数据分析笔记:财政收入预测数据挖掘分析大明王

在我国现行的分税制财政管理体制下,地方财政收入不仅是国家财政收入的重要组成部分,而且具有其相对独立的构成内容。地方财政收入是区域国民经济的综合反映,也是市场经济国家的政府进行宏观调控的基础。科学、合理地预测地方财政收人,对于克服年度地方预算收支规模确定的随意性和盲目性,正确处理地方财政与经济的相互关系具有十分重要的意义。

广州市作为广东省的省会,改革开放的前沿城市,交通便利,拥有中国大陆三大国际航空枢纽机场之一的广州白云国际机场和中国第三大港口、港口货物吞吐量居世界港口第五位的广州港。广州号称千年商埠,历史上一直是中国最重要的商业中心之一,商业网点多、行业齐全、辐射面广、信息灵、流通渠道通顺,拥有商业网点10万多个,为中国十大城市之冠。广州市在实现经济快速发展,地区生产总值飞跃的同时,也意味着财政收入的增收。2013年,广州实现地区生产总值(GDP)15420.14亿元,增长11.6%。其中,第一产业增加值228.87亿元,增长2.7%;第二产业增加值5227.38亿元,增长9.2%;第三产业增加值9963.89亿元,增长13.3%。第一、二、三产业增加值的比例为1.48∶33.90∶64.62。三次产业对经济增长的贡献率分别为0.4%、29.0%和70.6%。广州地方公共财政预算收入1141.79亿元,增长10.8%;如何做出下一年有效的财政收入预算,为下一年的政策提供指导依据,是一个具有重大意义的问题。

数据分析思路:

首先,阅读、理解以及整理收集到的数据,根据经济指标提炼数据,接着通过Adaptive_lasso方法进行特征选择,得到满足条件的特征变量;

其次,使用灰色预测对财政收入、增值税、营业税、企业所得税、个人所得税、政府性基金收入的影响因素2014-2015年数据进行预测,得到各影响因素2014-2015年数据。

再次,使用特征变量1999年-2015年数据,训练神经网络模型,再使用训练的模型预测2014-2015年广州市财政收入及各个类别收入数据;

最后,根据预测的数据,给广州财政局提出了几点合理的财政建议。

4、Adaptive-lasso指标筛选

Adaptive_lasso算法是近些年来被广泛应用于参数估计于变量选择的方法之一。Adaptive_Lasso算法能够解决最小二乘法和逐步回归局部最优解的不足,这是他的优点之一。Adaptive_lasso算法计算出某变量的特征值非零,则表示该变量对预测变量存在较大影响,而如果某变量的特征值为零,则表示该变量对预测变量影响很小。

1)指标初步筛选

从1999年-2013年财政收入表数据中可以发现,地方财政收入组成主要包括:1、税收收入,主要包括企业所得税和地方所得税中中央和地方共享的40%,地方享有的25%的增值税、营业税、印花税等;2、非税收入,包括专项收入、行政事业性收费、罚没收入、国有资本经营收入和其他收入等。政府性基金收入是国家通过向社会征收以及出让土地、发行彩票等方式取得收入,并专项用于支持特定基础设施建设和社会事业发展的收入。地方财政收入组成如图7:

X1城镇非私营单位从业人员数量:地区就业人数的上升,会引起地区人民收入总量的上升,从而间接影响财政收入的增加。

X2城镇单位职工年平均工资:城镇单位职工年平均工资能反映该地区的平均收入水平,并且职工收入增加,会引起地方财政的个人所得税总量的增加,从而影响财政收入的增加。

X3城镇人均可支配收入:城镇居民的可支配收入能反映他们的潜在消费能力,可支配收入越高,消费水平越高,从而会影响该地区的营业总额增加;而营业总额的增加,地方财政会获得更多的营业税收收入,从而促使财政收入的增长。

X4城镇居民储蓄存款余额:城镇居民储蓄存款余额能反映城镇居民的收入水平,储蓄水平高,收入也高,进而影响地方财政的个人税收收入。因此,城镇居民储蓄存在余额也是

影响财政收入的因素之一。

X5全社会固定资产投资额:是固定资产再生产活动,其内容包含建造和购置固定资产的经济活动。固定资产的投资能促进经济增长,扩大税源,进而拉动财政税收收入整体增长。

X7第一产业增值:第一产业包括农业(包括种植业、林业、牧业和渔业)。广东市在2005年取消了农业税,因而第一产业对财政收入的影响会较小。

X8第三产业与第二产业产值比:表示产业结构。三个产业生产总值代表国民经济水平,而生产总值是财政收入的主要影响因素,当产业结构逐步优化时,财政收入也会随之增加。

X10工业增值:工业产值增值一定程度上能反映该地区的生产总值的增值情况,而生产总值的增长是影响地方财政收入的主要因素之一。

3)lasso特征选择

本文选择Lasso算法解决Adaptive-lasso估计,确定特征变量。Lasso算法能够对变量进行筛选去重,可以将存在线性关系的变量进行去重。这也是本文选择该算法进行特征选择的原因之一。

特征选择结果如下:

从表3中可以看出,X2,X8的特征值结果为0,即这两个变量可能与其它变量存在共线关系,因而Adaptive-lasso将这两个变量剔除了。从实际角度考虑第一产业增值与第二/第三产业增值的比值很可能存在线性关系,城镇单位人均工资水平也与城镇居民人均可支配收入存在线性关系。特征选择的结果说明Adaptive-Lasso方法在构建模型时,能够剔除存在共线性关系的变量,同时体现了Adaptive-Lasso方法对多指标进行建模的优势。

1)初步筛选

通过Adaptive-lasso算法确定的营业税影响因素。公路客运量(x1)、建筑业增加值(x2)、第三产业增加值(x3)、全社会房地产开发投资额(x4)、全社会住宅投资额(x5)、地方财政收入(x6)、建筑业总产值(x7)、住宿和餐饮业零售额(x8)、限额以上餐饮业主营业务收入(x9)这些指标都可能与营业税收入存在关系。因此初步选择这些指标作为lasso输入变量。

将影响营业税收收入的x1-x9数据指标输入lasso特征选择,输出如下结果:

从上图特征选择结果看。x1-x9各个数据指标皆通过特征筛选。

初步筛选出影响增值税的六个数据指标:商品进口总值(x1),地区生产总值(x2)、工业增加值(x3),批发零售业零售额(4)、工业增加值占GDP(x5)、批发零售业增加值(x6)。

将x1-x6这个两个指标输入到lasso特征选择算法中,输出下表数据:

表中数据显示商品进口总值(x1),工业增加值(x3),工业增加值占GDP(x5)、批发零售业增加值(x6)这四个指标通过特征选择,而地区生产总值(x2)、批发零售业零售额(4)特征选择结果为0,因此被剔除。

初步确定以下影响企业所得税收入的数据指标:第二产业增加值X1、第三产业增加值X2、全社会固定资产投资额X3、城市商品零售价格指数(1978=100)X4、规模以上工业企业盈亏相抵后的利润总额X5、规模以上国有及国有控股工业企业企业亏损面X6、建筑业总产值X7、建筑业企业利润总额X8、限额以上连锁店(公司)零售额X9、地方财政总收入X10。

将这9个数据指标输入到lasso特征选择算法中,输出如下结果:

从上图结果可以得出:第二产业增加值X1、全社会住宅投资额X4、规模以上工业企业盈亏相抵后的利润总额X5、规模以上国有及国有控股工业企业企业亏损面X6、限额以上连锁店(公司)零售额X9,这9个数据指标通过特征选择,其它数据指标皆被剔除。

初步确定以下7个数据指标对个人所得税收入存在影响:城市居民年人均可支配收入x1、城镇单位职工年平均工资x2、城镇居民储蓄存款余额x3、地区生产总值x4、第二产业增加值x5、城镇非私营单位从业人员数x6、地方财政收入x7。

将这7个数据指标输入到lasso特征选择算法中,输出如下结果:

由上图可以得到,个人所得税特征选择结果:城市居民年人均可支配收入X1、第二产业增加值X5、城镇非私营单位从业人员数X6、地方财政收入X7,这四个指标通过特征选择,其它指标特征选择结果为0,不满足条件。

灰色预测法是一种对含有不确定因素的系统进行预测的方法。灰色系统是介于白色系统和黑色系统之间的一种系统。白色系统是指一个系统的内部特征是完全已知的,即系统的信息是完全充分的。而黑色系统是指一个系统的内部信息对外界来说是一无所知的,只能通过它与外界的联系来加以观测研究。灰色系统内的一部分信息是已知的,另一部分信息时未知的,系统内各因素间具有不确定的关系。

本文通过灰色预测法预测影响因素2014-2015年值,灰色预测数据在用于神经网络模型训练。

灰色预测算法如下:

#-*-coding:utf-8-*-defGM11(x0):#自定义灰色预测函数importnumpyasnpx1=x0.cumsum()#1-AGO序列z1=(x1[:len(x1)-1]+x1[1:])/2.0#紧邻均值(MEAN)生成序列z1=z1.reshape((len(z1),1))B=np.append(-z1,np.ones_like(z1),axis=1)Yn=x0[1:].reshape((len(x0)-1,1))[[a],[b]]=np.dot(np.dot(np.linalg.inv(np.dot(B.T,B)),B.T),Yn)#计算参数f=lambdak:(x0[0]-b/a)*np.exp(-a*(k-1))-\(x0[0]-b/a)*np.exp(-a*(k-2))#还原值delta=np.abs(x0-np.array([f(i)foriinrange(1,len(x0)+1)]))C=delta.std()/x0.std()P=1.0*(np.abs(delta-delta.mean())<0.6745*x0.std()).sum()/len(x0)returnf,a,b,x0[0],C,P#返回灰色预测函数、a、b、首项、方差比、小残差概率1)地方财政收入影响因素灰色预测

通过灰色预测算法预测地方财政收入影响因素2014-2015年数据,结果如下:

2)营业税影响因素灰色预测

通过灰色预测算法预测营业税收入影响因素2014-2015年数据,结果如下:

3)增值税影响因素灰色预测

通过灰色预测算法预测增值税收入影响因素2014-2015年数据,结果如下:

4)企业所得税影响因素灰色预测

通过灰色预测算法预测企业所得税收入影响因素2014-2015年数据,结果如下:

5)个人所得税影响因素灰色预测

通过灰色预测算法预测个人所得税收入影响因素2014-2015年数据,结果如下:

在灰色预测法预测的数据基础上,本文通过python调用深度学习模块中的神经网络模型进行训练和学习。神经网络模型是一种深度学习算法,它在经过很多次训练学习后,进行预测分析具有很好的效果。并且由于神经网络有较强的适用性和容错能力,对历史数据建立训练模型,把灰色预测的数据带入训练好的模型中,就能得到充分考虑历史信息的预测结果,从而预测出2014-2015年广东市财政收入及各个类别的收入。

1)地方财政收入预测:

将灰色预测的数据导入已经构建好的神经网络模型中,进行训练。本文所构建的神经网络模型其参数设置为误差精度10-7,学习次数10000次,神经元个数为Lasso变量选择方法选择的变量个数8,隐藏层设置为12个节点。预测结果如下图所示:

2)营业税收入预测

3)增值税收入预测

将灰色预测的数据输入到神经网络模型中,并设置模型参数:输入层为4,隐藏层为6,误差精度10-7,学习次数10000次。

4)企业所得税预测

将灰色预测的变量数据导入已经构建好的神经网络模型中,模型参数设置为:输入层为5,隐藏层为6,误差精度10-7,学习次数10000次。得到如下结果:

5)个人所得税预测

最后,将灰色预测数据导入神经网络模型中训练,模型参数设置为:输入层为4,隐藏层为6,误差精度10-7,学习次数15000次。得到如下结果:

THE END
1.www.stats.gov.cn/zsk/snapshoot?reference=33e2b9cdb6391521c5联系我们 服务条款 网站地图 微观数据申请 wgsjsys@stats.gov.cn 中国统计资料馆 简介 | 现场服务预约 数据咨询电话: 010-68576320 版权所有:国家统计局 地址:北京市西城区月坛南街57号(100826) 京ICP备05034670号-2 京公网安备 1104https://www.stats.gov.cn/zsk/snapshoot?reference=33e2b9cdb6391521c53328be6244e40b_3DE516C92202D8455ED909B8FC4292D4&index=resource_data&qt=%E4%BC%81%E4%B8%9A%E6%99%AF%E6%B0%94%E6%8C%87%E6%95%B0%E7%9A%84%E7%BC%96%E5%88%B6%E6%96%B9%E6%B3%95&siteCode=tjzsk
2.如何利用PowerBi搭建动态利润测算模型?(赠全面预算EXCEL模板)财务恰逢全面预算进行时,今年的全面预算你还在一张张表格梳理?老板和领导看完还是一头雾水,你做到最后也懵圈了最终还是年年做预算,年年都失败? 如何利用高效的工具,进行全面预算的准备?这里我推荐你尽快学会利用Power BI。 Power BI可以连接数百个数据源、打通各类数据源,从各种数据源中抓取数据,进行分析简化,数据https://www.163.com/dy/article/JJ1DD1EJ0553TKEZ.html
3.怎么做销售收入预测表(12个月)销售增长率是评价企业成长状况和发展能力的重要指标。其计算公式为:A:销售增长率=本年销售增长额÷上年销售总额=(本年销售额-上年销售额)÷上年销售总额 B:销售增长率=本年销售额/上年销售额-1 二、销售增长率分析 1、销售增长率是衡量企业经营状况和市场占有能力、预测企业经营业务拓展趋势的重要https://zhidao.baidu.com/question/1947687858756640348.html
4.公司营业收入数据表怎么做分析帆软数字化转型知识库公司营业收入数据表怎么做分析 公司营业收入数据表的分析可以通过数据清洗、趋势分析、同比和环比分析、细分市场分析、可视化展示等方式进行。在这些方法中,趋势分析最为重要,因为它可以帮助我们了解公司收入的增长或下降趋势,从而为未来的决策提供参考。通过趋势分析,可以识别出公司收入的季节性变化、长期增长趋势以及短期https://www.fanruan.com/blog/article/353416/
5.财务分析与估值建模系列之利润表(二)——利润表预测在这里,我们可以重复上述对每个成本科目所做的工作:充分研究,分析历史趋势以及考虑成本是固定的还是可变的,以便从前述的五种方法中选出预测成本的方法。 首先,我们还是先计算运营费用下各项目与营业收入的比值。 这里需要注意的是,在原始利润表中并没有折旧与摊销科目,而在调整利润表中,我们将折旧与摊销单列出来。但https://weibo.com/ttarticle/p/show?id=2309404394349470286017
6.科目余额表怎么看营业收入科目余额表能够揭示营业收入的质量。例如,观察应收账款的余额变化,评估企业收入的回款情况;分析销售折扣和折让的科目余额,了解企业为促销而付出的成本。这些信息有助于全面评价企业的盈利能力和经营效率。 **五、营业收入的趋势预测** 通过对科目余额表中营业收入的历史数据进行趋势分析,可以预测未来营业收入的可能走向https://h.chanjet.com/ask/0479c6d7a861ad68a0.html
7.推荐商业计划范文合集9篇完整的财务模型(损益表、资产负债表和现金流量表)应该放在附录中,但是这一章需要包括财务概要。例如,未来五年的营业收入、关键费用支出和预期净利润。 3、融资要求/资金使用 如果你在为公司寻求融资,这一章需要详细介绍需要的金额,并且资金用途也至关重要。 https://www.unjs.com/fanwenku/488816.html
8.2022创业项目前景计划书模板(通用6篇)4、公司的经营执照及费用预测; 5、公司的职责,包括保险、纳税等费用预测; 七、财务状况 1、预算及投资报酬; 2、财务数据,包括营业收入和费用、现金流量; 3、财务分析,包括资债平衡预测、月收入表和财务变化、各类财务预测的表图; 八、机遇与风险 创业项目前景计划书 篇5 https://mip.oh100.com/a/202203/4360727.html
9.如何借助《疯狂项目》做好项目的财务预测三(利润预测)圣代冰激凌材料成本(1.6元/杯),这里预测的是每一杯的成本为1.6元,所以每个月的预测成本=预测销售数量×1.6,例如,第1月,我们在销售收入预测表中圣代冰激凌销量为1200杯,所以利润预测表中该项成本应该是1200×1.6=1920元。 Q圆珍珠奶茶材料成本(2元/杯)与鲜活柠檬茶材料成本(1.2元/杯)的营业成本预测也是同理。 https://cxcyxy.zjku.edu.cn/col/1609136089010/2021/04/27/1621081179647.html
10.服装进销存利润表怎么做零代码企业数字化知识站服装进销存利润表怎么做? 制作服装进销存利润表是企业财务管理中重要的一环,它能够帮助企业分析销售、成本和利润等关键财务指标。以下是制作服装进销存利润表的步骤和方法: 1. 确定利润表的基本结构 利润表通常包括以下几个主要部分: 营业收入:包括销售商品的收入。 https://www.jiandaoyun.com/blog/article/913253/
11.项目部季度经济活动分析报告8篇(全文)3) 形象进度及营业额。分析项目分部分项工程实物量完成情况及实际完成产值和计划产值进行对比, 查找差异, 分析原因。 4) 验工计价与变更索赔情况分析。主要对实际完成产值与已实现验工计价进行对比分析, 分析差异及原因;分析调概、索赔、变更设计的进展, 对于业主已确认但未验工计价的索赔、变更事项做合理收入预测, https://www.99xueshu.com/w/filex13ykhd2.html
12.食品工业2020年经济运行分析及2021年预测表32020年全国工业、轻工业、食品工业营业收入和利润增速(%) 图172020年全国工业、轻工业、食品工业营业收入逐月增速情况 图182020年全国工业、轻工业、食品工业实现利润逐月增速情况 (二)2020年食品工业经济运行特点 1.防控疫情并尽快复工复产,为稳定社会经济做贡献 http://www.nfmccli.org/v_1/5905.aspx
13.东华实业:发行股份购买资产并募集配套资金暨关联交易报告书(修订334,526.44 万元;营业收入为 48,956.38 万元;期末资产净额为 107,166.47 万元。 根据《重组管理办法》,标的资产的资产净额以评估值 433,174.65 万元计算,为 上市公司资产净额的 404.21%,达到上市公司对应指标的 50%以上且超过 5,000 万元人民币,故本次交易构成重大资产重组。 http://wap.stockstar.com/detail/JC2015072900002795
14.财务报表建模——利润表利润模型都有哪些参数本文介绍了如何站在分析师的角度,使用R语言对A股某公司的利润表进行建模。建模过程中,作者强调了理解财报重要性、选择R语言的原因、建模原则和方法。通过详细分析营业收入、经营成本等各项科目,结合历史数据和行业趋势,运用自上而下和自下而上的预测方法,最终得出净利润预测。文章还讨论了在建模中需要注意的事项,强调https://blog.csdn.net/simon1223z/article/details/125682495
15.经营业绩预测创业计划书七、投资收入分析 如下表: 注:以上利润分析表示总部在正常营业的条件下,进行合理性预算,仅供投资参考。具体需要各店根据当地商圈条件,例如消费水平、还有店面位置、经营方式及促销策略等多重因素作相应的'调整,希望投资者根据当地实际情况估算适合自己的投资分析! https://www.yjbys.com/chuangye/ziliao/chuangyejihuashu/631796.html
16.《第一本经济学》课后习题标准答案(全部23课)程晔的财新博客纯粹主义者坚持认为,即使训练有素的经济学家也不具备预测能力,比方说,能比对冲基金经理更准确地预测股价波动。另一方面,许多经济学家认为,如果投资者有健全的经济学指导,他们可以超越同伴,尤其是在以政府的严重干预为特征的时代。例如,2000年代早期和中期,一些经济学家和投资顾问在还来得及“退出”前,发出房地产泡沫https://chengye.blog.caixin.com/archives/54958
17.财务预算报告(精选7篇)预计损益表是在各项经营预算的基础上,根据权责发生制编制的损益表。它综合反映计划期内预计销售收入、销售成本和预计可实现的利润或可能发生的亏损,可以揭示企业预期的盈利情况,有助于管理人员及时调整经营策略。一般根据销售或营业预算、生产预算、产品成本预算或者营业成本预算、期间费用预算、其他专项预算等有关资料分析https://mip.ruiwen.com/gongwen/baogao/239163.html
18.干货收藏租金测算方法招商运营商圈表7:租金预测表 租金价格按照商铺的租金系数结合目标商户的承受高限预测; 各业态平均营业坪效参考╳╳成熟商业项目平均水平; 平均提成率根据目标品牌可能接受的提成率计算,不执行提成租金的参照商户正常状态的租金/营业额比率计算。 该案例中,就是结合商场特征、租户组合、租约特征所对租金边际价格产生的影响,制订品牌规https://www.shangyexinzhi.com/article/4505851.html
19.公司月度财务分析报告优秀(通用11篇)(二)利润表分析 联通华盛通信有限公司温州分公司累计实现营业收入总额1,601.18万元,同比减少8.95%;实现净利润3,762.71万元,同比增加14.93%。从净利润的形成过程来看:营业利润为3,506.09万元,较同期减少3.52%;利润总额为8,762.71万元,同比减少1.83%。 成本费用同比减少 7.18%,其中营业成本491.27万元,占成本费用总额的67.https://m.wenshubang.com/caiwufenxibaogao/473276.html