在我国现行的分税制财政管理体制下,地方财政收入不仅是国家财政收入的重要组成部分,而且具有其相对独立的构成内容。地方财政收入是区域国民经济的综合反映,也是市场经济国家的政府进行宏观调控的基础。科学、合理地预测地方财政收人,对于克服年度地方预算收支规模确定的随意性和盲目性,正确处理地方财政与经济的相互关系具有十分重要的意义。
广州市作为广东省的省会,改革开放的前沿城市,交通便利,拥有中国大陆三大国际航空枢纽机场之一的广州白云国际机场和中国第三大港口、港口货物吞吐量居世界港口第五位的广州港。广州号称千年商埠,历史上一直是中国最重要的商业中心之一,商业网点多、行业齐全、辐射面广、信息灵、流通渠道通顺,拥有商业网点10万多个,为中国十大城市之冠。广州市在实现经济快速发展,地区生产总值飞跃的同时,也意味着财政收入的增收。2013年,广州实现地区生产总值(GDP)15420.14亿元,增长11.6%。其中,第一产业增加值228.87亿元,增长2.7%;第二产业增加值5227.38亿元,增长9.2%;第三产业增加值9963.89亿元,增长13.3%。第一、二、三产业增加值的比例为1.48∶33.90∶64.62。三次产业对经济增长的贡献率分别为0.4%、29.0%和70.6%。广州地方公共财政预算收入1141.79亿元,增长10.8%;如何做出下一年有效的财政收入预算,为下一年的政策提供指导依据,是一个具有重大意义的问题。
数据分析思路:
首先,阅读、理解以及整理收集到的数据,根据经济指标提炼数据,接着通过Adaptive_lasso方法进行特征选择,得到满足条件的特征变量;
其次,使用灰色预测对财政收入、增值税、营业税、企业所得税、个人所得税、政府性基金收入的影响因素2014-2015年数据进行预测,得到各影响因素2014-2015年数据。
再次,使用特征变量1999年-2015年数据,训练神经网络模型,再使用训练的模型预测2014-2015年广州市财政收入及各个类别收入数据;
最后,根据预测的数据,给广州财政局提出了几点合理的财政建议。
4、Adaptive-lasso指标筛选
Adaptive_lasso算法是近些年来被广泛应用于参数估计于变量选择的方法之一。Adaptive_Lasso算法能够解决最小二乘法和逐步回归局部最优解的不足,这是他的优点之一。Adaptive_lasso算法计算出某变量的特征值非零,则表示该变量对预测变量存在较大影响,而如果某变量的特征值为零,则表示该变量对预测变量影响很小。
1)指标初步筛选
从1999年-2013年财政收入表数据中可以发现,地方财政收入组成主要包括:1、税收收入,主要包括企业所得税和地方所得税中中央和地方共享的40%,地方享有的25%的增值税、营业税、印花税等;2、非税收入,包括专项收入、行政事业性收费、罚没收入、国有资本经营收入和其他收入等。政府性基金收入是国家通过向社会征收以及出让土地、发行彩票等方式取得收入,并专项用于支持特定基础设施建设和社会事业发展的收入。地方财政收入组成如图7:
X1城镇非私营单位从业人员数量:地区就业人数的上升,会引起地区人民收入总量的上升,从而间接影响财政收入的增加。
X2城镇单位职工年平均工资:城镇单位职工年平均工资能反映该地区的平均收入水平,并且职工收入增加,会引起地方财政的个人所得税总量的增加,从而影响财政收入的增加。
X3城镇人均可支配收入:城镇居民的可支配收入能反映他们的潜在消费能力,可支配收入越高,消费水平越高,从而会影响该地区的营业总额增加;而营业总额的增加,地方财政会获得更多的营业税收收入,从而促使财政收入的增长。
X4城镇居民储蓄存款余额:城镇居民储蓄存款余额能反映城镇居民的收入水平,储蓄水平高,收入也高,进而影响地方财政的个人税收收入。因此,城镇居民储蓄存在余额也是
影响财政收入的因素之一。
X5全社会固定资产投资额:是固定资产再生产活动,其内容包含建造和购置固定资产的经济活动。固定资产的投资能促进经济增长,扩大税源,进而拉动财政税收收入整体增长。
X7第一产业增值:第一产业包括农业(包括种植业、林业、牧业和渔业)。广东市在2005年取消了农业税,因而第一产业对财政收入的影响会较小。
X8第三产业与第二产业产值比:表示产业结构。三个产业生产总值代表国民经济水平,而生产总值是财政收入的主要影响因素,当产业结构逐步优化时,财政收入也会随之增加。
X10工业增值:工业产值增值一定程度上能反映该地区的生产总值的增值情况,而生产总值的增长是影响地方财政收入的主要因素之一。
3)lasso特征选择
本文选择Lasso算法解决Adaptive-lasso估计,确定特征变量。Lasso算法能够对变量进行筛选去重,可以将存在线性关系的变量进行去重。这也是本文选择该算法进行特征选择的原因之一。
特征选择结果如下:
从表3中可以看出,X2,X8的特征值结果为0,即这两个变量可能与其它变量存在共线关系,因而Adaptive-lasso将这两个变量剔除了。从实际角度考虑第一产业增值与第二/第三产业增值的比值很可能存在线性关系,城镇单位人均工资水平也与城镇居民人均可支配收入存在线性关系。特征选择的结果说明Adaptive-Lasso方法在构建模型时,能够剔除存在共线性关系的变量,同时体现了Adaptive-Lasso方法对多指标进行建模的优势。
1)初步筛选
通过Adaptive-lasso算法确定的营业税影响因素。公路客运量(x1)、建筑业增加值(x2)、第三产业增加值(x3)、全社会房地产开发投资额(x4)、全社会住宅投资额(x5)、地方财政收入(x6)、建筑业总产值(x7)、住宿和餐饮业零售额(x8)、限额以上餐饮业主营业务收入(x9)这些指标都可能与营业税收入存在关系。因此初步选择这些指标作为lasso输入变量。
将影响营业税收收入的x1-x9数据指标输入lasso特征选择,输出如下结果:
从上图特征选择结果看。x1-x9各个数据指标皆通过特征筛选。
初步筛选出影响增值税的六个数据指标:商品进口总值(x1),地区生产总值(x2)、工业增加值(x3),批发零售业零售额(4)、工业增加值占GDP(x5)、批发零售业增加值(x6)。
将x1-x6这个两个指标输入到lasso特征选择算法中,输出下表数据:
表中数据显示商品进口总值(x1),工业增加值(x3),工业增加值占GDP(x5)、批发零售业增加值(x6)这四个指标通过特征选择,而地区生产总值(x2)、批发零售业零售额(4)特征选择结果为0,因此被剔除。
初步确定以下影响企业所得税收入的数据指标:第二产业增加值X1、第三产业增加值X2、全社会固定资产投资额X3、城市商品零售价格指数(1978=100)X4、规模以上工业企业盈亏相抵后的利润总额X5、规模以上国有及国有控股工业企业企业亏损面X6、建筑业总产值X7、建筑业企业利润总额X8、限额以上连锁店(公司)零售额X9、地方财政总收入X10。
将这9个数据指标输入到lasso特征选择算法中,输出如下结果:
从上图结果可以得出:第二产业增加值X1、全社会住宅投资额X4、规模以上工业企业盈亏相抵后的利润总额X5、规模以上国有及国有控股工业企业企业亏损面X6、限额以上连锁店(公司)零售额X9,这9个数据指标通过特征选择,其它数据指标皆被剔除。
初步确定以下7个数据指标对个人所得税收入存在影响:城市居民年人均可支配收入x1、城镇单位职工年平均工资x2、城镇居民储蓄存款余额x3、地区生产总值x4、第二产业增加值x5、城镇非私营单位从业人员数x6、地方财政收入x7。
将这7个数据指标输入到lasso特征选择算法中,输出如下结果:
由上图可以得到,个人所得税特征选择结果:城市居民年人均可支配收入X1、第二产业增加值X5、城镇非私营单位从业人员数X6、地方财政收入X7,这四个指标通过特征选择,其它指标特征选择结果为0,不满足条件。
灰色预测法是一种对含有不确定因素的系统进行预测的方法。灰色系统是介于白色系统和黑色系统之间的一种系统。白色系统是指一个系统的内部特征是完全已知的,即系统的信息是完全充分的。而黑色系统是指一个系统的内部信息对外界来说是一无所知的,只能通过它与外界的联系来加以观测研究。灰色系统内的一部分信息是已知的,另一部分信息时未知的,系统内各因素间具有不确定的关系。
本文通过灰色预测法预测影响因素2014-2015年值,灰色预测数据在用于神经网络模型训练。
灰色预测算法如下:
#-*-coding:utf-8-*-defGM11(x0):#自定义灰色预测函数importnumpyasnpx1=x0.cumsum()#1-AGO序列z1=(x1[:len(x1)-1]+x1[1:])/2.0#紧邻均值(MEAN)生成序列z1=z1.reshape((len(z1),1))B=np.append(-z1,np.ones_like(z1),axis=1)Yn=x0[1:].reshape((len(x0)-1,1))[[a],[b]]=np.dot(np.dot(np.linalg.inv(np.dot(B.T,B)),B.T),Yn)#计算参数f=lambdak:(x0[0]-b/a)*np.exp(-a*(k-1))-\(x0[0]-b/a)*np.exp(-a*(k-2))#还原值delta=np.abs(x0-np.array([f(i)foriinrange(1,len(x0)+1)]))C=delta.std()/x0.std()P=1.0*(np.abs(delta-delta.mean())<0.6745*x0.std()).sum()/len(x0)returnf,a,b,x0[0],C,P#返回灰色预测函数、a、b、首项、方差比、小残差概率1)地方财政收入影响因素灰色预测
通过灰色预测算法预测地方财政收入影响因素2014-2015年数据,结果如下:
2)营业税影响因素灰色预测
通过灰色预测算法预测营业税收入影响因素2014-2015年数据,结果如下:
3)增值税影响因素灰色预测
通过灰色预测算法预测增值税收入影响因素2014-2015年数据,结果如下:
4)企业所得税影响因素灰色预测
通过灰色预测算法预测企业所得税收入影响因素2014-2015年数据,结果如下:
5)个人所得税影响因素灰色预测
通过灰色预测算法预测个人所得税收入影响因素2014-2015年数据,结果如下:
在灰色预测法预测的数据基础上,本文通过python调用深度学习模块中的神经网络模型进行训练和学习。神经网络模型是一种深度学习算法,它在经过很多次训练学习后,进行预测分析具有很好的效果。并且由于神经网络有较强的适用性和容错能力,对历史数据建立训练模型,把灰色预测的数据带入训练好的模型中,就能得到充分考虑历史信息的预测结果,从而预测出2014-2015年广东市财政收入及各个类别的收入。
1)地方财政收入预测:
将灰色预测的数据导入已经构建好的神经网络模型中,进行训练。本文所构建的神经网络模型其参数设置为误差精度10-7,学习次数10000次,神经元个数为Lasso变量选择方法选择的变量个数8,隐藏层设置为12个节点。预测结果如下图所示:
2)营业税收入预测
3)增值税收入预测
将灰色预测的数据输入到神经网络模型中,并设置模型参数:输入层为4,隐藏层为6,误差精度10-7,学习次数10000次。
4)企业所得税预测
将灰色预测的变量数据导入已经构建好的神经网络模型中,模型参数设置为:输入层为5,隐藏层为6,误差精度10-7,学习次数10000次。得到如下结果:
5)个人所得税预测
最后,将灰色预测数据导入神经网络模型中训练,模型参数设置为:输入层为4,隐藏层为6,误差精度10-7,学习次数15000次。得到如下结果: