摘要
文章探讨了福建省GDP的影响因素.根据GDP的计算公式,选取居民人均消费支出等5个指标作为解释变量.首先进行线性回归,作多重共线性诊断;其次采用向后回归法筛选通过显著性检验的变量作为新变量;紧接着标准化新变量和因变量,做主成分分析,提取主成分.再者将主成分和标准化的因变量进行线性回归,构建模型,得出方程,并对方程进行检验.最后根据模型,提出对GDP增长的相关建议.
关键词: GDP影响因素;线性回归;主成分分析;标准化
1. 引言
GDP是指在划定的一段时间内,某个国家或地区产出的一切最终产品和劳务价值,是用来衡量经济发展水平不可或缺的指标之一.了解GDP的走向能帮助我们更好地把握经济发展的格局,制定更为合适的宏观经济政策;利用GDP可以分析近阶段经济发展的趋势,以便更好地规划投资组合.自改革开放以来,我国经济发展呈现喜人势头,尤其是加入WTO以来,GDP更是如同雨后的春笋般节节攀升.
目前国际上用来衡量GDP的核算方法包括三种,分别是生产法、收入法、支出法.这就造成学者对GDP的研究方法各不相同,由此选择用来实证分析的变量也各不相同.文[1]从国民经济核算支出法的角度,挑选出影响我国国内生产总值的六个因素并细化柯布——道格拉斯生产函数,利用SPSS将其线性化后拟合出较好的GDP模型.文[2]虽然也是在支出法的基础上进行研究得到回归方程,但采用的分析软件有所不同,通过EVIEWS软件对构建的模型进行OLS参数估计,得到模型的数学方程.文[3]则直接选取多个变量采用灰色关联度组合分析方法对中国经济增长的影响因素进行实证分析,建立灰色预测模型.
从福建省近年来GDP数值可以看出, 福建省的经济发展正以稳步渐进的步伐顺着时间轴迈步向前.在借鉴已有研究方法的基础上,本文研究福建省GDP及相关因素的关系.本文选择支出法作为GDP的衡量方法,并据此选取代表消费、投资、净出口的相关指标,利用SPSS统计软件,通过主成分回归方法,提取主成分并进行回归,构建经济模型,以求得到较为准确的GDP影响因素回归模型,用于预测未来经济发展,据此结合当今经济形势,提出相应建议.
2. 数据选取及预处理
通过阅读经济学的相关知识,我们可以得知,平时所提的GDP指的是一定时期内某国或某地区产出的最终产品及劳务价值[4].GDP表现为价值形态、收入形态和产品形态.三种表现形态分别通过生产法、收入法和支出法三种核算方法体现,通过不同角度反映国民经济生产活动成果.
生产法中,GDP=劳动者报酬+生产税净额+固定资产折旧+营业盈余;收入法中,GDP =工资+利息+利润+租金+间接税和企业转移支付+折旧;支出法中,.其中C为居民消费,I为企业投资,G为政府购买,为净出口(X表示出口,M表示进口).
由于GDP支出法核算指标是消费,投资和出口,这三者常被比喻成拉动GDP增长的“三驾马车”,是经济增长原理的生动表述.此外支出法相对另外两种核算方法,选取的核算指标数量较少且指标较容易在统计年鉴等统计材料中找到.因此综合考虑各种因素,本文选取支出法作为GDP的核算方法.
本文所有数据来自于文[5]——《福建统计年鉴-2013》,保证其真实有效,文中选取了2000-2012年的数据进行实证分析.
根据支出法的计算公式,确定影响GDP的因素应该为居民消费C,企业投资I,政府购买G以及净出口.
居民消费C的指标选取,选择居民人均消费支出作为变量.但福建省统计年鉴中将居民人均消费支出分为城镇居民和农民区别衡量.因此本文借鉴文[6]对居民人均可支配收入处理方法,通过人口比重进行加权求和得到.
而企业投资I,根据其定义,企业投资包括固定资产投资和存货投资两大类,因此选择全社会固定资产投资额作为变量.
政府购买G指各级政府购买商品和劳务的支出,因此选择用公共财政支出作为衡量变量.另外,由于福建省统计年鉴里有直观的净出口总额,直接将其作为衡量变量.
据此将GDP作为被解释变量,命名为,将居民人均消费支出、全社会固定资产投资额、公共财政支出、净出口总额分别命名为,,,作为被解释变量,进行相关计量分析.具体数据如下:
表1 原始数据表
年份 GDP(亿元) 居民人均消费支出(元) 全社会固定资产投资额(万元) 公共财政支出(亿元) 净出口总额(万元)
2000 3764.54 3766.18 1082.47 324.18 380.23
2001 4072.85 4006.14 1134.48 373.19 432.00
2002 4467.55 4388.85 1230.76 397.56 525.07
2003 4983.67 4809.74 1507.87 452.30 574.32
2004 5763.35 5382.16 1899.10 516.68 932.20
2005 6554.69 5894.97 2344.73 593.07 1251.09
2006 7583.85 6575.16 3115.08 728.70 1565.30
2007 9248.53 7462.97 4321.74 910.64 1933.70
2008 10823.01 8573.66 5301.69 1137.72 2025.38
2009 12236.53 9351.59 6362.03 1411.82 1843.60
2010 14737.12 10780.89 8273.42 1695.09 2315.57
2011 17560.18 12420.72 10119.47 2198.18 2722.59
2012 19701.78 14071.84 12709.66 2607.50 2507.78
3. 模型基本原理
3.1 多元线性回归模型
世间万物总有联系,万物相互联系制约是亘古不变的自然规律.譬如,经济发展总是与某几个经济变量紧密关联,被选为经济发展“代表发言人”的GDP自然与居民人均消费支出、全社会固定资产投资额、公共财政支出、净出口总额有着密不可分的关联.由此,拥有好奇心的人们总是会试图研究万物间的联系.在金融领域,人们更倾向于依据经济理论,针对某些具体经济现象,从定性角度来研究经济问题中各因素间的因果关系,回归模型也就应运而生.
然而很多情况下,一果往往有多因.换句话说,在很多模型中,因变量的变化信息是无法通过一个自变量被完全解释,往往需要多个自变量.通常,我们选择一个被解释变量(经济学上称之为“内生变量”)往往需要选取多个解释变量(经济学上称之为“外生变量”),此时建立起的经济模型就称多元回归模型.其中最为简单的就是多元线性回归模型.形式如下:
式中称为线性方程的斜率,表示第i个样本在第j个自变量上的取值.表示第j个回归系数的值,称为方程的随机误差.引入矩阵记号描述:
则上述公式可写为:
3.2 回归模型检验
确定回归模型过程中,须对所建方程进行检验,通过检验一方面用以证明变量间关系是否合理,另一方面用以说明变量间关系是否统计显著.只有通过检验的方程才能用于变量关系的说明和因变量的预测.其中最关键的是对模型的未知参数进行估计,多元线性回归模型的参数估计方法采用最小二乘法(OLS).SPSS进行多元线性回归分析时会自动计算参数的估计值.
检验一般是统计检验和模型经济意义检验.统计检验其实是显著性检验,主要包括:拟合优度检验、模型方程显著性检验、系数显著性检验和残差分析等.
3.3 多重共线性问题
多元线性回归的假设条件最重要的一条是自变量不相关.然而,结果不仅和原因共同构成一个整体,并且这个整体中的原因之间也彼此存在关联和牵制.例如,研究GDP影响因素时,选取居民人均消费支出、全社会固定资产投资额、公共财政支出、净出口总额作为核算指标,但四个变量显然存在相互影响.又比如居民人均消费支出与公共财政支出必然有着联系,政府通过加大公共财政支出保障民生,人民的生活有了一定保障基础后由此催生消费欲望,人均消费因此大幅提高.而这种由于所选取的多个自变量之间存在线性相关而引发的问题称为多重共线性问题.
多重共线性问题将会导致普通最小二乘法(OLS)无法估计,由此带来连锁反应,导致检验无法通过,最终将使得模型不可用.这是因为参数估计是以公式
作为计算依据.
当矩阵中的量完全相关时,数据矩阵会发生奇异,从而无法求解矩阵的逆,也就无法求得.另外,当自变量间存在近似线性关系时,则导致矩阵的列向量近似线性关系,从而数据矩阵接近奇异,由此OLS估计的精度变得很差.这是因为假设
那么回归系数的最小估计
的均方误差(MSE)将会趋于无穷大,由此导致对于某一变量的回归系数的方差也会变得很大,从而影响回归系数估计值的稳定性,使其变得很差.
此外,又因为t统计量的计算公式
,
由于方差的不断变大,t统计量相应变得很小,导致t检验无法通过.
总之,多重共线性将使得多元线性回归模型失去准确性,对整个模型产生无可估量的影响.概括起来有以下几点:(1)导致回归系数估计不准确,模型失去经济意义;(2)导致回归的残差平方和被放大,使得模型方差的估计不偏大;(3)导致许多变量不能通过参数显著性检验,使得拟合模型的变量数与真实变量数不符.
3.4 主成分回归方法
那么如何解决多重共线性呢?近年来许多学者相继提出多种改善修正方法.大致有如下方法:(1)剔除一些解释变量;(2)增加样本容量;(3)主成分回归;(4)岭回归.其中本文主要讨论主成分回归方法.
主成分回归是将主成分分析和回归两种方法相结合.具体步骤如下:先将被解释变量y和所有解释变量进行回归,筛选出p个有统计意义的解释变量;然后将p个解释变量标准化作主成分分析,选出q个主成分(主成分是互不相关的);再用这q个主成分作为解释变量,进行回归分析,构建模型;最后把回归结果转化为原来p个解释变量对应变量的回归模型.其质是通过降维处理提出主成分以修正其自变量间自相关问题从而使得模型更加准确.
而主成分分析步骤为:(1)标准化自变量和因变量,避免受量纲影响;(2)求的特征值和标准正交化特征向量;(3)选择主成分.最大特征值对应的特征向量为第一主成分系数,以此类推.主成分个数选取取决于主成分对因变量的解释力度.若前n个特征值之和占所有特征值之和的比例达到一定程度,可以适当剔除对应特征值较小的主成分;(4)做正交变换得到新的变量.
4. 模型构建
4.1 共线性诊断
我们可以通过SPSS回归分析中的多重共线性诊断发现多重共线性程度.多重共线性诊断通常是采取以下方法:
(1)观察自变量间的相关系数矩阵.如果相关系数为0.8以上,说明自变量间可能会有共线性问题.一旦相关系数超过0.9,那么共线性问题一定存在.
(2)容忍度(Tolerance).容忍度是指,以每个自变量作为因变量对其他自变量进行回归分析时得到的残差比例,计算公式为.指标值越小,说明该自变量被其余变量预测越精确,共线性可能就越严重.陈希孺曾指出,可能存在共线性问题的条件是某个自变量的容忍度小于0.1.此外方差膨胀因子(VIF),即容忍度的倒数,也可用于诊断多重共线性.
(3)特征根(Eigenvalue).实际上就是对自变量进行主成分分析,如果相当多维度的特征根等于0,则可能有比较严重的共线性.
(4)条件指数(Condition Idex).某些维度该指标值大于15时,可能存在共线性;大于30则代表存在严重共线性.
在SPSS中,执行命令,将GDP选入Dependent栏中,把全部解释变量放入Independent栏,Method选择Enter,在Statistics对话框,勾选Collinearity Diangostic,其他为系统默认值,得到表2,表3.
表2 回归系数和共线性统计量
Coefficientsa
Model Unstandardized Coefficients Standardized Coefficients t Sig. Collinearity Statistics
B Std. Error Beta Tolerance VIF
1 (Constant) 49.137 719.280 .068 .947
居民人均消费支出 .599 .258 .376 2.321 .049 .003 383.269
全社会固定投资总额 .112 .242 .080 .465 .654 .002 436.765
公共财政支出 3.114 1.269 .436 2.453 .040 .002 462.850
净出口总额 .748 .288 .117 2.600 .032 .034 29.690
a. Dependent Variable: GDP
表3 共线性诊断指标
Collinearity Diagnosticsa
Model Dimension Eigenvalue Condition Index Variance Proportions
(Constant) 居民人均消费支出 全社会固定投资总额 公共财政支出 净出口总额
1 1 4.703 1.000 .00 .00 .00 .00 .00
2 .265 4.210 .01 .00 .00 .00 .00
3 .031 12.355 .01 .00 .00 .00 .19
4 .000 100.483 .19 .04 .99 .62 .00
5 .000 123.578 .80 .96 .00 .38 .81
a. Dependent Variable: GDP
从表2可知,所有自变量的容忍度均小于0.1,且其方差膨胀因子都很大,说明它们之间存在很严重的共线性问题.
此外,从表3可知,第四个特征值,全社会固定投资总额,公共财政支出发生了共线性;第五个特征值,居民人均消费支出,公共财政支出,净出口总额发生了多重共线性.
4.2 筛选变量
由于自变量间存在严重的共线性问题造成了回归模型不精确.此时可以考虑筛选变量,舍弃某个或某几个变量.
在SPSS执行命令,将GDP选入Dependent栏中,把全部解释变量放入Independent栏,Method选择Backward,在Statistics对话框,勾选Collinearity Diangostic,其他为系统默认值,从中筛选出有统计意义的变量,得到表4,表5.
表4 模型概述
Model Summaryc
Model R R Square Adjusted R Square Std. Error of the Estimate
1 1.000a .999 .999 152.43429
2 1.000b .999 .999 145.64414
a. Predictors: (Constant), 净出口总额, 公共财政支出, 居民人均消费支出, 全社会固定投资总额
b. Predictors: (Constant), 净出口总额, 公共财政支出, 居民人均消费支出
c. Dependent Variable: GDP
表5 回归系数和共线性统计量
Coefficientsa
Model Unstandardized Coefficients Standardized Coefficients t Sig. Collinearity Statistics
B Std. Error Beta Tolerance VIF
1 (Constant) 49.137 719.280 .068 .947
居民人均消费支出 .599 .258 .376 2.321 .049 .003 383.269
全社会固定投资总额 .112 .242 .080 .465 .654 .002 436.765
公共财政支出 3.114 1.269 .436 2.453 .040 .002 462.850
净出口总额 .748 .288 .117 2.600 .032 .034 29.690
2 (Constant) -115.781 597.812 -.194 .851
居民人均消费支出 .631 .237 .396 2.658 .026 .003 355.596
公共财政支出 3.551 .815 .498 4.358 .002 .005 208.937
净出口总额 .741 .275 .116 2.698 .024 .034 29.590
a. Dependent Variable: GDP
从表中可以看出,通过向后回归法,我们筛选出了三个变量,得到模型2,所留下的变量分别是居民人均消费支出,公共财政支出,净出口总额.这是因为它们的P值都小于0.05,而全社会固定投资总额的P值大于0.05,因此模型中留下三个变量,但可以看出它们之间仍存在很严重的共线性问题.此时我们采取主成分分析提取数个主成分修正模型.
5. 建议
综合以上分析,我们可以得知,GDP主要受居民人均消费支出、公共财政支出、净出口总额三者的影响.这对我们今后的经济发展能起到一定的指导意义.
我国是社会主义国家,当前正处于社会主义初级阶段,党和国家工作的出发点和落脚点都是为了人民,我省的工作也是立足于人民.经济发展的成果最终由人民共享,也最终由人民生活体现.因此未来福建省在政府购买方面要综合衡量,致力于公共财政支出的有效使用.只有公共财政支出发挥它最大的用途,人民的基本生活才能得到切实保障.这也就是为何GDP受公共财政支出影响的大的原因所在.归根到底,只有改善民生,提高人民的生活水平,GDP才能愈快增长,经济才能稳健发展.
此外,我国是社会主义市场经济体制,市场主导,国家间接调控.政府要密切关注市场消费,做好消费引导工作.这是因为居民人均消费支出对GDP的影响也不容忽视.而如何刺激消费,活跃市场呢?其实追根到底,关键在于人们生活收入.只有人民收入增加,才能更多地去消费.倘若收入微薄,衣、食尚且都难以保障,何谈消费?这就启示政府要加大对民生的改善,提高人民收入水平.
如何提高人民收入是国家一直致力于解决的命题.合理调节收入分配格局是得到普遍认可的方法之一.我国各地区普遍面临收入差距的大的困扰,福建省也不例外.调节收入差距最重要的是要对过高收入进行有效调节,取缔非法收入,努力提高中等收入的比重,提高低收入者的收入.
总而言之,要想把控经济发展格局,让经济得到稳健发展,离不开对这三方面的调控.政府应该改善民生,扩大内需,刺激消费,对外开放.
原创文章,作者:Editor,如若转载,请注明出处:http://www.diyilunwen.com/lwfw/jjxlw/2792.html