线性回归模型应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归模型的应用
一、数据来源与处理
数据均来源于中华人民共和国国家统计局网站公布的《2008年中国统计年鉴》。选取1999年至2007年的相关数据,其中人均消费支出、人均年总收入、政府对农业的投入均采用当年年末新增值;商品零售价格指数、恩格尔系数均采用原值;为避免数据本身过小造成误差增大,用年末累计参加农村养老保险人数除以当年农村人口数后,再乘以一千。利用SPSS16.0软件进行数据统计处理。
二、模型变量的选择和说明
被解释变量:农村居民人均消费支出(E);
解释变量:人均年总收入(Y)、政府对农业的投入(C)、商品零售价格指数(P)、农村恩格尔系数(D)、参加养老保险人数占农村总人口的千分比(I)。
采用以下函数表达式表示各解释变量与被解释变量的关系:E=F(Y,C,P,D,I)
经简单测算和经验分析,发现农村居民人均消费支出除了与传统的人均年总收入成一元线性相关外,政府对农业的投入影响农民人均收入水平、商品零售价格指数影响消费者价格心理、农村恩格尔系数影响农村消费者消费行为、参加养老保险人数占农村总人口的千分比影响农村及其购买能力,这些因素在单独情况下,均与人均消费支出成一元线性相关。因此,猜想以上各被解释变量在综合作用情况下与解释变量成多元线性线性相关是完全可行、合理的。
三、线性回归模型形成的步骤
(1)相关性分析。线性回归方程拟引入一个因变量,即人均消费;五个自变量,即人均收入、政府投入、CPI、农村恩格尔系数和养老保险投保率。经计算得加权平均值及方差如表1。
由表2看出,人均消费与五个因变量相关性均较大。其中,人均收入与人均消费相关性高达99%,政府投入次之,达98.4%,恩格尔系数与CPI与人均消费的相关性分别达83%和80.6%,远高于养老保险参保率的47.8%。
结果验证了凯恩斯的消费函数观点,自变量农村人均收入与因变量人均消费的相关性非常强,两者相关性散点如图1。
在进行线性回归分析时采用的方法为全部引入Enter法。虽然只有养老保险参保率与因变量的相关性最低,但为全面考虑,不将其从回归方程中剔除,如表3。
表4说明,相关系数R=1,判定系数R2=1,调整后的判定系数仍高达0.99,回归估计的标准误差S=18.56672。说明回归效果一般。
由表5看出,统计量F=1.533 E3,相伴概率值p<0.001。说明多个自变量与因变量人均消费之间存在着线性回归关系。另外,Sum of Squares一栏中分别代表回归平方和2641696.843、残差平方和1034.170以及总平方和2642731.013,df为自由度。
表7列出了人均消费的预测值、标准预测值、预测值标准差等指标的最小值、最大值、平均值、方差和个案数。
(3)多元线性回归的检验。拟合优度检验。测定多元线性回归的拟合程度,使用多重相关系数R2,它表示因变量与所有自变量全体之间线性相关程度,实际反映的是样本数据与预测数据间的相关程度。由表4可以看出R2=1,说明回归平面拟合程度最高。
回归方程的显著性检验又称F检验,它利用方差分析的方法进行,是平均的回归平方和与平均的残差平方和之比。F统计量服从第一自由度为k、第二自由度为n-k-1的F分布。由表5看出,F值为1.533E3,数值较大,说明自变量造成的因变量的变动远远大于随即因素对因
变量造成的影响,F统计量较为显著,回归方程的拟合优度也较高。
回归系数的显著性检验,又称t检验。t检验是检验各自变量对因变量的影响是否显著,从而找出那些自变量对因变量的影响哪些是重要的,哪些是不重要的。由表6可以看出各变量的t值。其中,人均收入t值为14.296,政府投入为1.798,CPI为-1.626,恩格尔系数为-0.094,养老保险投保率为0.156,其他因素为1.218。
四、总结
从模型中可以看出,农村商品零售价格指数对农村人均消费的影响最大,其次是农村人均收入,紧随其后的是农村养老保险参保率和农村居民家庭恩格尔系数,最后是政府财政对农业的投入。值得思考的是:第一,尽管2008年以来推广的家电下乡等在一定程度上降低了农村零售商品价格,但价格改革的继续深化、工农业商品比价的合理调整仍有很大的空间。农村消费决策的制定受价格因素的影响较大,商品的价格弹性和物美价廉的心理比城镇强烈。第二,2007年城镇人均年总收入达人民币14908.6元,是农村同期数据的2.57倍,其中农村人均年总收入比城镇低收入户的人均年总收入还要低1201.5元。城乡收入差距的不断扩大使得城乡消费水平差距越拉越远,农民增收问题任重而道远。第三,2004年以来,农村养老保险发展逐渐好转,但每年增速仅为1%~3%,2007年甚至出现2%的负增长,说明农村养老保险在我国的开展仍处于初级阶段。养老保险能为农民负担沉重的养老和医疗负担,减少后顾之忧,敢于在现期消费,降低农村养老保险投保的门槛,提高农村养老保险的普及率应是今后政府工作的重点。第四,自2001年以来,农村居民家庭恩格尔系数每隔一年就有1%~2%的小幅下降或上升,农村居民家庭恩格尔系数与城镇居民家庭恩格尔系数的比值一直保持在1.25左右,可以看出我国农民生活中食品支出比重过大,农村生活现代化程度还比较低。恩格尔系数过高也反映了农民收入的偏低,说明提高农民收入是解决这一问题的根本办法。第五,政府财政对农业的投入虽在一定程度上带动了农村的人均消费,但其作用没有前四个因素显著。如何使财政投入转化为农民真正可以自由支配的收入,应是今后政府努力思考的问题。