回归分析课程论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
居民消费价格指数的影响因素
作者:罗林霞
摘要:研究居民消费价格指数的影响因素,建立与居民消费价格指数相关的多元线性回归模型,借助统计软件SPSS对数据作线性回归分析,对模型进行自变量的筛选、多重共线性、异方差性及自相关性的检验。最终检验出模型存在异方差性,利用加权最小二乘估计消除异方差性,确立最终的回归方程,各自变量对居民消费价格指数都是正影响,其中食品的影响是最显著的,其次是衣着和交通通讯,显著性最小的是医疗保健及个人用品。
关键词:居民消费价格指数;多元线性回归;逐步回归法;DW检验;共线性诊断;异方差检验;加权最小二乘估计
引言:CPI反应一定时期内居民所消费商品及服务项目的价格水平变动趋势和变动程度。居民消费价格水平的变动率在一定程度上反映了通货膨胀(或紧缩)的程度。通俗的讲,CPI 就是市场上的货物价格增长百分比。一般市场经济国家认为居民消费价格指数增长率在2%-3%属于可接受范围内,当然还要看其他数据,CPI过高始终不是好事。因此,对CPI的影响因素的研究十分重要。
一、因变量与自变量的提出
选取的数据是2013年《中国统计年鉴》里面的我国31个省、市、自治区的相关数据,y 为居民消费价格指数,x1为食品,x2为烟酒及用品,x3为衣着,x4为家庭设备用品及维修服务,x5为医疗保健及个人用品,x6为交通通信,x7为教育文化娱乐及用品,x8为居住。
二、模型初步建立与检验
利用SPSS软件对数据作线性回归分析得:
根据表一,F=52.554,P≈0.000远远小于显著性水平α=0.05,所以方程是显著的,即变量x1 ,x2…x8整体对y有显著的影响,说明建立y与x1,x2,…x8之间的多元线性方程是正确的。但自变量整体对y的影响是显著的并不表明每个变量对y都是显著的,从表二中可知x4对y是不显著的,从而需要剔除掉不显著的变量。
表一:方差分析表
Model Sum of Square df Mean Square F Sig.
Regression 5.061 8 .633 52.554 .000
Residual .265 22 .012
Total 5.326 30
表二:系数表
模型非标准化系数标准化系数t. Sig.
B 标准误差Beta
(constant) -8.381 7.019 1.195 .245 x1 .358 .022 .905 16.081 .000
x2 .069 .020 .217 3.448 .002
x3 .076 .013 .387 5.926 .000
x4 .001 .020 .002 .044 .095
x5 .098 .025 .202 3.912 .001
x6 .196 .035 .363 5.635 .000
x7 .130 .027 .278 4.864 .000
x8 .155 .028 .356 5.530 .000 三、自变量的筛选
用逐步回归法对自变量进行筛选,
表三:系数表
模型非标准化系数标准化系
数
t Sig.
B 标准误差Beta
(constant) -8.381 6.864 -1.221 .234 x1 .358 .022 .905 16.556 .000 x7 .130 .026 .278 4.986 .000 x3 .076 .013 .387 6.064 .000 x8 .155 .027 .356 5.665 .000 x6 .196 .033 .363 5.924 .000 x5 .099 .024 .202 4.058 .000 x2 .069 .020 .217 3.553 .002
从表三中可以得到进入的变量有七个,它们对y 的影响都是显著的,将x4从模型中剔除了,说明x4对y 并没有什么太大的影响,可以忽略不计,因此可得初步回归方程为:
2568371069.0099.0196.0155.0076.0130.0358.0381.8x x x x x x x y +++++++-=
各自变量对y 的影响都是正影响。 四、违背基本假设的诊断
以回归标准化预计值为x 轴,回归标准化残差为y 轴做残差图,以便于分析模型是否存在异方差性或多重共线性,从残差图中可以看到方差有增大的趋势,于是初步判断模型存在异方差性。接下来诊断是否存在自相关性,运用SPSS 软件得出DW 值为2.112,与2很接近,判断方程是不存在自相关性的。用SPSS 软件进行共线性诊断,得相关系数表,从表四可看到所有自变量的VIF 值均小于10,从而可以得出方程不存在多重共线性。
表四:相关系数表
四、消除异方差性
用加权最小二乘法消除数据间的异方差性,计算每个自变量与绝对残差之间的等级相关系数,选取与绝对残差等级相关系数最大的来构造权函数,最终确定选取x6交通通讯为最优权函数,得最终的系数表为:
表五
模型 非标准化系数 标准化系数 t. Sig. B 标准误差 Beta 标准误差
(constant)
-8.472 6.789 -1.246 .225 x1 .356 .022 .903 .055 16.538 .000 x2 .070 .019 .225 .061 3.667 .001 x3 .076 .012 .388 .064 6.086 .000 x5 .101 .024 .208 .049 4.217 .000 x6 .196 .033 .371 .062 6.037 .000 x7 .129 .026 .277 .056 4.977 .000 x8
.156
.027
.365
.063
5.776
.000
模型
非标准化系数
标准化系数 t
Sig.
相关系数
B 标准误差 Beta Tolerance
VIF (constant) -8.381
6.864 -1.221 .234 x1 .358 .022 .905 16.556 .000 .723 1.383 x7 .130 .026 .278 4.986 .000 .695 1.439 x3 .076 .013 .387 6.064 .000 .531 1.884 x8 .155 .027 .356 5.665 .000 .546 1.831 x6 .196 .033 .363 5.924 .000 .575 1.738 x5 .099 .024 .202 4.058 .000 .870 1.149 x2
.069
.020
.217
3.553
.002
.572
1.747