应用回归课程设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用回归分析
课程设计报告
课程:应用回归分析
题目:人均可支配收入的分析年级:11金统
专业:金融统计
学号:
姓名:
指导教师:
徐州师范大学
数学科学学院
基于多元线性回归模型对我国城镇居民家
庭人均可支配收入的分析
摘要:收入分配和消费结构都是国民经济的重要课题居民消费的主要来源
是居民收入而消费又是拉动经济增长的重要因素。本文将通过多远统计分析方法对我国各地区城镇居民收入的现状进行分析。通过分析找出我国城镇居民收入特点及其中存在的不足。城镇居民可支配收入是检验我国社会主义现代化进程的一个标准。本文根据我国城镇居民家庭人均可支配收入为研究对象,选取可能影响我国城镇居民家庭人均可支配收入的城乡居民储蓄存款年底余额、城乡居民储蓄存款年增加额、国民总收入、职工基本就业情况、城镇居民家庭恩格尔系数(%)5个因素,运用多元线性回归分析建立模型,先运用普通最小二乘估计求回归系数再对方程进行异方差、自相关、和多重共线性诊断,用迭代法消除了自变量之间的自相关。对于多重共线性问题,先是用逐步回归和剔除变量的方法,最终转变为用方差扩大因子法城乡居民储蓄存款年增加额剔除城镇居民家庭恩格尔系数(%)
解决多重共线性,建立最终回归方程
432108.0039.0012.0470.5305x x x y +++-=∧
标准化回归方程
**
3*24108.0863.0031.0x x x y ++=∧
以其探究最后进入回归方程的几个变量在影响城镇居民收入孰轻孰重,达到学习与生活结合的效果。分析出影响城镇居民收入的主要原因,并对模型联系实际进行分析,以供国家进行决策做参考。
关键词:多元线性回归 异方差 自相关 多重共线性 逐步回归 方差扩
大因子
(一)引言:
改革开放以来我国的国民经济增长迅速居民的收入水平也大幅提高但居
民收入分配差距也在不断扩大。2008年的金融危机为我国带来的后遗症还在继续影响着居民正常生活物价上涨和通货膨胀的压力仍然困扰着老百姓收入和消费支出体系的健康发展至关重要。消费是拉动国民经济增长的一架重要马车收入又是决定居民消费的最主要因素。我国人口基数大消费群体众多但由于居民收入分配差距大直接影响到居民消费需求的降低从而影响经济增长。而且随着中国特色的市场经济体制的建立各种收入分配问题也愈发明显。因此鉴于篇幅限制本文就只针对城镇居民的收入进行分析。中国网北京7月13日讯 国家统计局今日发布数据显示,我国城乡居民收入稳定增长,农村居民收入增长较快。上半年,城镇居民家庭人均总收入12076元。其中,城镇居民人均可支配收入11041元,同比增长13.2%,扣除价格因素,实际增长7.6%。在城镇居民家庭人均总收入中,工资性收入同比名义增长11.5%,转移性收入增长9.9%,经营净收入增长31.2%,财产性收入增长20.4%。农村居民人均现金收入3706元,同比增长20.4%,扣除价格因素,实际增长13.7%。其中,工资性收入同比名义增长20.1%,家庭经营收入增长21.0%,财产性收入增长7.5%,转移性收入增长23.2%。财政部副部眨楼继伟就调整城镇中低收入居民收 入政策符记者问中说:“由于城乡居民收入增长趋缓,居民对未来支出增加的预期增强, 消费意愿减弱,导致消费需求不旺。针对有效需求不足这一突出问题,党中央利国务院 决定, 积极调整收入分配政策,通过提高国有企业下岗职工等低收入者的生活保障水平 和增加机关事业单位职工工资等措施,逐步改变居民收入预期下降、支出预期I:列、高 收入者消费意愿不强、低收入者消费能力不足的状况,旨在刺激消费需求,健进国民经 济持续快速健康发展。”
下面通过统计数据对我国城镇居民家庭人均可支配收入的总体现状和发展态势进行分析了解我国居民收入分配情况。
(二)问题重述
以1991年-2011年的城镇居民家庭人均可支配收入y 为因变量,选取城乡居民储蓄存款年底余额x1、城乡居民储蓄存款年增加额x2、国民总收入x3、职工基本就业情况x4、城镇居民家庭恩格尔系数(%)x5为自变量。
(三)模型分析与建立
①多元线性回归模型
1.多元线性回归模型的一般形式
设随机变量y 与一般变量p x x x ,,,21 的线性回归模型为
εββββ+++++=p p x x x y 22110 (4.1)
其中,p βββ,,,10 是1+p 个未知参数,0β称为回归常数,p ββ,,1 称为回归系
数。y 称为被解释变量(因变量),p x x x ,,,21 是p 个可以精确测量并控制的一般变量,称为解释变量(自变量)。 ε是随机误差,与一元线性回归一样,对随机误差项我们常假定
⎩⎨⎧==2
)var(0)(σ
εεE (4.2)
称
εββββ+++++=p p x x x y E 22110)( (4.3) 为理论回归方程。
对一个实际问题,如果我们获得n 组观测数据
),,2,1(),,,(;21n i y x x x i ip i i =,则线性回归模型(4.1)式可表示为
⎪⎪
⎩⎪⎪⎨
⎧+++++=+++++=+++++=n
np p n n n p p p p x x x y x x x y x x x y εββββεββββεββββ 221102
2222211021
112211101 (4.4) 写成矩阵形式为
εβ+=X y (4.5)
其中
⎪⎪⎪⎪
⎪⎭⎫
⎝⎛=n y y y y
21 ⎥⎥⎥⎥
⎥⎦⎤⎢⎢⎢⎢
⎢⎣⎡=np n n p p x x x x x x x x x X 2
1
22221
112111
11 ⎥⎥⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎢⎢⎣⎡=p βββββ 210 ⎥⎥⎥⎥⎥⎥
⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=n εεεεε 210 (4.6)
X 是一个)1(+⨯p n 阶矩阵,称为回归设计矩阵或资料矩阵。 2.多元线性回归模型的基本假定
为了方便地进行模型的参数估计,对回归方程(4.4)式有如下一些基本假定:
(1)解释变量p x x x ,,,21 是确定性变量,不是随机变量,且要求
n p X r a n k <+=1)(。这里的n p X rank <+=1)(,表明设计矩阵X 中的自变量列