多元线性回归模型的案例讲解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多元线性回归模型的案
例讲解
Revised as of 23 November 2020
1. 表1列出了某地区家庭人均鸡肉年消费量Y与家庭月平均收入X,鸡肉价格P1,猪肉价格P2与牛肉价格P3的相关数据。年份Y/
千克X/
元
P1/(元/
千克)
P2/(元/
千克)
P3/(元/
千克)
年份Y/
千
克X/元
P1/(元/
千克)
P2/(元/
千克)
P3/(元/
千克)
1980 397 1992 911
1981 413 1993 931
1982 439 1994 1021
1983 459 1995 1165
1984 492 1996 1349
1985 528 1997 1449
1986 560 1998 1575
1987 624 1999 1759
1988 666 2000 1994
1989 717 2001 2258
1990 768 2002 2478
1991 843
(1)求出该地区关于家庭鸡肉消费需求的如下模型:
(2)请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。
先做回归分析,过程如下:
输出结果如下:
所以,回归方程为:
由上述回归结果可以知道,鸡肉消费需求受家庭收入水平和鸡肉价格的影响,而牛肉价格和猪肉价格对鸡肉消费需求的影响并不显着。
验证猪肉价格和鸡肉价格是否有影响,可以通过赤池准则(AIC)和施瓦茨准则(SC)。若AIC值或SC值增加了,就应该去掉该解释变量。
去掉猪肉价格P2与牛肉价格P3重新进行回归分析,结果如下:
Variable Coefficient Std. Error t-Statistic Prob.
C
LOG(X)
LOG(P1)
R-squared
Mean dependent var
Adjusted R-squared . dependent var . of regression
Akaike info criterion Sum squared resid Schwarz criterion Log likelihood
F-statistic
Durbin-Watson stat
Prob(F-statistic)
通过比较可以看出,AIC 值和SC 值都变小了,所以应该去掉猪肉价格P 2与牛肉价格P 3这两个解释变量。所以该地区猪肉与牛肉价格确实对家庭的鸡肉消费不产生显着影响。
2. 表2列出了中国2012年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值Y ,资产合计K 及职工人数L 。
序号 工业总产值Y/亿元 资产合计K/亿元 职工人数L/万人
序号 工业总产值Y/亿元 资产合计K/亿元 职工人数L/万人
1 17
2 18
3 19
4 20
5 21
6 22
7 23
8 24
9 25 10 26 11 27 12 28 13 29 14 30 15 31
16
设定模型为:Y AK L e αβμ=
(1) 利用上述资料,进行回归分析;
(2) 回答:中国2000年的制造业总体呈现规模报酬不变状态吗 将模型进行双对数变换如下: 1)进行回归分析:
得到如下回归结果: 于是,样本回归方程为:
从回归结果可以看出,模型的拟合度较好,在显着性水平的条件下,各项系数均通过了t 检验。从F 检验可以看出,方程对Y 的解释程度较少。
0.7963R =表明,工业总产值对数值的%的变化可以由资产合计对数与职工的对数值
的变化来解释,但仍有%的变化是由其他因素的变化影响的。
从上述回归结果看,ˆˆ0.971α
β+=≈,即资产与劳动的产出弹性之和近似为1,表明中国制造业在2000年基本呈现规模报酬不变的状态。下面进行Wald 检验对约束关系进行检验。 过程如下: 结果如下:
由对应概率可以知道,不能拒绝原假设,即资产与劳动的产出弹性之和为1,表明中国制造业在2000年呈现规模报酬不变的状态。
一、邹式检验(突变点检验、稳定性检验)
1.突变点检验
1995-2012年中国家用汽车拥有量(t y ,万辆)与城镇居民家庭人均可支配收入(t x ,元),数据见表3。
表3 中国家用汽车拥有量(t y )与城镇居民家庭人均可支配收入(t x )数据
年份 t y (万辆) t
x (元) 年份 t y (万辆) t
x (元) 1995
2004 1996 2005 4283 1997 2006 1998
2007
1999 2008 2000 2009 5854 2001 2010 6280 2002 2011 2003 2012
下图是关于t y 和t x 的散点图:
从上图可以看出,2006年是一个突变点,当城镇居民家庭人均可支配收入突破元之后,城镇居民家庭购买家用汽车的能力大大提高。现在用邹突变点检验法检验1996年是不是一个突变点。
H 0:两个字样本(1995—2005年,2006—2012年)相对应的模型回归参数相等 H 1:备择假设是两个子样本对应的回归参数不等。
在1995—2012年样本范围内做回归。 在回归结果中作如下步骤: 输入突变点: 得到如下验证结果:
由相伴概率可以知道,拒绝原假设,即两个样本(1995—2005年,2006—2012年)的回归参数不相等。所以,2006年是突变点。 2.稳定性检验
以表3为例,在用1995—2009年数据建立的模型基础上,检验当把2010—2012年数据加入样本后,模型的回归参数时候出现显着性变化。
因为已经知道2006年为结构突变点,所以设定虚拟变量:019952005
1120062012D -⎧⎨-⎩
对1995—2012年的数据进行回归分析: 做邹氏稳定性检验: 输入要检验的样本点: