应用回归分析,第4章课后习题参考答案
应用多元统计分析课后习题答案高惠璇第四章部分习题解答
其中β=(C'C)-1C'Y. 证明: Q( ) (Y C )(Y C ) ˆ C ˆ C )(Y C ˆ C ˆ C ) (Y C ˆ )(Y C ˆ ) ( ˆ )C C ( ˆ ) (Y C
ˆ) (1 R 2 ) ( y y ) 2 . ( 3 )残差平方和Q( i
i 1
13
第四章 回归分析
ˆ C(CC)1CY HY ˆ C 证明:(1)估计向量为 Y 1 n 1 ˆ 1 1 ˆ y ˆ i 1n Y 1n HY ( H 1n )Y y n i 1 n n n 1 1n Y y. n
解:样本的似然函数为
L(a, b, 2 )
1 2 2 2 exp [( y a ) ( y 2 a b ) ( y a 2 b ) ] 1 2 3 3 2 2 2 2 1
ˆ, 2 ) ˆ, b L(a
1 2 ˆ) 2 ( y a ˆ) 2 ] ˆ ˆ ˆ exp [( y a ) ( y 2 a b 2 b 2 3 3 2 2 1 2 2 1
3 似然比统计量的分子为
2
1 ˆ0 ( y1 y2 3 y3 ) a 11
ˆ0 , ˆ 0 ) (2 ) ( ˆ0 ) L( a
3 2
3 2 2
3 exp[ ]. 2
5
第四章 回归分析
似然比统计量为
2
ˆ0 , ˆ 0 ) ( L( a ˆ0 ) 2 ˆ, ˆ, b ˆ ) L( a
可得参数向量β和σ2的最大似然估计为:
ˆ (C C ) 1 C Y . 2 1 ˆ )(Y C ˆ) ˆ ( Y C n
《应用回归分析》课后题标准答案
3
(5)由于 1
N
(1,
2 Lxx
)
t
1 1 2 / Lxx
(1
)
Lxx
服从自由度为 n-2 的 t 分布。因而
P
|
(
1
)
Lxx
|
t
/
2
(n
2)
1
也即: p(1 t /2
Lxx
1 1 t /2
) =1 Lxx
可得
ቤተ መጻሕፍቲ ባይዱ
1
的置信度为95%的置信区间为(7-2.353
1 3
33,7+2.353 1 3
1
第二章 一元线性回归
2.14 解答:(1)散点图为:
(2)x 与 y 之间大致呈线性关系。
(3)设回归方程为 y 0 1 x
n
xi yi n x y
1=
i 1 n
7
xi2 n(x)2
i 1
0 y 1 x 20 7 3 1
可得回归方程为 y 1 7x
2
(4)
1 n-2
1.5 回归变量的设置理论根据是什么?在回归变量设置时应注意哪些问题? 答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判 断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。应注意 的问题有:在选择变量时要注意与一些专门领域的专家合作,不要认为一个回归 模型所涉及的变量越多越好,回归变量的确定工作并不能一次完成,需要反复试 算,最终找出最合适的一些变量。
t /2
0
0
1 n
( x)2 Lxx
t
/
2
)
1
可得 1的置信度为95%的置信区间为( 7.77,5.77)
应用多元统计分析课后习题答案高惠璇部分习题解答(00004)市公开课金奖市赛课一等奖课件
[(
y1
aˆ0
)2
]
0
可得
ˆ
2
1 3
( y1
aˆ0 )2
( y2
aˆ0 )2
( y3
3aˆ0 )2
drf
ˆ
2 0
似然比统计量分子为
L(aˆ0
, ˆ 0 2
)
(2
)
3 2
(ˆ 0 2
)
3 2
exp[
3 2
].
第5页
5
第四章 回归分析
似然比统计量为
L(aˆ0 ,ˆ02 ) L(aˆ,bˆ,ˆ 2 )
第18页 18
第四章 回归分析
第19页 19
第四章 回归分析
等号成立 C(ˆ ) 0 (CC)1C • C(ˆ ) 0 ˆ.
第20页 20
第四章 回归分析
第21页 21
第四章 回归分析
第22页 22
第四章 回归分析
见附录P394定理7.2(7.5)式
第23页 23
第四章 回归分析
证实:(1)预计向量为 Yˆ Cˆ C(CC)1CY HY
yˆ
1 n
n i 1
yˆi
1 n
1n
Yˆ
1 n
1n
HY
1 n
(H1n )Y
1 n
1n
Y
y.
(因1n C张成的空间,这里有H1n 1n )
(2) 因 n ( yi y)( yˆi yˆ ) n ( yi yˆi yˆi y)( yˆi y)
0
ln
L
2
n
2
2
1
2( 2 )2
(Y
应用回归分析人大前四章课后习题答案详解Word版
3.10验证决定系数 与F值之间的关系式: 38
3.11研究货运总量y(万吨)与工业总产值38
1)计算出y, x1 ,x2, x3的相关系数矩阵39
2)求y关于x1, x2, x3的三元线性回归方程40
3)对所求的的方程作拟合优度检验41
③不论是时间序列数据还是横截面数据的手机,样本容量的多少一般要与设置的解释变量数目相配套。
4)统计数据的整理中不仅要把一些变量数据进行折算,差分,甚至把数据对数化,标准化等,有时还须注意剔除个别特别大或特别小的“野值”,有时需要利用差值的方法把空缺的数据补齐。
1.7构造回归理论模型的基本根据是什么?
1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?31
2)建立y对x的线性回归;32
3)用线性回归的Plots功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。32
3多元线性回归34
3.1写出多元线性回归模型的矩阵表示形式,并给出多元线性回归模型的基本假设。34
3.2讨论样本容量n与自变量个数p的关系,它们对模型的参数估计有何影响?35
由于许多经济变量的前后期之间总是有关联的,因此时间序列数据容易产生模型中随机误差项的序列相关。对于具有随机误差项序列相关的情况,就要通过对数据的某种计算整理来消除序列相关性,最常用的处理方法是差分法。
②横截面数据是在同一时间截面上的统计数据。由于一个回归模型往往涉及众多解释变量,如果其中某一因素或一些因素随着解释变量观测值的变化而对被解释变量产生不同影响,就产生异方差。因此当用截面数据作样本时,容易产生异方差。对于具有异方差性的建模问题,数据整理就是注意消除异方差性,这常与模型参数估计方法结合起来考虑。
《应用回归分析》课后习题答案
答:选择模型的数学形式的主要依据是经济行为理论,根据变量的样本数据作出解释变量与被解释变量之间关系的散点图,并将由散点图显示的变量间的函数关系作为理论模型的数学形式。对同一问题我们可以采用不同的形式进行计算机模拟,对不同的模拟结果,选择较好的一个作为理论模型。
df
均方
F
显著性
组间
(组合)
1231497.500
7
175928.214
5.302
.168
线性项
加权的
1168713.036
1
1168713.036
35.222
.027
偏差
62784.464
6
10464.077
.315
.885
组内
66362.500
2
33181.250
总数
1297860.000
9
由于 ,拒绝 ,说明回归方程显著,x与y有显著的线性关系。
.212
.586
1.708
a.因变量: y
(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。
去除x3后作F检验,得:
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
12893.199
2
6446.600
11.117
.007a
残差
4059.3.500
.724
.433
.212
.586
1.708
a.因变量: y
(2)
所以三元线性回归方程为
模型汇总
模型
R
应用回归分析第4章课后习题参考答案
应用回归分析第4章课后习题参考答案第4章违背基本假设的情况思考与练习参考答案试举例说明产生异方差的原因。
答:例:截面资料下研究居民家庭的储蓄行为Y i=0+1X i+εi其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。
由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。
例:以某一行业的企业为样本建立企业生产函数模型Y i=A i1K i2L i3eεi被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。
这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。
异方差带来的后果有哪些答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效2、变量的显著性检验失去意义3、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。
答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。
其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。
在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。
然而在异方差的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。
由OLS求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。
所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。
应用回归分析课后习题参考答案 全部版 何晓群,刘文卿
第一章回归分析概述1.2 回归分析与相关分析的联系与区别是什么?答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。
区别有 a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。
在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。
b.相关分析中所涉及的变量y与变量x全是随机变量。
而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。
C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。
而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。
1.3回归模型中随机误差项ε的意义是什么?答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。
1.4 线性回归模型的基本假设是什么?答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。
2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)={σ^23.正态分布的假定条件为相互独立。
4.样本容量的个数要多于解释变量的个数,即n>p.第二章一元线性回归分析思考与练习参考答案2.1一元线性回归有哪些基本假定?答:假设1、解释变量X是确定性变量,Y是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性:E(εi)=0 i=1,2, …,nVar (εi)=σ2i=1,2, …,nCov(εi,εj)=0 i≠j i,j= 1,2, …,n假设3、随机误差项ε与解释变量X之间不相关:Cov(X i, εi)=0 i=1,2, …,n假设4、ε服从零均值、同方差、零协方差的正态分布εi~N(0, σ2) i=1,2, …,n2.3 证明(2.27式),∑e i =0 ,∑e i X i =0 。
应用回归分析-第4章课后习题参考答案精品资料
第4章违背基本假设的情况思考与练习参考答案4.1 试举例说明产生异方差的原因。
答:例4.1:截面资料下研究居民家庭的储蓄行为Y i=β0+β1X i+εi其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。
由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。
例4.2:以某一行业的企业为样本建立企业生产函数模型Y i=A iβ1K iβ2L iβ3eεi被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。
这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。
4.2 异方差带来的后果有哪些?答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效2、变量的显著性检验失去意义3、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。
答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。
其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。
在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。
然而在异方差的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。
由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。
所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。
应用回归分析,第4章课后习题参考答案
第4章违背基本假设的情况思考与练习参考答案试举例说明产生异方差的原因。
答:例:截面资料下研究居民家庭的储蓄行为Y i=?0+?1X i+εi其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。
由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。
例:以某一行业的企业为样本建立企业生产函数模型Y i=A i?1K i?2L i?3eεi被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。
这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。
异方差带来的后果有哪些?答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效2、变量的显着性检验失去意义3、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。
答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。
其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。
在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。
然而在异方差的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。
由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。
所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。
这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。
《应用回归分析》课后题答案解析
(8) t
1
2
/ Lxx
1
Lxx
2
其中
1 n2
n i1
ei 2
1 n2
n i1
( yi
2
yi )
0.0036 1297860 8.542 0.04801
t /2 1.895
t 8.542 t /2
接受原假设 H 0: 1 0, 认为 1 显著不为 0,因变量 y 对自变量 x 的一元线性回归成立。
( yi
2
yi )
1 n-2
n i=1
( yi
( 0 1
2
x))
=
1 3
( 10-(-1+71))2 (10-(-1+7 (20-(-1+7 4))2 (40-(-1+7
2))2 (20-(-1+7 5))2
3))2
1 16 9 0 49 36
3
110 / 3
1
330 6.1
《应用回归分析》部分课后习题答案
第一章 回归分析概述
变量间统计关系和函数关系的区别是什么 答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量 唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另 外一个变量的确定关系。
回归分析与相关分析的联系与区别是什么 答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有 a. 在回归分析中,变量 y 称为因变量,处在被解释的特殊地位。在相关分析中,变 量 x 和变量 y 处于平等的地位,即研究变量 y 与变量 x 的密切程度与研究变量 x 与变量 y 的密切程度是一回事。b.相关分析中所涉及的变量 y 与变量 x 全是随机 变量。而在回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量也可以 是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的 密切程度。而回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归 方程进行预测和控制。
《应用数理统计》吴翊李永乐第四章-回归分析课后作业参考答案
《应⽤数理统计》吴翊李永乐第四章-回归分析课后作业参考答案第四章回归分析课后作业参考答案4.1 炼铝⼚测得铝的硬度x与抗张强度y的数据如下:i x68 53 70 84 60 72 51 83 70 64i y288 298 349 343 290 354 283 324 340 286(1)求y 对x的回归⽅程(2)检验回归⽅程的显著性(05.0=α) (3)求y在x =65处的预测区间(置信度为0.95) 解:(1) 1、计算结果⼀元线性回归模型εββ++=x y 10只有⼀个解释变量其中:x 为解释变量,y 为被解释变量,10,ββ为待估参数,ε位随机⼲扰项。
()()()()685.222,959.4116,541.35555.76725.19745.109610,5.3151,5.671221212112121211=-==-====-=-==-=--==-=-======∑∑∑∑∑∑∑∑========n Q U L Q L L U y n yyy L y x n y x y y x x L x n xxx L n y n y x n x ee yy e xxxyni ini i yy ni i i n i i i xy ni ini i xx ni i n i i σ使⽤普通最⼩⼆乘法估计参数10,ββ上述参数估计可写为95.193??,80.1?101=-===x y L L xxxy βββ所求得的回归⽅程为:x y80.195.193?+= 实际意义为:当铝的硬度每增加⼀个单位,抗张强度增加1.80个单位。
2、软件运⾏结果根据所给数据画散点图过检验由线性回归分析系数表得回归⽅程为:x y801.1951.193?+=,说明x 每增加⼀个单位,y 相应提⾼1.801。
(2) 1、计算结果①回归⽅程的显著性检验(F 检验):0H 线性回归效果不显著 :1H 线性回归效果显著()91.62/=-=n Q UF e在给定显著性⽔平05.0=α时,()()F F n F <==--32.58,12,195.01α,所以拒绝0H ,认为⽅程的线性回归效果显著②回归系数的显著性检验(t 检验)0:10=βH 0:11≠βH()628.22/?1=-=n Q L t e xx β在给定显著性⽔平05.0=α时,()()t t n t<==--306.282975.021α,所以拒绝0H ,认为回归系数显著,说明铝的硬度对抗张强度有显著的影响。
应用回归分析第4章课后习题集参考答案
第4章违背基本假设的情况思考与练习参考答案4.1 试举例说明产生异方差的原因。
答:例4.1:截面资料下研究居民家庭的储蓄行为Y i=0+1X i+εi其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。
由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。
例4.2:以某一行业的企业为样本建立企业生产函数模型Y i=A i1K i2L i3eεi被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。
这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。
4.2 异方差带来的后果有哪些?答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效2、变量的显著性检验失去意义3、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。
答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。
其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。
在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。
然而在异方差的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。
由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。
所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。
《应用回归分析》课后题答案[整理版]
《应用回归分析》课后题答案[整理版] 《应用回归分析》部分课后习题答案第一章回归分析概述 1.1 变量间统计关系和函数关系的区别是什么, 答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么, 答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。
区别有a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。
在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。
b.相关分析中所涉及的变量y与变量x全是随机变量。
而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。
C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。
而回归分析不仅可以揭示变量x 对变量y的影响大小,还可以由回归方程进行预测和控制。
1.3 回归模型中随机误差项ε的意义是什么, 答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。
1.4 线性回归模型的基本假设是什么,答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。
2.等方差及不相关的假定条件为{E(εi)=0 i=1,2….Cov(εi,εj)=,σ^23.正态分布的假定条件为相互独立。
4.样本容量的个数要多于解释变量的个数,即n>p.1.5 回归变量的设置理论根据是什么,在回归变量设置时应注意哪些问题,答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。
应用回归分析第4章课后习题参考答案
应用回归分析第4章课后习题参考答案第4章违背基本假设的情况思考与练习参考答案试举例说明产生异方差的原因。
答:例:截面资料下研究居民家庭的储蓄行为Y i=0+1X i+εi其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。
由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。
例:以某一行业的企业为样本建立企业生产函数模型Y i=A i1K i2L i3eεi被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。
这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。
异方差带来的后果有哪些答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效2、变量的显著性检验失去意义3、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。
答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。
其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。
在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。
然而在异方差的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。
由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。
所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。
《应用回归分析》课后题答案解析
《应用回归分析》部分课后习题答案第一章回归分析概述1.1 变量间统计关系和函数关系的区别是什么?答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么?答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。
区别有 a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。
在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。
b.相关分析中所涉及的变量y与变量x全是随机变量。
而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。
C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。
而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。
1.3 回归模型中随机误差项ε的意义是什么?答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。
1.4 线性回归模型的基本假设是什么?答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。
2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)={σ^23.正态分布的假定条件为相互独立。
4.样本容量的个数要多于解释变量的个数,即n>p.1.5 回归变量的设置理论根据是什么?在回归变量设置时应注意哪些问题?答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。
《应用回归分析》课后习题部分答案何晓群版
第二章 一元线性回归2.14 解答:(1)散点图为:(2)x 与y 之间大致呈线性关系。
(3)设回归方程为01y x ββ∧∧∧=+1β∧=12217()ni ii nii x y n x yxn x --=-=-=-∑∑0120731y x ββ-∧-=-=-⨯=-17y x ∧∴=-+可得回归方程为(4)22ni=11()n-2i i y y σ∧∧=-∑ 2n 01i=11(())n-2i y x ββ∧∧=-+∑=2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦(10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75)) []1169049363110/3=++++=6.1σ∧=≈ (5)由于211(,)xxN L σββ∧t σ∧==服从自由度为n-2的t 分布。
因而/2|(2)1P t n αασ⎡⎤⎢⎥<-=-⎢⎥⎣⎦也即:1/211/2(p t t ααβββ∧∧∧∧-<<+=1α-可得195%β∧的置信度为的置信区间为(7-2.3537+2.353 即为:(2.49,11.5)2201()(,())xxx Nn L ββσ-∧+t ∧∧==服从自由度为n-2的t 分布。
因而/2(2)1P t n αα∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦即0/200/2()1p βσββσα∧∧∧∧-<<+=- 可得195%7.77,5.77β∧-的置信度为的置信区间为()(6)x 与y 的决定系数22121()490/6000.817()nii nii y y r y y ∧-=-=-==≈-∑∑(7)由于(1,3)F F α>,拒绝0H ,说明回归方程显著,x 与y 有显著的线性关系。
(8)t σ∧==其中2221111()22n ni i i i i e y y n n σ∧∧====---∑∑ 7 3.661==≈ /2 2.353t α= /23.66t t α=>∴接受原假设01:0,H β=认为1β显著不为0,因变量y 对自变量x 的一元线性回归成立。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章违背基本假设的情况思考与练习参考答案4.1 试举例说明产生异方差的原因。
答:例4.1:截面资料下研究居民家庭的储蓄行为Y i=β0+β1X i+εi其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。
由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。
例4.2:以某一行业的企业为样本建立企业生产函数模型Y i=A iβ1K iβ2L iβ3eεi被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。
这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。
4.2 异方差带来的后果有哪些?答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效2、变量的显著性检验失去意义3、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。
答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。
其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。
在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。
然而在异方差的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。
由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。
所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。
这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。
加权最小二乘法的方法:4.4简述用加权最小二乘法消除多元线性回归中异方差性的思想与方法。
答:运用加权最小二乘法消除多元线性回归中异方差性的思想与一元线性回归的类似。
多元线性回归加权最小二乘法是在平方和中加入一个适当的权数i w ,以调整各项在平方和中的作用,加权最小二乘的离差平方和为:∑=----=ni ip p i i i p w x x y w Q 1211010)( ),,,(ββββββ(2)加权最小二乘估计就是寻找参数p βββ,,,10 的估计值pw w w βββˆ,,ˆ,ˆ10 使式(2)的离差平方和w Q 达极小。
所得加权最小二乘经验回归方程记做220111ˆˆˆ()()N Nw i i i i i ii i Q w y y w y x ββ===-=--∑∑22__1_2__02222()()ˆ()ˆ1111,i i Nw iii w i wi www w w kx i ii imi i i miw xx y y x x y x w kx x kx w x σβββσσ==---=-=====∑∑1N i =11表示=或ppw w w w x x y βββˆˆˆˆ110+++= (3) 多元回归模型加权最小二乘法的方法:首先找到权数i w ,理论上最优的权数i w 为误差项方差2i σ的倒数,即21ii w σ=(4)误差项方差大的项接受小的权数,以降低其在式(2)平方和中的作用; 误差项方差小的项接受大的权数,以提高其在平方和中的作用。
由(2)式求出的加权最小二乘估计pw w w βββˆ,,ˆ,ˆ10 就是参数p βββ,,,10 的最小方差线性无偏估计。
一个需要解决的问题是误差项的方差2i σ是未知的,因此无法真正按照式(4)选取权数。
在实际问题中误差项方差2i σ通常与自变量的水平有关(如误差项方差2i σ随着自变量的增大而增大),可以利用这种关系确定权数。
例如2i σ与第j 个自变量取值的平方成比例时, 即2i σ=k 2ij x 时,这时取权数为21iji x w =(5)更一般的情况是误差项方差2i σ与某个自变量j x (与|e i |的等级相关系数最大的自变量)取值的幂函数m ij x 成比例,即2i σ=k mij x ,其中m 是待定的未知参数。
此时权数为m iji x w 1=(6) 这时确定权数i w 的问题转化为确定幂参数m 的问题,可以借助SPSS 软件解决。
4.5(4.5)式一元加权最小二乘回归系数估计公式。
证明: 由 得:220111ˆˆˆ()()N Nw i i i i i ii i Q w y y w y x ββ===-=--∑∑0100ˆˆQQββ∂∂==∂∂ww w in i iw i w ini ix y x xw y y x xw 102111ˆˆ)())((ˆβββ-=---=∑∑==4.6验证(4.8)式多元加权最小二乘回归系数估计公式。
证明:对于多元线性回归模型 ,y =X β+ε (1)2()0,cov(,)E σ'∃==εεεW ,即存在异方差。
设,00n w '=⎫⎪=⎪ ⎪⎝⎭W DD D , 用-1D 左乘(1)式两边,得到一个新的的模型:---111D y =D X β+D ε,即***y =X β+ε。
因为22()()()E E E σσ---''''''====1-11-11-1εεD εεD D εεD D WD I , 故新的模型具有同方差性,故可以用广义最小二乘法估计该模型,得111ˆ()()()**-**------''''''''===1111wβX X X y X D D X X D D y X WX X Wy 原式得证。
4.7 有同学认为当数据存在异方差时,加权最小二乘回归方程与普通最小二乘回归方程之间必然有很大的差异,异方差越严重,两者之间的差异就越大。
你是否同意这位同学的观点?说明原因。
答:不同意。
当回归模型存在异方差时,加权最小二乘估计(WLS )只是普通最小二乘估计(OLS )的改进,这种改进可能是细微的,不能理解为WLS 一定会得到与OLS 截然不同的方程来,或者大幅度的改进。
实际上可以构造这样的数据,回归模型存在很强的异方差,但WLS 与OLS 的结果一样。
加权最小二乘法不会消除异方差,只是消除异方差的不良影响,从而对模型进行一点改进。
4.8 对例4.3的数据,用公式iw i iw e w e ='计算出加权变换残差'iwe ,绘制加权变换残差图,根据绘制出的图形说明加权最小二乘估计的效果。
解:用公式iw i iw e w e '计算出加权变换残差'iwe ,分别绘制加权最小二乘估计后的残差图和加权变换残差图(见下图)。
根据绘制出的两个图形可以发现加权最小二乘估计没有消除异方差,只是对原OLS的残差有所改善,而经过加权变换后的残差不存在异方差。
4.9 参见参考文献[2],表4.12(P138)是用电高峰每小时用电量y与每月总用电量x的数据。
(1)用普通最小二乘法建立y与x的回归方程,并画出残差散点图。
解:SPSS输出结果如下:由上表可得回归方程为:ˆ0.8310.004=-+y x残差图为:解:a由残差散点图可以明显看出存在异方差,误差的方差随着x的增加而增大。
b 用SPSS 做等级相关系数的检验,结果如下表所示:Cor relations1.000.318*..0215353.318* 1.000.021.5353Correlation Coefficient Sig. (2-tailed)NCorrelation Coefficient Sig. (2-tailed)NxabseiSpearm an's rhox absei Correlation is significant at the 0.05 level (2-tailed).*.得到等级相关系数0.318sr ,P 值=0.021,认为残差绝对值ie 与自变量i x 显著相关,存在异方差。
(3)如果存在异方差,用幂指数型的权函数建立加权最小二乘回归方程; 解:SPSS 输出结果如图:由上述表可得,在 1.5m =时对数似然函数达到最大,则幂指数的最优取值为1.5m =。
加权后的回归方程为:ˆ0.6830.004w y x =-+。
计算加权后的残差,并对残差绝对值和自变量做等级相关系数分析,结果如下表所示:0.321s r =,P 值为0.019<0.05,即加权最小二乘法没有消除异方差,只是消除异方差的不良影响,从而对模型进行一点改进。
(4)用方差稳定变换y y ='消除异方差。
解:对应变量做方差稳定变换(y y =')后,用最小二乘法做回归,SPSS 结果如下表:则回归方程为:ˆ0.5822+0.0009529yx '=。
保存预测值ˆi y',计算出残差的绝对值后,计算等级相关系数,见下表:其中0.160s r =,P 值=0.254>0.05,说明异方差已经消除。
4.10 试举一可能产生随机误差项序列相关的经济例子。
答:例如,居民总消费函数模型:C t =β0+β1Y t + ε t t=1,2,…,n由于居民收入对消费影响有滞后性,而且今年消费水平受上年消费水平影响,则可能出现序列相关性。
另外由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关 )。
4.11 序列相关性带来的严重后果是什么?答:直接用普通最小二乘法估计随机误差项存在序列相关性的线性回归模型未知参数时,会产生下列一些问题: 1.参数估计量仍然是无偏的,但不具有有效性,因为有自相关性时参数估计值的方差大于无自相关性时的方差。
2. 均方误差MSE 可能严重低估误差项的方差3.变量的显著性检验失去意义:在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,当参数方差严重低估时,容易导致t 值和F 值偏大,即可能导致得出回归参数统计检验和回归方程检验显著,但实际并不显著的严重错误结论。
4. 当存在序列相关时,β 仍然是β的无偏估计,但在任一特定的样本中,β可能严重歪曲β的真实情况,即最小二乘法对抽样波动变得非常敏感5. 模型的预测和结构分析失效。
4.12 总结DW 检验的优缺点。
答:优点:1.应用广泛,一般的计算机软件都可以计算出DW 值; 2.适用于小样本;3.可用于检验随机扰动项具有一阶自回归形式的序列相关问题。