计量经济学第四版习题及参考答案解析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计量经济学(第四版)习题参考答案
潘省初
第一章 绪论
1.1 试列出计量经济分析的主要步骤。

一般说来,计量经济分析按照以下步骤进行:
(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和政策分析 1.2 计量经济模型中为何要包括扰动项?
为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。

1.3什么是时间序列和横截面数据? 试举例说明二者的区别。

时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。

横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。

如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。

1.4估计量和估计值有何区别?
估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。

在一项应用中,依据估计量算出的一个具体的数值,称为估计值。

如Y
就是一个估计量,1
n
i
i Y
Y n
==
∑。

现有一样本,共4个数,100,104,96,130,则
根据这个样本的数据运用均值估计量得出的均值估计值为
5.1074
130
96104100=+++。

第二章 计量经济分析的统计学基础
2.1 略,参考教材。

2.2请用例2.2中的数据求北京男生平均身高的99%置信区间
N
S S x =
=
4
5
=1.25 用α=0.05,N-1=15个自由度查表得005.0t =2.947,故99%置信限为 x S t X 005.0± =174±2.947×1.25=174±3.684
也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。

2.3 25个雇员的随机样本的平均周薪为130元,试问此样本是否取自一个均值为120元、标准差为10元的正态总体? 原假设 120:0=μH
备择假设 120:1≠μH 检验统计量
()
10/25X
X μσ-Z ==
==
查表96.1025.0=Z 因为Z= 5 >96.1025.0=Z ,故拒绝原假设, 即 此样本不是取自一个均值为120元、标准差为10元的正态总体。

2.4 某月对零售商店的调查结果表明,市郊食品店的月平均销售额为2500元,在下一个月份中,取出16个这种食品店的一个样本,其月平均销售额为2600元,销售额的标准差为480元。

试问能否得出结论,从上次调查以来,平均月销售额已经发生了变化? 原假设 : 2500:0=μH
备择假设 : 2500:1≠μH
()100/1200.83ˆX X t μσ-=
=== 查表得 131.2)116(025.0=-t 因为t = 0.83 < 131.2=c t , 故接受原假
设,即从上次调查以来,平均月销售额没有发生变化。

第三章 双变量线性回归模型
3.1 判断题(说明对错;如果错误,则予以更正) (1)OLS 法是使残差平方和最小化的估计方法。


(2)计算OLS 估计值无需古典线性回归模型的基本假定。


(3)若线性回归模型满足假设条件(1)~(4),但扰动项不服从正态分布,则尽管OLS 估计量不再是BLUE ,但仍为无偏估计量。


只要线性回归模型满足假设条件(1)~(4),OLS 估计量就是BLUE 。

(4)最小二乘斜率系数的假设检验所依据的是t 分布,要求β
ˆ的抽样分布是正态分布。


(5)R 2=TSS/ESS 。


R 2 =ESS/TSS 。

(6)若回归模型中无截距项,则0≠∑t e 。


(7)若原假设未被拒绝,则它为真。

错。

我们可以说的是,手头的数据不允许我们拒绝原假设。

(8)在双变量回归中,2
σ的值越大,斜率系数的方差越大。

错。

因为
∑=2
2
)ˆ(t
x Var σβ
,只有当∑2
t x 保持恒定时,上述说法才正确。

3.2设YX βˆ和XY
βˆ分别表示Y 对X 和X 对Y 的OLS 回归中的斜率,证明 YX βˆXY
βˆ=2r r 为X 和Y 的相关系数。

证明:
2222
2
222
ˆˆ()ˆˆi i
i i
i i YX
XY
i
i
i
i i YX XY
i i x y y x x y
x
y
y
x y x y
r x y ββββ===


⋅===∑∑∑∑∑∑∑∑∑
3.3证明:
(1)Y 的真实值与OLS 拟合值有共同的均值,即
Y n
Y n
Y ==∑∑ˆ; (2)OLS 残差与拟合值不相关,即 0ˆ=∑t t e Y 。

(1)
,得
两边除以,
=n ˆ0ˆ)
ˆ(ˆ∑∑∑∑∑∑∑∑=
∴+=⇒+=⇒+=t
t t t
t t t t
t t t t Y
Y e e Y Y e Y
Y e Y Y
Y n
Y n
Y ==∑∑ˆ,即Y 的真实值和拟合值有共同的均值。

(2)
的拟合值与残差无关。

,=,即因此,(教材中已证明),
由于Y 0ˆˆ),ˆ(0ˆ0,0e ˆˆ)ˆˆ(ˆ2
2
t
∑∑∑∑∑∑∑∑∑∑====+=+=t
t
t
t t
t
t
t t
t t
t t
t
t
t
t e
Y e Y e Y Cov e Y
e X e
X e e X e Y βαβα 3.4证明本章中(3.18)和(3.19)两式:
(1)∑∑=2
2
2)ˆ(t
t x n X Var σα
(2)∑-=2
2
)ˆ,ˆ(t x X Cov σβα (1)
22222
222
2
2211122
2
2
22
2
ˆˆ,ˆˆ()ˆˆˆ2u()()ˆ()
2()()()()
ˆ2
()()ˆ2
()i
i
t t
t
i n n n t i
i j i i
i j i j
i j i j
t
Y X Y X u u X u X X u u x u
X X n
n x
u u u x u x u X X n
n x u
u u x u
x x u u X n
n x α
βαβα
αββααβ
ββββ
ββ
ββ
β≠≠=+=++-=---=--+-=-⋅⋅+-+
+
=
-⋅+-+++=
-⋅+-∑∑∑∑∑∑∑∑∑∑∑()2X
222
222
222
2
22
22
22
()ˆˆ2E()1(()2())()2i i j
i i i j i j i j i j t i i j i j i i j i j i i i j i j i j
t u u u x u x x u u E E XE X n n x u u u E E u E u u n n
n n
x u x x u u XE n x ααββσ
σ≠≠≠≠≠⎛⎫⎡⎤+++ ⎪⎢⎥-=- ⎪⎢⎥
⎪⎢⎥⎝
⎭⎣⎦
⎛⎫
+ ⎪=+==




++∑∑∑∑∑∑∑∑∑∑∑∑两边取期望值,有:()-+等式右端三项分别推导如下:
22
2
2
222
22
22222
2
222
22
212(()()())200ˆE()()ˆ[]0i
i i i j i j i
i j
t t t t t
t
t t x X
x E u x x E u u X
x n x n x X X x x nX X X E n x n x n x σσββσσσσαα≠⎛⎫ ⎪
⎪ ⎪⎝

=++==-=
+-=-+==∑∑∑∑∑∑∑∑∑∑∑∑∑(
=)
因此
()∑∑=2
2
2)ˆ(t
t x n X Var σα

(2)
222
2
ˆˆ,ˆˆ()ˆˆˆˆˆˆ(,)[()][(())()]ˆˆ[(()][()]ˆ0()01ˆ()t Y X Y X u u X Cov E E u X E u XE XE XVar X x α
βαβα
αββαβααβ
ββββββ
ββββββ
σ=+=++-=--=--=---=---=--=-=-
∑()(第一项为的证明见本题())
3.5考虑下列双变量模型: 模型1:i i i u X Y ++=
21ββ
模型2:i i i u X X Y +-+=)(21αα
(1)β1和α1的OLS 估计量相同吗?它们的方差相等吗? (2)β2和α2的OLS 估计量相同吗?它们的方差相等吗?
(1)X Y 2
1ˆˆββ-=,注意到 n
x n x x x n x Var x n X Var Y x Y x x X X x i
i i i i
i i i i 2
2
2
22
2
212
2
2121)
()ˆ()ˆ(ˆˆ,0,0,σσσα
σβαα=
=
-==-==-=∑∑∑∑∑∑∑==则我们有从而
由上述结果,可以看到,无论是两个截距的估计量还是它们的方差都不相同。

(2)
∑∑∑∑∑∑∑==---==2222
2
2
222
)ˆ()ˆ()())((ˆ,ˆi
i
i
i
i
i
i
i
i
i x
Var Var x
y
x x x Y Y x x x
y x σαβα
β=容易验证,
这表明,两个斜率的估计量和方差都相同。

3.6有人使用1980-1994年度数据,研究汇率和相对价格的关系,得到如下结果:
)
333.1()22.1(:528
.0318.4682.6ˆ2Se R X Y
t t =-=
其中,Y =马克对美元的汇率
X =美、德两国消费者价格指数(CPI )之比,代表两国的相对价格 (1)请解释回归系数的含义; (2)X t 的系数为负值有经济意义吗?
(3)如果我们重新定义X 为德国CPI 与美国CPI 之比,X 的符号会变化吗?为什么?
(1)斜率的值 -4.318表明,在1980-1994期间,相对价格每上升一个单位,(GM/$)汇率下降约4.32个单位。

也就是说,美元贬值。

截距项6.682的含义是,如果相对价格为0,1美元可兑换6.682马克。

当然,这一解释没有经济意义。

(2)斜率系数为负符合经济理论和常识,因为如果美国价格上升快于德国,则美国消费者将倾向于买德国货,这就增大了对马克的需求,导致马克的升值。

(3)在这种情况下,斜率系数被预期为正数,因为,德国CPI 相对于美国CPI 越高,德国相对的通货膨胀就越高,这将导致美元对马克升值。

3.7随机调查200位男性的身高和体重,并用体重对身高进行回归,结果如下:
)
31.0()15.2(:
81
.031.126.76ˆ2Se R Height eight W =+-=
其中Weight 的单位是磅(lb ),Height 的单位是厘米(cm )。

(1)当身高分别为177.67cm 、164.98cm 、187.82cm 时,对应的体重的拟合值为多少?
(2)假设在一年中某人身高增高了3.81cm ,此人体重增加了多少? (1)
78.16982.187*31.126.76ˆ86.13998.164*31.126.76ˆ49.15667.177*31.126.76ˆ=+-==+-==+-=eight W
eight W
eight W
(2)99.481.3*31.1*31.1ˆ==∆=∆height eight W
3.8设有10名工人的数据如下: X 10 7 10 5 8 8 6 7 9 10 Y
11 10 12 6 10 7 9 10 11 10
其中 X=劳动工时, Y=产量
(1)试估计Y=α+βX + u (要求列出计算表格); (2)提供回归结果(按标准格式)并适当说明; (3)检验原假设β=1.0。

(1)
6.910/96===∑n Y Y t 810/80===∑n X X t
75.028/21ˆ2
===∑∑t
t
t x
y x β 6.38*75.06.9*ˆˆ=-=-=X Y βα
估计方程为: t
t X Y 75.06.3ˆ+=
(2)
222ˆˆ(2)()(2)(30.40.75*21)/8 1.83125
t t t t
e n y x y n σβ=-=--=-=∑∑∑
934.2ˆˆ)ˆ(/ˆ2===∑t
x
Se t σ
βββ
β
733.1ˆˆ)ˆ(/ˆ2
2===∑∑t
t
x n X Se t σ
α
αα
α
518.0)4.30*28/21()(222
2
2===∑∑∑t
t
t t y x y x R 回归结果为(括号中数字为t 值):
t
t X Y 75.06.3ˆ+= R 2=0.518 (1.73) (2.93) 说明:
X t 的系数符号为正,符合理论预期,0.75表明劳动工时增加一个单位,产量增加0.75个单位,
拟合情况。

R 2为0.518,作为横截面数据,拟合情况还可以.
系数的显著性。

斜率系数的t 值为2.93,表明该系数显著异于0,即X t 对Y t 有影响.
(3) 原假设 : 0.1:0=βH
备择假设 : 0.1:1≠βH
检验统计量 ˆˆ( 1.0)/()(0.75 1.0)/0.25560.978t Se β
β=-=-=- 查t 表, 0.025(8) 2.306c t t == ,因为│t │= 0.978 < 2.306 ,
故接受原假设:0.1=β。

3.9用12对观测值估计出的消费函数为Y=10.0+0.90X ,且已知2ˆσ
=0.01,X =200,∑X 2=4000,试预测当X 0=250时Y 0的值,并求Y 0的95%置信区间。

对于x 0=250 ,点预测值 0ˆy
=10+0.90*250=235.0
0ˆy
的95%置信区间为:
00.025ˆ(122)*y
t σ±-
2352350.29=±=±
即 234.71 - 235.29。

也就是说,我们有95%的把握预测0y 将位于234.71 至235.29 之间.
3.10设有某变量(Y )和变量(X )1995—1999年的数据如下:
(1) 试用OLS 法估计 Y t = α + βX t + u t (要求列出计算表格);
(2) 22ˆR σ求和;
(3) 试预测X 0=10时Y 0的值,并求Y 0的95%置信区间。

(1)列表计算如下:
35/15===∑n Y Y t 115/55===∑X X t
365
.074/27ˆ2
===∑∑t
t
t x
y x β015.111*365.03*ˆˆ-=-=-=X Y βα
我们有:t
t X Y 365.0015.1ˆ+-= (2)
048.03/)27*365.010()2()ˆ()2222=-=--=-=∑∑∑n y x y n e t
t t t βσ 985.0)10*74/27()(222
2
2===∑∑∑t t
t t y x y x R
(3) 对于0X =10 ,点预测值 0
ˆY =-1.015+0.365*10=2.635 0Y 的95%置信区间为:
∑-++-±2
20025.00)(/11ˆ*)25(ˆx
X X n t Y σ
=770.0635.274/)1110(5/11*048.0*182.3635.22±=-++± 即 1.895 -3.099,也就是说,我们有95%的把握预测0Y 将位于1.865 至3.405 之间.
3.11根据上题的数据及回归结果,现有一对新观测值X 0=20,Y 0=7.62,试问它们是否可能来自产生样本数据的同一总体? 问题可化为“预测误差是否显著地大?”
当X 0 =20时,285.620365.0015.1ˆ0=⨯+-=Y 预测误差 335.1285.662.7ˆ0
00=-=-=Y Y e 原假设0H :0)(0=e E 备择假设1H :0)(0≠e E 检验:
若0H 为真,则
021.4332
.0335
.174
)1120(511048.00335.1)(11ˆ)(2
2
2
000==
-+
+-=
-++-=
∑x X X n e E e t σ
对于5-2=3个自由度,查表得5%显著性水平检验的t 临界值为:
182.3=c t 结论:
由于 4.021 3.182t =>
故拒绝原假设0H ,接受备则假设H 1,即新观测值与样本观测值来自不同的总体。

3.12有人估计消费函数i i i C Y u αβ=++,得到如下结果(括号中数字为t 值):
i C ˆ= 15 + 0.81i Y 2R =0.98 (2.7) (6.5) n=19 (1) 检验原假设:β=0(取显著性水平为5%) (2) 计算参数估计值的标准误差;
(3) 求β的95%置信区间,这个区间包括0吗?
(1)原假设 0:0=βH 备择假设 0:1≠βH
检验统计量 5.6)ˆ()0ˆ
(=-=β
βSe t 查t 表,在5%显著水平下 11.2)1119(025.0=--t ,因为t=6.5>2.11 故拒绝原假设,即0≠β,说明收入对消费有显著的影响。

(2)由回归结果,立即可得:
556.57.215)ˆ(==α
Se 125.05
.681.0)ˆ(==β
Se
(3)β的95%置信区间为:。

括所以在这个区间中不包之间在%的把握说也就是说有即为0,074.1~546.095,074.1~546.0264.081.0125.0*11.281.0)ˆ(ˆ2
βββα
±=±=±Se t
3.13 回归之前先对数据进行处理。

把名义数据转换为实际数据,公式如下: 人均消费C =C/P*100(价格指数)
人均可支配收入Y =[Yr*rpop/100+Yu*(1-rpop/100)]/P*100 农村人均消费Cr =Cr/Pr*100
城镇人均消费Cu =Cu/Pu*100
农村人均纯收入Yr =Yr/Pr*100 城镇人均可支配收入Yu =Yu/Pu*100 处理好的数据如下表所示:
根据表中的数据用软件回归结果如下:

t
C= 90.93 + 0.692t Y R2=0.997
t: (11.45) (74.82) DW=1.15
农村:

t
Cr= 106.41 + 0.60t Yr R2=0.979 t: (8.82) (28.42) DW=0.76
城镇:

t
Cu= 106.41 + 0.71t Yu R2=0.998 t: (13.74) (91.06) DW=2.02
从回归结果来看,三个方程的R 2都很高,说明人均可支配收入较好地解释了人均消费支出。

三个消费模型中,可支配收入对人均消费的影响均是显著的,并且都大于0小于1,符合经济理论。

而斜率系数最大的是城镇的斜率系数,其次是全国平均的斜率,最小的是农村的斜率。

说明城镇居民的边际消费倾向高于农村居民。

第四章 多元线性回归模型
4.1 应采用(1),因为由(2)和(3)的回归结果可知,除X 1外,其余解释变量的系数均不显著。

(检验过程略) 4.2 (1) 斜率系数含义如下:
0.273: 年净收益的土地投入弹性, 即土地投入每上升1%, 资金投入
不变的情况下, 引起年净收益上升0.273%.
0.733: 年净收益的资金投入弹性, 即资金投入每上升1%, 土地投入不变的情况下, 引起年净收益上升0.733%.
拟合情况:
92.01
29)
94.01(*811)1)(1(122
=----=-----=k n R n R ,表明模型拟合程度较高.
(2) 原假设 0:0=αH
备择假设 0:1≠αH
检验统计量 022.2135.0/273.0)ˆ(ˆ===α
αSe t 查表,
447.2)6(025.0=t 因为t=2.022<)6(025.0t ,故接受原假设,即α不显著异于0, 表明土地投入变动对年净收益变动没有显著的影响. 原假设 0:0=βH
备择假设 0:1≠βH
检验统计量 864.5125.0/733.0)
ˆ(ˆ
===ββ
Se t 查表,447.2)6(025.0=t 因为t=5.864>)6(025.0t ,故拒绝原假设,即β显著异于0,表明资金投入变动对年净收益变动有显著的影响. (3) 原假设 0:0==βαH
备择假设 1H : 原假设不成立 检验统计量
47)
129/()94.01(2
/94.0)1/()1(/22=---=---=k n R k R F
查表,在5%显著水平下14.5)6,2(=F 因为F=47>5.14,故拒绝原假设。

结论,:土地投入和资金投入变动作为一个整体对年净收益变动有影响.
4.3 检验两个时期是否有显著结构变化,可分别检验方程中D 和D •X 的系数是否显著异于0.
(1) 原假设 0:20=βH 备择假设 0:21≠βH 检验统计量
155.34704.0/4839.1)ˆ(ˆ2
2
===ββSe t 查表145.2)418(025.0=-t 因为t=3.155>)14(025.0t , 故拒绝原假设, 即2β显著异于0。

(2) 原假设 0:40=βH 备择假设 0:41≠βH
检验统计量
115.30332.0/1034.0)
ˆ(ˆ44-=-==ββSe t 查表145.2)418(025.0=-t 因为|t|=3.155>)14(025.0t , 故拒绝原假设, 即4β显著异于0。

结论:两个时期有显著的结构性变化。

4.4 (1),模型可线性化。

参数线性,变量非线性
则模型转换为设,1
,1221x
z x z ==
u z z y +++=22110βββ (2)变量、参数皆非线性,无法将模型转化为线性模型。

(3)变量、参数皆非线性,但可转化为线性模型。

取倒数得:)
(1011u x e y
++-+=ββ
把1移到左边,取对数为:u x y y ++=-101ln
ββ,令则有,1ln y
y z -= u x z ++=10ββ
4.5 (1)截距项为-58.9,在此没有什么意义。

X 1的系数表明在其它条件不变时,个人年消费量增加1百万美元,某国对进口的需求平均增加20万美元。

X 2的系数表明在其它条件不变时,进口商品与国内商品的比价增加1单位,某国对进口的需求平均减少10万美元。

(2)Y 的总变差中被回归方程解释的部分为96%,未被回归方程解释的部分为4%。

(3)检验全部斜率系数均为0的原假设。

)
1/(/)1/()1(/2
2--=---=k n RSS k
ESS k n R k R F =19216/04.02/96.0= 由于F =192 > F 0.05(2,16)=3.63,故拒绝原假设,回归方程很好地解释了应变量Y 。

(4) A. 原假设H 0:β1= 0 备择假设H 1:β1 ≠0
11ˆ0.2
21.74ˆ0.0092()
t S ββ=== > t 0.025(16)=2.12,
故拒绝原假设,β1显著异于零,说明个人消费支出(X 1)对进口需求有解释作用,这个变量应该留在模型中。

B. 原假设H 0:β2=0
备择假设H 1:β2 ≠0
2
2
ˆ0.1 1.19ˆ0.084()t S ββ-=
==<t 0.025(16)=2.12, 不能拒绝原假设,接受β2=0,说明进口商品与国内商品的比价(X 2)对进口需求地解释作用不强,这个变量是否应该留在模型中,需进一步研究。

4.6(1)弹性为-1.34,它统计上异于0,因为在弹性系数真值为0的原假设下的t 值为:
469.432
.034
.1-=-=
t 得到这样一个t 值的概率(P 值)极低。

可是,该弹性系数不显著异于-1,因为在弹性真值为-1的原假设下,t 值为:
06.132
.0)
1(34.1-=---=
t
这个t 值在统计上是不显著的。

(2)收入弹性虽然为正,但并非统计上异于0,因为t 值小于1(85.020.017.0==t )。

(3)由1
1)1(122-----=k n n R R ,可推出 2211(1)1n k R R n --=---
本题中,2
R =0.27,n =46,k =2,代入上式,得2
R =0.3026。

4.7 (1)薪金和每个解释变量之间应是正相关的,因而各解释变量系数都应为正,估计结果确实如此。

系数0.280的含义是,其它变量不变的情况下,CEO 薪金关于销售额的弹性为0.28;
系数0.0174的含义是,其它变量不变的情况下,如果股本收益率上升一个百分点(注意,不是1%),CEO 薪金的上升约为1.07%;
与此类似,其它变量不变的情况下,公司股票收益上升一个单位,CEO 薪金上升0.024%。

(2)用回归结果中的各系数估计值分别除以相应的标准误差,得到4个系数的t 值分别为:13.5、8、4.25和0.44。

用经验法则容易看出,前三个系数是统计上高度显著的,而最后一个是不显著的。

(3)R 2=0.283,拟合不理想,即便是横截面数据,也不理想。

4.8 (1)2.4%。

(2)因为D t 和(D t ⋅t )的系数都是高度显著的,因而两时期人口的水平和增长率都不相同。

1972-1977年间增长率为1.5%,1978-1992年间增长率为2.6%(=1.5%+1.1%)。

4.9 原假设H 0: β1 =β2,β3 =1.0
备择假设H 1: H 0不成立 若H 0成立,则正确的模型是: u X X X ββY ++++=32110)(
据此进行有约束回归,得到残差平方和R S 。

若H 1为真,则正确的模型是原模型:
u X βX βX ββY
++++=3322110
据此进行无约束回归(全回归),得到残差平方和S 。

检验统计量是: ()
)
1(---=
K n S g
S S F R ~F(g,n-K-1)
用自由度(2,n-3-1)查F 分布表,5%显著性水平下,得到F C , 如果F< F C , 则接受原假设H 0,即β1 =β2,β3 =0; 如果F> F C , 则拒绝原假设H 0,接受备择假设H 1。

4.10 (1)2个,111200D D ⎧⎧==⎨⎨
⎩⎩大型企业中型企业
其他
其他
(2)4个,
111112340000D D D D ⎧⎧⎧⎧====⎨⎨⎨⎨
⎩⎩⎩⎩小学初中大学
高中其他其他其他其他
4.11
0123(),019791,
1979
t t t t y D x D x u D t D t ββββ=+++⋅+=≤=>其中
4.12 对数据处理如下:
lngdp =ln (gdp/p ) lnk=ln (k/p ) lnL=ln (L/P ) 对模型两边取对数,则有 lnY =lnA +αlnK +βlnL +lnv 用处理后的数据回归,结果如下:
l k dp g
ln 18.0ln 96.026.0ˆln ++-= 97.02=R t :(-0.95) (16.46) (3.13)
由修正决定系数可知,方程的拟合程度很高;资本和劳动力的斜率系数均显著(t c =2.048), 资本投入增加1%,gdp 增加0.96%,劳动投入增加1%,gdp 增加0.18%,产出的资本弹性是产出的劳动弹性的5.33倍。

第五章 模型的建立与估计中的问题及对策
5.1 (1)对 (2)对 (3)错
即使解释变量两两之间的相关系数都低,也不能排除存在多重共线性的可能性。

(4)对 (5)错
在扰动项自相关的情况下OLS 估计量仍为无偏估计量,但不再具有最小方差的性质,即不是BLUE 。

(6)对 (7)错
模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。

(8)错。

在多重共线性的情况下,尽管全部“斜率”系数各自经t 检验都不显著, R 2
值仍可能高。

(9)错。

存在异方差的情况下,OLS 法通常会高估系数估计量的标准误差,但不总是。

(10)错。

异方差性是关于扰动项的方差,而不是关于解释变量的方差。

5.2 对模型两边取对数,有
lnY
t =lnY
+t*ln(1+r)+lnu
t
,
令LY=lnY
t ,a=lnY
,b=ln(1+r),v=lnu
t
,模型线性化为:
LY=a+bt+v
估计出b之后,就可以求出样本期内的年均增长率r了。

5.3(1)DW=0.81,查表(n=21,k=3,α=5%)得d
L
=1.026。

DW=0.81<1.026
结论:存在正自相关。

(2)DW=2.25,则DW´=4 – 2.25 = 1.75
查表(n=15, k=2, α=5%)得d
u
=1.543。

1.543<DW´= 1.75 <2
结论:无自相关。

(3)DW= 1.56,查表(n=30, k=5, α=5%)得d
L =1.071, d
u
=1.833。

1.071<DW= 1.56 <1.833
结论:无法判断是否存在自相关。

5.4
(1)横截面数据.
(2)不能采用OLS法进行估计,由于各个县经济实力差距大,可能存在异方差
性。

(3)GLS法或WLS法。

5.5
(1)可能存在多重共线性。

因为①X
3
的系数符号不符合实际.②R2很高,但解释
变量的t值低:t
2=0.9415/0.8229=1.144, t
3
=0.0424/0.0807=0.525.
解决方法:可考虑增加观测值或去掉解释变量X
3
.
(2)DW=0.8252, 查表(n=16,k=1,α=5%)得d
L
=1.106.
DW=0.8252< d
L
=1.106
结论:存在自相关.
单纯消除自相关,可考虑用科克伦-奥克特法或希尔德雷斯-卢法;进一步研究,由于此模型拟合度不高,结合实际,模型自相关有可能由模型误设定引起,
即可能漏掉了相关的解释变量,可增加相关解释变量来消除自相关。

5.6 存在完全多重共线性问题。

因为年龄、学龄与工龄之间大致存在如下的关系:A i =7+S i +E i
解决办法:从模型中去掉解释变量A ,就消除了完全多重共线性问题。

5.7 (1)若采用普通最小二乘法估计销售量对广告宣传费用的回归方程,则系数的估计量是无偏的,但不再是有效的,也不是一致的。

(2)应用GLS 法。

设原模型为
i i i u x y ++=10ββ (1)
由于已知该行业中有一半的公司比另一半公司大,且已假定大公司的误差项
方差是小公司误差项方差的两倍,则有2
22i i λσσ=,其中⎩⎨⎧===小公司大公司i i i ,1,22λ。


模型可变换为
i
i i i i i
i
u
x y λλβλβλ++=
10 (2) 此模型的扰动项已满足同方差性的条件,因而可以应用OLS 法进行估计。

(3)可以。

对变换后的模型(2)用戈德弗尔德-匡特检验法进行异方差性检验。

如果模型没有异方差性,则表明对原扰动项的方差的假定是正确的;如果模型还有异方差性,则表明对原扰动项的方差的假定是错误的,应重新设定。

5.8(1)不能。

因为第3个解释变量(1--t t M M )是t M 和1-t M 的线性组合,存在完全多重共线性问题。

(2)重新设定模型为
t
t t t
t t t u M M u M M GNP +++=+-+++=--1210132310)()(ααββββββ
我们可以估计出210ααβ和、,但无法估计出321βββ和、。

(3)所有参数都可以估计,因为不再存在完全共线性。

(4)同(3)。

5.9(1)R 2很高,logK 的符号不对,其 t 值也偏低,这意味着可能存在多重共线性。

(2)logK 系数的预期符号为正,因为资本应该对产出有正向影响。

但这里估计出的符号为负,是多重共线性所致。

(3)时间趋势变量常常被用于代表技术进步。

(1)式中,0.047的含义是,在样本期内,平均而言,实际产出的年增长率大约为4.7%。

(4)此方程隐含着规模收益不变的约束,即α+β=1,这样变换模型,旨在减缓多重共线性问题。

(5)资本-劳动比率的系数统计上不显著,看起来多重共线性问题仍没有得到解决。

(6)两式中R 2是不可比的,因为两式中因变量不同。

5.10(1)所作的假定是:扰动项的方差与GNP 的平方成正比。

模型的估计者应该是对数据进行研究后观察到这种关系的,也可能用格里瑟法对异方差性形式进行了实验。

(2)结果基本相同。

第二个模型三个参数中的两个的标准误差比第一个模型低,可以认为是改善了第一个模型存在的异方差性问题。

5.11 我们有
25
140
1ˆ25
55
1ˆ33231121=
--==
--=k n RSS k n RSS σ
σ
原假设H 0:2
32
1σσ= 备则假设H 1:2
32
1σσ≠ 检验统计量为:
5454.2255525140ˆˆ2123===σ
σF
用自由度(25,25)查F 表,5%显著性水平下,临界值为:Fc =1.97。

因为F =2.5454>Fc =1.97,故拒绝原假设原假设H 0:2
32
1σσ=。

结论:存在异方差性。

5.12 将模型变换为:
)2()()1(221112102211t
t t t t t t X X X Y Y Y ερρβρρβρρ+--+--=------
若1ρ、2ρ为已知,则可直接估计(2)式。

一般情况下,1ρ、2ρ为未知,因此需要先估计它们。

首先用OLS 法估计原模型(1)式,得到残差e t ,然后估计:
t t t t e e e υρρ++=--2211
其中t υ为误差项。

用得到的1ρ和2ρ的估计值1ˆρ
和2ˆρ生成 2211ˆˆ--*
--=t t t t Y Y Y Y ρρ
2211ˆˆ--*
--=t t t t X X X X ρρ
令)1(210ρρβα--=,用OLS 法估计
t t t X Y εβα++=*
*1
即可得到αˆ和1ˆβ,从而得到原模型(1)的系数估计值0ˆβ和1
ˆβ。

5.13 (1)全国居民人均消费支出方程:

t C = 90.93 + 0.692t Y R 2=0.997
t : (11.45) (74.82) DW=1.15 DW=1.15,查表(n=19,k=1,α=5%)得d L =1.18。

DW=1.15<1.18
结论:存在正自相关。

可对原模型进行如下变换:
C t -ρC t-1 = α(1-ρ)+β(Y t -ρY t-1)+(u t -ρu t -1)
由ˆˆ1/20.425DW ρ
ρ≈-有= 令:C 't = C t –0.425C t-1 , Y 't = Y t -0.425Y t-1 ,α’=0.575α 然后估计 C 't =α'+βY 't + εt ,结果如下:

't C = 55.57 + 0.688'
t Y R 2=0.994 t :(11.45) (74.82) DW=1.97 DW=1.97,查表(n=19,k=1,α=5%)得d u =1.401。

DW=1.97>1.18,故模型已不存在自相关。

(2)农村居民人均消费支出模型:
农村:∧
t Cr = 106.41 + 0.60t Yr R 2=0.979
t : (8.82) (28.42) DW=0.76
DW=0.76,查表(n=19,k=1,α=5%)得d L =1.18。

DW=0.76<1.18,故存在自相关。

解决方法与(1)同,略。

(3)城镇:
t Cu = 106.41 + 0.71t Yu R 2=0.998
t : (13.74) (91.06) DW=2.02
DW=2.02,非常接近2,无自相关。

5.14 (1)用表中的数据回归,得到如下结果:
Y
ˆ =54.19 + 0.061X1 + 1.98*X2 + 0.03X3 - 0.06X4 R 2=0.91 t: (1.41) (1.58) (3.81) (1.14) (-1.78) 根据t c (α=0.05,n-k-1=26)=2.056,只有X2的系数显著。

(2)理论上看,有效灌溉面积、农作物总播种面积是农业总产值的重要正向影响因素。

在一定范围内,随着有效灌溉面积、播种面积的增加,农业总产值会相应增加。

受灾面积与农业总产值呈反向关系,也应有一定的影响。

而从模型看,这些因素都没显著影响。

这是为什么呢?
这是因为变量有效灌溉面积、施肥量与播种面积间有较强的相关性,所以方程存在多重共线性。

现在我们看看各解释变量间的相关性,相关系数矩阵如下:
X1 X2 X3 X4
X1 X2 X3 X4
表中r 12=0.896,r 13=0.895,说明施肥量与有效灌溉面积和播种面积间高度相关。

我们可以通过对变量X2的变换来消除多重共线性。

令X22=X2/X3(公斤/亩),这样就大大降低了施肥量与面积之间的相关性,用变量X22代替X2,对模型重新回归,结果如下:
Y
ˆ =-233.62 + 0.088X1 + 13.66*X2 + 0.096X3 - 0.099X4 R 2=0.91 t: (-3.10) (2.48) (3.91) (4.77) (-3.19)
1 0.896 0.880 0.715 0.896 1 0.895 0.685 0.880 0.895 1 0.883 0.715
0.685
0.883
1
从回归结果的t值可以看出,现在各个变量都已通过显著性检验,说明多重共线性问题基本得到解决。

相关文档
最新文档