《计量经济学(第二版)》习题解答(第1-3章)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《计量经济学(第二版)》习题解答
第一章
1.1 计量经济学的研究任务是什么?计量经济模型研究的经济关系有哪两个基本特征? 答:(1)利用计量经济模型定量分析经济变量之间的随机因果关系。
(2)随机关系、因果关系。
1.2 试述计量经济学与经济学和统计学的关系。
答:(1)计量经济学与经济学:经济学为计量经济研究提供理论依据,计量经济学是对经济理论的具体应用,同时可以实证和发展经济理论。
(2)统计数据是建立和评价计量经济模型的事实依据,计量经济研究是对统计数据资源的深层开发和利用。
1.3 试分别举出三个时间序列数据和横截面数据。
1.4 试解释单方程模型和联立方程模型的概念,并举例说明两者之间的联系与区别。
1.5 试结合一个具体经济问题说明计量经济研究的步骤。
1.6 计量经济模型主要有哪些用途?试举例说明。
1.7 下列设定的计量经济模型是否合理,为什么?
(1)ε++
=∑=3
1
i i
i
GDP b a GDP
ε++=3bGDP a GDP
其中,GDP i (i =1,2,3)是第i 产业的国内生产总值。
答:第1个方程是一个统计定义方程,不是随机方程;第2个方程是一个相关关系,而不是因果关系,因为不能用分量来解释总量的变化。
(2)ε++=21bS a S
其中,S 1、S 2分别为农村居民和城镇居民年末储蓄存款余额。
答:是一个相关关系,而不是因果关系。
(3)ε+++=t t t L b I b a Y 21
其中,Y 、I 、L 分别是建筑业产值、建筑业固定资产投资和职工人数。
答:解释变量I 不合理,根据生产函数要求,资本变量应该是总资本,而固定资产投资只能反映当年的新增资本。
(4)ε++=t t bP a Y
其中,Y 、P 分别是居民耐用消费品支出和耐用消费品物价指数。
答:模型设定中缺失了对居民耐用消费品支出有重要影响的其他解释变量。
按照所设定的模型,实际上假定这些其他变量的影响是一个常量,居民耐用消费品支出主要取决于耐用消费品价格的变化;所以,模型的经济意义不合理,估计参数时可能会夸大价格因素的影响。
(5)财政收入=ƒ(财政支出)+ε
答:模型的经济意义不合理,应该是收入决定支出,而不是支出决定收入。
(6)煤炭产量=ƒ(L ,K ,X 1,X 2)+ε
其中,L 、K 分别是煤炭工业职工人数和固定资产原值,X 1,X 2分别是发电量和钢铁产量。
答:模型经济意义的“导向”不明确,L 、K 是生产函数的投入要素,X 1,X 2是需求函数的影响因素。
设定单方程模型时通常取一个导向:供给导向或需求导向,即将模型取成生产函数或需求函数。
1.8 指出下列模型中的错误,并说明理由。
(1)t
t Y C 2.1180ˆ+= 其中,C 、Y 分别是城镇居民消费支出和可支配收入。
答:b 的估计值>1,经济意义不合理,因为边际消费倾向不可能大于1。
(2)t
t t L K Y ln 28.0ln 62.115.1ˆln -+= 其中,Y 、K 、L 分别是工业总产值、工业生产资金和职工人数。
答:ln L 系数估计值的符号经济意义不合理,因为产值不可能与劳动投入负相关。
第二章
2.1 回答下列问题:
(1) 古典回归模型有哪些基本假定?违背基本假定的模型是否就不可以估计? 答:6个基本假定(P21),假定违反时仍然可以用OLS 进行估计。
(2) 总体方差与参数估计误差的区别与联系;
答:区别:总体方差描述的是模型中随机误差项(或被解释变量)关于均值的离散程度,而参数估计误差描述的是参数估计量关于参数真值的离散程度。
联系:根据参数估计误差的计算公式(以一
元回归为例)xx S b
S /ˆ)ˆ(2σ
=可知,两者正相关,即总体方差越小,参数估计误差越小。
(3) 随机误差项εi 与残差项e i 的区别与联系;
答:区别:随机误差项描述的是y 关于总体回归方程的误差,而残差项度量的是y 关于样本回归方程的误差。
联系:由于两者都是反映模型之外其他因素的综合影响,所以,可以将 e i 视为εi
的近
似估计。
(4) 根据最小二乘原理,所估计的模型已经使得拟合误差达到最小,为什么还要讨论模型的拟合优度问题?
答:根据最小二乘原理,只能保证模型的绝对拟合误差达到最小,而拟合优度可以度量模型的相对拟合误差大小,即模型对数据(客观事实)的近似程度。
(5) R 2检验与F 检验的区别与联系;
答:区别:R 2检验是关于模型对样本拟合优度的检验,F 检验是关于模型对总体显著性的检验。
联系:F 检验是关于R 2的显著性检验。
(6) 高斯—马尔可夫定理的条件与结论;
答:条件:古典假定成立;结论:OLS 估计是最佳线性无偏估计。
(7) 为什么要进行解释变量的显著性检验?
答:①利用显著性检验可以保证模型中的解释变量都是对Y 有重要影响的变量;②设定模型时是根据经济理论和先验知识确定解释变量,但这些变量在现实问题中不一定都有重要影响,需要用客观事实(统计数据)进行检验。
(8) 回归分析与相关分析的区别与联系;
答:区别:回归分析研究因果关系,为单向关系;而相关分析研究相关关系,为双向关系。
联系:当两个变量高度相关时,其线性关系也显著(更多的比较可以参见《统计学》教材)。
2.2 对于古典线性回归模型,证明:
(1)i i bx a y E +=)( (2)2
)(σ=i y D (3))(0),(j i y y Cov j i ≠=
证:
(1)i i i i i i bx a E bx a E bx a E y E +=++=++=)()()()(εε
(2)2)()(()(σεε==++=i i i i D bx a D y D (因为根据古典假定,i bx a +为常量)
(3)0
),()]()][([()]())][(()[()
,(),(==--=++-++++-++=++++=j i j j i i j j j j i i i i j j i i j i Cov E E E bx a E bx a bx a E bx a E bx a bx a Cov y y Cov εεεεεεεεεεεε
2.3 对于多元线性回归模型,证明:
(1)
∑=0i
e
(2)0)ˆ......ˆˆ(ˆ11=+++=∑∑i
ki k i
i i e x b x b a e y
证:根据教材P36多元线性回归模型正规方程组的推导过程,有:
0)ˆ()ˆ...ˆˆˆ(22110=∑=-∑=-----∑i i i
ki k i i i e y y x b x b x b b y k j e x x y y x x b x b x b b y i ji ji i i
ji ki k i i i ,...,2,10)ˆ()ˆ...ˆˆˆ(22110==∑=-∑=-----∑
0ˆ...ˆˆ)ˆ......ˆˆ(ˆ110110=∑++∑+∑=+++=∴∑∑i
ki k i i i i ki k i i i e x b e x b e b e x b x b b e y 2.4 下列模型的表述形式哪些是正确的?哪些是错误的?为什么?
(1)i i bx a y +=
(2)i i i bx a y ε++=
(3)i i x b a y ˆˆ+=
(4)i i x b a y ˆˆˆ+= (5)i i i x b a y ε++=ˆˆˆ (6)i i i x b a y ε++=ˆˆ (7)i i i e x b a y ++=ˆˆ
(8)i
i i e x b a y ++=ˆˆˆ 答:(1)、(3)、(5)、(6)、(8)错误,其余正确。
2.5 证明:2
2
)(yx r R =;其中,R 2是一元线性回归模型的判定系数,r yx 是y 与x 的相关系数。
证:xx
xy S S b x b y a
/ˆˆˆ=-=
; )(ˆˆ)ˆ(ˆˆˆx x b y x b x b y x b a y i
i i i -+=+-=+=∴ xx xy xx xx xy i i i S S S S S x x b x x b y y /)/()(ˆ)](ˆ[)ˆ(222222==-∑=-∑=-∑ 22
22
22
2/)()ˆ(yx
yy xx xy yy
xx xy
yy xx xy
i i r S S S S S S S S S y y y y
R =⎪⎪⎭
⎫
⎝⎛==
=-∑-∑=
∴
2.6 如何解释“可以按一定的置信度保证, OLS 估计量b
ˆ与回归系数b 之间的绝对误差不会大于)ˆ(2/b
S t α”这一结论。
答:αααα-=<-=<-=<1)]ˆ(|ˆ[|))ˆ(ˆ()|(|2
/2/2/b S t b b P t b
S b b P t t P
即能以α-1的概率保证:b ˆ与b 之间的绝对误差不会大于)ˆ(2
/b S t α。
2.7 试根据置信区间的概念解释t 检验的概率含义。
即证明,对于显著水平α,当2/||αt t i >时,b i 的100(1-α)%置信区间不包含0。
答:因为b i 的100(1-α)%置信区间为:))ˆ(ˆ,)ˆ(ˆ(2/2/i
i i
i b S t b b S t b αα+-; 所以,当2/||αt t i >时,有:
)ˆ(|ˆ|)ˆ(|ˆ|||2/2/i
i i
i i b S t b t b S b t αα>⇒>= 得: )ˆ(ˆ2/i i b S t b α> 或 )ˆ(ˆ2/i
i b S t b α-< 即: 置信区间下限0)ˆ(ˆ2/>-i i b S t b α, 或置信区间上限 0)ˆ(ˆ2/<+i
i b S t b α 所以,b i 的100(1-α)%置信区间中间不包含0,即b i 显著地不等于0。
2.8 计算例5中b 1、b 2的95%置信区间,
(1)解释计算结果的经济含义;
(2)置信区间是否包含0?解释其概率含义。
解:例5中已经计算得到,2085.1ˆ1=b ,8345.0ˆ1=b ,2730.0)ˆ(1
=b S ,0574.0)ˆ(2=b S , 取α=0.05时,145.2)14()1217(025.0025.0==--t t ;所以,b 1、b 2的95%置信区间为:
b 1:)7941.1,6229.0(2730.0145.22085.1)ˆ(ˆ1025.01=⨯±=±b S t b b 2:)9576.0,7114.0(0574.0145.28345.0)ˆ(ˆ2
025.02=⨯±=±b S t b
(1)b 1、b 2分别表示职工人数和资金的边际产出,估计结果表明,劳动的边际产出在0.6629和1.7941之间,即职工人数每增加1万人,可以95%的概率保证,工业总产值至少增加0.6629亿元,最多增加1.7941亿元。
同理,资金每增加1亿元,可以95%的概率保证,工业总产值至少增加0.7114亿元,最多增加0.9576亿元。
(2) b 1、b 2的置信区间都不包含0,其概率含义为:b 1、b 2都显著地不等于0,该推断的置信概率为95%。
2.9 调整的判定系数适用于检验什么问题?在什么情况下与判定系数的检验效果相同?
答:当两个模型各自所包含的解释变量个数不同时,适用于采用调整的判定系数来比较两个模型的拟合优度。
如果两个模型所包含的解释变量个数相同,则与判定系数的检验效果相同。
2.10 设某家电商品的需求函数为:
Y
ˆln =120+0.5ln X ―0.2ln P 其中,Y 为需求量,X 为消费者收入,P 为该商品价格。
(1)试解释lnX 和lnP 系数的经济含义; (2)若价格上涨10%,将导致需求如何变化?
(3)在价格上涨10%的情况下,收入增加多少才能保持原有的需求水平?
答:(1)由于模型是双对数模型,所以解释变量的系数为弹性;各自的经济含义是:在价格不变的情况下,消费者收入增加1%,将会使该家电需求增加0.5%;在现有的收入水平下,该商品价格上涨1%,将会使该家电需求减少0.2%。
(2)价格上涨10%,将导致需求减少:(10%*0.2%)/ 1%=2% (3)为了使需求不减少2%,需要增加收入:(2%*1%)/ 0.5%=4%
2.11 设某商品需求函数的估计结果为:
Y
ˆ=26.25+180.52X―2.58P
(10.31) (0.50) (17.51) (―5.16)
R 2=0.99
98.02 R
F =560
(1)解释回归系数的经济含义; (2)解释模型中各个统计量的含义。
答:(1)由于模型是线性模型,所以解释变量的系数度量了边际需求;在现有价格水平下,收入增加1个单位将会使需求增加180.52个单位;在收入水平不变的情况下,价格上涨1个单位将会使需求减少2.58个单位。
(2)各个统计量的含义如下:
)ˆ(i
b S :b 1、b 2的系数估计误差分别是10.31和0.50; t i :b 1、b 2的t 统计量值分别是17.51和-5.16;根据t 检验的近似检验方法得知,X 、P 对Y 都有显著影响;
R 2:判定系数=0.99、调整的判定系数=0.98都接近于1,表明模型对样本数据有很高的拟合优度,所估计的模型对需求变化的解释程度达到99%。
F :F 统计量值=560,表明模型对总体也是高度显著的。
2.12
建立某企业生产函数时共估计了以下三个模型,试从中选择一个最佳模型,并说明理由(已
知t 0.025=2.12)。
模型1:Y
ˆ=2545-0.3667L +1.2069K
R 2=0.9945
t =(-2.77) (5.88)
模型2:Y
ˆln =16.99+1.0876lnL +1.4471lnK R 2=0.9856
t = (0.68) (2.24)
模型3:Y
ˆln =5.2952+0.00062L +0.00036K
R 2=0.9902
t = (3.26) (2.87)
答:模型1的R 2值最高,但是变量L 的系数为负,经济意义不合理;模型2的R 2值低于模型3,并
且lnL的系数不显著(t=0.68<2.12),而模型3中所有系数符号的经济意义合理,且均显著,R2值达到0.9902;所以,模型3是最佳模型。
2.13我国1978—1997年财政收入Y和国民生产总值(GNP)X的统计资料如表1所示(单位:亿元)。
(1)建立财政收入的一元线性回归模型,并解释斜率系数的经济含义;
(2)若1998年国民生产总值为78017.8亿元,求1998年财政收入的预测值。
表1
解:在EViews3.1软件中键入LS Y C X,得到以下估计结果:
将1998年X的值代入模型,得到Y的预测值为:8661.5亿元。
2.14表2列出了我国1988—1998年城镇居民人均全年耐用消费品支出、人均全年可支配收入和耐用消费品价格指数(1987年=100)的统计资料。
试利用表中数据,
(1)建立城镇居民耐用消费品支出Y关于可支配收入X1和耐用消费品价格指数X2的回归模型;
(2)对所建立的模型进行统计检验,并根据检验结果重新估计模型;
(3)将被解释变量改设成Y/X2,重新估计二元回归模型;试分析检验统计量的变化情况,并说明其原因;对城镇居民耐用消费品需求函数的模型形式还可以做哪些调整?
解:(1)在EViews3.1软件中键入LS Y C X1 X2,得到以下估计结果:
(2)估计的模型中,参数符号的经济意义合理;R2=0.9479接近于1,表明模型对样本数据有很高的拟合优度;F统计量的伴随概率p=0.0000,说明模型对总体是显著的。
T检验中,t1、t2的伴随概率分别是p=0.00和0.38,说明X1对Y有显著影响,而X2的影响不显著。
剔除X2后,得到以下估计结果:
(3)将被解释变量改设成Y/X2,重新估计二元回归模型,得:
从消费支出中扣除价格因素影响、改成实际支出后,X2的影响变为显著变量(只要取显著水平大于0.0525)。
如果将收入也改成实际收入X1/X2,重新估计模型:
此时,价格X2不显著;由于支出、收入中都排除了价格因素的影响,所以可以从模型中剔除价格因素X2,得到最终模型为:
2.15表3是某类商品销售量Y与该商品价格X1和售后服务费用X2的历史统计资料。
(1)建立Y关于X1和X2的回归模型;
(2)对所建立的模型进行统计检验;
(3)解释模型估计结果的经济含义。
表3
解:(1)分别键入SCAT X1 Y 和 SCAT X2 Y 绘制相关图:
Y 与X1、X2近似为线性关系,所以建立二元线性回归模型:
(2)估计的模型中,R 2=0.9311接近于1,表明模型对样本数据的拟合优度很高;F 统计量的伴随概率p =0.0000,说明模型对总体是显著的。
T 检验中,t 1、t 2的伴随概率分别是p =0.00和0.0049,说明X1和X2对Y 均有显著影响。
(3)模型中参数的估计结果表明,如果该商品每件价格增加1元,将会使得产品销售量下降1.175万件;如果售后服务费增加1万元,将会使得产品销售量上升13.0603万件。
2.16 某市1980—1996年国内生产总值Y (当年价格)、生产资金K 和从业人数L 的统计资料如表4所示。
(1)分别利用线性化方法和迭代法估计C-D 生产函数:
εβαe K L r A Y t )1(0+=
(2)估计线性化后的CES 生产函数,并推算出各个参数的估计值:
20)])[ln(1(21ln )1(ln )1ln(ln ln L
K
K L r t A Y δρλδδλλδ--
-++++=
其中,各个参数的含义为:
A0——基期技术水平;r ——技术进步率
δ——分布系数,反映了劳动要素的密集程度,0<δ<1;
λ——规模效益参数;ρ——替代参数
表4
解:(1)
利用线性化方法估计C-D生产函数:
键入:LS LOG(Y) C T LOG(L) LOG(K),得到估计结果:
剔除不显著的变量T,估计结果为:
利用迭代法估计C-D 生产函数:
(由于时间变量影响不显著,所以,只建立二元模型) ①在工作文件窗口双击C 序列,输入参数初始值:1、1、1;
②在方程窗口中点击Estimate 按钮,在方程描述框中输入待估计的方程:
Y=C(1)*L^C(2)*K^C(3)
③ 点击options 选项,将迭代估计的控制条件改成:迭代次数1000,精度0.00001,得到以下估计结果(EViews7):
(2)将模型设定成:
ε+++++=2
4321)][ln(
ln ln ln L
K b K b L b t b a Y 其中:)1(2
1
)1()1ln(ln 43210δρλδδλλδ--
=-==+==b b b r b A a 键入: LS LOG(Y) C T LOG(L) LOG(K) (LOG(K/L))^2,得到估计结果:
由于T 变量不显著,剔除后重新估计模型得:
根据估计结果可以推算出原模型中各个参数的估计值:
2640
.0164894.1475565.0)059546.0(2ˆˆˆ2ˆ221235.2164894.1056341.1ˆˆˆ475565.0164894
.1056341.1056341
.1ˆ104337.1ˆ3
43
2
3224850097.8ˆ0
=⨯-⨯-=-==+=+==+=+=
⨯===--b b b b b b b e e A a δρλ
δ
注:
本题(1)中,如果将参数初始值全部设置为1,迭代估计的控制条件改成:迭代次数1000,精
度0.00001,则得到以下估计结果(EViews3.1):
题(2)中ρ的估计值<1,经济意义不合理。
第三章
3.1 什么是异方差性?异方差性对模型的OLS 估计有何影响?
答:≠=2)(i i D σε常数,主要影响:OLS 估计非有效估计,难以估算系数的估计误差,t 检验可靠性降低。
3.2 检验异方差性的G-Q 检验和White 检验的原理是否相同?试述White 检验、Park 检验和Gleiser 检验的异同之处。
答:(1)G-Q 检验和White 检验的原理不同,前者通过比较分段回归残差的差异性推断异方差性,后者通过建立辅助回归模型判断异方差性。
(2)White 检验、Park 检验和Gleiser 检验:相同点:都是利用辅助回归模型、通过检验残差的波动与解释变量是否相关来判断异方差性;不同点:所建立的辅助回归模型不同。
White 检验: i i i i v x x e +++=22102ααα 二次函数 Park 检验: i i i v x e +=βα2
指数函数 Gleiser 检验:i h i i v x e ++=10||αα
6个可线性化函数
3.3 利用WLS 估计消除异方差性的不利影响时,为什么需要构造多个权数变量进行调试? 答:根据WLS 估计的要求,权数变量应该取成2
/1)(/1i i i D w σε==;但是随机误差项的方差是未知的,只能用多种函数形式进行推测,所以需要构造多个权数变量对模型的异方差性进行检验和调整。
3.4 自相关性有哪几种类型?自相关性对模型的OLS 估计有何影响?模型存在自相关性时,为什么容易将不重要的解释变量误认为有显著影响的变量?
答:(1)根据现实中自相关性的常见形式,习惯上将模型的自相关性分成一阶自回归和高阶自回归两种类型,但实际上前者是后者的特例,只是为了便于表述和检验才如此区分。
(2)主要影响:OLS 估计非有效估计,一般会低估系数的估计误差,t 检验容易将不重要的变量误认为显著变量。
(3)当
模型存在自相关性时,根据)ˆ(b S 原有的计算公式一般会过低估计系数的误差,而)ˆ(/ˆb S b t =, )ˆ(b
S 的估计偏低将会导致t 统计量的偏高,这样很有可能使得真实的2/||αt t <变成2/||αt t >,即错误的拒绝了b =0的原假设;所以,容易将不重要的解释变量误认为有显著影响的变量。
3.5 如何用DW 统计量检验自相关性?DW 检验有哪些局限性?
答:由于)ˆ1(2ρ
-≈DW ,所以可以根据DW 的值是(显著的)接近于0或者4、或者接近于2来判断是否存在自相关性。
局限性:只能检验是否存在一阶自相关性,检验过程存在无法判断的“盲区”,不适用于自回归模型。
3.6 利用广义差分法消除自相关性的不利影响时,为什么采用了迭代估计?
答:对变量进行广义差分变换时,需要事先知道随机误差项各期的相关系数,而这些值是未知的,只能用迭代估计的方法进行近似估计。
3.7 异方差性和自相关性都是关于随机误差项的性质,但是,
(1)为什么通过对被解释变量Y 取值情况的分析,可以大致判断模型是否存在异方差性或自相关性?
(2)为什么是通过残差分析来检验模型的异方差性和自相关性? 答:(1)因为),(),(,
)()(j i j i i i y y COV COV y D D ==εεε,随机误差项与Y 的方差、协方差相
同,所以可以通过分析Y 的取值特征判断异方差性或自相关性。
(2)误差项和残差项都是反映了模型中解释变量之外其他因素的综合影响,所以可以将误差项视为随机误差项的近似估计,通过残差分析推断随机误差项的分布特征。
3.8 表1中列出了1995年北京市规模最大的20家百货零售商店的商品销售收入X 和销售利润Y 的统计资料(单位:千万元)。
(1)根据Y 、X 的相关图分析异方差性;
(2)利用White 检验、Park 检验和Gleiser 检验进行异方差性检验; (3)利用WLS 方法估计利润函数。
解:(1
从相关图可以明显看出,随着X 值的增大、Y 的波动幅度也在逐渐增大,即可能存在(递增型的)异方差性。
(2)异方差性检验
● White 检验:在方程窗口中,利用View 菜单下的残差检验,得到white 的检验结果:
卡方统计量=8.41,伴随概率=0.015<0.05,所以拒绝同方差的原假设,模型存在异方差性。
● Park 检验:分别键入以下命令:
LS Y C X
GENR E1=abs(RESID) GENR E2=RESID^2 LS log(E2) C log(X)
得到:8394
.12ˆi i X a
e =,F =10.37,F 统计量的伴随概率p =0.005,函数关系显著,所以存在异方差性。
● Gleiser 检验:分别键入以下命令:
LS E1 C X LS E1 C X^2 LS E1 C X^(1/2) LS E1 C 1/X LS E1 C 1/X^2 LS E1 C 1/X^(1/2)
得到: i I X e 0199.00353.0||+-=,
F =18.16,p =0.00047 20001.05805.0||i I X e +=,
F =17.93,p =0.0005 2/13265.02504.1||i I X e +-=,
F =16.16,p =0.0008
)/1(8763.452658.2||i I X e -=, F =7.05,p =0.02
)/1(95.6576651.1||2i I X e -=,
F =3.79,p =0.067
)/1(5396.154731.3||2/1i I X e -=, F =9.73,p =0.0059
只要取显著水平α>0.067,所有函数关系都是显著的,所以存在异方差性;其中,由于第一个方程的F 统计量值最大,所以6个方程中以线性关系最为显著。
(3)权数变量取成:
根据Park 检验结果,取:8394
.11/1i
X W =, GENR W1=1/X^1.8394
根据Gleiser 检验结果,取:i X W /12=,
GENR W2=1/X
另外,用残差直接估计总体方差(利用前述已经计算出的E1、E2):
||/13i e W =
GENR W3=1/E1 24/1i e W =
GENR
W4=1/E2
然后键入命令依次估计不同权数变量的模型,得到以下估计结果: ① 3534.0,08.2,5733.00711.06260.0ˆ22===+-=p nr R x y
② 2381.0,87.2,0106.00559.01573.0ˆ22===+-=p nr R x y
③ 5769.0,10.1,9458.00388.07077.0ˆ22===+=p nr R x y
④
4022.0,
82.1,
9950.00429.05919.0ˆ22===+=p nr R x y
因为4个模型White 检验统计量的p 值均>0.05,即模型经过WLS 估计都消除了异方差性;进一步再比较R 2得知,模型④的拟合优度最高,所以取该模型为最终估计模型。
3.9 设根据某年全国各地区的统计资料建立城乡居民储蓄函数i i i bX a S ε++=时(其中,S 为城乡居民储蓄存款余额,X 为人均收入),如果经检验得知:228.1i i X e =,
(1)试说明该检验结果的经济含义;
(2)写出利用加权最小二乘法估计储蓄函数的具体步骤; (3)写出使用EViews 软件估计模型时的有关命令。
解:(1)根据Park 检验原理得知,模型存在着异方差性,其经济含义为:我国城镇居民各地区储蓄存款的波动幅度不同,而且收入越高的地区,存款波动的幅度越大。
(2)常数===≈8.1)/(8.1)(2
2i i i i i X D X e D εε
所以,在原模型两端同除以X ,得:
i
i i i i X b X a X S ε
++=1 此时消除了原模型的异方差性,可以利用OLS 法估计变换后的模型。
(3)GENR W1=1/X^2 LS(W=W1) S C X
3.10 表2中的数据是美国1988年工业部门研究与开发(R&D )支出费用Y 和销售量S 、销售利润P 的统计资料(单位:百万美元)。
试根据表中数据,
(1)分别利用线性模型和双对数模型建立研发费用模型,比较模型的统计检验结果和异方差性的变化情况;
(2)检验模型的异方差性;
(3)对于双对数模型,分别取权数变量为W1=1/P 、W2=1/RESID^2, 利用WLS 方法重新估计模型,分析模型中异方差性的校正情况。
表2
解:(1)观察Y 与S 、lnY 与lnS 的相关图可知,线性模型的异方差性比双对数模型更加明显。
分别估计线性模型和双对数模型,并进行White 检验,有关结果为:
0046.0,
06.155245.02398.00126.096.13ˆ22===++-=p nr R P S y
t = (0.70) (1.21)
3401.0,
52.47954.0ln 0619.0ln 2453.104.7ˆln 22===++-=p nr R P S y
t =
(3.41) (0.24)
线性模型经检验存在异方差性,2个解释变量都不显著;而双对数模型经检验不存在异方差性,解释变量中销售量S 的影响显著。
表明模型函数形式的选择会影响模型的异方差性。
(2)White 检验统计量的伴随概率为0.0046<0.05,表明线性模型存在异方差性。
(3)分别键入命令: GENR W1=1/P GENR
W2=1/RESID^2
LS(W=W1) LOG(Y) C LOG(S) LOG(P) LS(W=W2) LOG(Y) C LOG(S) LOG(P)
对WLS 的估计结果再进行White 检验,得到以下结果: W1=1/P :
3478.0,
46.49996.0ln 1362.0ln 4704.106.8ˆln 22===-+-=p nr R P S y
t = (37.27)
(-1.86)
W2=1/RESID^2:
1422.0,
88.69999.0ln 0620.0ln 2388.104.7ˆln 22===++-=p nr R P S y
t = (40.10)
(2.44)
分析:虽然第(2)题中的双对数模型已经不存在异方差性,但是解释变量P 影响不显著,而且拟合优度偏低,所以利用WLS 法调整模型的异方差性。
从相关图可以看出,模型的异方差性属于递增型,所以将权数变量取成与异方差性类型相反的变量1/P 和1/e i 2。
利用W1进行WLS 估计后,解决了异方差性,也提高了拟合度,但是lnP 的符号方向不合理;再利用W2进行WLS 估计,White 检验表明不存在异方差性,解释变量的经济检验、统计检验均能通过,而且拟合优度提高到0.9999,所以,该模型为最佳模型。
3.11 对于练习2.13的我国财政收入预测模型,
(1)利用DW 统计量、偏相关系数和BG 检验,检测模型的自相关性;
(2)通过在LS 命令中直接加上AR(1)、AR(2)项来检测模型的自相关性,并与(1)中的检验结果进行比较;
(3)分析调整自相关性之后,模型估计结果的变化情况;
解:(1)DW=0.8613,d L =1.201,d U =1.441,0<DW <d L ,所以模型存在一阶自相关性。
偏相关系数检验表明存在一阶自相关性:
BG 检验结果:因为84.102
=χ,伴随概率p =0.0044,表明存在自相关性;同时,由于21,ρρ显著的不等于0(对应的p 值分别为0.0005和0.0112),所以,存在一、二阶自相关性。
(2)键入LS Y C X AR(1) AR(2),得到:
由于21,ρρ显著(对应的p 值分别为0.0014和0.0146),所以,说明确实存在一、二阶自相关性。
(3)OLS 的估计结果为:
与调整了自相关性的估计结果比较可知:OLS 估计的系数估计误差偏低,扩大了t 统计量值,进一步使得系数b 的估计偏低,即低估了GNP 对财政收入的边际影响。
3.12
对于练习2.14的我国城镇居民耐用消费品需求函数, (1)检验模型的自相关性;
(2)分析自相关性调整对模型估计结果的影响。
解:(1)建立需求函数:LS Y C X1 X2
该模型的DW=1.0358,偏相关系数检验存在二阶自相关性,BG 检验存在一、二阶自相关性,最后在估计模型时加入AR(1)、AR(2)项调整自相关性,对调整后模型21,ρρ的显著性检验结果得知,模型确实存在一、二阶自相关性。
(2)调整自相关性后,除了系数估计值变化较大之外,模型的另一个重要变化是:价格因素X2由不显著变量变成了显著变量。
3.13
古典回归模型是否要求模型不存在多重共线性?多重共线性是否会影响OLS 估计的无偏性和
有效性?具体产生哪些不利影响?
答:(1)古典回归模型要求模型不存在完全的多重共线性,即解释变量之间不存在精确的线性关系,所以模型存在多重共线性时,并没有违反古典假定。
(2)根据高斯—马尔科夫定理的证明过程可知,多重共线性不会影响OLS 估计的无偏性和有效性。
(3)多重共线性的主要不利影响是:增大系数的估计误差、难以利用回归系数区分解释变量的单独影响、t 检验可靠性降低。
3.14
试述产生多重共线性的原因和解决多重共线性的基本思路。
答:产生原因:经济变量之间的内在联系,经济变量变化趋势的共向性,模型中有滞后变量。
解决思路:通过直接或间接方式剔除产生多重共线性的解释变量。
3.15
对估计的计量经济模型进行统计检验时,有哪些情况会影响t 检验的可靠性?
答:因为)ˆ(/ˆb S b
t =,当)ˆ(b S 估算有误时,将会直接影响t 统计量的正确计算,导致检验可靠性降低;当模型存在异方差性、自相关性时,利用)ˆ(b
S 的标准计算公式将会错误地估算系数估计误差,多重共线性也会使得)ˆ(b S 增大;所以,异方差性、自相关性和多重共线性都会影响t 检验的可靠性。
3.16
建立生产函数β
α
K AL Y =时,
(1)若K 、L 高度相关,用OLS 方法估计模型时会出现什么问题?
(2)若已知该生产过程的规模报酬不变(即α+β=1),应该如何估计模型?写出具体步骤;
(3)写出上述估计过程的有关EViews 命令序列。
解:(1)当K 、L 高度相关时,模型存在严重的多重共线性,将会增大系数估计误差、降低统计检验的可靠性。
(2)利用附加信息α+β=1,可以得到:
ββββα)/(1L K AL K AL K AL Y ===-,
β)/(/L K A L Y =⇒
设: L Y=log(Y/L),LK=log(K/L),
则:
A a LK a LY ln =+=β。