伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解(2-8章)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

使用普通最小二乘法,此时最小化的残差平方和为
()
2
11
n
i
i
i y x β=-∑
利用一元微积分可以证明,1β必须满足一阶条件
()11
0n
i
i
i
i x y x β=-=∑
从而解出1β为:
1121
n
i i
i n
i
i x y
x
β===
∑∑
当且仅当0x =时,这两个估计值才是相同的。

2.2 课后习题详解
一、习题
1.在简单线性回归模型01y x u ββ=++中,假定()0E u ≠。

令()0E u α=,证明:这个模型总可以改写为另一种形式:斜率与原来相同,但截距和误差有所不同,并且新的误差期望值为零。

证明:在方程右边加上()0E u α=,则
0010y x u αββα=+++-
令新的误差项为0e u α=-,因此()0E e =。

新的截距项为00αβ+,斜率不变为1β。

2
(Ⅰ)利用OLS 估计GPA 和ACT 的关系;也就是说,求出如下方程中的截距和斜率估计值
01
ˆˆGPA ACT ββ=+^
评价这个关系的方向。

这里的截距有没有一个有用的解释?请说明。

如果ACT 分数提高5分,预期GPA 会
提高多少?
(Ⅱ)计算每次观测的拟合值和残差,并验证残差和(近似)为零。

(Ⅲ)当20ACT =时,GPA 的预测值为多少?
(Ⅳ)对这8个学生来说,GPA 的变异中,有多少能由ACT 解释?试说明。

答:(Ⅰ)变量的均值为: 3.2125GPA =,25.875ACT =。

()()1
5.8125n
i
i
i GPA GPA ACT ACT =--=∑
根据公式2.19可得:1
ˆ 5.8125/56.8750.1022β==。

根据公式2.17可知:0
ˆ 3.21250.102225.8750.5681β=-⨯=。

因此0.56810.1022GPA ACT =+^。

此处截距没有一个很好的解释,因为对样本而言,ACT 并不接近0。

如果ACT 分数提高5分,预期GPA 会提高0.1022×5=0.511。

(Ⅱ)每次观测的拟合值和残差表如表2-3所示:
根据表可知,残差和为-0.002,忽略固有的舍入误差,残差和近似为零。

(Ⅲ)当20ACT =,则0.56810.102220 2.61GPA =+⨯=^。

(Ⅳ)残差平方和为:21ˆ0.4347n
i i u
==∑,而()
2
1
1.0288n
i i y y =-=∑,则判定系数为:
21SSR /SST 10.4377/1.02880.577R =-=-≈
GPA 的变异中,有57.7%能由ACT 解释。

3.令kids 表示一名妇女生过的孩子数目,educ 表示该妇女接受过教育的年数。

生育率对受教育年数的简单回归模型为
01kids educ u ββ=++
其中,u 是无法观测到的误差。

(Ⅰ)u 中包含什么样的因素?它们可能与受教育程度相关吗?
(Ⅱ)简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。

答:(Ⅰ)收入、年龄和家庭背景(如兄弟姐妹的数量)都可能包含在误差项中。

它们可能是与受教育程度相关的:收入和受教育程度是呈正相关的;年龄与受教育程度是呈负相关的;兄弟姐妹的数量与受教育程度是负相关的。

(Ⅱ)假定(Ⅰ)中所列举的因素固定不变,即以误差项的形式呈现在回归方程中,但是误差项与解释变量是相关的,因此()0E u educ ≠,经典假定被推翻,因此简单回归分析不能解释教育对生育率在其他条件不变下的影响。

4.假设你对估计花在SAT 备考课程上的小时数(hours )对SAT 总分(sat )的影响感兴趣。

总体是某一年内所有计划上大学的中学高年级学生。

(Ⅰ)假设你有权进行一项控制实验。

请说明为了估计hours 对sat 的引致效应,你将如何构建实验。

(Ⅱ)考虑一个更加实际的情形,即由学生选择在备考课程上花多少时间,而你只能随机地从总体中抽出sat 和hours 的样本。

将总体模型写作如下形式:
01sat hours u ββ=++
其中,与通常带截距的模型一样,我们可以假设()0E u =。

列举出至少两个u 中包含的因素。

这些因素与hours 可能呈正相关还是负相关?
(Ⅲ)在(Ⅱ)的方程中,如果备考课程有效,那么1β的符号应该是什么? (Ⅳ)在(Ⅱ)的方程中,0β该如何解释?
答:(Ⅰ)构建实验时,首先随机分配准备课程的小时数,以保证准备课程的时间与其他影响SAT 的因素是
独立的。

然后收集实验中每个学生SAT 的数据,建立样本(){} 1 ,
:,,i i sat hour i n =,n 表示试验中所包括的学生的数量。

根据方程2.7,应该尝试采用尽可能多的有差异的“小时数”。

(Ⅱ)误差项还可能包含以下三个因素:天赋能力、家庭收入以及考试当天的健康状况。

如果学生拥有天赋能力,那么他们不需要为考试花费太多时间,能力与时间是负相关的。

家庭收入与学习时间呈正相关关系,因为家庭收入越高,就能负担去越多的课时费用。

排除慢性的健康问题,考试当天的健康状况与为准备考试花费的时间是无关的。

(Ⅲ)如果备考课程有效,1β的符号应该为正,在其他因素相同的情况下,备考时间越多,sat 越高。

(Ⅳ)截距有一个有用的解释:因为()0E U =,0β表示备考时间为0时学生获得的平均sat 总分。

5.考虑储蓄函数
01sav inc u ββ=++,u e =
其中,e 是一个随机变量,且有()0E e =和()2Var e e σ=,假设e 独立于inc 。

(Ⅰ)证明:若()|0E u inc =,则满足零条件均值的关键假设(假定SLR.4)。

[提示:若e 独立于inc ,则
()()|E u inc E e =]
(Ⅱ)证明:若()2Var |e u inc inc σ=,则不满足同方差假定SLR.5。

特别地,sav 的方差随着inc 而增加。

[提示:若e 和inc 独立,则()()Var |Var e inc e =。

]
(Ⅲ)讨论支持储蓄方差随着家庭收入递增的证据。

证明:(Ⅰ)计算inc 因此())
()|0E u inc E e inc e inc ==。

(Ⅱ)inc 的方差为:())()2
2Var |Var
Var e u inc e inc e inc inc σ==
=⋅。

(Ⅲ)低收入家庭支出的灵活性较低,因为低收入家庭必须首先支付衣食住行等必需品。

而高收入家庭具有较高的灵活性,部分选择更多的消费,而另一部分家庭选择更多的储蓄。

这种较高的灵活性暗示高收入家庭中储蓄的变动幅度更大。

6.令0ˆβ和1ˆβ分别为OLS 截距和斜率估计量,并令u 为误差(不是残差)的样本均值。

(Ⅰ)证明:1ˆβ可写成11
1ˆn
i i i w u ββ==+∑,其中/SST i i i w d =和i i d x x =-。

(Ⅱ)利用(Ⅰ)及1
0n
i i w ==∑,证明:1ˆβ和u 无关。

[提示:要求你证明()
11
ˆ0E u ββ-⋅=] (Ⅲ)证明0ˆβ可写成()
0011
ˆˆu x ββββ=+--。

(Ⅳ)利用(Ⅱ)和(Ⅲ)证明:()()
2
220
ˆVar SST x n x βσσ=+//。

(Ⅴ)(Ⅳ)中的表达式能简化成方程(2.58)吗?[提示:()
2
1
21
SST /n
x i i n n
x x -==-∑。

]
证明:(Ⅰ)该理论推导与公式2.52的推导本质上是一样的,区别只是将/SST i i i w d =带到求和的里面。

(Ⅱ)因为()()
111
ˆˆcov u E u βββ⎡⎤=-⎣

,,公式右边等于0。

从(Ⅰ)可知, ()
()1111ˆn n i i i i i i E u E w u w E u u ββ==⎡⎤⎡⎤-=∑=∑⎣⎦⎣⎦。

因为误差项两两互不相关,则()0i h E u u =,i h ≠, ()()22//i i E u u E u n n σ==。

因此()()()22111//0n n n i i i i i i i w E u u w n n w σσ===∑=∑=∑=。

(Ⅲ)最小二乘估计的截距公式为:0ˆˆy x ββ=-,代入01
y x u ββ=++,则 ()()
0011011
ˆˆˆx u x u x βββββββ=++-=+--。

(Ⅳ)因为1
ˆβ和u 是不相关的,则有: ()()()
()222222201x ˆˆVar Var Var //SST //SST x
u x n x n x ββσσσσ=+=+=+ (Ⅴ)能。

根据()2
1
21
SST /n
x i i n n
x x -==-∑,则
()
()()()2202
1
2
2
2
2
1
21
1
ˆVar SST //SST /SST /SST
x x n
n i i
x i i
x
n x n x x
x
n
x
βσσσ--==⎡⎤=+⎣⎦⎡⎤=∑
-+=∑
⎣⎦
7.利用Kiel and McClain (1995)有关1988年马萨诸塞州安德沃市的房屋出售数据,如下方程给出了房屋价格(price )和距离一个新修垃圾焚化炉的距离(dist )之间的关系:
()()2log 9.400.312log 135 0.162
price dist n R =+==^
, (Ⅰ)解释()log dist 的系数。

它的符号是你所预期的吗?
(Ⅱ)你认为简单回归给出了price 对dist 在其他条件不变下弹性的无偏估计量吗?(考虑一个城市决定放置焚化炉的地点的决策。


(Ⅲ)还有哪些其他因素影响房屋的售价?这些因素会与距离焚化炉的远近相关吗?
答:(Ⅰ)符号为正,与预期相符。

()log dist 的系数表示距离焚化炉的距离越远,价格就越高,价格的距离弹性是0.312,即距离远1%,价格上升0.312%。

(Ⅱ)如果城市决定将焚化炉放置在远离较贵的居民区的地方,则()log dist 与房价是正相关的。

这将违背假定4,而OLS 估计是有偏的。

(Ⅲ)房屋的面积、洗手间的数量、占地面积大小、房龄社区质量(包括学校质量)都会影响房屋的售价。

这些与距离焚化炉的远近是有关的。

8.(Ⅰ)令0ˆβ和1ˆβ为i y 对i
x 进行回归的截距和斜率(有n 次观测);1c 和2c 为常数且20c ≠;0β和1β为1i c y 对2i c x 进行回归的截距和斜率。

证明()120ˆˆ/c c ββ=1且010ˆˆc ββ=,
从而验证了2.4节中关于度量单位的命题。

[提示:为得到1β,把改变了度量单位的x 和y 代入方程(2.19)。

然后用方程(2.17)求0β,确定代入的是进行度量单位变换后的x 和y 以及正确的斜率。

(Ⅱ)现在令0β和1β得自(1i c y +)对(2i c x +)的回归(对1c 和2c 不加任何限制)。

证明:11
ˆˆββ=且00121ˆˆˆc c βββ=+-。

(Ⅲ)令0ˆβ和1ˆβ为()log i y 对i
x 回归的OLS 估计值,其中我们必须假定对所有i ,都有0i y >。

对10c >,令0β和1β为()1log i c y 对i x 回归的截距和斜率.证明:11
ˆˆββ=且()010ˆˆlog c ββ=+。

(Ⅳ)现在假定对所有i ,都有0x >。

令0β和1β为i y 对()2log i c x 回归的截距和斜率。

1β和1β与i y 对()log i x 回归的截距和斜率相比如何?
答:(Ⅰ)因为11c y c y =,2x c x c x =,当为1i c y 对2i c x 进行回归时,可以通过方程2.19得到方程的斜率:
()()
()
()()
()
()()
()
22
11121
1
1
2
2
2
222
11
11112
2
2
1
ˆˆ =n
n
i i
i
i i i n
n
i i
i i n
i i i n
i
i c x c x c y
c y c c x x y
y c x c x c x x x x y y c c c c x x ββ======----==
----⋅=-∑∑∑∑∑∑
根据公式2.17可得截距项为:
()()()()()()()
0112112121110ˆˆˆˆˆ/c y c x c y c c c x c y x c βββββ⎡⎤=-=-=-=⎣⎦
(Ⅱ)使用与(Ⅰ)相同的方法,可得()
11c y c y +=+,()
22c x c x +=+。

因此
()()()()1111i i i c y c y c y c y y y +-+=+-+=-,()()22i i c x c x x x +-+=-。

在(1i c y +)对(2i c x +)的回归中,
1c 和2c 被完全排除在斜率公式以外,以及11
ˆˆββ=。

截距为:()()()()()
011211211210121ˆˆˆˆˆˆˆc y c x c y c x y x c c c c βββββββ=+-+=+-+=-+-=+-。

(Ⅲ)因为()()()11log log log i i c y c y =+,令1c 代替()1log c ,i y 代替()log i y ,且20c =,然后采用与(Ⅱ)相同的方法。

(Ⅳ)采用与(Ⅱ)相同的方法,设10c =,2c 替代()2log c ,i x 替代()log i x ,如果0
ˆβ和1ˆβ是原截距和斜率,那么此时的截距和斜率为:()0021ˆˆˆlog c βββ=-和11
ˆˆββ=。

9.在线性消费函数01
ˆˆcons inc ββ=+^
中,收入的(估计)边际消费倾向(MPC )无非就是斜率1ˆβ,而平均消费倾向(APC )为01
ˆˆ//cons inc inc ββ=+^。

利用对100个家庭的年收入和消费观测(均以美元计),便得到如下方程:
2124.840.853100 0.692
cons inc n R =-+==^
, (Ⅰ)解释这个方程中的截距,并评价它的符号和大小。

(Ⅱ)当家庭收入为30000美元时,预计消费为多少? (Ⅲ)以inc 为横轴,画出估计的MPC 和APC 图。

答:(Ⅰ)截距表示当0inc =,cons 预计将为-124.84美元。

但这与事实不符,反映出消费函数在预测方面(尤
其是收入处于较低的水平上时)是薄弱的。

从年同比角度而言,124.84美元与0美元的差距并没有那么大。

(Ⅱ)将30000美元代入方程:预计消费124.840.8533000025465=-+⨯=(美元)。

(Ⅲ)MPC 和APC 如图2-1所示。

即使截距是负的,样本中最小的APC 是正的。

图中从年均收入水平1000美元开始。

图2-1
10.在高斯-马尔可夫假定SLR.1~SLR.5之下,考虑标准的简单回归模型01y x u ββ=++。

通常的OLS 估计
量0ˆβ和1ˆβ都是各自总体参数的无偏估计量。

令1β表示通过假定截距为零而得到1
β的估计量(见2.6节)。

(Ⅰ)用1x 、0β和1β表示()1E β。

证明:当总体截距(0β)为零时,1β是1β的无偏估计量。

有没有其他的情况使得1β也是无偏的?
(Ⅱ)求1β的方差。

(提示:方差不依赖于0β。


(Ⅲ)证明()()
11
ˆˆVar Var ββ≤。

[提示:对任何数据样本,()22111
1
n n
i i x x x ==≥-∑∑,除非()0x =,否则该式严格不等。

]
(Ⅳ)当我们要从1ˆβ和1
β中做出选择时,评论偏误和方差的替代关系。

答:(Ⅰ)从方程2.66可知:
2111ˆn n i i i i i x y x β==⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭
∑∑
将01i i i y x u ββ=++代入可得:
()011211ˆn n i i i i i i x x u x βββ==⎛⎫⎛⎫=++ ⎪ ⎪⎝⎭⎝⎭
∑∑ 分子化简后可写为:
2
011
1
1
n n n
i i i i i i i x x x u ββ===++∑∑∑
因此
220111111ˆn n n n i i i i i i i i i x x x u x βββ====⎛⎫⎛⎫⎛⎫⎛⎫=++ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭
∑∑∑∑ 对于所有的i 而言,()0i E u =,则:
()
210111ˆn n i i i i x x βββ==⎛⎫⎛⎫E =+ ⎪ ⎪⎝⎭⎝⎭
∑∑ 上式中右边的第一项表示1β的偏差。

当00β=、0x =或1
0n
i i x ==∑时,1β是无偏的。

(Ⅱ)根据(Ⅰ)中所表示的1β,可得方差为:
()
()22
22211112
222221111Var Var Var ˆ n n n n i i i i i i i i i i n
n n
i i i i i i x x u x x u x x x σσβ--====-===⎛⎫⎛⎫⎛⎫⎛⎫== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭
⎛⎫⎛⎫⎛⎫
== ⎪ ⎪ ⎪
⎝⎭⎝⎭⎝⎭
∑∑∑∑∑∑∑
(Ⅲ)根据公式2.57,()
()2211ˆVar /n
i i x x βσ=⎛⎫=- ⎪⎝⎭∑,对任何数据样本,()2211
n n i i i i x x x ==≥-∑∑,除非0x =。

因此
()()
11
ˆˆVar Var ββ≤。

(Ⅳ)对于给定的样本而言,当x 增加,1β的有偏程度增加。

但是当x 增加时,1β的变化与()
1
ˆVar β是相关的。

当0β较小时,1β的偏差也很小。

因此0β、x 以及样本大小n (21n
i i x =∑的规模)决定了在均方误差上1β和1
ˆβ的优劣。

11.数据集BWGHT.RAW 包含了美国妇女生育方面的数据。

我们关心的两个变量是因变量[婴儿出生体重的盎司数(bwght )]和解释变量[母亲在怀孕期间平均每天抽烟的根数(cigs )].下面这个简单回归是用1388n =个出生数据进行估计的:
119.770.514bwght cigs =-^
(Ⅰ)当0cigs =时,预计婴儿的出生体重为多少?当20cigs =(每天一包)时呢?评价其差别。

(Ⅱ)这个简单回归能够得到婴儿出生体重和母亲抽烟习惯之间的因果关系吗?请解释。

(Ⅲ)要预测出生体重125盎司,cigs 应该为多少?
(Ⅳ)样本中在怀孕期间不抽烟的妇女比例约为0.85。

这有助于解释第(Ⅲ)部分中的结论吗? 答:(Ⅰ)当0cigs =时,预计婴儿的出生体重为119.77盎司;当20cigs =时,预计婴儿的出生体重为109.49盎司,比前者下降8.6%。

(Ⅱ)不能。

因为还有其他因素影响婴儿的出生体重,如母亲的整体健康状况和产前护理的质量。

这些因素可能与怀孕期间吸烟量是相关的。

另外,咖啡因的摄入也会影响到婴儿的出生体重,这也与吸烟量相关。

(Ⅲ)要预测出生体重为125盎司,那么()()125119.77/0.52410.18cigs =--≈-。

这是无意义的,它表明在一个解释变量的情况下预测出生体重会发生的后果。

尽管有约700名婴儿的出生体重大于119.77盎司,但最大的预测出生体重不能超过119.77盎司。

(Ⅳ)因为模型仅仅使用吸烟量来解释出生体重,因此仅有一个结果:即0cigs =时的出生体重。

0cigs =时的预测结果必然大致位于样本数据的中间位置,因此可以预测高出生率。

二、计算机习题
1.401K.RAW 中的数据是帕普克(Papke ,1995)所分析数据的一个子集,帕普克是为了研究401(k )养老金计划的参与率和该计划的慷慨程度之间的关系。

变量prate 是有资格参与该计划的员工中拥有活动账户的百分比,也是我们要解释的变量。

慷慨程度指标是计划的匹配率mrate 。

这个变量给出了员工每向这个账户存1美元,公司为该员工匹配的平均数量。

例如,若0.50mrate =,则员工每投入1美元,公司就匹配50美分。

(Ⅰ)求出该计划的样本中平均参与率和平均匹配率。

(Ⅱ)现在估计下面这个简单回归方程01
ˆˆprate mrate ββ=+^
报告你的结果以及样本容量和2R 。

(Ⅲ)解释你的方程中的截距。

解释mrate 的系数。

(Ⅳ)当 3.5mrate =时,求出prate 的预测值。

这是一个合理的预测吗?解释这里出现的情况。

(V )prate 的变异中,有多少是由mrate 解释的?你认为,这是一个足够大的量吗? 答:(Ⅰ)平均参与率是87.63%,平均匹配率是0.732。

(Ⅱ)回归方程为:
283.05 5.861534 0.075
prate mrate n R =+==^
, (Ⅲ)截距表示即使0mrate =,预测的参与率是83.05%。

mrate 的系数表明匹配率每增加1美元,则有资格
参与该计划的员工中拥有活动账户的百分比(prate )增加5.86%。

该结果假定prate 的变动是可能的。

如果prate 已经达到98%,那么截距就是无意义的。

(Ⅳ) 3.5mrate =,则83.055.8683.055.863.5103.59
p r a t e m r a t e =+=+⨯=^。

这不是一个合理的预测,因为参与
率不超过100%。

这表明因变量是有界限的,简单回归所预测的自变量的极值是不符合常理的。

(V )prate 的变异中,有7.5%是由mrate 解释的,说明还有其他因素影响养老金计划参与率。

2.数据集CEOSAL2.RAW 包含了美国公司首席执行官的信息。

变量salary 是以千美元计的年薪,ceoten 是已担任公司CEO 的年数。

(Ⅰ)求出样本中的平均年薪和平均任期。

(Ⅱ)有多少位CEO 尚处于担任CEO 的第一年(就是说,0ceoten =)?最长的CEO 任期是多少?
(Ⅲ)估计简单回归模型()01log salary ceoten u ββ=++,用通常的形式报告你的结果。

多担任一年CEO ,预计年薪增长(近似)的百分数是多少?
答:(Ⅰ)平均年薪为865.864千美元,平均任期为7.95年。

(Ⅱ)有5位CEO 处于担任CEO 的第一年。

最长的CEO 任期是37年。

(Ⅲ)回归方程是:
()2log 6.510.0097177 0.013
salary ceoten n R =+==^
, 多担任一年CEO ,预计年薪增长的近似百分数是0.97%(或1%)。

3.利用Biddle and Hamermesh (1990)中的SLEEP75.RAW 数据,研究在每周用于睡眠的时间和用于有酬工作的时间之间是否存在替代关系。

我们可以用它们中的任何一个作为因变量。

为具体起见,估计模型
01sleep totwrk u ββ=++
其中,sleep 是每周用于晚上睡眠的分钟数,totwrk 是这一周中用于工作的分钟数。

(Ⅰ)用方程的形式,连同观测的次数和2R 报告你的结果。

该方程中的截距表示什么? (Ⅱ)若totwrk 增加2小时,则sleep 估计要减少多少?你觉得这是一个很大的效应吗? 答:(Ⅰ)估计方程为:
23586.40.151706 0.103
sleep totwrk n R =-==^

截距表示不工作的人每周用于晚上睡眠的时间为3586.4分钟。

这意味着每晚睡眠的时间达到8.5小时。

(Ⅱ)当120totwrk ∆=,则0.15112018.12sleep ∆=-⨯=-(分钟)。

这并不是一个很大的效应。

如果某人工作日的工作时间均增加一小时,睡眠总减少时间约为45分钟,平摊在每晚只有约6分钟。

4.利用W AGE2.RAW 中的数据估计一个简单回归,以便用智商(IQ )来解释月薪(wage )。

(Ⅰ)求出样本中的平均工资和平均IQ 。

IQ 的样本标准差是多少?(总体中的IQ 已标准化为平均值是100,标准差是15。


(Ⅱ)估计一个简单回归模型,其中IQ 提高一个单位导致wage 变化相同的数量。

利用这个模型计算IQ 提高15个单位时,工资的预期变化。

IQ 能够解释大多数工资变异吗?
(Ⅲ)现在再估计一个模型,其中IQ 提高一个单位对工资具有相同的百分比影响。

如果IQ 提高15个单位,预期工资提高的百分比大约是多少? 答:(Ⅰ)平均工资为957.95美元,平均IQ 为101.28。

IQ 的样本标准差为15.05,与总体标准差非常接近。

(Ⅱ)简单回归模型为:
2116.998.39350.096
wage IQ n R =+==^
, IQ 提高15个单位导致工资变化8.3×15=124.5(美元)。

IQ 不能够解释大多数工资变异,薪水的变异中,仅有9.6%是由IQ 解释的。

(Ⅲ)回归模型为:
()2log 5.890.00889350.099
wage IQ n R =+==^
, 如果IQ 提高15个单位,则()log 0.0088150.132wage ∆=⨯=^
,因此预期工资提高的百分比大约是13.2%。

5.在化工产业的企业总体中,令rd 表示年研发支出,sales 表示年销售额(都以百万美元计)。

(Ⅰ)写一个模型(不是估计方程),其中rd 和sales 之间的弹性为常数。

哪一个参数代表弹性?
(Ⅱ)再用RDCHEM .RAW 中的数据估计模型。

用通常的形式写出估计方程。

rd 关于sales 的弹性估计值是多少?用文字解释这个弹性的含义。

答:(Ⅰ)不变弹性的对数-对数模型为:
()()01log log rd sales u ββ=++
参数1β代表弹性。

(Ⅱ)估计方程为:
()()2log 4.105 1.076log 32 0.910
rd sales n R =-+==^
, rd 关于sales 的弹性估计值是1.076,说明sales 每增长1%,rd 将会增长1.08%。

6.例2.12中曾使用了MEAP93.RAW 中的数据。

现在,我们想用这个文件中的数据来说明数学通过率(10math )与每个学生的平均支出(expend )之间的关系。

(Ⅰ)就多花一美元对通过率的影响而言,你认为具有恒定不变的影响合适呢,还是这种影响越来越小更合适?请加以解释。

(Ⅱ)在总体模型()0110log math expend u ββ=++中,证明110β/表示expend 提高10%导致10math 改变的百分数。

(Ⅲ)利用MEAP93.RAW 中的数据,估计(Ⅱ)中的模型.按照通常的方式报告估计方程,包括样本容量和及2R 。

(Ⅳ)支出的估计影响有多大?也就是说,如果支出提高10%,估计10math 会提高多少个百分点?
(Ⅴ)有人担心这个回归分析可能得到10math 的拟合值会超过100。

为什么在这个数据集中不必担心这个问题?
答:(Ⅰ)多花一美元对通过率的影响而言,这种影响越来越小更合适。

在支出较小的学校,多花钱可以用于购买更多的教材、电脑以及雇用高质量的教师,但在一个高支出水平上,即已经具备了大量教材、足够好的设备和高质量的教师时,再增加支出对通过率的影响几乎没有,即使有也会很小。

(Ⅱ)()()()1110log /100%math expend expend ββ∆=∆≈∆,如果%10expend ∆=,则110/10math β∆=。

(Ⅲ)估计方程为:
()21069.3411.16log 408 0.0297
math expend n R =-+==^
, (Ⅳ)支出提高10%,估计10math 会提高1.1%。

支出的估计影响并不大,但这对低支出水平的学校而言是
无影响的,因为10%的支出增加从绝对数量上看是很小的。

(Ⅴ)在这个数据集中,最大的10math 为66.7,远小于100。

实际上,最大的拟合值仅为30.2。

7.利用CHARITY.RAW 中的数据[得自于Franses and Paap (2001)]回答如下问题: (Ⅰ)在这个4268人的样本中,平均捐款数量是多少(以荷兰盾为单位)?没有捐款的人数百分比是多少? (Ⅱ)每年平均寄出的邮件数量是多少?其最小值和最大值是多少? (Ⅲ)用普通最小二乘法估计如下模型:
01gift mailsyear u ββ=++ 按照通常的方式报告估计方程,包括样本容量和2R 。

(Ⅳ)解释斜率系数。

如果每封邮件的成本是1盾,那么慈善机构预期能够从寄出的每一封邮件中获得净利润吗?这意味着慈善机构从每封邮件中都获得了净利润吗?请加以解释。

(Ⅴ)样本中最小慈善捐款的预测值是多少?利用这个简单的回归分析,你有可能预测gift 等于0吗?
答:(Ⅰ)平均捐款数量为7.44荷兰盾。

在4268个被调查者中,2561人没有捐款,占60%。

(Ⅱ)每年平均寄出的邮件量为2.05。

最小值为0.25,这意味着有人每四年寄出一封邮件,最大值为3.5。

(Ⅲ)估计方程为:
22.010.654268 0.0138
gift mailsyear n R =+==^
, (Ⅳ)斜率系数为2.65,意味着年均邮件量导致了额外2.65荷兰盾的捐赠。

如果每一封邮件的成本是1盾,
那么每封邮件的预期净收益则是1.65盾,然而这只是从平均角度而言的,并不意味着慈善机构从每封邮件中都获得了净利润。

部分邮件对捐赠量没有任何贡献,或者其贡献额小于邮寄成本,部分邮件可能产生远高于邮寄成本的捐赠量。

(Ⅴ)样本中最小慈善捐款的预测值是:2.01 2.650.25 2.67+⨯=。

即使从总体来看,某些人没有收到邮件,最小慈善捐款为2。

因此不可能预测gift 等于0。

为了构造置信区间并进行检验,估计ˆj
β的标准差也就是方差的平方根: ()
()1/2
2ˆsd /SST 1j j j R βσ⎡⎤=-⎣
⎦ 由于σ未知,所以用其估计量ˆσ
来取代,则: ()
()1/2
2ˆˆse /SST 1j j j R βσ⎡⎤=-⎣

如果误差表现出异方差性,标准误公式就不是()
ˆsd j
β的一个可靠估计量,从而使标准误无效。

五、0LS 的有效性:高斯-马尔可夫定理 1.最优线性无偏估计量
(1)估计量:它是一个可应用于任何一个数据样本,并产生一个估计值的规则。

(2)无偏估计量:如果j β的一个估计量,对任意01 k βββ,,…,都有()
ˆj j
E ββ=,那么它就是j β的一个无偏估计量。

(3)“线性”:j β的一个估计量j β是线性的充分必要条件是,它能表示成因变量数据的一个线性函数:
1
n
j ij i i w y β==∑
其中每个i j w 都可以是所有自变量样本值的一个函数。

(4)“最优”:最优被定义为最小方差。

2.定理3.4:高斯-马尔可夫定理 (1)主要内容
在假定MLR.1~MLR.5下,01ˆˆˆ k βββ,,…,分别是01 k βββ,,
…,的最优线性无偏估计量。

假定MLR.1~MLR.5被称为(横截面数据分析的)高斯-马尔可夫假定。

(2)高斯-马尔可夫定理的重要性
当这个标准假定集成立时,不需要再去寻找其他无偏估计量:没有一个会比OLS 更好。

如果高斯-马尔可夫假定中的任何一个不成立,那么这个定理也就不再成立。

零条件均值的假定(假定MLR.4)不成立会导致OLS 产生偏误,异方差性(假定MLR.5不成立)虽不致使OLS 有偏,但它在线性无偏估计量中不再具有最小方差。

3.2 课后习题详解
一、习题
1.用W AGE2·RAW 中有关男工人的数据估计了如下方程:
210.360.0940.1310.210722 0.214
educ sibs meduc feduc n R =-++==^
, 其中,educ 是受教育年数,sibs 是兄弟姐妹的个数,meduc 是母亲受教育的年数,feduc 则是父亲受教育的年数。

(i )sibs 是否具有预期的影响?请给出解释。

保持meduc 、feduc 不变,为了使预测的受教育程度减少一年,需要sibs 增加多少?(这里不要求答案为整数。

) (ii )讨论对meduc 的系数的解释。

(iii )假设一个男工人A 没有兄弟姐妹,其父母都接受了12年的教育。

另一个男工人B 也没有兄弟姐妹,但其父母都接受了16年的教育。

预计B 和A 所接受教育的年数差别为多少?
答:(i )sibs 具有预期的影响。

家庭中兄弟姐妹的数量越多,每一个小孩受教育的年数都会减少。

为了使预测的受教育程度减少一年,需要增加1/0.9410.6sibs ∆=≈。

(ii )变量sibs 和feduc 保持不变,则母亲受教育的年数每增加一年,预计受教育年数将会增加0.131年。

因此母亲受教育年数增加4年,她的儿子受教育年数增加约半年(0.524)。

(iii )因为兄弟姐妹的个数是相同的,但是meduc 和feduc 均不相同,因此B 和A 所接受教育的年数为:()0.1310.2104 1.364+⨯=(年)。

2.利用GPA2.RAW 中有关4137名大学生的数据,用0LS 估计了如下方程:
21.3920.01350.0014841370.273
colgpa hsperc sat n R =-+==^
, 其中,colgpa 以四分制度量,hsperc 是在高中班上名次的百分位数(比方说,5hsperc =,就意味着位于班上前5%之列),而sat 是在学生能力测验中数学和语言的综合成绩。

(i )为什么hsperc 的系数为负也讲得通?
(ii )当20hsperc =和1050sat =时,大学GPA 的预测值是多少?
(iii )假设两个在高中班上具有同样百分位数的高中毕业生A 和B ,但A 学生的SAT 分数要高出140分(在样本中相当于一倍的标准差),那么,预计这两个学生的大学GPA 相差多少?这个差距大吗?
(iv )保持hsperc 不变,SAT 的分数相差多少,才能导致预测的colgpa 相差0.50或四分制的半分?评论你的结论。

答:(i )在高中班上名次的百分位数(hsperc )越小,学生在高中排名就越好,越大则排名越差。

其它条件不变的情况下,学生在高中的排名越差,他/她预计的GPA 将越小。

(ii )将20hsperc =,1050sat =代入估计方程可得:
1.3920.0135200.01481050
2.676colgpa =-⨯+⨯=
(iii )预计中A 的成绩比B 的成绩高出0.01481400.207⨯≈。

这个差距较大。

(iv )hsperc 不变,0.00148colgpa sat ∆=∆。

当0.5colgpa ∆=时,()()0.5/0.00148338sat ∆=≈。

在其他条件不变的情况下,SAT 分数的差异为约2.5个标准差,才能预测colgpa 相差0.50。

3.刚从法学院毕业的学生的起薪中位数由下式决定:
()()()012345log log log salary LSAT GPA libvol cost rank u ββββββ=++++++
其中,LSAT *是整个待毕业年级LSAT 成绩的中位数,GPA 是该年级大学GPA 的中位数,libvol 是法学院图书馆的藏书量,cost 是进入法学院每年的费用,而rank 是法学院的排名(1rank =的法学院是最好的)。

(i )解释为什么我们预期50β≤。

(ii )你预计其他斜率参数的符号如何?给出你的理由。

(iii )使用LAWSCH85.RAW 中的数据,估计出来的方程是
()()()2log 8.340.00470.2480.095log 0.038log 0.0033136 0.842
salary LSAT GPA libvol cost rank n R =++++-==^
, 在其他条件不变的情况下,预计GPA 中位数相差一分会导致薪水有多大差别?(以百分比回答。

) (iv )解释变量()log libvol 的系数。

(v )你是否认为,应该进入一个排名更高的法学院?从预计的起薪来看,排名相差20位的价值有多大?
答:(i )法学院的排名越大,说明该学院的声望越差,这将使得起薪下降。

例如,排名100意味着还有99所学校更好。

因此预期50β≤。

(ii )预计10β>,20β>,因为LSAT 和GPA 都衡量了待毕业班级的质量,好学生进入学院使得预计的平均工资更高。

34 0ββ>,,法学院图书馆的藏书量以及进入法学院每年的费用都衡量了学校的质量。

成本的作用小于藏书量,但反映了教员和硬件设施的质量。

(iii )预计GPA 中位数相差一分会导致薪水增加24.8%。

(iv )应该进入一个排名更高的法学院。

排名相差20位的价值为:1000.003320 6.6%⨯⨯=。

4.下面这个模型是Biddle and Hamermesh (1990)所用多元回归模型的一个简化版本,原模型研究睡眠时间和工作时间之间的取舍,并考察影响睡眠的其他因素:
0123sleep totwrk educ age u ββββ=++++
其中,sleep 和totwrk 都以分钟/周为单位,而educ 和age 则以年为单位。

(也可参见计算机习题C2.3。

) (i )如果成年人为工作而放弃睡眠,1β的符号是什么? (ii )你认为2β和3β的符号应该是什么?
(iii )利用SLEEP75.RAW 中的数据,估计出来的方程是
23638.250.14811.13 2.20706 0.113
sleep totwrk educ age n R =--+==^
, 如果有人一周多工作5个小时,预计sleep 会减少多少分钟?这是一个很大的舍弃吗?
(iv )讨论educ 的估计系数的符号和大小。

(v )你能说totwrk ,educ 和age 解释了sleep 的大部分变异吗?还有什么其他因素可能影响花在睡眠上的时间?它们与totwrk 可能相关吗?
答:(i )1β的符号应该为负。

(ii )2β的符号不明确。

一些人认为更高教育水平的人想获得更多,其他条件相同的情况下,他们休息的较少,此时20β<。

睡眠与年龄之间的关系比模型描述的更为复杂,经济学家不能很好的判断这件事情。

(iii )因为totwrk 都以分钟/周为单位,因此将时转化为分可得,560300totwrk ∆=⨯=。

预计睡眠将会下降
0.14830044.4⨯=(分)。

对一周而言,这并不是一个很大的舍弃。

(iv )受教育年限educ 越多暗示着预计睡眠时间越少,但是这种影响是很小的。

假设在其他条件不变的情况下,大学和高中的区别是四年间大学学生每周睡眠时间少休息45分钟。

(v )不能,totwrk 、educ 和age 只解释了11.3%的sleep 的变异。

一个包含在误差项中的重要因素是总体健康状况。

另一个重要因素是婚姻状况,以及是否有孩子。

健康、婚姻状况、孩子的数量和年龄与totwrk 是相关的。

5.考虑含有三个自变量的多元回归模型,并满足假定MLR.1~MLR.4,
0112233y x x x u ββββ=++++ 你对估计1x 和2x 的参数之和感兴趣;把这个和记为112θββ=+。

(i )证明112ˆˆˆθββ=+是1
θ的一个无偏估计量。

(ii )求出用()1ˆVar β、()2ˆVar β和()12ˆˆCorr ββ,表示的()
1ˆVar θ。

答:(i )()()()()11212121ˆˆˆˆˆE E E E θββββββθ=+=+=+=。

(ii )()
(
)
112
ˆˆˆVar Var θββ=+
6.在一项调查大学GPA 与在各种活动中折耗费时间之关系的研究中,你对几个学生分发了调查问卷。

学生被问到,他们每周在学习、睡觉、工作和闲暇这四种活动中各花多少小时。

任何活动都被列为这四种活动之一,所以对每个学生来说,这四个活动的小时数之和都是168。

(i )在模型
01111+++++GPA study sleep work leisure u βββββ=
中,保持sleep ,work 和leisure 不变而改变study 是否有意义?
(ii )解释为什么这个模型违背了假定MLR.3。

(iii )你如何才能将这个模型重新表述,使得它的参数具有一个有用的解释,而又不违背假定MLR.3。

答:(i )没有意义。

因为四种活动的总时间固定为168小时,其他三种不变,则study 时间也不会改变。

(ii )从(i )可知,study 是其他三种活动的线性函数:168study sleep work leisure =---。

这种关系对于每一个观测值都成立,因此违背了MLR.3。

(iii )应该去掉一个解释变量leisure ,模型变为:。

相关文档
最新文档