多元回归分析:其他问题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第6章 多元回归分析:其他问题
习题
6.1 利用CEOSAL1.RA W 中的数据估计了如下方程
200008.00215.0)l o g (276.0322.4)ˆlog(roe roe sales ary l sa -++=
(0.324) (0.033) (0.0129) (0.00026) n =209, R 2=0.282,
这个方程使得roe 对log(salary )具有边际递减的影响。
这样概括“边际递减”是必然的吗?解释为什么是或为什么不是。
6.2 令k βββˆ,,ˆ,ˆ10 为y i 对ik
i x x ,,1 回归(i =1,2,⋯,n )的OLS 估计值。
对于非零常数k c c ,,1 ,证明c 0y i 对ik k i x c x c ,,11 回归(i =1,2,⋯,n )的OLS 截距和斜率由k k k c c c c c ββββββˆ)/(~,,ˆ)/(~,ˆ~01101000=== 给出。
[提示:由于j
βˆ是(3.13)中一阶条件的解,从而j β~
也必将是因变量和自变量重新测度后的一阶条件的解。
]
6.3使用RDCHEM.RA W 中的数据,通过OLS 得到如下方程 2
0000000070.000030.0613.2t n ˆi s a l e s
s a l e s ens rd -+= (0.429) (0.00014) (0.0000000037)
n =32, R 2=0.1484,
(i) sales 对rdintens 的边际影响在什么时候开始变成负的?
(ii)
你会在模型中保留二次项吗?请解释。
(iii) 定义sales 为以十亿美元计的销售额:salesbil= sales/1000。
用salesbil 和salesbil 2
作为自变量重写估计方程。
务必报告标准误和R 平方。
[提示:注意salesbil 2= sales 2/(1000) 2。
]
(iv) 为了报告结果,你喜欢哪个方程?
6.4 如下模型使得受教育的回报还取决于父母双方受教育程度的总和pareduc : .e x p )l o g (43210u t e n u r e er pareduc educ educ wage
+++⋅++=βββββ (i) (以小数形式)证明此模型中多受一年教育的回报为
./)l o g (21p a r e d u
c e
d u c w a g
e ββ+=∆∆ 你预期2β的符号是什么?为什么?
(ii) 利用W AGE2.RA W 中的数据,所估计的方程是
p a r e d u
c e
d u c
e d u c a g e w ⋅++=00078.0047.065.5)ˆlog( (0.13) (0.010) (0.00021)
t e n u r e
er 010.0exp 019.0++
(0.004) (0.003)
n =722, R 2
=0.169.
(只有722个观测包含了父母受教育的全部信息。
)解释交互项的系数。
选择
pareduc 的两个特殊值(比如,如果父母双方都受过大学教育,则pareduc =32,
或父母都只受过高中教育,则pareduc =24),比较educ 的估计回报。
(iii) 如果在方程中另增加一个变量pareduc ,则得到 p a r e d u
c e
d u c ag
e w 033.0097.094.4)ˆlog(-+= (0.38) (0.027) (0.017)
p a r e d u c e d u c ⋅-0016.0t e n u r
e er 010.0exp 020.0++ (0.0012) (0.004) (0.003)
n =722, R 2
=0.174.
现在,教育的估计回报正向地取决于父母的受教育水平吗?检验虚拟假设:教
育的回报与父母的受教育水平无关。
6.5 在例4.2中,因变量是学生通过十年级数学考试(math10)的百分比,将sci11(11年级学生通过科学考试的百分比)作为另一个解释变量讲得通吗?
6.6 当我们把atndrte 2和ACT ⋅atndrte 都增加到(6.19)中的估计方程时,R 平方就变成0.232。
这些添加项在10%的显著性水平上是联合显著的吗?你会将它们包括在模型中吗?
6.7 如下三个方程是使用401K.RA W 中的1534个观测估计出来的: t o t e m p
a g e m r a t e te a pr 00013.0269.044.529.80ˆ-++= (0.78) (0.52) (0.045) (0.00004)
R 2
=0.100, 2R =0.098. )log(66.2314.002.532.97ˆtotemp age mrate te a
pr -++= (1.95) (0.51) (0.044) (0.28)
R 2=0.144, 2R =0.142.
20000000039.000043.0290.034.562.80ˆtotemp totemp age mrate te a pr +-++= (0.78) (0.52) (0.045) (0.00009) (0.00000000010)
R 2
=0.108, 2R =0.106.
你更喜欢这三个模型中的哪一个?为什么?
计算机习题
6.8 仅使用HPRICE3.RA W 中1981年的数据,回答如下问题。
数据是1981年间在麻省North Andover 售出住房的数据;1981年是开始建造地方垃圾焚化炉的一年。
(i) 为了研究垃圾焚化炉的位置对住房价格的影响,考虑简单回归模型
,)l o g ()l o g (10u d i s t p r i c e ++=ββ
其中price 为住房的美元价格,dist 为从住房到焚化炉的距离,以英尺为单位。
谨慎地解释这个方程,如果焚化炉的出现会使住房价格下降,你预期1β的符号
是什么?估计这个方程,并解释你的结论。
(ii) 在第(i)部分的简单回归模型中增加变量log(inst )、log(area )、log(land )、rooms 、
baths 和age ,其中inst 表示从家到高速州际公路的距离,area 表示住房的平方英尺数,land 表示客厅的平方英尺数,rooms 表示总的房间数,baths 表示总的卫生间数,age 表示住房的年数。
现在,你对焚化炉的影响有什么结论?解释为什么第(i)部分和第(ii)部分给出相互矛盾的结论。
(iii)
向第(ii)部分的模型中添加[log(inst )] 2,结果会怎么样?你对函数形式的重要性有什么结论。
(iv) 当你向第(iii)部分的模型中添加[log(dist )] 2时,它会显著吗?
6.9 本题利用W AGE1.RA W 中的数据。
(i) 使用OLS 估计方程
u er er educ wage ++++=
23210exp exp )log(ββββ 并用通常的格式报告你的结论。
(ii)
exper 2在1%的显著性水平上是统计显著的吗? (iii) 使用近似
∆+≈∆)e x p ˆ2ˆ(100ˆ%3
2er ge a w ββexper , 求第5年工作经历的近似回报。
第20年工作经历的近似回报是多少?
(iv) exper 取什么值时,工作经历的增加实际上会降低预期的)log(wage 。
样本中有
多少人具有比这个取值更长的工作经历?
6.10 考虑一个教育回报取决于工作经历量(反之亦然)的模型:
.e x p e x p )l o g (3210u er educ er educ wage
+⋅+++=ββββ (i)
证明:保持exper 不变,多受一年教育的回报(以小数表示)是1β+3βexper 。
(ii)
陈述如下虚拟假设:教育的回报并不取决于exper 的水平。
你认为合适的对立假设是什么? (iii)
利用WAGE2.RAW 中的数据,相对你给出的对立假设来检验(ii)中的虚拟假设。
(iv) 令θ1表示exper =10时(以小数表示)的教育回报:θ1=1β+103β。
求出θ1的估计
值和一个95%的置信区间。
(提示:写成1β=θ1-103β并代入方程;然后重新整理。
这就给出了得到θ1的置信区间所需做的回归。
)
6.11本题利用GPA2.RA W 中的数据。
(i) 估计模型
,2210u h s i z e h s i z e s a t +++=βββ
其中hsize 为毕业年级的规模(以百为单位),按通常的形式写出结论。
二次项是统计显著的吗?
(ii)
利用第(i)部分的估计方程,高中学校的“最优”规模是什么?说明你的答案。
(iii)
这个分析是所有高中高年级学生学术成绩的代表吗?请解释。
(iv) 用log(sat )作为因变量,求出估计的高中最优规模。
它与你在第(ii)部分所得到
的结论很不同吗?
6.12本题利用HPRICE1.RA W 中的数据。
(i) 估计模型
u b d r m s s q r f t l o t s i z e p r i c e ++++=3210)l o g ()l o g ()l o g (ββββ 并以通常的OLS 格式报告结论。
(ii) 当lotsize =20000,sqrft =2500和bdrms =4时,求出log(price )的预测值。
利用第6.4节中的方法,在同样的解释变量值的情况下,求出price 的预测值。
(iii) 就解释price 中的变异而言,决定你是喜欢第(i)部分的模型,还是喜欢模型 .3210u b d r m s s q r f t l o t s i z e p r i c e ++++=ββββ
6.13本题利用VOTE1.RA W 中的数据。
(i) 考虑一个含有竞选支出交互项的模型
.e x p e x p e x p e x p 43210u e n d B e n d A e n d B e n d A p r t y s t r A v o t e A +⋅++++=βββββ
保持prtystrA 和expendA 不变,expendB 对voteA 的偏效应是什么?expendA 对
voteA 的偏效应是什么?4β的预期符号明显吗?
(ii)
估计第(i)部分中的方程,并以通常的格式报告结果。
交互项是统计显著的吗? (iii)
求样本中expendA 的均值。
固定expendA 为300(300000美元)。
候选人B 另外支出100000美元对voteA 的估计影响是什么?这个影响很大吗? (iv)
现在固定expendB 为100。
∆expendA =100对voteA 的估计影响是什么?这讲得通吗? (v)
现在估计一个用候选人A 的支出占竞选总支出的百分比shareA 取代交互作用项的模型。
同时保持expendA 和expendB 不变而改变shareA ,这讲得通吗? (vi) (要求有微积分知识)在第(v)部分的模型中,保持prtystrA 和expendA 不变,
求出expendB 对voteA 的偏效应。
在expendA =300和expendB =0时进行计算,并评论你的结论。
6.14本题利用A TTEND.RA W 中的数据。
(i) 在例6.3的模型中,推出
.2/
642a t n d r t e p r i G P A p r i G P A s t n d f n l βββ++≈∆∆ 当priGPA =2.59和atndrte =0.82时,利用方程(6.19)来估计偏效应。
对你的估计进行解释。
(ii) 说明可将方程写成
,
)82.0()59.2(625243210u atndrte priGPA ACT priGPA ACT priGPA atndrte stndfnl +-++-+
+++=ββββθβθ 其中)82.0()59.2(26422βββθ++=。
(注意,截距已发生变化,但并不重要。
)
用它求出第(i)部分得到的2
ˆθ的标准误。
6.15本题利用HPRICE1.RA W 中的数据。
(i) 估计模型
u b d r m s s q r f t l o t s i z e p r i c e ++++=3210ββββ
并按通常的形式报告你的结果,包括回归的标准误。
当我们代入lotsize =10000,sqrft =2300和bdrms =4时,求出预测价格;将这个价格四舍五入到美元。
(ii)
做一个回归,使你能得到第(i)部分中预测值的一个95%的置信区间。
注意,由于四舍五入的误差,你的预测多少有些不同。
(iii)
令price 0为具有第(i)部分和第(ii)部分所述特征的住房的、未知的、未来售价。
求出price 0的一个95%的置信区间,并对这个置信区间的宽度进行评论。