应用计量经济学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机误差项ε是回归方程中除已有解释变量X 之外,代表其他所有影响被解释变量Y 的因素。 期望(值):就是均值,是将X 各值的概率作为权数得到的所有可能值的加权平均数。
被解释变量的估计值(Y ^
i )与被解释变量的真值(Y i )之间的差称为残差(e i )。普通最小二乘法是一种计算参数估计值并使残差平方和最小的回归估计方法。 总离差平方和TSS=回归离差平方和ESS+残差平方和RSS
∑(Y i -Y —)2=∑(Y ^i -Y )2+∑e i 2
Y 与偏离它的均值的离差平方和的计算结果称为总离差平方和。
调整的判定系数R —
2是经自由度调整后的判定系数,它衡量了Y 与它的均值被特定回归方程解释的比例。
方程中新增一个变量时,只有拟合优度提高的程度超过自由度下降的损失,调整的判定系数R —
2才会增
大。所以,多数研究者在评价回归估计方程的拟合优度时,都自然地使用调整的判定系数R —2
。 应用回归分析中的6个步骤:
1)查阅文献,建立理论模型2)确定模型——选择解释变量和函数形式3)对参数的符号做出假设4)搜集、检查和整理数据5)估计和评价方程6)报告结果
虚拟变量是依据特定状态条件是否成立取值为1或0的变量。
古典假设:1.回归模型是线性的,模型设定无误且有误差项;2.误差项的总体均值为0;3.所有解释变量与误差项都不相关;4.误差项的观测值都不相关;5.误差项具有同方差;6.每一个解释变量都不是其他解释变量的完全线性函数;7.误差项服从正态分布。
如果β估计值抽样发布的期望值等于β的真实值,那么β就是一个无偏估计量。
BLUE :最优线性无偏估计量。它满足以下条件:这个估计量是随机变量,这个估计量的均值或者期望值E (a )等于真实值a ,且它在所有这样的线性无偏估计量一类中有最小方差。
原假设通常表示的是研究者不希望出现的结果,及不希望出现结果的数值范围,以符号“H0”表示。 备择假设通常表示是研究者希望出现的结果,及希望出现结果的数值范围,以符号“H1”表示。 第一类错误是当原假设为真时,拒绝了原假设。
显著性水平是估计总体参数落在某一区间内,可能犯错误的概率,用α表示。
判定规则是决定是否拒绝原假设的方法。一般情况下,它是通过比较样本统计量与预先设定的临界值之间的大小来判定。
临界值是在检验原假设是用来划分接受区域与拒绝区域的那个值。
t 统计量:用来对计量经济学模型中关于参数的单个假设进行检验的一种统计量。用参数估计值除以它的标准差估计值计算。
遗漏变量是指假设初次设定方程时没有考虑到某个相关解释变量,或者假设考虑到了某个变量却无法获得数据这两种情况中的变量。
设定误差指的是在建立回归模型中产生的误差。
四个设定准则:1.理论:变量在方程中的含义是不是模糊不清的,从理论上看是不是合理的。2.t 检验:变量的被估参数在预期假设下是否显著。3.调整判定系数:变量加入后,方程的整体拟合优度是否得到改善。4.骗误:变量加入方程后,其他变量参数值是否发生显著改变。
在反函数形式中,被解释变量Y 是用包含一个或多个解释变量的倒数(或反函数)形式的函数来表示的。
交叉项是回归方程中的一个解释变量,这个解释变量是由方程中两个或两个以上的其他解释变量相乘得到的。
第二章
2.假设估计一个回归方程,大量的太阳黑子造成磁场干扰,从已知数据(10个发达国家中,人均收入(单位:1000美元)是农业中劳动力所占比例的函数) X —
=7.1,Y —
=8.4 a. β^
1=∑N
[(X i -X —
)(Y i -Y —)]/ ∑N (X i -X —
)2=-0.5477 β^
0=Y —-β^1X —
=8.4+0.5477*7.1=12.289 b.R 2
=ESS/TSS=1-(e i
2
/TSS )=0.465 R —
2
=1-[∑e i
2/(N-K-1)]/[∑(Y i -Y —
)2
/(N-1)]=0.398 c.收入=12.289-0.5477*8=7.907
3、人均收入是Y ,农业劳动力比例为X 。
Y 6 8 8 7 7 12 9 8 9 10 X 9 10 8 7 10 4 5 5 6 7 3X 27 30 24 21 30 12 15 15 18 21 X+Y
15
18
16
14
17
16
14
13
15
17
a.∑X =71
b.∑Y =84
c.∑3X =213=3∑X
d.∑(X+Y) =155=∑X+∑Y 第三章
2.a.如果学生是研究生,则D=1,如果是本科生,则D=0. b.是的;比如,E=学生所做联系数量。
c.预期D 的参数的符号为正。如果,D 按相反的形式所设定,则预期D 的参数的符号为负。这个预期符号和D 的定义相关。
d.参数估计为0.5,这表明:当方程中其他变量保持不变时,预期研究生获得的学分比本科生多0.5.如果班里只有研究生或者只有本科生,D 的参数是不能估计的。 3.a.当其他变量没有变化时,若第i 个教授是男性时,会比女教授多赚817元。 b.不一致。因为在英国的文化中存在种族歧视,非裔美国人要比其他民族成员工资低。 c.R 不是虚拟变量,是解释变量,虚拟变量只能是0或1。教授的级别分为好几级,具体可分为助理教授、副教授和正教授等。当教授级别上升一级,教授的薪水会多增加406美元。
d.文科学院中经济学家的薪水会比较高。因为在方程中其他条件不变的情况下,T i 变量的符号为正,所以当第i 位教授是经济学类,则该教授的薪水会比较高。 老师是否有发表的科研项目,发表科研项目越多,薪水也会随之增加。(教龄、发表的论文)
5.a.新变量参数的预期符号是正号。因为交通拥挤代表经过当地的车流量增加潜在的消费者数量增加,顾客数量也会得到增加。
b.更喜欢这个方程,因为可调整相关系数从0.579上升到0.617,所以这个方程更符合实际情况。
c.不是。因为方程(3-7)更符合实际情况,所以它比方程(3-5)更好,并不是因为调整的判定系数更高。而方程(3-7)的调整的判定系数更高是因为该方程比方程(3-5)增加了一个相关的解释变量。 第四章
2.a.在降雨量不变的前期下,对每英亩土地多施1英磅的肥料,将会导致产量增加0.10蒲式耳。在每英亩土地施肥量不变的前期下,降雨量没增加1英寸,将会导致每英亩产量增加5.33蒲式耳。
b.否,原因有很多。首先,一整年的降雨量都是零是难以想象的,所以这个特殊的截距项没有现实意义。更一般地,回想一下,为了满足古典假设2,截距项的普通最小二乘估计量包含了误差项的非零均值,所以,即使降雨量为零,尝试分析截距项的普通最
小二乘估计量也是没有意义的。
c.否。一个无偏的估计量使得估计值的分布是以真实β值为中心的,但是个别估计值可以偏离真实值而变化。参数估计值是0.10,这是对本习题中样本而言,而不是对整个总体而言,所以它仍可能是一个无偏的估计值。
d.不一定:5.33依然可能接近甚至等于真实值。更一般地,一个非BLUE 性质的估计量产生的参数估计值仍然有可能是精确的。比如,偏误的总量可能很小,或者抽样的误差能够消除这种偏误。
3.A 与C 不满足古典假设⑥,B 和D 满足古典假设⑥。
4.a.一个富有经验的计量经济学者更愿意选择一个具有无偏性而没有最小的方差性的估计。因为具有无偏性而没有最小的方差性的估计要比具有有偏性而具有最小方差的估计量更接近总体参数的真实值。
b.是的。一个具有极大方差的无偏估计量很有可能偏离其真实值。在这种情况下,一个具有少许偏离,但有极小方差的有偏估计值将会更好。
c.利用最小化均方误(MSE)。均方误是等于期望方差加上期望偏差的平方。
5.a.古典假设 误差项总体均值为0说明了不用花费太多时间去分析常数项的估计值。ε的均值可能不等于0,而常数项的存在正好能弥补,它可以迫使各回归模型中εi 的均值为0.实际上常数项是Y 中不能由解释变量所解释的固定部分,而误差项为不能被解释的随机部分。
b.违背古典假设⑥中的多重共线性,任何一个解释变量都不是其他解释变量的完全线性函数。该虚拟变量与方程中M t 变量是相同的变量,或者当M t 变化时,该虚拟变量也会变化。
c.R 代表:在其他变量不变的情况下,当第t-1日的资本收益的日指数每增加1个单位,则第t 日的道琼斯工业股票平均指数就会增加0.10个百分比变动。
M 代表:在其他变量不变的情况下,当t 日是星期一时,则第t 日的道琼斯工业股票平均指数就会减少0.017个百分比变动。当t 日不是星期一时,则第t 日的道琼斯工业股票平均指数不会有影响。
d.不是虚拟变量。作者根据同样云量划分为同一天气类型来衡量天气,所以阴天和雨天对于作者而言是一样的。
e.不同意。作者只用华尔街天气来检验华尔街股票市场,太过局限。因为股票市场交易变动是全世界经济变动影响的。 第六章
3.冠心病 Y=140+10.0C (2.5)+
4.0E (1.0)-1.0M (0.5)t=4 4 -2 a. 参数 β C
βE ΒM 假设符号 + + + t 值
4.0 4.0 -2.0 t c =1.314(在27自由度下进行10%单侧检验) 拒绝
拒绝
不拒绝
参数M 不满足预期估计,可能存在遗漏变量
b.M 参数的符号是负的,这不符合预期结果。它可能是因为遗漏了一个具有负的预期的变量。我们需要找到一个遗漏变量,如果它与肉类消费正相关那么它本身预期符号为负,或者它与肉类消费负相关那么它本身预期符号为正。所以: 可能遗漏变量 β的预期符号 M 的相关性 倾向趋势 B + +* + F + + + W +* + + R - - + H - + - O
-
-
+
*代表弱预期或弱相关
c.在以上变量中,唯一一个可能使参数M 偏离预期的是H 变量,而且这个变量是心脏健康护理质量综合水平的明显遗漏。所以,我们选择添加它。 4、a. 系数 E β
I β
T β
V β
R β
假设的符号 - + - - - 计算的t 值
-3.0 1.0 -1.0 -3.0 3.0
682.1=c t
显著
不显著
不显著
显著
显著但未预期符号
B.无论从t 值的大小判断还是从理论上判断,收入和税收都是潜在的不相关变量。βR
的一个显著的未预期到的符号清楚的表明,有潜在的遗漏变量。
C.在考虑由于遗漏变量造成的偏误的不相关变量之前,尝试解决遗漏变量偏误的问题必须谨慎。
D.方程似乎表明电视广告是有效的而收音机广告没有,但是你不能马上得出这个结论。改进模型设定可以改变这个结果,特别的,尽管收音机广告有可能对吸烟没有影响,但是很难让人相信一个收音机的反吸烟运动可以引起香烟消费的显著的增加。
E.理论:给出了公正的香烟的需求价格弹性,可能T 是不相关的。
t 检验βT :是可以拒绝原假设H 0
R —2: R —
2保持不变,这恰当是当一个t 值得绝对值大于1的变量从方程中移除(或加入)时出现的情况。
其他系数的变化:当排除T 的时候,其他的估计系数都没有明显变化,表明排除T 不会造成偏误。
结论:给予四大准则,可以合理地推断T 是一个不相关变量。