计量经济学练习及答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 综合练习
一、基础问答题
3-1.观察下列方程并判断其变量是否呈线性?系数是否呈线性?或都是?或都不是?
1) i i i X Y εββ++=310
2) i i i X Y εββ++=log 10
3) i i i X Y εββ++=log log 10 4) i i i X Y εβββ++=)(210
5)
i i
i X Y εββ+=10
6)
i i i X Y εββ+-+=)1(11
7) i i i i
X X Y εβββ+++=1022110
答:变量非线性、系数线性;变量、系数均线性;变量、系数均线性;变量线性、系数非线性;变量、系数均为非线性;变量、系数均为非线性;变量、系数均为线性。
3-2.为什么说最小二乘估计量是最优的线性无偏估计量?多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计的条件是什么?
答:在多元线性回归模型中,参数的最小二乘估计量具备线性、无偏性、最小方差性,同时多元线性回归模型满足经典假定,所以此时的最小二乘估计量是最优的线性无偏估计量,又称BLUE 估计量。
对于多元线性回归最小二乘估计的正规方程组,要使得参数估计值存在,必须使X ’X 满秩。
3-3.多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用?
答:多元线性回归模型的基本假定有:零均值假定、随机项独立同方差假定、解释变量的非随机性假定、解释变量之间不存在线性相关关系假定、随机误差项i u 服从均值为0方差为2σ的正态分布假定。
在证明最小二乘估计量的无偏性中,利用了解释变量与随机误差项不相关的假定;在有效性的证明中,利用了随机项 独立同方差假定。
三、简单运用与分析计算
3-5.假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。
你通过整个学年收集数据,得到两个可能的解释性方程:
方程A :3215.10.10.150.125ˆX X X Y
+--= 75.02=R
方程B :4217.35.50.140.123ˆX X X Y
-+-= 73.02=R
其中:Y ——某天慢跑者的人数
1X ——该天降雨的英寸数 2X ——该天日照的小时数
3X ——该天的最高温度(按华氏温度) 4X ——第二天需交学期论文的班级数
请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?
⑴方程B 更合理些。
原因是:方程B 中的参数估计值的符号与现实更接近些,如与日照的小时数同向变化,天长则慢跑的人会多些;与第二天需交学期论文的班级数成反向变化,这一点在学校的跑道模型中是一个合理的解释变量。
⑵解释变量的系数表明该变量的单位变化在方程中其他解释变量不变的条件下对被解释变量的影响,在方程A 和方程B 中由于选择了不同的解释变量,如方程A 选择的是“该天的最高温度”而方程B 选择的是“第二天需交学期论文的班级数”,由此造成2X 与这两个变量之间的关系不同,所以用相同的数据估计相同的变量得到不同的符号。
3-6.对下列模型:
i i i i u z x y +++=2βα (1)
i i i i u z x y +-+=ββα(2)
求出β的最小二乘估计值;并将结果与下面的三变量回归方程的最小二乘估计值作比较:(3)i i i i u z x y +-+=γβα ,你认为哪一个估计值
更好?
将模型⑴改写成i i i i u x z y ++=-βα)2(,则β的估计值为:
∑∑---=2
)
()2)((ˆx x z y x x i
i i
i
β
将模型⑵改写成i i i i u z x y +-+=)(βα,则β的估计值为:
∑∑+--+--=2
)
()(ˆz x z x y
z x z x i
i
i
i
i
β
这两个模型都是三变量回归模型⑶在某种限制条件下的变形。
如果限制条件正确,则前两个回归参数会更有效;如果限制条件不正确则前两个回归参数会有偏。
3-9.假定以校园内食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析;假设不管是否有假期,食堂都营业。
不幸的是,食堂内的计算机被一次病毒侵犯,所有的存储丢失,无法恢复,你不能说出独立变量分别代表着哪一项!下面是回归结果(括号内为标准差):
i i i i i X X X X Y
43219.561.07.124.286.10ˆ-+++= (2.6)(6.3)(0.61) (5.9) 63.02
=R 35=n
要求:
(1)试判定每项结果对应着哪一个变量? (2)对你的判定结论做出说明。
答:⑴答案并不唯一,猜测为:1X 为学生数量,2X 为附近餐厅的盒饭价格,3X 为气温,4X 为校园内食堂的盒饭价格;
⑵理由是被解释变量应与学生数量成正比,并且应该影响显著;与本食堂盒饭价格成反比,这与需求理论相吻合;与附近餐厅的盒饭价格成正比,因为彼此是替代品;与气温的变化关系不是十分显著,因为大多数学生不会因为气温升高不吃饭。
3-10.考虑以下预测的回归方程:
t t t RS F Y
33.510.0120ˆ++-= 50.02=R 其中:t Y ——第t 年的玉米产量(蒲式耳/亩)
t F ——第t 年的施肥强度(磅/亩)
t RS ——第t 年的降雨量(英寸) 要求回答下列问题:
(1)从F 和RS 对Y 的影响方面,说出本方程中系数10.0和33.5的含义; (2)常数项120-是否意味着玉米的负产量可能存在? (3)假定F β的真实值为40.0,则估计值是否有偏?为什么?
(4)假定该方程并不满足所有的古典模型假设,即并不是最佳线性无偏估计值,则是否意味着RS β的真实值绝对不等于33.5?为什么?
.解:⑴在降雨量不变时,每亩增加一磅肥料将使第t 年的玉米产量增加0.1蒲式耳/亩;在每亩施肥量不变的情况下,每增加一英寸的降雨量将使第t 年的玉米产量增加5.33蒲式耳/亩;
⑵在种地的一年中不施肥、也不下雨的现象同时发生的可能性极小,所以玉米的负产量不可能存在;
⑶如果F β的真实值为0.40,并不能说明0.1是有偏的估计,理由是0.1是本题估计的参数,而0.40是从总体得到的系数的均值。
⑷不一定。
即便该方程并不满足所有的古典模型假设、不是最佳线性无偏估计值,也有可能得出的估计系数等于5.33。
3-11、在经典线性模型基本假定下,对含有三个自变量的多元回归模型:
μββββ++++=3322110X X X Y
你想检验的虚拟假设是H0:1221
=-ββ。
(1)用21ˆ,ˆββ的方差及其协方差求出)ˆ2ˆ(21ββ-Var 。
(2)写出检验H0:1221=-ββ的t 统计量。
(3)如果定义θββ=-212,写出一个涉及β0、θ、β2和β3的回归方程,以便能直接得到θ估计值θˆ及其标准误。
(1)由数理统计学知识易知
)ˆ(4)ˆ,ˆ(4)ˆ()ˆ2ˆ(2
21121ββββββVar Cov Var Var +-=- (2)由数理统计学知识易知
)
ˆ2ˆ(1ˆ2ˆ2121ββββ---=se t ,其中)ˆ2ˆ(21ββ-se 为)ˆ2ˆ(21ββ-的标准差。
(3)由θββ=-212知212βθβ+=,代入原模型得
μ
ββθβμβββθβ+++++=+++++=33212103322120)2()2(X X X X X X X Y
这就是所需的模型,其中θ估计值θˆ及其标准误都能通过对该模型进行估计得到。
3-12.已知线性回归模型U X Y +=B 式中~U (0,I 2σ),13=n 且3=k (n 为样本容量,k 为参数的个数),由二次型)()'(B B X Y X Y --的最小化得到如下线性方程组:
3ˆˆ2ˆ3
21=++βββ 9ˆˆ5ˆ23
21=++βββ 8ˆ6ˆˆ3
21-=++βββ 要求:(1)把问题写成矩阵向量的形式;用求逆矩阵的方法求解之;
(2)如果53='Y Y ,求2ˆσ
; (3)求出β
ˆ的方差—协方差矩阵。
解:
⑴该方程组的矩阵向量形式为:
⎥⎥
⎥⎦⎤⎢
⎢⎢⎣⎡-=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡893ˆˆˆ61
1
152121
321
βββ ⎥
⎥⎥⎦⎤⎢⎢⎢⎣⎡-=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦
⎤⎢⎢⎢⎣⎡-213893611152121ˆˆˆ1
321βββ ⑵因为上述方程组即为正规方程组,即
[]
8
9
3
)''('ˆ)'(-==Y X Y X B X X 所以
所以(B
X Y Y Y e e ˆ'''-=)
9.13
138
2913353'ˆ2=-⨯-⨯-⨯-=-=
k n e e σ
⑶
的方差—协方差矩阵为:
⎥⎥
⎥⎦
⎤
⎢⎢⎢⎣⎡----=⎥⎥
⎥⎦
⎤
⎢⎢⎢⎣⎡=X X '=---619.0225.0675.0225.0125.1475.2675.0475.2525.66111521219.1)(ˆ)ˆ(1
12σβ
Cov V 3-13 某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归
方程fedu medu sibs edu 210.0131.0094
.036.10++-= R 2=0.214式中,edu 为劳动力受教育年数,sibs 为该劳动力家庭中兄弟姐妹的个数,medu 与fedu 分别为母亲与父亲受到教育的年数。
问(1)sibs 是否具有预期的影响?为什么?若medu 与fedu 保持不变,为了使预测的受教育水平减少一年,需要sibs 增加多少?(2)请对medu 的系数给予适当的解释。
(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少? 3-14.以企业研发支出(R&D )占销售额的比重为被解释变量(Y ),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:
099
.0)046.0()
22.0()
37.1(05.0)log(32.0472.022
1=++=R X X Y
其中括号中为系数估计值的标准差。
(1)解释log(X1)的系数。
如果X1增加10%,估计Y 会变化多少个百分点?这在经济上是一个很大的影响吗?
(2)针对R&D 强度随销售额的增加而提高这一备择假设,检验它不虽X1而变化的假设。
分别在5%和10%的显著性水平上进行这个检验。
(3)利润占销售额的比重X2对R&D 强度Y 是否在统计上有显著的影响? (在5%的显著性水平下,自由度位29 时,t 分布的临界值为1.699。
在10%的显著性水平下,t 分布的临界值为1.311)
(1)预期sibs 对劳动者受教育的年数有影响。
因此在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短。
根据多元回归模型偏回归系数的含义,sibs 前的参数估计值-0.094表明,在其他条件不变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育的时间,兄弟姐妹需增加1/0.094=10.6个。
(2)medu 的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1
年受教育的机会,其子女作为劳动者就会预期增加0.131年的教育机会。
(3)首先计算两人受教育的年数分别为
10.36+0.131⨯12+0.210⨯12=14.452 10.36+0.131⨯16+0.210⨯16=15.816
因此,两人的受教育年限的差别为15.816-14.452=1.364
3-13(1)log(x1)的系数表明在其他条件不变时,log(x1)变化1个单位,Y 变化的单位数,即∆Y=0.32∆log(X1)≈0.32(∆X1/X1)=0.32⨯100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y 会增加0.32。
由此,如果X1增加10%,Y 会增加0.032,3.2个百分点。
这在经济上不是一个较大的影响。
(2)针对备择假设H1:01>β,检验原假设H0:01=β。
易知计算的t 统计量的值为t=0.32/0.22=1.468。
在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为1.699(单侧),计算的t 值小于该临界值,所以不拒绝原假设。
意味着R&D 强度不随销售额的增加而变化。
在10%的显著性水平下,t 分布的临界值为1.311,计算的t 值小于该值,拒绝原假设,意味着R&D 强度随销售额的增加而增加。
(3)对X2,参数估计值的t 统计值为0.05/0.46=1.087,它比在10%的显著性水平下的临界值还小,因此可以认为它对Y 在统计上没有显著的影响。
第四章 综合练习(2009/11/3)
一、选择题(下列个题中,有多选,有单选) 1、容易产生异方差的数据是( C )
A 、时间序列数据
B 、虚变量数据
C 、横截面数据
D 、年度数据 2、下列哪种方法不能用来检验异方差( D )
A 、G-Q 检验
B 、White 检验
C 、Gleiser 检验
D 、D-W 检验
3、如果回归模型中的随机误差项存在异方差,则模型参数的普通最小二乘估计量是( B ) A 、无偏、有效 B 、无偏、非有效 C 、有偏、有效 D 、有偏、非有效
4、假设回归模型为Y i =β0+β1x i +u i,其中var(u i )=σ2 x i 2,则使用加权最小二乘法估计模型时,应将模型变换成( C ) A 、
X
u X X
X
Y +
+=
10
ββ B 、
X
u X
X
Y +
+=
10
ββ
C 、
X u X X Y ++=10ββ D 、XX
u
X XX XX Y ++=110ββ
5、对于模型Y i=βˆ0+βˆ1x i+e i,以ρ表示e i与e i-1之间的线性相关系数,则下面明显错误的是( B )
A、ρ=0.8,D.W=0.4
B、ρ=-0.8,D.W=-0.4
C、ρ=0,D.W=2
D、ρ=1,D.W=0
6、对于二元单方程经济模型,与两解释变量间相关系数为0相比,若它们间相关系数等于
0.15时,参数的估计量的方差将是原来的(B )
A、1倍
B、1.023倍
C、1.96倍
D、2倍
7、哪种情况下,模型Y i=β0+β1x i+u i,的普通最小二乘估计量既不具备无偏性,也不具备一致性( D )
A、x i为非随机变量
B、x i为非随机变量,与u i,不相关
C、x i为随机变量,但与u i,不相关
D、x i为随机变量,与u i相关
8、在工具变量的选取中,下面哪一个条件不是必须的( D )
A、与所替代的随机解释变量高度相关
B、与随机干扰项不相关
C、与模型中其他解释变量不相关
D、与被解释变量存在因果关系
9、下列可能导致模型产生序列相关的因素有(ABCD )
A、模型形式设定偏误
B、经济序列本身的惯性
C、,模型中漏了重要的带有自相关性的解释变量
D、数据的编造
10、当模型出现序列相关时,对参数估计量的影响包括(ABC )
A、非有效
B、显著性检验失去意义
C、模型预测失效
D、方差被低估
11、当模型出现多重共线性时(AC )
A、各解释变量对被解释变量的影响将难于精确鉴别
B、部分解释变量与随机误差项之间将高度相关
C、估计量的精确程度大幅下降
D、模型的随机误差项也将序列相关
12、关于D.W检验下列说法正确的是(ABCD )
A、只适用于一阶子回归形式的序列相关检验,且样本要足够大
B 、当D.W 接近4时,相关系数接近1
C 、当D.W 统计值落在[Dl,Du]或[4-Du,4-Dl]上时,无法确定是否存在序列相关
D 、D.W 统计量的取值区间是[0,4]
二、简单与分析题
1、在如下回归中,你是否预期存在着异方差?
2、已知模型i i i i u X X Y +++=22110βββ式中,i Y 为某公司在第i 个地区的销售额;i X 1为该地区的总收入;i X 2为该公司在该地区投入的广告费用(i=0,1,2……,50)。
(1)由于不同地区人口规模i P 可能影响着该公司在该地区的销售,因此有理由怀疑随机误差项u i 是异方差的。
假设i σ依赖于总体i P 的容量,请逐步描述你如何对此进行检验。
需说明:1)零假设和备择假设;2)要进行的回归;3)要计算的检验统计值及它的分布(包括自由度);4)接受或拒绝零假设的标准。
(2)假设i i P σσ=。
逐步描述如何求得BLUE 并给出理论依据。
(1)如果i σ依赖于总体i P 的容量,则随机扰动项的方差2
i σ依赖于2
i P 。
因此,要进
行的回归的一种形式为i i i P εαασ++=2102。
于是,要检验的零假设H0:10α=,备择
假设H1:01≠α。
检验步骤如下:
第一步:使用OLS 方法估计模型,并保存残差平方项2
~i
e ; 第二步:做2
~i e 对常数项C 和2
i
P 的回归
第三步:考察估计的参数1α的t 统计量,它在零假设下服从自由度为2的t 分布。
第四步:给定显著性水平面0.05(或其他),查相应的自由度为2的t 分布的临界值,
如果估计的参数1ˆα
的t 统计值大于该临界值,则拒绝同方差的零假设。
(2)假设i i P σσ=时,模型除以i P 有:
i
i i i i i i i i P u P X P X P P Y +++=221101
βββ 由于2
22/)/(σσ==i i i i P P u Var ,
所以在该变换模型中可以使用OLS 方法,得出BLUE 估计值。
方法是对i i P Y /关于i P /1、i i P X /1、i i P X /2做回归,不包括常数项。
3、已知消费模型:t t t t u x x y +++=22110ααα 其中:t y ——消费支出
t x 1——个人可支配收入 t x 2——消费者的流动资产 0)(=t u E
为常数)
其中2
212()(σσt t ar x u V = 要求:进行适当变换消除异方差,并证明。
⑴模型两边同时除以t x 1进行变换,得:
t
t t t t t t x u
x x x x y 11221101+++=ααα t t
t t
x x x
υααα+⎪⎪⎭
⎫
⎝⎛++⎪⎪⎭⎫ ⎝⎛=1221101 其中:t t t x u 1=
υ,可以证明误差项t
t t x u
1=υ是同方差的。
证明如下:
已知:t t t x u 1=υ,2122t t t x u =υ,22212122122)()()()(σσσυ====E x x E x u E E t
t t t t (根据已知条件2σ为常数)
,证得变换后的误差项是同方差的。
4、在研究生产中的劳动在增加值中所占的份额(即劳动份额)的变动时,有以下模型: 模型A :t t u t Y ++=10ββ
模型B :t t u t t Y +++=2210ααα
其中,Y 为劳动份额,t 为劳动时间。
根据该研究时期内的15年数据进行参数估计,得到模型结果为:
模型A :t Y t 0041.04528.0-=∧
5284.02=R 8252.0..=W D )9608.3(-
模型B :20005.00127.04786.0t t Y t +-=∧
)2724.3(- )7777.2(
6629.02=R 82.1..=W D
其中:括号中的数字是t 检验值。
要求:(1)模型A 中有没有自相关?模型B 呢?
(2)如何解释自相关的存在?
5、以某地区22年的年度数据估计了如下工业就业回归方程
3
21ln 62.0ln 25.0ln 51.089.3ˆX X X Y +-+-= (-0.56)(2.3) (-1.7) (5.8)
20.996R = 147.1=DW
式中,Y 为总就业量;X1为总收入;X2为平均月工资率;X3为地方政府的总支出。
(1)试证明:一阶自相关的DW 检验是无定论的。
(2)逐步描述如何使用LM 检验
(1)由于样本容量n=22,解释变量个数为k=3,在5%在显著性水平下,相应的上下临界值为D(22,4),664.1=U d 、053.1=L d 。
由于DW=1.147位于这两个值之间,所以DW 检验是无定论的。
(2)进行LM 检验:
第一步,做Y 关于常数项、lnX1、lnX2和lnX3的回归并保存残差t
e ~; 第二步,做t
e ~关于常数项、lnX1、lnX2和lnX3和1~-t e 的回归并计算2R ; 第三步,计算检验统计值(n-1)2R =21⨯0.996=20.916;
第四步,由于在不存在一阶序列相关的零假设下(n-1)2R 呈自由度为1的2χ分布。
在5%的显著性水平下,该分布的相应临界值为3.841。
由于20.916>3.841,因此拒绝零假设,意味着原模型随机扰动项存在一阶序列相关。
6、某地区供水部门利用最近15年的用水年度数据得出如下估计模型:
rain price pcy pop house water 123.187.17005.0363.0305.09.326---++-=
(-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)
93.02=R F=38.9
式中,water ——用水总量(百万立方米),house ——住户总数(千户),pop ——总人口(千人),pcy ——人均收入(元),price ——价格(元/100立方米),rain ——降雨量(毫米)。
(1)根据经济理论和直觉,请计回归系数的符号是什么(不包括常量),为什么?观察符号与你的直觉相符吗?
(2)在10%的显著性水平下,请进行变量的t-检验与方程的F-检验。
T 检验与F 检验结果有相矛盾的现象吗?
(3)你认为估计值是(1)有偏的;(2)无效的或(3)不一致的吗?详细阐述理由。
答:(1)在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越高。
所以可期望house 和pop 的符号为正;收入较高的个人可能用水较多,因此pcy 的预期符号为正,但它可能是不显著的。
如果水价上涨,则用户会节约用水,所以可预期price 的系数为负。
显然如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可以期望rain 的系数符号为负。
从估计的模型看,除了pcy 之外,所有符号都与预期相符。
(2)t-统计量检验单个变量的显著性,F-统计值检验变量是否是联合显著的。
这里t-检验的自由度为15-5-1=9,在10%的显著性水平下的临界值为1.833。
可见,所有参数估计值的t 值的绝对值都小于该值,所以即使在10%的水平下这些变量也不是显著的。
这里,F-统计值的分子自由度为5,分母自由度为9。
10%显著性水平下F 分布的临界值为2.61。
可见计算的F 值大于该临界值,表明回归系数是联合显著的。
T 检验与F 检验结果的矛盾可能是由于多重共线性造成的。
house 、pop 、pcy 都是高度相关的,这将使它们的t-值降低且表现为不显著。
price 和rain 不显著另有原因。
根据经验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能够很好地被度量。
可以预期水价与年降雨量在各年中一般没有太大的变化,所以它们的影响很难度量。
(3)多重共线性往往表现的是解释变量间的样本观察现象,在不存在完全共线性的情况下,近似共线并不意味着基本假定的任何改变,所以OLS 估计量的无偏性、一致性和有效性仍然成立,即仍是BLUE 估计量。
但共线性往往导致参数估计值的方差大于不存在多重共线性的情况。
7、一个对某地区大学生就业增长影响的简单模型可描述如下
t t t t t gGDP gGDP gPOP gMIN gEMP μβββββ+++++=4132110
式中,为新就业的大学生人数,MIN1为该地区最低限度工资,POP 为新毕业的大学生人数,GDP1为该地区国内生产总值,GDP 为该国国内生产总值;g 表示年增长率。
(1)如果该地区政府以多多少少不易观测的却对新毕业大学生就业有影响的因素作为基础来选择最低限度工资,则OLS 估计将会存在什么问题?
(2)令MIN 为该国的最低限度工资,它与随机扰动项相关吗?
(3)按照法律,各地区最低限度工资不得低于国家最低工资, 那么gMIN 能成为gMIN1的工具变量吗?
(1)由于地方政府往往是根据过去的经验、当前的经济状况以及期望的经济发展前景来定制地区最低限度工资水平的,而这些因素没有反映在上述模型中,而是被归结到了模型的随机扰动项中,因此 gMIN1 与μ不仅异期相关,而且往往是同期相关的,这将引起OLS 估计量的偏误,甚至当样本容量增大时也不具有一致性。
(2)全国最低限度的制定主要根据全国国整体的情况而定,因此gMIN 基本与上述模型的随机扰动项无关。
(3)由于地方政府在制定本地区最低工资水平时往往考虑全国的最低工资水平的要求,因此gMIN1与gMIN 具有较强的相关性。
结合(2)知gMIN 可以作为gMIN1的工具变量使用。
第五章 经典单方程计量经济学模型:专门问题
典型例题分析
例1.一个由容量为209的样本估计的解释CEO 薪水的方程为
Ln(salary)=4.59 +0.257ln(sales)+0.011roe+0.158finance +0.181consprod – 0.283utility (15.3) (8.03) (2.75) (1.775) (2.130) (-2.895)
其中,salary 表示年薪水(万元)、sales 表示年收入(万元)、roe 表示公司股票收益(万元);finance 、consprod 和 utility 均为虚拟变量,分别表示金融业、消费品工业和公用事业。
假设对比产业为交通运输业。
(1)解释三个虚拟变量参数的经济含义;
(2)保持sales 和roe 不变,计算公用事业和交通运输业之间估计薪水的近似百分比差异。
这个差异在1%的显著水平上是统计显著的吗?
(3)消费品工业和金融业之间估计薪水的近似百分比差异是多少?写出一个使你能直接检验这个差异是否统计显著的方程。
解答:
(1)finance 的参数的经济含义为:当销售收入与公司股票收益保持不变时,金融业的CEO 要比交通运输业的CEO 多获薪水15.8个百分点。
其他两个可类似解释。
(2)公用事业和交通运输业之间估计薪水的近似百分比差异就是以百分数解释的utility 的参数,即为28.3%。
由于参数的t 统计值为-2.895,它大于1%显著性水平下自由度为203的t 分布的临界值1.96,因此这种差异是统计上显著的。
(3)由于消费品工业和金融业相对于交通运输业的薪水百分比差异分别为15.8%与18.1%,因此它们间的差异为18.1% - 15.8% = 2.3%。
一个能直接检验这一差异是否显著的方程为
u trans utilty consprod roe salse salary ++++++=321210)ln()ln(αααβββ
其中,trans 为交通运输业虚拟变量。
这里对比基准为金融业,因此1α表示了消费品工业与金融业薪水的百分数差异,其t 统计值可用来进行显著性检验。
例2.假设货币需求关系式为t t t M Y R αβγ*=++,式中,t M 为时间t 的实际现金余额;t Y *为时间t 的“期望”实际收入;t R 为时间t 的利率。
根据适应规则,11(1)t t t t Y Y Y λλμ**
--=+-+,01λ<<修改期望值。
已知t Y ,t M ,t R 的数据,但t Y *的
数据未知。
(1)建立一个可以用于推导,,αβγλ和估计值的经济计量模型。
(2)假设221()0,(),()0,0;,,t t t t s t t E E E s Y R μμσμμ--===≠1t M -和1t R -与t μ都不相
关。
OLS 估计值是1)无偏的;2)一致的吗?为什么?
(3)假设t μ=1,t t ρμε-+t ε的性质类似(2)部分。
那么,本例中OLS 估计值是1)无偏的;2)一致的吗?为什么?
解答:
(1)由于
t t t M Y R αβγ*=++ (1)
11(1)t t t t Y Y Y λλμ**
--=+-+ (2)
第二个方程乘以β有
11(1)t t t t Y Y Y βλβλββμ**--=+-+ (3)
由第一个方程得 t t t R M Y γαβ--=*
11*1-----=t t t R M Y γαβ
代入方程(3)得
t t t t t t R M Y R M βμγαβλλβγα+---+=-----)()1(111
整理得
1(1)t t t M Y R ααλλβγ-=--++11(1)(1)t t t M R λλγβμ-----+
=111(1)(1)t t t t t Y M R R αλλβλγλγβμ---++-+--+
该模型可用来估计并计算出,,αβγλ和。
(2)在给定的假设条件下,尽管t μ与t M 相关,但t μ与模型中出现的任何解释变量都不相关,因此只是μ与M 存在异期相关,所以OLS 估计是一致的,但却是有偏的估计值。
(3)如果t t t ερμμ+=-1,则1t M -和t μ相关,因为1t M -与1-t μ相关。
所以OLS 估计结果有偏且不一致。
3、一个估计某行业CEO 薪水的回归模型如下
μββββββ++++++=comten ceoten profm mktval sales salary 543210arg
)ln()ln()ln(
其中,salary 为年薪sales 为公司的销售收入,mktval 为公司的市值,profmarg 为利润占销售额的百分比,ceoten 为其就任当前公司CEO 的年数,comten 为其在该公司的年数。
一个有177个样本数据集的估计得到R 2=0.353。
若添加ceoten 2和comten 2后,R 2=0.375。
问:此模型中是否有函数设定的偏误?
解答:
若添加ceoten 2和comten 2后,估计的模型为
μββββββββ++++++++=2726543210arg
)ln()ln()ln(comten ceoten comten ceoten profm mktval sales salary
如果β6、β7是统计上显著不为零的,则有理由认为模型设定是有偏误的。
而这一点可以通过
第三章介绍的受约束F 检验来完成:
97.2)
8177/()375.01(2/)353.0375.0(=---=F 在10%的显著性水平下,自由度为(2,∞)的F 分布的临界值为2.30;在5%的显著性水平下,临界值为3.0。
由此可知在10%的显著性水平下拒绝β6=β7=0的假设,表明原模型有设定偏误问题;而在5%的显著性水平下则不拒绝β6=β7=0的假设,表明原模型没有设定偏误问题。
三、习题
(一)基本知识类题型
5-1.解释下列概念:
1. 虚拟变量在建立模型时,有一些影响经济变量的因素无法定量描述,如:职业、性别对收入的影响,教育程度、季节等需要用定性变量度量。
为了在模型中反映这类因素的影响,并提高模型的精度,需要将这类变量“量化”,根据这类变量的属性类型,构造仅取“0”或“1”的人工变量,通常称这类变量为“虚拟变量”。
2. 虚拟因变量模型⑵也称“虚拟被解释变量模型”,指被解释变量也用虚拟变量表示,如:就业与否受年龄、身体状况、学历、性别、收入等许多因素影响,但最终的结果只有两个,要么就业,要么失业。
这类模型一般被用来研究某一决策和结果的可能性。
3. 滞后变量⑶在现实经济运行中,某些经济变量不仅受同期各种因素的影响,而且也受到过去某些时期的各种因素的影响,甚至受到自身的过去值的影响,如:居民的消费需求不仅受本期收入的影响还受到上期收入的影响,通常把这种过去时期的、具有滞后作用的变量称为“滞后变量”
4. 滞后效应⑷对于解释变量的任何变化,被解释变量必然会做出反映,而这些反映往往是要经过一段时间之后才会表现出来,称这种现象为滞后效应。
5. 分布滞后模型⑸模型中没有滞后被解释变量,本期被解释变量t Y 仅与解释变量的当期值t X 及其若干期的滞后值 ,,21--t t X X 等有关,这样的模型就是分布滞后模型。
其普遍形式为(以一元为例):t k t k t t t u X X X Y +++++=--βββα 110
6. 自回归模型⑹自回归模型指被解释变量Y 的滞后变量1-t Y 作为解释变量的模型,由于是被解释变量的滞后期变量对被解释变量现期的回归,即自己回归自己而得名。
7. h 检验⑺h 检验是Durbin 于1970年提出,是针对自回归模型中含有滞后变量1-t Y 作为解释变量时,检验随机扰动项是否具有自相关的DW 检验已不在适用的情况下提出的,这种识用于大样本情形下检验自回归模型有无一阶自相关的方法称为h 检验法。
该法定义统计量为:)
ˆ(ˆ1ˆ2βρV n n h -= 8. 有限最小二乘法⑻回归模型中的参数满足一定的限制条件,再根据该限制条件间接利用OLS 法回归样本获得回归参数的最优值的方法称为有限最小二乘法。