计量经济学习题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 导 论
二、单项选择题1、C 2、B 3、A 4、A 5、B 6、A
1、同一统计指标按时间顺序记录的数据序列称为 ( )
A 、横截面数据
B 、虚变量数据
C 、时间序列数据
D 、平行数据
2、样本数据的质量问题,可以概括为完整性、准确性、可比性和 ( )
A 、时效性
B 、一致性
C 、广泛性
D 、系统性
3、有人采用全国大中型煤炭企业的截面数据,估计生产函数模型,然后用该模型预测未来 煤炭行业的产出量,这是违反了数据的哪一条原则。
( )
A 、一致性
B 、准确性
C 、可比性
D 、完整性
4、判断模型参数估计量的符号、大小、相互之间关系的合理性属于什么检验? ( )
A 、经济意义检验
B 、统计检验
C 、计量经济学检验
D 、模型的预测检验
5、对下列模型进行经济意义检验,哪一个模型通常被认为没有实际价值? ( )
A 、i C (消费)5000.8i I =+(收入)
B 、di Q (商品需求)100.8i I =+(收入)0.9i P +(价格)
C 、si Q (商品供给)200.75i P =+(价格)
D 、i Y (产出量)0.60.65i K =(资本)0.4
i L (劳动)
6、设M 为货币需求量,Y 为收入水平,r 为利率,流动性偏好函数为012M Y r βββμ=+++, 1ˆβ和2
ˆβ分别为1β、2β的估计值,根据经济理论有 ( ) A 、1ˆβ应为正值,2ˆβ应为负值 B 、1ˆβ应为正值,2
ˆβ应为正值 C 、1ˆβ应为负值,2ˆβ应为负值 D 、1ˆβ应为负值,2
ˆβ应为正值 三、填空题
1、在经济变量之间的关系中,因果关系、相互影响关系最重要,是计量经济分析的重点。
2、从观察单位和时点的角度看,经济数据可分为时间序列数据、截面数据、面板数据
3、根据包含的方程的数量以及是否反映经济变量与时间变量的关系,经济模型可分为时间序列模型、单方程模型、联立方程组模型
第二章 一元线性回归模型
二、单项选择题
1、D
2、B
3、D
4、D
5、A
6、C
7、D
8、C
9、C 10、B 11、B 12、B 13、B 14、D 15、A
1、设OLS 法得到的样本回归直线为1ˆi Y β=2ˆi i X e β++,以下说法正确的是
( ) A 、0i e ≠∑ B 、ˆ0i i eY ≠∑ C 、ˆY Y ≠ D 、0i i e X =∑
2、回归分析中定义的 ( )
A 、解释变量和被解释变量都是随机变量
B 、解释变量为非随机变量,被解释变量为随机变量
C 、解释变量和被解释变量都为非随机变量
D 、解释变量为随机变量,被解释变量为非随机变量
3、一元线性回归分析中的回归平方和ESS 的自由度是 ( )
A 、n
B 、n-1
C 、n-k
D 、1
4、对于模型01i i i Y X ββμ=++,OLS 的估计量1
ˆβ的特性在以下哪种情况下不会受到影响 A 、观测值数目n 增加 B 、i X 各观测值差额增加
C 、i X 各观测值基本相等
D 、22)(σμ=i E
5、某人通过一容量为19的样本估计消费函数(用模型i i i C Y αβμ=++表示),
并获得下列结果:i i Y C 81.015+=∧
,2R =0.98,0.025(17) 2.110t =,则下面 (3.1)(1.87)
哪个结论是对的? ( )
A 、Y 在5%显著性水平下不显著
B 、β的估计量的标准差为0.072
C 、β的95%置信区间不包括0
D 、以上都不对
6、在一元线性回归模型中,样本回归方程可表示为: ( )
A 、01t t t Y X ββμ=++
B 、(/)t t t Y E Y X μ=+
C 、01ˆˆˆt
t Y X ββ=+ D 、01(/)t t E Y X X ββ=+ 7、最小二乘准则是指按使( )达到最小值的原则确定样本回归方程 ( )
A 、1n i i e
=∑ B 、1n i i e =∑ C 、max i e D 、21n i i e =∑
8、设Y 表示实际观测值,ˆY
表示OLS 回归估计值,则下列哪项成立 ( ) A 、ˆY
Y = B 、 ˆY Y = C 、ˆY Y = D 、ˆY Y = 9、最大或然准则是按从模型中得到既得的n 组样本观测值的( )最大的准则确定样本 回归方程。
A 、离差平方和 B 、均值 C 、概率 D 、方差
10、一元线性回归模型01i i i Y X ββμ=++的最小二乘回归结果显示,残差平方和RSS=40.32, 样本容量n=25,则回归模型的标准差σ为 ( )
A 、1.270
B 、1.324
C 、1.613
D 、1.753
11、参数i β的估计量ˆi β具备有效性是指 ( ) A 、ˆ()0i Var β= B 、在i
β的所有线性无偏估计中ˆ()i Var β最小 C 、ˆ0i i ββ-= D 、在i
β的所有线性无偏估计中ˆ()i i ββ-最小 12、反映由模型中解释变量所解释的那部分离差大小的是 ( )
A 、总离差平方和
B 、回归平方和
C 、残差平方和
D 、可决系数
13、总离差平方和TSS 、残差平方和RSS 与回归平方和ESS 三者的关系是 ( )
A 、TSS>RSS+ESS
B 、TSS=RSS+ESS
C 、TSS<RSS+ESS
D 、TSS 2=RSS 2+ESS 2
14、对于回归模型01i i i Y X ββμ=++,i = 1,2,…,n
检验01:0H β=时,所用的统计量
1ˆ11ˆβββS -服从 ( ) A 、2(2)n χ- B 、(1)t n - C 、2(1)n χ- D 、(2)t n -
15、某一特定的X 水平上,总体Y 分布的离散程度越大,即2σ越大,则 ( )
A 、预测区间越宽,精度越低
B 、预测区间越宽,预测误差越小
C 、预测区间越窄,精度越高
D 、预测区间越窄,预测误差越大
三、多项选择题1、ABCE 2、ACDE 3、BDE 4、BCDE 5、ABCDE
1、一元线性回归模型01i i i Y X ββμ=++的基本假定包括 ( )
A 、()0i E μ=
B 、2()i Var μσ=
C 、(,)0()i j Cov i j μμ=≠
D 、~(0,1)i N μ
E 、X 为非随机变量,且(,)0i i Cov X μ=
2、以Y 表示实际观测值,ˆY
表示回归估计值,e 表示残差,则回归直线满足 ( ) A 、通过样本均值点()X Y , B 、
2ˆ()0i i
Y Y -=∑ C 、(,)0i i Cov X e = D 、ˆi i
Y Y =∑∑ E 、ˆY Y = 3、以带“^”表示估计值,μ表示随机干扰项,如果Y 与X 为线性关系,正确的是( )
A 、01i i Y X ββ=+
B 、01i i i Y X ββμ=++
C 、01ˆˆi i i Y X ββμ=++
D 、01ˆˆi i i Y X e ββ=++
E 、01ˆˆˆi i
Y X ββ=+ 4、假设线性回归模型满足全部基本假设,则其最小二乘回归得到的参数估计量具备 ( )
A 、可靠性
B 、一致性
C 、线性
D 、无偏性
E 、有效性
5、下列相关系数算式中,正确的是 ( )
A 、x y
XY X Y
σσ-⋅ B 、()()i i x y X X Y Y n σσ--∑ C 、(,)x y Cov X Y σσ D
()()X X Y Y --E 、∑∑∑--⋅-22
22Y n Y X n X Y X n Y X i i i i
二、判断题
1、×
2、×
3、×
4、√
5、×
6、×
7、×
8、×
9、√ 10、√
1、满足基本假设条件下,随机误差项i μ服从正态分布但被解释变量Y 不一定服从正态分布。
2、总体回归函数给出了对应于每一个自变量的因变量的值。
( )
3、线性回归模型意味着变量是线性的。
( )
4、解释变量是作为原因的变量,被解释变量是作为结果的变量。
( )
5、随机变量的条件均值与非条件均值是一回事。
( )
6、线性回归模型01i i i Y X ββμ=++的0均值假设可以表示为1
10n
i n μ==∑。
( ) 7、如果观测值i X 近似相等,也不会影响回归系数的估计量。
( )
8、样本可决系数高的回归方程一定比样本可决系数低的回归方程更能说明解释变量对被解 释变量的解释能力。
( )
9、模型结构参数的普通最小二乘估计量具有线性性、无偏性、有效性,随机干扰项方差的 普通最小二乘估计量也是无偏的。
( )
10、回归系数的显著性检验是用来检验解释变量对被解释变量有无显著解释能力的检验。
五、计算分析题
1、令kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数。
生育率对受教育年数的简单回归模型为
μββ++=educ kids 10
(1)随机扰动项μ包含什么样的因素?它们可能与受教育水平相关吗?
(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释 解:
(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。
有些因素可能与受教育水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。
(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ 相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设3不满足。
2、已知回归模型μβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年)。
随机扰动项μ的分布未知,其他所有假设都满足。
(1)从直观及经济角度解释α和β。
(2)OLS 估计量α
ˆ和βˆ满足线性性、无偏性及有效性吗?简单陈述理由。
(3)对参数的假设检验还能进行吗?简单陈述理由。
(4)如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项、斜率
项有无变化?
(5)若解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化? 解:(1)N βα+为接受过N 年教育的员工的总体平均起始薪金。
当N 为零时,平均薪金
为α,因此α表示没有接受过教育员工的平均起始薪金。
β是N 每变化一个单位所引起的E 的变化,即表示每多接受一年教育所对应的薪金增加值。
(2)OLS 估计量α
ˆ和βˆ仍满足线性性、无偏性及有效性,因为这些性质的的成立无需随机扰动项μ的正态分布假设。
(3)如果t μ的分布未知,则所有的假设检验都是无效的。
因为t 检验与F 检验是建立在μ的正态分布假设之上的。
(4)考察被解释变量度量单位变化的情形。
以E*表示以百元为度量单位的薪金,则
μβα++=⨯=N 1001*E E
由此有如下新模型)100(N )100()100(*E μβα++=
或 ****μβα++=N E
这里αα100*=,ββ100*=。
所以新的回归系数将为原始模型回归系数的100倍。
(5)再考虑解释变量度量单位变化的情形。
设N*为用月份表示的新员工受教育的时间长度,则N=12N*或N*=(1/12)N ,于是
μβαμβα+*+=++=)N 12(N E 或 μβα++=*N )12(E
可见,估计的截距项不变,而斜率项将为原回归系数的12倍。
3、假设模型为t t t X Y μβα++=。
给定n 个观察值),(11Y X ,),(22Y X ,…,),(n n Y X ,按如下步骤建立β的一个估计量:在散点图上把第1个点和第2个点连接起来并计算该直线的斜率;同理继续,最终将第1个点和最后一个点连接起来并计算该条线的斜率;
最后对这些斜率取平均值,称之为β
ˆ,即β的估计值。
(1)画出散点图, 推出β
ˆ的代数表达式。
(2)计算βˆ的期望值并对所做假设进行陈述。
这个估计值是有偏还是无偏的?解释理由。
(3)判定该估计值与我们以前用OLS 方法所获得的估计值相比的优劣,并做具体解释。
解:(1)散点图如下图所示。
首先计算每条直线的斜率并求平均斜率。
连接),(11Y X 和),(t t Y X 的直线斜率为)/()(11X X Y Y t t --。
由于共有n -1条这样的直线,因此
][11ˆ21
1∑==---=n t t t t X X Y Y n β (2)因为X 非随机且0)(=t E μ,因此
βμμβμβαμβα=--+=-++-++=--][])()([][1
111111X X E X X X X E X X Y Y E t t t t t t t 这意味着求和中的每一项都有期望值β,所以平均值也会有同样的期望值,则表明是无偏的。
(3)根据高斯-马尔可夫定理,只有β的OLS 估计量是最佳线性无偏估计量,因此,
这里得到的β
ˆ的有效性不如β的OLS 估计量,所以较差。
4、对于人均存款与人均收入之间的关系式t t t Y S μβα++=使用美国36年的年度数据得如下估计模型,括号内为标准差:
ˆt t
S =384.105+0.067Y (151.105)
(0.011) 2R =0.538 023.199ˆ=σ
(1)β的经济含义是什么? (2)α和β的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你
可以给出可能的原因吗?
(3)对于拟合优度你有什么看法吗?
(4)检验是否每一个回归系数都显著为0(在1%的显著性水平下)。
解:(1)β为收入的边际储蓄倾向,表示人均收入每增加1美元人均储蓄预期平均变化量。
(2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此α符号应为负。
储蓄是收入的一部分,且会随着收入的增加而增加,因此预期β的符号为正。
实际的回归式中,β的符号为正,与预期的一致。
但截距项为正,与预期不符。
这可能是模型的错误设定造成的。
如家庭的人口数可能影响家庭的储蓄行为,省略该变量将对截距项的估计产生了影响;另外线性设定可能不正确。
(3)拟合优度刻画解释变量对被解释变量变化的解释能力。
模型中53.8%的拟合优度,表明收入的变化可以解释储蓄中53.8 %的变动。
(4)检验单个参数采用t 检验,零假设为参数为零,备择假设为参数不为零。
在零假设下t 分布的自由度为n-2=36-2=34。
由t 分布表知,双侧1%下的临界值位于2.750与2.704之间。
斜率项的t 值为0.067/0.011=6.09,截距项的t 值为384.105/151.105=2.54。
可见斜率项的t 值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设。
5、现代投资分析的特征线涉及如下回归方程:01t mt t r r ββμ=++;其中:r 表示股票或债券的收益率;m r 表示有价证券的收益率(用市场指数表示,如标准普尔500指数);t 表示时间。
在投资分析中,1β被称为债券的安全系数β,是用来度量市场的风险程度的,即市场的发展对公司的财产有何影响。
依据1956~1976年间240个月的数据,Fogler 和Ganpathy 得到IBM 股票的回归方程(括号内为标准差),市场指数是在芝加哥大学建立的市场有价证券指数。
ˆ0.7264 1.0598t mt r
r =+ 20.4710R = (0.3001) (0.0728)
要求:(1)解释回归参数的意义;(2)如何解释2R ?(3)安全系数1β>的证券称为不稳定证券,建立适当的零假设及备选假设,并用t 检验进行检验(5%α=)。
解:(1)回归方程的截距0.7264表示当0m r =时的股票或债券收益率,本身没有经济意义;回归方程的斜率1.0598表明当有价证券的收益率每上升(或下降)1个点将使得股票或债券收益率上升(或下降)1.0598个点。
(2)2R 为可决系数,是度量回归方程拟合优度的指标,它表明该回归方程中47.10%的股票或债券收益率的变化是由m r 变化引起的。
当然20.4710R = 也表明回归方程对数据的拟合效果不是很好。
(3)建立零假设01:1H β=,备择假设11:1H β>,0.05α=,240n =,查表可得临界值0.05(238) 1.645t =,由于111 1.05981
0.8214 1.6450.0728t S ββ--===<,所以接受零假
设01:1H β=,拒绝备择假设11:1H β>。
说明此期间IBM 股票不是不稳定证券。
6、假定有如下的回归结果:i i X Y 4795.06911.2-=∧
,其中,Y 表示美国的咖啡的消费量(杯数/人天),X 表示咖啡的零售价格(美元/杯)。
要求:(1)这是一个时间序列回归还是横截面回归?(2)如何解释截距的意义,它有经济含义吗?如何解释斜率?(3)能否求出真实的总体回归函数?
(4)根据需求的价格弹性定义:弹性=斜率×(X/Y ),依据上述回归结果,你能求出对
咖啡需求的价格弹性吗?如果不能,计算此弹性还需要其他什么信息?
解:(1)这是一个横截面序列回归。
(2)截距2.6911表示咖啡零售价为每磅0美元时,每天每人平均消费量为2.6911杯,
这个数字没有经济意义;斜率-0.4795表示咖啡零售价与消费量负相关,价格上升1美元/磅,则平均每天每人消费量减少0.4795杯;
(3)不能;(4)不能;在同一条需求曲线上不同点的价格弹性不同,若要求出,须给出具体的X 值及与之对应的Y 值。
7、若经济变量y 和x 之间的关系为2(5)i i i y A x e αμ=-,其中A 、α为参数,i μ为随机误差, 问能否用一元线性回归模型进行分析?为什么?
解:能用一元线性回归模型进行分析。
因为:对方程左右两边取对数可得:i i i x A y μα+-+
=)5ln(2ln ln 令i i i i x x A y y '=-=='=)5ln( 2 ln ln 10、、、βαβ 可得一元线性回归模型:i i i x y μββ+'+='10
8、上海市居民1981~1998年期间的收入和消费数据如表所示,回归模型为i i i x y μββ++=10,其中,被解释变量i y 为人均消费,解释变量i x 为人均可支配收入。
试用普通最小二乘法估计模型中的参数01,ββ,并求随机误差项方差的估计值。
解:列表计算得
∑∑======n i n i x
y x
y x 121
44
.14806304422.116951422778
.2802 556.3365 据此可计算出
4067
.144 556
.3365789876.0778.2802 ˆˆ789876.044.14806304422.116951422ˆ1
01211=⨯-=-====∑∑==x y x
y x
n i n i βββ
回归直线方程为 :i i x y
789876.04067.144ˆ+= 进一步列表计算得:
8.15385712=∑=n i i e
这里,n=18,所以: 11.9616 8.1538572
181 21ˆ1
22
=⨯-=-=∑=n i i e n μσ 多元线性回归模型
二、单项选择题
1、C
2、A
3、B
4、A
5、C
6、C
7、A
8、D
9、B 10、D
1、在模型0112233t t t t t Y X X X ββββμ=++++的回归分析结果中,有462.58F =,
0.000000F p =的值,则表明 ( )
A 、解释变量2t X 对t Y 的影响不显著
B 、解释变量1t X 对t Y 的影响显著
C 、模型所描述的变量之间的线性关系总体上显著
D 、解释变量2t X 和1t X 对t Y 的影响显著
2、设k 为回归模型中的实解释变量的个数,n 为样本容量。
则对回归模型进行总体显著性 检验(F 检验)时构造的F 统计量为 ( )
A 、(1)ESS k F RSS n k =--
B 、(1)()ESS k F RSS n k -=-
C 、ESS F RSS =
D 、1RSS F TSS
=- 3、已知二元线性回归模型估计的残差平方和为2
800i e =∑,估计用样本容量为23n =,
则随机误差项t μ的方差的OLS 估计值为 ( )
A 、33.33
B 、 40
C 、 38.09
D 、36.36
4、在多元回归中,调整后的决定系数2R 与决定系数2R 的关系为 ( )
A 、22R R <
B 、22R R >
C 、22R R =
D 、2R 与2R 的关系不能确定
5、下面说法正确的有 ( )
A 、时间序列数据和横截面数据没有差异
B 、对回归模型的总体显著性检验没有必要
C 、总体回归方程与样本回归方程是有区别的
D 、决定系数2R 不可以用于衡量拟合优度
6、根据调整的可决系数2R 与F 统计量的关系可知,当21R =时,有 ( )
A 、F=0
B 、F=-1
C 、F →+∞
D 、F=-∞
7、线性回归模型的参数估计量ˆβ是随机向量Y 的函数,即1ˆ()X X X Y β-''=。
ˆβ是 ( )
A 、随机向量
B 、非随机向量
C 、确定性向量
D 、常量
8、下面哪一表述是正确的 ( )
A 、线性回归模型01i i i Y X ββμ=++的零均值假设是指1
10n
i i n μ==∑ B 、对模型01122i i i i Y X X βββμ=+++进行方程显著性检验(即F 检验),检验的零假 设是0012:0H βββ===
C 、相关系数较大意味着两个变量存在较强的因果关系
D 、当随机误差项的方差估计量等于零时,说明被解释变量与解释变量之间为函数关系
9、对于01122ˆˆˆˆi i i k ki i
Y X X X e ββββ=+++++…,如果原模型满足线性模型的基本假设则 在零假设0j β=下,统计量ˆˆ()j j s ββ(其中ˆ()j
s β是j β的标准误差)服从 ( ) A 、()t n k - B 、(1)t n k -- C 、(1,)F k n k -- D 、(,1)F k n k --
10、下列说法中正确的是 ( )
A 、如果模型的R 2很高,我们可以认为此模型的质量较好
B 、如果模型的R 2很低,我们可以认为此模型的质量较差
C 、如果某一参数不能通过显著性检验,我们应该剔除该解释变量
D 、如果某一参数不能通过显著性检验,我们不应该随便剔除该解释变量
三、多项选择题1、ACDE 2、BD 3、BCD 4、BC 5、AD
1、残差平方和是指 ( )
A 、随机因素影响所引起的被解释变量的变差
B 、解释变量变动所引起的被解释变量的变差
C 、被解释变量的变差中,回归方程不能作出解释的部分
D 、被解释变量的总离差平方和回归平方之差
E 、被解释变量的实际值与拟合值的离差平方和
2、回归平方和是指 ( )
A 、被解释变量的观测值i Y 与其均值Y 的离差平方和
B 、被解释变量的回归值ˆi
Y 与其均值Y 的离差平方和 C 、被解释变量的总体平方和2
i Y ∑与残差平方和2i e ∑之差 D 、解释变量变动所引起的被解释变量的离差的大小
E 、随机因素影响所引起的被解释变量的离差大小
3、对模型满足所有假定条件的模型01122i i i i Y X X βββμ=+++进行总体显著性检验,如果 检验结果总体线性关系显著,则很可能出现 ( )
A 、120ββ==
B 、120,0ββ≠=
C 、120,0ββ≠≠
D 、120,0ββ=≠
E 、120,0ββ==
4、设k 为回归模型中的参数个数(包含截距项)则总体线性回归模型进行显著性检验时所 用的F 统计量可以表示为 ( )
A 、22
ˆ()/(1)
/i i i Y Y n k e k ---∑∑ B 、2
2
ˆ()//(1)i i
i
Y Y k e n k ---∑∑ C 、22/(1)/(1)R k R n k --- D 、22(1)/(1)/R n k R k
--- E 、22/(1)(1)/R n k R k --- 5、在多元回归分析中,调整的可决系数2R 与可决系数2R 之间 ( )
A 、22R R <
B 、22R R ≥
C 、2R 只可能大于零
D 、2R 可能为负值
E 、2
R 不可能为负值
四、判断题1、√ 2、√ 3、× 4、× 5、√ 1、满足基本假设条件下,样本容量略大于解释变量个数时,可以得到各参数的唯一确定的 估计值,但参数估计结果的可靠性得不到保证 ( )
2、在多元线性回归中,t 检验和F 检验缺一不可。
( )
3、回归方程总体线性显著性检验的原假设是模型中所有的回归参数同时为零 ( )
4、多元线性回归中,可决系数2
R 是评价模型拟合优度好坏的最佳标准。
( )
5、多元线性回归模型中的偏回归系数,表示在其他解释变量保持不变的情况下,对应解释 变量每变化一个单位时,被解释变量的变动。
( )
六、计算分析题
1、某地区通过一个样本容量为722的调查数据得到劳动力受教育年数的一个回归方程为 10.360.0940.1310.210i i i i edu sibs medu fedu =-++ R 2=0.214
式中,edu 为劳动力受教育年数,sibs 为劳动力家庭中兄弟姐妹的个数,medu 与fedu 分别为母亲与父亲受到教育的年数。
问
(1)sibs 是否具有预期的影响?为什么?若medu 与fedu 保持不变,为了使预测的受
教育水平减少一年,需要sibs 增加多少?
(2)请对medu 的系数给予适当的解释。
(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数均为12年,另
一个的父母受教育的年数均为16年,则两人受教育的年数预期相差多少年?
解:
(1)预期sibs 对劳动者受教育的年数有影响。
因此在收入及支出预算约束一定的条件下,
子女越多的家庭,每个孩子接受教育的时间会越短。
根据多元回归模型偏回归系数的含义,sibs 前的参数估计值-0.094表明,在其他条件不变的
情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育的时
间,兄弟姐妹需增加1/0.094=10.6个。
(2)medu 的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年受教
育的时间,其子女作为劳动者就会预期增加0.131年的教育时间。
(3)首先计算两人受教育的年数分别为
10.36+0.131´12+0.210´12=14.452
10.36+0.131´16+0.210´16=15.816
因此,两人的受教育年限的差别为15.816-14.452=1.364
2、考虑以下方程(括号内为标准差):
1ˆ8.5620.3640.004 2.560t t t t
W P P U -=++- (0.080) (0.072) (0.658) 19=n 873.02=R
其中:t W ——t 年的每位雇员的工资
t P ——t 年的物价水平
t U ——t 年的失业率
要求:(1)进行变量显著性检验;
(2)对本模型的正确性进行讨论,1-t P 是否应从方程中删除?为什么?
解:
(1) 在给定5%显著性水平的情况下,进行t 检验。
Pt 参数的t 值: 0.364/0.08=4.55
Pt-1参数的t 值: 0.004/0.072=0.056
Ut 参数的t 值: —2.56/0.658=—3.89
在5%显著性水平下,自由度为19-3-1=15的t 分布的临界值为t0.025(15)=2.131 ,Pt 、Ut 的
参数显著不为0,但不能拒绝 的参数为0的假设。
(2)回归式表明影响工资水平的主要原因是当期的物价水平、失业率,前期的物价水平对
他的影响不是很大,当期的物价水平与工资水平呈正向变动、失业率与工资水平呈相反变动,
符合经济理论,模型正确。
可以将Pt-1 从模型删除.
3、以企业研发支出(R&D )占销售额的比重(单位:%)为被解释变量(Y ),以企业销售
额(X 1)与利润占销售额的比重(X 2)为解释变量,一个容量为32的样本企业的估计结
果如下:
1220.4720.32ln 0.05(1.37)(0.22)(0.046)0.099
i i i
Y X X R =++=
其中,括号中的数据为参数估计值的标准差。
(1)解释ln(X 1)的参数。
如果X 1增长10%,估计Y 会变化多少个百分点?这在经济上
是一个很大的影响吗?
(2)检验R&D 强度不随销售额的变化而变化的假设。
分别在5%和10%的显著性水平
上进行这个检验。
(3)利润占销售额的比重X 2对R&D 强度Y 是否在统计上有显著的影响?
解:
(1)ln(X1)的系数表明在其他条件不变时,ln(X1)变化1个单位,Y 变化的单位数,即
DY=0.32Dln(X1)»0.32(DX1/ X1)。
由此,如果X1增加10%,Y 会增加0.032个百分点。
这
在经济上不是一个较大的影响。
(2)针对备择假设H1: ,检验原假设H0: 。
易知相应的t 统计量的值为t=0.32/0.22=1.455。
在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为2.045,计算出的t 值小于该
临界值,所以不拒绝原假设。
这意味着销售额对R&D 强度的影响不显著。
在10%的显著性
水平下,t 分布的临界值为1.699,计算的t 值小于该值,不拒绝原假设,意味着销售额对
R&D 强度的影响不显著。
(3)对X2,参数估计值的t 统计值为0.05/0.46=1.087,它比10%显著性水平下的临界值还
小,因此可以认为它对Y 在统计上没有显著的影响。
4、假设你以校园内食堂每天卖出的盒饭数量作为被解释变量,以盒饭价格、气温、附近餐
厅的盒饭价格、学校当日的学生数量(单位:千人)作为解释变量,进行回归分析。
假
设你看到如下的回归结果(括号内为标准差),但你不知道各解释变量分别代表什么。
i
i i i i X X X X Y 43219.561.07.124.286.10ˆ-+++= 63.02=R 35=n (2.6) (6.3) (0.61) (5.9)
试判定各解释变量分别代表什么,说明理由。
解:
(1)答案与真实情况是否一致不一定,因为题目未告知是否通过了经济意义检验。
猜测为:
为学生数量, 为附近餐厅的盒饭价格, 为气温, 为校园内食堂的盒饭价格;
(2)理由是被解释变量应与学生数量成正比,并且应该影响显著;被解释变量应与本食堂
盒饭价格成反比,这与需求理论相吻合;被解释变量应与附近餐厅的盒饭价格成正比,因为
彼此有替代作用;被解释变量应与气温的变化关系不是十分显著,因为大多数学生不会因为
气温变化不吃饭。
5、下表给出一二元模型的回归结果。
求:(1)样本容量是多少?RSS 是多少?ESS 和RSS 的自由度各是多少?
(2)2R 和2R ?
(3)检验假设:解释变量总体上对Y 无影响。
你用什么假设检验?为什么?
(4)根据以上信息,你能确定解释变量各自对Y 的贡献吗?
解:
(1)样本容量为 n=14.+1=15 RSS=TSS-ESS=66042-65965=77
ESS 的自由度为: d.f.= 2
RSS 的自由度为: d.f.=n-2-1=12
(2)R2=ESS/TSS=65965/66042=0.9988
R^2=1-(1- R2)(n-1)/(n-k-1)=1-0.0012*14/12=0.9986
(3)应该采用方程显著性检验,即F 检验,理由是只有这样才能判断X1、X2一起是
否对Y 有影响。
(4)不能。
因为通过上述信息,仅可初步判断X1、X2联合起来对Y 有线性影响,
两者的变化解释了Y 变化的99.8%。
但由于无法知道X1,X2前参数的具体估计值,因此还
无法判断它们各自对Y 的影响有多大。
6、在经典线性回归模型的基本假定下,对含有三个自变量的多元线性回归模型: 0112233i i i i i Y X X X ββββμ=++++
你想检验的虚拟假设是0H :1221=-ββ。
(1)用21ˆ,ˆββ的方差及其协方差求出)ˆ2ˆ(2
1ββ-Var 。
(2)写出检验H 0:1221=-ββ的t 统计量。
(3)如果定义θββ=-212,写出一个涉及β0、θ、β2和β3的回归方程,以便能直接得
到θ估计值θ
ˆ及其样本标准差。
解:(1))ˆ(4)ˆ,ˆ(4)ˆ()ˆ2ˆ(2
21121ββββββVar Cov Var Var +-=- (2)1212垐2垐21
t S ββββ---=,其中12
垐2S ββ-为1ˆβ-2ˆ2β的样本标准差。
(3)由θββ=-212知212βθβ+=,代入原模型得
μββθβμ
βββθβ+++++=+++++=33212103322120)2()2(X X X X X X X Y
这就是所需的模型,其中θ估计值θ
ˆ及其样本标准差都能通过对该模型进行估计得到。
7、假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,
以便决定是否修建第二条跑道以满足所有的锻炼者。
你通过整个学年收集数据,得到两个
可能的解释性方程:
方程A :123ˆ125.015.0 1.0 1.5i i i i
Y X X X =--+ 75.02=R 方程B :124ˆ123.014.0 5.5 3.7i i i i
Y X X X =-+- 73.02=R 其中:i Y ——第i 天慢跑者的人数
1i X ——第i 天降雨的英寸数
2i X ——第i 天日照的小时数
3i X ——第i 天的最高温度(按华氏温度)
4i X ——第i 天的后一天需交学期论文的班级数
请回答下列问题:
(1)这两个方程你认为哪个更合理些,为什么?
(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?
解:(1)方程B 更合理些。
原因:方程B 中的参数估计值的符号与现实更接近些,如与日
照的小时数同向变化,天长则慢跑的人会多些;与第二天需交学期论文的班级数成反向变化。
(2)解释变量的系数表明该变量的单位变化,在方程中其他解释变量不变的条件下,对被
解释变量的影响,由于在方程A 和方程B 中选择了不同的解释变量,方程A 选择的是“该
天的最高温度”,而方程B 选择的是“第二天需交学期论文的班级数”,造成了 与这两个变
量之间关系的不同,所以用相同的数据估计相同的变量得到了不同的符号。
8、考虑以下预测的回归方程:t
t t RS F Y 33.510.0120ˆ++-= 50.02
=R 其中:t Y 为第t 年的玉米产量(吨/亩);t F 为第t 年的施肥强度(千克/亩);t RS 为第t
年的降雨量(毫米)。
要求回答下列问题:
(1)从F 和RS 对Y 的影响方面,说出本方程中系数10.0和33.5的含义;
(2)常数项120-是否意味着玉米的负产量可能存在?
(3)假定F β的真实值为40.0,则F β的估计量是否有偏?为什么?
(4)假定该方程并不满足所有的古典模型假设,即参数估计并不是最佳线性无偏估计,
则是否意味着RS β的真实值绝对不等于33.5?为什么?
解:
(1) 在降雨量不变时,每亩增加1千克肥料将使当年的玉米产量增加0.1吨/亩;在每亩施肥
量不变的情况下,每增加1毫米的降雨量将使当年的玉米产量增加5.33吨/亩。
(2) 在种地的一年中不施肥也不下雨的现象同时发生的可能性很小,所以玉米的负产量不
可能存在.事实上,这里的截距无实际意义。
(3) 如果 的真实值为0.40,则表明其估计值与真实值有偏误,但不能说 的估计是有偏估计.
理由是0.1是 的一个估计值,而所谓估计的有偏性是针对估计的期望来说的,即如果取遍所有。