计量经济学第二版第四章课后习题
《计量经济学》习题(第四章)
《计量经济学》习题(第四章)第四章习题⼀、单选题1、如果回归模型违背了同⽅差假定,最⼩⼆乘估计量____A .⽆偏的,⾮有效的 B.有偏的,⾮有效的C .⽆偏的,有效的 D.有偏的,有效的2、Goldfeld-Quandt ⽅法⽤于检验____A .异⽅差性 B.⾃相关性C .随机解释变量 D.多重共线性3、DW 检验⽅法⽤于检验____A .异⽅差性 B.⾃相关性C .随机解释变量 D.多重共线性4、在异⽅差性情况下,常⽤的估计⽅法是____A .⼀阶差分法 B.⼴义差分法C .⼯具变量法 D.加权最⼩⼆乘法5、在以下选项中,正确表达了序列⾃相关的是____j i u x Cov D j i x x Cov C ji u u Cov B ji u u Cov A j i j i j i j i ≠≠≠≠≠=≠≠,0),(.,0),(.,0),(.,0),(.6、如果回归模型违背了⽆⾃相关假定,最⼩⼆乘估计量____A .⽆偏的,⾮有效的 B.有偏的,⾮有效的C .⽆偏的,有效的 D.有偏的,有效的7、在⾃相关情况下,常⽤的估计⽅法____A .普通最⼩⼆乘法 B.⼴义差分法C .⼯具变量法 D.加权最⼩⼆乘法8、White 检验⽅法主要⽤于检验____A .异⽅差性 B.⾃相关性C .随机解释变量 D.多重共线性9、Glejser 检验⽅法主要⽤于检验____A .异⽅差性 B.⾃相关性C .随机解释变量 D.多重共线性10、简单相关系数矩阵⽅法主要⽤于检验____A .异⽅差性 B.⾃相关性C .随机解释变量 D.多重共线性2222)(.)(.)(.)(.σσσσ==≠≠i i i i x Var D u Var C x Var B u Var A12、所谓不完全多重共线性是指存在不全为零的数k λλλ,,,21 ,有____1112211221221122.0.0..k k k k k x x x k k k k A x x x v B x x x C x x x v e D x x x v e v λλλλλλλλλλλλ++++=+++=∑?++++=++++=式中是随机误差项13、设21,x x 为解释变量,则完全多重共线性是____0.(021.0.021.22121121=+=++==+x x e x D v v x x C e x B x x A 为随机误差项)14、⼴义差分法是对____⽤最⼩⼆乘法估计其参数 11211211121121)()1(....-------+-+-=-++=++=++=t t t t t t t t t t t t t t t u u x x y y D u x y C u x y B u x y A ρρβρβρρρβρβρββββ15、在DW 检验中要求有假定条件,在下列条件中不正确的是____A .解释变量为⾮随机的 B.随机误差项为⼀阶⾃回归形式C .线性回归模型中不应含有滞后内⽣变量为解释变量D.线性回归模型为⼀元回归形式16、在下例引起序列⾃相关的原因中,不正确的是____A.经济变量具有惯性作⽤B.经济⾏为的滞后性C.设定偏误D.解释变量之间的共线性17、在DW 检验中,当d 统计量为2时,表明____A.存在完全的正⾃相关B.存在完全的负⾃相关C.不存在⾃相关D.不能判定18、在DW 检验中,当d 统计量为4时,表明____A.存在完全的正⾃相关B.存在完全的负⾃相关C.不存在⾃相关D.不能判定19、在DW 检验中,当d 统计量为0时,表明____A.存在完全的正⾃相关C.不存在⾃相关D.不能判定20、在DW 检验中,存在不能判定的区域是____A. 0﹤d ﹤l d ,4-l d ﹤d ﹤4B. u d ﹤d ﹤4-u dC. l d ﹤d ﹤u d ,4-u d ﹤d ﹤4-l dD. 上述都不对21、在修正序列⾃相关的⽅法中,能修正⾼阶⾃相关的⽅法是____A. 利⽤DW 统计量值求出ρB. Cochrane-Orcutt 法C. Durbin 两步法D. 移动平均法22、在下列多重共线性产⽣的原因中,不正确的是____A.经济本变量⼤多存在共同变化趋势B.模型中⼤量采⽤滞后变量C.由于认识上的局限使得选择变量不当D.解释变量与随机误差项相关23、在DW 检验中,存在正⾃相关的区域是____A. 4-l d ﹤d ﹤4B. 0﹤d ﹤l dC. u d ﹤d ﹤4-u dD. l d ﹤d ﹤u d ,4-u d ﹤d ﹤4-l d24、逐步回归法既检验⼜修正了____A .异⽅差性 B.⾃相关性 C .随机解释变量 D.多重共线性25、设)()(,2221i i i i i ix f u Var u x y σσββ==++=,则对原模型变换的正确形式为____ )()()()(.)()()()(.)()()()(..212222122121i i i i i i i i i i i i i i i i i i i i i i i i x f u x f x x f x f y D x f u x f x x f x f y C x f u x f x x f x f y B u x y A ++=++=++=++=ββββββββ 26、在修正序列⾃相关的⽅法中,不正确的是____A.⼴义差分法B.普通最⼩⼆乘法C.⼀阶差分法D. Durbin 两步法27、在检验异⽅差的⽅法中,不正确的是____A. Goldfeld-Quandt ⽅法B. spearman 检验法C. White 检验法28、在DW 检验中,存在零⾃相关的区域是____A. 4-l d ﹤d ﹤4B. 0﹤d ﹤l dC. u d ﹤d ﹤4-u dD. l d ﹤d ﹤u d ,4-u d ﹤d ﹤4-l d29.如果模型中的解释变量存在完全的多重共线性,参数的最⼩⼆乘估计量是()A .⽆偏的 B. 有偏的 C. 不确定 D. 确定的30. 已知模型的形式为u x y 21+β+β=,在⽤实际数据对模型的参数进⾏估计的时候,测得DW 统计量为0.6453,则⼴义差分变量是( )A. 1t t ,1t t x 6453.0x y 6453.0y ----B. 1t t 1t t x 6774.0x ,y 6774.0y ----C. 1t t 1t t x x ,y y ----D. 1t t 1t t x 05.0x ,y 05.0y ----31. 在具体运⽤加权最⼩⼆乘法时,如果变换的结果是x u x x x 1xy 21+β+β=,则Var(u)是下列形式中的哪⼀种?( )A. 2σxB. 2σ2x B. 2σx D. 2σLog(x)32. 在线性回归模型中,若解释变量1x 和2x 的观测值成⽐例,即有i 2i 1kx x =,其中k 为⾮零常数,则表明模型中存在( )A. 异⽅差B. 多重共线性C. 序列⾃相关D. 设定误差33. 已知DW 统计量的值接近于2,则样本回归模型残差的⼀阶⾃相关系数ρ近似等于( ) A. 0 B. –1 C. 1 D. 4⼆、多项选择1、能够检验多重共线性的⽅法有____A.简单相关系数法B. DW检验法C. 判定系数检验法D. ⽅差膨胀因⼦检验E.逐步回归法2、能够修正多重共线性的⽅法有____A.增加样本容量B.岭回归法C.剔除多余变量E.差分模型3、如果模型中存在异⽅差现象,则会引起如下后果____A. 参数估计值有偏B. 参数估计值的⽅差不能正确确定C. 变量的显著性检验失效D. 预测精度降低E. 参数估计值仍是⽆偏的4、能够检验异⽅差的⽅法是____A. gleiser检验法B. White检验法C. 图形法D. spearman检验法E. DW检验法F. Goldfeld-Quandt检验法5、如果模型中存在序列⾃相关现象,则会引起如下后果____A. 参数估计值有偏B. 参数估计值的⽅差不能正确确定C. 变量的显著性检验失效D. 预测精度降低E. 参数估计值仍是⽆偏的6、检验序列⾃相关的⽅法是____A. gleiser检验法B. White检验法C. 图形法D. DW检验法E. Goldfeld-Quandt检验法7、能够修正序列⾃相关的⽅法有____A. 加权最⼩⼆乘法B. Durbin两步法C. ⼴义最⼩⼆乘法D. ⼀阶差分法E. ⼴义差分法8、Goldfeld-Quandt检验法的应⽤条件是____A. 将观测值按解释变量的⼤⼩顺序排列B. 样本容量尽可能⼤C. 随机误差项服从正态分布D. 将排列在中间的约1/4的观测值删除掉9、在DW检验中,存在不能判定的区域是____A. 0﹤d﹤l dB. u d﹤d﹤4-u dC. l d﹤d﹤u dD. 4-u d﹤d﹤4-l dE. 4-l d﹤d﹤4。
计量经济学第四章习题详解word精品
第四章习题4.1没有进行t 检验,并且调整的可决系数也没有写出来,也就是没有考虑自由度的影响,会使结果存在一研究的目的和要求我们知道,商品进口额与很多因素有关,了解其变化对进出口产品有很大帮助。
为了探究和预测商品 进口额的变化,需要定量地分析影响商品进口额变化的主要因素。
二、模型的设定及其估计经分析,商品进口额可能与国内生产总值、居民消费价格指数有关。
为此,考虑国内生产总值 居民消费价格指数 CPI 为主要因素。
各影响变量与商品进口额呈正相关。
为此,设定如下形式的计量经济 模型:4.3199511048.160793.7302.8+ In+ InCP1996 11557.4 71176.6 327.9 1997 11806.5 78973.0 337.1 1998 11626.1 84402.3 334.4 1999 13736.4 89677.1 329.7 2000 18638.8 99214.6 331.0 2001 20159.2 109655.2 333.3 2002 24430.3 120332.7 330.6 2003 34195.6 135822.8 334.6 2004 46435.8 159878.3 I 347.7 2005 54273.7 183084.8 353.9 2006 63376.9 211923.5 359.2 2007 73284.6 249529.9 376.5 2008 79526.5 314045.4 398.7 2009 68618.4 340902.8 395.9 201094699.3 401512.8 408.9 2011113161.4472881.6431.0GDP 、式中, 为第 年中国商品进口额(亿元);In GDP 为第 年国内生产总值(亿元);In CPI 为居民消费价格 指数(以1985年为100)。
各解释变量前的回归系数预期都大于零。
第四章计量经济学答案范文
第四章一元线性回归第一部分学习目的和要求本章主要介绍一元线性回归模型、回归系数的确定和回归方程的有效性检验方法。
回归方程的有效性检验方法包括方差分析法、t检验方法和相关性系数检验方法。
本章还介绍了如何应用线性模型来建立预测和控制。
需要掌握和理解以下问题:1 一元线性回归模型2 最小二乘方法3 一元线性回归的假设条件4 方差分析方法5 t检验方法6 相关系数检验方法7 参数的区间估计8 应用线性回归方程控制与预测9 线性回归方程的经济解释第二部分练习题一、术语解释1 解释变量2 被解释变量3 线性回归模型4 最小二乘法5 方差分析6 参数估计7 控制8 预测二、填空ξ,目的在于使模型更1 在经济计量模型中引入反映()因素影响的随机扰动项t符合()活动。
2 在经济计量模型中引入随机扰动项的理由可以归纳为如下几条:(1)因为人的行为的()、社会环境与自然环境的()决定了经济变量本身的();(2)建立模型时其他被省略的经济因素的影响都归入了()中;(3)在模型估计时,()与归并误差也归入随机扰动项中;(4)由于我们认识的不足,错误的设定了()与()之间的数学形式,例如将非线性的函数形式设定为线性的函数形式,由此产生的误差也包含在随机扰动项中了。
3 ()是因变量离差平方和,它度量因变量的总变动。
就因变量总变动的变异来源看,它由两部分因素所组成。
一个是自变量,另一个是除自变量以外的其他因素。
()是拟合值的离散程度的度量。
它是由自变量的变化引起的因变量的变化,或称自变量对因变量变化的贡献。
()是度量实际值与拟合值之间的差异,它是由自变量以外的其他因素所致,它又叫残差或剩余。
4 回归方程中的回归系数是自变量对因变量的()。
某自变量回归系数β的意义,指的是该自变量变化一个单位引起因变量平均变化( )个单位。
5 模型线性的含义,就变量而言,指的是回归模型中变量的( );就参数而言,指的是回归模型中的参数的( );通常线性回归模型的线性含义是就( )而言的。
计量经济学第二版孙敬水主编习题答案
计量经济学第二版孙敬水主编习题答案1《计量经济学》思考与练习参考答案第1章引论一、单项选择题1.B2.C3.C4.B5.B6.A7.D8.B9.A 10.A 11.B 12.A 13.B二、多项选择题1.ABCDE2.CD3.ABCD4.ACD5.ABCD6.ABCD7.BDE8.BCE9.ABC10.ABCDE 11.ABC第2章一元线性回归模型一、单项选择题1.A2.D4.B5.D6.C7.D8.D9.B 10.C 11.B 12.D 13.B 14.D15.D 16.A 17.B 18.C 19.D 20.D 21.A 22.C 23.B 24.B 25.B 26.C27.A28.B 29.C 30.D 31.D二、多项选择题1.ACD2.ABCDE3.ABC4.BE5.AC6.CDE7.ABCDE8.BCDE9.ABCDE 10.ABDE11.CDE 12.ABCDE 13.ABCDE 14.ABCDE第3章多元线性回归模型一、单项选择题1.C2.D3.D4.C5.B6.B7.A9.C 10.A 11.A 12.A 13.D 14.B15.C 16.C 17.B 18.D 19.A 20.C 21.A 22.C 23.B 24.C 25.D二、多项选择题1.BCD2.ACDE3.BCD4.AD5.BC6.ACDE7.ABC8.ABCD9.ABC 10.ABCDE三、简答题、分析与计算题3.决定系数2R与总体线性关系显著性F检验之间的关系;在多元线性回归分析中,F检验与t检验有何不同?在一元线性回归分析中二者是否有等价的作用?2参考答案:(1)在多元线性回归分析中,可决系数2R是指解释变差占总变差的比重,用来表述解释变量对被解释变量的解释程度,它与总体线性关系显著性检验统计量F关系如下:F=2211RRkkn....或FkknFkR.+...=2可决系数是用于检验回归方程的拟和优度的,F检验是用于检验回归方程总体显著性的。
(完整word版)计量经济学第四章习题详解
第四章习题4.1 没有进行t检验,并且调整的可决系数也没有写出来,也就是没有考虑自由度的影响,会使结果存在误差.4.3200224430.3120332。
7 330.6200334195。
6135822.8 334。
6200446435.8159878.3 l347.7200554273.7183084.8 353.9200663376.9211923。
5 359。
2200773284。
6249529。
9 376.5200879526.5314045.4 398.7200968618。
4340902。
8 395。
9201094699.3401512.8 408。
92011113161.4472881.6 431.0一研究的目的和要求我们知道,商品进口额与很多因素有关,了解其变化对进出口产品有很大帮助。
为了探究和预测商品进口额的变化,需要定量地分析影响商品进口额变化的主要因素。
二、模型的设定及其估计经分析,商品进口额可能与国内生产总值、居民消费价格指数有关。
为此,考虑国内生产总值GDP、居民消费价格指数CPI为主要因素。
各影响变量与商品进口额呈正相关。
为此,设定如下形式的计量经济模型:=+ln+lnCP式中,亿元);lnGDP为国内生产总值(亿元);lnCPI为居民消费价格指数(以1985年为100)。
各解释变量前的回归系数预期都大于零。
为估计模型,根据上表的数据,利用EViews软件,生成Y、lnGDP、lnCPI等数据,采用OLS方法估计模型参数,得到的回归结果如下图所示:模型方程为:lnY=-3。
111486+1。
338533lnGDP-0.421791lnCPI(0。
463010)(0。
088610)(0。
233295)t= (—6。
720126) (15。
10582)(—1。
807975)=0.988051 =0.987055 F=992。
2582该模型=0.988051,=0。
987055,可决系数很高,F检验值为992.2582,明显显著。
计量经济学第二版课后习题答案1-8章 - 编辑版
练习题2.1 参考解答:计算中国货币供应量(以货币与准货币M2表示)与国内生产总值(GDP)的相关系数为:计算方法: XY n X Y X Y r -=或,()()X Y X X Y Y r --=计算结果:M2GDPM2 10.996426148646GDP0.9964261486461经济意义: 这说明中国货币供应量与国内生产总值(GDP)的线性相关系数为0.996426,线性相关程度相当高。
练习题2.2参考解答美国软饮料公司的广告费用X 与销售数量Y 的散点图为说明美国软饮料公司的广告费用X 与销售数量Y 正线性相关。
相关系数为:说明美国软饮料公司的广告费用X 与销售数量Y 的正相关程度相当高。
若以销售数量Y 为被解释变量,以广告费用X 为解释变量,可建立线性回归模型 i i i u X Y ++=21ββ 利用EViews 估计其参数结果为经t 检验表明, 广告费用X 对美国软饮料公司的销售数量Y 确有显著影响。
回归结果表明,广告费用X 每增加1百万美元, 平均说来软饮料公司的销售数量将增加14.40359(百万箱)。
练习题2.3参考解答: 1、 建立深圳地方预算内财政收入对GDP 的回归模型,建立EViews 文件,利用地方预算内财政收入(Y )和GDP 的数据表,作散点图可看出地方预算内财政收入(Y )和GDP 的关系近似直线关系,可建立线性回归模型: t t t u GDP Y ++=21ββ 利用EViews 估计其参数结果为即 ˆ20.46110.0850t tY GDP =+ (9.8674) (0.0033)t=(2.0736) (26.1038) R 2=0.9771 F=681.4064经检验说明,深圳市的GDP 对地方财政收入确有显著影响。
20.9771R =,说明GDP 解释了地方财政收入变动的近98%,模型拟合程度较好。
模型说明当GDP 每增长1亿元时,平均说来地方财政收入将增长0.0850亿元。
计量经济学庞皓第二版第四章答案
4.1(1) 存在3322ˆˆˆˆβγβα==且。
因为()()()()()()()23223223232322ˆ∑∑∑∑∑∑∑--=ii i i i i ii i i i x x x x x x x y x x y β 当32X X 与之间的相关系数为零时,离差形式的032=∑i i x x 有()()()()222223222322ˆˆαβ===∑∑∑∑∑∑i i ii i i i i x x y x x x x y 同理有:33ˆˆβγ= (2)会的。
(3) 存在()()()()3322ˆvar ˆvar ˆvar ˆvar γβαβ==且。
因为()()∑-=22322221ˆvar r x i σβ当023=r 时,()()()22222232222ˆvar 1ˆvar ασσβ==-=∑∑i i x r x 同理,有()()33ˆvar ˆvar γβ=4.3(1)参数估计结果如下: 093.1275F 991.0 992.0(-4.923) (17.967) (-9.069) ln 0571.1ln 6567.10601.3ˆln 22===-+-=R R CPI GDP Y t(2)数据中有多重共线性,居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且其简单相关系数呈现正向变动。
(3)分别拟合的回归模型如下:983.0(34.622)(-10.646) ln 187.1745.3ˆln 2=+-=R GDP Y867.0(11.681) (-4.341) PI ln 6638.24424.5ˆln 2=+-=R C Y931.0(16.814) (-1.958) ln 246.2438.1ˆln 2=+-=R CPI P DG单方程拟合效果都很好,回归系数显著,判定系数较高,GDP 和CPI 对进口的显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变;GDP 对CPI 进行回归分析,回归系数显著,判定系数较高,说明GDP 和CPI 有很强的线性关系,这正是原模型多重共线性的原因。
计量经济学课后答案第四、五章(内容参考)
计量经济学课后答案第四、五章(内容参考)第四章随机解释变量问题1. 随机解释变量的来源有哪些?答:随机解释变量的来源有:经济变量的不可控,使得解释变量观测值具有随机性;由于随机干扰项中包括了模型略去的解释变量,而略去的解释变量与模型中的解释变量往往是相关的;模型中含有被解释变量的滞后项,而被解释变量本身就是随机的。
2.随机解释变量有几种情形? 分情形说明随机解释变量对最小二乘估计的影响与后果?答:随机解释变量有三种情形,不同情形下最小二乘估计的影响和后果也不同。
(1)解释变量是随机的,但与随机干扰项不相关;这时采用OLS估计得到的参数估计量仍为无偏估计量;(2)解释变量与随机干扰项同期无关、不同期相关;这时OLS估计得到的参数估计量是有偏但一致的估计量;(3)解释变量与随机干扰项同期相关;这时OLS估计得到的参数估计量是有偏且非一致的估计量。
3. 选择作为工具变量的变量必须满足那些条件?答:选择作为工具变量的变量需满足以下三个条件:(1)与所替代的随机解释变量高度相关;(2)与随机干扰项不相关;(3)与模型中其他解释变量不相关,以避免出现多重共线性。
4.对模型Y t =β+β1X1t+β2X2t+β3Yt-1+μt假设Yt-1与μt相关。
为了消除该相关性,采用工具变量法:先求Y t关于X1t与 X2t回归,得到Yt,再做如下回归:Y t =β+β1X1t+β2X2t+β3Y t?1-+μt试问:这一方法能否消除原模型中Yt的相关性? 为什么?解答:能消除。
在基本假设下,X1t,X2t与μt应是不相关的,由此知,由X1t 与X2t估计出的Yt应与μt不相关。
5.对于一元回归模型Y t =β+β1Xt*+μt假设解释变量Xt *的实测值Xt与之有偏误:Xt= Xt*+et,其中et是具有零均值、无序列相关,且与Xt不相关的随机变量。
试问:(1) 能否将X t= X t*+e t代入原模型,使之变换成Y t=β0+β1X t+νt后进行估计? 其中,νt为变换后模型的随机干扰项。
计量经济学第4章课后答案
17CHAPTER 4SOLUTIONS TO PROBLEMS4.2 (i) and (iii) generally cause the t statistics not to have a t distribution under H 0.Homoskedasticity is one of the CLM assumptions. An important omitted variable violates Assumption MLR.3. The CLM assumptions contain no mention of the sample correlations among independent variables, except to rule out the case where the correlation is one.4.3 (i) While the standard error on hrsemp has not changed, the magnitude of the coefficient has increased by half. The t statistic on hrsemp has gone from about –1.47 to –2.21, so now the coefficient is statistically less than zero at the 5% level. (From Table G.2 the 5% critical value with 40 df is –1.684. The 1% critical value is –2.423, so the p -value is between .01 and .05.)(ii) If we add and subtract 2βlog(employ ) from the right-hand-side and collect terms, we havelog(scrap ) = 0β + 1βhrsemp + [2βlog(sales) – 2βlog(employ )] + [2βlog(employ ) + 3βlog(employ )] + u = 0β + 1βhrsemp + 2βlog(sales /employ ) + (2β + 3β)log(employ ) + u ,where the second equality follows from the fact that log(sales /employ ) = log(sales ) – log(employ ). Defining 3θ ≡ 2β + 3β gives the result.(iii) No. We are interested in the coefficient on log(employ ), which has a t statistic of .2, which is very small. Therefore, we conclude that the size of the firm, as measured by employees, does not matter, once we control for training and sales per employee (in a logarithmic functional form).(iv) The null hypothesis in the model from part (ii) is H 0:2β = –1. The t statistic is [–.951 – (–1)]/.37 = (1 – .951)/.37 ≈ .132; this is very small, and we fail to reject whether we specify a one- or two-sided alternative.4.4 (i) In columns (2) and (3), the coefficient on profmarg is actually negative, although its t statistic is only about –1. It appears that, once firm sales and market value have been controlled for, profit margin has no effect on CEO salary.(ii) We use column (3), which controls for the most factors affecting salary. The t statistic on log(mktval ) is about 2.05, which is just significant at the 5% level against a two-sided alternative.18(We can use the standard normal critical value, 1.96.) So log(mktval ) is statistically significant. Because the coefficient is an elasticity, a ceteris paribus 10% increase in market value is predicted to increase salary by 1%. This is not a huge effect, but it is not negligible, either.(iii) These variables are individually significant at low significance levels, with t ceoten ≈ 3.11 and t comten ≈ –2.79. Other factors fixed, another year as CEO with the company increases salary by about 1.71%. On the other hand, another year with the company, but not as CEO, lowers salary by about .92%. This second finding at first seems surprising, but could be related to the “superstar” effect: firms that hire CEOs from outside the company often go after a small pool of highly regarded candidates, and salaries of these people are bid up. More non-CEO years with a company makes it less likely the person was hired as an outside superstar.4.7 (i) .412 ± 1.96(.094), or about .228 to .596.(ii) No, because the value .4 is well inside the 95% CI.(iii) Yes, because 1 is well outside the 95% CI.4.8 (i) With df = 706 – 4 = 702, we use the standard normal critical value (df = ∞ in Table G.2), which is 1.96 for a two-tailed test at the 5% level. Now t educ = −11.13/5.88 ≈ −1.89, so |t educ | = 1.89 < 1.96, and we fail to reject H 0: educ β = 0 at the 5% level. Also, t age ≈ 1.52, so age is also statistically insignificant at the 5% level.(ii) We need to compute the R -squared form of the F statistic for joint significance. But F = [(.113 − .103)/(1 − .113)](702/2) ≈ 3.96. The 5% critical value in the F 2,702 distribution can be obtained from Table G.3b with denominator df = ∞: cv = 3.00. Therefore, educ and age are jointly significant at the 5% level (3.96 > 3.00). In fact, the p -value is about .019, and so educ and age are jointly significant at the 2% level.(iii) Not really. These variables are jointly significant, but including them only changes the coefficient on totwrk from –.151 to –.148.(iv) The standard t and F statistics that we used assume homoskedasticity, in addition to the other CLM assumptions. If there is heteroskedasticity in the equation, the tests are no longer valid.4.11 (i) Holding profmarg fixed, n rdintensΔ = .321 Δlog(sales ) = (.321/100)[100log()sales ⋅Δ] ≈ .00321(%Δsales ). Therefore, if %Δsales = 10, n rdintens Δ ≈ .032, or only about 3/100 of a percentage point. For such a large percentage increase in sales,this seems like a practically small effect.(ii) H 0:1β = 0 versus H 1:1β > 0, where 1β is the population slope on log(sales ). The t statistic is .321/.216 ≈ 1.486. The 5% critical value for a one-tailed test, with df = 32 – 3 = 29, is obtained from Table G.2 as 1.699; so we cannot reject H 0 at the 5% level. But the 10% criticalvalue is 1.311; since the t statistic is above this value, we reject H0 in favor of H1 at the 10% level.(iii) Not really. Its t statistic is only 1.087, which is well below even the 10% critical value for a one-tailed test.1920SOLUTIONS TO COMPUTER EXERCISESC4.1 (i) Holding other factors fixed,111log()(/100)[100log()](/100)(%),voteA expendA expendA expendA βββΔ=Δ=⋅Δ≈Δwhere we use the fact that 100log()expendA ⋅Δ ≈ %expendA Δ. So 1β/100 is the (ceteris paribus) percentage point change in voteA when expendA increases by one percent.(ii) The null hypothesis is H 0: 2β = –1β, which means a z% increase in expenditure by A and a z% increase in expenditure by B leaves voteA unchanged. We can equivalently write H 0: 1β + 2β = 0.(iii) The estimated equation (with standard errors in parentheses below estimates) isn voteA = 45.08 + 6.083 log(expendA ) – 6.615 log(expendB ) + .152 prtystrA(3.93) (0.382) (0.379) (.062) n = 173, R 2 = .793.The coefficient on log(expendA ) is very significant (t statistic ≈ 15.92), as is the coefficient on log(expendB ) (t statistic ≈ –17.45). The estimates imply that a 10% ceteris paribus increase in spending by candidate A increases the predicted share of the vote going to A by about .61percentage points. [Recall that, holding other factors fixed, n voteAΔ≈(6.083/100)%ΔexpendA ).] Similarly, a 10% ceteris paribus increase in spending by B reduces n voteAby about .66 percentage points. These effects certainly cannot be ignored.While the coefficients on log(expendA ) and log(expendB ) are of similar magnitudes (andopposite in sign, as we expect), we do not have the standard error of 1ˆβ + 2ˆβ, which is what we would need to test the hypothesis from part (ii).(iv) Write 1θ = 1β +2β, or 1β = 1θ– 2β. Plugging this into the original equation, and rearranging, givesn voteA = 0β + 1θlog(expendA ) + 2β[log(expendB ) – log(expendA )] +3βprtystrA + u ,When we estimate this equation we obtain 1θ≈ –.532 and se( 1θ)≈ .533. The t statistic for the hypothesis in part (ii) is –.532/.533 ≈ –1. Therefore, we fail to reject H 0: 2β = –1β.21C4.3 (i) The estimated model isn log()price = 11.67 + .000379 sqrft + .0289 bdrms (0.10) (.000043) (.0296)n = 88, R 2 = .588.Therefore, 1ˆθ= 150(.000379) + .0289 = .0858, which means that an additional 150 square foot bedroom increases the predicted price by about 8.6%.(ii) 2β= 1θ – 1501β, and solog(price ) = 0β+ 1βsqrft + (1θ – 1501β)bdrms + u= 0β+ 1β(sqrft – 150 bdrms ) + 1θbdrms + u .(iii) From part (ii), we run the regressionlog(price ) on (sqrft – 150 bdrms ), bdrms ,and obtain the standard error on bdrms . We already know that 1ˆθ= .0858; now we also getse(1ˆθ) = .0268. The 95% confidence interval reported by my software package is .0326 to .1390(or about 3.3% to 13.9%).C4.5 (i) If we drop rbisyr the estimated equation becomesn log()salary = 11.02 + .0677 years + .0158 gamesyr (0.27) (.0121) (.0016)+ .0014 bavg + .0359 hrunsyr (.0011) (.0072)n = 353, R 2= .625.Now hrunsyr is very statistically significant (t statistic ≈ 4.99), and its coefficient has increased by about two and one-half times.(ii) The equation with runsyr , fldperc , and sbasesyr added is22n log()salary = 10.41 + .0700 years + .0079 gamesyr(2.00) (.0120) (.0027)+ .00053 bavg + .0232 hrunsyr (.00110) (.0086)+ .0174 runsyr + .0010 fldperc – .0064 sbasesyr (.0051) (.0020) (.0052) n = 353, R 2 = .639.Of the three additional independent variables, only runsyr is statistically significant (t statistic = .0174/.0051 ≈ 3.41). The estimate implies that one more run per year, other factors fixed,increases predicted salary by about 1.74%, a substantial increase. The stolen bases variable even has the “wrong” sign with a t statistic of about –1.23, while fldperc has a t statistic of only .5. Most major league baseball players are pretty good fielders; in fact, the smallest fldperc is 800 (which means .800). With relatively little variation in fldperc , it is perhaps not surprising that its effect is hard to estimate.(iii) From their t statistics, bavg , fldperc , and sbasesyr are individually insignificant. The F statistic for their joint significance (with 3 and 345 df ) is about .69 with p -value ≈ .56. Therefore, these variables are jointly very insignificant.C4.7 (i) The minimum value is 0, the maximum is 99, and the average is about 56.16. (ii) When phsrank is added to (4.26), we get the following:n log() wage = 1.459 − .0093 jc + .0755 totcoll + .0049 exper + .00030 phsrank (0.024) (.0070) (.0026) (.0002) (.00024)n = 6,763, R 2 = .223So phsrank has a t statistic equal to only 1.25; it is not statistically significant. If we increase phsrank by 10, log(wage ) is predicted to increase by (.0003)10 = .003. This implies a .3% increase in wage , which seems a modest increase given a 10 percentage point increase in phsrank . (However, the sample standard deviation of phsrank is about 24.)(iii) Adding phsrank makes the t statistic on jc even smaller in absolute value, about 1.33, but the coefficient magnitude is similar to (4.26). Therefore, the base point remains unchanged: the return to a junior college is estimated to be somewhat smaller, but the difference is not significant and standard significant levels.(iv) The variable id is just a worker identification number, which should be randomly assigned (at least roughly). Therefore, id should not be correlated with any variable in the regression equation. It should be insignificant when added to (4.17) or (4.26). In fact, its t statistic is about .54.23C4.9 (i) The results from the OLS regression, with standard errors in parentheses, aren log() psoda =−1.46 + .073 prpblck + .137 log(income ) + .380 prppov (0.29) (.031) (.027) (.133)n = 401, R 2 = .087The p -value for testing H 0: 10β= against the two-sided alternative is about .018, so that we reject H 0 at the 5% level but not at the 1% level.(ii) The correlation is about −.84, indicating a strong degree of multicollinearity. Yet eachcoefficient is very statistically significant: the t statistic for log()ˆincome β is about 5.1 and that forˆprppovβ is about 2.86 (two-sided p -value = .004).(iii) The OLS regression results when log(hseval ) is added aren log() psoda =−.84 + .098 prpblck − .053 log(income ) (.29) (.029) (.038) + .052 prppov + .121 log(hseval ) (.134) (.018)n = 401, R 2 = .184The coefficient on log(hseval ) is an elasticity: a one percent increase in housing value, holding the other variables fixed, increases the predicted price by about .12 percent. The two-sided p -value is zero to three decimal places.(iv) Adding log(hseval ) makes log(income ) and prppov individually insignificant (at even the 15% significance level against a two-sided alternative for log(income ), and prppov is does not have a t statistic even close to one in absolute value). Nevertheless, they are jointly significant at the 5% level because the outcome of the F 2,396 statistic is about 3.52 with p -value = .030. All of the control variables – log(income ), prppov , and log(hseval ) – are highly correlated, so it is not surprising that some are individually insignificant.(v) Because the regression in (iii) contains the most controls, log(hseval ) is individually significant, and log(income ) and prppov are jointly significant, (iii) seems the most reliable. It holds fixed three measure of income and affluence. Therefore, a reasonable estimate is that if the proportion of blacks increases by .10, psoda is estimated to increase by 1%, other factors held fixed.。
庞皓计量经济学第二版第四章习题答案
庞皓计量经济学第二版第四章习题答案第四章练习题及参考解答4.1 假设在模型Yi=β1+β2X2i+β3X3i+ui中,X2与X3之间的相关系数为零,于是有人建议你进行如下回归:Yi=α1+α2X2i+u1iYi=γ1+γ3X3i+u2i(1)是否存在αˆ2=βˆ2且γˆ3=βˆ3?为什么? (2)βˆ1会等于αˆ1或γˆ1或两者的某个线性组合吗? (3)是否有var(βˆ2)=var(αˆ2)且var(βˆ3)=var(γˆ3)?练习题4.1参考解答:(1) 存在αˆ2=βˆ2且γˆ3=βˆ3。
2因为βˆ=(ix2i)(3ii3i2ix3i)2∑y∑x)-(∑yx)(∑x∑x2∑x2-∑xx22i3i2i当X2与X3之间的相关系数为零时,离差形式的∑x2ix3i=02有βˆ=(∑i2i3ii2i2yx)(∑x)∑yxx2x22=αˆ2 2i3i=x2i同理有:γˆ3=βˆ3(2) βˆ1会等于αˆ1或γˆ1的某个线性组合因为βˆ1=-βˆ22-ˆβ3,且3αˆ1=-αˆ22,γˆ1=-γˆ33 由于αˆ2=βˆ2且γˆ3=βˆ3,则αˆ1=-αˆ22=-βˆ22βˆ-αˆ12= 2γˆ-γˆ11=-γˆ33=-βˆ33βˆ3则βˆ=-βˆ-βˆ=--αˆ1-γˆ1122332-3=αˆ1+γˆ1-23(3) 存在var(βˆ2)=var(αˆ2)且var(βˆ3)=var(γˆ3)。
ˆ=因为varβ2()x1-r22i223σ2ˆ=当r23=0时,varβ2()x1-rx22i223σ2=σ222iˆ2) =var(αˆ=var(γˆ) 同理,有varβ334.2在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。
在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。
加进或剔除一个变量,通常是根据F检验看其对ESS的贡献而作出决定的。
计量经济学课后习题答案汇总
计量经济学练习题第一章导论一、单项选择题⒈计量经济研究中常用的数据主要有两类:一类是时间序列数据,另一类是【 B 】A 总量数据B 横截面数据C平均数据 D 相对数据⒉横截面数据是指【A 】A 同一时点上不同统计单位相同统计指标组成的数据B 同一时点上相同统计单位相同统计指标组成的数据C 同一时点上相同统计单位不同统计指标组成的数据D 同一时点上不同统计单位不同统计指标组成的数据⒊下面属于截面数据的是【D 】A 1991-2003年各年某地区20个乡镇的平均工业产值B 1991-2003年各年某地区20个乡镇的各镇工业产值C 某年某地区20个乡镇工业产值的合计数D 某年某地区20个乡镇各镇工业产值⒋同一统计指标按时间顺序记录的数据列称为【B 】A 横截面数据B 时间序列数据C 修匀数据D原始数据⒌回归分析中定义【 B 】A 解释变量和被解释变量都是随机变量B 解释变量为非随机变量,被解释变量为随机变量C 解释变量和被解释变量都是非随机变量D 解释变量为随机变量,被解释变量为非随机变量二、填空题⒈计量经济学是经济学的一个分支学科,是对经济问题进行定量实证研究的技术、方法和相关理论,可以理解为数学、统计学和_经济学_三者的结合。
⒉⒊现代计量经济学已经形成了包括单方程回归分析,联立方程组模型,时间序列分析三大支柱。
⒋⒌经典计量经济学的最基本方法是回归分析。
计量经济分析的基本步骤是:理论(或假说)陈述、建立计量经济模型、收集数据、计量经济模型参数的估计、检验和模型修正、预测和政策分析。
⒍⒎常用的三类样本数据是截面数据、时间序列数据和面板数据。
⒏⒐经济变量间的关系有不相关关系、相关关系、因果关系、相互影响关系和恒等关系。
三、简答题⒈什么是计量经济学?它与统计学的关系是怎样的?计量经济学就是对经济规律进行数量实证研究,包括预测、检验等多方面的工作。
计量经济学是一种定量分析,是以解释经济活动中客观存在的数量关系为内容的一门经济学学科。
计量经济学(庞皓)第二版课后思考题答案
计量经济学(庞皓)第⼆版课后思考题答案思考题答案第⼀章绪论思考题1.1怎样理解产⽣于西⽅国家的计量经济学能够在中国的经济理论研究和现代化建设中发挥重要作⽤?答:计量经济学的产⽣源于对经济问题的定量研究,这是社会经济发展到⼀定阶段的客观需要。
计量经济学的发展是与现代科学技术成就结合在⼀起的,它反映了社会化⼤⽣产对各种经济因素和经济活动进⾏数量分析的客观要求。
经济学从定性研究向定量分析的发展,是经济学逐步向更加精密、更加科学发展的表现。
我们只要坚持以科学的经济理论为指导,紧密结合中国经济的实际,就能够使计量经济学的理论与⽅法在中国的经济理论研究和现代化建设中发挥重要作⽤。
1.2理论计量经济学和应⽤计量经济学的区别和联系是什么?答:计量经济学不仅要寻求经济计量分析的⽅法,⽽且要对实际经济问题加以研究,分为理论计量经济学和应⽤计量经济学两个⽅⾯。
理论计量经济学是以计量经济学理论与⽅法技术为研究内容,⽬的在于为应⽤计量经济学提供⽅法论。
所谓计量经济学理论与⽅法技术的研究,实质上是指研究如何运⽤、改造和发展数理统计⽅法,使之成为适合测定随机经济关系的特殊⽅法。
应⽤计量经济学是在⼀定的经济理论的指导下,以反映经济事实的统计数据为依据,⽤计量经济⽅法技术研究计量经济模型的实⽤化或探索实证经济规律、分析经济现象和预测经济⾏为以及对经济政策作定量评价。
1.3怎样理解计量经济学与理论经济学、经济统计学的关系?答:1、计量经济学与经济学的关系。
联系:计量经济学研究的主体—经济现象和经济关系的数量规律;计量经济学必须以经济学提供的理论原则和经济运⾏规律为依据;经济计量分析的结果:对经济理论确定的原则加以验证、充实、完善。
区别:经济理论重在定性分析,并不对经济关系提供数量上的具体度量;计量经济学对经济关系要作出定量的估计,对经济理论提出经验的内容。
2、计量经济学与经济统计学的关系。
联系:经济统计侧重于对社会经济现象的描述性计量;经济统计提供的数据是计量经济学据以估计参数、验证经济理论的基本依据;经济现象不能作实验,只能被动地观测客观经济现象变动的既成事实,只能依赖于经济统计数据。
最新《计量经济学》第四章题及答案资料
第四章:多重共线性二、简答题1、导致多重共线性的原因有哪些?2、多重共线性为什么会使得模型的预测功能失效?3、如何利用辅回归模型来检验多重共线性?4、判断以下说法正确、错误,还是不确定?并简要陈述你的理由。
(1)尽管存在完全的多重共线性,OLS 估计量还是最优线性无偏估计量(BLUE )。
(2)在高度多重共线性的情况下,要评价一个或者多个偏回归系数的个别显著性是不可能的。
(3)如果某一辅回归显示出较高的2i R 值,则必然会存在高度的多重共线性。
(4)变量之间的相关系数较高是存在多重共线性的充分必要条件。
(5)如果回归的目的仅仅是为了预测,则变量之间存在多重共线性是无害的。
12233i i i Y X X βββ=++来对以上数据进行拟合回归。
(1) 我们能得到这3个估计量吗?并说明理由。
(2) 如果不能,那么我们能否估计得到这些参数的线性组合?可以的话,写出必要的计算过程。
6、考虑以下模型:231234i i i i i Y X X X ββββμ=++++由于2X 和3X 是X 的函数,那么它们之间存在多重共线性。
这种说法对吗?为什么? 7、在涉及时间序列数据的回归分析中,如果回归模型不仅含有解释变量的当前值,同时还含有它们的滞后值,我们把这类模型称为分布滞后模型(distributed-lag model )。
我们考虑以下模型:12313233i t t t t t Y X X X X βββββμ---=+++++其中Y ——消费,X ——收入,t ——时间。
该模型表示当期的消费是其现期的收入及其滞后三期的收入的线性函数。
(1) 在这一类模型中是否会存在多重共线性?为什么? (2) 如果存在多重共线性的话,应该如何解决这个问题? 8、设想在模型12233i i i i Y X X βββμ=+++中,2X 和3X 之间的相关系数23r 为零。
如果我们做如下的回归:1221i i i Y X ααμ=++ 1332i i i Y X γγμ=++(1)会不会存在22ˆˆαβ=且33ˆˆγβ=?为什么? (2)1ˆβ会等于1ˆα或1ˆγ或两者的某个线性组合吗? (3)会不会有22ˆˆvar()var()βα=且33ˆˆvar()var()γβ=? 9、通过一些简单的计量软件(比如EViews 、SPSS ),我们可以得到各变量之间的相关矩阵:2323232311 1k k k k r r r r R r r ⎛⎫ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭。
计量经济学第二版第四章课后习题答案
4.31)建立经济模型:i t t t CPI GDP Y μβββ+++=ln ln ln 321其中 Y 表示为商品进口额,GDP 表示为国内生产总值,CPI 表示为居民消费价格指数。
模型参数估计结果:t t t CPI GDP Y ln 057053.1ln 656674.1060149.3ln -+-=(0.337427)(0.092206) (0.214647)t= (-9.069059) (17.96703) (-4.924618)992218.02=R 991440.02=RF=1275.093(2)居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且CPI 与进口之间的简单相关系数呈现正向变动。
可能数据中有多重共线性。
计算相关系数:从上图可知, GDP 与CPI 之间存在较高的线性相关。
3)已知:i t t GDP A A Y 121ln ln μ++= i t t CPI B B Y 221ln ln μ++= i t t CPI C C GDP 321ln ln μ++=对以上三个模型分别进行回归,结果如下:t t GDP Y ln 218573.1090667.4ln +-=(0.384252) (0.035196)t= (-10.64579) (34.62222)982783.02=R 981963.02=R F=1198.698t t CPI Y ln 253662.1442420.5ln +-=(1.253662) (0.228046)t= (-4.341218) (11.68091)866619.02=R 860268.02=R F=136.4437t t CPI GDP 245971.2437984.1ln +-=(0.734328) (0.133577)t= (-1.958231) (16.81400)930855.02=R 927563.02=R F=282.7107单方程拟合效果都很好,回归系数显著,可决系数较高,GDP 和CPI 对进口分别有显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变,这只有通过相关系数的分析才能发现。
计量经济学第四章课后习题
中国能源消耗情况分析一、数据图形分析:图一 图二协方差矩阵(lny 与lnx )LNX1 LNX2 LNX3 LNX4 LNX5 LNX6 LNX7 LNY LNX1 1.000000 0.999970 0.999725 0.996897 0.993628 0.997198 0.708411 0.956283 LNX2 0.999970 1.000000 0.999746 0.997179 0.993886 0.996818 0.709053 0.954224 LNX3 0.999725 0.999746 1.000000 0.997887 0.991722 0.995511 0.716060 0.955923 LNX4 0.996897 0.997179 0.997887 1.000000 0.989485 0.989932 0.708962 0.944844 LNX5 0.993628 0.993886 0.991722 0.989485 1.000000 0.994070 0.667196 0.931304 LNX6 0.997198 0.996818 0.995511 0.989932 0.994070 1.000000 0.685726 0.962121 LNX7 0.708411 0.709053 0.716060 0.708962 0.667196 0.685726 1.000000 0.712070 LNY0.9562830.9542240.9559230.9448440.9313040.9621210.7120701.000000协方差矩阵(lny 与x )LNY X1 X2 X3 X4 X5 X6 X7 LNY 1.000000 0.972383 0.972994 0.970843 0.976252 0.954336 0.978077 0.716253 X1 0.972383 1.000000 0.999924 0.999470 0.998471 0.979294 0.996754 0.740635 X2 0.972994 0.999924 1.000000 0.999159 0.998662 0.980804 0.997243 0.743553 X3 0.970843 0.999470 0.999159 1.000000 0.998499 0.972904 0.994407 0.743665 X4 0.976252 0.998471 0.998662 0.998499 1.000000 0.974752 0.994885 0.755789 X5 0.954336 0.979294 0.980804 0.972904 0.974752 1.000000 0.986569 0.716553 X6 0.978077 0.996754 0.997243 0.994407 0.994885 0.986569 1.000000 0.726342 X70.716253 0.7406350.7435530.7436650.7557890.7165530.7263421.000000分析:将录入Eviews的数据Y,X1,X2,X3, X4,X5,X6,X7进行分析,通过每组数据随时间变化趋势可以发现,这八组数据都是逐年增长的,但增长速率有所变动。
计量经济学(庞浩)第二版课后习题答案
计量经济学(庞浩)第二版课后习题答案表明2β显著不为0,销售收入对销售成本有显著影响.(4) 假定下年1月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出置信度为95%的预测区间。
ˆ66.28720.786366.28720.7863800695.3272i iY X =+=+⨯=万元预测区间为: 21ˆˆF FYY t n ασ=695.3272 2.228 2.4157695.3272 1.9978F Y =⨯=。
第三章练习题参考解答练习题3.1为研究中国各地区入境旅游状况,建立了各省市旅游外汇收入(Y ,百万美元)、旅行社职工人数(X1,人)、国际旅游人数(X2,万人次)的模型,用某年31个省市的截面数据估计结果如下:ii i X X Y 215452.11179.00263.151ˆ++-= t=(-3.066806) (6.652983) (3.378064)R 2=0.934331 92964.02=R F=191.1894 n=31(1) 从经济意义上考察估计模型的合理性。
(2) 在5%显著性水平上,分别检验参数21,ββ的显著性。
(3) 在5%显著性水平上,检验模型的整体显著性。
3.2根据下列数据试估计偏回归系数、标准误差,以及可决系数与修正的可决系数:367.693Y =, 1402.760X =, 28.0X =,15n =, 2()66042.269i Y Y -=∑,211()84855.096i X X -=∑, 222()280.000i X X -=∑,11()()74778.346i i Y Y X X --=∑,22()()4250.900i i Y Y XX --=∑, 1122()()4796.000i i X X X X --=∑练习题参考解答练习题3.1参考解答有模型估计结果可看出:旅行社职工人数和国际旅游人数均与旅游外汇收入正相关。
平均说来,旅行社职工人数增加1人,旅游外汇收入将增加0.1179百万美元;国际旅游人数增加1万人次,旅游外汇收入增加1.5452百万美元。
计量经济学练习册答案(第二版)完整版
第一章导论一、单项选择题1、C2、B3、A4、A5、B6、A7、D8、C9、B 10、 B 11、C 12、A 13、D 14、C 15、A 16、C 17、D 18、C 19、A 20、 A 21、D二、多选题1、ABCD2、ABD3、ABCD4、ABC5、ABCD三、判断题4、1.√2. ×3.√4.×5.√6.√7.×8.√9.× 10.×四、简答题1、计量经济学与经济理论、统计学、数学的联系主要体现在计量经济学对经济理论、统计学、数学的应用方面,分别如下:1)计量经济学对经济理论的利用主要体现在以下几个方面(1)计量经济模型的选择和确定(2)对经济模型的修改和调整(3)对计量经济分析结果的解读和应用2)计量经济学对统计学的应用(1)数据的收集、处理、(2)参数估计(3)参数估计值、模型和预测结果的可靠性的判断3)计量经济学对数学的应用(1)关于函数性质、特征等方面的知识(2)对函数进行对数变换、求导以及级数展开(3)参数估计(4)计量经济理论和方法的研究2、模型的检验主要包括:经济意义检验、统计检验、计量经济学检验、模型的预测检验。
①在经济意义检验中,需要检验模型是否符合经济意义,检验求得的参数估计值的符号、大小、参数之间的关系是否与根据人们的经验和经济理论所拟订的期望值相符合;②在统计检验中,需要检验模型参数估计值的可靠性,即检验模型的统计学性质,有拟合优度检验、变量显著检验、方程显著性检验等;③在计量经济学检验中,需要检验模型的计量经济学性质,包括随机扰动项的序列相关检验、异方差性检验、解释变量的多重共线性检验等;④模型的预测检验,主要检验模型参数估计量的稳定性以及对样本容量变化时的灵敏度,以确定所建立的模型是否可以用于样本观测值以外的范围。
3、怎样理解计量经济学与经济统计学的关系?二者的联系:第一,计量经济分析所采用的数据的收集与处理、参数的估计等,需要使用统计学的方法和技术来完成;第二,参数估计值、模型的预测结果的可靠性,需要使用统计方法加以分析、判断。
第四章计量经济学答案
第四章一元线性回归第一部分学习目的和要求本章主要介绍一元线性回归模型、回归系数的确定和回归方程的有效性检验方法。
回归方程的有效性检验方法包括方差分析法、t检验方法和相关性系数检验方法。
本章还介绍了如何应用线性模型来建立预测和控制。
需要掌握和理解以下问题:1 一元线性回归模型2 最小二乘方法3 一元线性回归的假设条件4 方差分析方法5 t检验方法6 相关系数检验方法7 参数的区间估计8 应用线性回归方程控制与预测9 线性回归方程的经济解释第二部分练习题一、术语解释1 解释变量2 被解释变量3 线性回归模型4 最小二乘法5 方差分析6 参数估计7 控制8 预测二、填空ξ,目的在于使模型更1 在经济计量模型中引入反映()因素影响的随机扰动项t符合()活动。
2 在经济计量模型中引入随机扰动项的理由可以归纳为如下几条:(1)因为人的行为的()、社会环境与自然环境的()决定了经济变量本身的();(2)建立模型时其他被省略的经济因素的影响都归入了()中;(3)在模型估计时,()与归并误差也归入随机扰动项中;(4)由于我们认识的不足,错误的设定了()与()之间的数学形式,例如将非线性的函数形式设定为线性的函数形式,由此产生的误差也包含在随机扰动项中了。
3 ()是因变量离差平方和,它度量因变量的总变动。
就因变量总变动的变异来源看,它由两部分因素所组成。
一个是自变量,另一个是除自变量以外的其他因素。
()是拟合值的离散程度的度量。
它是由自变量的变化引起的因变量的变化,或称自变量对因变量变化的贡献。
()是度量实际值与拟合值之间的差异,它是由自变量以外的其他因素所致,它又叫残差或剩余。
4 回归方程中的回归系数是自变量对因变量的()。
某自变量回归系数β的意义,指的是该自变量变化一个单位引起因变量平均变化( )个单位。
5 模型线性的含义,就变量而言,指的是回归模型中变量的( );就参数而言,指的是回归模型中的参数的( );通常线性回归模型的线性含义是就( )而言的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章课后习题 4.1 解
1)存在22βˆαˆ=且3
3βˆγˆ=。
因为2X 和3X 之间的相关系数为零,即2X 和3X 相互之间不存在线性关系,两者是相互独立的,所以分别一元回归和二元回归两者的系数都不会发生变
化。
利用公式证明如下:
2)会。
3)如第一问解释,22βˆαˆ=,3
3βˆγˆ=是成立的,所以存在)αˆ()βˆ(22Var Var =,)αˆ()βˆ(33
Var Var =。
4.2 解:
根据我对多重共线性的认识,我认为任何一种逐步回归都存在弊端。
根据课本上对多重共线性的定义,不仅包括解释变量之间精确的线性关系,还包括解释变量之间近似的线性关
系。
而逐步回归法是通过逐步筛选并剔除引起多重共线性的变量。
所以在采用逐步回归法时,难免会出现一些不符合要求的变量被剔除的情况,此变量岁引起多重共线性,但其对被解释变量也有一定的影响,直接剔除就是忽略其的影响,使得回归结果不够精确。
误差增大。
4.3解:将数据输入到Eviews中,可得如下图所示:
图1
注释:X2表示国内生产总值GDP,X3表示居民消费价格指数CPI。
利用软件,采用最小二乘法进行回归,结果如下图所示:
图2 建立回归模型如下:
i t X X Y μβββ+++33221ln ln ln =
1)从回归结果中,可知此模型的参数1β=﹣3.06015,2β=1.656675,3β=﹣1.057054
2) 利用软件求出lnx2和lnx3的相关系数,可得
由上图可知lnx2,lnx3之间存在很强的线性相关性。
证实存在多重共线性。
根据题目要求分别进行三次回归:
图3 图4 图5
根据元以上回归结果可知,lnx2和lnx3在一元回归中分别对lny 影响显著,都通过了P 值法的检验;而在第三个回归结果中,可知lnx2和lnx3存在显著的线性关系,因为1C 没有通过P 值法检验,故修正后的模型为
3
2ln 245971.2ln x x =。
故此题中存在严重的多重共
线性。
对回归结果产生了严重的影响。
3)对图2中的回归模型系数采用P 值法进行检验:
因为1β、2β、3β的P 值分别为0.0000,0.0000,0.0001都远远小于显著性水平0.05,故要拒绝原假设,也即1β、2β、3β的值显著不为零,也即1β、2β、3β对应的解释变量对被解释变量的影响显著。
又因为对1β、2β、3β联合检验的F 值对应的P 值为0.0000<<0.05,故要拒绝原假设,也即三者联合起来对被解释变量有显著影响。
且调整后的可决系数为0.99144,非常接近于1,可知此回归结果对模型的拟合程度非常高。
但在题目中的第2问中可知,数据之间存在多重共线性。
对于这种情形我认为可以忽略共线性的问题。
4.4 自己找一个经济问题建立多元回归模型
题目:旅游业的发展在近年来受到广泛关注。
现分析国内旅游收入y 和国内旅游人数x2万人次,农村居民人均旅游消费x3/元,以及公路里程x3/万公里之间是否存在一定的线性关系。
将数据输入如下图所示:
图5
图6
如上图分析,经过对解释变量的系数进行P 值法检验,可知C ,x3,x4未通过检验,即我们要接受原假设,1β3β4β均为0。
图7
如上图所示,x2,x3,x4之间的相关系数。
由图可知x2和x3之间存在微弱的负相关,x3和x4之间也存在微弱的负相关;而x2和x4之间存在较强的线性关系,故次模型中存在多重共线性。
回归方法的改进:用逐步回归法重新进行回归。
结果如下: (向前回归)forward
图8
根据上图可知,解释变量的系数均通过了P 值法的检验,均小于0.05的显著性水平。
故此回归模型不存在多重共线性。
根据此次作业中的一些经济模型可以知道,避免多重共线性的出现需要注意,(1)选择变量时要有理论支持,即理论预期或假设;变量的数据要足够长,被解释变量与解释变量之间要有因果关系,并高度相关。
(2)建模时尽量使解释变量之间不高度相关,或解释变量的线性组合不高度相关。
4.5 对已有模型 321121.0452.0059.113.8ˆX X X Y +++=进行评析,并指出其中问题。
解:由题意可知0053.1099.8/133.80==βT
2294.617.0/059.11==βT 6848.066.0/452.02==βT 1110.009.1/121.03==βT
又因为056.2)26(025.0=T ,则1βT >2.056,需要拒绝原假设,也即在其他解释变量不变的情况下,解释变量X1对被解释变量Y 的影响是显著的。
除1βT 通过检验,其余参数均小于2.056,即我们应该接受原假设,也即0βT 、2βT 、3βT 的值为零,解释变量X2,X3对被解释变量的影响不显著。
故此模型中的解释变量之间存在严重的多重共线性。
应该对解释变量进行重新处理或者对模型进行修改从而优化模型,得到更加准确的模型。
4.6 (1)建立对数线性多元回归模型,引入全部变量建立对数线性多元回归模型如下: 生成:
lny=log(y), 同样方法生成: lnx1,lnx2,lnx3,lnx4,lnx5,lnx6,lnx7. 作全部变量对数线性多元回归,结果为:
图9
从修正的可决系数和F 统计量可以看出,全部变量对数线性多元回归整体对样本拟合很好,,各变量联合起来对能源消费影响显著。
可是其中的lnX3、lnX4、lnX6对lnY 影响不显著,而且lnX2、lnX5的参数为负值,在经济意义上不合理。
所以这样的回归结果并不理想。
(2) 预料此回归模型会遇到多重共线性问题, 因为国民总收入与GDP 本来就是一对关联指标;而工业增加值、建筑业增加值、交通运输邮电业增加值则是GDP 的组成部分。
这
两组指标必定存在高度相关。
解释变量国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等很可能线性相关, 可以看出lnx1与lnx2、lnx3、lnx4、lnx5、lnx6之间高度相关,许多相关系数高于0.900以上。
如果决定用表中全部变量作为解释变量,很可能会出现现严重多重共线性问题。
图10
(3)因为存在多重共线性,解决方法如下,A:修正理论假设,在高度相关的变量中选择相关程度最高的变量进行回归建立模型:而对变量取对数后,能源消费总量的对数与人均生活电力消费的对数相关程度最高,可建立这两者之间的回归。
4.7(1)根据样本数据得到各解释变量的样本相关系数矩阵如下:
图11
解释变量之间相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在0.9以上。
这显然与第三章对模型的无多重共线性假定不符合。
(2)解决方案:采用逐步回归的方式,可以得到没有共线性的回归模型,但可能存在设定偏误。
合并工业增加值与建筑业增加值,得到财政收入与第二产业的回归。
取对数再回归,可以减少共线性。
计量经济学作业
-------------------课后第四章习题
姓名:李曼丽
专业:统计学
班级:统计一班
学号:20121701310013。