第1章线性回归模型的自相关问题
eviews-4.自相关解析
三、序列相关性的后果
计量经济学模型一旦出现序列相关性,如果仍采用OLS 法估计模型参数,则OLS估计量仍然是线性无偏估计量, 但是会产生下列不良后果:
1、参数估计量非有效
因为,在有效性证明中利用了 E(UU’)=2I 即同方差性和无序列相关假设。
证明:
ˆ k t t 1 1
ˆ ) E[ ˆ E( ˆ )]2 E( ˆ )2 var( 1 1 1 1 1
~ Y (Yˆ )ˆ e e i Yi (iY0ls)
t t
t ols
然后,通过分析这些“近似估计量”之间的相 关性,以判断随机误差项是否具有序列相关性。
自相关的检验方法
检验自相关的方法也可以分为两种:一种是图示 法,另一种是检验方法。
(一)图示法
由于回归残差 e 可以作为随机项 u t 的估计量, ut t 的性质可以从 e 的性质中反映出来。我们可以通 t 过观察残差是否存在自相关来判断随机项是否存 在自相关。
ts
经济变量以正相关居多, 所以此项多为正数
ˆ ˆ) var( ) var( 1 1
2、变量的显著性检验失去意义
在变量的显著性检验中,统计量是建立在参 数方差正确估计基础之上的,这只有当随机误差 项具有同方差性和无序列相关时才能成立。
如果存在序列相关,参数估计量的方差 出现偏误(偏大或偏小),t检验就失 去意义。其他检验也是如此。
称ut具有一阶自回归形式。 比如:
ut 1ut 1 vt
满足经典假设
由于序列相关性经常出现在以时间序列为样本的模型中, 因此,本节用下标t代表i。
ut 1ut 1 vt
ˆ1
u u
计量经济学讲义—— 线性回归模型的自相关问题
10.5 自相关的诊断-Durbin-Watson d检验法
Durbin-Watson d统计量可以用来诊断回归模型的自相关
n
d =
∑
t=2
( e t − e t −1 ) 2
n
∑
样本容量为n-1。
t =1
e t2
(10.3)
Durbin-Watson d检验量是诊断自相关常用的检验 工具,必须掌握。
10.2 自相关产生的原因
1. 经济时间序列的惯性(inertia)或迟缓性(sluggishness)特征。 2. 模型适定误差。有些自相关并不是由于连续观察值之间相 关产生的,而是因为回归模型不是适定性的“好”模型。 “不好模型”有多种原因。 3. 蛛网现象(the cobweb phenomenon)。一个变量对另一个变 量的反映不是同步的,时滞一定的时间。商品供给对价格 的反映: St = B1 + B2*Pt-1 + ut (10.2)
∑
t=2 n
e t e t −1 e t2
ˆ ,− 1 ≤ ρ ≤ 1
(10.5)
∑
t =1
如果d接近0,则存在正相关;d接近4,则存在负相关;d 接近2,表示不存在相关。
10.5 自相关的诊断-Durbin-Watson d检验法
d 统计量诊断自相关需要一定的假设条件,不是任意可用的: 1. 回归模型包括一个截距项。因此,d统计量无法判断通过原 点的回归模型的自相关问题。 2. 变量X是非随机变量,即在重复抽样中变量X的值是固定不 变的。 3. 扰动项ui的生成机制是:
4. 数据处理。在做季节因素的调整时,经常要做移动平均。 移动平均的处理可以消除季节波动的影响,但带来新的问 题则是产生了自相关。
《计量经济学》第一学期课程试题(三)
《计量经济学》第⼀学期课程试题(三)《计量经济学》第⼀学期课程试题(三)⼀、选择题(单选题1-10每题1分,多选题11-15每题2分,共20分,答案填⼊下表)1、回归分析中定义A.解释变量和被解释变量都是随机变量B.解释变量为⾮随机变量,被解释变量为随机变量C.解释变量和被解释变量都为⾮随机变量D.解释变量为随机变量,被解释变量为⾮随机变量2、下⾯哪⼀项不能⽤于回归模型⾼阶⾃相关的检验: A.D-W 检验 B.偏⾃相关检验 C. B-G 检验 D. 拉格朗⽇乘数检验3、设M 为货币需求量,Y 为收⼊⽔平,r 为利率,流动性偏好函数M=β0+β1Y+β2r+ε,⼜设a.b 分别是β1β2的估计值,则根据经济理论,⼀般来说A. a 应为正值,b 应为负值B. a 应为正值,b 应为正值C. a 应为负值,b 应为负值D. a 应为负值,b 应为正值4.利⽤容量⼤于30的年度数据样本对某市2005年GNP 进⾏预测得点预测值为18400万,回归标准差为183。
该市2005年GNP 的95%置信区间。
A. [18217, 18583 ]B. [18034, 18766 ]C. [18126, 18583 ]D. [18126, 18675 ] 5.下列哪种检验,A. Park 检验B. Gleiser 检验C. Park 检验和Gleiser 检验D. White 检验6、模型变换法可⽤于解决模型中存在A、异⽅差B、⾃相关C、多重共线性D、滞后效应7、变量的显著性检验主要使⽤A F 检验B t 检验C DW 检验D 2χ检验8、下列属于统计检验的是A、多重共线性检验B、⾃相关性检验C、F 检验D、异⽅差性检验9、当回归模型存在⾃相关性时,t 检验的可靠性会A. 降低B.增⼤C.不变D.⽆法确定10、分布滞后模型中,反映中期乘数的是A 0bB biC ∑=s i i b 0D ∑∞=0i i b11、⾃相关系数的估计⽅法有ABCDA、近似估计法;B、迭代估计法C、Durbin 估计法;D、搜索估计法12、构造模型时,若遗漏了重要的解释变量,则模型可能出现BCA、多重共线性B、异⽅差性C、⾃相关性D、滞后效应13、关于多重共线性的影响,下⾯哪些不正确:ABCDA. 增⼤回归标准差B.难以区分单个⾃变量的影响C. t 统计量增⼤D.回归模型不稳定14、虚拟变量的作⽤有ABCA、描述定性因素B、提⾼模型精度C、便于处理异常数据D、便于测定误差15、产⽣滞后效应的原因有 ABDA、⼼理因素B、技术因素C、随机因素D、制度因素⼆、判断正误(正确打√,错误打×,每题1分,共10分,答案填⼊下表)1、回归模型i i i i X b X b b Y ε+++=22110中,检验0:10=b H 时,所⽤的统计量)?(?111b s b b ?服从于)22?n (χ 2.⽤⼀阶差分变换消除⾃相关性是假定⾃相关系数为1。
《应用回归分析》自相关性的诊断及处理实验报告
《应用回归分析》自相关性的诊断及处理实验报告
二、实验步骤:(只需关键步骤)
1、分析→回归→线性→保存→残差
2、转换→计算变量;分析→回归→线性。
3、转换→计算变量;分析→回归→线性
三、实验结果分析:(提供关键结果截图和分析)
1.用普通最小二乘法建立y与x1和x2的回归方程,用残差图和DW检验诊断序列的自相关性;
由图可知y与x1和x2的回归方程为:
Y=574062+191.098x1+2.045x2
从输出结果中可以看到DW=0.283,查DW表,n=23,k=2,显著性水平由DW<1.26,也说明残差序列存在正的自相关。
自相关系数,也说明误差存在高度的自相关。
分析:从输出结果中可以看到DW=0.745,查DW表,n=52,k=3,显著性水平 =0.05,dL=1.47,dU=1.64.由DW<1.47,也说明残差序列存在正的自相关。
α
625.0745.02
1121-1ˆ=⨯-=≈DW ρ 也说明误差项存在较高度的自相关。
2.用迭代法处理序列相关,并建立回归方程;
回归方程为:y=-178.775+211.110x1+1.436x2
从结果中看到新回归残差的DW=1.716,
查DW 表,n=52,k=3,显著性水平0.5 由此可知DW 落入无自相关性区
域,说明残差序列无自相关
3.用一阶差分法处理序列相关,并建立回归方程;
从结果中看到回归残差的DW=2.042,根据P 104表4-4的DW 的取值范围来诊断 ,误差项。
计量经济学_西南财经大学中国大学mooc课后章节答案期末考试题库2023年
计量经济学_西南财经大学中国大学mooc课后章节答案期末考试题库2023年1.通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与样本容量大小有关。
答案:错误2.表示X和Y之间真实线性关系的总体回归模型是()答案:3.时间序列数据中更容易出现异方差性。
答案:错误4.DW检验适用于下列哪种情况的检验()答案:正的一阶自回归形式的自相关性5.DW统计量的取值范围是()答案:6.如果一元线性回归模型中存在自相关性,则OLS估计不具有下列哪个性质()答案:有效性7.下列哪个选项描述的是一元线性回归模型【图片】中的自相关性()答案:8.利用估计的自回归系数【图片】一定能消除自相关性。
答案:错误9.当随机扰动项存在异方差性时,应该使用加权最小二乘法估计回归模型中的参数。
答案:正确10.用DW统计量估计自回归系数【图片】只适用于一阶自相关性。
答案:正确11.自相关性都会造成低估OLS估计量的真实方差。
答案:错误12.截面数据中不会出现自相关性。
答案:错误13.考虑一个样本量为100的多元回归模型【图片】,若去掉中间的20个观测值进行GQ检验,则检验统计量在原假设下服从()分布答案:F(37, 37)14.对三元回归模型【图片】,样本量用n表示。
考虑包含交叉项的White检验,则检验统计量服从自由度为()的卡方分布。
答案:915.下列哪个异方差检验不能诊断出是由哪个解释变量引起的异方差性()答案:ARCH检验16.异方差性是指随机扰动项的方差会随解释变量的变化而变化。
答案:正确17.反映由模型中解释变量所解释的那部分离差大小的是()答案:回归平方和18.虚拟变量的取值只能取0或1。
答案:错误19.在计量经济学的参数估计中,以下哪一项不属于参数估计“尽可能接近真实值”的判断标准是()答案:渐进正态性20.关于古典假定与统计性质的关系,以下说法正确的是()答案:若零均值假定不成立,则OLS的无偏性和有效性都会受到影响。
多元线性回归模型常见问题及解决方法
Yi 0 1 X i1 2 X i 2
k X ik i ; i 1, 2, , n
基本假设 (1)随机扰动项ui数学期望(均值)为零。E(ui)=0 (2)随机扰动项ui的同方差性且无自相关Var(ui)=σ2 (3)解释变量X列线性无关。R(Xn×k)=K (4)随机扰动项ui与解释变量X不相关。cov(ui,X)=0
0 0 0 1 2 0
0 0 0 1 2
0 0 0 0 1
Yt 0 1 X t1
k X tk Yt 1 t
(4)回归模型含有截距项。 D.W.检验的原假设为:H0: ρ=0,即μt不存在一 阶自回归。
构造统计量:
DW . .
2 ( e e ) t t 1 t 2 2 e t t 1 n
n
该统计量的分布与给定样本中的X值有复杂关 系,其精确分布很难得到。
n1 n 2 2 n
其中,Ω为对称正定矩阵,故存在一可逆矩阵 D,使得 Ω=DD’ 用D-1左乘模型两边,得到新模型: D-1Y=D-1Xβ+D-1μ 即Y*=X*β+μ*
由于 E ( * * ') E[ D 1 '( D 1 ) '] D 1E ( ')( D 1 ) ' D 1 2( D 1 ) ' D 1 2 DD '( D 1 ) ' 2 I 故,可用普通最小二乘法估计新模型,记参数 ˆ * ,则 估计量为 ˆ * ( X * ' X * )1 X * ' Y * [ X '( D 1 ) ' D 1 X ]1 X '( D 1 ) ' D 1Y
判断题
判断题1.线性回归模型中,解释变量是原因,被解释变量是结果。
(F)2.多元回归模型统计显著是指模型中每个变量都是统计显著的。
(F)3.在存在异方差情况下,常用的OLS法总是高估了估计量的标准差。
(F)4.总体回归线是当解释变量取给定值时因变量的条件均值的轨迹。
(Y)5.线性回归是指解释变量和被解释变量之间呈现线性关系。
(F)6.判定系数2R的大小不受回归模型中所包含的解释变量个数的影响。
( F )7.多重共线性是一种随机误差现象。
(F)8.当存在自相关时,OLS估计量是有偏的并且也是无效的。
( F )9.在异方差的情况下, OLS估计量误差放大的原因是从属回归的2R变大。
( F )10.任何两个计量经济模型的2R都是可以比较的。
( F )1. 随机误差项iu和残差项ie是一回事。
( F )2. 给定显著性水平a及自由度,若计算得到的t值超过临界的t值,我们将接受零假设( F )3. 利用OLS法求得的样本回归直线ttXbbY21ˆ通过样本均值点),(YX。
( T )4. 判定系数ESSTSSR2。
( F )5. 整个多元回归模型在统计上是显著的意味着模型中任何一个单独的变量均是统计显著的。
( F )6. 双对数模型的2R值可以与对数线性模型的相比较,但不能与线性对数模型的相比较。
( T )7. 为了避免陷入虚拟变量陷阱,如果一个定性变量有m类,则要引入m个虚拟变量。
( F )8. 在存在异方差情况下,常用的OLS法总是高估了估计量的标准差。
( T )9. 识别的阶条件仅仅是判别模型是否可识别的必要条件而不是充分条件。
( T )10. 如果零假设H0:B2=0,在显著性水平5%下不被拒绝,则认为B2一定是0。
( F )1. 回归分析用来处理一个因变量与另一个或多个自变量之间的因果关系。
( F )2. 拟合优度R2的值越大,说明样本回归模型对总体回归模型的代表性越强。
( T )3. 线性回归是指解释变量和被解释变量之间呈现线性关系。
自相关性习题及答案
自相关性一、名词解释1 序列相关性2 虚假序列相关3 差分法4 广义差分法5 自回归模型6 广义最小二乘法7 DW 检验8 科克伦-奥克特跌代法9 Durbin 两步法 10 相关系数二、单项选择题1、如果模型y t =b 0+b 1x t +u t 存在序列相关,则A.covx t , u t =0B.covu t , u s =0t ≠sC. covx t , u t ≠0D. covu t , u s ≠0t ≠s 2、DW 检验的零假设是ρ为随机误差项的一阶相关系数 A 、DW =0 B 、ρ=0 C 、DW =1 D 、ρ=13、下列哪个序列相关可用DW 检验v t 为具有零均值,常数方差且不存在序列相关的随机变量A .u t =ρu t -1+v tB .u t =ρu t -1+ρ2u t -2+…+v tC .u t =ρv tD .u t =ρv t +ρ2v t-1 +… 4、DW 的取值范围是A 、-1≤DW ≤0B 、-1≤DW ≤1C 、-2≤DW ≤2D 、0≤DW ≤4 5、当DW =4时,说明A 、不存在序列相关B 、不能判断是否存在一阶自相关C 、存在完全的正的一阶自相关D 、存在完全的负的一阶自相关6、根据20个观测值估计的结果,一元线性回归模型的DW =2.3;在样本容量n=20,解释变量k=1,显著性水平为0.05时,查得dl=1,du=1.41,则可以决断 A 、不存在一阶自相关 B 、存在正的一阶自相关 C 、存在负的一阶自 D 、无法确定7、当模型存在序列相关现象时,适宜的参数估计方法是A 、加权最小二乘法B 、间接最小二乘法C 、广义差分法D 、工具变量法 8、对于原模型y t =b 0+b 1x t +u t ,广义差分模型是指0t 1t t t 01t t t t-101t t-1t t-1b B. y =b x u C. y =b +b x uD. y y =b (1-)+b (x x )(u u )ρρρρ++++--+-9、采用一阶差分模型一阶线性自相关问题适用于下列哪种情况 A 、ρ≈0 B 、ρ≈1 C 、-1<ρ<0 D 、0<ρ<110、假定某企业的生产决策是由模型S t =b 0+b 1P t +u t 描述的其中S t 为产量,P t 为价格,又知:如果该企业在t-1期生产过剩,经营人员会削减t 期的产量;由此决断上述模型存在A 、异方差问题B 、序列相关问题C 、多重共线性问题D 、随机解释变量问题11、根据一个n=30的样本估计t 01t tˆˆy =+x +e ββ后计算得DW =1.4,已知在5%的置信度下,dl=1.35,du=1.49,则认为原模型A 、存在正的一阶自相关B 、存在负的一阶自相关C 、不存在一阶自相关D 、无法判断是否存在一阶自相关;12对于模型t 01t tˆˆy =+x +e ββ,以ρ表示e t 与e t-1之间的线性相关关系t=1,2,…T,则下列明显错误的是A 、ρ=0.8,DW =0.4B 、ρ=-0.8,DW =-0.4C 、ρ=0,DW =2D 、ρ=1,DW =0 13、同一统计指标按时间顺序记录的数据列称为A.横截面数据B.时间序列数据C.修匀数据D.原始数据 三、多项选择题1、DW 检验不适用一下列情况的序列相关检验 A 、高阶线性自回归形式的序列相关 B 、一阶非线性自回归的序列相关 C 、移动平均形式的序列相关D 、正的一阶线性自回归形式的序列相关E 、负的一阶线性自回归形式的序列相关 2、以dl 表示统计量DW 的下限分布,du 表示统计量DW 的上限分布,则DW 检验的不确定区域是A 、du ≤DW ≤4-duB 、4-du ≤DW ≤4-dlC 、dl ≤DW ≤duD 、4-dl ≤DW ≤4E 、0≤DW ≤dl3、DW 检验不适用于下列情况下的一阶线性自相关检验A 、模型包含有随机解释变量B 、样本容量太小C 、非一阶自回归模型D 、含有滞后的被解释变量E 、包含有虚拟变量的模型4、针对存在序列相关现象的模型估计,下述哪些方法可能是适用的 A 、加权最小二乘法 B 、一阶差分法 C 、残差回归法 D 、广义差分法 D 、Durbin 两步法5、如果模型y t =b 0+b 1x t +u t 存在一阶自相关,普通最小二乘估计仍具备 A 、线性 B 、无偏性 C 、有效性 D 、真实性 E 、精确性6、DW 检验不能用于下列哪些现象的检验 A 、递增型异方差的检验B 、u t =ρu t -1+ρ2u t -2+v t 形式的序列相关检验 C 、x i =b 0+b 1x j +u t 形式的多重共线性检验D 、t 01t 2t-1tˆˆˆy =+x +y +e βββ的一阶线性自相关检验 E 、遗漏重要解释变量导致的设定误差检验四、简答题1.简述DW 检验的局限性; 2.序列相关性的后果;3.简述序列相关性的几种检验方法;4.广义最小二乘法GLS 的基本思想是什么 5.解决序列相关性的问题主要有哪几种方法 6.差分法的基本思想是什么7.差分法和广义差分法主要区别是什么 8.请简述什么是虚假序列相关;9.序列相关和自相关的概念和范畴是否是一个意思 10.DW 值与一阶自相关系数的关系是什么 五、计算分析题1.根据某地1961—1999年共39年的总产出Y 、劳动投入L 和资本投入K 的年度数据,运用普通最小二乘法估计得出了下列回归方程:0.237 0.083 0.048 ,DW=0.858上式下面括号中的数字为相应估计量的标准误差;在5%的显著性水平之下,由DW 检验临界值表,得d L =1.38,d u =1.60;问;1 题中所估计的回归方程的经济含义;2 该回归方程的估计中存在什么问题 应如何改进 2.根据我国1978——2000年的财政收入Y 和国内生产总值X 的统计资料,可建立如下的计量经济模型:X Y ⨯+=1198.06477.5562.5199 22.72292R =0.9609,E S .=731.2086,F =516.3338,W D .=0.3474 请回答以下问题:(1) 何谓计量经济模型的自相关性(2) 试检验该模型是否存在一阶自相关,为什么 (3) 自相关会给建立的计量经济模型产生哪些影响(4) 如果该模型存在自相关,试写出消除一阶自相关的方法和步骤;临界值24.1=L d ,43.1=U d3.对某地区大学生就业增长影响的简单模型可描述如下t t t t t gGDP gGDP gPOP gMIN gEMP μβββββ+++++=4132110式中,为新就业的大学生人数,MIN1为该地区最低限度工资,POP 为新毕业的大学生人数,GDP1为该地区国内生产总值,GDP 为该国国内生产总值;g 表示年增长率;1如果该地区政府以多多少少不易观测的却对新毕业大学生就业有影响的因素作为基础来选择最低限度工资,则OLS 估计将会存在什么问题2令MIN 为该国的最低限度工资,它与随机扰动项相关吗3按照法律,各地区最低限度工资不得低于国家最低工资,哪么gMIN 能成为gMIN1的工具变量吗4 下表给出了美国1960-1995年36年间个人实际可支配收入X 和个人实际消费支出Y 的数据;年份 个人实际可支配收入 X个人实际 消费支出 Y年份 个人实际可支配收入X个人实际消费支出Y19601961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971157 162 169 176 188 200 211 220 230 237 247 256143 146 153 160 169 180 190 196 207 215 220 228 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989326 335 337 345 348 358 384 396 409 415 432 440295 302 301 305 308 324 341 357 371 382 397 406要求:1用普通最小二乘法估计收入—消费模型;t t u X Y ++=221ββ2检验收入—消费模型的自相关状况5%显著水平;3用适当的方法消除模型中存在的问题;5 在研究生产中劳动所占份额的问题时,古扎拉蒂采用如下模型模型1 t t u t Y ++=10αα模型2 t t u t t Y +++=2210ααα其中,Y 为劳动投入,t 为时间;据1949-1964年数据,对初级金属工业得到如下结果:模型1 t Y t0041.04529.0ˆ-=t = -3.9608R 2 = 0.5284 DW = 0.8252模型2 20005.00127.04786.0ˆt t Y t+-= t = -3.27242.7777 R 2= 0.6629 DW = 1.82 其中,括号内的数字为t 统计量;问:1模型1和模型2中是否有自相关; 2如何判定自相关的存在3怎样区分虚假自相关和真正的自相关;6下表是北京市连续19年城镇居民家庭人均收入与人均支出的数据; 北京市19年来城镇居民家庭收入与支出数据表单位:元2检验模型中存在的问题,并采取适当的补救措施预以处理;3对模型结果进行经济解释;7下表给出了日本工薪家庭实际消费支出与可支配收入数据要求:1建立日本工薪家庭的收入—消费函数;2检验模型中存在的问题,并采取适当的补救措施预以处理;3对模型结果进行经济解释;8下表给出了中国进口需求Y与国内生产总值X的数据;1985~2003年中国实际GDP、进口需求单位:亿元注:; 要求:1检测进口需求模型 t t t u X Y ++=21ββ 的自相关性;2采用科克伦-奥克特迭代法处理模型中的自相关问题;9 下表给出了某地区1980-2000年的地区生产总值Y 与固定资产投资额X 的数据; 地区生产总值Y 与固定资产投资额X 单位:亿元t t t 21 进行回归,并检验回归模型的自相关性;2采用广义差分法处理模型中的自相关问题;3 令1-=t t *t X /X X 固定资产投资指数,1-=t t *t Y /Y Y 地区生产总值增长指数,使用模型 t *t *t v LnX LnY ++=21ββ,该模型中是否有自相关计量经济学题库自相关答案六、 名词解释1.序列相关性:对于模型01122i i k ki i y x x x i ββββμ=+++++… 1,2,,i n =…随机误差项互相独立的基本假设表现为(,)0i j Cov μμ= ,,1,2,,i j i j n ≠=… 如果出现 (,)0i j Cov μμ≠ ,,1,2,,i j i j n ≠=…即对于不同的样本点,随机误差项之间不再是完全互相独立,而是存在某种相关性,则认为出现了序列相关性Serial Correlation;2.虚假序列相关:是指模型的序列相关性是由于省略了显著的解释变量而导致的; 3 差分法:差分法是一类克服序列相关性的有效方法,被广泛的采用;差分法是将原模型变换为差分模型,分为一阶差分法和广义差分法; 4 广义差分法:广义差分法可以克服所有类型的序列相关带来的问题,一阶差分法是它的一个特例;5 自回归模型:t t t y y μρ+=-16 广义最小二乘法:是最有普遍意义的最小二乘法,普通最小二乘法和加权最小二乘法是它的特例;7 DW 检验:德宾和瓦特森与1951年提出的一种适于小样本的检验方法;DW 检验法有五个前提条件略8科克伦-奥克特跌代法:是通过逐次跌代去寻求更为满意的ρ的估计值,然后再采用广义差分法;具体来说,该方法是利用残差t μ去估计未知的ρ;9 Durbin 两步法:当自相关系数ρ未知,可采用Durbin 提出的两步法去消除自相关;第一步对一多元回归模型,使用OLS 法估计其参数,第二步再利用广义差分;10.相关系数:度量变量之间相关程度的一个系数,一般用ρ表示;)()()(C j i j i Var Var ov μμμμρ=,10≤≤ρ ,越接近于1,相关程度越强,越接近于0,相关程度越弱;七、 单项选择题答案: 1D2B3A4D 5D6A7C8D9B10B11D12B13B 八、 多项选择题答案:1ABC 2BC 3BCD4BDE5AB6ABCDE 九、 判断题 1F2F3F4F 5F 6F十、 简答题1.简述DW 检验的局限性; 答:从判断准则中看到,DW 检验存在两个主要的局限性:首先,存在一个不能确定的..DW 值区域,这是这种检验方法的一大缺陷;其次:..DW 检验只能检验一阶自相关;但在实际计量经济学问题中,一阶自相关是出现最多的一类序列相关,而且经验表明,如果不存在一阶自相关,一般也不存在高阶序列相关;所以在实际应用中,对于序列相关问题—般只进行..DW 检验;2.序列相关性的后果;3.简述序列相关性的几种检验方法;4.广义最小二乘法GLS 的基本思想是什么 5.解决序列相关性的问题主要有哪几种方法 6.差分法的基本思想是什么7.差分法和广义差分法主要区别是什么 8.请简述什么是虚假序列相关;9.序列相关和自相关的概念和范畴是否是一个意思 10.DW 值与一阶自相关系数的关系是什么 十一、 计算分析题1.答案:1 题中所估计的回归方程的经济含义;该回归方程是一个对数线性模型,可还原为指数的形式为:3841.0451.1938.3Y K L -=∧,是一个C-D 函数,1.451为劳动产出弹性,0.3841为资本产出弹性;因为1.451+0.3841〉1,所以该生产函数存在规模经济; 2 该回归方程的估计中存在什么问题 应如何改进因为DW=0.858, d L =1.38,即0.858<1.38,故存在一阶正自相关;可利用GLS 方法消除自相关的影响;2.1何谓计量经济模型的自相关性答:如果对于不同的样本点,随机误差项之间不再是完全互相独立,而是存在某种相关性,则出现序列相关性;如存在:0,)(E 1i i ≠+μμ称为一阶序列相关,或自相关;2试检验该模型是否存在一阶自相关,为什么 答:存在; 3自相关会给建立的计量经济模型产生哪些影响答:1参数估计两非有效;2 变量的显著性检验失去意义;3模型的预测失效; 4如果该模型存在自相关,试写出消除一阶自相关的方法和步骤; 临界值24.1=L d ,43.1=U d答:1构造D.W 统计量并查表;2与临界值相比较,以判断模型的自相关状态; 3.答案:1由于地方政府往往是根据过去的经验、当前的经济状况以及期望的经济发展前景来定制地区最低限度工资水平的,而这些因素没有反映在上述模型中,而是被归结到了模型的随机扰动项中,因此 gMIN1 与μ不仅异期相关,而且往往是同期相关的,这将引起OLS 估计量的偏误,甚至当样本容量增大时也不具有一致性;2全国最低限度的制定主要根据全国国整体的情况而定,因此gMIN 基本与上述模型的随机扰动项无关;3由于地方政府在制定本地区最低工资水平时往往考虑全国的最低工资水平的要求,因此gMIN1与gMIN 具有较强的相关性;结合2知gMIN 可以作为gMIN1的工具变量使用; 练习题4参考解答:1收入—消费模型为tt X Y 0.93594287.9ˆ+-=Se = 2.5043 0.0075 t = -3.7650 125.3411R 2 = 0.9978,F = 15710.39,d f = 34,DW = 0.52342对样本量为36、一个解释变量的模型、5%显著水平,查DW 统计表可知,d L =1.411,d U = 1.525,模型中DW<d L ,显然消费模型中有自相关;3采用广义差分法e t = 0.72855 e t-1**9484.07831.3ˆtt X Y +-=)8710.1(=Se 0.0189t = -2.0220 50.1682R 2 = 0.9871 F = 2516.848 d f = 33 DW = 2.0972查5%显著水平的DW 统计表可知d L = 1.402,d U = 1.519,模型中DW = 2.0972> d U ,说明广义差分模型中已无自相关;同时,判定系数R 2、t 、F 统计量均达到理想水平;9366137285501783131...ˆ=--=β最终的消费模型为Y t = 13.9366+0.9484 X t练习题5参考解答:略 练习题6参考解答:1收入—消费模型为2ˆ79.9300.690(6.38)(12.399)(0.013)(6.446)(53.621)0.9940.575t tY X Se t R DW =+====2DW =0.575,取%5=α,查DW 上下界18.1,40.1,18.1<==DW d d U L ,说明误差项存在正自相关;3采用广义差分法使用普通最小二乘法估计ρ的估计值ρˆ,得 ).(t ).(Se e .e t t 7013178065701===-83019850416324434021010586690010362.DW .R ).().(t ).().(Se X ..Yˆ*t*t====+=DW =1.830,已知2,40.1<<=DW d d U U ;因此,在广义差分模型中已无自相关;据010.36)ˆ1(ˆ1=-ρβ,可得: 985.104657.01010.36ˆ1=-=β因此,原回归模型应为t t X Y 669.0985.104+=练习题7参考解答:略 练习题8参考解答:1进口需求模型为tt X ..Y ˆ2883069202356+-=Se = 785.1308 0.0285 t = -3.0017 10.1307 R 2= 0.8875,F = 102.6305,d f = 13,DW = 0.6307样本量n =15、一个解释变量的模型、1%显著水平,查DW 统计表可知,d L =0.811, d U = 1.054,模型中DW<d L ,显然进口需求模型中有自相关; 2采用科克伦-奥克特迭代法e t = 0.8264 e t-1 ,82640.ˆ=ρ令 ,Y .Y Y t t *t 182640--=,X .X X t t *t 182640--= 因为n =15, 样本容量较小,需采用普莱斯—温斯腾变换补充第一个观测值;4371011211.ˆX X *=-=ρ,749211211.ˆY Y *=-=ρ;*t Y 对*t X 回归,得 *t *t X ..Y ˆ4587020501450+-= ).(Se 9315651= 0.0953t = -2.2245 4.8153R 2 = 0.6408 F = 23.1871 d f = 13 DW = 1.2873模型中DW = 1.2873> d U ,说明广义差分模型中已无自相关;71548353826401205014501...ˆ-=--=β最终的进口需求模型为Y t = -835.7154+0.4587 X t。
应用回归分析课后习题
#;
.
第四章 习题
4.1 试举例说明产生异常差的原因。 4.2 异常差性带来的后果有哪些? 4.3 阐述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。 4.4 阐述用加权最小二乘法消除多元线性回归中异常差性的思想与方法。 4.5 验证(4.5)式一元加权最小二乘回归系数估计公式。 4.6 验证(4.8)式多元加权最小二乘回归系数估计公式。 4.7 有同学认为当数据存在异常差时,加权最小二乘回归方程与普通最小二乘回归方程之间 必然有很大的差异,异常差越严重,两者之间的差异就越大。你是否同意这位同学的观点? 说明原因。
(8) 做回归系数 1 显著性的检验
(9) 做相关系数的显著性检验 (10) 对回归方程做残差图并作相应的分析
#;
. (11) 该公司预计下一周签发新保单 x0 1000 ,需要的加班时间是多少。 (12) 给出 y0 的置信度为 95%的精确预测区间和近似预测区间。 (13) 给出 Ey0 的置信度为 95%的区间估计。
3.9 证明 y 与自变量 x j 的偏决定系数与(3.42)式的偏 F 检验值 Fj 是的等价的。
3.10* 验证决定系数与 F 值之间的关系式
R2
F
n
F p
1
p
3.11 研究货运总量 y(万吨)与工业总产值 x1 (亿元)、农业总产值 x2 (亿元)、居民非商
品支出 x3 (亿元)的关系。数据见表 3.9。
2.16* 表 2.8 是 1985 年美国 50 个州和哥伦比亚特区公立学校中教师的人均年工资 y(美元) 和对学生的人均经费收入 x(美元)。 (1)绘制 y 对 x 的散点图,可以用直线回归描述两者之间的关系吗? (2)建立 y 对 x 的线性回归。 (3)用线性回归的 Plots 功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假 设。
第章线性回归分析详解演示文稿
上式表明:y的变化可由两部分解释:第一,由解释
变量x的变化引起的y的线性变化部分,即y=β0+β1x; 第二,由其他随机因素引起的y的变化部分,即ε。 β0 、β1 都是模型中的未知参数,β0为回归常数,β1为 y对x回归系数(即x每变动一个单位所引起的y的平
一元二乘估计:
多元二乘估计(略)
第十一页,共52页。
9.3回归方程的统计检验
拟合优度检验 回归方程的显著性检验
回归系数的显著性检验 残差分析
第十二页,共52页。
9.3.1回归方程的拟合优度检验
用于检验样本数据点聚集在回归线周围的密集程度, 从而评价回归线对样本数据的代表程度。 思想:因变量y(儿子身高)取值的变化受两个因素
第二十九页,共52页。
第二、计算残差的自相关系数 自相关系数用于测定序列自相关强弱,其取值范围 -1~+1,接近1表明序列存在正自相关
第三十页,共52页。
第三、DW(durbin-watson)检验
DW检验用于推断小样本序列是否存在自相关的方法。其原 假设为:总体自相关系数ρ与零无显著差异。采用统计量 为:
的影响:自变量x(父亲身高)不同取值的影响,其 他因素(环境、饮食等)的影响。
可表示如下:
因变量总变差 = 自变量引起的 + 其他因素引起的 即因变量总变差= 回归方程可解释的+不可解释的 即,因变量总离差平方和SST =回归平方和 SSA + 剩余平
方和SSE
第十三页,共52页。
图示:
y y i
素对 y 的影响造成的。
第十五页,共52页。
一、一元线性回归方程
拟合优度的检验采用R2统计量,称为判定系数
一元线性回归模型习题和答案解析
一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类__________;AA 函数关系与相关关系B 线性相关关系和非线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系 2、相关关系是指__________;DA 变量间的非独立关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________;AA 都是随机变量B 都不是随机变量C 一个是随机变量,一个不是随机变量D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________;CA 01ˆˆˆt tY X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+5、参数β的估计量ˆβ具备有效性是指__________;B A ˆvar ()=0βB ˆvar ()β为最小C ˆ()0ββ-= D ˆ()ββ-为最小 6、对于01ˆˆi i iY X e ββ=++,以σˆ表示估计标准误差,Y ˆ表示回归值,则__________;B A i i ˆˆ0Y Y 0σ∑=时,(-)=B 2iiˆˆ0Y Y σ∑=时,(-)=0 C ii ˆˆ0Y Y σ∑=时,(-)为最小 D 2iiˆˆ0Y Yσ∑=时,(-)为最小 7、设样本回归模型为i 01i iˆˆY =X +e ββ+,则普通最小二乘法确定的i ˆβ的公式中,错误的是__________;DA ()()()i i 12iX X Y -Y ˆX X β--∑∑=B ()i iii122iin X Y -X Y ˆn X -X β∑∑∑∑∑=C ii122iX Y -nXY ˆX -nX β∑∑= D i i ii12xn X Y -X Y ˆβσ∑∑∑=8、对于i 01i iˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有__________;D A ˆ0r=1σ=时, B ˆ0r=-1σ=时, C ˆ0r=0σ=时, D ˆ0r=1r=-1σ=时,或 9、产量X,台与单位产品成本Y,元/台之间的回归方程为ˆY356 1.5X -=,这说明__________;DA 产量每增加一台,单位产品成本增加356元B 产量每增加一台,单位产品成本减少元C 产量每增加一台,单位产品成本平均增加356元D 产量每增加一台,单位产品成本平均减少元10、在总体回归直线01ˆE Y X ββ+()=中,1β表示__________;B A 当X 增加一个单位时,Y 增加1β个单位 B 当X 增加一个单位时,Y 平均增加1β个单位 C 当Y 增加一个单位时,X 增加1β个单位 D 当Y 增加一个单位时,X 平均增加1β个单位11、对回归模型i 01i i Y X u ββ+=+进行检验时,通常假定i u 服从__________;CA 2i N 0) σ(, B t(n-2) C 2N 0)σ(, D t(n)12、以Y 表示实际观测值,ˆY表示回归估计值,则普通最小二乘法估计参数的准则是使__________;Di i 2i i i i 2i i ˆA Y Y 0ˆB Y Y 0ˆC Y Y ˆD Y Y ∑∑∑∑ (-)= (-)= (-)=最小 (-)=最小13、设Y 表示实际观测值,ˆY表示OLS 估计回归值,则下列哪项成立__________;D ˆˆA YY B Y Y ˆˆC YY D Y Y = = = =14、用OLS 估计经典线性模型i 01i i Y X u ββ+=+,则样本回归直线通过点_________;DˆA X Y B X YˆC X YD X Y (,) (,) (,) (,)15、以Y 表示实际观测值,ˆY表示OLS 估计回归值,则用OLS 得到的样本回归直线i 01iˆˆˆY X ββ+=满足__________;A ii2i i 2i i 2i i ˆA Y Y 0B Y Y 0ˆC Y Y 0ˆD Y Y 0∑∑∑∑ (-)= (-)= (-)= (-)=16、用一组有30个观测值的样本估计模型i 01i i Y X u ββ+=+,在的显著性水平下对1β的显著性作t 检验,则1β显著地不等于零的条件是其统计量t 大于__________;D A 30 B 30 C 28 D 2817、已知某一直线回归方程的判定系数为,则解释变量与被解释变量间的线性相关系数为__________;BA B C D18、相关系数r 的取值范围是__________;DA r ≤-1B r ≥1C 0≤r ≤1D -1≤r ≤1 19、判定系数R 2的取值范围是__________;CA R2≤-1B R2≥1C 0≤R2≤1D -1≤R2≤120、某一特定的X 水平上,总体Y 分布的离散度越大,即σ2越大,则__________;AA 预测区间越宽,精度越低B 预测区间越宽,预测误差越小C 预测区间越窄,精度越高D 预测区间越窄,预测误差越大 22、如果X 和Y 在统计上独立,则相关系数等于__________;C A 1 B -1 C 0 D ∞23、根据决定系数R 2与F 统计量的关系可知,当R 2=1时,有__________;D A F =1 B F =-1 C F =0 D F =∞24、在C —D 生产函数βαK AL Y =中,__________;A A.α和β是弹性 和α是弹性 和β是弹性 是弹性25、回归模型i i i u X Y ++=10ββ中,关于检验010=β:H 所用的统计量)ˆ(ˆ111βββVar -,下列说法正确的是__________;DA 服从)(22-n χ B 服从)(1-n t C 服从)(12-n χ D 服从)(2-n t26、在二元线性回归模型i i i i u X X Y +++=22110βββ中,1β表示__________;A A 当X2不变时,X1每变动一个单位Y 的平均变动; B 当X1不变时,X2每变动一个单位Y 的平均变动; C 当X1和X2都保持不变时,Y 的平均变动;D 当X1和X2都变动一个单位时,Y 的平均变动;27、在双对数模型i i i u X Y ++=ln ln ln 10ββ中,1β的含义是__________;DA Y 关于X 的增长量B Y 关于X 的增长速度C Y 关于X 的边际倾向D Y 关于X 的弹性26、根据样本资料已估计得出人均消费支出Y 对人均收入X 的回归模型为i i X Y ln 75.000.2ln +=,这表明人均收入每增加1%,人均消费支出将增加__________;CA 2%B %C %D %28、按经典假设,线性回归模型中的解释变量应是非随机变量,且__________;A A 与随机误差项不相关 B 与残差项不相关 C 与被解释变量不相关 D 与回归值不相关29、根据判定系数R 2与F 统计量的关系可知,当R 2=1时有__________; C =1 =-1 =∞ =0 30、下面说法正确的是__________; DA.内生变量是非随机变量B.前定变量是随机变量C.外生变量是随机变量D.外生变量是非随机变量31、在具体的模型中,被认为是具有一定概率分布的随机变量是__________;A A.内生变量 B.外生变量 C.虚拟变量 D.前定变量 32、回归分析中定义的__________;B A.解释变量和被解释变量都是随机变量B.解释变量为非随机变量,被解释变量为随机变量C.解释变量和被解释变量都为非随机变量D.解释变量为随机变量,被解释变量为非随机变量33、计量经济模型中的被解释变量一定是__________;C A .控制变量 B .政策变量 C .内生变量 D .外生变量 二、多项选择题1、指出下列哪些现象是相关关系__________;ACDA 家庭消费支出与收入B 商品销售额与销售量、销售价格C 物价水平与商品需求量D 小麦高产与施肥量E 学习成绩总分与各门课程分数2、一元线性回归模型i 01i i Y X u ββ+=+的经典假设包括__________;ABCDEA ()0t E u =B 2var()t u σ=C cov(,)0t s u u =D (,)0t t Cov x u =E 2~(0,)t u N σ3、以Y 表示实际观测值,ˆY表示OLS 估计回归值,e 表示残差,则回归直线满足__________;ABEii2i i 2i i i i A X Y ˆB Y YˆC Y Y 0ˆD Y Y 0E cov(X ,e )=0∑∑∑∑ 通过样本均值点(,) = (-)= (-)= 4、ˆY 表示OLS 估计回归值,u 表示随机误差项,e 表示残差;如果Y 与X 为线性相关关系,则下列哪些是正确的__________;ACi 01ii1ii 01i i i1iii 01i A E Y X ˆˆB Y X ˆˆC Y X e ˆˆˆD YX e ˆˆE E(Y )X ββββββββββ+++++++ ()= = ===5、ˆY表示OLS 估计回归值,u 表示随机误差项;如果Y 与X 为线性相关关系,则下列哪些是正确的__________;BEi 01i i 01i ii1iii 01i ii1iA Y XB Y X u ˆˆC Y X u ˆˆˆD Y X u ˆˆˆE YX ββββββββββ+++++++ = =+ ===6、回归分析中估计回归参数的方法主要有__________;CDE A 相关系数法 B 方差分析法 C 最小二乘估计法 D 极大似然法 E 矩估计法7、用OLS 法估计模型i 01i i Y X u ββ+=+的参数,要使参数估计量为最佳线性无偏估计量,则要求__________;ABCDEA i E(u )=0B 2i Var(u )=σC i j Cov(u ,u )=0D i u 服从正态分布E X 为非随机变量,与随机误差项i u 不相关;8、假设线性回归模型满足全部基本假设,则其参数的估计量具备__________;CDE A 可靠性 B 合理性 C 线性 D 无偏性E 有效性9、普通最小二乘估计的直线具有以下特性__________;ABDE A 通过样本均值点(,)X YBˆii Y Y =∑∑C 2ˆ()0iiY Y-=∑ D 0ie =∑E (,)0i i Cov X e =10、由回归直线i 01iˆˆˆY X ββ+=估计出来的i ˆY 值__________;ADE A 是一组估计值 B 是一组平均值C 是一个几何级数D 可能等于实际值YE 与实际值Y 的离差之和等于零11、反映回归直线拟合优度的指标有__________; A 相关系数 B 回归系数C 样本决定系数D 回归方程的标准差E 剩余变差或残差平方和12、对于样本回归直线i 01i ˆˆˆY X ββ+=,回归变差可以表示为__________;ABCDE A 22i i i iˆY Y -Y Y ∑∑ (-) (-) B 221iiˆX X β∑(-) C 22ii R Y Y ∑(-)D 2iiˆYY ∑(-) E 1iiiiˆ X X Y Y β∑(-()-) 13对于样本回归直线i 01iˆˆˆY X ββ+=,ˆσ为估计标准差,下列决定系数的算式中,正确的有__________;ABCDEA 2i i 2iiˆY Y Y Y ∑∑(-)(-) B 2i i 2iiˆY Y 1Y Y ∑∑(-)-(-)C 221ii 2iiˆX X Y Y β∑∑(-)(-) D 1i ii i2i iˆX X Y Y Y Y β∑∑(-()-)(-)E 22iiˆn-2)1Y Y σ∑(-(-)14、下列相关系数的算式中,正确的有__________;ABCDE A X YXY XYσσ-BiiiiX YX X Y Y n σσ∑(-()-)C X Ycov (X,Y)σσDX X Y Y (-()-) E2X Y -nX Y∑15、判定系数R 2可表示为__________;BCEA 2RSSR =TSS B 2ESS R =TSSC 2RSS R =1-TSS D 2ESS R =1-TSS E 2ESS R =ESS+RSS16、线性回归模型的变通最小二乘估计的残差i e 满足__________;ACDEAi e 0∑= B i i e Y 0∑=C i iˆe Y0∑= D i ie X 0∑=E i i cov(X ,e )=017、调整后的判定系数2R 的正确表达式有__________;BCDA 2i i 2iiY Y /(n-1)ˆY Y /(n-k)∑∑(-)1-(-) B 2ii2iiˆY Y /(n-k-1)1Y Y /(n-1)∑∑(-)-(-)C 2(n-1)1(1-R )(n-k-1)- D 22k(1-R )R n-k-1-E 2(n-k)1(1+R )(n-1)- 18、对总体线性回归模型进行显著性检验时所用的F 统计量可表示为__________;BC AESS/(n-k)RSS/(k-1) B ESS/(k-1)RSS/(n-k)C 22R /(k-1)(1-R )/(n-k)D 22(1-R )/(n-k)R /(k-1) E 22R /(n-k)(1-R )/(k-1)三、名词解释函数关系与相关关系 线性回归模型总体回归模型与样本回归模型 最小二乘法高斯-马尔可夫定理 总变量总离差平方和 回归变差回归平方和 剩余变差残差平方和 估计标准误差 样本决定系数 相关系数 显著性检验 t 检验 经济预测 点预测 区间预测 拟合优度 残差 四、简答1、在计量经济模型中,为什么会存在随机误差项答:①模型中被忽略掉的影响因素造成的误差;②模型关系认定不准确造成的误差;③变量的测量误差;④随机因素;这些因素都被归并在随机误差项中考虑;因此,随机误差项是计量经济模型中不可缺少的一部分;2、古典线性回归模型的基本假定是什么答:①零均值假定;即在给定x t 的条件下,随机误差项的数学期望均值为0,即t E(u )=0;②同方差假定;误差项t u 的方差与t 无关,为一个常数;③无自相关假定;即不同的误差项相互独立;④解释变量与随机误差项不相关假定;⑤正态性假定,即假定误差项t u 服从均值为0,方差为2σ的正态分布;3、总体回归模型与样本回归模型的区别与联系;答:主要区别:①描述的对象不同;总体回归模型描述总体中变量y 与x 的相互关系,而样本回归模型描述所观测的样本中变量y 与x 的相互关系;②建立模型的不同;总体回归模型是依据总体全部观测资料建立的,样本回归模型是依据样本观测资料建立的;③模型性质不同;总体回归模型不是随机模型,样本回归模型是随机模型,它随着样本的改变而改变;主要联系:样本回归模型是总体回归模型的一个估计式,之所以建立样本回归模型,目的是用来估计总体回归模型;4、试述回归分析与相关分析的联系和区别;答:两者的联系:①相关分析是回归分析的前提和基础;②回归分析是相关分析的深入和继续;③相关分析与回归分析的有关指标之间存在计算上的内在联系;两者的区别:①回归分析强调因果关系,相关分析不关心因果关系,所研究的两个变量是对等的;②对两个变量x 与y 而言,相关分析中:xy yx r r =;但在回归分析中,01ˆˆˆt ty b b x =++和01ˆˆˆt t xa a y =++却是两个完全不同的回归方程;③回归分析对资料的要求是:被解释变量y 是随机变量,解释变量x 是非随机变量;相关分析对资料的要求是两个变量都随机变量;5、在满足古典假定条件下,一元线性回归模型的普通最小二乘估计量有哪些统计性质答:①线性,是指参数估计量0ˆb 和1ˆb 分别为观测值t y 和随机误差项t u 的线性函数或线性组合;②无偏性,指参数估计量0ˆb 和1ˆb 的均值期望值分别等于总体参数0b 和1b ;③有效性最小方差性或最优性,指在所有的线性无偏估计量中,最小二乘估计量0ˆb 和1ˆb 的方差最小; 6、简述BLUE 的含义;答:在古典假定条件下,OLS 估计量0ˆb 和1ˆb 是参数0b 和1b 的最佳线性无偏估计量,即BLUE,这一结论就是著名的高斯-马尔可夫定理;7、对于多元线性回归模型,为什么在进行了总体显著性F 检验之后,还要对每个回归系数进行是否为0的t 检验答:多元线性回归模型的总体显著性F 检验是检验模型中全部解释变量对被解释变量的共同影响是否显著;通过了此F 检验,就可以说模型中的全部解释变量对被解释变量的共同影响是显著的,但却不能就此判定模型中的每一个解释变量对被解释变量的影响都是显著的;因此还需要就每个解释变量对被解释变量的影响是否显著进行检验,即进行t 检验;五、综合题X:年均汇率日元/美元 Y:汽车出口数量万辆 问题:1画出X 与Y 关系的散点图; 2计算X 与Y 的相关系数;其中X 129.3=,Y 554.2=,2X X 4432.1∑(-)=,2YY 68113.6∑(-)=,()()X X Y Y ∑--=16195.43若采用直线回归方程拟和出的模型为ˆ81.72 3.65YX =+ t 值 R 2= F=解释参数的经济意义; 解答:1散点图如下:30040050060070080100120140160180X Y2()()XY X X Y Y r --===3截距项表示当美元兑日元的汇率为0时日本的汽车出口量,这个数据没有实际意义;斜率项表示汽车出口量与美元兑换日元的汇率正相关,当美元兑换日元的汇率每上升1元,会引起日本汽车出口量上升万辆;2、已知一模型的最小二乘的回归结果如下:i iˆY =101.4-4.78X 标准差 n=30 R 2=其中,Y :政府债券价格百美元,X :利率%; 回答以下问题:1系数的符号是否正确,并说明理由;2为什么左边是iˆY 而不是Yi ; 3在此模型中是否漏了误差项u i ;4该模型参数的经济意义是什么;答:1系数的符号是正确的,政府债券的价格与利率是负相关关系,利率的上升会引起政府债券价格的下降;2 34常数项表示在X 取0时Y 的水平,本例中它没有实际意义;系数-表明利率X 每上升一个百分点,引起政府债券价格Y 降低478美元;3、估计消费函数模型i i i C =Y u αβ++得i i ˆC =150.81Y +t 值 n=19 R 2= 其中,C :消费元 Y :收入元已知0.025(19) 2.0930t =,0.05(19) 1.729t =,0.025(17) 2.1098t =,0.05(17) 1.7396t =; 问:1利用t 值检验参数β的显著性α=; 2确定参数β的标准差; 3判断一下该模型的拟合情况;答:1提出原假设H 0:0β=,H1:0β≠统计量t =,临界值0.025(17) 2.1098t =,由于>,故拒绝原假设H 0:0β=,即认为参数β是显著的;2由于ˆˆ()t sb ββ=,故ˆ0.81ˆ()0.043318.7sb t ββ===; 3回归模型R 2=,表明拟合优度较高,解释变量对被解释变量的解释能力为81%,即收入对消费的解释能力为81%,回归直线拟合观测点较为理想;4、已知估计回归模型得i iˆY =81.7230 3.6541X + 且2X X 4432.1∑(-)=,2Y Y 68113.6∑(-)=,求判定系数和相关系数; 答:判定系数:22122()()b X X R Y Y -=-∑∑=23.65414432.168113.6⨯==相关系数:0.9321r == 5、、有如下表数据1设横轴是U,纵轴是P ,画出散点图; 2对下面的菲力普斯曲线进行OLS 估计;1P u U αβ=++已知P3计算决定系数; 答:1散点图如下:27、根据容量n=30的样本观测值数据计算得到下列数据:22XY 146.5X 12.6Y 11.3X 164.2Y =,=,=,=,=134.6试估计Y 对X 的回归直线;8、表2-4中的数据是从某个行业5个不同的工厂收集的,请回答以下问题: 表2-4 总成本Y 与产量X 的数据Y80 44 51 70 61 X12 4 6 11 81估计这个行业的线性总成本函数:i 01iˆˆˆY =b +b X 201ˆˆb b 和的经济含义是什么3估计产量为10时的总成本;9、有10户家庭的收入X,元和消费Y,百元数据如表2-5; 表2-5 10户家庭的收入X 与消费Y 的资料X 20 30 33 40 15 13 26 38 3543 Y7 9 8 11 5 4 8 10 9 101建立消费Y 对收入X 的回归直线; 2说明回归直线的代表性及解释能力; 3在95%的置信度下检验参数的显著性;4在95%的置信度下,预测当X =45百元时,消费Y 的置信区间; 10、已知相关系数r =,估计标准ˆ8σ=误差,样本容量n=62; 求:1剩余变差;2决定系数;3总变差; 11、在相关和回归分析中,已知下列资料:222X Y i 16,10,n=20,r=0.9,(Y -Y)=2000σσ∑==1计算Y 对绵回归直线的斜率系数;2计算回归变差和剩余变差;3计算估计标准误差;12、已知:n=6,22i i i i i i X =21,Y =426,X =79,Y =30268,X Y =1481∑∑∑∑∑; 1计算相关系数;2建立Y 对的回归直线;3在5%的显著性水平上检验回归方程的显著性;13、根据对某企业销售额Y 以及相应价格X 的11组观测资料计算:22XY 117849X 519Y 217X 284958Y =,=,=,=,=490461估计销售额对价格的回归直线;2销售额的价格弹性是多少14、假设某国的货币供给量Y 与国民收入X 的历史如表2-6;图上;2如何解释回归系数的含义;3如果希望1997年国民收入达到15,那么应该把货币供给量定在什么水平15、假定有如下的回归结果 tt X Y 4795.06911.2ˆ-= 其中,Y 表示美国的咖啡消费量每天每人消费的杯数,X 表示咖啡的零售价格单位:美元/杯,t 表示时间;问:1这是一个时间序列回归还是横截面回归 做出回归线;2如何解释截距的意义它有经济含义吗如何解释斜率3能否救出真实的总体回归函数4根据需求的价格弹性定义: YX ⨯弹性=斜率,依据上述回归结果,你能救出对咖啡需求的价格弹性吗如果不能,计算此弹性还需要其他什么信息解答:1这是一个时间序列回归;图略2截距表示咖啡零售价在每磅0美元时,美国平均咖啡消费量为每天每人杯,这个没有明显的经济意义;斜率-表示咖啡零售价格与消费量负相关,表明咖啡价格每上升1美元,平均每天每人消费量减少杯;3不能;原因在于要了解全美国所有人的咖啡消费情况几乎是不可能的;4不能;在同一条需求曲线上不同点的价格弹性不同,若要求价格弹性,须给出具体的X 值及与之对应的Y 值;16、下面数据是依据10组X 和Y 的观察值得到的:李子奈书P181110=∑i Y ,1680=∑i X ,204200=∑i i Y X ,3154002=∑i X ,1333002=∑i Y 假定满足所有经典线性回归模型的假设,求10β,1β的估计值及其标准差;2决定系数2R ;3对0β,1β分别建立95%的置信区间;利用置信区间法,你可以接受零假设:01=β吗。
多元统计分析思考题
《多元统计分析思考题》第1章回归分析1、回归分析是怎样的一种统计方法,用来解决什么问题?回归分析是统计学的一个重要分支,它基于观测数据建立变量之间的某种依赖关系,分析数据的内在规律,并可用于预报、控制等方面。
当自变量的个数大于1时称为多元回归,当因变量个数大于1时称为多重回归。
2、线性回归模型中线性关系指的是什么变量之间的关系?自变量与因变量之间一定是线性关系形式才能做线性回归吗?为什么?线性关系指的是自变量和因变量之间的关系。
多重线性回归中要求前提条件是线性——自变量和因变量之间的关系是线性的、独立性——各观测值之间是独立的、正态性——指自变量取不同值时,因变量服从正态分布、方差齐性——指自变量取不同值时,因变量的方差相同3、实际应用中,如何设定回归方程的形式?(P36)①假设方程的线性关系为:,其中是未知参数,是不可观测的随机误差且服从正态分布②估计未知参数,需要进行n次独立观测,得到n组样本数据4、多元线性回归理论模型中,每个系数(偏回归系数)的含义是什么?称为(偏)回归系数,随机因变量对各个自变量的回归系数,表示各自变量对随机变量的影响程度。
5、经验回归模型中,参数是如何确定的?有哪些评判参数估计的统计标准?最小二乘估计两有哪些统计性质(P37)?要想获得理想的参数估计值,需要注意一些什么问题?称为经验回归方程,这里是的最小二乘估计。
评判参数估计的统计标准有无偏性、有效性、一致性。
想要获得理想的参数估计值,需要尽量分散的取自变量,另外,样本数据个数n越大Var()越小。
6、理论回归模型中的随机误差项的实际意义是什么?为什么要在回归模型中加入随机误差项?建立回归模型时,对随机误差项作了哪些假定?这些假定的实际意义是什么?随机误差又称为偶然误差(accidental error)。
由于测试过程中诸多因素随机作用而形成的具有抵偿性的误差。
它是不可避免的,可以设法将其减少,但又不能完全消除。
随机误差具有统计性,在多次重复测量中,绝对值相同的正、负误差出现的机会大致相同,大误差出现的机会比小误差出现的机会少。
自相关——精选推荐
第六章 自相关一、什么是自相关及其来源 二、自相关的后果三、自相关的检验 四、自相关的修正五、应用实例6.1自相关的概念及其来源例如:研究中国工业总产值指数(Y )和国有企业工业总产值指数(X )的关系,利用1977年至1997年的历史资料,运用OLS 方法得到如下模型。
2ˆ0.0568 1.0628(37.8666)(0.3502)(0.0015)(3.0348)0.32650.37679.2099t t Y X t R DW F =+====给定显著性水平a=0.05,自由度为19,查t 分布表得0.025(19) 2.093t =。
以模型的计算结果t=3.0348,且0.025(19)t t >,表明t X 对t Y 的影响比较显著,但可决系数并不理想。
这种情况下,随机扰动项之间有可能存在序列自相关。
一、自相关的概念自相关(auto correlation )又称序列相关(serial correlation ),是指总体回归模型的随机误差项i u 之间存在的相关关系。
更一般的,自相关是指某一随机变量在时间上与其滞后项之间的相关。
经典回归模型中,曾假定随机误差项无自相关,即i u 在不同观测点之间是不相关的。
(,)(,)0()i j i j Cov u u E u u i j ==≠如果该假设不成立,就称i u 与j u 存在自相关,即不同观测点上的误差项彼此相关。
二、自相关产生的原因 1)经济系统的惯性。
自相关现象大多出现在时间序列数据中,其本期值往往受滞后值影响,突出特征就是惯性和低灵敏度。
例如:居民总消费函数模型01(1,2,,)t t tC Y u t n ββ=++=总消费受收入(t Y )的影响,事实上消费也受消费习惯的影响。
把消费习惯并列随机扰动项中,就可能出现序列相关性。
2)经济行为的滞后性例如,基础设施的建设需要一定的建设周期,那么产出效益的发挥有一定滞后时间。
计量经济学答案 整理版 (1)
《计量经济学》期末总复习《计量经济学》期末总复习一、单项选择题1.在双对数线性模型lnY i =ln β0+β1lnX i +u i 中,β1的含义是( D ) A .Y 关于X 的增长量 B .Y 关于X 的发展速度 C .Y 关于X 的边际倾向 D .Y 关于X 的弹性2.在二元线性回归模型:i i 22i 110i u X X Y +β+β+β=中,1β表示( A ) A .当X 2不变、X 1变动一个单位时,Y 的平均变动 B .当X 1不变、X 2变动一个单位时,Y 的平均变动 C .当X 1和X 2都保持不变时, Y 的平均变动 D .当X 1和X 2都变动一个单位时, Y 的平均变动3.如果线性回归模型的随机误差项存在异方差,则参数的普通最小二乘估计量是( A ) A .无偏的,但方差不是最小的 B .有偏的,且方差不是最小的 C .无偏的,且方差最小 D .有偏的,但方差仍为最小4.DW 检验法适用于检验( B ) A .异方差 B .序列相关 C .多重共线性 D .设定误差5.如果X 为随机解释变量,X i 与随机误差项u i 相关,即有Cov(X i ,u i )≠0,则普通最小二乘估计βˆ是( B ) A .有偏的、一致的 B .有偏的、非一致的 C .无偏的、一致的 D .无偏的、非一致的6.设某商品需求模型为Y t =β0+β1X t + u t ,其中Y 是商品的需求量,X 是商品价格,为了考虑全年4个季节变动的影响,假设模型中引入了4个虚拟变量,则会产生的问题为( D ) A .异方差性B .序列相关C .不完全的多重共线性D .完全的多重共线性7.当截距和斜率同时变动模型Y i =α0+α1D+β1X i +β2 (DX i )+u i 退化为截距变动模型时,能通过统计检验的是( C ) A .α1≠0,β2≠0 B .α1=0,β2=0 C .α1≠0,β2=0 D .α1=0,β2≠08.若随着解释变量的变动,被解释变量的变动存在两个转折点,即有三种变动模式,则在分段线性回归模型中应引入虚拟变量的个数为( B ) A .1个 B .2个 C .3个 D .4个9.对于无限分布滞后模型Y t =α+β0X t +β1X t-1+β2X t-2+…+u t ,无法用最小二乘法估计其参数是因为( B ) A .参数有无限多个 B .没有足够的自由度 C .存在严重的多重共线性 D .存在序列相关10.使用多项式方法估计有限分布滞后模型Y t =α+β0X t +β1X t-1+…+βk X t-k +u t 时,多项 式βi =α0+α1i+α2i 2+…+αm i m 的阶数m 必须( A ) A .小于k B .小于等于k C .等于k D .大于k11.对于无限分布滞后模型Y t =α+β0X t +β1X t-1+β2X t-2+…+u t ,Koyck 假定βk =β0λk ,0<λ<l ,则长期影响乘数为( A )A .λ-β10B .λ-11C .1-λD .λ-β∑1i12.对自回归模型进行自相关检验时,若直接使用DW 检验,则DW 值趋于( A ) A .0 B .1 C .2 D .413.对于Koyck 变换模型Y t =α(1-λ)+ β0X t +λY t-1+V t ,其中V t =u t -λu t-1,则可用作Y t-1的工具变量为( B ) A .X t B .X t-1 C .Y tD .V t14.使用工具变量法估计恰好识别的方程时,下列选项中有关工具变量的表述错误..的是 ( A )A .工具变量可选用模型中任意变量,但必须与结构方程中随机误差项不相关B .工具变量必须与将要替代的内生解释变量高度相关C .工具变量与所要估计的结构方程中的前定变量之间的相关性必须很弱,以避免多重共 线性D .若引入多个工具变量,则要求这些工具变量之间不存在严重的多重共线性15.根据实际样本资料建立的回归模型是( C ) A .理论模型 B .回归模型 C .样本回归模型D .实际模型16.下列选项中,不属于...生产函数f(L ,K)的性质是( D ) A .f(0,K)=f(L ,0)=0 B .0Kf,0L f ≥∂∂≥∂∂ C .边际生产力递减D .投入要素之间的替代弹性小于零17.关于经济预测模型,下面说法中错误..的是( C ) A .经济预测模型要求模型有较高的预测精度 B .经济预测模型比较注重对历史数据的拟合优度C .经济预测模型比较注重宏观经济总体运行结构的分析与模拟D .经济预测模型不太注重对经济活动行为的描述18.关于宏观经济计量模型中的季度模型,下列表述中错误..的是( D ) A .季度模型以季度数据为样本 B .季度模型一般规模较大 C .季度模型主要用于季度预测 D .季度模型注重长期行为的描述19.宏观经济模型的导向是( A ) A .由总供给与总需求的矛盾决定的 B .由国家的经济发展水平决定的 C .由总供给决定的D .由总需求决定的20.X 与Y 的样本回归直线为( D ) A .Y i =β0十β1X i +u i B .Y i =i i 10u X +β+β∧∧ C .E(Y i )=β0十β1X i D .i Y ∧=i 10X ∧∧β+β21.在线性回归模型中,若解释变量X 1和X 2的观测值成比例,即X 1i =KX 2i ,其中K 为常数,则表明模型中存在( C ) A ,方差非齐性 B .序列相关 C .多重共线性 D .设定误差22.回归分析中,用来说明拟合优度的统计量为( C ) A .相关系数 B .回归系数 C .判定系数 D .标准差23.若某一正常商品的市场需求曲线向下倾斜,可以断定( B ) A .它具有不变的价格弹性 B .随价格下降需求量增加 C .随价格上升需求量增加 D .需求无弹性24.在判定系数定义中,ESS 表示( B ) A .∑(Y i —Y)2B .∑2i )Y Y (-∧C .∑(Y i -∧Y )2 D .∑(Y i —Y )25.用于检验序列相关的DW 统计量的取值范围是( D ) A .O≤DW≤1 B .-1≤DW≤1 C .-2≤DW≤2 D .O≤DW≤426.误差变量模型是指( A ) A .模型中包含有观测误差的解释变量 B .用误差作被解释变量C .用误差作解释变量D .模型中包含有观测误差的被解释变量28.将社会经济现象中质的因素引入线性模型( C ) A .只影响模型的截距 B .只影响模型的斜率C .在很多情况下,不仅影响模型截距,还同时会改变模型的斜率D .既不影响模型截距,也不改变模型的斜率29.时间序列资料中,大多存在序列相关问题,对于分布滞后模型,这种序列相关问题就转化为( B ) A .异方差问题 B .多重共线性问题 C .随机解释变量问题 D .设定误差问题30.根据判定系数R 2与F 统计量的关系可知,当R 2=1时有( D ) A .F=-1 B .F=0 C .F=1 D .F=∞31.发达市场经济国家宏观经济计量模型的核心部分包括总需求、总供给和( C ) A .建模时所依据的经济理论B .总收入C .关于总需求,总生产和总收入的恒等关系D .总投资33.用模型描述现实经济系统的原则是( B ) A .以理论分析作先导,解释变量应包括所有解释变量 B .以理论分析作先导,模型规模大小要适度 C .模型规模越大越好,这样更切合实际情况 D .模型规模大小要适度,结构尽可能复杂34.下列模型中E(Y i )是参数1β的线性函数,并且是解释变量X i 的非线性函数的是( B )A .E(Y i )=2i 210X β+β B .E(Y i )=i 10X β+β C .E(Y i )=i10X 1β+β D .E(Y i )=i10X 1β+β35.估计简单线性回归模型的最小二乘准则是:确定0∧β、1∧β,使得( A ) A .∑(Y i -0∧β-1∧βX i )2最小B .∑(Y i -0∧β-1∧βX i -e i )2最小 C .∑(Y i -0∧β-1∧βX i -u i )2最小 D .∑(Y i -i 10X β-β)2最小36.在模型Y i =i1u i 0e X ββ中,下列有关Y 对X 的弹性的说法中,正确的是( A )A .1β是Y 关于X 的弹性B .0β是Y 关于X 的弹性C .ln 0β是Y 关于X 的弹性D .ln 1β是Y 关于X 的弹性37.假设回归模型为Y i =i i u X +β,其中X i 为随机变量,且X i 与u i 相关,则β的普通最小二乘估计量( D ) A .无偏且不一致 B .无偏但不一致 C .有偏但一致 D. 有偏且不一致38.设截距和斜率同时变动模型为Y i =i i 2i 110u )DX (X D +β+β+α+α,其中D 为虚拟变量。
计量经济学智慧树知到答案章节测试2023年南开大学
第一章测试1.残差是样本的随机误差项。
A:对B:错答案:A2.回归模型能够对现实做出完全准确的描述。
A:对B:错答案:B3.线性回归模型的“线性”是只针对于参数而言的。
A:对B:错答案:A4.是非线性模型。
A:错B:对答案:A5.异方差的假定不会影响最小二乘估计量的一致性。
A:错B:对答案:B第二章测试1.A:B:C:D:答案:A2.当估计一个商品的数量需求是否与价格呈线性关系的需求函数时,你应该:A:允许价格受其它的因素影响。
B: 不包括常数项因为商品的价格不会是零。
C:不需要考虑其它的解释变量。
D:假设随机误差项平均地来说为0。
答案:D3.异方差意味着A:模型不能自动假设为同方差。
B:随机误差项的方差不是常数。
C: 经济个体不全都是理性的。
D:被观测的个体有不同的偏好。
答案:B4.以下关于最小二乘法,说法错误的是A:B:C:D:答案:C5.以下说法错误的是A:如果模型的可决系数很高,我们可以认为此模型的质量较好。
B: 一元回归方程中存在多重共线性的问题。
C:模型的解释变量解释力度越强,R2就越高。
D:存在异方差时,变量的显著性检验失效。
答案:D6.如果你计算的t统计量的绝对值超过标准正态分布的临界值,你可以A: 拒绝误差项为同方差的原假设B: 拒绝零假设C:得出结论,实际值是非常接近的回归直线D:安全地假设,你的回归结果是显著的答案:B7.单侧检验和双侧检验的t统计量的构造:A:是相同的B:因为单侧检验的临界值是1.645,但是双侧检验的临界值是1.96(在5%的显著水平下)所以单侧检验和双侧检验的t统计量是不同的C:用做双侧检验的临界值,然而单侧检验只要1.96D:依赖于相应分布的临界值答案:A8.左侧检验的P值A:B:C:D:答案:D9.回归模型中的单个系数的显著性检验的t统计量可以通过用回归系数除以1.96来计算。
A:对B:错答案:B10.如果你计算的t统计量的绝对值超过标准正态分布的临界值,你可以得出结论,实际值是非常接近的回归直线吗?A:对B:错答案:B第三章测试1.A:对B:错答案:B2.不完全的多重共线性的情况下,最小二乘估计量不能计算。
自相关问题的识别与处理
自相关问题的识别与处理本次练习主要进行扰动项自相关问题的识别及处理,研究的问题是从1952年到1999年我国各年度居民消费水平与人均GDP之间的关系。
一、模型中的变量含义及样本选取Y——居民消费水平,单位:元X——人均GDP,单位:元Y1——滞后1期的居民消费水平,单位:元Y2——滞后2期的居民消费水平,单位:元选取1952至1999年各年的数据为样本进行分析,由于模型中含有滞后变量,会损失样本个数,最后观测变量的个数为T=46。
二、模型的初步建立首先作出Y与X的散点图如下:利用如下程序建立模型:proc reg data=ex sse outest=outest;model y=x y1 y2/dw;output out=out1 r=e p=py;title 'ols regression';run;运行后可得如下结果:ols regressionDependent Variable: YAnalysis of VarianceSum of MeanSource DF Squares Square F Value Prob>F Model 3 32487468.517 10829156.172 40490.411 0.0001Error 42 11232.89556 267.44989C Total 45 32498701.413Root MSE 16.35390 R-square 0.9997Dep Mean 593.54348 Adj R-sq 0.9996C.V. 2.75530Parameter EstimatesParameter Standard T for H0:Variable DF Estimate Error Parameter=0 Prob > |T| INTERCEP 1 12.447210 2.94795914 4.222 0.0001X 1 0.343074 0.01772414 19.356 0.0001Y1 1 0.408989 0.08601193 4.755 0.0001Y2 1 -0.127969 0.05674570 -2.255 0.0294Durbin-Watson D 1.450(For Number of Obs.) 461st Order Autocorrelation 0.217三、扰动项自相关的识别虽然从DW值来看,其统计量落入了无法判别的区间,但是由于上述模型的解释变量中包含被解释变量的滞后项,所以应用DW的前提条件不满足,不能依此作出判断。
一元线性回归模型
一.一元线性回归模型1. 一元线性回归模型的基本假设有哪些?违背假设是否能估计?为什么? 答:①E(i V |i X )=0 随机项i V 的数学期望为0 ②Var(i V |i X )=E{[i V —E(i V )]2}=E (2i V )=2u σ③COV(i V ,j V )=E{[i V —E(i V )][j V —E(j V )]}=0 i V ,j V 相互独立不相关 ④COV(i V ,i X )=0 解释变量i X 与误差项i V 同期独立无关 ⑤i V ~N(0,2u σ) i X ,i V 服从正态分布的随机变量 违背的话可以估计 但是要对原数据适当的处理 2. 方差分析表与参数估计表的结构变差来源 平方和 自由度 均方F统计量回归 残差 ESS RSS 12n - ESS22e RSS n S -= 1(2)ESSF RSSn =-总变差 TSS1n -21y TSS n S -=―2R =ESS TSS =1—RSSTSS=2212211[()()]()()ni i i n niii i x x y y x x y y ===----∑∑∑TSS=21()nii yy =-∑ ESS=21ˆ()ni yy =-∑ RSS=21ˆ()ni i y y =-∑ Eviews 输出结果 参数估计值 估计值标准差 F 检验 Variable Coefficient Std. Error t-Statistic Prob.C (0β) (S(0ˆβ)) 0β<对0β显著 X 1β>非线性不通过R-squared Adjusted R-squaredProb(F-statistic) >方程本身不是线性的 结论:该案例结果不理想 无论从个别还是总体上原因:(1) 0β,1β个别检验不通过 (2)F 检验远远超过期望的值(>5%or>10%) (3) 2R =拟合度特别差<50%(注:2R >80%or>70%认为拟合度好)3. 回归方程的标准记法ˆi y=0β+1βi x Se=(S(0ˆβ)) (S(1ˆβ)) 22211ˆ()ˆ22nni i i i uey yn n σ==-==--∑∑2221121ˆ()2()ni u i nii e s n x x σβ===--∑∑222211ˆ()[]()Xn ii x s nx x βσ==+-∑ 111ˆˆ()t s ββ= *代表显著性大小 **代表1%下显著 *代表5%下显著 无*代表5%下不显著 4. t 检验与F 检验的步骤(1) t 检验:01:0H β=11:0H β≠Next 111ˆˆ()t s ββ=~t(n-2) Next 查t 分布表临界值2(2)t n α- α取1%或5% Next 当|t|≥2(2)t n α-拒绝原假设10β≠说明y 对x 的一元线性相关显著当|t|<2(2)t n α-不拒绝原假设10β≠说明y 对x 的一元线性相关不显著(2) F 检验:01:0H β=11:0H β≠ Next 12ESSF RSS n =-(上:回归 下:残差)=?(假设=100)Next 查F α(1,n-2) Next 当100≥F α(1,n-2)拒绝0H 说明y 对x 的一元线性相关显著当100<F α(1,n-2)不拒绝0H 说明y 对x 的一元线性相关不显著(注:统计软件用P 值进行检验P>α等价F<F α(1,n-2)此时不拒绝0H 当P<αF>F α(1,n-2)此时拒绝0H ) 二.多元线性回归模型1. 基本假设:(1) 随机误差项i V 的条件期望值为0 即E(i V |1i X …ki X )=0 (2) 随机误差项i V 的条件方差相同Var(i V |1i X …ki X )=2u σ (3) i V 之间无序列相关COV(i V ,j V )=0 (4) i V ~N(0,2u σ)(5)各种解释变量之间不存在显著的线性相关关系 2.矩阵表达式12ˆˆˆ.ˆn y y y y ⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭ 11112211...1.....1...k k n kn x x x x x x x ⎫⎛⎪⎪ =⎪ ⎪ ⎝⎭0ˆˆ.ˆk βββ⎛⎫ ⎪= ⎪ ⎪⎝⎭ 1ˆ()()x x x y β-''= 参见P51 例3-1 3随机误差项u 的方差2u σ的最小二乘估计量221ˆ1nii X en k σ==--∑=21ˆ()1niii y yn k =---∑随机误差项i U 同方差且无序列相关 则方差协方差矩阵Var-COV(u)=E(uu ')=)(112.,...n n u E u u u u ⎛⎫⎪ ⎪ ⎪⎝⎭=2u σI4.方差分析表变差来源 平方和 自由度 均方F统计量回归 残差 ESSRSS 12n - ESS22e RSS n S -= 1(2)ESSF RSSn =-总变差 TSS1n -21y TSS n S -=―2R =ESS TSS TSS=21()n i i y y =-∑ ESS=21ˆ()n i y y =-∑ RSS=21ˆ()ni i y y =-∑ 221111(1)11RSSn n k R R TSS n k n ---=-=----- 222211ˆ()ˆ11nniiii i u ey ySe n k n k σ==-===----∑∑5. P69 8(1) 0β1β3β的个别检验不通过,2β的个别检验通过 (2)F 检验通过 对结果不满意三.违背古典假定的计量经济模型 2. 自相关D-W 检验 (1)d< L d ,u 存在一阶正自相关(2)d>4-L d ,u 存在一阶负自相关 (3)u d <d<4-u d ,不存在自相关(4)L d <d<u d ,或4-u d <d<4-L d 时,u 是否存在自相关,不能确定 4.异方差的white 检验(以二元线性模型为例) 二元线性回归模型:01122i i i i y x x u βββ=+++ ① 异方差与解释变量12,x x 的一般线性关系为:2i σ=0α+11i x α+22i x α+231i x α+242i x α+512i i x x α+i V ②<1>运用OLS 估计的式① <2>计算残差序列i并求2i<3>做2i对1i x ,2i x ,21i x ,22i x ,12i i x x 的辅助回归,即222011223142312ˆˆˆˆˆˆˆi i i i i i i e x x x x x x αααααα=+++++ ③其中2ˆi e 为2i e 的估计<4>计算估计量2nR ,n 为样本容量2R 为辅助回归的可决定系数<5>在不存在异方差的原假设下2nR 服从自由度为5的2χ分布,给定显著性水平α查2χ分布表得临界值2αχ(5) 如果2nR >2αχ(5)则拒绝原假设,表明模型中随机误差存在异方差 5.杜宾二步法:第一步求出自相关系数的估计值ˆ第二步利用ˆ进行广义差分变换 对差分模型利用OLS 求的参数0β和1β的估计值0ˆβ和1ˆβ 6.方差扩大因子检验多元回归模型中多重共线性:1x =f(x2,x3….xk) x2=f(x1,x3…xk) …xj=(x1,x2...1j x -…xk) xk=f(x1,x2….1k x -)对每个回归方程求其决定系数分别为12R ,22R (2)j R (2)k R ,在决定系数中寻求最大而接近者,比如2x R 最大,则可判定解释变量Xj 与其他解释变量的一个或多个相关程度高,因此就使回归方程式y=f(x1,x2….xk)表现高度多重共线性,计量经济学中检验多重共线性时,往往称(1-2j R )为自变量Xj 的容忍度,其倒数为方差扩大因子,记为211j jVIF R =- 当模型中全部k 个自变量所对应的方差扩大因子平均数远远大于1时就表明存在严重的多重共线性。
第一部分2 经典线性回归模型
分析: 原假设H0: 备择假设H1:至少有一个约束不满足。
H1成立,对应原模型(长模型),也称为不受约束模型(UR): 回归残差(RSSUR)
H0成立,对应短模型,也称为受约束模型(R) 回归残差(RSSR)
构造统计量:
为了检验RSSR与RSSUR的差距。 如果原假设成立,约束条件自然成立,因此两者差距小。(小于临界 值) 如果备择假设成立,约束条件不成立,两者差距大,(大于临界值)
(2)(3)可以合并为: 假设(2),(3)说明随机项u的方差-协方差矩阵为对角矩阵:
(4)各解释变量之间不存在严格的线性关系(即不存在“严格的多重 共线性”)
即X是满秩的。此时矩阵X’X也是满秩的, 所以行列式 ,保证了 可逆。是OLS估计可以进行的前提。
含义: ①从直观含义来看。模型中的变量对于解释Y提供了新的信息,不能由 其他信息完全替代 ②从参数的含义来看。保持其他信息不变时,如果存在严格多重共线, 则无法做到 ③从系数的求解来看:缺少足够信息将两变量的影响区分开来 三、最小二乘估计 1、最小二乘估计原理 分析:直观上看,也就是要求在X和Y的散点图上穿过各观测点画出一 条“最佳”直线,如下图所示。
4、最小二乘估计的矩阵表示 (具体可以参考陈强的书) 我们的目标是使得回归的残差平方和达到最小,即:
则它的一阶条件为: 化简得:
四、OLS估计量的性质 1、线性性(有助于确定估计量的分布)
2、无偏性(有助于确定正态分布的均值) 即 其中, 两边取期望 与零均值假定,以及非随机解释变量两个假设有关
3、最小方差性(有助于确定正态分布的方差) (1)方差-协方差矩阵: (2)方差协方差矩阵的计算 方法1: 方法2
3、调整的拟合优度 (1)拟合优度(判定系数)的缺陷 可以证明,多重决定系数时模型中解释变量个数的不减函数,这给对 比含有不同解释变量个数的模型的决定系数带来困难(缺陷),需要修 正。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(10.2)
10.4 自相关的诊断-图形法
例10.1 美国商业部门真实工资与生产率的关系(1959-2002)
10.4 自相关的诊断-图形法
例10.1 美国商业部门真实工资与生产率的关系(1959-2002)
从图形可以看出残差 具有明显的系统特征, 即明显的变化规律。
10.4 自相关的诊断-图形法
St = B1 + B2*Pt-1 + ut
(10.2)
4. 数据处理。在做季节因素的调整时,经常要做移动平均。移动平均的处理可 以消除季节波动的影响,但带来新的问题则是产生了自相关。
10.3 自相关产生的后果
1. 最小二乘估计量仍然是线性的和无偏的。 2. 最小二乘估计量不是有效的,即OLS估计量的方差不是最小的,估计量不是最优
例10.1 美国商业部门真实工资与生产率的关系(1959-2002)
E1=et, E11=et-1
e1=0.872613*e11 se=(0.071014)
t=(12.26511) p=(0.0000) R2 = 0.781227
回归模型存在着明显的自相关 性。
10.5 自相关的诊断-Durbin-Watson d检验法
回归过程(Markov first-order autoregressive scheme),通常记为AR(1)过程。
10.5 自相关的诊断-Durbin-Watson d检验法
d 统计量诊断自相关需要一定的假设条件,不是任意可用的: 4. 解释变量中不包含因变量的滞后值。该检验对下面的模型是不适用的:
70 80 90 100 110 120 130 P ROD UC T
10.4 自相关的诊断-图形法
将残差对时间作时序图(time-sequence plot)。 例10.1 美国商业部门真实工资与生产率的关系(1959-2002)
Wages = 29.575+ 0.7006*Product se =(1.460515)(0.017122) t = (20.24968) (40.91818) p=(0.00000) (0.00000) F=1674.298 (0.00000) R2 = 0.975529
第1章线性回归模型的自相关问 题
10.1 一元线性回归分析-回归的假定条件(无自相关)
假定5 无自相关假定,即两个误差项之间不相关。
Cov(ui,uj) = 0
(10.1)
ui
ui
ui
uj 正相关
uj 负相关
uj 不相关
无自相关的含义:意味着任一观察值的扰动项不受其它观察值扰动项的影响。
10.2 自相关产生的原因
量,并且很可能低估了真实的σ2。 6. 计算的R2也不能真实的反映实际R2。 7. 计算的预测方差和标准误差通常是无效的。
10.4 自相关的诊断
如何知道回归方程存在自相关? 由于无法知道误差方差σ 2的真实值,因为真实的ui无法观察到的,
e 与异方差一样,仅仅知道残差 i。需要根据从OLS方法得到的ei判断是
线性无偏估计量(BLUE)。 3. OLS估计量的方差是有偏的。用来计算方差和OLS估计量标准误的公式会严重的
低估真实的方差和标准误,从而导致t值变大,使得某个系数表面上显著不为零, 但事实却相反。
4. t检验和F检验不是可信的。 5. 计算得到的误差方差σ 2=RSS/d.f.(残差平方和/自由度)是真实σ2的有偏估计
Durbin-Watson d统计量可以用来诊断回归模型的自相关
n
(et et 1 )2
d t2 n
et2
t 1
(10.3)
即逐次残差的平方和与残差平方和的比值。D统计量的样本容量为n-1。 注意:Durbin-Watson d检验量是诊断自相关常用的检验工具,必须掌握。
10.5 自相关的诊断-图形法
Yt B1 B2 * X t B3 *Yt 1 ut
(10.7)
(10.7)中Yt-1是因变量Y的一期滞后值。形如(10.7)的回归方程称为自回归模型 (autoregressive models)——变量对其滞后一期值的回归。
10.5 自相关的诊断-Durbin-Watson d检验法
例10.1 美国商业部门真实工资与生产率的关系(1959-2002)
10.5 自相关的诊断-Durbin-Watson d检验法
n
(et et 1 )2
d t2 n
et2
t 1
(10.3)
d 2(1 ˆ ),0 d 4
(10.4)
n
et et 1
ˆ
否存在自相关。 方法1:图形法 方法2:Dubin-Watson d检验法
10.4 自相关的诊断-图形法
将残差对时间作时序图(time-sequence plot)。 例10.1 美国商业部门真实工资与生产率的关系(1959-2002)
WAGES
120
110
100
90Biblioteka 807060
50 40
50
60
1. 经济时间序列的惯性(inertia)或迟缓性(sluggishness)特征。
2. 模型适定误差。有些自相关并不是由于连续观察值之间相关产生的,而是因 为回归模型不是适定性的“好”模型。“不好模型”有多种原因。
3. 蛛网现象(the cobweb phenomenon)。一个变量对另一个变量的反映不是同步的, 时滞一定的时间。商品供给对价格的反映:
t2 n
,1 ˆ 1
(10.5)
et2
t 1
如果d接近0,则存在正相关;d接近4,则存在负相关;d接近2,表示不存在
相关。
10.5 自相关的诊断-Durbin-Watson d检验法
d 统计量诊断自相关需要一定的假设条件,不是任意可用的: 1. 回归模型包括一个截距项。因此,d统计量无法判断通过原点的回归模型的自
相关问题。 2. 变量X是非随机变量,即在重复抽样中变量X的值是固定不变的。 3. 扰动项ui的生成机制是:
ut * ut1 vt ,1 1
(10.6)
(10.6)表明t期的扰动项或误差项与t-1期值和一个纯随机项vt有关。ρ 度量了对前 期值的依赖程度,称为自相关系数,介于-1和1之间。(10.6)称为马尔可夫一阶自