伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-多元回归分析:推断【圣才出品】
伍德里奇计量经济学导论第6版笔记和课后答案
伍德里奇计量经济学导论第6版笔记和课后答案
第1章计量经济学的性质与经济数据
1.1 复习笔记
考点一:计量经济学及其应用★
1计量经济学
计量经济学是在一定的经济理论基础之上,采用数学与统计学的工具,通过建立计量经济模型对经济变量之间的关系进行定量分析的学科。
进行计量分析的步骤主要有:①利用经济数据对模型中的未知参数进行估计;②对模型进行检验;③通过检验后,可以利用计量模型来进行相关预测。
2经济分析的步骤
经济分析是指利用所搜集的相关数据检验某个理论是否成立或估计某种关系的方法。
经济分析主要包括以下几步,分别是阐述问题、构建经济模型、经济模型转化为计量模型、搜集相关数据、参数估计和假设检验。
考点二:经济数据★★★
1经济数据的结构(见表1-1)
表1-1 经济数据的结构
2面板数据与混合横截面数据的比较(见表1-2)
表1-2 面板数据与混合横截面数据的比较
考点三:因果关系和其他条件不变★★
1因果关系
因果关系是指一个变量的变动将引起另一个变量的变动,这是经济分析中的重要目标之一。
计量分析虽然能发现变量之间的相关关系,但是如果想要解释因果关系,还要排除模型本身存在因果互逆的可能,
否则很难让人信服。
2其他条件不变
其他条件不变是指在经济分析中,保持所有的其他变量不变。
“其他条件不变”这一假设在因果分析中具有重要作用。
伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:OLS的渐近性)【圣才出品】
y=β0+β1x1+…+βkxk+u 检验这些变量中最后 q 个变量是否都具有零总体参数。
虚拟假设:H0:βk-q+1=0,…,βk=0,它对模型斲加了 q 个排除性约束。
3 / 12
圣才电子书 十万种考研考证电子书、题库视频学习平台
对立假设:这些参数中至少有一个异亍零。
(2)σ2 是 σ2=Var(u)的一个一致估计量。
(3)对每个 j,都有:
βˆj βj
/ se
βˆ j
a
~ Normal 0,1
其中, se βˆ j 就是通常的 OLS 标准误。
定理 5.2 的重要乊处在亍,它去掉了正态性假定 MLR.6。对误差分布唯一的限制是,
它具有有限斱差。还对 u 假定了零条件均值(MLR.4)和同斱差性(MLR.5)。
因为 Var(x1)>0,所以,若 x1 和 u 正相关,则 βˆ1 的丌一致性就为正,而若 x1 和 u 负相关,则 βˆ1 的丌一致性就为负。如果 x1 和 u 乊间的协斱差相对亍 x1 的斱差很小,那么这
种丌一致性就可以被忽略。由亍 u 是观测丌到的,所以甚至还丌能估计出这个协斱差有多 大。
二、渐近正态和大样本推断 1.定理 5.2:OLS 的渐近正态性 在高斯-马尔可夫假定 MLR.1~MLR.5 下,
④将
LM
不
χ
2 q
分布中适当的临界值
c
相比较,如果
LM>c,就拒绝虚拟假设。
(3)不 F 统计量比较
不 F 统计量丌同,无约束模型中的自由度在迚行 LM 检验时没有什么作用。所有起作用
的因素只是被检验约束的个数(q)、辅助回归 R2 的大小( Ru2 )和样本容量(n)。无约束 模型中的 df 丌起什么作用,这是因为 LM 统计量的渐近性质。但必须确定将 Ru2 乘以样本容 量以得到 LM,如果 n 很大, Ru2 看上去较低的值仍可能导致联合显著性。
伍德里奇计量经济学导论第6版笔记和课后习题答案
第1章计量经济学的性质与经济数据1.1复习笔记考点一:计量经济学★1计量经济学的含义计量经济学,又称经济计量学,是由经济理论、统计学和数学结合而成的一门经济学的分支学科,其研究内容是分析经济现象中客观存在的数量关系。
2计量经济学模型(1)模型分类模型是对现实生活现象的描述和模拟。
根据描述和模拟办法的不同,对模型进行分类,如表1-1所示。
(2)数理经济模型和计量经济学模型的区别①研究内容不同数理经济模型的研究内容是经济现象各因素之间的理论关系,计量经济学模型的研究内容是经济现象各因素之间的定量关系。
②描述和模拟办法不同数理经济模型的描述和模拟办法主要是确定性的数学形式,计量经济学模型的描述和模拟办法主要是随机性的数学形式。
③位置和作用不同数理经济模型可用于对研究对象的初步研究,计量经济学模型可用于对研究对象的深入研究。
考点二:经济数据★★★1经济数据的结构(见表1-3)2面板数据与混合横截面数据的比较(见表1-4)考点三:因果关系和其他条件不变★★1因果关系因果关系是指一个变量的变动将引起另一个变量的变动,这是经济分析中的重要目标之计量分析虽然能发现变量之间的相关关系,但是如果想要解释因果关系,还要排除模型本身存在因果互逆的可能,否则很难让人信服。
2其他条件不变其他条件不变是指在经济分析中,保持所有的其他变量不变。
“其他条件不变”这一假设在因果分析中具有重要作用。
1.2课后习题详解一、习题1.假设让你指挥一项研究,以确定较小的班级规模是否会提高四年级学生的成绩。
(i)如果你能指挥你想做的任何实验,你想做些什么?请具体说明。
(ii)更现实地,假设你能搜集到某个州几千名四年级学生的观测数据。
你能得到它们四年级班级规模和四年级末的标准化考试分数。
你为什么预计班级规模与考试成绩成负相关关系?(iii)负相关关系一定意味着较小的班级规模会导致更好的成绩吗?请解释。
答:(i)假定能够随机的分配学生们去不同规模的班级,也就是说,在不考虑学生诸如能力和家庭背景等特征的前提下,每个学生被随机的分配到不同的班级。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解OLS用于时间序列数据的其他问题
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解OLS用于时间序列数据的其他问题第11章OLS用于时间序列数据的其他问题11.1复习笔记考点一:平稳和弱相关时间序列★★★★1.时间序列的相关概念(见表11-1)表11-1时间序列的相关概念2.弱相关时间序列(1)弱相关对于一个平稳时间序列过程{x t:t=1,2,…},随着h的无限增大,若x t和x t+h“近乎独立”,则称为弱相关。
对于协方差平稳序列,如果x t和x t+h之间的相关系数随h的增大而趋近于0,则协方差平稳随机序列就是弱相关的。
本质上,弱相关时间序列取代了能使大数定律(LLN)和中心极限定理(CLT)成立的随机抽样假定。
(2)弱相关时间序列的例子(见表11-2)表11-2弱相关时间序列的例子考点二:OLS的渐近性质★★★★1.OLS的渐近性假设(见表11-3)表11-3OLS的渐近性假设2.OLS的渐近性质(见表11-4)表11-4OLS的渐进性质考点三:回归分析中使用高度持续性时间序列★★★★1.高度持续性时间序列(1)随机游走(见表11-5)表11-5随机游走(2)带漂移的随机游走带漂移的随机游走的形式为:y t=α0+y t-1+e t,t=1,2,…。
其中,e t(t=1,2,…)和y0满足随机游走模型的同样性质;参数α0被称为漂移项。
通过反复迭代,发现y t的期望值具有一种线性时间趋势:y t=α0t+e t+e t-1+…+e1+y0。
当y0=0时,E(y t)=α0t。
若α0>0,y t的期望值随时间而递增;若α0<0,则随时间而下降。
在t时期,对y t+h的最佳预测值等于y t加漂移项α0h。
y t的方差与纯粹随机游走情况下的方差完全相同。
带漂移随机游走是单位根过程的另一个例子,因为它是含截距的AR(1)模型中ρ1=1的特例:y t=α0+ρ1y t-1+e t。
2.高度持续性时间序列的变换(1)差分平稳过程I(1)弱相关过程,也被称为0阶单整或I(0),这种序列的均值已经满足标准的极限定理,在回归分析中使用时无须进行任何处理。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第二篇(第10~12章)【圣才出品】
第二篇时间序列数据的回归分析第10章时间序列数据的基本回归分析10.1 复习笔记考点一:时间序列数据★★1.时间序列数据与横截面数据的区别(1)时间序列数据集是按照时间顺序排列。
(2)时间序列数据与横截面数据被视为随机结果的原因不同。
(3)一个时间序列过程的所有可能的实现集,便相当于横截面分析中的总体。
时间序列数据集的样本容量就是所观察变量的时期数。
2.时间序列模型的主要类型(见表10-1)表10-1 时间序列模型的主要类型考点二:经典假设下OLS的有限样本性质★★★★1.高斯-马尔可夫定理假设(见表10-2)表10-2 高斯-马尔可夫定理假设2.OLS估计量的性质与高斯-马尔可夫定理(见表10-3)表10-3 OLS估计量的性质与高斯-马尔可夫定理3.经典线性模型假定下的推断(1)假定TS.6(正态性)假定误差u t独立于X,且具有独立同分布Normal(0,σ2)。
该假定蕴涵了假定TS.3、TS.4和TS.5,但它更强,因为它还假定了独立性和正态性。
(2)定理10.5(正态抽样分布)在时间序列的CLM假定TS.1~TS.6下,以X为条件,OLS估计量遵循正态分布。
而且,在虚拟假设下,每个t统计量服从t分布,F统计量服从F分布,通常构造的置信区间也是确当的。
定理10.5意味着,当假定TS.1~TS.6成立时,横截面回归估计与推断的全部结论都可以直接应用到时间序列回归中。
这样t统计量可以用来检验个别解释变量的统计显著性,F统计量可以用来检验联合显著性。
考点三:时间序列的应用★★★★★1.函数形式、虚拟变量除了常见的线性函数形式,其他函数形式也可以应用于时间序列中。
最重要的是自然对数,在应用研究中经常出现具有恒定百分比效应的时间序列回归。
虚拟变量也可以应用在时间序列的回归中,如某一期的数据出现系统差别时,可以采用虚拟变量的形式。
2.趋势和季节性(1)描述有趋势的时间序列的方法(见表10-4)表10-4 描述有趋势的时间序列的方法(2)回归中的趋势变量由于某些无法观测的趋势因素可能同时影响被解释变量与解释变量,被解释变量与解释变量均随时间变化而变化,容易得到被解释变量与解释变量之间趋势变量的关系,而非真正的相关关系,导致了伪回归。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-多元回归分析:OLS的渐近性【圣才出品】
第5章多元回归分析:OLS 的渐近性5.1复习笔记考点一:一致性★★★★1.定理5.1:OLS 的一致性(1)一致性的证明当假定MLR.1~MLR.4成立时,对所有的j=0,1,2,…,k,OLS 估计量∧βj 是βj 的一致估计。
证明过程如下:将y i =β0+β1x i1+u i 代入∧β1的表达式中,便可以得到:()()()()11111111122111111ˆnni ii i i i n ni i i i xx y n x x u xxnxx ββ-==-==--==+--∑∑∑∑根据大数定律可知上式等式右边第二项中的分子和分母分别依概率收敛于总体值Cov (x 1,u)和Var(x 1)。
假定Var(x 1)≠0,因为Cov(x 1,u)=0,利用概率极限的性质可得:plim ∧β1=β1+Cov(x 1,u)/Var(x 1)=β1。
这就说明了OLS 估计量∧βj 具有一致性。
前面的论证表明,如果假定只有零相关,那么OLS 在简单回归情形中就是一致的。
在一般情形中也是这样,可以将这一点表述成一个假定。
即假定MLR.4′(零均值与零相关):对所有的j=1,2,…,k,都有E(u)=0和Cov(x j1,u)=0。
(2)MLR.4′与MLR.4的比较①MLR.4要求解释变量的任何函数都与u 无关,而MLR.4′仅要求每个x j 与u 无关(且u 在总体中均值为0)。
②在MLR.4假定下,有E(y|x 1,x 2,…,x k )=β0+β1x 1+β2x 2+…+βk x k ,可以得到解释变量对y 的平均值或期望值的偏效应;而在假定MLR.4′下,β0+β1x 1+β2x 2+…+βk x k 不一定能够代表总体回归函数,存在x j 的某些非线性函数与误差项相关的可能性。
2.推导OLS 的不一致性当误差项和x 1,x 2,…,x k 中的任何一个相关时,通常会导致所有的OLS 估计量都失去一致性,即使样本量增加也不会改善。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第三篇(第13~15章)【圣才出品】
第三篇高级专题第13章跨时横截面的混合:简单面板数据方法13.1 复习笔记考点一:跨时独立横截面的混合★★★★★1.独立混合横截面数据的定义独立混合横截面数据是指在不同时点从一个大总体中随机抽样得到的随机样本。
这种数据的重要特征在于:都是由独立抽取的观测所构成的。
在保持其他条件不变时,该数据排除了不同观测误差项的相关性。
区别于单独的随机样本,当在不同时点上进行抽样时,样本的性质可能与时间相关,从而导致观测点不再是同分布的。
2.使用独立混合横截面的理由(见表13-1)表13-1 使用独立混合横截面的理由3.对跨时结构性变化的邹至庄检验(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(见表13-2)表13-2 用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(2)对多个时期计算邹至庄检验统计量的办法①使用所有时期虚拟变量与一个(或几个、所有)解释变量的交互项,并检验这些交互项的联合显著性,一般总能检验斜率系数的恒定性。
②做一个容许不同时期有不同截距的混合回归来估计约束模型,得到SSR r。
然后,对T个时期都分别做一个回归,并得到相应的残差平方和,有:SSR ur=SSR1+SSR2+…+SSR T。
若有k个解释变量(不包括截距和时期虚拟变量)和T个时期,则需检验(T-1)k 个约束。
而无约束模型中有T+Tk个待估计参数。
所以,F检验的df为(T-1)k和n-T -Tk,其中n为总观测次数。
F统计量计算公式为:[(SSR r-SSR ur)/SSR ur][(n-T-Tk)/(Tk-k)]。
但该检验不能对异方差性保持稳健,为了得到异方差-稳健的检验,必须构造交互项并做一个混合回归。
4.利用混合横截面作政策分析(1)自然实验与真实实验当某些外生事件改变了个人、家庭、企业或城市运行的环境时,便产生了自然实验(准实验)。
一个自然实验总有一个不受政策变化影响的对照组和一个受政策变化影响的处理组。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第一篇(第4~6章)【圣才出品】
考点五:对多个线性约束的检验:F 检验 ★★★★★
1.对排除性约束的检验 对排除性约束的检验是指检验一组自变量是否对因变量都没有影响,该检验不适用于不 同因变量的检验。F 统计量通常对检验一组变量的排除有用处,特别是当变量高度相关的时 候。 含有 k 个自变量的不受约束模型为:y=β0+β1x1+…+βkxk+u,其中参数有 k+1 个。 假设有 q 个排除性约束要检验,且这 q 个变量是自变量中的最后 q 个:xk-q+1,…,xk, 则受约束模型为:y=β0+β1x1+…+βk-qxk-q+u。 虚拟假设为 H0:βk-q+1=0,…,βk=0,对立假设是列出的参数至少有一个不为零。 定义 F 统计量为 F=[(SSRr-SSRur)/q]/[SSRur/(n-k-1)]。其中,SSRr 是受约束模型 的残差平方和,SSRur 是不受约束模型的残差平方和。由于 SSRr 不可能比 SSRur 小,所以 F 统计量总是非负的。q=dfr-dfur,即 q 是受约束模型与不受约束模型的自由度之差,也是 约束条件的个数。n-k-1=分母自由度=dfur,且 F 的分母恰好就是不受约束模型中σ2= Var(u)的一个无偏估计量。 假设 CLM 假定成立,在 H0 下 F 统计量服从自由度为(q,n-k-1)的 F 分布,即 F~ Fq,n-k-1。如果 F 值大于显著性水平下的临界值,则拒绝 H0 而支持 H1。当拒绝 H0 时,就 说,xk-q+1,…,xk 在适当的显著性水平上是联合统计显著的(或联合显著)。
∧
∧
∧
∧
注:β1,β2,…,βk 的任何线性组合也都符合正态分布,且βj 的任何一数检验:t 检验 ★★★★
1.总体回归函数 总体模型的形式为:y=β0+β1x1+…+βkxk+u。假定该模型满足 CLM 假定,βj 的 OLS 量是无偏的。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第一篇(第7~9章)【圣才出品】
第7章含有定性信息的多元回归分析:二值(或虚拟)变量7.1 复习笔记考点一:带有虚拟自变量的回归★★★★★1.对定性信息的描述定性信息是指通常以二值信息(0-1)的形式出现的信息,如性别、是否结婚等。
在计量经济学中,二值变量又称为虚拟变量。
2.只有一个虚拟自变量(1)只有一个虚拟自变量的简单模型考虑决定小时工资的简单模型:wage=β0+δ0female+β1educ+u。
根据多元回归的解释方式,δ0表示控制educ不变时,female变化1单位给wage带来的变化。
假定零条件均值假定E(u|female,educ)=0成立,那么:δ0=E(wage|female=1,educ)-E(wage|female=0,educ),其中female=1表示女性,female=0表示男性。
可以发现,在任意教育水平下,男性与女性的工资差异是固定的,女性工资比男性工资多δ0。
除了β0之外,模型中只需要引入一个虚拟变量。
因为female+male=1,所以引入两个虚拟变量会导致完全多重共线性,即虚拟变量陷阱。
(2)当因变量为log(y)时,对虚拟解释变量系数的解释当变量中有一个或多个虚拟变量,且因变量以对数的形式存在时,虚拟变量的系数可以理解为百分比的变化。
将虚拟变量的系数乘以100,表示的是在保持所有其他因素不变时y的百分数差异,精确的百分数差异为:100·[exp (β∧1)-1]。
其中β∧1是一个虚拟变量的系数。
3.使用多类别虚拟变量 (1)在方程中包括虚拟变量的一般原则如果回归模型具有g 组或g 类不同截距,一种方法是在模型中包含g -1个虚拟变量和一个截距。
基组的截距是模型的总截距,某一组的虚拟变量系数表示该组与基组在截距上的估计差异。
如果在模型中引入g 个虚拟变量和一个截距,将会导致虚拟变量陷阱。
另一种方法是只包括g 个虚拟变量,而没有总截距。
这种方法存在两个实际的缺陷:①对于相对基组差别的检验变得更繁琐;②在模型不包含总截距时,回归软件通常都会改变R 2的计算方法。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-多元回归分析:推断【圣才出品】
伍德⾥奇《计量经济学导论》(第6版)复习笔记和课后习题详解-多元回归分析:推断【圣才出品】第4章多元回归分析:推断4.1复习笔记考点⼀:OLS估计量的抽样分布★★★1.假定MLR.6(正态性)假定总体误差项u独⽴于所有解释变量,且服从均值为零和⽅差为σ2的正态分布,即:u~Normal(0,σ2)。
对于横截⾯回归中的应⽤来说,假定MLR.1~MLR.6被称为经典线性模型假定。
假定下对应的模型称为经典线性模型(CLM)。
2.⽤中⼼极限定理(CLT)在样本量较⼤时,u近似服从于正态分布。
正态分布的近似效果取决于u中包含多少因素以及因素分布的差异。
但是CLT的前提假定是所有不可观测的因素都以独⽴可加的⽅式影响Y。
当u是关于不可观测因素的⼀个复杂函数时,CLT论证可能并不适⽤。
3.OLS估计量的正态抽样分布定理4.1(正态抽样分布):在CLM假定MLR.1~MLR.6下,以⾃变量的样本值为条件,有:∧βj~Normal(βj,Var(∧βj))。
将正态分布函数标准化可得:(∧βj-βj)/sd(∧βj)~Normal(0,1)。
注:∧β1,∧β2,…,∧βk的任何线性组合也都符合正态分布,且∧βj的任何⼀个⼦集也都具有⼀个联合正态分布。
考点⼆:单个总体参数检验:t检验★★★★1.总体回归函数总体模型的形式为:y=β0+β1x1+…+βk x k+u。
假定该模型满⾜CLM假定,βj的OLS 量是⽆偏的。
2.定理4.2:标准化估计量的t分布在CLM假定MLR.1~MLR.6下,(∧βj-βj)/se(∧βj)~t n-k-1,其中,k+1是总体模型中未知参数的个数(即k个斜率参数和截距β0)。
t统计量服从t分布⽽不是标准正态分布的原因是se(∧βj)中的常数σ已经被随机变量∧σ所取代。
t统计量的计算公式可写成标准正态随机变量(∧βj-βj)/sd(∧βj)与∧σ2/σ2的平⽅根之⽐,可以证明⼆者是独⽴的;⽽且(n-k-1)∧σ2/σ2~χ2n-k-1。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第三篇(第16~19章)【圣才出品】
第16章联立方程模型16.1 复习笔记考点一:联立方程模型的性质★★当一个或多个解释变量与因变量联合被决定时,模型就会出现内生性问题。
联立方程模型是指从经济理论中推导出来的若干的相关的方程,联立起来就是一个模型,如凯恩斯的国民收入模型等。
联立方程的重要特征:(1)给定多个方程中的外生变量和误差项,所有的方程就决定了剩余的内生变量,因此任一方程的因变量和方程中的内生变量都是SEM的内生变量。
(2)模型中的外生变量的关键假设是与所有的误差项都不相关。
由于这些误差出现在结构方程中,所以它们是结构误差。
(3)SEM中的每个方程自身都应该有一个行为上的其他条件不变解释。
考点二:OLS中的联立性偏误★★★★1.约简型方程考虑两个方程的结构模型:y1=α1y2+β1z1+u1y2=α2y1+β2z2+u2专门估计第一个方程。
变量z1和z2都是外生的,所以每个都与u1和u2无关。
如果将式y1=α1y2+β1z1+u1的右边作为y1代入式y2=α2y1+β2z2+u2中,得到(1-α2α1)y2=α2β1z1+β2z2+α2u1+u2为了解出y2,需对参数做一个假定:α2α1≠1这个假定是否具有限制性则取决于应用。
如果上式的条件成立,y2可写成y2=π21z1+π22z2+v2其中,π21=α2β1/(1-α2α1)、π22=β2/(1-α2α1)和v2=(α2u1+u2)/(1-α2α),用外生变量和误差项表示y2的方程y2=π21z1+π22z2+v2是y2的约简型。
参数π21和π1被称为约简型参数,它们是结构方程中出现的结构型参数的非线性函数。
22约简型误差v2是结构型误差u1和u2的线性函数。
因为u1和u2都与z1和z2无关,所以v2也与z1和z2无关。
因此,可用OLS一致地估计π21和π22。
2.联立性偏误及其方向在约简型方程中,除非在特殊的假定之下,否则对方程y1=α1y2+β1z1+u1的OLS估计,将导致α1和β1的估计量有偏误和不一致。
伍德里奇《计量经济学导论》复习笔记和课后习题详解-含有定性信息的多元回归分析:二值变量
伍德里奇《计量经济学导论》复习笔记和课后习题详解-含有定性信息的多元回归分析:二值变量第7章含有定性信息的多元回归分析:二值(或虚拟)变量7.1复习笔记考点一:带有虚拟自变量的回归★★★★★1.对定性信息的描述定性信息是指通常以二值信息(0-1)的形式出现的信息,如性别、是否结婚等。
在计量经济学中,二值变量又称为虚拟变量。
2.只有一个虚拟自变量(1)只有一个虚拟自变量的简单模型考虑决定小时工资的简单模型:wage=β0+δ0female+β1educ +u。
根据多元回归的解释方式,δ0表示控制educ不变时,female 变化1单位给wage带来的变化。
假定零条件均值假定E(u|female,educ)=0成立,那么:δ0=E(wage|female=1,educ)-E (wage|female=0,educ),其中female=1表示女性,female =0表示男性。
可以发现,在任意教育水平下,男性与女性的工资差异是固定的,女性工资比男性工资多δ0。
除了β0之外,模型中只需要引入一个虚拟变量。
因为female+male=1,所以引入两个虚拟变量会导致完全多重共线性,即虚拟变量陷阱。
(2)当因变量为log(y)时,对虚拟解释变量系数的解释当变量中有一个或多个虚拟变量,且因变量以对数的形式存在时,虚拟变量的系数可以理解为百分比的变化。
将虚拟变量的系数乘以100,表示的是在保持所有其他因素不变时y 的百分数差异,精确的百分数差异为:100·[exp(∧β1)-1]。
其中∧β1是一个虚拟变量的系数。
3.使用多类别虚拟变量(1)在方程中包括虚拟变量的一般原则如果回归模型具有g 组或g 类不同截距,一种方法是在模型中包含g-1个虚拟变量和一个截距。
基组的截距是模型的总截距,某一组的虚拟变量系数表示该组与基组在截距上的估计差异。
如果在模型中引入g 个虚拟变量和一个截距,将会导致虚拟变量陷阱。
另一种方法是只包括g 个虚拟变量,而没有总截距。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-模型设定和数据问题的深入探讨【圣才出品】
第9章模型设定和数据问题的深入探讨9.1复习笔记考点一:函数形式设误检验(见表9-1)★★★★表9-1函数形式设误检验考点二:对无法观测解释变量使用代理变量★★★1.代理变量代理变量就是某种与分析中试图控制而又无法观测的变量相关的变量。
(1)遗漏变量问题的植入解假设在有3个自变量的模型中,其中有两个自变量是可以观测的,解释变量x3*观测不到:y=β0+β1x1+β2x2+β3x3*+u。
但有x3*的一个代理变量,即x3,有x3*=δ0+δ3x3+v3。
其中,x3*和x3正相关,所以δ3>0;截距δ0容许x3*和x3以不同的尺度来度量。
假设x3就是x3*,做y对x1,x2,x3的回归,从而利用x3得到β1和β2的无偏(或至少是一致)估计量。
在做OLS之前,只是用x3取代了x3*,所以称之为遗漏变量问题的植入解。
代理变量也可以以二值信息的形式出现。
(2)植入解能得到一致估计量所需的假定(见表9-2)表9-2植入解能得到一致估计量所需的假定2.用滞后因变量作为代理变量对于想要控制无法观测的因素,可以选择滞后因变量作为代理变量,这种方法适用于政策分析。
但是现期的差异很难用其他方法解释。
使用滞后被解释变量不是控制遗漏变量的唯一方法,但是这种方法适用于估计政策变量。
考点三:随机斜率模型★★★1.随机斜率模型的定义如果一个变量的偏效应取决于那些随着总体单位的不同而不同的无法观测因素,且只有一个解释变量x,就可以把这个一般模型写成:y i=a i+b i x i。
上式中的模型有时被称为随机系数模型或随机斜率模型。
对于上式模型,记a i=a+c i和b i=β+d i,则有E(c i)=0和E(d i)=0,代入模型得y i=a+βx i+u i,其中,u i=c i+d i x i。
2.保证OLS无偏(一致性)的条件(1)简单回归当u i=c i+d i x i时,无偏的充分条件就是E(c i|x i)=E(c i)=0和E(d i|x i)=E(d i)=0。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-高级面板数据方法【圣才出品】
第14章高级面板数据方法14.1复习笔记考点一:固定效应估计法★★★★★1.固定效应变换固定效应变换又称组内变换,考虑仅有一个解释变量的模型:对每个i,有y it =β1x it +a i +u it ,t=1,2,…,T对每个i 求方程在时间上的平均,便得到_y i =β1_x i +a i +_u i 其中,11T it t y T y-==∑(关于时间的均值)。
因为a i 在不同时间固定不变,故它会在原模型和均值模型中都出现,如果对于每个t,两式相减,便得到y it -_y i =β1(x it -_x i )+u it -_u i ,t=1,2,…,T或1 12it it it y x u ,t ,,,T=+=&&&&&&L β其中,it it i y y y =-&&是y 的除时间均值数据;对it x &&和it u &&的解释也类似。
方程的要点在于,非观测效应a i 已随之消失,从而可以使用混合OLS 去估计式1 12it it it y x u ,t ,,,T =+=&&&&&&L β。
上式的混合OLS 估计量被称为固定效应估计量或组内估计量。
组间估计量可以从横截面方程_y i =β1_x i +a i +_u i 的OLS 估计量而得到,即同时使用y 和x的时间平均值做一个横截面回归。
如果a i与_x i相关,估计量是有偏误的。
而如果认为a i 与x it无关,则使用随机效应估计量要更好。
组间估计量忽视了变量如何随着时间而变化。
在方程中添加更多解释变量不会引起什么变化。
2.固定效应模型(1)无偏性原始的非固定效应模型,只要让每一个变量都减去时间均值数据,即可得到固定效应模型。
固定效应模型的无偏性是建立在严格外生性的假定下的,所以FE模型需要假定特异误差u it应与所有时期的每个解释变量都无关。
伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:深入专题)【圣才出品】
第6章 多元回归分析:深入专题6.1 复习笔记一、数据的测度单位对OLS 统计量的影响 1.数据的测度单位对OLS 统计量无实质性影响当对变量重新测度时,系数、标准误、置信区间、t 统计量和F 统计量改变的方式,都不影响所有被测度的影响和检验结果。
怎样度量数据通常只起到非实质性的作用,比如说,减少所估计系数中小数点后零的个数等。
通过对度量单位明智的选择,可以在不做任何本质改变的情况下,改进所估计方程的形象。
对任何一个x i ,当它在回归中以log (x i )出现时,改变其度量单位也只能影响到截距。
这与对百分比变化和(特别是)弹性的了解相对应:它们不会随着y 或x i 度量单位的变化而变化。
2.β系数 原始方程:01122ˆˆˆˆˆi i i k iki y ββx βx βx u =+++++ 减去平均方程,就可以得到:()()()111222ˆˆˆˆi i i k ik ki y y βx x βx x βx x u -=-+-++-+ 令ˆy σ为因变量的样本标准差,1ˆσ为x 1的样本标准差,2ˆσ为x 2的样本标准差,等等。
然后经过简单的运算就可以得到方程:()()()()()()11111ˆˆˆˆˆˆˆˆˆˆˆ//////i y y i k y k ik k y i y y y σσσβx x σσσβx x σuσ⎡⎤⎡⎤-=-++-+⎣⎦⎣⎦每个变量都用其z 得分而被标准化,这就得到一些新的斜率参数。
截距项则完全消失:11ˆˆy k kz b z b z =+++误差 新的系数是:()ˆˆˆˆ/,1,,jj y b j k ==σσβ传统上称这些ˆjb 为标准化系数或β系数。
以标准差为单位,由于它使得回归元的度量单位无关紧要,所以这个方程把所有解释变量都放到相同的地位上。
在一个标准的OLS 方程中,不可能只看不同系数的大小,也不可能断定具有最大系数的解释变量就“最重要”。
通过改变x i 的度量单位,可以任意改变系数的大小。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-时间序列回归中的序列相关和异方差性
第12章时间序列回归中的序列相关和异方差性12.1复习笔记考点一:含序列相关误差时OLS 的性质★★★1.无偏性和一致性当时间序列回归的前3个高斯-马尔可夫假定成立时,OLS 的估计值是无偏的。
把严格外生性假定放松到E(u t |X t )=0,可以证明当数据是弱相关时,∧βj 仍然是一致的,但不一定是无偏的。
2.有效性和推断假定误差存在序列相关,即满足u t =ρu t-1+e t ,t=1,2,…,n,|ρ|<1。
其中,e t 是均值为0方差为σe 2满足经典假定的误差。
对于简单回归模型:y t =β0+β1x t +u t 。
假定x t 的样本均值为零,因此有:1111ˆn x t tt SST x u -==+∑ββ其中:21nx t t SST x ==∑∧β1的方差为:()()122221111ˆ/2/n n n t j xt t x x t t j t t j Var SST Var x u SST SST x x ---+===⎛⎫==+ ⎪⎝⎭∑∑∑βσσρ其中:σ2=Var(u t )。
根据∧β1的方差表达式可知,第一项为经典假定条件下的简单回归模型中参数的方差。
因此,当模型中的误差项存在序列相关时,OLS 估计的方差是有偏的,假设检验的统计量也会出现偏差。
3.拟合优度当时间序列回归模型中的误差存在序列相关时,通常的拟合优度指标R 2和调整R 2便会失效;但只要数据是平稳和弱相关的,拟合优度指标就仍然有效。
4.出现滞后因变量时的序列相关(1)在出现滞后因变量和序列相关的误差时,OLS 不一定是不一致的假设E(y t |y t-1)=β0+β1y t-1。
其中,|β1|<1。
加上误差项把上式写为:y t =β0+β1y t-1+u t ,E(u t |y t-1)=0。
模型满足零条件均值假定,因此OLS 估计量∧β0和∧β1是一致的。
误差{u t }可能序列相关。
虽然E(u t |y t-1)=0保证了u t 与y t-1不相关,但u t-1=y t -1-β0-β1y t-2,u t 和y t-2却可能相关。
计量经济学导论第六版课后答案知识伍德里奇
计量经济学导论第六版课后答案知识伍德里奇第一章:计量经济学介绍1. 为什么需要计量经济学?计量经济学的主要目标是提供一种科学的方法来解决经济问题。
经济学家需要使用数据来验证经济理论的有效性,并预测经济变量的发展趋势。
计量经济学提供了一种框架,使得经济学家能够使用数学和统计方法来分析经济问题。
2. 计量经济学的基本概念•因果推断:计量经济学的核心是通过观察数据来推断出变量之间的因果关系。
通过使用统计方法,我们可以分析出某个变量对另一个变量的影响。
•数据类型:计量经济学研究的数据可以是时间序列数据或截面数据。
时间序列数据是沿着时间轴观测到的数据,而截面数据是在某一时间点上观测到的数据。
•数据偏差:在计量经济学中,数据偏差是指由于样本选择问题、观测误差等原因导致数据与真实值之间的差异。
3. 计量经济学的方法计量经济学使用了许多统计和经济学方法来分析数据。
以下是一些常用的计量经济学方法:•最小二乘法(OLS):在计量经济学中,最小二乘法是一种常用的回归方法。
它通过最小化观测值和预测值之间的平方差来估计未知参数。
•时间序列分析:时间序列分析是通过对时间序列数据进行模型化和预测来研究经济变量的变化趋势。
•面板数据分析:面板数据是同时包含时间序列和截面数据的数据集。
面板数据分析可以用于研究个体和时间的变化,以及它们之间的关系。
4. 计量经济学应用领域计量经济学广泛应用于经济学研究和实践中的各个领域。
以下是一些计量经济学的应用领域:•劳动经济学:计量经济学可以用来研究劳动力市场的供求关系、工资决定因素等问题。
•金融经济学:计量经济学可以用来研究证券价格、金融市场的波动等问题。
•产业组织经济学:计量经济学可以用来研究市场竞争、垄断力量等问题。
•发展经济学:计量经济学可以用来研究发展中国家的经济增长、贫困问题等。
第二章:统计学回顾1. 统计学基本概念•总体和样本:总体是指我们想要研究的全部个体或事物的集合,而样本是从总体中选取的一部分个体或事物。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-跨时横截面的混合:简单面板数据方法
第三篇高级专题第13章跨时横截面的混合:简单面板数据方法13.1复习笔记考点一:跨时独立横截面的混合★★★★★1.独立混合横截面数据的定义独立混合横截面数据是指在不同时点从一个大总体中随机抽样得到的随机样本。
这种数据的重要特征在于:都是由独立抽取的观测所构成的。
在保持其他条件不变时,该数据排除了不同观测误差项的相关性。
区别于单独的随机样本,当在不同时点上进行抽样时,样本的性质可能与时间相关,从而导致观测点不再是同分布的。
2.使用独立混合横截面的理由(见表13-1)表13-1使用独立混合横截面的理由3.对跨时结构性变化的邹至庄检验(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(见表13-2)表13-2用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(2)对多个时期计算邹至庄检验统计量的办法①使用所有时期虚拟变量与一个(或几个、所有)解释变量的交互项,并检验这些交互项的联合显著性,一般总能检验斜率系数的恒定性。
②做一个容许不同时期有不同截距的混合回归来估计约束模型,得到SSR r。
然后,对T个时期都分别做一个回归,并得到相应的残差平方和,有:SSR ur=SSR1+SSR2+…+SSR T。
若有k个解释变量(不包括截距和时期虚拟变量)和T个时期,则需检验(T-1)k个约束。
而无约束模型中有T+Tk个待估计参数。
所以,F检验的df为(T-1)k和n-T-Tk,其中n为总观测次数。
F统计量计算公式为:[(SSR r-SSR ur)/SSR ur][(n-T-Tk)/(Tk-k)]。
但该检验不能对异方差性保持稳健,为了得到异方差-稳健的检验,必须构造交互项并做一个混合回归。
4.利用混合横截面作政策分析(1)自然实验与真实实验当某些外生事件改变了个人、家庭、企业或城市运行的环境时,便产生了自然实验(准实验)。
一个自然实验总有一个不受政策变化影响的对照组和一个受政策变化影响的处理组。
自然实验中,政策发生后才能确定处理组和对照组。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第1章及第一篇(第2~3章)【圣才出品】
品数(output)方面的信息。 (i)仔细陈述这个政策问题背后其他情况不变的思维试验。 (ii)一个企业培训其员工的决策看起来有可能独立于工人特征吗?工人可观测与不可
观测的特征各有哪些? (iii)除工人特征之外,再列出一个影响工人生产力的因素。 (iv)你若发现 training 和 output 之间成正相关关系,你令人信服地证明了工作培训
2.工作培训项目的理由之一是能提高工人的生产力。假设要求你评估更多的工作培训 是否使工人更有生产力。不过,你没有工人的个人数据,而是有俄亥俄州制造企业的数据。 具体而言,对每个企业,你都有人均工作培训小时数(training)和单位工时生产的合格产
4 / 91
圣才电子书 十万种考研考证电子书、题库视频学习平台
十万种考研考证电子书、题库视频学习平台
表 1-1 经济数据的结构
2.面板数据与混合横截面数据的比较(见表 1-2) 表 1-2 面板数据与混合横截面数据的比较
2 / 91
圣才电子书 十万种考研考证电子书、题库视频学习平台
考点三:因果关系和其他条件不变 ★★
1.因果关系 因果关系是指一个变量的变动将引起另一个变量的变动,这是经济分析中的重要目标之 一。计量分析虽然能发现变量之间的相关关系,但是如果想要解释因果关系,还要排除模型 本身存在因果互逆的可能,否则很难让人信服。
答:讲不通。因为找出每周学习小时数(study)和每周工作小时数(work)之间的关 系,是说每周学习小时数(study)和每周工作小时数(work)之间有关系,但没有说是因 果关系,每周学习小时数可能与其他因素有关或每周工作小时数与其他因素有关。
4.对税收有控制权的州或省份有时候会减少税收来刺激经济增长。假设你被某州政府 雇佣来估计公司税率的影响,比如说对每单位州生产总值增长的影响。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-工具变量估计与两阶段最小二乘法
第15章工具变量估计与两阶段最小二乘法15.1复习笔记考点一:工具变量法★★★★★1.简单模型的工具变量法简单回归模型为y=β0+β1x+u,其中x与u相关:Cov(x,u)≠0。
(1)为了在x和u相关时得到β0和β1的一致估计量,需要有一个可观测到的变量z,z满足两个假定:①工具外生性条件,z与u不相关,即Cov(z,u)=0,意味着z应当对y无偏效应(一旦x和u中的遗漏变量被控制),也不应当与其他影响y的无法观测因素相关;②工具相关性条件,z与x相关,即Cov(z,x)≠0,意味着z必然与内生解释变量x 有着或正或负的关系。
满足这两个条件,则z称为x的工具变量,简称为x的工具。
(2)工具变量的两个要求之间的差别①Cov(z,u)是z与无法观测误差u的协方差,通常无法对它进行检验:在绝大多数情形中,必须借助于经济行为或反思来维持这一假定。
②给定一个来自总体的随机样本,z与x(在总体中)相关的条件则可加以检验。
最容易的方法是估计一个x与z之间的简单回归。
在总体中,有x=π0+π1z+v,从而,由于π1=Cov(z,x)/Var(z)所以式Cov(z,x)≠0中的假定当且仅当π1≠0时成立。
因而就能够在充分小的显著水平上,相对双侧对立假设H 1:π1≠0而拒绝虚拟假设H 0:π1=0。
就能相当有把握地肯定工具z 与x 是相关的。
2.工具变量估计量(1)参数的工具变量(IV)估计量参数的识别意味着可以根据总体矩写出β1,而总体矩可用样本数据进行估计。
为了根据总体协方差写出β1,利用简单回归方程可得z 与y 之间的协方差为:Cov(z,y)=β1Cov(z,x)+Cov(z,u)在Cov(z,u)=0与Cov(z,x)≠0的假定下,可以解出β1为:β1=Cov(z,y)/Cov(z,x)β1是z 和y 之间的总体协方差除以z 和x 之间的总体协方差,说明β1被识别了。
给定一个随机样本,用对应样本量来估计总体量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章多元回归分析:推断4.1复习笔记考点一:OLS估计量的抽样分布★★★1.假定MLR.6(正态性)假定总体误差项u独立于所有解释变量,且服从均值为零和方差为σ2的正态分布,即:u~Normal(0,σ2)。
对于横截面回归中的应用来说,假定MLR.1~MLR.6被称为经典线性模型假定。
假定下对应的模型称为经典线性模型(CLM)。
2.用中心极限定理(CLT)在样本量较大时,u近似服从于正态分布。
正态分布的近似效果取决于u中包含多少因素以及因素分布的差异。
但是CLT的前提假定是所有不可观测的因素都以独立可加的方式影响Y。
当u是关于不可观测因素的一个复杂函数时,CLT论证可能并不适用。
3.OLS估计量的正态抽样分布定理4.1(正态抽样分布):在CLM假定MLR.1~MLR.6下,以自变量的样本值为条件,有:∧βj~Normal(βj,Var(∧βj))。
将正态分布函数标准化可得:(∧βj-βj)/sd(∧βj)~Normal(0,1)。
注:∧β1,∧β2,…,∧βk的任何线性组合也都符合正态分布,且∧βj的任何一个子集也都具有一个联合正态分布。
考点二:单个总体参数检验:t检验★★★★1.总体回归函数总体模型的形式为:y=β0+β1x1+…+βk x k+u。
假定该模型满足CLM假定,βj的OLS 量是无偏的。
2.定理4.2:标准化估计量的t分布在CLM假定MLR.1~MLR.6下,(∧βj-βj)/se(∧βj)~t n-k-1,其中,k+1是总体模型中未知参数的个数(即k个斜率参数和截距β0)。
t统计量服从t分布而不是标准正态分布的原因是se(∧βj)中的常数σ已经被随机变量∧σ所取代。
t统计量的计算公式可写成标准正态随机变量(∧βj-βj)/sd(∧βj)与∧σ2/σ2的平方根之比,可以证明二者是独立的;而且(n-k-1)∧σ2/σ2~χ2n-k-1。
于是根据t随机变量的定义,便得到此结论。
3.单个参数的检验(见表4-1)表4-1单个参数的检验注意:(1)当检验βj 是否等于某个非零常数时,则H 0:βj =αj 。
相应的t 统计量为:t=(∧βj -αj )/se(∧βj )。
(2)p 值是根据t 值在t 分布上计算出的概率,就是能拒绝虚拟假设的最小显著性水平。
用α表示检验的显著性水平,当p<α时,就应拒绝虚拟假设;否则,就不能拒绝H 0。
(3)当不能拒绝原假设时,应回答“不能拒绝原假设”,而不能说“接受原假设”。
4.经济或实际显著性与统计显著性(1)变量x j 的统计显著性完全由j ˆt 的大小决定,而经济显著性或实际显著性则与∧βj 的大小(及符号)相关。
(2)在实践中,区分导致t 统计量统计显著的原因很重要。
当一个变量的估计效应不太大时,认为该变量在解释y 时很“重要”会导致错误的结论。
(3)一般而言,样本越大,变量往往会越显著,因此进行t 检验时应使用更小的显著性水平。
5.检验变量在多元回归模型中的经济和统计显著性的准则(1)首先检查统计显著性,当变量通过显著性检验时,可再讨论系数的大小;当变量没有通过检验时,若根据理论或实践经验认为该变量对于模型很重要,则应适当放松显著性(尤其是小样本)。
(2)一般来说,t统计量很小的变量都具有“错误”的符号。
考点三:置信区间★在经典线性模型假定下,为总体参数βj构造一个置信区间(CI)是很容易的。
置信区间又称区间估计,它为总体参数的可能取值提供了一个范围,而不只是一个点估计值。
它的含义是:对每次获得的随机样本都计算∧βj并构造一个样本区间,那么总体值βj将以1-α的概率出现在样本区间中。
置信区间的下界和上界分别是:∧βj-c·se(∧βj)和∧βj+c·se(∧βj)。
考点四:检验关于参数的一个线性组合假设★★★假定检验的原虚拟假设为H0:β1=β2,对立假设为H1:β1<β2。
将虚拟假设和对立假设分别重新写成H0:β1-β2=0与H1:β1-β2<0。
构造新的t统计量,即:t=(∧β1-∧β2)/se(∧β1-∧β2)。
因为Var(∧β1-∧β2)=Var(∧β1)+Var(∧β2)-2Cov(∧β1,∧β2),所以se(∧β1-∧β2)={[se(∧β1)]2+[se(∧β2)]2-2s12}1/2,其中s12为Cov(∧β1,∧β2)的一个估计值。
因此,se (∧β1-∧β2)的计算较为困难,而且在回归结果中也并没有报告(∧β1-∧β2)的标准误。
在实际操作中,可将β1与β2之差定义为一个新参数,即θ1=β1-β2。
因此原虚拟假设和备择假设转变为H0:θ1=0与H1:θ1<0。
将β1写为β1=θ1+β2,代入模型中去,通过构造新的变量便可以估计出∧θ的标准误,这样就可以直接进行t检验。
考点五:对多个线性约束的检验:F检验★★★★★1.对排除性约束的检验对排除性约束的检验是指检验一组自变量是否对因变量都没有影响,该检验不适用于不同因变量的检验。
F统计量通常对检验一组变量的排除有用处,特别是当变量高度相关的时候。
含有k个自变量的不受约束模型为:y=β0+β1x1+…+βk x k+u,其中参数有k+1个。
假设有q个排除性约束要检验,且这q个变量是自变量中的最后q个:x k-q+1,…,x k,则受约束模型为:y=β0+β1x1+…+βk-q x k-q+u。
虚拟假设为H0:βk-q+1=0,…,βk=0,对立假设是列出的参数至少有一个不为零。
定义F统计量为F=[(SSR r-SSR ur)/q]/[SSR ur/(n-k-1)]。
其中,SSR r是受约束模型的残差平方和,SSR ur是不受约束模型的残差平方和。
由于SSR r不可能比SSR ur小,所以F 统计量总是非负的。
q=df r-df ur,即q是受约束模型与不受约束模型的自由度之差,也是约束条件的个数。
n-k-1=分母自由度=df ur,且F的分母恰好就是不受约束模型中σ2=Var(u)的一个无偏估计量。
假设CLM假定成立,在H0下F统计量服从自由度为(q,n-k-1)的F分布,即F~F q,n-k-1。
如果F值大于显著性水平下的临界值,则拒绝H0而支持H1。
当拒绝H0时,就说,x k-q+1,…,x k在适当的显著性水平上是联合统计显著的(或联合显著)。
2.F统计量和t统计量之间的关系(1)当检验单个变量的显著性时,F统计量等于对应t统计量的平方。
因为t n-k-12具有F1,n-k-1分布,所以在双侧对立假设下,这两种方法得到完全一样的结果。
但t统计量可用来检验单侧备择假设,对于检验单个参数假设更灵活;且t统计量比F统计量更容易获得。
因此一般用t统计量对单个参数假设进行检验。
(2)两(或多)个t检验不显著的变量,合起来可能十分显著。
此外还可能,在一组解释变量中,一个变量t检验显著;但在常用的显著性水平上,这组变量却不是联合显著的。
(t检验与F检验之间的这种可能冲突,给出了为什么不应该“接受”原假设的一个例子。
)(3)当一个变量十分显著时,对它与其他变量进行联合检验,结果是联合显著的。
在这种情况下,同时拒绝这两个虚拟假设并不存在逻辑上的不一致。
3.F统计量的R2型(1)F统计量的R2型的优点①R2必定介于0和1之间;而SSR在很大程度上依赖度量单位,计算较繁冗。
②R2在几乎所有的回归中都会报告,使用R2来检验变量的排除较为容易。
(2)F统计量的R2型的公式计算公式为:F=[(R ur2-R r2)/q]/[(1-R ur2)/(n-k-1)]=[(R ur2-R r2)/q]/[(1-R ur2)/df ur)]。
因为R ur2>R r2,所以再次表明F总是正的。
4.回归整体显著性的F统计量在含有k个自变量的模型中,对于整体显著性检验的虚拟假设为所有的斜率参数都是零,即H0:β1=β2=…=βk=0,对应的受约束模型为y=β0+u。
受约束模型的R2为零,因为y中的变异一点都没有得到解释。
F统计量的计算公式为:F=(R2/k)/[(1-R2)/(n-k-1)]。
其中,R2是y对x1,x2,…,x k回归的通常R2。
上述F统计量的公式只有在检验所有自变量的联合排除时才有效。
5.检验一般的线性约束假设不受约束模型为y=β0+β1x1+β2x2+β3x3+β4x4+u。
当检验的原假设为H0:β1=1,β2=0,β3=0,β4=0。
其中,除β1=1外都是排除性约束。
首先估计不受约束模型,得到SSR ur;然后施加约束,得到受约束模型y=β0+x1+u,变换为y-x1=β0+u,估计该式子得到SSR r。
F统计量就是[(SSR r-SSR ur)/SSR ur][(n -5)/4],将得到的F值与临界值比较即可决定是否拒绝原假设。
4.2课后习题详解一、习题1.下面哪种因素可能导致通常OLS的t统计量无效(即在H0下不服从t分布)?(i)异方差性。
(ii)模型中两个自变量之间的样本相关系数达到0.95。
(iii)遗漏一个重要的解释变量。
答:(i)和(iii)可能导致通常OLS的t统计量无效。
同方差性是CLM假定之一。
遗漏一个重要的变量违背了假定MLR.3。
(ii)CLM假定除了排除相关系数等于1的情况外,并没有涉及自变量之间的相关性。
2.考虑一个用企业年销售额、股本回报率(roe,以百分数表示)和企业股票的回报(ros,以百分数表示)来解释CEO薪水的如下方程:log(salary)=β0+β1log(sales)+β2roe+β3ros+u(i)用模型参数来表述如下原假设:在控制了sales和roe后,ros对CEO的薪水没有影响。
再给出备择假设的参数表述:股票市场更好的业绩会提高CEO的薪水。
(ii)使用CEOSAL1中的数据,通过OLS可以得到如下方程:如果ros提高50个百分点,预计salary会提高多大比例?ros对salary具有实际上很大的影响吗?(iii)检验ros对salary没有影响的原假设,备择假设是具有正效应。
在10%的显著性水平上进行检验。
(iv)你最后会在一个用企业业绩表示CEO报酬的模型中包括ros吗?给出你的解释。
答:(i)原假设为:H0:β3=0;备择假设为:H1:β3>0。
(ii)如果ros提高50个百分点,预计salary会提高:0.00024×50=0.012=1.2%。
因此ros对salary的影响实际上是很小的。
(iii)自由度为n-k-1=209-3-1=205,10%的显著性水平下,单侧检验的临界值为1.282。
t统计量为:0.00024/0.00054≈0.44,小于临界值,因此在10%的显著水平上不能拒绝虚拟假设,即ros对salary没有影响。
(iv)会。