伍德里奇计量经济学课件 (14)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ˆ b 1
Introductory Econometrics 15 of 54
证明一致性
Because as n , n 1 xi1 x1 ui 0 n
1
xi1 x1
2
does not converge to zero,
2
ˆ b plimb 1 1
Introductory Econometrics
17 of 54
一个更弱的假定
n n n
要获得估计量的无偏性,我们假定零条件期望 – E(u|x1, x2,…,xk) = 0 而要获得估计量的一致性,我们可以使用更弱的假定: 零期望和零相关性假定。 如果这个较弱的假定也不成立,OLS将是有偏而且不一 致的。
Introductory Econometrics
18 of 54
推导不一致性
n
b , 并考虑下面 定义渐近偏差为:plimb 1 1 的真实模型和待估计模型。
True model: y b 0 b1 x1 b 2 x2 v u b 2 x2 v and then, b b plimb
n
Introductory Econometrics
5 of 54
为什么考虑一致性
n
由于在很多情形下误差项可能呈现非正态 分布,了解OLS 估计量和检验统计量的渐 近性,即当样本容量任意大时的特性就是 重要的问题。
Introductory Econometrics
6 of 54
什么是一致性
令 W n 是基于样本 y1 , y2 ,..., yn 的关于 的估计量。 如果对于任何 >0 ,当 n 时 Pr(|Wn | ) 0
n 1 xi1 x1 ui n 1 xi1 x1
b1.
由于当n趋于无穷时分子趋于零而分母不 ˆ 的概率极限即b 。 趋于零,故b
1 1
Introductory Econometrics 16 of 54
证明OLS的一致性
n
多元回归中OLS估计量的一致性的证明可 以通过矩阵运算得到。
5
Introductory Econometrics 1
多元回归分析: OLS的渐近性(1)
y = b0 + b1x1 + b2x2 + . . . + bkxk + u
Introductory Econometrics
2
本章提纲
一致性 n 渐近正态和大样本推断 n OLS的渐近有效性
Introductory Econometrics
12 of 54
当n增加时样本的分布
n1 < n2 < n3
n3
例:n1:每次从班上抽取10人, 抽若干次后,平均身高的分布; n2:每次从班上抽取100人, 抽若干次后,平均身高的分布; n3:每次从班上抽取200人, 抽若干次后,平均身高的分布。
SST j 1 R j 2
2
2 2 SST j ( SSR j / SST j ) SSR j
2 ˆij SST j ( xij x j ) 2 , SSR j r .
Notice the sample variance of x j is SST j / n, 注意到x j的样本方差为SSTj / n, ˆij is SSR j / n. and the sample variance of r ˆij的样本方差为SSR j / n。 而r
Introductory Econometrics
20 of 54
有内生性时的一致性
n n n
考虑真实模型为y = b0 + b1x1 + b2x2 + u ,但u和x1相关。 若x1 和x2相关,而u和x2不相关,则对b1和b2的OLS估计量 都是不一致的。 若x1 和x2不相关,且u和x2不相关,则只有对b1的OLS估计 量是不一致的
n
我们已经讨论了有限样本(小样本)中OLS估计量和检验统 计量具有的如下性质:
n
样本容量为任意n时,这些性质都成立。
在MLR. 1-4下 OLS估计量具有无偏性 n 在MLR.1-5下 OLS估计量是最优线性无偏估计量 n 在MLR.1-6 下OLS估计量是最小方差无偏估计量 n t(F)统计量的分布为t(F)分布。
渐近正态和大样本推断
n n n
我们要做些什么? 当样本容量变大时是否估计量会渐近地趋向于正 态分布? 我们讨论是否OLS估计量满足渐近正态性。
Introductory Econometrics
26 of 54
中心极限定理
基于中心极限定理,我们能够证明OLS估计量是渐近正态。 渐近正态意味着当n 时,P(Z<z) F(z) 或者 P(Z<z) Ф(z) w 中心极限定理指出任何一个均值为µ而方差为σ2 的总体的标准化平均值的分布渐近趋向于N(0,1), 或记作
Introductory Econometrics 31 of 54
理解定理5.2
2 1 ˆ ) V (b , j 2 SSR j n r ˆ 2 ˆij. where r ˆ is the population variance of r 2 ˆij的总体方差。 其中 r ˆ 是r
Introductory Econometrics
24 of 54
渐近正态和大样本推断
n n
很容易碰到一些例子,其中严格的正态性假定并不能成 立 任何一个明显不对称的变量,像拘捕次数,储蓄量,等 等都不可能服从正态分布,因为正态分布是对称的。
Introductory Econometrics
25 of 54
bˆ
j
ˆ se b j
bj
~ Normal 0,1
a
Introductory Econometrics
29 of 54
在定理5.2中什么是我们的假定而什么不是
n n
去掉了正态性假定MLR.6 仍然假定: n 误差的分布具有有限的方差 n 零条件期望 n 同方差性 n 线性结构和随机样本
Z Y Y
~ N 0,1
a
Z
Y Y
n
~ N 0,1
a
n
Introductory Econometrics
27 of 54
定理5.2: OLS的渐近正态性
Under the Gauss-Markov assumptions MLR.1 - MLR.5 ˆ is asymptotically normally distributed. That is, (i) b
Introductory Econometrics
8 of 54
一致性与无偏性 E(x)=z* (n-1)/n+n* 1/n=1 X的期望为1 n 记plim(x) 为n趋向无穷大时x的取值。因此
n
plim(x)=z=0.
Introductory Econometrics
9 of 54
一致性与无偏性
1 1 2
You think: y b 0 b1 x1 u , so that
where Cov x1 , x2 Var x1
Introductory Econometrics 19 of 54
渐近偏差(续)
n
n
所以,考虑渐近偏差的方向就像是考虑存在一个 遗漏变量时偏差的方向。 主要的区别在于渐近偏差用总体方差和总体协方差表示,而 偏差则是基于它们在样本中的对应量。 记住,不一致性是一个大样本问题。因此,当数据增加时候 这个问题并不会消失。
n2
Sampling distribution of β1
n1
b1
Introductory Econometrics
13 of 54
OLS的一致性
n n
定理5.1: 在假设MLR.1到MLR.4下,OLS截距估 计量和斜率估计量都是一致的估计量。 对简单回归而言,证明估计量的一致性和证明无 偏性的方法是类似的。
Introductory Econometrics
30 of 54
理解定理5.2
Why considering 为什么在(i)中考虑 ˆ ) Because V ( b j
ˆ b , not just b ˆ b in (i)? n b j j j j ˆ b ,而不是 b ˆ b n b j j j j
introductoryeconometrics33of54渐近正态续?因为自由度df很大的t分布接近于正态分布我们也可以得到????1?????knajjjtsebbb注意到尽管我们在大样本中不再需要正态性假定我们仍然需要同方差性introductoryeconometrics34of54渐近标准误差如果u不是正态分布我们有时把标准误差称作是渐近标准误差因为??????ncsersstsejjjjj???b?b?1??22所以我们预计标准误差减小的速度与n成正比introductoryeconometrics35多元回归分析
Wn 便是 的一个一致估计量。 当Wn 具有一致性时,我们也称 为 Wn 的概率极限,写
作是 p lim(Wn ) .
Introductory Econometrics
7 of 54
一致性与无偏性
n n
一个估计量是否有可能在有限样本中是有偏的但 又具有一致性? 假设Z的真值为0,一个随机变量X以(n-1)/n的概 率取值为Z,而以1/n的概率取值为n。
Introductory Econometrics
21 of 54
渐近正态和大样本推断 估计量的一致性是一条重要性质,但我们并不能 只靠它来进行统计推断。 在经典线性模型假设下,样本的分布是正态分布, 因而我们能够推出t分布和F分布用于检验。
n n
Introductory Econometrics
Introductory Econometrics
14 of 54
证明一致性
The OLS estimated slope parameter from simple regression is 简单回归中的斜率估计量即
xi1 x1 yi 2 x x i1 1 xi1 x1 ui b1 2 x x i1 1 n 1 xi1 x1 ui b1 2 n 1 xi1 x1
n
Introductory Econometrics
3 of 54
本课提纲
一致性的含义是什么 n OLS估计量的一致性 n 当零条件均值假设不成立时OLS没有一致 性。 n 渐近正态性和大样本推断的含义是什么 n OLS的渐近正态
n
Introductory Econometrics
4 of 54
为什么考虑一致性
j
ˆ b ~ Normal 0, 2 a2 , n b j j j ˆ where 2 a 2 j is the asymptotic variance of n b j b j ,
1 2 ˆ and a 2 plim n r rij are the residuals from ij , where ˆ j
n n
是否有可能(一个估计量)是无偏却不一致的? 假设Z的真值为0,一个随机变量X以0.5的概率 取0.5,而以0.5的概率取-0.5,那么X的期望为0。 但是X总是在X=0这条线上下摆动,当n趋向无穷 大时,它的方差并不会趋于0。因此,它是Z的不 一致的估计量。
Introductory Econometrics
10 of 54
一致性与无偏性
n
无偏估计量未必是一致的,但是那些当样 本容量增大时方差会收缩到零的无偏估计 量是一致的。
Introductory Econometrics
11 of 54
一致性
n
n
在高斯-马尔可夫假定下OLS 是最优线性无偏 估计量,但在别的情形下不一定能找到无偏估计 量。 在那些情形下,我们只要找到一致的估计量,即 当n ∞时, 这些估计量的分布退化为参数的真值。
a
regressing x j on the other independent variables.
Introductory Econometrics 28 of 54
定理5.2: OLS的渐近正态性
ˆ 2 is a consistent estimator of 2 (ii) (iii) For each j,
22 of 54
渐近正态和大样本推断
n n
这种准确的正态分布来自于总体误差的分布是正 态分布的假定。 这个正态误差的假定意味着当x给定时,y的分布 也是正态分布。
Introductory Econometrics
23 of 54
渐近正态和大样本推断
n
为什么需要正态性假定?
n n n
为了证明无偏性?-不是 为了证明最优线性估计量?不是 为了能够用t统计量和F统计量作精确的推断?是的
Introductory Econometrics 15 of 54
证明一致性
Because as n , n 1 xi1 x1 ui 0 n
1
xi1 x1
2
does not converge to zero,
2
ˆ b plimb 1 1
Introductory Econometrics
17 of 54
一个更弱的假定
n n n
要获得估计量的无偏性,我们假定零条件期望 – E(u|x1, x2,…,xk) = 0 而要获得估计量的一致性,我们可以使用更弱的假定: 零期望和零相关性假定。 如果这个较弱的假定也不成立,OLS将是有偏而且不一 致的。
Introductory Econometrics
18 of 54
推导不一致性
n
b , 并考虑下面 定义渐近偏差为:plimb 1 1 的真实模型和待估计模型。
True model: y b 0 b1 x1 b 2 x2 v u b 2 x2 v and then, b b plimb
n
Introductory Econometrics
5 of 54
为什么考虑一致性
n
由于在很多情形下误差项可能呈现非正态 分布,了解OLS 估计量和检验统计量的渐 近性,即当样本容量任意大时的特性就是 重要的问题。
Introductory Econometrics
6 of 54
什么是一致性
令 W n 是基于样本 y1 , y2 ,..., yn 的关于 的估计量。 如果对于任何 >0 ,当 n 时 Pr(|Wn | ) 0
n 1 xi1 x1 ui n 1 xi1 x1
b1.
由于当n趋于无穷时分子趋于零而分母不 ˆ 的概率极限即b 。 趋于零,故b
1 1
Introductory Econometrics 16 of 54
证明OLS的一致性
n
多元回归中OLS估计量的一致性的证明可 以通过矩阵运算得到。
5
Introductory Econometrics 1
多元回归分析: OLS的渐近性(1)
y = b0 + b1x1 + b2x2 + . . . + bkxk + u
Introductory Econometrics
2
本章提纲
一致性 n 渐近正态和大样本推断 n OLS的渐近有效性
Introductory Econometrics
12 of 54
当n增加时样本的分布
n1 < n2 < n3
n3
例:n1:每次从班上抽取10人, 抽若干次后,平均身高的分布; n2:每次从班上抽取100人, 抽若干次后,平均身高的分布; n3:每次从班上抽取200人, 抽若干次后,平均身高的分布。
SST j 1 R j 2
2
2 2 SST j ( SSR j / SST j ) SSR j
2 ˆij SST j ( xij x j ) 2 , SSR j r .
Notice the sample variance of x j is SST j / n, 注意到x j的样本方差为SSTj / n, ˆij is SSR j / n. and the sample variance of r ˆij的样本方差为SSR j / n。 而r
Introductory Econometrics
20 of 54
有内生性时的一致性
n n n
考虑真实模型为y = b0 + b1x1 + b2x2 + u ,但u和x1相关。 若x1 和x2相关,而u和x2不相关,则对b1和b2的OLS估计量 都是不一致的。 若x1 和x2不相关,且u和x2不相关,则只有对b1的OLS估计 量是不一致的
n
我们已经讨论了有限样本(小样本)中OLS估计量和检验统 计量具有的如下性质:
n
样本容量为任意n时,这些性质都成立。
在MLR. 1-4下 OLS估计量具有无偏性 n 在MLR.1-5下 OLS估计量是最优线性无偏估计量 n 在MLR.1-6 下OLS估计量是最小方差无偏估计量 n t(F)统计量的分布为t(F)分布。
渐近正态和大样本推断
n n n
我们要做些什么? 当样本容量变大时是否估计量会渐近地趋向于正 态分布? 我们讨论是否OLS估计量满足渐近正态性。
Introductory Econometrics
26 of 54
中心极限定理
基于中心极限定理,我们能够证明OLS估计量是渐近正态。 渐近正态意味着当n 时,P(Z<z) F(z) 或者 P(Z<z) Ф(z) w 中心极限定理指出任何一个均值为µ而方差为σ2 的总体的标准化平均值的分布渐近趋向于N(0,1), 或记作
Introductory Econometrics 31 of 54
理解定理5.2
2 1 ˆ ) V (b , j 2 SSR j n r ˆ 2 ˆij. where r ˆ is the population variance of r 2 ˆij的总体方差。 其中 r ˆ 是r
Introductory Econometrics
24 of 54
渐近正态和大样本推断
n n
很容易碰到一些例子,其中严格的正态性假定并不能成 立 任何一个明显不对称的变量,像拘捕次数,储蓄量,等 等都不可能服从正态分布,因为正态分布是对称的。
Introductory Econometrics
25 of 54
bˆ
j
ˆ se b j
bj
~ Normal 0,1
a
Introductory Econometrics
29 of 54
在定理5.2中什么是我们的假定而什么不是
n n
去掉了正态性假定MLR.6 仍然假定: n 误差的分布具有有限的方差 n 零条件期望 n 同方差性 n 线性结构和随机样本
Z Y Y
~ N 0,1
a
Z
Y Y
n
~ N 0,1
a
n
Introductory Econometrics
27 of 54
定理5.2: OLS的渐近正态性
Under the Gauss-Markov assumptions MLR.1 - MLR.5 ˆ is asymptotically normally distributed. That is, (i) b
Introductory Econometrics
8 of 54
一致性与无偏性 E(x)=z* (n-1)/n+n* 1/n=1 X的期望为1 n 记plim(x) 为n趋向无穷大时x的取值。因此
n
plim(x)=z=0.
Introductory Econometrics
9 of 54
一致性与无偏性
1 1 2
You think: y b 0 b1 x1 u , so that
where Cov x1 , x2 Var x1
Introductory Econometrics 19 of 54
渐近偏差(续)
n
n
所以,考虑渐近偏差的方向就像是考虑存在一个 遗漏变量时偏差的方向。 主要的区别在于渐近偏差用总体方差和总体协方差表示,而 偏差则是基于它们在样本中的对应量。 记住,不一致性是一个大样本问题。因此,当数据增加时候 这个问题并不会消失。
n2
Sampling distribution of β1
n1
b1
Introductory Econometrics
13 of 54
OLS的一致性
n n
定理5.1: 在假设MLR.1到MLR.4下,OLS截距估 计量和斜率估计量都是一致的估计量。 对简单回归而言,证明估计量的一致性和证明无 偏性的方法是类似的。
Introductory Econometrics
30 of 54
理解定理5.2
Why considering 为什么在(i)中考虑 ˆ ) Because V ( b j
ˆ b , not just b ˆ b in (i)? n b j j j j ˆ b ,而不是 b ˆ b n b j j j j
introductoryeconometrics33of54渐近正态续?因为自由度df很大的t分布接近于正态分布我们也可以得到????1?????knajjjtsebbb注意到尽管我们在大样本中不再需要正态性假定我们仍然需要同方差性introductoryeconometrics34of54渐近标准误差如果u不是正态分布我们有时把标准误差称作是渐近标准误差因为??????ncsersstsejjjjj???b?b?1??22所以我们预计标准误差减小的速度与n成正比introductoryeconometrics35多元回归分析
Wn 便是 的一个一致估计量。 当Wn 具有一致性时,我们也称 为 Wn 的概率极限,写
作是 p lim(Wn ) .
Introductory Econometrics
7 of 54
一致性与无偏性
n n
一个估计量是否有可能在有限样本中是有偏的但 又具有一致性? 假设Z的真值为0,一个随机变量X以(n-1)/n的概 率取值为Z,而以1/n的概率取值为n。
Introductory Econometrics
21 of 54
渐近正态和大样本推断 估计量的一致性是一条重要性质,但我们并不能 只靠它来进行统计推断。 在经典线性模型假设下,样本的分布是正态分布, 因而我们能够推出t分布和F分布用于检验。
n n
Introductory Econometrics
Introductory Econometrics
14 of 54
证明一致性
The OLS estimated slope parameter from simple regression is 简单回归中的斜率估计量即
xi1 x1 yi 2 x x i1 1 xi1 x1 ui b1 2 x x i1 1 n 1 xi1 x1 ui b1 2 n 1 xi1 x1
n
Introductory Econometrics
3 of 54
本课提纲
一致性的含义是什么 n OLS估计量的一致性 n 当零条件均值假设不成立时OLS没有一致 性。 n 渐近正态性和大样本推断的含义是什么 n OLS的渐近正态
n
Introductory Econometrics
4 of 54
为什么考虑一致性
j
ˆ b ~ Normal 0, 2 a2 , n b j j j ˆ where 2 a 2 j is the asymptotic variance of n b j b j ,
1 2 ˆ and a 2 plim n r rij are the residuals from ij , where ˆ j
n n
是否有可能(一个估计量)是无偏却不一致的? 假设Z的真值为0,一个随机变量X以0.5的概率 取0.5,而以0.5的概率取-0.5,那么X的期望为0。 但是X总是在X=0这条线上下摆动,当n趋向无穷 大时,它的方差并不会趋于0。因此,它是Z的不 一致的估计量。
Introductory Econometrics
10 of 54
一致性与无偏性
n
无偏估计量未必是一致的,但是那些当样 本容量增大时方差会收缩到零的无偏估计 量是一致的。
Introductory Econometrics
11 of 54
一致性
n
n
在高斯-马尔可夫假定下OLS 是最优线性无偏 估计量,但在别的情形下不一定能找到无偏估计 量。 在那些情形下,我们只要找到一致的估计量,即 当n ∞时, 这些估计量的分布退化为参数的真值。
a
regressing x j on the other independent variables.
Introductory Econometrics 28 of 54
定理5.2: OLS的渐近正态性
ˆ 2 is a consistent estimator of 2 (ii) (iii) For each j,
22 of 54
渐近正态和大样本推断
n n
这种准确的正态分布来自于总体误差的分布是正 态分布的假定。 这个正态误差的假定意味着当x给定时,y的分布 也是正态分布。
Introductory Econometrics
23 of 54
渐近正态和大样本推断
n
为什么需要正态性假定?
n n n
为了证明无偏性?-不是 为了证明最优线性估计量?不是 为了能够用t统计量和F统计量作精确的推断?是的