计量经济学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我们可以使用总体的一个容量为n的随机样本, {(xi1, xi2, …, xik; yi): i=1,…,n}, 其中i 代表第i个观察值,
j=1,…,k代表第j个回归元。
Sometimes we write 有时我们将模型写为
yi= b0+ b1xi1+ b2xi2+ …+bkxik+ui
北京大学中国经济研究中心 沈艳
北京大学中国经济研究中心 沈艳
2
Lecture Outline 课堂大纲
The MLR.1 – MLR.4 Assumptions 假定MLR.1 – MLR.4 The Unbiasedness of the OLS estimates OLS估计值的无偏性 Over or Under specification of models 模型设定不足或过度设定 Omitted Variable Bias 遗漏变量的偏误 Sampling Variance of the OLS slope estimates OLS斜率估计量的抽样方差
当该假定成立时,我们称所有解释变量均为外生的;否则,我 们则称解释变量为内生的。
We will pay particular attention to the case that assumption 3 fails due to omitted variables.
我们将特别注意当重要变量缺省导致假定3不成立的情况。
168.8708 9636.909
443.0 22560
北京大学中国经济研究中心 沈艳
13
Theorem 3.1 (Unbiasedness of OLS) 定理 3.1(OLS的无偏性)
Under assumptions MLR.1 through MLR.4, the OLS estimators are unbiased estimator of the population parameters, that is
同期,高中以上人数占比edu的最小值,均值 和最大值分别是:5.1%, 21.6%, 51.5%.
北京大学中国经济研究中心 沈艳
11
Assumption MLR.4 假定MLR.4
20000 30000 40000 50000 60000
上海 北京
西藏
天津
浙 江广 东 青 海宁 夏江 苏 云贵南州广安四重西甘徽川庆河肃河北福山南海建江新内湖东黑山南蒙龙西疆南古西江湖陕辽吉北西宁林
When one regressor is an exact linear combination of the other regressor(s), we say the model suffers from perfect collinearity. 当一个自变量是其它解释变量的严格线性组合时,我们说此模 型有完全共线性。
当y= b0+ b1x1+ b2x2+ …+bkxk+u, n<(k+1) 也发生完全共线性的情况。
Why does perfect collinearity matter?
为什么完全共线性是个问题?
北京大学中国经济研究中心 沈艳
9
Assumption MLR.4 假定MLR.4
First, find answer from the perspective of ceteris paribus analysis. 首先,你可以从ceteris paribus 分析的角度考虑。
北京大学中国经济研究中心 沈艳
7
Assumption MLR.4 假定MLR.4
MLR.4 (No perfect collinearity) (不存在完全共线性) : In the sample, none of the independent variables is constant, and there are no exact linear relationships among the independent variables. 样本自变量无常数,自变量之间也不存在严格的线性关系。
6
Assumptions MLR.3 假定 MLR.3
MLR.3 (Zero Conditional Mean) (零条件均值) :
E(u| xi1, xi2…, xik)=0. When this assumption holds, we say all of the explanatory variables are exogenous; when it fails, we say that the explanatory variables are endogenous.
我们现在讨论OLS估计量的统计特性,而我们知道OLS是估计潜在 的总体模型参数的估计量。
Statistical properties are the properties of estimators when ranቤተ መጻሕፍቲ ባይዱom sampling is done repeatedly.
Not meaningful to talk about the statistical properties of a set of estimates obtained from a single sample.
Second, from the perspective of partialling out.你可以
从“排除其它变量影响”角度考虑。尤其是观察残差形式的b估计量的公
式。
Third, from the implementation of OLS estimators.
The denominator of the OLS estimator is 0 when there is perfect collinearity, hence the OLS estimator cannot be performed. 在完全共线性情况下,OLS估计量的分母为零,因此
OLS估计量不能估算具体估计值。
北京大学中国经济研究中心 沈艳
10
Assumption MLR.4 假定MLR.4
考虑人口受教育程度对人均工资的影响
变量高中及以上受教育的人数占比edu可以大致反 映人口受教育程度
在2008年,各省职工年平均工资wage的最小 值,均值和最大值分别是:21000, 29298, 56565
The population model is also called the true model, to allow for the possibility that we might estimate a model that differs from it.
总体模型亦称真实模型;我们实际估计的模型有可能和真实模型不同。
在假定MLR.1~MLR.4下,OLS估计量 是总体参数的无偏估计量,即
E(bˆ j ) b j , j 0,1,2,..., k
北京大学中国经济研究中心 沈艳
14
Theorem 3.1 (Unbiasedness of OLS) 定理 3.1(OLS的无偏性)
Unbiasedness is the property of an estimator, that is, the procedure that can produce an estimate for a specific sample, not an estimate.
北京大学中国经济研究中心 沈艳
8
Assumption MLR.4 假定MLR.4
Examples of perfect collinearity:完全共线性的例子:
y= b0+ b1x1+ b2x2+ b3x3+u, x2 = 3x3, y= b0+ b1log(inc)+ b2log(inc2 )+u y= b0+ b1x1+ b2x2+ b3x3+ b4x4+u, x1 +x2 +x3+ x4 =1. Perfect collinearity also happens when y= b0+ b1x1+ b2x2+ …+bkxk+u, n<(k+1).
中级计量经济学
INTERMEDIATE ECONOMETRICS
简单多元回归之二
Chapter Outline 本章大纲
Motivation for Multiple Regression 使用多元回归的动因 Mechanics and Interpretation of Ordinary Least Squares 普通最小二乘法的操作和解释 The Expected Values of the OLS Estimators OLS估计量的期望值 The Variance of the OLS Estimators OLS估计量的方差 Efficiency of OLS: The Gauss-Markov Theorem OLS的有效性:高斯-马尔科夫定理
无偏性是估计量的特性,而不是估计值的特性。估计量是 一种方法(过程),该方法使得给定一个样本,我们可以 得到一组估计值。我们评价的是方法的优劣。
北京大学中国经济研究中心 沈艳
5
Assumption MLR.2 (Random Sampling)
假定 MLR.2(随机抽样性)
We can use a random sample of size n from the population, {(xi1, xi2, …, xik; yi): i=1,…,n}, where i denotes observation, and j= 1,…,k denotes the jth regressor.
统计性质是指当在随机抽样不断重复时,估计量所表现出来的特性。
因此讨论从一个样本中得到的估计值的统计特性是没有什么意义的。
北京大学中国经济研究中心 沈艳
4
Assumption MLR.1 (Linear in Parameters) 假定 MLR.1(对参数而言为线性)
In the population model, the dependent variable y is related to the independent variable x and the error u as
0
10
20
30
40
50
高中以上人数占比(%)
年平均工资(元)
拟合值
北京大学中国经济研究中心 沈艳
12
Assumption MLR.4 假定MLR.4
. gen edu2=edu*2
. reg wage edu edu2 note: edu omitted because of collinearity
= 0.4
Adj R-squared = 0.3
Root MSE
=7
wage
edu edu2 _cons
Coef.
(omitted) 305.9833 16098.88
Std. Err.
67.04014 3159.532
t P>|t|
4.56 0.000 5.10 0.000
[95% Conf. Interv
y= b0+ b1x1+ b2x2+ …+bkxk+u
b1, b2 …, bk : unknown parameters of interest
u is an random error or random disturbance term.
在总体模型中,因变量y与自变量x和误差项u关系如上所示。其中, b1, b2 …, bk 为所关心的未知参数,u为不可观测的随机误差项或随机干扰项。
北京大学中国经济研究中心 沈艳
3
The expected value of the OLS estimators
OLS估计量的期望值
We now turn to the statistical properties of OLS for estimating the parameters in an underlying population model.
Source
SS
df
MS
Model Residual
1.0463e+09 1.4565e+09
1 1.0463e+09 29 50225314.6
Total 2.5028e+09 30 83427163.6
Number of obs =
F( 1, 29) = 20
Prob > F
= 0.0
R-squared
j=1,…,k代表第j个回归元。
Sometimes we write 有时我们将模型写为
yi= b0+ b1xi1+ b2xi2+ …+bkxik+ui
北京大学中国经济研究中心 沈艳
北京大学中国经济研究中心 沈艳
2
Lecture Outline 课堂大纲
The MLR.1 – MLR.4 Assumptions 假定MLR.1 – MLR.4 The Unbiasedness of the OLS estimates OLS估计值的无偏性 Over or Under specification of models 模型设定不足或过度设定 Omitted Variable Bias 遗漏变量的偏误 Sampling Variance of the OLS slope estimates OLS斜率估计量的抽样方差
当该假定成立时,我们称所有解释变量均为外生的;否则,我 们则称解释变量为内生的。
We will pay particular attention to the case that assumption 3 fails due to omitted variables.
我们将特别注意当重要变量缺省导致假定3不成立的情况。
168.8708 9636.909
443.0 22560
北京大学中国经济研究中心 沈艳
13
Theorem 3.1 (Unbiasedness of OLS) 定理 3.1(OLS的无偏性)
Under assumptions MLR.1 through MLR.4, the OLS estimators are unbiased estimator of the population parameters, that is
同期,高中以上人数占比edu的最小值,均值 和最大值分别是:5.1%, 21.6%, 51.5%.
北京大学中国经济研究中心 沈艳
11
Assumption MLR.4 假定MLR.4
20000 30000 40000 50000 60000
上海 北京
西藏
天津
浙 江广 东 青 海宁 夏江 苏 云贵南州广安四重西甘徽川庆河肃河北福山南海建江新内湖东黑山南蒙龙西疆南古西江湖陕辽吉北西宁林
When one regressor is an exact linear combination of the other regressor(s), we say the model suffers from perfect collinearity. 当一个自变量是其它解释变量的严格线性组合时,我们说此模 型有完全共线性。
当y= b0+ b1x1+ b2x2+ …+bkxk+u, n<(k+1) 也发生完全共线性的情况。
Why does perfect collinearity matter?
为什么完全共线性是个问题?
北京大学中国经济研究中心 沈艳
9
Assumption MLR.4 假定MLR.4
First, find answer from the perspective of ceteris paribus analysis. 首先,你可以从ceteris paribus 分析的角度考虑。
北京大学中国经济研究中心 沈艳
7
Assumption MLR.4 假定MLR.4
MLR.4 (No perfect collinearity) (不存在完全共线性) : In the sample, none of the independent variables is constant, and there are no exact linear relationships among the independent variables. 样本自变量无常数,自变量之间也不存在严格的线性关系。
6
Assumptions MLR.3 假定 MLR.3
MLR.3 (Zero Conditional Mean) (零条件均值) :
E(u| xi1, xi2…, xik)=0. When this assumption holds, we say all of the explanatory variables are exogenous; when it fails, we say that the explanatory variables are endogenous.
我们现在讨论OLS估计量的统计特性,而我们知道OLS是估计潜在 的总体模型参数的估计量。
Statistical properties are the properties of estimators when ranቤተ መጻሕፍቲ ባይዱom sampling is done repeatedly.
Not meaningful to talk about the statistical properties of a set of estimates obtained from a single sample.
Second, from the perspective of partialling out.你可以
从“排除其它变量影响”角度考虑。尤其是观察残差形式的b估计量的公
式。
Third, from the implementation of OLS estimators.
The denominator of the OLS estimator is 0 when there is perfect collinearity, hence the OLS estimator cannot be performed. 在完全共线性情况下,OLS估计量的分母为零,因此
OLS估计量不能估算具体估计值。
北京大学中国经济研究中心 沈艳
10
Assumption MLR.4 假定MLR.4
考虑人口受教育程度对人均工资的影响
变量高中及以上受教育的人数占比edu可以大致反 映人口受教育程度
在2008年,各省职工年平均工资wage的最小 值,均值和最大值分别是:21000, 29298, 56565
The population model is also called the true model, to allow for the possibility that we might estimate a model that differs from it.
总体模型亦称真实模型;我们实际估计的模型有可能和真实模型不同。
在假定MLR.1~MLR.4下,OLS估计量 是总体参数的无偏估计量,即
E(bˆ j ) b j , j 0,1,2,..., k
北京大学中国经济研究中心 沈艳
14
Theorem 3.1 (Unbiasedness of OLS) 定理 3.1(OLS的无偏性)
Unbiasedness is the property of an estimator, that is, the procedure that can produce an estimate for a specific sample, not an estimate.
北京大学中国经济研究中心 沈艳
8
Assumption MLR.4 假定MLR.4
Examples of perfect collinearity:完全共线性的例子:
y= b0+ b1x1+ b2x2+ b3x3+u, x2 = 3x3, y= b0+ b1log(inc)+ b2log(inc2 )+u y= b0+ b1x1+ b2x2+ b3x3+ b4x4+u, x1 +x2 +x3+ x4 =1. Perfect collinearity also happens when y= b0+ b1x1+ b2x2+ …+bkxk+u, n<(k+1).
中级计量经济学
INTERMEDIATE ECONOMETRICS
简单多元回归之二
Chapter Outline 本章大纲
Motivation for Multiple Regression 使用多元回归的动因 Mechanics and Interpretation of Ordinary Least Squares 普通最小二乘法的操作和解释 The Expected Values of the OLS Estimators OLS估计量的期望值 The Variance of the OLS Estimators OLS估计量的方差 Efficiency of OLS: The Gauss-Markov Theorem OLS的有效性:高斯-马尔科夫定理
无偏性是估计量的特性,而不是估计值的特性。估计量是 一种方法(过程),该方法使得给定一个样本,我们可以 得到一组估计值。我们评价的是方法的优劣。
北京大学中国经济研究中心 沈艳
5
Assumption MLR.2 (Random Sampling)
假定 MLR.2(随机抽样性)
We can use a random sample of size n from the population, {(xi1, xi2, …, xik; yi): i=1,…,n}, where i denotes observation, and j= 1,…,k denotes the jth regressor.
统计性质是指当在随机抽样不断重复时,估计量所表现出来的特性。
因此讨论从一个样本中得到的估计值的统计特性是没有什么意义的。
北京大学中国经济研究中心 沈艳
4
Assumption MLR.1 (Linear in Parameters) 假定 MLR.1(对参数而言为线性)
In the population model, the dependent variable y is related to the independent variable x and the error u as
0
10
20
30
40
50
高中以上人数占比(%)
年平均工资(元)
拟合值
北京大学中国经济研究中心 沈艳
12
Assumption MLR.4 假定MLR.4
. gen edu2=edu*2
. reg wage edu edu2 note: edu omitted because of collinearity
= 0.4
Adj R-squared = 0.3
Root MSE
=7
wage
edu edu2 _cons
Coef.
(omitted) 305.9833 16098.88
Std. Err.
67.04014 3159.532
t P>|t|
4.56 0.000 5.10 0.000
[95% Conf. Interv
y= b0+ b1x1+ b2x2+ …+bkxk+u
b1, b2 …, bk : unknown parameters of interest
u is an random error or random disturbance term.
在总体模型中,因变量y与自变量x和误差项u关系如上所示。其中, b1, b2 …, bk 为所关心的未知参数,u为不可观测的随机误差项或随机干扰项。
北京大学中国经济研究中心 沈艳
3
The expected value of the OLS estimators
OLS估计量的期望值
We now turn to the statistical properties of OLS for estimating the parameters in an underlying population model.
Source
SS
df
MS
Model Residual
1.0463e+09 1.4565e+09
1 1.0463e+09 29 50225314.6
Total 2.5028e+09 30 83427163.6
Number of obs =
F( 1, 29) = 20
Prob > F
= 0.0
R-squared