第10章 设定误差与模型选择(计量经济学-中南财经政法大学,向书坚)分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)如果 X 2 与 X 3 相关,则 ˆ1 ,ˆ 2 是 1, 2 的有偏
非一致估计。即无论样本容量有多大,
E(ˆ1) 1 E(ˆ2 ) 2
7
(2)即便 X 2 与X 3 不相关,此时 ˆ1 仍是有偏的,ˆ2 则
是无偏。
怎么理解上面两点?先看两个模型的系数估计表达式。
在真实模型中
这里小写ˆ字2 母(表示y(对i x2应i )x(变22i )量(x32的i )x离32i ()差,(yi例x3x如i2)i(x:3i )
预测功效。预测是计量经济模型一个很重要的功能。注意:
R2 大并不能保证模型有好的预测精度
返回
4
§ 10.2 设定误差的类型
以立方总成本函数为例来说明。
Yi
1
2Xi
3
X
2 i
4
X
3 i
u1i
①漏掉一个变量:Yi
1
2 Xi
3
X
2 i
u2i
误差项可以看做:
u2i
u1i
4
X
3 i
②包含无关变量:Yi
返回
13
§ 10.4 设定误差的检验
§ 10.4.1对多余变量的侦查
假定为了解释某一现象而建立一个k变量的模型: Yi 1 2 X 2i 3 X 3i ... k X ki ui
对于X k 是否属于模型,一个简单的办法是作t检验, 即 t ˆk / se(ˆk )是否显著。这种思路在实际中很不可 取,因为这样就意味着凡是参数检验不显著的变量都 被排除在模型之外,显著的就包含在模型中。而不去 考虑这些变量的舍取是否有理论上的依据。
1
2 X i
3
X
2 i
4
X
3 i
5
X
4 i
u3i
u3i
u1i
5
X
4 i
u1i
误差项可以看做:
(在原模型中5 0)
5
③错误的函数形式:
ln Yi
1
2 X i
3
X
2 i
4
X
3 i
u4i
因变量以对数的形式出现在模型中。
④测量误差:
Y* i
* 1
*X* 2i
*
3
X
*2 i
X * *3 4i
u* i
(
x2 )( 2i
x2 ) ( 3i
x2i x3i )2
(
yi x2i )(
x32i )
yi x2i
( x2 )( x2 ) x2
2i
3i
2i
9
也就是 ˆ2 ˆ2
。因此E(ˆ2) E(ˆ2)
,可以自己验证。
。对于E(ˆ1) 1
其实只要清楚系数估计量的表达式,对上述两条
结论的验证应该比较容易。
(2) i 的估计量是非有效的,即
Var(ˆi ) Var(ˆi )
11
对于第二点的解释:
由ols所估计的结果有
Var(ˆ2 )
2
x2
2i
Var(ˆ2 )
故
所以
Var(ˆ2 ) Var(ˆ2 )
1 1 r223
1
2
x
2
2i
(1
r223
)
Var(ˆ2) Var(ˆ2)
12
两种设定误差的后果比较: 遗漏有关变量。参数估计量有偏非一致,随机误差 项的方差估计亦不正确,致使区间估计和假设检验 都得不到正确的结论。 包含无关变量。参数估计量无偏且一致,随机误差 项的方差估计量为非有效的估计量,参数的统计推 断精度降低。 因此,不能简单认为与其略掉有关变量不如含有无 关变量。
x2i
2
x3i
)
yi x2i (Yi Y )(X2i X2)
8
在误设模型中
ˆ2
yi x2i x2
2i
再看第二条中的结论: E(ˆ1) 1 E(ˆ2 ) 2 我们只分析 ˆ2 ,
如果 X 2 与 X 3 不相关,那么 x2i x3i 0 ,即
ˆ2 (
yi x2i )( x32i ) ( yi x3i )( x2i x3i )
注意与后面韩德瑞的建模思想进行比较。 韩的建模思想是由一般到简单,即由尽可能 多变量进行约化,直到最后几个能通过检验 的变量。 (从一般到简单)
3
AER方法建模所所需遵循的准则:
节省性;以实用为标准,模型尽可能简单
识别性;同一参数必须有一个确定的估计值
拟合优度;拟合优度是评价模型好坏的标准之一
理论一致性;正确的系数符号,以保证模型能给出合理的经 济意义上的解释。
其中 Yi* Yi i
,X
* i
Xi
vi
,i , vi
都
是测量误差
返回
6
§ 10.3 设定误差的后果
1、漏掉一个有关变量
为了避免使用矩阵代数,选用一个只有两个自变量的模型来说明。
真实模型:Yi 1 2 X 2i 3 X 3i ui
如用下述模型 Yi 1 2 X 2i vi
拟合,将漏掉 X 3 ,其后果
第10章
设定误差与模型选择
1
第10章 设定误差与模型选择
1、计量经济建模的传统观点:平均经济回归 2、设定误差类型 3、设定误差的后果 4、设定误差的检验 5、观测误差
2
§ 10.1 计量经济建模的传统观点
被称为平均经济回归(AER)建模思想是: 从含有一定个数的回归元的一个模型开始, 经过诊断,然后把越来越多的变量加到模型 中来。 (从简单到复杂)
2、包含无关变量
真实模型 Yi 1 2 X 2i ui
误设模型 Yi 1 2 X 2i 3 X 3i vi
后果:
(1)参数的ols估计量性质都还不错。 E(ˆ1) 1 E(ˆ2 ) 2 , E(ˆ2 ) 2 ,E(ˆ3 ) 3 0 。
E(ˆ 2 ) Var(u) ,置信区间和假设检验仍然有效。
14
§ 10.4.2 名义与真实的显著水平
如果真实模型中有c个变量,而在建立模
型时只选取了k个变量作回归。那么原先确
定的显著水平并不能反应参数的真实显著水
平。真实显著水平 * 和名义显著水平 有如下关系:
* 1 (1 )c/ k
可以近似为: * (c / k )a
取
,
和
,由上式可以计算出真
(3)随机误差项的方差无法正确估计,致使参数
估计量的检验无法得出正确的结论。即
E(ˆ 2) Var(u)
E(ˆ 2 /
t检验失效
x2i ) Var(ˆ2 )
(4)习
惯
上
计
算
的ˆ
的
2
方
差(
2 )是真实估计量
x22i
ˆ
的
2
有
偏
估
计
量,
导
致
根
据
置
信
区
间
和
假设
检
验
中
的统计显著性容易得出错误结论
10
实c的显1著5 水平k 5 。 5%
* 15%
15
§ 10.4.3 对遗漏变量和不正确的函数形式的检验
1、残差分析(仍然以前面的立方总成本函数为例)
Yi
1 2 X i
3
X
2 i
4ຫໍສະໝຸດ Baidu
X
3 i
u1i
如果用二次函数拟合
Yi
1
2 X i
3
X
2 i
u2i
又或者用线性函数拟合
非一致估计。即无论样本容量有多大,
E(ˆ1) 1 E(ˆ2 ) 2
7
(2)即便 X 2 与X 3 不相关,此时 ˆ1 仍是有偏的,ˆ2 则
是无偏。
怎么理解上面两点?先看两个模型的系数估计表达式。
在真实模型中
这里小写ˆ字2 母(表示y(对i x2应i )x(变22i )量(x32的i )x离32i ()差,(yi例x3x如i2)i(x:3i )
预测功效。预测是计量经济模型一个很重要的功能。注意:
R2 大并不能保证模型有好的预测精度
返回
4
§ 10.2 设定误差的类型
以立方总成本函数为例来说明。
Yi
1
2Xi
3
X
2 i
4
X
3 i
u1i
①漏掉一个变量:Yi
1
2 Xi
3
X
2 i
u2i
误差项可以看做:
u2i
u1i
4
X
3 i
②包含无关变量:Yi
返回
13
§ 10.4 设定误差的检验
§ 10.4.1对多余变量的侦查
假定为了解释某一现象而建立一个k变量的模型: Yi 1 2 X 2i 3 X 3i ... k X ki ui
对于X k 是否属于模型,一个简单的办法是作t检验, 即 t ˆk / se(ˆk )是否显著。这种思路在实际中很不可 取,因为这样就意味着凡是参数检验不显著的变量都 被排除在模型之外,显著的就包含在模型中。而不去 考虑这些变量的舍取是否有理论上的依据。
1
2 X i
3
X
2 i
4
X
3 i
5
X
4 i
u3i
u3i
u1i
5
X
4 i
u1i
误差项可以看做:
(在原模型中5 0)
5
③错误的函数形式:
ln Yi
1
2 X i
3
X
2 i
4
X
3 i
u4i
因变量以对数的形式出现在模型中。
④测量误差:
Y* i
* 1
*X* 2i
*
3
X
*2 i
X * *3 4i
u* i
(
x2 )( 2i
x2 ) ( 3i
x2i x3i )2
(
yi x2i )(
x32i )
yi x2i
( x2 )( x2 ) x2
2i
3i
2i
9
也就是 ˆ2 ˆ2
。因此E(ˆ2) E(ˆ2)
,可以自己验证。
。对于E(ˆ1) 1
其实只要清楚系数估计量的表达式,对上述两条
结论的验证应该比较容易。
(2) i 的估计量是非有效的,即
Var(ˆi ) Var(ˆi )
11
对于第二点的解释:
由ols所估计的结果有
Var(ˆ2 )
2
x2
2i
Var(ˆ2 )
故
所以
Var(ˆ2 ) Var(ˆ2 )
1 1 r223
1
2
x
2
2i
(1
r223
)
Var(ˆ2) Var(ˆ2)
12
两种设定误差的后果比较: 遗漏有关变量。参数估计量有偏非一致,随机误差 项的方差估计亦不正确,致使区间估计和假设检验 都得不到正确的结论。 包含无关变量。参数估计量无偏且一致,随机误差 项的方差估计量为非有效的估计量,参数的统计推 断精度降低。 因此,不能简单认为与其略掉有关变量不如含有无 关变量。
x2i
2
x3i
)
yi x2i (Yi Y )(X2i X2)
8
在误设模型中
ˆ2
yi x2i x2
2i
再看第二条中的结论: E(ˆ1) 1 E(ˆ2 ) 2 我们只分析 ˆ2 ,
如果 X 2 与 X 3 不相关,那么 x2i x3i 0 ,即
ˆ2 (
yi x2i )( x32i ) ( yi x3i )( x2i x3i )
注意与后面韩德瑞的建模思想进行比较。 韩的建模思想是由一般到简单,即由尽可能 多变量进行约化,直到最后几个能通过检验 的变量。 (从一般到简单)
3
AER方法建模所所需遵循的准则:
节省性;以实用为标准,模型尽可能简单
识别性;同一参数必须有一个确定的估计值
拟合优度;拟合优度是评价模型好坏的标准之一
理论一致性;正确的系数符号,以保证模型能给出合理的经 济意义上的解释。
其中 Yi* Yi i
,X
* i
Xi
vi
,i , vi
都
是测量误差
返回
6
§ 10.3 设定误差的后果
1、漏掉一个有关变量
为了避免使用矩阵代数,选用一个只有两个自变量的模型来说明。
真实模型:Yi 1 2 X 2i 3 X 3i ui
如用下述模型 Yi 1 2 X 2i vi
拟合,将漏掉 X 3 ,其后果
第10章
设定误差与模型选择
1
第10章 设定误差与模型选择
1、计量经济建模的传统观点:平均经济回归 2、设定误差类型 3、设定误差的后果 4、设定误差的检验 5、观测误差
2
§ 10.1 计量经济建模的传统观点
被称为平均经济回归(AER)建模思想是: 从含有一定个数的回归元的一个模型开始, 经过诊断,然后把越来越多的变量加到模型 中来。 (从简单到复杂)
2、包含无关变量
真实模型 Yi 1 2 X 2i ui
误设模型 Yi 1 2 X 2i 3 X 3i vi
后果:
(1)参数的ols估计量性质都还不错。 E(ˆ1) 1 E(ˆ2 ) 2 , E(ˆ2 ) 2 ,E(ˆ3 ) 3 0 。
E(ˆ 2 ) Var(u) ,置信区间和假设检验仍然有效。
14
§ 10.4.2 名义与真实的显著水平
如果真实模型中有c个变量,而在建立模
型时只选取了k个变量作回归。那么原先确
定的显著水平并不能反应参数的真实显著水
平。真实显著水平 * 和名义显著水平 有如下关系:
* 1 (1 )c/ k
可以近似为: * (c / k )a
取
,
和
,由上式可以计算出真
(3)随机误差项的方差无法正确估计,致使参数
估计量的检验无法得出正确的结论。即
E(ˆ 2) Var(u)
E(ˆ 2 /
t检验失效
x2i ) Var(ˆ2 )
(4)习
惯
上
计
算
的ˆ
的
2
方
差(
2 )是真实估计量
x22i
ˆ
的
2
有
偏
估
计
量,
导
致
根
据
置
信
区
间
和
假设
检
验
中
的统计显著性容易得出错误结论
10
实c的显1著5 水平k 5 。 5%
* 15%
15
§ 10.4.3 对遗漏变量和不正确的函数形式的检验
1、残差分析(仍然以前面的立方总成本函数为例)
Yi
1 2 X i
3
X
2 i
4ຫໍສະໝຸດ Baidu
X
3 i
u1i
如果用二次函数拟合
Yi
1
2 X i
3
X
2 i
u2i
又或者用线性函数拟合