计量经济学课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
18 16 14 12 10 8 6 4 2 0 50-60 70-80
35% 30% 25% 20%
`
15% 10% 5% 0% 90-100
经济计量学 汪家义
经济计量学
第二章
第五节 回归分析结果的报告与评价
一、回归分析结果的报告
回归分析的结果,应该以清晰的格式予以
表达,通常采用如下格式(例2.1为例) ˆ 159.8788 0.7616 X Y
ˆ (X X ) D Yβ 2 0
ˆ ) D(Y ) ( X 0 X )2 D( β 2 ˆ ) 2( X X )cov(Y , β
0 2
n n 1 ˆ ) cov( cov(Y , β Yi , kiYi ) 2 n i 1 i 1 2 n σ ki 0 n i 1
Y0 的置信度为 1 α 的置信区间为:
ˆ t ( n 2) Se(e ), Y 0 0 α/2 ˆ t ( n 2) Se(e ) Y 0 α/2 0
ˆ ) D(Y ˆ) 因为, Var (e0 ) D(Y0 ) D(Y 0 0 ˆ) Se(e0 ) Se(Y 0
分布的随机变量。可以证明:
ˆ β β X E (Y X X ) E Y 0 1 2 0 0
2 1 ( X X ) 0 ˆ σ2 Var Y 0 n 2 n ( X X ) i i 1
ˆ β ˆ X ) ˆ ) D( β 证明: D(Y 0 1 2 0 ˆ Xβ ˆ X ) D(Y β 2 2 0
ˆ β ˆ X t ( n 2) Se(Y ˆ ), β 1 2 0 α / 2 0
ˆ σ
ˆ 2 67.637632 4574.899 σ
例如,在例 2.1 中,
2 1 ( X X ) 2 0 ˆ )σ ˆ Var (Y 0 n 2 n ( X X ) i i 1
个估计值。 区间预测:就是给出预测对象实际值的一 个置信区间。
2. 预测的用途
由预测分析得到信息有许多用途。经济系统中, 预测常常用来指导经济政策和方针的制订。
预测结果还能用于指导建立模型。当预测结果与
实际结果相差较大时,会利用误差信息对模型进行修
正。
二、被解释变量 Y 的平均值的预测
1. 被解释变量 Y 的均值的点预测 因为 E (Y X i ) β1 β2 X i 当给定 X=X0 时,
可以看出个值 Y0 预测的置信区间比均值
E (Y X X 0 ) 预测的置信区间要宽。
例如,在例 2.1 中,当 X0 = 2000 时,Y0
的点预测与 E (Y X X 0 ) 的点预测一样,均为:
ˆ β ˆ X 1683.879 ˆ β Y 0 1 2 0
ˆ) Var (e0 ) Var (Y0 Y 0
E (Y X X 0 ) β1 β2 X 0
由于样本回归直线
ˆ β ˆ X 是理论 ˆ β Y i 1 2 i
回归直线 E (Y X i ) β1 β2 X i 近似,因此我们自然
ˆ 来预测 E (Y X X 0 ) ,这时就称 会想到用 Y 0 ˆ β ˆ X ˆ β Y 0 1 2 0
是 E (Y X X 0 ) 的点预测。
可以证明,这个点预测是一个最佳线性无偏 估计量。
例如,例 2.1 的模型中,我们得到样本回
归模型为 :
ˆ 159.8788 0.7616 X Y i i
当给定X0=2000时,我们对 Y 均值的点预 测为:
ˆ β ˆ X ˆ β Y 0 1 2 0
2.统计上的显著性。 由于 β1,β2 由样本推断而得到的 ,即使
β1 和 β2 的真实值为 0,由于抽样的波动, 我 ˆ , ˆ 。因此,必 β 们也会得到不为 0 的估计值 β
1 2
须对回归系数进行显著性检验,判断回归系数
的显著性。
3.回归分析模型的拟合优度,即解释变量 X 在多大程度上解释了被解释变量 Y 的变异。 在收 入-消费例中,R2 = 0.9970,说明收入解释了消费 变异的 99.70%,这是一个非常好的拟合。
时,给定一个置信概率 1 α 后,我们可求出被
解释变量 Y 的均值 E (Y X X 0 ) 的置信区间。 这个置信区间就称为 E (Y X X 0 ) 的区间预测。
为了得到 E (Y X X 0 ) 的置信区间,我们
ˆ 的概率分布。 需要得到 Y 0 ˆ ,β ˆ 都是被解释变量 Y 的线性函数, 因为 β i 1 2 ˆ 也是Y 的线性函。于是 Y ˆ 是一正态 所以, Y i 0 0
i i
Se = (52.9184) t = (3.0212) P = (0.0165) R2 = 0.9970
(0.0149) (51.1354) (0.0000) ˆ = 67.6376 σ
二、回归分析结果的评价 用最小二乘法得到回归模型后,我们要对模 型的特性进行评价。回归模型的评价如下: 1.经济理论评价。(即分析模型是否符合经 济理论)
159.8788 0.7616 2000 = 1683.879
2. 被解释变量 Y 的均值的区间预测
在给定解释变量 X= X0 时,得到 Y 的均值
E (Y X X 0 ) 的点预测为: ˆ β ˆ X ˆ β Y
0 1 2
0
ˆ ,β ˆ 作为 β1 , β2 的估计量时均可 注意到 β 1 2 ˆ 也是随机变量。此 以看成是随机变量,所以 Y 0
ˆ β ˆ X ) ˆ ) D( β D(Y 0 1 2 0 ˆ ) D(Y ) ( X 0 X )2 D( β 2
2 1 ( X X ) 2 σ n 0 2 n ( X X ) i i 1
即
ˆ Y 0
2 ( X X ) 1 N β1 β2 X 0 , σ 2 ( n 0 ) n 2 ( X X ) i i 1
1683.879 2.306 28.356
1618.490
ˆ t ( n 2) Se(Y ˆ ) 1749.268 Y 0 α/2 0
所以,当 X=2000 时,可得到 E (Y X 2000) 的 95% 的置信区间为:
1618.490,
1749.268
由于置信区间是样本的函数,给定置信度为 95%,给定X0 = 2000,则在 100 次抽样中,我们将
2 ( X X ) 1 0 ˆ2 1 σ 2 n ( Xi X ) 1 (2000 3250)2 4574.899 1 10 20625000 5378.972
Se(e0 ) 73.341
Y0 的置信度为95%的置信区间为:
4.检验回归分析模型是否满足经典假定。
该类检验将在第六章中予以讲授。
第六节
回归分析的应用—预测
一、预测概述
在时间序列分析中,预测就是指对事物未
来状态的估计。
在截面数据分析中,预测分析同样适用,
此时的目的是预测当 X 取特定值 X0 时,Y 的
可能结果值Y0。
1. 预测包括点预测和区间预测:
点预测:就是对预测对象的未来值给出一
2 σ 在一般的情况下 是未知的,可用 σ 2 的 n 1 2 ˆ2 无偏估计量 σ 来代替。此时 e i n 2 i 1
ˆ (β β X ) Y 1 2 0 t 0 ˆ) Se(Y
0
t ( n 2)
其中
2 ( X X ) 1 0 ˆ )σ ˆ Se(Y 0 n n 2 ( X X ) i i 1
即
e0
2 ( X X ) 1 0 N 0, σ 2 1 2 n ( X X ) i
2 ( X X ) 1 0 Se(e0 ) σ 1 2 n ( Xi X )
可以证明,用 σ ˆ 2 代替 σ 2 时,
根据经济理论,边际消费倾向应为小于 1大于
0 的正数。在收入-消费模型中,我们得到的边际
消费倾向为0.7616,与经济理论的描述是一致的。
如果我们得到一个回归模型: 煤炭产量= -108.5+0.00067×固定资产原值
+0.0156 ×职工人数 -0.0068 ×电力消耗量 +0.00256 ×木材消耗量 在该模型中,电力消耗量前的参数估计量为负 数,这意味着电力消耗越多,煤炭产量越低, 则该模型不符合经济理论。模型不能通过检验。
得到 100 个置信区间,在这 100 个置信区间中,大
约有95个包含着真实的被解释变量 Y 的均值;
被解释变量 Y 真实均值的单个最优估计就是点
估计值 1683.879。
三、被解释变量 Y 的个值预测 1. Y 的个值的点预测 给定 X 值(X = X0)时,由于样本回归函数
的随机形式为: ˆ β ˆ X e ˆ Y0 β 1 2 0 0 Y0 e0 则知 Y0 点预测为:
ˆ t (8) Se(e ), Y 0 0 0.025 ˆ t (8) Se(e ) Y 0 0.025 0
ˆ β ˆ X ˆ β Y 0 1 2 0
它是 Y0 的最佳线性无偏估计量。
2. Y 的个值的区间预测 Y0 和 E (Y X X 0 ) 的点预测结果相同,但它 们的区间预测不同。 注意到:样本 Y0 ,Y1 ,Y2 , 与 Y1 ,Y2 , 得
ˆ 只 ,Y n 独立,而 Y 0
ˆ 不相关,从而 ,Yn 有关,所以Y0 和 Y 0
即
2 ( X X ) 1 0 ˆ t ( n 2)σ Y ˆ 1 0 α/2 2 n ( Xi X )
E (Y X X 0 ) 的置信度为 1 α 的置信区间为:
ˆ t ( n 2) Se(Y ˆ ), Y 0 α / 2 0 ˆ t ( n 2) Se(Y ˆ ) Y 0 α/2 0
1 (2000 3250)2 4574.899 20625000 10 804.073
ˆ ) 28.356, Se(Y 0
ˆ = 1683.879 Y 0
t / 2 (8) t0.025 (8) 2.306
ˆ t ( n Baidu Nhomakorabea 2) Se(Y ˆ) Y 0 α/2 0
t
e0 E (e0 ) Se(e0 )
ˆ Y0 Y 0 Se(e0 )
t ( n 2)
( X 0 X )2 1 ˆ 1 Se(e0 ) σ 2 n ( Xi X )
由此可得 Y0 的置信度为 1 α 的置信区间为
ˆ t ( n 2) Se(e ), Y 0 0 α/2 ˆ t ( n 2) Se(e ) Y 0 α/2 0
ˆ 0 E (e0 ) E Y0 Y 0
ˆ) Var (e0 ) Var (Y0 Y 0
2 ( X X ) 1 0 ˆ ) σ2 σ2 D(Y0 ) D(Y 0 2 n ( Xi X )
2 ( X X ) 1 0 σ2 1 2 n ( Xi X )
由此可得条件均值 E (Y X X 0 ) 的置信度 为 1 α 的置信区间为:
ˆ t ( n 2) Se(Y ˆ ), Y 0 0 α/2 ˆ t ( n 2) Se(Y ˆ ) Y 0 α/2 0
ˆ β ˆ X t ( n 2) Se(Y ˆ ) β 1 2 0 α/2 0
35% 30% 25% 20%
`
15% 10% 5% 0% 90-100
经济计量学 汪家义
经济计量学
第二章
第五节 回归分析结果的报告与评价
一、回归分析结果的报告
回归分析的结果,应该以清晰的格式予以
表达,通常采用如下格式(例2.1为例) ˆ 159.8788 0.7616 X Y
ˆ (X X ) D Yβ 2 0
ˆ ) D(Y ) ( X 0 X )2 D( β 2 ˆ ) 2( X X )cov(Y , β
0 2
n n 1 ˆ ) cov( cov(Y , β Yi , kiYi ) 2 n i 1 i 1 2 n σ ki 0 n i 1
Y0 的置信度为 1 α 的置信区间为:
ˆ t ( n 2) Se(e ), Y 0 0 α/2 ˆ t ( n 2) Se(e ) Y 0 α/2 0
ˆ ) D(Y ˆ) 因为, Var (e0 ) D(Y0 ) D(Y 0 0 ˆ) Se(e0 ) Se(Y 0
分布的随机变量。可以证明:
ˆ β β X E (Y X X ) E Y 0 1 2 0 0
2 1 ( X X ) 0 ˆ σ2 Var Y 0 n 2 n ( X X ) i i 1
ˆ β ˆ X ) ˆ ) D( β 证明: D(Y 0 1 2 0 ˆ Xβ ˆ X ) D(Y β 2 2 0
ˆ β ˆ X t ( n 2) Se(Y ˆ ), β 1 2 0 α / 2 0
ˆ σ
ˆ 2 67.637632 4574.899 σ
例如,在例 2.1 中,
2 1 ( X X ) 2 0 ˆ )σ ˆ Var (Y 0 n 2 n ( X X ) i i 1
个估计值。 区间预测:就是给出预测对象实际值的一 个置信区间。
2. 预测的用途
由预测分析得到信息有许多用途。经济系统中, 预测常常用来指导经济政策和方针的制订。
预测结果还能用于指导建立模型。当预测结果与
实际结果相差较大时,会利用误差信息对模型进行修
正。
二、被解释变量 Y 的平均值的预测
1. 被解释变量 Y 的均值的点预测 因为 E (Y X i ) β1 β2 X i 当给定 X=X0 时,
可以看出个值 Y0 预测的置信区间比均值
E (Y X X 0 ) 预测的置信区间要宽。
例如,在例 2.1 中,当 X0 = 2000 时,Y0
的点预测与 E (Y X X 0 ) 的点预测一样,均为:
ˆ β ˆ X 1683.879 ˆ β Y 0 1 2 0
ˆ) Var (e0 ) Var (Y0 Y 0
E (Y X X 0 ) β1 β2 X 0
由于样本回归直线
ˆ β ˆ X 是理论 ˆ β Y i 1 2 i
回归直线 E (Y X i ) β1 β2 X i 近似,因此我们自然
ˆ 来预测 E (Y X X 0 ) ,这时就称 会想到用 Y 0 ˆ β ˆ X ˆ β Y 0 1 2 0
是 E (Y X X 0 ) 的点预测。
可以证明,这个点预测是一个最佳线性无偏 估计量。
例如,例 2.1 的模型中,我们得到样本回
归模型为 :
ˆ 159.8788 0.7616 X Y i i
当给定X0=2000时,我们对 Y 均值的点预 测为:
ˆ β ˆ X ˆ β Y 0 1 2 0
2.统计上的显著性。 由于 β1,β2 由样本推断而得到的 ,即使
β1 和 β2 的真实值为 0,由于抽样的波动, 我 ˆ , ˆ 。因此,必 β 们也会得到不为 0 的估计值 β
1 2
须对回归系数进行显著性检验,判断回归系数
的显著性。
3.回归分析模型的拟合优度,即解释变量 X 在多大程度上解释了被解释变量 Y 的变异。 在收 入-消费例中,R2 = 0.9970,说明收入解释了消费 变异的 99.70%,这是一个非常好的拟合。
时,给定一个置信概率 1 α 后,我们可求出被
解释变量 Y 的均值 E (Y X X 0 ) 的置信区间。 这个置信区间就称为 E (Y X X 0 ) 的区间预测。
为了得到 E (Y X X 0 ) 的置信区间,我们
ˆ 的概率分布。 需要得到 Y 0 ˆ ,β ˆ 都是被解释变量 Y 的线性函数, 因为 β i 1 2 ˆ 也是Y 的线性函。于是 Y ˆ 是一正态 所以, Y i 0 0
i i
Se = (52.9184) t = (3.0212) P = (0.0165) R2 = 0.9970
(0.0149) (51.1354) (0.0000) ˆ = 67.6376 σ
二、回归分析结果的评价 用最小二乘法得到回归模型后,我们要对模 型的特性进行评价。回归模型的评价如下: 1.经济理论评价。(即分析模型是否符合经 济理论)
159.8788 0.7616 2000 = 1683.879
2. 被解释变量 Y 的均值的区间预测
在给定解释变量 X= X0 时,得到 Y 的均值
E (Y X X 0 ) 的点预测为: ˆ β ˆ X ˆ β Y
0 1 2
0
ˆ ,β ˆ 作为 β1 , β2 的估计量时均可 注意到 β 1 2 ˆ 也是随机变量。此 以看成是随机变量,所以 Y 0
ˆ β ˆ X ) ˆ ) D( β D(Y 0 1 2 0 ˆ ) D(Y ) ( X 0 X )2 D( β 2
2 1 ( X X ) 2 σ n 0 2 n ( X X ) i i 1
即
ˆ Y 0
2 ( X X ) 1 N β1 β2 X 0 , σ 2 ( n 0 ) n 2 ( X X ) i i 1
1683.879 2.306 28.356
1618.490
ˆ t ( n 2) Se(Y ˆ ) 1749.268 Y 0 α/2 0
所以,当 X=2000 时,可得到 E (Y X 2000) 的 95% 的置信区间为:
1618.490,
1749.268
由于置信区间是样本的函数,给定置信度为 95%,给定X0 = 2000,则在 100 次抽样中,我们将
2 ( X X ) 1 0 ˆ2 1 σ 2 n ( Xi X ) 1 (2000 3250)2 4574.899 1 10 20625000 5378.972
Se(e0 ) 73.341
Y0 的置信度为95%的置信区间为:
4.检验回归分析模型是否满足经典假定。
该类检验将在第六章中予以讲授。
第六节
回归分析的应用—预测
一、预测概述
在时间序列分析中,预测就是指对事物未
来状态的估计。
在截面数据分析中,预测分析同样适用,
此时的目的是预测当 X 取特定值 X0 时,Y 的
可能结果值Y0。
1. 预测包括点预测和区间预测:
点预测:就是对预测对象的未来值给出一
2 σ 在一般的情况下 是未知的,可用 σ 2 的 n 1 2 ˆ2 无偏估计量 σ 来代替。此时 e i n 2 i 1
ˆ (β β X ) Y 1 2 0 t 0 ˆ) Se(Y
0
t ( n 2)
其中
2 ( X X ) 1 0 ˆ )σ ˆ Se(Y 0 n n 2 ( X X ) i i 1
即
e0
2 ( X X ) 1 0 N 0, σ 2 1 2 n ( X X ) i
2 ( X X ) 1 0 Se(e0 ) σ 1 2 n ( Xi X )
可以证明,用 σ ˆ 2 代替 σ 2 时,
根据经济理论,边际消费倾向应为小于 1大于
0 的正数。在收入-消费模型中,我们得到的边际
消费倾向为0.7616,与经济理论的描述是一致的。
如果我们得到一个回归模型: 煤炭产量= -108.5+0.00067×固定资产原值
+0.0156 ×职工人数 -0.0068 ×电力消耗量 +0.00256 ×木材消耗量 在该模型中,电力消耗量前的参数估计量为负 数,这意味着电力消耗越多,煤炭产量越低, 则该模型不符合经济理论。模型不能通过检验。
得到 100 个置信区间,在这 100 个置信区间中,大
约有95个包含着真实的被解释变量 Y 的均值;
被解释变量 Y 真实均值的单个最优估计就是点
估计值 1683.879。
三、被解释变量 Y 的个值预测 1. Y 的个值的点预测 给定 X 值(X = X0)时,由于样本回归函数
的随机形式为: ˆ β ˆ X e ˆ Y0 β 1 2 0 0 Y0 e0 则知 Y0 点预测为:
ˆ t (8) Se(e ), Y 0 0 0.025 ˆ t (8) Se(e ) Y 0 0.025 0
ˆ β ˆ X ˆ β Y 0 1 2 0
它是 Y0 的最佳线性无偏估计量。
2. Y 的个值的区间预测 Y0 和 E (Y X X 0 ) 的点预测结果相同,但它 们的区间预测不同。 注意到:样本 Y0 ,Y1 ,Y2 , 与 Y1 ,Y2 , 得
ˆ 只 ,Y n 独立,而 Y 0
ˆ 不相关,从而 ,Yn 有关,所以Y0 和 Y 0
即
2 ( X X ) 1 0 ˆ t ( n 2)σ Y ˆ 1 0 α/2 2 n ( Xi X )
E (Y X X 0 ) 的置信度为 1 α 的置信区间为:
ˆ t ( n 2) Se(Y ˆ ), Y 0 α / 2 0 ˆ t ( n 2) Se(Y ˆ ) Y 0 α/2 0
1 (2000 3250)2 4574.899 20625000 10 804.073
ˆ ) 28.356, Se(Y 0
ˆ = 1683.879 Y 0
t / 2 (8) t0.025 (8) 2.306
ˆ t ( n Baidu Nhomakorabea 2) Se(Y ˆ) Y 0 α/2 0
t
e0 E (e0 ) Se(e0 )
ˆ Y0 Y 0 Se(e0 )
t ( n 2)
( X 0 X )2 1 ˆ 1 Se(e0 ) σ 2 n ( Xi X )
由此可得 Y0 的置信度为 1 α 的置信区间为
ˆ t ( n 2) Se(e ), Y 0 0 α/2 ˆ t ( n 2) Se(e ) Y 0 α/2 0
ˆ 0 E (e0 ) E Y0 Y 0
ˆ) Var (e0 ) Var (Y0 Y 0
2 ( X X ) 1 0 ˆ ) σ2 σ2 D(Y0 ) D(Y 0 2 n ( Xi X )
2 ( X X ) 1 0 σ2 1 2 n ( Xi X )
由此可得条件均值 E (Y X X 0 ) 的置信度 为 1 α 的置信区间为:
ˆ t ( n 2) Se(Y ˆ ), Y 0 0 α/2 ˆ t ( n 2) Se(Y ˆ ) Y 0 α/2 0
ˆ β ˆ X t ( n 2) Se(Y ˆ ) β 1 2 0 α/2 0