计量经济学第2章第5节
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
e 0服从正态分布,即
e 0~N (,((012
01
0σμ+''-X X X X取e 0的方差的估计量为
((σσμe 0
2201
01=+''-X X X X (σσμe 0
101
0=+''-X X X X
构造统计量
t y
y e =- 000
σ
~t n k (--1
利用该统计量,类似于参数估计量置信区间的分析过程,得到在给定(1-α的置信水平下
在前面的课程中,我们已经知道,线性回归模型的参数估计量β是随机变量y i
的函数,即
(B
=''-X X X Y 1所以它也是随机变量。在多次重复抽样中,每次的样本观测值不可能完全相同,所以得到
的点估计值也不可能相同。现在我们用参数估计量的一个点估计值近似代表参数值,那么,二者的接近程度如何?以多大的概率达到该接近程度?这就要构造参数的一个区间,以点估计值为中心的一个区间(称为置信区间,该区间以一定的概率(称为置信水平包含
越大,置信区间越大。如果要求缩小置信区间,在其它情况不
变时,就必须降低对置信水平的要求。
二、预测值的置信区间
计量经济学模型的一个重要应用是经济预测。对于模型
Y
X =B如果给定样本以外的解释变量的观测值X 0=(,,,,110200x x x k ,可以得到被解释变量的
预测值
y
00=X B但是,严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因在于两方面:
(0. 0937,0.3033
显然,参数β2的置信区间最小。
在实际应用中,我们当然希望置信水平越高越好,置信区间越小越好。如何才能缩小置信区间?从(2.5.1式中不难看出:①增大样本容量n。在同样的置信水平下,n越大,从t分布表中查得自由度为(n k --1的临界值t α2
越小;同时,增大样本容量,在一般情况下
(((((0000000100010010
=+-=+-''=+-''+=-''=---X X X X X X X Y X X X X X X X X X X B B
B B B N N μμμμ
V a re E e E ((
((((
002
00122
0101==-''=+''--μσμX X X X X X X X N
y 0的置信区间是
( (y
t y y t 001
00001011-⨯+''<<+⨯+''--αασσμμX X X X X X X X
(2.5.2
这就是说,当给定解释变量值X 0后,只能得到被解释变量y 0以(1-α的置信水平处于该区间的结论。
经常听到这样的说法,“如果给定解释变量值,根据模型就可以得到被解释变量的预测值为…值”,这种说法是不科学的,也是计量经济学模型无法达到的。如果一定要给出一个具体的预测值,那么它的置信水平则为0;如果一定要回答以100%的置信水平处在什么区间中,那么这个区间是∞。
可使s c n k i ii β='--e e
1
减小,因为式中分母的增大是肯定的,分子并不一定增大。②更主
要的是提高模型的拟合优度,以减小残差平方和'e e。设想一种极端情况,如果模型完全拟
合样本观测值,残差平方和为0,则置信区间也为0。③提高样本观测值的分散度。在一般情况下,样本观测值越分散,c ii越小。置信水平与置信区间是矛盾的。置信水平越高,在其它情况不变时,临界值t α2
t n k t α11330120005((.
.--==从回归计算中得到:
.. .. .. ββββββ0
1
2
5405279081
04809001490198500348
1
2
======s s s
根据(2.5.1计算得到β0、β1、β2的置信区间分别为
(302. 33,778.71 (0.4360,0.5258
P t t t (-<<=-ααα2
2
1百度文库
即
P t s t i i i
(
-<
-<=-ααββαβ2
2
1
P t s t s i i i i
i
( βββαααββ
-⨯<<+⨯=-2
2
1于是得到:在(1-α的置信水平下βi的置信区间是
( , ββααββ
i i t s t s i
i
-⨯+⨯2
2
(2.5.1在例2.3.1中,如果给定α=001.,查表得:
§2.5多元线性回归模型的置信区间
多元线性回归模型的置信区间问题包括参数估计量的置信区间和被解释变量预测值的置信区间两个方面,在数理统计学中属于区间估计问题。所谓区间估计是研究用未知参数的点估计值(从一组样本观测值算得的作为近似值的精确程度和误差范围,是一个必须回答的重要问题。
一、参数估计量的置信区间
一是模型中的参数估计量是不确定的,正如上面所说的;二是随机项的影响。所以,我们得到的仅能是预测值的一个估计值,预测值仅以某一个置信水平处于以该估计值为中心的一个区间中。于是,又是一个区间估计问题。
下面进行置信区间的推导。如果已经知道实际的预测值y 0,那么预测误差为:
e y y
000=-容易证明
E e E E E E (( ((
越大,置信区间
越大。如果要求缩小置信区间,在其它情况不变时,就必须降低对置信水平的要求。
该参数。即回答βi以何种置信水平位于( , ββi i
a a -+之中,以及如何求得a。在变量的显著性检验中已经知道: t s i i i
=
-
βββ~t n k (--1
这就是说,如果给定置信水平(1-α,从t分布表中查得自由度为(n k --1的临界值t α2
,
那么t值处在(,-t t αα的概率是(1-α。表示为:
在实际应用中,我们当然也希望置信水平越高越好,置信区间越小越好。如何才能缩小置信区间?从(2.5.2式中不难看出:①增大样本容量n。在同样的置信水平下,n越大,从t分布表中查得自由度为(n k --1的临界值t α越小;同时,增大样本容量,在一般情况下
可使σ
μ='--e e
n k 1
减小,因为式中分母的增大是肯定的,分子并不一定增大。②更主要
的是提高模型的拟合优度,以减小残差平方和'e e。设想一种极端情况,如果模型完全拟合样本观测值,残差平方和为0,则置信区间也为0。③提高样本观测值的分散度。在一般情况下,样本观测值越分散,作为('-X X 1的分母的'X X的值越大,致使区间缩小。置信水平与置信区间是矛盾的。置信水平越高,在其它情况不变时,临界值t α2
e 0~N (,((012
01
0σμ+''-X X X X取e 0的方差的估计量为
((σσμe 0
2201
01=+''-X X X X (σσμe 0
101
0=+''-X X X X
构造统计量
t y
y e =- 000
σ
~t n k (--1
利用该统计量,类似于参数估计量置信区间的分析过程,得到在给定(1-α的置信水平下
在前面的课程中,我们已经知道,线性回归模型的参数估计量β是随机变量y i
的函数,即
(B
=''-X X X Y 1所以它也是随机变量。在多次重复抽样中,每次的样本观测值不可能完全相同,所以得到
的点估计值也不可能相同。现在我们用参数估计量的一个点估计值近似代表参数值,那么,二者的接近程度如何?以多大的概率达到该接近程度?这就要构造参数的一个区间,以点估计值为中心的一个区间(称为置信区间,该区间以一定的概率(称为置信水平包含
越大,置信区间越大。如果要求缩小置信区间,在其它情况不
变时,就必须降低对置信水平的要求。
二、预测值的置信区间
计量经济学模型的一个重要应用是经济预测。对于模型
Y
X =B如果给定样本以外的解释变量的观测值X 0=(,,,,110200x x x k ,可以得到被解释变量的
预测值
y
00=X B但是,严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因在于两方面:
(0. 0937,0.3033
显然,参数β2的置信区间最小。
在实际应用中,我们当然希望置信水平越高越好,置信区间越小越好。如何才能缩小置信区间?从(2.5.1式中不难看出:①增大样本容量n。在同样的置信水平下,n越大,从t分布表中查得自由度为(n k --1的临界值t α2
越小;同时,增大样本容量,在一般情况下
(((((0000000100010010
=+-=+-''=+-''+=-''=---X X X X X X X Y X X X X X X X X X X B B
B B B N N μμμμ
V a re E e E ((
((((
002
00122
0101==-''=+''--μσμX X X X X X X X N
y 0的置信区间是
( (y
t y y t 001
00001011-⨯+''<<+⨯+''--αασσμμX X X X X X X X
(2.5.2
这就是说,当给定解释变量值X 0后,只能得到被解释变量y 0以(1-α的置信水平处于该区间的结论。
经常听到这样的说法,“如果给定解释变量值,根据模型就可以得到被解释变量的预测值为…值”,这种说法是不科学的,也是计量经济学模型无法达到的。如果一定要给出一个具体的预测值,那么它的置信水平则为0;如果一定要回答以100%的置信水平处在什么区间中,那么这个区间是∞。
可使s c n k i ii β='--e e
1
减小,因为式中分母的增大是肯定的,分子并不一定增大。②更主
要的是提高模型的拟合优度,以减小残差平方和'e e。设想一种极端情况,如果模型完全拟
合样本观测值,残差平方和为0,则置信区间也为0。③提高样本观测值的分散度。在一般情况下,样本观测值越分散,c ii越小。置信水平与置信区间是矛盾的。置信水平越高,在其它情况不变时,临界值t α2
t n k t α11330120005((.
.--==从回归计算中得到:
.. .. .. ββββββ0
1
2
5405279081
04809001490198500348
1
2
======s s s
根据(2.5.1计算得到β0、β1、β2的置信区间分别为
(302. 33,778.71 (0.4360,0.5258
P t t t (-<<=-ααα2
2
1百度文库
即
P t s t i i i
(
-<
-<=-ααββαβ2
2
1
P t s t s i i i i
i
( βββαααββ
-⨯<<+⨯=-2
2
1于是得到:在(1-α的置信水平下βi的置信区间是
( , ββααββ
i i t s t s i
i
-⨯+⨯2
2
(2.5.1在例2.3.1中,如果给定α=001.,查表得:
§2.5多元线性回归模型的置信区间
多元线性回归模型的置信区间问题包括参数估计量的置信区间和被解释变量预测值的置信区间两个方面,在数理统计学中属于区间估计问题。所谓区间估计是研究用未知参数的点估计值(从一组样本观测值算得的作为近似值的精确程度和误差范围,是一个必须回答的重要问题。
一、参数估计量的置信区间
一是模型中的参数估计量是不确定的,正如上面所说的;二是随机项的影响。所以,我们得到的仅能是预测值的一个估计值,预测值仅以某一个置信水平处于以该估计值为中心的一个区间中。于是,又是一个区间估计问题。
下面进行置信区间的推导。如果已经知道实际的预测值y 0,那么预测误差为:
e y y
000=-容易证明
E e E E E E (( ((
越大,置信区间
越大。如果要求缩小置信区间,在其它情况不变时,就必须降低对置信水平的要求。
该参数。即回答βi以何种置信水平位于( , ββi i
a a -+之中,以及如何求得a。在变量的显著性检验中已经知道: t s i i i
=
-
βββ~t n k (--1
这就是说,如果给定置信水平(1-α,从t分布表中查得自由度为(n k --1的临界值t α2
,
那么t值处在(,-t t αα的概率是(1-α。表示为:
在实际应用中,我们当然也希望置信水平越高越好,置信区间越小越好。如何才能缩小置信区间?从(2.5.2式中不难看出:①增大样本容量n。在同样的置信水平下,n越大,从t分布表中查得自由度为(n k --1的临界值t α越小;同时,增大样本容量,在一般情况下
可使σ
μ='--e e
n k 1
减小,因为式中分母的增大是肯定的,分子并不一定增大。②更主要
的是提高模型的拟合优度,以减小残差平方和'e e。设想一种极端情况,如果模型完全拟合样本观测值,残差平方和为0,则置信区间也为0。③提高样本观测值的分散度。在一般情况下,样本观测值越分散,作为('-X X 1的分母的'X X的值越大,致使区间缩小。置信水平与置信区间是矛盾的。置信水平越高,在其它情况不变时,临界值t α2