多元线性回归模型的预测
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§3.4 多元线性回归模型的预测
一、E(Y0)的置信区间 二、Y0的置信区间
对于模型
Yˆ Xβˆ
给定样本以外的解释变量的观测值
X0=(1,X10,X20,…,Xk0),可以得到被解释变量的预 测值:
Yˆ0
X
βˆ
0
它可以是总体均值E(Y0)或个值Y0的预测。
但严格地说,这只是被解释变量的预测值的估 计值,而不是预测值。
0.00828
0.00285 0.00001 0.00001
0.00828 0.00001 0.00004
X0 (XX) 1 X0 0.3938
于是E(Ŷ2001)的95%的置信区间为:
1776 .8 2.093 705 .5 0.3938
或
(1741.8,1811.7)
同样,易得Ŷ2001的95%的置信区间为
2
2
中国居民人均收入-消费支出二元模型例中: 2001年人均GDP:4033.1元,
于是人均居民消费的预测值为
Ŷ2001=120.7+0.2213×4033.1+0.4515×1690.8=1776.8(元)
实测值(90年价)=1782.2元,相对误差:-0.31%
预测的置信区间 :
1.88952 (XX)1 0.00285
2
2
其中,t/2为(1-)的置信水平下的临界值。
二、Y0的置信区间
如果已经知道实际的预测值Y0,那么预测误差为:
e0 Y0 Yˆ0
容易证明
E(e0 ) E(X0β 0 X0βˆ ) E(0 X0 (βˆ β)) E(0 X0 (XX)1 Xμ)
0
Var(e0 ) E(e02 )
E(0 X0 (XX)1 Xμ)2 2 (1 X0 (XX)1 X0 )
2 X0 (XX) 1 X0
容易证明
Yˆ0 ~ N (X0β, 2X0 (XX) 1 X0 )
Yˆ0 E(Y0 ) ~ t(n k 1)
ˆ X0 (XX) 1 X0
于是,得到(1-)的置信水平下E(Y0)的置信区间:
Yˆ0 t ˆ X 0 (XX) 1 X0 E(Y0 ) Yˆ0 t ˆ X 0 (XX) 1 X0
e0服从正态分布,即
e0Biblioteka Baidu~ N(0, 2 (1 X0 (XX)1 X0 ))
ˆ
2 e0
ˆ 2 (1 X0 (XX)1 X0 ))
构造t统计量
t Yˆ0 Y0 ~ t(n k 1)
ˆ e0
可得给定(1-)的置信水平下Y0的置信区间:
Yˆ0 t ˆ 1 X 0 (XX) 1 X0 Y0 Yˆ0 t ˆ 1 X 0 (XX) 1 X0
1776 .8 2.093 705.5 1.3938
或
(1711.1, 1842.4)
为了进行科学预测,还需求出预测值的置信 区间,包括E(Y0)和Y0的置信区间。
一、E(Y0)的置信区间
易知
E(Yˆ0 ) E(X0βˆ ) X0 E(βˆ ) X0β E(Y0 ) Var(Yˆ0 ) E(X0βˆ X0β)2 E(X0 (βˆ β)X0 (βˆ β))
Var(Yˆ0 ) E(X0 (βˆ β)(βˆ β)X0 ) X0 E(βˆ β)(βˆ β)X0
一、E(Y0)的置信区间 二、Y0的置信区间
对于模型
Yˆ Xβˆ
给定样本以外的解释变量的观测值
X0=(1,X10,X20,…,Xk0),可以得到被解释变量的预 测值:
Yˆ0
X
βˆ
0
它可以是总体均值E(Y0)或个值Y0的预测。
但严格地说,这只是被解释变量的预测值的估 计值,而不是预测值。
0.00828
0.00285 0.00001 0.00001
0.00828 0.00001 0.00004
X0 (XX) 1 X0 0.3938
于是E(Ŷ2001)的95%的置信区间为:
1776 .8 2.093 705 .5 0.3938
或
(1741.8,1811.7)
同样,易得Ŷ2001的95%的置信区间为
2
2
中国居民人均收入-消费支出二元模型例中: 2001年人均GDP:4033.1元,
于是人均居民消费的预测值为
Ŷ2001=120.7+0.2213×4033.1+0.4515×1690.8=1776.8(元)
实测值(90年价)=1782.2元,相对误差:-0.31%
预测的置信区间 :
1.88952 (XX)1 0.00285
2
2
其中,t/2为(1-)的置信水平下的临界值。
二、Y0的置信区间
如果已经知道实际的预测值Y0,那么预测误差为:
e0 Y0 Yˆ0
容易证明
E(e0 ) E(X0β 0 X0βˆ ) E(0 X0 (βˆ β)) E(0 X0 (XX)1 Xμ)
0
Var(e0 ) E(e02 )
E(0 X0 (XX)1 Xμ)2 2 (1 X0 (XX)1 X0 )
2 X0 (XX) 1 X0
容易证明
Yˆ0 ~ N (X0β, 2X0 (XX) 1 X0 )
Yˆ0 E(Y0 ) ~ t(n k 1)
ˆ X0 (XX) 1 X0
于是,得到(1-)的置信水平下E(Y0)的置信区间:
Yˆ0 t ˆ X 0 (XX) 1 X0 E(Y0 ) Yˆ0 t ˆ X 0 (XX) 1 X0
e0服从正态分布,即
e0Biblioteka Baidu~ N(0, 2 (1 X0 (XX)1 X0 ))
ˆ
2 e0
ˆ 2 (1 X0 (XX)1 X0 ))
构造t统计量
t Yˆ0 Y0 ~ t(n k 1)
ˆ e0
可得给定(1-)的置信水平下Y0的置信区间:
Yˆ0 t ˆ 1 X 0 (XX) 1 X0 Y0 Yˆ0 t ˆ 1 X 0 (XX) 1 X0
1776 .8 2.093 705.5 1.3938
或
(1711.1, 1842.4)
为了进行科学预测,还需求出预测值的置信 区间,包括E(Y0)和Y0的置信区间。
一、E(Y0)的置信区间
易知
E(Yˆ0 ) E(X0βˆ ) X0 E(βˆ ) X0β E(Y0 ) Var(Yˆ0 ) E(X0βˆ X0β)2 E(X0 (βˆ β)X0 (βˆ β))
Var(Yˆ0 ) E(X0 (βˆ β)(βˆ β)X0 ) X0 E(βˆ β)(βˆ β)X0