§2.5多元线性回归模型的置信区间
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3
可靠性和估计精度是相互制约
1、提高可靠性(减少风险),区 间增大,反之,则反。因为信息量 只有这末多。 2、增加样本容量t临界值减小和 系数标准误减小(它的分子不增它, 分母增大)误差半径减小 3、提高拟合优度(减少RSS) 4、提高样本观察值的分散度。 5、置信区域是一个以^为中心的 超椭球
假日旅馆房间收入的预测
已知(美国1970-1980年间)房间总收入、 房间租用率、房间总数 和 平均租金的资 料。 指标间的关系如下:
房间总收入=房间租用率X 房间总数X 平均租金
01-3-3
重庆商学院经济系
14
资料(LX\LX3\SHM31)
ª¾ ä ¼ À û FJZSR FZ FJSHM GNP PGNP SHYL SYZQLL Ö ª µ ê · © Ò å ¹ ©³ ¤ Ë ¸ Ø Ê © í À ½ Ô ° ë ¬ É â ± ö « ¼ ¹ ä ³ Á © Ø « Ö ª Å Û Ç ¬ ý Û Ö ¬ ³ £ ¨Ó À Ì Ö ¹ Ú ¹ à £ ¦ Á ¹ ³ Ú µ ñ Ò í È × £ © Ó À Ò Ô Í Ý Õ ý GNPÉ Ý ± ý ¹ Ú µ ñ Ò í È ×
01-3-3 重庆商学院经济系 2
一、参数估计的置信区间
Y XB N ˆ ( X X )1 X Y B Y是与N同分布的随机变量( 不同) 也是正态分布的 ˆ y y
i i
ˆ ) 2 ( X X )1 Var ( B u
2 2 用S u u 2
ˆ
£ ©
f ÎÇ ¿ · î Ã Ù
³ ª | e f | <10% £ © ¼ Æ Ò Ô º Ó Ç Û ¡ £
ˆ 1 X f ( X X ) 1 X f Sf
ª ³ | t f | > t / 2 ( n k ) £ © Ô ¤â ° Á Û ¾ ¥ ° î £ ¸
t (n k ) ª ³ | t f | < /2 © Ô £ ¤â ° Á Û ¾ ¥ · À ¡ £
01-3-3
重庆商学院经济系
10
影响预测值精度的因素
1、预测精度提高(半径减少)和可靠程 度提高(风险减少)是相互制约的 2、增加观察值个数 3、提高拟合优度 4、扩大解释变量的分散程度 5、在解释变量均值向量处,有最小的预 测误差
01-3-3 重庆商学院经济系 11
均值预测和个值预测的比较
Y Yµ ö Ö ³ ³ Á Ö À Í Â Ä ø ¹ ä
01-3-3 重庆商学院经济系 24
建立房租的预测模型
LNFZ=LOG(FZ) 为什么要先做对数变换
01-3-3
重庆商学院经济系
25
指标数值大小不在一个数量级
200
40 180 160 35 140 30 120 25
150
100
50
20
100 80
0 70
ˆX L ˆX u ˆ Y F 1 F 1 k Fk F SRM £ ·
Î Ö Ò § XF1£ © XF2£ © …£ © XFk£ © Ô ¤° â YF¡ £
01-3-3 重庆商学院经济系 6
均值预测(E(YF))
ˆX L ˆX X ˆ ˆ ã Ô ³ ¤° â £ · Y F 1 F1 k Fk F
ø ¹ Ä ä Ô ¤° â £ ·
ˆ Í Í Ö Á £ · Y F
1 ˆ X ( X X ) X F t / 2 ( n k ) ë ´ © » · £ F
01-3-3
重庆商学院经济系
7
个值预测(YF)
ˆ ˆX 1¡ ¢ ³ ã Ô ¤° â £ · Y F F
2¡ ¢ ø Ä ¹ ä Ô ¤° â £ ·
¿ · Ç î Ã Ù £ · Ô ¤° â Á Û ¾ ¥ ¹ ë Î é ¿ Ä Ç ©Ã Ù £ · º ø Í Ô ¤° â
01-3-3
重庆商学院经济系
5
预测假定
FÎÇ ¿ Ä ©Ã Ù PRM Ô Ù F³ ã ± Æ ¾ ¢ YF£ º 0+1XF1£ ¨ 2XF2+… +kXFk£ ¨ uF Â ³ ¶ ä ¹ Ø ´ ¨Ô Ù F² ¥ ± Æ ¾ ¢ ¡ £
2
i
~N
ii
i
,
c
2 ii u i
S
2 u
n k 1
S ˆ i
c
S
2 u
ˆ t
S ˆ i
2
i
~ t (n k 1)
ˆ 2 t S ˆ i i 2 01-3-3
1 P t t t2 2 2 2 ˆ ˆ P t S ˆ i i t S ˆ i 1 i 2 i 2 ˆ t S 2ˆi , 为1 置信水平下的区间估计 i 2 重庆商学院经济系
01-3-3 重庆商学院经济系 12
假日旅馆房间收入的预测
已知(美国1970-1980年间): 房间总收入= 房间租用率 X 房间总数 X 平均租金 要求: 根据美国假日旅馆近年来的年报和美国 政府公布的资料,预测假日旅馆明年房 间总收入? 本例题建立的是经济计量模型?
01-3-3 重庆商学院经济系 13
2
i
i
i
2
i
2 2
2
i
i
i
2
i
01-3-3
重庆商学院经济系
9
预测能力检验
1¢ ¡ t¹ ë Î é £ · f ÎÇ ¿ · î Ã Ù
tf ˆ Y Y f f Sf ~ t (n k )
2¡ ¢ Ì ´ Ô Ë î ° î £ ·
ef
ˆ Yf Y f Yf
01-3-3 重庆商学院经济系
大量观察 深入观察 全面观察
4
预测时间轴的分段
1952 ð ª Î » Ã Ù 97 98 99 2000 2002 ¿ Ä Ç ©Ã Ù (Ë ² ½ ² )
Ú µÆ ±
¿ · Ç î Ã Ù
ˆ¨ ˆ X ð ª Î » à ٠£ · Ò Î Ö § X¡ ¢ Y£ ¨¶ Ú ° â Ö ³ £ ¦£ © Ó Æ OLS ¼ Æ Ò Ô ³ À ³ º Y £ Á â · Ì Ö ³ £ ¦
01-3-3
重庆商学院经济系
15
预测步骤
1、预测房间租用率FJZYL 2、预测平均房租FZ 3、预测房间数目FJSHM 4、预测房间总收入 FJZSR=FJZYL X FZ X FJSHM
01-3-3
重庆商学院经济系
16
分析房间租用率
假日旅馆的房间租用率与美国经济形势 有关,而失业率是一个反映经济形势的 很好的指标 而且,经验表明短期利率是反映和预测 今后一般经济活动很好的指标 当然,不能仅用失业率的下降趋势来解 释租用率的上升,它们还受发展趋势的 影响,所以生成一个增长趋势指标QSH
¼ «¹ ä ¬ Û Ç Õ Å ë £ © ¼ «¬ â £ © à º » ð À ¼ Ø Å ¹ Õ ¿ À ¶ Ü « ¼ ¹ ä ½ ¶ À ñ ¶ ñ À ñ Æ ñ ° ñ ì ªÇ » GNPÒ þ · © ½ ¶ À ñ Ç §Ò ³ ¿ Ç ïÒ Ö § Æ É Ò ³ Ö ¤Å ¯ ½ û ¿ Ç
01-3-3 重庆商学院经济系 17
租用率关于失业率和趋势的回归模型 ZYL = -1.8541822*SHYL + 0.78418817*QSH + 69.877048
01-3-3
重庆商学院经济系
18
选用失业率作为租用率的解释变量合理吗?
显然失业率不是租用率的“因”。而且, 由于不能事先得到1981年的失业率,所 以不能利用上述方程来预测租用率 但是方程反映出变量之间存在密切的关 系,进一步证实租用率与失业率有非常 相似的周期(趋势线) 不过,假日旅馆的租用率呈上升趋势, 大约每年递增0.7~0.8%
01-3-3
重庆商学院经济系
23
建立房租的预测模型
Estimation Command: LS ZYL SHYL(-1) SYZQLL(-1) ZYL(-1) C Estimation Equation: ZYL = C(1)*SHYL(-1) + C(2)*SYZQLL(-1) + C(3)*ZYL(-1) + C(4) Substituted Coefficients: ZYL = 1.0498118*SHYL(-1) - 0.72478497*SYZQLL(-1) + 0.99297981*ZYL(-1) - 0.50974687
Y
Y» ð Ö ³ ³ Á Ö À Í Â Ä ø ¹ ä
X
X
1¡ ¢ Y0 ³ Á Ö À Í Â Ä ø ¹ ä ª Å Y0 ³ Á » ð Ö ³ E(Y 0)³ Á Ö À Í Â Ä ø ¹ ä ¼ ì £ ¸ 2¡ ¢ Õ â Í ¦ Ä ø Ó í ³ Á ¼ ì ´ Å Ô Ù X£ ºX ² ï ³ º ¬ î Í ¡ ¡ £
01-3-3 重庆商学院经济系 21
关于租用率动态模型的估计结果
如果出现高失业率,下一年租用率增高, 反之,低失业率租用率也低。
01-3-3
拟合优度偏低 需要引入解释变量
重庆商学院经济系
22
通常引入短期利率反映经济景气 (商业证券利率是可靠的)
经验表明短期利率是预测未来
一、二年间经济活动的良好指标
01-3-3 重庆商学院经济系 19
为什么不能采用上述模型 进行预测的根本原因?
因为年底给出下一年的失业率的预测值,不可能通过 模型得到下一年租用率最可信的预测值。因为: 基本统计理论说明,根据解释变量预测值得到的最好 的估计系数也小于根据解释变量真值得到的估计系数。 实际上,如果预测的可靠性不大,分配给一个解释变 量的系数是偏低的。 而且,还没用一个人在预测失业率方面得出过好的结 果。 我们应当建立这样的回归模型,进行预测时使解释变 量的值都是已知的。即利用已经存在的值去预测它下 一期的值,构成“动态预测”。 于是,建立租用率关于失业率(-1)和租用率(-1) 的动态预测模型。引入租用率(-1)就应当删除趋势。
§2.5多元线性回归模型的置信区间
一、参数估计量的置信区间 二、预测值的置信区间
区间估计
用样本提供的信息,根据估计量(统计量)公式, 可以给出未知参数的估计值或被解释变量的预 测值的估计值,这种估计称为点估计。显然点 估计没有给出做出进行这类判断的可靠程度和 误差范围。 区间估计则是以一定的可靠程度(精确度), 给出估计值存在的误差范围(区间)。 因为估计量是一个随机变量,所以区间估计的 实质,是为被估计的参数或预测值构造一个以 点估计为中心的区间(置信区间),该区间以 一定的概率(置信度=1-)包含该参数或预 测值。
ˆ Í Í Ö Á £ · Y F ( X X ) 1 X F t / 2 (n k ) ˆ 1 X F ë » © ´ £ ·
置信区域是一个以^YF为中心的超椭球。
01-3-3 8
重庆商学院经济系
一元回归被解释变量Y均值与个值的预测Leabharlann Baidu
模型:Yi=b0+b1Xi+ui Y^i=b^0+b^1Xi u^i= Yi- Y^i Yi= Y^i+ u^i Y的均值Y^i的分布: x 1 x ˆ ~ N E( y ˆ ) , n y x x Y的个值Yi的分布: 1 x x ˆ ~ N E( y ˆ ) , 1 n y x x
重庆商学院经济系 20
01-3-3
建立预测租用率的动态模型
Estimation Command: LS ZYL SHYL(-1) ZYL(-1) C Estimation Equation: ZYL = C(1)*SHYL(-1) + C(2)*ZYL(-1) + C(3) Substituted Coefficients: ZYL = 1.4255166*SHYL(-1) + 0.83625401*ZYL(-1) + 2.9153472 知道去年的租用率和失业率就可以预测今年的 租用率;知道今年的就可以预测明年的,而无 须预测了明年的失业率才能预测明年的租用率。