区间估计及假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2)
xi 2
则,Z为一个标准化正态变量,Z ~ N (0,1) 。
(5.3.1)
如果总体方差 2 已知,就可以用正态分布对 2
作出概率上的表述。在正态曲线下,
1 之间的面积为68.26% 1.96 之间的面积为95%
2 之间的面积为95.45%
3 之间的面积为99.73%
从而 2 的区间估计就容易了。选定1 为95%,则
界值,查表;显著水平 / 2 ,自由度n -2可得 t / 2 的值。
于是有:
Pr[t / 2
ˆ2 2 se(ˆ2 )
t / 2 ] 1
整理得:
(5.3.4)
Pr[ˆ2 t /2se(ˆ2 ) 2 ˆ2 t /2se(ˆ2 )] 1 (5.3.5)
即 2 的100(1 )% 水平的置信区间为: ˆ2 t / 2se(ˆ2 )
计教程),而且,可以证明Z2的分布独立于Z1。运用P160定理5.5
(附录),
变量 t Z1 n 2 服从自由度为n-2的t 分布。
Z2
把(1)式和(2)式代入上式,即可得到(5.3.2)式。
用t分布构造的 2 的置信区间为:
Pr( t / 2 t t / 2 ) 1
(5.3.3)
上式中t 值由(5.3.2)式给出。 t / 2 为 / 2 显著水平上的临
用统计上的话说,这个指定的(声称的)假设叫做虚拟假设 (null hypothesis),或维持假设(maintained hypothesis),用 H0来表示。 通俗地说,是一个靶子。
Pr[1.96
ˆ2 2 se(ˆ2 )
1.96] 0.95
但是,在许多实际问题中,总体方差 2 都是未知的,只能
用其无偏估计量 ˆ 2 来替代。(5.3.1)式便为:
Biblioteka Baidu
t
ˆ2 2 se(ˆ2 )
(ˆ2
2) ˆ
xi 2
(5.3.2)
se(ˆ2 ) 为估计量ˆ2 的标准误的估计值(estimated standard
也就是说, 的
水平的置信区间为:
1 100(1 )%
在区间估计中,置信区ˆ间1 的t宽/2度se(与ˆ估1) 计量的标准误
(5.3.8) 或
成正比例。这说明,标准误越大,置信区间s越e(宽ˆ1,) 对总
体se真(ˆ值2 )进行估计的接近程度越差。因此,估计量的标准误被看
作是估计量的精度(precision),它反映了估计量的精确程度。
把(5.4.1)式中的 2代入(5.4.2)式
整理得:
ˆ 2
Pr[(n 2)
2 (n 2)
ˆ 2
] 1
2 2
2 1 / 2
(5.4.3)
该式给出了 2 的置信系数为 100(1 )% 的置信区间。
§5.5 假设检验(Hypothesis Testing):概述
参数估计与假设检验都是在样本分布基础上作出概率性判 断,两者既有联系又有区别,但其基本原理则是一致的。
例子:P123
两个游戏: 掷硬币 套圈
请问: 区间估计更象哪一个?
置信区间的两个特点: 位置的随机性 长度的随机性
二、1 的置信区间:
利用 E(ˆ1 ) 1 和
2 ˆ1
n
Xi2 2
xi 2
进行类似的推导,可得:
Pr[ˆ1 t /2se(ˆ1) 1 ˆ1 t /2se(ˆ1)] 1 (5.3.7)
参数的区间估计主要解答某一总体参数真值落在什么区间 内的问题;
而假设检验就是要对一个已知估计值或已得出的数据进行 检验,判断它是否与某一个指定的假设(stated hypothesis)相容 或一致(compatible)。所谓相容或一致,是指某一已知估计值 充分地接近其假设的数值,从而导致接受新指定的假设。
error)。
这里定义的t变量服从自由度为n-2的t分布
证明:令
Z1
ˆ2 2 se(ˆ2 )
(ˆ2
2)
xi 2
(1)
Z2
(n
2) ˆ
2 2
(2)
如果 已知,(1)式就是对 ˆ2 进行标准化,所以Z1服从
标准正态分布, Z1 ~ N (0,1) 。
Z2服从(n-2)个自由度的 2 分布(证明参见有关的数理统
ˆ2 为置信下限(lower confidence limit)
ˆ2 为置信上限(upper confidence limit)
(5.2.1)式表示的是:随机区间包含真实 2 的概率为 1 。区 间估计量给出了一个真实 2 会落入其中的数值范围。
点估计与区间估计:
单一的点估计量可能不同于总体真值,即存在估计误差。点
第5章 区间估计与假设检验
(Interval Estimation and Hypothesis Testing)
§5.1 统计学的预备知识 自己复习
§5.2 区间估计:一些基本概念
第三章给出了边际消费倾向(MPC)的估计值为0.5091。
我们也知道,
E(,ˆ2但) 是,2 由于抽样的波动性,单个估计
估计既不能给出误差范围的大小,也没有给出估计的可靠程度。
区间估计则可以显示 ˆ1和
以及这种接近的可靠性。
ˆ2 是怎样的接近总体真值 1 和
2 ,
§5.3 回归系数 1 和 2 的置信区间
一、 2 的置信区间
OLS估计量 ˆ1 和 ˆ2 服从正态分布,因此, 若令
Z
ˆ2 2 se(ˆ2 )
(ˆ2
§5.4 2 的置信区间
在正态性假定下,变量:
2
ˆ 2
(n 2)
2
(5.4.1)
服从自由度为n-2的 2 分布。因此,可以用 2 分布构造
2 的置信区间:
Pr(
2 1
/
2
2
2
/
2
)
1
(5.4.2)
其中的
2
值由(5.4.1)式给出,12
/
2和
2
/
2
可以查表得
到,自由度为n-2,见P125 Figure 5.1。
2
1
(5.2.1)
Pr( ˆ2 2 ˆ2 ) 1
这样的区间称为置信区间(confidence interval);1 称为置
信系数(confidence coefficient);而 称为显著性水平(level of
significance)。置信区间的端点称置信限(confidence limits)也 称临界值(critical values)。
值可能并不等于真值。因此,我们不能完全依赖一个点估计值,
而是要围绕点估计量构造出一个区间,使这一区间在一定的概
率保证之下包含真实的参数值(真值),这就是区间估计。
我们的任务就是求出两个正数 和 ,
,使得随
机区间(random interval)
0 包含1 的概率
为
:
(ˆ2 , ˆ2 )