区间估计及假设检验

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

§5.4 2 的置信区间
在正态性假定下，变量：
2
ˆ 2
(n 2)
2
（5.4.1）
服从自由度为n-2的 2 分布。因此，可以用 2 分布构造
2 的置信区间：
Pr(
2 1
/
2
2
2
/
2
)
1
（5.4.2）
其中的
2
值由（5.4.1）式给出，12
/
2和
2
/
2
可以查表得
到，自由度为n-2，见P125 Figure 5.1。
计教程），而且，可以证明Z2的分布独立于Z1。运用P160定理5.5
(附录)，
变量 t Z1 n 2 服从自由度为n-2的t 分布。
Z2
把（1）式和（2）式代入上式，即可得到（5.3.2）式。
用t分布构造的 2 的置信区间为：
Pr( t / 2 t t / 2 ) 1
（5.3.3）
上式中t 值由（5.3.2）式给出。 t / 2 为 / 2 显著水平上的临
Pr[1.96
ˆ2 2 se(ˆ2 )
1.96] 0.95
但是，在许多实际问题中，总体方差 2 都是未知的，只能
用其无偏估计量 ˆ 2 来替代。（5.3.1）式便为：
t
ˆ2 2 se(ˆ2 )
(ˆ2
2) ˆ
xi 2
（5.3.2）
se(ˆ2 ) 为估计量ˆ2 的标准误的估计值（estimated standard
把（5.4.1）式中的 2代入（5.4.2）式
整理得：
ˆ 2
Pr[(n 2)
2 (n 2)
ˆ 2
] 1
2 2
2 1 / 2
（5.4.3）
该式给出了 2 的置信系数为 100(1 )% 的置信区间。
§5.5 假设检验（Hypothesis Testing）：概述
参数估计与假设检验都是在样本分布基础上作出概率性判断，两者既有联系又有区别，但其基本原理则是一致的。
2
1
（5.2.1）
Pr( ˆ2 2 ˆ2 ) 1
这样的区间称为置信区间（confidence interval）；1 称为置
信系数（confidence coefficient）；而称为显著性水平（level of
significance）。置信区间的端点称置信限（confidence limits）也称临界值（critical values）。
例子：P123
两个游戏: 掷硬币套圈
请问: 区间估计更象哪一个?
置信区间的两个特点: 位置的随机性长度的随机性
二、1 的置信区间：
利用 E(ˆ1 ) 1 和
2 ˆ1
n
Xi2 2
xi 2
进行类似的推导，可得：
Pr[ˆ1 t /2se(ˆ1) 1 ˆ1 t /2se(ˆ1)] 1 （5.3.7）
用统计上的话说，这个指定的（声称的）假设叫做虚拟假设（null hypothesis），或维持假设（maintained hypothesis），用 H0来表示。通俗地说，是一个靶子。
error）。
这里定义的t变量服从自由度为n-2的t分布
证明：令
Z1
ˆ2 2 se(ˆ2 )
(ˆ2
2)
xi 2
（1）
Z2
(n
2) ˆ
2 2
（2）
如果已知，（1）式就是对 ˆ2 进行标准化，所以Z1服从
标准正态分布， Z1 ~ N (0,1) 。
Z2服从（n-2）个自由度的 2 分布（证明参见有关的数理统
估计既不能给出误差范围的大小，也没有给出估计的可靠程度。
区间估计则可以显示 ˆ1和
以及这种接近的可靠性。
ˆ2 是怎样的接近总体真值 1 和
2 ，
§5.3 回归系数 1 和 2 的置信区间
一、 2 的置信区间
OLS估计量 ˆ1 和 ˆ2 服从正态分布，因此，若令
Z
ˆ2 2 se(ˆ2 )
(ˆ2
参数的区间估计主要解答某一总体参数真值落在什么区间内的问题；
而假设检验就是要对一个已知估计值或已得出的数据进行检验，判断它是否与某一个指定的假设（stated hypothesis）相容或一致（compatible）。所谓相容或一致，是指某一已知估计值充分地接近其假设的数值，从而导致接受新指定的假设。
界值，查表；显著水平 / 2 ，自由度n -2可得 t / 2 的值。
于是有：
Pr[t / 2
ˆ2 2 se(ˆ2 )
t / 2 ] 1
ቤተ መጻሕፍቲ ባይዱ
整理得：
（5.3.4）
Pr[ˆ2 t /2se(ˆ2 ) 2 ˆ2 t /2se(ˆ2 )] 1 （5.3.5）
即 2 的100(1 )% 水平的置信区间为： ˆ2 t / 2se(ˆ2 )
2)
xi 2
则，Z为一个标准化正态变量，Z ~ N (0,1) 。
（5.3.1）
如果总体方差 2 已知，就可以用正态分布对 2
作出概率上的表述。在正态曲线下，
1 之间的面积为68.26% 1.96 之间的面积为95%
2 之间的面积为95.45%
3 之间的面积为99.73%
从而 2 的区间估计就容易了。选定1 为95%，则
ˆ2 为置信下限（lower confidence limit）
ˆ2 为置信上限（upper confidence limit）
（5.2.1）式表示的是：随机区间包含真实 2 的概率为 1 。区间估计量给出了一个真实 2 会落入其中的数值范围。
点估计与区间估计：
单一的点估计量可能不同于总体真值，即存在估计误差。点
值可能并不等于真值。因此，我们不能完全依赖一个点估计值，
而是要围绕点估计量构造出一个区间，使这一区间在一定的概
率保证之下包含真实的参数值（真值），这就是区间估计。
我们的任务就是求出两个正数和，
，使得随
机区间（random interval）
0 包含1 的概率
为
：
(ˆ2 , ˆ2 )
也就是说，的
水平的置信区间为：
1 100(1 )%
在区间估计中，置信区ˆ间1 的t宽/2度se(与ˆ估1) 计量的标准误
（5.3.8）或
成正比例。这说明，标准误越大，置信区间s越e(宽ˆ1，) 对总
体se真(ˆ值2 )进行估计的接近程度越差。因此，估计量的标准误被看
作是估计量的精度（precision），它反映了估计量的精确程度。
第5章区间估计与假设检验
（Interval Estimation and Hypothesis Testing）
§5.1 统计学的预备知识自己复习
§5.2 区间估计：一些基本概念
第三章给出了边际消费倾向（MPC）的估计值为0.5091。
我们也知道，
E(，ˆ2但) 是，2 由于抽样的波动性，单个估计