第5章 区间估计与假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(5.2.1)式表示的是:随机区间包含真实 2 的概率为 1 。区 间估计量给出了一个真实 2 会落入其中的数值范围。 点估计与区间估计: 单一的点估计量可能不同于总体真值,即存在估计误差。点 估计既不能给出误差范围的大小,也没有给出估计的可靠程度。 ˆ ˆ 区间估计则可以显示 1和 2 是怎样的接近总体真值 1 和 2 , 以及这种接近的可靠性。
对于这种单尾检验,最好的方法是显著性检验方法。
§5.7 假设检验:显著性检验法 检验回归系数的显著性:t检验
显著性检验法(test-of-significance approach)是由R.A.Fisher (费希尔),Negman(尼曼)和Pearson(皮尔逊)合作发明的, 它是利用样本结果,来证实一个虚拟假设的真伪的一种检验程 序。 t分布的来历: student
ˆ 2 为置信下限(lower confidence limit) ˆ 2 为置信上限(upper confidence limit)
§5.3 回归系数 1 和 2 的置信区间 一、 2 的置信区间
OLS估计量
ˆ ˆ 和 2 服从正态分布,因此, 若令 1
ˆ ˆ 2 2 ( 2 2 ) Z ˆ ) se( 2
用统计上的话说,这个指定的(声称的)假设叫做虚拟假设 (null hypothesis),或维持假设(maintained hypothesis),用 H0来表示。 通俗地说,是一个靶子。
另 外 , 还 需 要 一 个 备 择 假 设 ( 对 立 假 设 ) ( alternative hypothesis),用H1表示。H0和H1构成一个完备事件。
变量 t
Z1 n 2 Z2
服从自由度为n-2的t 分布。
把(1)式和(2)式代入上式,即可得到(5.3.2)式。
用t分布构造的 2 的置信区间为:
Pr( t / 2 t t / 2 ) 1
(5.3.3)
上式中t 值由(5.3.2)式给出。 t / 2 为 / 2 显著水平上的临 界值,查表;显著水平 / 2 ,自由度n -2可得 t / 2 的值。
它是统计上高度显著(highly statistically significant)。
单侧或单尾检验 One-Sided or One-Tail Test
当我们有着很强的理论支撑或者先验性预期时,可以把备择假 设H1取为单侧的或单向的。如:H 0 : 2 0.3 和 H1 : 2 0.3
于是有:
Pr[ t / 2
整理得:
ˆ 2 2 t / 2 ] 1 ˆ se( 2 )
(5.3.4)
ˆ ˆ ˆ ˆ Pr[ 2 t / 2 se( 2 ) 2 2 t / 2 se( 2 )] 1 (5.3.5)
整理得:
ˆ ˆ 2 2 2 Pr[( n 2) 2 (n 2) 2 ] 1 1 / 2
2
(5.4.3)
该式给出了 2 的置信系数为 100 (1 )% 的置信区间。 §5.5 假设检验(Hypothesis Testing):概述
参数估计与假设检验都是在样本分布基础上作出概率性判 断,两者既有联系又有区别,但其基本原理则是一致的。
在正态性假设下的变量:
ˆ ˆ ( 2 2 ) 2 2 t ˆ ˆ se( )
2
xi
2
(5.3.2)
服从自由度为n-2的t分布。 在虚拟假设下 2 的真值被设定,就可以利用样本数据算 出(5.3.2)式,即这个t统计量是可以算出来的,从而可以作出 如下的置信区间:
在区间估计中,置信区间的宽度与估计量的标准误
100 (1 )% ˆ ˆ 1 t / 2 se( 1 )
水平的置信区间为:
(5.3.8)
或
§5.4 2 的置信区间 在正态性假定下,变量:
ˆ 2 2 (n 2) 2 (5.4.1) 服从自由度为n-2的 2 分布。因此,可以用 2 分布构造
xi
2
(5.3.1)
则,Z为一个标准化正态变量,Z ~ N (0,1) 。
如果总体方差 2 已知,就可以用正态分布对 2
作出概率上的表述。在正态曲线下,
1 之间的面积为68.26%
1.96 之间的面积为95%
2 之间的面积为95.45%
3
之间的面积为99.73%
我们的任务就是求出两个正数 和 , ,使得随 0 1 的概率 机区间(random interval) 包含 ˆ ˆ 为 : ( 2 , 2 ) 2
1
ˆ ˆ Pr( 2 2 2 ) 1
(5.2.1)
这样的区间称为置信区间(confidence interval); 称为置 1 信系数(confidence coefficient);而 称为显著性水平(level of significance)。置信区间的端点称置信限(confidence limits)也 称临界值(critical values)。
ˆ 那么,我们估计的 2 是否与上述 H 0 相容?
可以用置信区间来加以判断。
P123页的(5.3.9)式给出的置信区间:(0.4268,0.5914)。 也就是说,从长远来看,像(0.4268,0.5914)这样的很多个 区间将会有95%的概率包含真实的 2 。因而,置信区间给出 ˆ 了可信的(plausible)虚拟假设的一个集合。如果虚拟假设的 2 落入这个 100 (1 )% 置信区间,我们就不拒绝虚拟假设;如 果它落在区间之外,我们就可以拒绝虚拟假设。
从而 2 的区间估计就容易了。选定1 为95%,则
ˆ 2 2 Pr[ 1.96 1.96 ] 0.95 ˆ ) se( 2
但是,在许多实际问题中,总体方差 2 都是未知的,只能 用其无偏估计量 2 来替代。(5.3.1)式便为: ˆ
ˆ ˆ ( 2 2 ) xi 2 2 2 t (5.3.2) ˆ ˆ se( 2 ) ˆ ˆ se( 2 ) 为估计量 2 的标准误的估计值(estimated standard error)。
备择假设可以是简单的(simple)或复合的(composite)。例 如, H1 : 2 1.5 是一个简单假设,而 H1 : 2 1.5 则是一个复 合假设。 进行统计假设检验,就是要制定一套步骤和规则,以使决定 接受或拒绝一个虚拟假设(原假设)。一般来说,有两种相互 联系、相互补充的方式:置信区间(confidence interval)和显 著性检验(test of significance)。
在假设 H 0下,落入此区间
的 2 值有 100 (1 )% 的 可信性。因此,若 2 果真 落入此区域,就不拒绝 H 0
ˆ ˆ 2 t / 2 se( 2 )
ˆ ˆ 2 t / 2 se( 2 )
图5.2 2 的一个 100 (1 )% 置信区间
在统计上,当虚拟假设被我们拒绝时,就称我们的发现是统计 上显著的(statistically significant)。反之,当我们不拒绝虚拟假 设时,我们说,我们的发现不是统计上显著的。 当选择的显著性水平又比较低,比如 1% ,从而置信系数
1 比较高,如99%时,仍然达到了统计上是显著的,我们就称
参数的区间估计主要解答某一总体参数真值落在什么区间 内的问题; 而假设检验就是要对一个已知估计值或已得出的数据进行 检验,判断它是否与某一个指定的假设(stated hypothesis)相容 或一致(compatible)。所谓相容或一致,是指某一已知估计值 充分地接近其假设的数值,从而导致接受新指定的假设。
这里定义的t变量服从自由度为n-2的t分布
证明:令
ˆ ˆ 2 2 ( 2 2 ) Z1 ˆ se( )
2
xi
2
(1)
ˆ 2 Z 2 (n 2) 2 (2) ˆ 如果 已知,(1)式就是对 2 进行标准化,所以Z1服从 标准正态分布, Z1 ~ N (0,1) 。 2 分布(证明参见有关的数理统 Z2服从(n-2)个自由度的 计教程),而且,可以证明Z2的分布独立于Z1。运用P160定理5.5 (附录),
即 2 的100 (1 )% 水平的置信区间为:
ˆ ˆ 2 t / 2 se( 2 )
例子:P123
两个游戏: 掷硬币 套圈
请问: 区间估计更象哪一个?
置信区间的两个特点: 位置的随机性 长度的随机性
二、 的置信区间: 1 2 ˆ 利用 E ( 1 ) 1 和 ˆ
来自百度文库
2 的置信区间:
Pr(
2 1 / 2
/ 2 ) 1
2 2
(5.4.2)
2 2 值由(5.4.1)式给出,12 / 2和 / 2 可以查表得 其中的
到,自由度为n-2,见P125 Figure 5.1。 把(5.4.1)式中的 2 代入(5.4.2)式
1
n xi
Xi
2
2 2
进行类似的推导,可得:
ˆ ˆ ˆ ˆ Pr[ 1 t / 2 se( 1 ) 1 1 t / 2 se( 1 )] 1 (5.3.7)
也就是说,
1
的
ˆ se( 1 ) 成正比例。这说明,标准误越大,置信区间越宽,对总 ˆ se( 2 ) 体真值进行估计的接近程度越差。因此,估计量的标准误被看 作是估计量的精度(precision),它反映了估计量的精确程度。
第5章 区间估计与假设检验 (Interval Estimation and Hypothesis Testing)
§5.1 统计学的预备知识 自己复习 §5.2 区间估计:一些基本概念
第三章给出了边际消费倾向(MPC)的估计值为0.5091。 ˆ E( 2 ) 2 我们也知道, ,但是,由于抽样的波动性,单个估计 值可能并不等于真值。因此,我们不能完全依赖一个点估计值, 而是要围绕点估计量构造出一个区间,使这一区间在一定的概 率保证之下包含真实的参数值(真值),这就是区间估计。
§5.6假设检验:置信区间的方法 双侧或双尾检验 (Two-sided or Two-Tail Test)
ˆ 利用P88页Table 3.2的数据,估计出MPC(边际消费倾向 2 ) 是0.5091。可以造构如下的检验假设:
H 0: 2 0.3
H 1: 2 0.3
在虚拟假设下,MPC是0.3,在对立假设下MPC大于或小于 0.3。虚拟假设是一个简单假设,而对立假设则是一个复合假设; 实际上就是我们所说的双侧假设(two-sided hypothesis)。
显著性检验的关键在于构造出一个检验统计量(test statistic) (作为估计量),在虚拟假设下这个统计量会服从一定的抽样 2 分布(如t分布,F分布,正态分布, 分布等)。构造出统计 量以后,就可以利用样本数据计算出这个统计量的样本值,再 把这个样本值与给定某一显著水平的临界值进行比较,看它与 临界值是否有显著差别,从而作出判断,决定拒绝还是接受所 作的假设。
决策规则:构造一个 2 的 100 (1 )% 置信区间。如果 2 在 假设H0下落入此区间,就不要拒绝H0。但如果它落在此区间之外, 就要拒绝H0。 在上例中, H 0 : 2 0.3,很明显地落在(0.4268,0.5914)这 个置信区间之外,因此我们能以95%的置信度拒绝MPC的真值是 0.3的假设。