假设检验的基本思想与概念

合集下载

假设检验的基本概念

第五节检验水准与两类错误
第二章
I型错误和II型错误
假设检验是利用小概率反证法思想，从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立，然后在假定H0成立的条件下计算检验统计量，最后根据P值判断结果，此推断结论具有概率性，因而无论拒绝还是不拒绝H0，都可能犯错误。详见表8-1。
01
P122 例8-3
02
两均数之差的标准误的估计值
03
01
P122 例8-3
02
两均数之差的标准误的估计值
由于u0.05/2=1.96，u0.01/2=2.58，|u|>u0.01/2, 得P<0.01，按α=0.05水准，拒绝H0，接受H1，两组间差别有统计学意义。可以认为试验组和对照组退热天数的总体均数不相等，两组的疗效不同。试验组的平均退热天数比对照组短。例7-7已计算了的95%的可信区间：天，给出了两总体均数差别的数量大小。
1- ：检验效能（power）:当两总体确有差别，按检验水准所能发现这种差别的能力。
a 与 b 间的关系
a
b
减少（增加）I型错误，将会增加（减少）II型错误增大n 同时降低a 与 b
B
D
A
C
减少I型错误的主要方法：假设检验时设定值。
提高检验效能的最有效方法：增加样本量。
若，不拒绝H0，但不能下“无差别”或“相等”的结论，只能下“根据目前试验结果，尚不能认为有差别”的结论。
第三节大样本均数的假设检验
单样本数据，每组例数等于或大于60例；两样本数据，两组例数的合计等于或大于60例，而且基本均等。
两总体方差已知。
样本数据不要求一定服从正态分布总体。
另一方面，可信区间不但能回答差别有无统计学意义，而且还能比假设检验提供更多的信息，即提示差别有无实际的专业意义。

4 假设检验和t检验

t
2.671
17905113912 /11101971 9462 / 9 ( 1 1)
11 9 2
11 9
=n1+n22=11+9-2=18
(3)确定P值，作出推断结论
以=18，查 t 界值表得 0.01<P<0.02。按=0.05 水
准，拒绝 H0，接受 H1,差异有统计学意义。可以认为两种饲料对小鼠的体重影响不同。
(2)计算检验统计量
本例n=12，d=53，d2=555，
d d 53 4.42 n 12
sd
d2 (
d)2 / n
555 (53)2 /12 5.40
n 1
12 1
t d 4.42 2.83 sd / n 5.40 / 12
12 1 11
(3)确定P值，作出推断结论
(1)建立检验假设，确定检验水准
H0：1=2 即两组小鼠的体重总体均数相同 H1：1 2 即两组小鼠的体重总体均数不相同 =0.05
(2)计算检验统计量
126.45 105.11
t
2.671
(111)17.762 (9 1)17.802 ( 1 1)
11 9 2
11 9
126.45 105.11
型）选择相应的检验统计量。如 t 检验、z检验、 F检验和 2 检验等。
本例采用t检验方法 t X X X 0 , n 1
SX S n S n
本例t值为1.54
3. 确定P值,做出推断结论
是指查根表据得所到计检算验的用检的验临统界计值量，确然定后H将0成算立得的可能性的大统小计，量即与确拒定绝在域检的验临假界设值条作件比下较由，抽确样定误P差引起差值别。的如概对率双。侧 t 检验 | t | ，则 tα/2(ν) P α ,按检

假设检验的基本思想

现在，我们来解决例1提出的问题：
(1)假设H0：= 0=4.55，H1：≠4.55；
(2)选择检验用统计量；
(3)对于给定小正数，如=0.05，查标准正态分表得到临界值z/2 =z0.025 =1.96；
因为| z|=3.9＞1.96，所以拒绝H0，接受H1，即认为新工艺改变了铁水的平均含碳量。
以上两例都是科技领域中常见的假设检验问题。我们把问题中涉及到的假设称为原假设或称待检假设，一般用H0表示。而把与原假设对立的断言称为备择假设，记为H1。
如例1，若原假设为H0：= 0=4.55，则备择假设为H1：≠4.55。若例2的原假设为H0：X服从正态分布，则备择假设为H1：X不服从正态分布。
例如，在100件产品中，有一件次品，随机地从中取出一个产品是次品的事件就是小概率事件。因为此事件发生的概率=0.01很小，因此，从中任意抽一件产品恰好是次品的事件可认为几乎不可能发生的，如果确实出现了次品，我们就有理由怀疑这“100件产品中只有一件次品”的真实性。那么取值多少才算是小概率呢？这就要视实际问题的需要而定，一般取0.1，0.05，0.01等。
一、假设检验问题的提出
统计推断的另一个重要问题是假设检验问题。在总体的分布函数未知或只知其形式，但不知其参数的情况下，为了推断总体的某些性质，提出某些关于总体的假设。例如，提出总体服从泊松分布的假设，又如，对于正态总体提出数学期望μ0的假设等。
这里，先结合例子来说明假设检验的基本思
二、假设检验的基本思想
假设检验的一般提法是：在给定备择假设H1下，利用样本对原假设H0作出判断，若拒绝原假设H0，那就意味着接受备择假设H1，否则，就接受原假设H0。换句话说，假设检验就是要在原假设H0和备择假设H1中作出拒绝哪一个和接受哪一个的判断。究竟如何作出判断呢？对一个统计假设进行检验的依据是所谓小概率原理，即概率很小的事件在一次试验中是几乎不可能发生

茆诗松《概率论与数理统计教程》第3版笔记和课后习题含考研真题详解-第7~8章【圣才出品】

，xn；
)
0
2．分类数据的χ2 拟合优度检验
定理：在实际观测数与期望观测数相差不大的假定下，在 H0 成立时，对统计量
2
r i 1
(ni
npi0 )2 npi0
有 2
L 2 (r 1) 。
根据定理，采取显著性水平为α 的显著性检验：检验统计量为：
2
r i 1
(ni
npi0 )2 npi0
，拒绝域为W
{ 2
2 1
(r
1)} 。
五、正态性检验 1．W 检验 W 统计量
3 / 117
圣才电子书十万种考研考证电子书、题库视频学习平台

W
n
(ai
i 1
a
)( x ( i )
x
)
2
n
n
(ai a )2 (x(i) x )2
i 1
i 1
拒绝域{W≤Wa}。
2．比率 p 的检验（见表 7-1-2）
表 7-1-2 比率 p 的检验
2 / 117
圣才电子书十万种考研考证电子书、题库视频学习平台

四、似然比检验与分布拟合检验
1．似然比检验的思想
假设的似然比
sup p(x1，K ，xn； )
( x1，K
，xn
)
sup
p( x1，K
＋（n）}。
7.2 课后习题详解
习题 7.1
1．设 x1，…，xn 是来自 N（μ，1）的样本，考虑如下假设检验问题
4 / 117
圣才电子书十万种考研考证电子书、题库视频学习平台

H0：μ＝2 vs H1：μ＝3
若检验由拒绝域为 W {x 2.6}确定。

假设检验的基本原理

项目
假设检验的基本原理
一、假设检验的基本原理
参数估计是当总体的参数不明确时，根据数据找出参数的估计，以确定相应的总体。而当对参数的信息有所了解，但存在某种怀疑或猜测而需要证实时，则应用假设检验的方法来处理。
一、假设检验的基本原理
一、假设检验的概念
统计假设（简称假设）的实质是施加于一个或多个总体的概率分布或其参数的假设。所做的假设可以是正确的，也可以是不正确的。
一、假设检验的基本原理
反证法是假设检验所采用的逻辑推理方式，为了检验某个假设是否成立，先假设它是正确的，然后根据抽样理论和样本信息计算样本特征值。如果样本特征值在小概率范围内，就拒绝假设；如果样本特征值在大概率范围内，就接受假设。
一、假设检验的基本原理
四、假设检验的两类错误与功效
1. 假设检验的两类错误
一、假设检验的基本原理
假设检验过程中可能发生以下两类错误：（1）第Ⅰ类错误（type Ⅰ error）。当原假设为真时拒绝原假设所犯的错误称为第Ⅰ类错误，又称弃真错误。犯第Ⅰ类错误的概率记为α。（2）第Ⅱ类错误（type Ⅱ error）。当原假设为假时没有拒绝原假设所犯的错误称为第Ⅱ类错误，又称取伪错误。犯第Ⅱ类错误的概率记为β。
一、假设检验的基本原理
二、原假设和备择假设
在假设检验中，首先需要提出两种假设，即原假设和备择假设。在统计学中，把统计假设称为原假设或零假设(null hypothesis),记为H0。原假设通常是研究者想收集证据予以反对的假设。与原假设对立的是备择假设(alternative hypothesis) ，记为H1。备择假设通常是研究者想收集证据予以支持的假设，也称研究假设。备择假设通常用于支持研究者的看法，比如，研究者正在做一项研究，并想使用假设检验来支持自己的看法，就应该把自己认为正确的看法作为备择假设。

假设检验的基本概念

假设检验的基本概念
一、假设检验的基本原理二、假设检验的基本概念三、假设检验的一般步骤
回
停下
一、假设检验的基本原理
在实际工作中常会遇到这样的问题：（1）某药物在改进工艺后的疗效是否有提高？（2）假定总体服从某种分布是否成立？如何通过抽检的样本对上述问题做出判断？此时常常作出适当的假设,然后进行试验或
观测ห้องสมุดไป่ตู้得到统计样本,构造统计方法进行判断,以
决定是否接受这个假设.
假设检验就是这样一种统计推断方法，
根据样本提供的信息对所提出的假设作出判断: 是接受, 还是拒绝.
1. 基本原理小概率推断原理： 0 α 0.05 小概率事件 (概率接近0的事件),在一次试验中,实际上可认为不会发生(这是人们长期积累起的普遍经验!).
分析设该厂生产的猪肉罐头平均重量 μ = 500 g
则问题变为检验假设H0: μ = 500是否成立？
由以往经验可知, 标准差 σ = 2 ，
则X ~ N ( μ,22 ), 其中μ未知.
问题: 根据样本值判断 μ = 500 解 1° 提出两个对立假设还是 μ ≠ 500？
H 0 : μ μ0 500 , H1 : μ μ0 ;
/ n
u / 2 , 则称x与0差异是显著的 , 则
我们拒绝 H0;
反之，如果 | u | | x 0 |
/ n
u / 2 , 则称 x与0差异是不
显著的，则我们接受 H0 ;
上述 x与0有无显著差异的判断是在显著性水平
之下做出的 .
2. 检验统计量用于检验假设的统计量，称为检验统计量. 如：对于例2, X μ0 ______ 统计量U 检验统计量 σ/ n 3. 原假设与备择假设假设检验问题通常叙述为: “在显著性水平下,

概率论与数理统计第八章假设检验

对于(a)小概率P{X 0 u }
u是所选取合适的统计量 U 的分位点
1
单侧检验
P{ X 0 u } x 0 u为拒绝区域
其含义是依这样本x所推断的
小
概率
事
件H
发生
0
了
，
拒
绝H
0
u
拒绝

1
u 拒绝
对于(b)小概率P{X 0 u } (密度函数为对称时)
由经验知 0.015公斤，为了检验某天机器工作是否正常，抽取其所
包装的9袋称得重量分别为0：.497,0.506,0.518,0.524,0.488,0.511,0.510,0.515,0.519；问这天机器正常否？
现在另一天任然抽取9袋得样本均值x 0.511公斤，推断这天机器是否工作正常?
小概率事件是: 样本均值X与所假设的期望0相差 X 0
不能太大, 若相差太大则拒绝H0
小概率事件P{ X 0 u }
u
是
2
所
选
取
合
适
的
统
计
量U
2
的

2
分
位
点
1
P{ X 0 u } x 0 u 为拒绝区域 2
较大、较小是一个相对的概念，合理的界限在何处？应由什么原则来确定？
问题是：如何给出这个量的界限？这里用到人们在实践中普遍采用的一个原则：
小概率事件在一次试验中基本上不会发生(若发生了则认为假设是错 )
在假设检验中,称这个小概率为显著性水平,用表示.

假设检验。《统计学》

ຫໍສະໝຸດ 4、假设检验中的拒绝域和接受域
在规定了检验的显著性水平α后，根据容量为n 的样本，按照统计量的理论概率分布规律，可以确定据以判断拒绝和接受原假设的检验统计量的临界值。
临界值将统计量的所有可能取值区间分为两个互不相交的部分，即原假设的拒绝域和接受域。
对于正态总体，总体均值的假设检验可有如下图示：
第二，假设检验采用的反证法带有概率性质。所谓假设的不合理不是绝对的，而是基于实践中广泛采用的小概率事件几乎不可能发生的原则。至于事件的概率小到什么程度才算是小概率事件，并没有统一的界定标准，而是必须根据具体问题而定。如果一旦判断失误，错误地拒绝原假设会造成巨大损失，那么拒绝原假设的概率就应定的小一些；如果一旦判断失误，错误地接受原假设会造成巨大损失，那么拒绝原假设的概率就应定的大一些。
假设检验
假设检验在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
参数估计和假设检验
参数估计和假设检验是统计推断的两个组成部分，都是利用样本对总体进行某种推断，但推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法。假设检验讨论的是用样本信息去检验对总体参数的某种假设是否成立的程序和方法。
＞X0），那么对于前者当X＜X0时，对于后者当X＞X0 时，可以否定原假设。这种假设检验称为单侧检验。可以分为左侧检验和右侧检验。
双侧检验与单侧检验 (假设的形式)
假设
H0 H1
研究的问题（总体均值检验）双侧检验左侧检验右侧检验 X= X0 X X 0 X X 0 X ≠ X 0 X < X 0 X > X 0
a和的关系就像翘翘板，a小就大， a大就小

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(1) 是参数估计问题吗？
(2) 回答“是”还是“否” ，假设检验问题。
(3) 命题“合金平均强度不低于110Pa”正确与
否仅涉0 及{如:下 1两10个} 参数集1 合 {： : 110}
这两个非空参数集合都称作统计假设，简称假设。
(4) 我们的任务是利用样本去判断假设（命题） “ 0 ”是否成立。这里的“判断”在统
正如在数学上我们不能用一个例子去证明一个结论一样，用一个样本（例子）不能证明一个命题（假设）是成立的，但可以用一个例子（样本）推翻一个命题。因此，从逻辑上看，注重拒绝域是适当的。事实上，在“拒绝原假设”和“拒绝备择假设（从而接收原假设）” 之间还有一个模糊域，如今我们把它并入接收域，所以接收域是复杂的，将之称为保留域也许更恰当，但习惯上已把它称为接收域，没有必要再进行改变，只是应注意它的含义。
二、选择检验统计量，给出拒绝域形式
由样本对原假设进行判断总是通过一个统计量完成的，该统计量称为检验统计量。使原假设被拒绝的样本观测值所在区域称为拒绝域，一
般用W 表示，在例7.1.1中，样本均值 x愈大，
意味着总体均值也大，因此，合理的拒绝域
形如 W {(x1,L , xn ) : x c} {x c}
计学中称为检验或检验法则。
7.1.2 假设检验的基本步骤
一、建立假设
在假设检验中，常把一个被检验的假设称为原假设，用 H0表示，通常将不应轻易加以否定的假设作为原假设。当 H0被拒绝时而接收的假设称为备择假设，用 H1表示，它们常常成对出现。
在例7.1.1中，我们可建立如下两个假设：
H0 : 110 vs H1 : 110
三、选择显著性水平
检验可能犯以下两类错误：
➢ 其一是 H0为真但样本观测值落在拒绝域中，从而拒绝原假设 H0，这种错误称为第一类错误，其发生的概率称为犯第一类错误的概率，或称拒真概率，通常记为 .
➢ 其二是 H0不真（即 H1为真）但样本观测值落在接受域中，从而接受原假设 H，0 这种错误称为第二类错误，其发生的概率称为犯第二类错误的概率,或称受伪概率，通常记为。
观测数据情况
总体情况
H 0为真
H1为真
(x1,L , xn ) W
犯第一类错误
正确
(x1,L , xn ) W c 正确
犯第二类错误
犯第一类错误的概率和犯第二类错误的概率可以用同一个函数表示，即所谓的势函数。势函数是假设检验中最重要的概念之一，定义如下：
定义7.1.1 设检验问题 H0 : 0 vs H1 : 1
§7.1 假设检验的基本思想与概念
7.1.1 假设检验问题
例7.1.1 某厂生产的合金强度服从 N( ,，16其) 中
的设计值为不低于110(Pa)。为保证质量，该
厂每天都要对生产情况做例行检查，以判断生产是否正常进行,即该合金的平均强度不低于
110(Pa)。某天从生产中随机抽取25块合金，
测得强度值为x1, x2 , …, x25，其均值为 x 108 (Pa)，问当日生产是否正常？
说明：在样本量一定的条件下不可能找到一
个使和都小的检验。
英国统计学家 Neyman 和 Pearson 提出水平
为的显著性检验的概念。
定义7.1.2 对检验问题 H0 : 0 对 H1 : 1
如果一个检验满足对任意的 0，都有 g( ) ,
则称该检验是显著性水平为的显著性检验，简称水平为的检验。
四、给出拒绝域
确定显著性水平后，可以定出检验的拒绝域W。
在例7.1.1中，若取=0.05,
由于g()关于单调减，只需要
g (110)
5(c
110) 4
0.05
成立即可。这给出c 的值为
c 110 0.8u0.05 110 0.81.645 =108.684 检验的拒绝域为 W {x 108.684}
g( )
P ( /5
c
4/5
这个势函数是的减函数
利用这个势函数容易写出犯两类错误的概率
分别为
(
)
c
4/5
,
0
和
(
)
1
c
4/5
,
1,
由此可得如下结论：
➢ 当减小时，c 也随之减小，必导致的增大； ➢ 当减小时，c 会增大，必导致的增大；
若令 u x 110 4/5
则拒绝域有另一种表示: W {u u0.05} {u 1.645}
五、作出判断
在有了明确的拒绝域后，根据样本观测值我们可以做出判断：
➢ 当 x 108.684 或 u 1.时64，5 则拒绝 H0
即接收 H1 ；
➢ 当 x 108.684 或 u 1.645时，则接收 H0
的拒绝域为W，则样本观测值落在拒绝域内的概率称为该检验的势函数，记为
x g( ) P ( W ), 0 1 (7.1.3)
势函数 g( )是定义在参数空间上的一个函数。犯两类错误的概率都是参数的函数，并可由势
函数算得，即：
( ), g( ) 1 ( ),
0 1
对例7.1.1，其拒绝域为W {x，c由} (7.1.3)可以算出该检验的势函数
在例7.1.1中，由于 x 108 108.684
因此拒绝原假设，即认为该日生产不正常。