第八章 假设检验

合集下载

假设检验的基本概念

假设检验的基本概念
第五节 检验水准与两类错误
第二章
I型错误和II型错误
假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立,然后在假定H0成立的条件下计算检验统计量,最后根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。详见表8-1。
01
P122 例8-3
02
两均数之差的标准误的估计值
03
01
P122 例8-3
02
两均数之差的标准误的估计值
由于u0.05/2=1.96,u0.01/2=2.58,|u|>u0.01/2, 得P<0.01,按α=0.05水准,拒绝H0,接受H1,两组间差别有统计学意义。可以认为试验组和对照组退热天数的总体均数不相等,两组的疗效不同。试验组的平均退热天数比对照组短。例7-7已计算了的95%的可信区间: 天,给出了两总体均数差别的数量大小。
1- :检验效能(power):当两总体确有差别,按检验水准 所能发现这种差别的能力。
a 与 b 间的关系
a
b
减少(增加)I型错误,将会增加(减少)II型错误 增大n 同时降低a 与 b
B
D
A
C
减少I型错误的主要方法:假设检验时设定 值。
提高检验效能的最有效方法:增加样本量。
若 ,不拒绝H0,但不能下“无差别”或“相等”的结论,只能下“根据目前试验结果,尚不能认为有差别”的结论。
第三节 大样本均数的假设检验
单样本数据,每组例数等于或大于60例;两样本数据,两组例数的合计等于或大于60例,而且基本均等。
两总体方差已知。
样本数据不要求一定服从正态分布总体。
另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。

假设检验一般概念

假设检验一般概念

x 400 k 时接受原假设H0;
(1)
x 400 k 时拒绝原假设H0接受备择假设H1
(2)
进一步,由于当H0为真时,有
u x400 ~N(0,1) 25/ n
1 |u|要构x造一40个0具有明确k分布的统计量,可将(1)、(2)式转化为
25/ n 25/ n
2 |u|时接x受原40假0设H0 k
2. 拒绝域与接受域 称是检验水平或显著性水平,它是我们
制定检验标准的重要依据。常数u/2把标准正态分布密度曲线下
的区域分成了两大部分,其中一部分
(x1,x2, ,xn)uu/2
称为H0的拒绝域或否定域, 当样本点落入拒绝域时,我们便拒 绝原假设H0(同前述(6)式),另一部分
(x1,x2, ,xn)uu/2
(1)根据问题的要求提出假设,写明原假设H0和备择假设H1的
具体内容。
(2)根据H0的内容,建立(或选取)检验统计量并确定其分布。 (3)对给定(或选定)的显著性水平 ,由统计量的分布查表 或计算确定出临界值,进而得到H0的拒绝域和接受域。
(4)由样本观察值计算出统计量的值。
(5)做出推断:当统计量的值满足“接受H0的条件”时就接受 H0,否则就拒绝H0接受H1 。
u
2
时接受原假设H0 (5)
时拒绝原假设H0,接受备择假设 H1 (6)
分析(5)、(6)两式,可以这 样认为:
拒绝H0,是因为以H0成立 为出发点进行推理时,得到 了不合情理的结论,使小概 率事件在一次试验中发生了。
接受H0,是因为以H0成立 为出发点进行推理时,未发 现异常。
这就是带有概率特征的反证 法,认为小概率事件在一次 试验中不可能发生。
H0:X服从泊松分布;H1:X不服从泊松分布.

第八章 假设检验

第八章    假设检验
Z X 0 n
规定显著性水平
(significant level) ❖ 什么是显著性水平? ❖ 1. 是一个概率值
❖ 2. 原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域
❖ 3. 表示为 (alpha)
常用的 值有0.01, 0.05, 0.10
❖ 4. 由研究者事先确定
作出统计决策
3. 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它
4. 总是有符号 , 或
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
备择假设
(alternative hypothesis)
1. 也称“研究假设”,研究者想收集证据予以支持的 假设(期望出现的结论作为备选假设),用H1或Ha表 示
学习目标
假设检验的基本思想和原理 假设检验的步骤 一个总体参数的检验 两个总体参数的检验 P值的计算与应用 用Excel进行检验
正常人的平均体温是37oC吗?
37.1 36.9 36.9 37.1 36.4
➢ 当问起健康的 成年人体温是
36.9
36.6
36.2
36.7
36.9
多 少 时 , 多 数 37.6 36.7 37.3 36.9 36.4
的饮料容量是否符合标准要求?
双侧检验
总体均值的检验( 2 已知)
(例题分析-大样本)
❖ H0 : = 255 ❖ H1 : 255 ❖ = 0.05
❖ n = 40 ❖ 临界值(c):
拒绝 H0
0.025
拒绝 H0
0.025
-1.96 0 1.96 z
检验统计量:
zx0 25.852551.01 n 5 40

第八章 假设检验

第八章 假设检验

广 东 工 业 大 学
上页
下页
返回
1、原假设与备择假设 H0 2、原理
H1
小概率原理:小概率事件在一次试验中是不太会发生的。 (1)提出假设 H 0 (2)在假设 H 0 成立的条件下,构造一个小概率事件A, (3)根据样本值判断:
若在这一次试验中小概率事件A发生了,则拒绝假设 H 0 ,
若在这一次试验中小概率事件A未发生,则接受假设 H 0 .
广 东 工 业 大 学
上页
下页
返回
显著性水平 3、接受域与拒绝域
P{ A} P{样本落入区域 } R
拒绝域: R 接受域: R 4、两类错误
第一类错误: 弃真
小概率
样本点落入R:拒绝 H 0
样本点落入 R : 接受 H 0
犯第一类错误的概率:
H 0 正确,但拒绝了它。
第二类错误: 采伪
工 业 大 学
上页
下页
返回
二、假设检验的思想方法 假设检验的基本思想实质上是带有某种概率性质的反证 法。为了检验一个假设是否正确,首先假设该假设正确,然 后根据抽取到的样本对假设作出接受或拒绝的决策。如果样 本观察值导致了不合理的现象发生,就应拒绝假设,否则应 该接受假设。
假设检验中所谓“不合理”,并非逻辑中的绝对矛盾,而 是基于人们的实践活动中广泛采用的原则,即小概率事件在一 次试验中是几乎不发生的。但概率小到什么程度才能算作“小 概率事件”?显然,“小概率事件”的概率越小,否定原假设 就越有说服力。 广
上页
广 东 工 业 大 学
下页
返回
例1 某砖厂生产的砖其抗拉强度X服从正态分布 N ( ,1.21) ,今从 该厂产品中随机抽取6块,测得其平均抗拉强度为31.13.试检验 这批砖的平均抗拉强度为32.5是否成立,取显著性水平 0.05. 解: 提出原假设 H 0 : 0 32.5 双边检验: 单边检验:

概率论与数理统计第八章假设检验

概率论与数理统计第八章假设检验
当总体分布函数完全未知或只知其形式、但 不知其参数的情况,为推断总体的性质,提出 某些关于总体的假设。
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.

统计学-第八章 假设检验

统计学-第八章  假设检验
验和单侧检验。以总体均值μ 的检验为例:
假设 原假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : m =m0 H0 : m m0 H0 : m m0
备择假设 H1 : m ≠m0 H1 : m <m0 H1 : m >m0
三、假设检验的程序---
4.例题分析
[例8.1] 某品牌洗衣粉在它的产品说明书中声称:平 均净含量不少于1250克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造商 的说明是否属实。试写出用于检验的原假设与备择假设。
2.接受域:概率P>的区域,为大概率区域,称之 为原假设的接受区域。
3.拒绝域:概率P≤的区域,为小概率区域,称之 为原假设的拒绝区域。
三、假设检验的程序---
1.拒绝原假设H1 原则:临界值
2.接受原假设H0 原则:临界值
检验统计值的绝 对值大于临界值;
检验统计值的绝 对值小于临界值;
假设 H0为真实 H0为不真实
接受H0 判断正确
采伪错误()
拒绝H0 弃真错误()
判断正确
四、假设检验中的两类错误
第I类()错误和第II类()错误的关系
和的关系就像 翘翘板,小就 大, 大就小。
你要同时减少两类 错误的惟一办法是 增加样本容量!
关乎决策:三个与其
与其,人为地把显著性水平固定按某一水平上,不 如干脆选取检验统计量的P值;
第二节 一个正态总体的假设检验
二、均值m的假设检验
3.给出显著性水平(0.01、0.05或0.1)
4.确定接受域和拒绝域(以双侧检验为例)

2已知:当Z Z 2
,则拒绝原假设,反之则接受H0;

第八章假设检验

第八章假设检验
/ n 0.15/ 15
查表得 z0.05 1.645,
于是
| x

/
0
n
|
0.516
z0.05

1.645
故接受 H0 , 认为该机器工作正常.
例2 公司从生产商购买牛奶.公司怀疑生产商在 牛奶中掺水以谋利. 通过测定牛奶的冰点,可以检 验出牛奶是否掺水.天然牛奶的冰点温度近似服从
单个正态总体方差的假设检验
1. 为未知, 关于 2的检验( 2 检验)
设总体 X ~ N (, 2 ), , 2均为未知,
X1 , X 2 ,, X n 为来自总体 X 的样本, 要检验假设:
其中 0 为已知常数. 设显著性水平为 ,
因为 S 2 是 2 的无偏估计,
当H
例1 某切割机在正常工作时, 切割每段金属棒 的平均长度为10.5cm, 标准差是0.15cm, 今从一批 产品中随机的抽取15段进行测量, 其结果如下: 10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7 假定切割的长度 X 服从正态分布, 且标准差没

2ቤተ መጻሕፍቲ ባይዱ

2 1
/
2
(n
1)
H1 : 0 (即设牛奶已掺水)
这是右边检验问题,其拒绝域为
z

x

0
n
z0.05
1.645.
现在
z


0.535

(0.545) 2.7951
1.645,
0.008 5
z的值落在拒绝域中, 所以我们在显著性水平

第八章 假设检验

第八章  假设检验

第八章 假设检验参数估计和假设检验是统计推断中的两类重要问题。

在前一章中我们讨论了用样本统计量来推断总体未知参数的方法—参数的点估计与区间估计,本章我们将讨论正态总体分布中的未知参数的假设检验以及总体分布函数的假设检验。

§8.1 假设检验的基本概念§8.1.1 问题的提出在实际工作中,我们经常要面对这样的问题:总体的分布函数的类型或分布函数中的一些参数是未知的,需要对总体分布函数的类型或分布函数中的未知参数提出某种"假设",然后通过已经获得的一个样本对提出的“假设”作出成立还是不成立的判断(或决策)。

为了介绍假设检验的基本思想,我们先来看一个例子:例8.1 某食品厂生产的罐头规定每听的标准重量为500克,这些罐头由一条生产线自动包装,在正常的情况下,由经验知道生产出的罐头重量(单位:克)服从正态分布N (500,22)。

质量管理中规定每隔一定时间要抽测5听罐头。

若某次抽测的5听罐头的重量为501,507,498,502,504(克),假定方差不变,这时我们是否可以得出生生产线运转正常(即这段时间生产的罐头的平均重量为500克)的判断呢?由题意知,罐头重量),2N(μ~X 2,记μ0=500,则要回答的问题是:μ=μ0吗? 我们可以先假定μ=μ0,并称之为待检假设或原假设,记为H 0:μ=μ0这个原假设可能成立也可能不成立。

当原假设不成立时,称μ的取值为备选假设,这里取“μ≠μ0”为备选假设,记为H 1:μ≠μ0所谓假设检验问题就是要利用样本提供给我们的信息,在原假设H 0与备选假设H 1之间作出拒绝哪一个、接受哪一个的判断,简称为H 0对H 1的检验问题。

在例8.1中,我们把问题归结成统计假设:H 0:μ=500,对H 1:μ≠500。

那么,如何来解决H 0对H 1的检验问题呢?由参数估计知,x 是μ的一个"好"估计量。

如果原假设H 0成立,即μ=500,那么,x 通常应很接近500,即|x -500|通常应很小;否则,就认为原假设H 0不成立,也即μ≠500。

第八章假设检验

第八章假设检验
于是可以选定一个适当的正数k,
若过分大,则有理由 怀疑H0的正确性
7/51
§8.1 假设检验
当观察值 x 满足 x 0
此即假定H0正确 时的小概率事件
/ n
k时, 拒绝假设 H0 ,
反之, 当观察值 x 满足
x 0
/ n
k时, 接受假设 H0 .
如何选取k呢,先看以下事实: 由于作出决策的依据是一个样本,当实际 上H0为真时,仍可能作出拒绝H0的决策,这种 可能性是无法消除的,这是一种错误。
24/51
第八章 假设检验

§8.1 假设检验 §8.2 正态总体均值的假设检验 §8.3 正态总体方差的假设检验

§8.6 分布拟合检验
25/51
§8.2 正态总体均值的假设检验

假设检验是针对弃真这一可能犯的错误人为设定一个界限, 如果在这个界限内,认为原假设成立,否则的话,由于显 著性水平取得很小,表明小概率事件发生,根据实际推断 原理,原假设不成立。 尽管也可能犯第II类取伪的错误,这时尽管总体的性质发 生了改变但没有发现,往往影响较小。 正态总体均值的检验分为三种情况
/ n
若|z|= X 0 k,则称 x 与μ0的差异是显著的,以至
于小概率事件发生了,这时拒绝H0, 否则则称 x与μ0的差异是不显著的,这时接受H0, 选定的数α称为显著性水平,在α下对显著性判断
X 0 统计量Z= 称为检验统计量 / n
13/51
/ n
§8.1 假设检验
假设检验的相关定义: 像上例中的假设检验问题可叙述成: “在显著性水平α下,检验假设H0:μ=μ0,H1:μ≠μ0” 或“在显著性水平α下,针对H1检验H0”
例如:提出总体期望服从泊松分布的假设,然后进行判断 提出正态总体期望为μ0的假设,然后进行判断

第八章 假设检验

第八章 假设检验

的分布函数未知,这时检验统计量的精确分布难 于求出或相当复杂,如有可能求出其渐近分布,则 只适用于大样问题.非参数性的检验问题,一般都是 大样问题,如例3中所讨论的检验问题.
第三步,确定 H0 的否定域 如例1中,当原假设H0 成立时,检验统计量 U 服从 正态 N (0,1) ,那么给定满足 0 1 的 值,在标准正
态分布表中查得临界值 u ,使得 P{| U | u } , 或者 P{u |U | u } 1.
若由子样 1,,n 的观察值 x1,, xn ,算得统计量 U 的值 u 落在 (, u ) 或 (u ,) 时则否定 H0,称 (, u ) 及 (u ,) 组成为 H0 的否定域,称 u 为临界值.
如果 多于两个点,0 {0}, 0 { 1} 为非 单点集,即有:
H0 : 0 , H1 : 1. 这时称 H0 为简单原假设, H1 为复合备选假设.
一、数学期望 a 的检验问题
一个总体时 a 的检验:
H0 : a a0 , H1 : a a1.
对原假设 H0作出否定域或不否定的判断,通常称之 为对 H0 作显著性检验.称 为显著性水平,1为置信 水平.以后常用“在显著性水平”下对 H0 作显著性检验” 这类术语.值得强调的是,我们对 H0 作出判断,是冒着
犯第一类错误的风险的.
对于 H0,给定不同的显著性水平 ,对应有不同 的临界值 u,相应地有不同的否定域,因而有不同的 判断结论,这点必须注意,如图(1)所示.
例2 某工厂生产的灯泡其光通量 服从正态分布; 某电话交换台在某段时间接到呼唤次数 是服从泊松 分布.是否正确,如何检验?
上述例1是关于数学期望 E( ) 2 的假设检验问题.

第8章 假设检验

第8章  假设检验
例 一种摄影药品被其制造商声称其贮藏寿命是均值180天、 标准差不多于10天的正态分布。某位使用者担心标准差可 能超过10天。他随机选取12个样品并测试,得到样本标准 差为14天。根据样本有充分证据证明标准差大于10天吗?
例 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的 和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的 频数将以比例9:3:3:1发生。在检验这个理论时,孟德 尔分别得到频数315、101、108、32、这些数据提供充分 证据拒绝该理论吗?
P PH0 | Z || z0 | 2PH0 Z | z0 | 2(1 (| z0 |))
(即z0代替了拒绝域式中的z 2 )
判断:当P小于显著水平时,拒绝原假设,
否则,接受: 0, H1 : 0 , 其中0是已知的常数
以X 作为的参考, 若H0为真,X比0大些,但
这个批次清漆的干燥时间构成的总体方差可设 2 0.36 而其均值是要求我们检验的!
经计算,现抽取的9个数据的平均值x 6.4小时,
现在的问题是,我们能否认为 "6.4 6.0 0" ?
即,接受以下哪个假设?
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
4
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
16
*另外方法:若给定显著性水平, 当原假设成立时
( 0),总体X ~ N (0, 2 ),因此,X ~ N (0, 2 n )
P0 ( X 0
k)
P 0
(
X
0
n
k

)
n
k
n z /2
k z/2 n
1
一般,H
的拒绝域写为:

第八章 假设检验

第八章 假设检验
例8-1:某心理学家认为,一般汽车司机视反 应时平均175ms。有人随机抽取36名司机为样本 测定,结果平均视反应时180ms,标准差20ms。 能否根据测试结果否定心理学家的结论?(假定 视反应时符合正态分布) 例8-2:从甲乙两校高一随机抽取学生各 50名进行数学测验,甲校平均分75,标准差6; 乙校平均分70,标准差8。试问两校学生的数 学平均成绩有无显著差异?
II型()错误
(一)I 型错误(Type I Error)

定义:Ho正确时,因检验值落入拒绝区而 未接受Ho所犯的错误。
Z
Ho: 1=2
错误
1 2
SEDX
Z
-1.96σ
0
1.96σ
(二)II 型错误(Type II Error)

定义:Ho不正确时,因检验值落入接受区
使用:结果或方向不确定时。
意义:只推断有无差异,不断言方向。
|Z|(CR)
<1.96 ≥1.96 ≥2.58
P值
>0.05 ≤0.05 ≤0.01
显著性
不显著 显著 极显著
符号
* **
(二)单尾(侧)检验

定义:拒绝性概率置于理论分布一尾。
使用:结果或方向确定时。 意义:既推断有无差异,又断言方向。 类型 右尾检验 左尾检验
解释
直观分析法 理论分析——小概率事件
直观分析
D=.95 接受Ho区域
.025 2
-1.96 σ -1σ
.025 2

1.96 σ
拒绝Ho区域
0.05
直观分析
接受Ho区域
.005 2
.005 2
-2.58 σ

概率论第八章

概率论第八章

n = 15, x = 10.48, α = 0.05, s = 0.237, 查表得 tα / 2 ( n 1) = t0.025 (14) = 2.1448
x 0 10.48 10.5 ≈ 0.327 ∈ (2.1448 , 2.1448) t= = s / n 0.237 / 15
故接受 H 0 , 认为金属棒的平均长度 无显著变化 .
故接受 H 0 , 认为该机工作正常 .
二. σ 未知
2
步骤: 、 步骤:1、提出假设 H0 : = 0 H1 : ≠ 0
X 0 ~ t(n 1) 2、H0成立时,选用检验统计量 T = 、 成立时, S n
3、对于给定的显著性水平 α ,由 P{ T > tα } = α 、 由此得到拒绝域W; 查表确定临界值 tα (n 1) ,由此得到拒绝域 ;
(n 1)S2
σ
2 0
~ χ 2 (n 1),
(n 1)S2 α (n 1)S2 α P ≤ k1 = , P ≥ k2 = , 2 2 2 σ0 2 σ0
P {拒绝H 0 | H 0为真} = P {小概率事件 A | H 0为真} = α
(2) 当原假设 H0 不真 而观察值却落入接受域 不真, 而观察值却落入接受域, 的判断, 称做第二类错误 第二类错误, 而作出了接受 H0 的判断 称做第二类错误 又叫 取伪错误, 取伪错误 犯第二类错误的概率记为
2 1 2 2
,
当H 0为真时 , t ~ t ( n1 + n2 2).
由P
1 2 =δ
{ t ≥ k} = α
( x y) δ
得 k = tα / 2 ( n1 + n2 2).
故拒绝域为

张厚粲 第八章 假设检验

张厚粲 第八章 假设检验

果的预期。H1:μ1≠μ0
后者称之为虚无假设(零假设),用H0表示,意为实 际上什么也没有发生,我们预期的差异、处理效果都不存
在。
H 0 : μ 1 =μ 0
备择假设与虚无假设有时没有方向性,我们只是关注 二者是否不同,比如“A与B之间存在(不存在)显著差 异”。而有时具有方向性,比如“A显著大于B”。
拒绝H0
α型错误
正确
I型错误
注:1.好的检验能在样本容量n一定的情况,较少犯两类错误的 概率,即α β都较小。但是α不能过低,过低,意味着β增大。
2. 实际运用中,控制Ⅰ型错误( α ),这就是显著性检验。
3.把错误概率控制在统计学允许的范围内,所作的推论或判 断近似为真
3.两类错误的关系
(1) α +β不一定等于1
二、决策标准(显著性水平α、观测概率Р)
1.显著性水平α( α =0.05; α =0.01; α =0.0001)
被选作拒绝零假设的基础的临界概率,即犯错误的 概率。如果零假设为真的概率小于或等于α,则拒绝零假 设;如果零假设为真的概率大于α,则接受零假设。 2.观测概率Р
P 随机误差导致的概率
则配对,分别给以两种不同的处理。
(二)检验目的
检验两相关样本均数所代表的未知总体均数是否有差 别。 (三)应用条件 适用于配对设计的计量资料均数的比较。 1、配对设计的数据一一对应。 2、差值 d 变量服从正态分布。 (四)检验统计量 t 的公式
Sd ( d )2 d n n1
2
d d d 0 d t n1 Sd Sd n Sd n

1.弃真错误(Ⅰ型错误):零假设( H0 )本来是
可能原因: 样本中有极端值;显著性水平的取值。

第八章假设检验

第八章假设检验
• 4、做出统计判断。
需要考虑因素
1. 总体方差是否已知
2. 总体分布是否正态
3. 样本容量大小
4. 双侧检验还是单侧检验 5. 右侧还是左侧
二、平均数的显著性检验的种类
• (一)总体正态分布,总体方差已知(Z)
• (二)总体正态,总体方差未知(t) • (三)总体非正态分布,大样本(Z′)
(一)总体正态分布,总体方差已知
H:1 0 新的教学法与原来的教学法无显著差异 0 H:1 0 新的教学法比原来的教学法差 0 H:1 0 新的教学法比原来的教学法好 0
假设检验的原理
• 费舍:“可以说,每一实验的存在,仅仅 是为了给事实一个反驳虚无假设的机会。”
二、假设检验中的小概率事件
• 样本统计量的值(随机事件)在其抽样分 布上出现的概率小于或等于事先规定的水 平,这时,就认为小概率事件发生了。

差异原因——误差
• 偶然误差:由于随机抽样引起的差异。
• 系统误差 :的确存在差异。
如何检验
Z X 0
X
N (0,1)
11 X 2.008 n 30 Z X 0
0
X
84 79 2.49 2.008
2
0.05, Z 0.05 1.96 0.01, Z 0.01 2.58
SE X
0
n
X 0 Z SE X
例1
• 某小学采用一种实验教材,使用一年以后, 随机抽取10名学生进行测试,得到平均成 绩82分。而过去使用旧教材的全体学生的 平均成绩为77分,标准差为5分,问实验教 材与旧教材的效果有无显著性差异?
例2
• 某地区统考数学,假设该统考数学成绩服 从正态分布,已知其总平均分为50分,标 准差为12分。从该地区随机选择一个班作 为样本,该班有学生50人,经计算该班平 均成绩为53分,试问该班成绩与总成绩的 差异是否显著。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
或 n 若所得的置信区间不包含u0,则拒绝H0, 否则不能拒绝。
x z2

x z2 /
s n


上例,我们用求置信区间的方法,来判断 原假设是否合理。 大样本下满足中心极限定理,样本均值的 抽样分布服从正态分布,从而有置信区间:
x z2 s 24 =986 1.96 n 40
假设检验的步骤

1.确定原假设和备选假设 2.选择检验统计量 3.指定检验的显著性水平 4.建立拒绝原假设的规则 5.收集样本数据,计算检验统计量的值 6.将检验统计量的值域拒绝规则的临界值比较, 以决定是否拒绝原假设。或者,由检验统计量 的值计算p值,利用p值确定是否拒绝原假设。
x 2.92 3 z 2.67 / n 0.18 / 6

x z ~ N (0,1) / n


根据显著性水平α=0.01,对应的拒绝域面积为 0.01,临界值为-2.33 Z<-2.33,所以拒绝H0,即可认为没听咖啡的容量 不足3磅。 统计证据支持对HILLTOP咖啡重量不足采取投诉措 施。

(978.56,993.44)该区间不包含u0=1000, 因此我们拒绝原假设H0.检验表明,该包 装机未能正常工作。
总体均值的检验:小样本情形


小样本下,已知总体为正态分布,我们考 虑以下两种情况: 1.总体方差已知 2.总体方差未知 在总体方差已知的情况下,即使样本容量 较小,但样本平均数的抽样分布总是以平 均值 为均值,以 x 为标准差的正态分 布。因此其检验过程和检验统计量同大样 本情形。
拒绝域为α/2 拒绝域为α/2
z / 2
拒绝域
0
z / 2
拒绝域
z

某厂采用自动包装机分装产品,假定每 包产品的重量服从正态分布,每包标准 重量为1000克,某日随机抽查40包,测 得样本平均重量为986克,样本标准差是 24克。试问在α=0.05的显著性水平上, 能否认为这天自动包装机工作正常?
第八章 假设检验
什么是假设检验



假设检验就是利用样本数据对关于总体参 数的原假设和备选假设进行检验的过程。 若样本数据不支持原假设,则拒绝原假设; 原假设用 标注, 为备选假设。 Ha H0 原假设就是,在进行检验之前,对总体参 数或总体分布做的一个初步假设。 备选假设与原假设互为排斥。
假设检验的原理
样本统计量未落入小概率 事件发生区域
拒绝域 α=0.01
0 -2.33 -1
x
小结:总体均值的单侧检验 (大样本下)


1.左侧检验的形式 假设:H0: u≥u0,Ha: u<u0 检验统计量
x z ~ N (0,1) / n

(总体方差已知)
(总体方差未知) 显著性水平为α是的拒绝法则为: 若 z z ,则拒绝H0

3.决策中的假设检验:在上述两种情形 中,如果拒绝H0则必须采取措施。然而, 当面对分别与原假设和备选假设相联系 的措施,决策者必须在二者间做出选择, 在这种情况下,无论是否拒绝H0,都必 须采取某种措施。

关于假设形式的总结 假设检验:双侧检验和单侧检验 双侧检验:H0: 0 Ha: 0 单侧检验:H0: 0 或 Ha: 或



假定级别总体近似服从正态分布,试问 在显著水平5%下,该机场能否被命名为 高水平服务水准机场。(高水平服务水 准机场的标准是评分等级超过7.) 由题意有,u0=7,x=7.75,n=12,s=1.125 设定假设命题有: H0:u≤u0;Ha:u>u0 由命题可知,该假设 检验为右侧检验。



在这个例子中,当H0为真时而拒绝了H0,表 明这种新型喷射器实际上不比目前所用的喷射 器好,但却错误认为这种新型的喷射器提高了 每加仑燃料的功效,那么此时发生了第一类错 误。 若当H0为假时而接受了H0,表明这种新型喷 射器实际上比目前所用的喷射器好,但错误认 为这种喷射器没有提高每加仑燃料的功效,则 此时发生了第二类错误。
若|z|>1.96,则该事件发生是小概率事件,(因为 有:P(|z|>1.96)=α=0.05)那么我们认为不会发 生,因此我们拒绝原假设。接受备选假设。 计算得到z=2.7,因此我们拒绝原假设。


拒绝域 α/2
拒绝域 α/2
0 -1.96 1.96
z



注意到:假设检验涉及到小概率事件的标准, 多小的概率算不可能出现? 在上例中,小概率事件的出现以0.05为 标准, 这一标准我们称为显著水平,用α表示。 由于确定了显著水平,我们相应的可以确定假 设检验的临界值,上例中的临界值为1.96和1.96。这里出现了双侧临界值的情况。
H0为真 接受H0 拒绝H0 结论正确 第一类错误 (弃真)
H0为假 第二类错误 (纳伪) 结论正确
例如:某汽车生产研究小组设计了一种 能提高汽车油料效能的新的燃料喷射器。 目前旧型喷射器的效能为24公里每加仑, 设定的假设检验如下: H0:u<=24 Ha: u>24 由Ha表明,我们将试图找出的结论放入备 选假设。



第一类错误发生的概率为α,即检验的显 著性水平。一般设置为0.05和0.01。 在发生第一类错误概率较小时,如果拒 绝原假设H0,则我们可以很大的程度相 信关于拒绝原假设的结论是正确的。 在这种情况下,统计上支持我们做出H0 为假,而Ha为真的结论。即拒绝原假设 总有较大的把握。


第二类错误发生的概率为β:它是把来自 θ=θ1(θ1≠θ0)的总体的样本值代入检验统计量 所得结果落入接受域的概率。 在绝大多数的假设检验运用中,一般都只对第 一类错误进行控制,而通常不对第二类错误加 以控制。由于第二类错误发生的不稳定性,我 们一般采用“不能拒绝H0”而不采用“接受H0” 的说法。采用“不能拒绝H0”的说法使我们避 免了犯第二类错误的风险。因此,我们往往把 要否定的陈述作为原假设,而把拟采纳的陈述 本身作为备择假设。
0
0 0
表达式中的等号总是出现在原假设中,在选择原假设 或备选假设时,应将试图建立的结果设定为备选 假设。
第一类错误和第二类错误



原假设和备选假设是关于总体的两个对 立的解释。二者之中有且仅有一个是正 确的。 因为假设检验是建立在样本数据基础上 的,因此得出来的结论不一定百分百正 确,存在发生错误的可能。 存在两种错误:第一类错误和第二类错 误


在原假设为真的前提下考虑某统计量 的一次实现值,若该值的出现是一个 小概率事件,则表明原假设成立的前 提是不正确的,从而拒绝原假设。 一般认为,小概率事件在一次试验中 不可能出现,可以忽略不计。若原假 设成立的情况下,由样本的统计量的 出现是小概率事件,则拒绝原假设。


假定已知某总体服从正态分布,其标准差为2,但 不知其均值。现有人认为其均值为3,抽取一个容 量为36的样本,得到样本平均值为3.9 H 原假设H 0: 3 ;备选假设: a: 3 假定H0成立,则有, x 3 z ~ N (0,1) 2 / 36
正常的原假设。 因此统计上能够支持对包装机运作不正常采取的 措施。


2.关于双侧检验的P值: 在双侧检验中,p值为分布一侧面积的两 倍。据测我们可以将P值与α直接比较。 如果不是将一侧面积的两倍取为P值,那 么必须另行建立基于一侧面积α/2的关于 p值的拒绝规则置信水平1-α下的区间估计/显著水平为α的 假设检验

n
x 0 z / 2

n
所以,若x落在不拒绝区域内,则u0必被包 含在置信区间内。即:检验统计量的值落在 不拒绝域内,与置信区间包含总体参数是等 价的。因此,我们有以下的用置信区间进行 假设检验的形式。


假设H0:u=u0;Ha:u≠u0 我们可以通过计算置信区间来判断是否拒 绝或不拒绝原假设。 计算1-α置信水平下的估计区间:
x t s/ n

显著性水平为α时的拒绝法则为: t t

(3)双侧 假设 H0: u=u0,Ha:u≠u0 检验统计量为:
x t s/ n

显著性水平为α时的拒绝法则为: | t | t /2


国际航空运输联合会通过调查商务旅行 者来评定跨太平洋通道的机场等级,最 大可为10.限选取12名商务旅行者作为一 简单随机样本,要求他们对伦敦的 heathrow国际机场评定等级,得到的数 据分别为: 7,8,10,8,6,9,6,7,7,8,9, 8
总体均值的单侧检验:大样本

HILLTOP咖啡的标签上表明其重量至少为3 磅,今抽取36听咖啡组成一样本,检测其 平均质量,得到x=2.92磅。由以前的研究 结果已知总体的标准差为 =0.18,选定α =0.01,检验标签上的重量说明。

H0: u≥3 Ha: u<3 检验统计量为:
总体均值的检验:小样本情形 且总体方差未知



1.检验的形式(样本来自正态总体) (1)左侧 假设 H0:u≥u0,Ha:u<u0 检验统计量为 x t s/ n 显著性水平为α时的拒绝法则为:若

t t
则拒绝H0

(2)右侧 假设 H0: u≤u0,Ha:u>u0 检验统计量为:
假设检验
x 0 P(| | z / 2 ) / n
区间估计
x P(| | z / 2 ) 1 / n
估计区间: x z / 2

n
不拒绝区域:0 z / 2

n

因为有:

n 0 x z / 2
相关文档
最新文档