第八章+假设检验
假设检验一般概念
x 400 k 时接受原假设H0;
(1)
x 400 k 时拒绝原假设H0接受备择假设H1
(2)
进一步,由于当H0为真时,有
u x400 ~N(0,1) 25/ n
1 |u|要构x造一40个0具有明确k分布的统计量,可将(1)、(2)式转化为
25/ n 25/ n
2 |u|时接x受原40假0设H0 k
2. 拒绝域与接受域 称是检验水平或显著性水平,它是我们
制定检验标准的重要依据。常数u/2把标准正态分布密度曲线下
的区域分成了两大部分,其中一部分
(x1,x2, ,xn)uu/2
称为H0的拒绝域或否定域, 当样本点落入拒绝域时,我们便拒 绝原假设H0(同前述(6)式),另一部分
(x1,x2, ,xn)uu/2
(1)根据问题的要求提出假设,写明原假设H0和备择假设H1的
具体内容。
(2)根据H0的内容,建立(或选取)检验统计量并确定其分布。 (3)对给定(或选定)的显著性水平 ,由统计量的分布查表 或计算确定出临界值,进而得到H0的拒绝域和接受域。
(4)由样本观察值计算出统计量的值。
(5)做出推断:当统计量的值满足“接受H0的条件”时就接受 H0,否则就拒绝H0接受H1 。
u
2
时接受原假设H0 (5)
时拒绝原假设H0,接受备择假设 H1 (6)
分析(5)、(6)两式,可以这 样认为:
拒绝H0,是因为以H0成立 为出发点进行推理时,得到 了不合情理的结论,使小概 率事件在一次试验中发生了。
接受H0,是因为以H0成立 为出发点进行推理时,未发 现异常。
这就是带有概率特征的反证 法,认为小概率事件在一次 试验中不可能发生。
H0:X服从泊松分布;H1:X不服从泊松分布.
第八章 假设检验
规定显著性水平
(significant level) ❖ 什么是显著性水平? ❖ 1. 是一个概率值
❖ 2. 原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域
❖ 3. 表示为 (alpha)
常用的 值有0.01, 0.05, 0.10
❖ 4. 由研究者事先确定
作出统计决策
3. 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它
4. 总是有符号 , 或
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
备择假设
(alternative hypothesis)
1. 也称“研究假设”,研究者想收集证据予以支持的 假设(期望出现的结论作为备选假设),用H1或Ha表 示
学习目标
假设检验的基本思想和原理 假设检验的步骤 一个总体参数的检验 两个总体参数的检验 P值的计算与应用 用Excel进行检验
正常人的平均体温是37oC吗?
37.1 36.9 36.9 37.1 36.4
➢ 当问起健康的 成年人体温是
36.9
36.6
36.2
36.7
36.9
多 少 时 , 多 数 37.6 36.7 37.3 36.9 36.4
的饮料容量是否符合标准要求?
双侧检验
总体均值的检验( 2 已知)
(例题分析-大样本)
❖ H0 : = 255 ❖ H1 : 255 ❖ = 0.05
❖ n = 40 ❖ 临界值(c):
拒绝 H0
0.025
拒绝 H0
0.025
-1.96 0 1.96 z
检验统计量:
zx0 25.852551.01 n 5 40
第8章假设检验
双侧检验的P 值
/2
拒绝H0
1/2 P 值
/2
拒绝H0
1/2 P 值
临界值 0
样本统计量计算值
Z
临界值
样本统计量计算值
8 - 32
P值 2P(Z 样本统计量计算值 )
统计学
STATISTICS
(第三版)
左侧检验的P 值
置信水平
拒绝H0
P值
1 -
临界值
0
z
P值 P(Z 样本统计量计算值)
证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设
解:研究者抽检的意图是倾向于证
实这种洗涤剂的平均净含量并不符
绿叶 洗涤剂
合说明书中的陈述 。建立的原假设
和备择假设为
H0 : 500 H1 : < 500
8 - 15
500g
统计学
STATISTICS
(第三版)
提出假设
(例题分析)
8 -3
统计学
STATISTICS
(第三版)
8.1 假设检验的基本问题
8.1.1 假设检验及其基本思想
8.1.2 原假设与备择假设
8.1.3 双侧检验与单侧检验
与教
材有
8.1.4 检验统计量与拒绝域
所不
8.1.5 利用P值进行决策
同
8.1.6 假设检验中的两类错误
8.1.7 假设检验的基本步骤
8 -4
8 - 12
统计学
STATISTICS
(第三版)
提出假设
(一般原则)
1. 首先根据研究目的确定两个对立的命题
2. 常常采取“不轻易否定原假设”的原则
第八章 假设检验
广 东 工 业 大 学
上页
下页
返回
1、原假设与备择假设 H0 2、原理
H1
小概率原理:小概率事件在一次试验中是不太会发生的。 (1)提出假设 H 0 (2)在假设 H 0 成立的条件下,构造一个小概率事件A, (3)根据样本值判断:
若在这一次试验中小概率事件A发生了,则拒绝假设 H 0 ,
若在这一次试验中小概率事件A未发生,则接受假设 H 0 .
广 东 工 业 大 学
上页
下页
返回
显著性水平 3、接受域与拒绝域
P{ A} P{样本落入区域 } R
拒绝域: R 接受域: R 4、两类错误
第一类错误: 弃真
小概率
样本点落入R:拒绝 H 0
样本点落入 R : 接受 H 0
犯第一类错误的概率:
H 0 正确,但拒绝了它。
第二类错误: 采伪
工 业 大 学
上页
下页
返回
二、假设检验的思想方法 假设检验的基本思想实质上是带有某种概率性质的反证 法。为了检验一个假设是否正确,首先假设该假设正确,然 后根据抽取到的样本对假设作出接受或拒绝的决策。如果样 本观察值导致了不合理的现象发生,就应拒绝假设,否则应 该接受假设。
假设检验中所谓“不合理”,并非逻辑中的绝对矛盾,而 是基于人们的实践活动中广泛采用的原则,即小概率事件在一 次试验中是几乎不发生的。但概率小到什么程度才能算作“小 概率事件”?显然,“小概率事件”的概率越小,否定原假设 就越有说服力。 广
上页
广 东 工 业 大 学
下页
返回
例1 某砖厂生产的砖其抗拉强度X服从正态分布 N ( ,1.21) ,今从 该厂产品中随机抽取6块,测得其平均抗拉强度为31.13.试检验 这批砖的平均抗拉强度为32.5是否成立,取显著性水平 0.05. 解: 提出原假设 H 0 : 0 32.5 双边检验: 单边检验:
第八章 假设检验
(一)问题的提出
例1.1 体重指数BMI是目前国际上常用的衡量人体胖 瘦程度以及是否健康的一个标准. 专家指出, 健康 成年人的BMI 取值应在 18.55- 24.99 之间.某种 减肥药广告宣称, 连续使用该种减肥药一个星期便 可达到减肥的效果.为了检验其说法是否可靠,随机 抽取9位试验者(要求BMI 指数超过25,年龄在20-25 岁女生),
x 0.522 0.465, 依然拒绝H0;
那么,拒绝H0的最小的值 是多少?最小的显 著水平又是多少?
(一)问题的提出
先让每位女生记录没有服用减肥药前的体重, 然后 让每位女生服用该减肥药, 服药期间, 要求每位女 生保持正常的饮食习惯, 连续服用该减肥药1周后, 再次记录各自的体重.测得服减肥药前后的体重差 值X(服药前体重-服药后体重) (单位: kg): 1.5,0.6,-0.3,1.1,-0.8,0,2.2,-1.0,1.4 设X~N(μ,0.36), μ未知,根据目前的样本资料能否 认为该减肥药广告中的宣称是可靠的?
n i1
Xi
~
N(,
1 ), n
H0 : 0, H1 : 1( 0 ), 拒绝域:X c.
P1 (X c)
P0 (X c)
0
c
1
犯两类错误的 概率相互制约
11
例1.1中,犯第I类错误的概率
(c) P{拒绝H0|H0是真的} P{X c| 0}
P{ X c | 0} / n / n
例1.2 一种饼干的包装盒上标注净重200g,假 设包装盒的重量为定值,且设饼干净重服从N (μ,σ2), μ, σ2均未知.现从货架上取来3盒,称 得毛重(单位:g)为 233,215,221,根据这 些数据是否可以认为这种包装饼干的标准差超 过6g?
概率论与数理统计第八章假设检验
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
统计学-第八章 假设检验
假设 原假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : m =m0 H0 : m m0 H0 : m m0
备择假设 H1 : m ≠m0 H1 : m <m0 H1 : m >m0
三、假设检验的程序---
4.例题分析
[例8.1] 某品牌洗衣粉在它的产品说明书中声称:平 均净含量不少于1250克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造商 的说明是否属实。试写出用于检验的原假设与备择假设。
2.接受域:概率P>的区域,为大概率区域,称之 为原假设的接受区域。
3.拒绝域:概率P≤的区域,为小概率区域,称之 为原假设的拒绝区域。
三、假设检验的程序---
1.拒绝原假设H1 原则:临界值
2.接受原假设H0 原则:临界值
检验统计值的绝 对值大于临界值;
检验统计值的绝 对值小于临界值;
假设 H0为真实 H0为不真实
接受H0 判断正确
采伪错误()
拒绝H0 弃真错误()
判断正确
四、假设检验中的两类错误
第I类()错误和第II类()错误的关系
和的关系就像 翘翘板,小就 大, 大就小。
你要同时减少两类 错误的惟一办法是 增加样本容量!
关乎决策:三个与其
与其,人为地把显著性水平固定按某一水平上,不 如干脆选取检验统计量的P值;
第二节 一个正态总体的假设检验
二、均值m的假设检验
3.给出显著性水平(0.01、0.05或0.1)
4.确定接受域和拒绝域(以双侧检验为例)
2已知:当Z Z 2
,则拒绝原假设,反之则接受H0;
第八章假设检验
查表得 z0.05 1.645,
于是
| x
/
0
n
|
0.516
z0.05
1.645
故接受 H0 , 认为该机器工作正常.
例2 公司从生产商购买牛奶.公司怀疑生产商在 牛奶中掺水以谋利. 通过测定牛奶的冰点,可以检 验出牛奶是否掺水.天然牛奶的冰点温度近似服从
单个正态总体方差的假设检验
1. 为未知, 关于 2的检验( 2 检验)
设总体 X ~ N (, 2 ), , 2均为未知,
X1 , X 2 ,, X n 为来自总体 X 的样本, 要检验假设:
其中 0 为已知常数. 设显著性水平为 ,
因为 S 2 是 2 的无偏估计,
当H
例1 某切割机在正常工作时, 切割每段金属棒 的平均长度为10.5cm, 标准差是0.15cm, 今从一批 产品中随机的抽取15段进行测量, 其结果如下: 10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7 假定切割的长度 X 服从正态分布, 且标准差没
2ቤተ መጻሕፍቲ ባይዱ
2 1
/
2
(n
1)
H1 : 0 (即设牛奶已掺水)
这是右边检验问题,其拒绝域为
z
x
0
n
z0.05
1.645.
现在
z
0.535
(0.545) 2.7951
1.645,
0.008 5
z的值落在拒绝域中, 所以我们在显著性水平
第八章 假设检验
x z2
x z2 /
s n
上例,我们用求置信区间的方法,来判断 原假设是否合理。 大样本下满足中心极限定理,样本均值的 抽样分布服从正态分布,从而有置信区间:
x z2 s 24 =986 1.96 n 40
假设检验的步骤
1.确定原假设和备选假设 2.选择检验统计量 3.指定检验的显著性水平 4.建立拒绝原假设的规则 5.收集样本数据,计算检验统计量的值 6.将检验统计量的值域拒绝规则的临界值比较, 以决定是否拒绝原假设。或者,由检验统计量 的值计算p值,利用p值确定是否拒绝原假设。
x 2.92 3 z 2.67 / n 0.18 / 6
x z ~ N (0,1) / n
根据显著性水平α=0.01,对应的拒绝域面积为 0.01,临界值为-2.33 Z<-2.33,所以拒绝H0,即可认为没听咖啡的容量 不足3磅。 统计证据支持对HILLTOP咖啡重量不足采取投诉措 施。
(978.56,993.44)该区间不包含u0=1000, 因此我们拒绝原假设H0.检验表明,该包 装机未能正常工作。
总体均值的检验:小样本情形
小样本下,已知总体为正态分布,我们考 虑以下两种情况: 1.总体方差已知 2.总体方差未知 在总体方差已知的情况下,即使样本容量 较小,但样本平均数的抽样分布总是以平 均值 为均值,以 x 为标准差的正态分 布。因此其检验过程和检验统计量同大样 本情形。
拒绝域为α/2 拒绝域为α/2
z / 2
拒绝域
0
z / 2
第八章 假设检验
第八章 假设检验参数估计和假设检验是统计推断中的两类重要问题。
在前一章中我们讨论了用样本统计量来推断总体未知参数的方法—参数的点估计与区间估计,本章我们将讨论正态总体分布中的未知参数的假设检验以及总体分布函数的假设检验。
§8.1 假设检验的基本概念§8.1.1 问题的提出在实际工作中,我们经常要面对这样的问题:总体的分布函数的类型或分布函数中的一些参数是未知的,需要对总体分布函数的类型或分布函数中的未知参数提出某种"假设",然后通过已经获得的一个样本对提出的“假设”作出成立还是不成立的判断(或决策)。
为了介绍假设检验的基本思想,我们先来看一个例子:例8.1 某食品厂生产的罐头规定每听的标准重量为500克,这些罐头由一条生产线自动包装,在正常的情况下,由经验知道生产出的罐头重量(单位:克)服从正态分布N (500,22)。
质量管理中规定每隔一定时间要抽测5听罐头。
若某次抽测的5听罐头的重量为501,507,498,502,504(克),假定方差不变,这时我们是否可以得出生生产线运转正常(即这段时间生产的罐头的平均重量为500克)的判断呢?由题意知,罐头重量),2N(μ~X 2,记μ0=500,则要回答的问题是:μ=μ0吗? 我们可以先假定μ=μ0,并称之为待检假设或原假设,记为H 0:μ=μ0这个原假设可能成立也可能不成立。
当原假设不成立时,称μ的取值为备选假设,这里取“μ≠μ0”为备选假设,记为H 1:μ≠μ0所谓假设检验问题就是要利用样本提供给我们的信息,在原假设H 0与备选假设H 1之间作出拒绝哪一个、接受哪一个的判断,简称为H 0对H 1的检验问题。
在例8.1中,我们把问题归结成统计假设:H 0:μ=500,对H 1:μ≠500。
那么,如何来解决H 0对H 1的检验问题呢?由参数估计知,x 是μ的一个"好"估计量。
如果原假设H 0成立,即μ=500,那么,x 通常应很接近500,即|x -500|通常应很小;否则,就认为原假设H 0不成立,也即μ≠500。
第八章假设检验
若过分大,则有理由 怀疑H0的正确性
7/51
§8.1 假设检验
当观察值 x 满足 x 0
此即假定H0正确 时的小概率事件
/ n
k时, 拒绝假设 H0 ,
反之, 当观察值 x 满足
x 0
/ n
k时, 接受假设 H0 .
如何选取k呢,先看以下事实: 由于作出决策的依据是一个样本,当实际 上H0为真时,仍可能作出拒绝H0的决策,这种 可能性是无法消除的,这是一种错误。
24/51
第八章 假设检验
§8.1 假设检验 §8.2 正态总体均值的假设检验 §8.3 正态总体方差的假设检验
§8.6 分布拟合检验
25/51
§8.2 正态总体均值的假设检验
假设检验是针对弃真这一可能犯的错误人为设定一个界限, 如果在这个界限内,认为原假设成立,否则的话,由于显 著性水平取得很小,表明小概率事件发生,根据实际推断 原理,原假设不成立。 尽管也可能犯第II类取伪的错误,这时尽管总体的性质发 生了改变但没有发现,往往影响较小。 正态总体均值的检验分为三种情况
/ n
若|z|= X 0 k,则称 x 与μ0的差异是显著的,以至
于小概率事件发生了,这时拒绝H0, 否则则称 x与μ0的差异是不显著的,这时接受H0, 选定的数α称为显著性水平,在α下对显著性判断
X 0 统计量Z= 称为检验统计量 / n
13/51
/ n
§8.1 假设检验
假设检验的相关定义: 像上例中的假设检验问题可叙述成: “在显著性水平α下,检验假设H0:μ=μ0,H1:μ≠μ0” 或“在显著性水平α下,针对H1检验H0”
例如:提出总体期望服从泊松分布的假设,然后进行判断 提出正态总体期望为μ0的假设,然后进行判断
第8章 假设检验
例 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的 和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的 频数将以比例9:3:3:1发生。在检验这个理论时,孟德 尔分别得到频数315、101、108、32、这些数据提供充分 证据拒绝该理论吗?
P PH0 | Z || z0 | 2PH0 Z | z0 | 2(1 (| z0 |))
(即z0代替了拒绝域式中的z 2 )
判断:当P小于显著水平时,拒绝原假设,
否则,接受: 0, H1 : 0 , 其中0是已知的常数
以X 作为的参考, 若H0为真,X比0大些,但
这个批次清漆的干燥时间构成的总体方差可设 2 0.36 而其均值是要求我们检验的!
经计算,现抽取的9个数据的平均值x 6.4小时,
现在的问题是,我们能否认为 "6.4 6.0 0" ?
即,接受以下哪个假设?
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
4
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
16
*另外方法:若给定显著性水平, 当原假设成立时
( 0),总体X ~ N (0, 2 ),因此,X ~ N (0, 2 n )
P0 ( X 0
k)
P 0
(
X
0
n
k
设
)
n
k
n z /2
k z/2 n
1
一般,H
的拒绝域写为:
第八章 假设检验
II型()错误
(一)I 型错误(Type I Error)
定义:Ho正确时,因检验值落入拒绝区而 未接受Ho所犯的错误。
Z
Ho: 1=2
错误
1 2
SEDX
Z
-1.96σ
0
1.96σ
(二)II 型错误(Type II Error)
定义:Ho不正确时,因检验值落入接受区
使用:结果或方向不确定时。
意义:只推断有无差异,不断言方向。
|Z|(CR)
<1.96 ≥1.96 ≥2.58
P值
>0.05 ≤0.05 ≤0.01
显著性
不显著 显著 极显著
符号
* **
(二)单尾(侧)检验
定义:拒绝性概率置于理论分布一尾。
使用:结果或方向确定时。 意义:既推断有无差异,又断言方向。 类型 右尾检验 左尾检验
解释
直观分析法 理论分析——小概率事件
直观分析
D=.95 接受Ho区域
.025 2
-1.96 σ -1σ
.025 2
1σ
1.96 σ
拒绝Ho区域
0.05
直观分析
接受Ho区域
.005 2
.005 2
-2.58 σ
概率论第八章
n = 15, x = 10.48, α = 0.05, s = 0.237, 查表得 tα / 2 ( n 1) = t0.025 (14) = 2.1448
x 0 10.48 10.5 ≈ 0.327 ∈ (2.1448 , 2.1448) t= = s / n 0.237 / 15
故接受 H 0 , 认为金属棒的平均长度 无显著变化 .
故接受 H 0 , 认为该机工作正常 .
二. σ 未知
2
步骤: 、 步骤:1、提出假设 H0 : = 0 H1 : ≠ 0
X 0 ~ t(n 1) 2、H0成立时,选用检验统计量 T = 、 成立时, S n
3、对于给定的显著性水平 α ,由 P{ T > tα } = α 、 由此得到拒绝域W; 查表确定临界值 tα (n 1) ,由此得到拒绝域 ;
(n 1)S2
σ
2 0
~ χ 2 (n 1),
(n 1)S2 α (n 1)S2 α P ≤ k1 = , P ≥ k2 = , 2 2 2 σ0 2 σ0
P {拒绝H 0 | H 0为真} = P {小概率事件 A | H 0为真} = α
(2) 当原假设 H0 不真 而观察值却落入接受域 不真, 而观察值却落入接受域, 的判断, 称做第二类错误 第二类错误, 而作出了接受 H0 的判断 称做第二类错误 又叫 取伪错误, 取伪错误 犯第二类错误的概率记为
2 1 2 2
,
当H 0为真时 , t ~ t ( n1 + n2 2).
由P
1 2 =δ
{ t ≥ k} = α
( x y) δ
得 k = tα / 2 ( n1 + n2 2).
故拒绝域为
张厚粲 第八章 假设检验
果的预期。H1:μ1≠μ0
后者称之为虚无假设(零假设),用H0表示,意为实 际上什么也没有发生,我们预期的差异、处理效果都不存
在。
H 0 : μ 1 =μ 0
备择假设与虚无假设有时没有方向性,我们只是关注 二者是否不同,比如“A与B之间存在(不存在)显著差 异”。而有时具有方向性,比如“A显著大于B”。
拒绝H0
α型错误
正确
I型错误
注:1.好的检验能在样本容量n一定的情况,较少犯两类错误的 概率,即α β都较小。但是α不能过低,过低,意味着β增大。
2. 实际运用中,控制Ⅰ型错误( α ),这就是显著性检验。
3.把错误概率控制在统计学允许的范围内,所作的推论或判 断近似为真
3.两类错误的关系
(1) α +β不一定等于1
二、决策标准(显著性水平α、观测概率Р)
1.显著性水平α( α =0.05; α =0.01; α =0.0001)
被选作拒绝零假设的基础的临界概率,即犯错误的 概率。如果零假设为真的概率小于或等于α,则拒绝零假 设;如果零假设为真的概率大于α,则接受零假设。 2.观测概率Р
P 随机误差导致的概率
则配对,分别给以两种不同的处理。
(二)检验目的
检验两相关样本均数所代表的未知总体均数是否有差 别。 (三)应用条件 适用于配对设计的计量资料均数的比较。 1、配对设计的数据一一对应。 2、差值 d 变量服从正态分布。 (四)检验统计量 t 的公式
Sd ( d )2 d n n1
2
d d d 0 d t n1 Sd Sd n Sd n
1.弃真错误(Ⅰ型错误):零假设( H0 )本来是
可能原因: 样本中有极端值;显著性水平的取值。
第八章假设检验
需要考虑因素
1. 总体方差是否已知
2. 总体分布是否正态
3. 样本容量大小
4. 双侧检验还是单侧检验 5. 右侧还是左侧
二、平均数的显著性检验的种类
• (一)总体正态分布,总体方差已知(Z)
• (二)总体正态,总体方差未知(t) • (三)总体非正态分布,大样本(Z′)
(一)总体正态分布,总体方差已知
H:1 0 新的教学法与原来的教学法无显著差异 0 H:1 0 新的教学法比原来的教学法差 0 H:1 0 新的教学法比原来的教学法好 0
假设检验的原理
• 费舍:“可以说,每一实验的存在,仅仅 是为了给事实一个反驳虚无假设的机会。”
二、假设检验中的小概率事件
• 样本统计量的值(随机事件)在其抽样分 布上出现的概率小于或等于事先规定的水 平,这时,就认为小概率事件发生了。
差异原因——误差
• 偶然误差:由于随机抽样引起的差异。
• 系统误差 :的确存在差异。
如何检验
Z X 0
X
N (0,1)
11 X 2.008 n 30 Z X 0
0
X
84 79 2.49 2.008
2
0.05, Z 0.05 1.96 0.01, Z 0.01 2.58
SE X
0
n
X 0 Z SE X
例1
• 某小学采用一种实验教材,使用一年以后, 随机抽取10名学生进行测试,得到平均成 绩82分。而过去使用旧教材的全体学生的 平均成绩为77分,标准差为5分,问实验教 材与旧教材的效果有无显著性差异?
例2
• 某地区统考数学,假设该统考数学成绩服 从正态分布,已知其总平均分为50分,标 准差为12分。从该地区随机选择一个班作 为样本,该班有学生50人,经计算该班平 均成绩为53分,试问该班成绩与总成绩的 差异是否显著。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
假设检验是统计推断的另一类重要组成部分.它分为参数 假设检验与非参数假设检验.
√参数假设检验是对总体分布函数中的未知参数提出某种
假设, 然后利用样本提供的信息对所提出的假设进行检验, 根据检验的结果对所提出的假设作出拒绝或接受的判断.
非参数假设检验是对总体分布函数的形式或总体的性质 提出某种假设进行的检验.
o 两类错误
由于抽样的随机性, 由上述检验方法作出拒绝H0 或不拒 绝H0的判断, 有可能犯以下两类错误:
记: =P{第一类错误}=P{拒绝H0 | H0真} =P{第二类错误}=P{接受H0 | H0伪}
显著水平
当然,我们希望犯两类错误的概率都尽可能的小, 最好都为 零. 但当样本容量固定时是不可能的. 在实际问题中, 通常的
绝域,则拒绝 H0 ,否则接受H0 .
说明:关于检验标准(显著水平):
(1) 一般说来,我们给定的假设H0 是经过周密调查和考虑的, 所以否定H0 要谨慎, 这就要求取得要小些,反过来,也表明小概 率取的越小,一旦否定H0 , 就越有说服力.
(2)检验标准可以取值不同, 就决定着不同的否定域, 因此 对于同一组样本值 (x1,x2,…xn) 来说,可以得到相反的决策.
(3)只对犯第I类错误的概率加以控制,而不考虑犯第II类错 误的检验问题, 称为显著性检验问题.
(设显著水平为 =0.05)
解 (1)建立假设 H0 : 0 0.5, H1 : 0; 1.96 (2)取检验统计量 z X 0 ~ N (0,1) n (3)拒绝域为: | z | z / 2 z0.025 1.96 ( =0.05) (4)计算得 | z | x 0 2.2 n
(2)判断“假设” 的根据是 “实际推断原理”;
(3) 建立一个检验法的关键: 选一个合适的统计量,依此构造一个小概率事件
r参数的假设检验问题的基本步骤:
1. 根据实际问题的要求, 提出原假设H0 及备择假设H1; 2. 确定检验统计量,并在原假设H0成立的前提下导出统计量的 分布;
3. 给定显著水平 , 根据统计量的分布求出拒绝域; 4. 决策: 将样本值代入统计量,若统计量的值落入拒
8.1.2 假设检验的基本思想
假设检验的基本思想实质上是带有某种概率性质的反证法. 为了检验一个假设H0是否正确, 首先假定该假设H0正确, 然后根 据抽到的样本对假设H0作出接收或拒绝的决策.如果样本观察值 导致了不合理的现象发生, 就应拒绝假设H0 ,否则应接受假设H0.
如何对一个假设进行判断(检验)呢?我们需要制定一个 判断“规则”,使得根据每个样本值都能做出接受还是拒绝原 假设的决定.
X
/
0
n
落在 (
, z
2 ] [z
2 , )
区域, 就决策否定 H0 ,这个区域就叫否定(拒绝)域.
对于例1: 取 =0.05, z / 2 z0.025 1.96
0
0.5, n
9,
2 0
0.015,
xபைடு நூலகம்
0.511,
计算得: |z|=2.2>1.96, 从而拒绝H0 ,即认为包装机工作不正常. (“小概率事件”发生了)
检验规则的制定常常是通过如下办法实现的:从具体问题
的直观背景出发,构造适用于所提出的假设的统计量(把样
本所含的信息集中起来),并以此统计量来作判断(检验).
o 判断“假设”的根据?-----实际推断原理
由于要检验的假设涉及总体均值 ,故首先想到是否可
借助样本均值这一统计量来进行判断.
由于X 是 的无偏估计量, 如果H0成立, 即 =0,
z X 0 ~ N (0,1)
/ n
当H0成立时,
x 0 n
z
2
是概率为
的小概率事件.
由实际推断原理知, 小概率事件在一次试验中实际上几
乎是不可能发生的, 而现在居然在一次抽样试验中发生了.
这表明“假设H0成立”是错误的, 因此我们拒绝H0. 反之,
我们没有理由拒绝H0.
即:
统计量 z
则 x与0的偏差 x 0 一般不应太大,若 x 0 过分大,
就怀疑H0的正确性而拒绝H0.
而衡量 x 0 的大小可归结为衡量
所以可适当选定一正数k, 使当观察值
就拒绝假设H0 ,反之,若
x 0 / n
x 0 的大小,
/ n
x 满足
x 0
k时,
/ n
k ,就接受假设H0.
为了确定常数 k,我们考虑统计量,当H0成立时,
现在的问题是,如何根据样本观察值来判断总体的均值 是否等于0 ( 0 =0.5). 为此我们提出假设
H0 : =0=0.5 ----------称为原假设或零假设, H1 : 0 ----------称为备择假设(备选假设).
于是问题转化为判断 H0 是否成立. 我们要做的工作是根据 样本提供的信息作出接受H0 (拒绝H1)还是拒绝H0 (接受H1)的判 断.如果作出的判断是接受H0 ,即认为包装机工作正常,否则认 为包装机工作不正常。
参数假设检验与参数估计是从不同的角度推断总体分布 中的某些参数, 参数检验解决定性问题, 参数估计解决定 量问题.
8.1.1 问题的提出
由题意, 每袋糖重 X~ N( , 0.0152). 包装机正常工作是指 X~ N(0.5, 0.0152). 若重 X不服从N(0.5, 0.0152),就认为包装机不正 常工作. 换句话说,本题所要回答的问题是“ =0.5”成立吗?
故应拒绝H0,即认为包装机工作不正常.
•双边假设检验: H0 : 0, H1 : 0 •单边假设检验: H0 : 0, H1 : 0 右边检验
H0 : 0 , H1 : 0 左边检验
下面讨论单边检验的拒绝域
设总体X~N(, 2), 2为已知, x1 , x2 , …xn 是来自X的样本. 给定显著性水平 . 求下面检验问题(右边检验)的拒绝域.
做法是: 先限制犯第一类错误的概率,(显著性检验问题) 即根据实际情况, 指定一个较小的数 (如0.05,0.01等), 有了 的值, 就可以确定上述的数 k, 从而可确定拒绝域.
总结: 假设检验的基本思想:
(1) 假设检验的推理逻辑是一种反证法. 先给定一个统计假设, 即原假设 (零假设): H0:=0 并先假定它成立, 然后判断是接受还是拒绝它.