第七章假设检验

合集下载

第七章假设检验

5 2 1 c 0 .0 5 3
5 c 0 .9 7 5 3
5 3
c 1 .9 6

所以
c 1 . 176

总目录
上一页
下一页
返回
退出
§7.2 参数假设检验本节我们介绍母体ξ的分布是正态分布的几种显著性
{ ( x1 , x 2 , , x n ) : u ( x1 , x 2 , , x n ) u0 }
总目录上一页下一页返回退出
构造检验统计量
设则
U
1 , 2 , , 25
是取自母体ξ的一组子样，
x1 , x 2 , , x 25
是子样观测值
1500
51.5 53.5 5 3
总目录
上一页
下一页
返回
退出
t-检验例题7.3（3-2）
假设母体服从正态分布，
检验假设
H 0 : 0 65
H 1 : 0 65
由子样算得
Sn
*
x 4 5 .0 6
n
n 1
1
( xi x )
2
5 .8 1 8
i 1
给定显著水平α=0.05，查自由度为99的t分布表得
xiaobugs
第七章假设检验
第七章目录 §7.1 假设检验的基本思想和概念 §7.2 参数假设检验 §7.3 正态母体参数的置信区间 §7.4 非参数假设检验（简介） *§7.5 奈曼-皮尔逊基本引理和一致最优势检验（略）
总目录
上一页
下一页
返回
退出
§7.1 假设检验的基本思想和概念名词解释：

课程释疑7 第七章假设检验

并未受到控制，犯第二类错误的概率 β 并未受到控制，因此接受 H0 而犯错误的可能性无法预料。犯错误的可能性无法预料。
Байду номын сангаас
另一方面，另一方面，仅仅凭一次试验的结果没有被拒绝的假设从人们的心理上是不放心的，一般需要继续做试验，从人们的心理上是不放心的，一般需要继续做试验，重新取得数据作检验，根据多次试验的结果再作结论。新取得数据作检验，根据多次试验的结果再作结论。问8.3：同一问题及同一批数据,如使用不同的显著水平：同一问题及同一批数据, 其检验结果是否不同？其检验结果是否不同？不同的显著水平下，检验的结论可能是不同的。答：不同的显著水平下，检验的结论可能是不同的。下是不能拒绝的，例如可能在水平 α = 0.05下是不能拒绝的，而在下被拒绝。水平α = 0.10 下被拒绝。
问 8.4：一个显著水平 α 的检验的第一类错误概率与水：这两个概念有何差别？平 α ，这两个概念有何差别？这是两个不同的概念，答：这是两个不同的概念，第一类错误概率与具体的检验有关，检验，验有关，同一问题可以有不止一个水平α 检验，他们具有不同的第一类错误概率，但是有一个共同点，就是第有不同的第一类错误概率，但是有一个共同点，一类错误概率都不超过 α 。水平 α 则是所有可能的水检验的第一类错误概率的上界。平 α 检验的第一类错误概率的上界。因此水平α 与具体检验无关。检验无关。
第七章假设检验
问8.1：两类错误概率能否同时控制得很小？：两类错误概率能否同时控制得很小？固定时，做不到。一般地说，答：当样本容量 n 固定时，做不到。一般地说，当第小时，就显大，一类错误概率α 小时，第二类错误概率 β 就显大，
1 的检验为例：以下以正态总体 N (µ ，) 的参数 µ 的检验为例：

《概率论与数理统计》第七章假设检验.

《概率论与数理统计》第七章假设检验.第七章假设检验学习⽬标知识⽬标：理解假设检验的基本概念⼩概率原理；掌握假设检验的⽅法和步骤。

能⼒⽬标：能够作正态总体均值、⽐例的假设检验和两个正态总体的均值、⽐例之差的假设检验。

参数估计和假设检验是统计推断的两种形式，它们都是利⽤样本对总体进⾏某种推断，然⽽推断的⾓度不同。

参数估计是通过样本统计量来推断总体未知参数的取值范围，以及作出结论的可靠程度，总体参数在估计前是未知的。

⽽在假设检验中，则是预先对总体参数的取值提出⼀个假设，然后利⽤样本数据检验这个假设是否成⽴，如果成⽴，我们就接受这个假设，如果不成⽴就拒绝原假设。

当然由于样本的随机性，这种推断只能具有⼀定的可靠性。

本章介绍假设检验的基本概念，以及假设检验的⼀般步骤，然后重点介绍常⽤的参数检验⽅法。

由于篇幅的限制，⾮参数假设检验在这⾥就不作介绍了。

第⼀节假设检验的⼀般问题关键词：参数假设；检验统计量；接受域与拒绝域；假设检验的两类错误⼀、假设检验的基本概念（⼀）原假设和备择假设为了对假设检验的基本概念有⼀个直观的认识，不妨先看下⾯的例⼦。

例7.1 某⼚⽣产⼀种⽇光灯管，其寿命X 服从正态分布)200 ,(2µN ，从过去的⽣产经验看，灯管的平均寿命为1550=µ⼩时，。

现在采⽤新⼯艺后，在所⽣产的新灯管中抽取25只，测其平均寿命为1650⼩时。

问采⽤新⼯艺后，灯管的寿命是否有显著提⾼？这是⼀个均值的检验问题。

灯管的寿命有没有显著变化呢？这有两种可能：⼀种是没有什么变化。

即新⼯艺对均值没有影响，采⽤新⼯艺后，X 仍然服从)200 ,1550(2N 。

另⼀种情况可能是，新⼯艺的确使均值发⽣了显著性变化。

这样，1650=X 和15500=µ之间的差异就只能认为是采⽤新⼯艺的关系。

究竟是哪种情况与实际情况相符合，这需要作检验。

假如给定显著性⽔平05.0=α。

在上⾯的例⼦中，我们可以把涉及到的两种情况⽤统计假设的形式表⽰出来。

第7章假设检验

第七章假设检验实例：一项新的减肥产品在广告中声称：服用该产品的第一周内，参加者的体重平均至少可以减轻8磅。

现随机抽取40位服用该减肥产品的样本，结果显示：样本的体重平均减少7磅，标准差为3.2磅。

假定显著性水平为0.05.问：该广告是否是属实的？消费者该不该信赖它呢？有人说大学中男生的学习成绩比女生好。

现从一个学校中随机抽取了25名男生和16名女生，对他们进行同样题目的测试，测试结果表明，男生的平均成绩为82分，标准差为10分；女生的平均成绩为78分，标准差为7分。

假定显著性水平为0.05，问：调查数据能否支持该人的结论？回答这些问题我们需要进行假设检验！一、假设检验的基本问题（一）假设检验的定义假设检验—也称显著性检验，它是先对总体参数提出某种假设，然后利用样本信息判断假设是否成立的过程。

（二）假设检验的基本思想假设检验的基本思想即小概率事件原理。

小概率事件原理——即小概率事件在一次试验中是几乎不可能发生的。

也就是说，如果提出的总体的某个假设是真实的，那么不利于或不可能支持这一假设的小概率事件A在一次试验中几乎是不可能发生的，要是在一次试验中事件A发生了，我们就有理由怀疑这一假设的真实性，并拒绝这一假设。

（三）假设检验的基本形式假设：1、原假设：通常将研究者想收集证据予以反对的假设，也称为零假设，用H0表示。

2、备择假设：通常将研究者想收集证据予以支持的假设，或称为研究假设，用H1表示。

根据备择假设有无特定的方向，可将假设检验的形式分为双侧检验和单侧检验。

（1）双侧检验——备择假设没有特定的方向性，并含有符号“”的假设检验；（2）单侧检验——备择假设具有特定的方向性，并含有符号“<”或“>”的假设检验；在单侧检验中，根据研究者感兴趣的方向不同：左侧检验：研究者感兴趣的备择假设方向为“<”的假设检验；右侧检验：研究者感兴趣的备择假设方向为“>”的假设检验。

单侧检验单侧检验左侧检验右侧检验假设检验的表达式假设原假设备择假设双侧检验00:θθ=H 01:θθ≠H 00:θθ≥H 01:θθ<H 00:θθ≤H 01:θθ>H例1:消费者协会接到消费者投诉，指控某品牌纸包装茶叶存在重量不足，有欺骗消费者之嫌。

第七章假设检验

第七章假设检验第一节假设检验的基本知识一、假设陈述1、原假设/虚无假设：用H表示，常常是根据已有资料得出的，稳定、保守的经验性看法，没有充分根据是不会被推翻的。

2、备选假设/研究假设：与原假设对立的假设，用H1表示，经过抽样调查后，获得证据希望予以支持的假设。

二、假设检验的基本原理——小概率原理小概率原理：一次观察中小概率事件被认为不可能发生；如果一次观察出现了小概率事件，合理的想法应该是否定原有事件具有小概率的说法。

小概率原理在假设检验中的运用：抽取一个样本并计算出检验统计量，如果在原假设成立的条件下这个统计量几乎不可能发生，则拒绝原假设而接受备选假设。

反之，如果计算出的统计量发生的可能性不太小，则接受原假设。

即在原假设下，检验统计量是小概率事件则拒绝原假设。

例1：某市场有100位摊贩，根据以往统计，其中非本地居民占10%，现随机抽取10人调查，发现5个都不是本地人，则原有统计结果是否成立？解：H：100人中10个是非本地人。

计算在原假设成立的情况下，抽取5人都是非本地人的概率：P= C105 C905/C10010＜10-4可见，出现5名非本地人的结果概率极其小，但一次实验就出现了，所以怀疑原假设的真实性，拒绝原假设。

三、拒绝域与显著性水平1、显著性水平α，在原假设成立条件下，统计检验中规定的小概率的数量界限，常用的有α=0.10,0.05,0.01。

2、接受域和拒绝域根据原假设画出统计量的分布，以Z分布为例。

如果把拒绝原假设的小概率α事件定在分布的右侧尾部，则右侧面积代表的概率即显著性水平，Zα是临界值。

如果检验统计量值Z＞Zα，则应拒绝原假设；如Z＜Zα，则接受原假设。

以Zα为临界值，左边为接受域，右边为拒绝域。

也可把α定在左边或两边。

α1、双边检验如果拒绝域放在抽样分布的两侧，每侧拒绝域的概率分别为α/2，假设抽样本分布以0为对称，则P(|Z|＞Z α/2)= α；双边检验的假设如下：H 0: μ=μ0H 1: μ≠-Z α/2 Z α/2如果检验统计量|Z|＞Z α/2，则拒绝原假设，否则接受。

第七章假设检验

u
u，
大
概
率
事
件
在
一
次
试
验
中
发
生
，
肯
定
H
。
0
➢3型问题（右侧检验）
由关系式（ 7.2.1）和标准正态分布上侧分位
数定义，对于给定的，存在 u，使得
P
X
/
n
u
如果 H 0成立，即
，
0
则
有
U
X
0
/n
X / n
X
0
/n
u
u
2
P
0
/n
u
2
0
/ n
P
0
/n
u
2
0
/n
1 u 2
/
0
n
u 2
/
0
n
1 u
2
/
0
n
1 u
2
/
0
n
2u2
/ n0u2
/ n0
这表明该检验误的大两小类与错 0密切相关
➢2型问题（左侧检验）
由关系式（7.2.1）和标准正态分布下侧分位X /n Nhomakorabeau
P U
u
P
X
/
n
u
所以，如果检验统计量 U X 0 地实现 u满足 / n
u u，小概率事件在一次试验中发生，否定 H 0;
u
u，
大
概
率
事
件
在

第七章假设检验

k
,
n
也就是说,事件“|
U
|
z
”2
2
2
是一个小概率事件.
由标准正态分布的上分位点的定义知:
k z 2 ,
17
故可以取拒绝域为 W： | U | z 2
如果由样本值算得该统计量的实测值落
入区域W，则拒绝H0 ；否则，不能拒绝H0 .
这是因为，如果H0 是对的，那么衡量差异大小的某个统计量落入区域 W(拒绝域) 是个小概率事件. 如果该统计量的实测值落入 W，也就是说， H0 成立下的小概率事件发生了, 那么就认为H0不可信而否定它. 否则就不能否定H0 （只好接受它）.
n
体N (, 2 )的样本. 且设是已知常数.
12
现在要检验的假设是：
H0 : 0 (0 355),
它的对立假设是：
H1 : 0,
在实际工作中，往往把不轻易否定的命题作为原假设.
称H0为原假设（或零假设）；称H1为备选假设（或对立假设）. 那么，如何判断原假设H0 是否成立呢？
13
H0 : 新技术未提高效益，H1 : 新技术提高效益.
30
•假设检验 —基本概念
原把需要检验的
假假设称为原假
关于总体
假设
分布的某个命题
设设，记为H0.
备在拒绝原假设后,可供择选择的一个命题称为
假备择假设,它是原假设
设的对立假设，记为H1.
31
•假设检验 —基本概念
检验统计量用于判断原假设成立与否的统计量
P{第二类错误}= P{接受H0|H0不真}= .
26
•假设检验的两类错误
显著性水平为犯第一类错误的概率.

第7章假设检验

备择假设的方向为“<”，称为左侧检验备择假设的方向为“>”，称为右侧检验
双侧检验与单侧检验
(假设的形式)
单侧检验
左侧检验
H0 : 0
假设
双侧检验
H0 : = 0 H1 : ≠0
右侧检验
H0 : 0
原假设
备择假设
H1 : < 0 H1 : > 0
什么是假设检验?
(hypothesis test) 1. 先对总体的参数(或分布形式)提出某种假设，然后利用样本信息判断假设是否成立的过程 2. 有参数检验和非参数检验 3. 逻辑上运用反证法，统计上依据小概率原理
原假设
(null hypothesis) 1. 2. 3. 研究者想收集证据予以反对的假设又称“0假设” 总是有符号 , 或 4. 表示(0,1)
总体均值的检验( 2 已知)
(例题分析)
【例】一种罐装饮料采用自动生产线生产，每罐的容量是 255ml，标准差为 5ml 。为检验每罐容量是否符合要求，质检人员在某天生产的饮料中随机抽取了40罐进行检验，测得每罐平均容量为 255.8ml。取显著性水平 =0.05 ，检验该天生产的饮料容量是否符合标准要求？
两类错误与显著性水平
假设检验中的两类错误
1. 第Ⅰ类错误(弃真错误)
原假设为真时拒绝原假设第Ⅰ类错误的概率记为
被称为显著性水平
2. 第Ⅱ类错误(取伪错误)
原假设为假时未拒绝原假设第Ⅱ类错误的概率记为 (Beta)

假设检验中的两类错误
(决策结果)
H0: 无罪
0
临界值
样本统计量
决策规则
1. 给定显著性水平，查表得出相应的临界值 z或z/2， t或t/2 2. 将检验统计量的值与水平的临界值进行比较 3. 作出决策

第七章假设检验

因为，把好人关在牢里的概率很小
4、不原意相信“牢外面的人一定是好人”
未发现犯罪不意味着就是好人
注：有证据可以放心定性坏人，断定好人要慎重
4 December 2010
宁波工程学院
理学院
第七章假设检验
第15页 15页
三、选择显著性水平
假设检验中关键的小概率事件发生的概率α 称为该检验的显著性水平，简称水平。注：按照小概率事件原理进行统计推断自然可能犯错误。错误拒绝原假设 H 0 的概率为 α 。正确拒绝原假设 H 0 的可信度为1-α
宁波工程学院
理学院
第七章假设检验
第7页
问题分析（续）
(5) 对于随机试验中参数的假设检验问题称为参数假设检验问题否则称为非参数假设检验问题。例如：后面的聪明检验。 (6) 由样本去推断总体，判断差异是由总体由样本去推断总体，判断差异是变异引起，还是由于随机误差引起。这就变异引起，还是由于随机误差引起。这就是假设检验要解决的问题 (7) 参数估计和假设检验是二种不同的统计推断
4 December 2010
宁波工程学院
理学院
第七章假设检验
第23页 23页
显著性水平a 和拒绝域(左侧检验 )
H0成立时的抽样分布拒绝H0 置信水平
α
1-α
0
临界值
4 December 2010
观察到的样本统计量
宁波工程学院理学院
第七章假设检验
第24页 24页
显著性水平a和拒绝域(右侧检验 )
4 December 2010
宁波工程学院
理学院
第七章假设检验
第8页
通俗的例子（1）
实例：箱子中有黑球和白球，总数100个，但不知黑球白球各多少个。现提出假设H0：“箱子中有99个白球或白球占绝大部分”，暂时设 H0正确，那么从箱子中任取一球，得黑球的概率为0.01或很小，是一小概率事件。检验：今取一球，居然取到黑球，自然会使人对H0的正确性产生怀疑，从而否定H0。也就是说箱中不止1个黑球。问题：如果取到的是白球，说明什么？

第七章假设检验

|u| = x 0 2.2 1.96, 0 / n
于是根据小概率事件实际不可能性原理,拒绝假设 H0 ,
认为包装机工作不正常.
(2)若取定 0.01,
则 k u / 2 u0.005 2.58,
|u|= x 0 2.2 2.58, 于是 0 / n
接受假设 H0 , 认为包装机工作正常.
注:上述称为显著性水平.此例表明假设检验的结论与选取的显著性水平有密切的关系.所以,必须说明假设检验的结论是在怎样的显著水平下作出的.
ch3-8
2.假设检验的基本思想及推理方法
1)假设检验基本思想（1）在假设检验中，提出要求检验的假设，称为原假设或零假设，
记为 H0 ，原假设如果不成立，就要接受另一个假设，这另一个假设称为备择假设或对立假设，记为 H1 。（2）假设检验的依据——小概率原理：小概率事件在一次试验中实际上不会发生。（3）假设检验的思路是概率性质的反证法。即首先假设成立，然后根据一次抽样所得的样本值信息，若导致小概率事件发生，则拒绝原假设，否则接受原假设。
C3 12
p3 (1
p)9
0.0097
0.01
这是小概率事件 , 一般在一次试验中
是不会发生的, 现一次试验竟然发生, 故认
为原假设不成立, 即该批产品次品率p 0.04
则该批产品不能出厂.
P12 (1)
C1 12
p1 (1
p)11
0.306
0.3
ch3-12
这不是小概率事件,没理由拒绝原假设,
因为 X 是的无偏估计量，所以，若 H 0 为真，则 X 0 不ch应3-6X 太大， Nhomakorabea0
0 / n

第七章假设检验

5.9
7.5
方差分析：单因素方差分析
SUMMARY 组
职员家庭工人家庭农民家庭
计数 4 4 4
求和 32
25.6 24.8
平均
方差
8 1.766667
6.4
0.94
6.2
1
方差分析
差异源
SS
组间
7.786667
组内
11.12
总计
18.90667
df
MS
F
P-value F crit
2 3.893333 3.151079 0.091771 4.256492
Z x1 x2
S12

S
2 2
n1 n2
H0、H1 (1) H0：μ1 = μ2
H1：μ1 ≠ μ2 (2) H0：μ1 = μ2
H1：μ1 ＞ μ2
(3) H0：μ1 = μ2 H1：μ1 ＜ μ2
拒绝域

2
2
Z 0 Z z
2
2

z 0 Z

z Z 0
条件检验条件量
np≥5 nq≥5

Z p1 p2 pq pq n1 n2

p

n1
p1
n2
p2
n1 n2
(1) H0：P1=P2 H1：P1 ≠P2
(2) H0： P1 ≤P2 H1：P1 ＞ P2
(3) H0：P1 ≥P2 H1：P1 ＜P2
拒绝域

2
2
Z 0 Z z
2
2
z 0 Z
2 1 (n1)
条件检验条件量

第七章假设检验

二、率的χ2检验
结束
第四节均数的假设检验
第四节均数的假设检验
第四节均数的假设检验
第四节均数的假设检验
第四节均数的假设检验
第四节均数的假设检验
第四节均数的假设检验
第四节均数的假设检验
第五节标准差的假设检验
第五节标准差的假设检验
例1方差齐性检验
第六节率的假设检验
一、率的u检验二、率的χ2检验
第二节假设检验步骤
三、确定显著性水平求出临界值显著性水平，根据研究对象的性质、精度要求等具体情况确定，一般情况取0.05或0.01。当值确定后，根据检验所用的统计量表查出相应的临界值。四、检验结论以检验统计量与临界值的比较作出统计结论。如果检验统计量的值落在接受域内，接受无效假设，检验结论为差异无显著性；如果检验统计量的值落在拒绝域内，拒绝无效假设，检验结论为差异有显著性。将概率比较得出检验结论：当 P(H0) ＞检验结论为在水平上差异无显著性当 P(H0) ≤ 检验结论为在水平上差异有显著性

第三节单侧检验与双侧检验
第三节单侧检验与双侧检验
第三节单侧检验与双侧检验
单侧检验与双侧检验的异同相同点无效假设H0、计算统计量公式、判断差异是否具有显著性方法、犯第一类错误弃真的概率等均相同。不同点 (1)单检否定域在分布的一侧，双检否定域在分布的两侧； (2)单检的备择假设H1不能省，双检可以省； (3)单检临界值小于双检临界值，更易得出差异具有显著性的结论，且犯第二类错误纳伪的概率比双检小。
第七章
假设检验
比对----生物识别“以貌取人”
生物特征分为两大类：指纹、手形、面相、虹膜、视网膜、耳廓、脉搏、血管、DNA、骨骼等身体特征；签字、语音、行走步态等行为特征。

第7章假设检验

第七章假设检验
1．从1997年的新生婴儿中随机抽取20名，测得其平均体重为3180g ，样本标准差为300g ，而从过去的统计资料知，新生婴儿的平均体重为3140g ，问现在的新生婴儿的体重有否显著变化？()01.0=α
2．检查一批保险丝，抽取10根在通过强电流后熔化所需时间(s)为
42 , 65 , 75 , 78 , 59 , 71 , 57 , 68 , 54 , 55
问在05.0=α下能否认为这批保险丝的平均熔化时间不小于65s(设熔化时间服从正态分布)？
3．在同一炼钢炉上进行改进操作方法后确定其得率是否有所变化的试验，用原方法和改进后的新方法各炼了10炉，其得率分别为
原方法：78.1，72.4，76.2，74.3，77.4，78.4，76.0，75.5，76.7， 77.3
新方法：79.1，81.0，77.3，79.1，80.0，79.1，79.1，77.3，80.2，82.1
设两种方法得率相互独立且均服从同方差的正态分布，问新方法的得率是否有所提高()01.0=α？
7．某企业生产钢丝以往所得折断力的方差为25，现从某日产品中随机抽取10根检验折断力，得数据如下(单位：kg):
578，572, 570, 568, 572, 570, 570, 572, 596, 584
设折断力服从正态分布，试在显著性水平0.05下，问该日生产钢丝折断力的方差是否有显著变化？。

第七章假设检验的基本概念

差异
怎样确定c? 怎样确定 I类错误类错误——弃真错误，发生弃真错误，类错误弃真错误的概率为α 的概率为
•两类错误两类错误接受或拒绝H 接受或拒绝 0，都可能犯错误 II类错误纳伪错误，类错误——纳伪错误，发生纳伪错误类错误的概率为β 的概率为 H0非真检验决策 H0为真拒绝H 类错误（）拒绝 0 犯I类错误（α）正确类错误接受H 类错误（）接受 0 正确犯II类错误（β）类错误
乙种误差
纳伪的错误，又称第二类错误，是指H 纳伪的错误，又称第二类错误，是指 0 为假，但小概率事件没有发生，接受H 为假，但小概率事件没有发生，接受 0 即把假的当成真的，即把假的当成真的，它是在接受原假设时出现的错误。时出现的错误。犯乙种误差的概率为β 犯乙种误差的概率为β，β的数值随着真的原假设中µ 的偏离程度而变化，实 µ 的原假设中 µ 0 的偏离程度而变化， △µ=µ-µ0越小 β的数值就越大。 µ µ 越小,β的数值就越大。
总体某种假设）（某种假设）（接受）接受）小概率事件未发生
抽样检验
样本观察结果）（观察结果）（拒绝）拒绝）小概率事件发生
三、假设检验的基本形式
假设一般包括两部分：虚无假设HO和研究假设H1。虚无假设HO：又称原假设，零假设。是一种无差别假设，是一种已有的，具有稳定性的经验看法，没有充分根据，是不会被轻易否定的。研究假设H1 ：又称备择假设。是研究者所需证实的假设。
2
2
Zα
2
一端检验
又称单边检验，单尾检验。又称单边检验，单尾检验。如果我们关心的是不仅存在差异，如果我们关心的是不仅存在差异，而且还有差异的方向，就要选用一端检验。有差异的方向，就要选用一端检验。一端检验可分作右端检验和左端检验。一端检验可分作右端检验和左端检验。 H0：µ≥µ0 ，H1：µ＜µ0（左端检验）左端检验）＜ H0：µ≤µ0，H1：µ＞µ0 （右端检验）右端检验）＞

第七章假设检验(F检验与卡方检验)

• 例子：一次英语考试后，从两个学校分别随机抽取试卷数量n1=10，n2=9，求得的样本修正方差即总体方差估计值为S12=236，S22=63.36。问两校这次考试离散程度是否有显著差异？（α=0.05）
解答
2 (1)假设离散程度无显著性差异，即H 0 : 12 2
236 (2)计算统计量F 2 3.74 S 2 63.36 (3)df 1 n1 1 10 1 9 df 2 n2 1 9 1 8
• • 若自由度df=1，α=0.900，查2分布表可知P(2>0.02)=0.900 记20.900(1)=0.02
• 如df=5， α=0.05，查2分布表20.05(5)=？ • 如df=5， α=0.01，查2分布表20.01(5)=？ • 如df=10， α=0.05，查2分布表20.05(10)=？ p{2 > 2 tα(n)}= α
对平均数差异的显著性检验的理论前提是假设两个总体的方差是相同，或至少没有显著性差异。 Z检验和t检验对两个总体的方差是否有显著性差异所进行的检验称为方差齐性检验，即必须进行F检验。
F分布
• 若有两个服从正态分布的总体N1(μ1，σ1),N2(μ2，σ2)。检验σ1和σ2是否有显著性差异？ • 在方差分析中，需要检验某个因素是否对指标有显著的作用时需要F分布来解决。 • 设有两个总体X，Y，已知X~2(n1)，Y~2(n2)，并且 X与Y相互独立，则称随机变量F，所服从的分布为第一自由度为n1，第二自由度为n2的F分布，记为F~F (n1,n2)。
• (4)设X~ 2(n)，则2分布的期望值E(X)=n，D(X)=2n • (5) 2分布是连续型分布，但有些离散型的分布也近似于 2分布。

统计学第七章假设检验和非参数统计

4、计算T值：根据裁判的观察确定球的反弹角度为X
5、统计判断：当一名球员使用上肢之外的身体部分触球时，球的反弹角度为X的概率为0.03。由于0.03＜0.05，拒绝原假设，即认为球员A存在上肢触球。
在本例中，有3％的可能性发生弃真错误，即球员A没有上肢触球，但裁判作出了错误判断。
显著性水平α在这里决定了某一个结论能否被接受。
例题：
对24名儿童依次进行一项测试活动，获得下列分数序列：
31，23，36，43，41，44，12，26，43， 75，2，3，15，13，78，24，13，27，86，61， 13，7，6，8
转化成上下游程，为：－，＋，＋，－，＋，－，＋，＋，＋，－，＋，＋，－，＋，－，－，＋，＋，－，－，－，－，＋
二、确定适当的检验统计量T
检验统计量T是用于检验原假设是否成立的标准，在原假设成立的前提下，统计量T满足某种特征。
四、计算检验统计量T的值
根据检验中获得的数据，计算统计量T的值。
五、作出统计决策
根据T的取值特征，计算取该值的概率，如果此概率小于a，则拒绝原假设。
第一节检验原理
一、提出原假设（Null Hypothesis）和备择假设（Alternative Hypothesis）
建立原假设H0：P＋＝P－
计算两种符号的数量S＋和S－，利用二项分布计算S＋或S－出现的概率是否处于接受域。
在n>20的情况下，二项分布可以用正态分布进行近似：
符号检验中仍然没有利用总体的分布特征。
四、游程检验
游程检验又称连贯检验或串检验，用于考察一个序列中两种符号的出现次序是否随机。
本例，如果α变为0.15，这时当一名球员使用上肢之外的身体部分触球时，球的反弹角度为X的概率为0.10，就可以拒绝原假设，即认为球员A存在上肢触球。但如果α为0.05，在反弹角度为X的概率为0.10时，就要接受原假设。

第七章假设检验

SE X
例3的计算
n 1 20 1 X 0 16 15.6 t 1 SE X 0.4 当 0.05时, df 20 1 19时, ③判断结果：
0.4
t(19)0.05 2 2.093
因为1<2.093,所以,P>0.05，差异不显著。故该幼儿园4岁男童平均体重与正常男童平均体重无显著差异。
㈠假设
假设：是根据已知理论与事实对研究对象所
作的假定性说明。假设检验中一般有两个相互对立的假设，即零假设和备择假设。 ⑴零假设是研究者根据样本信息期望拒绝的假设,以H0表示。 ⑵备择假设与零假设相互排斥，是研究者根据样本信息期望证实的假设，以H1表示。
㈡假设检验的原理
小概率原理
• 假设检验的基本思想就是基于“小概率事件在一次试验中不可能发生”这一原理。
在实际研究中何时用单侧检验何时用双侧检验，一定要根据研究目的所规定的方向性来确定。应该用单侧检验的问题，若使用双侧检验，其结果一方面可能使结论由“显著”变为“不显著”，另一方面也增大了错误。反之，若使用双侧检验的问题若用单侧来检验，虽然减小了错误，但是使无方向性的问题人为地成为单方向问题，这也有悖于研究目的。
⒈两总体分布为正态,且方差已知
解：⒈建立假设: H 0 : 1 2 , H1 : 1 2 ⒉计算检验的统计量: 2 12 2 1.85 2 1.78 2 SE DX n1 n2 30 25
第二节平均数差异显著性检验
一、平均数差异显著性检验的类型与条件㈠平均数差异显著性检验的类型 ⒈单总体平均数差异显著性检验，也叫平均数的显著性检验。 ⒉双总体平均数差异显著性检验，也叫平均数差异的显著性检验。㈡平均数差异显著性检验的前提条件 ⒈被检验的样本应是随机样本； ⒉总体分布为正态分布。

第七章假设检验

第三节
u检验
u检验（u test ），亦称z检验（z test）大样本均数（率）与总体均数（率）比较的u检验、两个大样本均数（率）比较的u检验一、大样本均数比较的u检验二、大样本率的u检验
一、大样本均数比较的u检验
假定样本数据服从正态分布，当总体标准差未知时，可用样本标准差作为估计值这里的总体均数一般是指已知的理论值、标准值或经过大量观察所得到的稳定值，记作µ 0 （或记为）
两个样本率p1、p2的差值服从正态分布
u p1 p2
1 2
p p
2 2 p p p p 1 (1 1 ) / n1 2 (1 2 ) / n2
1 2 1 2
样本率p介于0.1～0.9之间，每组例数大于60 例
n1 p1 n2 p2 ˆ0 n1 n2
两样本均数比较的u检验
该检验方法适用于完全随机设计中两组计量资料差别的比较两样本均数差值服从正态分布
u Leabharlann 1 X 2X1X2
X
1X2
2 2 2 2 X / n 1 1 2 / n2 X2 1

当总体标准差未知，两组例数均超过30
ˆX
1X2
亦称样本率与总体率的比较的u检验，这里的总体率一般是指已知的理论值、标准值或经大量观察所获得的稳定值。
例7–3 全国调查的调查结果，学龄前儿童营养性贫血患病率为23.5%。某医院为了解当
地学龄前儿童能够营养性贫血患病情况，对
当地1396例学龄前儿童进行了抽样调查，查
出营养性贫血患儿363例，患病率为26.0%。
ˆp p
1
2
1 1 ˆ0 (1 ˆ0 )( ) n1 n2

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

自由度df = 1，p−value为0.903. 因此可以认为这些数据服从Mendel第一定律。 Fisher基于Mendel试验的所有数据，发现其数据与理论值符合的太好，p − value = 0.99993，但这么好的拟合在几万次试验中才发生一次，因而Fisher断定数据可能有伪造的嫌疑[注1]。
(O − E)2 ,
E
这个统计量中每项的分母的选取有点讲究, 我们可以这样粗略地解释: 假设 ni 服从 Poisson 分布, 则 ni 的均值和方差均为 npi, 从而 (ni − npi)/√npi 的极限分布为标准正态分布, 因此 χ2 近似为 k 个服从自由度为 1 的 χ2 分布的随机变量之和, 由于 ki=1(ni − npi) = 0, 故这 k 个随机变量满足一个约束, 从而 χ2 的自由度为 k − 1. 事实上, 可以严格地证明, 在一定的条件下, χ2 的极
自由度为 k − 1 的 χ2 分布, R. A. Fisher 发现自由度应该等于 k − 1 减去估计的独立参数的个数
H0 : π1 = 0.75, π2 = 0.25
解: 在Mendel第一定律(H0)下，黄色和绿色的个数期望值为 µ1 = nπ1 = 8023 ∗ 0.75 = 6017.25, µ2 = nπ2 = 8023 ∗ 0.25 = 2005.75 2
则Pearson χ2统计量为 Z = (O − E)2 = (6022 − 6017.25)2/6017.25 + (2001 − 2005.75)2/2005.75 = 0.015 E
理论频数 np1 np2 · · · npk
观测频数 n1 n2 · · · nk
由大数定律知, 在零假设成立时, ni/n 依概率收敛于 pi, 故理论频数 npi 与观测频数 ni 接近.
而检验统计量取为
χ2 = k (ni − npi)2 .
i=1
npi
1
简单地, 就是
χ2 =
其中 O 为观测频数, E 为期望频数.
i
第七章假设检验
7.3 拟合优度检验
前面的假设检验基本上是在假定总体是正态的条件下做的, 但是这个假设本身不一定成立, 需要收集样本 (X1, · · · , Xn) 来检验它. 一般地, 检验
H0 : X服从某种分布可以采用 Karl Pearson 提出的 χ2 拟合优度检验.
7.3.1 离散总体情形
H0 : P (X ∈ a1) = p1, · · · , P (X ∈ ak) = pk.
这类问题只提零假设而不提对立假设, 相应的检验方法称为拟合优度检验. 显然, 在零假设下, 各类别的理论频数分别为 np1, · · · , npk, 将理论频数和观测频数列于下表:
类别
a1 a2 · · · ak
解: 该问题设计的总体是一个有 6 个类别的离散总体, 记出现六个面的概率分别为 p1, · · · , p6, 则零假设可以表示为
H0 : pi = 1/6, i = 1, · · · , 6.
在零假设下, 理论频数都是 100, 故检验统计量 χ2 的取值为
(97 − 100)2 (104 − 100)2 (82 − 100)2 (110 − 100)2 (93 − 100)2 (114 − 100)2
7.3.2 列联表的独立性和齐一性检验 . . . . . . . . . . . . . . . . . . . . . . . . . . 4
7.3.3 连续总体情形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
目录
第七章假设检验
1
7.3 拟合优度检验 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
7.3.1 离散总体情形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
限分布就是自由度为 k − 1 的 χ2 分布, 但其证明超出本课程的要求范围.
下面给出一个例子来说明拟合优度检验的应用.
例 7.3.1. 有人制造一个含 6 个面的骰子, 并声称是均匀的. 现设计一个实验来检验此命题: 连续投掷 600 次, 发现出现六面的频数分别为 97, 104, 82, 110, 93, 114. 问能否在显著性水平 0.2 下认为骰子是均匀的?
(2) 理论分布含若干未知参数的情形
当理论总体总含有未知的参数时, 理论频数 npi 一般也与这些参数有关, 此时应该用适当的估计如极大似然估计代替这些参数以得到 pi 的估计 pˆi, 得到的统计量记为
χ2 = k (ni − npˆi)2 .
i=1
npˆi
拟合优度检验的提出者 Karl Pearson 最初认为在零假设下, 检验统计量的 χ2 的极限分布仍等于
(1) 理论分布不含未知参数的情形设某总体 X 服从一个离散分布, 且根据经验得知总体落在类别 a1, · · · , ak 的理论频率分别
为 p1, · · · , pk, 现从该总体抽得一个样本量为 n 的样本, 其落在类别 a1, · · · , ak 的观测数分别为 n1, · · · , nk. 感兴趣的问题是检验理论频率是否正确, 即下面假设是否正确:
+
+
+
+
+
= 6.94,
100
100
1ห้องสมุดไป่ตู้0
100
100
100
跟自由度为 6 − 1 = 5 的 χ2 分布的上 0.05 分位数 χ25(0.2) ≈ 7.29 比较, 不能拒绝零假设, 即可在显著性水平 0.2 下认为骰子是均匀的.
例 7.3.2. 孟德尔(Mendel)豌豆杂交试验。纯黄和纯绿品种杂交，因为黄色对绿色是显性的，在Mendel第一定律(自由分离定律)的假设下，二代豌豆中应该有75％是黄色的，25％是绿色的。在产生的n = 8023个二代豌豆中，有n1 = 6022个黄色， n2 = 2001个绿色。我们的问题是检验这些这批数据是否支持Mendel第一定律，要检验的假设是

第七章假设检验

第七章 假设检验

课程释疑7 第七章 假设检验

《概率论与数理统计》第七章假设检验.

第7章 假设检验

第七章 假设检验

第七章假设检验

第七章假设检验

第7章 假设检验

第七章 假设检验

第七章 假设检验

第七章 假设检验

第七章假设检验

第7章假设检验

第七章 假设检验的基本概念

第七章 假设检验(F检验与卡方检验)

统计学第七章假设检验和非参数统计

第七章 假设检验

第七章假设检验

第七章假设检验

课程释疑7 第七章假设检验

第7章假设检验

第七章假设检验

第7章假设检验

第七章假设检验

第七章假设检验

第七章假设检验

第七章假设检验的基本概念

第七章假设检验(F检验与卡方检验)

第七章假设检验