第6章 假设检验

合集下载

第六章 假设检验2006

第六章 假设检验2006

第六章参数假设检验假设检验(test of hypothesis)亦称显著性检验(test of statistical significance),就是先对总体的参数或分布做出某种假设,如假设两个总体均数相等,总体服从正态分布或两总体分布相同等,然后用适当的统计方法计算某检验统计量,根据检验统计量的大小来推断此假设应当被接受或拒绝,它是统计推断的另一重要方面。

假设检验可以分为两类:一类是已知总体分布类型,对其未知总体参数的假设作假设检验,称为参数检验(parametric test),主要讨论总体参数(均值、方差、总体率等)的检验;另一类是对未知总体分布类型的总体假设作假设检验,称为非参数检验(non-parametric test),主要包括总体分布形式的假设检验、随机变量独立性的假设检验等。

本章主要介绍有关总体参数(均值、方差、总体率等)的参数检验问题。

第一节假设检验的基本概念一、假设检验问题及基本原理(一)假设检验问题我们先来看个具体的例子。

例6.1某药厂用自动包装机包装葡萄糖,按规定每袋葡萄糖的标准重量为500克,若已知包装机包装的每袋葡萄糖重量服从正态分布,且按以往标准知总体方差σ2=6.52,某日开工后,为检验包装机工作是否正常,随机抽取6袋葡萄糖,测得其平均重量x=504.5(克),问该日自动包装机包装的平均重量是否还是500克?某日随机抽取的6袋葡萄糖的平均重量x=504.5(克),与标准重量500克相比差4.5克,造成该差异的原因有两种可能:①这日自动包装机工作正常,其包装的总体平均重量μ=500克,此6袋葡萄糖的平均重量这一样本均值与总体均值不同,是随机抽样误差造成的;②这日自动包装机工作不正常,其包装的总体平均重量μ≠500克,故从此总体中随机抽取的6袋葡萄糖的平均重量与标准重量存在实质性差异,而不仅仅是抽样误差造成的。

上述两种可能是相互对立的、互不相容的,究竟哪一种可能是对的,可用假设检验的方法来判断。

第6章 假设检验

第6章 假设检验

×
样本均数 分布未知
样本均数服从 t分布
( X-t / 2 ( ) .S X, X+t / 2 ( ) .S X )

样本均数服从 正态分布

N ( , 2 / n)
N ( , S 2 / n)
( X-u / 2 . X, X+u / 2 . X )
( X-u / 2 .S X, X+u / 2 .S X )
时,当P值在检验水准α 附近时,应慎重做结论。

α 是犯Ⅰ型错误的最大概率,P是犯Ⅰ型错误的实际概率。
3.假设检验的统计意义

假设检验的实际意义

不管是接受还是拒绝零假设都未必有实际意义; 拒绝零假设时,即使P值很小,总体之间差异可能很小,不具有
实际意义;

接受零假设时,不代表总体之间没有差异,可能由于样本量过 小,“证据不足”,“补充证据”后,仍可能拒绝零假设;
样本均数 分布未知
×
样本均数服从 正态分布
Ⅳ N
σ 已知? Y
u
X
X
X X / n S/ n
样本均数服从 t分布
样本均数服从 正态分布
N ( , / n)
2

N ( , S 2 / n)
样本均数与总体 均数比较 (大样本:u检验) (小样本:?检验)
两样本均数比较

若小概率事件发生了,则我们犯了经验主义错误;
因为小概率事件发生可能性为α ,则我们犯经验主义错 误的概率为α ,这种错误称为Ⅰ型ห้องสมุดไป่ตู้误。

若小概率事件没有发生,接受零假设时,还是有可能犯错
误,这时候错误是教条主义,称为Ⅱ型错误。

统计学第六章假设检验

统计学第六章假设检验

10
即 z 拒绝域,没有落入接受域,所以没有足够理由接受原假设H0, 同
时,说明该类型电子元件的使用寿命确实有了显著的提高。
第六章 假设检验
1. 正态总体均值的假设检验
(2) 总体方差 2 未知的情形
双侧举例:【例 6-6】某厂用生产线上自动包装的产品重量服从正态
分布,每包标准重量为1000克。现随机抽查9包,测得样本平均重量为
100个该类型的元件,测得平均寿命为102(小时), 给定显著水平α=0.05,
问,该类型的电子元件的使用寿命是否有明显的提高?
解:该检验的假设为右单侧检验 H0: u≤100, H1: u>100
已知 z z0.05 1.645
zˆ x u0 n 100 (102 100 ) 2 1.645
986克,样本标准差是24克。问在α=0.05的显著水平下,能否认为生产线
工作正常? 解:该检验的假设为双侧检验 H0: u=0.5, H1: u≠0.5
已知 t /2 (n 1) t0.025 (9 1) 2.306, 而 tˆ x u 986 1000 1.75 可见 tˆ 1.75 2.306
设H0, 同时,说明该包装机生产正常。
其中 P( Z 1.8) 1 P( Z 1.8) 1 0.9281 0.0719 0.05。
第六章 假设检验
单侧举例:【例 6-4】某电子产品的平均寿命达到5000小时才算合格,
现从一批产品中随机抽出12件进行试验,产品的寿命分别为
5059, 3897, 3631, 5050, 7474, 5077, 4545, 6279, 3532, 2773, 7419, 5116
的显著性水平=0.05,试测算该日生产的螺丝钉的方差是否正常?

第六章 假设检验

第六章 假设检验
8
依据实际问题,建立原假设 H和0 备选假设 H1
确定检验统计量,确定该统计量的抽样分布
给定显著性水平α,查表得临界值,因此确定拒绝 的区H间0 范围(拒绝域)
据样本观察值计算统计量,
做出决策是接受原假设 H,0 还是拒绝原假设 H 0
9
H真0 实 不H 0 真实
接受 H 0
拒绝 H 0
40
一个假设检验问题的结论是简单的,给定显著性 水平,不是拒绝原假设,就是接受原假设,但是 有可能存在如下情况:在显著性水平α=0.05时拒 绝了原假设,但在显著性水平α=0.01下保留原假 设。因为降低显著性水平会导致拒绝域缩小,这 样原来落在α=0.05的拒绝域中的检验统计量的观 察值有可能落在α=0.01到接受域中。由此提出p值检验。
42
(一)z检验的p-值:
检验统计量为z统计量的p-值计算公式,z 0表示检
验统计量的抽样数据,则p-值的计算方法如下:
如果: H 1 , 0p-值=
pz z0
如果: H 1 , 0p-值= 如果: H 1 ,0 p-值=
p z z0 p z z0
例6:利用p-值检验重新检验例1。 解: 第一、第二步与例1完全相同,故省略之。 第三步:计算样本统计的数值。 样本平均数 X 2,48n=50,代入检验统计量得:
26
解:此题为右侧检验。 第一步,建立假设
H0 : , 100 H1 : 100
第二步,确定检验统计量及其分布
z X 0 ~ N 0,1
n
第三步,确定临界值,右单侧检验临界值 α=0.05,查标准正态分布表得临界值:
显著性水z平
z=1.645,拒绝域是z>1.645。
27

第6章 假设检验

第6章 假设检验

三、假设检验中的相关概念
(一)原假设和备择假设 1、原假设和备择假设的定义



原假设:假设检验中,通常将所要检验的假 设称为原假设,也称为零假设,用H0表示。 备择假设:原假设的对立假设称为备择假设 或备选假设,用H1表示。

例如:设μ 0为总体均值μ 的某一确定值。
0
1.检验总体均值μ 是否等于某一确定值μ
2、原假设和备择假设的形式
(双侧检验和单侧检验)

若原假设是总体参数等于某一数值,

如H0:μ=μ0 ;H1:μ≠μ0。
这种假设检验称为双侧检验 若原假设是总体参数大于等于或小于等于某一数值, 如H0:μ≥μ0 ;H1:μ<μ0 或H0 :μ≤μ0 ;H1:μ>μ0

这种假设检验称为单侧检验。又分为左侧检验和右侧检验。
一、总体均值的检验
(一)提出假设
1. 双侧检验:H0 : m =m0;H1 : m m0
2. 3.
左侧检验:H0 : m m0;H1 : m <m0 右侧检验:H0 : m m0 ;H1 : m >m0
一、总体均值的检验
(二)选择检验统计量,并确定其分布形式

样本容量n
否 是
小(正态总体)
设检验。
一、什么是假设检验


参数假设检验 指对总体分布函数中的未知参数提出某种 假设,然后利用样本信息对所提的假设进 行检验并做出判断的过程。 非参假设检验 指对总体分布函数形式等的假设进行检验 的过程。
参数假设检验实例
例1:某公司进口一批钢筋,根据要求,钢筋的 平均拉力强度不能低于2000克,而供货商强 调其产品的平均拉力强度已达到了这一要求, 这时需要进口商对供货商的说法是否真实作出 判断。进口商可以先假设该批钢筋的平均拉力 强度不低于2000克,然后用样本的平均拉力 强度来检验假设是否正确。

卫生统计学课件_第六章_假设检验

卫生统计学课件_第六章_假设检验
16
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。

第六章 假设检验

第六章 假设检验

,接受 H 1 。表明在
第二节 总体均值的假设检验
(二)总体为非正态分布或分布未知 当总体分布为非正态分布且大样本时,检验的 X 统计量为 Z
0
/
n

在“原假定成立”的条件下,只要样本容量充分 大(一般习惯上要求 n≥30),它近似服从标准正 态分布。 如果标准差σ未知,只需用样本标准差S作为它 的估计量代替式中的 σ即可,这时检验统计量为

检验统计量服从t分布与其服从标准正态分布的检验结论判断方法一致
例6.3 某厂购买了一台新的生产机器,生产零件的长度规定为10厘米。为了 检验机器的性能是否良好,质检员随机抽取了25件产品,测得其平均长度为9.8厘 米,标准差为0.4厘米。假设生产的零件长度服从正态分布,问在显著性水平 =0.05时,该机器的性能是否良好。 2 解:设 X 表示该机器生产零件的长度,则有 X ~ N (, ),样本容量n=25,样本 均值 x =9.8厘米,样本标准差 s 0.4 厘米。根据问题提出的假设为: H0 : 0 =10厘米; H 1 : 0 =10厘米 这是一个双侧检验问题,因为总体服从正态分布但总体方差未知,用检验的小 样本数据检验,故当 H 0 成立时,检验统计量为: x 0
t
s n
规定显著性水平为 =0.05,查表得到临界值 t / 2(24) 2.064 ,所以原假设的否 定域为:t 2.064 。 计算检验统计量的值: t x 0 9.8 10 2.5
s 0.4 n 100
因为 |-2.5|=2.5>2.064,落在否定域,所以否定 H 0 显著性水平 =0.05时,不能说该机器的性能良好。 互动地带 6-11
第Ⅱ类错误,也称取伪错误 本来是非真的,却根据检验统计量的值把它给接受了。 发生这种错误的概率通常用 表示,即 P(接受H 0 / H 0非真) 在样本容量一定时,犯两种错误的风险是彼此消长的。两者要同时得到控制只 有增加样本容量。在样本容量受限时,通常根据研究问题的性质决定重点控制 第一类错误的风险还是控制第二类错误的风险。

第六章假设检验

第六章假设检验
当我们把真实的原假设当成假的加以拒绝, 称为第一类错误,也称弃真错误、α错误,犯 第一类错误的概率就是显著性水平α;当我们 把不真实的原假设当作真的加以接受,称为第 二类错误,也称取伪错误、β错误,犯第二类 错误的概率是不确定的。
α也称为生产者风险:在生产者将产品售给消费者时,通常 要进行产品的质量检验,原假设总是产品是合格的,但是检验 时生产者总是担心把合格品检验为不合格品,也就是第一类错 误α,所以α也称为生产者风险。 β也称为消费者风险:在消费者一方总恐怕把不合格品检验 不出来而当作合格品接受,因而β也称为消费者风险。
(二)未知总体分布及总体方差,大样本 1.检验总体均值的统计量
(三)总体为正态分布、方差未知、小样本 1. 检验统计量
2. 拒绝域的临界值 可以根据双侧检验还是单侧检验来确定拒绝域的 临界值。当为双侧检验,显著性水平a时,临界值 为 ;当为右侧检验时,显著性水平a,监界值 为 ;当为左侧检验时,显著性水平为a,临界值 为- 。
备择假设,常用H1表示。即原假设被否定之 后而采取的逻辑对立假设。
(二)检验统计量
有了两个假设,就要根据数据来对他们进行判 断。数据的代表是作为其函数的统计量,对样 本数据进行加工并用来判断是否接受原假设的统计 量称作检验统计量 统计量最常用的是Z统计量、t统计量。
统计量的选择要根据研究的参数及其估计量 的分布、抽样的方式、总体方差是否已知等多种 因素来确定
第四步:确定决策规则。拒绝或没有拒绝原假设的决 策是建立在由样本数据来进行统计检验并将其与假设 的抽样分布比较。抽样分布被分成两个部分,拒绝域 和非拒绝域。如果原假设是真实的,那么统计检验不 可能落入拒绝域。因此,如果统计检验落入了拒绝域, 我们拒绝原假设;否则,我们不能拒绝它。

《概率论》第六章假设检验

《概率论》第六章假设检验

例1 某服务系统的相应时间服从正态分布,需求 其平均相应时间在0.5秒之内。若16次抽样测试得 到样本平均值为x=0.56秒,样本标准差为s=0.12秒, 该服务系统工作是否正常?(=0.05)
解:H0 : 0.5 n=16 =0.05 t1 1.753 t x 0 0.56 0.5 =2 >1.753 s n 0.12 16
因此否定H0 即该服务系统工作不正常
(二)未知方差2,关于期望的检验
1.检验假设(单边)H0 : 0 H1 : 0
2.选取检验统计量 T X 0 [ t(n 1)] Sn
3.由备选假设确定拒绝域形式,W=(t c)
4.由显著性水平决定临界值c=t (n 1),
2.选取检验统计量 T X 0 [ t(n 1)] Sn
3.由备选假设确定拒绝域形式,W=(t c)
4.由显著性水平决定临界值c=t1 (n 1),
P T t1 (n 1)
5.求出检验统计量的观测值,判断是否在拒绝域中
即:若t t1 (n 1),则否定H0; 若t t1 (n 1),则接受H0.
因此这实际上需要比较第二个正态总体 的期望值是与第一个正态总体期望值相 等还是比它高?
这种作为检验对象的假设称为原假设, 通常用 H0表示。比如, 例2中的待检假设为:H0:Eξ=3140
如何根据样本的信息来判断关于总体分布的 某个设想是否成立,也就是检验假设H0成立 与否的方法是本章要介绍的主要内容。
P T t (n 1)
5.求出检验统计量的观测值,判断是否在拒绝域中
即:若t<t (n 1),则否定H0; 若t>t (n 1),则接受H0.
(二)未知方差2,关于期望的检验

第六章 假设检验

第六章 假设检验
2 2 , 1 2 已知,或大样本情况 6.3.1 2 2 两个总体均服从正态分布、两个总体的方差 1 , 2 已知;或两 个总体分布及方差未知,但大样本情况下,样本均值之差 X 1 X 2 的抽样分布服从或近似服从正态分布,即可采用检验 统计量:
第六章 假设检验 6.2 总体均值的假设检验
【例6-7】某厂采用自动包装机分装产品,假定每包产 品的重量服从正态分布,每包标准重量为1000克。某 日随机抽查9包,测得样本平均重量为986克,样本标 准差为24克。试问在0.05的显著性水平上,能否认为 这天自动包装机工作正常?
第六章 假设检验 6.2 总体均值的假设检验
6.1
第六章 假设检验 假设检验的原理
6.1.2
假设检验的步骤
(三)选取显著性水平,确定原假设的拒绝域和接受域 显著性水平表示原假设为真时拒绝原假设 H 0 的最大概率, 即拒绝原假设所冒的风险,用 表示。 通常取 0.05 或 0.01
6.1
第六章 假设检验 假设检验的原理
第六章 假设检验 6.2 总体均值的假设检验
6.2.3 2未知时小样本情况下总体均值的假设检验
设总体服从正态分布 X ~ N (, 2 ) ,在小样本抽样情况下,利用 t检验法对总体均值的检验,其检验统计量及分布为:
t X ~ t (n 1) s/ n
第六章 假设检验 6.2 总体均值的假设检验
6.1
第六章 假设检验 假设检验的原理
6.1.4
假设检验中的P值
H1 : 0
(2)左侧检验:H 0 : 0
P值= P(Z zc 0 )
H 0 : 0
(3)右侧检验:
H1 : 0

第六章 假设检验

第六章 假设检验

所以有 C0 = 6 × 1.65 + 250 = 因此犯第二类错误的概率是
259.9
X − 270 C0 − 270 β = P{ X ≤ C0 } = P{ } ≤ 6 6 259.9 − 270 = P{z ≤ = −1.68} = φ (−1.68) 6 = 1 − φ (1.68) = 0.0465
y
0.0044
2.61
x
从(1)的计算结果可以看出,在超市提出的假设成立的 )的计算结果可以看出, 情况下,随机抽取的200件产品中,有6件是次品的概率 件产品中, 情况下,随机抽取的 件产品中 件是次品的概率 为0.0044,显然这是一个小概率事件,认为在一次抽查中 ,显然这是一个小概率事件, 不应该发生,现在它发生了, 不应该发生,现在它发生了,我们怀疑超市提出的假设不 应该成立。也就是拒绝这批产品进入超市。 应该成立。也就是拒绝这批产品进入超市。 在这个例子中,超市提出了假设, 在这个例子中,超市提出了假设,通过抽样获得样本数
这两类错误之间的关系是:在样本容量一定时,犯第一类 这两类错误之间的关系是:在样本容量一定时, 错误概率较大时,犯第二类错误地概率较小;反之, 错误概率较大时,犯第二类错误地概率较小;反之,犯第 一类错误概率较小时,犯第二类错误概率较大。 一类错误概率较小时,犯第二类错误概率较大。要想两类 错误的概率都减小,只有增加样本容量。 错误的概率都减小,只有增加样本容量。 5、显著性水平 、 显著性水平:是指人们犯第一类错误概率的最大允许值。 显著性水平:是指人们犯第一类错误概率的最大允许值。 注意:显著性水平是人们根据自己所研究的问题来确定, 注意:显著性水平是人们根据自己所研究的问题来确定, 在经济学和其他社会科学中,常用选择的显著性水平是5% 在经济学和其他社会科学中,常用选择的显著性水平是 或者10%,在卫生和医药统计中,常用选择的显著性水平 或者 ,在卫生和医药统计中, 是1%。在我们经济学中,除非特别声明,一般都以 。在我们经济学中,除非特别声明,一般都以5% 作 为显著性水平。 为显著性水平。 6、临界值和拒绝域 、 拒绝域: 所围城的区域。 拒绝域:拒绝域就是由显著性水平 α 所围城的区域。 临界值:由给定的显著性水平确定的拒绝域的边界值, 临界值:由给定的显著性水平确定的拒绝域的边界值,称 为临界值。 分位点所对应的值。 为临界值。实际上临界值就是 α 分位点所对应的值。

第6章 假设检验

第6章  假设检验

二、 假设检验的步骤 提出原假设和备择假设 /备择假设 确定适当的检验统计量 规定显著性水平: 根据显著性水平α及检验
统计量的查找临界值,并确定拒绝域。注 意是单侧检验还是双侧检验

计算检验统计量的值: 从总体中抽取某一样 本,据样本资料计算检验统计量的值 作出统计决策: 若检验统计量的值落在拒绝 域内就拒绝H0,否则接受H0
置信水平
拒绝域
a/2
1 - 接受域
H0值
a/2
临界值
临界值
样本统计量
双侧检验 (显著性水平与拒绝域 )
抽样分布
拒绝域 a/2 1 - 接受域 H 0值 样本统计量 置信水平 拒绝域 a/2
临界值
临界值
例如 ,一个灯光厂需要生产平均使用寿命 µ = 1000小时的灯泡。为了观察生产工艺过程是否正常, 从一批产品中抽取150个进行检验,得到平均使用 寿命980小时,能否断定这个厂生产的灯泡平均使 用寿命为1000小时?为什么? 不希望在1000小时任何一边超越太多,假设: H0: µ = 1000 (平均使用寿命为1000) H1: µ ≠ 1000 (平均使用寿命不是1000) 我们在这里提出的原假设是µ =1000,所以只要 µ >1000或µ <1000二者中有一个成立就可以否定原假 设(平均使用寿命为1000)。
标准误计算公式
σ已知: σ未知: S
X


n
X

S n
实例:如某年某市120名12岁健康男孩,已求 得 均数为143.07cm,标准差为5.70cm,按公 式计算,则标准误为:
SX
5 . 70 120
0 . 52
标准误的应用

第6章 假设检验

第6章 假设检验

⑤案例1判断决策 案例1
在这个检验中,“不能拒绝”原假设是因 为样本均值与假设总体均值(15)非常接近,它的 离差可以通过概率(P值)大于显著性水平来解释。 当样本均值为14.982时,它很接近供应商 提供的总体金属板的均值,所以经过检验得出 的结论是:没有证据证明供应商提供的总体均值 是不正确的。
⑤案例3判断决策 案例3 不能拒绝原假设,因 此经理有足够证据证明新 支行的平均储蓄存款与总 部没有什么不同,可以开 展业务。
二、一个正态总体方差的假设检验
H0 :σ = σ , H1 :σ ≠ σ
2 2 0 2ຫໍສະໝຸດ 2 0所用统计量χ =
2
(n −1)S
2
σ
2 0
~ χ (n −1)
2
对于显著性水平α ,拒 绝域为, 绝域为,
χ ≤χ
2
2 1−α
2
或 χ ≥χ
2
2 α
2
单边检验, 单边检验,
H0 :σ ≤ σ , H1 :σ > σ
2 2 0 2
2 0
拒绝域为, 拒绝域为,
2
χ ≥ χα
2
χ
2 1−α
χα
2
2 2
案例研究4 案例研究4
某公司生产的清洁剂包装净重为64克 某公司生产的清洁剂包装净重为64克, 尽管每盒净重量存在差异不可避免, 尽管每盒净重量存在差异不可避免 , 但公 司还是期望这种差异尽可能的小些。 司还是期望这种差异尽可能的小些 。 如果 净重过大, 会增加成本;如果净重过少, 净重过大 , 会增加成本;如果净重过少 , 会使顾客不满。 正常情况下, 会使顾客不满 。 正常情况下 , 每盒净重的 标准差为1 标准差为1.6克。为了控制生产质量,公司 为了控制生产质量, 随机抽取了50 盒作为样本, 随机抽取了 50盒作为样本 , 测得样本标准 差为1 差为1.9克,以0.05为显著性水平,公司是 05为显著性水平, 否有证据说明清洁剂净重的标准差不超过 1.6克。

第六章 假设检验

第六章 假设检验

第一步:建立假设 第一步:
H0 : µ = 8000; H1 : µ > 8000
原假设的选取原则: 原假设的选取原则:没有充分理由 不能轻易否定的命题。 不能轻易否定的命题。
对立假设的选取原则:没有把握不 对立假设的选取原则: 能轻易肯定的命题。 能轻易肯定的命题。
第二步:寻找检验统计量 第二步:
2
第三步:给定显著性水平和临界值 第三步:
• 在原假设 H0 为真时,X 应该接近8000。 为真时, 如果 X 远离8000 ,就有理由怀疑原 假设为真。 假设为真。 • 例中,8300与8000之间算近还是算远? 例中, 之间算近还是算远? • 需要定一个界限,记此界限为c。 需要定一个界限,记此界限为c
假设检验是要根据样本的观测值对原假作 出判断,接受原假设或者拒绝。 出判断,接受原假设或者拒绝。 由于样本的随机性,客观情况未知, 由于样本的随机性,客观情况未知,有可 能犯错误。 能犯错误。 例:产品验收,有时面对的整批产品是合 产品验收, 格的,有时面对的整批产品是不合格的。 格的,有时面对的整批产品是不合格的。 拒收了合格率高的产品或者接受了合格率 低的产品都是犯了错误。 低的产品都是犯了错误。
例:餐厅的营业额问题: 餐厅的营业额问题:
H0 : µ = 8000; H1 : µ பைடு நூலகம் 8000
N(µ0 ,σ )
2 0
N(µ,σ )
2
在原假设成立的条件下,新菜单挂出后, 在原假设成立的条件下,新菜单挂出后, 每天营业额仍然服从正态分布
N(8000,640 )
如今获得了一个容量为9的样本, 如今获得了一个容量为9的样本,此时样 服从: 本均值 X 服从: 1 2 N(8000, ×640 ) 9

第6章 假设检验基础

第6章 假设检验基础
统计推断: 事先规定一个“小”的概率a (检验水准) 若 P 值小于a ,拒绝零假设; 若 P 值不小于a ,则不拒绝零假设。
5
配对设计资料的 t 检验
n 配对设计(paired design)是一种特殊的设计方式,能够 很好地控制非实验因素对结果的影响,有自身配对和异 体配对之分。
n 配对设计资料的分析着眼于每一对观察值之差,这些差 值构成一组资料,用 t 检验推断“差值的总体均数是否为 0”。
3.48
3.50
­0.02




12
2.69
2.66
0.03
13
3.09
3.20
­0.11
14
2.98
2.92
0.06
15
2.65
2.60
0.05
8
1. 建立检验假设,确定检验水准
H 0 : md = 0 ,即差值的总体均数为 0 H 1 :md ¹ 0 ,即差值的总体均数不为 0
2. 计算统计量 n=15, d =0.06, sd = 0.10
X1 ~ N( m1 ,s 2 ), X2 ~ N( m2 ,s 2 )
1. 建立检验假设,确定检验水准
H0: m1 = m2 , 或 m1 - m2 = 0 H1: m1 ¹ m2, 或 m1 - m2 ¹ 0
a =0.05
4
2. 计算统计量
X1
~
N(
m1
s2
, n1
)

X2
~
N(
m2
s2
, n2
小结(Summary)
1. t 检验是以 t 分布为基础的一类比较均数的假设检验方法。 2. t 检验的应用条件为随机样本、来自正态总体、方差齐性。 3. 单样本 t 检验是推断该样本所属总体的均数与已知的某一 数值有无差别。配对设计资料的 t 检验着眼于差值的总体均 数是否为0。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2
2
n2 7.5 2 / 120 6.3 2 / 153 0.8533
u
X1 X 2 s X1X 2

139.9 143.7 0.8533
4.4353 u 0.05 2.58
P<0.01,差别有统计学意义,可认为该市1993年12岁男童平均身高比1973年高。
假设检验应注意的问题
t 检 验
样本均数与总体均数的比较

目的:推断该样本是否来自某已知总体; 样本均数代表的总体均数与0是否相等。

总体均数0一般为理论值、标准值或经大量观察所得并为人们接
受的公认值、习惯值。

解决思路:

区间估计

判断样本信息估计的总体均数之可信区间是否覆盖已知的 总体均数0 ?若不覆盖,则可推断该样本并非来自已知均 数的总体。
样本信息不支持H0,便拒绝之并接受H1,否则不拒绝H0 。
假设检验的基本步骤

建立假设 确定检验水准 计算检验统计量 计算概率P 结论

当P≤ 时,拒绝H0,接受H1,差别有统计学意义。
当P> 时,不拒绝H0,差别尚无统计学意义。
不论,拒绝拒绝H0,还是不拒绝H0都可能范错误。
同?
μ0 =132(g/L)
n=25
? =
μ
X 150 ( g / L) S 16.5( g / L)
已知总体
未知总体

目的:推断病人的平均血红蛋白(未知总体均
数)与正常女性的平均血红蛋白(已知总体均
数0)间有无差别
μ =μ0 ?
X 0 150 132 18

手头样本对应的未知总体均数 μ等于已知总体均数μ0,
在两个样本均数比较时,若两组样本含量都很大,可用u检验,其计 算公式为:
X1 X 2 u s X 1 X 2
X1 X 2 s12 n1 s 2 2 n2
u为标准正态离差,按正态分布界定P值并作出结论 。
例6.5 某市于1973年和1993抽查部分12岁男童对其发育情况进行评估, 其中身高的有关资料如下,试比较这两个年度12岁男童身高均数有无 差别。
配对设计的形式

自身配对

同一对象接受两种处理,如同一标本用两种方法进行检验, 同一患者接受两种处理方法;

异体配对

将条件相近的实验对象配对,并分别给予两种处理。

若两处理因素的效应无差别,差值d的总体均
数d应该为0,故可将该检验理解为样本均数 与总体均数d =0的比较

差值均数的大小及其抽样误差反应因素的效应

允许误差。医学研究中一般取=0.05 。

检验水准实际上确定了小概率事件的判断标准。
选定检验方法计算检验统计量
(计算样本与总体的偏离)
t

X 0 s n
统计量t表示,在标准误的尺度下,样本均数与总体 均数0的偏离。这种偏离称为标准t离差。

根据抽样误差理论,在H0假设前提下,统计量t服 从自由度为n-1的t分布,即t值在0的附近的可能性 大,远离0的可能性小,离0越远可能性越小。
H0:d=0,两仪器检验结果相同; H1:d≠0,两仪器检验结果不同。
双侧 =0.05。
t
d sd n
ห้องสมุดไป่ตู้
17.17 40.33/ 12
1.48
按 = n-1=12-1=11查t值表,得t0.20,11=1.363,t0.10,11=1.796,
t0.10,11>t>t0.20,11,则0.20>P>0.10,差别无统计学意义,尚
H1 :1≠2 ,正常人与病毒性肝炎患者的转铁蛋白含量不等。 双侧 =0.05。
t
271.89 235.21 163.3679 1 12 1 15
7.402
=n1+n2-2=12+15-2=25
按自由度 25 查附表 2 , t 界值表得 t0.001,25=3.725 , t > t0.001,25 , P < 0.001 ,差别 有统计学意义,可以认为病毒性肝炎患者的转铁蛋白含量较低。
差别仅仅是由于抽样误差所致;

除抽样误差外,病人与正常人存在本质上的差异
建立假设 (在假设的前提下有规律可循)

零假设(null hypothesis),记为H0

H0:=132,病人与正常人的平均血红蛋白含量相等;

备择假设(alternative hypothesis),记为H1

H1:≠132,病人与正常人的平均血红蛋白含量不等。
结论(根据小概率原理作出推断)

在H0成立的前提下出现现有差别或更大差别的可能性P(| t | ≥5.4545)小于0.05,是小概率事件,即现有样本信息不支持H0。 抉择的标准为:


当P≤ 时,拒绝H0,接受H1

当P> 时,不拒绝H0

本例P<0.05,按 =0.05的水准,拒绝H0,接受H1,差别有统计 学意义。认为该病女性患者的Hb含量高于正常女性的Hb含量。
两组乳猪脑组织钙泵含量( g/g) 实验组 0.2755 0.2545 0.1800 0.3230 0.3113 0.2955 0.2870 差值 d 0.0795 -0.0545 0.1330 0.0400 0.0431 0.0495 0.0180 0.3086 d2 0.006320 0.002970 0.017689 0.001600 0.001858 0.002450 0.000324 0.033211

t值越小,越利于H0假设 t值越大,越不利于H0假设
t
X 0 s n

150 132 16.5 25
5.4545
计算概率P(与统计量t值对应的概率)

在H0成立的前提下,获得现有这么大的标准t
离差以及更大离差 的可能性。
P=P(|t|≥5.4545) ?
按 =25-1=24查附表2t界值表
1973 年:n1=120 =139.9cm s1=7.5cm; 1993 年:n2=153 =143.7cm s2=6.3cm。
H0 :1=2,即该市两个年度12岁男童平均身高相等; H1 :1≠2,即该市两个年度12岁男童平均身高不等。
双侧 =0.05。
s X 1 X 2 s1 n1 s 2
假设检验中需注意的几个问题

建立假设

“假设”是对总体特征的表述 H0与H1并非并列,而是以H0为主
H0与H1的表述随资料性质、分析目的和检验方法而定。
假设检验中需注意的几个问题

验证假设

各种检验方法都以统计量的分布为依据 检验统计量与H0密切相关:H0条件下产生了检验统计量t的概率分


反证法推理 :在H0条件下,抽得现有样本统计量的概率(P)很小, 就认为样本数据与H0假设有矛盾,且这种矛盾不能用抽样误差来
解释,所以可认为该样本来自H1假设,则接收H1;反之……。

判断水准 必须事先确定,一般取0.05。 P值

P值是决策的依据 P≤0.05 及其意义:首先P不指H0成立之可能,而是指从H0假设总体中 随机抽到差别至少等于现有差别的机会。
例6.2 现用两种测量肺活量的仪器对12名妇女测得最大呼气率 (PEER)(L/min),资料如表6.1,问两种方法的检测结果有无差别?
表 6.1 被测者号 (1) 1 2 3 4 5 6 7 8 9 10 11 12 合计 用两种方法对 12 名妇女的最大呼气率检测结果(L/min) Wright 法 (2) 490 397 512 401 470 415 431 429 420 275 165 421 Mini 法 (3) 525 415 508 444 500 460 390 432 420 227 268 443 差值 d (4)=(3)-(2) 35 18 -4 43 30 45 -41 3 0 -48 103 22 206 d2 (5) 1225 324 16 1849 900 2025 1681 9 0 2304 10609 484 21426
两样本均数比较的t检验

有些研究的设计既不能自身配对,也不便异体配对, 而只能把独立的两组相互比较。例如手术组与非手术 组、新药组与对照组。两个样本均数比较的目的在于 推断两个样本所代表的两总体均数1和2是否相等。
X1 X 2 t s X1X 2
s X 1 X 2 sc
2
1 1 n n 2 1
假设检验的意义

得到关于总体的结论 如本例假设检验的意义在于分辨手头样本所代表的未

知总体和已知总体是否为同一总体,换句话说,即分
辨手头样本是否为已知总体的一个随机样本。
假设检验的基本思想

“反证法”的思想 先根据研究目的建立假设,从H0假设出发,先假设它是正确的, 再分析样本提供的信息是否与H0有较大矛盾,即是否支持H0,若

其中H0假设比较单纯、明确,在H0 下若能 弄清抽样误差的分布规律,便有规律可循。 而H1假设包含的情况比较复杂。因此,我 们着重考察样本信息是否支持H0假设(因 为单凭一份样本资料不可能去证明哪个假设 是正确的,哪一个不正确)。
确定检验水准 (确定最大允许误差)
设定检验水准的目的就是确定拒绝假设H0时的最大
H0:d=0,即两组乳猪脑组织钙泵含量相等; H1:d>0,即对照组乳猪脑组织钙泵含量高于实验组。 单侧 =0.05。
t d sd n 0.0441 0.05716 7 2.0412
按= n-1=7-1=6查t界值表,得单侧t0.05,6=1.943,t>t0.05,6, 则P<0.05,差别有统计学意义,可以认为脑缺氧可造成钙泵 含量的降低。
相关文档
最新文档