假设检验基础汇总
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验基础
流行病与卫生统计学教研室
2018/10/12
1
假设检验的概念和基本原理
生活实例
某商家宣称:他的一大批鸡蛋“坏蛋率为1%”。 为了对这批鸡蛋的质量作出判断,某质量监督员从 中随机抽取5个作检查,结果4个为好蛋,1个为变 质蛋。 根据此结果,作为质量监督员如何评价鸡蛋的质量? 为什么?
2018/10/12
15 2.65 2.60 0.05
2018/10/12
31
配对设计的设计形式
2. 同一样品分成两份,随机分别接受不同处理(或测量)
例1 现用两种测量肺活量的仪器对12名妇女测得最大呼气率 (PEER)(L/min),资料如下表,问两种方法的检测结果有无差别?
编号
Wright 法 Mini法 差值d 525 35 415 18 508 -4 444 43 500 30 460 45 390 -41 432 3 420 0 227 -48 268 103 443 22
通常根据构造的检验统计量来命名假设检验方法。
2018/10/12
10
4.确定 P 值
P值的含义:由H0所规定的总体作随机抽样,获得等于
及大于现有样本统计量值的概率。 怎样确定P值:构造的检验统计量服从相应的分布,查
相应分布界值表确定P值。
一般双侧检验查双侧界值,单侧检验查单侧界值。
2018/10/12
11
5.作出推断结论
P与检验水准α相比作出推断结论
P≤ α,拒绝H0,接收H1
(在H0成立的前提下,一次随机抽样发生了小概率事件)
P> α,不能拒绝H0
(在H0成立的前提下,一次随机抽样没有发生小概率事件,没有充
足的理由拒绝H0 )
2018/10/12
12
例7-2的假设检验的基本步骤
①H0:μ=3 (新疗法使患者锻炼持续时间的平均增加量等于常规疗法的3分钟 ) H1:μ≠3
2018/10/12 24
例3 测得25例女性患者的血红蛋白(Hb),其均数为 150 (g/L),,标准差为16.5 (g/L)。而当地正常成年女性
的Hb均数为132 (g/L),问该病女性患者的Hb含量是否
与正常女性Hb含量不同?
2018/10/12
25
单样本设计t检验可解决问题
X 0
3. 选择检验方法,计算检验统计量
4. 确定 P 值 5. 作出推断结论
2018/10/12
7
1. 建立假设(H0和H1) ,确定单双侧检验
建立假设(H0和H1) H0 零假设或原假设(null hypothesis)
通常为两总体参数相等或服从某分布;
H1 备择假设(alternative hypothesis)
推断结论和两类错误 检验结果 实际情况 拒绝H0 第Ⅰ类错误 (α) 不拒绝H0 结论正确(1-α)
H0真
H0 不真
结论正确 (1-β)
第Ⅱ类错误(β)
2018/10/12
18
一 、假设检验的两类错误
第Ⅰ类错误
犯第Ⅰ类错误概率为α α 的意义
α 的取值
第Ⅱ类错误
犯第Ⅱ类错误概率为β β 的意义 β 的取值
2
假设检验(hypothesis test)
假设检验是一种重要的工具。
假设检验(hypothesis test)是依据样本间存在差异,
来对样本所对应的总体间是否存在差别作出判
断的一种方法。
2018/10/12
3
假设检验的思维逻辑
反证法
小概率事件的推断原理
小概率事件在一次观察或实验中是几乎不可能出现 的。
3. 自身前后或左右处理结果进行比较
例 某儿科采用静脉注射人血丙种球蛋白治疗小儿急 性毛细支气管炎。对其用药前后患者血清中免疫球蛋 白进行比较,以确认静脉注射人血丙种球蛋白是否有 效
2018/10/12
34
配对设计t检验可解决的问题
d 0
d ? 0
2018/10/12
35
配对设计t检验的假设检验步骤
2018/10/12 19
α与β关系示意图
2018/10/12 20
二、假设检验的功效
概念: 1-β 称为假设检验的功效(power of a test)
统计学意义:如果两个总体参数间确实存在差异,使用假设检验
方法能够发现这种差异(即拒绝)的能力被称为检验效能(power of
test)。一般情况下要求检验效能应在0.8以上。
6 3.23 2.93 0.30
7 2.27 2.24 0.03
8 2.48 2.55 -0.07
9 3.03 2.82 0.21
10 3.07 3.05 0.02
11 3.61 3.58 0.03
12 2.69 2.66 0.03
13 3.09 3.20 -0.11
14 2.98 2.92 0.06
2018/10/12
29
配对设计的设计形式
1. 异体配对:将两个不同的受试对象(按主要非处理因素)配成 特征相近的对子,同对的两个受试对象随机接受两种不同的处 理。 例8.2 例1 某医生研究脑缺氧对脑组织中生化指标的影响,将乳猪按出生 体重配成7对,一组为对照组,一组为脑缺氧模型组。试比较两
乳猪编号 1 2 3 4 组动物脑组织钙泵的含量有无差别? 对照组 试验组 差值d
通常为两总体参数不相等或不服从某分布;
确定单双侧检验
由研究目的及专业知识所决定 从备择假设H1 看: H1:μ≠μ0(μ>μ0和μ< μ0)
H1 : 0 (双侧检验 two-sides test) H1 : 0或 0 (单侧检验 one-sided test)
2018/10/12 8
推断,不论做出那种推断结论,都有可能发生
错误。
2018/10/12
16
一 、假设检验的两类错误
第Ⅰ类错误与第Ⅱ类错误的概念
将假设检验的结果与实际情况相比:
第Ⅰ类错误(typeⅠerror):H0为真时,拒绝H0
第Ⅱ类错误(type Ⅱ error) : H0不真时,不拒绝H0
2018/10/12
17
例 某医院用某新药与常规药治疗婴幼儿贫血,将20名贫 血患儿随机等分两组,分别接受两种药物治疗,测得血 红蛋白增加量(g/L)如下,问新药与常规药的疗效有无 差别?
新药组 常规药组 24 14 36 18 25 20 14 15 26 22 34 24 23 21 20 25 15 27 19 23
完全随机设计类型(两种形式)
1.从同一个同体中随机抽取两个样本,分别采用两种不同 的处理,比较不同处理结果是否有差异。 A A B 2.从两个总体中随机抽取两个样本,两样本信息不同,推 断两总体信息是否不同。 A B
A
B
38
B
2018/10/12
完全随机设计类型(两种形式)
例8.3 例8.4 例8.6
2018/10/12 13
建立假设,确定单双侧检验 确定检验水准
选定检验方法,计算检验统计量
确定P值
P≤α
作出推断结论
P>α
拒绝H0,接受H1
2018/10/12
不能拒绝H0
14
第三节 两类错误及检验效能
假设检验的两类错误
假设检验的功效
2018/10/12
15
一 、假设检验的两类错误
假设检验是根据有限的样本信息对总体作
2018/10/12
21
t检验 ( t-test )
单样本设计的t检验
配对设计的t检验 完全随机设计(成组设计)的t检验
2018/10/12
22
每种不同设计类型的t检验均主要从以下四个方面介绍:
1. 设计类型 2. 可解决的问题
3. 假设检验步骤
4. 适用条件
2018/10/12
23
(一)单样本设计的t检验one-sample t-test
2018/10/12
5 0.3544 0.3113 0.0431
6 0.3450 0.2955 0.0495
7 0.3050 0.2870 0.0180
30
0.3550 0.2755 0.0795
0.2000 0.2545 -0.0545
0.3130 0.1800 0.1330
0.3630 0.3230 0.0400
2018/10/12
40
(新疗法使患者锻炼持续时间的平均增加量不等于常规疗法的3分钟 )
②检验水准α=0.05 ③
t
43 1.5 / 50
4.7140
50 1 49
P 0.001
④查界值表,自由度近似取50,可得到
⑤拒绝零假设,接受备择假设,可以认为“新疗法使患者锻炼持续时间的平均增加 量不等于常规疗法的3分钟”
作出推断结论
P>α
不能拒绝H0
27
单样本设计t检验的适用条件
独立性 independence 正态性 normality
如何判断资料是否服从正态分布 从经验或专业知识判断 需作正态性检验(见第四节)
2018/10/12
28
(二)配对设计的t检验paired samples t-test
配对设计是研究者为了控制可能存在的主要非处理因 素而采用的一种试验设计方法。 配对设计常见的设计形式 异体配对 同一样品,采用两种不同处理 同体配对 自身前后或左右配对
2018/10/12
39
完全随机设计类型(两种形式)
例 某市于1973年和1993年抽查部分12岁男童对其生长 发育情况进行评估,其中身高的有关资料如下,试比较这 两个年度12岁男童身高均数有无差别。
1973年:n=120 1993年:n=153 均数=139.9 cm 标准差=7.5 cm 均数=143.7 cm 标准差=6.3 cm
H0:μ d=0 H1: μ d≠0
α=0.05
d 0 t t ( ), n 1 Sd / n
查ν=n-1的t界值表,确定P值
P≤α
拒绝H0,接受H1
2018/10/12
作出推断结论
P>α
不能拒绝H0
36
配对设计t检验的适用条件
独立性 正态性
2018/10/12
37
(三) 完全随机设计t检验(两独立样本t检验) (two independent samples t-test)
2.确定检验水准α(size of a test)
检验水准α:为预先规定的小概率事件的标准 通常取值0.05或0.01
可根据研究目的进行调整
2018/10/12
9
3.选择检验方法,计算检验统计量
应根据研究目的、资料类型、设计类型及样本含量大小
等因素选择合适的假设检验方法; 在H0成立的前提下,由样本已知信息构造检验统计量;
配对设计的设计形式
例2 为了研究孪生兄弟的出生体重是否与其出生顺序有关,共收 集了15对孪生兄弟的出生顺序和出生体重,数据如下:
编号
先出生 后出生 差值d
1 2.79 2.69 0.10
2 3.06 2.89 0.17
3 2.34 2.24 0.10
4 3.41 3.37 0.04
5 3.48 3.50 -0.02
?
0
26
2018/10/12
单样本设计t检验的假设检验步骤
H0:μ =μ
0
H 1 : μ ≠μ 0 (双侧) μ >μ 0或μ <μ 0 (单侧)
α=0.05
X 0 t S/ n
t ( ), n 1
查ν=n-1的t界值表,确定P值
P≤α
拒绝H0,接受H1
2018/10/12
标准差为1.5分钟。该新疗法使患者锻炼持续时间的平均
增加量是否多于常规疗法的3分钟?
2018/10/12
5
?
0
0
0
X 0是由抽样误差所致
X 0是由两总体异质性所致
2018/10/12
6
假设检验的基本步骤
1. 建立假设(H0和H1) ,确定单双侧检验 2. 确定检验水准α
1
490
2
397
3
512
4
401
5
470
6
415
7
431
8
429
9
420
10
275
11
165
12
421
2018/10/12
32
配对设计的设计形式Байду номын сангаас
例2 用两种方法测定12份血清样品中Mg2+含量(mmol/L)的结 果见下表,试问两种方法测定结果有无差异?
2018/10/12
33
配对设计的设计形式
2018/10/12
4
例7.2 某医生研究一种新的治疗充血性心力衰竭的方法。
对50位心功能在2~3级之间的成年男性患者进行4周的
治疗,考察其疗效。评价疗效的一个指标是锻炼持续时 间的增加量(分钟)。以前常规的治疗方法能使患者的锻 炼持续时间平均增加3分钟。该医生通过50位接受新方 法治疗的患者的数据算得锻炼持续时间平均增加4分钟,
单样本设计
例8.1 例2 已知中学一般男生的心率平均值为74次/分钟,为了 研究经常参加体育锻炼的中学生心脏功能是否与一般 的中学生相同,在某地区中学随机抽取常年参加体育 锻炼的男生16名,测量他们的心率,结果分别为55、 72、58、57、70、75、72、69、61、67、69、73、59、 71、53、69。请作统计推断。
流行病与卫生统计学教研室
2018/10/12
1
假设检验的概念和基本原理
生活实例
某商家宣称:他的一大批鸡蛋“坏蛋率为1%”。 为了对这批鸡蛋的质量作出判断,某质量监督员从 中随机抽取5个作检查,结果4个为好蛋,1个为变 质蛋。 根据此结果,作为质量监督员如何评价鸡蛋的质量? 为什么?
2018/10/12
15 2.65 2.60 0.05
2018/10/12
31
配对设计的设计形式
2. 同一样品分成两份,随机分别接受不同处理(或测量)
例1 现用两种测量肺活量的仪器对12名妇女测得最大呼气率 (PEER)(L/min),资料如下表,问两种方法的检测结果有无差别?
编号
Wright 法 Mini法 差值d 525 35 415 18 508 -4 444 43 500 30 460 45 390 -41 432 3 420 0 227 -48 268 103 443 22
通常根据构造的检验统计量来命名假设检验方法。
2018/10/12
10
4.确定 P 值
P值的含义:由H0所规定的总体作随机抽样,获得等于
及大于现有样本统计量值的概率。 怎样确定P值:构造的检验统计量服从相应的分布,查
相应分布界值表确定P值。
一般双侧检验查双侧界值,单侧检验查单侧界值。
2018/10/12
11
5.作出推断结论
P与检验水准α相比作出推断结论
P≤ α,拒绝H0,接收H1
(在H0成立的前提下,一次随机抽样发生了小概率事件)
P> α,不能拒绝H0
(在H0成立的前提下,一次随机抽样没有发生小概率事件,没有充
足的理由拒绝H0 )
2018/10/12
12
例7-2的假设检验的基本步骤
①H0:μ=3 (新疗法使患者锻炼持续时间的平均增加量等于常规疗法的3分钟 ) H1:μ≠3
2018/10/12 24
例3 测得25例女性患者的血红蛋白(Hb),其均数为 150 (g/L),,标准差为16.5 (g/L)。而当地正常成年女性
的Hb均数为132 (g/L),问该病女性患者的Hb含量是否
与正常女性Hb含量不同?
2018/10/12
25
单样本设计t检验可解决问题
X 0
3. 选择检验方法,计算检验统计量
4. 确定 P 值 5. 作出推断结论
2018/10/12
7
1. 建立假设(H0和H1) ,确定单双侧检验
建立假设(H0和H1) H0 零假设或原假设(null hypothesis)
通常为两总体参数相等或服从某分布;
H1 备择假设(alternative hypothesis)
推断结论和两类错误 检验结果 实际情况 拒绝H0 第Ⅰ类错误 (α) 不拒绝H0 结论正确(1-α)
H0真
H0 不真
结论正确 (1-β)
第Ⅱ类错误(β)
2018/10/12
18
一 、假设检验的两类错误
第Ⅰ类错误
犯第Ⅰ类错误概率为α α 的意义
α 的取值
第Ⅱ类错误
犯第Ⅱ类错误概率为β β 的意义 β 的取值
2
假设检验(hypothesis test)
假设检验是一种重要的工具。
假设检验(hypothesis test)是依据样本间存在差异,
来对样本所对应的总体间是否存在差别作出判
断的一种方法。
2018/10/12
3
假设检验的思维逻辑
反证法
小概率事件的推断原理
小概率事件在一次观察或实验中是几乎不可能出现 的。
3. 自身前后或左右处理结果进行比较
例 某儿科采用静脉注射人血丙种球蛋白治疗小儿急 性毛细支气管炎。对其用药前后患者血清中免疫球蛋 白进行比较,以确认静脉注射人血丙种球蛋白是否有 效
2018/10/12
34
配对设计t检验可解决的问题
d 0
d ? 0
2018/10/12
35
配对设计t检验的假设检验步骤
2018/10/12 19
α与β关系示意图
2018/10/12 20
二、假设检验的功效
概念: 1-β 称为假设检验的功效(power of a test)
统计学意义:如果两个总体参数间确实存在差异,使用假设检验
方法能够发现这种差异(即拒绝)的能力被称为检验效能(power of
test)。一般情况下要求检验效能应在0.8以上。
6 3.23 2.93 0.30
7 2.27 2.24 0.03
8 2.48 2.55 -0.07
9 3.03 2.82 0.21
10 3.07 3.05 0.02
11 3.61 3.58 0.03
12 2.69 2.66 0.03
13 3.09 3.20 -0.11
14 2.98 2.92 0.06
2018/10/12
29
配对设计的设计形式
1. 异体配对:将两个不同的受试对象(按主要非处理因素)配成 特征相近的对子,同对的两个受试对象随机接受两种不同的处 理。 例8.2 例1 某医生研究脑缺氧对脑组织中生化指标的影响,将乳猪按出生 体重配成7对,一组为对照组,一组为脑缺氧模型组。试比较两
乳猪编号 1 2 3 4 组动物脑组织钙泵的含量有无差别? 对照组 试验组 差值d
通常为两总体参数不相等或不服从某分布;
确定单双侧检验
由研究目的及专业知识所决定 从备择假设H1 看: H1:μ≠μ0(μ>μ0和μ< μ0)
H1 : 0 (双侧检验 two-sides test) H1 : 0或 0 (单侧检验 one-sided test)
2018/10/12 8
推断,不论做出那种推断结论,都有可能发生
错误。
2018/10/12
16
一 、假设检验的两类错误
第Ⅰ类错误与第Ⅱ类错误的概念
将假设检验的结果与实际情况相比:
第Ⅰ类错误(typeⅠerror):H0为真时,拒绝H0
第Ⅱ类错误(type Ⅱ error) : H0不真时,不拒绝H0
2018/10/12
17
例 某医院用某新药与常规药治疗婴幼儿贫血,将20名贫 血患儿随机等分两组,分别接受两种药物治疗,测得血 红蛋白增加量(g/L)如下,问新药与常规药的疗效有无 差别?
新药组 常规药组 24 14 36 18 25 20 14 15 26 22 34 24 23 21 20 25 15 27 19 23
完全随机设计类型(两种形式)
1.从同一个同体中随机抽取两个样本,分别采用两种不同 的处理,比较不同处理结果是否有差异。 A A B 2.从两个总体中随机抽取两个样本,两样本信息不同,推 断两总体信息是否不同。 A B
A
B
38
B
2018/10/12
完全随机设计类型(两种形式)
例8.3 例8.4 例8.6
2018/10/12 13
建立假设,确定单双侧检验 确定检验水准
选定检验方法,计算检验统计量
确定P值
P≤α
作出推断结论
P>α
拒绝H0,接受H1
2018/10/12
不能拒绝H0
14
第三节 两类错误及检验效能
假设检验的两类错误
假设检验的功效
2018/10/12
15
一 、假设检验的两类错误
假设检验是根据有限的样本信息对总体作
2018/10/12
21
t检验 ( t-test )
单样本设计的t检验
配对设计的t检验 完全随机设计(成组设计)的t检验
2018/10/12
22
每种不同设计类型的t检验均主要从以下四个方面介绍:
1. 设计类型 2. 可解决的问题
3. 假设检验步骤
4. 适用条件
2018/10/12
23
(一)单样本设计的t检验one-sample t-test
2018/10/12
5 0.3544 0.3113 0.0431
6 0.3450 0.2955 0.0495
7 0.3050 0.2870 0.0180
30
0.3550 0.2755 0.0795
0.2000 0.2545 -0.0545
0.3130 0.1800 0.1330
0.3630 0.3230 0.0400
2018/10/12
40
(新疗法使患者锻炼持续时间的平均增加量不等于常规疗法的3分钟 )
②检验水准α=0.05 ③
t
43 1.5 / 50
4.7140
50 1 49
P 0.001
④查界值表,自由度近似取50,可得到
⑤拒绝零假设,接受备择假设,可以认为“新疗法使患者锻炼持续时间的平均增加 量不等于常规疗法的3分钟”
作出推断结论
P>α
不能拒绝H0
27
单样本设计t检验的适用条件
独立性 independence 正态性 normality
如何判断资料是否服从正态分布 从经验或专业知识判断 需作正态性检验(见第四节)
2018/10/12
28
(二)配对设计的t检验paired samples t-test
配对设计是研究者为了控制可能存在的主要非处理因 素而采用的一种试验设计方法。 配对设计常见的设计形式 异体配对 同一样品,采用两种不同处理 同体配对 自身前后或左右配对
2018/10/12
39
完全随机设计类型(两种形式)
例 某市于1973年和1993年抽查部分12岁男童对其生长 发育情况进行评估,其中身高的有关资料如下,试比较这 两个年度12岁男童身高均数有无差别。
1973年:n=120 1993年:n=153 均数=139.9 cm 标准差=7.5 cm 均数=143.7 cm 标准差=6.3 cm
H0:μ d=0 H1: μ d≠0
α=0.05
d 0 t t ( ), n 1 Sd / n
查ν=n-1的t界值表,确定P值
P≤α
拒绝H0,接受H1
2018/10/12
作出推断结论
P>α
不能拒绝H0
36
配对设计t检验的适用条件
独立性 正态性
2018/10/12
37
(三) 完全随机设计t检验(两独立样本t检验) (two independent samples t-test)
2.确定检验水准α(size of a test)
检验水准α:为预先规定的小概率事件的标准 通常取值0.05或0.01
可根据研究目的进行调整
2018/10/12
9
3.选择检验方法,计算检验统计量
应根据研究目的、资料类型、设计类型及样本含量大小
等因素选择合适的假设检验方法; 在H0成立的前提下,由样本已知信息构造检验统计量;
配对设计的设计形式
例2 为了研究孪生兄弟的出生体重是否与其出生顺序有关,共收 集了15对孪生兄弟的出生顺序和出生体重,数据如下:
编号
先出生 后出生 差值d
1 2.79 2.69 0.10
2 3.06 2.89 0.17
3 2.34 2.24 0.10
4 3.41 3.37 0.04
5 3.48 3.50 -0.02
?
0
26
2018/10/12
单样本设计t检验的假设检验步骤
H0:μ =μ
0
H 1 : μ ≠μ 0 (双侧) μ >μ 0或μ <μ 0 (单侧)
α=0.05
X 0 t S/ n
t ( ), n 1
查ν=n-1的t界值表,确定P值
P≤α
拒绝H0,接受H1
2018/10/12
标准差为1.5分钟。该新疗法使患者锻炼持续时间的平均
增加量是否多于常规疗法的3分钟?
2018/10/12
5
?
0
0
0
X 0是由抽样误差所致
X 0是由两总体异质性所致
2018/10/12
6
假设检验的基本步骤
1. 建立假设(H0和H1) ,确定单双侧检验 2. 确定检验水准α
1
490
2
397
3
512
4
401
5
470
6
415
7
431
8
429
9
420
10
275
11
165
12
421
2018/10/12
32
配对设计的设计形式Байду номын сангаас
例2 用两种方法测定12份血清样品中Mg2+含量(mmol/L)的结 果见下表,试问两种方法测定结果有无差异?
2018/10/12
33
配对设计的设计形式
2018/10/12
4
例7.2 某医生研究一种新的治疗充血性心力衰竭的方法。
对50位心功能在2~3级之间的成年男性患者进行4周的
治疗,考察其疗效。评价疗效的一个指标是锻炼持续时 间的增加量(分钟)。以前常规的治疗方法能使患者的锻 炼持续时间平均增加3分钟。该医生通过50位接受新方 法治疗的患者的数据算得锻炼持续时间平均增加4分钟,
单样本设计
例8.1 例2 已知中学一般男生的心率平均值为74次/分钟,为了 研究经常参加体育锻炼的中学生心脏功能是否与一般 的中学生相同,在某地区中学随机抽取常年参加体育 锻炼的男生16名,测量他们的心率,结果分别为55、 72、58、57、70、75、72、69、61、67、69、73、59、 71、53、69。请作统计推断。