分类资料的假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7
试验结果(outcome)
点数
12
3
4
理论(T) 10 10 10
10
实际(A) 12 13
6
5
差值
-2 -3
4
5
212102131026102
10
10
10
5102 15102 9102
8.00
10
10
10
5
6
10 10 15 9 -5 1
8
基本思想
一种对理论频数和实际频数吻合程 度的考察。
A investigation of the degree of agreement of theoretical(T) frequency and actual(A) frequency
n<40,或T<1 确切概率法(fisher exact test)
23
Βιβλιοθήκη Baidu 表 8.3 某抗生素在艾滋病人中的耐药情况
组别
曾服 未服 合计
耐药 5(3.7)
6 11
不耐药 9 22 31
合计 患病率%
14
35.7
28
21.4
42
26.2
24
卡方检验的连续性校正
2 (AT0.5)2 T
25
四格表专用公式
2 (Ai Ti)2 Ti
9
关于本例的基本思想
H0 : 两 组 的 总 体 有 效 率 相 等 , π1=π2=?
来自一个总体的两样本率的合并率应当能够更 好估计总体率 ,且与两个样本率 的差别还不 会很大。本例计算的合并率即理论的有效率为 81.1%
10
基本思想
如果H0成立,两组应有相同的率,从频数的角度 两组病人就相应有四个理论频数。 A 表示实际观察到的生存数和死亡数 T 表示即理论生存数和死亡数
TRC
nRnc n
113 ×180/222=91.6
17
基本思想
H0:两种药物的总体有效率相等, π1=π2=?
来自一个总体的两样本率的合并率可作为期望的 有效率.H0成立时, 两个样本率与期望率 的差 别还不会很大, 表现为频数间的差别不会很大。
18
基本思想
基于该理论的总体率构造两组相应的四个理 论频数TRC。
2
contents
8.1 完全随机设计两组率的比较 8.2 行列表数据的检验 8.3 多组率的两两比较 8.4配对设计两组率的比较
3
8.1 完全随机设计两组率比较
卡方检验 精确概率法
Karl Pearson 1857~1936
4
8.3四格表资料的卡方检验
表8.1 某试验药和传统对照药治疗念珠菌性外阴阴道炎的疗效比较
8 分类资料的假设检验
余小金 东南大学公共卫生学院 流行病学与卫生统计学系
分类资料的统计描述常用相对数指标
2.4.1 比(ratio) 2.4.2 构成比(proportion) 说明一种事物内
部各组成部分所占的比重或分布。 2.4.3 率(rate) 说明某现象发生的频率或
强度。P=x/n
合计
有效例数 无效例数 合计 有效率(%)
100( a) 13(b) 113
88.5
80(c) 29(d) 109
73.4
180
42
222
81.1
6
基本思想 Basic logic
一个正常的骰子,抛 出后得到六个面的概 率均为1/6。因此, 要判定一个骰子是否 合格,可以通过抛骰 子的方法来进行;
2 (AT)2
T
(10091.6)2 ... ... (2920.6)2
91.6
20.6
8.24.18
(R 1 )C ( 1 )
21
确定p值得出结论
根据近似卡方分布,查 界值表(附表10), =3.84 , 本 例 的 =8.248> , 所 以 ,
P<0.05(P=0.004)。按 =0.05水准拒绝H0 ,接受 H1 ,两组有效率差别有统计学意义,可认为试
n>40且T>5
2 (a d b)2 c n
(a b )c ( d)a ( c)b ( d)
n>40, 1<T<5
2 (a d b cn/2 )2n
(ab )c (d)a (c)b (d)
26
8.4 配对设计两组率
表8.10 两种方法检查结果
凝集法
培养法
合计
+
-
+
50(a ) 40(b )
15
2
检验假设
H0:两种药物的总体有效率相等, π1=π2;
H1:两种药物的总体有效率不相 等,π1≠π2,
α=0.05。
16
计算理论频数
处理 试验药 对照药
合计
有效例数 无效例数 合计 有效率(%)
100( 91.6) 13 113
88.5
80
29 109
73.4
180
42
222
81.1
A11 A12 100 13
A21 A22 80 29
T11
T12
91.6 21.4
T21
T22
88.4 20.6
11
构造反映抽样误差大小的差异统计量
如果H0成立,A和T的差别不应太大,
且有一定的分布规律。通过对差别 大 小的判断,可得到两总体率是否相等 的结论。
2 (AT)2 T
12
关于卡方分布
处理 试验药 对照药
合计
有效例数 无效例数 合计 有效率(%)
100(91.6) 13(21.4) 113
88.5
80(88.4) 29(20.6) 109
73.4
180
42
222
81.1
5
何为四格表资料(four-fold table)
比较目的:总体率是否不等 资料为比较两组两种结果的频数
处理 试验药 对照药
验药与对照药治疗念珠菌性外阴阴道炎的效果不
同,试验药的有效率较高。
2 0.0(11)
6.63
2 0.05 (1)
3.84
22
卡方检验的应用条件
n>=40,T>=5 普通卡方检验(chi square test)
n>=40,1<T<5 校正卡方检验 (adjusted chi square test)
如果H0成立,A和T的差别不应太大,且有
一定的分布规律。通过对差别大小的判断, 可得到两总体率 是否相等的结论。
19
构造反映抽样误差大小的差异统计量
如果H0成立,A和T的差别不应太大,且有
一定的分布规律。通过对差别 大小的判断, 可得到两总体率是否相等的结论。
2 (AT)2 T
20
计算检验统计量χ2值
与自由度有关的连续性偏态分布。 k个相互独立的标准正态变量u的平方和称
为卡方变量,其分布服从卡方分布,自由 度为K-1。u2=χ2 k个实际频数与理论频数之间的相对差别, 在n大于40,理论频数都大于5时,近似服 从卡方分布,自由度为k-1
13
基于卡方分布获得概率
14
χ2检验的步骤
检验假设 计算理论频数和检验统计量 确定P值和判断结论
试验结果(outcome)
点数
12
3
4
理论(T) 10 10 10
10
实际(A) 12 13
6
5
差值
-2 -3
4
5
212102131026102
10
10
10
5102 15102 9102
8.00
10
10
10
5
6
10 10 15 9 -5 1
8
基本思想
一种对理论频数和实际频数吻合程 度的考察。
A investigation of the degree of agreement of theoretical(T) frequency and actual(A) frequency
n<40,或T<1 确切概率法(fisher exact test)
23
Βιβλιοθήκη Baidu 表 8.3 某抗生素在艾滋病人中的耐药情况
组别
曾服 未服 合计
耐药 5(3.7)
6 11
不耐药 9 22 31
合计 患病率%
14
35.7
28
21.4
42
26.2
24
卡方检验的连续性校正
2 (AT0.5)2 T
25
四格表专用公式
2 (Ai Ti)2 Ti
9
关于本例的基本思想
H0 : 两 组 的 总 体 有 效 率 相 等 , π1=π2=?
来自一个总体的两样本率的合并率应当能够更 好估计总体率 ,且与两个样本率 的差别还不 会很大。本例计算的合并率即理论的有效率为 81.1%
10
基本思想
如果H0成立,两组应有相同的率,从频数的角度 两组病人就相应有四个理论频数。 A 表示实际观察到的生存数和死亡数 T 表示即理论生存数和死亡数
TRC
nRnc n
113 ×180/222=91.6
17
基本思想
H0:两种药物的总体有效率相等, π1=π2=?
来自一个总体的两样本率的合并率可作为期望的 有效率.H0成立时, 两个样本率与期望率 的差 别还不会很大, 表现为频数间的差别不会很大。
18
基本思想
基于该理论的总体率构造两组相应的四个理 论频数TRC。
2
contents
8.1 完全随机设计两组率的比较 8.2 行列表数据的检验 8.3 多组率的两两比较 8.4配对设计两组率的比较
3
8.1 完全随机设计两组率比较
卡方检验 精确概率法
Karl Pearson 1857~1936
4
8.3四格表资料的卡方检验
表8.1 某试验药和传统对照药治疗念珠菌性外阴阴道炎的疗效比较
8 分类资料的假设检验
余小金 东南大学公共卫生学院 流行病学与卫生统计学系
分类资料的统计描述常用相对数指标
2.4.1 比(ratio) 2.4.2 构成比(proportion) 说明一种事物内
部各组成部分所占的比重或分布。 2.4.3 率(rate) 说明某现象发生的频率或
强度。P=x/n
合计
有效例数 无效例数 合计 有效率(%)
100( a) 13(b) 113
88.5
80(c) 29(d) 109
73.4
180
42
222
81.1
6
基本思想 Basic logic
一个正常的骰子,抛 出后得到六个面的概 率均为1/6。因此, 要判定一个骰子是否 合格,可以通过抛骰 子的方法来进行;
2 (AT)2
T
(10091.6)2 ... ... (2920.6)2
91.6
20.6
8.24.18
(R 1 )C ( 1 )
21
确定p值得出结论
根据近似卡方分布,查 界值表(附表10), =3.84 , 本 例 的 =8.248> , 所 以 ,
P<0.05(P=0.004)。按 =0.05水准拒绝H0 ,接受 H1 ,两组有效率差别有统计学意义,可认为试
n>40且T>5
2 (a d b)2 c n
(a b )c ( d)a ( c)b ( d)
n>40, 1<T<5
2 (a d b cn/2 )2n
(ab )c (d)a (c)b (d)
26
8.4 配对设计两组率
表8.10 两种方法检查结果
凝集法
培养法
合计
+
-
+
50(a ) 40(b )
15
2
检验假设
H0:两种药物的总体有效率相等, π1=π2;
H1:两种药物的总体有效率不相 等,π1≠π2,
α=0.05。
16
计算理论频数
处理 试验药 对照药
合计
有效例数 无效例数 合计 有效率(%)
100( 91.6) 13 113
88.5
80
29 109
73.4
180
42
222
81.1
A11 A12 100 13
A21 A22 80 29
T11
T12
91.6 21.4
T21
T22
88.4 20.6
11
构造反映抽样误差大小的差异统计量
如果H0成立,A和T的差别不应太大,
且有一定的分布规律。通过对差别 大 小的判断,可得到两总体率是否相等 的结论。
2 (AT)2 T
12
关于卡方分布
处理 试验药 对照药
合计
有效例数 无效例数 合计 有效率(%)
100(91.6) 13(21.4) 113
88.5
80(88.4) 29(20.6) 109
73.4
180
42
222
81.1
5
何为四格表资料(four-fold table)
比较目的:总体率是否不等 资料为比较两组两种结果的频数
处理 试验药 对照药
验药与对照药治疗念珠菌性外阴阴道炎的效果不
同,试验药的有效率较高。
2 0.0(11)
6.63
2 0.05 (1)
3.84
22
卡方检验的应用条件
n>=40,T>=5 普通卡方检验(chi square test)
n>=40,1<T<5 校正卡方检验 (adjusted chi square test)
如果H0成立,A和T的差别不应太大,且有
一定的分布规律。通过对差别大小的判断, 可得到两总体率 是否相等的结论。
19
构造反映抽样误差大小的差异统计量
如果H0成立,A和T的差别不应太大,且有
一定的分布规律。通过对差别 大小的判断, 可得到两总体率是否相等的结论。
2 (AT)2 T
20
计算检验统计量χ2值
与自由度有关的连续性偏态分布。 k个相互独立的标准正态变量u的平方和称
为卡方变量,其分布服从卡方分布,自由 度为K-1。u2=χ2 k个实际频数与理论频数之间的相对差别, 在n大于40,理论频数都大于5时,近似服 从卡方分布,自由度为k-1
13
基于卡方分布获得概率
14
χ2检验的步骤
检验假设 计算理论频数和检验统计量 确定P值和判断结论