雷静卫生统计学-第九章 卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/4/29
2检验的应用
1)单个样本分布的拟合优度检验 2)推断两个或多个总体率(或构成比)之间有无差
别; 3)配对设计的资料中,除可检验两者有无差别外,
还可推断两变量间有无相关关系。
2020/4/29
一、2分布和拟合优度检验
(一) 2分布:是一种连续型随机变量的概率分布。
如果Ζ服从标准正态分布,那么Ζ2服从自由
的一致性,此时宜用一致性检验,或称kappa 检验;还可通过 T 检验(公式9-11)来判定两 变量的概率分布是否相同。
2020/4/29
➢完成课堂练习3 : 第6. 7.题
2020/4/29
2020/4/29
行×列表资料 检2 验的注意事项
1.一般认为,行×列表中的理论频数不应小于1, 或 1T5 的格子数不宜超过格子总数的1/5。 若出现上述情况,可通过以下方法解决:①最 好是增加样本含量,使理论频数增大;②根据 专业知识,考虑能否删去理论频数太小的行或 列,能否将理论频数太小的行或列与性质相近 的邻行或邻列合并;③改用双向无序 R×C列 表的Fisher确切概率法。
2020/4/29
注意:
➢ 两样本率比较的资料,既可用Ζ检验也可用
2 检验来推断两总体率是否有差别,且在不
校正的条件下两种检验方法是等价的,对同一
份资料有 2 2
2020/4/29
三、配对设计资料的2检验
• 配对设计的四格表资料,就是将含量为n 的一份随机样本同时按照两个二项分类 的属性进行交叉分类,形成2行2列的交 叉分类表。数据形式如下表:
2020/4/29
(二)拟合优度检验
• 以例9-1为例
H 0 :总体分布为N(139.48,7.302)的正态分布 H 1 :总体分布不是N(139.48,7.302)的正态分布
0.05
2020/4/29
基本思想:表9-1
• 将变量x分割为k个组段,列成频数表的形式;
• 用Ai表示第i个组段的频数;
• 当P>α时,接受H0
• 当P≤α时,拒绝H0
注意事项:
1)2值的大小与组数有关,分组不同拟合的结果 可能不同;一般要求每组中理论频数不小于5, 否则需要合并;
2)拟合优度2检验的样本含量要足够大,否则需 要进行连续性校正,校正公式为:
2020/4/29
2 ( Ai Ti 0.5)2 Ti
例1.某医院分别以中医和中西医结合两种疗法治 疗乙型脑炎患者238例,结果如下表。问两种治 疗方法的疗效有无差别?
0.05
2020/4/29
四格表2检验的基本思想:
➢ 作理论频数(T)与实际频数(A)之差的检验。
➢ 值2 反映了实际频数与理论频数吻合的程度。
➢ 基本公式:
2
(AT)2
T
பைடு நூலகம்
2020/4/29
➢ T值是在假设H0 成立的条件下,求得的理论频数
TR C
nR .nC n
➢ TRC 表示R行C列的理论频数
2020/4/29
行×列表资料 2 检验的注意事项
2.多个样本率比较,若所得统计推断为拒绝
H0,接受H1时,只能认为各总体率之间总
的来说有差别,但不能说明任两个总体率 之间皆有差别。要进一步推断哪两两总体 率之间有差别,需进一步做多个样本率的 多重比较(卡方分割P164)。
2020/4/29
行×列表资料 2 检验的注意事项
α = 0.05
2
(ad b)c2n
(ab)c (d)a (c)b (d)
按ν=1 查χ2界值表得P值,下结论。
2020/4/29
➢ 在有关系的前提下,若须进一步分析关系的密
切程度时,可计算Pearson列联系数 r p
2 rp n 2
r p 取值范围在之间。0表示完全独立;
1表示完全相关;愈接近于0,关系愈不 密切;愈接近于1,关系愈密切。
多个样本率比较时,有R行2列,如表9-6的形式; 两个样本构成比比较时,有2行C列,如表9-7; 多个样本构成比比较,有R行C列,称为R×C表。 以上3种情况可统称为独立样本行×列表资料。
2020/4/29
行×列表资料检验的专用公式:
2 n(
A2 1)
nRnC
(行数-1)(列数-1)
例9.3;9.4
2020/4/29
配对设计四格表的一般形式
方法1 阳性
方法2 阳性 阴性
a
b
合计 n1
阴性
c
d
n2
合计
m1
m2
n
2020/4/29
1.两法检验结果有无差别的检验:
(阳性检出率是否不同)
2 (b c)2
bc
ν=1
若观察频数b+c < 40,需对χ2值进行校正
2(b | c|1)2
bc
2020/4/29
∴对于等级资料(即有序分类资料),在比
较各处理组的效应有无差别时,应该用 秩和检验。 2检验只能说明各处理组结 构是否均衡,但不能很好的反映效应是 否有差别。
2020/4/29
五、配对R×R表资料的2 :
➢ 用两种检测方法同时对同一批样品进行测定, 测定结果用3个或3个以上的等级表示。
➢ 如表9-11 ➢ 其研究目的通常是分析两种检测方法测定结果
分组
中医组 中西医 结合组
合计
乙型脑炎的两种疗法比较
治愈 未愈 合计 人数 人数
44
74
118
70
50
120
114 124 238
治愈率 (%) 37.3 58.3
47.9
2020/4/29
3.作出统计结论: 以 =1 查 2界值表,
若 P0.05,按 0.05检验水准拒绝H0, 接受H1 ,可认为两总体率不同; 若 P0.05,按 0.05检验水准不拒绝 H0 ,不能可认为两总体率不同。
➢ nR 为相应行的合计,nC 为相应列的合计
➢ n 为总例数
2020/4/29
2 (AT)2
T
求得χ2 值,按ν =(R - 1)(C - 1)
查附表8 χ2 界值表(P482),得P值。 同一自由度下,χ2值越大,
相应的概率P值越小。
2020/4/29
2.计算检验统计量
(1)当总例数 n40且所有格子的 T 5 时:
• 用Pi表示在H0成立的条件下,样本值落在第i组段的 概率;
• Ti表示根据H0确定的理论频数, Ti=n Pi
• 计算
2
(Ai Ti)2 Ti
• 该2值近似地服从自由度为k-1的2分布。如果计算Ti 时有s个总体参数是用样本统计量代替的,此时自由
度为:ν=k-1-s
2020/4/29
• 按此自由度查附表8,确定概率P
c2
(AT0.5)2 T
c2=(a
(|ad-bn2)c2n|+)b(c+)d(a+)(bc+)d
2020/4/29
2.计算检验统计量 (3)当总例数 n40或 T 1时, 用四格表资料的Fisher确切概率法。
P161 例9.3
例1
2020/4/29
例9-3 将病情相似的淋巴瘤患者随机分为两组,分 别予以单纯化疗与复合化疗,问两疗法的总体 缓解率是否不同?
使用基本公式或四格表资料的专用公式;当
P时,改用四格表资料的Fisher确切概率法。
基本公式: 2
(AT)2 T
四格表专用公式 :2(ab)c((add )ba () c2cn)b (d)
2020/4/29
2.计算检验统计量
(2)当总例数 n40且只有一个格子 1T5
时:用检验的校正公式或改用四格表资料的 Fisher确切概率法。
2020/4/29
R×C列联表资料的关联性分析(略)
小结: 1.完全随机设计四格表卡方检验 2.配对设计四格表卡方检验
讨论:P175 分析计算题 1.
2020/4/29
四、独立样本行×列表资料的2检验
应用: ➢ 多个样本率的比较 ➢ 两个或多个构成比(样本频率分布)
的比较
2020/4/29
其基本数据有以下3种情况:
3.医学期刊中常见的:不论表中两个分类变量 是有序还是无序,均用卡方检验进行分析, 这种做法是不妥的,对于有序的R×C表资料 不宜用卡方检验。因为行×列表资料的检验 与分类变量的顺序无关,无论将任何两行( 或两列)频数互换,所得值皆不变,结论相 同。
2020/4/29
行×列表资料 2 检验的注意事项
例2.有56份咽喉涂抹标本,把每份标本依同样的 条件分别接种于两种白喉杆菌培养基上,观察白 喉杆菌生长情况,观察结果如下表。问两种培养 基的阳性结果有无差别?
两种白喉杆菌培养基培养效果比较
甲培养基
乙培养基
+
-
合计
+
22
18
40
-
2
14
16
合计
24
32
56
2020/4/29
2.两法检验结果有无关系(联): H0 :两法结果无关联 H1 :两法结果有关联
分组
中医组 中西医 结合组
合计
乙型脑炎的两种疗法比较
治愈 未愈 合计 人数 人数
44
74
118
70
50
120
114 124 238
治愈率 (%) 37.3 58.3
47.9
2020/4/29
二、完全随机设计的四格表 2 检验
2检验的步骤: 1.建立检验假设
H 0 :1 ,2两总体率相等 H 1 :1 2,两总体率不等
度为1的2分布,其概率密度曲线在(0,+∞)
区间上表现为L形,如图9-1中ν=1的曲线。
假设有ν个相互独立的标准正态分布的随机
变量Ζ1,Ζ2,…,Ζν,那么 122 22
的分布称为服从自由度为ν的2分布,记作
2
2020/4/29
2分布的特征: ➢当自由度ν>1时,随ν的增加, 曲线逐渐趋于对称; ➢当自由度趋于∞时,2分布逼近 正态分布。 2分布的临界值表,见P482附表8.
组别 单纯化疗
两种疗法缓解率比较
缓解
未缓解
2(4.8) 10(7.2)
合计 12
缓解率(%) 16.7
复合化疗 14(11.2) 14(16.8) 28
50.0
合计
16
24
40
40.0
2020/4/29
例1.某医院分别以中医和中西医结合两种疗法治 疗乙型脑炎患者238例,结果如下表。问两种治 疗方法的疗效有无差别?
2检验的应用
1)单个样本分布的拟合优度检验 2)推断两个或多个总体率(或构成比)之间有无差
别; 3)配对设计的资料中,除可检验两者有无差别外,
还可推断两变量间有无相关关系。
2020/4/29
一、2分布和拟合优度检验
(一) 2分布:是一种连续型随机变量的概率分布。
如果Ζ服从标准正态分布,那么Ζ2服从自由
的一致性,此时宜用一致性检验,或称kappa 检验;还可通过 T 检验(公式9-11)来判定两 变量的概率分布是否相同。
2020/4/29
➢完成课堂练习3 : 第6. 7.题
2020/4/29
2020/4/29
行×列表资料 检2 验的注意事项
1.一般认为,行×列表中的理论频数不应小于1, 或 1T5 的格子数不宜超过格子总数的1/5。 若出现上述情况,可通过以下方法解决:①最 好是增加样本含量,使理论频数增大;②根据 专业知识,考虑能否删去理论频数太小的行或 列,能否将理论频数太小的行或列与性质相近 的邻行或邻列合并;③改用双向无序 R×C列 表的Fisher确切概率法。
2020/4/29
注意:
➢ 两样本率比较的资料,既可用Ζ检验也可用
2 检验来推断两总体率是否有差别,且在不
校正的条件下两种检验方法是等价的,对同一
份资料有 2 2
2020/4/29
三、配对设计资料的2检验
• 配对设计的四格表资料,就是将含量为n 的一份随机样本同时按照两个二项分类 的属性进行交叉分类,形成2行2列的交 叉分类表。数据形式如下表:
2020/4/29
(二)拟合优度检验
• 以例9-1为例
H 0 :总体分布为N(139.48,7.302)的正态分布 H 1 :总体分布不是N(139.48,7.302)的正态分布
0.05
2020/4/29
基本思想:表9-1
• 将变量x分割为k个组段,列成频数表的形式;
• 用Ai表示第i个组段的频数;
• 当P>α时,接受H0
• 当P≤α时,拒绝H0
注意事项:
1)2值的大小与组数有关,分组不同拟合的结果 可能不同;一般要求每组中理论频数不小于5, 否则需要合并;
2)拟合优度2检验的样本含量要足够大,否则需 要进行连续性校正,校正公式为:
2020/4/29
2 ( Ai Ti 0.5)2 Ti
例1.某医院分别以中医和中西医结合两种疗法治 疗乙型脑炎患者238例,结果如下表。问两种治 疗方法的疗效有无差别?
0.05
2020/4/29
四格表2检验的基本思想:
➢ 作理论频数(T)与实际频数(A)之差的检验。
➢ 值2 反映了实际频数与理论频数吻合的程度。
➢ 基本公式:
2
(AT)2
T
பைடு நூலகம்
2020/4/29
➢ T值是在假设H0 成立的条件下,求得的理论频数
TR C
nR .nC n
➢ TRC 表示R行C列的理论频数
2020/4/29
行×列表资料 2 检验的注意事项
2.多个样本率比较,若所得统计推断为拒绝
H0,接受H1时,只能认为各总体率之间总
的来说有差别,但不能说明任两个总体率 之间皆有差别。要进一步推断哪两两总体 率之间有差别,需进一步做多个样本率的 多重比较(卡方分割P164)。
2020/4/29
行×列表资料 2 检验的注意事项
α = 0.05
2
(ad b)c2n
(ab)c (d)a (c)b (d)
按ν=1 查χ2界值表得P值,下结论。
2020/4/29
➢ 在有关系的前提下,若须进一步分析关系的密
切程度时,可计算Pearson列联系数 r p
2 rp n 2
r p 取值范围在之间。0表示完全独立;
1表示完全相关;愈接近于0,关系愈不 密切;愈接近于1,关系愈密切。
多个样本率比较时,有R行2列,如表9-6的形式; 两个样本构成比比较时,有2行C列,如表9-7; 多个样本构成比比较,有R行C列,称为R×C表。 以上3种情况可统称为独立样本行×列表资料。
2020/4/29
行×列表资料检验的专用公式:
2 n(
A2 1)
nRnC
(行数-1)(列数-1)
例9.3;9.4
2020/4/29
配对设计四格表的一般形式
方法1 阳性
方法2 阳性 阴性
a
b
合计 n1
阴性
c
d
n2
合计
m1
m2
n
2020/4/29
1.两法检验结果有无差别的检验:
(阳性检出率是否不同)
2 (b c)2
bc
ν=1
若观察频数b+c < 40,需对χ2值进行校正
2(b | c|1)2
bc
2020/4/29
∴对于等级资料(即有序分类资料),在比
较各处理组的效应有无差别时,应该用 秩和检验。 2检验只能说明各处理组结 构是否均衡,但不能很好的反映效应是 否有差别。
2020/4/29
五、配对R×R表资料的2 :
➢ 用两种检测方法同时对同一批样品进行测定, 测定结果用3个或3个以上的等级表示。
➢ 如表9-11 ➢ 其研究目的通常是分析两种检测方法测定结果
分组
中医组 中西医 结合组
合计
乙型脑炎的两种疗法比较
治愈 未愈 合计 人数 人数
44
74
118
70
50
120
114 124 238
治愈率 (%) 37.3 58.3
47.9
2020/4/29
3.作出统计结论: 以 =1 查 2界值表,
若 P0.05,按 0.05检验水准拒绝H0, 接受H1 ,可认为两总体率不同; 若 P0.05,按 0.05检验水准不拒绝 H0 ,不能可认为两总体率不同。
➢ nR 为相应行的合计,nC 为相应列的合计
➢ n 为总例数
2020/4/29
2 (AT)2
T
求得χ2 值,按ν =(R - 1)(C - 1)
查附表8 χ2 界值表(P482),得P值。 同一自由度下,χ2值越大,
相应的概率P值越小。
2020/4/29
2.计算检验统计量
(1)当总例数 n40且所有格子的 T 5 时:
• 用Pi表示在H0成立的条件下,样本值落在第i组段的 概率;
• Ti表示根据H0确定的理论频数, Ti=n Pi
• 计算
2
(Ai Ti)2 Ti
• 该2值近似地服从自由度为k-1的2分布。如果计算Ti 时有s个总体参数是用样本统计量代替的,此时自由
度为:ν=k-1-s
2020/4/29
• 按此自由度查附表8,确定概率P
c2
(AT0.5)2 T
c2=(a
(|ad-bn2)c2n|+)b(c+)d(a+)(bc+)d
2020/4/29
2.计算检验统计量 (3)当总例数 n40或 T 1时, 用四格表资料的Fisher确切概率法。
P161 例9.3
例1
2020/4/29
例9-3 将病情相似的淋巴瘤患者随机分为两组,分 别予以单纯化疗与复合化疗,问两疗法的总体 缓解率是否不同?
使用基本公式或四格表资料的专用公式;当
P时,改用四格表资料的Fisher确切概率法。
基本公式: 2
(AT)2 T
四格表专用公式 :2(ab)c((add )ba () c2cn)b (d)
2020/4/29
2.计算检验统计量
(2)当总例数 n40且只有一个格子 1T5
时:用检验的校正公式或改用四格表资料的 Fisher确切概率法。
2020/4/29
R×C列联表资料的关联性分析(略)
小结: 1.完全随机设计四格表卡方检验 2.配对设计四格表卡方检验
讨论:P175 分析计算题 1.
2020/4/29
四、独立样本行×列表资料的2检验
应用: ➢ 多个样本率的比较 ➢ 两个或多个构成比(样本频率分布)
的比较
2020/4/29
其基本数据有以下3种情况:
3.医学期刊中常见的:不论表中两个分类变量 是有序还是无序,均用卡方检验进行分析, 这种做法是不妥的,对于有序的R×C表资料 不宜用卡方检验。因为行×列表资料的检验 与分类变量的顺序无关,无论将任何两行( 或两列)频数互换,所得值皆不变,结论相 同。
2020/4/29
行×列表资料 2 检验的注意事项
例2.有56份咽喉涂抹标本,把每份标本依同样的 条件分别接种于两种白喉杆菌培养基上,观察白 喉杆菌生长情况,观察结果如下表。问两种培养 基的阳性结果有无差别?
两种白喉杆菌培养基培养效果比较
甲培养基
乙培养基
+
-
合计
+
22
18
40
-
2
14
16
合计
24
32
56
2020/4/29
2.两法检验结果有无关系(联): H0 :两法结果无关联 H1 :两法结果有关联
分组
中医组 中西医 结合组
合计
乙型脑炎的两种疗法比较
治愈 未愈 合计 人数 人数
44
74
118
70
50
120
114 124 238
治愈率 (%) 37.3 58.3
47.9
2020/4/29
二、完全随机设计的四格表 2 检验
2检验的步骤: 1.建立检验假设
H 0 :1 ,2两总体率相等 H 1 :1 2,两总体率不等
度为1的2分布,其概率密度曲线在(0,+∞)
区间上表现为L形,如图9-1中ν=1的曲线。
假设有ν个相互独立的标准正态分布的随机
变量Ζ1,Ζ2,…,Ζν,那么 122 22
的分布称为服从自由度为ν的2分布,记作
2
2020/4/29
2分布的特征: ➢当自由度ν>1时,随ν的增加, 曲线逐渐趋于对称; ➢当自由度趋于∞时,2分布逼近 正态分布。 2分布的临界值表,见P482附表8.
组别 单纯化疗
两种疗法缓解率比较
缓解
未缓解
2(4.8) 10(7.2)
合计 12
缓解率(%) 16.7
复合化疗 14(11.2) 14(16.8) 28
50.0
合计
16
24
40
40.0
2020/4/29
例1.某医院分别以中医和中西医结合两种疗法治 疗乙型脑炎患者238例,结果如下表。问两种治 疗方法的疗效有无差别?