统计方法卡方检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


2
( A T 0.5) 2 ( 14 11.16 0.5) 2 11.16 ( 18 20.84 0.5) 2 20.84 2.94

T ( 1 3.84 0.5) 2
3.84 ( 10 7.16 0.5) 2 7.16

结果相同,结论一致 注意:当 n<40 或出现 T<1 时,校正法也不行,要用精确检验法直接计算概率。
2 n(
A2 1) nR nC
一、 多个率比较 例 8.4 某省观察三个地区的花生污染黄曲霉毒素 B1 的情况,见表 8.5,问三个地区花生污 染黄曲霉毒素 B1 污染率有无差别? 表 8.5 三地花生黄曲霉毒素 B1 污染率 地区 甲 乙 丙 合计 检验的样品数 合计 污染率 % 未污染 污染 6 23 29 79.3 30 8 44 14 3 40 44 11 84 31.8 27.3 47.6

A2 432 1882 1) 492( nR nC 245 50 245 301
14 2 552 ... 1) 163.01 245 141 78 141
3.确定 P 值 自由度ν =(3 – 1)(3 – 1) = 4,χ2 =163.01>χ 2 0.05(4)=9.49, P<0.05,按α =0.05 水准, 拒绝 H0,接受 H1,故认为矽肺期次与肺门密度有关联,结合本资料认为肺门密度有随矽 肺期次增高而增加的趋势。 第四节 行×列表的χ2 分割法。行×列表χ2 检验拒绝 H0 时,只能得到总体有差别的结 论。χ2 分割法可得到进一步的结论。 例 8.7 对例 8.4 三个地区花生污染率的分析结果作进一步的两两比较。 由表 8.5 可知乙丙两地污染率差异最小,将它们分割后见表 8.8 表 8.8 χ2 分割计算表 步骤 地区 未污染 污染 合计 污染率χ2 υ 分 乙 30 14 44 31.8 % 0.09 1 # P
合计 99 68 93 28 288 由表 8.6 可知, 第 2 行第 4 列对应的合计数最小, 故该格的理论数最小, 即 T24= 112× 28/288 = 10.89> 5,符合 R× C 表卡方检验条件。
1、建立假设: H0:鼻咽癌患者与眼科病人血型构成比相同 H1:鼻咽癌患者与眼科病人血型构成比不全相同 2. 计算χ2 值 α =0.05
卡方统计量
卡方检验用途: 可以对两个率或构成比以及多个率或构成比间的差异做统计学检验 第一节 . 四格表资料的χ 2 检验 例 8.1 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿 棕色素定性检查,结果见表 8.1,问铅中毒病人和对照人群的尿棕色素阳性率有无差别? 表 8.1 两组人群尿棕色素阳性率比较 组别 阳性数 阴性数 合计 阳性率% 病人 29(18.74) 7(17.26) 36 80.56 对照 9(19.26)28(17.74) 37 24.32 合计 38 35 73 52.05 卡方检验的基本思想 表 1 中 29、 7、 9、28 是构成四格表资料的四个基本格子的数字,其余行合计和列合计以及 总的合计都可以根据该四个数字推算出来,故该类资料被称为四格表资料 四格表卡方检验的步骤 以例 8.1 为例 1.建立假设: H0: π 1 = π 2 H1: π 1≠ π2 α= 0.05 四格表的四格子里的数字是实际数,在表 1 中四个数字旁边括号中的四个数字为理论数, 其含义是当无效假设成立的时候,理论上两组人群各有多少阳性和阴性的人数。 若 H0:π 1= π 2 成立 → p1= p2= p 即假设两组间阳性率无差别,阳性率都是等于合计的 52.05% ,那么 铅中毒病人 36 人,则理论上有 36 ╳ 52.05%=18.74 人为阳性; 对照组 37 人,则理论上有 37 ╳ 52.05%=19.26 人为阳性。 故每个实际数所对应的理论数算法是, 该实际数对应的行和乘列和再除以总的 N 样本含 量。 即 TRC=nR nC / n 2.计算理论数
32 1) 17.91 11 40
自由度ν =(3 – 1)(2 – 1) = 2 χ 2 =17.91> χ 2 0.05(2)=5.99 P< 0.05,差异有统计学意义, 按α=0.05 水准, 拒绝 H0,接受 H1,故可认为三个地区花生污染黄曲霉毒素 B1 污染率不全相等。 【注意事项】 1. 不宜有 1/5 以上格子的理论数小于 5,或有小于 1 的理论数。 处理方法: 1)增加样本含量 2)去除理论数过太小的行或列 3)合并理论数太小的性质相近的行或列 2. 如检验结果拒绝检验假设,只能认为各总体率或总体构成比之间总的来说有差别,但不 能说明它们彼此之间有差别或两两之间有差别。 二、 多个构成比比较 例 8.5 某医院研究鼻咽癌患者与眼科病人的血型构成情况有无不同,资料如表 8.6,问其 血型构成有无差别? 表 8.6 鼻咽癌患者与眼科病人血型构成比较 组别 A型 患者 55 眼科病人 44 B 型 O 型 AB 型 合计 45 57 19 176 23 36 9 112
2 n(
A2 552 452 1) 288( nR nC 176 99 176 68
57 2 92 ... 1) 2.56 176 93 112 28
3.确定 P 值 自由度ν =(2 – 1)(4 – 1) = 3 χ2 =2.56<χ2 0.05(2)=7.81 P> 0.05,差异有统计学意
义, 按α=0.05 水准,不拒绝 H0,故不能认为鼻咽癌患者与眼科病人血型构成有差别。 三、双向有序分类资料的关联性检验 例 8.6 某矿工医院探讨矽肺不同期次患者的胸部平片密度变化,492 例患者资料整理如表 8.7,问矽肺患者肺门密度的增加与期次有无关系? 表 8.7 不同期次矽肺患者肺门密度级别分布 矽肺期次 + ++ +++ 合计 Ⅰ Ⅱ Ⅲ 43 1 6 188 96 17 14 72 55 245 169 78
检验步骤 1、建立假设: H0:三个地区花生污染黄曲霉毒素 B1 污染率相等 H1:三个地区花生污染黄曲霉毒素 B1 污染率不全相等 α =0.05 2. 计算χ2 值
2 n(
...
3.确定 P 值
A2 62 232 1) 84( nR nC 29 44 29 40
2
A T 2
( A T ) 2 (29 18.74) 2 (7 17.26) 2 T 18.74 17.26 2 2 (9 19.26) (28 17.74) 23.12 19.26 17.74
2
4.确定 P 值,作出统计推论 自由度ν =(行-1)(列-1) = 1 χ 2 = 23.12 >χ 2 0.05(1) = 3.84, 故 P< 0.05,按α =0.05 水准拒绝 H0,接受 H1 ,故可以认为两总体阳性率有差别,即 铅中毒病人有尿棕色素增高现象。 二、 四格表专用公式 表 8.1 两组人群尿棕色素阳性率比较 组别 阳性数 阴性数 合计 病人 29(a) 7(b) 36(a+b) 对照 9(c) 28(d) 37(c+d) 合计 38(a+c) 35(b+d) 73(n) 四格表资料还可以用专用的公式来计算卡方值
2
(ad bc)2 n (a b)(c d )(a c)(b d )
a, b, c, d 各代表四格表中四个实际数 例 8.1 中计算χ2 值也可用此公式结果和前面一致
(29 28 7 9) 2 73 23.12 36 37 38 357
2
( 118 14 10 43 / 2) 2 43 15 28 11 32
2.94
3. 确定 P 值,作统计推论 χ 2 =2.94 < χ 2 0.05(1) = 3.84 , P > 0.05,差异无统计学意义 , 按 α =0.05 水准,不拒绝 H0, 故不能认为穿不同防护服的两组工人的皮肤炎患病率有差异。
合计 50 301 141 492 1、建立假设: H0:矽肺期次与肺门密度无关联 H1:矽肺期次与肺门密度有关联 α =0.05 第 3 行第 1 列合计数最小, 最小理论数为 T31= 78×50/492= 7.93> 5, 符合 R×C 表卡方检 验条件。 2. 计算χ2 值
2 n(
2
三 . 四格表的校正 条件: 当 n>=40 且 1=<T<5 校正公式 :

2
A T 0.5
T
2
2

( ad bc n / 2)2 (a b)(c d )(a c)(b d )
例 8.2 某矿石粉厂生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎。后随机抽 取 15 名工人穿新防护服,其余仍穿原用的防护服,一个月后检查两组工人的皮肤炎患病情 况,资料见表 8.2,问两组工人患病率有无差别? 表 8.2 两组工人皮肤炎患病率比较 防护服 阳性 阴性 合计
配对计数资料的计算公式: 当 b+c>40
2
b+c<40
(b c) 2 bc

2
( b c 1) 2 bc
检验步骤: 1.建立假设: H0:两法总体检出率无差别 H1:两法总体检出率不同 α= 0.05 2.计算χ 2 值

2
( b c 1) 2 bc

( 22 6 1) 2 22 6

1(3.84)
14(11.16)
15

10(7.16)
18(20.84)
28
合计
11
32
43
由表可见, n>40 且有 1<T<5,故应用校正公式,步骤如下: 由于理论数的计算方法是: TRC=nR nC / n 分母大家都一样,所以最小理论数的计算: Tmin=行和最小*列和最小 / n 四格表卡方要不要校正,只要计算最小理论数就可以判断了。 1.建立假设: H0:π 1 = π2 H1: π 1≠ π2 α= 0.05 2.计算χ2
TRC
nR nc n
第 1 行 1 列 : T11= 36× 38/73= 18.74 依次类推 T12 = 17.26 T21 = 19.26 T22 = 17.74 四格表中理论数的两大特征: ( 1)理论频数表的构成相同,即不但各行构成比相同,而且各列构成比也相同; ( 2)各个基本格子实际数与理论数的差别(绝对值)相同。 一、卡方检验基本公式
四格表的确切概率法
条件: n< 40,或有理论数 T< 1 Fisher’ s exact test P= ( a+b)!(c+d) !(a+c) !(b+d) !/ a!b!c!d!n! 第二节 配对四格表资料的χ2 检验 例 8.3 某研究室用甲乙两种血清学方法检验鼻咽癌患者血清 93 份,结果两法都是阳性的 45 份,都是阴性的 20 份;甲法阳性但乙法阴性的 22 份,甲法阴性但乙法阳性的 6 份。问 两法检出率有无差别? 表 8.4 两种血清学检验结果比较 甲 法 乙 法 合 计 + — + - 合计 45(a) 6(c) 51 22(b) 20(d) 42 67 26 93
T A: 实际数 T: 理论数 卡方检验的基本思想是看理论数与实际数的吻合程度 上述公式中卡方统计量的大小取决于实际数和理论数的相差大小情况,如果无效假设成立
的话,那么实际数和理论数不应该相差过大,所以卡方统计量应该较小,而如果卡方统计 量越大,则越有可能推来自百度文库无效假设而得出有统计差异的结论。 3.计算χ 2 值
8.04
3. 确定 P 值,作出统计推论 自由度ν =1 χ2 =8.04>χ2 0.05(1)=3.84,查χ2界值表得 P< 0.005,按α=0.05 水准,拒绝 H0, 接受 H1,故可以认为甲乙两法血清学阳性检出率不同,甲法的阳性检出率较高。 第三节 行×列表的卡方检验 适用于多个(两个组以上)的率或构成比差别的显著性检验。
相关文档
最新文档