统计方法卡方检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卡方检验用途:
可以对两个率或构成比以及多个率或构成比间的差异做统计学检验
第一节. 四格表资料的χ2检验
例8.1 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见表8.1,问铅中毒病人和对照人群的尿棕色素阳性率有无差别?
表8.1 两组人群尿棕色素阳性率比较
组别阳性数阴性数合计阳性率%
病人29(18.74) 7(17.26) 36 80.56
对照9(19.26)28(17.74) 37 24.32
合计38 35 73 52.05
卡方检验的基本思想
表1中29、7、9、28是构成四格表资料的四个基本格子的数字,其余行合计和列合计以及总的合计都可以根据该四个数字推算出来,故该类资料被称为四格表资料
四格表卡方检验的步骤
以例8.1为例
1.建立假设:
H0:π1 = π2
H1:π1≠π2
α=0.05
四格表的四格子里的数字是实际数,在表1中四个数字旁边括号中的四个数字为理论数,其含义是当无效假设成立的时候,理论上两组人群各有多少阳性和阴性的人数。
若H0:π1=π2成立→p1=p2=p
即假设两组间阳性率无差别,阳性率都是等于合计的52.05%,那么
铅中毒病人36人,则理论上有
36 ╳52.05%=18.74人为阳性;
对照组37人,则理论上有
37 ╳52.05%=19.26人为阳性。
故每个实际数所对应的理论数算法是,该实际数对应的行和乘列和再除以总的N样本含量。
即TRC=nR nC / n
2.计算理论数
第1行1列: T11=36×38/73= 18.74
依次类推T12 = 17.26
T21 = 19.26
T22 = 17.74
四格表中理论数的两大特征:
(1)理论频数表的构成相同,即不但各行构成比相同,而且各列构成比也相同;
(2)各个基本格子实际数与理论数的差别(绝对值)相同。
一、卡方检验基本公式
A: 实际数 T: 理论数
卡方检验的基本思想是看理论数与实际数的吻合程度
上述公式中卡方统计量的大小取决于实际数和理论数的相差大小情况,如果无效假设成立的话,那么实际数和理论数不应该相差过大,所以卡方统计量应该较小,而如果卡方统计量越大,则越有可能推翻无效假设而得出有统计差异的结论。 3.计算χ2值
4.确定P 值,作出统计推论 自由度ν=(行-1)(列-1) = 1
χ2 = 23.12 >χ2 0.05(1) = 3.84,
故P <0.05,按α=0.05 水准拒绝H0,接受H1 ,故可以认为两总体阳性率有差别,即铅中毒病人有尿棕色素增高现象。 二、 四格表专用公式
表8.1 两组人群尿棕色素阳性率比较 组别 阳性数 阴性数 合计 病人 29(a) 7(b) 36(a+b)
对照 9(c) 28(d) 37(c+d) 合计 38(a+c) 35(b+d) 73(n)
四格表资料还可以用专用的公式来计算卡方值
a, b, c, d 各代表四格表中四个实际数
例8.1中计算χ2值也可用此公式结果和前面一致
三. 四格表的校正
条件: 当n>=40 且 1= 校正公式: 或 例8.2 某矿石粉厂生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎。后随机抽取15 名工人穿新防护服,其余仍穿原用的防护服,一个月后检查两组工人的皮肤炎患病情 况,资料见表8.2,问两组工人患病率有无差别? 表8.2 两组工人皮肤炎患病率比较 由表可见,n>40且有1 由于理论数的计算方法是: TRC=nR nC / n 分母大家都一样,所以最小理论数的计算: Tmin=行和最小*列和最小/ n 四格表卡方要不要校正,只要计算最小理论数就可以判断了。 1.建立假设: H0:π1 = π2 H1:π1≠π2 α=0.05 2.计算χ2 3. 确定P值,作统计推论 χ2 =2.94 <χ2 0.05(1) = 3.84,P >0.05,差异无统计学意义, 按α=0.05水准,不拒绝H0, 故不能认为穿不同防护服的两组工人的皮肤炎患病率有差异。 结果相同,结论一致 注意:当n<40或出现T<1时,校正法也不行,要用精确检验法直接计算概率。四格表的确切概率法 条件:n<40,或有理论数T<1 Fisher’s exact test P= (a+b)!(c+d) !(a+c) !(b+d) !/ a ! b ! c ! d ! n ! 第二节配对四格表资料的χ2检验 例8.3 某研究室用甲乙两种血清学方法检验鼻咽癌患者血清93份,结果两法都是阳性的45份,都是阴性的20份;甲法阳性但乙法阴性的22份,甲法阴性但乙法阳性的6份。问两法检出率有无差别? 表8.4 两种血清学检验结果比较 甲法乙法合计 +— +45(a) 22(b) 67 -6(c) 20(d) 26 合计51 42 93 配对计数资料的计算公式: 当b+c>40 b+c<40 检验步骤: 1.建立假设: H0:两法总体检出率无差别 H1:两法总体检出率不同 α=0.05 2.计算χ2值 3. 确定P值,作出统计推论 自由度ν=1 χ2=8.04>χ20.05(1)=3.84,查χ2界值表得P<0.005,按α=0.05水准,拒绝H0,接受H1,故可以认为甲乙两法血清学阳性检出率不同,甲法的阳性检出率较高。 第三节行×列表的卡方检验 适用于多个(两个组以上)的率或构成比差别的显著性检验。 一、多个率比较