x2检验——精选推荐
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x2检验
本章重点
1.熟悉x2检验的基本思想。
2.掌握x2检验在四格表资料、行×列表资料中的应用。
3.掌握配对计数资料的x2检验。
χ2 检验是一种用途广泛的假设检验方法,本章只介绍它在分类变量资料中的应用: χ2 检验的适用范围:
1.推断两个或两个以上总体率或构成比之间有无差异;
2.配对计数资料差异的显著性。
检验统计量:χ2
应用:计数资料
第一节 四格表资料的χ2 检验
目的:推断两个总体率(构成比)是否有差别
要求:两样本的两分类个体数排列成四格表资料
一、四格表资料的基本公式
x2检验基本思想
检验“实际数”和假设“理论数”的差异是否是由于抽样误差引起(两个样本率的差异体现在“实际数”和假设“理论数”的差异中)。
实际数,用四格表表示,称为四格表资料,分别为a 、b 、c 、d ,其他的数据是从这四个实际数推算出来的,称为理论数(表中括号内的数据)。
实际数用A 表示,理论数T 表示。
A :表示实际频数,即实际观察到的例数。
T :理论频数,即如果假设检验成立,应该观察到的例数。
TRC :第R 行C 列的理论频数
nR :相应的行合计,
nC :相应的列合计
n 为总例数
检验统计量χ2 值反映了实际频数与理论频数的吻合程度。
Χ2检验是检验实际数与理论数差异程度的指标。
A 与T 的值越接近, χ2越小,相反,实际数与理论数之间的差数越大, χ2值也就越大。
所得χ2值如果小于界值的χ2,P>0.05,即接受了原假设,可认为两组人群的治疗效果差异无统计学意义。
反之,如果所得χ2值大于查表所得χ2值,则P<0.05,即差异有统计学意义。
自由度计算公式
Χ2值的大小,除了取决于A-T 的差值外,还取决于格子数的多少,格子数越多, χ2值越大,只有排除了这种影响, χ2值才能正确反映A 与T 的吻合程度,因此,在查χ2表时,要考虑自由度的大小。
22(), ()(1)A T T
χν-=∑=-行数-1列数 R C RC n n T n
=
计算公式:V=(行-1)(列-1) 四格表资料由2行2列组成,V=(2-1)(2-1)=1
自由度即自由变动的范围,由于四格表周边的合计数已经固定,因此只要算出任一格的理论数,其余三个格子的理论数就没有自由变动的余地了,四格表的自由度V=1。
x2分布界值
自由度一定时,P 值越小, x2值越大。
当P 值一定时,自由度越大, x2越大。
v =1时, P =0.05, x2 =3.84
P =0.01, x2 =6.63
P =0.05时,v =1, x2 =3.84
v =2, x2 =5.99
假设检验步骤
(1) 建立检验假设,确定检验水平。
H 0:π1=π2 即试验组与对照组的总体有效率相等
H 1:π1≠π2 即试验组与对照组的总体有效率不等
α=0.05。
(2)求检验统计量值
(3) 确定P 值,作出推断结论
二、四格表资料检验的专用公式
三、四格表资料检验的校正公式
χ2分布是一连续型分布,而四格表资料属离散型分布,由此计算得的 χ2统计量的抽样分布亦呈离散性质。
为改善χ2 统计量分布的连续性,则需行连续性校正、。
Χ2 连续性校正仅用于ν =1 的四格表资料,当ν≥2 时,一般不作校正。
四格表资料χ2 检验公式的选择:
n ≥40,T ≥5,专用公式;
,校正公式; 22()()()()()ad bc n a b a c b d c d χ-=++++22(0.5)c A T T χ--=∑40, 15
n T ≥≤<22(), ()(1)A T T χν-=∑=-行数-1列数22()2()()()()
c n |a
d -bc |-n =a+b c+d a+c b+d χ
,直接计算概率。
第二节 行×列表资料的χ2检验
x2检验不仅用于两个样本率来推断两个总体率是否相同,还可以检验多个样本率或构成比以推断多个总体率或构成比是否相同。
比较多个样本率或构成比之间的差异,做R ×C 表x2检验。
检验统计量
行×列表x2检验注意事项 1. 若1/5的理论频数小于5,应增大样本含量或将相临的两行或两列合并。
2. 总的结论有统计学意义,即有差异,并不说明任意两组间都有差异,做行×列表的分割才能检验任意两组间是否有差异。
3. 有些资料不适合做x2检验,如单向有序的行×列表(等级资料)。
第三节 配对四格表资料的 χ2 检验
思想:每一次实验对象分别给予不同的处理,或同一实验对象先后给予不同的处理,所得到的记录或结果,对实验方法进行检验。
配对设计的四格表资料的x2检验是对两种处理的阳性率是否相等的一种检验方法。
一般形式
注意:a 、b 、c 、d 代表的是对子数 上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:
① A 、B 两种检测方法皆为阳性数(a );
② A 、B 两种检测方法皆为阴性数 (d );
③ A 法为阳性、B 法为阴性数 (b );
④ A 法为阴性、B 法为阳性数 (c )。
表8-5 A 、B 两种培养基的培养结果 B 培养基 A 培养基 + -
合计 + 48(a ) 24(b ) 72 - 20(c ) 106(d )
126 合计 68 130
198
∑-=T T A 2
2)(χ40 1
n T <<或22(1)(1)(1)
R C
A n n n χν=-=--∑行数列数
其中,a , d 为两法观察结果一致的两种情况,
b ,
c 为两法观察结果不一致的两种情况。
检验统计量
条件:
当b+c >40时,使用前者;
当b+c ≤40时,使用后者。
注意:
本法一般用于样本含量不太大的资料。
因为它仅考虑了两法结果不一致的两种情况(b , c ),而未考虑样本含量n 和两法结果一致的两种情况(a , d )。
所以,当 n 很大且 a 与 d 的数值很大(即两法的一致率较高),b 与 c 的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。
检验步骤:
习题
1.对于总合计数n 为400的4个样本率的资料做检验,其自由度为( D )
A .399
B .395
C .1 D.3 E.8
2.四个样本率做比较, x2 > x2 (0.05,3)可认为( A )
A.各总体率不等或不全相等
B. 各总体率均不相等
C.各样本率均不相等
D. 两个样本率相等
E. 各样本率不等或不全相等
3.从甲、乙两文中,查到同类研究的两个率的比较的四格表资料,甲99%,乙文95%,可认为( C )
A .两文结果有矛盾
B .两文结果基本一致
C .甲文结果更可信
D .甲文结果不可信
E .甲文说明总体的差别大
c b c b +-=22)(χ, 1=ν c b c b c +--=2
2)1(χ, 1=ν
0H :C B =,1H :C B ≠, 05.0=α。