第八讲 x2检验

合集下载

x2检验——精选推荐

x2检验——精选推荐

x2检验本章重点1.熟悉x2检验的基本思想。

2.掌握x2检验在四格表资料、行×列表资料中的应用。

3.掌握配对计数资料的x2检验。

χ2 检验是一种用途广泛的假设检验方法,本章只介绍它在分类变量资料中的应用: χ2 检验的适用范围:1.推断两个或两个以上总体率或构成比之间有无差异;2.配对计数资料差异的显著性。

检验统计量:χ2应用:计数资料第一节 四格表资料的χ2 检验目的:推断两个总体率(构成比)是否有差别要求:两样本的两分类个体数排列成四格表资料一、四格表资料的基本公式x2检验基本思想检验“实际数”和假设“理论数”的差异是否是由于抽样误差引起(两个样本率的差异体现在“实际数”和假设“理论数”的差异中)。

实际数,用四格表表示,称为四格表资料,分别为a 、b 、c 、d ,其他的数据是从这四个实际数推算出来的,称为理论数(表中括号内的数据)。

实际数用A 表示,理论数T 表示。

A :表示实际频数,即实际观察到的例数。

T :理论频数,即如果假设检验成立,应该观察到的例数。

TRC :第R 行C 列的理论频数nR :相应的行合计,nC :相应的列合计n 为总例数检验统计量χ2 值反映了实际频数与理论频数的吻合程度。

Χ2检验是检验实际数与理论数差异程度的指标。

A 与T 的值越接近, χ2越小,相反,实际数与理论数之间的差数越大, χ2值也就越大。

所得χ2值如果小于界值的χ2,P>0.05,即接受了原假设,可认为两组人群的治疗效果差异无统计学意义。

反之,如果所得χ2值大于查表所得χ2值,则P<0.05,即差异有统计学意义。

自由度计算公式Χ2值的大小,除了取决于A-T 的差值外,还取决于格子数的多少,格子数越多, χ2值越大,只有排除了这种影响, χ2值才能正确反映A 与T 的吻合程度,因此,在查χ2表时,要考虑自由度的大小。

22(), ()(1)A T Tχν-=∑=-行数-1列数 R C RC n n T n=计算公式:V=(行-1)(列-1) 四格表资料由2行2列组成,V=(2-1)(2-1)=1自由度即自由变动的范围,由于四格表周边的合计数已经固定,因此只要算出任一格的理论数,其余三个格子的理论数就没有自由变动的余地了,四格表的自由度V=1。

8.无序分类资料的统计推断—X2检验

8.无序分类资料的统计推断—X2检验

8 无序分类资料的统计推断—— χ2检验χ2检验(chi-square test )是一种用途较广的假设检验方法,这里仅介绍它在分类变量资料中的应用,检验两个或两个以上的样本率或构成比之间的差异是否有统计意义。

8.1 四格表资料的χ2检验四格表即2 ⨯ 2列联表,其自由度df =1,又分为一般与配对两种情形,本节介绍一般四格表的χ2检验,主要是用来推断两个总体率或构成比之间有无差别。

一般四格表,①在总频数n ≥40且所有理论频数≥5时,用Pearson χ2统计量;②在总频数n ≥40且有理论频数<5但≥1时,用校正χ2统计量;③在总频数n <40或有理论频数<1时,用Fisher 精确概率法检验。

计数资料的数据格式有两种,一种是频数表格式,如表8-1;一种是原始记录格式,如前面第4章统计描述中的表4-3,这两种格式在SPSS 操作时有所不同。

例8-1 欲研究内科治疗对某病急性期和慢性期的治疗效果有无不同,某医生收集了182例采用内科疗法的该病患者的资料,数据见表8-1。

请分析不同病期的总体有效率有无差别?表8-1 两种类型疾病的治疗效果组别 有效 无效 合计 有效率(%)急性期 69 37 106 65.1 慢性期 30 46 76 39.5 合计998318254.4解 这是一般四格表,012:H ππ=,即急性期和慢性期的总体有效率相同。

建立3列4行的数据文件,如图8-1,其中行变量r 表示组别(值标签:1=“急性期”、2=“慢性期”),列变量c 表示疗效(值标签:1=“有效”、2=“无效”),freq 表示频数。

1.指定频数变量 选择菜单Data →Weight cases ,弹出Weight cases 对话框,见图8-2;选中Weight cases by ;在左边框中选中频数freq ,并将其送入Frequency 框中;单击OK 。

图8-1 例8.1数据文件 图8-2 Weight cases 对话框2.进行χ2检验 选择菜单Analyze → Descriptive Statistics → Crosstabs (交叉表),弹出Crosstabs 主对话框;将组别r 送入行变量Row(s)框,将疗效c 送入列变量Column(s)框,如图8-3。

卫生统计学:第八章 χ2检验

卫生统计学:第八章   χ2检验

-
6(c)
54(d)
60
合计
30
90
120
配对四格表资料的χ2检验
配对设计
对子号


1
+
+
2
+
-



120
-
-
成组设计
编号 剂量组 结果
1

+
2

+



120

-
甲、乙两种真菌培养基的培养结果


合计
(+)
(-)
(+) 24(a) 36(b) 60
(-) 6(c) 54(d) 60
合计 30
90
6
4
2
9
2.19*
0.0568*
8
7 1
3 10
3.19
0.0065
8
2
9
0
11
4.19
0.0002
* 为实际数据的四格表
d )!
!:阶乘
例8.4
表8.12 某中药制剂预防HIV垂直传播临床试验
组别
新生儿HIV阴性 新生儿HIV阳性 合计
中药制剂
6(a)
4(b)
10
对照组
2(c)
9(d)
11
合计
8
13
22
N=22<40,采用Fisher确切概率计算法 周边合计最小是8,共计可获得8+1=9种组合的四格表
Fisher’s exact probability
=2, x2 =5.99

X2检验

X2检验

X2(称卡方)检验用途较广,但主要用于检验两个或两个以上样本率或构成比之间差别的显著性,也可检验两类事物之间是否存在一定的关系。

一、两个率的比较(一)X2检验的基本公式下页末行的例3.1是两组心肌梗塞病人病死率的比较,见表3.5,其中对照组未用抗凝药。

两组病人的病死率不同,抗凝药组为25.33%,对照组为40.8%。

造成这种不同的原因可能有两种:一种是仅由抽样误差所致;另一种是两个总体病死率确实有所不同。

为了区别这两种情况,应当进行X2检验。

其基本步骤如下:1.首先将资料写成四格表形式,如表3.6。

将每个组的治疗人数分为死亡与生存两部分,各占四格表中的一格,这些数字称为实际频数,符号为A,即实际观察得来的数字。

2.建立检验假设为了进行检验,首先作检验假设:两种疗法的两总体病死率相等,为35%(即70/200),记为H0:π1=π2。

即不论用或不用抗凝药,病死率都是35%,所以亦可以换一种说法:病死率与疗法无关。

上述假设经过下面步骤的检验后,可以被接受也可以被拒绝。

当H0被拒绝时,就意味着接受其对立假设即备择假设H1。

此例备择假设为两总体病死率不相等,记为H1:π1≠π2因为我们观察的是随机现象,所以无论是接受或拒绝H0都冒有一定风险,即存在着错判的可能性。

一般要求,当错误地被拒绝的概率α不超过一定的数值,如5%(或0.05),此值称为检验水准,记为α=0.05。

3.计算理论频数根据“检验假设”推算出来的频数称理论频数,符号为T。

计算方法如下:假设两总体病死率相同,都是35.0%,那么抗凝血组治疗75人,其死亡的理论频数应为75×35.0%=26.25人,而生存的理论频数为75-26.25=48.75人。

用同样方法可求出对照组的死亡与生存的理论频数,前者为43.75人。

后者为81.25人。

然后,把这些理论频数填入相应的实际频数格内,见表3.6括号内数字。

计算理论频数也可用下式(3.4)TRC=nRnC/N (3.4)式中,TRC为R行与C列相交格子的理论频数,nR为与计算的理论频数同行的合计数,nC为与该理论频数同列的合计数,N为总例数。

x2检验.

x2检验.
服从x2分布,计算出x2值后,查表判断这么大的 x2是否为小概率事件,以判断建设检验是否成立。
χ2分布(chi-square distribution)
0.5 0.4 0.3
f ( ) 2( / 2) 2
2
1
2

( / 21)
e
2 / 2
ß ×¸ Ý
2 0.05(6)
2 2 0.05(6) 12.59 由于
1.
2. 3.
建立假设 H0:不同地区的人群血型分布构成相同 H1:不同地区的人群血型分布构成不同或不全相同 α=0.05 计算检验统计
3212 A2 n 1 2592 1080 987 nR nC
A1 A2
a+b c+d n=a+b+c+d
四格表统计量公式
当n≥40,T≥5时
2 ( A T ) 2 RC RC TRC
ad bc n 2 a c a b c d b d
2
四格表统计量公式
当n≥40,1≤T<5时
2 ( A T 0.5) 2 T
n ad bc n 2 2 a c a b c d b d
2
A T
2
T 411.25 19.81 20.58 297.59
321 41.25
2

444 358.15
358.15
2
4.
v=(3-1)(4-1)=6, 则P<0.05,拒绝H0,认为三个地区的人群血型分布构成不同或不全相同。 查χ2界值表

第八讲 x2检验

第八讲 x2检验
2 2
A:表示实际频数,即实际观察到的例数。 T:理论频数,即如果假设检验成立,应该观察到的 例数。 nR nC TRC n 自由度=(R-1)x(C-1) R行数, C列数, nR是ARC所在行的合计,nC是ARC所在列的合计
(3) 确定P 值,作出推断结论
0.5 0.4 0.3
纵高
0.2 0.1 0.0 0 3 6 9 12 卡方值
自由度=1 自由度=2 自由度=3 自由度=6
15
18
当自由度 确定后, 2 分布曲线下右侧尾 部的面积为 时,横轴上相应的 2 值记作 2,
x2分布界值


自由度一定时,P值越小, x2值越大。 当P 值一定时,自由度越大, x2越大。 v=1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, v=1, x2 =3.84 v=2, x2 =5.99
直接计算表内四个格子数据的各种组合的概 率,然后计算单侧或双侧累计概率,并与检 验水准比较,作出是否拒绝H0的结论
配对四格表χ2检验

一般形式
甲属性 + 合计

乙属性 + a c a+c b d b+d
合计 a+b c+d n=a+b+c+d
注意:a、b、c、d代表的是对子数
配对四格表差异性检验统计量公式
2 2 4. 由于 0.05(6)
则P<0.05,拒绝H0,认为 民族与血型分布有关。
行×列表χ2检验注意事项
1. 若1/5以上格子的理论频数小于5,或至少有1格子 的理论频数小于1,要处理。 进一步增大样本含量 将相临的两行或两列合并(注意合理性) 2. 总的结论有统计学意义,即有差异,并不说明任意 两组间都有差异,做行×列表的分割才能检验任意 两组间是否有差异 3. 有些资料不适合做x2检验,如单向有序的行×列表 (等级资料)

X2检验的基本思想

X2检验的基本思想

甲法
+ - 合计
配对四格表资料示意
乙法
+

a
b
c
d
a+c
b+d
合计
a+b c+d n(a+b+c+d)
x2=
(b-c)2 b+c
x2=
(|b-c|-1)2 b+c
b+c≥40 b+c<40
行×列表资料的X2检验: 一二、、基基本本公数式据:有x五2=种n(情∑况:nARn2C -1) 1、多个样本率的比较:为R行2列 2、两个样本构成比的比较:为2行C列 3、多个样本的构成比比较:为R×C列 4、双向无序分类资料的关联性检验:为R×C列 5、双向有序分类资料的关联性检验:为R×C列
例:某矿工医院探讨矽肺不同期次患者的胸部平片密 度变化,492例患者资料整理成如下表,问矽肺患者肺门 密度的增加与期次有无关系?
不同期次矽肺患者肺门密度级别分布
矽肺期次
肺门密度级别
+
++
+++
合计
I
43
188
14
245
II
1
96
72
169
III
6
合计
50
17
55
78
301
141
492
四格表资料的Fisher确切概率法 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV 的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非 预防组,结果见表。问两组新生儿的HBV总体感染率有无 差别?
x2=∑
(A-T)2 T

X2检验

X2检验

X2检验X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。

主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系,检验频数分布的拟合优度。

X2检验类型有:四格表资料X2检验(用于两样本率的检验),行×列表X2检验(用于两个及两个以上样本率或构成比的检验), 行×列列联表X2检验(用于计数资料的相关分析)。

在SPSS中,所有X2检验均用Crosstabs完成。

Crosstabls过程用于对计数资料和有序分类资料进行统计描述和统计推断。

在分析时可以产生二维至n维列联表,并计算相应的百分数指标。

统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)。

如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。

Crosstabs过程不能产生一维频数表(单变量频数表),该功能由Frequencies 过程实现。

界面说明【Rows框】用于选择行*列表中的行变量。

【Columns框】用于选择行*列表中的列变量。

【Layer框】Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。

如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。

Layer在这里用的比较少,在多元回归中我们将进行详细的解释。

【Display clustered bar charts复选框】显示重叠条图。

【Suppress table复选框】禁止在结果中输出行*列表。

【Statistics】按钮弹出Statistics对话框,用于定义所需计算的统计量。

Chi-square复选框:计算X2值。

Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。

Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。

第8章χ2检验ppt课件

第8章χ2检验ppt课件
(31 )(41 )6
P < 0.05 ,在α=0.05检验水准下,拒绝H0,
认为三个不同地区的人群血型分布总体构成比有差 别。
多个样本率间的多重比较
➢χ2分割法(partitions of χ2 method)
➢Scheffe’可信区间法 ➢SNK法
行×列表的分割
➢重新规定检验水准: I型错误的概率不变。
χ2分布是一连续型分布,而四格表资料属 离散型分布,由此计算得的 χ2统计量的抽 样分布亦呈离散性质。为改善χ2 统计量分 布的连续性,则需行连续性校正 (correction for continuity)。
Χ2 连续性校正仅用于ν =1 的四格表资料,当 ν≥2 时,一般不作校正。
四格表资料χ2 检验公式的选择:
5
2
2.24*
0.041464*
6
1
3.24
0.002962
7
0
4.24
0.000041
8
二、检验步骤(本例n=17<40 )
H 0 : 1 2 , H 1 : 1 2 , 0 . 05
➢ 计算表内四个格子数据的各种组合的概率Pi
➢ (表8-4) 本例(a-T)*=2.24, P* =0.041464
能认为四年级与五年级学生近视眼患病率不等。
本资料若不校正时,
2 5.49 P 0.05
结论与之相反。
四、四格表资料的Fisher确切概率法
❖条件:
n40,或T1, 或P时,
❖理论依据:超几何分布。
❖基本思想
在四格表周边合计数固定不变的条 件下,计算表内4个实际频数变动时的各
种组合之概率Pi ;再按检验假设用单侧 或双侧的累计概率 P ,依据所取的检验

x2检验的注意事项

x2检验的注意事项

x2检验的注意事项
进行x2检验时,有一些注意事项需要考虑。

首先,x2检验是用于检验两个分类变量之间是否存在相关性的统计方法。

在进行x2检验时,需要确保样本数据符合一些前提条件。

首先,样本数据应该是随机抽取的,以确保结果的代表性和可靠性。

其次,样本容量应该足够大,通常要求每个单元格中的期望频数都不低于5,以确保x2检验的准确性。

另外,需要注意的是x2检验是一种非参数检验方法,不对总体分布做出假设,但是对于观测值之间的独立性有一定要求,因此在进行x2检验前需要对数据进行独立性检验。

另外,进行x2检验时,需要注意选择适当的假设。

在x2检验中,零假设通常是指两个变量之间不存在相关性,备择假设则是存在相关性。

根据研究问题和实际情况,选择适当的假设对于结果的解释至关重要。

此外,在进行x2检验时,需要注意对结果的解释。

x2统计量的计算结果需要进行适当的解释,包括对p值的理解以及相关性的强弱程度。

同时,也需要考虑实际意义,避免对统计显著性的过分解读。

最后,需要注意x2检验的局限性。

x2检验只能用于分析两个分类变量之间的相关性,对于其他类型的数据不适用。

另外,x2检验不能说明因果关系,只能说明相关性。

因此,在进行x2检验时,需要综合考虑其他因素,避免过分依赖统计结果。

第八章卡方检验

第八章卡方检验

第八章χ2检验次数资料分析问男女比例是否符合1:1,。

即与1:1性别比差异是否显著性别比差异是否显著。

∑−=T T A 22)(χA —实际次数T —理论次数χ2是度量实际观察次数与理论次数偏离程度的一个统计量论次数偏离程度的一个统计量,,χ2越小越小,,表明实际观察次数与理论次数越接近论次数越接近;;χ2 =0,表示两者完全吻合者完全吻合;;χ2越大越大,,表示两者相差越大相差越大。

∑−−=T T A c 22)5.0(χ当自由度大于当自由度大于1时,时,χχ2分布与连续型随机分布与连续型随机变量χ2分布相近似,这时这时,,可不作连续性矫正,但要求各组内的理论次数不小于5。

若某组的理论次数小于5,则应把它与其相邻的一组或几组合并一组或几组合并,,直到理论次数大于5 为止。

第二节适合性检验一、目的判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验(一)提出无效假设与备择假设(二)计算χ2求理论次数求理论次数::T 白=260×3/4=195T 黑=260×1/4=65表χ2计算表c头,黑色有角牛红色无角牛72头,红色有角牛18头,共360头。

试问这两对性状是否符合孟德尔遗传规律中的遗传比例??9∶3∶3∶1的遗传比例检验步骤检验步骤::(一)提出无效假设与备择假设H :实际观察次数比符合9∶3∶3∶1的理论比例论比例。

H A :实际观察次数比不符合9∶3∶3∶1的理论比例(二)计算χ2T=360×9/16=202.5;黑无T=360×3/16=67.5;黑有;=360×1/16=22.5。

=0.5444+1.6333+1.6333+0.9(三)统计推断χ0.05(3)=7.81,因χ<χ005(3) ,P >0.05,表明实际观察次数与理论次数差异不显著,即两对性状分离现象符合孟德尔遗传规律中9∶3∶3∶1的遗传比例的遗传比例。

研究生医学统计学-X2检验课件

研究生医学统计学-X2检验课件

01
这是为了保证X2统计量的分布接近卡方分布。
每个单元格中的期望数都应该大于5
02
这是为了确保卡方分布的精确性和稳定性。
观察数和期பைடு நூலகம்数之间没有关联
03
这是为了确保X2统计量不受其他因素的影响。
限制条件
1 2
样本量较小
如果样本量较小,X2检验的准确性可能会受到影 响。
分类变量之间存在高度相关性
如果分类变量之间存在高度相关性,X2检验的结 果可能会受到干扰。
X2统计量的解读
X2值的大小表示分类变量之间关系的强度,X2值越大,说明分类变量之 间的关系越强。
X2检验的临界值一般为3.841、6.635等,当X2值大于临界值时,可以认 为分类变量之间存在显著关系。
在解读X2值时,需要考虑样本量和数据分布情况,对于小样本和极端数据 需要进行特殊处理。
X2统计量的优缺点
研究生医学统计学-x2检验课件
目录
CONTENTS
• X2检验的基本概念 • X2检验的假设与限制 • X2检验的统计量与解读 • X2检验的实际应用 • X2检验的软件实现 • X2检验的案例分析
01 X2检验的基本概念
CHAPTER
X2检验的定义
X2检验是一种用于检验分类变量间独 立性的统计方法,也称为卡方检验。 它通过比较实际观测频数与期望频数 之间的差异,来判断变量间的关联性。
谢谢
THANKS
总结词
探讨X2检验在医学研究中如何应用
详细描述
在医学研究中,X2检验常用于分析分类变量之间的关系,如疾病与基因型、治疗方式与疗效等。通过 X2检验,可以判断不同组别之间是否存在显著差异,从而为医学研究提供科学依据。

X2检验的基本思想

X2检验的基本思想

x2=∑
(A-T)2 T
3、确定概率P值:根据x2的自由度υ=(R-1)(C-1), 查x2界值表。
4、判断结果 如果不能拒绝H0,则认为两个样本来自相同的总体,两 样本率的差异在统计学上无显著性;若拒绝H0,认为两样本 来自不同总体,两样本率的差异在统计学上具有显著性。
x2界值与检验假设的关系
x2值反映了实际频数与理论频数的吻合程度。若检验假
17
4
7
-33
7
6
16
3
8
0
8
7
15
2
9
33
9
8
14
1
10
66 0.09120390
10 9
13
0
11
99 0.01289752
χ2检验的基本思想 1899年统计学家K.Pearson提出一种度量实际观察计数
与原假设条件下的期望频数间偏差的统计量,称为 pearson’s χ2检验计量。该统计量定义为:
式中χ为希腊字母,读为“chi”,x2表示Pearson’s x2检验统 计量。为了与其他x2统计量的公式相区别,常称其为x2检 验统计量的基本公式。O表示实际观察的频数。E表示无效 假设下的期望频数。
x2C=∑(1A-T1T-0.5)2
x2C=∑
(1ad-bc1-
(n) 2
)2
(a+b) (c+d) (a+c) (b+d)
注意,最小理论频数TRC的判断:R行与C列中, 行合计数中的最小值与列合计中的最小值所对应格子 的理论频数最小。
配对四格表资料的x2检验 配对设计是将受试对象按某些特征或条件配成对子,
75(83.52)c 21(12.48)d 96(c+d)

第八章 x2检验

第八章 x2检验

实际频数A (actual frequency) ( a、b、c、d) 理论频数T ( theoretical frequency)
2检验的基本思想:
(A T) 基本公式: T
2 2
式中A代表每个格子的实际频数( actual
frequency ),即表中的基本数据;T代表每个格子的
(三)四格表专用公式
当总例数n≥40且所有格子的T ≥5时, 可用χ2检 验的基本公式,也可用下面的专用公式:
(ad bc) n (a b)(c d )(a c)(b d )
2 2
1
疗法 盐酸苯乙双胍 安慰剂 合 计
பைடு நூலகம்
死亡 26 (a) 2 (c) 28 (a+c.)
3.R×C列联表的分割
季节 感染人数 未感染人数 合计 感染率(%)
春 夏
秋 冬 合计 季节 春 感染人 数 12
12 12
29 35 88 未感染 人数 699
699 666
665 717 2747 合计 711
711 678
694 752 2835
1.69 1.77
4.18 4.65 3.10
二、独立样本R×C列联表资料的χ2检验
1. 多个独立样本率的比较(R×2表)
2.多个样本的构成比比较(R×C表)
3.两个样本的构成比比较(2×C表)
R×C表的χ2检验通用公式
基本公式
2
通用公式
2
(A T) A 2 n( 1) T nR nC
2
1.多个独立样本率的比较
( b c 1) 2 , 1 bc
2
(b+c<40)

8分布检验和拟合优度χ2检验.

8分布检验和拟合优度χ2检验.

三、检验步骤
1、双尾检验假设:H0:S1(x)=S2(x) H1:S1(x)≠S2(x) 单尾检验假设: H0:S1(x)=S2(x)或H0:S1(x)=S2(x) H1:S1(x)>S2(x) H1:S1(x)<S2(x) 2、把两组样本分别排成累计频数分布(对两 个分布用相同的间隔或分类,并利用尽可能多 的间隔。 3、计算检验统计量D值,如是单尾检验,应 按H1的方向计算D值。

2、方法
用 Fn(x)表示样本量为n的随机样本观察值的 累计分布函数,且Fn(x) =i/n(i是等于或小于x 的所有观察结果的数目,i=1,2,…,n)。 F(x)表示理论分布的累计概率分布函数。K-S 单样本检验通过样本的累计分布函数Fn(x)和理 论分布函数F(x)的比较来做拟合优度检验。检 验统计量是F(x)与Fn(x)间的最大偏差Dn:
第三节 卡方(X2)拟合优度检验
一、什么是卡方(X2)拟合优度检验 人们通常关心随机变量的概率分布,如:“随机变 量服从参数为n=10和p=2的二项分布”,这样的命 题假设可以用“拟合优度检验”来检验。即设计一 个检验来比较从假设的分布中抽取的样本,看所假 设的分布函数与样本数据是否“拟合”。 所以,拟合检验就是检验抽取样本的总体分布与某 种特定分布的符合程度,也就是检验观察值与理论 数之间的紧密程度。以X2分布为依据的这种检验, 称为X2拟合优度检验
2 2
n1n2 2 54 44 4D 4 (0.406) 15.986 n1 n2 54 44
当α=0.05,df=2时,查得临界值C=5.991。因 X2=15.986>C,故在5%的显著性水平下拒绝Ho,即 高分组的学生智力显著高于低分组的学生。

x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算x2检验(chi-square test)或称卡方检验x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。

可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。

一、四格表资料的x2检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?表20-11 两种疗法治疗卵巢癌的疗效比较表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。

这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。

T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。

这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。

兹以表20-11资料为例检验如下。

检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式(20.13)式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。

第1行1列: 43×53/87=26.2第1行2列: 43×34/87=16.8第2行1列: 44×53/87=26.8第2行2列: 4×34/87=17.2以推算结果,可与原四项实际数并列成表20-12:表20-12 两种疗法治疗卵巢癌的疗效比较因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算x2值按公式20.12代入4.查x2值表求P值在查表之前应知本题自由度。

第八章 x2检验

第八章  x2检验

河南大学医学院授课教案首页预防医学教研室教研室主任签名注:教后记放在讲义最后一页。

基本内容第一节 四格表资料的χ2检验一、2χ检验的基本思想以两样本率比较的2χ检验为例,介绍2χ检验的基本思想。

2χ分布是一种连续型分布 2χ分布的形状依赖于自由度ν的大小,当自由度ν≤2时,曲线呈L 型;随着ν的增加,曲线逐渐趋于对称;当自由度ν→∞时, 2χ分布趋向正态分布。

2χ分布的具有可加性。

表8-1 完全随机设计两样本率比较的四格表处理属性合计 阳性阴性 1)(1111T A )(1212T A 1n (固定值) 2)(2121T A )(2222T A 2n (固定值) 合计 1m 2mn 有时为方便用a 、b 、c 、d 分别为四格表中四个实际频数22211211A A A A 、、、,n =a+b+c+d 。

2χ检验的检验统计量为2χ基本公式(亦称Pearson 2χ) ∑-=T T A 22)(χ (8-1)ν=(行数-1)(列数-1) (8-2)理论频数T 的计算公式 nn n T C R RC .= (8-3)式中RC T 为第R 行(row)第C 列(column)的理论频数,R n 为相应行的合计,c n 为相应列的合计,n 为总例数。

由公式(8-1)可以看出:2χ值反映了实际频数与理论频数的吻合程度,其中TT A 2)(-反映了某个格子实际频数与理论频数的吻合程度。

若检验假设0H 成立,实际频数与理论频数的差值会小,则2χ值也会小;反之,若检验假设0H 不成立,实际频数与理论频数的差值会大,则2χ值也会大。

2χ值的大小还取决于T T A 2)(-个数的多少(严格地说是自由度ν的大小)。

由于各TT A 2)(-皆是正值,故自由度ν愈大,2χ值也会愈大;所以只有考虑了自由度ν的影响,2χ值才能正确地反映实际频数A 和理论频数T 的吻合程度。

2χ检验时,要根据自由度ν查2χ界值表。

当2χ≥2,ναχ时,P ≤α,拒绝0H ,接受1H ;当2,2ναχχ<时,α>P ,尚没有理由拒绝0H 。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


2
b c 1
bc
2
2 11 1
2 11
2
4.92
3. P<0.05 差异有统计学意义。
配对四格表资料的关联性检验

公式与普通四格表检验公式相同 H1:两法的结果相关 α=0.05
1. 建立假设 H0:两法的结果无相关
2. 计算检验统计
ad bc n 2 a c a b c d b d 2 25 15 2 11 53 15.37
配对四格表χ2检验

一般形式
甲属性 + 合计

乙属性 + a c a+c b d b+d
合计 a+b c+d n=a+b+c+d
注意:a、b、c、d代表的是对子数
配对四格表差异性检验统计量公式
当b+c>40时
b c
2
2
bc
,
v 1
当b+c≤40时

2
b c 1

例10-3 为观察婴儿腹泻是否与喂养方式有关, 某医院儿科随机调查了消化不良儿童82例,对 每个个体分别观察腹泻与否和喂养方式两种属 性,结果如下,分析两种属性的关联性。 喂养方式 腹 有 30 17 47 泻 无 10 25 35 合计
人工 母乳 合计
40 42 82
2×2交叉分类表的一般形式及概率表达

四格表资料,若有理论数小于1或n<40,或作
χ2检验后所得概率P接近检验水准α,需要用确 切概率法直接计算概率以作判断。实际上,当 有统计软件条件下,大样本四格表的资料也可 用确切概率检验
四格表确切概率法

确切概率计算方法的基本思想:在四格表边 缘合计固定不变的条件下,利用公式
a b ! c b ! a c ! b d ! p
属性X
X1 Y1 A11 (π11) 属性Y Y2 A12 (π12)
合计
n1(πr1)
X2
合计
A21 (π21)
m1(πc1)
A22 (π22)
m2 (πc2)
n2(πr2)
n(1.0)
基本思想
所谓两属性X和Y互相独立,是指属性X的 概率和属性Y的概率分布无关,否则称这 两种属性之间存在关联性。即
1
1 1 2
x
2
AT
T
2

χ2值反映了实际频数与理论频数的吻合
程度,如果H0成立,则实际频数与理论 频数之差一般不会很大,若实际频数与 理论频数差别很大,出现大的χ2值的概 率P是很小的,P≤α时我们就怀疑假设成 立,因而拒绝假设,若P>α,则没有理 由拒绝它。
基本公式
( ARC TRC ) TRC
2 2
74 63 120 17
3. P>0.05 差异无统计学意义。
四格表资料χ2统计量的校正公式
当n≥40,1≤T<5时
( A T 0.5)2 2 T
n ad bc n 2 2 a c a b c d b d
bc
2
,
v 1
例10-4

用两种不同的方法对53名肺癌患者进行诊断, 结果如下,问两种方法的检测结果有无差别?
甲法 + 合计
乙法 + 25 11 36 2 15 17
合计 27 26 53
1. 建立假设 H0:两方法的检测结果无差别 H1:两方法的检测结果有差别 α=0.05 2. 计算检验统计
a !b !c !d !
直接计算表内四个格子数据的各种组合的概 率,然后计算单侧或双侧累计概率,并与检 验水准比较,作出是否拒绝H0的结论
行×列表χ2检验

公式:
( ARC TRC )2 2 TRC
A2 2 n 1 nR nC
自由度=(R-1)x(C-1) R行数, C列数, nR是ARC所在行的合计,nC是ARC所在列的合计
四格表χ2检验公式
当n≥40,T≥5时
( ARC TRC )2 2 TRC
ad bc n 2 a c a b c d b d
2
1. 建立假设 H0:两药疗效相同 H1:两药疗效不相同 α=0.05 2. 计算检验统计
ad bc n a c a b c d b d 2 68 11 6 52 137 2.74
nri ncj ij ri cj ( )( ) n n
Tij n ij nri ncj n
1. 建立假设 H0:两种属性之间相互独立 H1:两种属性之间相互不独立 α=0.05 2. 计算检验统计
ad bc n a c a b c d b d 2 30 25 10 17 82 9.98
例题10-6

某医院用3种穴位针刺治疗急性腰扭伤民, 数据如下,试比较3 组总体治愈率有无差别。
治愈数 未愈数 合计 治愈率
穴位
后溪穴
人中穴
80
20
18
20
98
40
81.6
50.0
腰痛穴
合计
24
124
38
76
62
200
38.7
62.0
1. 建立假设 H0:3组总体治愈率相等 H1:3组总体治愈率不全相等 α=0.05 2. 计算检验统计
2

例10-2 两种药物治疗葡萄球菌败血症疗效 的试验结果如下,问两种药物的疗效有无差 异? 疗效
药物
有效
无效
合计

乙 合计
28(26.09)
12(13.91) 40
2(3.91)
4(2.09) 6
30
16 46
1. 建立假设 H0:两药疗效相同 H1:两药疗效不同 α=0.05 2. 计算检验统计
表10-1 两种药治疗急性下呼吸道感染有效率比较
处理 A药 B药 合计 有效例数 无效例数 合 计 有效率(%)
68(64.818)a 52(55.182)c 120 (a+c)
6(9.182)b 11(7.818)d 17 (b+d)
74 63
(a+b) (c+d)
91.89 82.54 87.59
2 2 0.05(6) 4. 由于
则P<0.05,拒绝H0,认为 民族与血型分布有关。
行×列表χ2检验注意事项
1. 若1/5以上格子的理论频数小于5,或至少有1格子 的理论频数小于1,要处理。 进一步增大样本含量 将相临的两行或两列合并(注意合理性) 2. 总的结论有统计学意义,即有差异,并不说明任意 两组间都有差异,做行×列表的分割才能检验任意 两组间是否有差异 3. 有些资料不适合做x2检验,如单向有序的行×列表 (等级资料)
例题10-7

某研究者欲比较维吾尔族与回族的血型分布 情况,数据如下,试比较两个民族血型构成 有无差别。
血型
民 族 维吾尔族 回族 合计
A 442 369 811
B 483 384 867
O 416 487 903
AB 172 115 287
合 计 1513 1355 2868
1. 建立假设 H0:两个民族的血型构成比相等 H1:两个民族的血型构成比不相等 α=0.05 2. 计算检验统计
2
a c a b c d b d
2
ad bc n 2 n
2
28 4 2 12 46 2 46 1.69
30 16 40 6
3. P>0.05 差异无统计学意义。
交叉分类2×2表的关联性分析
2 2
40 42 47 35
3. P<0.05 差异有统计学意义。
列联系数(contingency coefficient)
r
2 n
2
0 <r<1
15.347 本例 r =0.18 15.347 484
四格表确切概率法

该方法是由R.A.Fisher提出的,其理论依据是 超几何分布
合计 275 125 84 484
1. 建立假设 H0:民族与血型无关 H1:民族与血型有关 2. α=0.05 3. 计算检验统计
602 702 222 202 2 484 ( 1) 275 122 275 125 84 86 84 151 15.35
2 2
A:表示实际频数,即实际观察到的例数。 T:理论频数,即如果假设检验成立,应该观察到的 例数。 nR nC TRC n 自由度=(R-1)x(C-1) R行数, C列数, nR是ARC所在行的合计,nC是ARC所在列的合计
x2分布界值


自由度一定时,P值越小, x2值越大。 当P 值一定时,自由度越大, x2越大。 v=1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, v=1, x2 =3.84 v=2, x2 =5.99
2
27 26 36 17
3. P<0.05 , 拒绝H0,两种方法的结果存在关联性。
小结



熟悉χ2检验的基本思想。 掌握χ2检验在四表格资料、行×列表资 料中的应用。 了解行×列表的分割法及四表格的确切 概率法。
习题
1.对于总合计数n为400的4个样本率的资料做检验, 其自由度为( ) A.399 B.395 C.1 D.3 E.8 2.当四格表的周边合计不变时,如果某格的实际频数 有变化,则其理论频数( ) A.增大 B.减小 C.不变 D.不确定 E.增大或减少 3.从甲、乙两文中,查到同类研究的两个率的比较的 四格表资料,其 检验,甲文 ,乙文 , 可认为( ) A.两文结果有矛盾 B.两文结果基本一致 C.甲文结果更可信 D.甲文结果不可信 E.甲文说明总体的差别大
相关文档
最新文档