医学统计学列联表检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
les
22.14.
H0:“方法”与“疗效”独立,H1:“方法”与“疗效”不独立
双向有序表的检验
1.双向有序且属性相同表(配对四格表)的检验
两个分类变量的标志完全一样且有序排列相同,是相关样本 数据构成的列联表。
例: 用甲乙两种方法检查鼻咽癌患者93例,两法都是阳性的 45例,都是阴性的20例,甲法阳性但乙法阴性的22例,甲法阴 性但乙法阳性的6例。
(3)列联表分析
菜单 “Analyze”|“ Descriptive Statistics”|“ Crosstabs ” 命令
1
将“结果[result]”
点入“Row(s)”
框,将“吸烟情
况[smoke]”点
入“Cloumn(s)”
框。
点击“Statistics”
钮。
2
【Statistics钮】 用于定义所需计 算的统计量。
1
.010
Likelihood Ratio 7.925
1
.005
Fisher's Exact Test
.007
.004
N of Valid Cases 339
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expec 22.14.
独立。
疗法
不加牛黄 加牛黄 合计
疗效 治愈 未愈
合计
32
46
78
76
50
126
108
96
204
. 四格表独立性 检验
例1:某医院收得乙型脑 炎重症病人204例,随机 分成两组,分别用同样的 中草药方剂治疗,但其中 一组加一定量的人工牛 黄,每个病人根据治疗方 法和治疗效果进行分类, 得出如下表格:
健康人 125 138 210 26
合计 189 224 340 46
合计 300 499 799
30046 E14 799 17.275
R,C 2
O 64 86 2 第一行合计数ij ,第四
N(OO 1)799300189300224 列合i,计j1数最i小,j最小 理论频数
01
H0:“患癌”与 “血型”独
双向无序四格表
(1) N≥40,理论频数≥5
2 2,2 (Oij Eij)2 2N(O11O22O12O21)2
i, j1
Eij
O1O2O1O2
(2)N≥40,理论频数小于5(但≥1),用校正卡方统计量
2 2,2 (|OijEij|0.5)2 N(O | 1O 122O1O 221|0.5N)2
例: 甲乙两种疗法治疗某病,问两Ch法i疗-S效q有ua无r差e别Tes ts
组别
有效 Val无ue效
PCeo甲anrt法sionnuiCthyi-C1So4qrura aercet76i..o46n67194b
Li乙ke法lihood R7atio 7.9235
df 合计As(2ym-psi.dSedig)
立,H1:“患癌”与 “血型”不独立
2
2
02
df=(2-1)(4-1) =3,单侧概率 P>0.05,
2
2
210 26 0 4
2
03
11.921 (3)7.815 总体率的差异无统 计意义,不能认为 499340 49946 患鼻咽癌与血型不
0.05
不能以α=0.05水 准的单侧检验拒绝 H0,
Chi-Square Tests
Value Pearson Chi-Square7.469b
Continuity Corraect6i.o6n74
Likelihood Ratio 7.925
Asymp. Sig.Exact Sig.Exact Sig.
df (2-sided) (2-sided) (1-sided)
疗法
疗效 合计
治愈 未愈
不加牛黄 32 46 78
设不加牛黄组治愈总体率为 ,加牛黄组 治愈总体率为 检验 即 “疗法”与“疗效”独立
加牛黄
76
50 126
合计
108 96 204
双向无序列联表:两个分类变量分类标志 无数值大小
p 与先后顺序之分。 1
p2
H0 : p1 p2
H 0:
H0:X与Y独立(即两组总体率相同) 实际频数Oij与理论频数Eij的差异是随机误差, 用
4.1 列联表原理
Crosstabs 过程
第四章 列联表分析
疗效
疗法
合计
治愈 未愈
不加 牛黄
32
46
78
加牛 黄
76
50 126
合计 108 96 204
例1:某医院收得乙型脑炎重症病 人204例,随机分成两组,分别用同 样的中草药方剂治疗,但其中一组 加一定量的人工牛黄,每个病人根 据治疗方法和治疗效果进行分类, 得出如下表格:
1 1
.006 .010
分析:由于最小理论
1
.005 值为22.14,
Fisher's Exact Test N of Valid Cases 339
a. Computed only for a 2x2 table
N = 3 3.90>0470 , 所 以 选.0用04 普通的卡方
b. 0 cells 22.14.
(2).个案加权
在SPSS系统中,列
联表的输入多采用频
数表格的方式,
如果要对此类数据进
行卡方分析等,必须
采用个案加权
(weight by ca
ses)进行数据处理
后才能使用相关的统
计方法。
菜单 “Data” | “Weight Cases”命令
点击“Weight Cases by单选 框”,选中 “Freqency ”: 选入“频数 [count]”。单击 OK钮
Pearson卡方统计量 反映实际Oij与理论Eij吻合程度
2 R,C (Oij Eij )2
i, j1
Eij
Eij
Oi. O. j N
2 NiR,j,C1OOiOi2jj 1
df(R1)(C1)
若 2 2(df ) 拒绝 H 0
注意:上述 2 检验适用于双向无序的 R C 表(df≠1) 分组标志无数量大小和先后顺序之分。 分析的目的是考察两个属性之间是否独立。
Continuity Correction 连续性校正的卡方值
Chi-Square Tests
Value Pearson Chi-Square7.469b
Asymp. Sig.Exact Sig.Exact Sig.
df (2-sided) (2-sided) (1-sided)
1
.006
Continuity Corraect6i.o6n74
Symmetric Measures
ValueApprox. Sig.
Nominal by NoCmoinntailngency Coeffi.c1i4e7nt
.006
N of Valid Cases
339
a.Not assuming the null hypothesis.
ing the asymptotic standard error assumi hypothesis.
数据均是有效值。
NPercentNPercentNPercent 分析:给出了2×2列联表,其中表中给出了
结果 *313吸090烟.0情 % 况0 .0% 313090.0% 实际观测值和理论值。
结 果 * 吸 烟 情 况 Crosstabulation
结果 患病 健康
Total
Count Expected Count % within 吸烟情况 Count Expected Count % within 吸烟情况 Count Expected Count % within 吸烟情况
高于不加人工牛黄组的疗效。 20 2 .0 1 ( 1 ) 6 .6 3 4 9 H 0 ( )
4.2 Crosstabs 过程
例: 调查339名50岁以上的人的吸烟习惯与患慢性气管 炎病的数据而建立如下列联表,试探讨吸烟与患慢性气 管炎之间的关系。
组别 患病组 健康组
不吸烟 13
121
吸烟 43
162
目的:检验 输入数据
H 0 : 变量X与Y是独立的
个案加权
列联表分析
(weight by cases过程) (Crosstabs过程)
结果分析
实现步骤:
(1).将数据录入SPSS并整理加工
定义变量
输入数据
保存
smoke:吸烟情况; 数;
result:结果;
count:频
保存为:“吸烟与慢性支气管炎的关系.sav”
115
.006
1
.010
110
.005
FNi合sohf计erV'asliEdxaC2ca1tseTsest 3349
25
N=25<4ab0..,C0Foismchpeeulr'tls esEdxa(co.tn0Tl%esy)t
:fFoirshear's2确x切2概t率ab法le
have expected count
定义列联表单元格中 勾选“Counts复选框组” “Observed”和理论数 选择“Percentages”里 比。点击“Continue”按 点击”OK”按钮
结果输出和讨论:
Case Processing Summary
分析:处理记录缺失值情况报告,可见所有
Cases Valid Missing Total
46
78
两组治愈率相同) m N统i=计nE 2结ij0 论4>7:8 2 4 0 “04 96 疗 法36 ”.7与1 “5疗效”
2 加黄合N牛计(OO 111701O 68O222O 5906O 1O 12122O 206421)2不 专独 业20 立 结7 48 ( 论(3 2 即 :1 2两 加5 60 组 人 10 治 工48 6愈 牛 9 7 率 黄6 6不组)2同疗7 )效.1969
点击“Chi-square复 选框”,计算 2 值 ; 选择“Nominal”里 的“Contingency Coefficient”计算 Pearson列联相关 系数。 点击“continue”钮回 到上一对话框
点击”Cell算的指标。 中的输出实际观察数 “Expected” 的“column”计算列百分 钮返回上一层对话框 。
或删去理论频数太小的行,列。
3.多个总体率比较的卡方检验,若结论为拒绝原假设,
只能认为总体率之间不全等,不能说明任意两个总体率
有无差别,需做多重比较。
最小理论频数=最小行合计频数﹒最小列合计频数/总频数
例: 判断患鼻咽癌与血型有无关系
分类 A型血 B型血 O型血 AB型血
患癌者 64
86 130 20
(.0%)
have
expected
count
less检 验th。an
5.
The
minimum
expected
count
i
2 7 .4 6 9 ,P 0 .0 0 6 0 .0 5
所以有理由拒绝吸烟 与患病是独立的原假 设,即认为
吸烟与患支气管炎是 有关的。
计算Pearson列联相关系数 r=0.147
吸烟情况
否 13
是 43
22.1
33.9
9.7%
21.0%
121
162
111.9
171.1
90.3%
79.0%
134
205
134.0
205.0
100.0% 100.0%
Total 56
56.0 16.5%
283 283.0 83.5%
339 339.0 100.0%
不吸烟者的患癌率 9.7% 吸烟者的患癌率 21.0%
(N≥40,理论频数≥5)
给出了4种检验方法的结论。其中, 1. Pearson Chi-Square 即常用的卡方检验
Likelihood Ratio 似然比 卡方检验
Fisher's Exact Test : Fisher's确切概率法
(N<40或理论频数小于1)
(N≥40,理论频数小于5(但≥1))
i,j1
Eij
O1O2O1O2
df=1
(3) N<40或理论频数小于1,不能使用卡方检验,应使用Fisher精确 检验, 称为四格表确切概率法。
列联表的原假设是两个变量X和Y相互独立,计算卡方统 计量,当此统计量很大时否定原假设。
“疗法”与“疗效”独立(即
H 0:
疗效
疗法
合计
治愈 未愈
不加 牛黄
32
疗法
中医 西医
痊愈 68 737
疗效
显效 好转
26
15
388
25
无效 3 5
合计
112 1155
注:
双向无序列联表计 算卡方统计量常用
单侧检验。
2.若R×C列联表中理论频数出现小于1,或理论频数
出现小于5的格数超过总格数1/5时,必须增大样本例数;
或把理论频数太小的行,列与性质相近的邻行,列合并;
4.1 列联表原理
列联表:观测数据按两个或更多属性(定性变量)分类 时所列出的频数表。
R×C列联表:分类频数排成R行C列的列联表。
2×2表:二行二列的列联表,又称四格表 。
列联表分析:使用列联表进行分类资料的检验。
列联表
※双向无序
单向有序 双向有序且属性不同 双向有序且属性相同
1.双向无序表独立性检验