医学统计学列联表检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
32
46
76
50
108
96
合计
78 126 204
列联表:观测数据按两个或更多属性(定性变量)分类 时所列出的频数表。
R×C列联表:分类频数排成R行C列的列联表。 2×2表:二行二列的列联表,又称四格表 。 列联表分析:使用列联表进行分类资料的检验。
※双向无序
列联表
单向有序 双向有序且属性不同
双向有序且属性相同
(3)列联表分析 菜单 “Analyze”|“Descriptive Statistics”|“Crosstabs ”命令
将“结果[result]” 点入“Row(s)” 框,将“吸烟情 况[smoke]”点 入“Cloumn(s)” 框。
点击“Statistics” 钮。
【Statistics钮】 用于定义所需计 算的统计量。
第四章 列联表分析
4.1 列联表原理 4.2 Crosstabs 过程
4.1 列联表原理
例1:某医院收得乙型脑炎重症病人204例,随机分成两 组,分别用同样的中草药方剂治疗,但其中一组加一定 量的人工牛黄,每个病人根据治疗方法和治疗效果进 行分类,得出如下表格:
疗法
不加牛黄 加牛黄 合计
疗效
治愈
未愈
不吸烟 13
121
吸烟 43
162
目的:检验 H0 : 变量X与Y是独立的
输入数据
个案加权 列联表分析 结果分析
(weight by cases过程)(Crosstabs过程)
实现步骤:
(1).将数据录入SPSS并整理加工
定义变量
输入数据
保存
smoke:吸烟情况; result:结果; count:频数; 保存为:“吸烟与慢性支气管炎的关系.sav”
疗法
疗效
治愈
未愈
不加牛黄 32
46
加牛黄 76
50
合计 108
96
合计
78 126 204
“疗法”与“疗效”独立(即两组治愈率相同
) N=204>40
2
N (O11O22 O12O21 )2 O1O2O1O2
204(32 50 46 76)2 78126108 96
7.1969
2
2 0.01
最小理论频数=最小行合计频数﹒最小列合计频数/总频数
3.多个总体率比较的卡方检验,若结论为拒绝原假设, 只能认为总体率之间不全等,不能说明任意两个总体率 有无差别,需做多重比较。
例: 判断患鼻咽癌与血型有无关系
分类 A型血 B型血 O型血 AB型血
患癌者 64
86
130
20
健康人 125 138 210
862 300 224
L
Hale Waihona Puke Baidu
2102 499 340
262 499 46
1
1.921
2 0.05
(3)
7.815
df=(2-1)(4-1)=3,单侧概率P>0.05,
不能以α=0.05水准的单侧检验拒绝H0,
总体率的差异无统计意义,不能认为患鼻咽癌与血型不独立。
2 . 四格表独立性检验
例1:某医院收得乙型脑炎重症病人204例,随机分成两 组,分别用同样的中草药方剂治疗,但其中一组加一定 量的人工牛黄,每个病人根据治疗方法和治疗效果进 行分类,得出如下表格:
(2).个案加权 在SPSS系统中,列联表的输入多采用频数表格的方式, 如果要对此类数据进行卡方分析等,必须采用个案加权 (weight by cases)进行数据处理后才能使用相关的统 计方法。
菜单 “Data” | “Weight Cases”命令
点击“Weight Cases by单选框”,选中“Freqency ”: 选入“频数[count]”。单击OK钮
(1)
6.6349
H0 ()
统计结论:“疗法”与“疗效”不独立(即两组治愈率不 同专)业结论:加人工牛黄组疗效高于不加人工牛黄组的疗效。
4.2 Crosstabs 过程
例: 调查339名50岁以上的人的吸烟习惯与患慢性气管 炎病的数据而建立如下列联表,试探讨吸烟与患慢性气 管炎之间的关系。
组别 患病组 健康组
Eij
Oi. O. j N
2
N
R,C i, j1
Oi2j OiO
j
1
df (R 1)(C 1)
若 2 2 (df ) 拒绝 H0
注意:上述 检验适用于双向无序的 表(df≠1) 分组标志无数量大小和先后顺序之分。 分析的目的是考察两个属性之间是否独立。
疗法
中医 西医
痊愈
68 737
疗效 显效 好转
26
15
388
25
无效
3 5
合计
112 1155
注:1.双向无序列联表计算卡方统计量常用单侧检验。
2.若R×C列联表中理论频数出现小于1,或理论频数 出现小于5的格数超过总格数1/5时,必须增大样本例数; 或把理论频数太小的行,列与性质相近的邻行,列合并; 或删去理论频数太小的行,列。
2 2,2 (| Oij Eij | 0.5)2 N (| O11O22 O12O21 | 0.5N )2
i, j1
Eij
O1O2O1O2
df=1
(3) N<40或理论频数小于1,不能使用卡方检验,应使用Fisher精确 检验, 称为四格表确切概率法。
列联表的原假设是两个变量X和Y相互独立,计算卡方统 计量,当此统计量很大时否定原假设。
26
合计 189 224 340
46
合计 300 499 799
第一行合计数,第四列合计数最小,最小理论频数
E14
300 46 799
17.27
5
H0:“患癌”与“血型”独立,H1:“患癌”与“血型”
不独立 R,C
2 N(
Oi2j
O O i, j1 i j
1)
799
642 300 189
疗法
不加牛黄 加牛黄 合计
疗效
治愈
未愈
32
46
76
50
108
96
合计
78 126 204
双向无序四格表
(1) N≥40,理论频数≥5
2 2,2 (Oij Eij )2
i, j1
Eij
2 N (O11O22 O12O21 )2
O1O2O1O2
(2)N≥40,理论频数小于5(但≥1),用校正卡方统计量
1.双向无序表独立性检验
双向无序列联表:两个分类变量分类标志无数值大小 与先后顺序之分。
疗法
不加牛黄 加牛黄 合计
疗效
治愈
未愈
32
46
76
50
108
96
合计
78 126 204
设不加牛黄组治愈总体率为 ,加牛黄组治愈总体率为
检验
即 “疗法”与“疗效”独立
H0:X与Y独立(即两组总体率相同)
实际频数Oij与理论频数Eij的差异是随机误差, 用 Pearson卡方统计量反映实际Oij与理论Eij吻合程度