两个分类变量的关联分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十章 两变量关联性分析
三、两个分类变量的关联分析
n对分类变量间的联系,可作关联(association)分析
n对两个分类变量交叉分类计数所得的频数资料(列联表) 作关于两种属性独立性的c 2 检验
交叉分类2×2列联表
n对样本量为n的一份随机样本同时按照两个二项分类的特 征(属性)进行交叉分类形成一个2×2交叉分类资料表, 也称为2×2列联表(contingency table)。
n 例103:为观察行为类型与冠心病的关系,某研究组收集 了一份包含3154个个体的样本,研究者将观察对象按行 为类型分为A型(较具野心、进取心和有竞争性),B型 (较沉着、轻松、和做事不慌忙)。对每个个体分别观 察是否为冠心病患者和行为类型两种属性,2×2种结果 分类记数如下表所示。试分析两种属性的关联性。
表 103 行为类型与冠心病的关系
行为类型(属性 A) 冠心病(属性 B)
合计 有(1) 无(2)
类型 A(1) 178 **** **** 类型 B(2) 79 1486 1565 合计 257 2897 3154
表 104
2×2 交叉分类频数表的一般形式及概率表达
属性 A
属性 B
合计
1
2
1 11 A ( 11 p ) 1
2 A ( 12 p ) 1 n ( 1 r p ) 2 21 A ( 21 p ) 22 A ( 22 p ) 2 n ( 2 r p )
合计
1 m ( 1 c p )
2 m ( 2 c p )
n (1.0)
0 H :属性 A 与 B 互相独立,
1 H :属性 A 与 B 互相关联。
独立性检验就是考察 cj ri ij p p p = 成立与否。
å
- = j
i i i i T T A , j
2
j j 2
)
( c
0 H :行为类型与冠心病之间互相独立
1 H :行为类型与冠心病之间有关联
a =0.05
将表中各数据代入公式(99),
2
2
(1781486791411)3154 39.90
158915652572897
c ´-´´ == ´´´ 2
0.05,1
3.84 c
= , 2
2
0.05,1
c c
> P <0.05,说明行为类型与冠心病之间存在
着关联性。
关联系数(association coefficient)
2
2
r n
c
c =
+ 2
2
39.90
0.112
39.903154
r n
c
c =
=
= ++
多分类资料的关联分析
例105 欲探讨职业类型与胃病类型是否有关联,某医生 将收治的310名胃病患者按主要的职业类型与胃病类型两种 属性交叉分类,结果见表106。
问职业类型与胃病类型间有无关联?
表106 310名胃病患者两种属性的交叉分类表
职业 胃病
合 计 浅表性胃炎
慢性胃炎 胃溃疡
805220 机关干部 工厂工人 公交车司机 486222
4 1210
132 12652 152
132 26
310
合计
H 0 :胃病类型与职业无关联 H 1
:胃病类型与职业有关联 α=0.05
222222 2
80484526212 310( 1521321321322613215212613212626126
c =´++++++
´´´´´´ 222
202210
1)
15252132522652
++- ´´´ 20.838
= P <0.005
2
2
20.838
0.251
20.838310
r n
c
c =
=
= ++
170例某病患者的治疗效果资料
患者年龄
(岁)
疗 效
合 计 无效 好转 治愈
<18 5 32 20 57
18~ 30 38 10 78
50~ 15 10 10 35
合 计 50 80 40 170 Gamma系数
小结:
n相关是测量变量间的相互关联或联系的指标。相关研究 的两个变量其关系是平等的,均为随机变量。
n在分析相关时必须先做散点图
n两连续变量间的相关分析方法主要有Pearson积矩相关和 Spearman秩相关
n分类资料的关联分析可区分为两分类和多分类的情形, 检验都采用卡方检验。
n相关和关联是两变量间相互关联或联系数量上的关系, 不能据此推论两变量有因果关系。相关有可能只是伴随 关系。
THE END
Thanks