两个分类变量的关联分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十章 两变量关联性分析

三、两个分类变量的关联分析

n对分类变量间的联系,可作关联(association)分析

n对两个分类变量交叉分类计数所得的频数资料(列联表) 作关于两种属性独立性的c 2 检验

交叉分类2×2列联表

n对样本量为n的一份随机样本同时按照两个二项分类的特 征(属性)进行交叉分类形成一个2×2交叉分类资料表, 也称为2×2列联表(contingency table)。

n 例10­3:为观察行为类型与冠心病的关系,某研究组收集 了一份包含3154个个体的样本,研究者将观察对象按行 为类型分为A型(较具野心、进取心和有竞争性),B型 (较沉着、轻松、和做事不慌忙)。对每个个体分别观 察是否为冠心病患者和行为类型两种属性,2×2种结果 分类记数如下表所示。试分析两种属性的关联性。

表 10­3 行为类型与冠心病的关系

行为类型(属性 A) 冠心病(属性 B)

合计 有(1) 无(2)

类型 A(1) 178 **** **** 类型 B(2) 79 1486 1565 合计 257 2897 3154

表 10­4

2×2 交叉分类频数表的一般形式及概率表达

属性 A

属性 B

合计

1

2

1 11 A ( 11 p ) 1

2 A ( 12 p ) 1 n ( 1 r p ) 2 21 A ( 21 p ) 22 A ( 22 p ) 2 n ( 2 r p )

合计

1 m ( 1 c p )

2 m ( 2 c p )

n (1.0)

0 H :属性 A 与 B 互相独立,

1 H :属性 A 与 B 互相关联。

独立性检验就是考察 cj ri ij p p p = 成立与否。

å

- = j

i i i i T T A , j

2

j j 2

)

( c

0 H :行为类型与冠心病之间互相独立

1 H :行为类型与冠心病之间有关联

a =0.05

将表中各数据代入公式(9­9),

2

2

(1781486791411)3154 39.90

158915652572897

c ´-´´ == ´´´ 2

0.05,1

3.84 c

= , 2

2

0.05,1

c c

> P <0.05,说明行为类型与冠心病之间存在

着关联性。

关联系数(association coefficient)

2

2

r n

c

c =

+ 2

2

39.90

0.112

39.903154

r n

c

c =

=

= ++

多分类资料的关联分析

例10­5 欲探讨职业类型与胃病类型是否有关联,某医生 将收治的310名胃病患者按主要的职业类型与胃病类型两种 属性交叉分类,结果见表10­6。

问职业类型与胃病类型间有无关联?

表10­6 310名胃病患者两种属性的交叉分类表

职业 胃病

合 计 浅表性胃炎

慢性胃炎 胃溃疡

805220 机关干部 工厂工人 公交车司机 486222

4 1210

132 12652 152

132 26

310

合计

H 0 :胃病类型与职业无关联 H 1

:胃病类型与职业有关联 α=0.05

222222 2

80484526212 310( 1521321321322613215212613212626126

c =´++++++

´´´´´´ 222

202210

1)

15252132522652

++- ´´´ 20.838

= P <0.005

2

2

20.838

0.251

20.838310

r n

c

c =

=

= ++

170例某病患者的治疗效果资料

患者年龄

(岁)

疗 效

合 计 无效 好转 治愈

<18 5 32 20 57

18~ 30 38 10 78

50~ 15 10 10 35

合 计 50 80 40 170 Gamma系数

小结:

n相关是测量变量间的相互关联或联系的指标。相关研究 的两个变量其关系是平等的,均为随机变量。

n在分析相关时必须先做散点图

n两连续变量间的相关分析方法主要有Pearson积矩相关和 Spearman秩相关

n分类资料的关联分析可区分为两分类和多分类的情形, 检验都采用卡方检验。

n相关和关联是两变量间相互关联或联系数量上的关系, 不能据此推论两变量有因果关系。相关有可能只是伴随 关系。

THE END

Thanks

相关文档
最新文档