R×C列联表资料的统计分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

胆汁质
13 15 9
抑郁质
7 10 8
粘液质
14 13 15
二、双向无序RC表的统计分析
第一步,建立检验假设。
H0: 3个专业学生的气质类型构成(频数分布) 相同 H1: 3个专业学生的气质类型构成(频数分布) 不全相同 a0.05。
二、双向无序RC表的统计分析
第二步,计算检验统计量。

2
三、单向有序RC表的统计分析
秩和检验 原因变量为二值变量:Wilcoxon秩和检验
u
3 (tk tk ) 1 n1n2 ( N 1)(1 ) 3 12 N N
T n1 ( N 1) / 2
原因变量为多值名义变量:Kruskal-Wallis H检验
Ri2 12 H ( ) 3( N 1) H c N ( N 1) ni
一、 RC列联表资料的认识与分析方法选择
定量变量:年龄、红细胞
二值变量:性别(男、女)
多值名义变量:药物类型(A、B、C)、血型 (A、B、AB、O)
多值有序变量:疗效(痊愈、显效、好转、无 效)、临床诊断(Ⅰ级、Ⅱ级、Ⅲ级)、CT诊断 (Ⅰ级、Ⅱ级、Ⅲ级)
双向无序的RC表
药物 类型 A B C 血型: A 8 7 10
所以,3个专业学生的气质类型构成没有统
计学差异
24
二、双向无序RC表的统计分析
原因变量为多值有序变量,结果变量为多值名 义变量的RC表,将其视为双向无序RC表进 行分析
表 11 不同年龄成人获取健康知识途径情况 年龄 20~35 36~50 51~ 例数 途径: 大众媒体 20 42 27 网络 35 17 10 社区教育 26 26 57
Βιβλιοθήκη Baidu
H 1 (t 3 t p ) /( N 3 N ) p
p 1 m
三、单向有序RC表的统计分析
实例分析
表15 3种药物治疗某病患者疗效的观察结果 药物 种类 疗效: 治愈 A 15 例数 显效 49 好转 31 无效 5 合计 100
B
C 合计
4
1 20
9
15 73
50
45 126
双向无序RC表的统计方法

2
检验
Fisher精确概率法:有1/5以上的格子的 理论频数小于5
结果变量为有序变量的单向有序RC表
表 4 不同药物组中患者的疗效情况 药物 类型 A B C 患者例数 疗效: 痊愈 5 4 10 显效 10 9 12 好转 8 10 13 无效 7 7 5
在二维列联表中,仅结果变量的取值为有序的, 而原因变量是无序的,由此排列成的RC表称之 为结果变量为有序变量的单向有序RC表
疗 效 治愈 显效 好转 无效 合计 例 药物: A 15 49 31 5 100 B 4 9 50 22 85 数 C 1 15 45 24 85 合计 20 120 10.5 73 2193 57.0 126 94219 156.5 51 220270 245.0 270 秩次 平均 范围 秩次 A 157.5 2793.0 4851.5 1225.0 9027.0 秩 和 B C 42.0 10.5 513.0 855.0 7825.0 7042.0 5390.0 588.0 13770.0 13788.0
二、双向无序RC表的统计分析
2检验的计算公式

2 i 1 j 1
R
C
A
ij
Tij Tij
2
v R 1 C 1
二、双向无序RC表的统计分析
实例分析
表10 不同专业学生的气质类型分布 例数 专业 计算机 金融 传媒
气质类型: 多血质
16 12 18
当RC表中的两个定性变量,即原因变量与结果 变量都是有序变量,并且它们的性质不同,这样 的列联表称为双向有序且属性不同的RC表
双向有序且属性不同的RC表
表 7 不同年龄组某病患者心力衰竭心功能分级 年龄 (岁) 45 60 75 合计 例数 心功能分级 I 1 1 5 7 II 61 59 34 154 III 152 103 56 311 IV 49 81 51 181 合计 264 241 147 652
双向有序且属性不同RC表的统计方法
第四个分析目的,希望考察各行上的频数分布 是否相同,此时,将此资料视为双向无序的 RC列联表资料,可根据资料具备的前提条件, 2 选用一般 检验或Fisher精确检验。若P<0.05, 不能认为两有序变量之间有相关关系,而只能 认为各行上的频数分布不同
双向有序且属性相同的RC表
16 15.33
15.33 3.43
2
13 12.33
12.33
2
15 14
14
2
v R 1 C 1 3 1 4 1 6
二、双向无序RC表的统计分析
第三步,确定P值,给出结论。
查2界值表可知, 20.05,6 =12.59,而本 例中检验统计量的值3.43<12.59,故P>0.05。
双向有序且属性不同RC表的统计方法
第二个分析目的,希望考察原因变量与结
果变量之间是否存在相关关系,此时,需 要选用处理定性资料的相关分析方法,通 常采用Spearman秩相关分析方法
双向有序且属性不同RC表的统计方法
第三个分析目的,若两个有序变量之间存
在的相关关系有统计学意义,研究者希望 进一步了解这两个有序变量之间的变化关 系是呈直线关系还是呈某种曲线关系,此 时宜选用线性趋势检验
Spearman 秩相关是一种非参数的度量 相关性的分析方法,它对数据进行秩变换, 然后计算直线相关系数
四、双向有序且属性不同RC表的统计分析
实例分析
表16 某地地方性甲状腺肿病分年龄组的疗效 年龄
11~ 20~ 例数 疗效: 治愈 35 32 显效 1 8 好转 1 9 无效 3 2
30~
40~ 50~
双向有序且属性不同RC表的统计方法
对于双向有序且属性不同的RC表资料应根据具 体的分析目来确定分析方法:
第一个分析目的,只关心各组结果变量取值之间的差别是
否具有统计学意义,此时,原因变量的有序性就变得无关 紧要了,可将此时的“双向有序RC列联表资料”视为 “结果变量为有序变量的单向有序RC列联表资料”,可 以选用的统计分析方法有秩和检验、Ridit分析和有序变 量的logistic回归分析
22
24 51
85
85 270
三、单向有序RC表的统计分析
第一步,建立检验假设。
H0: 3种药物的疗效总体分布位置相同 H1: 3种药物的疗效总体分布位置不全相同 a0.05。
三、单向有序RC表的统计分析
第二步,对原始数据编秩, 遇数据相等者取 平均秩 秩和检验法分析 3 种药物疗效所需数据
结果变量为有序变量的单向有序RC表的统计方法
秩和检验
Ridit分析 有序变量的Logistic回归分析
双向有序且属性不同的RC表
表 6 不同年龄组中患者的疗效情况 年龄 <40 40~49 50~59 60~ 患者例数 疗效: 痊愈 5 8 6 4 显效 6 9 9 6 好转 3 8 8 7 无效 1 5 7 8
三、单向有序RC表的统计分析
第三步,计算检验统计量。
90272 137702 137882 12 H 3 271 53.29 270 271 100 85 85
Hc 1
53.29 61.09 3 3 3 3 20 20 73 73 126 126 51 51 2703 270
表9 甲、乙两名医生对200例棉屑沉着病可疑患者的诊断结果 甲医生的 诊断结果 正常 Ⅰ期 Ⅱ期 合计 病例数 乙医生的诊断结果: 正常 78 6 0 84 Ⅰ期 5 56 10 71 Ⅱ期 0 13 32 45 合计 83 75 42 200
双向有序且属性相同RC表的统计方法
双向有序且属性相同的RC表是一个“方 形”列联表,它实际上是配对设计22列联 表资料的“扩大”。其主要目的是希望回 答行变量与列变量的检测结果是否一致的 问题,常用的统计分析方法叫做一致性检 验或称为Kappa检验
二、双向无序RC表的统计分析
原因变量为二值变量,结果变量为多值 名义变量的2C表
表 12 满族与回族居民血型的频数分布 民族 满族 回族 合计 例数 血型:A 442 369 811 B 483 384 867 O 416 487 903 AB 172 115 287 合计 1513 1355 2868
17
15 10
13
10 11
12
8 23
2
2 5
四、双向有序且属性不同RC表的统计分析
线性趋势检验
基于2分割方法的线性趋势检验:先计算RC表
的2值,然后将总2值分解为线性回归分量和偏 离线性回归的分量
其分析步骤为:给有序变量的各等级打分;按类
似于定量资料的线性回归分析方法计算回归斜率 及其方差,进而求出由线性回归所引起的分量和 偏离线性回归的分量
v R 1 3 1 2
三、单向有序RC表的统计分析
第四步,确定P值,给出结论。
查2界值表可知, 20.02,2 =9.21,而本例 中检验统计量的值61.09>9.21,故P<0.01。
所以,3种药物疗效之间的差别有统计学意

四、双向有序且属性不同RC表的统计分析
Spearman秩相关
表 2 不同药物组中患者的血型分布情况 患者例数 B 9 10 12 AB 4 2 5 O 9 11 13
在二维列联表中,两个定性变量都是名义变量, 并且这两个名义变量分别有R个与C个可能的取 值,由此排列成的RC表称之为双向无序的RC 表
双向无序的RC表
表3 缓慢心律 失常种类 窦性过缓 被动心律 房室阻滞 束支阻滞 合 计 部位: 心律失常种类与心肌梗塞部位关系的调查结果 患者例数 下壁 8 1 6 1 16 前壁 7 1 3 16 27 真后壁 2 0 1 1 4 心内膜下 合计 1 0 1 0 2 18 2 11 18 49
二、双向无序RC表的统计分析
原因变量为多值有序变量R2表除了可以应用 线性趋势检验外,其他分析方法与双向无序的 RC表相同
表 14 化合物剂量 100mg 200mg 300mg 400mg 合计 60 只大鼠肿瘤发生情况 例数 肿瘤发生情况: 未发生 12 10 9 5 36 发生 3 5 6 10 24 合计 15 15 15 15 60
二、双向无序RC表的统计分析
原因变量为多值名义变量,结果变量为二值变 量的R2表
表 13 药物种类 安慰剂 A药 B药 C药 D药 E药 合计 5 种药物治疗精神抑郁症的疗效 例数 疗效:改善 8 12 21 15 14 19 89 未改善 22 18 9 15 16 11 91 合计 30 30 30 30 30 30 180
结果变量为有序变量的单向有序RC表
表5 284例受试对象的冠状动脉造影结果 医院 甲 乙 丙 合计 例数 动脉造影: 管径正常 轻度狭窄 中度狭窄 重度狭窄 完全闭塞 53 79 34 166 19 20 28 67 10 9 11 30 5 7 6 18 0 2 1 3 合计 87 117 80 284
表 8 100 例患者的临床诊断与 CT 诊断结果 临床诊断 Ⅰ级 Ⅱ级 Ⅲ级 患者例数 CT 诊断: Ⅰ级 60 4 3 Ⅱ级 4 12 3 Ⅲ级 2 3 9
当行变量与列变量的性质相同且取值的水平数及 含义也相同时,称这样的RC表为双向有序且属 性相同的RC列联表
双向有序且属性相同的RC表
RC列联表资料的统计分析
主要内容
RC列联表资料的认识与分析方法选择
四种不同类型RC列联表资料的统计分析 与SAS实现 RC列联表资料统计分析中的错误辨析与 释疑
一、 RC列联表资料的认识与分析方法选择
表 1 某临床研究中 100 例患者的资料 编号 1 2 3 4 „ 年龄 60 53 49 66 „ 性别 女 男 女 男 „ 药物 类型 A C B B „ 红细 胞 3.78 4.26 3.53 4.71 „ 血型 O A AB B „ 临床 诊断 Ⅱ级 Ⅰ级 Ⅲ级 Ⅰ级 „ CT 诊断 Ⅲ级 Ⅰ级 Ⅲ级 Ⅱ级 „ 疗效 好转 痊愈 显效 无效 „
相关文档
最新文档