RXC表资料统计分析与错误辨析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对差错的辨析
采用两种分析方法分别测定同 一人群,测定结果都分为正确、未确 定、错误,从资料类型看,应属于双 向有序且属性相同的列联表资料,原 作者未经相应的统计分析直接得出结 论,显然是不合适的。为便于作统计 分析先把上表修改如下:
Mri 正确 未确定 错误 合计
各期喉癌MRI和纤维喉镜分期 结果(修改表)
两种手术方法术前声音评 估情况(修改表)
例数 术式 恢复程度:正常 显改 改善 无改
支配术 再支配术
342 0 006 7
释疑
在保证两组之间重要的非处 理因素均衡的前提下,适当增大 样本含量,并采用适合于分析单 向有序列联表资料的秩和检验或 Ridit分析,作出专业结论。
释疑
严格地说,若两组患者均在 各时间点被重复测量了疗效(有 序变量),应按具有重复测量设 计定性资料的方式整理和分析资 料。
本资料的结果变量具有 一定顺序,因而应属于结果 变量为有序变量的单向有序 列联表资料,原作者采用卡 方检验分析资料,并进行两 两比较,是错误的。
释疑
适合分析单向有序列 联表资料的统计分析方法 有秩和检验或Ridit分析, 对平均秩进行两两间比较 也有相应的近似方法。
4、误用2检验回答相关性
合计
16
27
4
•2
━━━━━━━━━━━━━━━━━━━━
例2计算方法
(双向无序R×C表)
因表中小于5的理论频 数超过了总格子数的1/5, 故这样的双向无序列联表资 料应选用Fisher的精确检验 来处理。
理论频数=(行合计)(列合计)/N
2型资料举例
(单向有序R×C表)
表3
3种药物疗效的观察结果
问题
原文题目《上颌窦鳞癌两种癌基因及 增殖细胞核抗原的表达及意义》
目的:检测上颌窦鳞癌、上颌窦内翻 性乳头状瘤及上颌窦炎性年膜中ras 、 p53及增殖细胞抗原PCNA的表达情况, 并分析其表达与上颌窦鳞癌临床病理 特性和预后的关系。
原作者在研究上颌窦鳞癌病理 分级与ras、p53及PCNA表达关系时 按上颌窦鳞癌病理分级不同分为三 个组,检测结果见表3,然后得出 ras 基因表达与上颌窦鳞癌分化程 度有关,其表达多见于高分化鳞癌 中(卡方检验,P=0.02),P53基因 表达与上颌窦鳞癌分化程度无关 (P>0.05) 。
ras基因表达与否与病理分级 之间的相关性分析:
rs=0.41822,P=0.0072<0.05。 故可以认为ras基因表达与否
与上颌窦鳞癌病理分级之间 的相关性有统计学意义。
程序运行结果:
P53基因表达与否与病理分级 之间的相关性分析:
rs= -0.05834, P=0.7206>0.05。
统计学培训班
RC表资料的统计分析 与错误辨析 胡良平 军事医学科学 生物医学统计咨询中心
RC表的分类、分型 以及统计分析方法的合理选择
(一)横断面研究设计2×2表;
列 第一类:22表
,四型
(二)队列研究设计2×2表; (三)病例-对照研究设计2×2表;
联
(四)配对研究设计2×2表。
表 分 第二类:RC表,四型
对差错的辨析
由上表可以看出:原因变量(病理分级) 的三个水平之间具有一定的顺序,是一个有 序变量。而基因ras(或p53)的表达与否只 有两个水平,相当于阴性(0)和阳性(1), 可以看成是顺序的一种特例。
因而可将其视为双向有序的列联表资料。原 作者对其进行一般的2检验,只能得出不同 病理分级的上颌窦鳞癌之间的ras(或p53) 基因表达率差异是否具有统计学意义。并不 能说明原作者的实验目的,即上颌窦鳞癌病 理分级与ras(或p53)基因表达率之间有相 关关系(需要用Spearman秩相关分析)。
━━━━━━━━━━━━━━━━━━━
疗
人数
效 药物∶ A
B
C
───────────────────
治愈
15
4
1
显效
49
9
15
好转
31
50
45
无效
5
22
24
───────────────
合计
100
85
85
━━━━━━━━━━━━━━━━━━━
例3计算方法
(结果变量为有序变量的单向有序R×C表)
(1)秩和检验; (2)Ridit分析; (3)有序变量的Logistic
释疑
应根据作者实验目的采用适合此 资料的Spearman秩相关分析法。
变换原表如下:
表1上颌窦鳞癌病理分级与RAS、P53基因表达关系
病理 例数 分级
Ras 表达(例)
+
-
P53 表达(例)
+
-
高分化 3 中分化 25 低分化 12
3
0
12
13
2
10
2
1
11
14
7
5
程序运行结果:
故可以认为P53基因表达与否 与上颌窦鳞癌病理分级之间 的相关性无统计学意义。
合计
326
295
408
━━━━━━━━━━━━━━━━━━━
3型资料计算方法
(双向有序且属性不同R×C表)
双向有序且属性不同的二维列联表有四 个分析目的:
其一、检验各组结果之间的差别; 其二、研究两有序变量之间的相关性; 其三、研究两有序变量之间是否呈直线
关系; 其四、各行(或列)频数分布是否相同。
(双向无序R×C表)
表2
心律失常种类与心肌梗塞部位关系
━━━━━━━━━━━━━━━━━━━━
缓慢心率
梗塞例数
失常种类 部位:下壁 前壁•真后壁 心内膜下
────────────────────
窦性过缓
8
7
2 • ••1
被动心律
1
1
0
•0
房室阻滞
6
3
1
•1
束支阻滞
1
16
1
•0
───────────────
表2 乳褐质在各组钩突 粘膜中的表达状况
杯状细胞 腺体细胞 上皮细胞 分组 -- + ++ +++ — + ++ +++ — + ++ ++
正常对照组 14 3 0 0 0 14 3 0 17 0 0 0 单纯鼻炎组 14 6 7 0 1 10 10 0 18 3 0 0 并鼻息肉组 43 5 10 0 1 18 27 3 46 2 0 1
4型资料举例
(双向有序且属性相同R×C表)
表5
两法检查室壁收缩运动的符合情况
━━━━━━━━━━━━━━━━━━━
对比法测
冠心病人数
定的结果 核素法∶正常
减弱
异常
───────────────────
正常
58
2
3
减弱
1
42
7
异常
8
9
17
───────────────
合计
67
53
27
━━━━━━━━━━━━━━━━━━━
2、双向有序且属性相同资料 未进行统计分析直接得出结论
240《喉癌MRI分期评价》, 原作者目的预评价MRI在喉癌术 前T分期中的价值。采用方法为: 对59例喉癌的MRI资料进行回顾 性分期,并与纤维喉镜及手术病 理对照。结果见下表:
附表 各期喉癌MRI和
纤维喉镜分期结果
tБайду номын сангаас例 mri
纤维 喉镜
表3
上颌窦鳞癌病理分级与RAS、 P53及PCNA的表达关系
病理 例数 分级 高分化 3 中分化 25 低分化 12
阳性例数
Ras
P53
3
2
12
11
2
7
PCNA 指数 均值(%)
19.30 18.02 15.89
结论:RAS基因表达与上颌 窦鳞癌病理分级有关,多见于高 分化鳞癌中(卡方检验P=0.02); P53基因表达与上颌窦鳞癌病理分 级无关(P>0.05)。
原作者的分析方法:卡方检验。 结果 ①LZ在单纯炎症组钩突粘膜 杯状细胞中表达较健康对照组加强 (P<0.05);LF在健康和慢性鼻窦炎 钩突杯状细胞中常为阴性表达;同 样,得出lf的结果。结论 钩突粘 膜中的杯状细胞和混合腺对LZ和LF 的分泌起重要作用,可能参与构成 局部免疫防御系统。
对差错的辨析
4型资料计算方法
(双向有序且属性相同R×C表)
双向有序且属性不同的二维列联表有一 个分析目的:即两种检测方法检测的结 果是否一致。
可选用的统计分析方法为: (1)Kappa检验(或称为一致性检验); (2)特殊模型分析(复杂,少用)
第二部分
RC表资料统计 分析常见错误的辨析 与释疑
(一)双向无序列联表;
(二)单向有序列联表; (三)双向有序且属性不同的列联表;
类
(四)双向有序且属性相同的列联表。
(一)结果变量为“二值变量” 的高维表;
第三类:高维表,三型 (二)结果变量为“多值有序变量”的高维表
(三)结果变量为“多值名义变量”的高维表
第一部分:R×C表的四型
1、双向无序列联表; 2、结果变量为有序变量的单向
有序列联表; 3、双向有序且属性不同的列联
表; 4、双向有序且属性相同的列联
表。
1型资料举例1
(双向无序R×C表)
表1 某地6094人按2种血型划分的结果
━━━━━━━━━━━━━━━━━━━
ABO
人数
血型 MN血型:M
N
MN
───────────────────
O
431
490
902
A
388
病例数
纤维喉:正确
未确定
错误 合计
43
9
2
54
0
0
0
0
0
0
5
5
43
9
7
59
释疑
原作者真正的目的是想 分析这两种检测方法的检测 结果之间是否具有一致性, 因而应选用与之相应的一致 性检验,即kappa 检验。
3、误用卡方检验处理 单向有序列联表资料
《溶菌酶和乳铁蛋白在慢性鼻窦 炎钩突粘膜中的表达》,采用免疫 组化ABC法,检测溶菌酶(LZ)和乳铁 蛋白(LF)在17侧健康和70侧慢性鼻 窦炎患者(分为单纯炎症组和合并鼻 息肉组)钩突粘膜中的表达情况。分 别得到以下两表和结论:
3型资料计算方法
(双向有序且属性不同R×C表)
其一、检验各组结果之间的差别; 用秩和检验等方法处理资料; 其二、研究两有序变量之间的相关性; 用Spearman秩相关分析处理资料; 其三、研究两有序变量之间是否呈直线关系; 用线性趋势检验处理资料; 其四、各行(或列)频数分布是否相同; 用卡方检验或Fisher精确检验处理资料。
1、对单向有序资料未进行 统计分析直接得出结论
《两种术式治疗单侧声带麻痹的 比较》,原作者对23例喉支架术 (9例)及喉神经再支配术(14例) 的患者手术前及手术后进行了比较 观察,各术式声音评估情况见表1:
对差错的辨析
原作者未对资料进行统计分 析就直接得出结论,显然是错误 的,本资料应属于结果变量为有 序变量的单向有序列联表资料, 原表设计不利于进行相应的统计 分析,先把上表修改如下:
回归分析。
(关键是对结果变量打分计算)
3型资料举例
(双向有序且属性不同R×C表)
表4
眼晶状体混浊度与年龄之关系
━━━━━━━━━━━━━━━━━━━
晶状体混
眼数
浊 程 度 年龄∶20~
30~
40~
───────────────────
+
215
131
148
++
67
101
128
+++
44
63
132
───────────────
410
800
B
495
587
950
AB
137
179
325
───────────────
合计
1451
1666
2977
━━━━━━━━━━━━━━━━━━━
例1计算方法
(双向无序R×C表)
因表中小于5的理 论频数没有或很少,故 这样的双向无序列联表 资料可以用一般的卡方 检验来处理。
1型资料举例2
分级 数 正确 错误 正确 错误 未定
T1 21 20 1 19 0 2 T2 17 15 2 15 2 0
T3 13 11 2 8 2 3
T4 8 8 0 1 3 4
合计 59 54 5 43 7 9
总准确率:MRI:92%(54/59); 纤维喉镜:73%(43/59);P< 0.01
结论 MRI能准确判断会厌前间隙 (PES)、喉旁间隙(PGS)浸润及软 骨破坏,因而可显著提高喉癌术前 分期的准确性,对临床治疗方案选 择具有重要意义。
杯状细胞 腺体细胞 上皮细胞 分组 -- + ++ +++ - + ++ +++ -- + ++ ++
8 正常对照组 3 5 1 0 10 7 0 17 0 0 0 1 单纯鼻炎组 11 7 2 0 11 10 0 19 2 0 0 并鼻息肉组 13 22 10 4 0 10 27 12 43 5 1 0
从资料类型上看,需要进行秩 和检验或Ridit分析,其实再看一 看每一时期两组的样本含量,就会 发现样本含量太小,每组分为四个 疗效级别而例数只有9例和14例, 即使两组间疗效真正存在差别,也 可能由于样本例数太小,无法提供 充足的信息而不能得出差异具有统 计学意义的结论来。
表1 溶菌酶在各组钩突 粘膜中的表达状况