诊断试验的评价
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
评价程序
金标准
病人
阳 性
阴 性 阳性
非病 人
特定 人群 待评价方法
结果
评价
阴性
金标准(gold standard)
金标准是指一种疾病标准诊断方法,是当前医学界公认的、
诊断某病的可靠的诊断方法,应用该标准能较正确区分某种
疾病的人和不具有该病的人。 常见的金标准有:病理学检查(组织活检和尸体解剖)、手 术发现、微生物培养、特殊的影像学诊断、长期随访结果。 要评价一个试验方法,金标准的选择是非常重要的。一项诊 断试验的准确程度只有在金标准诊断的病人组和非病人组中 进行考核,才能得到正确地评价。
似然比(likelihood ratio, LR)
一项诊断价值高的试验,应当是真阳性率(灵 敏度)高而假阳性率低。两者的比值称为诊断 试验的似然比。
真阳性率 LR 假阳性率
约登指数(Youden’s Index)
正确指数。灵敏度和特异度是反映一项诊断试验的
两个基本指标,两者之和减去1。
Youden 指数 灵敏度 特异度 1 a d 1 ac bd 1 漏诊率 误诊率
自的总体 。
样本大小
U P(1 P)
2
N
2
p为试验的预期特异性或灵敏度,为容许误差,
为第一类误差的概率,U值由U界值表可查得。
评价内容
包括两方面:
1.真实性(validity) 真实性是指测量值与实际值的 符合程度。 2.可靠性(reliability) 重复性(repeatability), 指一项试验在相同的条件重复
真阳性 真阴性 ad 100% 受试总人数 abcd
调整符合率
1 a d a d 100% 4ac bd ab cd
Kappa值:表示两种试验的结果的一致性的程度
Kappa值的计算
被 评 价 试验结果 阳 阴 性 性 金 标 准 有 病 A (真阳性) C (假阴性) A+C 无 病 B (假阳性) D (真阴性) B+D 合 计
Kappa值
一致性强度
<0
A+B C+D N
弱
轻 尚好 中度
0~0.2 0.21~0.40 0.41~0.60
合 计
ad n (a b)( a c) (c d )( b d ) ] n 机遇一致率: p c [ n n
观察一致率:p 0
0.61~0.80
0.81~1
高度
一、确定金标准 二、选择研究对象:病人和非病人 病例组是指用金标准确诊‘有病’的病例,应包含典型的、 不典型病例,早、中、晚期病例,轻、中、重病例、有和无 并发症的患者。 非病例组是指用金标准证实没有目标疾病的其他病例,特别 是与该病容易混淆的病例。 三、确定样本大小 四、同步试验、盲法(double blind)观察 五、根据试验检查的结果,评价其诊断价值
很强
Kappa
p0 pc 1 pc
甲、乙二医生阅读胸部X线片诊断结果
甲医生诊断 乙医生诊断 肺门淋巴结结核 肺门淋巴结结核 正 常 46(α) 12(c) 正常 10(b) 32(d) 56(r1) 44(r2) 合计
合 计
58(c1)
42(c2) 100(N)
观察一致率=(46+32)/100=78% 机遇一致率=[(58×56)/100+(42×44)/100]/100=51% Kappa=(78%-51%)/(1-51%)=0.55
影响试验可靠性的因素
1.实验方法本身或仪器的差异 2.调查对象的生物学变异:研究对象间的变异和研究
对象内部变异wenku.baidu.com
3.观察者的测量变异:观察者间变异和观察者内变异
真实性评价的内容
包括两个方面: 1、对有病的识别能力 2、对无病的识别能力
真实性评价指标
1、灵敏度(sensitivity, Se):在真正有病的人中,试
研究对象
研究对象包括两组,病例组和非病例组。
病例组是被金标准确诊的病人。应包含该疾病的典型与非典
型病例,早、中、晚期各期病例,轻、中、重病例、有和无 并发症的患者。 非病例组是用金标准证实无该病的人群,即对照组。还应包 括与该病容易混淆的病例(作鉴别诊断)
所有的研究对象都要有代表性,病例组和对照组都应代表各
2、特异度(specificity,Sp ):指在无病的人中试验结 果阴性的百分率,即真阴性率。特异度表示试验方法对无病 的检出能力。特异度越高,说明对无病的判断能力越强,无 病的人误诊机会越少。
真阴性 d 特异度 ( Sp) 100% 100% 真阴性 假阳性 bd
假阳性 b 误诊率 假阳性率 1 特异度 100% 100% 假阳性 真阴性 bd
验结果阳性的百分率,即真阳性率。
真阳性 a 灵敏度( S e ) 100% 100% 真阳性 假阴性 ac
灵敏度表示试验方法对疾病的检出能力。灵敏度越高,说 明试验方法对疾病检出能力越强,病人漏诊机会越少。
假阴性 c 漏诊率 假阴性率 1 灵敏度 100% 真阳性 假阴性 a c
试验获得相同结果的稳定程度。
评价的结果
被 评 价 试验结果 阳 性
金 标 准 有 病 无 病 合 计
A (真阳性)
C (假阴性)
B (假阳性)
D (真阴性)
A+B
C+D
阴
性
合 计
A+C
B+D
N
可靠性的评价
标准差和变异系数
CV 标准差/ 算术均数
符合率或一致性 调整一致性
符合率
评价甲胎蛋白诊断肝癌的价值,以肝穿刺作为 金标准,试验结果如下表。
甲胎蛋白 试验结果 异
正
肝穿刺结果 肝 癌 非肝癌
合 236
66
计
常
常
205(a)
29(c) 234
31(b)
37(d) 68
合 计
302(N)
试验方法的评价 和疾病筛检
朱益民
浙江大学医学院
流行病与卫生统计学系
基本内容
试验方法的评价 诊断价值的评价(预测值) 提高诊断效率的方法 疾病筛检
试验方法的评价
评价程序
可靠性评价
真实性评价
诊断标准与灵敏度和特异度的关系
ROC曲线
参考值建立的方法
评价程序
被评价的方法与标准方法作同步、盲法试验。