诊断试验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
100
敏感度(%)
60 50 ● ≥280 u/L 40 30 20 10 0
图1 血清磷酸肌酸激酶诊断急性心肌梗塞的ROC曲线
诊断试验的可靠性评价
• 可靠性:重复性或信度。在相同条件下, 重复试验结果的稳定性。 计量资料:变异系数(CV)=标准差/均数 *100% 计数资料: 观察符合率
概
述
• 诊断:区分患者和非患者;
• 诊断试验:用于区分患者和非患者的试验 方法。
• 筛检试验:在目标人群中发现可疑患病个 体的检查、检验或其他措施。
– 要求:简便、快速、经济、安全、有效、无创 而乐于接受。
诊断试验
• 广义的诊断试验包括:
– 临床资料(病史、症状、体征);
– 实验室检查(生化、免疫、微生物、寄生虫、
+
a(真阳性)
b(假阳性)
a+b
-
c(假阴性)
d(真阴性)
c+d
a+c
b+d
N
诊断试验的评价指标
• 假阳性率:误诊率 = b/(b+d) = 1-特异度 = 1-50% = 50% • 假阴性率:漏诊率 = c/(a+c) = 1-敏感度 = 1-96% = 4%
诊 断 试 验 + a(真阳性) b(假阳性) a+b 有病
• 序列试验Spe = SpeA + SpeB×(1-SpeA)
• 序列试验Sen = SenA×SenB
诊断试验的评价原则(1)
1. 诊断试验与标准诊断法的(同期)比较,是否采用
盲法(避免人为主观因素的影响,试验数据一 般具有客观性)? 2. 研究病例是否包括各型病例(轻、中、重型) 以及易混淆的病例? 3. 病例的来源和研究工作的安排是否做了叙述?
四格表—计算评价指标
金标准 有病 诊 断 试 验 + 无病 合计 有病 无病 合计 96 4 250 250 346 254
a(真阳性 b(假阳性 a+b ) ) c(假阴性 d(真阴性 c+d ) )
合计
a+c
b+d
N
100
500
600
诊断试验的评价指标
• 敏感度 Sen
• 特异度 Spe
• 阳性预测值
a(真阳性)
b(假阳性)
a+b
LR-=假阴性率/真阴性率
=[c/(a+c)]/[d/(b+d)]
-
c(假阴性)
d(真阴性)
c+d
a+c
b+d
N
=(1-灵敏度)/特异度
诊断试验的评价指标
• 敏感度和特异度一般呈彼消此长的关系;
• 准确度高的试验,敏感度和特异度之和较高,假
阳性率和假阴性率之和最小;
• 准确度不能单方面反映敏感度或特异度
诊断试验界值
A 无病 有病
A.理想的 正常人群与 患者试验结 果分布
试验结果
人 数 B 重叠 无病 有病
B.现实的 正常人群与 患者试验结 果分布
试验结果
21
诊断界值区分有病与无病
无病 b
假阴性
有病
a
c d 测量值
假阳性
诊断界值区分有病与无病
灵敏度高,假
阴性低。
试验试验+
在结果呈阴性 时临床价值最 大, 适用于:疾病
诊断试验评价原则(2)
4. 诊断试验的重复性及临床意义是否明确?
5. 参考值的确定是否合理可靠? 6. 在一系列诊断试验中该诊断试验是否最正 确? 7. 诊断试验的检测步骤是否详尽?是否可以 被重复验证? 8. 诊断试验的实用性如何?
• 谢谢!
• 阴性预测值
• 假阳性率FP:误诊率
• 假阴性率FN:漏诊率
• 阳性似然比 LR+
• 阴性似然比 LR-
• 准确度:观察符合率
诊断试验的评价指标
• 敏感度:真阳性率
敏感度 = a/(a+c) = 96/100 = 96%
有病 诊 断 试 验 金标准
无病
合计
• 特异度:真阴性率
特异度 = d/(b+d) = 250/500 = 50%
似然比的临床应用
验前概率=临床分析估计的概率
验前比值=验前概率/(1-验前概率) 验后比值=验前比值×似然比 验后概率=验后比值/(1+验后比值)
诊断试验的评价指标
LR+=真阳性率/假阳性率 =[a/(a+c)]/[b/(b+d)] =灵敏度/(1-特异度)
诊 断 试 验 + 有病
金标准
无病
合计
N
诊断试验的评价指标
• 阳性似然比(Positive Likelihood Ratio):
真阳性率和假阳性率的比值,即诊断试验
阳性时患者患病与无病几率的比值。
• 阴性似然比(Negative Likelihood Ratio): 假阴性率和真阴性率的比值,即诊断试验 阴性时患者患病与无病几率的比值。
诊断试验临床应用价值的评价
预测值(predictive value,PV):应用新诊断 试验的结果来估计受试者患病或无病的可能 性的大小。 PV+:真阳性/(真阳性+假阳性) PV-:真阴性/(真阴性+假阴性)
诊断试验临床应用价值评价
• 阳性预测值 = a/(a+b) = 96/346
有病 诊 断 试 验
受试者工作特征曲线(ROC曲线)
Y轴:试验敏感性(真 阳);X轴:1-特异度 (假阳),连续曲线 的最佳临界值; • 确定参考值 • 对两个以上独立诊断 试验的比较-曲线下面 积越大提示试验的准 确性越高;
血清磷酸肌酸激酶诊断急性心肌梗塞的ROC曲线
特异度(%)
100 90 80 70 60 50 40 30 20 10 0 ● A 90 80 70 ● ≥80 u/L ● ≥40 u/L ≥1 u/L
无病 b
有病
漏诊可能造成
严重后果者;
a
c d 测量值
23
诊断界值区分有病与无病
特异度高,假
阳性低。
试验试验+
在结果呈阳性 时临床价值最 大,
无病 b
有病
适用于:疾病 误诊可能造成 严重后果者。
24
a
c d 测量值
诊断界值区分有病与无病
试验-
试验+
要权衡灵敏度和 特异度
无病 b 有病
a
参考教材
• 临床流行病学(第三版),王家良主编,上海
科学技术出版社
• 临床流行病学(全国高等学校教材),李立明
主编,人民卫生出版社
• Haynes RB et al. Clinical Epidemiology: How to Do
Clinical Practice Research (Third Edition ), 2006
• 平行试验Sen = SenA + SenB×(1-SenA)
• 平行试验Spe = SpeA×SpeB
提高诊断试验效率 —联合试验
• 序列试验:
– 几个独立试验的结果中只要有一个阴性就判为 序列试验阴性(获阴性结果时就终止试验), 结果全部为阳性才判为序列试验阳性。 – 提高特异度,降低敏感度。
金标准
无病
合计
-
c(假阴性)
d(真阴性)
c+d
a+c
b+d
N
诊断试验的评价指标
• 准确度:符合率 = (a+d)/N = (96+250)/600 = 58%
诊 断 试 验 + 有病
金标准
无病
合计
a(真阳性)
b(假阳性)
a+b
•
诊断比值比(OR)
-
c(假阴性)
d(真阴性)
c+d
=ad/bc
a+c
b+d
金标准
无病
合计
= 28%
• 阴性预测值 = d/(c+d) = 250/254 = 98%
+
a(真阳性) b(假阳性) a+b
-
c(假阴性) d(真阴性) c+d
a+c
b+d
N
提高诊断试验效率 —联合试验
• 平行试验:
– 几个独立试验的结果中只要有一个阳性就判为 平行试验阳性(获阳性结果时就终止试验), 结果全部为阴性才判为平行试验阴性。 – 提高敏感度,降低特异度。
诊断试验的可靠性(Reliability)评价
•
诊断试验的临床实用价值(Clinical
applicability)
诊断试验真实性评价
真实性:诊断试验结果与实际情况的符合程度。
确定金标准
选择研究对象
独立盲法与金标准比较
确立金标准(标准诊断)
• • • 目前临床医学界公认最为准确和可靠的诊断方法; 可“正确”区分“有病”或“无病”; 金标准的确立应结合临床具体情况,包括:
诊断试验真实性的评价指标
• 灵敏度(Se):敏感度、真阳性率
• 特异度(Sp):真阴性率
• 总符合率:一致性、准确度
诊断性试验的评价指标
• 敏感度(Sensitivity):采用金标准诊断为“有病
”病例中,诊断性试验为阳性的比例。 • 特异度(Specificity):采用金标准诊断为“无病 ”病例中,诊断性试验为阴性的比例。 • 准确度(Accuracy):诊断性试验真阳性和真阴性 在总检例数中的比例。 • 比值比(OR)=(真阳性×真阴性)/(假阳性×假阴性)
– 病例组应包括(纳入)各型病例(典型和不典型; 早、中、晚期;轻、中、重型;有和无并发症; 经治疗与未治疗等); – 对照组应包括(纳入)确实无该病的易混淆的 其它病例。
样本量
• 保证评价结论可靠正确的最小样本量 • 参数:
– 显著性水平(α=0.05)、容许误差(δ=0.05~0.10)、 灵敏度(Sen)、特异度(Spe) 病例组的样本量:n1 = Z2Sen(1-Sen)/2 对照组的样本量:n 2= Z2Spe(1-Spe)/2
c d 测量值
25
诊断试验参考值的确立方法
• 正态分布法(均数±标准差):双侧1.96,单侧1.64 (95%正常范围); • 百分位数法:双侧P2.5~P97.5,单侧P5或P95(95 %正常范围); • 受试者工作特性曲线(ROC曲线)法: • 结合专业实际进行临床判断:根据人群调查所得 危险因素来判断。
– – – – – – 实验室检查、细菌培养; 手术探查、组织活检、尸体解剖(病理学诊断); 特殊影像诊断; 公认的综合诊断标准,如系统性红斑狼疮; 长期随访的肯定诊断,如慢性胰腺炎; 权威医疗机构颁布的诊断标准,如2003年流行的急性重症 非典型肺炎。
研究对象的选择
• 能够代表检查对象的目标人群。 • 分阶段评价:典型患者不同病情程度 多中心大样本多种临床类型 • 代表性:
病理等);
– 器械或影像学检查(心电图、内镜、X线、B超、
CT、核磁共振等)。
诊断试验评价意义
正确诊断是成功治疗和判断预后的前提;
科学的评价有助于客观判断诊断试验真实性、科 学性和实用价值。 正确评价诊断试验能避免盲目片面选择诊断试验。
第一节 诊断试验评价的设计
•
•
诊断试验的真实性(Validity)评价