诊断试验

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

100
敏感度（%）
60 50 ● ≥280 u/L 40 30 20 10 0
图1 血清磷酸肌酸激酶诊断急性心肌梗塞的ROC曲线
诊断试验的可靠性评价
• 可靠性：重复性或信度。在相同条件下，重复试验结果的稳定性。计量资料：变异系数（CV）=标准差/均数 *100% 计数资料：观察符合率
概
述
• 诊断：区分患者和非患者；
• 诊断试验：用于区分患者和非患者的试验方法。
• 筛检试验：在目标人群中发现可疑患病个体的检查、检验或其他措施。
– 要求：简便、快速、经济、安全、有效、无创而乐于接受。
诊断试验
• 广义的诊断试验包括：
– 临床资料（病史、症状、体征）；
– 实验室检查（生化、免疫、微生物、寄生虫、
+
a(真阳性)
b(假阳性)
a+b
-
c(假阴性)
d(真阴性)
c+d
a+c
b+d
N
诊断试验的评价指标
• 假阳性率：误诊率 = b/(b+d) = 1-特异度 = 1-50% = 50% • 假阴性率：漏诊率 = c/(a+c) = 1-敏感度 = 1-96% = 4%
诊断试验 + a(真阳性) b(假阳性) a+b 有病
• 序列试验Spe = SpeA + SpeB×(1-SpeA)
• 序列试验Sen = SenA×SenB
诊断试验的评价原则（1）
1. 诊断试验与标准诊断法的(同期)比较，是否采用
盲法（避免人为主观因素的影响，试验数据一般具有客观性）？ 2. 研究病例是否包括各型病例（轻、中、重型）以及易混淆的病例？ 3. 病例的来源和研究工作的安排是否做了叙述？
四格表—计算评价指标
金标准有病诊断试验 + 无病合计有病无病合计 96 4 250 250 346 254
a(真阳性 b(假阳性 a+b ) ) c(假阴性 d(真阴性 c+d ) )
合计
a+c
b+d
N
100
500
600
诊断试验的评价指标
• 敏感度 Sen
• 特异度 Spe
• 阳性预测值
a(真阳性)
b(假阳性)
a+b
LR-=假阴性率/真阴性率
=[c/(a+c)]/[d/(b+d)]
-
c(假阴性)

d(真阴性)
c+d
a+c
b+d
N
=（1-灵敏度）/特异度
诊断试验的评价指标
• 敏感度和特异度一般呈彼消此长的关系；
• 准确度高的试验，敏感度和特异度之和较高，假
阳性率和假阴性率之和最小；
• 准确度不能单方面反映敏感度或特异度
诊断试验界值
A 无病有病
Ａ．理想的正常人群与患者试验结果分布
试验结果
人数 B 重叠无病有病
Ｂ．现实的正常人群与患者试验结果分布
试验结果
21
诊断界值区分有病与无病
无病 b
假阴性
有病
a
c d 测量值
假阳性
诊断界值区分有病与无病
灵敏度高，假
阴性低。
试验试验+
在结果呈阴性时临床价值最大，适用于：疾病
诊断试验评价原则(2)
4. 诊断试验的重复性及临床意义是否明确？
5. 参考值的确定是否合理可靠？ 6. 在一系列诊断试验中该诊断试验是否最正确？ 7. 诊断试验的检测步骤是否详尽？是否可以被重复验证？ 8. 诊断试验的实用性如何？
• 谢谢！
• 阴性预测值
• 假阳性率FP：误诊率
• 假阴性率FN：漏诊率
• 阳性似然比 LR+
• 阴性似然比 LR-
• 准确度：观察符合率
诊断试验的评价指标
• 敏感度：真阳性率
敏感度 = a/(a+c) = 96/100 = 96％
有病诊断试验金标准
无病
合计
• 特异度：真阴性率
特异度 = d/(b+d) = 250/500 = 50％
似然比的临床应用
验前概率=临床分析估计的概率
验前比值=验前概率/（1-验前概率）验后比值=验前比值×似然比验后概率=验后比值/（1+验后比值）
诊断试验的评价指标
LR+=真阳性率/假阳性率 =[a/(a+c)]/[b/(b+d)] =灵敏度/（1-特异度）
诊断试验 + 有病
金标准
无病
合计
N
诊断试验的评价指标
• 阳性似然比（Positive Likelihood Ratio）：
真阳性率和假阳性率的比值，即诊断试验
阳性时患者患病与无病几率的比值。
• 阴性似然比（Negative Likelihood Ratio）：假阴性率和真阴性率的比值，即诊断试验阴性时患者患病与无病几率的比值。
诊断试验临床应用价值的评价
预测值（predictive value,PV）：应用新诊断试验的结果来估计受试者患病或无病的可能性的大小。 PV+：真阳性/（真阳性+假阳性） PV-：真阴性/（真阴性+假阴性）
诊断试验临床应用价值评价
• 阳性预测值 = a/(a+b) = 96/346
有病诊断试验
受试者工作特征曲线（ROC曲线）
Y轴：试验敏感性（真阳）；X轴：1-特异度（假阳），连续曲线的最佳临界值； • 确定参考值 • 对两个以上独立诊断试验的比较-曲线下面积越大提示试验的准确性越高；
血清磷酸肌酸激酶诊断急性心肌梗塞的ROC曲线
特异度（%）
100 90 80 70 60 50 40 30 20 10 0 ● A 90 80 70 ● ≥80 u/L ● ≥40 u/L ≥1 u/L
无病 b
有病
漏诊可能造成
严重后果者；
a
c d 测量值
23
诊断界值区分有病与无病
特异度高，假
阳性低。
试验试验+
在结果呈阳性时临床价值最大，
无病 b
有病
适用于：疾病误诊可能造成严重后果者。
24
a
c d 测量值
诊断界值区分有病与无病
试验-
试验+
要权衡灵敏度和特异度
无病 b 有病
a
参考教材
• 临床流行病学（第三版），王家良主编，上海
科学技术出版社
• 临床流行病学（全国高等学校教材），李立明
主编，人民卫生出版社
• Haynes RB et al. Clinical Epidemiology: How to Do
Clinical Practice Research (Third Edition ), 2006
• 平行试验Sen = SenA + SenB×(1-SenA)
• 平行试验Spe = SpeA×SpeB
提高诊断试验效率 —联合试验
• 序列试验：
– 几个独立试验的结果中只要有一个阴性就判为序列试验阴性（获阴性结果时就终止试验），结果全部为阳性才判为序列试验阳性。 – 提高特异度，降低敏感度。
金标准
无病
合计
-
c(假阴性)
d(真阴性)
c+d
a+c
b+d
N
诊断试验的评价指标
• 准确度：符合率 = (a+d)/N = (96+250)/600 = 58％
诊断试验 + 有病
金标准
无病
合计
a(真阳性)
b(假阳性)
a+b
•
诊断比值比（OR）
-
c(假阴性)
d(真阴性)
c+d
＝ad／bc
a+c
b+d
金标准
无病
合计
= 28％
• 阴性预测值 = d/(c+d) = 250/254 = 98％
+
a(真阳性) b(假阳性) a+b
-
c(假阴性) d(真阴性) c+d
a+c
b+d
N
提高诊断试验效率 —联合试验
• 平行试验：
– 几个独立试验的结果中只要有一个阳性就判为平行试验阳性（获阳性结果时就终止试验），结果全部为阴性才判为平行试验阴性。 – 提高敏感度，降低特异度。
诊断试验的可靠性（Reliability）评价
•
诊断试验的临床实用价值（Clinical
applicability）
诊断试验真实性评价
真实性：诊断试验结果与实际情况的符合程度。
确定金标准
选择研究对象
独立盲法与金标准比较
确立金标准（标准诊断）
• • • 目前临床医学界公认最为准确和可靠的诊断方法；可“正确”区分“有病”或“无病”；金标准的确立应结合临床具体情况，包括：
诊断试验真实性的评价指标
• 灵敏度（Se）：敏感度、真阳性率
• 特异度（Sp）：真阴性率
• 总符合率：一致性、准确度
诊断性试验的评价指标
• 敏感度（Sensitivity）：采用金标准诊断为“有病
”病例中，诊断性试验为阳性的比例。 • 特异度（Specificity）：采用金标准诊断为“无病 ”病例中，诊断性试验为阴性的比例。 • 准确度（Accuracy）：诊断性试验真阳性和真阴性在总检例数中的比例。 • 比值比（OR）=（真阳性×真阴性）/（假阳性×假阴性）
– 病例组应包括（纳入）各型病例(典型和不典型；早、中、晚期；轻、中、重型；有和无并发症；经治疗与未治疗等)； – 对照组应包括（纳入）确实无该病的易混淆的其它病例。
样本量
• 保证评价结论可靠正确的最小样本量 • 参数：
– 显著性水平(α=0.05)、容许误差(δ=0.05~0.10)、灵敏度（Sen）、特异度（Spe）病例组的样本量：n1 = Z2Sen(1-Sen)/2 对照组的样本量：n 2= Z2Spe(1-Spe)/2
c d 测量值
25
诊断试验参考值的确立方法
• 正态分布法(均数±标准差)：双侧1.96，单侧1.64 （95％正常范围）； • 百分位数法：双侧P2.5~P97.5，单侧P5或P95（95 ％正常范围）； • 受试者工作特性曲线(ROC曲线)法： • 结合专业实际进行临床判断：根据人群调查所得危险因素来判断。
– – – – – – 实验室检查、细菌培养；手术探查、组织活检、尸体解剖（病理学诊断）；特殊影像诊断；公认的综合诊断标准，如系统性红斑狼疮；长期随访的肯定诊断，如慢性胰腺炎；权威医疗机构颁布的诊断标准，如2003年流行的急性重症非典型肺炎。
研究对象的选择
• 能够代表检查对象的目标人群。 • 分阶段评价：典型患者不同病情程度多中心大样本多种临床类型 • 代表性：
病理等）；
– 器械或影像学检查（心电图、内镜、X线、B超、
CT、核磁共振等)。
诊断试验评价意义
正确诊断是成功治疗和判断预后的前提；
科学的评价有助于客观判断诊断试验真实性、科学性和实用价值。正确评价诊断试验能避免盲目片面选择诊断试验。
第一节诊断试验评价的设计
•
•
诊断试验的真实性（Validity）评价