第八章 诊断试验的设计与评价(2学时)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)似然比(likelihood ratio,LR)
在诊断试验评价中,特定方法的似然比被界定为:病 人中出现某种检测结果的概率与非病人中出现相应结 果的概率之比,说明病人出现该结果的机会是非病人 的多少倍。 一项诊断效率高的诊断方法应该是真阳性率高,假阳 性率低。这二项之比称为该诊断试验的似然比,似然 比愈大,诊断的价值也愈大。
ua n (1 p) p
公式中n为所需例数,u/2为检验水准所对应的双侧正态分布界值, P为灵敏度或特异度的预期值, 为允许误差。 样本量的估计主要取决于灵敏度、特异度和允许误差(一般0.050.10)三个参数。如果为了排除疾病,需要诊断方法的灵敏度较高; 如果为了确诊疾病,需要诊断方法的特异性较高。 也可用查表法来估计样本含量
上诊断试验的诊断价值。
糖尿病试验不同血糖的灵敏度和特异度分布
餐后二小时血糖 (mg/100ml)
70 80 90 100 110 120 130 140 150 160 170 180 190 200
灵敏度%
98.6 97.1 94.3 88.6 85.7 71.4 64.3 57.1 50.0 47.1 42.9 38.6 34.3 27.1
表示不同诊断水平的真阳性率对假阳性率的函数关系。
ROC曲线
作用: 1、客观反映灵敏度和特异度之间的关系;
2、正常值临界点的选择;
3、比较两种或两种以上诊断试验的价值
ROC曲线评价方法
以灵敏度和假阳性率为两个轴的取值作的图形; 通常用于测定值为连续或等级数据; 常用于确定最佳临界值,也可用于比较两种和两种以
对照组样本量估计
1.962 0.739 (1 0.739) n 59.1 60 2 0.08
[四] 评价结果的整理
表9-1
筛检试验评价
金标准
筛检试验
阳性 阴性 合计
患者 真阳性 A 假阴性 C
非患者 假阳性 B 真阴性 D
合计
R1 R2 N
C1
C2
例:某病患病状况与诊断结果
康 临床期
复
易感期
临床前期
残疾、死亡
疾病发生
出现症状
图9-2 疾病自然史与筛检、诊断示意图
筛检试验
诊断试验
开始暴露
临床前可 检查期
诊断 治疗
康 临床期 复
易感期
临床前期
残疾、死亡
疾病发生 图9-3
出现症状 疾病自然史与筛检诊断示意图
图7-4
筛检试验流程图
筛检试验与诊断试验的区别
筛检试验 对象 目的 要求 费用 健康人或无症状的病人 发现可疑病人 病人 对病人进行确诊 诊断试验
LR 假阴性率 1 灵敏度 真阴性率 特异度
某卫生机构为了评价物理检查在急性化脓性咽炎诊断中的真实性, 以咽拭子培养甲组乙型溶血性链球菌作为“金标准”,
病人 物理检查 阳性 阴性 合计 54 11 65
非病人 21 142 163
合计 75 153 228
阳性似然比=(54/65)/(21/163)=6.45 阴性似然比=(11/65)/(142/163)=0.19 说明病人中出现检查阳性的机会是非病人的 6.45 倍;还说明病 人中出现检查阴性的机会是非病人的0.19倍。
多数情况下,患者例数少于非患者例数,故符合率受 特异度的影响大于灵敏度的影响。
筛检试验 患者 金标准 非患者 合计
阳性
阴性 合计
真阳性 A
假阴性 C
假阳性 B
真阴性 D
R1
R2 N
C1
C2
三、诊断试验中正常值临界点的选择
人群中青光眼患者与非青光眼患者眼内压分布
ROC曲线
ROC曲线( receiver operator characteristic curve,受试者工作特征曲线) 的横轴表示假阳性率 (1-特异度),纵轴表示灵敏度,曲线上的任意一个 点代表一项诊断方法的特定阳性标准值相对应的灵敏 度和特异度对子。 表示一个特定的诊断方法对区别特定的患者组与非患 者组样本的检测性能。
灵敏度和特异度的关系
都是反映诊断试验准确性的最基本指标 提高一方面水平,会降低另一方面水平 一般选择敏感度和特异度都较高的试验作为诊断依据 根据研究目的,调整灵敏度和特异度来确定临界值 以产生漏诊和误诊之和最小时的数据确定临界值
3、灵敏度与特异度的综合评价
灵敏度与特异度是一个事物的两个方面,存在本质的 联系,不可能截然分开。而且,分别评价灵敏度和特 异度不利于全面把握诊断方法的真实性。 综合评价指标 (1)似然比(likehood ratio, LR) (2)诊断指数(Youden’s index) (3)符合率
阳性似然比和阴性似然比
阳性似然比是指真阳性率与假阳 性率之比,是诊断试验中阳性结 LR 真阳性率 灵敏度 假阳性率 1 特异度 果在患者中出现的概率与在非患 者中出现的概率之比。其计算公 式为 阴性似然比是指假阴性率与真阴 性率之比,是诊断试验中阴性结 果在患者中出现的概率与在非患 者中出现的概率之比。
筛检试验 患者 阳性
金标准 非患者 假阳性 B 真阴性 D
合计
真阳性 A 假阴性 C
R1 R2
二、真实性
阴性
合计
C1
C2
N
1. 灵敏度(sensitivity):指在“金标准” 确诊的病人中,待评价的诊断试验检测 A 灵敏度 100% 出的阳性人数所占的比例。将实际有 AC 病的人正确判断为患者的能力。真阳 性率 假阴性率(false negative rate,漏 诊率):指在“金标准”确诊的病人 中诊断试验检测出的“阴性”人数所 占的比例。将实际有病的人错误判断 为非患者的比例。
[二] 研究对象的选择
总的原则是:研究对象应能代表诊断方法可能应用的靶 人群。
\ 病例组应当包括所研究疾病的各种临床类型:轻、中、 重型,早、中、晚期,典型的和不典型的,有和没有并 发症者,治疗过的与未治疗过的,使病例组对该病的总 体具有代表性,使评价的结果对该病具有普遍的意义。
[二] 研究对象的选择
(2)诊断指数(约登指数(Youden Index,YI) )
是将灵敏度与特异度相加,反映诊断方法发现病人和 非病人的总的能力,表示诊断试验判断真正患者和非 患者的总能力。 同时考虑灵敏度和特异度的指标 数值越大,真实性越好 DI=灵敏度+特异度-1
(3)符合率(agreement rate) 指诊断试验中真阳性和真阴性之和占总受检人数的比 例。表示观察值与标准值或真实值符合的程度。又称 准确度。 符合率=(A+D)/(A+B+C+D)
假阳性率(false positive rate,误诊 率):指在“金标准”确诊的非病人中 诊断方法检测出的“阳性”人数所占的 比例。将实际无病的人错误判断为患者 的比例。
特异度
D 100 % BD
假阳性率
B 100% BD
高特异度试验的适用范围 假阳性会使病人受到严重危害(精神及肉体) 确诊某病
非病组应选自确实无该病的其他病例,并且还应该包括 容易与该病产生混淆的其他疾病,这主要是为了考察待 评价诊断方法的疾病鉴别诊断的能力。 研究对象的选择既要考虑到病例的代表性,同时又要考 虑到诊断方法的鉴别能力。 选择研究对象的过程中必须遵循随机化的原则,避免随 意选择研究对象。
[三] 样本含量的估计
金标准
+
目 标 人 群
病人 - 待评价的 方法 + 非病 人 -
评价指标
图7-5 筛检或诊断试验的评价程序
[一]“金标准”的确定
是指目前医学界公认的诊断某种疾病最准确可靠的方 法或手段。 通常,一种疾病有一个“金标准” 常用的金标准包括 病理学诊断(活检、尸检) 外科手术或诊断性操作 特殊的影像学诊断 权威机构颁布的综合诊断标准
金标准 诊断试验 病人 非病人 合计
阳性
阴性
18
2
49
931
67
933
合计
20
980
1000
第二节 诊断试验的评价
诊断方法是对人体无害、操作简便、出结果迅速、 费用低廉,还要考虑诊断方法的真实性、可靠性和 收益三个方面。
一、诊断方法的评价内容
1、真实性(validity)。准确度(accuracy)、效度 (validity)。是指一般测量工具的实际测量结果与真 值(true value)之间的接近程度。在诊断方法的评价 中,真实性是指诊断方法的检测结果与“金标准”的检 测结果的符合程度,用灵敏度和特异度表示。 2、可靠性( reliability )。精确度(precision)、信 度(reliability)和可重复性(repeatability)。是 指在相同条件下针对同一事物,测量工具重复测量其结 果的稳定程度(stability)。在诊断方法评价中,可靠 性是指在相同条件下针对同一研究对象,重复检测其结 果的稳定程度,或一致性(consistency)、重现性。
假阴性率 C 100% AC
高灵敏度试验的适用范围
漏诊可能造成严重后果
排除某病的其他诊断
筛检无症状病人而且该病发病率较低
筛检试验 患者 阳性 阴性
金标准 非患者 假阳性 B 真阴性 D
合计
真阳性 A 假阴性 C
R1 R2
合计
C1
C2
N
2、特异度(specificity):指在“金标 准”确诊的非病人中,诊断试验检测出 的阴性人数所占的比例。将实际无病的 人正确判断为非患者的能力。
临床前期
临床期
残疾、死亡
疾病发生
出现症状
图9-1 疾病自然史
如果疾病在临床前期出现一些可以识别的异常特征, 如肿瘤的早期标识物(biomarkers)、血压升高、血脂 升高等,则可使用一种或多种方法将其查出,并对其做 进一步的诊断和治疗,则可延缓疾病的发展,改善其预 后
开始暴露 诊断 治疗
临床前可 检查期
“金标准”的特性
1. 准确性高:用低成本且比较安全的诊断技术去代替昂 贵而危险的“金标准”可能导致疾病错误分类情况的 发生,即将病人判断为非病人,将非病人判断为病人 2. 临床可行性差:通常具有精确、复杂、昂贵和危险的 特性 3. 相对性:任何一个“金标准”只是特定历史条件下医 学发展的产物,它不具有恒真性;目前所使用的所谓 金标准也是相对的;在没有更好的标准的时候,一般 标准也是金标准。
Βιβλιοθήκη Baidu快速、简便、安全,高灵 复杂、准确性和特异度高 敏度 经济、廉价 花费较高
处理
用诊断试验确诊
严密观察和及时治疗
第一节 诊断试验的研究设计
一、定义
诊断试验(diagnostic test)即给病人做出诊 断所应用的各种实验室检查、医疗仪器检查及其 他方法。 随着医学科学的发展和对疾病认识的不断深化, 新的诊断试验不断出现以代替旧的诊断试验应用 于临床。为了提高诊断水平,应研究和评价这些 新的诊断试验,以确定其能否取代或充实现有的 诊断方法和能否推广。
二、诊断试验的用途
诊断疾病 筛选无症状的病人 判断疾病的严重程度 估计疾病临床过程及预后 估计对治疗的反应 评价判断治疗效果
三、诊断试验的研究设计程序
1.选择一个“金标准”, 2.用“金标准”去筛选一定数量的患有和未患 有某种疾病的研究对象,分为“病例组(有 病)”与“对照组(无病)” 3.用待评价诊断方法同步地盲法测试二组研究 对象。 4.将所获得的结果与“金标准”的诊断结果进 行比较,用一些特殊的指标来评价诊断方法的 价值(第二节详细讲解)。
第九章
筛检与诊断试验的设计与评价
筛检试验:是运用快速、简便的试验、检查
或其他方法,将健康人群中那些可能有病或 缺陷、但表面健康的个体,同那些可能无病 者鉴别开来。简便、价廉、易被接受。用于疾
病的二级预防
诊断试验:为临床医生选择诊断提供依据。诊 断与鉴别诊断
开始暴露
诊断 治疗 康 复
易感期
2
例 肿瘤标志物CA19-9是临床上用来诊断胰腺癌的指 标之一,其对诊断胰腺癌的灵敏度估计为77.3%,特 异度估计为73.9%,若设定容许误差δ =0.08,检验水 准 =0.05( u/2=1.96),试问需要多大的样本量才 能具有统计学意义?
试验组的样本量估计
1.962 0.773 (1 0.773) n 53.7 54 2 0.08