7 诊断性试验的设计与评价
关于诊断性试验实施设计的步骤
关于诊断性试验实施设计的步骤1. 确定试验目标在进行诊断性试验设计之前,首先需要明确试验的目标。
确定试验目标有助于指导试验的设计和实施过程,并确保试验结果的可靠性和有效性。
试验目标通常与诊断性试验的研究问题相关,例如评估某种诊断测试的准确性、敏感性、特异性等。
2. 确定试验流程根据诊断性试验的特点和目标,确定试验的整体流程。
试验流程应包括以下几个重要步骤:2.1 选取研究对象根据试验目标,选择适当的研究对象。
研究对象可以是人群、动物或其他实验样本。
确保选取的研究对象能够代表目标人群或样本,并具有一定的统计代表性。
2.2 确定诊断测试方法根据研究对象的特点和试验目标,确定适当的诊断测试方法。
诊断测试方法应具有足够的准确性和可靠性,能够满足试验的要求。
常见的诊断测试方法包括病理组织学检查、影像学检查、生化指标检测等。
2.3 制定数据收集计划设计合理的数据收集计划,明确需要收集的数据类型和数量。
数据收集计划应包括样本容量估计、数据收集时间点以及数据收集方法等内容。
确保数据收集过程的准确性和一致性。
2.4 制定试验分析计划在试验设计的过程中,需要制定试验分析计划。
试验分析计划应包括数据分析方法、统计指标和数据处理流程等内容。
确保试验结果的可靠性和客观性。
3. 进行试验实施根据确定的试验流程,开始进行试验实施。
试验实施阶段需要注意以下几点:3.1 试验操作标准化为了保证试验结果的可比性和可靠性,需要制定试验操作的标准化方案。
试验操作标准化包括试验操作流程的严格控制、试剂的准备和储存条件的规范等。
3.2 数据收集和记录按照数据收集计划进行数据收集和记录工作。
确保数据的准确性和完整性。
采用合适的数据采集工具和方法,加强数据的管理和验证。
3.3 质量控制在试验实施过程中,需要进行质量控制。
质量控制包括对实验设备和试剂的质量进行监测和验证,以及对试验操作流程的监督和检查等。
4. 数据分析与结果解释在试验实施完毕后,对收集到的数据进行分析和解释。
诊断试验的临床效能评价
a+d 粗一致性 = ————×100% n
调整一致性 = ¼(灵敏度+特异度+阳性预告值+阴性预告值)×100%
二、预测值 1.阳性预测值是指真阳性人数占试验结果阳性 人数的百分比,表示试验结果阳性者属于真 病例的概率。阳性预测值计算公式: PPV=a/(a+b)×100%
2.阴性预测值是指真阴性人数占试验结果阴性 人数的百分比,表示试验结果阴性者属于非 病例的概率。阴性预测值计算公式: NPV=d/(c+d)×100%
评价诊断试43; 合计
合计
病人 非病人 a(真阳性) b(假阳性) a+b c(假阴性) d(真阴性) c+d a+c b+d a+b+c+d(n)
假阴性率
阴性似然比 = ————
真阴性率
四、ROC曲线分析
ROC是受试者工作特征(Receiver Operating Characteristic)或相对工作特性曲线(Relative Operating Characteristic)的缩写。
以真阳性率(灵敏度)为纵坐标,假阳性率(1-特 异度)为横坐标作图所得出的曲线。
100 90
真阳性率(灵敏度)
80 70 60 50 40 30 20 10 0 0 10 20 30 40 50 60 70 80 90 100
假阳性率(1-特异度)
诊断糖尿病中血糖测定的ROC曲线
1.
ROC曲线的基本原理 对于大多数诊断来说,疾病的概率分布和正常分布是重叠 的。任何分界值或阈值都将导致一些具有疾病的病人错分 为正常,或一些没有疾病的个体错分为病人,或两种情况 都有。应用低的阈值降低假阴性结果的数量(高灵敏度), 但假阳性的数量增加(低特异度); 另一方面,增加阈值会增加假阴性(低灵敏度),且降低 假阳性的数量(高特异度)。这样,在灵敏度和特异度之 间成互交的关系,一个高的灵敏度伴随着低特异度,而一 个低的灵敏度伴有高特异度。 对所有可能的阈值计算ROC曲线(ROC)显示灵敏度和 特异度之间相互关系。图的纵轴表示灵敏度或真阳性率, 水平轴表示假阳性率。在ROC曲线上各个作业点表示在给 定的一个阈值下灵敏度和特异度的组合。ROC曲线越凸越 接近左上角,表明其诊断价值越大,越准确,具有直观性。
(循证医学课件)第10章诊断性试验循证分析与评价
制图方法: ➢ 以该试验的敏感度(真阳性率)为纵坐标(Y轴),而以1-特 异度(假阳性率)为横坐标(X轴),
➢ 依照连续分组测定的数据,分别计算SEN及SPE,按照 平面几何方法,将给出各点联成曲线,即为ROC曲线
判定方法: ➢ 曲线的各点中,距Y轴顶点直线距离最近的一点,即为 正常值的最佳临界值。
➢ ROC曲线 ➢ 似然比的应用 ➢ 提高敏感度或特异度方法
一、ROC曲线的应用 ROC曲线(receiver operator characteristic curve)
又称受试者工作特征曲线,在诊断性试验 中应用的目的有两个:
➢ 1、用于正常值临界点的选择 ➢ 2、用于优选性质类似的诊断性试验
表10-5 +LR和验前概率与验后概率的关系
*表中数据均为验后概率(%)
由上表可知:如果阳性似然比较高,即使验前概率在较 低情况下,验后概率也会有很大的增长
表10-6 部分常见病、诊断性试验结果的阳性似然比(1)
接下页
表10-6 部分常见病、诊断性试验结果的阳性似然比(2)
我国诊断性试验的研究不断发展
➢ 1985~1995年中华系列杂志中,共发表诊断性 试验的论著50篇
➢ 1996~2000年中华检验医学杂志,共发表诊断 性试验论著111篇
➢ 2001~2007年中华医学会6种核心杂志中共检出 诊断性试验的论著5l篇
近10年来快速诊断性试验(rapid diagnostic tests,RDTs) 在热带病研究中发展迅速
表10-3 缺血性贫血患者血清铁蛋白检查结果
SEN=731/809=90.4% SPE=1500/1770=84.7% +LR=SEN/ (1-SPE)=5.9
诊断试验研究范文
诊断试验研究范文
诊断试验研究通常包括四个主要步骤:设计、数据收集、数据分析和结果解释。
设计阶段考虑了研究问题、目标受众、样本大小和研究类型等因素。
数据收集阶段涉及选择适当的研究对象,并采集他们的病例资料、实验室测试结果和诊断结果等数据。
数据分析阶段使用统计方法来评估测试的准确性和可靠性。
结果解释阶段则根据数据分析的结果,对诊断测试的准确性和可靠性进行评估,并推导出结论。
在诊断试验研究中,最常用的评估指标是敏感性和特异性。
敏感性是指在有疾病的个体中正确识别出该疾病的能力,即真阳性率。
特异性是指在无疾病的个体中正确排除该疾病的能力,即真阴性率。
除了敏感性和特异性,还有其他指标,如阳性预测值和阴性预测值,用于评估测试结果的准确性。
诊断试验研究也可以进一步应用不同统计方法来验证测试的准确性。
接收者操作特征曲线(ROC曲线)是一种常用的统计工具,用于评估和比较不同测试的准确性。
ROC曲线显示了敏感性和特异性之间的关系,并使用曲线下面积(AUC)作为评估指标。
AUC的值介于0.5和1之间,值越接近1,表示测试的准确性越高。
需要注意的是,诊断试验研究的结果可能受到多种因素的干扰,如样本选择偏倚、采样误差和信息偏倚等。
因此,在诊断试验研究中,还需要进行一些控制措施,如随机化、对照组设计和盲法等,以减少这些干扰因素的影响。
总之,诊断试验研究是一种重要的研究方法,用于评估医学诊断测试的准确性和可靠性。
通过设计、数据收集、数据分析和结果解释等步骤,
可以为医生和研究人员提供有关诊断测试的科学依据,从而改善诊断治疗的准确性和效果。
7.非随机实验性研究、诊断性试验及动物实验的质量评价工具
•循证理论与实践 •Meta 分析系列之七:非随机实验性研究、诊断性试验及动物实验的质量评价工具曾宪涛,庄丽萍,杨宗国,董圣杰[中图分类号] R4 [文献标志码] A [文章编号]1674-4055(2012)06-0496-04基金项目:湖北省教育科学“十二五”规划2012年度重点课题(2012A050),湖北医药学院2011年度优秀中青年科技创新团队项目(2011 CZX01)作者单位:442000 十堰,湖北医药学院附属太和医院口腔医学中心(曾宪涛);复旦大学附属肿瘤医院中西医结合科 上海医学院肿瘤学系(庄丽萍);复旦大学附属公共卫生临床中心中医科(杨宗国);苏州大学附属第一医院骨科(董圣杰)通讯作者:董圣杰,E-mail:dongshengjay@ doi :10.3969/j.1674-4055.2012.06.003非随机实验性研究(non-randomized experimental study )和诊断准确性试验的Meta 分析是临床研究重要组成部分,而临床前的动物实验的Meta 分析也日渐得到重视,其结论已成为循证决策的依据之一。
在前面的章节中,我们已对随机对照试验[1]及观察性研究[2]的质量评价工具进行了简介,现对较为常用的或推荐使用的非随机实验性研究、诊断准确性试验及动物实验的评价工具进行简介。
1 非随机实验性研究1.1 M I N O R S 条目 非随机对照试验方法学评价指标(methodological index for non-randomized studies ,MINORS )[3]是由法国外科医师Slim 等在2007年全面回顾文献及专家共识的基础上制定的临床干预研究的质量评价工具,特别适用于外科非随机对照干预性研究(non-randomized surgical studies )质量的评价。
评价指标共12条,每一条分为0~2分。
前8条针对无对照组的研究,最高分为16分;后4条与前8条一起针对有对照组的研究,最高分共24分。
诊断试验的评价和ROC分析
诊断试验的评价和ROC分析诊断试验是一种常用的医学检验方法,用于确定患者是否患有某种疾病。
然而,单纯通过试验结果判断是否患病往往并不准确。
因此,我们需要评价诊断试验的准确性,并使用ROC分析来量化其性能。
1. 诊断试验的评价指标为了评估诊断试验的性能,我们需要引入以下四个指标:敏感度、特异度、阳性预测值和阴性预测值。
敏感度(Sensitivity)是指在真正患病的人中,试验能正确诊断出疾病的比例。
敏感度越高,表示试验具有较好的疾病检测能力。
特异度(Specificity)是指在真正健康的人中,试验能正确排除疾病的比例。
特异度越高,表示试验具有较好的非患病排除能力。
阳性预测值(Positive Predictive Value)是指在试验为阳性的情况下,患者真正患病的概率。
阳性预测值越高,表示试验结果与患病状态的相关性越高。
阴性预测值(Negative Predictive Value)是指在试验为阴性的情况下,患者真正健康的概率。
阴性预测值越高,表示试验结果与健康状态的相关性越高。
2. ROC曲线和AUC值为了综合评价诊断试验的准确性,我们引入了ROC曲线(Receiver Operating Characteristic Curve)和AUC值(Area Under Curve)。
ROC曲线是以敏感度为纵轴,以1-特异度为横轴绘制的曲线。
曲线上每一个点表示了在不同阈值下的敏感度和特异度。
ROC曲线越靠近左上角,表示试验性能越好。
AUC值是ROC曲线下面积的数值,范围在0.5到1之间。
AUC值越接近1,表示试验具有较高的准确性。
3. 如何进行ROC分析进行ROC分析通常需要以下步骤:(1)收集样本数据:包括疾病阳性和阴性样本,以及其相应的试验结果。
(2)计算敏感度和特异度:根据试验结果计算敏感度和特异度,并绘制ROC曲线。
(3)计算AUC值:根据ROC曲线计算AUC值。
(4)选择最佳阈值:根据需求和实际情况,选择最佳的阈值以平衡敏感度和特异度。
诊断试验评价简介
3. 似然比(likelihood ratio, LR):
患者人群中试验结果的概率与无病人群中试验结果 概率之比。
(1)阳性似然比(positive likelihood ratio,LR(+)): 即真阳性率与假阳性率之比值。是说明病人中出现某
种检测结果阳性的概率是非病人的多少倍。
a/(a+c)
似然比在临床诊断中有实用价值。当知道了 某诊断试验的阳性似然比,并了解到所诊断疾病 的患病率,就可计算在不同患病率情况下该试验 的预测值。
4.预测值(Predictive value,PV) 是根据诊断试验的结果来估计患病和不患病的 可能性大小。 阳性预测值: 表示阳性结果中真正患病的概率。
阴性预测值: 表示阴性结果中真正未患病的概率。
Sp=[d/(b+d )]×100%=d/ND
常用评价指标的计算
2.假阳性率(FPR, α):亦称误诊率,指非患 者错判为阳性的概率。 α=[b/(b+d)] ×100%=1 - Sp 假阴性率(FNR, β):亦称漏诊率,指患者
错判为阴性的概率。 β=[c/(a+c)] × 100%=1-Se
[12-3] 某医院收治急性心前区疼痛疑诊急性心肌梗 死患者360例。为研究血清磷酸肌酸激酶(CPK)对急 性心肌梗死的诊断价值,在经冠脉造影或心电图(金 标准)确诊的基础上,同步检测患者CPK,设诊断异 常界值为≥80u/L,结果见表12-2。试分析其Se与Sp。
诊断试验评价简介
学习目标
1.了解诊断试验的评价方法及常用指标 2. 了解ROC曲线的应用 3. 能够运用统计软件进行ROC曲线分析
问题提出
(1)什么是诊断试验? (2)诊断试验的常用评价指标?
诊断试验方法的评价
③ Kappa值= ( P0-Pc)/(1-Pc) P0= (a+d)/ (a+b+c+d) =(205+37)/302 = 0.8013 Pc={[ (a+b) (a+c)/ (a+b+c+d)]+[ (c+d) (b+d)/ (a+b+c+d)]}/ (a+b+c+d) = [(236×234)/302+(66×68)/302]/302 = (55224+4488)/91204 = 0.6547 Kappa = (0.8013-0.6547)/(1-0.6547)= 0.1466/0.3453 = 0.4246 由于 0.40 <Kappa< 0.74,表示两种试验的一致性程度为一般,因此,甲胎蛋白检测作
诊断试验方法(fāngfǎ)的 评价
2021/11/11
第一页,共28页。
用于临床疾病诊断的试验方法很 多,而且随着科学技术的发展,特别 (tèbié)是医学、分子生物学、电子计 算机技术的发展,越来越多的新诊断 试验方法被应用于临床。
第二页,共28页。
评价(píngjià)一种新的诊断试验方 法的基本程序是与诊断某病的金标准 作盲法 和同步 比较
倍数,表明诊断试验结果呈阴性时患病与不患病的比例,其 比值越小,试验的诊断价值越高。
7治疗性证据的分析与评价
临床治疗设想的来源
➢ 通过对疾病发病机制的基础研究、临床研究和流行 病学研究,寻找疾病的病因,危险因素和预后因素, 进而提出防治的设想。
➢ 通过医师的临床实践和经验总结,提出可能有效的 新疗法。
其疗效需要评价
➢ 临床治疗本身的复杂性 — 疾患的发生可以是多种因素共同作用的结果 — 采用的治疗措施本身对人体产生多方面的作用 — 疾病本身以及机体反应性的复杂性
>0.05 >0.05 >0.05 >0.05 >0.05
>0.05
>0.05
➢基线情况不一致,说明治疗前两组可比性差,可能对结论有影响。
➢一般通过严格的随机化分组可保证两组的可比性。
4) 是否采用盲法
盲法是指患者、医师或研究者不知道患者接受的是治疗措施 还是对照措施;
临床试验可在四个水平上设盲 ➢ 研究者 ➢ 病人 ➢ 负责病人治疗的医师 ➢ 负责结果评定的研究人员
5)除试验方案不同外,各组患者接受的其他治疗方法是否相同
沾染(contamination) 当对照组额外接受了治疗组措施或其他有利的治疗,结果人为地 夸大了对照组的疗效 例1:在观察应用小剂量阿司匹林预防暂时性脑缺血发作及脑卒中 的研究中,可能因对照组成员,多次应用阿司匹林治疗感冒而出现 沾染。 例2:在比较硬化剂疗法与β-受体阻滞剂预防食管静脉再出血时,后 一组患者出现出血时,也被送去做硬化剂注射止血,此种情况亦称 为沾染。
➢失访的定义 指在试验某一时间点上,需要测定患者结果时,却不能找到该患者
➢失访的常见原因 ✓治疗有不良反应,患者不愿继续接受治疗; ✓或患者在随访这段时间中已经死亡; ✓由于症状已缓解,患者不愿继续治疗或随访; ✓患者由于搬迁离开原地址; ✓病人拒绝接受某些检查,特别是创伤性检查 ➢失访对结果评定的影响 (失访率超过20%,研究的结果不可信)
第12章 诊断性试验
Sp= d/(b+d)
15
一、评价诊断试验真实性的指标
3. 误诊率(misdiagnosis rate)
亦称假阳性率(α),理想的α=0。
表12-2 CPK对急性心肌梗死的诊断价值
CPK(IU/L) 心肌梗死 无心肌梗死 合 计
阳性(≥80)
215
16
231
阴性(<80)
15
114
129
合计
230
130
360
一、评价诊断试验真实性的指标
5.准确度(accuracy,Ac):符合率,粗一致性, 系诊断性试验检出的真阳性和真阴性例数之和占 总病例数的比例。
以CPK80IU作为阳性标准,其阳性似然比为7.6, 现在要预测采用该试验后患者急性心肌梗死的概率 (验后概率)为多少,较验前概率提高了多少。
33
二、评价诊断试验可靠性的指标
亦称重复性或精密度,是指某项诊断试验在完全相同情 况下重复进行时获得相同结果的稳定程度。
影响可靠性的因素
生物学变异
①不同观察者间的变异:表示不同观察者独立地检 查同一样本时所得结果不一致的程度。
PV(+) = a/(a+b) (2)阴性预测值(negative predictive value,PV(-)): 系指诊断性试验检出的全部阴性例数中,真正没有该病的例 数所占的比例。
PV(-) = d/(c+d)
19
6. 预测值
试验结果阳性并不意味肯定有病,阳性结 果提示有病的机会取决于敏感性、特异性及患 病率。
诊断性试验的设计与评价
特异性越高,则假阳性率越低,假阳 性率等于误诊率。因此,特异性高的 试验,用于临床时误诊机会少。高特 异性试验,用于肯定诊断、确诊疾病。 当试验结果阳性时,临床确诊价值最 大。
用高特异性试验,阳性结果肯定诊断, 又称为SpPins。
特异性高的试验适用于:
肯定疾病的诊断;
凡假阳性结果会导致病人精神负担, 或不当防治措施会给病人带来严重危17
4. Spe=Spe1 X Spe2
5. 验后比=验前比 X LR1 X LR2
25
联合试验
2. 序列试验: 依次相继的试验,要所有的试验
阳性才能做出诊断。序列试验提高了特异度 及阳性预测值。但降低了敏感度及阴性预测 值。
3. 例如: 诊断心肌梗死的CPK、AST、LDH,没
有一种试验是很特异的,如采用序列试验, 即三项均阳性才能诊断,这样可提高诊断心 肌梗死的特异度。
进行比较。 新的诊断性试验,应该具备方法更为简便、
更为可靠或者减少危险、减少创伤、节约费 用等优点,这样的诊断性试验才具有推广意 义。
4
二、评价诊断性试验的条件
3。列出四格表
诊 断
+
性
试 验
-
标准诊断
有病
无病
a(真阳性) b(假阳性)
c(假阴性) d(真阴性)
5
必须用评价的资料列出四格表, 方法如下
12
如果扩大检查范围,将该地全体运动员都 作上述检查,结果如表2:
冠状动脉狭窄>75%
是
否
运动心电图+ 55(a) 42(b) 97
- 49(c) 478(d) 527
104
520 624
13
SEN=55/104=53%(不变) SPE=478/520=92%(不变) ACC=(55+478)/624=85%(增加20%, 14个 百分点) +PV=55/97=57%(下降38%, 32个百分点) -PV=478/527=91%(增加44%, 28个百分 点) PREV=104/624=17%(原为53%) +LR=0.53/(1-0.92)=6.6(不变) -LR=(1-0.53)/0.92=0.51(不变) 阳性率=97/624=15%(下降52%, 16个百 分点)
科研设计题库及答案-问答题
1,实践循证口腔医学步骤:1)聚焦临床相关问题:把一般的临床疑问聚焦为可查询临床的问题。
2)利用现有的检索手段查全、查准文献。
3)评价证据。
4)整合最佳证据于临床:原则:在考察证据科学性、重要性及可行性的基础上,结合个人经验积累和病人的治疗需求与喜好做出最佳临床决策。
23如何实施?1)按随机分配方案对不同干预措施分配编码,编码计划应有补充量, 同时准备应急信封,以便必要时揭盲, 盲底妥善保存。
2)对安慰剂也要进行药检;3)用双模拟(double dummy)的技巧实现盲法4)用胶囊技巧使不同药物外观相同;5)基础治疗技巧(base medicine technique4,随机对照试验的应用范围及设计原则应用范围:1)临床防治性研究;2)评价新的药物或治疗措施与不治疗传统方法治疗或安慰剂相比较,是否能提高疗效或减少副作用;3)研究心得预防措施能够降低某病的发病率。
一般不用于病因学的试验研究。
设计原则:1)明确的诊断、纳入、排除标准,选择合格的研究对象。
做好知情同意。
2)在保证试验结果达到统计分析要求的条件下,确定最少的样本含量,节约。
3)观察期有足够长度。
4)严格贯彻随机、对照、盲法的原则5)对照组和试验组要同期观察。
6)同意的观察指标,观察者应用这些指标应有一致性;对仪器、试验试剂和方法有严格的质控。
5,交叉试验的应用范围及优缺点应用范围:用于体征和症状反复出现的慢性疾病的治疗效果观察;对症治疗的研究;预防药物的效果观察6,前后对照研究的应用范围及优缺点7,队列研究(cohort study)的应用范围及优缺点应用范围:只要在群体中观察致病因素、预后因素或防治措施对人群特定结局的影响,均可用。
但要观察时间足够8,病例对照研究的应用范围及优缺点应用范围:1,用于疾病致病因素或危险因素的研究;2,用于探讨疾病预后因素的研究;3,用于药物有害作用的研究。
特点:1,回顾性研究,从果-因。
故只能推测判断暴露与疾病是否有关。
第十章 诊断性试验循证分析与评价讲解
29
• 在表10-2中,随着血糖浓度的升高,敏感 度下降而特异度升高。因此,敏感度和特 异度中任何一个数值的提高,必然导致另 一数值的降低。如选用餐后血糖100mg/ dl。(5.55mmol/L)为临界值,则糖尿病 的漏诊率(1—SEN)为11%,而有30%的非 糖尿病受试者被误诊。如果将临界值定为 130mg/L (7.22mmol/I。),则可使漏 诊率(1—SEN)上升到36%,而误诊率(1— SPE) 仅 为 3 % 。 当 餐 后 血 糖 临 界 值 定 为 110rug/I。(6.1lmmol/1。)时,该阈值 的敏感度和特异度之和为最大.这时漏诊 率和误诊率之和最小。因此,餐后血糖定 为 110mg / I . 作 为 临 界 值 最 适 当 , 恰 与 ROC曲线确定的临界值相同。 30
普通医院CK诊断心梗(CK<80=CK-)
心梗
无心梗
CK+
流行病学第七章 诊断性试验的评价
Hao Liang, Epidemiology Department of Guangxi Medical University
1
第七章:诊断试验的评价
第一节 概述 一、诊断试验概念 二、诊断试验评价的目的意义 第二节 诊断试验的评价 一、诊断试验评价的原理 二、真实性 三、可靠性 四、实用性 第三节 提高诊断试验效率的方法 一、选择患病率较高的人群 二、采取联合试验 第三节 诊断试验评价的设计 一、确定金标准 二、研究对象选择 三、样本含量的估计 四、确定诊断试验的分界值 五、与e Status (Gold Standard)
Present Test Positive Absent
Test Negative
6
Disease Status(Gold Standard) Present Test Positive Test Negative 真阳性(True positive): 表示用金标准方法确诊患 某病而用新方法试验亦判定为阳性者; Absent
16
例子
表 血清肌酸磷酸激酶测定诊断急性心肌梗死 血清磷酸 肌酸激酶 阳性 阴性 合 计 急性心肌梗死(金标准判定) 有 无 合计 225 24 249 25 121 146 250 145 395
•敏感度(真阳性率)=(225/250)×100%=90.0% •漏诊率(假阴性率)=(25/250)×100%=10.0% •误诊率(假阳性率)=(24/145)×100%=16.6% •特异度(真阴性率)=(121/145)×100%=83.4%
a ab
100 %
20
阴性预测值(negative predictive value, -PV)是 指在诊断试验检测为阴性者中,用金标准诊断为“无病”
7诊断试验的评价
诊断
合计
TN(true negative)=真阴性
TP(true positive)=真阳性
FN(false negative)=假阴性 FP(false positive)=假阳性
13
3.真实性评价指标 真实性评价指标(1) 真实性评价指标
1)灵敏度(sensitivity) 灵敏度(sensitivity)
23
真实性评价指标(7) 真实性评价指标
• 7) 受试者工作特性曲线(ROC曲线): 受试者工作特性曲线( 曲线) 曲线
1-特异度 作图 特异度
灵敏度 与
• ROC曲线下的面积(AUC)反映了诊断试验的准确性。 • 比较多个诊断试验诊断效率的统计分析
24
ROC制作 例) 制作(例 制作
金标准 试验结果 有病 1 2 3 4 5 6 合计
约登指数= 灵敏度+特异度)-1 约登指数=(灵敏度+特异度)-1 )-
18
3.真实性评价指标 真实性评价指标(6) 真实性评价指标
6) 似然比 似然比(likelihood ratio, LR):反映灵敏度 :
和特异度特征的综合指标 • 阳性似然比: 阳性似然比:
LR + =真阳性率/假阳性率=灵敏度/误诊率 真阳性率 假阳性率=灵敏度 误诊率 假阳性率 灵敏度/(1-特异度 特异度) =灵敏度/(1-特异度) • 阴性似然比: 阴性似然比: LR - =假阴性率/真阴性率=漏诊率/特异度 假阴性率 真阴性率=漏诊率 特异度 真阴性率
2
临床上“试验” 临床上“试验”的应用
• 诊断:最常用 诊断: • 监测:指标的变化 监测: • 预后:风险/分期 预后:风险/ • 治疗计划
诊断性试验的研究与评价
87.50
患病率很低时,即使试验特异度很高,仍会出现大量假阳性病例 患病率很高时,即使试验敏感度很高,仍会出现大量假阴性病例。
EXAMPLE 2
• 监护病房CPK诊断心梗(CPK<80=AMI-)
心梗
无心梗
CPK+ 215(93%) 16
231 +PV=93%
CPK-
15
114(88%) 129 -PV=88%
b+d n
选择研究对象
• 诊断试验评价中,研究对象应能代表检查对象的总体
• 病例组: 应该包括所研究疾病的各种临床类型 如轻、中、重型;早、中、晚期;典型与非典型;有和无 并发症者;病程长与病程短,经治疗和未经治疗的患者; 对照组:应选择确实无该病的其他病例,且应包括相当比 例的临床上容易与所研究的疾病相混淆而需要鉴别的其他 疾病患者,只包括健康自愿者是不恰当的。
– 诊断疾病:灵敏度和特异度高 – 筛检无症状患者:简便、经济、安全易接受 – 疾病随访:重复性好,影响因素少 – 判定疾病的严重程度;估计疾病的临床过程及其预后;估计对治疗的反
应;测定目前对治疗的实际反应
二、诊断学试验设计的原则
• 1、有标准诊断——金标准(Gold standard) • 2、选择研究对象 • 3、盲法判断试验结果 • 4、确定合适的样本量 • 5、确定正常阈值
预测值与患病率有关
• 在保持敏感度、 特异度不变的情 况下,则患病率 增大时,阳性预 测值随之升高, 患病率减小时, 阳性预测值下降, 患病率极低时, 阳性预测值趋向 于零
患病率对预测值的影响要比敏感度和特异度更为重要。 ➢阳性预测值随患病率上升而上升 ➢阴性预测值随患病率的上升而下降 ➢阳性预测值的上升速度快于阴性预 测值的下降速度 ➢患病率对阳性预测值的影响较明显
诊断试验与评价
诊断性试验 患者 合计
+
188
-
62
合计
250
非患者
97 153 250
285 215 500
14
计算各指标如下:
灵敏度 特异度 阳性似然比 阴性似然比 假阳性率 假阴性率 阳性预测值 阴性预测值
188 100 % 75 . 2 % 250
153 100 % 61 . 2 % 250
( 188 )(/ 97 ) 1 . 94
阳性似然比为1.94,即是说该新方法诊断糖尿病患者所得 阳性结果为非糖尿病人的2倍;阴性似然比为0.41,即用该 方法诊断糖尿病人的阴性结果为非糖尿病人的4/10。
假阳性率为38.8%,即100名非糖尿病患者中,有39人诊断 性试验阳性;假阴性率为24.8%,既100名糖尿病患者中, 有25人诊断性试验阴性。
b
bd
8
5.Youden 指数(Youden index, YI),又称正确指数,是指诊断试 验发现真正的病人和非病人的能力,反应诊断试验真实性的综合指标。 它等于灵敏度与特异度之和减一。
Y IS eSp 1
9
6.似然比(likelihood ratio)也是评价诊断试验真实性的指标,它反 映灵敏度和特异度两方面的特性,不受患病率的影响,比灵敏度和特 异度稳定。 阳性似然比(positive likelihood ratio)是真阳性率与假阳性率之比。 计算式为:
(7.11) predictive value,
PV-)是指由诊断试验判断为阴性的全部对象中,
用金标准诊断为非患者所占的比例。
d PV cd10% 0
(7.12)
12
预测值主要受患病率和诊断试验的灵敏度与特异度的影响,一般 情况下,受检人群患病率越高,阳性预测值也高。阳性预测值、阴性 预测值、灵敏度、特异度及患病率间有如下关系。
诊断性试验的分析和评价
9、回收率 、
回收率是测定值对真值的相对百分比。 回收率是பைடு நூலகம்定值对真值的相对百分比。其愈接近 100%愈好。 愈好。 愈好
例用某新方法进行糖尿病诊断性试验,选取 250 例确诊的糖 尿病患者作为试验组,选取 250 例非糖尿病病人作为对照组。结 果如下表,试对该诊断性试验结果进行评价。 糖尿病诊断试验 糖尿病诊断试验 诊断性试验 + - 合计 糖尿病患者 188 62 250 非糖尿病患者 97 153 250 合计 285 215 500
合计 285 215 500
188 + 153 3、准确度(符合率)= 、准确度(符合率) × 100 % = 68 . 2 % 500
4、诊断指数 = 灵敏度 + 特异度 = 136.4% 、
诊断性试验 + - 合计
糖尿病诊断试验 糖尿病患者 非糖尿病患者 188 97 62 153 250 250
诊断性试验评价的四格表 金标准 诊断性 试 验 合计 + + a c a+c b d b+d 合计 a+b c+d N
7、阳性预测值 = 、 说明阳性者中真患者的比例。 说明阳性者中真患者的比例。 8、阴性预测值 = 、 说明阴性者中非患者的比例。 说明阴性者中非患者的比例。 阳性预测值与阴性预测值是评价诊断性试验收益 的指标。可受患病率的影响。 的指标。可受患病率的影响。
5、阳性似然比 = 、 说明患者中阳性结果是非患者阳性结果的多少倍。 说明患者中阳性结果是非患者阳性结果的多少倍。
6、阴性似然比 = 、 说明患者中阴性结果是非患者阴性结果的百分之几。 说明患者中阴性结果是非患者阴性结果的百分之几。 阳性似然比与阴性似然比是反映灵敏度和特异 度两方面特性,不易受患病率影响,较稳定。 度两方面特性,不易受患病率影响,较稳定。
《流行病学》7诊断试验评价
30
56
NPV (%) 50
80
95
88
3、诊断试验阳性结果截断值的确定
理想的诊断试验灵敏度、特异度均应 接近100%。
但在实际工作中很难达到,往往表现 为灵敏度↑↓则特异度↓↑。
两者高低的转换与确定诊断试验阳性 结果的截断值(cut off point)或临界点的 选择密切相关。
.
图7-3 病人与非病人观测值分布类型
评价指标
.
二、 诊断试验的评价
(一)评价方法
诊断试验的评价就是将待评价的诊 断试验与诊断目标疾病的标准方法——即 “金标准”(gold standard)——进行同步盲 法比较,判定该方法对疾病“诊断”的真实 性和价值。
.
确定“金标准”
“金标准”指当前临床医学界公认的诊断 疾病的最可靠的方法,也称为标准诊断金标
.
PPV
指试验阳性结果中真正患病(真阳性)的比例 阳性预 测 A 1 值 0 % 0 AB
NPV
指诊断试验阴性者不患目标疾病的可能性
阴性预 测 D 值 10% 0 CD
.
2、可靠性 (reliability)
也称信度、精确度(precision)或可重复性 (repeatability)
指在相同条件下用同一诊断试验对同一受试 者重复操作时获得相同结果的稳定程度
其次是选择研究对象,用金标准将这些对象划分 “有病(病例组)”与“无病(对照组)”;
第三,用待评价的诊断试验采用盲法同步地测试这 些研究对象,将获得的结果与金标准的诊断比较,应 用相应的指标来评价该试验的诊断价值。
.
金标准
目 标 人 群
+
病人
- 待评价的 诊断试验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
七、诊断性试验的评价原则
新的诊断性试验用于临床之前或杂志上有关 诊断性试验的结论,均须经过科学的评价。 是否采用盲目法将诊断性试验与标准诊断法 (金标准)作过对比研究? 诊断性试验必须与金标准比较,才能确定是 否可靠。 盲法对比,更为科学。 列出四格表进行分析对比,计算各项指标, 根据ACC、SEN、SPE确定诊断性试验有无应用 价值。
15
结果解释
PREV的下降是由于扩大了检查范围, 被检人群中,患病者例数减少所致。 随着PREV的下降,ACC、-PV ↑,而+PV、阳性率↓。 SEN、SPE、+LR、-LR、稳定不变。
在评价诊断性试验中,一般不用阳性率,因 阳性病例数并未说明是真阳性或假阳性。
16
从以上2组数据可以看出:
13
如果扩大检查范围,将该地全体运动员都 作上述检查,结果如表2: 冠状动脉狭窄>75% 是 否 运动心电图+ 55(a) 42(b) 97 - 49(c) 478(d) 527 104 520 624
14
SEN=55/104=53%(不变) SPE=478/520=92%(不变) ACC=(55+478)/624=85%(增加20%,14个 百分点) +PV=55/97=57%(下降38%,32个百分点) -PV=478/527=91%(增加44%,28个百分 点) PREV=104/624=17%(原为53%) +LR=0.53/(1-0.92)=6.6(不变) -LR=(1-0.53)/0.92=0.51(不变) 阳性率=97/624=15%(下降52%,16个百 分点)
21
再一步分析,则可计算不同水平的阳性似然比:
CPK n > 280 97 AMI(+) 比例 97/230=0.42 n 1 AMI(-) 比例 1/130=0.01 0.42/0.01=42 LR
80—279 118 118/230=0.51 15 15/130=0.12 0.51/0.12=4.2
肯定疾病的诊断; 凡假阳性结果会导致病人精神负担,或不 当防治措施会给病人带来严重危害。 18
四、诊断性试验的样本大小的计算
计算时,先查阅文献或作预试估计SEN、SPE 病例组(N1):用该试验敏感性估计 P1=(a/a+c) 对照组(N2):用该试验特异性估计 P2=(d/b+d) 用估计总体率的样本公式分别计算
8 0
20
如将CPK 80单位作为诊断心肌梗死的临界值,列出四格 表 急性心肌梗塞 是 否 ≥80u 215 16 CPK <80u 15 114 230 130 SEN=a/(a+c)=215/230=0.93 SPE=d/(b+d)=114/130=0.88 +LR=SEN/(1-SPE)=0.93/(1-0.88) =7.75
5
二、评价诊断性试验的条件
3。列出四格表
标准诊断 有病 诊 断 性 试 验 无病
+
a(真阳性)
b(假阳性)
-
c(假阴性)
d(真阴性)
6
必须用评价的资料列出四格表,方法如下
用标准诊断方法,诊断的病例数为 a+c 在有病的受试者中,诊断性试验阳性者为 a, 阴性者为 c 用标准诊断方法,判断无该病的例数为 b+d 无该病的受试者中,诊断性试验阳性例数为 b,阴性例数为 d
2-39 40-79 80-119 120-159 160-199 200-239 240-279 280-319 320-359 360-399 400-439 440-479
>=480 35 0
AMI
+ 2 - 88
13 26
30 8
30 5
21 0
19 1
18 1
13 1
19 0
15 0
7 0
6)
2。诊断性试验指标的临床意义
稳定的指标:敏感性、特异性、+LR、-LR (是最重要的指标)
相对稳定的指标:准确性 不稳定的指标:阳性预测值、阴性预测值、 患病率
11
不稳定指标及其影响因素
现举例说明不稳定指标及其影响因素:某地运动 员有胸前区疼痛史者195例,分别作运动心 电图及冠状动脉造影,结果如表1:
9
患病率(prevalence): PREV =(a+c)/(a+b+c+d) 7) 阳性似然比(positive likelihood ratio ): 有病者诊断性试验阳性的概率与无病者试验阳 性的概率之比。 +LR =[ a /(a+c)] / [ b /(b+d)] = Sen/(1-Spe) 8) 阴性似然比(negative likelihood ratio ): 有病者试验阴性的概率和无病者试验阴性的概 率之比。 -LR = [ c/(a+c)] / [ d /(b+d)] =(1-Sen)/Spe LR:有病者得出某一试验结果的概率与无病者得 10 出该试验结果的概率之比。
ma P1(1-P1)/δ N2=ma P2(1-P2)/δ
N1=
2 2
2
2
显著性水平μа取0.05 μ0.05=1.96(双侧检验) 诊断性试验的允许误差δ一般定在0.05-0.10
19
五、似然比的临床应用
可用于临床计算患病的概率,便于更准确地对患者作出 诊断。 例如:对怀疑急性心肌梗塞患者,作肌酸磷酸激酶 (CPK)测定,根据其结果可计算似然比。爱丁堡皇家 医院将怀疑心肌梗死者360例收入病房,检测CPK,由一 位不知CPK结果的医生根据心电图和尸检结果判断有心 肌梗死者230例,无心梗者130例,测定值如下:
冠状动脉狭窄>75%(金标准)
运动心电图
+ -
是 55(a) 49(c) 104
否 7( b) 84(d) 91
62 133 195
12
SEN=a/(a+c)=55/104=53% SPE=d/(b+d)=84/91=92% ACC=(a+d)/(a+b+c+d)=55+84/195=71% +PV=a/(a+b)=55/62=89% -PV=d/(c+d)=84/133=63% PREV(冠状动脉狭窄) =(a+c)/(a+b+c+d)=104/195=53% +LR=SEN/(1-SPE)=0.53/(1-0.92)=6.6 -LR=(1-SEN)/SPE=(1-0.53)/0.92=0.51 阳性率=(a+b)/(a+b+c+d)=62/195=31%
从评价的资料中,不能绘制四格表的诊断性试 验,无法进行评价
7
三、评价诊断性试验的常用指标
1。评价指标
1)
2)
敏感度(sensitivity):经金标准确诊 有病的人中,诊断性试验阳性者所占的比 例。 SEN = a /( a+c) 特异度(specificity):经金标准诊断 确定为无该病的人中,诊断性试验阴性所 占的比例。 SPE = d /(b+d)
诊断性试验的分析与评价
一、定义
对疾病进行诊断的试验方法,即称为诊 断性试验。
诊断性试验不仅包括实验室检查,还包括病 史、体检结果、影象学检查、各种公认的诊 断标准等。2来自 诊断性试验的应用1.
2. 3. 4. 5. 6. 7.
诊断疾病 筛检无症状病人 疾病的随访 判断疾病的严重性 估计疾病的临床过程极其预后 估计对治疗的反应 测定目前对治疗的实际反应
Spe=Spe1 X Spe2
验后比=验前比 X LR1 X LR2
26
联合试验
2. 序列试验:依次相继的试验,要所有的试验
阳性才能做出诊断。序列试验提高了特异度 及阳性预测值。但降低了敏感度及阴性预测 值。 例如:诊断心肌梗死的CPK、AST、LDH,没有 一种试验是很特异的,如采用序列试验,即 三项均阳性才能诊断,这样可提高诊断心肌 梗死的特异度。 SEN = SEN1 X SEN2 SPE = SPE1 +SPE2 - SPE1 X SPE2
例如:专科门诊开展肾动脉造影检查青年高血压病, 或血红蛋白电泳检查长期贫血患者,则阳性率较高, 价值较大。
上述试验用于基层医院,检查一般的高血压及贫血
病人,则阳性率很低,开展后使用价值不大。
29
4. 诊断性试验的重复性及其临床意义是否明确?
重复性(Reproducibility)又称精密性 (Precision)或可靠性(Reliability)。如多 次测定同一标本结果接近,说明测定数值稳定, 表明仪器性能好,操作技术熟练,方法可靠。可 通过试验室质控来保证重复性。 5. 诊断性试验所确定的正常值是否合理、可靠? (1)正常值的含义不同,可直接影响正常值的 数据。正态分布的正常值,可用Ⅹ±2SD表示, 它包括正常值的95%;据此100例健康人,经两种 检查后,健康人只有90例(0.952=0.90),作五 种检查后健康人只有77例(0.955=0.77),这种 正常的表示显然有不确切的一面。 非正态分布的正常值用中位数、正常范围或95% 30 百分位法表示。
40—79
1—39
13
2 230
13/230=0.06 26 26/130=0.02 0.06/0.02=0.3
2/230=0.01
88 88/130=0.67 0.01/0.67=0.01 130
22
23
似然比的应用:
验前比(Pretest Odds)=验前概率/(1-
验前概率)
验后比(Post-test Odds)=验前比×似