诊断试验
诊断试验和筛检试验
试验的要求 所需费用
快速、简便、灵敏度高,最 好能检出所有病人
低
科学、准确、特异度高,最 好能排除所有非病人
高
结果的处理 阳性者须作进一步的诊断或 阳性者要给予治疗 干预
筛检试验的评价指标
❖理想的筛检试验应是对人体无害、 操作简便、出结果迅速可靠而费用 低廉的。评价一项筛检试验时要考 虑到真实性、可靠性和收益三个方 面。
Kappa值:不同观察者对某一结果的判定或同一观察者在不同条件下 对某结果判定的一致性程度。 Kappa值越高一致性越好。0.4~0.6为中 度一致;0.6~0.8为高度一致; >0.8为有极好的一致性。
❖ 收益:一项筛检工作的收益从下列几方面来衡量。
(1)所发现的新病例的数量:筛检是在表面健康的人 群中进行的,通过筛检可以得到一定量的可疑病人, 经诊断后获得一定数量的新病例。获得新病例数受 灵敏度和现患率的影响。
[问题2]请画出本次流调工作流程图。
❖ 为对筛查工具DDST及绘人试验的真实性及可靠性进 行评价,采用以下几种手段:①选取太原市三个培 智学校100名MR儿童,采用DDST及绘人试验逐一测 试。结果有82人可疑或异常。同时选取年龄性别相 同居住同一地区的200名正常儿童,也采用上述方 法测试,结果有23名可疑或异常;②在调查现场选 取一个村庄,对该村185名0~12岁儿童逐人采用全 部筛查程序进行检查,结果在DDST异常的9人中8人 智商低于68,在DDST正常的176人中有3人智商低于 68;③在调查现场选取24名0~5岁儿童,分别由二 个测验者对同一个对象进行测查计分及评定结果 (数记录据看白板)。
3.已知对2000名职工分别进行A试验B试验(假设患病率为1.5%),实验结果如下:
(1)请计算下列各项的灵敏度和特异度
诊断试验
诊断试验( diagnostic test):应用物理学的、生物化学的、血清免疫学的检查,临床检查和医疗器械检查,对疾病和健康状况提供信息的试验。
一种好的诊断方法要求真实、可靠、快速、安全、无损伤、费用低。
诊断试验的评价也是临床流行病学中重要组成内容之一。
第一节重要性1、对诊断试验进行科学的评价能正确认识其临床应用价值。
2、科学地评价诊断试验是临床医生选择诊断试验的基础诊断试验科学性评价①试验是否与金标准试验进行“盲法”比较?②是否每个被测者都做参照试验进行评价?③所研究病人样本是否包括临床试验中将使用该诊断试验的各种病人?④诊断试验的精确性(方法介绍详细、结果重复性好)临床上诊断试验主要用于(1)诊断疾病(2)筛检疾病:筛检原则1)筛检的疾病是重大社会问题2)能显著改善其预后3)有足够的领先时间。
领先时间指的是从筛检发现到该病人因症状而去就诊的时间间隔4)筛检试验方法快速、简易、价廉、安全、可靠、灵敏、特异、有效、能被受试者接受(3)疾病随访(4)判断疾病严重程度(5)估计愈后(6)估计对治疗的反应诊断试验评价的目的•怎样开展诊断试验研究•怎样阅读和评价有关诊断试验的文章•临床和科研工作中怎样选择诊断试验–诊断疾病:灵敏度和特异度高–筛检无症状患者:简便、经济、安全易接受–疾病随访:重复性好,影响因素少–判定疾病的严重程度;估计疾病的临床过程及其预后;估计对治疗的反应;测定目前对治疗的实际反应临床医生对一系列的检查事先要有计划,一般将最便宜、最无创伤的检查放在最先做。
第二节研究设计方法1、确定“金标准”金标准:是指当前医学界公认的可以明确肯定或排除某种疾病的最可靠的诊断方法。
2、选择研究对象1)原则:代表性2)病例组:按金标准确诊为“有病”的病例,包括各种类型的病人。
3)对照组:按金标准确诊为无目标疾病的其他病例,特别是与该病容易混淆的病例。
正常人一般不宜纳入对照组。
被试验对象应同期进入研究。
诊断试验评价简介
3. 似然比(likelihood ratio, LR):
患者人群中试验结果的概率与无病人群中试验结果 概率之比。
(1)阳性似然比(positive likelihood ratio,LR(+)): 即真阳性率与假阳性率之比值。是说明病人中出现某
种检测结果阳性的概率是非病人的多少倍。
a/(a+c)
似然比在临床诊断中有实用价值。当知道了 某诊断试验的阳性似然比,并了解到所诊断疾病 的患病率,就可计算在不同患病率情况下该试验 的预测值。
4.预测值(Predictive value,PV) 是根据诊断试验的结果来估计患病和不患病的 可能性大小。 阳性预测值: 表示阳性结果中真正患病的概率。
阴性预测值: 表示阴性结果中真正未患病的概率。
Sp=[d/(b+d )]×100%=d/ND
常用评价指标的计算
2.假阳性率(FPR, α):亦称误诊率,指非患 者错判为阳性的概率。 α=[b/(b+d)] ×100%=1 - Sp 假阴性率(FNR, β):亦称漏诊率,指患者
错判为阴性的概率。 β=[c/(a+c)] × 100%=1-Se
[12-3] 某医院收治急性心前区疼痛疑诊急性心肌梗 死患者360例。为研究血清磷酸肌酸激酶(CPK)对急 性心肌梗死的诊断价值,在经冠脉造影或心电图(金 标准)确诊的基础上,同步检测患者CPK,设诊断异 常界值为≥80u/L,结果见表12-2。试分析其Se与Sp。
诊断试验评价简介
学习目标
1.了解诊断试验的评价方法及常用指标 2. 了解ROC曲线的应用 3. 能够运用统计软件进行ROC曲线分析
问题提出
(1)什么是诊断试验? (2)诊断试验的常用评价指标?
诊断试验
(二)假阴性率与假阳性率
假阴性率(false rate)(漏诊率 漏诊率、 假阴性率(false negative rate)(漏诊率、第 二类错误) 二类错误):即实际有病,但根据该诊断标准被定 为非病者的百分率。 假阴性率=[c/( a+c)] ×100%=l-灵敏度 假阳性率(false rate)(误诊率 误诊率、 假阳性率(false positive rate)(误诊率、第 一类错误) 一类错误):即实际无病,但根据该诊断标准被定 为有病的百分率。 假阳性率=[b/(b+d)] ×100%=1-特异度
(1)该试验是否与“金标准”或参考标准(reference standard)进行过独立的、盲法对比研究? (2)该诊断性试验,是否包括了适当的病谱(轻、中、 重、治疗、未疗或易混淆的病例)?且与我们临床实际的病 例相似? (3)不论诊断性试验的结果如何,参考标准是否仍可 照常使用? (4)如将该试验应用于另一组病例,是否也具有同样 的真实性?
是用真阳性率和假阳性率作图得出的曲线,它 可表示灵敏度和特异度之间的关系。
ROC曲线常用来决定最佳临界点,通常最接近 左上角那一点,可定为最佳临界点。
ROC曲线也可用来比较两种和两种以上诊断 试验的诊断价值,从而帮助临床医师作出最佳选 择。
ROC曲线是一种全面、准确评价诊断试验 非常有效的方法,并可以比较两种或多种诊断 试验的诊断价值,除了直观方法比较外,还可 以计算ROC曲线下的面积,来比较几种诊断试 验的诊断效率。 ROC曲线下的面积越大,越接 近1.0,其诊断的真实度越高,越接近0.5,其诊 断的真实度越差。
二、诊断试验的指标
★主观指标:指由被诊断者的主诉 主观指标: 而确定的指标,如头晕、头痛、食欲不振、 失眠等等。 ★半客观(或半主观)指标:指 半客观(或半主观)指标: 根据诊断者的感觉而加以判断的指标,如 肿物的硬度,肺部步音的多少等。
第12章 诊断性试验
Sp= d/(b+d)
15
一、评价诊断试验真实性的指标
3. 误诊率(misdiagnosis rate)
亦称假阳性率(α),理想的α=0。
表12-2 CPK对急性心肌梗死的诊断价值
CPK(IU/L) 心肌梗死 无心肌梗死 合 计
阳性(≥80)
215
16
231
阴性(<80)
15
114
129
合计
230
130
360
一、评价诊断试验真实性的指标
5.准确度(accuracy,Ac):符合率,粗一致性, 系诊断性试验检出的真阳性和真阴性例数之和占 总病例数的比例。
以CPK80IU作为阳性标准,其阳性似然比为7.6, 现在要预测采用该试验后患者急性心肌梗死的概率 (验后概率)为多少,较验前概率提高了多少。
33
二、评价诊断试验可靠性的指标
亦称重复性或精密度,是指某项诊断试验在完全相同情 况下重复进行时获得相同结果的稳定程度。
影响可靠性的因素
生物学变异
①不同观察者间的变异:表示不同观察者独立地检 查同一样本时所得结果不一致的程度。
PV(+) = a/(a+b) (2)阴性预测值(negative predictive value,PV(-)): 系指诊断性试验检出的全部阴性例数中,真正没有该病的例 数所占的比例。
PV(-) = d/(c+d)
19
6. 预测值
试验结果阳性并不意味肯定有病,阳性结 果提示有病的机会取决于敏感性、特异性及患 病率。
流行病学第七章 诊断性试验的评价
Hao Liang, Epidemiology Department of Guangxi Medical University
1
第七章:诊断试验的评价
第一节 概述 一、诊断试验概念 二、诊断试验评价的目的意义 第二节 诊断试验的评价 一、诊断试验评价的原理 二、真实性 三、可靠性 四、实用性 第三节 提高诊断试验效率的方法 一、选择患病率较高的人群 二、采取联合试验 第三节 诊断试验评价的设计 一、确定金标准 二、研究对象选择 三、样本含量的估计 四、确定诊断试验的分界值 五、与e Status (Gold Standard)
Present Test Positive Absent
Test Negative
6
Disease Status(Gold Standard) Present Test Positive Test Negative 真阳性(True positive): 表示用金标准方法确诊患 某病而用新方法试验亦判定为阳性者; Absent
16
例子
表 血清肌酸磷酸激酶测定诊断急性心肌梗死 血清磷酸 肌酸激酶 阳性 阴性 合 计 急性心肌梗死(金标准判定) 有 无 合计 225 24 249 25 121 146 250 145 395
•敏感度(真阳性率)=(225/250)×100%=90.0% •漏诊率(假阴性率)=(25/250)×100%=10.0% •误诊率(假阳性率)=(24/145)×100%=16.6% •特异度(真阴性率)=(121/145)×100%=83.4%
a ab
100 %
20
阴性预测值(negative predictive value, -PV)是 指在诊断试验检测为阴性者中,用金标准诊断为“无病”
诊断试验
概念:什么是诊断试验?一、诊断试验研究意义和设计原则(一)诊断试验的意义☐正确诊断是预防、治疗措施决策的基础。
☐创造新方法、淘汰旧方法势在必行。
☐诊断试验研究是临床常用的研究方法之一;也是方法学研究的常用方法。
☐诊断试验研究和评价是每个医务人员必备的基本知识与技能。
☐基础研究也要做这方面的研究,如唾液酸、支原体试剂盒、肿瘤标志物.诊断试验的应用:☐诊断试验应用非常广泛。
☐可应用于疾病诊断、病原学诊断、疗效和预后诊断、药物不良反应的检测、人群中的普查、筛查等。
☐预防医学新的检测方法、基础医学中新的检测方法、新的病理诊断方法、某种疾病的判断方法等(二)诊断试验评价的设计要点:诊断实验设计时要注意以下几点:1.确定可靠的金标准:注意金标准的准确性和可行性。
2.选择合适的研究对象:金标准:有病、无病实验组:应包括疑似病例、各种病情病程、易混淆病例。
3.诊断的可靠性:正式试验前先进行可靠性试验,计算变异系数和一致性,注意控制实验条件,仪器、试剂、质量控制。
4.如实报告结果,盲法判断结果。
5.样本含量足够:P-敏感度或特异度δ-容许误差α-第一类错误的概率5、样本含量计算:1)当灵敏度和特异度接近50%时,可用近似公式计算:n=(uα/δ)p(1-p)式中:uα正态分布中累计概率为α/2时的u值(如u0.05/2=1.96,u0.01/2=2.576),δ-指允许误差,p-预试验时的灵敏度或特异度。
2)当预期的灵敏度或特异度小于20%或大于80%时,资料呈偏态分布,需要对率采用平方根反正弦转换,按下公式计算:二、诊断试验的研究设计(一)要求:理想的诊断方法应该是准确度高、精密度高、安全、无不适感、作用迅速、操作简单易行、效率高、价格低廉。
最重要的是准确度高。
(二)诊断试验设计步骤:1.确定金标准(gold standard)诊断试验的效果评价必须建立一个科学、可靠和公认的对比标准,即¡°金标准¡±,是指当前医学界公认的、最可靠的、准确度高的诊断方法作为比照的统一标准。
诊断试验
根据研究目的,调整灵敏度和特异度来确 定临界值
以产生漏诊和误诊之和最小时的数据确定 临界值
16
诊断试验的评价指标
阳性预测值(positive predictive value,+PV)
计算公式:+PV=a / ( a + b ) 诊断性试验中阳性患者占全部患者的比例; 反映诊断指标阳性时患者患某病的概率。
5.1 9 60
9
表1 诊断试验结果
诊断试验
金标准 有病(D+) 无病(D-)
合计
阳性(T+)
a
b
a+b
阴性(T-)
c
d
c+d
合计
a+c
b+d a+b+c+d
10
诊断试验的评价指标
基本指标
灵敏度、特异度、误诊率、漏诊率
预测值
阳性预测值、阴性预测值
综合பைடு நூலகம்价指标
正确率、约登指数、优势比、似然比
表示试验组中诊断阳性数与阴性数比值 与对照组中诊断阳性数与阴性数比值的 比值。
OR>1,表示试验组比对照组更容易获 得诊断阳性结果;反之亦然。
27
诊断试验的评价指标
阳性似然比(positive likelihood ratio,PLR)
计算公式:PLR = Se / ( 1 - Sp ) 真阳性与假阳性之比 表明阳性时患病与未患病机会的比值 比值愈大患病概率愈大
表示不同诊断水平的真阳性率对假阳性 率的函数关系。
31
ROC曲线评价方法
以灵敏度和假阳性率为两个轴的取值作 的图性;
通常用于测定值为连续或等级数据; 常用于确定最佳临界值,也可用于比较
诊断试验的评价
3
4
例如,以舒张压为诊断指标在病人与正常人群中 检查。如果将诊断标准定为90mmHg l2kPa),则有部分本是正常人,但按此标准被判为高 血压病人。亦有部分本是高血压患者但按诊断标准被 判为正常人。即有些人舒张压虽未超过 90mmHg(l2kPa),但是高血压患者。降低诊断标准, 使正常人被判为高血压的比例增加;提高诊断标准,使 病人被判为正常人的比例增加。
诊断试验(diagnostic test)
狭义是指实验室所做的试验和检查。从广义上 来说,也包括从病史、体格检查或X线检查所 获得的临床资料或临床所见。目的是把病人和 非病人区分开来。
1
诊断指标
• 主观指标 • 半客观(或半主观)指标 • 客观指标
2
一、诊断试验研究与评价的理论依据 就大多数诊断指标而言,在正常人中符合正
样本大小
N U2P(1 P)
2
p为试验的预期特异性或灵敏度,为容许误差, 为第一类误差的概率,U值由U界值表可查得。
11
3 ·同步测试 对确定的每个受试对象,用金标准和 被评价的诊断试验同时进行测试。
可以理解,将受试对象用金标准诊断分为病人与 非病人,而用待评价的诊断试验测试,在真正病人中 有的将被判为病人 (阳性),有的将被判为非病人 (阴 性),即将其分为两部分。在真正非病人中待评价的诊 断试验也将其判为两部分,病人 (阳性)与非病人 (阴 性) 。
12
试验方法的评价
包括两方面: 一、真实性(validity)
真实性是指测量值与实际值的符合程度。 二、可靠性(reliability)
也称重复性(repeatability),指一项试验在相同 的条件重复试验获得相同结果的稳定程度。
第六章:诊断试验及其评价讲解
阴性预测值= D 100% CD
25
预测值
影响预测值的因素: 1. 灵敏度Se 特异度Sp 2. 患病率P
阳性预测值=
患病率
患病率 灵敏度
灵敏度 1-患病率
1-特异度
阴性预测值=
1-患病率 特异度 1-患病率 特异度 患病率1-灵敏度
26
预测值与患病率的关系
患病率(%)
+PV (%)
-PV (%)
99
99.9
16.0
95
99.7
50.0
90
ቤተ መጻሕፍቲ ባይዱ
99.4
68.0
80
99.0
83.0
70
98.0
24
预测值
诊断试验 阳性 阴性 合计
病人 A C
A+C
非病人 B D
B+D
合计 A+B C+D
N
阳性预测值(positive predictive value):又称预测阳性结果正确率,即在诊 断试验阳性结果的人中,有该病的概率,也是真阳性占阳性结果总数和百分率。
阳性预测值= A 100% A B
130
360
+LR=7.6 -LR=0.07
+LR=93.48/12.31=7.6 -LR=6.52/87.69=0.07
29
似然比的特点和应用
比灵敏度和特异度更稳定,不受患病率的影响; 用于估计疾病概率。 更科学地描述诊断试验
临床试验诊断试验
诊断试验的未来展望
新技术的应用
随着生物技术的不断发展,如基因组学、蛋白质组学等新技术将 在诊断试验中得到广泛应用。
人工智能辅助诊断
人工智能技术可以辅助医生进行疾病诊断,提高诊断的准确性和效 率。
预防为主的理念
未来诊断试验将更加注重疾病的预防,通过早期检测和干预,降低 疾病的发生率和危害程度。
THANKS
数据处理与分析
采用科学的数据处理和分析方法 ,确保数据的真实性和可信度。
试验数据分析
统计分析方法
选择合适的统计分析方法,对数 据进行处理和分析,如描述性统
计、推断性统计等。
数据解读与解释
根据分析结果,解读数据含义,为 诊断提供依据。
结果报告与发布
撰写试验结果报告,向相关部门提 交报告,并公开发布研究成果。
快速检测与便携式设备
随着技术的不断进步,诊断试验的灵敏度 和特异性不断提高,能够更准确地检测和 识别疾病。
随着便携式设备的普及,快速、简便的诊 断试验成为现实,方便医生在基层和现场 进行检测。
多指标综合检测
个性化诊断
采用多指标综合检测的方法,可以更全面 、准确地评估患者的病情和预后情况。
基于大数据和人工智能技术,医生可以根 据患者的个体差异,制定个性化的诊断方 案和治疗方案。
病。
分型
根据诊断试验的结果,将疾病 分为不同的类型或亚型,以便
更好地制定治患 者疾病的进展趋势和治疗效果 ,为制定治疗策略提供依据。
监测病情变化
通过对患者进行定期的诊断试 验,监测其病情变化,以便及
时调整治疗方案。
诊断试验的评价指标
特异度
诊断试验能够正确识别非患病 者的比例。
试验操作流程
诊断试验
100
敏感度(%)
60 50 ● ≥280 u/L 40 30 20 10 0
图1 血清磷酸肌酸激酶诊断急性心肌梗塞的ROC曲线
诊断试验的可靠性评价
• 可靠性:重复性或信度。在相同条件下, 重复试验结果的稳定性。 计量资料:变异系数(CV)=标准差/均数 *100% 计数资料: 观察符合率
概
述
• 诊断:区分患者和非患者;
• 诊断试验:用于区分患者和非患者的试验 方法。
• 筛检试验:在目标人群中发现可疑患病个 体的检查、检验或其他措施。
– 要求:简便、快速、经济、安全、有效、无创 而乐于接受。
诊断试验
• 广义的诊断试验包括:
– 临床资料(病史、症状、体征);
– 实验室检查(生化、免疫、微生物、寄生虫、
+
a(真阳性)
b(假阳性)
a+b
-
c(假阴性)
d(真阴性)
c+d
a+c
b+d
N
诊断试验的评价指标
• 假阳性率:误诊率 = b/(b+d) = 1-特异度 = 1-50% = 50% • 假阴性率:漏诊率 = c/(a+c) = 1-敏感度 = 1-96% = 4%
诊 断 试 验 + a(真阳性) b(假阳性) a+b 有病
• 序列试验Spe = SpeA + SpeB×(1-SpeA)
• 序列试验Sen = SenA×SenB
诊断试验的评价原则(1)
1. 诊断试验与标准诊断法的(同期)比较,是否采用
盲法(避免人为主观因素的影响,试验数据一 般具有客观性)? 2. 研究病例是否包括各型病例(轻、中、重型) 以及易混淆的病例? 3. 病例的来源和研究工作的安排是否做了叙述?
诊断性试验的设计与评价
特异性越高,则假阳性率越低,假阳 性率等于误诊率。因此,特异性高的 试验,用于临床时误诊机会少。高特 异性试验,用于肯定诊断、确诊疾病。 当试验结果阳性时,临床确诊价值最 大。
用高特异性试验,阳性结果肯定诊断, 又称为SpPins。
特异性高的试验适用于:
肯定疾病的诊断;
凡假阳性结果会导致病人精神负担, 或不当防治措施会给病人带来严重危17
4. Spe=Spe1 X Spe2
5. 验后比=验前比 X LR1 X LR2
25
联合试验
2. 序列试验: 依次相继的试验,要所有的试验
阳性才能做出诊断。序列试验提高了特异度 及阳性预测值。但降低了敏感度及阴性预测 值。
3. 例如: 诊断心肌梗死的CPK、AST、LDH,没
有一种试验是很特异的,如采用序列试验, 即三项均阳性才能诊断,这样可提高诊断心 肌梗死的特异度。
进行比较。 新的诊断性试验,应该具备方法更为简便、
更为可靠或者减少危险、减少创伤、节约费 用等优点,这样的诊断性试验才具有推广意 义。
4
二、评价诊断性试验的条件
3。列出四格表
诊 断
+
性
试 验
-
标准诊断
有病
无病
a(真阳性) b(假阳性)
c(假阴性) d(真阴性)
5
必须用评价的资料列出四格表, 方法如下
12
如果扩大检查范围,将该地全体运动员都 作上述检查,结果如表2:
冠状动脉狭窄>75%
是
否
运动心电图+ 55(a) 42(b) 97
- 49(c) 478(d) 527
104
520 624
13
SEN=55/104=53%(不变) SPE=478/520=92%(不变) ACC=(55+478)/624=85%(增加20%, 14个 百分点) +PV=55/97=57%(下降38%, 32个百分点) -PV=478/527=91%(增加44%, 28个百分 点) PREV=104/624=17%(原为53%) +LR=0.53/(1-0.92)=6.6(不变) -LR=(1-0.53)/0.92=0.51(不变) 阳性率=97/624=15%(下降52%, 16个百 分点)
诊断试验与评价
个性化诊断与精准医疗
个性化诊断
根据患者的基因组、表型等特征,为其量身定制最佳治疗方案,提高治疗效果和 患者生存率。
精准医疗
以个体差异为基础,结合现代医学技术,对疾病进行精确的诊断和治疗,实现医 疗服务的个性化和精细化。
人工智能在诊断试验中的应用
人工智能辅助诊断
远程诊断
利用人工智能技术对医学影像、实验 室数据等进行自动分析和识别,提高 诊断的准确性和效率。
理想的诊断试验应该是操作简便、快速且成本效益高。
疾病谱的变化与新技术的应用
疾病谱的变化
随着疾病谱的变化,诊断试验需要不断更新和改进以满足临床需求。
新技术的应用
新技术的发展为诊断试验提供了更多的可能性,如分子诊断、基因诊断和影像学诊断等。
Part
05
诊断试验的未来发展
新技术与新方法的研发
基因组学技术
诊断试验与评价
• 诊断试验概述 • 诊断试验的设计与实施 • 诊断试验的评价指标 • 诊断试验的局限性 • 诊断试验
诊断试验概述
定义与目的
定义
诊断试验是对患者进行疾病诊断或筛 查的实验手段,通过检测患者的血液、 尿液、组织或其他生物样本,以确定 患者是否患病以及患病类型。
确定诊断目的
明确诊断试验的目标,例 如确定某病种的早期诊断 方法、鉴别诊断或病情监 测等。
数据分析与解释
对试验数据进行统计分析, 得出结论,并对结果进行 解释和评估。
选择受试者
根据诊断目的选择合适的 受试者,确保受试者具有 代表性,并遵循伦理原则。
样本采集与处理
按照标准操作程序采集和 处理样本,确保样本质量 和一致性。
目的
诊断试验旨在为医生提供关于患者健 康状况的准确信息,帮助医生做出准 确的诊断,制定合适的治疗方案,并 监测患者的病情进展和治疗效果。
诊断试验评价
特异度
S pd 1% 0 0 34 18 % 0 0 6.2 8 % 4
c d
510
S(E S)p Sc (1 p d S)p c cdd 3156 3 1 324 0 0 8 .0206
灵敏度的95%可信区间为:
Sp ± uα/2SE(Sp) =0.6824 ±1.96×0.0206=(0.6420,0.7228)
如何评价诊断试验的准确度
❖ 在实际工作中,必须按照某种原则选择一个诊断标准或阈值,据此判断检测对象是否患有某种疾病。 如高血压的诊断标准为:140/90mmHg
❖ 但是患者与非患者的测量指标分布常有一定重叠,导致诊断不准确。
非患者
患者
β
α
μ-σ
μ
μ+σ
-3
-2
-1
0
1
2
3
漏诊
阈值
误诊
诊断试验可能出现两类错误
界值时的灵敏度和特异度。 ❖ ROC曲线是以(1-特异度)为横坐标,以灵敏度为纵坐标绘制而成的曲线,它用线段连接每个诊断界值对应的
[(1-特异度),灵敏度]点。
1.0
0.8
0.6
灵 敏 度
0.4
机会线
0.2
0.0
0.0
0.2
0.4
0.6
0.8
1.0
1 – 特异度
机会线(chance line)
❖ 曲线下从原点到右上角的对角线称为机会线(chance line),表示无论取何诊断界值,灵敏度=1-特异度,及真阳 性率=假阳性率,即无论患者还是非患者都有相同的“机会”被诊断为阳性。
A方法 B方法 合计
阳性 62 58 120
诊断结果 阴性
诊断试验
诊断试验( diagnostic test):应用物理学的、生物化学的、血清免疫学的检查,临床检查和医疗器械检查,对疾病和健康状况提供信息的试验。
一种好的诊断方法要求真实、可靠、快速、安全、无损伤、费用低。
诊断试验的评价也是临床流行病学中重要组成内容之一。
第一节重要性1、对诊断试验进行科学的评价能正确认识其临床应用价值。
2、科学地评价诊断试验是临床医生选择诊断试验的基础诊断试验科学性评价①??试验是否与金标准试验进行“盲法”比较?②??是否每个被测者都做参照试验进行评价?③?所研究病人样本是否包括临床试验中将使用该诊断试验的各种病人?④??诊断试验的精确性(方法介绍详细、结果重复性好)临床上诊断试验主要用于(1)诊断疾病(2)筛检疾病:筛检原则1)筛检的疾病是重大社会问题2)能显着改善其预后3)有足够的领先时间。
领先时间指的是从筛检发现到该病人因症状而去就诊的时间间隔4)筛检试验方法快速、简易、价廉、安全、可靠、灵敏、特异、有效、能被受试者接受(3)疾病随访(4)判断疾病严重程度(5)估计愈后(6)估计对治疗的反应诊断试验评价的目的•怎样开展诊断试验研究•怎样阅读和评价有关诊断试验的文章•临床和科研工作中怎样选择诊断试验–诊断疾病:灵敏度和特异度高–筛检无症状患者:简便、经济、安全易接受–疾病随访:重复性好,影响因素少–判定疾病的严重程度;估计疾病的临床过程及其预后;估计对治疗的反应;测定目前对治疗的实际反应临床医生对一系列的检查事先要有计划,一般将最便宜、最无创伤的检查放在最先做。
第二节研究设计方法1、确定“金标准”金标准:是指当前医学界公认的可以明确肯定或排除某种疾病的最可靠的诊断方法。
2、选择研究对象1)原则:代表性2)病例组:按金标准确诊为“有病”的病例,包括各种类型的病人。
3)对照组:按金标准确诊为无目标疾病的其他病例,特别是与该病容易混淆的病例。
正常人一般不宜纳入对照组。
被试验对象应同期进入研究。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
诊断试验( diagnostic test):应用物理学的、生物化学的、血清免疫学的检查,临床检查和医疗器械检查,对疾病和健康状况提供信息的试验。
一种好的诊断方法要求真实、可靠、快速、安全、无损伤、费用低。
诊断试验的评价也是临床流行病学中重要组成内容之一。
第一节重要性1、对诊断试验进行科学的评价能正确认识其临床应用价值。
2、科学地评价诊断试验是临床医生选择诊断试验的基础诊断试验科学性评价①试验是否与金标准试验进行“盲法”比较?②是否每个被测者都做参照试验进行评价?③所研究病人样本是否包括临床试验中将使用该诊断试验的各种病人?④诊断试验的精确性(方法介绍详细、结果重复性好)临床上诊断试验主要用于(1)诊断疾病(2)筛检疾病:筛检原则1)筛检的疾病是重大社会问题2)能显著改善其预后3)有足够的领先时间。
领先时间指的是从筛检发现到该病人因症状而去就诊的时间间隔4)筛检试验方法快速、简易、价廉、安全、可靠、灵敏、特异、有效、能被受试者接受(3)疾病随访(4)判断疾病严重程度(5)估计愈后(6)估计对治疗的反应诊断试验评价的目的•怎样开展诊断试验研究•怎样阅读和评价有关诊断试验的文章•临床和科研工作中怎样选择诊断试验–诊断疾病:灵敏度和特异度高–筛检无症状患者:简便、经济、安全易接受–疾病随访:重复性好,影响因素少–判定疾病的严重程度;估计疾病的临床过程及其预后;估计对治疗的反应;测定目前对治疗的实际反应临床医生对一系列的检查事先要有计划,一般将最便宜、最无创伤的检查放在最先做。
第二节研究设计方法1、确定“金标准”金标准:是指当前医学界公认的可以明确肯定或排除某种疾病的最可靠的诊断方法。
2、选择研究对象1)原则:代表性2)病例组:按金标准确诊为“有病”的病例,包括各种类型的病人。
3)对照组:按金标准确诊为无目标疾病的其他病例,特别是与该病容易混淆的病例。
正常人一般不宜纳入对照组。
被试验对象应同期进入研究。
3、样本大小的计算决定样本量大小的有关因素•灵敏度,计算病例组样本量•特异度,计算对照组样本量•显著性检验水平•容许误差,一般定在0.05-0.104、列出诊断实验的四格表诊断试验结果1)真实性(validity)或准确性:是测量值与实际值相符合的程度,亦即反映客观事物的准确程度患病率:a+c/N(1)灵敏度(Sn)*灵敏度(sensitivity)(真阳性率)即实际有病而按该诊断标准被正确地判为有病的百分率灵敏度反映一项试验能将实际有病的人判定为患病的能力,其值越大,则漏诊的可能性愈小。
假阴性互补(2)假阴性率(false negative rate)(漏诊率、第二类错误)该指标是指在有病者中,被该项试验错判为无病的比例。
(3 )*特异度(Sp)(specificity):又称真阴性率。
特异度反映一项试验能将实际上未患某病的人正确地判定为未患某病的能力。
其值越大,则误诊的可能性愈小。
假阳性互补(4)*假阳性率(false positive):又称误诊率该指标是指在无病者中,被该项试验错判为有病的比例。
(5)一致性(agreement):该指标是指试验结果的真阳性和真阴性人数占受试者总人数的比例。
真阳性和真阴性值愈大,一致性愈接近于1,假阳性和假阴性愈小,该项试验价值愈高。
(6)*预测值(predicative value)Pv:又称预检值、预告值。
检验结果的正确率,指诊断试验结果与实际符合的概率。
它包括阳性预测值与阴性预测值。
(+Pv) 阳性预测值是阳性试验结果中实际患病者的百分率,即试验结果阳性者的患病概率。
该值愈大愈好。
(-Pv) 阴性预测值是阴性试验结果中实际未患病者的百分率,即试验结果阴性者的未患该病的概率,该值愈大愈好。
(7其指数范围从0~1,约登指数愈大,其真实性亦愈大。
理想的约登指数为1。
(8)似然比(LR):是诊断试验的结果在患者中出现的概率与非患者中出现的概率之比,是评价诊断试验真实性的重要综合指标。
包括•阳性似然比(+LR) 是诊断试验阳性结果在患者中出现的概率(真阳性率)与非患者中出现的概率(假阳性率)之比。
其值越大越好,表明阳性结果的正确率高。
阳性似然比=灵敏度(真阳性率)/假阳性率•阴性似然比(-LR) 是诊断试验阴性结果在患者中出现的概率(假阴性率)与非患者中出现的概率(真阴性率)之比。
其值越小越好,表明阴性结果的正确率高。
阴性似然比=假阴性率/真阴性率(特异度)例:某医院共收治360名疑似心肌梗塞病人,经临床及心电图等检查,确诊230名心肌梗塞病人,又对每个疑似患者进行肌酸磷酸激酶(CPK)含量测定,结果见表,试评价肌酸磷酸激酶诊断的真实性。
肌酸磷酸激酶试验结果灵敏度=a/(a+c)⊆100%=215/230⊆100%=93%假阴性率=1-灵敏度=7%结果表示在患心肌梗死的病人中用该试验检查阳性者占93%还有7%的人被漏诊。
特异度=d/(b+d) 100%=114/130 100%=88%假阳性率=1-特异度=12%结果表示在未患心肌梗死的病人中用该试验检查真阴性者占88%,还有12%的人被误诊。
患病率:a+c/N=64%一致性=(a+d)/(a+b+c+d) ⊆100% =329/360 ⊆100%=91%结果表示该试验检查出的阳性和阴性者中91%与金标准相符。
阳性预测值=a/(a+b) ⊆100%=215/231 ⊆100% =93%结果表示用该试验检查为阳性的人中有93%的人确实患心肌梗死。
阴性预测值=d/(c+d) ⊆100%=114/129 ⊆100% =88%结果表示用该试验检查为阴性的人中有88%的人确实未患心肌梗死。
•约登指数=(灵敏度+特异度)-1=0.81•阳性似然比=(215÷230)/(16 ÷130)=7.6其含义为心肌梗死患者CPK结果阳性者为非心肌梗死患者的7.6倍。
•阴性似然比=(15 ÷230)/(114 ÷130)=0.074其含义为心肌梗死患者CPK结果阴性者为非心肌梗死患者的0.07倍。
理想的诊断试验要求灵敏度和特异度都很高,但当诊断试验的测量指标是连续变量时,不同的阳性标准有不同的灵敏度和特异度。
若提高灵敏度,必导致特异度下降,反之亦然。
第三节诊断试验评价指标和意义1、灵敏度(Sn)和特异度(Sp)(1)定义(2)如何定临界点(cut off points)要求灵和特均高,不可能,如何定截断值(cut-off value)或临界点的确定•截断值所谓截断值就是正常值与异常值之间的界限值。
在诊断试验中,通常将正常范围定为均数±2倍标准差,在该范围内为正常,反之则异常。
截断值确定的策略应以灵敏度和特异度最高,误诊率和漏诊率最小为理想。
(3)原则:高灵敏度试验适用于A.对于严重疾病但可治,早期诊断最好,而漏掉后果严重时。
结核B. 有几个诊断假设,为了排除某病的诊断。
C.用于筛检无症状病人而该病的发病率比较低,试验结果呈阴性时高灵敏度试验临床价值最大。
高特异度试验适用于:A.无法治疗的疾病,误诊后果严重.如癌,阳性结果会导致病人精神和肉体上的严重危害。
B.要肯定诊断时,高特异度试验的阳性结果临床价值最大2、预测值(Pv)又称诊断价值它是诊断试验的收益评价指标,表示试验结果的实际临床意义,从本质上说是评价真实性的指标。
灵敏度和特异度是诊断试验本身的特征,是临床医生是否采纳该诊断试验的重要决策依据。
一旦诊断试验的结果报告出来,临床医生最紧要的工作就是判断有这种结果的人患病概率的大小。
预测值就是说明试验结果为阳性(或阴性)时,有多少概率有病(或无病)。
(1)定义阳性预测值(positive predictive value):是指筛检试验阳性者患目标疾病的可能性+ Pv阴性预测值(negative predictive value):是指筛检试验阴性者不患目标疾病的可能性(2)关系:患病率一定时,灵敏度越高,则阴性预测值越好,临床医生更有把握判断阴性结果为非病人;反之,特异度越高,则阳性预测值越好,临床医生越有理由判断阳性结果为病人。
临床医生在很大程度上依据阳性与阴性预测值来判断受试者是否患病。
当灵敏度和特异度一定时,与受检人群目标疾病患病率(P)密切相关,人群患病率的波动远大于灵敏度和特异度的变化范围,因此临床医生更应注意患病率对试验结果的影响。
阳性预测值与患病率成正比,阴性预测值与患病率成反比。
当患病率很低时,即使一个试验的灵敏度和特异度均很高,仍会出现许多假阳性,使阳性预测值降低,临床医生在判断一张化验单的阳性或阴性结果的临床价值时,必须事先考虑被检人群的患病率高低,才能做出正确的评价。
同样的试验在基层门诊部和在高级专科医院应用时,其阳性或阴性预测值也有很大差别。
3、受试者工作特性曲线(receiver operator characteristic curve, ROC)是用真阳性率和假阳性率作图得出的曲线,它可表示灵敏度和特异度之间的关系。
ROC有两方面的重要作用:一是根据诊断目的确定参考值,二是对两个以上独立的诊断试验进行比较。
•ROC曲线可以决定最佳临界点,如患病率接近50%时,最接近左上角那一点,可定为自己最佳点。
以临界点作为截断值时,灵和特均高。
•ROC曲线也可用来比较两种和两种以上诊断试验的诊断价值. ROC曲线下面积反映一个诊断试验的整体准确性,面积越大,准确性越高.ROC曲线是一种全面、准确评价诊断试验非常有效的方法。
ROC曲线常用来决定最佳临界点,通常最接近左上角那一点,可定为最佳临界点,点上的值即为最佳临界值。
ROC曲线也可用来比较两种和两种以上诊断试验的诊断价值,从而帮助临床医师作出最佳选择。
CT的整体准确性较高,在诊断脑瘤中的价值更大.4、似然比(LR)(1)定义:即某一实验结果有病者与无病者的比值,也是反应诊断真实性指标(综合性指标),可同时反应灵敏度和特异度的复合指标。
比灵敏度和特异度更稳定,不受患病率影响,它的不足之处它是比不是率,应用时需换算。
+LR:试验阳性结果的似然比系真阳性率和假阳性率之比。
说明正确判断阳性的可能性是错判阳性可能性的倍数。
-LR:阴性结果的LR系假阴性率和真阴性率之比。
表示错判阴性的可能性是正确判断阴性可能性的倍数。
(2)例子:CPK阳性结果的似然比为7.6,阴性结果的似然比为0.07,表示:CPK阳性来自心肌梗死的可能性为来自非心肌梗死的7.6倍。
(或心肌梗死患者出现CPK阳性的机会是非心肌梗死者出现阳性结果的7.6倍)CPK阴性来自心肌梗死的可能性不到来自非心肌梗死的1/10。
(或心肌梗死患者出现CPK阴性的机会是非心肌梗死者出现阴性结果的0.07倍)(3)似然比的重要作用•实际上,很多有病的受试者的试验结果并不能在诊断试验后得到非常“异常”的结果,而可能是接近临界值的“边缘异常”的结果,这常常使临床医生难下诊断。