筛检与诊断试验的评价
第九章筛检与诊断试验的评价(1)
第九章筛检与诊断试验的评价(1)第九章筛检与诊断试验的评价(⼀)单项选择题(1)诊断试验的真实性是指A.重复多次试验获得相同结果的稳定程度B.试验结果中真正有⽆疾病的概率C.受试者的测定值与实际值的符合程度D.观察者对结果判断的⼀致程度E.诊断试验的随机误差(2)对漏诊后果严重的疾病,要求筛检试验A.灵敏度⾼B.灵敏度低C.特异度⾼D.特异度低E.符合率⾼(3)为提⾼诊断试验的灵敏度,对⼏个独⽴实验可A.串联使⽤B.并联使⽤C.先串联后并联使⽤D.要求每个实验假阳性率低E、要求每个实验特异度低(4)为提⾼诊断试验的特异度,对⼏个独⽴实验可A.串联使⽤B.并联使⽤C.先串联后并联使⽤D.要求每个实验假阳性率低E.要求每个实验特异度低(5)某病早期治疗效果好,漏诊后果严重,对此病的诊断试验应A.提⾼灵敏度B.提⾼特异度C.提⾼阳性预测值D.提⾼阴性预测值E.提⾼诊断的截断值(6)诊断试验的真实性(符合率)是指A.试验结果精确B.试验条件稳定C.试验结果辨别有⽆疾病的能⼒D.试验的测定值与实际值的符合程度E.重复试验获得相同结果的稳定程度(7)在糖尿病诊断⽅案中,甲⽅案⾎糖阳性标准定为5.8mmol/L,⼄⽅案定为6.1mmol/L,⼄⽅案与甲⽅案⽐较A.灵敏度⾼,特异度低,假阳性率低,假阴性率⾼B.灵敏度低,特异度⾼,假阳性率⾼,假阴性率低C.灵敏度⾼,特异度⾼,假阳性率低,假阴性率低D.灵敏度低,特异度⾼,假阳性率低,假阴性率⾼E.灵敏度⾼,特异度⾼,假阳性率⾼,假阴性率低(8)下列关系式中哪项是正确的A.灵敏度+特异度=1B.灵敏度+假阳性率=1C.灵敏度+假阴性率=1D.灵敏度+阳性预测值=1E.灵敏度+阴性预测值=1(9)反映诊断试验可靠性的指标是A.灵敏度B.特异度C.约登指数D.预测值E.符合率(10)试验标准确定后,诊断结果的阳性预测值取决于A.灵敏度B.特异度C.患病率D.符合率E.约登指数(11)有关⼏个独⽴试验的联合使⽤,下列说法正确的是A.串联使⽤时灵敏度、特异度均提⾼B.并联使⽤时灵敏度、特异度均降低C.串联使⽤时灵敏度降低、特异度提⾼D.并联使⽤时灵敏度降低、特异度提⾼E.串联使⽤时灵敏度提⾼、特异度降低(12)在某特定⼈群实施筛检计划,该病患病率为10%,所⽤筛检试验的灵敏度为95%,特异度为90%。
筛检和诊断试验的评价概要
b)当漏诊可能导致严重后果,或当有几个诊断假设时,
为排除某病的诊断或用于筛检无症状病人而该病的发
病率又较低时,此时应选择灵敏度高的诊断标准;标
准左移,此时特异度下降,假阳性率上升,导致筛检
成本高; 无病
有病
正常
病人
C
A
B
c)对于治疗效果不理想,进一步确诊和治疗费用较昂
贵,易导致对病人精神及肉体上的严重危害或为了用
不同诊断阳性标准条件下的灵敏度和特异度
阳性标准( LCA- α 1 –AT百分率%) 灵敏度 特异度
15
100.00 83.24
16
99.00 90.00
17
97.69 93.12
18Leabharlann 96.42 96.2119
95.00 99.00
20
91.45 100.00
现某市工业区的肝癌现患率为40/10万, 市效区为20/10万。根据上述资料,若分别 选用16%和19%作为诊断阳性标准,分别 在两区各筛检50万人。请计算不同条件下 (不同阳性标准、不同现患率人群)的预期 筛检结果和阳性预测值。
筛检和诊断试验的评价
筛检和诊断试验的评价
对筛检和诊断试验的评价,除考虑方法本身 的安全和操作上的简单、快速、方便及价格低廉 等因素外,还要考虑试验的真实性、可靠性及收 益三个方面。
➢真实性 ➢可靠性
➢收益
评价筛检试验的指标
黄金标准
– 病理学标准(组织活检和尸体解剖) – 外科手术发现或特殊的影像诊断 – 长期临床随访结果 – 公认地综合临床诊断标准 – 金标准是相对的,选择应结合临床具体情况
– 特异度指筛检试验能将实际无病的人正确判为非患 者的比例(d/b+d) × 100% ;
08. 筛检与诊断试验的评价
-
18
1
2
13
20
14
合计
19 15 34
Kappa值=实际一致性/非机遇一致性
Kappa N ( A D) (R1C1 R2C2 )
2020/9/4
N 2 (R1C1 R2C2 )
34
• 影响筛检试验可靠性的因素
✓ 受试对象生物学变异 ✓ 观察者 ✓ 实验室条件
2020/9/4
35
预测值(predictive value)
LR
假阴性率 真阴性率
1 灵敏度 特异度
2020/9/4
28
约登指数(Youden Index)
也称正确指数,是灵敏度与特异度之和减去1, 表示筛检方法发现真正病人与非病人的总能力。
正确指数的范围在0~1之间。指数越大,其真实 性越高。
正确指数 = (灵敏度 + 特异度) – 1 =1 – (假阴性率 + 假阳性率)
2020/9/4
29
血清肌酸激酶测定与急性心肌梗死
急性心肌梗死(金标准判定)
血清肌酸激酶
有
无
阳性
225
24
阴性
25
121
合计
250
145
合计
249 146 395
灵敏度=90.0 % 漏诊率=10.0 % 误诊率=16.6% 特异度=83.4%
阳性似然比=5.4 阴性似然比=0.12 约登指数=0.73
• 根据筛检对象范围分类 整群筛检(mass screening) 目标筛检(targeted screening)
• 根据筛检的项目多少分类 单项筛检 (single screening) 多项筛检 (multiple screening)
流行病学:筛检与 诊断试验
试验标准
不同诊断界值时灵敏度与特异度间的平衡
100
80
60
40
特异度
灵敏度
20
0
50
60
70
80
90
100百分率
(%)
(二)可靠性(reliability)
可靠性又称信度,指某一方法在相同 件下重复测量同一受试者时,所获结果的一 致性。
影响因素
1、生物学变异:个体内、个体间差异 2、观察变异 :多次观察和观察者间差异 3、试验差异:实验条件和试验环境所致的
医生还需关注的问题:
1、检测结果和实际情况符合程度如何? 2、试验阳性时患病的概率多大? 3、试验阴性时不患病的概率多大?
表1 按所定诊断标准将人群分组
按所定诊断标准
按“金标准”诊断
有病
无病
阳性 阴性
a(真阳性) c(假阴性)
b(假阳性) d(真阴性)
6.阳性似然比=Se/FP=[a/(a+c)]/[b/(b+d)] 7.阴性似然比=FN/SP=[c/(a+c)]/[d/(b+d)]
确定诊断界值的原则
₪ 漏诊后果严重的疾病,选择灵敏度高的诊 断界值;
₪ 对于尚无有效治疗疾病,选择特异度高的 诊断界值
₪ 一般可选择“灵敏度=特异度”界值为诊 断标准
确定诊断界值的方法
生物统计法 临床判断法 受试者工作特征曲线(ROC曲线) 依据临床需要确定界值
ROC曲线
取诊断试验的多个不同界值(5个以上)分别与金标准比较,计 算得到多组灵敏度和特异度值,以灵敏度为纵坐标,1-特异度 为横坐标,将各个界值对应点连接而成的曲线。
➢ 解决办法:将两指标结合:Youden指数、阳性似 然比、阴性似然比等
筛检与诊断试验的评价
活/尸检
手术发现
1
2
3
6
5
4
金标准 特殊检查 影像诊断 长期随访的结果
“金标准”指当前临床医学界公认的诊断疾病的最可靠的方法,也称为标准诊断
微生物培养
选择研究对象 研究对象中应该包括两类人: 某病患者 包括典型、不典型;早、中、晚期;轻、中、重型;有、无并发症者,以便使试验结果具有代表性。 某病非患者 包括健康者、特别是易与该病相混淆的其他疾病患者,这样才能较好的评价诊断试验的鉴别诊断的价值。
真实性 标准
科学性 可靠性 益 预测值
01
03
02
二、诊断试验的评价指标
它反映该项试验正确判断病人的能力。
灵敏度= ×100%
评价诊断试验真实性的指标有哪些?各自的含义和计算方法是怎样的?
1
简述阳性及阴性预测值的含义、计算方法及其影响因素。
2
试述诊断界值改变对各评价指标的影响及界值的确定方法。
3
试述串联与并联试验的结果判断原则及其影响。
4
复习思考题:
④假阴性率( false negative ):又称漏诊率 指实际有病者中,被该项试验错判为无病的比例。 假阴性率 = ×100%=1-灵敏度 其值越大,反映该项试验漏诊者越多。 灵敏度和漏诊率互补。 ⑤正确诊断指数或约登指数(Youden’ index) 用灵敏度与特异度之和减1表示。 约登指数=灵敏度+特异度-1 越接近“1”越好.
2、可靠性(reliability):即可重复性。 指用同一种诊断方法在同样条件下,对相同的人群进行一次以上的检查,获得试验结果的稳定程度。常用的指标有: (1)计量资料 :如 S、CV。 (2)计数资料 1)观察一致率 对同一事物两人观察或同一个人两次 观察,结果相一致的百分比。 观察一致率=观察符合例数/观察总例数×100% 2)卡帕值(Kappa 值) 指实际一致率与最大可能一致率之比。
筛检与诊断试验的评价
*
采用串联试验诊断疾病,应注意: 常先选简便、易行、价廉、对被检查人无损伤的试验,后用复杂、昂贵、可能有损伤的试验。 如几个试验的费用、安全性相近,先使用特异度高的试验(假阳性少),减少接受第二种试验的病人数,降低成本,提高效率。
*
四、诊断试验评价的设计
确立金标准 研究对象的选择 样本量的估计 确定诊断试验的分界值 与金标准同步进行盲法比较
*
金标准
特 定 人 群
病人
非病人
待评价的筛检/诊断方法
评价指标
图2 筛检、诊断试验的评价程序
阳性a
阴性c
阳性b
阴性d
*
*
(一)真实性评价
真实性(validity):又称有效性或效度 指筛检或诊断试验所获得的测量情况与实际情况的符合程度。 1.灵敏度(sensitivity,Se) (真阳性率): 即实际有病且按该诊断标准被正确地判为有病的概率。(反映试验检出病人的能力) 灵敏度(%) = a/(a+c)×100% 2.特异度(specificity,Sp) (真阴性率): 即实际无病且按该诊断标准被正确地判为无病的概率。(反映试验排除病人的能力) 特异度(%) = d/(b+d)×100%
*
目录
一、概述 二、筛检和诊断试验的评价 三、提高筛检、诊断试验效率的方法 四、诊断试验评价的设计
*
一、概述
筛检(screening):是通过快速的检验、检查或其他措施,在一般人群中发现那些尚未被识别的病人或有缺陷的人。 诊断(diagnosis):是把病人与可疑有病但实际无病的人区别开来。 筛检/诊断试验:是指应用各种实验、仪器等手段进行检查,以确定或排除疾病的实验方法。
*
筛检或诊断试验评价的方法
确定金标准:临床医学界公认的诊断疾病的最可靠的方法。
选择研究对象
病例组
样本量的估计
对照组
资料的整理,评价指标的分析
偏倚的控制
1
确定金标准
‘金标准’:是指当前临床医学界公认的诊断疾病的最可靠的方法。 也称为标准诊断。
通常包括:活检、手术发现、微生物培养、尸检、特殊检查和影像 诊断,以及长期随访的结果。
2
例:
冠心病: 肿瘤: 肾结石:
冠状动脉造影 病理学检查 手术发现
金标准具有创伤性,因此探求一些新的诊断方法(诊断 试验),并比较其与金标准的差别、得失及推广价值有现实 意义。
3
选择研究对象
(1)病例组:是指用金标准确诊‘有病’的病例,应包含典型的、不 典型病例,早、中、晚期病例,轻、中、重病例、有和无并发症的患者。 (2)对照组:是指用金标准证实没有目标疾病的其他病例,特别是与 该病容易混淆的病例。正常人一般不宜纳入对照组。
靠性和收益。
6
质量控制
1.应该采用盲法判断试验结果避免或减少偏差。 2.筛检试验所用的仪器型号、试验条件、试验步骤、试剂质量等要统一、
标准化。筛检试验所涉及的方法须反复测试。 观察指标要客观、特异,判断结果的标准要明确具体。 参与调查的研究者应经过严格培训。
4
样本大小的计算
与筛检试验研究的样本量有关的因素: 1.显著性水平α:α值越小,样本含量越大,一般取α=0.05。 2.容许误差δ:δ越小,样本含量越大;δ越大,样本含量越小,δ 一般在0.05~0.10。 3.灵敏度或特异度的估计值P:病例组样本含量由灵敏度估计, 对照组样本含量由特异度估计。
5
整理分析资料
诊断学:筛检与诊断试验的评价
Kappa值的意义
取值范围:-1~+1 Kappa值= -1:两次判断完全不一致 Kappa值= +1:两次判断完全一致 Kappa值= 0:观察一致率完全由机遇造成 Kappa值< 0:观察一致率比机遇一致率还
3.阳性似然比(LR+)=Se/FPR=[a/(a+c)]/[b/(b+d)] 4.阴性似然比(LR-) =FNR/Sp=[c/(a+c)]/[d/(b+d)]
意义:综合了灵敏度与特异度的特征,相对稳定; LR+越大诊断价值越高, LR-越小诊断价值越高
真实性其他指标
按所定诊断标准
按“金标准”诊断
a(真阳性) c(假阴性)
b(假阳性) d(真阴性)
1.灵敏度(sensitivity, Se ),真阳性率,实际有病且 诊断试验判为有病的概率
Se=a/(a+c) ×100%
假阴性率(false negative rate,FNR),漏诊率
FNR =c/(a+c) ×100%
真实性指标
诊断试验
按“金标准”诊断
有病
无病
阳性 阴性
a(真阳性) c(假阴性)
b(假阳性) d(真阴性)
5.约登指数(Youden index,YI,r),正确 诊断指数
YI= (Se+Sp)-1= 1-(FNR+FPR) 取值范围均在(0, 1)之间,越接近1越好
例题
114例乳腺肿块针吸细胞活检(FNA)和手术切除肿块 活检的比较
表1 甲、乙二医生诊断结果
甲医生诊断
乙医生诊断 肺门淋巴结核
正常
肺门淋巴结核 46(a)
10(b)
正常
诊断试验及疾病筛检的评价--一、筛检
诊断试验及疾病筛检的评价--一、筛检(一)筛检的概念筛检(screening)是在大量人群中通过快速的试验和其他方法,去发现那些未被识别的病人、可疑病人或有缺陷的人。
图5-1 筛检步骤示意图筛检不是诊断试验,它是把健康人和病人(疑似病人、有缺陷的人)区别开来的方法,它仅是初步检查,是早期发现病人的一种方法。
对筛检试验阳性还应进一步确诊。
对某种疾病来说,在一般人群中包括三种人,一种是无该病的健康人,一种是可疑有该病但实际无该病的人,一种是有该病的人。
这三种人混杂存在。
筛检的工作即是将健康人与其他两类人区别开来。
然后用更完善的诊断方法,将可疑患该病但实际无该病的人与实际患该病的人区别开来,(见图5-1)。
第三步为对有该病的人进行治疗,使之恢复。
因此,筛检是第一步,诊断试验是第二步,治疗是第三步。
(二)筛检的分类1.人群筛检(population screening,mass screening)是指用一定筛检方法对一个人群进行筛检,找出其中患该病可能性较大的人,然后,对其进一步诊断及治疗。
如先用尿糖测定筛检出可疑糖尿病病人,再用其他方法(如血糖测定)以确诊,然后加以治疗。
2.多次(级)筛检(multiple screening)在上类筛检中,同时应用多种筛检方法进行筛检,可以同时筛检多种疾病。
3.定期健康检查(periodical health examination)或目标筛检(targeted screenig)对有某种暴露的人群(如铅作业工人)、高危人群、某一单位、某种职业人群定期进行健康检查,以早期发现病人,及时给予治疗。
4.病例搜索(case-finding)或机会性筛检(opportunistic scr eening)筛检的对象局限于因其他原因而找临床医师或卫生医师诊治或咨询的人。
即是临床医师或卫生医师对来诊者加用其他筛检方法,以发现与主诉无关的疾病。
(三)适用于筛检的疾病、对象及筛检应用的原则在开展筛检规划时应当注意以下几点:1.应当筛检危害严重的疾病或缺陷,迟发现将造成严重后果如遗传性代谢缺陷的苯丙酮尿症(phenyl ketonuria)及某些癌症(如宫颈癌),或某些已成为重大的社会卫生问题的疾病或缺陷。
第八章筛检与诊断试验的评价ppt课件
筛检试验阳性 确诊患该病
筛检试验与诊断试验的区别
对象 目的
筛检试验
健康人或表面健康的人 早期发现可疑患者和高危人群
诊断试验
患者或可疑病人 明确判断可疑患者是否患病
要求 费用 处理
意义
快速、简便、高灵敏度
科学、准确、特异性高
低廉
一般费用较高
阳性者须进一步诊断试验或干预,结果阳性者给予治疗和干预,
阴性者定期再筛检。
Sp =d/(b+d) × 100%
是否 阳性 a b 阴性 c d
(2)假阳性率 (false positive rate,FPR)
————又称误诊率,指诊断试验将实际无病的人错判为 患者的概率。
FPR = b/(b+d) × 100% =1-Sp
是否 阳性 a b 阴性 c d
灵敏度与特异度有何关系?
本章内容
• 筛检与诊断的定义和区别 • 筛检与诊断试验的评价指标 • 筛检与诊断试验的设计与实施 • 如何提高筛检与诊断试验的效率 • 筛检与诊断试验中的偏倚
第一节 概 述
一、概 念
(一)筛检(screening)
筛检是运用快速、简便的检验同那些真正无病或无缺陷的人区别开来。
特异度(%) 8.8 25.5 47.6 69.8 84.1 92.5 96.9 99.4 99.6 99.8
100.0 100.0 100.0 100.0
灵敏度和特异度的关系
➢当试验方法和阳性标准固定时,每个诊断试验的灵 敏度和特异度是恒定的。
➢改变诊断试验正常和异常的临界点会影响灵敏度和 特异度。Se升高,Sp就降低; Sp升高,Se就降低。
机遇一致性(Pc)
( r1c1 N
筛检与诊断试验的评价
科研领域
临床试验
01
在临床试验中,筛检可用于筛选符合条件的受试者,确保试验
的准确性和可靠性。
流行病学研究
02
通过筛检了解特定人群的疾病分布和流行趋势,为制定防控策
略提供依据。
基础研究
03
在基础研究中,筛检可用于筛选具有特定表型的实验对象,为
深入研究疾病机制提供支持。
成本效益比
衡量筛检试验成本和效益 之间的比例关系,数值越 低,成本效益越好。
03 诊断试验的评价
诊断试验的特异性
总结词
指试验在鉴别正常人和病人时的准确 性。
详细描述
特异性是指诊断试验仅对患病者产生 阳性结果的能力,即真阴性率。特异 度高,意味着试验结果很少出现假阳 性,可以减少误诊率。
诊断试验的敏感性
通过技术创新和规模化生产,降低筛检与诊断试验的成本,使其更 易于普及。
远程诊断
利用信息技术和通信技术,实现远程筛检与诊断,提高医疗服务的 可及性。
公共卫生项目
加强公共卫生项目,提高筛检与诊断试验在基层和偏远地区的可及性 。
感谢您的观看
THANKS
总结词
指试验在检测出患者时的能力。
详细描述
敏感性是指诊断试验能够正确地识别患病者的比例,即真阳性率。敏感性高的 试验能够减少漏诊率。
诊断试验的预测值
总结词
指根据试验结果预测实际患病状态的能力。
详细描述
预测值包括阳性预测值和阴性预测值。阳性预测值是指试验阳性者中真正患病者 的比例,阴性预测值是指试验阴性者中真正无病者的比例。
提高筛检与诊断试验的准确性
标准化和质量控制
建立筛检与诊断试验的标准化操作程序和质量控制体系,确保试 验结果的可靠性和一致性。
诊断试验和筛检试验的评价
诊断试验和筛检试验的评价一、目的要求1、掌握诊断与筛检验试验的评价指标及计算方法2、了解诊断与筛检试验标准的选定原则二、内容(一)诊断与筛检试验的评价指标课题一CA19-9(19糖原决定簇)为一种无损伤的非侵入性的胰腺癌诊断方法。
为评价此法的真实性,使用该方法同时检测了55例经病理确诊的胰腺癌病人和58例非胰腺癌的健康对照,结果如表 1表1 CA19-9检测胰腺癌和非胰腺癌人群的结果CA19-9 胰腺癌病人非胰腺癌病人合计阳性(≥75U)47 10 57阴性(<75U)8 48 56 合计55 58 113问题1:请计算此法的灵敏度、特异度、假阳性率、假阴性率、约登指数、阳性预测值、阴性预测值?(二)诊断与筛检试验的影响因素课题二CA19-9在人群中的分布为一连续分布,下图是CA19-9的胰腺癌和非胰腺癌人群的分布示意图,若使用CA1—9在人群中作筛检或诊断,请回答:问题2:为使灵敏度最高,应取什么标准?此时的灵敏度是多少?假阴性率是多少?问题3:为使特异度最高,应取什么标准?此时的特异度是多少?假阳性率是多少?课题三当使用CA19-9筛检或诊断胰腺癌时,不同的诊断标准得到的灵敏度和特异度不一样,二者的关系如表 2已知甲地区人口10万人,胰腺癌患病率为30/10万;乙地区人口也是10万,其胰腺癌的患病率为15/10万。
如果分别以CA19-9大于37U和大于75U作为阳性诊断标准,同时在这两个地区进行胰腺癌筛检,请回答:问题4:请将预测筛检结果填入表3中,请问预测值和现患率有何关系?问题5:当医生拿到来自患病率差异较大的地区的病人的阳性或阴性结果时,其临床意义大小有无差异?为什么?表2 不同诊断标准测得的CA19-9的灵敏度和特异度CA19-9 灵敏度(%)特异度(%)>37U 98.1 76.0>75U 85.5 82.8>120U 80.0 86.2表3 两地区胰腺癌预期筛检结果诊断标准现患率阳性预测值阴性预测值>37U 30/10万(甲地)>37U 15/10万(乙地)>75U 30/10万(甲地)>75U 15/10万(乙地)(三)联合试验课题四某学者同时用CA19-9和B超检测胰腺癌和非胰腺癌人群,结果如表 4表4 CA19-9和B超检测胰腺癌和非胰腺癌人群结果CA19-9 B超胰腺癌非胰腺癌+- 3 4++44 6-+ 5 23-- 3 25问题6:请分别计算各单项试验及并联试验和串联试验的灵敏度、特异度?问题7:与各单项试验比较,联合试验的灵敏度和特异度有何变化?问题8:联合试验在临床确诊和鉴别诊断方面有什么意义?。
筛检与诊断试验的评价
二、可靠性的评价
即可重复性。指用同一种诊断方法在同样条件下,对相同 的人群进行一次以上的检查,获得试验结果的稳定程度。 1.计量资料 :如 S、CV。
2.计数资料 (1)观察一致率 对同一事物两人观察或同一个人两次
观察,结果相一致的百分比。 观察一致率=观察符合例数/观察总例数×100% (2)卡帕值(Kappa 值)指实际一致率与最大可能一致率 之比。
对部分结、直肠癌病人和正常人血清中的CEA进行检测,
结果如下表。
结、直肠癌病人与正常人血清CEA测定结果
CEA 结、直肠癌病人 正常人
合计
阳性
14
2
16
阴性
3
99
102
合计
17
101
第34页/共57页
118
Se=14/17=82.35% Sp=99/101=98.02% 假阴性率=1-Se=3/17=17.65% 假阳性率=1-Sp=2/101=1.98%
一、真实性的评价
筛检或诊断 试验
阳性 阴性 合计
按“金标准”诊断
合计
患病
未患病
a(真阳性) b(假阳性) a+b c(假阴性) d(真阴性) c+d
a+c
b+d a+b+c+d=N
真阳性(A)是指金标准确诊有该病的病例组中,诊断试验检出的阳性例数 假阳性(B)是指无该病的非病例组中,诊断试验检出的阳性例数 假阳性(C)是指金标准确诊有该病的病例组中,诊断试验检出的阴性例数 真阴性(D)指在金标准确诊无该病的非病例组中,诊断试验检出的阴性例数
5.资料整理分析
评价诊断试验资料分析
诊断试验
筛检试验与诊断试验的评价
图例: 筛检阴性者 筛检阳性但未患病 筛检阳性且已患病生统计学系
(二)筛检试验(screening test) 就是用于识别健康人群中可能患有某病的个体 或未来发病危险性高的个体的方法。
★方法:问卷、常规体格检查、物理学检 查、实验室检验、高级分子生物学技术
青岛大学公共卫生学院流行病与卫生统计学系
第二节筛检试验与诊断试验的评价
评价方法—同步盲法 “同步”是指所有研究对象都要同时进行诊断 试验和标准诊断方法(金标准)的测定。 “盲法”指诊断试验和金标准方法结果的解释 相互不受影响。
青岛大学公共卫生学院流行病与卫生统计学系
评价步骤
一金标准的确定 二研究对象的选择 三样本含量的估计 四确定待评价试验的阳性界定值 五资料的整理,评价指标的分析 六似然比的临床应用 七质量控制
4.要充分考虑筛检收益。
青岛大学公共卫生学院流行病与卫生统计学系
六 伦理学问题
◈知情同意原则
◈有益无害原则 ◈公正原则
青岛大学公共卫生学院流行病与卫生统计学系
二诊断(diagnosis)和诊断试验
诊断不同于筛检,筛检是把病人 及可疑病人与无病者区分开来,而 诊断则是进一步把病人与可疑有病 但实际无病者区别开来。
青岛大学公共卫生学院流行病与卫生统计学系
样本含量的估计
样本量有关的因素
◈灵敏度或特异度的估计值:P值=
50%时,样本量最大,越远离50%,样本量越小,病 例组样本含量由灵敏度估计,对照组样本含量由特 异度估计。
◈显著性检验水平:α值越小,样本含
量越大,一般取α=0.05。
◈容许误差δ : δ越小,样本含量越大;
青岛大学公共卫生学院流行病与卫生统计学系
筛检试验评价- 诊断试验的评价
筛检试验或诊断试验的评价
筛检或诊 按“金标准”诊断
断试验 有病
无病
合计
阳性 a(真阳性) b(假阳性) a+b 阴性 c(假阴性) d(真阴性) c+d
合计 a+c
b+d a+b+c+d
灵敏度= a 100% ac
特异度 = d 100% bd
漏诊率= c 100% 误诊率= b 100%
ac
bd
• 哥vnv
•
• 国国
合格和韩
• 和环境和交换机及环 境和交换机
• 歼击机
• 版本vnbngnvng
.
牬坱窛镒怕脪譢旎坓诩屽 辏珵暗伤娙坨穓鱴稫疪僃 駨箱韜缵齣敳崜胊美蝖
• 11111
• 该放放风放放风放放 风方法
• • • • 共和国规划
.
• •
看即空 间将尽见快快 见可间 进尽快快尽尽
看接 空快尽尽快快 见口 间空快快将尽
驡胺魸
癬 撍 妕 鏜
縚 訽 婌 财 仌
埵 偠 窌 鴩 衕
攊 哩 鰭 熔 靏
饻聟挖
.
抁褦娘攦錋蚃憶掜氣鴽围 轎繽劃醡鶜桽樲豍亀鶧潞 贒腥溸皥萄誢鴭柀阾昒
• 455454545445 • Hkjjkhh • • •你 • • •
.
僊痂赙韘裏嚜奢漷藜别兝 訖鋞浃钹刃蹩妏劄楽翹钚 箍匛鹐櫍禸剺畓藞枮苌
• 1222222222222223211
• 测量值与真实值的符合程度。 • 灵敏度 、特异度、漏诊率、误诊率、正确诊
断指数、似然比、符合率
.
• 确定金标准
• “金标准”:当前临床公认最好的、准确性高的、 可靠的诊断方法作为诊断的依据,或者以一种被 广泛接受或认可的具有高度灵敏度和特异度的诊 断方法
流行病学实习四——诊断与筛检试验的评价——北京大学
特异度=(d/b+d)*100% 假阴性率=(c/a+c) *100%
阳性预测值=(a/a+b) *100%
阳性似然比
真阳性率 假阳性率
灵敏度 1 特异度
阴性预测值=(d/c+d) *100%
阴性似然比
假阴性率 真阴性率
1 灵敏度 特异度
血清T4浓度诊断试验
• 灵敏度= 22/27*100% = 81.5%, 表示在确诊的甲状腺功能低下病人中血清T4浓度<77nmol/L(阳性)
者占81.5%。 • 特异度= 86/93*100% = 92.5%, 表示在无甲状腺功能低下病人中血清T4浓度≥77nmol/L(阴性)者占
92.5%。 • 假阴性率= 5/27*100% = 18.5%, 表示在确诊的甲状腺功能低下病人中血清T4浓度≥77nmol/L(阴性)
者占 18.5%,即有18.5%的甲状腺功能低下病人漏诊。 • 假阳性率= 7/93*100% = 7.5%, 表示在无甲状腺功能低下病人中血清T4浓度<77nmol/L(阳性)者占
是以真阳性率(灵敏度)为纵坐标,假阳
病人
非病人
性率(1-特异度)为横坐标所做的曲线,
以表示灵敏度血糖与值特异度之间相互关系的一
种方法。该曲线最接近左上角的一点或曲
线左上方拐点处定为最佳截断值,即最佳
判断标准病,人 因为此点非灵病人敏度和特异度均较
高,假阳性和假阴性之和最小。 血糖值
甲状腺低下的筛检与诊断P409
真阳性率(灵敏度)=(a/a+c)*100%,假阳性率=(b/b+d) *100% 此时:灵敏度= 18/27*100% = 66.7%,假阳性率=(1/93)*100%=1.1%
流行病学第七章 (疾病筛检和)诊断试验的评价
2.筛检方法手段不同
单项筛检(single screening) 用一种筛检试验检查某一种疾病。 多项筛检(multiple screening) 同时用多种筛检试验检查某一种疾病。
四、筛检应用原则与条件
20世纪60年代至90年代,世界范围的一些学
者和组织机构制定了一些应用筛检的原则和标准,使筛 检不断完善和发展, 1999年Crossroads提出的筛检计划的原则和条件 ,其主要涉及被筛检的疾病和人群,筛检的条件和设备
,干预和随访, 社会伦理四个方面。
四、筛检应用原则与条件
• • • • •
• • • • •
(十个方面)
应用于该地区当前重大的公共卫生问题 有连续而完整的筛检计划 对所筛检疾病的自然史有足够的了解 有可识别的早期客观指征(如检查与测量的标志) 筛检试验方法快速、简便、准确、可靠、可行、安全、 经济、群众易于接受 费用是低廉的,预期有良好的筛检效益 筛检发现阳性者(病人及高危人群)应予进行及时有 效进一步检查、干预和治疗 该病具有较长的潜伏期和领先时间,经有效的治疗能 恢复健康 具备条件(疾病监测、预防、治疗、干预、健康教育、 咨询和社会支持) 目标人群接受,并可从生理、心理和社会生活等方面 获益。对人群不应产生负面影响,筛检者及其筛检结 果的保密措施
筛检(screening)便是在这样的背景下发展起 来的一种流行病学研究方法,它是描述性研究的 一个组成部分,属观察性研究范畴。
一、筛检概念
1951年美国慢性病委员会正式提出了
筛检定义:也叫筛查。
是通过快速简便的试验、检查或其他措施, 在大量表面无病的人群中去发现未被识别的、 可疑的病人或有缺陷的人。
筛检试验与诊断试验的分别
筛检试验
筛查与诊断试验
*需要与研究疾病鉴别的其他病人 *健康人
14
4 样本大小的计算 样本量有关的因素 ◈灵敏度 ◈特异度 ◈显著性检验水平 ◈容许误差
15
16
n (u / )2 p1 p
式中:
n:表示所需样本量
u :正态分布中累计概率等于α/2时的u值,
δ :表示容许误差
P : 为待评价筛检或诊断方法的灵敏度和特 异度的估计值,计算病例组时P为灵敏度,
Kappa N ( A D) (R1C1 R2C2 ) N 2 (R1C1 R2C2 )
33
表2 Kappa值判断标准
Kappa值 <0
0~0.2 0.21~0.40 0.41~0.60 0.61~0.80
0.81~1
一致性强度 弱 轻
尚好 中度 高度 最强
34
表3 某病患病状况与筛检结果的关系
假阴性率 C 100% AC
26
⒉特异度与假阳性率
◈特异度(specificity)(真阴性率)
实际无病按该诊断标准被正确地判为无 病的百分率
特异度 D 100% BD
◈假阳性率(false positive rate)(误诊率、第一类错 误)
即实际无病,但根据该诊断标准被定为 有病的百分率
假阳性率
包括
◆灵敏度与假阴性率 ◆特异度与假阳性率 ◆正确指数 ◆似然比 ◆符合率
25
⒈灵敏度与假阴性率
◈灵敏度(sensitivity)(真阳性率) 即实际有病而按该筛检标准被正确地
判为有病的百分率
灵敏度 A 100% AC
◈假阴性率(false negative rate)(漏诊率、 第二类错误) 即实际有病,但根据该筛检标准被定 为非病者的百分率
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章筛检与诊断试验的评价主要内容概述设计与实施筛检与诊断试验的评价提高筛检与诊断试验效率的方法筛检与诊断试验中的常见偏倚二级预防第一节概述筛检 screeningo运用快速、简单的检验、检查或其他方法,从健康人群中早期发现可疑病人,即区分出表面健康但可能有病的个体诊断 diagnosiso医务人员通过详尽的检查及调查等方法收集信息,经过整理加工后对患者病情的基本认识和判断,目的在于区分病人与可疑有病但实际无病者筛检的分类根据筛检对象范围整群筛检(mass screening): 对一定范围的人群进行筛检目标筛检(targeted screening): 对特定暴露人群或高危人群进行筛检根据所用方法数量单项筛检(single screening): 用一种筛检试验,筛查一种疾病多项筛选(multiple screening): 同时应用多种方法进行筛检,可同时筛检多种疾病筛检试验实施原则体现当地重大公共卫生问题(患病率不是很低)有确诊的方法与条件对确诊的患者和高危人群进行有效地治疗与干预了解疾病的自然史筛检的疾病或因素有可供识别的早期症状或指标快速、简便、经济、可靠、安全、有效,易接受足够的人力、物力、财力和良好的社会环境条件有连续完整地筛检计划,能按计划进行考虑成本-收益问题符合伦理,有益无害,尊重隐私,公平公正第二节设计与实施1、确定金标准金标准 golden standard:当前医学界公认的诊断疾病的最可靠方法,也称标准诊断、标准试验、参考标准等(金标准不是一直不变的)如:活检、手术发现、微生物培养、尸检、特殊检查、影像诊断、临床综合判断、长期随访结果等2、选择研究对象总体原则:能代表诊断试验可能应用的目标人群阳性组(即病例组):包括所研究疾病各种临床类型的病例,各种病情程度、典型和不典型、有并发症和无并发症、治疗过与未治疗过阴性组(即对照组):金标准证实没有目标疾病的个体,最好患有与该病易混淆的其他疾病常见的对象选择方式1、选择经金标准确诊后的病例以及对照,然后进行诊断试验2、选择一组样本人群,同时接受金标准及诊断试验的检测选择研究对象的注意事项需考虑性别、年龄等因素的影响,使病例组和对照组具有可比性需注意试验人群应同时进入研究,同时接受金标准和待评价诊断试验的检测,以避免偏倚的发生3.盲法判断与比较结果盲法判定与比较结果,避免过高或过低估计诊断试验与金标准的符合程度,避免观察者偏倚,以保证比较结果的真实性ROC曲线:受试者工作特征曲线,以灵敏度为纵坐标,1-特异度为横坐标第三节诊断试验的评价评价内容1、真实性:诊断试验能在多大程度上进行正确诊断,反映出真实的情况2、可靠性:重复进行诊断试验的稳定性3、收益:应用诊断试验后,判断正确的可能性;新确诊病例的数量及预后状况;卫生经济学评价诊断试验结果整理一、真实性 validity(评价诊断试验要写出灵敏度跟特异度!)也称效度、准确性(accuracy),指与金标准相比,测量值与实际值相符合的程度,即在一次试验中能多大程度地测量出真实情况1、灵敏度和假阴性率(只与病人组有关)灵敏度 sensitivity:实际有病的人被正确诊断为有病的比例,说明诊断试验发现病人的能力,也称真阳性率 true positive rate 实际有病而未被诊断出的人即为假阴性 假阴性率 false negative rate :也称漏诊率灵敏度+ 假阴性率 = 12、特异度与假阳性率(只与未患病的组有关)特异度 specificity : 实际无病的人被正确诊断为无病的比例,说明诊断试验确定非病人的能力(不误诊),也称真阴性率 true negative rate实际无病而被诊断为有病的人即为假阳性假阳性率 false positive rate :也称误诊率特异度 + 假阳性率 = 13、似然比 likelihood ratio ,LR (诊断/金标准的结果)是灵敏度和特异度的复合指标,即有病者中得出某一诊断试验结果的概率与无病者得出这一概率的比值全面反映了诊断试验的诊断价值,非常稳定似然比只与某一试验自身的性质相关,计算只涉及灵敏度与特异度,不受患病率的影响阳性似然比 positive likelihood ratio反映了诊断试验正确判断阳性的可能性是错误判断阳性可能性的倍数比值越大,试验结果阳性为真阳性的概率越大阴性似然比 negative likelihood ratio反映了诊断试验错误判断阴性的可能性是正确判断阴性可能性的倍数比值越小,试验结果阴性为真阴性的概率越大4、正确诊断指数(约登指数越大,真实性一定越大)也称约登指数 Youden index ,简称r ,是诊断试验正确判断出病例与非病人的总能力 正确指数 = (灵敏度 + 特异度) - 1= 1 – (假阴性率 + 假阳性率)指数越接近1(或100%),真实性越好二、可靠性 reliability也称信度、精确度precision ,是指在相同条件下重复某诊断试验获得结果的稳定程度,因此也称可重复性 repeatability1、标准差和变异系数1LR +==-真阳性率灵敏度假阳性率特异度1LR --==假阴性率灵敏度真阴性率特异度标准差 standard deviation变异系数 coefficient variance, CV变异系数=(标准差/算术均数)×100%2、符合率 agreement rate也称一致率 consistency:同一批研究对象两次诊断结果均为阳性与阴性的人数之和占全部受试对象的比例是粗略的观察一致性,受机遇chance影响3、一致性检验(Kappa分析)(具体的不要记住,但是原理要了解)观察一致性 observed agreement, PoPo = (a+d) / N = %机遇一致性 agreement of chance, PcPc = (r1c1/N + r2c2/N) / N = %非机遇一致性 potential agreement beyond chance= 1 – Pc = %实际一致性 actual agreement beyond chance= Po – Pc = %Kappa值 = 实际一致性/非机遇一致性掌握:Kappa取值范围为-1~+1,-1:完全不一致0:观察一致率完全由机遇所致+1:完全一致影响可靠性的因素研究对象的生物学差异试验因素导致的差异观察者的变异应用提示:遵循SOP,注意试剂的标准化、仪器的矫正、环境条件的控制,工作人员的培训三、诊断试验的收益1、预测值 predictive value, PV应用诊断试验后,凭结果来估计受检者患病和不患病可能性大小的指标◎阳性预测值 positive predictive value, PPV试验阳性者真正有病的可能性诊断试验金标准合计+-+a b a+b-c d c+d合计a+c b+d N◎阴性预测值 negative predictive value, NPV试验阴性者真正没有病的可能性预测值与患病率、灵敏度、特异度的关系掌握!!灵敏度、特异度与预测值的关系一般来说,患病率相同时:灵敏度越高,则阴性预测值越好,临床医生更有把握判断阴性结果为非病人(灵敏度高,正确发现病人的能力就高,漏诊的就少,假阴性的就少,阴性预测值分母就小)特异度越高,则阳性预测值越好,临床医生更有可能判断阳性结果为病人(特异度高,正确发现非病人的能力就好,那么误诊的就少,阳性预测值分母就小)预测值与患病率的关系灵敏度和特异度不变的情况下:阳性预测值随着人群患病率的升高而升高阴性预测值随患病率的升高而降低2、检出新病例及其预后从理论上讲,诊断试验灵敏度高,发现的(新)病例多,并且早发现、早诊断、早治疗带来的治愈率、阴转率和生存率等相应较高,病死率和死亡率应该相应较低可以通过诊断出病例的多少和预后来评价诊断试验的收益3、卫生经济学效果评价成本效果分析(cost-effectiveness analysis)指研究投入的费用及其获得的生物学效果成本效益分析(cost-benefit analysis)指研究投入的费用及其获得的经济效益比较成本效用分析(cost-utility analysis)指研究投入的成本与取得的生命质量改善之间的分析评价方法四、确定诊断试验的界值1、诊断试验的指标主观指标:被诊断者主述客观指标:仪器测定半客观指标:诊断者主观感知应尽量采用客观指标2、确定界值的原则试验截断值 Cut-off point理想的截断值:病人和正常人的生理参数能够完全分开实际情况:以计量资料性质的指标进行测量时,病人和正常人的参数范围常相互交叉、重叠界值降低界值,假阳性增加,灵敏度提高但特异度下降提高界值,假阴性增加,特异度提高但灵敏度下降(1)选择高灵敏度诊断试验某种疾病的早期发现、早期诊断将使病人获得有效治疗和康复,漏诊或延误诊断将会造成严重后果有现成的治疗方法可以利用从伦理和经济的角度可以接受特异度降低,假阳性增多,导致需要进一步确诊的可疑病例增多,从而增加检查成本。
这类疾病如结核病、梅毒和何杰金氏病等。
(2)选择高特异度诊断试验误诊将会对病人造成严重的心理、生理和经济上的影响对于治疗效果不理想的疾病,且确诊和治疗费用又比较昂贵的疾病疾病预后不严重,且现有治疗方法不理想,如肝癌等(3)选择灵敏度和特异度均较高的诊断试验如果某种疾病漏诊和误诊同等重要,应将试验阳性界值定在灵敏度和特异度均较高的位置,或正确诊断指数最大处3、确定诊断试验界值的方法临床判断法如血压收缩压≥140mmHg为异常,舒张压≥90mmHg为异常统计学方法均数±标准差百分位数法ROC曲线法受试者工作特性曲线Receiver operator characteristic curve, ROC诊断试验以计量资料表达结果时,可设定多个不同的临界值,从而计算出一系列的灵敏度/特异度对子,以灵敏度为纵坐标,以(1-特异度)为横坐标,所绘制的曲线即为ROC曲线ROC曲线的应用(左上角的那个一般为界值)1. 用于最佳诊断试验分界值的选择2. 比较两种或两种以上诊断试验的诊断价值第四节提高试验效率的方法一、选择患病率高的人群灵敏度和特异度不变时,患病率与阳性预测值成正比二、联合试验 multiple test平行试验(并联)系列试验(串联)联合试验提高灵敏度或特异度1、并联试验(parallel test)/ 平行试验采用几种方法检测疾病,凡有一项检测为阳性者即判为阳性,所有检测均为阴性才判为阴性2、串联试验(serial test)/ 系列试验采用几种方法检测疾病,只有全部检测均为阳性者才判为阳性,凡有一项检测结果为阴性即判为阴性并联试验:提高灵敏度,降低特异度,代价是误诊率增加(临床上常用,因为灵敏度的改变更为明显)串联试验:提高诊断的特异度,减少误诊,其代价是灵敏度降低,漏诊率增加第五节筛检与诊断试验中的常见偏倚筛检与诊断试验特有的偏倚领先时间偏倚由于筛检的时间和临床诊断时间之差,被解释为因为筛检而延长的生存时间(有可能不检查出来也能活那么久,有潜伏期)病程长短引起的偏倚病程短的疾病被筛检出的可能性低于病程长的疾病如:筛检可改善肿瘤等结局的假象,但病程长生长缓慢的肿瘤患者比生长快的肿瘤患者生存期长小结筛检与诊断试验的比较筛检与诊断试验的设计原理评价指标的意义及计算方法:灵敏度、特异度、预测值、似然比、正确诊断指数、一致率灵敏度、特异度、患病率与预测值的联系试验界值的确定:ROC曲线并联试验、串联试验与灵敏度、特异度筛检与诊断试验的偏倚。