第八章 诊断试验的设计与评价(2学时)
诊断试验与评价
个性化诊断与精准医疗
个性化诊断
根据患者的基因组、表型等特征,为其量身定制最佳治疗方案,提高治疗效果和 患者生存率。
精准医疗
以个体差异为基础,结合现代医学技术,对疾病进行精确的诊断和治疗,实现医 疗服务的个性化和精细化。
人工智能在诊断试验中的应用
人工智能辅助诊断
远程诊断
利用人工智能技术对医学影像、实验 室数据等进行自动分析和识别,提高 诊断的准确性和效率。
理想的诊断试验应该是操作简便、快速且成本效益高。
疾病谱的变化与新技术的应用
疾病谱的变化
随着疾病谱的变化,诊断试验需要不断更新和改进以满足临床需求。
新技术的应用
新技术的发展为诊断试验提供了更多的可能性,如分子诊断、基因诊断和影像学诊断等。
Part
05
诊断试验的未来发展
新技术与新方法的研发
基因组学技术
诊断试验与评价
• 诊断试验概述 • 诊断试验的设计与实施 • 诊断试验的评价指标 • 诊断试验的局限性 • 诊断试验
诊断试验概述
定义与目的
定义
诊断试验是对患者进行疾病诊断或筛 查的实验手段,通过检测患者的血液、 尿液、组织或其他生物样本,以确定 患者是否患病以及患病类型。
确定诊断目的
明确诊断试验的目标,例 如确定某病种的早期诊断 方法、鉴别诊断或病情监 测等。
数据分析与解释
对试验数据进行统计分析, 得出结论,并对结果进行 解释和评估。
选择受试者
根据诊断目的选择合适的 受试者,确保受试者具有 代表性,并遵循伦理原则。
样本采集与处理
按照标准操作程序采集和 处理样本,确保样本质量 和一致性。
目的
诊断试验旨在为医生提供关于患者健 康状况的准确信息,帮助医生做出准 确的诊断,制定合适的治疗方案,并 监测患者的病情进展和治疗效果。
卫生经济学教学大纲
《流行病学Ⅱ》教学大纲供临床医学专业用一、课程基本信息课程名称(中、英文):流行病学,Epidemiology课程号:504081020课程属性:选修先修课程:卫生统计学学分:2总学时:32 理论学时 22 实验(实践)学时 10二、教学目的及要求流行病学是预防医学中的一门主导课程,也是预防医学各学科的方法学基础。
本课程通过课堂讲授、讨论、实习、自学等方式进行教学。
要求学生通过本课程的学习,能够掌握流行病学的基本知识、基础理论和基本技能;能够运用流行病学的观点和方法开展人群健康和疾病调查、病因研究、社区预防保健服务以及疾病预防效果评价工作。
三、教学内容(下划双线示掌握内容,下划单线示熟悉内容;句尾的“*”示教学难点):第一章绪论流行病学的定义及基本内涵,流行病学的重要观点*,流行病学的基本研究方法。
流行病学的应用,了解流行病学与临床医学的关系及临床以学生学习流行病学的意义,了解流行病学发展简史及面临的挑战和展望。
第二章疾病的分布常用的疾病频率测量指标的概念、用途及注意事项,描述疾病流行强度的术语。
熟悉疾病三间分布的描述内容、描述方法及形成原因,描述疾病分布的主要概念。
了解率和比的概念,移民流行病学的概念及用途。
第三章病因与病因推断病因概念*,病因研究的方法,因果关联的推断标准*。
因果关联的方式。
了解病因模型,了解病因的分类。
第四章描述性研究现况研究的概念、种类,设计与实施*,抽样调查样本量的估算方法,现况研究的资料整理与分析,现况研究中常见的偏倚及控制。
普查与抽样调查的优缺点,现况研究的特点,生态学研究的方法、优点和局限性。
了解调查表的编制,生态学谬误的概念及产生原因。
第五章队列研究队列研究的概念、基本原理与特点,研究对象(暴露人群、对照人群)的选择方式,队列研究的设计与实施*、相关指标(率、相对危险度、归因危险度等)的计算及其意义,队列研究常见偏倚及其控制方法。
队列研究的用途和类型,队列研究的优缺点。
诊断性试验的设计与评价
二、评价诊断性试验的条件
1。标准诊断:
疾病的诊断,必须有标准诊断(即金标准, gold standard,或参考标准,reference standard)。标准诊断是目前公认的诊断方 法,如:活检、手术、尸检、特殊检查或长 期随访的结果
3
二、评价诊断性试验的条件
2。诊断方法的对比:
评价新的诊断性试验,必须与标准诊断方法 进行比较。
急性心肌梗塞
是
否
≥80u
215
16
CPK <80u
15
114
230
130
SEN=a/(a+c)=215/230=0.93
SPE=d/(b+d)=114/130=0.88
+LR=SEN/(1-SPE)=0.93/(1-0.88) =7.75
20
➢ 再一步分析,则可计算不同水平的阳性似然比:
CPK
AMI(+)
m N1= a2P1(1-P1)/δ2 m N2= a2P2(1-P2)/δ2
显著性水平μа取0.05 μ0.05=1.96(双侧检验) 诊断性试验的允许误差δ一般定在0.05-0.10
18
五、似然比的临床应用
可用于临床计算患病的概率,便于更准确地对患者作出 诊断。
例如:对怀疑急性心肌梗塞患者,作肌酸磷酸激酶 (CPK)测定,根据其结果可计算似然比。爱丁堡皇家 医院将怀疑心肌梗死者360例收入病房,检测CPK,由一 位不知CPK结果的医生根据心电图和尸检结果判断有心 肌梗死者230例,无心梗者130例,测定值如下:
阴性者为 c 用标准诊断方法,判断无该病的例数为 b+d 无该病的受试者中,诊断性试验阳性例数为
b,阴性例数为 d
诊断实验的研究与评价
3)再检验其血清肌酸磷酸酶(CPK)>80单位,此时阳性似然比为7.75。
其验前比=0.9167/(1-0.9167)=11.0048;验后比=11.0048×7.75=85.25。
• 验后概率=85.25/(1+85.25)=0.988 经过询问症状,心电图检查及血清CPK检查,该病人患冠心病的可能性为98.8%,因
•
粗一 致 a率 d 10 % 0 abcd
调整 1 一 a 致 a率 dd 4 a ba cc db d
4.似然比(likelihood ratio LR)
综合了灵敏度和特异度的信息,其含义为:病人 中出现某种检测结果的概率与非病人中出现相应结 果的概率之比,它表明某项试验所确定的阳性界值 (截点)能否良好地区分真阳性和假阳性。根据似 然比可以判断诊断试验阳性或阴性时患病的概率, 以助临床医生的诊断决策。
•
误诊率B 10% 0 BD
正确诊断指数(Youden指数)
一项诊断方法发现真正的病人和非病人的总能力。
约登指A 数=(灵D敏度+ 特异度 )-1
或 约登A+指C数 = B+D +
-1
将灵敏度和特异度合并为一个指标,可更全面地评价、
比较各种筛检试验的真实性。 指数愈大,反映的真实性也愈大。
约登指数的标准误为
ROC Curve
1.00
.75
Se ns it iv ity
.50
.25
0.00
0.00
.25
.50
.75
1.00
1 - Specificity
图2--ROC曲线图
第四节 诊断试验的评价
用某些指标对诊断试验的真实性、 可靠性以及效益进行评价。
《诊断试验与评价》课件
课程材料将提供相关书籍和论文,参与课程的学生可免费获取。
试验设计与实施
试验设计原则
了解实验设计的基本原则是 设计可靠、有效பைடு நூலகம்试验的前 提。
测量与观察
选择适宜的测量和观察方法 可以提高数据的精度和准确 性。
数据收集与处理
选择合适的数据处理方法, 可以得到可靠和有效的数据 集。
试验评价与分析
1 试验结果分析
学会分析试验数据,进而了解试验的效能和可靠性指标。
2 数据可靠性与有效性评价
利用统计分析方法对数据的可靠性和有效性进行评估。
3 试验结论绘制与报告
学习如何根据结果生成结论,并准备报告和相关文献。
实践案例分析
1
可靠性试验案例
分析某行业产品的寿命,评估其可靠性和使用寿命。
2
效能试验案例
诊断试验与评价
本课程介绍试验的设计、实施和评价方法,旨在提高试验设计者和实施人员 的专业技能,对于进行试验评价和分析的学者和专家也有所裨益。
课程介绍
课程目标
通过本课程,学生将深入了解诊断试验的设计、实施和评价方法,并掌握相关的数据处理和 结论绘制方法。
课程大纲
本课程主要分为试验设计与实施、试验评价与分析、实践案例分析和课程总结四个部分。
通过对比两种产品的相关性能参数,评估其性能的优缺点。
3
试验结果分析案例
基于实验数据,对某项技术的优缺点进行分析和总结,得出结论。
课程总结
重点回顾
对课程中重点内容进行复习,回顾课程的核心内容。
学习收获
总结课程所获的专业知识和技能,学以致用。
学习资源推荐
提供相关书籍、文献和网站等资源推荐,进一步拓展知识面。
第八章筛检与诊断试验的评价ppt课件
筛检试验阳性 确诊患该病
筛检试验与诊断试验的区别
对象 目的
筛检试验
健康人或表面健康的人 早期发现可疑患者和高危人群
诊断试验
患者或可疑病人 明确判断可疑患者是否患病
要求 费用 处理
意义
快速、简便、高灵敏度
科学、准确、特异性高
低廉
一般费用较高
阳性者须进一步诊断试验或干预,结果阳性者给予治疗和干预,
阴性者定期再筛检。
Sp =d/(b+d) × 100%
是否 阳性 a b 阴性 c d
(2)假阳性率 (false positive rate,FPR)
————又称误诊率,指诊断试验将实际无病的人错判为 患者的概率。
FPR = b/(b+d) × 100% =1-Sp
是否 阳性 a b 阴性 c d
灵敏度与特异度有何关系?
本章内容
• 筛检与诊断的定义和区别 • 筛检与诊断试验的评价指标 • 筛检与诊断试验的设计与实施 • 如何提高筛检与诊断试验的效率 • 筛检与诊断试验中的偏倚
第一节 概 述
一、概 念
(一)筛检(screening)
筛检是运用快速、简便的检验同那些真正无病或无缺陷的人区别开来。
特异度(%) 8.8 25.5 47.6 69.8 84.1 92.5 96.9 99.4 99.6 99.8
100.0 100.0 100.0 100.0
灵敏度和特异度的关系
➢当试验方法和阳性标准固定时,每个诊断试验的灵 敏度和特异度是恒定的。
➢改变诊断试验正常和异常的临界点会影响灵敏度和 特异度。Se升高,Sp就降低; Sp升高,Se就降低。
机遇一致性(Pc)
( r1c1 N
8.《流行病学》(第9版)教学大纲(适用临床医学等专业)
《流行病学》教学大纲epidemiology一、课程说明课程编码 NN101412 课程总学时20(理论总学时20/实践总学0时)周学时(理论学时2/实践学时0)学分2课程性质限制性选修课适用专业临床医学、临床医学(专升本)、全科医学、眼视光(七年制)、眼视光学(专升本)专业1.教学内容与学时安排表2.课程教学目的与要求:流行病学是预防医学中的一门主导课程,也是医学各学科的方法学基础。
随着临床流行病学和循证医学等兴起,使得流行病学也日益成为临床医学重要的基础性学科。
本课程的教学目的主要是培养学生掌握流行病学基本理论、基本知识、流行病学方法的选择与应用,并了解相应的扩展知识和新进展知识,为临床专业学生学习预防医学及培养防治结合型人才奠定流行病学理论基础,也为今后在临床实际工作中或其他有关学科中运用流行病学的理论和方法奠定基础。
本课程教学要求是根据教学大纲的要求,重点讲解基本理论和基本知识,同时注意传授一定比例的扩展知识、新进展知识和实际应用知识,加强学生创新能力的培养,开拓思路、启发思维,调动学生的学习积极性。
内容精练,条理清楚,合理使用教学设备和教具。
并根据本章节的特点,结合课时安排规定学生必要的自学内容。
3、本门课程与其它课程关系:临床医学各学科中,凡涉及专业问题的调查设计、资料的获取和数据资料的分析及其解释,都要以流行病学方法为基础。
流行病学应用广泛,涉及面宽,几乎涉及社会科学、自然科学和医学科学的各主要学科。
流行病学是伴随卫生统计学、微生物学和免疫学以及传染病学发展起来。
现在除基础医学和临床医学外,流行病学与社会医学、心理学及一系列预防医学学科,包括卫生管理学也建立了密切的联系。
在非传染病研究上与病理学、生化学、遗传学、分子生物学、临床医学相应各科及预防医学有关学科关系密切。
研究健康流行病学与生理学、生化学、医学心理学、社会医学等有关。
4、推荐教材及参考书:1.李立民主编.《流行病学》(第四版).北京:人民卫生出版社,19992.曾光主编.现代流行病学方法与应用.北京:北京医科大学中国协和医科大学联合出版,19943.谭红专主编.现代流行病学.北京:人民卫生出版社,20014.赵忠堂主编.流行病学研究方法与应用.北京:科学出版社,20005.林果为,沈福民主编.现代临床流行病学.上海:上海医科大学出版社,20006.王家良主编.临床流行病学.北京:人民卫生出版社,20007.MacMahon B, Trichopoulos D. Epidemiology-Principles and Methods, Second edition.Boston, New York, Toronto and London: Little, Brown and Company,19968.施侣元主编,《流行病学》,人民卫生出版社,20039.谭红专主编,《现代流行病学》,人民卫生出版社,200810.叶临湘主编,《现场流行病学》,人民卫生出版社,200911. 王建华主编,《流行病学》,人民卫生出版社, 200812.王建华主编,《流行病学》,人民卫生出版社, 201313.沈洪兵主编,《流行病学》,人民卫生出版社, 20185、课程考核方法与要求:本课程考核方法采用期末闭卷考试方式进行。
诊断试验设计、评价与应用
第十九页,共134页。
第二节 诊断试验的设计
第二十页,共134页。
一、确定金标准
金标准(gold standard)
是当前临床医学界公认的最准确和最可靠的标准诊 断方法,是区分有病与无病的依据。
但从安全性、经济性和复杂性等角度综合考虑,金标准 不一定是最好的方法。
第四十三页,共134页。
3.正确率
正确率(accuracy,Acc,Ac或π)也称为准 确度、符合率、总符合率或一致率。指该诊断 试验的全部真阳性者和真阴性者占受试对象总 和的比例,反映了诊断试验结果与金标准实验 结果符合或一致的程度。
第八页,共134页。
诊断学的发展(中国)
我国是世界上最早形成系统医学的国家之一。公元 前5世纪,“四诊”已广为流传。
公元前3世纪,我国最早的医学论著《内经》已有 关于诊法与致病机制的阐述。 如“善诊者,察色按脉,先别阴阳;审浊清而知 部分;视喘息,听声音而知所苦;关权衡规矩而 知病所主;按尺寸,观浮、沉、滑、涩而知病所 生”。
由表可见,随血糖浓度的升高,敏感度下降,而特异度升高,反之,则相反。因此,敏感度和特 异度中提高任何一个值都是以牺牲另一个值为代价的。选择其中一组的血糖浓 度作为划分正常和异常的诊断参考值,称为临界值。当诊断参考值定为110mg/dl时,此 时域值的敏感度和特异度之和为最高,即漏诊和误诊之和最低。
敏感度与特异度均很高的理想诊断试验,在实 际的临床诊断中通常是很少有的。一个诊断性 试验的敏感度和特异度之间的关系是彼消此长 的关系,其中一个升高时,另一个必然降低。
下面是一个说明这种关系的例子:利用检测餐 后2小时血糖水平来诊断糖尿病,不同浓度血 糖的敏感度和特异度的变化见表11-3。
《循证医学》教学大纲
了解:疾病预后证据的质量水平。
理解:熟悉如何根据病例提出问题及预后的检索策略。
掌握:预后证据的真实性评价方法;判断预后证据的临床意义和统计学意义;如何将预后证据用于实际的患者。
四、考核方式:考试(毕卷)
五、备注:无
教学内容
第一节 应用防治性研究证据的循证医学步骤
第二节 提出患者需要解决的临床问题
第三节 如何根据问题检索相关的最佳临床研究证据
第四节 如何评价检索出的研究证据
一、 防治性临床研究的特殊性
二、防治性临床研究的类型
三、评价防治性研究证据的科学性
四、研究结果的评估
第五节 如何应用评价后的证据解决患者的问题
考核要求
了解:循证医学的发生的背景、发展趋势。
理解:学习和实践循证医学的目的和意义及实践循证医学可能存在的问题和困难。
掌握:循证医学的基本概念及循证医学实践的基本步骤和方法。
第二章 怎样在临床实践中发现和提出问题(1学时)
教学目的与要求
本章的教学目的是使学生了解提出问题的重要性和问题的来源,。
掌握:诊断试验真实性证据的意义和应用;实施循证诊断的步骤。
第九章 防治性研究证据的评价和应用(2学时)
教学目的与要求
本章的教学目的是使学生了解防治性临床研究的科研设计方法和类型,熟悉循证医学方法解决患者治疗问题的步骤,掌握相对危险度(RR)、相对危险度减少(RRR)绝对危险度减少(ARR) 、需要治疗的患者数(NNT)等基本概念,掌握防治性研究资料真实性评价原则,能结合自己患者的病情应用循证医学方法解决问题。
六、病因学和不良反应研究的结果是否符号流行病学的规律
七、 病因致病和不良反应发生的生物学依据是否充分
诊断试验与评价
诊断性试验 患者 合计
非患者
+ 合计
188 62 250
97 153 250
285 215 500
14
计算各指标如下:
灵敏度 特异度 阳性似然比 阴性似然比 假阳性率 假阴性率 阳性预测值 阴性预测值
188 250 153 250
100 % 75 . 2 % 100 % 61 . 2 % 97 ) 1 . 94 250 153 ) 0 . 41 250 0 . 388 38 . 8 % 24 . 8 %
3.对研究对象进行平行盲法诊断
在进行诊断时,应该使诊断试验的操作者及报告者处于盲态,并进行 平行诊断,以避免主观因素及系统误差对诊断结果的干扰。 4.确定判断阳性和阴性的截断点 即确定正常值范围作为划分阳性和阴性的依据。
3
5. 根据临床试验的结果及确定的截断点,整理出病例组中的阳性人数 和对照组中的阳性人数如表,计算相关的评价指标进行分析
25
四、提高诊断试验效率的方法 在临床试验中,对某一种疾病的诊断常常不只根据一个诊断试验的结 果来判断,特别是当这种诊断试验的准确性不够高时,就需要两个或多 个诊断试验联合起来诊断,以提高诊断的准确性。诊断试验的联合使用 主要有串联和并联两种形式。 (一)串联(series) 串联是指当一系列的诊断试验均为阳性时, 才考虑受试者是患者,只要有一项试验的结果为阴性,都将受试者划归 为非患者。串联作用可以提高特异度,增加阳性预测值,但降低了灵敏 度和阴性预测值,使得漏诊率增加。 (二)并联(parallel)是指患者同时作几个诊断试验,只要有一个 诊断试验的结果是阳性就将受试者划规为患者,而每个试验的结果都是 阴性时,才认为受试者为非患者。并联联合试验可以提高诊断的灵敏度 和阴性预测值,但是降低了特异度和阳性预测值,使得误诊率增加。 在临床诊断中中,考虑几个诊断试验是串联使用还是并联使用,应 该根据疾病的治疗效果、医疗费用、副作用等情况进行选择。如一种疾 病治疗效果好、医疗费用又低,就应该提高诊断的灵敏度,减少漏诊, 尽量的筛查出患者,使病人得到及时的治疗,就可以采用并联的方法。 相反治疗效果差,医疗费又高,则可以采用串联的办法。
第八章诊断试验设计与评价2学时
“金标准”的特性
1. 准确性高:用低成本且比较安全的诊断技术去代替昂 贵而危险的“金标准”可能导致疾病错误分类情况的 发生,即将病人判断为非病人,将非病人判断为病人
2. 临床可行性差:通常具有精确、复杂、昂贵和危险的 特性
3. 相对性:任何一个“金标准”只是特定历史条件下医 学发展的产物,它不具有恒真性;目前所使用的所谓 金标准也是相对的;在没有更好的标准的时候,一般 标准也是金标准。
某卫生机构为了评价物理检查在急性化脓性咽炎诊断中的真实性, 以咽拭子培养甲组乙型溶血性链球菌作为“金标准”,
物理检查
阳性 阴性 合计
病人
54 11 65
非病人
21 142 163
合计
75 153 228
阳性似然比=(54/65)/(21/163)=6.45
阴性似然比=(11/65)/(142/163)=0.19
n
0.028
5.7 3 54
对照组样本量估计
1.926 0.73 (1 9 0.73 ) 9
n
0.028
5.1 9 60
[四] 评价结果的整理
筛检试验 阳性 阴性 合计
表9-1 筛检试验评价
金标准
患者
非患者
真阳性 A 假阳性 B
假阴性 C 真阴性 D
C1
C2
合计
R1 R2 N
例:某病患病状况与诊断结果
阳性似然比是指真阳性率与假阳
性率之比,是诊断试验中阳性结 果在患者中出现的概率与在非患
真阳性率 灵敏度 LR假阳性1率 特异度
者中出现的概率之比。其计算公
式为
阴性似然比是指假阴性率与真阴 性率之比,是诊断试验中阴性结 果在患者中出现的概率与在非患 者中出现的概率之比。
诊断性试验的设计与评价共36页文档
53、人们通常会发现,法律就是这样 一种的 网,触 犯法律 的人, 小的可 以穿网 而过, 大的可 以破网 而出, 只有中 等的才 会坠入 网中。 ——申 斯通 54、法律就是法律它是一座雄伟的大 夏,庇 护着我 们大家 ;它的 每一块 砖石都 垒在另 一块砖 石上。 ——高 尔斯华 绥 55、今天的法律未必明天仍是法律。 ——罗·伯顿
Thank you
6、最大的骄傲于最大的自卑都表示心灵的最软弱无力。——斯宾诺莎 7、自知之明是最难得的知识。——西班牙 8、勇气通往天堂,怯懦通往地狱。——塞内加 9、有时候读书是一种巧妙地避开思考的方法。——赫尔普斯 10、阅读一切好书如同和过去最杰出的人谈话。——笛卡儿
诊断试验的设计和评价
非金标准对照
阳性
阴性
合计
诊断阳性
40
19
59
诊断阴性
1
512
513
合计
41
531
572
阳性一致百分比 =(40 / 41)x 100% = 97.6%
阴性一致百分比 =(512 / 531 )x 100% = 96.4%
总的一致百分比 = [(40+512) / 572] x 100% = 96.5%
1
41
诊断
阴性 19
512
531
合计
59
513
572
阳性一致百分比 =(40 / 59)x 100% = 67.8%
阴性一致百分比 =(512 / 513 )x 100% = 99.8%
总一致百分比 = [(40+512) / 572] x 100% = 96.5%
例:同样的总一致百分比、诊断效能不同
有病
无病 合计
诊断阳性
44
1
45
诊断阴性
7
168 175
合计
51
169 220
LR+ = 44/51 ÷ 1/169 = 145.8 LR- = 7/51 ÷ 168/169 = 0.14
诊断的准确性评价指标 (定性结果)
地位相当 - 似然比 - 预测值
PPV(Y) > PPV(X) LRy+ > LRx+ NPV(Y) > NPV(X) LRy- < LRx-
44
Mean
SD
45
46Leabharlann Bland—Altman方法
定量分析与定性分析的结合 同时控制系统误差和随机误差
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ua n (1 p) p
公式中n为所需例数,u/2为检验水准所对应的双侧正态分布界值, P为灵敏度或特异度的预期值, 为允许误差。 样本量的估计主要取决于灵敏度、特异度和允许误差(一般0.050.10)三个参数。如果为了排除疾病,需要诊断方法的灵敏度较高; 如果为了确诊疾病,需要诊断方法的特异性较高。 也可用查表法来估计样本含量
(2)诊断指数(约登指数(Youden Index,YI) )
是将灵敏度与特异度相加,反映诊断方法发现病人和 非病人的总的能力,表示诊断试验判断真正患者和非 患者的总能力。 同时考虑灵敏度和特异度的指标 数值越大,真实性越好 DI=灵敏度+特异度-1
(3)符合率(agreement rate) 指诊断试验中真阳性和真阴性之和占总受检人数的比 例。表示观察值与标准值或真实值符合的程度。又称 准确度。 符合率=(A+D)/(A+B+C+D)
筛检试验 患者 阳性
金标准 非患者 假阳性 B 真阴性 D
合计
真阳性 A 假阴性 C
R1 R2
二、真实性
阴性
合计
C1
C2
N
1. 灵敏度(sensitivity):指在“金标准” 确诊的病人中,待评价的诊断试验检测 A 灵敏度 100% 出的阳性人数所占的比例。将实际有 AC 病的人正确判断为患者的能力。真阳 性率 假阴性率(false negative rate,漏 诊率):指在“金标准”确诊的病人 中诊断试验检测出的“阴性”人数所 占的比例。将实际有病的人错误判断 为非患者的比例。
康 临床期
复
易感期
临床前期
残疾、死亡
疾病发生
出现症状
图9-2 疾病自然史与筛检、诊断示意图
筛检试验
诊断试验
开始暴露
临床前可 检查期
诊断 治疗
康 临床期 复
易感期
临床前期
残疾、死亡
疾病发生 图9-3
出现症状 疾病自然史与筛检诊断示意图
图7-4
筛检试验流程图
筛检试验与诊断试验的区别
筛检试验 对象 目的 要求 费用 健康人或无症状的病人 发现可疑病人 病人 对病人进行确诊 诊断试验
多数情况下,患者例数少于非患者例数,故符合率受 特异度的影响大于灵敏度的影响。
筛检试验 患者 金标准 非患者 合计
阳性
阴性 合计
真阳性 A
假阴性 C
假阳性 B
真阴性 D
R1
R2 N
C1
C2
三、诊断试验中正常值临界点的选择
人群中青光眼患者与非青光眼患者眼内压分布
ROC曲线
ROC曲线( receiver operator characteristic curve,受试者工作特征曲线) 的横轴表示假阳性率 (1-特异度),纵轴表示灵敏度,曲线上的任意一个 点代表一项诊断方法的特定阳性标准值相对应的灵敏 度和特异度对子。 表示一个特定的诊断方法对区别特定的患者组与非患 者组样本的检测性能。
二、诊断试验的用途
诊断疾病 筛选无症状的病人 判断疾病的严重程度 估计疾病临床过程及预后 估计对治疗的反应 评价判断治疗效果
三、诊断试验的研究设计程序
1.选择一个“金标准”, 2.用“金标准”去筛选一定数量的患有和未患 有某种疾病的研究对象,分为“病例组(有 病)”与“对照组(无病)” 3.用待评价诊断方法同步地盲法测试二组研究 对象。 4.将所获得的结果与“金标准”的诊断结果进 行比较,用一些特殊的指标来评价诊断方法的 价值(第二节详细讲解)。
金标准 诊断试验 病人 非病人 合计
阳性
阴性
18
2
49
931
67
933
合计
20
980
1000
第二节 诊断试验的评价
诊断方法是对人体无害、操作简便、出结果迅速、 费用低廉,还要考虑诊断方法的真实性、可靠性和 收益三个方面。
一、诊断方法的评价内容
1、真实性(validity)。准确度(accuracy)、效度 (validity)。是指一般测量工具的实际测量结果与真 值(true value)之间的接近程度。在诊断方法的评价 中,真实性是指诊断方法的检测结果与“金标准”的检 测结果的符合程度,用灵敏度和特异度表示。 2、可靠性( reliability )。精确度(precision)、信 度(reliability)和可重复性(repeatability)。是 指在相同条件下针对同一事物,测量工具重复测量其结 果的稳定程度(stability)。在诊断方法评价中,可靠 性是指在相同条件下针对同一研究对象,重复检测其结 果的稳定程度,或一致性(consistency)、重现性。
上诊断试验的诊断价值。
糖尿病试验不同血糖的灵敏度和特异度分布
餐后二小时血糖 (mg/100ml)
70 80 90 100 110 120 130 140 150 160 170 180 190 200
灵敏度%
98.6 97.1 94.3 88.6 85.7 71.4 64.3 57.1 50.0 47.1 42.9 38.6 34.3 27.1
2
例 肿瘤标志物CA19-9是临床上用来诊断胰腺癌的指 标之一,其对诊断胰腺癌的灵敏度估计为77.3%,特 异度估计为73.9%,若设定容许误差δ =0.08,检验水 准 =0.05( u/2=1.96),试问需要多大的样本量才 能具有统计学意义?
试验组的样本量估计
1.962 0.773 (1 0.773) n 53.7 54 2 0.08
LR 假阴性率 1 灵敏度 真阴性率 特异度
某卫生机构为了评价物理检查在急性化脓性咽炎诊断中的真实性, 以咽拭子培养甲组乙型溶血性链球菌作为“金标准”,
病人 物理检查 阳性 阴性 合计 54 11 65
非病人 21 142 163
合计 75 153 228
阳性似然比=(54/65)/(21/163)=6.45 阴性似然比=(11/65)/(142/163)=0.19 说明病人中出现检查阳性的机会是非病人的 6.45 倍;还说明病 人中出现检查阴性的机会是非病人的0.19倍。
第九章
筛检与诊断试验的设计与评价
筛检试验:是运用快速、简便的试验、检查
或其他方法,将健康人群中那些可能有病或 缺陷、但表面健康的个体,同那些可能无病 者鉴别开来。简便、价廉、易被接受。用于疾
病的二级预防
诊断试验:为临床医生选择诊断提供依据。诊 断与鉴别诊断
开始暴露
诊断 治疗 康 复
易感期
表示不同诊断水平的真阳性率对假阳性率的函数关系。
ROC曲线
作用: 1、客观反映灵敏度和特异度之间的关系;
2、正常值临界点的选择;
3、比较两种或两种以上诊断试验的价值
ROC曲线评价方法
以灵敏度和假阳性率为两个轴的取值作的图形; 通常用于测定值为连续或等级数据; 常用于确定最佳临界值,也可用于比较两种和两种以
灵敏度和特异度的关系
都是反映诊断试验准确性的最基本指标 提高一方面水平,会降低另一方面水平 一般选择敏感度和特异度都较高的试验作为诊断依据 根据研究目的,调整灵敏度和特异度来确定临界值 以产生漏诊和误诊之和最小时的数据确定临界值
3、灵敏度与特异度的综合评价
灵敏度与特异度是一个事物的两个方面,存在本质的 联系,不可能截然分开。而且,分别评价灵敏度和特 异度不利于全面把握诊断方法的真实性。 综合评价指标 (1)似然比(likehood ratio, LR) (2)诊断指数(Youden’s index) (3)符合率
金标准
+
目 标 人 群
病人 - 待评价的 方法 + 非病 人 -
评价指标
图7-5 筛检或诊断试验的评价程序
[一]“金标准”的确定
是指目前医学界公认的诊断某种疾病最准确可靠的方 法或手段。 通常,一种疾病有一个“金标准” 常用的金标准包括 病理学诊断(活检、尸检) 外科手术或诊断性操作 特殊的影像学诊断 权威机构颁布的综合诊断标准
[二] 研究对象的选择
总的原则是:研究对象应能代表诊断方法可能应用的靶 人群。
\ 病例组应当包括所研究疾病的各种临床类型:轻、中、 重型,早、中、晚期,典型的和不典型的,有和没有并 发症者,治疗过的与未治疗过的,使病例组对该病的总 体具有代表性,使评价的结果对该病具有普遍的意义。
[二] 研究对象的选择
临床前期
临床期
残疾、死亡
疾病发生
出现症状
图9-1 疾病自然史
如果疾病在临床前期出现一些可以识别的异常特征, 如肿瘤的早期标识物(biomarkers)、血压升高、血脂 升高等,则可使用一种或多种方法将其查出,并对其做 进一步的诊断和治疗,则可延缓疾病的发展,改善其预 后
开始暴露 诊断 治疗
临床前可 检查期
(1)似然比(likelihood ratio,LR)
在诊断试验评价中,特定方法的似然比被界定为:病 人中出现某种检测结果的概率与非病人中出现相应结 果的概率之比,说明病人出现该结果的机会是非病人 的多少倍。 一项诊断效率高的诊断方法应该是真阳性率高,假阳 性率低。这二项之比称为该诊断试验的似然比,似然 比愈大,诊断的价值也愈大。
快速、简便、安全,高灵 复杂、准确性和特异度高 敏度 经济、廉价 花费较高
处理
用诊断试验确诊
严密观察和及时治疗
第一节 诊断试验的研究设计
一、定义
诊断试验(diagnostic test)即给病人做出诊 断所应用的各种实验室检查、医疗仪器检查及其 他方法。 随着医学科学的发展和对疾病认识的不断深化, 新的诊断试验不断出现以代替旧的诊断试验应用 于临床。为了提高诊断水平,应研究和评价这些 新的诊断试验,以确定其能否取代或充实现有的 诊断方法和能否推广。