流行病学诊断性试验
同济大学流行病学-第七章诊断试验和疾病筛检

同济⼤学流⾏病学-第七章诊断试验和疾病筛检第七章诊断试验和疾病筛检第⼀节概述⼀.筛检(screening)1.定义:时间是运⽤快速、简便的实验、检查或其他⼿段,⾃表⾯健康的⼈群中去发现那些未被识别的可以病⼈或有缺陷者。
⽤于筛检的试验成为筛检试验。
筛检是流⾏病学研究⽅法之⼀,属于观察性研究范畴。
2.⽬的:①疾病的早期发现、早期诊断和早期治疗,属于⼆级预防的内容。
如常见的有结核、⾼⾎压、糖尿病、乳腺癌、⼦宫颈癌等。
②检出某种疾病的⾼危⼈群。
⾼危⼈群是指该⼈群发⽣某种疾病的可能性显著⾼于⼀般⼈群。
例如⽣活⽅式关联疾病的吸烟⼈群、运动不⾜的办公室⼯作⼈群等。
近年来还开始了筛检疾病易感基因和有害基因的国内⼯作。
因为这类筛检是针对疾病病因的,故属于⼀级预防。
③传染病和医学相关事件的预防和控制。
主要指⼀些特殊⼈群和职业⼈群中检查和控制传染源或某些医学相关事件的诱因,以保护⼈群的⼤多数免受其伤害。
如对静脉吸毒⼈群艾滋病毒感染标志的筛检等。
3.类型⼈群整群筛检——以整个⽬标⼈群为对象选择性筛检——以群体中的⼀个亚群或有某种特征的⼈群为对象⽬的治疗性筛检——未早发现、早治疗预防性筛检——为了查出某病的⾼危⼈群⽅法单项筛检——如餐后2h⾎糖多项筛检——如胸痛+痰培养筛检肺结核⼆.诊断(diagnosis)1.定义:诊断是进⼀步把病⼈与可疑有病但实际⽆病者区别开来。
他不同于筛检。
因此,诊断对下⼀步治疗有决定意义,诊断正确与否⾄关重要。
⽤于诊断的试验称为诊断试验.第⼆节试验⽅法的评价⼀.实验⽅法评价的程序试验⽅法评价的基本⽅法是与诊断某疾病的⾦标准作盲法和同步⽐较,基本步骤是:(⼀)确定⾦标准(gold standard)1.⽬的:避免发⽣错误分类偏倚,及时病⼈组中不致于混⼊假病⼈(⾮疾病之⼈)和⾮病⼈组中(对照组)不混有真病⼈(所研究疾病的患者)2.⾦标准——是指⽤来分辨病⼈与⾮病⼈的标准评价⽅法。
3.常见的⾦标准①病理学检查(组织活检和⼫体解剖)②外科⼿术发现③特殊的影响学诊断(如⽤冠状动脉造影诊断冠⼼病)④长期随访观察所得到的结果4.对有些诊断困难的疾病,可能按时还没有真正意义上的⾦标准或是因诊断过程复杂,且费⽤昂贵等。
如何撰写高质量的流行病学研究论文第三讲诊断试验准确性研究的报告规范——STARD介绍

如何撰写高质量的流行病学研究论文第三讲诊断试验准确性研究的报告规范——STARD介绍作者:王波, 詹思延作者单位:100083,北京大学公共卫生学院流行病与卫生统计学系刊名:中华流行病学杂志英文刊名:CHINESE JOURNAL OF EPIDEMIOLOGY年,卷(期):2006,27(10)被引用次数:2次参考文献(8条)1.Detrano R;Gianrossi R;Froelicher V The diagnostic accuracy of the exercise electrocardiogram:a meta-analysis of 22 years of research[外文期刊] 19892.Bossuyt PM;Reitsma JB;Bruns DE The STARD statement for reporting studies of diagnosticaccuracy:explanation and elaboration 20033.Bossuyt PM;Reitsma JB;Bruns DE Towards complete and accurate reporting of studies of diagnostic accuracy:The STARD initiative 20034.Begg CB;Greenes RA;Iglewicz B The influence of uninterpretability on the assessment of diagnostic tests 19865.Harper R;Reeves B Reporting of precision of estimates for diagnostic accuracy:a review 19996.Greenes RA;Begg CB Assessment of diagnostic technologies.Methodology for unbiased estimation from samples of selectively verified patients[外文期刊] 19857.Reid MC;Lachs MS;Feinstein AR Use of methodological standards in diagnostic test research.Getting better but still not good[外文期刊] 19958.Lijmer JG;Mol BW;Heisterkamp S Empirical evidence of design-related bias in studies of diagnostic tests[外文期刊] 1999(11)本文读者也读过(8条)1.罗晓敏.詹思延如何撰写高质量的流行病学研究论文第六讲非随机对照试验研究报告规范——TREND介绍[期刊论文]-中华流行病学杂志2007,28(4)2.王波.詹思延如何撰写高质量的流行病学研究论文第四讲随机平行对照试验报告规范——CONSORT介绍[期刊论文]-中华流行病学杂志2006,27(12)3.王波.詹思延如何撰写高质量的流行病学研究论文第五讲 整群随机对照试验的报告规范——CONSORT扩展声明[期刊论文]-中华流行病学杂志2007,28(2)4.本刊近期连载"如何撰写高质量的流行病学研究论文"系列讲座[期刊论文]-中华流行病学杂志2006,27(5)5.余灿清.詹思延如何撰写高质量的流行病学研究论文第二讲遗传关联性研究及其Meta分析的报告规范[期刊论文]-中华流行病学杂志2006,27(8)6.王波.詹思延如何撰写高质量的流行病学研究论文第一讲观察性流行病学研究报告规范--STROBE介绍[期刊论文]-中华流行病学杂志2006,27(6)7.夏愔愔.詹思延如何撰写高质量的流行病学研究论文第七讲随机对照试验Meta分析的报告规范——QUOROM介绍[期刊论文]-中华流行病学杂志2007,28(6)8.朱成斌.詹思延如何撰写高质量的流行病学研究论文 第八讲 非劣效性和等效性随机对照试验的报告规范——CONSORT声明的扩展[期刊论文]-中华流行病学杂志2007,28(8)引证文献(2条)1.严卫丽第五讲:如何报告临床诊断准确性研究——国际报告规范STARD解读[期刊论文]-中国循证儿科杂志2010(5)2.徐秦.孙奇用STARD声明评价"肿瘤型M2丙酮酸激酶在肺癌诊断中的应用"一文[期刊论文]-中国循证医学杂志2009(1)本文链接:/Periodical_zhlxbx200610020.aspx。
流行病学:筛检与 诊断试验

试验标准
不同诊断界值时灵敏度与特异度间的平衡
100
80
60
40
特异度
灵敏度
20
0
50
60
70
80
90
100百分率
(%)
(二)可靠性(reliability)
可靠性又称信度,指某一方法在相同 件下重复测量同一受试者时,所获结果的一 致性。
影响因素
1、生物学变异:个体内、个体间差异 2、观察变异 :多次观察和观察者间差异 3、试验差异:实验条件和试验环境所致的
医生还需关注的问题:
1、检测结果和实际情况符合程度如何? 2、试验阳性时患病的概率多大? 3、试验阴性时不患病的概率多大?
表1 按所定诊断标准将人群分组
按所定诊断标准
按“金标准”诊断
有病
无病
阳性 阴性
a(真阳性) c(假阴性)
b(假阳性) d(真阴性)
6.阳性似然比=Se/FP=[a/(a+c)]/[b/(b+d)] 7.阴性似然比=FN/SP=[c/(a+c)]/[d/(b+d)]
确定诊断界值的原则
₪ 漏诊后果严重的疾病,选择灵敏度高的诊 断界值;
₪ 对于尚无有效治疗疾病,选择特异度高的 诊断界值
₪ 一般可选择“灵敏度=特异度”界值为诊 断标准
确定诊断界值的方法
生物统计法 临床判断法 受试者工作特征曲线(ROC曲线) 依据临床需要确定界值
ROC曲线
取诊断试验的多个不同界值(5个以上)分别与金标准比较,计 算得到多组灵敏度和特异度值,以灵敏度为纵坐标,1-特异度 为横坐标,将各个界值对应点连接而成的曲线。
➢ 解决办法:将两指标结合:Youden指数、阳性似 然比、阴性似然比等
流行病学实验流行病学

选择研究对象
对干预措施有效 研究对象的代表性好
预期结局事件发生率较高
容易随访的人群
干预措施对其有益或至少无害
依从性好、乐于接受并坚持试验
25
第二节
设计基本原则与步骤
样本量确定
干预措施实施前、后研究人群中研究事件的 发生率
实验组和对照组结局事件比较指标数据差异 的大小
第I型(α)错误出现的概率 第II型(β)错误出现的概率 单侧检验或双侧检验 研究对象分组数量
22
第二节
设计基本原则与步骤
包括14个基本内容
明确研究目的 确定对照的方式 盲法的应用 确定实验观察期限
选定结局变量及其测量方法 确定基线数据,建立监测系统
influ
确定研究和设计类型
选择研究现场 选择研究对象 确定干预措施 确定样本量 随机化分组
对象的随访和资料收集 确定统计分析方法
23
第二节
???
26
估计样本量
非连续变量样本量估计
N [ Z 2 p(1 p ) Z p1 (1 p1 ) p2 (1 p2 ) ]2 ( p1 p2 )2
连续变量样本量估计
N ( 2 Z Z)
2 2
d
2
27 27
第二节
设计基本原则与步骤
包括14个基本内容
明确研究目的 确定对照的方式 盲法的应用 确定实验观察期限
设计基本原则与步骤
选择实验现场
人口相对稳定,流动性小,有足够数量
预期结局事件(如疾病)在该地区有较高而稳 定的发生率 评价疫苗的免疫学效果,选择近期内未发生该 疾病流行的地区
较好的医疗卫生条件,诊断水平较好,卫生防 疫保健机构比较健全等
流行病学第七章 诊断性试验的评价

Hao Liang, Epidemiology Department of Guangxi Medical University
1
第七章:诊断试验的评价
第一节 概述 一、诊断试验概念 二、诊断试验评价的目的意义 第二节 诊断试验的评价 一、诊断试验评价的原理 二、真实性 三、可靠性 四、实用性 第三节 提高诊断试验效率的方法 一、选择患病率较高的人群 二、采取联合试验 第三节 诊断试验评价的设计 一、确定金标准 二、研究对象选择 三、样本含量的估计 四、确定诊断试验的分界值 五、与e Status (Gold Standard)
Present Test Positive Absent
Test Negative
6
Disease Status(Gold Standard) Present Test Positive Test Negative 真阳性(True positive): 表示用金标准方法确诊患 某病而用新方法试验亦判定为阳性者; Absent
16
例子
表 血清肌酸磷酸激酶测定诊断急性心肌梗死 血清磷酸 肌酸激酶 阳性 阴性 合 计 急性心肌梗死(金标准判定) 有 无 合计 225 24 249 25 121 146 250 145 395
•敏感度(真阳性率)=(225/250)×100%=90.0% •漏诊率(假阴性率)=(25/250)×100%=10.0% •误诊率(假阳性率)=(24/145)×100%=16.6% •特异度(真阴性率)=(121/145)×100%=83.4%
a ab
100 %
20
阴性预测值(negative predictive value, -PV)是 指在诊断试验检测为阴性者中,用金标准诊断为“无病”
流行病学原理与方法、偏倚控制、筛检试验与诊断试验、医学统计学笔记

流行病学原理与方法、偏倚控制、筛检试验与诊断试验、医学统计学流行病学原理与方法一、流行病学研究的基本原则:1、群体原则2、现场原则3、对比原则(核心)4、代表性原则记忆:一群(群体)人在现场(现场)对比(对比)当代表(代表)二、流行病学的研究方法:1、描述流行病学2、分析流行病学3、实验流行病学4、理论流行病学三、疾病的分布与影响因素1、疾病的分布是指疾病在:地区、时间、人群的发生发展的规律注:三间:时间、空间、人间2、疾病分布的测量指标(1)发病率:定义:新发病的病例、不包括原有部分、一定为新发生的病历、原有的不算(2)患病率:定义:目前所有新老病人患病人数病的总和、常统计慢性病、包括新发与原有部分的总和例如:2015年检查1000人、检查出200个高血压、2016年查1000人查出210个高血压、则发病率:10/1000=1%、患病率:210/1000=21%(3)罹患率:定义:局部范围、短时间、传染病的发病率、为患病率中的特殊部分(4)死亡率:定义:一年内死亡的人数(5)病死率:定义:得病而导致死亡的人数注:前提必须为患病导致死亡四、疾病的流行强度1、散发:发病率与历年相似、没有传染关系2、流行:发病率超过散发水平、至少3倍以上3、大流行:疾病迅速发展、一定为短时间跨省、跨国4、爆发:短时间、小范围突发大量病例五、流行病的研究方法1、现况研究(横段面研究、患病率研究):主要用于不明原因得病后的研究(1)普查:普查主要为“患病率”(2)抽样调查①随机抽样调查:现况研究中最基本的调查②系统抽样调查:先编号在抽取③分层抽样调查:先分类在抽取(3)现况研究无需设置对照组、不分组2、病例对照研究(1)分组分为:患病组、未患病组(2)研究方向:现在患病找以前的发病因素、由果到因、研究病因(3)最有价值的指标:OR比值比=暴露比/未暴露比(4)OR值的意义①OR值>1:提示正关联、是危险因素②OR值<1:提示负关联、是保护因素③OR值=1:提示无任何关联如:第一组为90名老年男性肺癌患者、其中60人吸烟另一组为90名健康老年男性、其中40人吸烟暴露因素(危险因素)为:吸烟OR比值比=暴露比(患病暴露60/未患病暴露40)/未暴露比(患病未暴露30/未患病未暴露50)=(3/2)/(3/5)=2.53、对列研究(1)分组分为:暴露组、未暴露组(2)研究方向:通过危险因素来追踪将来是否得病、由因到果(3)最有意义的指标①相对危险度RRA、特点:某因素与某疾病联系程度、评价暴露因素强度的最佳指标、B、相对危险度RR=暴露组发病率/未暴露组发病率、为发病率之比、如:1000人在化工厂上班工人、20肺癌1000人学校上班的老师、4人肺癌相对危险对RR=(20/1000)/(4/1000)=5②归因危险度PAR:又称为特异危险度A、特点:评价暴露因素危险度的最佳指标B、归因危险度PAR=暴露组之比(发病率)-非暴露组之比(发病率)如:暴露组200人、30人高血压非暴露组150人、15人高血压归因危险度PAR=30/200-15/150=1/20=0.054、临床试验:临床给药(1)单盲:医生知情、患者不知情(2)双盲:医生与患者均布知情(3)全盲:实验者、医生、患者均不知情偏倚控制一、定义:研究结果偏离正常值二、分类1、选择性偏倚:如:测量高血压时选择人群均为70岁以上的老人则出现误差2、信息偏倚:信息出现误差影响结果、包括:报告、测量、诊断、3、混合偏倚:在试验设计阶段通过限制与匹配方法来控制注:无回忆偏倚筛检试验与诊断试验特点:筛检试验与诊断试验为目前公认诊断疾病最可靠的方法筛检试验的指标一、灵敏度:实际有病被筛选为有病的病例、又称为真阳性如:100人患有肝癌、经过肝脏穿刺活检AFP发现98人肝癌、灵敏度为:98%、余下的2人为假阴性二、特异度:实际无病被筛选为无病的病例、又称为真阴性如:100人无病、经过检查无病的人数为87、特异度为:87%、余下的13人为假阳性三、约登指数:约登指数=灵敏度+特异度-1如:某工厂进行前列腺癌筛选其中PSA阳性100人、73人确诊前列腺癌、灵敏度为73%其中PSA阴性50人、43确诊无前列腺癌、特异度为:86%约登指数=灵敏度+特异度-1=73%+86%-1=159%-1=59%=0.59四、符合率(粗一致性)=(灵敏度人数+特异度人数)/总人数注:用于测定试验可靠性指标如:进行乳腺癌筛查100个乳腺癌患者、其中检查确诊80人患有乳腺癌、灵敏度人数:80人100个健康人无乳腺癌、其中检查确诊90人无乳腺癌、特异度人数:90人符合率(粗一致性)=(灵敏度人数+特异度人数)/总人数=(80+90)/100+100=170/200=85%医学统计学一、基本概念1、总体:全部研究对象2、样本:总体的最有代表性的一部分、总体包括样本3、均数:总体均数:μ、样本均数:X-4、概率:总体概率:π、样本概率:P5、偏差:总体标准差:δ、样本标准差:S二、概率1、概率定义:随机事件发生可能性的大小、总体概率π、样本概率:P2、概率的范围:0-100%(0-1)3、概率分类(1)小概率事件:P样本概率<5%(0.05)的事件为小概率事件(2)大概率事件:例如:明日太阳从东边升起为大概率事件,概率为100%三、统计工作的基本步骤:1、设计:统计过程中最重要、最关键、决定成败的步骤2、收集3、整理4、分析四、数字变量(又称为:计量资料)1、集中趋势:指标包括:均数(算术平均数)、几何平均数、中位数注:反应集中趋势指标一定带有“数”字(1)均数(算术品均数):总数/个体数、反映集中趋势的正态分布(2)几何平均数:反映集中趋势的倍增分布(倍数、等比)、一般用于统计:抗体浓度、药物浓度等(3)中位数:中间位置数字,反映集中趋势的偏态分布、用于判断一端无确切数值、如传染病的潜伏期等注:奇数个取中间位置数值、偶数个取两个数取中间位置两个数字之和除以二总结:集中趋势看均数、算术几何中位数、算术均数正态分布、几何均数倍增分布、中位数偏态分布2、离散趋势:指标包括:全距、四分位数间距Q、方差、标准差注:反应离散趋势指标一定带有“差”“距”字(1)标准差:反应离散趋势的正态分布的为标准差、为离散趋势最准确、最重要指标注:方差,标准差只用于正态分布(2)四分位数间距Q:反应离散趋势的偏态分布的为四分位数间距(?、(3)标准误SX-:反应离散趋势的抽样误差为标准误SX-①计算公式:SX-=标准差/√样本个数②随机抽样时:X-≠μ说明存在抽样误差记忆:离散二距方标差、正态标准数最佳、偏态四分数间距、抽样误差标准误3、变异系数CV:统计学需要比较时出现“单位不同”或“均数相差悬殊”选用变异系数CV进行比较4、反应正态分布特点①总体均数μ=0、总体标准差δ=1②当总体均数μ恒定时、总体标准差S曲线将变胖五、假设检验1、定义:针对总体的特征进行某种假设2、计算方法(1)无效假设:零假设、用h0表示、h0:μ=μ0(2)研究假设:备择假设、用h1表示、h1:μ≠μ0(3)P>0.05统计无效、P<0.05接受h1、拒绝h0有统计学意义注:进行统计前是首选要进行无效假设、默认为无效假设等于实际情况、调查后若出现零假设概率P>5%(大概率事件、不可能)无意义、假设研究后的研究假设结果概率P小于5%、则拒绝h0、接受h1六、检验方法:X2卡方检验、U检验、T检验1、X2卡方检验(1)用于“率”的比较或用于“构成比”的比较、如:血型的比较、发病频率、常用程度的指标注:“率”为发病频率、严重程度的重要指标(2)特殊:四个样本的自由度、特例:四个样本=(行数-1)x(列数-1)=(2-1)x(2-1)=1注:自由度=样本-12、用于比较两个样本所属总体均数是否相等:U检验(样本数大于50)、T检验(样本数小于50)3、分用于总体类型不知(未知)时用于分等级的检验:秩和检验记忆:比较均数用UT、大于50要选U、小于50要选T、率的检验选X2、分级检验用秩和4、频数分布:在总体分组的基础行再归并排列、又称为分布数列、常分为8-15组、100以上的病例常以10组为宜七、统计图1、线图:看变化、统计XX变化、最好的线条图为:半对数线图2、直方图:看分布、统计XX分布3、直条图:比大小、比高低、统计XX大小、XX高低4、散点图:回归变数、统计XX回归数、两个连续变量之间的关系5、百分条图、圆图:看构成、看比重、统计XX构成、统计XX比重。
流行病学 第7章 筛检试验和诊断试验

❖ 筛检试验评价就是将待评筛检试验与诊断 目标疾病的标准方法,即“金标准”(gold standard),进行同步测试和结果比较,判 定该方法对疾病“诊断”的真实性和价值。
精品课件
一、选择“金标准”: 金标准(gold standard)即标准诊断方
法,是指可靠的、公认的、能正确地将有病 和无病区分开的诊断方法。
精品课件
对率作抽样调查时所需样本大小 n ( a=0.05)
d 0.10
0.90 0.200 0.180 0.160 0.140 0.120 0.100 0.090 0.080 0.070 0.060 0.050 73
p
0.50 0.05
0.45
0.40
0.35
0.30
0.25
0.20
0.15
0.50 0.95
精品课件
筛检试验与诊断试验的区别
筛检试验
诊断试验
对象不同 健康人或无症状的病人 病人
目的不同 把病人及可疑病人与无 病人与可疑有病但实
病者区分开来
际无病的人区分开来
要求不同 快速、简便、高灵敏度 科学性、准确性
费用不同 简单、廉价
一般花费较贵
处理不同 阳性者须进一步作诊断 结果阳性者要随之以
试验以便确诊
精品课件
(二)、筛检的应用范围
1、该疾病是当地一个重大的公共卫生问题: 2、具备有效的治疗方法: 3、有进一步确诊的方法与条件: 4、该病的自然史明确: 5、具有较长的可识别的潜伏期或临床前期: 6、有适当的筛检方法: 7、预期有良好的筛检效益:
精品课件
第2节 试验方法的建立
❖ 对诊断试验和筛检试验必需进行科学的研 究,制定出符合实际的应用条件和标准,才能 使其具有最大的诊断和筛检价值,两者的研究 方法相同。
流行病学4(诊断试验)

分界点确定原则: 1.假阳性率、假阴性率同等重要 2.确诊试验费用:高减少灵敏度 3.遗漏可能病例的后果:严重提高灵敏度 4.检查间隔周期:短可减少灵敏度 5.患病率:高应提高灵敏度 6.治疗需要:会过度应减少灵敏度
(二)可靠性评价
在计量资料用标准差或变异系数
sxBiblioteka 2 x n 1 n
2
s CV 100 % x
在计数资料用符合率评价可靠性
重复试验获得相同结果的次数 符合率 100 % 试验次数 ad 100 % acbd
影响可靠性的因素 1. 实验方法本身或仪器的变异 2. 观察者测量变异 3. 调查对象的生物学(个体)变异
(三)预测值 表示试验结果的实际临床意义 1.阳性预测值 PPV 试验阳性者属于真病例的概率 PPV=a/a+b×100% 2.阴性预测值 NPV 试验阴性者属于非病例的概率 NPV=d/c+d×100%
血糖 ≥130 < 130
流行病学正文部分-第6版第6章[1].实验流行病学
![流行病学正文部分-第6版第6章[1].实验流行病学](https://img.taocdn.com/s3/m/344d9c43312b3169a451a4bd.png)
第六章实验流行病学第一节概述一、定义医学科学研究的基本方法是观察和实验。
所谓“观察”(observation),是利用一些方法,在不干预、自然的情况下认识自然现象的本来面目,描述现状,分析规律;而“实验”(experiment)则是采用一些人为方法改变自然现象,从而使一些本来在自然情况下并不显露的现象显示出来。
观察性研究并不刻意改变研究对象的自然暴露,而在实验性研究中,为了达到研究者的目的,对研究对象刻意安排了特殊暴露。
例如,为了观察经常吃炸薯条对儿童身体的影响,可以通过调查和比较经常吃炸薯条的儿童与不经常吃炸薯条的儿童有关身体状况(如肥胖等),从而获得结论。
在上述研究中,被观察者没有受到研究者的干预,属于观察性研究。
然而,考虑到经常吃炸薯条的儿童的家庭生活水平可能较好,不经常吃炸薯条的儿童的家庭生活水平可能相对较差,观察性研究得出的结论的真实性可能受到家庭生活水平等因素的影响。
如果研究者把儿童按家庭生活水平分为可比的两组,一组按照研究者的要求吃炸薯条,另一组不吃炸薯条,经过一段时间后再比较两组儿童的肥胖率,这种情况下,儿童不是根据其本来的意愿而是根据研究者的安排吃炸薯条或不吃炸薯条,即研究者对研究对象实施了人为干预,新的分配可能改变了他们原来的自然选择,这种研究就是实验性研究。
在医学研究中,可根据研究对象的属性把实验性研究分为基础性实验(以分子、细胞、器官等为研究对象)、动物实验和人群实验。
以人群为研究对象,以医院、社区、工厂、学校等现场为“实验室”的实验性研究称为实验流行病学(experimental epidemiology)研究,或称为流行病学实验(epidemiological experiment)。
因为在研究中施加了人为的干预因素,因此也常被称之为干预性研究(intervention study)。
实验流行病学是流行病学研究的主要方法之一。
二、发展简史早期流行病学的研究方法主要是观察性的。
流行病学实习四——诊断与筛检试验的评价——北京大学

特异度=(d/b+d)*100% 假阴性率=(c/a+c) *100%
阳性预测值=(a/a+b) *100%
阳性似然比
真阳性率 假阳性率
灵敏度 1 特异度
阴性预测值=(d/c+d) *100%
阴性似然比
假阴性率 真阴性率
1 灵敏度 特异度
血清T4浓度诊断试验
• 灵敏度= 22/27*100% = 81.5%, 表示在确诊的甲状腺功能低下病人中血清T4浓度<77nmol/L(阳性)
者占81.5%。 • 特异度= 86/93*100% = 92.5%, 表示在无甲状腺功能低下病人中血清T4浓度≥77nmol/L(阴性)者占
92.5%。 • 假阴性率= 5/27*100% = 18.5%, 表示在确诊的甲状腺功能低下病人中血清T4浓度≥77nmol/L(阴性)
者占 18.5%,即有18.5%的甲状腺功能低下病人漏诊。 • 假阳性率= 7/93*100% = 7.5%, 表示在无甲状腺功能低下病人中血清T4浓度<77nmol/L(阳性)者占
是以真阳性率(灵敏度)为纵坐标,假阳
病人
非病人
性率(1-特异度)为横坐标所做的曲线,
以表示灵敏度血糖与值特异度之间相互关系的一
种方法。该曲线最接近左上角的一点或曲
线左上方拐点处定为最佳截断值,即最佳
判断标准病,人 因为此点非灵病人敏度和特异度均较
高,假阳性和假阴性之和最小。 血糖值
甲状腺低下的筛检与诊断P409
真阳性率(灵敏度)=(a/a+c)*100%,假阳性率=(b/b+d) *100% 此时:灵敏度= 18/27*100% = 66.7%,假阳性率=(1/93)*100%=1.1%
流行病学第七章 (疾病筛检和)诊断试验的评价

2.筛检方法手段不同
单项筛检(single screening) 用一种筛检试验检查某一种疾病。 多项筛检(multiple screening) 同时用多种筛检试验检查某一种疾病。
四、筛检应用原则与条件
20世纪60年代至90年代,世界范围的一些学
者和组织机构制定了一些应用筛检的原则和标准,使筛 检不断完善和发展, 1999年Crossroads提出的筛检计划的原则和条件 ,其主要涉及被筛检的疾病和人群,筛检的条件和设备
,干预和随访, 社会伦理四个方面。
四、筛检应用原则与条件
• • • • •
• • • • •
(十个方面)
应用于该地区当前重大的公共卫生问题 有连续而完整的筛检计划 对所筛检疾病的自然史有足够的了解 有可识别的早期客观指征(如检查与测量的标志) 筛检试验方法快速、简便、准确、可靠、可行、安全、 经济、群众易于接受 费用是低廉的,预期有良好的筛检效益 筛检发现阳性者(病人及高危人群)应予进行及时有 效进一步检查、干预和治疗 该病具有较长的潜伏期和领先时间,经有效的治疗能 恢复健康 具备条件(疾病监测、预防、治疗、干预、健康教育、 咨询和社会支持) 目标人群接受,并可从生理、心理和社会生活等方面 获益。对人群不应产生负面影响,筛检者及其筛检结 果的保密措施
筛检(screening)便是在这样的背景下发展起 来的一种流行病学研究方法,它是描述性研究的 一个组成部分,属观察性研究范畴。
一、筛检概念
1951年美国慢性病委员会正式提出了
筛检定义:也叫筛查。
是通过快速简便的试验、检查或其他措施, 在大量表面无病的人群中去发现未被识别的、 可疑的病人或有缺陷的人。
筛检试验与诊断试验的分别
筛检试验
诊断试验

诊断试验( diagnostic test):应用物理学的、生物化学的、血清免疫学的检查,临床检查和医疗器械检查,对疾病和健康状况提供信息的试验。
一种好的诊断方法要求真实、可靠、快速、安全、无损伤、费用低。
诊断试验的评价也是临床流行病学中重要组成内容之一。
第一节重要性1、对诊断试验进行科学的评价能正确认识其临床应用价值。
2、科学地评价诊断试验是临床医生选择诊断试验的基础诊断试验科学性评价①??试验是否与金标准试验进行“盲法”比较?②??是否每个被测者都做参照试验进行评价?③?所研究病人样本是否包括临床试验中将使用该诊断试验的各种病人?④??诊断试验的精确性(方法介绍详细、结果重复性好)临床上诊断试验主要用于(1)诊断疾病(2)筛检疾病:筛检原则1)筛检的疾病是重大社会问题2)能显着改善其预后3)有足够的领先时间。
领先时间指的是从筛检发现到该病人因症状而去就诊的时间间隔4)筛检试验方法快速、简易、价廉、安全、可靠、灵敏、特异、有效、能被受试者接受(3)疾病随访(4)判断疾病严重程度(5)估计愈后(6)估计对治疗的反应诊断试验评价的目的•怎样开展诊断试验研究•怎样阅读和评价有关诊断试验的文章•临床和科研工作中怎样选择诊断试验–诊断疾病:灵敏度和特异度高–筛检无症状患者:简便、经济、安全易接受–疾病随访:重复性好,影响因素少–判定疾病的严重程度;估计疾病的临床过程及其预后;估计对治疗的反应;测定目前对治疗的实际反应临床医生对一系列的检查事先要有计划,一般将最便宜、最无创伤的检查放在最先做。
第二节研究设计方法1、确定“金标准”金标准:是指当前医学界公认的可以明确肯定或排除某种疾病的最可靠的诊断方法。
2、选择研究对象1)原则:代表性2)病例组:按金标准确诊为“有病”的病例,包括各种类型的病人。
3)对照组:按金标准确诊为无目标疾病的其他病例,特别是与该病容易混淆的病例。
正常人一般不宜纳入对照组。
被试验对象应同期进入研究。
流行病学:筛检与诊断试验

符合率和调整一致率分别是多少?
表1 甲、乙二医生诊断结果
甲医生诊断
乙医生诊断 肺门淋巴结核
正常 合 计
肺门淋巴结核 46(a)
10(b) 56(r1)
正常
12 (c)
32(d) 44(r2)
合计
58(c1)
42(c2) 100(n)
观察一致率Po=(46+32)/100=78% 机遇一致率Pc=(r1c1/n+r2c2/n)/n=51% 非机遇一致率1-Pc=100%-51%=49%
筛检试验 健康人群 区分可疑患者 进一步确诊 高灵敏度
较低 准确性低
诊断试验 可疑病人 确诊患者 加以治疗 高特异度
较高 准确性高
筛检分类和实施原则
分类 筛检对象:整群筛检 发病率高
目标筛检 高危人群 筛检方法:单项筛检 肺炎:呼吸频率
多项筛检 肺结核:胸透+血沉+痰结核杆菌
目的与意义
1.筛检
早期发现可疑患者 糖尿病 尿糖筛检 血糖确诊
思考题
*1.如何开展诊断试验评价(相应指标的计 算及意义)。
*2.试述ROC曲线的定义及用途。 3.简述提高试验效率的办法。 4.试述选择诊断标准(界值)的原则。
谢 谢
!
赠送课件: 第一章 绪 论
第一章 绪论
第一节 流行病学的概念 第二节 流行病学的研究方法 第三节 流行病学研究的重要观点
第四节 流行病学的用途 第五节 流行病学与临床医学的关系 第六节 流行病学研究中伦理学问题
31
95
-
20
400
420
合计
200
800 1000
20
50
90
《流行病学》7诊断试验评价

30
56
NPV (%) 50
80
95
88
3、诊断试验阳性结果截断值的确定
理想的诊断试验灵敏度、特异度均应 接近100%。
但在实际工作中很难达到,往往表现 为灵敏度↑↓则特异度↓↑。
两者高低的转换与确定诊断试验阳性 结果的截断值(cut off point)或临界点的 选择密切相关。
.
图7-3 病人与非病人观测值分布类型
评价指标
.
二、 诊断试验的评价
(一)评价方法
诊断试验的评价就是将待评价的诊 断试验与诊断目标疾病的标准方法——即 “金标准”(gold standard)——进行同步盲 法比较,判定该方法对疾病“诊断”的真实 性和价值。
.
确定“金标准”
“金标准”指当前临床医学界公认的诊断 疾病的最可靠的方法,也称为标准诊断金标
.
PPV
指试验阳性结果中真正患病(真阳性)的比例 阳性预 测 A 1 值 0 % 0 AB
NPV
指诊断试验阴性者不患目标疾病的可能性
阴性预 测 D 值 10% 0 CD
.
2、可靠性 (reliability)
也称信度、精确度(precision)或可重复性 (repeatability)
指在相同条件下用同一诊断试验对同一受试 者重复操作时获得相同结果的稳定程度
其次是选择研究对象,用金标准将这些对象划分 “有病(病例组)”与“无病(对照组)”;
第三,用待评价的诊断试验采用盲法同步地测试这 些研究对象,将获得的结果与金标准的诊断比较,应 用相应的指标来评价该试验的诊断价值。
.
金标准
目 标 人 群
+
病人
- 待评价的 诊断试验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
55.7
98.6
18050.099.8 Nhomakorabea敏 100
感
A
度 80
%
真 60
阳
性 40
率
20
0 20 40 60 80 100
1-特异度%(假阳性率)
图1.糖尿病诊断中的ROC曲线
最佳阈值的选择,如图中的A点,此时的敏感度和特异度分 别为85%和88%
(三)ROC曲线用构图法除直观地表达了敏感度和 特异度之间的关系外,还具有以下几个特性:
金标准具有创伤性,因此探求一些新的诊断 方法(诊断试验),并比较其与金标准的差别、 得失及推广价值有现实意义。
三、具体方法和步骤: 选择受试对象 确定样本含量 按金标准分组 进行诊断试验 评价,结论
(要有代表性) (病例组和对照组) (四格表)
选择病例
病例的代表性:临床各型 ( 轻、中、重 )
临床各期 ( 早、中、晚 ) 有无并发症
1.并联试验:
同时进行多项诊断试验,在这些试验中只要有 一项是阳性,即可认为有患病的证据,并联试验常 常应用于一些必须迅速确诊的危重症病人或急诊病 人
优点:能提高敏感度和阴性预测值 缺点:同时降低特异度、阳性预测值
并联敏感度=敏感度A+(1-敏感度A)×敏感度B 并联特异度=特异度A×特异度B
例: 并联试验对深部静脉血栓形成的诊断 (与静脉造影术比较)
2.临床意义?
3.适用性和推广性?
一、诊断试验证据的真实性评价
❖ 1. 是否设立了准确性高的标准方法(金标 准),并采用了盲法与它进行比较?
标准方法本身的准确性是保证新方法准确性的 关键,在评价一项诊断性实验的价值时,也应看该 研究过程中是否设立了准确性高的金标准作为对照。
盲法它包括两层意思:
1. 进行诊断试验和解释试验结果应由不知道受试者 金标准诊断结果的医师完成;
130
81.4
82.4
140
74.3
91.2
160
55.7
98.6
180
50.0
99.8
以高敏感度为优先考虑: ① 疾病的漏诊可能造成严重后果。 ② 诊断性试验的目的是为了排除疾病。 ③ 在无症状人群中筛选病例,而该病的发病率又 较低。
以高特异度作为优先考虑: ①假阳性结果会导致病人肉体、精神或者经济上 的严重危害时。
金标准诊断为有病的病例中,诊断试验检测为 阳性例数的比例。
敏感度越高,漏诊率(假阴性率, )越少。 漏诊率(假阴性率)=1-敏感度
2. 特异度(Specificity,Spe,真阴性率): Spe=d/(b+d)×100%
金标准诊断为无病的病例中,诊断试验检测为阴性 例数的比例。
特异度越高,误诊率(假阳性率, )越少。 误诊率(假阳性率)=1-特异度
8.准确度(accuracy,Acc)
Acc =(a+d)/(a+b+c+d) 诊断性试验检测为真阳性和真阴性,在总检例数中 的比例。
9.患病率(prevalence,prev):
PREV= (a+c)/ (a+b+c+d)
意义:经诊断试验检测的全部病例中,真正“ 有病”患者所占的比例。
在级别不同的医院中,某种疾病的患者集中程 度不同,故患病率差别较大,因而会影响阳性及阴 性预测值的结果。
选择对照
* 健康人 * 未患该病而患其他疾病的病人
样本含量与下列因素有关
❖ 对试验灵敏度的要求 ❖ 对试验特异度的要求 ❖ 允许误差
表1:诊断性试验与金标准检测结果的比较
━━━━━━━━━━━━━━━━━━━━━━━
金标准
━━━━━━━━━
有病
无病
合计
━━━━━━━━━━━━━━━━━━━━━━━
PLR=Sen/ = 真阳性率/假阳性率
意义:诊断试验结果阳性时,患病与不患病机会 的比值。
PLR ↑患病概率↑
7.阴性似然比(Negative likelihood ratio,NLR):
NLR= / Spe =假阴性率/真阴性率
意义:诊断试验结果阴性时,患病与不患病机 会的比值。
阴性似然比较大,表明当试验结果为阴性时患 病的可能性仍较大,因而排除该病的可能性不大。
1. 相同的实验条件下,该试验对同样的病人其结果的重 复性如何;
2. 按照研究者报导的方法,其它医院试验结果的重复性 如何。
4. 试验中所确定的参照值(正常值,截断值) 是否可靠?
参照值是否可靠主要与若干因素有关:
表示:全部阳性例数中,“有病”患者(真阳性 )所占的比例。
5.阴性预测值(Negative predictive value,NPV)
阴性预告值:NPV=d/(c+d)×100%
表示:全部阴性例数中,“无病”者(真阴性 )所占的比例。
6.阳性似然比(positive likelihood ratio,PLR):
诊断试验评价指标计算举例:
表1:医院就诊者心电图运动试验对冠状动脉狭窄病人的诊断结果
心电图 + 运动试验 -
合计
冠状动脉狭窄≥75%
是
否
合计
55 (a) 7 (b) 62 (a+b)
49 (c) 84 (d) 133 (c+d)
104
91
∑195
(a+c) (b+d)
表1计算结果: 患病率=(a+c)/(a+b+c+d)=104/195=53% 敏感度=a/(a+c)=55/104=53% 特异度=d/(b+d)=84/91=92% 准确度=(a+d)/(a+b+c+d)=139/195=71% 阳性预测值=a/(a+b)=55/62=89% 阴性预测值=d/(c+d)=84/133=63% 阳性似然比=敏感度/(1-特异度)=0.53/(1-0.92)=6.63 阴性似然比=(1-敏感度)/特异度=(1-0.53)/0.92=0.5
优点:是可以提高特异度和阳性预测值 缺点:降低敏感度和阴性预测值
串联特异度=特异度A+(1-特异度A) ×特异度B 串联敏感度=敏感度A×敏感度B
例:血清酶的串联试验对急性心肌梗塞的诊断
血清酶试验 CPK GOT LDH 三项均阳性
敏感度 0.96 0.91 0.87 0.78
特异度 0.57 0.74 0.91 0.95
表2:某社区冠心病高发区人群心电图运动试验对冠状动脉狭窄病人的诊断结 果
心电图 + 运动试验 -
合计
冠状动脉狭窄≥75%
是
否
55(a) (b) 42 (a+b) 97
49(c) (d)478 (c+d) 527
104
520
∑624
(a+c) (b+d)
表2计算结果: 患病率=(a+c)/(a+b+c+d)=17% 敏感度=a/(a+c)=53% 特异度=d/(b+d)=92% 准确度=(a+d)/(a+b+c+d)=85% 阳性预测值=a/(a+b)=57% 阴性预测值=d/(c+d)=91% 阳性似然比=敏感度/(1-特异度)=6.63 阴性似然比=(1-敏感度)/特异度=0.51
(二)它以敏感度(真阳性率)为纵坐标,1 -特异度(假阳性率)为横坐标
例:不同血糖水平诊断糖尿病的灵敏度、特异度
血糖水平标 灵敏度(%) 特异度(%)
准(mg/dL)
90
98.6
7.3
100
97.1
25.3
110
92.9
48.4
120
88.6
68.2
130
81.4
82.4
140
74.3
91.2
160
❖ 能对轻型,早期非典型病例作出正确的诊断应具有更 重要的临床实用价值;
病例的筛选也是进行诊断试验研究关键的一环,应 对病例的纳入标准作严格的规定
如一些个体特征:如年龄、性别、体质等 病例的不同来源:一般门诊与专家门诊 患病率的不同和病人患病的病情严重程度
3.试验结果的重复性如何?
结果的重复性包括两层意思:
②为了肯定诊断。这样,当试验结果是阳性时, 就有足够的把握确定诊断。
3.约登指数( Youden’s indx, YI ) YI=灵敏度+特异度-1 表示:约登指数越大, 其真实性亦越好。
4.阳性预测值(Positive predictive value,PPV)
阳性预告值:PPV=a/(a+b)×100%
二、基本方法:
• 将待评价的诊断试验与金标准诊断试验进行盲法 同步(或先后)比较;
• 金标准:指可靠、公认的诊断方法: 活体检查、尸检、外科发现、特殊的影像诊
断、长期随访临床观察等;
金标准的目的:
将研究人群准确地分为有病和无病两组
例:
冠心病: 肿瘤: 肾结石:
冠状动脉造影 病理学检查 手术发现
诊断性试验的研究和评价
引言
疾病的诊断和治疗是临床医学的两个主要组成 部分,正确的诊断是治疗的重要前提。
随着现代科学技术和医学本身的发展,越来 越多的实验室检查及医疗仪器检查被引入临床, 这些对疾病的诊断也起着日益重要的作用。
第一节 诊断性试验的概念和 研究方法
一、诊断性试验的概念
诊断性试验(Diagnostic Test)是对 一种新的诊断方法,包括症状、体征、化验 与特殊检查的评价。
l ROC曲线常用来决定最佳阈值的选择
诊断性试验最佳诊断阈值一般为敏感度与特异 度之和最高,而假阳性和假阴性之和最小的测试值
所选的点从ROC曲线看是接近左上角的测试值, 也即应尽量靠近左上角。
l 曲线下的面积,它代表该试验在各阈值判断正 确(真阳性及真阴性)部分,代表诊断性试验 整体准确性或真实性,ROC曲线下面积越大则 该诊断性试验的准确性越高;