诊断试验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概念:什么是诊断试验?
一、诊断试验研究意义和设计原则
(一)诊断试验的意义
☐正确诊断是预防、治疗措施决策的基础。
☐创造新方法、淘汰旧方法势在必行。
☐诊断试验研究是临床常用的研究方法之一;也是方法学研究的常用方法。
☐诊断试验研究和评价是每个医务人员必备的基本知识与技能。
☐基础研究也要做这方面的研究,如唾液酸、支原体试剂盒、肿瘤标志物.
诊断试验的应用:
☐诊断试验应用非常广泛。
☐可应用于疾病诊断、病原学诊断、疗效和预后诊断、药物不良反应的检测、人群中的普查、筛查等。
☐预防医学新的检测方法、基础医学中新的检测方法、新的病理诊断方法、某种疾病的判断方法等
(二)诊断试验评价的设计要点:
诊断实验设计时要注意以下几点:
1.确定可靠的金标准:注意金标准的准确性和可行性。
2.选择合适的研究对象:金标准:有病、无病
实验组:应包括疑似病例、各种病情病程、易混淆病例。
3.诊断的可靠性:正式试验前先进行可靠性试验,计算变异系数和一致性,注意控制实验条件,仪器、试剂、质量控制。
4.如实报告结果,盲法判断结果。
5.样本含量足够:
P-敏感度或特异度δ-容许误差α-第一类错误的概率
5、样本含量计算:
1)当灵敏度和特异度接近50%时,可用近似公式计算:
n=(uα/δ)p(1-p)
式中:
uα正态分布中累计概率为α/2时的u值
(如u0.05/2=1.96,u0.01/2=2.576),
δ-指允许误差,
p-预试验时的灵敏度或特异度。
2)当预期的灵敏度或特异度小于20%或
大于80%时,资料呈偏态分布,需要
对率采用平方根反正弦转换,
按下公式计算:
二、诊断试验的研究设计
(一)要求:理想的诊断方法应该是准确度高、精密度高、安全、无不适感、作用迅速、操作简单易行、效率高、价格低廉。
最重要的是准确度高。
(二)诊断试验设计步骤:
1.确定金标准(gold standard)
诊断试验的效果评价必须建立一个科学、可靠和公认的对比标准,即¡°金标准¡±,是指当前医学界公认的、最可靠的、准确度高的诊断方法作为比照的统一标准。
金标准选择不当造成的偏移称为不完善金标准偏移(imperfect gold standard bias)1.确定金标准(gold standard)
金标准要求:
1)针对性强:能够准确地区分有病无病(患者、非患者)、阴性阳性。
2)费用低,操作容易,可行性好:简便、实用、经济。
包括基因诊断、病理学诊断、冠状动脉造影、CT、磁共振(MRI)、放射标记扫描等。
3)金标准确定方法
☐根据专业知识确定;
如:诊断恶性肿瘤:金标准是病理切片,深部组织癌症CT、核磁共振成像等
☐查找相关的标准(GB);
如:水中汞、铅、镉测定,可查“饮用水水质卫生标准”配套的检测方法。
☐如果没有金标准,可采用不完善参照试验作“金标准”。
4)金标准选择不当的影响
☐产生金标准偏移:金标准选择不当影响了诊断试验的正确评价(不能正确区分患者与非患者),称为金标准偏移。
避免金标准偏移的办法:采用一系列的检查、化验的方法论证。
☐产生合并偏倚:金标准选择不当,将假阳性判断为真阳性或将假阴性判断为真阴性,使诊断的准确度高估,称为合并偏倚。
☐产生证实偏倚:由于某些原因,部分采用金标准,部分使通过其他方法确诊,使诊断的准确度产生的偏倚称为证实偏倚。
2.研究对象的选择
1)试验组:诊断试验研究的目的一般是要论证待研究的诊断方法是否具有诊断价值,所以选择实验组研究对象选择应该具有代表性。
症状和体征典型与不典型,不同临床病程早、中、晚期,不同病情轻、中、重型。
2)对照组:具有鉴别诊断的意义。
通常选用容易与该病混淆而又确实未患该病的其他病人或正常人作为对照。
3)病例选择不当通常会产生选择性偏倚,选择性偏倚中最常见的是频谱偏倚。
3.诊断(试验)指标确定
☐此处的诊断指标指的就是待研究的指标(或试验指标)。
选择指标时尽可能地选择客观定量指标。
☐在进行待研究(试验)指标与金标准进行比较时,要尽可能采用盲法,特别是定性指标强调盲法。
以避免评阅偏依产生(review bias)。
(已知金标准结果,在待测诊断指标测量时带有偏向产生的偏依称评阅偏依)
☐试验评阅偏倚:未采用盲法,研究者事先知道金标准的诊断结果所产生的偏倚叫试验评阅偏倚。
☐诊断评阅偏倚:未采用盲法,研究者在判断金标准结果时,事先知道诊断试验结果,所产生的偏倚叫诊断评阅偏倚。
☐诊断评阅顺序偏倚:研究者在评价两个诊断试验时,评价后一个实验结果受前一个试验结果的影响,所产生的偏倚叫诊断评阅顺序偏倚。
4.截断点的选择(cut off point)
☐诊断试验的截断点又称分界点、截割点、诊断界值(criticl value), 指诊断试验中用以划分阳性与阴性的分界值。
临床上常用参考值范围(正常值)作为判断正常与否。
从下图可见如果截断点右移则会增加误诊率;截断值左移就会增加漏诊率。
未患本病
患本病
1)实际工作重要根据不同资料、不同指标选择截断值。
上图说明:
☐A图:体内毒物测定,N与Y没有重叠,应设a、b两个界点,a→b 间为可疑。
☐B图:传染性疾病的指标,上限与下限在同一水平,只取1个界点,<C非病,≥C患者。
☐C图:N与Y重叠面积较小,假阴性与假阳性面积接近5%,界点为d,如肿瘤标志物检测,<d非病,>d患者。
☐D图:N与Y有较大重叠面积,如激素及其他生物活性物的含量,应设两个界点e和f,<e 非病,>f患者, e →f间为可疑。
2)实际工作中还要考虑是减少漏诊率还是减
少误诊率为主?
☐某些疾病发现后治疗无效,目的在于排除出病例,以减少误诊,需要较高的特异度,此时选择较高的截断值。
☐如果疾病早诊断早治疗可促进预后,目的在于早诊断,提高敏感度,减少漏诊率,可选择较低的截断值。
☐如果既要考虑灵敏度又要兼顾特异度,可选择Youden指数最大,或选择阳性似然比最大的截断值。
5.同步盲法测试:经金标准确定的试验组和对照组同步接受新的诊断试验方法盲法测定。
6.统计学分析与评价:
与金标准测定结果比较分析,统计学指标:敏感度、特异度、似然比、预测值、youden 指数等,同时还要进行统计学推断。
三、诊断试验的评价指标及其意义
诊断试验指标包括诊断试验特性指标和预断(值)指标;其中阳性预测值(PV+)和阴性预测值(PV-)属于预断值。
敏感度和特异度是任何诊断试验必须具备的两个基本特征指标。
新方法与金标准比较
新的诊断试验效果如何,只能与金标准比较,与金标准比较时,其结果数据可用2×2四格表归纳比较分析。
比较有四种情况:
a¡ª金标准+,新方法+,真阳性数。
d¡ª金标准-, 新方法-,真阴性数。
b¡ª金标准-, 新方法+,假阳性。
c¡ª金标准+,新方法-,假阴性。
诊断试验的指标及其意义
(一)诊断试验的基本指标及其意义
1.灵敏度(sensitivity,Se)与漏诊率:指用金标准已确诊为病人的对象中,用该试验检查判断为阳性者(效能)所占的百分比。
真阳性率.
灵敏度与漏诊率互为补数,漏诊率=1-Se
2.特异度(specificity,Sp)与误诊率:指用金标准确诊的未患某病的对象中,用新诊断法为阴性的的部分所占比例(正确鉴定非本病的效能),真阴性率。
特异度与误诊率互为补数,误诊率=1-Sp
未患本病
患本病
d
灵敏度与特异度关系:
理想的诊断实验灵敏度与特异度都高,但一般不可能,灵敏度高时特异度就会低;特异度高时灵敏度则会低。
两者关系见下表。
灵敏度、特异度关系
2h后血糖mg/dl 灵敏度(%)特异度(%)
70 98.6 8.8
80 97.1 25.5
90 94.3 47.6
100 88.6 69.8
110 85.7 84.1
120 71.4 92.5
130 64.3 96.9
140 57.1 99.4
150 50.0 99.6
160 47.1 99.8
170 42.9 100.0
180 38.6 100.0
190 34.3 100.0
200 27.1 100.0
诊断试验的指标及其意义
3. 假阴性率(β):指确有本病存在的患者中,用新方法检查结果呈阴性的频率,即漏诊率。
灵敏度=1- β
4. 假阳性率(α):指确无本病存在时,该试验检查呈阳性的频率,即误诊率。
特异度=1- α
(二)正确度与Y ouden指数
☐灵敏度和特异度分别从不同单方面考察了诊断试验的诊断准确度,而正确度和Youden指数可将灵敏度和特异度结合起来对诊断试验进行综合评价。
5. 正确度(accuracy)
☐正确度又称总符合率,指诊断试验诊断正确的例数占总例数的百分比,诊断正确的例数包括患者中被检测为阳性的例数和非患者中被检测为阴性的例数。
正确度的计算公式为:
☐也可以表示为:
☐可见,正确度为灵敏度和特异度的加权平均数,权重为患者与非患者占总例数的比例。
因此,正确度受灵敏度和特异度影响;
☐如果研究对象为病例和对照的随机样本,正确度与病例组和对照组的样本含量比例有关;☐如果研究对象为人群中的随机样本,正确度与人群患病率有关。
☐如在患病率较低的人群中进行诊断试验,即使灵敏度很低的试验,也可获得较高的正确度。
6. Youden指数:又称正确诊断指数,是指诊断试验中真阳性率和真阴性率之和减去基数(1或100%)。
☐Youden指数是评价检验效能综合指标之一。
☐Youden指数的取值在-1~1之间,一般认为yi(J)要>0.5才有诊断价值,说明诊断试验的准确度越高。
☐缺陷:α=0.3,β=0.7和α=0.7,β=0.3指数相同
☐似然比也是综合灵敏度和特异度的评价指标。
7. 阳性似然比阳性似然比(positive likelihood ratio,LR(+))定义为灵敏度和1-特异度之比,即真阳性率和假阳性率之比,表示患者检出阳性的概率是误诊率的多少倍。
计算公式为:
☐阳性似然比的取值在0~∞之间,其值越大,诊断试验越好。
8.阴性似然比(negative likelihood ratio,LR(-))定义为(1-灵敏度)和特异度之比,即假阴性率和真阴性率之比,表示患者检出阴性的概率是非患者的多少倍。
计算公式为:
☐阴性似然比的取值在0~∞之间,其值越小,诊断试验越好。
举例:
☐例:以糖化血红蛋白(GHb):为金标准,正常值为4%-6%,研究用空腹血糖(FPG)诊断糖尿病,(≥5.6mmL/L为糖尿病患者),以金标准诊断的245例糖尿病患者为研究对象,45名正常人为对照结果如表。
☐灵敏度=227/227+18=92.65%
☐特异度=29/21+29=58.00%
☐FNR = 1-Se = 1-92.65% = 7.35% (漏诊率)
☐FPR = 1-Sp = 1-58.00 = 42.00% (漏诊率)
☐= = 86.78%
☐J=Se+Sp-1=92.65%+58.00-1 = 0.5065
☐LR(+)=Se/1-Sp=0.9265/1-0.58=2.21
☐LR(-)=1-Se/Sp=1-0.9265/0.58=0.13
(四)预测值
☐预测值:是在诊断试验结果(阳性或阴性)的条件下,证实有无患病的频率。
☐在实际工作中,临床或社区医生往往更关心诊断试验结果阳性的研究对象是患者的可能性有多大?或者诊断试验结果为阴性的研究对象是非患者的可能性有多大?可用预测值判断,分为阳性预测值和阴性预测值。
9.阳性预测值(predictive value,Pv+):定义为诊断试验结果为阳性的研究对象,实际为患者的概率,计算公式为:
10.阴性预测值(predictive value,Pv -):
定义为诊断试验结果为阴性的研究对象,实际为非患者的概率,计算公式为:
☐阳性预测值和阴性预测值越大,说明诊断试验预测的准确性越高。
如在人群中进行筛检试验,研究样本为人群的随机样本,预测值受人群总体患病率P0的影响。
已知P0,则预测值和灵敏度、特异度的关系可表示为:
举例
☐上例如用空腹血糖诊断门诊病人,试计算其阳性预测值和阴性预测值?
☐
= 227/227+21=91.53%
☐= 29/18+29 = 61.70%
☐例:上例若用空腹血糖在某社区人群中诊断糖尿病人,该人群中糖尿病人群的患病率为2.6%,试计算其阳性预测值和阴性预测值?
☐=
☐=5.56%
☐=
☐=99.67
(五)ROC曲线(诊断试验的线分析)
☐ROC曲线称接收者工作特征曲线,又称受试运算特性曲线(receiver operating characteristic, ROC)。
☐以Se为纵轴,以1-Sp为横轴,标出一系列不同界点的Se与1-Sp的交叉点,然后将这些交叉点连接成线,此线即ROC线。
☐当诊断试验的结果为计量或等级资料时,灵敏度、特异度、Youden指数、似然比等指标都会受诊断界值(或截断点)的影响。
☐当诊断指标为计量或等级资料时,随着诊断界值的改变,诊断试验的灵敏度和特异度会发生相应的改变,将不同诊断界值时所对应的(1-特异度)作为横坐标,相应的灵敏度作为纵坐标,用光滑曲线连接各((1-特异度),灵敏度)点,构成真阳性率对假阳性率的曲线即为ROC曲线。
☐ROC曲线可以描述不同诊断界值时诊断试验的灵敏度和特异度,反映了诊断试验中灵敏度和特异度随诊断界值变化而变化的关系,且不受人群患病率的影响,可用于综合评价诊断试验的诊断准确度。
☐ROC曲线可全面评价不同诊断界值时诊断试验的准确度,具有更好的概括性。
线分析相对全面,但复杂工作量大。
☐目前,ROC曲线分析是目前公认的评价诊断试验的最佳方法。
☐例:在一项考察空腹血糖(FPG,mmol/L)诊断糖尿病的诊断试验中,共收集245例糖尿病患者与50名正常人的空腹血糖,若以血糖≥5.6mmol/L为阳性标准,检测结果见表5-2。
试计算灵敏度和特异度、误诊率和漏诊率、ROC曲线。
表5-2 空腹血糖试验诊断结果
☐根据以上资料,分别取
灵敏度:0.00,0.25,0.50,0.75,1.00
1-特异度:0.00,0.25,0.50,0.75,1.00
☐绘制ROC曲线:
☐图中红色线为空腹血糖测量诊断糖尿病在不同界点时,各灵敏度和相应1-特异度的ROC曲线。
☐图中从左下到右上的对角线称为机会线,这时灵敏度=1-特异度,即真阳性率=假阳性率,表示诊断试验对患者和非患者检出阳性的概率相同。
因此,通常ROC曲线下面积取值在0.5~1之间。
☐当两个或多个诊断试验比较时,由于多个诊断界值对应多对灵敏度和特异度,直接比较不够概括,这时可计算ROC曲线下面积(记为Az)。
☐通常ROC曲线下面积取值在0.5~1之间,ROC曲线越接近机会线,曲线下面积越接近0.5,诊断价值越低;曲线越远离机会线,曲线下面积越接近1,诊断价值越高。
☐曲线B、C、D临床应用价值越来越高,曲线E临床应用价值最高,灵敏度和特异度接近100%。
ROC曲线下面积判断标准
☐一般情况下Az<0.7时,表示诊断价值较低;
☐Az在0.7~0.9之间时,诊断价值为中等;
☐Az>0.9以上时表示诊断价值较高。
☐ROC曲线下的面积计算可采用SPSS软件计算Az及其标准误。
☐例:已知例5-1中245名糖尿病患者和50名正常人的空腹血糖测量结果,试求图5-2中ROC 曲线下面积。
☐本例Az=0.937,S Az=0.013,p=0.000
☐从上图分析:ROC曲线从左下到右上表示诊断界值从大到小变化时,灵敏度逐渐增大,特异度逐渐减小;
☐曲线的斜率(即阳性似然比)为灵敏度/(1-特异度)。
如果折中考虑灵敏度和特异度,也可利用ROC曲线的斜率(阳性似然比)最大作为确定诊断界值的方法之一。
基本概念小结
●ROC曲线反映了灵敏度与特异度间的平衡(增加灵敏度将降低特异度;增加特异度将降低灵敏度)。
●在ROC曲线空间,如果曲线沿着左边线,然后沿着上边线越紧密,则试验准确度越高。
●在ROC曲线空间,如果曲线沿着机会线(45度对角线)越紧密,则试验准确度越低。
●在诊断界值(cutpoint)处的正切线的斜率就是该试验值对应的阳性似然比(likelihood ratio,LR)。
在ROC曲线空间的左下角LR+最大,随着曲线从左下往右上方移动,LR+逐渐减小。
●ROC曲线下面积是重要的试验准确度指标。
四、诊断试验的选择原则
1、需要敏感度高的诊断试验
1)病情严重但疗效好的疾病,如:肾上腺嗜铬细胞瘤
2)疗效较好的肿瘤,如:绒毛膜癌
3)存在多种可能的疾病诊断,目的在于删除某一诊断。
4)普查或定期检查。
2、需要特异度高的诊断试验
1)检查的目的是为了确诊。
2)病情严重但疗效和预后不好的疾病,检查的目的是为了防止误诊。
3、需要敏感度与特异度均高的诊断试验
病情十分严重,需尽快做出特殊处理的病人。
☐(一)诊断试验研究的统计推断
☐诊断试验也是抽样研究,同样存在抽样误差,也需要进行假设检验。
☐诊断试验指标的参数估计。
五、诊断试验研究的统计推断与评价
(一)诊断试验研究的统计推断
(二)诊断试验研究的评价
综合评价:常采用总一致性、调整一致性和Youden 指数。
例:已知D-二聚体测定可用于深部静脉血栓(DVT)诊断,若采用酶联免疫吸附方法(ELISA)测定D-dimer>0.25mg/L为阳性,结果如下表,试分析其诊断性参数?
(二)诊断试验研究的评价
(二)诊断试验研究的评价
诊断试验单点综合评价指标:
诊断试验的效能评价:
①诊断效率(diagnostic efficiency,DE)
DE=(a+d)/N DE≤0.5 废弃该试验DE>0.75 具有临床价值
②Kappa检验(一致性检验)
K值越接近1的试验效能越好
K<0.40诊断价值小
K界于0.40-0.74诊断效能一般
K≥0.75表明诊断准确性能好
(二)诊断试验研究的评价
③可用度(diagnostic reliablity,DR)
可用度是将假阳性预断值和假阴性预断值扣除后的可靠部分。
DR≥0.5的试验才有临床价值
④诊断指数(diagnostic index,DI)
它反映诊断试验的有效程度DI=Se+sp
DI<100 无效,此试验要淘汰。
DI≥150 试验具有较好的临床意义
最重要的有三个反映诊断试验真实性指标:Se、Sp和youden指数
(二)诊断试验研究的评价
验后概率的估计:指通过诊断方法确诊为阳性(或阴性)时受试对象患某病(未患某病)的概率。
1)将患病率(验前概率)转换为验前比(pre-test odds)
验前比= 验前概率/(1-验前概率)
2)计算阳性似然比:阳性似然比=Se/(1-Sp)
3)计算验后比:验后比= 验前比×似然比
4)将验后比转换为验后概率:验后概率= 验后比/(1+验后比)
诊断试验的似然比综合了敏感度和特异度的信息,在已知患病率与似然比的情下,可以根据诊断试验特定测量值相应的似然比计算验后比,从而准确地估计单个病人的患病率,以帮助临床医生的诊断决策。
(二)诊断试验的研究与评价
例:患者女,50岁,有间歇性的胸前绞痛,被当地医生怀疑心肌梗死,根据该医院的病例统计,该年龄段有此症状的妇女患心肌梗死的可能性为64%(验前概率)。
在实验室为该病人进一步作血清肌酸激酶检查,结果为120ug/g。
该医院曾以冠脉造影检查作金标准,用血清肌酸酶诊断心肌梗死阈值为80ug/g,血清肌酸激酶大于该值为急性心肌梗死,该酶诊断心肌梗死的敏感度为90%,特异度为83%。
请判断该患者患急性心肌梗死的概率是多少?(把握度)
(二)诊断试验的研究与评价
验前概率=0.64
验前比= 0.64/(1-0.64)=1.8
阳性似然比= Se/(1-Sp) = 0.9/(1-0.83)=5.3
验后比= 验前比×然似比=1.8 ×5.3=9.54
验后概率= 验后比/(1+验后比)= 9.54/(1+9.54)=0.91
结论:患者经血清肌酸激酶试验阳性后,患急性心肌梗死概率为91%,比验前概率明显升高,对该患者患急性心肌梗死的诊断有91%的把握。
(二)诊断试验研究的评价
两个诊断试验的点比较
在界点确定的条件下,比较两个诊断试验的效能,采用两个试验的Se和Sp综合直接进行U检验。
公式如下:
N+ 患本病的受检人数N- 未患本病的受检人数
判断直接以1.96和2.58判为两试验差别有显著意义
或有极显著意义
六、提高诊断试验临床价值的策略
(一)提高试验的预断值
1、选择择高危人群作为研究对象。
2、设立专科门诊,选择有特殊表现的人群。
假设某诊断试验Se=0.9 Sp=0.9 那么PV+=0.9
如果选择高危人群或专科病人,患病率为0.5,抽样200人查出100人阳性,其中有90人为真正患者.
如果选择的人群患病率为1/1000 ,则阳性预测值是0.009, 即查出的1000个阳性者中,只有9个是真正患该病的患者,991个是假阳性.
1.平行试验(并联实验):同时做几种试验,只要有一个是阳性,即可认为是该病的患者。
提高了诊断的敏感度和阴性的预测值,减少了漏诊率,但增加了误诊率。
SeCo=SeA+(1-SeA) ×SeB
联合敏感度=A敏感度+[(100%-A敏感度)×B敏感度]
SpCo=SpA ×SpB
联合特异度=A特异度×B特异度
(二)采用联合实验方法
例:糖尿病的早期诊断常用尿糖和血糖实验。
两法单独使用时,其敏感度较低。
已知血糖试验敏感度为75.38%,特异度为99.58%。
而尿糖的敏感度为65.83%,特异度为99.59%。
采用上式计算联合敏感度为82.41%,联合特异度为99.45%。
六、提高诊断试验临床价值的策略
2.系列试验(串联试验):指在一系列实验每一项均为阳性,才可判断为阳性。
此法可提高Sp 和PV+,但会降低Se和PV-,减少误诊率增加漏诊率。
SeCo=SeA×SeB(联合敏感度=A法敏感度×B法敏感度)
SpCo=SpA+(1-SpA) ×SpB
联合特异度=A特异度+[(100%-A特异度)×B特异度]
例:采用两种试验诊断卵巢恶性肿瘤,一种是测定血清卵巢相关抗原CA125,单独使用该法特异度为82.9%。
另一种试验是测定血清唾液酸SA。
单独使用SA特异度为88.9%。
采用系列实验后其特异度提高到97.8%。
六、提高诊断试验临床价值的策略
3、灵活运用界点:
☐为筛选或排除某一疾病,应该采用高Se与Sp相对低的界点。
☐若为确诊某一疾病,则必须采用高Sp与Se较低的界点。
在急于做出基本诊断的情况下,可运用Se与Sp兼顾的界点。
4、注意界点个性化
5、进行动态观察
学习目的:
1.了解提高诊断试验效率的策略。
2.掌握诊断试验的设计原理和步骤。
3.熟练掌握诊断试验的常用指标体系。
4.了解界定值在诊断试验中的作用。
5.掌握评价诊断试验真实性的指标及其体系。
6.理解平行试验和体系试验的基本概念。
1.诊断试验的基本定义和意义?
2.说明诊断试验中试验组与对照组的区别与联系?
3.何谓金标准?根据掌握的临床医学知识,例举5种金标准。
4.说明诊断试验真实性的常用指标定义,及其误差和漏诊的关系?
5.平行试验、系列试验何联合试验有何特点及其区别?。