临床科研设计诊断试验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临床科研设计诊断试验
◆诊断试验的基本原理
◆诊断试验设计方法
◆诊断试验的评价指标
◆诊断试验常用统计方法
✓配对设计卡方检验
✓ROC曲线分析
✓配对t检验
✓Bland-Altman分析
◆诊断试验报告规范
1.诊断试验的概念
◆诊断试验(diagnostic test):是指应用实验、仪器设
备等手段对疾病进行诊断的一切检测方法。
◆包括各种实验室检查(生物化学、免疫学、微生物学、
病理学等)、影像诊断(超声波、CT、X线、核磁共振
等)、仪器检查(心电图、脑电图、核素扫描、内窥镜
等),还包括病史询问、体格检查等。
诊断试验的用途
–诊断疾病
–筛选无症状的病人
–判断疾病的严重程度
–估计疾病临床过程及预后
–估计对治疗的反应
–判断治疗效果
诊断试验的用途——疾病筛检
筛检是通过快速的试验、检查或其他措施,在表面健康的人群中去发现未被识别的病人或有缺陷的人。
筛检不是诊断试验,仅是一种初步检查,对筛检阳性者必须进一步确诊,以便对其采取必要的措施。
实施原则:
• 1、该地区当前重大的公共卫生问题;
• 2、有可识别的早期客观指征与测量标志;
• 3、对所筛检疾病的自然史了解清楚;
• 4、筛检方法快速、简便、安全可靠、经济,易为群众接受;
• 5、对经筛检发现并确诊的病人及高危人群能进行及时有效的干预和治疗;
• 6、筛检效果从各方面权衡,有好的收益;
• 7、筛检计划为目标人群接受,并可从生理、心理和社会生活等方面获益。
诊断试验的基本原理
①用金标准进行检查或检验,可将试验对象分为两组,即金标准确诊的患某病组及金标准排除的未患某病组。
②用新方法进行的诊断试验所得出的患病与未患病的结果
分别与金标准方法所得出患病与未患病的结果比较,根据其是否一致对试验方法进行评价。
③如果新方法试验所得的结果与金标准试验所得结果符合程度越高,这个新方法的诊断价值就越高,反之亦然。
2.诊断试验设计要点
•确定金标准
•选择研究对象
•进行样本量估算
•盲法、独立和同步比较诊断试验和“金标准”结果
•计算诊断试验的相关指标及统计分析
确定金标准
•当前医学界公认的诊断某疾病最可靠、准确度最高的诊断方法。
•常用的金标准包括
–病理学诊断(活检、尸检)
–外科手术或诊断性操作
–特殊的影像学诊断
–权威机构颁布的综合诊断标准
选择研究对象
•要求:代表性好、盲法
•试验组
–经金标准确诊为某疾病的患者,具有反应该疾病
的全部特征,如病情、病程、症状体征、并发症、
治疗或未治疗等。
•对照组
–经金标准证实未患该疾病的患者(可患其它疾病)或正常人。
样本量估算
•样本含量估计的要素:
•①真实性指标(灵敏度、特异度)的水平;
•②检验水准α,即I类误差的概率;
•③允许误差δ。
盲法、独立和同步比较诊断试验和“金标准”结果•采用盲法评价诊断试验结果十分重要,即要求判断诊断试验结果者不能预先知道研究对象是否患病,而按照
“金标准”判断研究对象是否有病者不能知道诊断试验
的结果。
•某些情况下,“金标准”建立在一系列试验和相关临床资料的基础上。
此时“金标准”不能包括所研究的诊断
试验,否则可能发生掺合偏倚,增加两者的一致性,扩
大诊断试验的准确性。
(独立)
•诊断试验和“金标准”检查应同步进行,这对急性、自限性疾病尤为重要,因为疾病进展的不同阶段诊断结果
不相同。
计算诊断试验的相关指标及统计分析
诊断试验的评价指标
•基本指标
–灵敏度、特异度、误诊率、漏诊率
•预测值
–阳性预测值、阴性预测值
•综合评价指标
–正确率、约登指数、优势比、似然比
•阳性似然比、阴性似然比
3.真实性评价
真实性(Validity)又称有效性或准确度(Accuracy ),是指诊断试验所获得的测量值与实际值(“金标准”)的符合程度。
真实性指标:灵敏度,特异度,约登指数,一致性,似然比
◆1、灵敏度(Sensitivity):是试验发现有病的人的
能力,即实际(金标准)诊断为“有”病的病例中,诊
断性试验检测为阳性例数的比例。
◆2、特异度(Specificity ):是甄别出没有病的人的能
力,即实际(金标准)无病的例数中,诊断试验结果为
阴性的比例。
◆3、假阴性率(False negative ):在金标准方法已确
诊患某病组中,新试验方法错判为阴性的比例,即假阴
性所占的百分率。
也叫漏诊率,漏诊率与灵敏度互为补
数。
◆4、假阳性率(False positive):在金标准方法已确
诊未患某病组中,用新方法试验将其错误判定为阳性,即假阳性部分所占的百分率。
也叫误诊率。
灵敏度和特异度的关系
•都是反映诊断试验准确性的最基本指标
•提高一方面水平,会降低另一方面水平
•一般选择敏感度和特异度都较高的试验作为诊断依据–根据研究目的,调整灵敏度和特异度来确定临界值
–以产生漏诊和误诊之和最小时的数据确定临界值。
◆5.约登指数
•约登指数(Youden’s index)又称正确诊断指数,是灵敏度与特异度之和减1。
•约登指数=灵敏度+特异度-1
•指数范围从0~1,约登指数越接近于1,诊断试验的真实性越好,反之越差。
•约登指数表示诊断试验能够正确地判断病人和非病人的能力。
◆6.一致性
分为粗一致性(Crude agreement)和调整一致性(Adjusted agreement)。
粗一致性和调整一致性说明诊断检试验阳性与阴性结果均正确的百分比。
它表示诊断试验的真实性。
◆7.似然比(likelihood ratio)
似然比为病人中出现某种检测结果的概率与非病人中出现相应结果的概率之比。
(1) 阳性似然比(Positive likelihood ratio)
是指真阳性率与假阳性率之比,说明病人中出现某种检测结果阳性的概率是非病人的多少倍。
(2) 阴性似然比(negative likelihood ratio)是指假阴性率与真阴性率之比,说明病人中出现某种检测结果阴性的概率是非病人的多少倍。
阳性似然比越大筛检试验的真实性越好;筛检试验才可能具有临床价值,阴性似然比越小筛检试验的真实性越好。
4.可靠性评价
•可靠性(Reliability)又称精密性(Precision)或重复性(Reproducibility) ,是指在相同条件下重复试验获
得相同结果的稳定程度。
具体地讲,可靠性是指某一诊
断方法重复测量同一受试者时所获结果的一致性。
•具体评价的方法是在相同的条件下,用待评价的诊断试
验对同一组研究对象作两次相同的测量,根据两次测量结果计算相应指标,进行分析评价。
影响诊断试验可靠性的因素
•研究对象的生物学差异同一指标对同一受试者重复测量时,测量结果不一致的现象。
•实验因素所致的差异实验所用的仪器、设备、试剂实验条件不稳定或等采用非同一批次试剂时,均可导致重复实验结果的差异。
•观察者的差异由同一观察者或不同观察者对相同受试者的同一指标测量时,其结果会不一致。
5.联合试验
•联合试验是指采用多个筛检试验检测一种疾病,达到提高筛检试验灵敏度或特异度的目的,以满足提高筛检试验真实性的需要。
•(1)串联试验(serial test)也称系列试验,是指采用几种筛检方法检测疾病,只有全部检测均为阳性者才判为阳性,凡有一项检测结果为阴性即判为阴性。
•(2)并联试验(parallel test)也称平行试验,是指采用几种筛检方法检测疾病,凡有一项检测为阳性者即判为阳性,所有检测均为阴性才判为阴性。
如果两个筛检试验彼此完全独立,则可以采用下列公式计算联合试验的灵敏度和特异度。
•并联试验的灵敏度=A灵敏度+(1-A灵敏度)×B灵敏度
•并联试验的特异度=A特异度×B特异度
•串联试验的灵敏度=A灵敏度×B灵敏度
•串联试验的特异度=A特异度+(1-A特异度)×B特异度
在联合试验时,应先进行特异度高的试验,后用灵敏度高的试验,这样筛检的效率更高。
6.预测值
在实验医学,临床试验本身特点决定了试验的灵敏度和特异度,但灵敏度和特异度本身不能帮助临床医生。
临床医生想知道如果诊断试验阳性(+PV) 或阴性,试验本身是正确的概率。
阳性预测值:如果诊断试验结果是阳性“病人”真正有病的可能性。
阴性预测值:如果试验结果是阴性,“病人”真正无病的概率。
预测值与灵敏度、特异度的关系
患病率不变的情况下:
随着灵敏度的升高,阴性预测值升高,阳性预测值下降;随着特异度的升高,阳性预测值升高,阴性预测值下降。
阳性预测值与特异度同向变化;阴性预测值与灵敏度同向变化
7.诊断试验常用统计方法
配对设计包括:
•①同一批样品用两种不同的处理方法。
•②两个评估者对研究对象进行逐一评估。
•③观察对象根据配对条件配成对子,同一对子内两个体分别接受不同的处理。
观察结果均分为k个相同的类别,资料可归纳整理成k×k 的表格形式,又称为方表。
这样的资料又称为方表资料。
•对于配对设计的分类资料,若研究目的为分析两种方法(即行变量和列变量)之间的相关关系(包括是否有关
联、关联程度及一致性),应选用关联度分析及一致性
检验( Kappa 检验);
•若研究目的为分析两种方法间是否存在差异则应用优势性检验(McNemar检验)。
ROC曲线分析
受试者工作特征曲线(Receiver Operator Characteristic curve,简称ROC曲线)
•表示一个特定的诊断方法对区别特定的患者组与非患
者组样本的检测性能。
•表示不同诊断水平的真阳性率对假阳性率的函数关系。
•完全无价值的诊断试验其ROC曲线与机会线重合,而ROC曲线越偏离机会线,ROC曲线下面积就越大,则诊断试验的真实性也就越好。
ROC曲线评价方法
•以灵敏度和假阳性率为两个轴的取值作的图性;
•通常用于测定值为连续或等级数据;
•常用于确定最佳临界值,也可用于比较两种和两种以上诊断试验的诊断价值。
•以试验灵敏度为y轴,以假阳性率为x轴,由不同决策界值产生图中各个点,采用线段连接图中所有的点,绘制而成的线图。
•图中反映了随着灵敏度的增加,假阳性率也随之增加。
ROC曲线的特点
•综合了灵敏度和特异度两个指标;
•不受患病率的影响;
•考虑了所有可能的诊断临界值的影响;
•全面客观地评价诊断试验的准确性;
•描述了诊断试验区分事件发生与不发生的固有能力。
ROC曲线下的面积
•ROC曲线和X轴围成的面积占总面积的百分比作为曲线
面积的估计值。
•曲线越接近左上角,面积越接近1,说明试验的准确度越高;
•越接近对角线,越接近0.5,则说明试验的准确度越差;
•一般认为:面积在0.5~0.7之间时诊断价值较低,在
0.7~0.9之间时诊断价值中等,在0.9以上时诊断价
值较高。
最佳诊断界值的确定
•ROC曲线上最靠近左上角的点所对应的灵敏度和特异度都是较大的,该点为ROC曲线的正切线与曲线相交的
点,常以此点所对应的诊断界值作为最佳诊断界值。
–灵敏度+特异度最大的点就是最佳诊断界值。
–通过解拟合ROC曲线的方程寻找该点。
ROC分析主要做三件事:
➢计算ROC曲线下面积及其95%CI
➢绘制ROC曲线图
➢寻找截断点(cut off)
ROC曲线下面积的临床意义
➢小于0.7,表示诊断准确度较低;
➢0.7~0.9,表示诊断准确度为中等;
➢大于0.9,表示诊断准确度较高。
截断点(cut off)的选择
•在该截断点下作的诊断:
➢误诊率与漏诊率之和为最小;
➢或灵敏度与特异度之和最大。
两条ROC曲线的比较
•可信区间法:计算两条曲线AUC的可信区间
–如果两个可信区间有重合部分,则表示两种方法诊断价值的差异无统计学意义;反之则AUC值大
的那种方法的价值更高。
配对t检验
缺点:只能评价整体平均的差别,不能区分个案的波动。
强调统计学意义,容易忽视临床意义。
Bland—Altman分析基本原理
•Bland—Altman分析用于评价测量结果为连续资料的两种测量方法一致性的方法,最初是由Bland JM和Altman DG于1986年提出的。
•它的基本思想是计算出两种测量结果的一致性界限,并用图形的方法直观地反映这个一致性界限。
最后结合临
床实际,得出两种测量方法是否具有一致性的结论。
•在进行两种方法的测定时,通常是对同一批受试对象同时进行测量。
•这两种方法一般不会获得完全相同的结果,总是存在着有一定趋势的差异,如一种方法的测量结果经常大于
(或小于)另一种方法的结果,这种差异被称为偏倚。
•偏倚可以用两种方法测定结果的差值来表示。
如果两种测量结果的差异位于一致性界限内,在临床上是可以接受的,则可以认为这两种方法具有较好的一致性。
如果两种测量方法中没有一种是“金标准”,或者不能确定哪种方法一定反映真实值,则可以用两种测量结果的平均值作为最终测量结果。
•Bland-Altman图以图形的方式反映一致性界限。
在二维直角坐标中,用横轴x表示两种方法测量每个对象的平均值,纵轴y表示两种方法测量每个对象的差值,即可得到Bland—Altman图。
•图中上下两条水平实线代表临床可接受的一致性界限的上下限,中间实线代表差值的均数,虚线代表差值均数为0。
•两种测量方法的一致程度越高,代表差值均数的实线越接近代表差值均数为0的虚线。
根据一致性界限外的数据点数和一致性界限内的最大差值,以及临床上的可接受程度,对待评价的两种方法的一致性做出评价。
•Bland-Altman图还清楚地显示了观察过程中出现的极端情况。
8.诊断准确性研究的报告标准,即STARD标准。
•STARD项目组正是为了改进诊断准确性研究报告质量而
发起的,通过建立一个科学、规范、循证的报告标准,使得读者能够通过完整、准确的报告评价研究结果的内部有效性潜在偏倚和外部有效性适用性。
•2000年9月在荷兰阿姆斯特丹举行的共识会议上,相关领域专家根据各个条目与结果偏倚内部有效性和诊断准确性测量结果的差异外部有效性证据决定保留或去除该条目,最终形成了一个由25项条目组成的清单表。