诊断实验研究及其评价
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
诊断实验研究及评价
1.是否与金标准进行同步独立盲法比较
待评价诊断试验或指标应与金标准同步盲法(独立)测量与判断。
⏹标准诊断方法也称为金标准是指临床医学界公认的当前最客观、最真实、
最可靠的疾病诊断标准。常用的金标准。
病理学诊断(组织活检或尸体解剖);
外科手术发现;
特殊的影像诊断(如冠状动脉造影诊断冠心病);
病原学诊断;
临床综合诊断;
长期随访获得的肯定诊断。
阅读诊断研究文献时,首先要检查文章的作者是否对每一位被研究对象在进行所考核的诊断试验时,都采用了合适的金标准,并独立判定结果。
2. 研究对象的来源与构成情况是否清楚
⏹研究对象来自哪类哪级医院,其验前概率(患病率)差别很大,从而影响试验结果
对疾病的预测值。
(1)灵敏度与特异度
当患病率稳定时,若试验的灵敏度越高,则阴性预测值越高;若试验的特异度越高,则阳性预测值越高。
(2)患病率
当灵敏度与特异度稳定时,若患病率越高则阳性预测值越大;若患病率越低阴性
⏹病例组是否包括该病的各种不同临床类型病人(轻、中、重;早、中、晚期;典型
的、非典型的;有、无并发症;治疗过、未治疗过等)。
⏹对照组是否包括了确实无该病的其他病例,并且应包括易与该病相混淆的其他疾病
病人。一般不能只选正常人做对照。
⏹病例组、对照组是否属于同期进入研究的连续样本或者是按比例抽样样本,而不能
由研究者随意选择。
3.样本含量是否足够
⏹公式计算:诊断试验的样本含量取决于对试验灵敏度、特异度和容许误差的要求。
⏹经验数据:病例组、对照组一般分别不得低于100例,特殊情况下每组也至少30
例以上。
4.对“正常”值的定义是否准确、合理
⏹对“正常值”的定义直接影响诊断试验的敏感度、特异度等指标和新诊断实验本身的
真实性及其应用价值,正常值的方法和诊断阈值的确定是否合理和可靠。
⏹应该根据具体病情而定:
确定标准时应遵循的基本原则
⑴鉴别诊断试验的繁简程度;
⑵漏掉一个可能病例的后果是否严重,早诊断疗效佳取高灵敏度,反之取高特异
度;(诊断标准降低,使灵敏度升高,特异度下降,误诊率提高,漏诊率下降。反
之,诊断标准提高,使灵敏度降低,特异度上升,误诊率降低,漏诊率上升。)
⑶隔一定间隔期后再一次检查的可能性;
⑷该病的患病率:患病率高时诊断标准要放宽,以减少假阴性;患病率低时诊断
标准要严格,以减少假阳性。
具体方法:
⑴将普通作为正常:
1)百分位数法:①数值呈偏态分布;②不能确定分布型数据。
2)平均值加减标准差法:通常以平均值之上或之下2个标准差作为截断值。
在正态分布的数据,平均值±2个标准差(±2S)包括了95%的数据。若资料呈
正态分布,则在分布的两侧各有2.5%的人被确定为异常
⑵异常与疾病相联系
①绘制受试者工作特性曲线(receiver operator characteristic,ROC),取其左上角拐
弯处之点作截断值。
②取正确诊断指数最大时的测量值作为截断值。
正确指数=l-(假阳性率十假阴性率)=灵敏度十特异度- 1
⑶按可治疗界值划分
按研究者的意愿规定的数值作为标准或人为决定。如根据在什么标准时进行治疗可以利大于弊。此时既要考虑并发症发生率、病死率,又要考虑费用、效益等。
2)受试者工作特性曲线是以取不同阳性判断标准时的灵敏度为纵坐标,误诊率为横坐标绘制所得的曲线。它表示灵敏度与特异度之间的相互关系。
ROC曲线常用来决定最佳临界点,通常最接近左上角那一点,可定为最佳临界点。
5. 评价指标是否合适并正确计算与解释
⏹是否仅简单计算两组的集中趋势及其变异系数或率及其标准误,并进行相应的t检
验或χ2 检验。
⏹诊断试验的评价指标应采用真实性(灵敏度、特异度、误诊率、漏诊率、正确诊断
指数)、似然比(阳性、阴性似然比)、预测值(阳性、阴性预测值)。
6.诊断试验的可靠性高低
⏹是否严格控制试验条件和观察者变异范围,并应详细报道。
⏹可靠性评价是否根据数据类型分别采用个体内相关系数、Kappa系数、Kendall相关
系数等指标。
(1)计量资料的评价方法
采用单因素方差分析,通过计算个体内相关系数(p)评价此类数据的可靠性。一般地说,p≥0.7,表明数据可靠性较高。
(2)计数资料的评价方法
采用Kappa检验,通过计算Kappa系数可以评价计数资料的可靠性。其参考标准为:k≤0.40表明可靠性差;0.40 (3)等级资料的评价方法 等级资料可通过计算两次观察结果的Kendall相关系数(t)来对数据可靠性进行评价。一般地说,t>0.6表示数据基本可靠,t>0.8表示数据可靠性较好。 7.作为整组诊断试验的组成部分的试验应检测其贡献率 ⏹如果是联合诊断试验,是否每一个试验的敏感度和特异度等重要指标都进行了测量, 对联合试验研究中每一个单独的诊断试验进行全面评价,才能准确判断联合试验的真实性,并为读者提供了解及应用这些试验的客观依据。 8.是否详细介绍具体方法与注意事项 ⏹新的诊断试验能被迅速普及应用才能产生社会效益,使更多的病人得到及时正确诊 断和治疗,因此,是否详细介绍诊断试验的操作步骤、仪器设备、试剂、试验条件、注意事项等,利于他人重复或应用。即是诊断试验所用的仪器型号、试验条件、试验步骤、试剂质量等要统一、标准化。 ⏹观察指标要客观、特异,判断结果的标准要明确具体。 ⏹参与调查的研究者应经过严格培训。 9.是否进行效用分析与适用性分析 ⏹诊断试验的实用价值是否予以描述,是否对新的诊断试验有效性、有无不良反应、 可能带来的社会经济效益、安全性、病人接受程度等作出实事求是的评价。 10.诊断指标的选择 ⏹1.客观指标能用客观仪器测定,很少依赖诊断者及被诊断者的主观意识,如体温、 血红蛋白等。 ⏹2.主观指标完全根据被诊断者的主观感觉,如疼痛、愉快等。 ⏹3.半主观指标根据诊断者的主观感知判断,如肿物的硬度、中医切脉等。 ⏹以上3类指标以客观指标质量最好,以主观指标质量最差,在进行诊断时,应 该尽可能选择客观指标。