医学科研设计与论文写作:6诊断性试验研究及其评价)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 临床关心的是疾病的有无、试验结果的阳性或阴性,这也正是采用四格表 对诊断性试验的各项指标进行评价的基础。目前大多数诊断方法、特别是 实验室诊断多为定量结果,对这种连续变量首先需要确定阳性和阴性的临 界值,即对受试对象的诊断指标数据确定参考值,实际上就是将数据简化 为直接用于临床的结果,然后将试验结果即阳性和阴性结果和金标准分类 结果填入四格表进行诊断性试验属性分析,通常包括敏感性、特异性、准 确性和似然比等,从而判断试验的精确性。参考值的确定根据数据的统计 学分布,常用的有均数加减标准差、百分位数等方法,也可利用受试者工 作曲线进行确定,当然有些临床参考值是来自长期的临床实践,是对产生 疾病后果的危险性大小认识的结果,如高血压的参考值。
• 更精确可按照估计总体率的样本含量估算方法,分别计算“有病”组样本含量n1; “无病组”的样本含量n2;△为允许误差。
• 例:超声波n对1胆Z囊2结S石en诊(1断2的S敏en感)度为80%,特n异2 度Z为26S0p%e。(12试问S应pe检) 查多少患
者,才能具有统计学意义?
设α=0.05,Za=1.96(双侧),Sen=0.80,Spe=0.60,设△=0.10, 代入公式得 n1=62例;n2=93例
诊断性试验研究及其评价
诊断试验的评价
诊断
▪ 把病人与可疑有病但实际 无病者区别开来的方法或 手段。
诊断试验
▪ 用于评价诊断技术 优劣的试验称为诊 断试验。
诊断 试验
金标准
有病
无病
合计
阳性 a(真阳性) b(假阳性) a+b 阴性 c(假阴性) d(真阴性) c+d
合计 a+c
b+d
N
诊断性试验设计的基本原则
– 作ROC曲线只靠一、二
次试验结果是不可能找
到正确的临界点的,一
般要求最少有五组连续
分组测定数据用以制图
。ROC曲线还可以用来
比较两种或两种以上诊
断性试验的诊断价值。
正
常
临
界
值
放射性核素RN与CT扫描诊断脑肿瘤的 饭后血糖值诊断糖尿病的
的 选
ROC曲线
ROC曲线
择
提高试验效率的一些方法:
试验人群选择; 截断点选择; 串联、并联
ROC曲线(receiver operator characteristic curve)
又称受试者工作特征曲线,在诊断性试验中,用于正常值临界点的正确选择,对临 床实验室工作甚为重要。
制图时以该试验的敏感度(真阳性率)为纵坐标,以1-特异度(假阳性率)为横坐 标,依照连续分组测定的数据,分别计算Sen及Spe,将给出各点联成曲线,即为 ROC曲线。距左上角最近的一点,即为正常值的最佳临界值,这一点下的曲线面积 最大。用该点数值区分正常与异常,其敏感度及特异度都比较高,而误诊及漏诊例 数之和最小。
这些研究对象的试验结果才可能具有
对研究疾病的代表性和鉴别诊断的价 合计
a+c
b+d
N
值。
盲法比较诊断性试验与金标准的结果
• 评价诊断性试验时,采用盲法具有十分重要的意义,即要求判断试验结果 的人,不能预先知道该病例用金标准划分为“有病”还是“无病”,以免 发生疑诊偏倚。
• 新的诊断性试验,对疾病的诊断结果应当与金标准诊断的结果进行同步对 比,并且列出四格表,以便进一步评估 。有些资料,如从论著资料中的数 据,不能列出四格表的诊断性试验,则无法进行评价。
选择研究对象
选择对照
• 对照组可选用金标准证实没有目标疾 诊断
金标准
病的其他病例,特别是与该病容易混 试验 淆的病例,以期明确其鉴别诊断价值。
有病
无病 合计
正常人一般不宜纳入对照组。这些病
例可能存在与研究疾病相同或类似的 阳性 a(真阳性) b(假阳性) a+b
症状和体征,而单纯临床诊断难以区
别,极易发生误诊。只有包括了上述 阴性 c(假阴性) d(真阴性) c+d
确定金标准 确定样本量 选择研究对象 试验结果与金标准分类结果
比较
样本量
• 足够的样本量是排除机会干扰、如实反映诊断性试验准确性的保证,使评价指标 如敏感性和特异性能如实反映诊断性试验的特性。通常随样本量的增加,真正反 映试验的评价指标的准确性也增加。比如,在只有10个受试对象时,观察到的敏 感性为0.75,由于机会的作用,敏感性可能高到1.00,也可能低至0.45,随着样本 量增加,95%的可信区间的范围逐渐变窄,样本量达到30个时,可信区间的上限 降为80%,下限升为60%,此时随样本量的增加,可信区间变窄的幅度明显减缓, 因此样本量应至少在30个以上,才能保证结果受机会影响的程度在能接受的范围。
选择研究百度文库象
选择病例
金标准
•
病例组应包括各型病例: 如典型和不典型的,早、
诊断 试验
有病
无病 合计
中与晚期病例,轻、中
与重型的,有和无并发 阳性 a(真阳性) b(假阳性) a+b
症者等,以便使诊断性 试验的结果更具有临床 阴性 c(假阴性) d(真阴性) c+d
实用价值。
合计 a+c
b+d
N
病例代表性的好坏,将直接影响对筛检或诊断试验的评 价结果的普遍性和推广价值。
• 更精确可按照估计总体率的样本含量估算方法,分别计算“有病”组样本含量n1; “无病组”的样本含量n2;△为允许误差。
• 例:超声波n对1胆Z囊2结S石en诊(1断2的S敏en感)度为80%,特n异2 度Z为26S0p%e。(12试问S应pe检) 查多少患
者,才能具有统计学意义?
设α=0.05,Za=1.96(双侧),Sen=0.80,Spe=0.60,设△=0.10, 代入公式得 n1=62例;n2=93例
诊断性试验研究及其评价
诊断试验的评价
诊断
▪ 把病人与可疑有病但实际 无病者区别开来的方法或 手段。
诊断试验
▪ 用于评价诊断技术 优劣的试验称为诊 断试验。
诊断 试验
金标准
有病
无病
合计
阳性 a(真阳性) b(假阳性) a+b 阴性 c(假阴性) d(真阴性) c+d
合计 a+c
b+d
N
诊断性试验设计的基本原则
– 作ROC曲线只靠一、二
次试验结果是不可能找
到正确的临界点的,一
般要求最少有五组连续
分组测定数据用以制图
。ROC曲线还可以用来
比较两种或两种以上诊
断性试验的诊断价值。
正
常
临
界
值
放射性核素RN与CT扫描诊断脑肿瘤的 饭后血糖值诊断糖尿病的
的 选
ROC曲线
ROC曲线
择
提高试验效率的一些方法:
试验人群选择; 截断点选择; 串联、并联
ROC曲线(receiver operator characteristic curve)
又称受试者工作特征曲线,在诊断性试验中,用于正常值临界点的正确选择,对临 床实验室工作甚为重要。
制图时以该试验的敏感度(真阳性率)为纵坐标,以1-特异度(假阳性率)为横坐 标,依照连续分组测定的数据,分别计算Sen及Spe,将给出各点联成曲线,即为 ROC曲线。距左上角最近的一点,即为正常值的最佳临界值,这一点下的曲线面积 最大。用该点数值区分正常与异常,其敏感度及特异度都比较高,而误诊及漏诊例 数之和最小。
这些研究对象的试验结果才可能具有
对研究疾病的代表性和鉴别诊断的价 合计
a+c
b+d
N
值。
盲法比较诊断性试验与金标准的结果
• 评价诊断性试验时,采用盲法具有十分重要的意义,即要求判断试验结果 的人,不能预先知道该病例用金标准划分为“有病”还是“无病”,以免 发生疑诊偏倚。
• 新的诊断性试验,对疾病的诊断结果应当与金标准诊断的结果进行同步对 比,并且列出四格表,以便进一步评估 。有些资料,如从论著资料中的数 据,不能列出四格表的诊断性试验,则无法进行评价。
选择研究对象
选择对照
• 对照组可选用金标准证实没有目标疾 诊断
金标准
病的其他病例,特别是与该病容易混 试验 淆的病例,以期明确其鉴别诊断价值。
有病
无病 合计
正常人一般不宜纳入对照组。这些病
例可能存在与研究疾病相同或类似的 阳性 a(真阳性) b(假阳性) a+b
症状和体征,而单纯临床诊断难以区
别,极易发生误诊。只有包括了上述 阴性 c(假阴性) d(真阴性) c+d
确定金标准 确定样本量 选择研究对象 试验结果与金标准分类结果
比较
样本量
• 足够的样本量是排除机会干扰、如实反映诊断性试验准确性的保证,使评价指标 如敏感性和特异性能如实反映诊断性试验的特性。通常随样本量的增加,真正反 映试验的评价指标的准确性也增加。比如,在只有10个受试对象时,观察到的敏 感性为0.75,由于机会的作用,敏感性可能高到1.00,也可能低至0.45,随着样本 量增加,95%的可信区间的范围逐渐变窄,样本量达到30个时,可信区间的上限 降为80%,下限升为60%,此时随样本量的增加,可信区间变窄的幅度明显减缓, 因此样本量应至少在30个以上,才能保证结果受机会影响的程度在能接受的范围。
选择研究百度文库象
选择病例
金标准
•
病例组应包括各型病例: 如典型和不典型的,早、
诊断 试验
有病
无病 合计
中与晚期病例,轻、中
与重型的,有和无并发 阳性 a(真阳性) b(假阳性) a+b
症者等,以便使诊断性 试验的结果更具有临床 阴性 c(假阴性) d(真阴性) c+d
实用价值。
合计 a+c
b+d
N
病例代表性的好坏,将直接影响对筛检或诊断试验的评 价结果的普遍性和推广价值。