证据的分类 分级与

合集下载

临床研究证据的分类、分级和来源

临床研究证据的分类、分级和来源

观察性研究(描述性和分析性研究)
特点: - 研究者不能主动控制研究条件 - 可为前瞻性和回顾性 类型: - 队列研究 - 病例对照研究 - 横断面研究 - 叙述性研究
试验性研究
---- 临床试验 特点: - 研究者可主动控制研究条件 - 可随机分配 - 前瞻性研究 类型: - 随机对照试验 - 交叉试验 - 自身前后对照试验 - 临床同期对照试验
Quasi-randomized control trial
与随机对照试验相似 唯一区别:采用半随机分配方式
按试验对象的生日、住院日或住院号等末尾数 字的奇数或偶数分配研究对象 交替分配研究对象
容易受偏倚因素的影响 结果的真实性、可靠性不及RCT
半随机对照试验设计模式
试验组
研究 合格研 半随机 对象 究对象
例:乙型肝炎病毒与原发性肝癌病因学研究 Lancet 1981;11:1129
肝癌(40)
HBsAg(+) 台湾 社保 人员 无肝 Ca者 (?) 无肝癌(3414)
观察5年
HBsAg(-)
肝癌(1)
无肝癌 (19252)
样本指向
+ -
HBsAg
肝 癌 有 无 40 3414 1 19252
两组发生肝癌的相对危险度: RR=[40/(40+3414)]/[1/(1+19252)] =223
第三章 临床研究证据的 分类、分级和来源


临床研究证据的分类
临床研究证据的分级
临床研究证据的来源
证据的分类
按研究方法分类
原始临床研究证据
按研究问题分类
病因临床研究证据
按用户需要分类
系统评价

证据等级与推荐强度评估

证据等级与推荐强度评估

证据等级与推荐强度评估引言在当前的科学研究和医疗实践中,为了评估证据的可靠性和推荐对策的强度,人们采用了一系列标准和指南。

证据等级与推荐强度评估体系的使用可以帮助医生、研究人员和决策者做出更科学、准确和可靠的决策。

本文将介绍证据等级和推荐强度评估的基本概念、评估标准以及应用范围。

证据等级评估什么是证据等级评估?证据等级评估是一种评价研究证据质量和可信度的方法,它将研究设计的严密性、样本容量、实验方法以及研究结果的一致性等因素综合考虑,以确定证据的可靠程度。

证据等级的分类根据《循证医学指南》的建议,证据等级通常可以分为以下几个级别:•Level I:系统评价与Meta分析•Level II:随机对照试验•Level III:非随机对照试验•Level IV:前瞻性队列研究•Level V:回顾性队列研究和病例对照研究•Level VI:横断面研究•Level VII:专家意见证据等级从 I 到 VII 逐渐减少可靠性和可信度,也代表了不同类型研究的严谨性和证据质量。

推荐强度评估什么是推荐强度评估?推荐强度评估是基于证据等级评估的基础上,进一步考虑治疗效果、副作用、成本效益等多个因素,给出治疗或决策的推荐强度。

推荐强度评估可以帮助医生和决策者判断某项治疗方法的优劣和适用性。

推荐强度的分类推荐强度通常可以分为以下几个级别:•强烈推荐:对治疗效果非常肯定,治疗效果优于其他方案,副作用相对较小,成本效益较高。

•推荐:对治疗效果肯定,治疗效果相对较好,副作用较小,成本效益较高。

•不确定推荐:目前证据不足以支持某项治疗方法的强烈推荐或推荐,需要进一步研究和验证。

•不推荐:治疗效果相对较差,副作用较大,成本效益较低,不推荐使用。

推荐强度评估从强烈推荐到不推荐的级别,体现了不同治疗方案的优劣和适用性。

证据等级和推荐强度评估的应用证据等级和推荐强度评估广泛应用于医学研究、临床实践和卫生政策制定等领域。

在医学研究中,研究人员可以根据证据等级评估的结果来选择最适合的研究方法和设计,提高研究的科学性和可靠性;在临床实践中,医生可以根据推荐强度评估的结果来决定最合适的治疗方案,提高治疗效果和患者满意度;在卫生政策制定中,决策者可以依据证据等级和推荐强度评估的结果来制定政策和指南,提供科学依据和支持。

证据的分类分级与推荐

证据的分类分级与推荐



明确显示干预措施利 大于弊或弊大于利
利弊不确定或无论质 量高低的证据均显示 利弊相当

极低
GRADE标准特点及应用
一 GRADE标准特点
证据质量指在多大程度上能够确信疗效评估的正确性; 推荐强度指在多大程度上能够确信遵守推荐意见利大于弊;反映一 项干预措施是否利大于弊的确定程度
【GRADE标准的特点和优势】
该工作组循证制定出国际统一的证据质量分级和推荐强度系统,并于2004年正式
推出。
评价:这是第一个从使用者角度制定的综合性证据分级和推荐强度标准,以易于
理解、方便使用为特点。
认 可 度 : 由 于 其 更 加 科 学 合 理 , 过 程 透 明 , 适 用 性 强 , 目 前 包 括 WHO 和
2)研究结果不一致:不同研究间大相径庭的疗效评估 (异质性或结果的 差异 )意味着各种疗法的疗效确实存在差异。差异可能源于人群 (如药 物对重症人群的疗效可能相对显著 ) 、干预措施 ( 如较高药物剂量会使 疗效更显著)或结局指标(如随时间推移疗效降低)。当结果存在异质性 而研究者未能意识到并给出合理解释时,证据质量亦降低。
六、GRADE标准
针对当前证据分级与推荐意见存在的不足, 2000年,包括 WHO在内的19个国
家 和 国 际 组 织 共 同 创 立 “ 推 荐 分 级 的 评 价 、 制 定 与 评 估 ” (Grading of Recommendations Assessment,Development and Evaluation,GRADE)工作 组,由67名包括临床指南专家、循证医学专家、各个标准的主要制定者及证据研 究人员构成。
科普材料、健康教育材料、 大众媒体为主(电视、广 播、网络、报纸) 关注微观层面,侧重个人 保健,解决自身问题

循证医学证据的分类分级与推荐

循证医学证据的分类分级与推荐
2001年,苏格兰院际指南网络(The Scottish Intercollegiate Guidelines Network,SIGN)发布了更详细的证据分级和推荐强度(表 3—8)。
荷兰、新西兰、澳大利亚等国先后在临床指南中也引入或修订了各自的 证据分级和推荐标准。
局限性:局限于治疗方面,不适于预防、诊断等其他领域
证据的分类、分级与 推荐
授课内容
第一节 证据分类 第二节 证据分级与推荐 第三节 GRADE标准特点及应用
学习目的
掌握证据的分类依据、GRADE证据分级和 推荐标准的内涵和关系
熟悉临床研究证据分级与推荐系统的演进 过程及内容
了解其他领域的证据分级系统
1、飞速发展医疗科研 (尤其是临床研究)导 致大量科研成果产生(海 量信息);全球23000余 种生物医学期刊每年发 表数百万篇文献
1992年AHRQ证据分级及推荐强度
四、SIGN标准
1996年,英格兰北部循证指南制定项目(North of England Evidence Based Guidelines Development Project,NEEBGDP)发布了其制定 的证据分级标准和推荐强度,将RCT,Meta分析和系统评价共同作为 最高级别的证据,这是英国继加拿大和美国之后较系统全面发布自己的 分级标准。
卫生技术评估(health technology assessment, HTA)
二、按使用者需求分类
第二节、证据分级与推荐
要实现科学高效的决策,使用者不必花费大量时间和精力 检索和评价证据质量(quality of evidence),只需要充 分利用研究人员预先确立证据分级标准和推荐意见,参考 各种高质量证据帮助科学决策。
1979年,加拿大定期体检特别工作组(Canadian Task Force on the Periodic Health Examination ,CTFPHE)首次 对研究证据进行分级并给出推荐意见。

证据分级、分类和推荐 李静

证据分级、分类和推荐  李静
2004年,由包括WHO 在内的19 个国家和国际组 织、67名包括临床指南专家、循证医学专家、各 个标准的主要制定者及证据研究人员共同成立的 GRADE 工作组,循证制定出国际统一的证据质 量分级和推荐强度标准,于2008年正式在BMJ杂 志系列推出5篇文章
GRADE为系统评价和指南提供了一个证据质量评价体 系,为指南中的推荐强度评级提供了一种系统方法
基于经验未经严格论证的专家意见
证据临床相关性分级2001
(The Evidence Pyramid)
The different types of material indexed in MEDLINE are labeled in the pyramid diagram, with the least clinically relevant at the bottom and the most clinically relevant at the top. The four layers above case reports and case series represent actual clinical research; the layers below are least clinically relevant and can be useful as background resources
证据分类、分级和推荐
李静
四川大学华西医院 中国循证医学中心 循证医学教育部网上合作研究中心 中国Cochrane中心
1
证据分类
临床研究
一次研究证据:
作者根据自己的工作实践经验 和科研成果写成的原始论文: 主要涉及病因、诊断、治疗和预后
二次研究证据:
对一次文献的系统阅读、综合 分析、提练和概括论述:系统评价、 Meta-分析、综述、临床实践指南、

证据的分类分级与推荐

证据的分类分级与推荐

该工作组循证制定出国际统一的证据质量分级和推荐强度系统,并于2004年正式
推出。
评价:这是第一个从使用者角度制定的综合性证据分级和推荐强度标准,以易于
理解、方便使用为特点。
认 可 度 : 由 于 其 更 加 科 学 合 理 , 过 程 透 明 , 适 用 性 强 , 目 前 包 括 WHO 和
横断面调查
描述性研究 病例系列 个案报道
自身前后对照研究
非随机同期对照研究
2、二次研究证据(secondary research evidence)指尽可能全面 收集某一问题的全部原始研究证据,进行严格评价、整合、分析 、总结后所得出的综合结论,是对多个原始研究证据再加工后得 的证据。 –系统评价(systematic review ,SR)/Meta分析 –临床实践指南(clinical practice guidelines, GCP) –临床决策分析(clinical decision analysis) –临床证据手册(handbook of clinical evidence) –卫生技术评估(health technology assessment, HTA) –实践参数(practice parameter)
用的诠释; 8. 适用于制作系统评价、卫生技术评估及指南。
二 影响证据质量的因素
可能降低证据质量的因素
1)研究的局限性:研究的局限性包括隐蔽分组缺失、盲法缺失(特别是 结局指标为主观性指标且对其评估极易受偏倚影响时 )、失访过多、未 进行意向性分析、观察到疗效就过早终止试验或未报道结果 (通常是未 观察到疗效的一些研究)。
Cochrane协作网在内的 28个国际组织、协会已经采纳 GRADE标准,已成为证据 发展史上的里程碑事件。

第三章 证据的分类、分级与推荐

第三章 证据的分类、分级与推荐
63
证据质量 高质量
中级质量 低质量
极低级质量
表达方式 ⊕⊕⊕⊕或A ⊕⊕⊕○或B ⊕⊕○○或C ⊕○○○或D
推荐强度
支持使用某干预措施的 强推荐
支持使用某干预措施的 弱推荐
反对使用某干预措施的 弱推荐
反对使用某干预措施的 强推荐
表达方式 ↑↑或1 ↑?或2 ↓?或2 ↓↓或1
64
1)强推荐的含义 对患者:在这种情况下,多数患者会采纳推荐方案,只有少
40
退出和失访 已纳入的病例发现不符合纳入标准 出现药物副作用的病例 对分配的治疗不依从的病例
41
研究的质量 随机分组、方法、编盲 盲法;双盲、单盲、开放性 随访:病例是否完整 分析方法
影响结果解释的因素 偏倚的来源
42
排除质量低的研究,但有排除产生真 实性结果研究的危险
12
13
系统评价(systematic review, SR/Meta analysis) 临床实践指南(clinical practice guidelines,
CPG 临床决策分析(clinical decision analysis) 临床证据手册(handbook of clinical evidence) 卫生技术评价(health technology assessment,
标准,评价标准要有足够的客观性; 对影响预后的重要因素是否进行校正,如疾病的
不同亚型,不同特征的患者人群。
31
结果能否用于自己的病人 -检查样本的代表性:研究人群与我的病人越接近, 应用结果的把握就越大
是否考虑到临床上所有的重要结果 治疗的利与弊
① 治疗作用;肺癌,保守/开放治疗 ② 不良事件;SARS,类固醇治疗 ③ 费用:公费,自费,病人经济状况 32

证据分级、分类和推荐 李静

证据分级、分类和推荐  李静

2011年再次推出GRADE系列文章
2008年推出的系列文章主要针对使用GRADE 结果的临床医生和决策者,这些结果包括证 据概要表、结果总结表和推荐强度分级 未能为负责使用GRADE 方法生产结果的人 提供详尽指导:包括系统评价及卫生技术评 估作者、指南委员会成员及为指南委员会提 供支持的方法学家们 2011年推出的系列文章弥补了上述不足,为 使用GRADE 的每一个步骤提供指导
Guideline 1 created equal!!
Article 1
Guideline 2
Article 2 Textbook
CME
Expert
What’s the truth?
证据分级
20世纪60年代,美国社会学家Campbell和Stanley首次提出了研究证据分级的 思想,评价教育领域部分原始研究的设计,将随机对照研究的质量定 为最高并引入内部真实性和外部真实性的概念
Ⅱ2
证据来自于比较了不同时间、地点有无干预措 施的研究;或无对照研究但疗效巨大(如1940
年青霉素的应用)

基于临床研究、描述性研究或专家委员会的报
告,或权威专家的意见
B 考虑该疾病的证据尚可 C 支持考虑该疾病的证据缺乏
D 不考虑该疾病的证据尚可 E 不考虑该疾病的证据充分
Oxford Centre for Evidence-based Medicine
GRADE证据推荐强度
根据研究结果对患者的利弊关系,将推荐强度分为强和 弱两级
推荐强度
定义

干预措施明显利大于弊、或弊大于利

干预措施因研究质量低而利弊不确定或利弊 相当
术语
解释

包括降低发病率和病死率、提高生活质量、

证据的分类、分级与推荐

证据的分类、分级与推荐
能性较大
任何疗效的评估都很不确定
GRADE标准特点及应用
一 GRADE标准特点
证据质量指在多大程度上能够确信疗效评估的正确性; 推荐强度指在多大程度上能够确信遵守推荐意见利大于弊;反映一 项干预措施是否利大于弊的确定程度
【GRADE标准的特点和优势】
1. 由一个具有广泛代表性的国际指南制定小组制定; 2. 明确界定了证据质量和推荐强度; 3. 清楚评价了不同治疗方案的重要结局; 4. 对不同级别证据的升级与降级有明确、综合的标准; 5. 从证据到推荐全过程透明; 6. 明确承认价值观和意愿; 7. 就推荐意见的强弱,分别从临床医生、患者、政策制定者角度作了明确实
五、牛津大学循证医学中心标准
1998年,由临床流行病学和循证医学专家 Bob Philips, Chris Ball, Dave Sackett等人共同循证制定新的分级标准,2001年5 月正式发表于英国牛津循证医学中心的网络上。
该标准首次在证据分级的基础上整合分类概念,涉及治疗、预防 、病因、危害、预后、诊断、经济学分析七个方面,更具有针对 性和适应性
– 卫生技术评估(health technology assessment, HTA)
– 实践参数(practice parameter)
二、按使用者需求分类
政策制定者
人群 政府官员、机构负责 人、团体领袖等
研究者
基础、临床、教学 研究者等
卫生保健人员
患者和公众
临床医生、护士、 普通民众、患病人群和健 医学技术人员等 康人群
结果不确定的小样本RCT(Ⅰ、Ⅱ型错误 都较高)
非随机的同期对照试验
级别 A
B
C
非随机的历史对照试验 无对照的系列病例报道

临床证据水平分级和级别

临床证据水平分级和级别

临床证据水平分级和级别Document serial number【LGGKGB-LGG98YT-LGGT8CB-LGUT-1979年,加拿大预防保健工作组(CTFPHC)的Fletche等人首次按临床研究设计将证据强度分为Ⅲ级5等,推荐强度分为Good、Fair和Poor 3级;1996年美国预防服务工作组(USPSTF)评估系统将证据分Ⅲ级5等,推荐强度分5级;美国预防医学工作组(U.S. Preventive Services Task Force)的分级方法,可以用于评价治疗或筛查的证据质量:证据水平:* I级证据:自至少一个设计良好的随机对照临床试验中获得的证据;* II-1级证据:自设计良好的非随机对照试验中获得的证据;* II-2级证据:来自设计良好的队列研究或病例对照研究(最好是多中心研究)的证据;* II-3级证据:自多个带有或不带有干预的时间序列研究得出的证据。

非对照试验中得出的差异极为明显的结果有时也可作为这一等级的证据;* III级证据:来自临床经验、描述性研究或专家委员会报告的权威意见。

美国预防医学工作组(U.S. Preventive Services Task Force)的推荐评价标准:推荐级别:* A级推荐:良好的科学证据提示该医疗行为带来的获益实质性地压倒其潜在的风险。

临床医生应当对适用的患者告讨论该医疗行为;* B级推荐:至少是尚可的证据提示该医疗行为带来的获益超过其潜在的风险。

临床医生应对适用的患者讨论该医疗行为;* C级推荐:至少是尚可的科学证据提示该医疗行为能提供益处,但获益与风险十分接近,无法进行一般性推荐。

临床医生不需要提供此医疗行为,除非存在某些个体性考虑;* D级推荐:至少是尚可的科学证据提示该医疗行为的潜在风险超过潜在获益;临床医生不应该向无症状的患者常规实施该医疗行为;* I级推荐:该医疗行为缺少科学证据,或证据质量低下,或相互冲突,例如风险与获益无法衡量和评估。

第三章证据的分类、分级与推荐

第三章证据的分类、分级与推荐
43
加拿大定期体检特别工作组(CTFPHE标准): 1979年,三级标准
美国胸内科医师学会(ACCP标准) :1986年, 五级标准
HTA) 实践参数(practice parameter)
14
专家意见 个人经验 其他(当地的“智慧”、“诀窍”、
“常识”等)
15
病因:如何确定疾病的原因? 诊断:如何正确解释从病史、体检得到的资
料?如何选择、决定诊断试验?某种诊断或治 疗措施的价值? 治疗:如何选择对病人有好处而无害处的治 疗手段,从效果和花费来看,是否值得应用? 某种药物的临床应用? 预防:如何防止疾病的发生、复发? 预后:如何估计病人可能产生的并发症?
27
➢ 研究结果科学性:是否真实可信? ➢ 研究结果的是什么?有多大? ➢ 研究结果能否应用于我的病人,解
决临床问题。
28
是否同参照标准(金标准)进行独立的盲法比较; 研究人群是否包括临床上应用该试验的各种病人; 所评价的试验结果有没有影响参照标准检查的实施; 诊断试验的方法描述是否详细,能否重复。
38
随机临床试验是最严格的方法 随机试验也可能存在受偏倚的影响,
对其方法学质量进行评价是必要的。
39
设立对照组 随机分组
方法:简单随机化、区组随机、分层随机 双盲(Double blinding)
外观一致的对照药或安慰剂 双盲双模拟(double dummy) 开放试验、单盲
40
退出和失访 已纳入的病例发现不符合纳入标准 出现药物副作用的病例 对分配的治疗不依从的病例
应当对文献等证据进行评价。
23
可作为是否纳入研究的标准; 用于解释研究结果间的差异性(异质性); 用于敏感性分析; 作为研究结果统计学分析时赋予权重的根据,

EBM-3 证据的分类、分级与推荐

EBM-3 证据的分类、分级与推荐
按研究方法 按研究问题 按用户需要 按获得渠道
原始临床研究证据
二次临床研究证据
病因临床研究证据
诊断临床研究证据
系统评价
临床实践指南
公开发表的临床研究证据
灰色文献
预防临床研究证据
治疗临床研究证据
临床决策分析
临床证据手册
在研的临床研究证据
网上信息
预后临床研究证据
卫生技术评估
健康教育资料
2013-12-29
针对临床,用于指南,传播广泛,影响权威,
推荐意见的强度与证据级别相对应

最大的不足:
内容复杂、应用局限、标准各异
2013-12-29
中国循证卫生保健协作网
11
(六)GARDE标准

2000年,包括WHO在内的19个国家和国际组织共同创立“
推荐分级的评价、制定与评估”(Grading of Recommendations Assessment, Development and Evaluation, GRADE)工作组
数据库并确定检索途径和检索词,确定各词之间的逻 辑关系与检索步骤,制定出检索表达式并在检索过程 中修改和完善检索表达式。
2013-12-29
中国循证卫生保健协作网
32
步骤5:

判断和评估检索到的证据能否回答临床问题
如果是为使用证据而检索,主要是从证据的级别和临
床适用性来判断检索结果的质量。
如果是为制作证据(如撰写系统评价)而检索,还应
IV
V
非随机的历史对照试验
无对照的系列病例报道
2013-12-29
中国循证卫生保健协作网
7
(三)1992年AHRQ标准

证据资源级别和分类

证据资源级别和分类

证据资源级别和分类循证医学的证据已经历了最初针对有效性的老五级分级(见表3)、2001年英国循证医学中心修订的过渡阶段的混合新五级分级(见表4),到2004年美国学者提出的新九级分级(见表5)等阶段。

新九级证据遵从了循证医学对临床指导价值的原则,前六级涉及人体病例研究,对于论述、观点等典型的专家意见归为第七级的专家证据。

从上到下体现了有效性评价对临床的指导价值从大到小。

以上都是从研究者的角度和设计质量方面来评价证据的好坏。

循证信息资源主要有知识/事实型和文献型两大类,其中文献信息资源又按加工深度分为一次研究文献和二次研究文献。

在实际应用中,根据临床研究方法对一次文献和二次文献进行了详细的划分,如,将原始临床研究证据分为随机对照试验、队列研究、病例-对照研究、无对照的研究等;而二次临床研究证据分为系统评价、Meta分析、临床实践指南、卫生技术评估等。

迈特思创循证医学文献检索平台能够帮助医务工作者轻松过滤出一次、二次文献资源。

证据类型知识概要系统综述(SR):系统综述又称系统评价,是基于特殊人群的某一具体临床问题,系统全面地检索全世界所有已发表或未发表的临床研究结果,采用临床流行病学严格评价文献的标准,筛选出合格的文献,进行综合分析和统计学处理,得出可靠的结论,用于指导临床决策,并随着新的临床研究的出现及时更新。

SR被公认为全世界最高级别的证据之一,是治疗性临床问题的一级证据文献(老五级)。

META分析(荟萃分析):用统计合并的方法对具有相同研究目的的多个独立研究结果(主要为RCT试验结果)进行比较和综合分析的研究方法。

从广义来说,META分析就是系统评价的一种,用定量综合的方法对资料进行了统计学处理的系统评价就称为META分析。

目前,国外文献常常将系统评价与META分析交叉使用。

也是最高级别的循证证据之一。

随机对照试验(Randomized controlled trial,RCT):采用随机分配的方法,将符合要求的研究对象分别分配到试验组或对照组,接受相应的试验措施,在一致的条件或环境下同步进行研究和观察,并用客观的指标,对结果进行测量或评价。

EBM-3 证据的分类、分级与推荐

EBM-3 证据的分类、分级与推荐


五种因素可导致证据质量下降,三种因素则可 提升证据质量

最终,每一结局相应的证据质量归属于从高到 极低的四类之一
2015/10/29
EBM-LiuQ
14
Significance of the four levels of evidence
2015/10/29
EBM-LiuQ
15
Quality assessment criteria
Oxford Centre for Evidence-based Medicine, Levels of Evidence
2015/10/29
EBM-LiuQ
10

以上分级标准的共同点:
针对临床,用于指南,传播广泛,影响权威,
推荐意见的强度与证据级别相对应

最大的不足:
内容复杂、应用局限、标准各异

2004年正式推出 第1个从使用者角度制定的综合性证据分级和推荐强度标准 28个国际组织已采纳GRADE标准
2015/10/29
EBM-LiuQ
12
GRADE步骤——定义问题、收集证据
2015/10/29
EBM-LiuQ
13
GRADE步骤——证据质量评级

RCTs开始被定为支持干预效果估计的高质量证 据,观察性研究定为低质量证据
且结果一致时

剂量-效应关系
药物剂量及其效应大小间有明显关联

可能的混杂因素
2015/10/29
EBM-LiuQ
19
GRADE步骤——分级推荐

指南制定者(而非系统评价员)综合所有信息 做出最终判定,得出哪些结局是关键性的,哪 些结局是重要(而非关键性)的,然后做出证 据总体质量级别的最终决策。

证据的分类分级与推荐专家讲座

证据的分类分级与推荐专家讲座

证据的分类分级与推荐
38
第38页
随机临床试验是最严格方法 随机试验也可能存在受偏倚影响, 对其
方法学质量进行评价是必要。
证据的分类分级与推荐
39
第39页
设置对照组 随机分组 方法: 简单随机化、区组随机、分层随机 双盲(Double blinding) 外观一致对照药或抚慰剂 双盲双模拟(double dummy) 开放试验、单盲
14
第14页
教授意见 个人经验 其它(当地“智慧”、“诀窍”、
“常识”等)
证据的分类分级与推荐
15
第15页
病因:怎样确定疾病原因?
诊疗:怎样正确解释从病史、体检得到资料? 怎样选择、决定诊疗试验?某种诊疗或治疗 办法价值?
治疗:怎样选择对病人有好处而无坏处治疗 伎俩,从效果和花费来看,是否值得应用? 某种药品临床应用?
应该对文件等证据进行评价。
证据的分类分级与推荐
23
第23页
可作为是否纳入研究标准; 用于解释研究结果间差异性(异质性); 用于敏感性分析; 作为研究结果统计学分析时赋予权重依据, 即
结果越准确或质量高赋予较大权重
证据的分类分级与推荐
24
第24页
研究质量低可能与研究汇报不恰当相 关
与作者联络,补充或核实情况 真实性测量标准与实际研究结局之间
2)研究结果不一致
不一样研究间大相径庭疗效评定(异质性或结果差异)意味着各种疗法疗效确 实存在差异。差异可能源于人群(如药品对重症人群疗效可能相对显著)、干 预办法(如较高药品剂量会使疗效更显著)或结局指标(如随时间推移疗效降低 )。
当结果存在异质性而研究者未能意识到并给出合了解释时, 证据质量亦降低 。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

各种证据是否具有相同的重要性?
33
第三节 临床研究证 据的分级
34
分级的依据
证据来源 证据科学性
证据可靠程度
35
分级始于研究设计 各类设计具有不同的优缺

36
非系统性临床观察研究
临床医生对疾病的非系统性观察 病例报告 病例分析 专家评论
无对照、样本量小 存在较大的偏倚
37
非随机研究
43
代表性分级标准
加拿大定期体检特别工作组(CTFPHE标准): 1979年,三级标准
美国胸内科医师学会(ACCP标准) :1986年, 五级标准
美国卫生保健政策研究所(AHRQ标准) :1992 年,四级标准
苏格兰院际指南网络(SIGN标准 ):2001年,四 级
牛津大学循证医学中心:1998年,五级 推荐分级的评价、制定与评估(GRADE标准):
第四节 GRADE标准 的特点及应用
57
一 GRADE标准特点
证据质量指在多大程度上能够确信疗效评估的正确性; 推荐强度指在多大程度上能够确信遵守推荐意见利大于弊; 反映一项干预措施是否利大于弊的确定程度
58
【GRADE标准的优势】 1.由一个具有广泛代表性的国际指南制定小组制定; 2.明确界定了证据质量和推荐强度; 3.清楚评价了不同治疗方案的重要结局; 4.对不同级别证据的升级与降级有明确、综合的标准; 5.从证据到推荐全过程透明; 6.明确承认价值观和意愿; 7.就推荐意见的强弱,分别从临床医生、患者、政策制
临床问题 疗效评价
治疗的不良反应
最佳的研究设计 RCT
RCT
诊断或筛查试验
与金标准进行盲法比较
预后评价
队列研究
无法进行RCT或有伦理问 队列研究 题的疗效评价
暴露不良环境的危害
病例对照研究
27
不同临床问题的相似评价标准
➢ 研究结果科学性:是否真实可信? ➢ 研究结果的是什么?有多大? ➢ 研究结果能否应用于我的病人,解
20
各种证据如何分辨质量?
21
第二节 临床研究评 价
22
为什么要评估证据的质量?
大多数干预措施的效果不是非常显著,有的甚 至可对病人造成伤害。
应当对文献等证据进行评价。
23
对文献质量进行评价的意义:
可作为是否纳入研究的标准; 用于解释研究结果间的差异性(异质性); 用于敏感性分析; 作为研究结果统计学分析时赋予权重的根据,
不同亚型,不同特征的患者人群。
31
结果是否有助于处理我的病人
✓ 结果能否用于自己的病人 -检查样本的代表性:研究人群与我的病人越接近, 应用结果的把握就越大
✓ 是否考虑到临床上所有的重要结果 ✓ 治疗的利与弊
① 治疗作用;肺癌,保守/开放治疗 ② 不良事件;SARS,类固醇治疗 ③ 费用:公费,自费,病人经济状况 32
11
按研究方法分类
原始临床研究数据:直接在受试者中进行单个 有关病因、诊断、预防、治疗和预后等试验研 究所获得的第一手数据,进行统计学处理、分 析、总结后得出的结论。
二次临床研究数据:全面收集某一问题的全部 原始研究证据,进行严格评价、整合、分析、 总结后所得出的综合结论,是对多个原始研究 证据再加工后得到的证据。
当研究纳入的患者和观察事件相对较少而致置信区间较宽 时,将降低该研究的证据质量。
5)发表偏倚
若阴性结果的研究不能发表会减弱证据质量,典型情况是 公开的证据仅限于少数试验且这些试验全部由企业赞助, 此时不得不质疑存在发表偏倚。
61
二)可能增加证据质量的因素 1)效应值很大
当方法学严谨的观察性研究显示疗效显著或非常显著且结果一致时, 将提高其证据质量。 2)可能的混杂因素会降低疗效 例如研究证据显示营利性医院患者死亡率低于非营利性医院。但通常 营利性医院卫生资源更多,就诊患者社会经济状况普遍较好、病情较 轻。考虑到这些混杂因素,若得出营利性医院疗效更好,其证据强度 将降低。 3)剂量-效应关系 药物剂量及其效应大小间有明显关联。
具体描述
未来研究几乎不可能改变现 有疗效评价结果的可信度 未来研究可能对现有疗效评 价有重要影响,可能改变评 估结果的可信度 未来研究很有可能对现有疗 效评估有重要影响,改变评 估结果可信度的可能性较大 任何疗效的评估都很不确定
推荐级 具体描述 别

明确显示干预
措施利大于弊

利弊不确定或
者利弊相当
56
定者角度作了明确实用的诠释; 8.适用于制作系统评价、卫生技术评估及指南。
59
二 影响证据质量的因素
一)可能降低证据质量的因素 1)研究的局限性
研究的局限性包括隐蔽分组缺失、盲法缺失(特别是结局指标为主观性指标 且对其评估极易受偏倚影响时)、失访过多、未进行意向性分析、观察到疗 效就过早终止试验或未报道结果(通常是未观察到疗效的一些研究)。 2)研究结果不一致 不同研究间大相径庭的疗效评估(异质性或结果的差异)意味着各种疗法的疗 效确实存在差异。差异可能源于人群(如药物对重症人群的疗效可能相对显 著)、干预措施(如较高药物剂量会使疗效更显著)或结局指标(如随时间推移 疗效降低)。 当结果存在异质性而研究者未能意识到并给出合理解释时,证据质量亦降低 。
60
3)间接证据
第一类,如欲比较两种活性药物的疗效时,若无两药直接 比较的随机对照试验,但有两药均与同一安慰剂比较的随 机对照试验时,便可进行两药疗效的间接比较。但其证据 质量比两药直接比较的随机对照试验低
第二类间接证据包括人群、干预措施、对照措施、预期结 局及相关研究中类似的因素。
4)精确度不够
WHO,2004年,四级
44
CTFPHE标准
ACCP标准
首次对Ⅰ级水平的RCT规定了质量; 将证据等级与推荐强度一一对应; 但忽视了低级别的证据。
证据质量等级标准的发展
老五级证据
新五级证据
53
新九级证据
54
GRADE标准
55
GRADE 证据分级及推荐强度
证据水 平 高 中

极低
HTA) 实践参数(practice parameter)
14
非研究证据
专家意见 个人经验 其他(当地的“智慧”、“诀窍”、
“常识”等)
15
按研究问题分类
病因:如何确定疾病的原因? 诊断:如何正确解释从病史、体检得到的资
料?如何选择、决定诊断试验?某种诊断或治 疗措施的价值? 治疗:如何选择对病人有好处而无害处的治 疗手段,从效果和花费来看,是否值得应用? 某种药物的临床应用? 预防:如何防止疾病的发生、复发? 预后:如何估计病人可能产生的并发症?
解决临床问题,包括: 发病与危险因素→认识与预防疾病; 疾病的早期诊断→提高诊断的准确性; 疾病的正确合理治疗→应用有疗效的措施; 疾病预后的判断→改善预后,提高生存质量。 合理用药和促进卫生管理及决策科学化。
询证医学五步法
第三章 证据的分类、分 级与推荐
9
什么是证据?
10
第一节 临床研究证 据的分类
设立对照组 随机分组
方法:简单随机化、区组随机、分层随机 双盲(Dou 双盲双模拟(double dummy) 开放试验、单盲
40
随访
退出和失访 已纳入的病例发现不符合纳入标准 出现药物副作用的病例 对分配的治疗不依从的病例
41
决临床问题。
28
诊断试验评价
是否同参照标准(金标准)进行独立的盲法比较; 研究人群是否包括临床上应用该试验的各种病人; 所评价的试验结果有没有影响参照标准检查的实施; 诊断试验的方法描述是否详细,能否重复。
29
治疗措施评价
➢ 有无对照;治疗分配是否随机?
随机化方法是否正确;两组基线是否一致(可比 性);
62
三 影响推荐强度的因素
推荐强度反映对一项干预措施是否利大于弊的确定程度。 干预措施的有利方面包括降低发病率和病死率、提高生活
质量、降低医疗负担和减少资源消耗。 不利方面包括增加发病率和病死率,降低生活质量或增加
资源消耗等。 GRADE系统只有强弱两级推荐,为方便使用GRADE还为
证据质量和推荐强度提供了首选的符号描述法,也为喜欢 使用数字和字母形式的机构提供了首选的数字/字母描述法
63
证据质量与推荐强度的表达方式
证据质量 高质量
中级质量 低质量
极低级质量
表达方式 ⊕⊕⊕⊕或A ⊕⊕⊕○或B ⊕⊕○○或C ⊕○○○或D
推荐强度
支持使用某干预措施的 强推荐
支持使用某干预措施的 弱推荐
反对使用某干预措施的 弱推荐
反对使用某干预措施的 强推荐
表达方式 ↑↑或1 ↑?或2 ↓?或2 ↓↓或1
系统评价中对RCT质量评价内容
研究的质量 随机分组、方法、编盲 盲法;双盲、单盲、开放性 随访:病例是否完整 分析方法
影响结果解释的因素 偏倚的来源
42
对研究质量的处理
排除质量低的研究,但有排除产生真 实性结果研究的危险
纳入低质量的试验同时探讨质量高低 对效应估计值的影响 用敏感性分析探讨排除低质量研究对 系统评价结果证据强度的影响 使用Meta回归模型 累积性Meta分析
➢ 是否用双盲; ➢ 是否交待全部研究结果; ➢ 随访的完整性,有无干扰;
30
预后研究评价
患者是否在病程的相同起点开始随访; 随访的完整性:从纳入研究到研究规定的终点,
失访率高低直接影响研究结果的真实性; 结果评定标准的客观性:定义结果的测量或评价
标准,评价标准要有足够的客观性; 对影响预后的重要因素是否进行校正,如疾病的
16
按用户需要分类
政策制定者:政府官员、机构负责人 等(禁烟、禁反应停)
研究者:临床和基础研究教学人员等 (研究立项)
相关文档
最新文档