医学文献的阅读与评价

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
anti-inflammatory drugs, NSAIDs)与流产增加是否有关 (2) 研究设计:前瞻性队列研究 (3) 研究地点:美国旧金山地区 (4) 研究对象:纳入1055名孕妇,妊娠试验阳性与妊娠期40
天后,询问调查有关药物服用情况.
(5) 主要测量指标:怀孕20周以上的妊娠结果 (6) 研究结果:53名(5%)妇女怀孕期服用NSAID, 调整了可疑混杂因素后,产前服用NSAID与流产危险 的增加有80%关联(调整后的危险比率为1.8,95% CI为1.0~3.2)。如果NSAID服用在初期妊娠或服用 超过一周,关联性更强。产前服用阿司匹林在增加流 产危险性方面有类似的关联性,而产前服用扑热息痛 并不增加其危险性,详细结果见表17-7、8、9、10.
临床经济分析(clinical economic analysis) (1)是否提供了完整的经济分析?从什么角度出发来
考虑成本和效益的? (2)进行比较的干预措施其临床效果是否已被确定? (3)经济学分析的方法是否正确?
临床决策分析(clinical decision analysis) (1)研究设计是否合理,分析结果是否真实可靠? (2) 是否是对临床上重要的决策进行了可靠的决策模
扑热息痛
未服用 (n=760)
服用 (n=172)
流产 是(n=141)
117
24
危险比(95%CI) 否(n=793)
645
1.0
148
1.2(0.8~1.8)
(二)按照病因学研究文献的评价标准进行评价
1.研究设计类型是什么? 该研究采用的是前瞻性队列研究, 其论证强度是观察性研究中最好的。 2. 研究对象是否明确?组间基线是否可比?是。研究对象 有明确的诊断,并有明确的纳入和排除标准;组间年龄、受教 育程度和社会经济状况等进行了亚组分析,组间基线基本 是可比的。 3. 研究的样本量是否合适? 该研究所观察的队列总数是大 的,但就暴露组来说,样本量不算大,尤其观察暴露于阿 司匹林组仅22人,很可能影响研究结果的精确性。
否(n=871) 831 40
危险比(95%CI)
1.0 1.8(1.0~3.2)
表3 孕妇产前服用阿司匹林与流产危险
阿司匹林
未服用 (n=980)
服用 (n=22)
流产 是(n=154)
149
5
危险比(95%CI) 否(n=848)
831
1.0
17
1.6(0.6~4.1)
表4 孕妇产前服用扑热息痛与流产危险
五、评价医学文献的总的原则
总的评价原则就是要从研究的真实性、可靠性和实用性 三方面进行评价,即: ① 研究结果的真实性如何? ② 研究结果的价值如何? ③ 研究结果是否能应用于目前的病人?
研究结果的真实性评价是文献评价的重点
表1 病因学研究的文献评价标准
1.研究的真实性 (1)研究设计类型是什么? (2)研究对象是否明确?组间基线是否可比? (3)研究的样本量是否合适? (4)是否充分说明了研究过程中可能产生的偏倚及其控制方法? • (5)研究的观察时间是否足够长? (6)是否有因果效应的先后顺序? 2.研究的价值 (1)暴露和结果的联系强度多大?即RR、OR或病因分值(EF)多大? (2)暴露和结果间有无剂量-效应关系? (2)对有害作用的危险性估计的精确度如何(95%可信区间)? 3.临床实用性 (1)研究结果是否能应用于自己的患者? (2)有害因素的危险性的大小如何? (3)此暴露因素是否可控制?
论文中出现严重的学术造假
二、医学文献的类型和特点
按照出版形式分类: 图书、期刊、Hale Waihona Puke HO出版物、会议文献、学位论文、科技
报告和专利文献。 根据其文献提供的信息量多少、内容的加工深度以及功 能不同,常划分为4个级别:
零次文献、一次文献、二次文献和三次文献。
1. 零次文献(zero document)
7. 暴露和结果的联系强度多大?即RR、OR或病因分值 (EF)多大?对混杂因素(过去流产史、教育、孕妇年龄、 种族、按摩浴缸和热盆浴使用、吸烟及服用多种维生素等) 进行调整后,NSAID与流产之间的RR为1.8(95%CI: 1.0~3.2);妊娠早期服用,流产的危险性更高,调整后 的RR 为5.6(95%CI:2.3~13.7);如果服药时间长 达一周以上者,危险度为8.1(95%CI:2.8~23.4)。 多因素调整后,仍然得出相似结果。服用NSAID组的孕妇, 在16%的流产者中,10%应归于NSAID的副作用(AR= 0.1)。而在受孕期前后服药,35%应归于NSAID副作用, 如果服药长达一周以上,50%应归于NSAID所致。
SCI正面临的尴尬局面:
SCI收录的期刊也时常刊登有统计学错误的论文 论文的结论经不起时间考验:
调查发现在1990~2003年间发表在“新英格兰杂志(N Engl J Med)”“美国医学会杂志(JAMA)”“柳叶刀 (Lancet)”三大著名医学杂志上的且引用次数在1000次以 上的文献,有近1/3的研究没有经受住时间考验。
三、决定文献质量的关键部分
(一) 研究是否具有首创性或提供了新证据 (二) 研究对象的选择是否合理 (三) 科研设计是否合理 (四)偏倚是否得到有效控制 (五) 研究样本量是否足够大,研究(试验或观察)的 时间是否足够长
四、快速阅读文献的方法
1. 明确阅读文献的目的 2. 选择性地阅读文献
快速阅读文献方法: 首先,快速浏览文献 第二,选择性地阅读感兴趣和临床有应用价值的文献, 第三,集中阅读文献的方法学部分
8. 暴露和结果间有无剂量-效应关系?研究仅观察了孕 妇使用NSAID的具体时间对流产的影响和持续时间,即 受孕期前后服用这类药物,使用一周以上时,危险性最 高。但是未报告剂量与流产的关系,或流产的严重程度 是否与时间越长、剂量越大有关。 9. 对有害作用的危险性估计的精确度如何(95%可信区 间)?文章分别报告了每个研究结果的可信区间。 10. 研究结果的临床实用性 该研究证实了受孕期前后服 用NSAIDs,特别是使用一周以上,流产的危险性很大, 因此对临床上的同类病人有指导意义。
11预防
医学文献的阅读与评价
一、医学文献质量
国内: 我国生物医学期刊统计学质量不高
国内已发表的医学论文的统计学错误的研究发现, 其错误率达80%以上(调查者)
我国生物医学类期刊所发表的论文,其统计学误用率 基本保持在90%左右(审稿者)
杂志级别不同,错误率不同
表 国内CNKI数据库中各类别期刊统计学错误率比较
表4 预后研究文献的评价标准
1.研究的真实性 (1)是否有一个具有代表性的、定义明确的患者样本群,且在 病程的相同起点开始随访? (2)随访时间是否足够长?随访是否完整? (3)结果的判断是否采用了客观指标? (4)是否校正了重要的预后影响因素? 2.临床价值 (1)在一段特定时间内,所研究结果发生的可能性有多大? (2)对所研究结果发生的可能性的估计是否精确? 3.临床实用性 (1)研究对象是否与自己的患者相似? (2)研究结果是否能改变治疗决策? (3)研究结果是否可以直接用于临床?是否对患者有益?
表5 综合性研究文献的评价要点
系统综述 (systematic review) (1)是否集中回答了重要的临床问题? (2)是否全面检索了有关的数据库?重要的相关文献有否被遗漏? (3)文献纳入和排除的标准是否合适? (4)是否充分分析了可能的偏倚?
临床指南(clinical guideline) (1)指南的选题是否正确?设计是否科学? (2)指南中的推荐意见的证据来源如何?证据等级是如何划分的? (3)指南是否全面、有伸缩性?是否考虑了患者的接受程度?
3. 二次文献(secondary document)
二次文献是对一次文献进行收集、整理、加工而形成的文献数据库, 也称为检索工具或检索系统。这类文献包括目录、题录、文摘、索引等。
4. 三次文献(tertiary document)
三次文献是对利用二次文献的检索工具检索到的大量一次文献进行 系统评价后而完成的综述、述评、进展、指南等。这类文献通常是对某 个领域的研究现状和趋势的高度概括,因此具有信息量大、综合性强、 参考价值大的特点,对研究者科研选题、临床决策的制订具有积极的指 导意义。
361(37)
黑人
4(5)
72(7)
西班牙人
16(22)
204(21)
亚洲或环太平洋 8(11)
286(29)
其他
6(8)
51(5)
其他如教育程度、吸烟、药物使用等特征详见原文
表2 孕妇产前服用NSAIDs与流产危险
NSAID服用
未服用 (n=980)
服用 (n=53)
流产 是(n=162)
149 13
期刊类别 种类数 医学类 20 农林类 15 综合类 20 理工类 30
最低误用率(%) 13.1 9.4 7.6 6.5
最高(%) 36.0 27.5 23.3 21.2
平均(%) 24.55 18.45 15.45 13.85
排前三位的问题: 指标计算错误、方法误用、方法滥用
国外:
60年代到80年代,国外医学杂志调查结果:有 统计错误的论文20%~72%。 甚至连 Nature Medicine 这样公认权威的 杂志统计学错误率也达38%。
4. 是否充分说明了研究过程中可能产生的偏倚及其控制方法? 是。该研究注意了诊断可疑性偏倚,统一实验室检查,消除 了妊娠试验的假阳性。执行了自愿入组,避免了无应答偏倚。 信息收集是由经过培训的女性调查员,进行面对面调查获得 的。 5. 研究的观察时间是否足够长?是。观察到妊娠结束,但未 报告失访的人数。从研究结果看,纳入的孕妇数量与最终报 告的每个药物所统计的人数不一致,应有少量失访,但影响 不大。 6. 是否有因果效应的先后顺序? 有。调查从最后一次月经开 始,了解服药情况。因此服药在前,流产在后,符合因果效 应的先后顺序。
表2 诊断试验研究文献的评价标准
1.研究的真实性 (1)诊断试验是否与金标准进行了独立的盲法比较? (2)所选择的病人样本中是否包括了临床实践中应该使用该诊断试验的各种 病人? (3)诊断试验的参考值是否合理、可靠? (4)对诊断试验的实施方法的描述是否详细? 2.研究结果的临床价值 (1)诊断试验的验前概率(患病率)是多大? (2)诊断试验的灵敏度、特异度和似然比是多少? 3.临床实用性 (1)诊断试验的重复性如何? (2)研究结果是否适应于自己的病人? (3)诊断试验结果是否能改变治疗措施?
型分析?模型中所需的各种参数是否真实可靠? (3)分析是否包括了所有重要的临床收益和风险?
举例:病因学研究文献评价实例
(一)研究实例概况 1. 题目 孕期暴露于非甾体抗炎药与流产的危险 2. 作者 Li DK, Liu L, Odouli R 3. 发表杂志 BMJ.2003 Aug 16;327(7411):368 4. 内容摘要 (1) 目的: 评价产前服用非甾体抗炎药(non-steroidal
零次文献是指未经信息加工,直接记录在载体上的原始信息。这类 文献一般不会公开发表,因此只能通过参加学术会议、个人访谈、书信 等方式获得。
2. 一次文献(primary document)
又称原始文献,是著者以其本人的研究成果为基本素材写成的专著、 期刊论文、科技报告、学位论文、专利文献等。这类文献常反映了最新 研究成果,内容新颖,出版周期短,特别是期刊论文报道速度快、信息 量大,已成为医学科技文献的主要情报信息源。这类文献虽容易获得, 但由于其数量庞大、内容分散,不便于更好地利用。
表1 1055名孕妇(服用和未服用NSAID或阿司匹林组)的基本特征
特征
服用者(n=75#)
未服用者(n=980)
年龄(岁)
﹤20
1(1)
33(3)
20~24
7(9)
114(12)
25~29
19(25)
273(28)
30~34
31(42)
321(33)
≥35
17(23)
239(24)
种族
白人
40(54)
表3 治疗性研究文献的评价标准
1.研究的真实性 (1)研究对象是否被随机分配进入治疗组和对照组? (2)报告结论时是否包括了所有进入试验的病人?随访是否完整? (3)治疗的实施是否采用了盲法? (4)各治疗组在治疗开始时是否可比? 2.研究结果大小 (1)治疗的效果有多大? (2)治疗效果的精确性如何? 3.临床实用性 (1)是否报告了临床上所有的重要结果? (2)研究结果是否能应用于自己的病人? (3)治疗可能得到的益处、害处及费用如何?
相关文档
最新文档