观察性研究论文(简)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
‘鞋靴工厂工人中白血病的发生:一项病例-对照研究’
2. 背景/理由: 解释研究报告的科学背景 和理由。
对读者的重要性。 研究所处阶段和焦点。 已知什麽?现有知识还缺什麽? 背景资料:
现有研究; 现有研究的系统综述
3. 目的: 叙述特定的目的, 包括事先确定 的假设。
研究的详细目的,特定的人群,将估计的参数 研究所针对的特定的假设或问题。
---- 属于哪一类偏倚?
例2 二型糖尿病和原发性青光眼
“如果二型糖尿病妇女比一般妇女更多地进行眼科检 查,检测偏倚可能会影响二型糖尿病与原发性青光眼 之间的关系。我们比较了患糖尿病和未患糖尿病妇女 报告的眼科检查的平均次数。我们还控制了与较认真 的眼科检查有关的一些协变量,重新计算了青光眼的 相对危险度。’’
13 (a). 报告每个阶段的个体数— 例如潜在的合 格数、考察人数、确认合格数、纳入研究数、 完成随访数和被分析人数。 13 (b). 每个阶段未参加的理由。 13 (c). 利用流程图。
Flow chart (流程图)
14. Descriptive data:
14 (a). 给出参加者的特征(如人口学、临床、 社
观察性研究与随机对照试验 互相补充
观察性研究与随机对照试验
随机对照试验 随机
试验设计
观察性研究 实际观察
少
患者人数
多
严格
患者选择的限制
少
队列研究(Cohort studies)
研究者随着时间访问对象, 得到有关他们及其暴露的 基线信息,一段时间后,评价结局的发生情形。
在暴露的和未暴露的个体之间,或者在不同暴露类 别的个体组之间进行比较
如果测量了许多变量,并且在早期探索阶段用于探索 性分析,最好在附录、额外的表格或另文中提供一份 详细的清单。
要报告统计分析中考虑过的所有 ‘候选变量’ ,而 不要有选择地报告那些包含在最后模型中的变量。
例 主要和次要终点 ---- 地特胰岛素研究
主要终点是严重药物副反应的发生, 包括低血糖事 件数(总数、重度、夜间。 严重副反应定义如下: 死亡、生命危险、住院或延长目前的住院、持久或重 要残疾、先天或出生缺陷以及医生认为可能危害患者 和/或需要医学或手术干预的重要医学事件。 次要终点包括 HbA1C水平的降低、空腹血糖(FBG) 和体重改变。 FBG 波动定义为最近患者自测2-6次 FBG的标准差。
11. 定量变量: 解释在分析中如何处置定量 变量。必要时, 描述如何归并成类别和理由
有的研究者将连续测量型的暴露变量转换成新的分 类变量。这时,如何分组对后继分析有重要影响。
作者必须解释为何、如何将定量变量分组归并成类 别,包括类别的个数、分界点、各类的均数或中位 数。
12. Statistical methods:
另一项研究发现,67 篇用统计分析校正混杂因素的 文章中,多数没有清除说明混杂因素是怎样选择的。
例 术前C反应蛋白预测手术后死亡
“我们利用基于数据的一系列Cox模型,包含单变量 分析P0.20的变量。因为已知HMG- CoA还原酶抑制 剂(支架)治疗和POD1cTnI分别有降低和增加心血管手 术患者心血管事件和死亡, 所以两者均强迫进入模型。” “检验比例风险假定时,包含术前CRP与对数随访
时 间的交互效应,交互效应无统计学意义,支持比例风 险假定。” “死亡的观察终止在7年,HLOS的观察终止在30
12 (b). 描述考察亚组和交互效应的方法
读者需要知道,哪些亚组分析是事先计划的,哪 些是在分析数据的时候发生的。同样重要的是, 解释用哪些方法考察亚组之间效应或联系的差异。 (见 item 17).
横断面研究的一个明显的困难是确定暴露先于疾病。
观察性研究的报告
观察性研究的报告常常质量不够好. 很差 的报告妨碍读者评价一项研究的优点和缺 点,以及结果的推广.
加强观察性流行病 学研究报告(strobe) 声明
Lancet 2007, 370:1453-57
STROBE Statement 2007
12 (a) 描述所有统计方法, 包括控制混杂的方法.
必须足够详细地叙述统计方法,以使有知识的读者 拿到原始数据后能够证实所报告的结果。 [International Committee of Medical Journal Editors].
现状
一项实证研究表明, 169篇文章中只有93篇 (55%)在 报告校正混杂因素时清楚地叙述了连续型变量和多 分类变量如何进入统计模型。
ຫໍສະໝຸດ Baidu
题目与摘要 1
引言
2-3
方法
4-12
结果
13-17
讨论
18-21
资助
22
TITLE AND ABSTRACT
1 (a). 在标题或摘要中以通用的术语指出 研究的设计。
‘Leukaemia incidence among workers in the shoe and boot manufacturing industry: a case-control study’
偏倚。研究者最好在订计划时就认真考虑潜在的偏 倚来源。 写报告时,建议作者评估有多大可能出现有关的偏 倚。尤其,要讨论偏倚的方向和大小,可能的话, 再估计一下。
例1 中国自杀的危险因素
在多数自杀的病例-对照研究中,对照组由活 着的个体组成,但是我们决定以死于其他原 因的个体为对照组
以已故个体为对照,用以评估其危险因素的 信息来自死者的家庭成员或亲密关系者,因 此和自杀者的信息来源更具有可比性。
Matched studies 匹配研究
6 (b). 队列研究:对匹配研究,给出匹配标准 和暴露和非暴露的人数。
6 (b). 病例对照研究:对匹配研究,给出匹配 标准和每个病例匹配对照的人数。
7. 变量: 明确定义所有的结局、暴露、预 测变量、潜在的混杂变量和效应修正变量。 必要时给出诊断标准。
CRP是在手术前一瞬间和术后1-5天收集的 全血中测定… 另有一份特定的清单, 从CABG Genomic项目 的1500多变量中,根据理论选出的患者表型变 量, 供全死因死亡和住院时长分析. 人口学变量包括年龄、性别、种族和医院。
9. 偏倚: 描述针对潜在偏倚来源所做的努力
选择偏倚、信息偏倚、混杂偏倚 读者需要了解研究期间采取哪些措施来减少潜在的
‘‘研究期间该地区的病例数决定我们的样本 量’’ [皮肤利什曼病].
例2 通常,需要计算决定
‘‘该地区的一项关于潜在抑郁症的调查, 报告患病率为19.8%。我们假定正常体重 儿童的母亲中20%患抑郁症,而营养不良 儿童的母亲患抑郁症的优势比为 3,功效 设为80%,检验水准设为 5% 。我们需要 72对病例-对照(一个病例对配一个对 照)。”
交互效应
若A因素能改变B因素的效应: A因素存在时, B因素的效应≠
A因素不存在时, B因素的效应 则称A因素和B因素间存在交互效应 要列出四个效应:
(1)无暴露时结果如何; (2) A因素的单独效应 (3) B因素的单独效应 (4) A因素和B因素的联合效应
RESULTS
13. Participants:
例 2 来源 -- 老年妇女透析史和癌症风险
Iowa 妇女健康研究的参加者是从 1985年Iowa州汽 车驾驶执照名单中全部55至69岁妇女中抽取的一 份随机样本,这份名单代表了该年龄组妇女的 94%。
随访问卷于1987年10月和1989年8月邮寄,以调查 生存状态和地址变迁。
除非恶性皮肤肿瘤以外,癌症的发生是通过Iowa 州健康登记来确定的。以姓名、邮编、生日和身 份证号码的组合来和登记的个体相匹配。
例 1 目的 ---- 殴打综合症
“我们的主要目的是: 1) 确定四个社区卫生服务中心出现的妇女
患者中遭遇家庭暴力的比例。 2) 找出目前受虐待和不受虐待患者之间的
人口学和临床差异。”
例2 假说 ---- 地特胰岛素研究
口服降糖药治疗效果欠佳的2型糖尿病患者, 每天一次使用基础胰岛素可以降低餐后血糖, 改善HbA1C水平, 仅仅中度增重, 而且临床低 血糖的风险低, 它是许多患者偏爱的一种选择。
对照代表产生病例的那个队列或人群。
横断面研究(Cross-sectional studies)
研究者在同一个时间点评价全部个体,常常是考察 暴露、危险因素或疾病存在的百分比。
有些横断面研究是分析性的,目的在于定量描述暴 露和疾病之间潜在的因果联系。这样的研究需要象队 列研究那样比较暴露组之间疾病的患病率。也可以象 病例-对照研究那样比较有病组和没病组之间暴露风 险。
地点: 收集数据的地点或来源(例如,选民名册、 门诊部、肿瘤登记…)。
位置: 进行研究的国家、城市、医院或门诊部 日期: 不仅限于时间长度。 生存分析: 起点、终点以及随访结束的日期。
6. Participants:
6 (a). 队列研究: 给出合格标准, 和选择参加者的 来源和方法。描述随访的方法。 6 (a). 病例对照研究:给出合格标准, 以及确诊
解读 STROBE
---- 提高观察性研究论文的水准
方积乾
中山大学公共卫生学院 医学统计与流行病学系
2010年8月
RCT vs. Observational study
医学研究的许多问题靠观察性研究来探索。 观察性研究更适用于发现治疗措施罕见的或
较迟出现的副反应,更多地靠日常医学实践 来实现。 临床专业杂志发表的文章,十分之九是观察 性研究。
---- 属于哪一类偏倚?
10. 研究的规模:解释研究的规模是怎样 达到的
为了得到充分狭窄的置信区间, 有意义地回答所研究 的问题, 研究规模要足够大。
小样本常常提供有价值的信息,但是宽的置信区间 表明其对现有知识贡献较少。
为了区别“小的联系”和“没有联系”,需要大样 本。
例1 罕见病,利用全部病例
现有资料的二次使用
这是观察性研究的创造性部分,其结果不一定没价 值或不重要 -- 简单重述原始目的可帮助读者了解研究的内容和 资料可能的局限性。
如果本报告是某项研究若干部分之一 -- 通过简单重述该研究的主要特点,引述前一篇文 章。
5. 地点: 叙述地点、位置、日期, 包括招募、 暴露、随访和数据收集的时间范围.
病例和选择对照的来源和方法。给出选择病 例和对照的理由。 6 (a). 横断面研究:给出合格标准, 以及选择参 加者的来源和方法。
例1 纳入标准和排除标准 ---- 地特胰岛素研究
所有其他一型或二型糖尿病患者都合格, 经他 们的医生同意就可纳入。
排除标准: 不能或不愿参加试验,和/或不愿参 加随访、对地特胰岛素或赋形剂过敏、以前 参加过研究或以前用过地特胰岛素。
8. 数据来源/测量: 对每一个变量给出数据 来源和评价(测量)方法的细节。如果有 多个组,描述评价方法的可比性。
测量暴露、混杂变量和结局的方法影响研究的真 实性和可靠性。
暴露和结局的测量误差和错误分类会使因果关系 的检出更加困难,甚至会造出虚假的关系。
例 术前C反应蛋白(CRP)预测手术后死亡
可以评价若干不同的结局指标,可以在随访期间的 多个时间点考察暴露和结局。
病例-对照研究(Case-control studies)
研究者在具有特定疾病结局者(病例)和不具有特 定疾病结局者(对照)之间比较他们的暴露。
要收集的病例和对照应当能代表人群中某个队列或 某个断面。
病例样本可以是现有病例的全部或大部分,对照样 本仅仅是没有特定结局的人群中的一小部分。
会) 和关于暴露和混杂的信息。
14. Descriptive data: 14 (b). 指出每个重要变量含有缺失值的个体数。
14. Descriptive data:
METHODS
4. 研究设计: 在文章中尽早叙述研究设计 的关键要点。
在方法部分(或引言的末尾)尽早说明研究设计的 关键要点,是读者了解设计的基本内容。
关键要点
队列研究: 在特定时间段内随访;构成队列的人员; 他们的暴露状态。
病例-对照研究: 病例、对照以及来自哪个人群。 横断面调查:调查的人群和时点。
2. 背景/理由: 解释研究报告的科学背景 和理由。
对读者的重要性。 研究所处阶段和焦点。 已知什麽?现有知识还缺什麽? 背景资料:
现有研究; 现有研究的系统综述
3. 目的: 叙述特定的目的, 包括事先确定 的假设。
研究的详细目的,特定的人群,将估计的参数 研究所针对的特定的假设或问题。
---- 属于哪一类偏倚?
例2 二型糖尿病和原发性青光眼
“如果二型糖尿病妇女比一般妇女更多地进行眼科检 查,检测偏倚可能会影响二型糖尿病与原发性青光眼 之间的关系。我们比较了患糖尿病和未患糖尿病妇女 报告的眼科检查的平均次数。我们还控制了与较认真 的眼科检查有关的一些协变量,重新计算了青光眼的 相对危险度。’’
13 (a). 报告每个阶段的个体数— 例如潜在的合 格数、考察人数、确认合格数、纳入研究数、 完成随访数和被分析人数。 13 (b). 每个阶段未参加的理由。 13 (c). 利用流程图。
Flow chart (流程图)
14. Descriptive data:
14 (a). 给出参加者的特征(如人口学、临床、 社
观察性研究与随机对照试验 互相补充
观察性研究与随机对照试验
随机对照试验 随机
试验设计
观察性研究 实际观察
少
患者人数
多
严格
患者选择的限制
少
队列研究(Cohort studies)
研究者随着时间访问对象, 得到有关他们及其暴露的 基线信息,一段时间后,评价结局的发生情形。
在暴露的和未暴露的个体之间,或者在不同暴露类 别的个体组之间进行比较
如果测量了许多变量,并且在早期探索阶段用于探索 性分析,最好在附录、额外的表格或另文中提供一份 详细的清单。
要报告统计分析中考虑过的所有 ‘候选变量’ ,而 不要有选择地报告那些包含在最后模型中的变量。
例 主要和次要终点 ---- 地特胰岛素研究
主要终点是严重药物副反应的发生, 包括低血糖事 件数(总数、重度、夜间。 严重副反应定义如下: 死亡、生命危险、住院或延长目前的住院、持久或重 要残疾、先天或出生缺陷以及医生认为可能危害患者 和/或需要医学或手术干预的重要医学事件。 次要终点包括 HbA1C水平的降低、空腹血糖(FBG) 和体重改变。 FBG 波动定义为最近患者自测2-6次 FBG的标准差。
11. 定量变量: 解释在分析中如何处置定量 变量。必要时, 描述如何归并成类别和理由
有的研究者将连续测量型的暴露变量转换成新的分 类变量。这时,如何分组对后继分析有重要影响。
作者必须解释为何、如何将定量变量分组归并成类 别,包括类别的个数、分界点、各类的均数或中位 数。
12. Statistical methods:
另一项研究发现,67 篇用统计分析校正混杂因素的 文章中,多数没有清除说明混杂因素是怎样选择的。
例 术前C反应蛋白预测手术后死亡
“我们利用基于数据的一系列Cox模型,包含单变量 分析P0.20的变量。因为已知HMG- CoA还原酶抑制 剂(支架)治疗和POD1cTnI分别有降低和增加心血管手 术患者心血管事件和死亡, 所以两者均强迫进入模型。” “检验比例风险假定时,包含术前CRP与对数随访
时 间的交互效应,交互效应无统计学意义,支持比例风 险假定。” “死亡的观察终止在7年,HLOS的观察终止在30
12 (b). 描述考察亚组和交互效应的方法
读者需要知道,哪些亚组分析是事先计划的,哪 些是在分析数据的时候发生的。同样重要的是, 解释用哪些方法考察亚组之间效应或联系的差异。 (见 item 17).
横断面研究的一个明显的困难是确定暴露先于疾病。
观察性研究的报告
观察性研究的报告常常质量不够好. 很差 的报告妨碍读者评价一项研究的优点和缺 点,以及结果的推广.
加强观察性流行病 学研究报告(strobe) 声明
Lancet 2007, 370:1453-57
STROBE Statement 2007
12 (a) 描述所有统计方法, 包括控制混杂的方法.
必须足够详细地叙述统计方法,以使有知识的读者 拿到原始数据后能够证实所报告的结果。 [International Committee of Medical Journal Editors].
现状
一项实证研究表明, 169篇文章中只有93篇 (55%)在 报告校正混杂因素时清楚地叙述了连续型变量和多 分类变量如何进入统计模型。
ຫໍສະໝຸດ Baidu
题目与摘要 1
引言
2-3
方法
4-12
结果
13-17
讨论
18-21
资助
22
TITLE AND ABSTRACT
1 (a). 在标题或摘要中以通用的术语指出 研究的设计。
‘Leukaemia incidence among workers in the shoe and boot manufacturing industry: a case-control study’
偏倚。研究者最好在订计划时就认真考虑潜在的偏 倚来源。 写报告时,建议作者评估有多大可能出现有关的偏 倚。尤其,要讨论偏倚的方向和大小,可能的话, 再估计一下。
例1 中国自杀的危险因素
在多数自杀的病例-对照研究中,对照组由活 着的个体组成,但是我们决定以死于其他原 因的个体为对照组
以已故个体为对照,用以评估其危险因素的 信息来自死者的家庭成员或亲密关系者,因 此和自杀者的信息来源更具有可比性。
Matched studies 匹配研究
6 (b). 队列研究:对匹配研究,给出匹配标准 和暴露和非暴露的人数。
6 (b). 病例对照研究:对匹配研究,给出匹配 标准和每个病例匹配对照的人数。
7. 变量: 明确定义所有的结局、暴露、预 测变量、潜在的混杂变量和效应修正变量。 必要时给出诊断标准。
CRP是在手术前一瞬间和术后1-5天收集的 全血中测定… 另有一份特定的清单, 从CABG Genomic项目 的1500多变量中,根据理论选出的患者表型变 量, 供全死因死亡和住院时长分析. 人口学变量包括年龄、性别、种族和医院。
9. 偏倚: 描述针对潜在偏倚来源所做的努力
选择偏倚、信息偏倚、混杂偏倚 读者需要了解研究期间采取哪些措施来减少潜在的
‘‘研究期间该地区的病例数决定我们的样本 量’’ [皮肤利什曼病].
例2 通常,需要计算决定
‘‘该地区的一项关于潜在抑郁症的调查, 报告患病率为19.8%。我们假定正常体重 儿童的母亲中20%患抑郁症,而营养不良 儿童的母亲患抑郁症的优势比为 3,功效 设为80%,检验水准设为 5% 。我们需要 72对病例-对照(一个病例对配一个对 照)。”
交互效应
若A因素能改变B因素的效应: A因素存在时, B因素的效应≠
A因素不存在时, B因素的效应 则称A因素和B因素间存在交互效应 要列出四个效应:
(1)无暴露时结果如何; (2) A因素的单独效应 (3) B因素的单独效应 (4) A因素和B因素的联合效应
RESULTS
13. Participants:
例 2 来源 -- 老年妇女透析史和癌症风险
Iowa 妇女健康研究的参加者是从 1985年Iowa州汽 车驾驶执照名单中全部55至69岁妇女中抽取的一 份随机样本,这份名单代表了该年龄组妇女的 94%。
随访问卷于1987年10月和1989年8月邮寄,以调查 生存状态和地址变迁。
除非恶性皮肤肿瘤以外,癌症的发生是通过Iowa 州健康登记来确定的。以姓名、邮编、生日和身 份证号码的组合来和登记的个体相匹配。
例 1 目的 ---- 殴打综合症
“我们的主要目的是: 1) 确定四个社区卫生服务中心出现的妇女
患者中遭遇家庭暴力的比例。 2) 找出目前受虐待和不受虐待患者之间的
人口学和临床差异。”
例2 假说 ---- 地特胰岛素研究
口服降糖药治疗效果欠佳的2型糖尿病患者, 每天一次使用基础胰岛素可以降低餐后血糖, 改善HbA1C水平, 仅仅中度增重, 而且临床低 血糖的风险低, 它是许多患者偏爱的一种选择。
对照代表产生病例的那个队列或人群。
横断面研究(Cross-sectional studies)
研究者在同一个时间点评价全部个体,常常是考察 暴露、危险因素或疾病存在的百分比。
有些横断面研究是分析性的,目的在于定量描述暴 露和疾病之间潜在的因果联系。这样的研究需要象队 列研究那样比较暴露组之间疾病的患病率。也可以象 病例-对照研究那样比较有病组和没病组之间暴露风 险。
地点: 收集数据的地点或来源(例如,选民名册、 门诊部、肿瘤登记…)。
位置: 进行研究的国家、城市、医院或门诊部 日期: 不仅限于时间长度。 生存分析: 起点、终点以及随访结束的日期。
6. Participants:
6 (a). 队列研究: 给出合格标准, 和选择参加者的 来源和方法。描述随访的方法。 6 (a). 病例对照研究:给出合格标准, 以及确诊
解读 STROBE
---- 提高观察性研究论文的水准
方积乾
中山大学公共卫生学院 医学统计与流行病学系
2010年8月
RCT vs. Observational study
医学研究的许多问题靠观察性研究来探索。 观察性研究更适用于发现治疗措施罕见的或
较迟出现的副反应,更多地靠日常医学实践 来实现。 临床专业杂志发表的文章,十分之九是观察 性研究。
---- 属于哪一类偏倚?
10. 研究的规模:解释研究的规模是怎样 达到的
为了得到充分狭窄的置信区间, 有意义地回答所研究 的问题, 研究规模要足够大。
小样本常常提供有价值的信息,但是宽的置信区间 表明其对现有知识贡献较少。
为了区别“小的联系”和“没有联系”,需要大样 本。
例1 罕见病,利用全部病例
现有资料的二次使用
这是观察性研究的创造性部分,其结果不一定没价 值或不重要 -- 简单重述原始目的可帮助读者了解研究的内容和 资料可能的局限性。
如果本报告是某项研究若干部分之一 -- 通过简单重述该研究的主要特点,引述前一篇文 章。
5. 地点: 叙述地点、位置、日期, 包括招募、 暴露、随访和数据收集的时间范围.
病例和选择对照的来源和方法。给出选择病 例和对照的理由。 6 (a). 横断面研究:给出合格标准, 以及选择参 加者的来源和方法。
例1 纳入标准和排除标准 ---- 地特胰岛素研究
所有其他一型或二型糖尿病患者都合格, 经他 们的医生同意就可纳入。
排除标准: 不能或不愿参加试验,和/或不愿参 加随访、对地特胰岛素或赋形剂过敏、以前 参加过研究或以前用过地特胰岛素。
8. 数据来源/测量: 对每一个变量给出数据 来源和评价(测量)方法的细节。如果有 多个组,描述评价方法的可比性。
测量暴露、混杂变量和结局的方法影响研究的真 实性和可靠性。
暴露和结局的测量误差和错误分类会使因果关系 的检出更加困难,甚至会造出虚假的关系。
例 术前C反应蛋白(CRP)预测手术后死亡
可以评价若干不同的结局指标,可以在随访期间的 多个时间点考察暴露和结局。
病例-对照研究(Case-control studies)
研究者在具有特定疾病结局者(病例)和不具有特 定疾病结局者(对照)之间比较他们的暴露。
要收集的病例和对照应当能代表人群中某个队列或 某个断面。
病例样本可以是现有病例的全部或大部分,对照样 本仅仅是没有特定结局的人群中的一小部分。
会) 和关于暴露和混杂的信息。
14. Descriptive data: 14 (b). 指出每个重要变量含有缺失值的个体数。
14. Descriptive data:
METHODS
4. 研究设计: 在文章中尽早叙述研究设计 的关键要点。
在方法部分(或引言的末尾)尽早说明研究设计的 关键要点,是读者了解设计的基本内容。
关键要点
队列研究: 在特定时间段内随访;构成队列的人员; 他们的暴露状态。
病例-对照研究: 病例、对照以及来自哪个人群。 横断面调查:调查的人群和时点。