方积乾《卫生统计学》2观察性研究的设计与实施1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
1
1
1
0.0307
200 775 205 770
OR:
OR e 1.96 Var(lnOR)
5.64e1.96 0.0307 (4.00,7.95)
4/4/2020
13
② Miettinen 法
OR:
1.96
1 2
OR
例 16-7 2 110.14,
OR 5.64
OR:
1 1.96
4/4/2020
11
(2)优势比的假设检验
H 0 :OR=1, 检验统计量
H1 :OR ≠ 1
2
(N 1)(ad bc)2
(a b)(a c)(b d )(c d )
(975 1)(96 666 104 109)2 110.14
200 775 205 770
注:检验统计量分子上:(N-1),
相对危险度RR=风险之比
归因危险度AR=风险之差
RR 的(1-α)置信区间:
RR
1 Z / 2
2 MH
AR 的(1-α)置信区间:
AR1
Z / 2
2 MH
RR 的 95%置信区间:
RR
1 Z / 2
2 MH
1 1.96
22.56 571.47
AR 的 95%置信区间:
AR1
Z / 2
2 MH
抗体阳性 57
20477
278.36
抗体阴性 54
437579
12.34
合计
111 458056
24.23
4/4/2020
RR
278.36
22.56
12.34
23
人年 资料:
随访人群 发病人数 观察人年数
暴露组
d1
T1
非暴露组
d0
T0
合计
D
T
H0 : RR =1, H1 : RR ≠1
Mantel-Haenszel 2 统计量
合计
56 组 7组
63 组
4/4/2020
20
第四节 队列研究的实施与分析
4/4/2020
21
一、队列研究
危险因素 Risk factor
暴露 Exposure
危险因素 Risk factor
暴露人群 Cohort
对照人群 Cohort
暴露结局 Outcome
对照结局 Outcome
4/4/2020
小计
有无
发病
ah bh m1h
未发病 ch dh m0h
小计
n1h n0h nh
4/4/2020
第十六章 观察性研究的设计与分析
郭艳 中山大学公共卫生学院
2015.12.23
4/4/2020
1
观察性研究
(observational study)
不对研究对象施加任何干预措施的情况下, 通过观察或访问的方法,客观地记录被研 究事物的状况。 也称非实验研究 (non- experimental study)
2 MH
(d1T T1D)2 T1DT0
H 0 成立时,近似地服从自由度为 1 的 2 分布
2 MH
(d1T T1D)2 T1DT0
(57 458056 20477 111)2 = 20477 111 437579
=571.25
拒绝零假设,可以认为,RR ≠ 1
4/4/2020
24
置信区间
4/4/2020
5
表 16-1 单纯随机抽样标准误及区间估计计算公式
总体 类型
无限 总体
总体均数
标准误
区间估计
S S
X
n
X t / S 2,n1 X
总体概率 标准误
SP
P(1 P) n 1
区间估计 P Z / 2SP
有限 总体
S Nn S X N 1 n
X t / S 2,n1 X
N n P(1 P) SP N 1 n 1
2
OR
1 1.96
5.64 110.14 (4.08,7.79)
4/4/2020
14
2.分层四格表资料的分析
例16-8 食管癌与饮酒关系病例-对照研究
每日饮酒量 (g/天)
80+ 0~79
ORh
25~44 病对 例照 5 35 5 270
7.71
年龄组(岁)
45~54 病对 例照
55~64 病对 例照
队列研究(cohort study) ---- 前瞻性
4/4/2020
3
第二节 横断面研究的实施与分析
4/4/2020
4
一、单纯随机抽样调查的实施与分析
(一)单纯随机抽样调查资料的分析
例16-1 从某中学5400名学生中抽取270人作为样本 进行近视眼情况调查,以估计该中学学生的平均视 力及患近视眼学生的比例。 1.均数的区间估计 2.概率的区间估计
3.22
3.38
6.56
(2)RR 的检验 H0:RR=1 H1:RR≠1
Mantel-Haenszel 2 统计量
理论频数
实际频数
2 MH
H
ah
h1
H
h1
m1hT1h Th
2
H
h1
m1hT1hT0 Th2
h
( 28
785)
( 50 18250 64399
(
50
18250 46149 643992
266.02(1 1.96 )
4/4/2020
571.47 25
频率资料:
随访人群 发病人数 未发病人数 总人数
暴露组
a
c
a+c
非暴露组
b
d
b+d
2 MH
(N 1)(ad bc)2 (a b)(a c)(c d )(b d )
4/4/2020
26
2. 分层资料的分析
例16-16 按年龄分层的人时资料
15
(2)对公共优势比 OR 的假设检验
H 0 :OR=1,
H1 :OR ≠ 1
检验统计量
H
H
( ah Th )2
2
h1
h1
MH
H
Vh
h1
Th:对应于 ah 的理论频数
Vh:对应于 ah 的方差
Vh
n1hn0hm1hm0h nh3 nh
例 16-8
2 MH
(ah Th )2 Vh
(96 48.5329)2 86.51 26.0437
P Z / 2SP
注: 有限总体校正因子
N n N 1
n 较大时,可用 Z / 2 代替 t / 2,n1
4/4/2020
6
二、分层抽样调查的实施与分析
等比例分配 (proportional allocation)
大层多抽,小层少抽; 各层抽取的比例与该层在总体中所占比例相同
ni Ni nN 非等比例分配 (non- proportional allocation)
优势比 OR
1.0
3.57
7.80
27.23
H0:不存在剂量-反应线性关系; H1:存在剂量-反应线性关系
检验统计量
K
[ X k (ak Tk )]2 (n3 n)
2
k 0 K
K
=152.99
n1n0[n
mk
X
2 k
(
mk X k )2 ]
df=1
k 0
k 0
4/4/2020
18
(二)匹配设计资料的分析 *
3.22
3.38
6.56
(1)RR 的估计
H ahT0h
RR
h1 Th H bhT1h
28 46149 / 64399 78519898 / 68712 = 22 18250 / 64399 95 48814 / 68712 =3.36
h1 Th
4/4/2020
27
指标
发病人数 观察人年数
而以前所学Pearson 2 统计量的分子上:N
N 较大时,两者等价
4/4/2020
12
(3)优势比的区间估计
① Woolf 法
1111 Var(ln OR)
abcd
lnOR: lnOR 1.96 Var(lnOR)
OR:
OR e1.96 Var(lnOR)
例 16-7
Var(ln OR)
11.6620 6.8576
21.6694 10.6701
13.9317 7.4392
H ahdh
OR
h1 H
nh bhch
58.5386 5.29 11.0716
n h1 h
对象分层
合计 病对 例照 96 109 104 666
5.64
58.5386 11.0716 48.5329 26.0437
人数不同
例 16-11 子宫内膜癌与服用雌激素关系的 1:4 病例-对照研究
正常 (对照)
服用雌激素
未服
子宫内膜癌 服用雌激素
(病例)
未服
1 17 组 4组
2 16 组 1组
3
4
0
15 组 5 组 3 组
1组 1组 0组
病例:63 名(其中 56 名服用雌激素); 对照:63×4 = 252 名 匹配组:63 个
每层有一个 四格表
指标
发病人数 观察人年数
RR
按年龄分层
<50
≥50
未按年龄分层
危险因素
有(1)
无(0)
小计
危险因素
有
无
小计
危险因素 小计
有无
28(a) 22(b) 50(m)
785 95 880 813 122 935
18250(T1) 46149(T0) 64399(T) 48814 19898 68712 67064 66047 133111
25 29 21 138
42 27 34 139
5.67
6.36
65+ 病对 例照 24 18 44 119
3.61
ahdh nh
4.2857
16.1972
24.1240
13.9317
bhch hh
0.5556
2.8592
3.7934
3.8634
Th
1.2698
Vh
1.0768
(1)公共优势比
4/4/2020
描述疾病或治疗模式的现状 评估某种暴露对健康的影响 监测某种转归(如药物不良反应) 探索病因和预防措施
4/4/2020
2
观察性研究
描述性研究(descriptive study)
最常见:横断面研究
分析性研究(analytical study)
病例-对照研究(case-control study) ---- 回顾性
880
8806874182814) 2
48814 19898
687122
)
156.64
理论频数
28
(3)RR 的95%置信区间 (Miettinen法)
RR
1 Z / 2
2 MH
1 1.96
3.36 156.64 =(2.74,4.10)
注:频数资料的分层分析
第 h 层四格表一般形式
危险因素
发病与否
RR
按年龄分层
<50
≥50
未按年龄分层
危险因素
有(1)
无(0)
小计
危险因素
有
无
小计
危险因素 小计
有无
28(a) 22(b) 50(m1)
785 95 880 813 122 935
18250(T1) 46149(T0) 64399(T) 48814 19898 68712 67064 66047 133111
病例组 层1
层2 …… 层k
对照组 层1
层2 …… 层k
匹配设计
病例: 对照 = 1 : 1 ; 病例: 对照 = 1 : m
病例与对照在非处理因素方面具有可比性
4/4/2020
9
二、病例-对照研究资料的分析
4/4/2020
10
(一)成组设计病例-对照研究资料的分析
1.单个四格表资料的分析 暴露,2水平
例16-7 食管癌与饮酒的病例-对照研究
组别
病例组 对照组 合计
每日饮酒量(g/天)
80+
0-79
96 (a)
104 (b)
109 (c)
666 (d)
205 (a+c) 770 (b+d)
合计
200 (a+b) 775 (c+d)
975
(1) 优势比的估计
ad 96 666
OR
5.64
bc 104 109
4/4/2020
16
(3)公共优势比 OR 的 95%置信区间
Miettinen 法估计:
OR
1
1.96
2 MH
例 16-8
OR:
OR
1
1.96
2 MH
= 5.291
= 1.96
86.51
(3.72
,
7.51)
4/4/2020
17
3.多个暴露水平的剂量-反应关系 暴露分
例 16-9 食管癌与饮酒关系病例-对照研究
22
暴露组 二、队列研究数据的统计分析
1. 单个四格表的分析
例16-15 为研究鼻咽癌与EB病毒关系,某市进行
了EB病毒抽样调查,共检查25-70岁居民41471人,
其中38550人EB病毒抗体阴性,2921人阳性。以
EB病毒抗体阴性和阳性者形成两个组,进行了为
期12年的队列研究。
人年资料
随访人群 发病数 暴露人年数 人年发病率(/10 万)
1.1:1配对设计资料的分析
例 16-10 子宫内膜癌与服用雌激素关系的病例-对照研 究
正常 (对照)
合计 服用雌激素 未服
子宫内膜癌 服用雌激素
27 对
29 对 56 对
(病例)
未服
3对
4对 7对
合计
30 对
33 对 63 对
4/4/2020
19
2.1: m 匹配设计资料的分析
暴露分2个水平; 1:4小组中服用
多个水平
每日饮酒量(g/天) Xk
病例数 ak (Tk)
0-39 0
29(85.13)
40-79 1
75(72.82)
80-119 2
51(28.31)
120+ 3
45(13.74)
合计 200( n1 )
对照数 bk
386
280
87
22
775(n0)
合计人数 mk
415
355
138
67
975(n)
各层抽取相同数目的个体
最优分配分层随机抽样(optimum allocation)
大层多抽,小层少抽; 变异大多抽,变异小少抽
分层抽样资料分析方法:加权平均!
4/4/2020
7
第三节 病例-对照研究的实施与分析
4/4/2020
8
一、病例-对照研究的类型
ຫໍສະໝຸດ Baidu
成组设计:比较两组的暴露史
病例组 对照组
分层成组设计: