浙大统计——横断面研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
横断面研究(Cross-sectional study)的设计与分析
横断面研究是调查某特定人群在某时点的患病状况以及有关危险因素信息的一种研究形式。又称患病率调查或现况调查。横断面研究又根据是否调查所有研究对象分成普查(census)和抽样调查(sampling survey)。
目的:
1. 流行状况和病因研究(疾病分布与危险因素的关系)
例如某县卫生局需决定县医院设多少肿瘤病床,是否投资购买CT和钴60机,做该县肿瘤病人普查。
例如在原发性高血压的普查中,调查了患有原发性高血压的病人和健康人的年龄、性别、家族史、吸烟和饮酒习惯、职业、体力活动和血脂等因素。可以从以上因素中筛选出高血压的危险因素。
2. 三早(早期发现、早期诊断和早期治疗),筛查(定期的重复横断面调查)
例如饮食业人员的肝炎普查、宫颈癌筛查、糖尿病抽样调查等。
横断面研究的优点是研究周期短,能在较短的时间获得对研究总体全面的概括性的认识。缺点是只能获得患病率,
而不能获得发病率。由于是在同一时点调查因和果,因此无法对因果关系作判断。
横断面研究设计(示意图)
ED ED ED ED
调查设计的内容(以糖尿病抽样调查为例)
(1)确定研究目的
了解糖尿病在一般成年人(30岁以上)(全国、广东省或城市)中的流行情况和危害程度。探讨与糖尿病患病有关的危险因素(如遗传、肥胖、饮食习惯、吸烟与饮酒等)。
(2)确定研究对象和样本量
研究的总体(全国、广东省或广东的城市居民)、居民的定义、年龄范围、性别比例
抽样的方法与抽样比例(样本量估计)
(3)确定观察指标
糖尿病的诊断标准
调查方法和检测方法
调查的界定时间
(4)制定调查表
根据样本量和研究目的确定调查表的内容
样本量少时,每人的调查时间可以稍长,调查表内容可以多一些。如样本量大,每个人的调查时间有限,调查表应集中于关键的内容。
分析项目:如年龄、性别、家族史、体重、身高、饮食习惯、烟酒嗜好史等。
核对项目:姓名、身份证号、联系电话、地址等。
调查员的姓名和调查日期
调查前需对调查人员做培训,统一询问和填表方式。并可以做试访。
(5)设计统计分析指标
患病率,标准化率,χ2检验等
随机抽样的方法与标准误计算
1.单纯随机抽样(simply random sampling)
随机化方法:抽签、随机数字表或随机数发生器。
单纯随机抽样是最基本的随机抽样方法,也是其它抽样方法的基础。优点是简单易行,适合样本量较少,方便编号的对象。标准误的计算也较简单。但样本大时不可能实施。
标准误计算:无限总体抽样,计算同前;有限总体抽样,乘上一个比例系数
设总体数为N,样本数为n,则:
S
S
n
n
N x
=-
1
S
pq
n
n
N p
=
-
-
()1
1
2.系统抽样(机械抽样)(systematic sampling)
随机化方法:按一定顺序,等距抽取样本。距离按抽样比例定,开始点用随机数定。
系统抽样方法简单易行,容易得到一个按比例分配的样本。适合抽样对象已经有某种编号顺序,一般情况抽样误差比单纯随机抽样小。缺点是如果抽样顺序与某因素的分布规律吻合时,可能抽得有偏样本。无专门的标准误计算公式。
标准误计算:无专用的公式,一般用单纯随机抽样公式。3.分层抽样(stratified sampling)
随机化方法:随机化不能完全避免抽取的样本在一些重要的
因素出现偏倚。为保证抽取的样本在这些重要的因素达到均衡,可采取分层抽样的方法。如糖尿病调查中为保证样本的年龄分布和性别分布与总体相符,可以将抽样总体按年龄性别分层。如:
各性别年龄层的总体人数
年龄组男女
30-
40-
50-
60-
分层抽样的优点是抽样误差较少,可以对不同层采用不同随
机化方法,还可对各层作独立的分析。缺点是工作量大,并且需先对抽样总体有一定了解。
按比例分层随机抽样:对每层中的抽样总体按固定比例随机抽取样本。
最优分配分层随机抽样:按估计的各层的样本数随机抽取各层的样本。
标准误计算:设总体数为N,各层的总体数为Ni,各层的方差为Si2,各层抽取的样本数为n i,则:
S
N
N
S
n x
i i
i =
⎛
⎝
⎫
⎭
⎪
∑22
S
N
N
p q
n p
i i i
i =
⎛
⎝
⎫
⎭
⎪
∑2
S
N
N
S
n
n
N x
i i
i
i
i =
⎛
⎝
⎫
⎭
⎪-
⎛
⎝
⎫
⎭
⎪∑221
S
N
N
p q
n
n
N p
i i i
i
i
i =
⎛
⎝
⎫
⎭
⎪-
⎛
⎝
⎫
⎭
⎪∑21
4.整群抽样(cluster sampling)
单纯随机抽样、系统抽样和分层随机抽样都要求对每名对象