卫生统计学第八版李晓松第十四章 调查研究设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二节 基本的概率抽样方法及其样本量估计
(五)整群抽样
1. 基本概念
整群抽样(cluster sampling):以“群”(cluster)为基本单位的抽样方
法。先将总体分成若干个群,从中随机抽取一些群,被抽中群内的 全部个体组成调查的样本。
2. 优缺点
(1)优点:便于组织调查,节约成本,容易控制调查质量。 (2)缺点:样本量一定时,抽样误差一般大于简单随机抽样。
当初步估计π小于0.2或大于0.8时:
第二节 基本的概率抽样方法及其样本量估计
(四)分层随机抽样
例3 在例2的总体中,牧区有2900人,林区有2500人,如先将
总体分为牧区和林区两个层,预调查得到牧区、林区各层内居
民145和125人,平均血清硒含量分别为27.80μg/L、26.20μg/L, 标准差分别为 4.30μg/L、3.43μg/L,患大骨病的频率分别为30%,
1. 基本概念
系统抽样(systematic sampling):又称机械抽样,按照某种顺序给总体中的个体编号,然后随机 地抽取一个号码作为第一调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。
2. 优缺点
(1)优点:易于理解,简便易行;容易得到一个在总体中分布均匀的样本。 (2)缺点:当总体的观察个体按顺序有周期性或单调增减趋势时,可能产生偏倚;抽到的样 本较分散,不易组织调查。
0.2~0.8之间),同样,相对误差为ε =10%,置信水平为1-α =95%:
因此,欲调查患大骨节病的居民所占百分比,至少需要调查459名居民。
由于例2拟通过同一项调查达到2个目的,该调查的样本量应取163和459两个数的
最大值,即需调查459名居民。
第二节 基本的概率抽样方法及其样本量估计
(三)系统抽样
第二节 基本的概率抽样方法及其样本量估计
(二)简单随机抽样
1. 基本概念
(1)简单随机抽样(simple random sampling):或称单纯随机抽样,保证总体中的每一个 个体都有同等的机会被抽出来作为样本的抽样方法。它是最基本的抽样方法,也是其他 抽样方法的基础。 (2)抽样框(sampling frame):将总体的全部观察单位编号,形成抽样框,在抽样框中随
(1)标题 (2)说明 (3)被访者基本情况 (4)主要内容 (5)编码
(6)作业证明的记载
第一节 调查设计的基本内容
(四)调查表
2. 调查表制定的一般步骤
(1)明确调查目的 (5)确定项目的回答选项 (6)预调查及评价
(2)提出调查项目
(3)项目筛选 (4)确定项目的提问形式
(7)修改完善
第一节 调查设计的基本内容
(四)分层随机抽样
3. 样本量估计
(1)样本量估计的依据
①总体变异程度CV的估计:(以预调查数据对总体CV做初略估计)
上式中,样本均数: 样本方差: 式中wh= Nh/N 为总体中各层的观察单位数占总观察单位数的比例,L为“层” 数, 为各层的均数, 为各层的方差。
第二节 基本的概率抽样方法及其样本量估计
(四)分层随机抽样
②估计的总体率p:可通过预调查,以各层的观察单位数占总观察单位数的比重作为权 数,粗略估计加权合计率。 ③相对误差ε:可根据研究问题的背景加以确定。
④置信水平1-α:也可根据研究问题的背景加以确定。
(2)样本量估计公式 ①估计总体均数时: ②估计总体率π时: 当初步估计π在0.2~0.8时:
第二节 基本的概率抽样方法及其样本量估计
(六)多阶段抽样
1. 基本概念
(1)二阶段抽样(two-stage sampling):如果整群抽样中调查的不是抽中群内的所有
个体,而是在群内再进行抽样,调查其中的部分个体。 (2)多阶段抽样(multi-stage sampling):在初级抽样单位中抽取二级抽样单位,又
(四)分层随机抽样
(2)按总体率估计,首先粗略估计总的频率: 若仍以 ε =0.02,置信水平为 ,则样本量为:
按比例分配,则两个地区需抽取的居民人数分别为:
可见,欲调查患大骨节病居民所占百分比,两个地区分别至少需要调查286和
246名居民。
例3拟通过同一项调查达到两个目的,两个地区该调查的最小样本量应取 (103,286)和(89,246)的最大值,即分别最少需调查286和246名居民。
第三节 非概率抽样方法
第三节 非概率抽样方法
(一)非概率抽样方法的定义
1. 不考虑等概率原则,主要依据研究者的主观意愿、经验或
卫生统计学
第十四章 调查研究设计
郝元涛 中山大学
马晓光
浙江大学
目录
01
02 03 04 第一节:调查设计的基本内容 第二节:基本的概率抽样方法及其样本量估计 第三节:非概率抽样方法 第四节:数据质量评价指标
重点难点
※ 调查研究设计的一般做法
※ 基本的抽样方法及其样本量估计
※ 信效度的概念及其评价指标
第二节 基本的概率抽样方法及其样本量估计
(二)简单随机抽样
例2 在西藏某地区5400名居民中抽取270人作为样本测量血清硒含量,结果发现,
居民血清硒含量平均为26.80μg/L,标准差为3.49μg/L,患大骨节病的居民 123人。 为调查西藏该地区居民血清硒含量的平均水平及患大骨节病的比例,基于上述信 息,估计进行简单随机抽样所需样本量。
(2 )单独按照常用的基本抽样方法估算的样本量一般偏小,可以采用
设计效应进行调整。 (3)设计效应(design effect, Deff)首先是1965年L.Kish在他的代表作《抽
样调查》中提出的,Deff是复杂抽样设计与简单随机抽样设计估计量的
方差之比,用来反映复杂抽样设计的效率或相对精确程度。
4. 数据整理
(1)保存原始数据 (2)对数据变量和内容进行清理检查
5. 数据分析
第二节 基本的概率抽样方法及其样本量估计
第二节 基本的概率抽样方法及其样本量估计
(一)基本概念
1. 概率抽样(probability samples)
按照某种特定的机会抽取样本。
2. 样本量估计
(1)样本量估计是抽样设计的重要部分。 (2)样本量不足,则抽样误差较大;在统计推断时,检验效能偏低,导致假阴性结果。 (3)片面追求大的样本量,不仅导致人力、物力和时间的浪费,也可能引入其他一些偏倚。 (4)在调查研究设计中,需根据设计类型、抽样方法及结局变量的性质,借助适当的公式 进行样本量的估计。
55%。现在估计分层随机抽样所需样本量。
第二节 基本的概率抽样方法及其样本量估计
(四)分层随机抽样
(1)按总体均数估计:
若仍以 ε =0.02,置信水平为 1-α,则样本量为: 按比例分到2个地区: 可见,欲调查平均血清硒含量,两个地区分别至少需要调查103和89名居民。
第二节 基本的概率抽样方法及其样本量估计
第一节 调查设计的基本内容
第一节 调查设计的基本内容
(一)调查目的
1. 了解总体参数,说明总体特征
2. 研究事物之间的关联
第一节 调查设计的基本内容
(二)调查对象与观察单位
1. 确定调查总体,划清调查总体的同质范围 2. 明确调查的人群及调查的时间和地点 3. 不在总体范围内的个体不应作为观察单位
在二级抽样单位中抽取三级抽样单位等,将整个抽样过程分成若干个阶段进行的抽
样方法。
2. 优缺点
(1)优点:便于组织调查,节约成本,容易控制调查质量。 (2)缺点:样本量一定时,抽样误差一般大于简单随机抽样。
第二节 基本的概率抽样方法及其样本量估计
(六)多阶段抽样
3. 样本量估计
( 1 )多阶段抽样设计一般较为复杂,得到精确的方差估计公式很困难, 尤其是多种抽样方法结合使用时。
第一节 调查设计的基本内容
(三)调查方法与调查项目
1. 调查方法和调查项目
(1)根据调查目的、调查对象和具备的调查条件确定调查方法
(2)根据调查指标确定调查项目
2. 调查方式
(1)观察法
wenku.baidu.com
(2)问卷法
(3)访谈法
3. 调查表 4. 组织计划和实施
第一节 调查设计的基本内容
(四)调查表
1. 调查表的构成
第二节 基本的概率抽样方法及其样本量估计
(五)整群抽样
第二节 基本的概率抽样方法及其样本量估计
(五)整群抽样
①对于总体均数估计: ②对于总体率估计: 当总体为无限总体时:
当总体为有限总体时:
(2)相对误差 ε :可根据研究问题的背景加以确定。 (3)置信水平 1-α:也可根据研究问题的背景加以确定。
置信水平也可由研究者根据研究问题的背景加以确定,通常取90%、95%或99%。
z / 2 C V n
2
第二节 基本的概率抽样方法及其样本量估计
(二)简单随机抽样
(2)样本量估计公式 ①估计总体均数时: ②估计总体率π 时:
当初步估计π 在0.2~0.8时:
当初步估计π 小于0.2或大于0.8时:
(四)调查表
3. 调查表问题的设置
(1)避免不确切的表述 (2)避免判定性的问题 (4)避免难堪或禁忌的敏感问题 (5)避免笼统和抽象的问题 (6)避免多重问题
(3)避免引导性的问题
第一节 调查设计的基本内容
(五)组织计划和实施
1. 调查员的选择 2. 调查员的培训
(1)介绍本次调查的目的、计划、内容、方法等有关情况 (2)介绍调查的具体内容和任务 (3)调查问卷的培训 (4)模拟调查或访问 (5)建立监督、管理和相互联系的方法和规定 (6)预调查
3. 样本量估计
由于系统抽样无专用的标准误计算公式,往往按简单随机抽样的方法来估计样本量。
第二节 基本的概率抽样方法及其样本量估计
(四)分层随机抽样
1. 基本概念
分 层 抽 样 (stratified sampling) : 将 总 体 中 全 部 个 体 按 某 种 特 征 分 成 若 干
“层”(stratum),再从每一层内随机抽取一定数量的个体组成样本。
(1)估计总体均数时:根据已知信息,血清硒含量均数26.80μg/L,标准差3.49μg/L。 若要求最大相对误差为ε =0.02,置信水平为1-α =95%:
因此,欲调查血清硒含量的平均水平,至少需要调查163名居民。
第二节 基本的概率抽样方法及其样本量估计
(二)简单随机抽样
(2)估计总体率时:根据以上预调查数据,p = 123/270 = 0.456(推测π 介于
机抽取部分观察单位组成样本。
2. 优缺点
(1)优点:简单直观、均数(或率)及其标准误的计算简便。 (2)缺点:是总体较大时,难以对总体中的个体一一进行编号,且抽到的样本分散,不 易组织调查。
第二节 基本的概率抽样方法及其样本量估计
(二)简单随机抽样
3. 样本量估计
(1)样本量估计的依据
①总体中个体的变异程度:如果个体间变异程度小,则所需样本量也较少;反之,如 果变异程度大,则需较大的样本量。通常用变异系数CV 来反映个体间变异。 ②调查的精度:用最大相对误差ε 反映精度的要求,即测定值与真实值之差与真实值的 比值。精度要求越高,所需样本量就越大。可由研究者根据研究问题的背景加以确定。 ③置信程度:通常用置信水平1-α 反映置信程度。置信程度要求越高,所需样本量越大。
第一节 调查设计的基本内容
(六)数据整理分析计划
1. 问卷核查
(1)完整性核查 (2)逻辑检查
2. 数据编码
(1)包括事前编码和事后编码 (2)需要按照统一规则进行编码 (3)将编码信息制定成编码手册
第一节 调查设计的基本内容
(六)数据整理分析计划
3. 数据录入
(1)使用FoxPro、Excel、Epidata 等建立数据库结构 (2)对数据录入员提供统一录入说明,双录入 (3)数据录入完毕后,应作抽查或全面核查
2. 优缺点
(1)优点:①样本具有较好的代表性,抽样误差较小;②各层可根据调查对象的 特征,采取不同的抽样方法以及资料收集方式;③统计分析内容更丰富,可以对 不同层进行独立分析,还可以比较不同层间的差异。 (2)缺点:若分层变量选择不当,层内变异较大,层间变异较小,则分层抽样失 去意义。
第二节 基本的概率抽样方法及其样本量估计
第二节 基本的概率抽样方法及其样本量估计
(五)整群抽样
第二节 基本的概率抽样方法及其样本量估计
(五)整群抽样
(1)按总体均数估计:
可见,欲调查平均血清硒含量,至少需调查12个乡镇。 (2)按总体率估计:
可见,欲调查大骨节病患病居民所占百分比,至少需调查8个乡镇。
同样,该调查的最小样本量应取12和8的最大值,即最少需调查12个乡镇。
相关文档
最新文档