卫生统计学第八版李晓松第十四章 调查研究设计
8卫生统计学实验设计

例:试将同性别、体重相近的15只动物分 到A、B、C三组 (1) (2) (3) (4) (5)
88 1 B 56 2 C 53 2 C 27 0 A 59 2 C
(6)
33 0 A
(7)
35 2 C
(8)
72 0 A
(9)
67 1 B
(10)
47 2 C
(11)
77 2 C
(12)
34 1 B
(13)
基本要素3:实验效应
实验效应是指处理因素作用于受试对象的反应和 实验效应是指处理因素作用于受试对象的反应和 处理因素作用于受试对象 结局,通过观察指标来体现。 观察指标来体现 结局,通过观察指标来体现。 客观性 精确性:包含准确度(系统误差 和精密度(随机 系统误差)和精密度 精确性:包含准确度 系统误差 和精密度 随机 误差) 误差 敏感性(真阳性 与特异性(真阴性 真阳性)与特异性 真阴性) 敏感性 真阳性 与特异性 真阴性 指标的观察 盲法
处理组 对照组 处理因素+非处理因素 (无) 非处理因素 处理效应+非处理效应 (无) 非处理效应
比较结果
处理因素
处理效应
排除“非处理因素”的影响,从而衬托出 “处理因素”的 作用。
对照(control)
均衡性
(1) 对等: 除处理因素外,对照组具备与实验组对等的一 切非处理因素。 (2) 同步: 对照组与实验组设立之后,在整个研究进程中 始终处于同一空间和同一时间。 任何一个对照组都是为相应的实验组专门设立 的。不得借用文献上的记载或以往的结果或 其它研究的资料作为本研究之对照。
55 1 B
(14)
45 0 A
(15)
70 1 B
人民大2024社会调查教程(第八版)作者PPT第14章 统计分析

eta平方系数来测量两变量的相关强度,简写成E 2;具有消减误差比例特征
ni Y i nY
2
计算公式: E
2
Y 2 nY
2
2
E2 表示eta平方系数
Y表示因变量的数值
Y表示因变量的平均数
➢ 要确定两个变量之间的因果关系,必须同时满足三个条件:
• 两变量间必须存在着不对称的相关关系 —必要不充分条件
• 两变量在发生顺序上必须有先后,即先有原因(自变量)的变化,
再有原因(因变量)的变化
• 必须确定两变量的关系不是由第三个变量的存在而呈现出的一种虚
假关系
二、双变量分析的方法
不同测量层次变量的两两组合
(如平均数、比率、方差)是否可推断总体的检验;
双样本差异的总体假设检验,就是要通过两样本统
计量的差异(如平均数之差、比率之差、方差之差)
是否在总体中也存在的检验,亦即要证明两样本的
差异是否是由于来自两个不同的总体造成的
第四节 双变量统计分析
一、双变量分析的内容
1. 两变量间的相关关系
X
Y
• 指当一个变量X发生变化时,另一个变量Y也随之发生变化;反之,当Y发生
一、描述统计及其内容
描述统计
• 与样本、总体有关,与变量多
少无关
• 主要是计算样本的统计量,不
对总体做推断
描述性研究
• 只涉及变量多少,而不涉及样
本或总体问题
• 只关于“是什么”,只做描
述不做解释,通常只涉及单个
变量
二、推断统计与抽样分布
抽样原理
二、推断统计与抽样分布
卫生统计学第十四章 调查设计

(ai
a)2
a i为样本中各群阳性数之 和,a为样本各群的平均阳性 数。
〔b〕群内观察单位m相等
样本均数:x xi xi mk k
均数的标准误 S : x
1
k K
(xi k(k
2
x) 1)
样本率p:
ai mk
1 k
pi
率的标准误Sp:
(1
k
)
k
(pi
i1
p)2
K k(k 1)
pi为样本i第 群的率
〔systematic sampling〕
又称机械抽样或等距离抽样
〔1〕方法 按照一定的顺序,机械地每隔假设干个单位抽取一个观察单位的方法 称系统抽样。
做法是:先将总体观察单位按某一顺序号分成n个局部,再从第一局部随机抽取第k 号观察单位,依次用相等间隔,从每一局部各抽取一个观察单位组成样本。
〔2〕标准误的计算 系统抽样误差随总体性质、抽样的间隔大小而异,无专用的标 准误计算公式。一般情况下,它比单纯随机抽样误差小。有人认为可按单纯随机抽 样方法估计系统抽样误差。
S p(1 8 8)8 0 (8 1 1 )(0 .2 4 0 .3)2 4 (0 .3 4 0 .3)2 4 .. ( .0 .3 6 0 .3)2 4 0 .024
总体 9% 5 可 率信 的 0 .3 区 4 1 .9间 6 0 .0为 2 0 4 .2: 8 ~ 90 .3 189
例14.4 某校有80个班级,各班学生50人,现用锡克试验调查该校学生白喉易感率,随机抽查了8 个班的全部学生,其中阳性人数分别为12,17,12,15,21,20,21,18。试估计该校学生锡克 试验阳性率。
解: 〔群内观察单位相等〕
华北理工卫生统计学教案14实验设计

实验设计(experiment design):是指研究人员对实验因素作合理的、有效的安排,最大限度地减少实验误差,使实验研究达到高效、快速和经济的目的。
实验设计是实验研究中最为重要和关键的第一步。
必须给予高度重视。
有些研究人员未能充分认识到这第一步的重要。
经常是先进行实验研究工作,其后才考虑实验设计问题第二节实验设计的基本要素处理因素、受试对象和实验效应是实验设计的三个基本要素,它们贯穿于整个实验研究过程。
例如:用两种药物治疗糖尿病病人,观察比较两组病人血糖、尿糖的下降情况,这里所用的药物为处理因素、糖尿病病人为受试对象,血糖值、尿糖值为实验效应。
在实验设计阶段,研究人员应根据实验研究的目的,紧紧抓住这三个基本要素,并应通盘考虑如何去合理有效地安排这三个基本要素。
只有这样,实验设计才会有明确的方向。
一、处理因素(treatment factor)在实验过程中,影响实验结果的因素是多方面的,根据研究目的可分为处理因素和非处理因素二类。
处理因素是指研究者欲施加或观察的、并能引起受试对象直接或间接效应的因素,简称处理或因素;非处理因素是指对评价处理因素作用有一定干扰但研究者并不想通过实验考察其作用大小的因素,又称混杂因素。
例如,病人的病情、病程等。
➢处理因素的个数与水平:依照实验因素和水平的不同,可产生四类实验-- 单因素单水平、单因素多水平、多因素单水平、多因素多水平。
➢确定处理因素时应注意的问题1、要抓住实验中的主要因素实验效应是多种因素作用的结果,由于研究目的不同,以及人力、物力和时间所限,研究者不可能通过一次或几次实验中把已知的所有因素都进行处理与分析,只能抓主要的因素,且因素的水平数不宜过多。
2、要分清处理因素和非处理因素例如,研究综合治疗糖尿病的效果,处理因素为药物治疗加饮食疗法;合理调配作息时间和其它辅助治疗措施也能缓解症状,有助于康复,但不是本次研究的处理因素,而是非处理因素。
研究者应采取各种措施,尽可能使非处理因素在所比较的各组中基本相同,以便充分显示处理因素的作用。
医学统计学第章实验设计

2. 精确性 包括准确度和精密度两层含义。
准确度指观察值与真值的接近程度,主要受系统误差的 影响。
在实验设计中常通过随机数来实现随机化。
获得随机数的常用方法有三种:随机数字表、计算机的 伪随机数发生器与随机排列表。
随机数字表(李晓松附表1)常用于抽样研究及随机分 组。表内随机数字互相独立,无论横行、纵列或斜向等 各种顺序均是随机的。使用时可从任一个数字开始,可 查单行、单列,双行、双列,也可以多行、多列,方向 可向下或向上,亦可向左或向右。
例如:欲了解农村地区的卫生服务需求情况,随机抽取 部分农户询问患病与就医情况。居民的患病或就医不是 由研究者所确定的,也不是随机确定的,而是根据农户 自身的实际情况确定的,研究者只是被动的观察实际情 况。
2. 实验研究
又称干预性研究,是对研究对象人为给予干预措施的研 究。
例如:在关于健康教育能否预防小学生近视的研究中, 将小学生随机分为实验组和对照组,对实验组的小学生 给予有关近视的健康教育,对照组则只是每天做一次眼 保健操,不进行健康教育。观察一段时间后,比较两组 小学生视力下降发生情况。
安慰剂的使用需慎重,应以不损害患者健康为前提,适 用于研究的疾病尚无有效药物治疗或使用安慰剂后对该 疾病病情、临床过程、预后无影响或不利影响小的情况, 一般与盲法结合使用。
2. 空白对照
即对照组不接受任何处理,在动物实验和实验室方法研 究中最常用,常用于评价测量方法的准确度,评价实验 是否处于正常状态。
医学统计学(李晓松主编第2版高等教育提高出版社)附录思考与理解练习95%答案解析

一、SPSS 基本功能SPSS基本功能数据管理统计分析图表分析:条图、直方图、饼图、线图、散点图等输出管理:对输出结果复制、编辑等描述性分析均数比较一般线性模型相关与回归分析非参数检验生存分析FrequenciesDescriptivesExploreCrosstabs 统计资料的类型资料类型定量资料:用定量的方法获得的数值资料计数资料:按性质或类别分组后清点各组个数等级资料:半定量资料定量资料的统计推断正态分布两组均数比较单样本设计t检验配对设计t检验成组设计t检验三组及以上均数比较完全随机设计方差分析随机区组设计方差分析重复测量方差分析析因设计方差分析偏态分布配对设计秩和检验单样本设计秩和检验成组设计秩和检验资料类型定量资料计数资料等级资料统计分析统计描述统计推断相对数总体率的估计假设检验u检验卡方检验4假设检验参数检验非参数检验正态分布等级资料偏态分布资料分布类型未知方差不齐,且不易变换达到齐性数据一端或两端不确定的资料1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料 参数检验➢ 优点:资料信息利用充分;检验效能较高 ➢ 缺点:对资料的要求高;适用范围有限 ➢ 优点:适用范围广,可适用于任何类型的资料 ➢ 缺点:检验效能低,易犯Ⅱ型错误 凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其检验效能低,易犯Ⅱ型错误第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
卫生统计学第八版李晓松 数据的产生

第二节 随机对照试验
第二节 随机对照试验
(一)设计原则
1. 对照(control)
(1)案例:“胃冷冻法”治疗胃溃疡是否有效。 (2)安慰剂效应:由于心理效应所产生的虚假现象。 (3)对照思想:设置对照组以减少非处理因素对处理因素效应的影响。 (4)标准的对照试验:将试验对象随机分配到试验组和对照组,除了对试验 组给予处理措施外,两组患者在其他方面都要被同等对待。 (5)意义:鉴别处理因素与非处理因素之间的差异,是进行比较的必要基础; 消除和减少试验误差。
第二节 随机对照试验
(一)设计原则
2. 随机化(randomization)
(1)决定如何将试验对象分配到各处理组中,只有当所有处理组中试验对象的基本 情况相当时,各处理组间的效应比较才是有效的。 (2)匹配定义:找到性别、年龄等变量情况相似的两组对象分别给予不同的处理。 (3)匹配存在的问题:不一定能完全避免偏倚,因为有太多潜在的变量可能影响试 验的结果,很难把所有的因素都进行匹配。 (4)随机化思想:使用随机的方式使每个实验对象有同等的机会被分配到各处理组。 (5)随机化方法:抽签。 (6)随机化意义:保证了各对比组间的均衡可比性。
第四节 样本的可靠性与代表性
(二)抽样误差
例1续 就器械锻炼的流行病学调查而言,假设人群中实际有60%的人抵触器 械锻炼。可用计算机设计程序抽取多个简单随机样本,为每个样本计算出一 个样本率p,将所有的样本率p的值绘制成直方图。
图(A):从率为0.6的总体中分别抽取1000个样本量为100的简单随机样 本的样本率p的分布。 图(B):从相同的人群中抽取1000个样本量为2500的简单随机样本,并 重新计算得到1000个样本率p,并绘制出直方图。
第四节 样本的可靠性与代表性
医学统计学-调查设计

05 数据分析方法与结果解读
描述性统计分析方法
数据整理和可视化
集中趋势描述
对数据进行清洗、整理,并通过图表等方 式进行可视化展示,以便直观了解数据分 布和特征。
计算均值、中位数等统计量,描述数据的 平均水平或中心位置。
离散程度描述
分布形态描述
调查对象
该医院近期就诊的患者,包括门诊和住院患 者。
调查方法
采用随机抽样方法,对就诊患者进行问卷调 查,同时结合医院内部数据进行分析。
调查内容
包括患者对医院环境、医生态度、治疗效果、 费用等方面的满意度评价。
案例三:某药物临床试验效果评价
调查目的
评价该药物在临床试验中的疗效和安全性,为药物上市申 请提供依据。
问题与答案
问卷中的问题应清晰明确,答案选项 应全面且互斥。对于开放式问题,应 预留足够的空间供被调查者填写。
指导语
对于需要解释或说明的问题,应在问 题下方或旁边添加指导语,帮助被调 查者准确理解问题含义。
编码与排版
问卷应采用易于阅读的字体和排版方式,确 保被调查者能够轻松阅读并填写。同时,应 对问卷进行统一编码,方便后续数据处理和 分析。
根据检验效能和效应大小估算
03
根据所需的检验效能和效应大小,结合总体标准差或已知的研
究数据,进行样本量估算。
抽样误差与置信区间
抽样误差
由于抽样引起的样本统计量与总体参 数之间的差异,包括随机误差和系统 误差。
置信区间
影响因素
样本量、总体标准差、置信水平等因 素会影响置信区间的宽度和估计的精 确性。
将总体分成若干群,然后随机抽取 若干群作为样本,适用于群间差异
卫生统计学第八版李晓松第十五章 实验研究设计

病因之一的假说。
第一节 实验设计的基本内容与原则
(一)研究目的
2. 确定研究目的 科学研究就是提出假说和验证假说的过程,实验研究设计的实质是说明如何 验证假说。将研究假说具体化即为研究目的。 确定研究目的要明确研究主要目的和次要目的及其实际价值。 主要目的就是研究的主要问题,次要目的是需要进一步补充和完善研究的结 果。注意研究目的需具体明确。
第一节 实验设计的基本内容与原则
(三)处理因素
(2)根据处理因素与水平的不同,可将实验研究分为两类: ① 单因素多水平 :实验只有 1 个处理因素,处理因素的水平数大于 1 。如比较不同 DON注射剂量组新西兰家兔膝关节软骨和滑膜的形态学改变的研究中,设1个DON剂量 组和1个生理盐水对照组,这属于单因素两水平。如设2个DON剂量组和1个生理盐水对 照组,则属于单因素三水平。 ②多因素多水平:实验同时有多个处理因素,每个处理因素均有多于1个水平。如在 比较不同DON剂量组新西兰家兔膝关节软骨和滑膜的形态学改变的研究中,有2个处理 因素即DON注射和染毒方式,DON剂量为0.05μg/g、0.10μg/g 2个水平,染毒方式有注射 和灌胃2个水平。
联系这一假说。 (2)研究假说二:吸烟和工业污染是公认的肺癌病因,中国西部农业小镇宣威的肺癌发
病率在全世界位居第一,但已有研究表明这两种因素对宣威地区肺癌发生影响不大。宣威
地区烟煤量丰富,当地农村居民长年习惯在室内烧烟煤取暖做饭,但烧煤的火塘没有进风 口和烟囱,从而造成室内严重空气污染,由此提出烧烟煤引起的室内空气严重污染是肺癌
第一节 实验设计的基本内容与原则
(二)实验对象
1. 基本概念
实验对象(experiment subject)是接受处理因素作用的基本单位,亦称研究对象。
卫生统计学第八版李晓松第十四章 调查研究设计

55%。现在估计分层随机抽样所需样本量。
第二节 基本的概率抽样方法及其样本量估计
(四)分层随机抽样
(1)按总体均数估计:
若仍以 ε =0.02,置信水平为 1-α,则样本量为: 按比例分到2个地区: 可见,欲调查平均血清硒含量,两个地区分别至少需要调查103和89名居民。
第二节 基本的概率抽样方法及其样本量估计
第一节 调查设计的基本内容
(六)数据整理分析计划
1. 问卷核查
(1)完整性核查 (2)逻辑检查
2. 数据编码
(1)包括事前编码和事后编码 (2)需要按照统一规则进行编码 (3)将编码信息制定成编码手册
第一节 调查设计的基本内容
(六)数据整理分析计划
3. 数据录入
(1)使用FoxPro、Excel、Epidata 等建立数据库结构 (2)对数据录入员提供统一录入说明,双录入 (3)数据录入完毕后,应作抽查或全面核查
(四)分层随机抽样
(2)按总体率估计,首先粗略估计总的频率: 若仍以 ε =0.02,置信水平为 ,则样本量为:
按比例分配,则两个地区需抽取的居民人数分别为:
可见,欲调查患大骨节病居民所占百分比,两个地区分别至少需要调查286和
246名居民。
例3拟通过同一项调查达到两个目的,两个地区该调查的最小样本量应取 (103,286)和(89,246)的最大值,即分别最少需调查286和246名居民。
第一节 调查设计的基本内容
(三)调查方法与调查项目
1. 调查方法和调查项目
(1)根据调查目的、调查对象和具备的调查条件确定调查方法
(2)根据调查指标确定调查项目
2. 调查方式
(1)观察法
(2)问卷法
(3)访谈法
专业基础课-《医学统计学》课程教学大纲

《医学统计学》教学大纲适用对象:药学专业本科生(学分:2 学时:36)一、课程的性质和任务医学统计学是开展医学研究的重要手段,是认识和揭示医学领域里各种数量特征的科学分析方法,是使医学科研得以成功的一种重要辅助工具。
医学统计学的主要内容包括医学统计学的基本概念、基本原理和基本方法及研究设计的部分内容。
本课程通过讲授、课堂实习、课堂讨论等教学方式,使学生熟悉统计的基本理论、掌握统计方法的应用,加深对基本理论和基本概念的理解。
目的让学生建立统计学的观念,培养统计学的思维,学会从不确定性、机遇、风险和推断的角度去思考医学问题,以提高自身的科学素质和科学研究能力。
二、相关课程的衔接本门课程的先修课程是:高等数学、计算机基础。
三、教学的基本要求1、掌握医学统计学的基本原理、基本概念和基本统计方法。
理论课着重讲授教材的重点、难点,启发和帮助学生自己阅读教材和参考资料,培养学生独立思考能力及自学能力。
2、掌握医学资料的正确整理方法,统计图表的绘制及注意事项,常用统计指标的计算方法、选用原则。
初步掌握使用计算机软件计算常用统计指标。
3、培养学生正确的统计思想,培养学生分析医学资料的初步技能,为同学今后从事医学教学、科研、临床等工作打下坚实的基础。
四、教学方法与重点、难点教学方法:理论课以课堂讲授为主,计算机平台软件操作为辅,采用多媒体与板书结合的教学方法。
重点:医学统计学的基本原理、基本概念和基本统计方法。
难点:统计资料的分析方法五、建议学时分配六、教学方式本课程采用多媒体理论教学与上机实习相结合的方式。
主要讲授医学统计学基本原理和概念,培养学生统计学思维,通过分析各种临床案例,结合统计学软件进行上机实习过程的学习,集课堂教学、实践教学和网络教学为一体,教学环节包括课堂讲授、学生自学、上机实验以及期末考核。
课程大部分内容的讲授需要采用多媒体课件或者网络机房进行教学,并实时演示相关软件操作和网络数据库检索流程等课程的重点内容。
《卫生统计学》PPT课件

实例1:
《剖腹产同时放置宫内节育器 735 例的初步观察》将施行剖 腹产手术1562 例中的735 例作为试验组,在剖腹产的同时放置 宫内节育器。比较两组被观察对象的术后出血、恶露干净时间 和术后副反应等情况。
规定实验组适应症为:破膜和总产程都不超过24小 时,无感染 ( 无阳性体征,血常规正常 ) 以及第一胎 产后本人同意放置宫内节育器者。 另将筛选剩下的 827 例作为对照组,不放置宫内节 育器。
例:电针引产
混杂因素不同状态时,研究因素的分析。
胎膜 产妇状况 例数 成功 成功率 P
已破 初产
经产
331 258 77.9% 0.030
67 60 90.0%
未破 初产
经产
273 170 62.3% 0.332
100 68 68.0%
实验研究的基本要素:受试对象
受试对象是处理因素作用的客体。 按受试对象可分:动物实验和人体试验。 动物选择
本例,受试对象的基本条件不同,试验组较好,而对照组差, 缺乏可比性。
中华妇产科杂志,1985;20(1):49~50。
实例2:
对治疗炎症的某注射液作临床试验,以另一注射液为对照。 适应症为生殖道感染疾病或口腔感染疾病。 研究者设计了3个组: 试验组:30例生殖道感染,30例口腔感染 对照组:30例生殖道感染,30例口腔感染 开放组:外科感染疾病28例,其他感染15例。 开放组为了增多试验组病例,研究者将试验组和开放组合 并,并与对照组作比较。
研究的类型
调查
实验
动物实验 临床试验
实验研究的基本要素
处理因素
受试对象
实验效应
实验研究的基本要素:处理因素
外加于受试对象,在实验中需要观察并阐明 其效应的因素,称为处理因素。
卫生统计学实验设计

随机排列示意
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) 136 643 557 604 384 708 218 061 555 871
排列
(8) (1) (7) (5) (9) (3) (4) (2) (6) (10)
试验组和对照组样本含量不等
两组的比例不超过
1:4 ~ 4:1
样本含量的影响因素:
数据的种类:
定量<等级<定性
个体的变异:
变异小,样本含量少
组间的差别:
差别大,容易鉴别,n少
指标间的相关程度: 相关大,n少
设计方法:
各组例数的分配: 均衡时,n少
I型错误和II型错误: 小,n大
考核某种药物/治疗方法的疗效
药物与疗法属处理因素; 影响疗效的一些非处理因素,如病人的性别、
年龄、病型、病程、病情、健康、营养状况、 医护人员的照护等等;
在病人分组试验中,各组病人除处理因素不同 之外,各组病人非处理因素应通过随机化尽量 加以控制,使之均衡一致。
对混杂因素的处理:
采用良好的设计:
研究的质量:
实例1
《剖腹产同时放置宫内节育器735例的初步观察》将施 行剖腹产手术1562例中的735例作为实验组,在剖腹产的同 时放置宫内节育器。比较两组被观察对象的术后出血、恶 露干净时间和术后副反应等情况。
规定实验组适应症为:破膜和总产程都不超过24小 时,无感染(无阳性体征,血常规正常)以及第一胎 产后本人同意放置宫内节育器者。
重复的作用 重复的次数
2.1 基本原则之一:对照(control)
均衡性
卫生统计学课件10调查研究设计(研)

2020/4/11
29
第三节 调查设计的基本内容和步骤
• 【例2-3】 安徽省疾病预防与控制中心、安徽医科大学卫 生管理学院,于2005年联合开展了安徽省农民心血管疾病 相关行为因素的调查研究。本研究采用5阶段随机抽样调 查,寻找出了安徽省农民心血管疾病的相关行为影响因素, 研究结果发表在《中国农村卫生事业管理》杂志2006年第 三期。
• 第二阶段 分别在各层各抽中学院采用单纯随机抽样共抽 取80个班(二级观察单位——小群);
• 第三阶段 分别在各层各抽中学院各抽中班采用系统抽样 共抽取2000名学生(三级观察单位),调查他们的月生 活消费。
2020/4/11
28
• 例题分析
– 例2-1项目中,首先在上海市区全部男同性恋活动 场所随机抽取10个场所;再在随机抽取的调查时间 里调查10个场所的全部对象。调查对象分布在场所 -时间两维空间里,属于从场所-时间两维空间里整 群随机抽样。(该项目于2007年每月随机抽取1周, 抽中周每日9点至次日3点进行调查)
– 四种抽样方法各有优缺点,在实际中常常是将 四种基本的常用抽样方法综合运用于多阶段抽 样中。
2020/4/11
27
多阶段抽样
– 在例2-2的项目中,采用分层三阶段随机抽样方法调查 学生的月生活消费,抽样步骤如下:
• 分层 将苏州大学新校区的全体学生划分为本科生、研究 生2层;
• 第一阶段 分别在本科生、研究生层内采用单纯随机抽样 各抽取4个学院(一级观察单位,或称大群)
• 具体操作如下:
– 分层 本科生与研究生两层 – 抽本科生 在15000名本科生中采用单纯随机抽样
抽取学生750人,具体操作同单纯随机抽样。 – 抽研究生 在5200名研究生中采用单纯随机抽样抽
卫生统计学 调查研究与调查设计

➢调查的应答率
➢比较不同来源的同类资料
➢进行抽样复查
• 非抽样误差的类型 ➢抽样框误差 ➢无回答误差 ➢计量误差 • 控制或消除非抽样误差的方法与措施
非抽样误差的控制是比较困难的,贯穿整 个调查研究过程。不仅需要调查前的周密 设计,还需要与调查有关的所有人员的共 同参与和努力。
• 非抽样误差的估计
对非抽样误差进行精确的估计,非常 复杂,非常困难。一般从以下几个方 面,对非抽样误差作粗略的评估:
三、调查研究的一般步骤
• 选题阶段 正确选择并论证调查研究的课题。 开展探索性研究(exploration study)
• 准备阶段 设计调查方案 组织调查研究队伍
• 调查阶段 调查获得研究所需要的第一手资料
• 研究/分析阶段
审查整理资料,进行统计分析,开展理 论研究。
• 总结阶段
撰写调查研究报告,总结调查研究工作, 评估调查研究成果。
一调查设计的一般内容说明调查研究的题目和调查研究该课题的目的解释涉及的概念确定调查机构和队伍二调查设计的一般原则经济性原则三调查设计的可行性研究方法样本设计一调查对象的确定调查对象亦称分析单位是指调查研究者迚行调查和抽样的基本单位
调查研究与调查设计
• 统计学 研究数据的收集、整理和分析的科 学。
• 收集数据的方法 实验研究 调查研究
n
1.96 2 0.10 2
0.5 0.5
384
经校正得到
384
nc
1
384 3000
340
即至少需要调查340家客户。
调查技术
• 问卷法 • 访谈法 • 电话调查 • 观察法 • 敏感性问题的调查技术
卫生统计学课件 第14章统计调查汇总

调查设计的基本内容
2、明确研究目的和意义 在掌握充分的背景材料的基础上,提出: 本课题的主要问题; 本课题的辅助问题。 一项研究的问题不宜涉及太多。 一般在前言的部分进行表述。
调查设计的基本内容
3、确定研究的主要指标 研究变量:定量、分类(等级)。 分析指标:均数、标准差、率、构成比、 比例比(OR、RR)等。 要求: 客观性强 灵敏度高 精确性好 定量指标,少用定性指标
要注意设计方法的技术路线图。
调查设计的基本内容
6、拟定调查项目和调查表 其是研究目的的具体体现 分析项目:要满足调查目的、 项目要精选(特异性高、针对性强) 项目的提法明确 具有可行性 备查项目:便于核查更正而设置
调查设计的基本内容
7、估计样本含量 确定样本估计的条件: ★显著性水平(α水平); ★把握度(1-β); ★其他条件:δ、率差、OR、RR。 估计方法: 经验法 查表法 公式计算法
减少抽样误差; 便于组织;节 便于 省经费;容易 控制调查质量。 对不同层采用 不同抽样方法 ;可对不同层 独立进行分析 。
缺点
例数较多时,编号麻 烦,实际工作中难以 办到; 当总体变异大时, 代表性用于总 体不太大的情形。
观察单位按顺 序有周期趋势 或单调递增(减) 时易产生偏差。
1 rh
调查表的考评
3.内部一致性信度 (internal consistent reliability) 是目前比较流行的信度评价方法,是分半信度的 推广。它无需将条目分为两个部分,而是以条目之 间的联系程度对信度作出估计。内部一致性信度主 要有Kuder-Richardson公式和克朗巴赫α系数 (Cronbach's alpha) 。前者是后者的特殊情况,仅 适用于两分类条目。这里仅介绍克朗巴赫α系数:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节 基本的概率抽样方法及其样本量估计
(五)整群抽样
第二节 基本的概率抽样方法及其样本量估计
(五)整群抽样
(1)按总体均数估计:
可见,欲调查平均血清硒含量,至少需调查12个乡镇。 (2)按总体率估计:
可见,欲调查大骨节病患病居民所占百分比,至少需调查8个乡镇。
同样,该调查的最小样本量应取12和8的最大值,即最少需调查12个乡镇。
(四)调查表
3. 调查表问题的设置
(1)避免不确切的表述 (2)避免判定性的问题 (4)避免难堪或禁忌的敏感问题 (5)避免笼统和抽象的问题 (6)避免多重问题
(3)避免引导性的问题
第一节 调查设计的基本内容
(五)组织计划和实施
1. 调查员的选择 2. 调查员的培训
(1)介绍本次调查的目的、计划、内容、方法等有关情况 (2)介绍调查的具体内容和任务 (3)调查问卷的培训 (4)模拟调查或访问 (5)建立监督、管理和相互联系的方法和规定 (6)预调查
第一节 调查设计的基本内容
第一节 调查设计的基本内容
(一)调查目的
1. 了解总体参数,说明总体特征
2. 研究事物之间的关联
第一节 调查设计的基本内容
(二)调查对象与观察单位
1. 确定调查总体,划清调查总体的同质范围 2. 明确调查的人群及调查的时间和地点 3. 不在总体范围内的个体不应作为观察单位
(2 )单独按照常用的基本抽样方法估算的样本量一般偏小,可以采用
设计效应进行调整。 (3)设计效应(design effect, Deff)首先是1965年L.Kish在他的代表作《抽
样调查》中提出的,Deff是复杂抽样设计与简单随机抽样设计估计量的
方差之比,用来反映复杂抽样设计的效率或相对精确程度。
55%。现在估计分层随机抽样所需样本量。
第二节 基本的概率抽样方法及其样本量估计
(四)分层随机抽样
(1)按总体均数估计:
若仍以 ε =0.02,置信水平为 1-α,则样本量为: 按比例分到2个地区: 可见,欲调查平均血清硒含量,两个地区分别至少需要调查103和89名居民。
第二节 基本的概率抽样方法及其样本量估计
卫生统计学
第十四章 调查研究设计
郝元涛 中山大学
马晓光
浙江大学
目录
01
02 03 04 第一节:调查设计的基本内容 第二节:基本的概率抽样方法及其样本量估计 第三节:非概率抽样方法 第四节:数据质量评价指标
重点难点
※ 调查研究设计的一般做法
※ 基本的抽样方法及其样本量估计
※ 信效度的概念及其评价指标
第二节 基本的概率抽样方法及其样本量估计
(五)整群抽样
第二节 基本的概率抽样方法及其样本量估计
(五)整群抽样
①对于总体均数估计: ②对于总体率估计: 当总体为无限总体时:
当总体为有限总体时:
(2)相对误差 ε :可根据研究问题的背景加以确定。 (3)置信水平 1-α:也可根据研究问题的背景加以确定。
第二节 基本的概率抽样方法及其样本量估计
(二)简单随机抽样
例2 在西藏某地区5400名居民中抽取270人作为样本测量血清硒含量,结果发现,
居民血清硒含量平均为26.80μg/L,标准差为3.49μg/L,患大骨节病的居民 123人。 为调查西藏该地区居民血清硒含量的平均水平及患大骨节病的比例,基于上述信 息,估计进行简单随机抽样所需样本量。
第一节 调查设计的基本内容
(三)调查方法与调查项目
1. 调查方法和调查项目
(1)根据调查目的、调查对象和具备的调查条件确定调查方法
(2)根据调查指标确定调查项目
2. 调查方式
(1)观察法
(2)问卷法
(3)访谈法
3. 调查表 4. 组织计划和实施
第一节 调查设计的基本内容
(四)调查表
1. 调查表的构成
(四)分层随机抽样
②估计的总体率p:可通过预调查,以各层的观察单位数占总观察单位数的比重作为权 数,粗略估计加权合计率。 ③相对误差ε:可根据研究问题的背景加以确定。
④置信水平1-α:也可根据研究问题的背景加以确定。
(2)样本量估计公式 ①估计总体均数时: ②估计总体率π时: 当初步估计π在0.2~0.8时:
在二级抽样单位中抽取三级抽样单位等,将整个抽样过程分成若干个阶段进行的抽
样方法。
2. 优缺点
(1)优点:便于组织调查,节约成本,容易控制调查质量。 (2)缺点:样本量一定时,抽样误差一般大于简单随机抽样。
第二节 基本的概率抽样方法及其样本量估计
(六)多阶段抽样
3. 样本量估计
( 1 )多阶段抽样设计一般较为复杂,得到精确的方差估计公式很困难, 尤其是多种抽样方法结合使用时。
2. 优缺点
(1)优点:①样本具有较好的代表性,抽样误差较小;②各层可根据调查对象的 特征,采取不同的抽样方法以及资料收集方式;③统计分析内容更丰富,可以对 不同层进行独立分析,还可以比较不同层间的差异。 (2)缺点:若分层变量选择不当,层内变异较大,层间变异较小,则分层抽样失 去意义。
第二节 基本的概率抽样方法及其样本量估计
0.2~0.8之间),同样,相对误差为ε =10%,置信水平为1-α =95%:
因此,欲调查患大骨节病的居民所占百分比,至少需要调查459名居民。
由于例2拟通过同一项调查达到2个目的,该调查的样本量应取163和459两个数的
最大值,即需调查459名居民。
第二节 基本的概率抽样方法及其样本量估计
(三)系统抽样
第二节 基本的概率抽样方法及其样本量估计
(六)多阶段抽样
1. 基本概念
(1)二阶段抽样(two-stage sampling):如果整群抽样中调查的不是抽中群内的所有
个体,而是在群内再进行抽样,调查其中的部分个体。 (2)多阶段抽样(multi-stage sampling):在初级抽样单位中抽取二级抽样单位,又
当初步估计π小于0.2或大于0.8时:
第二节 基本的概率抽样方法及其样本量估计
(四)分层随机抽样
例3 在例2的总体中,牧区有2900人,林区有2500人,如先将
总体分为牧区和林区两个层,预调查得到牧区、林区各层内居
民145和125人,平均血清硒含量分别为27.80μg/L、26.20μg/L, 标准差分别为 4.30μg/L、3.43μg/L,患大骨病的频率分别为30%,
第二节 基本的概率抽样方法及其样本量估计
(二)简单随机抽样
1. 基本概念
(1)简单随机抽样(simple random sampling):或称单纯随机抽样,保证总体中的每一个 个体都有同等的机会被抽出来作为样本的抽样方法。它是最基本的抽样方法,也是其他 抽样方法的基础。 (2)抽样框(sampling frame):将总体的全部观察单位编号,形成抽样框,在抽样框中随
(1)估计总体均数时:根据已知信息,血清硒含量均数26.80μg/L,标准差3.49μg/L。 若要求最大相对误差为ε =0.02,置信水平为1-α =95%:
因此,欲调查血清硒含量的平均水平,至少需要调查163名居民。
第二节 基本的概率抽样方法及其样本量估计
(二)简单随机抽样
(2)估计总体率时:根据以上预调查数据,p = 123/270 = 0.456(推测π 介于
置信水平也可由研究者根据研究问题的背景加以确定,通常取90%、95%或99%。
z / 2 C V n
2
第二节 基本的概率抽样方法及其样本量估计
(二)简单随机抽样
(2)样本量估计公式 ①估计总体均数时: ②估计总体率π 时:
当初步估计π 在0.2~0.8时:
当初步估计π 小于0.2或大于0.8时:
3. 样本量估计
由于系统抽样无专用的标准误计算公式,往往按简单随机抽样的方法来估计样本量。
第二节 基本的概率抽样方法及其样本量估计
(四)分层随机抽样
1. 基本概念
分 层 抽 样 (stratified sampling) : 将 总 体 中 全 部 个 体 按 某 种 特 征 分 成 若 干
“层”(stratum),再从每一层内随机抽取一定数量的个体组成样本。
(四)分层随机抽样3. 样本Βιβλιοθήκη 估计(1)样本量估计的依据
①总体变异程度CV的估计:(以预调查数据对总体CV做初略估计)
上式中,样本均数: 样本方差: 式中wh= Nh/N 为总体中各层的观察单位数占总观察单位数的比例,L为“层” 数, 为各层的均数, 为各层的方差。
第二节 基本的概率抽样方法及其样本量估计
(1)标题 (2)说明 (3)被访者基本情况 (4)主要内容 (5)编码
(6)作业证明的记载
第一节 调查设计的基本内容
(四)调查表
2. 调查表制定的一般步骤
(1)明确调查目的 (5)确定项目的回答选项 (6)预调查及评价
(2)提出调查项目
(3)项目筛选 (4)确定项目的提问形式
(7)修改完善
第一节 调查设计的基本内容
机抽取部分观察单位组成样本。
2. 优缺点
(1)优点:简单直观、均数(或率)及其标准误的计算简便。 (2)缺点:是总体较大时,难以对总体中的个体一一进行编号,且抽到的样本分散,不 易组织调查。
第二节 基本的概率抽样方法及其样本量估计
(二)简单随机抽样
3. 样本量估计
(1)样本量估计的依据
①总体中个体的变异程度:如果个体间变异程度小,则所需样本量也较少;反之,如 果变异程度大,则需较大的样本量。通常用变异系数CV 来反映个体间变异。 ②调查的精度:用最大相对误差ε 反映精度的要求,即测定值与真实值之差与真实值的 比值。精度要求越高,所需样本量就越大。可由研究者根据研究问题的背景加以确定。 ③置信程度:通常用置信水平1-α 反映置信程度。置信程度要求越高,所需样本量越大。