随机抽样及随机分组
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简单随机抽样亦称单纯随机抽样要求每个观察对 象有同等概率被选入样本。
从有N个观察单位中抽取m个观察单位方法: 先将N个观察单位编号,并且每个赋一个随机数。
再将N个随机数排序,前m个随机数对应的观察 单位编号即为所抽取。 优缺点 简单随机抽样是最基本的抽样方法,优 点是均数(或率)及其标准误的计算简便,缺点是 当总体例数较多时,实施抽样比较困难。适用于 小型调查。
省大量时间大量的人力,物力和成本。
优缺点
优点:①费用较少,速度较快,覆盖面较大, 正确性较高;②许多医学问题只能作抽样调查, 如药物疗效观察等。
缺点:调查设计、实施及资料分析复杂,若样本 达到总体75%时则直接采用普查。
例如,在美国大选中,对1000名至3000名选民 进行调查,来预测近1亿选民的投票情况,抽样 误差不超过3%。
研究肥胖对冠心病的影响情况; 研究当今中国儿童生长发育情况; 研究分析经济危机形成的原因; 。。。。等。
调查研究资料的特点
无法随机化分组 组间不均衡 存在混杂因素
例如, 肥胖对冠心病的影响研究中,研究者不可 能象药物研究那样, 随机地安排一部份人去肥 胖,安排另一部人不肥胖。两组人群中存在着很 多因素不均衡的因素混杂, 从而需要特殊的统 计学设计和分析。
调查方法
根据调查的范围和调查对象的选择方式可分 为:
普查
抽样调查
普查(overall survey)
亦称全面调查(complete survey),将组 成总体的所有观察单位全部加以调查
普查一般都是用于了解总体某一特定“时点” 的情况,如年中人口数、时点患病率等。
如我国人口普查等。
优点: ①理论上只有普查才能取得总体参数,因为
抽样研究的两个重要问题
抽样的样本大小 怎样抽样
随机抽样方法
简单随机抽样(simple random sampling) 系统抽样(systematic sampling) 分层抽样(stratified sampling) 整群抽样(cluster sampling)
㈠简单随机抽样 P10
平均数为0,标准差为1 3 排序 按随机数从小到大排序,前50名即为所
求 数据→行编辑→数据排序 选变量:RND正态 →数据
练习题
现在某班有20个同学,要从中随机抽取5名参 加比赛,如何平公的进行抽取?
㈡系统抽样
系统抽样又称等距抽样或机械抽样。方法是按照一 定顺序,机械地每隔若干个观察单位抽取一个观察单 位组成样本。
库中,建立数据库.
2 产生随机数 点击
设计→实验设计→随机化方法→分层抽样 选择分层变量:班级
每个班人数都赋值为3 →数据 查看抽样结果: 1标记为被抽取对象
练习题
现某年级2个班,1班6名同学,2班9名同学, 现要从1班随机抽取2名同?
各种抽样方法抽样误差的关系
优缺点 ①抽样误差比较小;②先要将总体分层, 层内个体差异越小越好,层间个体差异越大越好, 便于对不同的层采用不同的抽样方法。
CHISS的实现
例如,某校有3个不同专业的研究班,每班10个同学, 现要从每班各随机抽取3名同学参加比赛,如何抽取?
CHISS实现步骤: 1 编号建数据库 将30学生的学号及班级录入数据
例如:上述例子中我们抽取的住户均为单号, 其住房可能都是一个朝向,若作采光等卫生学 调查,将产生明显的偏性。
典型案例:央视收视率调查
㈢整群抽样
先将总体划分为K个群,每个群包括若干 个观察单位,再随机抽取t个“群” (kt),并将被抽取t个群的全部观察单 位组成样本。
例如:要检查某学校学习情况时,随机抽取 几个班,对几个班的全部同学进行考查。
优缺点 优点是在大规模调查中,整群抽样易 于组织,可节省人力物力,容易控制调查质 量;缺点是一般来说各群间差异较大,所以 抽样误差较大。
㈣分层抽样
先按影响观察值变异较大的某种特征,将总体分为 若干层(strata),再从每层内随机抽取一定数量的 观察单位组成样本(样本含量为n)又称分类抽样。
随机抽样及随机分组
童新元 中国人民解放军总医院
设计类型
干预试验 (动物实验,临床试验) 观察研究
调查研究设计
研究者无须或无法施加干预措施,而是对现 场发生的实际情况进行观察,称为调查研究 (Investigation Study), 亦 称 观 察 研 究 (observation study)。例如:
普查没有抽样误差; ②普查能全面地了解总体的分布特征。 缺点: ①普查工作量大,较费时费力; ②调查质量难以保证,系统误差大。
抽样调查(sampling survey)
抽样调查是从总体中随机抽取一定数量的 观察对象组成样本,用样本信息推断总体 特征。
抽样调查是统计学上第一次技术革命. 抽样调查技术通过部分认识整体,同时,节
各种抽样方法的存在抽样误差,一般是:
整群抽样单纯随机抽样系统抽样分层 抽样。
随机化分组
随机化分组是试验设计的重要内容,常 用的方法有三种:
掷硬币、抽签、骰子; 用查随机数字表; 用计算机随机化程序。
随机化分组方案
随机化分组是首先将受试对象按某一特征编 号,在每个编号下用随机化工具产生相应的 随机数字,然后,再按照事先规定的分组原 则进行合理的分组。
例如:要从1000户中抽取100户作样本,可先在门牌 号1~ 10号之间随机抽取一户(假定为第5号住户),其 后每间隔10号抽取一户,即抽取5、15、25、35、…、 995,共100户组成样本。
抽样间隔=总数/样本含量
3.优缺点 优点是易于理解,简便易行,容易得 到一个按比例分配的样本;缺点是一般情况 下,虽然系统抽样的抽样误差小于简单随机抽 样,但是在某些特殊情况下可能有偏性。
CHISS的实现
例如,现在某校有500名研究生,要随机抽 取10%,即50同学参加比赛,问:该如何抽取?
CHISS实现
1 编号建数据库 将500学生的学号录入数据库 中,建立数据库,并每人给一个编号从1,2,…500 .
2 产生随机数 点击
设计→实验设计→随机化方法→产生随机数 选择条件:正态分布,数据行数为500,正态分布
从有N个观察单位中抽取m个观察单位方法: 先将N个观察单位编号,并且每个赋一个随机数。
再将N个随机数排序,前m个随机数对应的观察 单位编号即为所抽取。 优缺点 简单随机抽样是最基本的抽样方法,优 点是均数(或率)及其标准误的计算简便,缺点是 当总体例数较多时,实施抽样比较困难。适用于 小型调查。
省大量时间大量的人力,物力和成本。
优缺点
优点:①费用较少,速度较快,覆盖面较大, 正确性较高;②许多医学问题只能作抽样调查, 如药物疗效观察等。
缺点:调查设计、实施及资料分析复杂,若样本 达到总体75%时则直接采用普查。
例如,在美国大选中,对1000名至3000名选民 进行调查,来预测近1亿选民的投票情况,抽样 误差不超过3%。
研究肥胖对冠心病的影响情况; 研究当今中国儿童生长发育情况; 研究分析经济危机形成的原因; 。。。。等。
调查研究资料的特点
无法随机化分组 组间不均衡 存在混杂因素
例如, 肥胖对冠心病的影响研究中,研究者不可 能象药物研究那样, 随机地安排一部份人去肥 胖,安排另一部人不肥胖。两组人群中存在着很 多因素不均衡的因素混杂, 从而需要特殊的统 计学设计和分析。
调查方法
根据调查的范围和调查对象的选择方式可分 为:
普查
抽样调查
普查(overall survey)
亦称全面调查(complete survey),将组 成总体的所有观察单位全部加以调查
普查一般都是用于了解总体某一特定“时点” 的情况,如年中人口数、时点患病率等。
如我国人口普查等。
优点: ①理论上只有普查才能取得总体参数,因为
抽样研究的两个重要问题
抽样的样本大小 怎样抽样
随机抽样方法
简单随机抽样(simple random sampling) 系统抽样(systematic sampling) 分层抽样(stratified sampling) 整群抽样(cluster sampling)
㈠简单随机抽样 P10
平均数为0,标准差为1 3 排序 按随机数从小到大排序,前50名即为所
求 数据→行编辑→数据排序 选变量:RND正态 →数据
练习题
现在某班有20个同学,要从中随机抽取5名参 加比赛,如何平公的进行抽取?
㈡系统抽样
系统抽样又称等距抽样或机械抽样。方法是按照一 定顺序,机械地每隔若干个观察单位抽取一个观察单 位组成样本。
库中,建立数据库.
2 产生随机数 点击
设计→实验设计→随机化方法→分层抽样 选择分层变量:班级
每个班人数都赋值为3 →数据 查看抽样结果: 1标记为被抽取对象
练习题
现某年级2个班,1班6名同学,2班9名同学, 现要从1班随机抽取2名同?
各种抽样方法抽样误差的关系
优缺点 ①抽样误差比较小;②先要将总体分层, 层内个体差异越小越好,层间个体差异越大越好, 便于对不同的层采用不同的抽样方法。
CHISS的实现
例如,某校有3个不同专业的研究班,每班10个同学, 现要从每班各随机抽取3名同学参加比赛,如何抽取?
CHISS实现步骤: 1 编号建数据库 将30学生的学号及班级录入数据
例如:上述例子中我们抽取的住户均为单号, 其住房可能都是一个朝向,若作采光等卫生学 调查,将产生明显的偏性。
典型案例:央视收视率调查
㈢整群抽样
先将总体划分为K个群,每个群包括若干 个观察单位,再随机抽取t个“群” (kt),并将被抽取t个群的全部观察单 位组成样本。
例如:要检查某学校学习情况时,随机抽取 几个班,对几个班的全部同学进行考查。
优缺点 优点是在大规模调查中,整群抽样易 于组织,可节省人力物力,容易控制调查质 量;缺点是一般来说各群间差异较大,所以 抽样误差较大。
㈣分层抽样
先按影响观察值变异较大的某种特征,将总体分为 若干层(strata),再从每层内随机抽取一定数量的 观察单位组成样本(样本含量为n)又称分类抽样。
随机抽样及随机分组
童新元 中国人民解放军总医院
设计类型
干预试验 (动物实验,临床试验) 观察研究
调查研究设计
研究者无须或无法施加干预措施,而是对现 场发生的实际情况进行观察,称为调查研究 (Investigation Study), 亦 称 观 察 研 究 (observation study)。例如:
普查没有抽样误差; ②普查能全面地了解总体的分布特征。 缺点: ①普查工作量大,较费时费力; ②调查质量难以保证,系统误差大。
抽样调查(sampling survey)
抽样调查是从总体中随机抽取一定数量的 观察对象组成样本,用样本信息推断总体 特征。
抽样调查是统计学上第一次技术革命. 抽样调查技术通过部分认识整体,同时,节
各种抽样方法的存在抽样误差,一般是:
整群抽样单纯随机抽样系统抽样分层 抽样。
随机化分组
随机化分组是试验设计的重要内容,常 用的方法有三种:
掷硬币、抽签、骰子; 用查随机数字表; 用计算机随机化程序。
随机化分组方案
随机化分组是首先将受试对象按某一特征编 号,在每个编号下用随机化工具产生相应的 随机数字,然后,再按照事先规定的分组原 则进行合理的分组。
例如:要从1000户中抽取100户作样本,可先在门牌 号1~ 10号之间随机抽取一户(假定为第5号住户),其 后每间隔10号抽取一户,即抽取5、15、25、35、…、 995,共100户组成样本。
抽样间隔=总数/样本含量
3.优缺点 优点是易于理解,简便易行,容易得 到一个按比例分配的样本;缺点是一般情况 下,虽然系统抽样的抽样误差小于简单随机抽 样,但是在某些特殊情况下可能有偏性。
CHISS的实现
例如,现在某校有500名研究生,要随机抽 取10%,即50同学参加比赛,问:该如何抽取?
CHISS实现
1 编号建数据库 将500学生的学号录入数据库 中,建立数据库,并每人给一个编号从1,2,…500 .
2 产生随机数 点击
设计→实验设计→随机化方法→产生随机数 选择条件:正态分布,数据行数为500,正态分布