第三章抽样与抽样分布(第二部分)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
先从数字1到k之间随机抽取一个数字r作为初始 单位,以后依次取r+k,r+2k…等单位
2. 优点:操作简便,可提高估计的精度
四、整群抽样
(cluster sampling)
1. 先将总体划分为若干个群,然后再以群作为 调查单位从中抽取部分群,然后对中选群中 的所有单位全部实施调查。
2. 特点
抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用,方便调
3.3 常用的抽样方法
一、简单随机抽样 二、分层抽样 三、系统抽样 四、整群抽样
抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样 多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
一、简单随机抽样
(simple random sampling)
1. 从总体N个单位中随机地抽取n个单位作为样本,使得 总体中每一个元素都有相同的机会 (概率)被抽中
第三章(第二部分) 抽样与抽样分布
3.3 常用的抽样方法 3.4 抽样分布(一)
(一个总体参数推断时样本统计量的抽样分布)
3.5 抽样分布(二)
(两个总体参数推断时样本统计量的抽样分布)
3.6 大数定理和中心极限定理
学习目标
1. 了解抽样的概率抽样方法 2. 理解抽样分布的意义 3. 了解抽样分布的形成过程 4. 理解中心极限定理 5. 理解抽样分布的性质
总体分布
.3
百度文库.2
.1 0
1
234
均值和方差
N
xi
i1 2.5
N
N
(xi )2
2 i1
1.25
N
样本均值的抽样分布
(例题分析)
现从总体中抽取n=2的简单随机样本,在重复抽 样条件下,共有42=16个样本。所有样本的结果为
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
1. 将总体单位按某种特征或某种规则划分为不 同的层,然后从不同的层中独立、随机地抽 取样本
2. 优点
保证样本的结构与总体的结构比较相近,从而 提高估计的精度
组织实施调查方便 既可以对总体参数进行估计,也可以对各层的
目标量进行估计
三、系统抽样
(systematic sampling)
1. 将总体中的各单位按一定顺序排列,在规定 的范围内随机地抽取一个单位作为初始单位, 然后按事先规定好的规则确定其他样本单位
的总体,参加者从一地到另一地,一些人离去又有 一些人进来,但这些事件是在一定范围内进行的。 对这样的总体在同一时间内抽样十分
重要,以便样本组成不会经历时间上的太大变化。
6.滚雪球抽样:以若干个具有所需特征的人为最初的 调查对象,然后依靠他们提供认识的合格的调查对 象,再由这些人提供第三批调查对象,……依次类 推,样本如同滚雪球般由小变大。滚雪球抽样多用 于总体单位的信息不足或观察性研究的情况。
查的实施 当群为总体的一个缩影时,抽样估计误差小,
否则误差较大。
其它抽样方法介绍
1. 多阶段抽样(Multistage sampling):是指 将抽样过程分阶段进行,每个阶段使用的抽样 方法往往不同,即将各种抽样方法结合使用, 其在大型流行病学调查中常用。其实施过程为, 先从总体中抽取范围较大的单元,称为一级抽 样单元,再从每个抽得的一级单元中抽取范围 更小的二级单元,依此类推,最后抽取其中范 围更小的单元作为调查单位。
一、抽样分布的概念
(sampling distribution)
1. 样本统计量的概率分布,是一种理论分 布
在重复选取容量为n的样本时,由该统计 量的所有可能取值形成的相对频数分布。
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4.
抽样分布的形成过程
(sampling distribution)
总体
计算样本统计
样
量
本
如:样本均值
、比例、方差
二、样本均值的抽样分布
1. 在重复选取容量为n的样本时,由样本均值 的所有可能取值形成的相对频数分布
2. 一种理论概率分布
3. 推断总体均值的理论基础
1、样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 体的均值、方差及分布如下
2.非概率抽样:又称为不等概率抽样或非随机抽 样,就是调查者根据自己的方便或主观判断抽 取样本的方法。它不是严格按随机抽样原则来 抽取样本,所以失去了大数定律的存在基础, 也就无法确定抽样误差,无法正确地说明样本 的统计值在多大程度上适合于总体。虽然根据
样本调查的结果也可在一定程度上说明总体的 性质、特征,但不能从数量上推断总体.非概率 抽样按抽样特点可分为:方便抽样、判断抽样、 空间抽样、滚雪球抽样、配额抽样等类型。 3.方便抽样:样本限于总体中易于抽到的一部分。 最常见的方便抽样是偶遇抽样,即研究者将在 某一时间和环境中所遇到的每一总体单位均作 为样本成员。“街头拦人法”就是一种偶遇抽 样。 4. 判断抽样又称立意抽样,研究人员从总体中选 择那些被判断为最能代表总体的单位作样本的 抽样方法。当研究者对自己的研究领域十分熟 悉,对研究总体比较了解时采用这种抽样方法, 可获代表性较高的样本。 5.空间抽样:对非静止的、暂时性的空间相邻的 群体的抽样方法。例如,游行与集会没有确定
7.配额抽样也称定额抽样,是将总体依某种标准分层 (群);然后按照各层样本数与该层总体数成比例 的原则主观抽取样本。定额抽样与分层概率抽样很 接近,最大的不同是分层概率抽样的各层样本是随 机抽取的,而定额抽样的各层样本是非随机的。
3.4 抽样分布(一)
(一个总体参数推断时样本统计量的抽样分布)
一、抽样分布的概念 二、样本均值的抽样分布 三、样本比率的抽样分布 四、样本方差的抽样分布
2. 抽取元素的具体方法有重复抽样和不重复抽样 3. 特点
简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计比较方便 4. 局限性 当N很大时,不易构造抽样框 抽出的单位很分散,给实施调查增加了困难 没有利用其他辅助信息以提高估计的效率
二、分层抽样
(stratified sampling)
2. 优点:操作简便,可提高估计的精度
四、整群抽样
(cluster sampling)
1. 先将总体划分为若干个群,然后再以群作为 调查单位从中抽取部分群,然后对中选群中 的所有单位全部实施调查。
2. 特点
抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用,方便调
3.3 常用的抽样方法
一、简单随机抽样 二、分层抽样 三、系统抽样 四、整群抽样
抽样方法
抽样方式
概率抽样
非概率抽样
简单随机抽样 整群抽样 多阶段抽样
分层抽样 系统抽样
方便抽样 自愿样本 配额抽样
判断抽样 滚雪球抽样
一、简单随机抽样
(simple random sampling)
1. 从总体N个单位中随机地抽取n个单位作为样本,使得 总体中每一个元素都有相同的机会 (概率)被抽中
第三章(第二部分) 抽样与抽样分布
3.3 常用的抽样方法 3.4 抽样分布(一)
(一个总体参数推断时样本统计量的抽样分布)
3.5 抽样分布(二)
(两个总体参数推断时样本统计量的抽样分布)
3.6 大数定理和中心极限定理
学习目标
1. 了解抽样的概率抽样方法 2. 理解抽样分布的意义 3. 了解抽样分布的形成过程 4. 理解中心极限定理 5. 理解抽样分布的性质
总体分布
.3
百度文库.2
.1 0
1
234
均值和方差
N
xi
i1 2.5
N
N
(xi )2
2 i1
1.25
N
样本均值的抽样分布
(例题分析)
现从总体中抽取n=2的简单随机样本,在重复抽 样条件下,共有42=16个样本。所有样本的结果为
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
1. 将总体单位按某种特征或某种规则划分为不 同的层,然后从不同的层中独立、随机地抽 取样本
2. 优点
保证样本的结构与总体的结构比较相近,从而 提高估计的精度
组织实施调查方便 既可以对总体参数进行估计,也可以对各层的
目标量进行估计
三、系统抽样
(systematic sampling)
1. 将总体中的各单位按一定顺序排列,在规定 的范围内随机地抽取一个单位作为初始单位, 然后按事先规定好的规则确定其他样本单位
的总体,参加者从一地到另一地,一些人离去又有 一些人进来,但这些事件是在一定范围内进行的。 对这样的总体在同一时间内抽样十分
重要,以便样本组成不会经历时间上的太大变化。
6.滚雪球抽样:以若干个具有所需特征的人为最初的 调查对象,然后依靠他们提供认识的合格的调查对 象,再由这些人提供第三批调查对象,……依次类 推,样本如同滚雪球般由小变大。滚雪球抽样多用 于总体单位的信息不足或观察性研究的情况。
查的实施 当群为总体的一个缩影时,抽样估计误差小,
否则误差较大。
其它抽样方法介绍
1. 多阶段抽样(Multistage sampling):是指 将抽样过程分阶段进行,每个阶段使用的抽样 方法往往不同,即将各种抽样方法结合使用, 其在大型流行病学调查中常用。其实施过程为, 先从总体中抽取范围较大的单元,称为一级抽 样单元,再从每个抽得的一级单元中抽取范围 更小的二级单元,依此类推,最后抽取其中范 围更小的单元作为调查单位。
一、抽样分布的概念
(sampling distribution)
1. 样本统计量的概率分布,是一种理论分 布
在重复选取容量为n的样本时,由该统计 量的所有可能取值形成的相对频数分布。
2. 随机变量是 样本统计量
样本均值, 样本比例,样本方差等
3. 结果来自容量相同的所有可能样本
4.
抽样分布的形成过程
(sampling distribution)
总体
计算样本统计
样
量
本
如:样本均值
、比例、方差
二、样本均值的抽样分布
1. 在重复选取容量为n的样本时,由样本均值 的所有可能取值形成的相对频数分布
2. 一种理论概率分布
3. 推断总体均值的理论基础
1、样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 体的均值、方差及分布如下
2.非概率抽样:又称为不等概率抽样或非随机抽 样,就是调查者根据自己的方便或主观判断抽 取样本的方法。它不是严格按随机抽样原则来 抽取样本,所以失去了大数定律的存在基础, 也就无法确定抽样误差,无法正确地说明样本 的统计值在多大程度上适合于总体。虽然根据
样本调查的结果也可在一定程度上说明总体的 性质、特征,但不能从数量上推断总体.非概率 抽样按抽样特点可分为:方便抽样、判断抽样、 空间抽样、滚雪球抽样、配额抽样等类型。 3.方便抽样:样本限于总体中易于抽到的一部分。 最常见的方便抽样是偶遇抽样,即研究者将在 某一时间和环境中所遇到的每一总体单位均作 为样本成员。“街头拦人法”就是一种偶遇抽 样。 4. 判断抽样又称立意抽样,研究人员从总体中选 择那些被判断为最能代表总体的单位作样本的 抽样方法。当研究者对自己的研究领域十分熟 悉,对研究总体比较了解时采用这种抽样方法, 可获代表性较高的样本。 5.空间抽样:对非静止的、暂时性的空间相邻的 群体的抽样方法。例如,游行与集会没有确定
7.配额抽样也称定额抽样,是将总体依某种标准分层 (群);然后按照各层样本数与该层总体数成比例 的原则主观抽取样本。定额抽样与分层概率抽样很 接近,最大的不同是分层概率抽样的各层样本是随 机抽取的,而定额抽样的各层样本是非随机的。
3.4 抽样分布(一)
(一个总体参数推断时样本统计量的抽样分布)
一、抽样分布的概念 二、样本均值的抽样分布 三、样本比率的抽样分布 四、样本方差的抽样分布
2. 抽取元素的具体方法有重复抽样和不重复抽样 3. 特点
简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计比较方便 4. 局限性 当N很大时,不易构造抽样框 抽出的单位很分散,给实施调查增加了困难 没有利用其他辅助信息以提高估计的效率
二、分层抽样
(stratified sampling)