《抽样的基本步骤与方法》
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非随机抽样(非概率抽样 non probability sample)
所有的样本单位所出现的机会是不确定的。 不能计算每个样本单位所出现的概率,因为选择样本的
方法是非随机的。
概率抽样
按照随机/概率规律的原则, 从总体中抽取样本
随机化原则基础上
增大样本量 改变抽样的组织形式
提高抽样估计的准确性
误差
抽样误差:
用样本估计总体而产生的误差;抽样误差越小,估计的 精度越高;一般用估计量的方差表示;可以计算并加以 控制。
非抽样误差:
在抽样调查中由于人为的差错所造成的误差。
二、两种基本的抽样形式
随机抽样(概率抽样 probability samples)
等概率抽样—所有的样本单位所出现的机会是相同的。 不等概率抽样—可以计算每个样本单位所出现的概率。
总体太大,实际上无法实行普查
个别对象难以接触
误差
实验是破坏性的
科学地抽样--样本具有代表性,抽样误差
非抽样误差
--可控制抽样误差
(可控制)
抽样调查与普查比较表
预算经费 时间要求 总体大小 抽样误差可能造成的损失 非抽样误差可能造成的损失 测量(实验)的性质 是否需要特别注意各个案例
四、抽样的基本方法
1、随机抽样 1)简单随机抽样(完全概率抽样) 2)系统抽样(等距抽样/机械抽样) 3)分层抽样(类型抽样) 4)整群抽样 5)多级抽样(多阶段抽样)
3、非随机抽样 1)便利抽样 2)判断抽样 3)配额抽样 4)滚雪球抽样
简单随机抽样与非常简单随机抽样
简单随机抽样定义:
从含有N个抽样单元的总体中,一次抽取 n个
抽样
专科生
样本n=1000 n1=300
本科生 n2=500
研究生 n3=200
样本1000人
分层抽样模拟
分层抽样的优点
子总体内的抽样单元之间差异比较小,子样本具有较好 的均匀性,可能得到较高精度的估计量 有效消除特殊个体的影响 可对各层的特性加以比较 实施管理方便
整群抽样
先把总体划分成R个群,然后以群为初级抽样 单元,从中随机地抽取r个群,对抽中的群内的所 有单元都进行调查。
明确调查目的 定义总体、抽样单元 确定主要目标量的精度 确定、购置抽样框
选择抽样方案 确定样本量
制定实施细节和步骤
理论、技术 经验、工程
抽样方案设计的内容
1. 明确调查目的,确定所要估计的目标参数; 2. 明确研究总体以及抽样单元; 3. 对主要目标量的精度提出要求; 4. 选择抽样方案的类型; 5. 考虑费用,实施能力,计算样本量; 6. 制定调查实施的具体办法和步骤。
缺点: • 对所有单元编号,十分复杂,有时不可行 • 所抽取的单元可能十分分散,实施困难 • 没有利用有关总体的一些已知信息,可能不是最有效 的
分层抽样
分层原则:层内差异小,层间差异大
总体 N=10000
本科生 50%
专科生 30%
研究生 20%
分层
专科生 n1=3000
本科生 n2=5000
研究生 n3=2000
单元,共有
C
n N
种不同的结果,每种结果被抽
到的概率都是1/
C
n N
。
无放回的抽样,不独立。从总体中逐个无放
回地抽取个体,每次抽取到尚未在样本中的任何
一个个体的概率都相等,直到抽足n个为止。
当n/N非常小时,有放回和无放回抽样几乎没有差别
非常简单随机抽样定义: 总体中所有个体被抽种的机会相同,并且n个
第 三 章
市 第三节 抽样设计和方法
场 调 查 策 划 技 巧
本章内容
抽样设计的基本概念 两种抽样的基本形式 抽样的主要步骤 抽样的基本方法 样本量的确定
抽样调查与普查
抽样调查就是从总体中抽取能代表总体的一部分/样本, 然后根据样本中所包含的信息对总体的状况进行估计和推算。
样本
个体是相互独立被抽取得。 有放回的抽样,独立从总体中抽取一个个体,
记录,放回总体,抽取第二个个体,记录,放回总 体,以此类推,直到抽足n个为止。
简单随机抽样的实施方法
1. 抽签法 2. 随机数字表(随机乱码表) 3. 随机正态数字表
简单随机抽样的优缺点
优点: • 是最基本的抽样方法 • 最符合随机原则 • 抽样误差容易计算 • 复杂抽样设计的基础 • 衡量其它抽样方法的标准
确性要求不严格的调查有相当大的吸引力。 2、一般来讲,非随机抽样实施起来要比随机抽样用的时
间少。 3、如果合理地运用非随机抽样,它能产生极具代表性的
合理的抽样结果。 非随机抽样的局限性 1、不能估计出抽样误差。 2、调查人员无法知道抽样中的单位所具有代表性程度; 3Байду номын сангаас抽样结果不能推及总体。
三、抽样的基本步骤
随机抽样和非随机抽样的优点及局限性
随机抽样的优点 1、调查的结果可以用来推断总体。 2、调查人员可以获得被抽取的不同年龄、不同层
次的人们的信息。 3、能够估算抽样误差。 随机抽样的局限性 1、在大多数情况下,随机抽样所需的费用要比非
随机抽样高。 2、随机抽样比非随机抽样需要更多的时间策划和
实施。
非随机抽样的优点 1、费用比随机抽样低,非随机抽样的这一特点对那些精
比较适用于所给条件的调查方式
抽样调查
普查
低
高
短
长
大
小
小
大
大
小
毁灭性的
非毁灭性的
是
否
一、抽样设计的几个基本概念
总体 样本与样本单位 抽样误差和非抽样误差 抽样单元和抽样框
抽样
总体
统计过程
总体
抽 样
统计
样本
推断
计算
描
统计量
述
统计量
推断过程
总体参数估计 样本统计量 (X)
总体 样本
为了便利地实现随机抽样,常常把总体划分为有限个互 不重叠的部分,每一部分叫做一个抽样单元。
统计量
样本均值X 样本比例 P 样本方差 S2 样本相关 r
抽样 推断
统计方法 误差
总体
特征(参数)
平均值μ 比例π 方差σ2 相关ρ
抽样调查与普查的比较
抽样调查特点:
普查特点:
抽样调查花费较少 迅速地获取信息
--争取时效是非常重要的
总体较小 总体差异(方差)较大 抽样误差较大
中国
抽样单元
一级抽样单元:省 二级抽样单元:区 三级抽样单元:街道 三级抽样单元:居委会 四级抽样单元:家庭户 五级抽样单元:被访者
北京 朝阳区 官庄街道 广院居委会 17楼2门101室 男主人
抽样框
抽样框是包含全部抽样单元的资料。
1. 一般说来,普查可以提供抽样框资料 2. 表现形式名单、地图、统计年鉴等 3. 很多时候,很难获得完整的抽样框资料
所有的样本单位所出现的机会是不确定的。 不能计算每个样本单位所出现的概率,因为选择样本的
方法是非随机的。
概率抽样
按照随机/概率规律的原则, 从总体中抽取样本
随机化原则基础上
增大样本量 改变抽样的组织形式
提高抽样估计的准确性
误差
抽样误差:
用样本估计总体而产生的误差;抽样误差越小,估计的 精度越高;一般用估计量的方差表示;可以计算并加以 控制。
非抽样误差:
在抽样调查中由于人为的差错所造成的误差。
二、两种基本的抽样形式
随机抽样(概率抽样 probability samples)
等概率抽样—所有的样本单位所出现的机会是相同的。 不等概率抽样—可以计算每个样本单位所出现的概率。
总体太大,实际上无法实行普查
个别对象难以接触
误差
实验是破坏性的
科学地抽样--样本具有代表性,抽样误差
非抽样误差
--可控制抽样误差
(可控制)
抽样调查与普查比较表
预算经费 时间要求 总体大小 抽样误差可能造成的损失 非抽样误差可能造成的损失 测量(实验)的性质 是否需要特别注意各个案例
四、抽样的基本方法
1、随机抽样 1)简单随机抽样(完全概率抽样) 2)系统抽样(等距抽样/机械抽样) 3)分层抽样(类型抽样) 4)整群抽样 5)多级抽样(多阶段抽样)
3、非随机抽样 1)便利抽样 2)判断抽样 3)配额抽样 4)滚雪球抽样
简单随机抽样与非常简单随机抽样
简单随机抽样定义:
从含有N个抽样单元的总体中,一次抽取 n个
抽样
专科生
样本n=1000 n1=300
本科生 n2=500
研究生 n3=200
样本1000人
分层抽样模拟
分层抽样的优点
子总体内的抽样单元之间差异比较小,子样本具有较好 的均匀性,可能得到较高精度的估计量 有效消除特殊个体的影响 可对各层的特性加以比较 实施管理方便
整群抽样
先把总体划分成R个群,然后以群为初级抽样 单元,从中随机地抽取r个群,对抽中的群内的所 有单元都进行调查。
明确调查目的 定义总体、抽样单元 确定主要目标量的精度 确定、购置抽样框
选择抽样方案 确定样本量
制定实施细节和步骤
理论、技术 经验、工程
抽样方案设计的内容
1. 明确调查目的,确定所要估计的目标参数; 2. 明确研究总体以及抽样单元; 3. 对主要目标量的精度提出要求; 4. 选择抽样方案的类型; 5. 考虑费用,实施能力,计算样本量; 6. 制定调查实施的具体办法和步骤。
缺点: • 对所有单元编号,十分复杂,有时不可行 • 所抽取的单元可能十分分散,实施困难 • 没有利用有关总体的一些已知信息,可能不是最有效 的
分层抽样
分层原则:层内差异小,层间差异大
总体 N=10000
本科生 50%
专科生 30%
研究生 20%
分层
专科生 n1=3000
本科生 n2=5000
研究生 n3=2000
单元,共有
C
n N
种不同的结果,每种结果被抽
到的概率都是1/
C
n N
。
无放回的抽样,不独立。从总体中逐个无放
回地抽取个体,每次抽取到尚未在样本中的任何
一个个体的概率都相等,直到抽足n个为止。
当n/N非常小时,有放回和无放回抽样几乎没有差别
非常简单随机抽样定义: 总体中所有个体被抽种的机会相同,并且n个
第 三 章
市 第三节 抽样设计和方法
场 调 查 策 划 技 巧
本章内容
抽样设计的基本概念 两种抽样的基本形式 抽样的主要步骤 抽样的基本方法 样本量的确定
抽样调查与普查
抽样调查就是从总体中抽取能代表总体的一部分/样本, 然后根据样本中所包含的信息对总体的状况进行估计和推算。
样本
个体是相互独立被抽取得。 有放回的抽样,独立从总体中抽取一个个体,
记录,放回总体,抽取第二个个体,记录,放回总 体,以此类推,直到抽足n个为止。
简单随机抽样的实施方法
1. 抽签法 2. 随机数字表(随机乱码表) 3. 随机正态数字表
简单随机抽样的优缺点
优点: • 是最基本的抽样方法 • 最符合随机原则 • 抽样误差容易计算 • 复杂抽样设计的基础 • 衡量其它抽样方法的标准
确性要求不严格的调查有相当大的吸引力。 2、一般来讲,非随机抽样实施起来要比随机抽样用的时
间少。 3、如果合理地运用非随机抽样,它能产生极具代表性的
合理的抽样结果。 非随机抽样的局限性 1、不能估计出抽样误差。 2、调查人员无法知道抽样中的单位所具有代表性程度; 3Байду номын сангаас抽样结果不能推及总体。
三、抽样的基本步骤
随机抽样和非随机抽样的优点及局限性
随机抽样的优点 1、调查的结果可以用来推断总体。 2、调查人员可以获得被抽取的不同年龄、不同层
次的人们的信息。 3、能够估算抽样误差。 随机抽样的局限性 1、在大多数情况下,随机抽样所需的费用要比非
随机抽样高。 2、随机抽样比非随机抽样需要更多的时间策划和
实施。
非随机抽样的优点 1、费用比随机抽样低,非随机抽样的这一特点对那些精
比较适用于所给条件的调查方式
抽样调查
普查
低
高
短
长
大
小
小
大
大
小
毁灭性的
非毁灭性的
是
否
一、抽样设计的几个基本概念
总体 样本与样本单位 抽样误差和非抽样误差 抽样单元和抽样框
抽样
总体
统计过程
总体
抽 样
统计
样本
推断
计算
描
统计量
述
统计量
推断过程
总体参数估计 样本统计量 (X)
总体 样本
为了便利地实现随机抽样,常常把总体划分为有限个互 不重叠的部分,每一部分叫做一个抽样单元。
统计量
样本均值X 样本比例 P 样本方差 S2 样本相关 r
抽样 推断
统计方法 误差
总体
特征(参数)
平均值μ 比例π 方差σ2 相关ρ
抽样调查与普查的比较
抽样调查特点:
普查特点:
抽样调查花费较少 迅速地获取信息
--争取时效是非常重要的
总体较小 总体差异(方差)较大 抽样误差较大
中国
抽样单元
一级抽样单元:省 二级抽样单元:区 三级抽样单元:街道 三级抽样单元:居委会 四级抽样单元:家庭户 五级抽样单元:被访者
北京 朝阳区 官庄街道 广院居委会 17楼2门101室 男主人
抽样框
抽样框是包含全部抽样单元的资料。
1. 一般说来,普查可以提供抽样框资料 2. 表现形式名单、地图、统计年鉴等 3. 很多时候,很难获得完整的抽样框资料