《调查抽样》PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4500 13000 1000 18500
27
分层抽样的优缺点
优点: 层内差异比较小,样本代表性高,可能得到较高 精度的推断结果 可对各层的特性加以比较
不足: 有时分层不容易划分,增加工作难度.工作量 和费用较大
4. 整群抽样
整群抽样又称聚类抽样、整体抽样,也称集团 抽样,是在当总体的所在基本单位自然组合为或 被划分为若干个群后,从中随机抽取部分群并对 抽中群内全部基本单位进行调查的一种抽样组合 形式。
39
独立控制的定额抽样举例
调查某地居民消费情况,计划抽取样本200 人。先将这些人按年龄、职业和收入特征 分层,再决定配额数量。
在这三层中虽然年龄、职业和收入都有具体规定, 但三者之间的交叉关系没有作规定,如高收入40 人既可以从18~34岁中选取,也可以从35~49岁 中选取,这些都没具体规定,完全由调查者根据 判断来选取。
与分层抽样的比较
同:先分层,后在各层中抽样。 异:分层抽样中各层的子样本是随机抽取 的,而配额抽样中各层的子样本是非随机 抽取的。
37
定额抽样分类
独立控制的定额抽样 相互控制的定额抽样
38
1)独立控制的定额抽样
又称单项特征配额,只对具有某种特征的 样本数规定配额,而对具有两种特征或两 种以上特征的样本数则不作规定。
合计
40
110
43
50
200
一项关于某品牌洗发水的消费者座谈会的抽样
研究对象:18~40岁 的女性,30人
经济
高低
选择“经济收入”和 “发型”为控制特征
收入
配额要求高低收入者 按1:1,烫发和直发按 3:2
依上述要求,设计一 个配额抽样控制表。
发 直发 型
烫发
44
配额抽样的特点
优点:成本低,而且调查人员对每一配额 较为方便地选择样本。 缺点:选择偏见问题严重,也不能对抽样 误差进行估计。
S低=50,为便于计算观察,列表如下:
层 每层中调查单位 各层中标准差估计
n总数1N0i (0万0 ) 4500 值 S2i43

15
18500 300
中 n 615000 13000 200703
低 合计
18500
n
20 1100000
1000 18500
50 — —54
Ni Si (万)
中群内基本单位而言则是全面调查, 即“先部分,后全部”。
31
整群抽样的特点
1. 在调查组织工作方面方便 2. 抽样误差比较大
抽样原则: 为提高精度要尽可能扩大各层间的差异,
而缩小层内的差异。
4.3.2 非随机抽样
❖ 1.任意抽样 ❖ 2.定额抽样 ❖ 3.主观抽样 ❖ 4.滚雪球抽样
33
1.任意抽样
ni
n
Ni N
23
2)非比例分层抽样
非比例分层抽样,即这种方法不受各层次中抽取样本数比 例相等的限制,对有较大影响但数量较少的层次分配较大 的抽样比例,而对数量较多但影响较小的抽样比例的一种 抽样方式。
适用用于各层的单位数相差悬殊或各层的方差差异比较大 时。
24
分层抽样举例
某部门要调查城市居民家用电器潜在需求量。这种商品的消 费量与居民收入水平相关,且总体中个体差异较大,因此, 应先按家庭收入作为分层标志进行分层。假定该市有居民的 家庭总数为100万户,已确定计划抽取样本1000个。家庭收入 按高、中、低分层,其中高收入家庭为15万户,中等收入为 65万户,低收入为20万户。
✓ 抽样总体:又称样本,即已被人们所掌握了 的、能按某一方式排列或给以编号的全体单 位的总体,是抽样样本的依据。
5
2. 重复抽样和不重复抽样 3. 抽样框: 是界定目标总体的一个表,可以是名单、电话 调查时所用的电话号码簿,或住户的区域地图, 或从邮寄名单提供商那里购买的地址簿或数据库。
4.抽样单元

值之差;
计 误
随机误差
抽样平均误 差

代表误差
偏差
4.2 抽样调查的程序
确定总体 选择资料收集方法 制定抽样框 选择抽样方法 确定样本容量 制订抽样计划 进行抽样
9
4.3 抽样方法
❖ 4.3.1 随机抽样 ❖ 4.3.2 非随机抽样
4.3.1 随机抽样
❖ 1.简单随机抽样 ❖ 2.系统抽样 ❖ 3.分层抽样 ❖ 4.整群抽样
2. 系统抽样
系统抽样,又称等距抽样或机械抽样,它的随机性表现 在每个单位都有相同的被抽中的概率,即第一个单位确定 后,其他各单位的位置也就确定了。
基本步骤: ❖ 将所有个体按一定顺序排列,编号; ❖ 计算抽样距离,一般用K表示; ❖ 在K个个体中用简单随机抽样的方法抽取一个 号码,抽中号码所在的位置序号为l,l确定为抽 样起点; ❖ 确定样本编号。l,l+k, l+2k…,
3
抽样调查与普查的比较
比较项目
预算 可用时间
误差 总体规模 特征差异 测量的性质
抽样调查
小 短 高 小 小 破坏性的
普查
大 长 低 大 大 非破坏性的
4
4.1.2 基本概念
1. 全及总体和抽样总体 ✓ 全及总体:又叫母体,简称总体,是指所要
调查对象的全体。总体是由具有某种共同性 质的所有单位组成的。总体又分为有限总体 和无限总体两种。
抽样
专科生 本科生 研究生
ቤተ መጻሕፍቲ ባይዱ
样本n=1000 n1=300 n2=500 n3=200
样本1000人
分层抽样模拟
分层抽样的划分
❖比例分层抽样 ❖非比例分层抽样
22
1)等比例分层抽样
先按某个特性进行分 层,然后用各层基本 单位数占总体中基本 单位总数的百分比乘 以调查样本总数的方 法来确定各层抽取的 样本数。
基本步骤(先部分,后全部) ❖ 采用分群法将总体分成若干个子群体; ❖ 按随机原则选定群体作为样本; ❖ 对选中的群体进行普查。
29
整群抽样与分层抽样的区别
分层抽样: 高收入层
中收入层 低收入层
整群抽样: A群
B群 C群
高高高 中中中 低低低
高中低 高中低 高中低
30
整群抽样应注意的问题
❖ 群与群之间不重叠。 ❖ 是以群为单位的纯随机抽样。 ❖ 对于群而言是非全面调查,对于被抽
15
开始
总体 N=60
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
如何抽样?
35
3.配额抽样
定额抽样又称定额抽样、计划抽样,依据一定 特征对总体分层或分类后,从各层或各类中主观 选取一定比例的样本的方法。选取调查单位的职 责在调查人员身上。
基本步骤: ❖ 选择“控制特征”; ❖ 将总体按“控制特征”细分成若干子总体; ❖ 确定子总体样本大小; ❖ 指派配额。
36
40
年龄
18~34岁
50
35~49岁
80
50~59岁
40
60岁以上
30
合计
200
职业 工人 知识分子 其他 合计
收入 高 中 低 合计
80 70 50 200
40 110 50 200
41
2)相互控制的定额抽样
又称交叉特征配额表,对各个特征的每一 个样本数目都有规定,即按各类控制特征 分配样本数额时,要考虑各类型之间的关 系,采用交叉控制表安排样本的分配额。
指在一定时间内、一定环境里所能遇到的 或接触到的人均选入样本的方法。比如街头 栏人法、方便选择法等。
优点:方便,省时,省力。 缺点:不能推断总体,代表性差,偶然性强。
34
2.判断抽样
又称主观抽样,研究者依据主观判断选取 可以代表总体的个体作样本。
例如:在产业市场调查中,一个公司大约 50%业务来自于10个大购买者,其余50% 来自300多个小公司.
12
某一居民小组抽取40%样本的例子
确定抽样框(该居民小组15户门牌号) 编号(见下表) 计算样本容量,15×40%=6 用随机数表抽取样本(可从任两列的任一行开 始抽取≤15的数)
门 48 49 49- 50 51 52 52 52 53 54 55 56 57 58 58

-1 2
-1 -2 -3
11
1. 简单随机抽样
简单随机抽样,又称纯随机抽样,所
有个体都有被抽中的同等机会。适合于
相对直较接小抽的取总法体调❖从查调。查总体中直接随机抽取样本
抽签法 随机数表法
进行调查。 基❖本适步用骤于:集中在某个较小空间的总 ❖体将进所行有抽个样体排队编号; ❖基❖利本比用步如制骤:作:对出存来放的在同仓样库规的格同的类卡产片品, 填❖进找入行寻编直准号接确,抽的将样抽次。样序框打;乱,随手逐一 抽❖给取抽卡样片框,中直的到所达有到个规体定编的号样;本量 为❖确止定;样本容量; ❖❖将运选用出随的机卡数片表编抽号取对 样个本体。一一对 号入座,选为调查样本。
一级抽样单元:省 二级抽样单元:区 三级抽样单元:街道 三级抽样单元:居委会 四级抽样单元:家庭户 五级抽样单元:被访者
中国
为了便利地实现抽样, 常限常个把互总不体重划叠分的北为部京有分, 每一部分叫做一朝个阳区抽 样单元。
官庄街道
广院居委会
17楼2门101室
男主人
4.1.3 抽样误差
登记误差
样本特征值 与总体特征
-1 -2

编 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 号
简单随机抽样的优缺点
优点:
•方法简单直观 • 最符合随机原则 • 抽样误差容易计算
缺点: • 对所有单元编号,十分复杂,有时不可行
• 所抽取的单元可能十分分散,实施困难
• 对于总体差异比较大时,简单随机抽样代表 向较差
18
3. 分层抽样
也称类型抽样或分类抽样,是先对总体单位分层, 然后每一层都按照一定的方法随机抽取部分单位构成 样本的一种抽样形式。
基本步骤(先全部,再部分): ❖ 把总体单位按主要标志分成两个或两个以上的相 互独立的完全组,即分层; ❖ 从这些组中进行简单随机抽样,样本相互独立。
19
分层标志的选择
42
收入
职业



合计
工人
知识 分子
其他
工人
知识 分子
其他
工人
知识 分子
其他
18~34 岁
4
4
2 10 8
6
6
6
4 50
35~49


6
6
2 20 14 14 8
4
6 80
龄 50~59 岁
2
4
2 12 8
4
2
4
2 40
60岁以 上
2
4
2
6
4
4
2
4
2 30
合计 14 18 8 48 34 28 18 18 14
等比例分层抽样
n高
1000
15 100
150(户)
n中
1000
65 100
650(户)
n低
1000
20 100
200(户)
非比例分层抽样
因为高、中、低各层内收入的差异程度不同,高 、中层差异较大,低层差异较小,所以给予各层 不同的标准差估计值,即S高 = 300,S中=200。
课堂测试
1. 下面方法省去了一个一个抽样的麻烦,适用于大规模调查,还 能使样本均匀地分散在调查总体中,不会集中于某些层次,增 加了样本的代表性 ( ) A分层抽样 B系统抽样 C 配额抽样 D 整群抽样
❖ 尽量利用总体中存在的自然分层标志;
❖ 在选择分层标志时,如果有数量标志,也有 品质标志,应该选择那些能决定被调查标志 数量差异的品质标志。
20
分层抽样 分层原则:层内差异小,层间差异大
总体 N=10000
专科生
本科生 50%
30%研究生
20%
分层
专科生 n1=3000
本科生
研究生
n2=5000 n3=2000
45
4. 滚雪球抽样
先选取一组合适样本,然后通过它们得到 更多的样本,以扩大样本范围。
目的之一:估计在总体中非常稀少的某些特 征,该方法可显著增加在总体中查找想要特 征的可能性。
使用的基本前提: ❖ 具有此特征样本在总体中比例极低。 ❖ 样本之间要有互动,互动密度较其他群体 的互动密度高。 ❖ 样本的居住区域不集中。
《调查抽样》PPT课件
4.1 抽样调查的基本问题
4.1. 1 抽样调查概念与特征 4.1.2 抽样调查中的基本概念 4.1.3 抽样误差的确定
2
4.1.1 抽样调查的概念与特征
❖普查:对一个总体的全部个体所进行的 全面的、 普遍的调查,获得调查对象 特征。
❖抽样调查:从总体中选出部分个体加以 调查,获得样本特征,进而推断总体的 综合特征 。
等距=60/6=10
样本 n=6
(07 17 27 37 47 57)
系统等距抽样模拟
系统抽样
1. 最好编号是按照与研究目的有关变量来排列的 2. 要避免间距与研究现象固有的周期相重合
从一个1000户的居委会中抽取20个家庭
将1000户居民按一定顺序排列; 计算抽样距离,1000/20=50=K; 在前50个居民中采用简单随机抽样方法随机抽 取一个号码,如抽取23,即抽样起点; 确定样本编号。 23、73、123、173、223、273……
相关文档
最新文档