抽样检验-第四章抽样技术 精品002
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽签法
是将总体各单位编上序号,并将号码写在 外型相同的纸上,掺和均匀后,再从中随机 抽取,被抽中的号码所代表的单位就是随机 样本,直到抽够预先规定的样本数目为止。
例如
在某城市某街道所管辖的10000户居民中, 抽200户居民进行调查。 操作方法:做10000张纸片,写上1—10000 号,从中抽取200张,被抽中的居民就是样本。
2.选择排序:选择一个与调查变量相关的变量 进行排序。
如:要调查居民的住房购买意向,按照居民 现有住房面积进行排序。
尽量选择与研究相关程度高 的辅助变量作为排序依据
关于间隔问题
注意间隔与研究现象本身的关系
如对集市贸易成交量的调查,间隔就不能用 7或30这种与周、月周期一致的数。
等距抽样的优缺点 优点:简便易行;样本分布均匀 缺点:难以计算抽样误差 适用范围:产品质检中最为常见
整群抽样
(一)概念
整群抽样是根据总体的特征按一定标志分成 若干不同的群,然后对抽中群的单位进行调 查的一种抽样方式。
例如
简单
欲估计成都某高校大学生拥有的电脑情况随。机假
定该大学里共有30000个大学生,8000个学抽生样
宿舍(每个宿舍住4人)。
整群 抽样
方案一:根据学生名单按照简单随机抽样抽取
(一)样本容量的确定 样本容量是指一个样本所包括的单位数。
确定样本容量需考虑的因素:
1.调查精度 3.总体规模 5.经费的制约 7.抽样方式 9.人力资源限制
2.总体变异程度 4.无回答情况 6.分组需要 8.时间限制 10.其它如设施工具等限制
其中,总体变异程度和调查精度要求是两个基本因素.
2
规模
1000 5000 10000
样本 50以上 50-20 30-10 15-3 占总 体比 重%
10000- 100000 100000 以上
5-1 1以下
由经验确定样本容量,一般用于非随机抽样
(二)简单随机抽样的实施 适用范围
总体单位数量不大
总体单位差异不大
容易得到总体清单的较大总体
具体抽法有:抽签法 随机乱数表法 使用统计软件直接抽取
上述两种抽出的结果与总体均值的误差 都很大
如果在新生中抽1人,老生中抽1人共同 组成样本,这时样本最小的可能值为:
y1
2
10 2
6
样本最小的可能值为:
6 14 y2 2 10
与总体均值接近 很多
(二)样本容量的分配问题
1.分层比例抽样法 2.分层最佳抽样法 3.分层最低抽样成本法
1.分层比例抽样法--PPS
(一)概念 是把从市场调查总体中抽取样本的过
程,分成两个或两个以上的阶段进行随机 抽样的方式.
经典案例:以色列人的第一个国王的产生
撒母耳把百姓召到米斯巴,对他们说:“你 们要求立一个国王来统治以色列,耶和华应 允了你们的请求,现在开始选举第一任国王。 各支派宗族都让你们的代表站到耶和华面前 来。”各支派的代表站出来了,撒母耳就在 他们面前抽签。第一签,抽到便雅悯支派; 第二签,抽到便雅悯支派中的玛特利族…… 到很多次签以后,终于抽到便雅悯支派、玛 特利族、基士的儿子扫罗——扫罗被耶和华 选为以色列历史上的第一个国王。
a aa aaa
A层
b bb bbb
B层
c cc ccc
C层
a bc bab
b ac abc
c ba bca
A群 层内差异大,层B间群具有相同性 C群
优点
节约费用
缺点
准确性较差
适用范 围 1.难于得到抽样框时
2.调查费用紧张时 3.方便管理,节约时间时 4.进行大范围、大规模调查
多阶段随机抽样
400个大学生;
方舍,案并二调:查根被据抽学中生宿宿舍舍中名的单每随一机个抽大取学10生0个;宿多段样阶抽
方案三:先随机抽取400个学生宿舍,再在每
个被抽中的宿舍内随机抽取1个学生。
(二)群的划分和规模
划分原则:应使群内方差尽可能大,而使群间 方差尽可能小
分群抽样与分层抽样层的间区差异别大,层内具有相同性
6 0449352494 7 0054997654 8 3596315307 9 5980808391 10 4605885236
7524633824 6405188159 2689809354 4542726842 0139092286
4586251025 9611963896 3335135462 8360949700 7728144077
14
C
6
F
12
合计
12
合计
36
总体均值为 Y 12 36 8
6
现在用抽样方法随机抽取2人为样本,并用 样本均值对总体均值进行推断
在简单随机抽样下,如果抽中的是拥有最少 书的2个人 ,则样本均值为:
24 y1 2 3
如果抽到的是拥有最多书的2个人,则其 样本均值为:
12 14 y2 2 13
1200000 小型用户抽取数 240000 1000 200户
1200000
适用于各层之间差异不大的情况下
2.分层最佳抽样法
按照各层样本标准第差i层 的大小,调整各层的次标 的样本数目。 准差
ni
NiSi n Ni Si
例如
某电机厂有120万用户,其中: 大型:36万户 中型:60万户 小型:24万户
随机原则在管理中的应用
非随机抽样不遵循随机原则,它是从方便 出发或根据调查者主观判断来选择调查对 象。
最大的特点:操作简便、时效快、成本低, 但在理论上无法推断总体。
二、市场抽样调查的方式
随机抽样方式
简单随机抽样 系统抽样 分层抽样
整群抽样 多阶段抽样
简单随机抽样
简单随机抽样是指在抽样前,对总体单位不 进行任何分组,排列等处理,完全按随机原 则从总体中抽取样本。
抽样距离R的大小等于总体数量N除以样本数量n
R N n
具体操作方法
P101
例如
从10000户居民中抽出200户居民进行抽样 调查,采用等距抽样。 操作方法:
1
50 100
150
10000
关于排序问题的处理办法
1.随机排序:排序是随机的,与研究目的无关。
如:要调查居民的购买意向,一般按照家庭的 住址或地理位置排序。
n ( z )2 (1.96 200 )2 683(户)
x
15
不重复抽样情况下:
Z2 2 N
n0
(N
2
Fra Baidu bibliotek
1)
2 x
Z2 2
2
2)根据成数抽样极限误差确定初始样本容 量重复抽样情况下:
Z2 P(1 P)
n0
2
2 p
不重复抽样情况下:
Z
2
P(1
P)
N
n0
(N
2
1)
2 p
Z 2
P(1
P)
特点:分层抽样可以提高参数估计的精度
【例4-1】
设某个学生宿舍共有6个人,其中3名新生 (A,B,C),3名老生(D,E,F)。由于 学校与偏远山区的学校互帮互助,现在鼓 励大家踊跃捐献书籍,假定他们捐献的数 目如下表所示:
学生编号 A
新生捐赠书籍 /本
2
学生编号 D
老生捐赠书籍 /本
10
B
4
E
若确定抽取1000户进行调查, 大型的标准差:5% 中型的标准差:2% 小型的标准差:3%
各层应抽取的单位数为:
大型用户抽取数
360000 5%
1000
360000 5% 600000 2% 240000 3%
484户
中型用户抽取数
600000 2%
1000
360000 5% 600000 2% 240000 3%
抽样技术
第四章 抽样技术
教学目的与要求:
本章主要介绍市场调查中多种 调查方式以及各自代表性的 估计和样本精确度的计算方 法。
本章主要内容 随机抽样 非随机抽样 抽样中的误差问题
运用抽样技术进行调查简称抽样调查。广义 上,一切非全面的统计调查都是抽样调查。
相对于普查,抽样调查具有自身的特点: (1)节省费用; (2)调查周期短、时效快; (3)有助于提高原始数据质量
第一步,确定委托机构所要求或者认可 的估计精度水平,包括误差限度和置信 度(并通过查表查得)两项内容。
第二步,选择总体方差 2
第三步,初始样本容量 n0
1)根据平均数抽样极限误差确定初始样本 容量重复抽样情况下:
Z2 2
n0
2
2x
样本容量计算举例
某地区居民户为10000户,其年消费水平标 准差为200元,若采取抽样调查了解其年平均 消费水平,并要求以95%的置信度推断总体, 其样本指标与总体指标之间的容许误差范围 是15元,则样本单位数的计算为:
n2
n1 r
第六步,根据分组的需要,分别计算各组 所需样本量
第七步,为了最终确定样本容量,除了遵 从以上步骤谨慎考虑之外,还必须仔细权 衡时间、成本、调查机构的各种资源限制。
根据经验法确定样本容量
是根据抽样调查的经验,得出不同规模的 总体,样本单位数占总体的比重经验数,供抽 样调查抽取时参考.
总体 100以下 100- 1000- 5000-
随机数表法
随机数表法是先把总体各单位编号,根据编号的 最大数(总体单位数)确定使用随机数表中若干 列或若干行数字,然后从任意行或任意列的第一 个数字起,可以向任意方向数去,遇到属于总体 单位编号范围内的号码就确定为样本单位直到抽 够预定的样本单位数为止。
112345678910 212345678910 312345678910 412345678910
1 6119690446 2645747774 5192433729 6539459593 2 1547445266 9527079953 5936783848 8239610118 3 9455728573 6789754387 5462244431 9119042592 4 4248116213 9734408721 1686848767 0307112059 5 2352378317 7320889837 6893591416 2625229663
如要了解消费者的购买力,选择居民的收入水平 进行分层。
2.分层要使层内差异缩小,层间差异增大
各层内部的个体差异
层与层之间的差异
可以提高样本的代表性
3.分层不宜太多,以免失去层的特性
5层合适
不超过7层
优点
1.当总体内部类型明显时,可以增强样本对总体 的代表性 2.提高了样本指标推断总体指标的精确度 3.有利于了解总体内部的情况
323户
小型用户抽取数
240000 3%
1000
360000 5% 600000 2% 240000 3%
193户
适用于各层之间差异很大的情况下
3.分层最低抽样成本法
按照抽样的费用 来确定各层应抽 样本数量。
既考虑抽取样本的代表性,也考虑 抽样的费用
如何科学分层? 1.选择好分层的标准
根据调查的目的进 行选择
2
第四步,确定抽样方式,并根据不同抽样方 式的设计效应(deff)对样本容量进行调整:
设计效应(deff)=任意抽样方式下的抽 样方差/简单随机抽样方式下抽样方差
简单随机抽样的deff=1; 分层随机抽样的deff<1; 整群随机抽样的deff>1; 系统随机抽样的deff≈1。
第五步,判定有效回答率r,并根据有效回答 率对样本容量再进行调整。
问题
1.层的划分问题
实际调查中,不易划分
2.要求总体容量N已知
适用范 围 1.对各层进行估计时
2.为使调查的实施更有效
3.分层后,在各层实施不同的抽样方法 4.为使样本更有代表性
5.为提高估计量的精确度
系统抽样
(一)概念
系统抽样又叫等距抽样,它是先将总体各 单位按某一标志顺序排列,编上序号,然 后用总体单位数除以样本单位数求出抽样 间隔,并在第一个间隔内随机抽取一个单 位做为组成样本的单位,最后按计算的抽 样距离做更距抽样,直到抽满n个单位为止。
按照每个层次中单位的 数量占总体单位数量的 多少,等比例的分配样 本单位数。
ni
Ni N
n
例如
某电机厂有120万用户,其中: 大型:36万户 中型:60万户 小型:24万户
若确定抽取1000户进行调查,
各层应抽取的单位数为: 大型用户抽取数 360000 1000 300户
1200000 中型用户抽取数 600000 1000 500户
6196279335 5469282391 7797450024 1302124892 9391083647
使用统计软件直接抽取 SPSS
分层抽样
(一)概念
分层抽样(stratified random sampling)又叫类型 抽样,它是先将总体按一定标志分层,然后在各 层中采用简单随机抽样或系统抽样方式抽取样本 的一种抽样方式。
第一节 随机抽样
一、市场抽样调查的含义 总体是指根据一定的目的而确定的研究对象 的全体。
总体可能是无限的,但对每次调查情况是有限的。
大学生
某学院在校大 学生
样本是总体中抽取出来着为直接观察对象的 全部单位。
抽样框是指供抽样所用的总体清单,是抽样 的实际总体。
随机抽样是指按照随机原则抽取样本的调查。 是指调查总体的每个单位都有 同等被抽中或不被抽中的概率, 即样本的抽取完全是客观的。