第八章抽样调查
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ii i ii i
(三)等距抽样
等距抽样也称机械抽样或系统抽样,它是将总
体各单位按某一标志顺序排列,然后按固定顺序和
相等距离或间隔抽取样本单位的抽样组织方式。
抽样距离计算公式为:
k
N n
等距抽样示意图
(四)整群抽样
整群抽样也称集团抽样、区域抽样或分
群随机抽样,它是将总体各单位按时间或空
(二)偏差与随机误差
所谓偏差,是指在随机抽样中调查人员(有 意识地)破坏了随机原则抽样(即不按随机 原则抽样),由此形成的样本指标与总体指 标之间的差别。在抽样调查中,通常所说的 抽样误差是不包括偏差的。 所谓随机误差,是指由于随机抽样的随机性 由此而形成的样本指标与总体指标之间的差 别,通常也叫做抽样误差.
(二)类型抽样 类型抽样又称分类抽样或分层抽样,它 是先将总体按某个主要标志进行分组(或分 类),再按随机原则从各组中抽取样本单位的 一种抽样方式。
(1)等数分配类型抽样法
(2)等比例类型抽样法
i (i 1,2, , k ) n i N nN
(3)不等比例类型抽样法
n i n
重复抽样和不重复抽样(重置抽样和不重 置抽样)
重复抽样:也称为重置抽样,是指按照随机 原则,抽取一个登记后,放回去再按随机原 则再抽的抽样方法。
1 1 1 例如: , , , 5000 5000 5000
不重复抽样:也称为不重置抽样,是指抽取 出总体单位后,不再放回去,对剩下的总体 单位继续按随机原则进行抽样的方法。
p
P P 1 n
(2)不重复抽样条件下:
p
当N很大时,
p
P1 P N n n N 1
P P 1 n 1 n N
[例7—2]
某仪表厂生产某种型号的精密仪表,按正常生产经验,产品合格率为 85%。今按简单随机抽样方式从800只仪表中抽取10%进行检验,求合格品 比率的抽样平均误差。
(5)用于工业生产过程的质量控制
二、抽样调查中的几个基本概念
(一)全及总体和抽样总体 1.全及总体:全及总体简称总体或母体,它是指
所要调查研究对象的全体,用N表示。 2.抽样总体:抽样总体简称样本或子样,它是 指在全及总体中按随机原则抽取的那部分单位所构成 的集合体,用n表示。 n ≥ 30 大样本 n < 30 小样本
第七章
抽样调查
知识点回顾
普 查
全面调查 统 计 调查 非全面 调 查
全面报表 抽样调查
重点调查
典型调查
Contents
1 2 3 抽样调查的一般问题 抽样误差 总体指标的推断 必要抽样数目的确定
4
第一节
抽样调查的一般问题
一天,爸爸叫儿子去买一盒火柴。临出门前, 爸爸嘱咐儿子要买能划燃的火柴。儿子拿着钱出门 了,过了好一会儿,儿子才回到家。 “火柴能划燃吗?”爸爸问。 “都能划燃。” “你这么肯定?” 儿子递过一盒划过的火柴,兴奋地说: “我每根都试过啦。”
(二)总体指标和样本指标
1.总体指标 总体指标也称为母体参数或全及指标,它
是根据全及总体各单位的标志值或标志特征计
算的,反映总体某种属性的综合指标。由于全
及总体是唯一确定的,根据全及总体计算的全
及指标也是唯一确定的。
X 总体平均数: X
N
N1 总体成数:P P N 总体方差:
i
X
x
x
1000 7. 9 1 K 16 采取不重复抽样 见表7 2 ,
x
X
2
x
x
X
2
n CN
250 6 .4 6 16
重复抽样的样本数及相应指标计算表
序号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
样本变量x
(2)随机数字法
所谓随机数字,就是指用某种机械方法或电 子计算机产生的数字序列,数中的0,1, 2,…,9这10个数字出现的机会是等概率的, 但排列顺序则是随机的。将随机产生的数字 用表格的形式表现出来,就是随机数字表。 所谓随机数字表法,就是利用随机数字表随 机抽取样本单位的方法。 有关随机数字表法的具体内容,详见教材 (略).
-15 -10 -5 0 -10 -5 0 5 -5 0 5 10 0 5 10 15
离差平方(x-X)2
2Hale Waihona Puke Baidu5 100 25 0 100 25 0 25 25 0 25 100 0 25 100 225
1000
不重复抽样的样本数及相应指标计算表
序号 1 2 3 4 5 6 样本变 量x 10,20 10,30 10,40 20,30 20,40 30,40 样本平均 离差(x-X) 离差平方(x数x X)2 15 -10 100 20 -5 25 25 0 0 25 0 0 30 5 25 35 10 100 250
抽样平均误差的概念
抽样平均误差是指以全部可能样本指标
为变量,以总体指标为平均数计算得到的标 准差,以符号
ˆ
表示,通常以
p
x
代表平均
数的抽样平均误差,以
代表成数的抽样平
均误差,以M代表可能组成的样本总数。
二、影响抽样误差的主要因素
1. 母体(总体)各标志值的变异程度 ——两者成 正比,如果母体(总体)标准值没有差异,则也就没 有抽样误差; 2. 样本容量n ——反比关系;
(三)抽样误差
所谓抽样误差,就是指在随机抽样中按随机 原则从总体中抽取一部分单位构成样本,并 计算出有关样本指标(如样本平均数或成 数),再通过样本指标去推断总体有关指标 (如总体平均数或成数)时两者之间存在着 的差别。简而言之,抽样误差就是样本指标 与总体指标之间的差别。 抽样误差是抽样调查不可避免的误差。因为 部分单位与全部单位的数量特征通常是不可 能完全一致的.
[例7—3]
某大学有4500名学生,采用不重复简单随机抽样方式 从中抽取10%的学生,调查其每月生活费用支出情况。抽样 结果显示,学生平均每人每月生活费支出350元,标准差80 元,生活费用支出在500元以上的学生占全部学生的20%。 试求抽样平均误差。
N 4500 n 80010% 450 , x 350 s 80, p 20% ,
1 1 1 例如: , , , 5000 4999 4998
有序抽样和无序抽样
有序抽样:指每次抽样的先后要进行排序的 抽样方法。有有序重复抽样和有序不重复抽 样。 无序抽样:指每次抽样的先后不进行排序的 抽样方法。有无序重复抽样和无序不重复抽 样。
(1)抽签法(抓阄法)。具体作法是:当给总体各 个单位编号后,把号码写在结构均匀的签(如同 等大小的纸片等)上,将签混合均匀后即可以从 中抽取。抽签法简便易行,然而对于较大的总体 来说,编号、做签条的工作量很大,且不易做到 混合均匀。因此,抽签法的应用有一定的局限性.
P 85%,
2 P1 P 85% (1 85%) 12.75%,
n 800 10% 80
在重复条件下,采用[公式7—11]:
p
P P 1 n 12.75% 3.99% 80
在不重复条件下,采用[公式7—13]:
p
P P 1 n 1 n N 12.75% 80 3.79% 1 80 800
间形式划分成许多群,然后按纯随机抽样或
机械抽样方式从中抽取部分群,对中选群的
所有单位进行全面调查的抽样组织方式。
第二节
抽样误差
一、抽样误差的概念
抽样误差是指随机抽样所得的样本指标与 总体指标的随机误差。
登记 误差 偏差 代表 误差
抽样实际误差
抽 样 误 差
随机 误差
抽样平均误差
抽样极限误差
(一)登记性误差与代表性误差
1.79%
三、抽样平均误差
(四)其他抽样组织方式抽样平均误差的计算方法
1.类型比例抽样平均误差的计算 (1)平均数的抽样平均误差
重复抽样条件下:
x 2
n
不重复抽样条件下:
x
2
n 1 n N
三、抽样平均误差
(2)成数的抽样平均误差 重复抽样条件下:
3. 不同的抽样方法——重复抽样>不重复抽样;
4. 不同的抽样组织形式——是等距抽样还是整群抽 样,还是分层抽样或其它形式都会有影响。
(二)计算抽样平均误差的理论公式
根据抽样平均误差的概念可得其一般计算公式:
ˆ
即: x
样本指标 总体指标2
可能组成的样本总数
x X
2
( xi X ) 2 N
(x X ) F
i
2
F
2.样本指标
样本指标也称样本统计量或抽样指标, 它是根据抽样总体各单位的标志值或标志特 征计算的综合指标。 由于可以从一个全及总体中抽取许多个
不同的样本,不同的样本其分布结构也会有
差异,抽样指标的数值也就不同,所以抽样
指标的数值不是唯一确定的。
(三)抽样平均误差的计算方法
1.平均数的抽样平均误差 (1)重复抽样条件下:
x 2
n
n
n
n
(2)不重复抽样条件下:
x 2 N n
n N 1
2
当N很大时,
x
n 1 n N
2.成数的抽样平均误差
(1)重复抽样条件下:
x p
s2 n n 1 N 802 450 3.58(元) 1 450 4500 20% (1 20%) 450 1 450 4500
P P 1 n 1 n N
10,10 10,20 10,30 10,40 20,10 20,20 20,30 20,40 30,10 30,20 30,30 30,40 40,10 40,20 40,30 40,40
样本平均数x
10 15 20 25 15 20 25 30 20 25 30 35 25 30 35 40
离差(x-X)
所谓登记性误差,又称为调查误差或工作误 差,它是指调查人员在调查过程中,由于工 作不认真(如粗心大意抄错、写错、写漏等) 或计量工具不准确而形成的调查结果与实际 结果之间的差别。这种误差是可以尽量加以 克服或避免的。
所谓代表性误差,是指根据部分(少数)单 位调查的结果去代表(或推断)全部单位的 数量特征时,两者之间的差别。这种误差通 常是不可避免的.
M M
2
p
p P 2
为叙述简便起见,假设有10,20,30和40四 个数字组成一个总体,从中随机抽取两个数 字作为样本,求抽样平均误差。
100 25 N 4 采取重复抽样 , 见表7 1 X 400 X 100 25 25 K 16 N 4 全部可能组成样本的标 准差为: x
问1: 在这则笑话中,儿子 采用的是什么调查方式?
问2:这种调查方式好 不好?还可采用什么 方法调查?
要知道一锅汤的味道, 该怎么办呢?
想知道一批导弹的杀伤半径, 采用什么调查方法?为什么?
一、抽样调查的概念与作用
(一)抽样调查的概念与特点 抽样调查又称抽样推断或抽样估计,它是从总体 中按随机原则抽取一部分单位进行观测,并根据这部 分单位的资料推断总体数量特征的一种方法。
x 样本平均数: x
n
n1 样本成数:p p n 样本方差:s
2
(x
i
x)
2
n
( x x) f
i
2
f
三、抽样调查的组织方式
(一)简单随机抽样 简单随机抽样也叫纯随机抽样,它对总 体单位不作任何分类排队,而是直接从总体 中随机抽取一部分单位来组成样本的抽样组 织方式。
抽样调查的主要特点:
按随机原则抽取调查单位
由部分推断全体
抽样误差可以事先计算并加以控制
(二)抽样调查的作用 (1)用于不可能进行全面调查的无限总体 (2)用于不可能进行全面调查而又需要了解全面 (3)用于不必要进行全面调查的现象
情况的现象
(4)用于对全面调查的资料进行评价与修正