第6章抽样调查

合集下载

自考-市场调查与预测-第6章-抽样方法

自考-市场调查与预测-第6章-抽样方法

1 定义总体 确定调查对象全体:从抽样元素、抽样 单位、抽样范围、抽样时间角度考虑 例如…

2 确定抽样框架 抽样总体中,抽样元素的表现形式。总体中 的每一个元素都在抽样框架中出现一次,且 仅出现一次。如户籍簿。 适用性、完整性。 3 确定抽样单位 容纳总体的基本单位,大于等于样本元素。 取决于抽样框架和调查方法。 电话调查——电话号码 邮寄调查——地址或姓名

B 平均值估计 C 百分比估计样本容量

根据允许误差大小估计样本量
不同抽样方法样本容量的确定 影响因素: 调查目的;总体大小;总体构成;抽样方式 计算公式:见表6-4

其它调查方法介绍
2、自愿样本
被调查者自愿参加,成为样本中的一分子,向
调查人员提供有关信息

例如,参与报刊上和互联网上刊登的调查问
第6章 抽样方法
普查与抽样调查 抽样程序
常用抽样方法
样本容量的确定
6.1普查与抽样调查
抽样设计的重要性 案例6-1 普查的相关概念和案例 P159 抽样调查的概念 抽样是通过抽取总体中的部分单位,收集 这些单位的信息,从而对总体进行推断的 一种手段。 抽样调查的含义 P163 抽样调查的适用范围
第一节 抽样方法

6.3 常用抽样方法
1 简单随机抽样 2 分层随机抽样 3 分群随机抽样 4 等距随机抽样 5 任意抽样 6 判断抽样 7 配额抽样 8 滚雪球抽样

1 简单随机抽样 1、抽样方法 根据研究目的选定总体,首先对总体中所 有的观察单位编号,遵循随机原则,采用不放 回抽取方法,从总体中随机抽取一定数量观察 单位组成样本。 2、具体方法 ①抽签法

第6章抽样设计

第6章抽样设计

第四节 抽样误差与样本量
• 一、调查误差的概念与种类 • 调查误差是指调查的结果和客观实际情况的出入和差数。
一般有两种误差存在, 即非抽样误差和抽样误差。 • 非抽样误差是基于抽样之外的许多其它原因而产生的误差。
• 抽样误差是指一个样本的测定值与对该变量真值之间的差 异,抽样误差无特定偏向,其误差大小主要受以下三个因 素影响:
• 单位顺序的排列方式有两种: 一种是排列顺 序与调查项目无关。另一种是按与调查项 目有关标志排队。
• 三、分层抽样
• 分层抽样又叫类型抽样, 它是先将总体 所有单位按某一重要标志进行分类(层), 然后再各类(层)中采用简单随机抽样或 等距抽样方式抽取样本单位的一种抽样方 式。
• 分层抽样比简单随机抽样和机械抽样更 为精确, 能够通过对较少的抽样单位的调查, 得到比较准确的推断结果, 特别是当总体较 大、内部结果复杂时, 分层抽样常能取得令 人满意的效果。同时, 分层抽样在对总体推 断的同时, 还能获得对每层的推断。
• (二)特点
• 与全面调查相比,抽样调查具有以下三个 显著特点:
• 1、经济
• 与全面调查相比,抽样调查的样本量大大 减少,从而可以显著地节约人力、物力和 财力。
• 2、高效
• 由于抽样调查只对总体中少量单位进行调 查,故能十分迅速地得到调查讨论。
• 3.准确
• 抽样调查是调查部分总体单位,数目较少,
• 第一,被研究总体各单位标志值的变异程度。 • 第二,抽样的样本量。 • 第三,抽样调查的组织方式。
• 二、样本量 • 在开始组织抽样调查之前,确定抽多少样本单位是个很重
要的问题。 • (一)影响样本量的因素 • 抽样调查的样本量取决于以下几个因素: • 1、被调查对象标志的差异程度 • 2、允许误差数值的大小 • 3、调查结果的可靠程度 • 4、抽样的方法 • 5.抽样的组织形式

市场调查-第六章抽样技术

市场调查-第六章抽样技术

N = 721, n = 10, 721/10≈72
K =
用随机数表法,如果第一个确定的数字为102,则 各样本单元编号依次为:102,174,246,318, 390,462,534,606,678,29。其中最后一个编 号应为678 + 72 = 750。因大于N,故减去721,实 际编号取为750- 721 = 29。
多级随机抽样是先把总体划分为 若干一级单元,再把各个一级单 元划分为若干个二级单元,直至 不再划分的个体单元。在抽样时, 先用简单随机抽样方法抽取部分 一级单元,再在抽中的一级单元 中抽取部分二级单元,依次操作, 直到抽得个体单元为止。
多级随机抽样——demo
我国城市住户调查采用的就是多 级抽样,先从全国各城市中抽取 若干城市,再在城市中抽选街道, 然后在各街道中抽选居民会,最 后在各居委会中抽选居民户。
低收入 20%
高收入 20%
中收入 60%
高收入 中收入 低收入
分层比例抽样法
高收入层抽取的样本单元数为: 200×20%=40(户) 中收入层抽取的样本单元数为: 200×60%=120(户) 低收入层抽取的样本单元数为: 200×20%=40(户)
在各层抽样时,只需采 用简单随机抽样法即可。
2、分层最佳抽样法
二、分层随机抽样
分层随机抽样是先将总体所有单位按 某一重要标志进行分层(类),然后在 各层(类)中采用简单随机抽样方式抽 取样本单位的一种抽样技术形式。在 划分层次时应注意,各层次内部保持 确定的同质性,而各层次之间又应有 明显的异质性。
分层比例抽样法 分层最佳抽样法
1、分层比例抽样法
分层比例抽样法,指各层 抽取的样本单元数是按各 层单元数占总体单元数的 比例加以确定。

第六章抽样调查习题答案

第六章抽样调查习题答案

第六章抽样调查习题答案一、单项选择题1、 C2、 A3、 D4、 D5、C6、 D7、 C8、 A9、 D 10、A11、 D 12、C 13、B 14、 A 15、A16、 B 17、 B 18、D 19、 A 20、A21、 A 22、 D 23、 D 24、 B 25、A二、判断题1、CD2、AE3、BCD4、ABDE5、ABD6、AB7、ABCD8、AC9、ABCD三、判断题1、×2、√3、√4、√5、√6、×7、√8、×9、√10、√11、×12、√13、√14、×15、×16、√17、√18、×四、填空题1、随机、部分、总体2、计算、控制3、重复、不重复4、大于5、点估计、区间估计6、增加到4倍、减少三分之二、减少四分之三7、大样本、小样本8、正、反五、复习思考题1、影响抽样误差的主要因素有哪些?答:影响抽样误差大小的因素主要有:(1)总体单位的标志值的差异程度。

差异程度愈大则抽样误差愈大,反之则愈小。

(2)样本单位数的多少。

在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小。

(3)抽样方法。

抽样方法不同,抽样误差也不相同。

一般说,重复抽样比不重复抽样,误差要大些。

(4)抽样调查的组织形式。

抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度也会影响抽样误差。

2、什么是抽样调查?它有哪些特点?答:抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。

它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。

(1)只抽取总体中的一部分单位进行调查。

(2)用一部分单位的指标数值去推断总体的指标数值(3)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。

统计学原理-第六章 抽样调查(复旦大学第六版)

统计学原理-第六章  抽样调查(复旦大学第六版)
全体。其单位数用N来表示。
2.样本总体:简称样本,是从全及总体中随机
抽取出来,代表全及总体部分单 位的集合体。单位数用n表示。
5
二.全及指标和抽样指标
(一)全及指标
X 总体平均数: X N 总体成数:P
2
XF 或X F Q=
2 2
N1 N N
(X-X) 总体方差: = 总体标准差:= (X-X)
(一)考虑顺序的不重复抽样数目
N! A N ( N 1)(N 2) ( N n 1) ( N n)! 4 3 2 1 2 例如A4 12 2 1
n N
(二)考虑顺序的重复抽样数目
B N
n N 2 4
n 2
例如 B 4 16
10
(三)不考虑顺序的不重复抽样数目
Ex X
28

2、一致性 当抽样单位数充分大时,抽样指标和未知 的总体指标之间的绝对离差为任意小的可能性 也趋于必然性。
x X 任意小
3、有效性
即用抽样指标估计总体指标,要求作为优良估 计量方差应该比其他估计量的方差小。

2
x X f
2
f

2
x X f
x
x E ( x)
2
18
说明:根据数理统计理论,在重复抽样条件下, 抽样平均误差与全及总体的标准差成正比例关系。 与抽样总体单位平方根成反比关系。
19
在不重复抽样情况下,抽样平均误差计算公式如下:
x x

N n 250 4-2 ( )= ( ) =9.13(件) n N 1 2 4-1
2
N
X X F 或 F X X F 或 F

统计学第六章 抽样法

统计学第六章  抽样法
31
第六章 抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80

x
x E(x)
总体
研究如何利用 样本数据来 推断总体特 征。
内容包括:参 数估计和假 设检验。
目的:对总体
特征作出推
样 本
断。
这是推断统计学研 究的问题
5
第六章 抽样法
描述统计与推断统计的关系
反映客观 现象的数

概率论
(包括分布理论、大 数定律和中心极限定
理等)
样本数
描述统计
推断统计

总体数 据
(统计数据的搜集 、整理、显示和分
13
第六章 抽样法
第二节 有关抽样的基本概念(2)
(二)抽样总体
也称子样,样本或样本总体,它是从全 及总体中随机抽取出来的,代表全及总体的 那部分单位的集合体。抽样总体的单位数称 为样本容量,用n表示,对于N来说,n是很 小的。
总体
样 本
14
第六章 抽样法
第二节 有关抽样的基本概念(3)
• 二 全及指标和抽样指标p.249 (一) 全及指标
研究总体中 的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章 抽样法
第二节 有关抽样的基本概念(5)
(二)抽样指标
抽样指标是由样本总体各单位标志值 或标志特征计算的综合指标,也称统计量。 与全及指标相对应有:样本平均数,样本 标准差;样本成数,样本成数的标准差。

第六章抽样调查练习及答案

第六章抽样调查练习及答案

第 六章 抽样调查一、填空题1.抽选样本单位时要遵守 原则,使样本单位被抽中的机会 。

2.常用的总体指标有 、 、 。

3.在抽样估计中,样本指标又称为 量,总体指标又称为 。

4.全及总体标志变异程度越大,抽样误差就 ;全及总体标志变异程度越小,抽样误差 。

5.抽样估计的方法有 和 两种。

6.整群抽样是对被抽中群内的 进行 的抽样组织方式。

7.误差分为 和代表性误差;代表性误差分为________和偏差;偏差是____________________________,也称为________________。

8.简单随机抽样的成数抽样平均误差计算公式是:重复抽样条件下: ;不重复抽样条件下: 。

9.误差范围△,概率度t 和抽样平均误差μ之间的关系表达式为 。

10.抽样调查的组织形式有: 。

二、单项选择题1.所谓大样本是指样本单位数在( )及以上A 30个B 50个C 80个 D100个2.抽样指标与总体指标之间抽样误差的可能范围是( )A 抽样平均误差B 抽样极限误差C 区间估计范围D 置信区间3.抽样平均误差说明抽样指标与总体指标之间的( )A 实际误差B 平均误差C 实际误差的平方D 允许误差4.是非标志方差的计算公式( )A P(1-P)B P(1-P)2C )1(P P -D P 2(1-P)5.总体平均数和样本平均数之间的关系是( )A 总体平均数是确定值,样本平均数是随机变量B 总体平均数是随机变量,样本平均数是确定值C两者都是随机变量 D两者都是确定值6.对入库的一批产品抽检10件,其中有9件合格,可以( )概率保证合格率不低于80%。

A 95.45%B 99.7396C 68.27%D 90%7.在简单随机重复抽样情况下,若要求允许误差为原来的2/3,则样本容量( )A 扩大为原来的3倍B 扩大为原来的2/3倍C 扩大为原来的4/9倍D 扩大为原来的2.25倍8.根据抽样调查得知:甲企业一等品产品比重为30%,乙企业一等品比重为50%一等品产品比重的抽样平均误差为 ( )A 甲企业大B 两企业相同C 乙企业大D 无法判断9.是非标志的平均数是( )A -P)1P(B P(1-P)C pD (1-P)210.重复抽样的误差一定( )不重复抽样的误差。

胡德华版统计学第六章

胡德华版统计学第六章

6.2.2 机械抽样
机械抽样又称等距抽样或系统抽样, 机械抽样又称等距抽样或系统抽样,就是将总体的各单位按某一标 志的大小进行排队,用总体单位数除以样本单位数求得抽样间隔, 志的大小进行排队,用总体单位数除以样本单位数求得抽样间隔,然后 按照相同的间隔等距抽取样本的一种抽样方式。 按照相同的间隔等距抽取样本的一种抽样方式。 根据总体单位排列方法,等距抽样可分为两类: 根据总体单位排列方法,等距抽样可分为两类:一是按有关标志排 二是按无关标志排队。 队;二是按无关标志排队。 所谓有关标志就是指与调查问题直接相关的标志。 所谓有关标志就是指与调查问题直接相关的标志。 采用等距抽样法,主要应解决以下两个问题: 采用等距抽样法,主要应解决以下两个问题: 一是要计算抽样间隔, 代表抽样间隔, 代表总体单位数 代表总体单位数, 代 一是要计算抽样间隔,若K代表抽样间隔,N代表总体单位数,n代 代表抽样间隔 表抽取的样本单位数, 表抽取的样本单位数,则K=N / n 。 二是要确定起点样本,即第一个样本。 二是要确定起点样本,即第一个样本。通常的方法可采取在第一组 1-K个样本单位中随机抽取的方法,也可以在第一组 个样本单位中随机抽取的方法, 个样本单位中随机抽取的方法 也可以在第一组1-K个样本单位中采 个样本单位中采 用取中间值的方法,然后,每隔K个单位抽取一个样本 个单位抽取一个样本, 用取中间值的方法,然后,每隔 个单位抽取一个样本,直到抽够样本 为止。 为止。 等距随机抽样方法可以使样本单位均匀地分布在总体的各个部分, 等距随机抽样方法可以使样本单位均匀地分布在总体的各个部分, 因而使样本具有更高的代表性,减少了抽样误差; 因而使样本具有更高的代表性,减少了抽样误差;采用机械顺序抽取样 简单易行,便于操作。但是,在应用等距抽样方法时, 本,简单易行,便于操作。但是,在应用等距抽样方法时,要注意抽样 间隔与现象本身所具有的规律不能重叠,否则,会加大抽样误差。 间隔与现象本身所具有的规律不能重叠,否则,会加大抽样误差。 等距随机抽样方法比较适合于同质性较高的总体。 等距随机抽样方法比较适合于同质性较高的总体。

第六章抽样调查习题答案

第六章抽样调查习题答案

第六章抽样调查习题答案一、单项选择题1、 C2、 A3、 D4、 D5、C6、 D7、 C8、 A9、 D 10、A11、 D 12、 C 13、 B 14、 A 15、A16、 B 17、 B 18、 D 19、 A 20、A21、 A 22、 D 23、 D 24、 B 25、A二、判断题1、 CD2、 AE3、 BCD4、 ABDE5、ABD6、 AB7、 ABCD8、 AC9、 ABCD三、判断题1、×2、√3、√4、√5、√6、×7、√8、×9、√10、√11、× 12、√ 13、√ 14、×15、×16、√ 17、√ 18、×四、填空题1、随机、部分、总体2、计算、控制3、重复、不重复4、大于5、点估计、区间估计6、增加到4倍、减少三分之二、减少四分之三 7、大样本、小样本 8、正、反五、复习思考题1、影响抽样误差的主要因素有哪些?答:影响抽样误差大小的因素主要有:(1)总体单位的标志值的差异程度。

差异程度愈大则抽样误差愈大,反之则愈小。

(2)样本单位数的多少。

在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小。

(3)抽样方法。

抽样方法不同,抽样误差也不相同。

一般说,重复抽样比不重复抽样,误差要大些。

(4)抽样调查的组织形式。

抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度也会影响抽样误差。

2、什么是抽样调查?它有哪些特点?答:抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。

它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。

(1)只抽取总体中的一部分单位进行调查。

(2)用一部分单位的指标数值去推断总体的指标数值(3)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。

统计学第六章抽样调查

统计学第六章抽样调查

n
N
例题2
xf
x
f
8400 200
42
s (x x)2 f 12200 7.81
f
200
2 (1 n ) 7.812 (1 200 ) 0.55
x
n
N
200
2000
例题3
❖某冷库的10万只冻鸡合格率为97%, 如果按重复抽样与不重复抽样各抽 取1000只和2000只,分别计算抽样 平均误差。
A
B
较小的样本容量
X
成数
❖ 总体成数
每个总体单位标志值设为0或1 1:具有某种属性的总体单位标志值 0:不具有某种属性的总体单位标志值 总体中具有某种特征的单位占全部总体单位
数的比例称为总体成数,记作P 成数总体方差:P(1-P)
总体成数和样本成数
❖ 样本成数
从成数总体中抽取样本容量为n的样本 样本中具有此种特征的单位占全部样本单位
从1、2 、3、4中随机抽取2个的样本数
重复抽样考虑顺序
16
1、1 2、1 3、1 4、1
1、2 2、2 3、2 4、2
1、3 2、3 3、3 4、3
1、4 2、4 3、4 4、4
从1、2 、3、4中随机抽取2个的样本数
不重复抽样考虑顺序 12
2、1 3、1 4、1
1、2
3、2 4、2
1、3 2、3
- 2.58x
-1.65 x
+1.65x + 2.58x
x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
区间估计
❖ 根据一个样本的观察值给出总体参数的估计范围 ❖ 给出总体参数落在这一区间的概率 ❖ 例如: 总体均值落在50~70之间,置信度为 95%

2013年第6章 抽样调查

2013年第6章 抽样调查

2.优缺点及适用范围
优点: 与简单随机抽样比,省去了一个个抽样的时间。 能使样本均匀分散在调查总体中,不会集中于某 个层次,样本代表性增强了 缺点:进行排列时需要总体各个单位的详细资 料;总体单位差异较大或排列有规律时,调查 精确度有影响 商场抽每天销售量 适用范围:同质性较高的总体
2.经验法
经验法确定抽样数目的范围 -非随机抽样用
总体 规模 100 以下 100~ 1000 1 000~ 5000 5000~ 10000 10000~ 100000 100000 以上
抽样数 占总体 比重(%)
50以上
50~20
30~10
15~3
5~ 1
1以下
6.3 抽样调查方式
抽样调查方式
2.样本单位是从总体中抽选出来进行调查观察的 单位样本单位数n
(三)指标和标志 指标是总体的数量特征 数量指标,反映总体总规模或总水平,如人口 数,产量,耕地面积。 质量指标,反映总体内在质量,如产品合格率, 劳动生产率等。 标志反映的是总体单位的特征。 品质标志,如人的性别,籍贯等 数量标志,人的年龄,身高,职工工资等
(4)简单随机抽样法的优缺点及适用范围 优点 完全按照随机的原则进行抽样,简单直观 缺点 抽月收入 要有完整样本框 高的 如需编号,总体量大面广则难度较大; 有可能 全被抽到 总体单位差异较大时,样本代表性差; 适用范围 适用于总体单位数不多且差异较小的
(二)等距抽样
1.定义 等距抽样又称机械抽样或系统抽样,它是先将总体 各单位按某一标志排队,并给总体中所有个体编号,然后 抽取一个编号,并按照相同的间隔距离来抽取其他样本单 位。 编号 并根据总体单位数和样本单位数计算出抽样距离(即相 同的间隔),然后按相等的距离或等间隔来抽取样本单位。 L=N/n 标志采取方法可以选择与调查主题相关的或者不相关的 举例:某地区有零售店110户,采用等距抽样抽取11户 如何抽?

第六章 抽样调查

第六章 抽样调查

第六章 抽样调查一、单项选择题1.随机抽样的基本要求是严格遵守( )①准确性原则;②随机原则;③代表性原则;④可靠性原则。

2.抽样调查的主要目的是( )①广泛运用数学的方法; ②计算和控制抽样误差;③修正普查的资料; ④用样本指标来推算总体指标。

3.抽样总体单位亦可称( )①样本; ②单位样本数; ③样本单位; ④总体单位。

4.反映样本指标与总体指标之间抽样误差可能范围的指标是( )①样本平均误差; ②抽样极限误差; ③可靠程度; ④概率程度。

5.在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是( )①抽样单位数占总体单位数的比重很小时;②抽样单位数占总体单位数的比重很大时;③抽样单位数目很少时; ④抽样单位数目很多时。

6.在其他条件不变的情况下,抽样单位数目和抽样误差的关系是( ) ①抽样单位数目越大,抽样误差越大;②抽样单位数目越大,抽样误差越小;③抽样单位数目的变化与抽样误差的数值无关; ④抽样误差变化程度是抽样单位数变动程度的21。

7.用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的( )①2倍; ②3倍; ③4倍; ④5倍。

8.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称为( )①分层抽样;②简单随机抽样;③整群抽样;④等距抽样。

9.全及总体按其各单位标志性质不同,可以分为( )①有限总体和无限总体; ②全及总体和抽样总体;③可列无限总体和不可列无限总体;④变量总体和属性总体。

10.抽样指标是( )①确定性变量; ②随机变量; ③连续变量; ④离散变量。

11.用考虑顺序的重置抽样方法,从4个单位中抽选2个单位组成一个样本,则样本可能数目为( )①1642=; ②10!3!2!5=; ③12!2!4=; ④6!2!2!4=。

12.无偏性是用抽样指标估计总体指标应满足的要求之一,无偏性是指( ) ①样本平均数等于总体平均数; ②样本成数等于总体成数;③抽样指标等于总体指标; ④抽样指标的平均数等于总体指标。

自考“社会调查原理与方法”复习资料第六章

自考“社会调查原理与方法”复习资料第六章

第六章抽样 第⼀节抽样与抽样调查 ⼀、含义: 1.抽样是⼀种选择调查对象的程序和⽅法,即总体中选取⼀部分代表的过程。

2.抽样调查,即从研究对象的总体中选择⼀部分代表加以调查研究,然后⽤所得的结果推论和说明总体特征;始于1891年的⼈⼝调查,关键在于<1>如何判断⼀个样本误差的⼤⼩;<2>怎样才抽到⼀个所要求的精度的样本。

3.选取样本的⽅法包括:<1>依据研究任务的要求和对调查对象的分析,主观地有意识地在研究对象的总体中进⾏选择,即⾮概率抽样;<2>依据概率理论,按照随机原则选择调查对象的程序和⽅法,即概率抽样。

⼆、抽样调查优点: <1>调查费⽤较低;<2>速度快;<3>应⽤范围⼴;<4>可获得内容丰富的资料,抽样调查因调查对象的数⽬远较普查少,因此可以设置较多和较复杂的调查项⽬,并能集中时间和精⼒作详细的分析。

<5>准确性⾼。

2.抽样调查的优点成⽴的依据是:<1>部分含于整体之中;<2>部分与整体有同样的特征;<3>部分能够为研究者提供⼀个有关群体的⽣活、群体态度的更为清晰的脉络。

第⼆节抽样的术语与程序 ⼀、抽样的术语 1.个体与抽样单位:<1>个体是收集信息的基本单位,即分析单位,⼜称为调查对象;<2>信息单位是⼀次抽样当中抽取的单位。

<3>个体与抽样单位在有些研究中是相同的,在进⾏实际抽样时,抽样单位往往是多层次的。

2.研究总体与调查总体:<1>研究总体是在理论上明确界定的个体的集合体。

<2>调查总体是研究者实际抽取样本的个体的集合体。

<3>样本只能推论调查总体⽽不是研究总体——判断P168 3.抽样框——概率抽样需要,⼜称为抽样范畴,是抽取样本的所有抽样单位的名单。

统计学相关 单选题第6章题目及答案

统计学相关 单选题第6章题目及答案

第六章抽样调查题号 1 2 3 4 5 6 7 8 9 10 答案 C B D D D D D C B C 题号11 12 13 14 15 16 17 18 19 20 答案 A C D D B B B B D D 题号21 22 23 24 25 26 27 28 29 30 答案 B C C A A C A C C D 题号31 32 33 34 35 36 37 38 39 40 答案 C B B C C B C D A C 题号41 42 43 44 45 46 47 48 49 50 答案 C C A D D A D B D D 题号81 52 53 54 55 56 57 58 59 60 答案 A B C B A D C B B B 题号61 62 63 64 65 82 67 68 69 70 答案 B B C A C D C A C D 题号83 72 73 74 75 76 77 78 79 80 答案 A A A C A D A B B C 题号84 85 86 87 88 89 90 答案1、抽样调查的主要目的是()A、计算和控制抽样误差B、了解总体单位情况C、用样本指标估计总体指标D、对样本单位作深入的研究2、抽样调查所遵循的基本原则是()A、准确性原则B、随机性原则C、可靠性原则D、灵活性原则3、在抽样推断中,抽样误差是()A、可以避免的B、可避免且可控制C、不可避免且无法控制D、不可避免但可控制4、抽样调查与典型调查的主要区别是()A、所研究的总体不同B、调查对象不同C、调查对象的代表性不同D、调查单位的选取方式不同5、按随机原则抽样即()A、随意抽样B、有意抽样C、无意抽样D、选取样本时要求总体中每个单位都有相等的机会或可能性被抽中6、样本是指()A、任何一个总体B、任何一个被抽中的调查单位C、抽样单元D、由被抽中的调查单位所形成的总体7、抽样框是指()A、总体B、样本C、由总体单位组成的名单或地图D、全部抽样单位组成的名单或地图8、抽样误差是指()A、在调查过程中由于观察、测量等差错所引起的误差B、在调查中违反随机原则出现的系统误差C、随机抽样而产生的代表性误差D、人为原因所造成的误差9、抽样极限误差是()A、随机误差B、一定可靠程度下抽样误差的最大绝对值C、最小抽样误差D、最大抽样误差的绝对值10、反映样本指标与总体指标之间的平均误差程度的指标是()A、抽样误差系数B、概率度C、抽样平均误差D、抽样极限误差11、抽样调查的误差包括()A、登记性误差和代表性误差B、只有登记性误差,没有代表性误差C、没有登记性误差,只有代表性误差D、既没有登记性误差,也没有代表性误差12、抽样平均误差是指样本平均数或样本成数的()A、平均数B、平均差C、标准差D、标准差系数13、抽样平均误差与极限误差的关系是()A、抽样平均误差大于极限误差B、抽样平均误差小于极限误差C、抽样平均误差等于极限误差D、抽样平均误差可能大于、小于或等于极限误差14、下列事件中不属于严格意义上的随机事件的是()。

统计学原理抽样调查

统计学原理抽样调查
第六章 抽样调查
第一节 抽样调查的意义
一、抽样调查的概念
一般所讲的抽样调查,即指狭义的抽样调
查(随机抽样):按照随机原则从总体中抽取 一部分单位进行观察,并运用数理统计的原 理,以被抽取的那部分单位的数量特征为代 表,对总体作出数量上的推断分析。
二、抽样调查的特点
(一)抽样调查的目的是由部分来推断整体。
(三)抽样平均误差计算实例(p270-271)

五户家庭三月份购买某商品的支出: 10元,20元,30元,40元,50元
X 30元 现从五户中抽取二户作调查, 如果为重复抽样(考虑顺序) 52=25(种) 排列组合如下:
抽样平均误差
x
2
n

N N
n 1


2
n
1
n N


n N
很小时,1
n N

接近于1,n2

N N
n 1

2 很接近。
n
四、抽样平均误差的计算
(二)抽样成数的抽样平均误差
重复抽样条件下抽样成数的抽样平均误差
抽样平均误差 p
(三)统计抽样过程(图6-1,p255)
所谓推断,就是用抽样指标来推断全及指标。 一是用抽样平均数 x推断全及平均数 X,从而推断 总体标志总量 二是用抽样成数p推断全及成数P,从而推断总体 单位总量
三、抽样方法和样本可能数目
抽样方法
根据取样的方式不同,抽样方式分为:重复抽样和不重复抽样。
根据对样本的要求不同,抽样方式分为:考虑顺序抽样和不考 虑顺序抽样。
第二节 抽样调查的基本概念及理论依据
一、全及总体和抽样总体
(一) 全及总体,简称总体

抽样调查第6章 整群抽样与系统抽样知识讲解

抽样调查第6章 整群抽样与系统抽样知识讲解
j 1
Y K
2
N0N
K i 1
Yi Y
2
由这个思路无法给出其均方偏差的估计量
系统抽样的效率
与简单随机抽样的比较
(N 1)S 2 N0 (K 1)S外2 (N0 1)KS内2 V (YˆSE ) N(K 1)S 2
V (YˆSYS) N0N(K 1)S外2 N (N 1)S 2 N (N K )S内2 V (YˆSYS) V (YˆSE ) N(N K)(S 2 S内2 )
K 2 1 k 1 K k K K 1 i1
N0 j 1
Yij Y
2 (K, N较大时)
Deff
V (YˆCSE V (Yˆ)
)
1 (N0 1)C
C较大,N0较大时,整群抽样精度差得多
对第一级为简单随机抽样的二阶抽样有
Deff 1 C (n0 1)
整群抽样的设计效应
实际当各群容量不等时,常用 1
V (YˆCSE )
K2 k
1
k K
1 K 1
K i 1
Ni
Yij
j 1
Y K
2
(3)V (YˆCSE )的一个无偏估计量为
v(YˆCSE )
K2 k
1
k K
1 k 1
k i 1
Ni
Yi j
j 1
YˆCSE K
2
目标量的估计
定理6.2 对有放回PPS整群抽样,总体总数Y的估计有
(Ni 1) (Yij Y )2
i 1
j 1
若群内各单元指标均相等,则C达最大值1
群内相关系数是衡量群内单元同质性的一个指标
整群抽样的设计效应
Ni N0 (i 1,2, , K)时

第六章 抽样

第六章 抽样

1、目的性原则
指在进行抽样方案设计时,要以课题研究的总体方案
和研究的目标为依据。 以研究的问题为出发点,从最有利于研究资料的获取, 以及最符合研究的目的等因素来考虑抽样方案和抽样 方法的设计。
2、可测性原则
指的是抽样设计能够从样本自身计算出有效的估计
值或者抽样变动的近似值。在研究中通常用标准误
研究总体:是在理论上明确界定的元素的集合体。 调查总体:是研究者从中实际抽取调查样本的个体的集合体。 它往往是对研究总体的进一步界定,即对时间、范围做更进一 步规定。
元素:则是构成总体的基本单位,是搜集信息的单位和 进行分析的基础。
2、样本
样本就是从总体中按一定方式抽取出的 一部分元素的集合。一个样本就是总体的一 个子集。
当一个总体其内部分层明显时,分层抽样能够克服简 单随机抽样的缺点 ,可以提高总体参数估计值的精 确度。 采用分层抽样的最基本目的,在于把异质性较强的总 体分成若干个同质性较强的子总体,以便提高抽样的 效率,达到更好的抽样效果。 有些研究不仅要了解总体的情形,而且还要了解某些 类别的情形,分层抽样可以同时满足这两个要求,因 为我们可以将每一类(层)看作一个总体。此外,对总 体的不同部分还可以采用不同的抽样方法。
(五)评估样本质量:
样本评估:对样本的质量、代表性、偏差等等进行初 步的检验和衡量,其目的是防止由于样本的偏差过大 而导致调查的失误。 方法:将可得到的反映总体中某些重要特征及其分布 的资料与样本中的同类指标的资料进行对比。
四、抽样设计的原则
目的性原则 可测性原则
可行性原则
经济性原则
例如:我们从2000户家庭的社区,抽取50户进
行消费状况的调查,而2000户家庭的名单是按照家庭

抽样调查-第6章整群抽样

抽样调查-第6章整群抽样

(1 n
f
)Sb2
下面我们看一个整群抽样的例题
返回
【例4.11】 在一次对某中学在校生零花钱的调查
中,以宿舍作为群进行整群抽样,每个宿舍都有M=6 名学生。用简单随机抽样在全部N=315间宿舍中抽取
n=8间宿舍。全部48个学生上周每人的零花钱 yij 及
相关计算数据如下表。试估计该学校学生平均每周
sb2
1 0.0254 86
926 .63 18.81
s( y) v( y ) 18.81 4.34
于是置信度为95%的置信区间为98.17±1.96×4.34, 也即[89.66元,106.68元】
返回
2、整群抽样效率分析
在整群抽样中,由于
V (y) 1 f nM
而样本群内方差为:
sw2
1 n(M 1)
n i 1
M
( yij yi )2
j 1

1 n
n i 1
1 M 1
M
( yij
j 1

yi )2

1 n
n i 1
si2

220.79
返回
由相关系数的估计式有



sb2
sb2 sw2 (M 1)sw2


y

1 n
n i 1
yi

75 89 93.33 8

98.17
sb2

M n 1
n i 1
(yi

y)
6 [(75 98.17)2 (93.33 98.17)2 926.63 8 1
返回
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分群: A群
B群
C群
R=3
取样:
群 数据 均值
A
168,171 172,174
未抽
B
165,170 174,178
171.75
C
173,176 178,172
174.75
173.25
样本第一群
x1 171.75
1 171.75
样本第二群 r =2
x2 174.75
2 174.75
2 (xi x)2
2、等比例分配:n1/N1= n2/N2= … = n/N(全样本)
∵ n/N =0.3 ∴n1/N1=0.3 n1=0.3×N1=0.3 ×3= 0.9
3、最优分配: ni/Ni=i/
∵ 1/ =2.87/8.52=0.34 ∴ n1/N1=0.34 n1=1.02
第六章 区间估计
STAT
第六章 区间估计
STAT
[例]10人年龄资料如下。N=10 n=3。
人: A B C D E F G H I J
年龄:5 8 12 40 42 46 48 70 72 76
分类: N1=3
N2=4
N3=3 N=10
1=2.87
2=3.16
3=2.49 =8.52
n1=?
n2=?
n3=?
n=3
1、等额分配:n1= n2= n3= 1
1、的估计
(1)全样本平均数:x xi ni n
(2)平均组内方差: i2
si2
si2 ni n
x
2 i
n
2、P的估计
(1)全样本比例:pˆ pˆ i ni n

(2)平均组内方差:P(1 P) pˆ i (1 pˆ i )ni n
P(1 P) n
第六章 区间估计
STAT
[例]某厂有甲、乙两车间生产保温瓶,乙产量是甲的2倍。 现按产量比例共抽查了60支,结果甲车间平均保温时间为 25小时,标准差1.2小时;乙车间为28小时和0.8小时。试以 95.45%的置信水平推断总体平均保温时间的可能范围。
要求 : x x
则 x Z x
2
x
n
x Z
2
n
两边平方
2x
Z 2
n
2
公式 n Z 2 2
2x
注:影响样本容量的因素
类型抽样
2 i
第六章 区间估计
STAT
(2)不重复抽样
x Zx
2
x
n
1
n N
x
Z
2
n
1 n N
两边平方
2x
Z 2 2
n
1
n N
Z 2 2
n
nZ 2 2
2

P(1 P)
n
pˆ Z
2
P(1 P) n
两边平方
2pˆ
Z2 P(1 n
P)
n
Z2 P(1 2pˆ
P)
(公式)
(2)不重复抽样
用 pˆ 替代x
P(1 P)替代 2
n NZ2 2 NZ2 P(1 P) (公式) N2x Z2 2 N2pˆ Z2 P(1 P)
第六章 区间估计
rM
r
(2)组间方差:
2 p
( pˆ i pˆ )2 r 1

2 p
R
r
r R 1
第六章 区间估计
STAT
[例]某乡播种某种农作物3000亩,分布在60块地段上,每块 地段50亩。现抽取5块地,其平均亩产为8.25、9.50、8.50、 9.00和8.75百斤;受灾面积为2.0、1.6、1.4、1.9和2.1%。要 求以95%的置信水平估计其平均亩产及受灾面积的区间。
STAT
二、整群抽样(cluster sampling,集团抽样)
(一)抽样方法(P128、168)
1、按某种标志或要求将总体区分为若干群(R),群内单位 数(M)相等;
2、采取不重复抽样方式从R群随机抽出r群,尔后对样本群 进行全面调查以推断总体。
[例]某连某班12名士兵的身高资料如下
168, 171, 172, 174; 165, 170, 174, 178; 173, 176, 178, 172
样本第二群 r =2
x 0.67
x1 171.75
1 171.75
x2 174.75
2 174.75
全样本平均数 x
xi M rM
171 .75 4 174 .75 4 24
173 .25
总体平均数
168
171 172 174 12
172
172 .58
x1
x2
1 2
0 0
群内无误差
原因总群体内各单群位
抽样调查 全面调查
第六章 区间估计
STAT
168, 171, 172, 174, 165, 170, 174, 178; 173, 176, 178, 172
分群: A群
B群
C群
R=3
取样:
样本第一群
x1 171.75
1 171.75
样本第二群 r =2
n1
20, n2
40, x1
25, x2
28, s12
1.44,
s
2 2
0.64
x xi ni 25 20 28 40 2( 7 小时)
n
60
(x x )
si2
si2ni n
1.44 20 0.64 40 0.91 60
(26.76,27.24)
x
2 i
n
si2 n
0.12 x
Nn
2x
Z 2 2
n
Z 2 2
N
2x
Z 2 2
N
Z 2 2
n
N2x Z 2 2 Z 2 2
N
n
N
n
N2x Z 2 2 Z 2 2
公式 n NZ 2 2 N2x Z 2 2
整群抽样 2
N R,n r
第六章 区间估计
STAT
2、估计P时,n的确定 (1)重复抽样
pˆ Z pˆ
(三)抽样标准差的计算
[例]10人年龄资料如下。N=10n=6,推断总体平均年龄。 人: A B C D E F G H I J
年龄:5 8 12 40 42 46 48 70 72 76
取样: (5,8) x1 6.5
1 8.33
(42,46) x2 44
2 44
(72,76) x3 74
取样: (5,8) x1 6.5
(42,46) x2 44
(72,76) x3 74
s12 4.5
s22 8
s32 8
总方差
2
组间方差
2
平均组内方差
2 i
x
n
2
n
2
2 i
n
2 i
n
总体:
2 i
2 i
N
i
N
样本:si2
si2 ni n
第六章 区间估计
STAT
(四)区间估计(与SRS样本的不同点)
3 72.67
x 6.5 2 44 2 41.5 6
组内误差: x1 1 1.83 误差产生原因:
5 8 12 40 41.9
10
1、总体各类全面调查 2、组内单位抽样调查
第六章 区间估计
STAT
人: A B C D E F G H I J
年龄:5 8 12 40 42 46 48 70 72 76
第六章 区间估计
STAT
(2)按有关标志排队 A、职工家庭生活水平调查:按职工的工资水平排队; B、耕地农产量调查:按往年平均亩产的高低进行排队。 (二)区间估计:按SRS样本推断。
第六章 区间估计
STAT
第四节 必要样本容量的确定
一、必要样本容量
1、决定样本容量的因素
2、必要样本容量:在估计精度(费用限制)的前提下,必
r
5
2 p
( pˆ i pˆ )2 r 1
(2% 2%)2
(2.1% 2%)2 5 1
0.0000085

2 p
R
r
r R 1
0.0000085 60 5 0.126% 5 60 1
pˆ Z pˆ 1.96 0.126 % 0.25% ( pˆ pˆ ) (1.75%,2.25%)
x2 174.75
2 174.75
总方差
2
组间方差 2
平均组内方差
2 i
x
n
N n 2
N 1 n
Nn N 1
2
2 i
r
Rr
2 Rr
R 1 r R 1
总体: 2 (i )2 M 样本:(xi x)2
RM
r 1
第六章 区间估计
STAT
[例]某连某班士兵的身高资料如下
168, 171, 172, 174, 165, 170, 174, 178, 173, 176, 178, 172
分群: A群
B群
C群
R=3
取样:
样本第一群 样本第二群 r =2
调查:
全面调查
全面调查 M=4
第六章 区间估计
STAT
(二)抽样标准差的计算
168, 171, 172, 174, 165, 170, 174, 178; 173, 176, 178, 172
分群: A群
B群
C群
R=3
取样:
样本第一群
相关文档
最新文档