第六章-抽样调查
自考-市场调查与预测-第6章-抽样方法
1 定义总体 确定调查对象全体:从抽样元素、抽样 单位、抽样范围、抽样时间角度考虑 例如…
2 确定抽样框架 抽样总体中,抽样元素的表现形式。总体中 的每一个元素都在抽样框架中出现一次,且 仅出现一次。如户籍簿。 适用性、完整性。 3 确定抽样单位 容纳总体的基本单位,大于等于样本元素。 取决于抽样框架和调查方法。 电话调查——电话号码 邮寄调查——地址或姓名
B 平均值估计 C 百分比估计样本容量
根据允许误差大小估计样本量
不同抽样方法样本容量的确定 影响因素: 调查目的;总体大小;总体构成;抽样方式 计算公式:见表6-4
其它调查方法介绍
2、自愿样本
被调查者自愿参加,成为样本中的一分子,向
调查人员提供有关信息
–
例如,参与报刊上和互联网上刊登的调查问
第6章 抽样方法
普查与抽样调查 抽样程序
常用抽样方法
样本容量的确定
6.1普查与抽样调查
抽样设计的重要性 案例6-1 普查的相关概念和案例 P159 抽样调查的概念 抽样是通过抽取总体中的部分单位,收集 这些单位的信息,从而对总体进行推断的 一种手段。 抽样调查的含义 P163 抽样调查的适用范围
第一节 抽样方法
6.3 常用抽样方法
1 简单随机抽样 2 分层随机抽样 3 分群随机抽样 4 等距随机抽样 5 任意抽样 6 判断抽样 7 配额抽样 8 滚雪球抽样
1 简单随机抽样 1、抽样方法 根据研究目的选定总体,首先对总体中所 有的观察单位编号,遵循随机原则,采用不放 回抽取方法,从总体中随机抽取一定数量观察 单位组成样本。 2、具体方法 ①抽签法
统计学第六章抽样调查
Part
05
系统抽样技术
系统抽样原理及步骤
• 系统抽样原理:系统抽样是一种等距抽样方法,它首先确定一个抽样间隔,然后在总体中按照这个间隔进行抽 样。这种方法适用于总体单位排列有序且周期性变化的情况。
系统抽样原理及步骤
01
系统抽样步骤
02
确定总体范围和抽样框;
03
计算抽样间隔,确定样本量;
系统抽样原理及步骤
01
03 02
分层标准选择与确定方法
• 以调查对象的某些自然特征或社会特征作 为分层标准。
分层标准选择与确定方法
专家判断法
依靠专家经验判断选择合 适的分层标准。
数据分析法
通过对历史数据或相关数据的 分析,找出影响调查指标的主 要因素,作为分层标准。
试验法
通过试验确定不同分层标准 对调查结果的影响程度,选 择最优的分层标准。
缺点
由于样本可能被重复抽取,导致样本的代表性降 低。
缺点
操作相对复杂,需要记录已经抽取过的样本。
简单随机抽样优缺点分析
操作简单
简单随机抽样的操作过程相对简单,易于理解和实施。
等概率原则
保证了每个单位被抽中的机会相等,避免 具有代表性:当样本量足够大时,简单随机抽样可以获得具有代表性的样本。
整群抽样优缺点比较
• 适用于某些特定情况:对于某些总体分布不均匀或难以划分的情况,整群抽样 可能更为适用。
整群抽样优缺点比较
抽样误差较大
01
由于是以群为单位进行抽样,可能导致抽样误差较大。
样本代表性不足
02
如果群的划分不合理或随机性不足,可能导致样本代表性不足。
对群内个体差异考虑不足
03
市场调查-第六章抽样技术
N = 721, n = 10, 721/10≈72
K =
用随机数表法,如果第一个确定的数字为102,则 各样本单元编号依次为:102,174,246,318, 390,462,534,606,678,29。其中最后一个编 号应为678 + 72 = 750。因大于N,故减去721,实 际编号取为750- 721 = 29。
多级随机抽样是先把总体划分为 若干一级单元,再把各个一级单 元划分为若干个二级单元,直至 不再划分的个体单元。在抽样时, 先用简单随机抽样方法抽取部分 一级单元,再在抽中的一级单元 中抽取部分二级单元,依次操作, 直到抽得个体单元为止。
多级随机抽样——demo
我国城市住户调查采用的就是多 级抽样,先从全国各城市中抽取 若干城市,再在城市中抽选街道, 然后在各街道中抽选居民会,最 后在各居委会中抽选居民户。
低收入 20%
高收入 20%
中收入 60%
高收入 中收入 低收入
分层比例抽样法
高收入层抽取的样本单元数为: 200×20%=40(户) 中收入层抽取的样本单元数为: 200×60%=120(户) 低收入层抽取的样本单元数为: 200×20%=40(户)
在各层抽样时,只需采 用简单随机抽样法即可。
2、分层最佳抽样法
二、分层随机抽样
分层随机抽样是先将总体所有单位按 某一重要标志进行分层(类),然后在 各层(类)中采用简单随机抽样方式抽 取样本单位的一种抽样技术形式。在 划分层次时应注意,各层次内部保持 确定的同质性,而各层次之间又应有 明显的异质性。
分层比例抽样法 分层最佳抽样法
1、分层比例抽样法
分层比例抽样法,指各层 抽取的样本单元数是按各 层单元数占总体单元数的 比例加以确定。
第六章抽样调查习题答案
第六章抽样调查习题答案一、单项选择题1、 C2、 A3、 D4、 D5、C6、 D7、 C8、 A9、 D 10、A11、 D 12、C 13、B 14、 A 15、A16、 B 17、 B 18、D 19、 A 20、A21、 A 22、 D 23、 D 24、 B 25、A二、判断题1、CD2、AE3、BCD4、ABDE5、ABD6、AB7、ABCD8、AC9、ABCD三、判断题1、×2、√3、√4、√5、√6、×7、√8、×9、√10、√11、×12、√13、√14、×15、×16、√17、√18、×四、填空题1、随机、部分、总体2、计算、控制3、重复、不重复4、大于5、点估计、区间估计6、增加到4倍、减少三分之二、减少四分之三7、大样本、小样本8、正、反五、复习思考题1、影响抽样误差的主要因素有哪些?答:影响抽样误差大小的因素主要有:(1)总体单位的标志值的差异程度。
差异程度愈大则抽样误差愈大,反之则愈小。
(2)样本单位数的多少。
在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小。
(3)抽样方法。
抽样方法不同,抽样误差也不相同。
一般说,重复抽样比不重复抽样,误差要大些。
(4)抽样调查的组织形式。
抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度也会影响抽样误差。
2、什么是抽样调查?它有哪些特点?答:抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。
它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。
(1)只抽取总体中的一部分单位进行调查。
(2)用一部分单位的指标数值去推断总体的指标数值(3)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。
统计学原理-第六章 抽样调查(复旦大学第六版)
2.样本总体:简称样本,是从全及总体中随机
抽取出来,代表全及总体部分单 位的集合体。单位数用n表示。
5
二.全及指标和抽样指标
(一)全及指标
X 总体平均数: X N 总体成数:P
2
XF 或X F Q=
2 2
N1 N N
(X-X) 总体方差: = 总体标准差:= (X-X)
(一)考虑顺序的不重复抽样数目
N! A N ( N 1)(N 2) ( N n 1) ( N n)! 4 3 2 1 2 例如A4 12 2 1
n N
(二)考虑顺序的重复抽样数目
B N
n N 2 4
n 2
例如 B 4 16
10
(三)不考虑顺序的不重复抽样数目
Ex X
28
2、一致性 当抽样单位数充分大时,抽样指标和未知 的总体指标之间的绝对离差为任意小的可能性 也趋于必然性。
x X 任意小
3、有效性
即用抽样指标估计总体指标,要求作为优良估 计量方差应该比其他估计量的方差小。
2
x X f
2
f
2
x X f
x
x E ( x)
2
18
说明:根据数理统计理论,在重复抽样条件下, 抽样平均误差与全及总体的标准差成正比例关系。 与抽样总体单位平方根成反比关系。
19
在不重复抽样情况下,抽样平均误差计算公式如下:
x x
N n 250 4-2 ( )= ( ) =9.13(件) n N 1 2 4-1
2
N
X X F 或 F X X F 或 F
第六章抽样调查练习及答案
第 六章 抽样调查一、填空题1.抽选样本单位时要遵守 原则,使样本单位被抽中的机会 。
2.常用的总体指标有 、 、 。
3.在抽样估计中,样本指标又称为 量,总体指标又称为 。
4.全及总体标志变异程度越大,抽样误差就 ;全及总体标志变异程度越小,抽样误差 。
5.抽样估计的方法有 和 两种。
6.整群抽样是对被抽中群内的 进行 的抽样组织方式。
7.误差分为 和代表性误差;代表性误差分为________和偏差;偏差是____________________________,也称为________________。
8.简单随机抽样的成数抽样平均误差计算公式是:重复抽样条件下: ;不重复抽样条件下: 。
9.误差范围△,概率度t 和抽样平均误差μ之间的关系表达式为 。
10.抽样调查的组织形式有: 。
二、单项选择题1.所谓大样本是指样本单位数在( )及以上A 30个B 50个C 80个 D100个2.抽样指标与总体指标之间抽样误差的可能范围是( )A 抽样平均误差B 抽样极限误差C 区间估计范围D 置信区间3.抽样平均误差说明抽样指标与总体指标之间的( )A 实际误差B 平均误差C 实际误差的平方D 允许误差4.是非标志方差的计算公式( )A P(1-P)B P(1-P)2C )1(P P -D P 2(1-P)5.总体平均数和样本平均数之间的关系是( )A 总体平均数是确定值,样本平均数是随机变量B 总体平均数是随机变量,样本平均数是确定值C两者都是随机变量 D两者都是确定值6.对入库的一批产品抽检10件,其中有9件合格,可以( )概率保证合格率不低于80%。
A 95.45%B 99.7396C 68.27%D 90%7.在简单随机重复抽样情况下,若要求允许误差为原来的2/3,则样本容量( )A 扩大为原来的3倍B 扩大为原来的2/3倍C 扩大为原来的4/9倍D 扩大为原来的2.25倍8.根据抽样调查得知:甲企业一等品产品比重为30%,乙企业一等品比重为50%一等品产品比重的抽样平均误差为 ( )A 甲企业大B 两企业相同C 乙企业大D 无法判断9.是非标志的平均数是( )A -P)1P(B P(1-P)C pD (1-P)210.重复抽样的误差一定( )不重复抽样的误差。
第六章 抽样调查
第六章抽样调查第一节抽样调查的意义及全然概念一、抽样调查的意义抽样调查(随机抽样):按照随机原那么从总体中抽取一局部单位进行瞧瞧,并运用数理统计的原理,以被抽取的那局部单位的数量特征为代表,对总体作出数量上的推断分析。
二、抽样调查的适用范围抽样调查方法是市场经济国家在调查方法上的必定选择,和普查相比,它具有正确度高、本钞票低、速度快、应用面广等优点。
一般适用于以下范围:1.实际工作不可能进行全面调查瞧瞧,而又需要了解其全面资料的事物;2.虽可进行全面调查瞧瞧,但比立困难或并不必要;3.对普查或全面调查统计资料的质量进行检查和修正;4.抽样方法适用于对大量现象的瞧瞧,即组成事物总体的单位数量较多的情况;5.利用抽样推断的方法,能够关于某种总体的假设进行检验,判定这种假设的真伪,以决定取舍。
三、抽样调查的全然概念(一)全及总体和抽样总体(总体和样本)全及总体:所要调查瞧瞧的全部事物。
总体单位数用N表示。
抽样总体:抽取出来调查瞧瞧的单位。
抽样总体的单位数用n表示。
n≥30大样本n<30小样本(二)全及指标和抽样指标(总体指标和样本指标)全及指标:全及总体的那些指标。
抽样指标:抽样总体的那些指标。
第二节抽样调查的组织形式通常有以下四种组织形式:一、简单随机抽样(纯随机抽样)即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。
随机抽选可有各种不同的具体做法,如:1.直截了当抽选法;2.抽签法;3.随机数码表法;二、类型抽样(分类抽样)先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原那么抽取样本,组成一个总的样本。
类型的划分:一是必须有清楚的划类界限;二是必须明白各类中的单位数目和比例;三是分类型的数目不宜太多。
类型抽样的好处是:样本代表性高、抽样误差小、抽样调查本钞票较低。
要是抽样误差的要求相同的话那么抽样数目能够减少。
两种类型:1.等比例类型抽样(类型比例抽样);2.不等比例类型抽样(类型适宜抽样)。
第六章抽样调查习题答案
第六章抽样调查习题答案一、单项选择题1、 C2、 A3、 D4、 D5、C6、 D7、 C8、 A9、 D 10、A11、 D 12、 C 13、 B 14、 A 15、A16、 B 17、 B 18、 D 19、 A 20、A21、 A 22、 D 23、 D 24、 B 25、A二、判断题1、 CD2、 AE3、 BCD4、 ABDE5、ABD6、 AB7、 ABCD8、 AC9、 ABCD三、判断题1、×2、√3、√4、√5、√6、×7、√8、×9、√10、√11、× 12、√ 13、√ 14、×15、×16、√ 17、√ 18、×四、填空题1、随机、部分、总体2、计算、控制3、重复、不重复4、大于5、点估计、区间估计6、增加到4倍、减少三分之二、减少四分之三 7、大样本、小样本 8、正、反五、复习思考题1、影响抽样误差的主要因素有哪些?答:影响抽样误差大小的因素主要有:(1)总体单位的标志值的差异程度。
差异程度愈大则抽样误差愈大,反之则愈小。
(2)样本单位数的多少。
在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小。
(3)抽样方法。
抽样方法不同,抽样误差也不相同。
一般说,重复抽样比不重复抽样,误差要大些。
(4)抽样调查的组织形式。
抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度也会影响抽样误差。
2、什么是抽样调查?它有哪些特点?答:抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。
它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。
(1)只抽取总体中的一部分单位进行调查。
(2)用一部分单位的指标数值去推断总体的指标数值(3)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。
统计学课件第六章抽样调查PPT课件
特点
每个样本被选中的机会都 相等,样本的代表性相对 较好。
分层抽样
定义
先将总体按一定标准分成 若干层次或群,然后从各 层或群中按随机原则抽取 样本。
方法
分类抽样、比例抽样、类 型抽样。
特点
能够提高样本的代表性, 降低误差,减少资源浪费。
系统抽样
定义
先将总体中的所有个体按某种顺序排列,然后按 照固定的间隔或系统选取样本。
改进抽样方法
采用更科学的抽样方法和技术,如分层抽样、系统抽样等,以提 高样本的代表性。
提高样本代表性
在抽样过程中尽量减少非随机误差,如无回答、不完整数据等, 以提高样本对总体的代表性。
05 抽样调查的组织与实施
抽样调查的设计
确定调查目的
明确调查的目标和意图,为后 续的抽样设计提供指导。
确定调查对象
合理安排问题的顺序、布局和格式,以提高 问卷的易用性和回答率。
确定调查方式
选择合适的调查方式,如自填式、面访式等, 并确定数据收集的途径。
测试与修正
对问卷进行测试和修正,确保问卷的准确性 和可靠性。
调查的实施与质量控制
培训调查员
对调查员进行培训,确保他们了解调 查目的、问卷内容、调查方法等。
现场实施
将总体分成若干个群集或组,然后从每个 群集或组中抽取一定数量的样本,也称为 簇抽样或组抽样。
抽样调查的应用场景
01
02
03
04
市场调查
通过对目标市场的部分消费者 进行调查,了解市场需求、消 费者行为和产品反馈等信息。
社会调查
通过对一定范围内的社会成员 进行调查,了解社会现象、人 口状况和社会问题等信息。
统计学课件第六章抽样调查ppt课 件
第六章 抽样调查
第六章 抽样调查一、单项选择题1.随机抽样的基本要求是严格遵守( )①准确性原则;②随机原则;③代表性原则;④可靠性原则。
2.抽样调查的主要目的是( )①广泛运用数学的方法; ②计算和控制抽样误差;③修正普查的资料; ④用样本指标来推算总体指标。
3.抽样总体单位亦可称( )①样本; ②单位样本数; ③样本单位; ④总体单位。
4.反映样本指标与总体指标之间抽样误差可能范围的指标是( )①样本平均误差; ②抽样极限误差; ③可靠程度; ④概率程度。
5.在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是( )①抽样单位数占总体单位数的比重很小时;②抽样单位数占总体单位数的比重很大时;③抽样单位数目很少时; ④抽样单位数目很多时。
6.在其他条件不变的情况下,抽样单位数目和抽样误差的关系是( ) ①抽样单位数目越大,抽样误差越大;②抽样单位数目越大,抽样误差越小;③抽样单位数目的变化与抽样误差的数值无关; ④抽样误差变化程度是抽样单位数变动程度的21。
7.用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的( )①2倍; ②3倍; ③4倍; ④5倍。
8.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称为( )①分层抽样;②简单随机抽样;③整群抽样;④等距抽样。
9.全及总体按其各单位标志性质不同,可以分为( )①有限总体和无限总体; ②全及总体和抽样总体;③可列无限总体和不可列无限总体;④变量总体和属性总体。
10.抽样指标是( )①确定性变量; ②随机变量; ③连续变量; ④离散变量。
11.用考虑顺序的重置抽样方法,从4个单位中抽选2个单位组成一个样本,则样本可能数目为( )①1642=; ②10!3!2!5=; ③12!2!4=; ④6!2!2!4=。
12.无偏性是用抽样指标估计总体指标应满足的要求之一,无偏性是指( ) ①样本平均数等于总体平均数; ②样本成数等于总体成数;③抽样指标等于总体指标; ④抽样指标的平均数等于总体指标。
市场调研与预测第六章 抽样
分层随机抽样技术及其应用
注意:分层时要注意各层之间要有明显的差异, 不致发生混淆;要知道各层中的单位数目和比 例;分层的数目不宜太多,每个层次内每个个 体应保持一致性等。 分层抽样具体形式:等比例分层抽样、非比例 分层抽样
分群随机抽样技术及其应用
运用分群抽样技术抽取样本,先把调查总体区分 为若干个群体,然后用单纯随机抽样法,从中抽 取某些群体进行全面抽查。 如果不是对所抽取的群体进行全面抽查,而是进 一步划分为若干个小群体,再按随机原则抽取一 个或一部分小群体来调查,称为多段分群抽样。 运用分群抽样技术抽取样本,抽选工作比较简易 方便,抽中的单位比较集中,但是由于样本单位 集中在某些群体,而不能均匀分布在总体中的单 位,若群与群的差异较大,抽样误差会增大。
随机抽样
随机抽样又称为概率抽样,是对总体中每一个 体给予平等的抽取机会的抽样技术。 随机抽样的类别: 随机抽样的类别: (1)简单随机抽样:是在总体单位中不进行 任何有目的的选择,按随机原则,纯粹偶然的 方法抽取样本的技术。 (2)分层随机抽样:把调查总体按其属性不 同分为若干层次,然后在各层中随机抽取样本 的技术。
随机抽样的类别
(3)分群随机抽样:是把调查总体区分为若 干个群体,然后用单纯随机抽样法,从中抽取 某些群体进行全面调查的技术 (4)系统随机抽样:在总体中先按一定标志 顺序排列,并根据总体单位数量和样本单位数 计算出抽样距离,然后按相同的距离或间隔抽 选样本单位的技术
随机抽样的优点和不足
优点: 优点: 1.调查范围和工作量比较小,又排除了认为的干扰, 能省时、省力、省费用。 2.随机抽样能够计算调查结果的可靠程度。 不足: 不足: 1.对所有调查样本都给予平等看待,难以体现重点。 2.抽样范围广,所需时间长,参加调查的人员和费 用多。 3.需要具有一定专业技术的专业人员进行抽样和资 料分析。
自考“社会调查原理与方法”复习资料第六章
第六章抽样 第⼀节抽样与抽样调查 ⼀、含义: 1.抽样是⼀种选择调查对象的程序和⽅法,即总体中选取⼀部分代表的过程。
2.抽样调查,即从研究对象的总体中选择⼀部分代表加以调查研究,然后⽤所得的结果推论和说明总体特征;始于1891年的⼈⼝调查,关键在于<1>如何判断⼀个样本误差的⼤⼩;<2>怎样才抽到⼀个所要求的精度的样本。
3.选取样本的⽅法包括:<1>依据研究任务的要求和对调查对象的分析,主观地有意识地在研究对象的总体中进⾏选择,即⾮概率抽样;<2>依据概率理论,按照随机原则选择调查对象的程序和⽅法,即概率抽样。
⼆、抽样调查优点: <1>调查费⽤较低;<2>速度快;<3>应⽤范围⼴;<4>可获得内容丰富的资料,抽样调查因调查对象的数⽬远较普查少,因此可以设置较多和较复杂的调查项⽬,并能集中时间和精⼒作详细的分析。
<5>准确性⾼。
2.抽样调查的优点成⽴的依据是:<1>部分含于整体之中;<2>部分与整体有同样的特征;<3>部分能够为研究者提供⼀个有关群体的⽣活、群体态度的更为清晰的脉络。
第⼆节抽样的术语与程序 ⼀、抽样的术语 1.个体与抽样单位:<1>个体是收集信息的基本单位,即分析单位,⼜称为调查对象;<2>信息单位是⼀次抽样当中抽取的单位。
<3>个体与抽样单位在有些研究中是相同的,在进⾏实际抽样时,抽样单位往往是多层次的。
2.研究总体与调查总体:<1>研究总体是在理论上明确界定的个体的集合体。
<2>调查总体是研究者实际抽取样本的个体的集合体。
<3>样本只能推论调查总体⽽不是研究总体——判断P168 3.抽样框——概率抽样需要,⼜称为抽样范畴,是抽取样本的所有抽样单位的名单。
第六章 抽样
例:以某高校6000名在校大学生为总体:
抽样1:按一定方式抽取300名大学生作样本;
抽样2:按一定方式抽取10个班作样本;
分析:两种抽样方式下的抽样单位和抽样框
(四)抽样框sample frame
一次直接抽样时总体中所有元素的名单。 抽样框是抽样操作依据的名单,是和调查的总体相 对应的
究总体的操作化界定,规定了调查对象选择的具体指标。
• 目标总体和调查总体吻合度越高,调查的代表性就越好;否则会
产生覆盖误差。
(二)制定抽样框
1.抽样框是对研究总体的进一步操作。
2.抽样框的意义
(1)抽样框与研究/调查总体之间可能不匹配,可能包含研 究总体之外的某些人,或可能遗漏其中的某些人. (2) 根据样本所得到的结果,只能代表组成抽样框的各个 要素的集合 (3) 样本的大小(规模)与其能否正确代表总体比较起 来,是一项不太重要的因素。
(五)参数值——又称总体值,是关于总体中某一变量的 的综合描述,或者说是总体中所有元素的某种特征的综 合数量表现。 –参数值只有对总体中每一个元素都进行调查或测量才 能得到。 (六)统计值——又称样本值,是关于样本中某一变量的 综合描述,或者说是样本中所有元素的某种特征的综合 数量表现。 –统计值是从样本中计算出来的,它是相应的参数值的 估计量。
一、简单随机抽样
(一)定义
又称纯随机抽样,是概率抽样的最基 本形式。 它是按等概率原则,直接从含有N个 元素的总体中随机抽取n个元素组成样本 (N>n)。
(二)选取样本的两种办法
1.抽签方式 (1)将总体名单从1到N编号,形成抽样框; (2)准备N张卡片,每张卡片上的号码与总体 名单编号对应,将卡片放在盒子里,混合均匀; (3)根据抽样设计的样本规模,从盒内n次取 出n张卡片; (4)根据取出的卡片上的号码,找到总体名单 上对应的元素,构成样本。
统计学相关 单选题第6章题目及答案
第六章抽样调查题号 1 2 3 4 5 6 7 8 9 10 答案 C B D D D D D C B C 题号11 12 13 14 15 16 17 18 19 20 答案 A C D D B B B B D D 题号21 22 23 24 25 26 27 28 29 30 答案 B C C A A C A C C D 题号31 32 33 34 35 36 37 38 39 40 答案 C B B C C B C D A C 题号41 42 43 44 45 46 47 48 49 50 答案 C C A D D A D B D D 题号81 52 53 54 55 56 57 58 59 60 答案 A B C B A D C B B B 题号61 62 63 64 65 82 67 68 69 70 答案 B B C A C D C A C D 题号83 72 73 74 75 76 77 78 79 80 答案 A A A C A D A B B C 题号84 85 86 87 88 89 90 答案1、抽样调查的主要目的是()A、计算和控制抽样误差B、了解总体单位情况C、用样本指标估计总体指标D、对样本单位作深入的研究2、抽样调查所遵循的基本原则是()A、准确性原则B、随机性原则C、可靠性原则D、灵活性原则3、在抽样推断中,抽样误差是()A、可以避免的B、可避免且可控制C、不可避免且无法控制D、不可避免但可控制4、抽样调查与典型调查的主要区别是()A、所研究的总体不同B、调查对象不同C、调查对象的代表性不同D、调查单位的选取方式不同5、按随机原则抽样即()A、随意抽样B、有意抽样C、无意抽样D、选取样本时要求总体中每个单位都有相等的机会或可能性被抽中6、样本是指()A、任何一个总体B、任何一个被抽中的调查单位C、抽样单元D、由被抽中的调查单位所形成的总体7、抽样框是指()A、总体B、样本C、由总体单位组成的名单或地图D、全部抽样单位组成的名单或地图8、抽样误差是指()A、在调查过程中由于观察、测量等差错所引起的误差B、在调查中违反随机原则出现的系统误差C、随机抽样而产生的代表性误差D、人为原因所造成的误差9、抽样极限误差是()A、随机误差B、一定可靠程度下抽样误差的最大绝对值C、最小抽样误差D、最大抽样误差的绝对值10、反映样本指标与总体指标之间的平均误差程度的指标是()A、抽样误差系数B、概率度C、抽样平均误差D、抽样极限误差11、抽样调查的误差包括()A、登记性误差和代表性误差B、只有登记性误差,没有代表性误差C、没有登记性误差,只有代表性误差D、既没有登记性误差,也没有代表性误差12、抽样平均误差是指样本平均数或样本成数的()A、平均数B、平均差C、标准差D、标准差系数13、抽样平均误差与极限误差的关系是()A、抽样平均误差大于极限误差B、抽样平均误差小于极限误差C、抽样平均误差等于极限误差D、抽样平均误差可能大于、小于或等于极限误差14、下列事件中不属于严格意义上的随机事件的是()。
统计基础第六章
(一)全及总体和样本总体
1.全及总体:简称总体或母体, 指所要调查研究对象的全体。
2.样本总体:简称样本或子样,指在 全及总体中按随机原则抽取的那部分 单位所构成的集合体。
(二)全及指标和样本指标
1.全及指标:也称母体参数,反 映总体某种属性的综合指标。
总体 N
2.样本指标:也称样本统计量 或抽样指标,反映抽样总体综合指标。
一、样本容量的影响因素
1
总体各单位之间
9 % 0 2 .6 % 8 P 9 % 0 2 .6 % 8
( 9 % 0 2 .6 % 8 1)0 0 N 0 ( P 9 % 0 0 2 0 .6 % 8 1)000
该地有两台以上彩电8 的7用3 户2N0 数P 在9287638200户到92680户之间 。
第四节 样本容量的确定
组成总体的各研究对象称之为总体单位。用N表示
样本总体
样本总体又称子样,简称样本它是由从总体 中按一定程序抽选出来的那部分总体单位所 作成的集合。
n3,0称为大 ;n样 3,0称 本为小 . 样本
全及总体是唯一确定的,而样本总体是随机的。
(二)全及指标和样本指标 1.全及指标。全及指标是根据全及总体各单位
第六章 抽样调查
本章相关内容
第一节 抽样调查的意义和作用 第二节 抽样误差 第三节 抽样推断 第四节 必要抽样数目的确定
目标要求
能力(技能)目标
知识目标
熟练运用抽样估计的一 般原理推断全及总体的
掌握随机抽样的涵义;
指标;
掌握抽样调查方法;
熟练运用抽样估计原理 进行区间估计;
掌握抽样平均误差的计算 方法;
如何衡量总体指标落在误差范围内的概率大小呢?
统计学第六章抽样调查
标 差 总 标 差 、 本 准 s 准 : 体 准 σ 样 标 差
总体参数和样本统计量符号
总体指标符号 总体容量: N 总体平均数: µ 总体成数: P 总体方差: σ2 总体标准差: σ 样本指标符号 样本容量: n 样本平均数: x 样本成数: p 样本方差: S2 样本标准差: S
抽样组织形式
抽样估计效果好坏,关键是抽样平均误差的 抽样估计效果好坏,关键是抽样平均误差的 抽样平均误差 控制。抽样平均误差小, 控制。抽样平均误差小,抽样效果从整体上 看就是好的;否则,抽样效果就不理想。 看就是好的;否则,抽样效果就不理想。 抽样平均误差受以下几方面的因素影响: 抽样平均误差受以下几方面的因素影响:
抽样调查的基本概念 抽样调查的基本概念 重复抽样和不重复抽样
重复抽样:又称有放回的抽样 有放回的抽样,从总体中 重复抽样 有放回的抽样 抽取样本时,每次被抽中的单位都再被 放回总体中参与下一次抽样。 不重复抽样:又称无放回的抽样 无放回的抽样,总体中 不重复抽样 无放回的抽样 随机抽选的单位经观察后不放回到总体 中,即不再参加下次抽样。
µ ( p) =
P (1 − P ) n
不重复抽样条件下: 不重复抽样条件下: 条件下
µ ( p) =
P (1 − P ) n (1 − ) n N
抽样极限误差
样本平均数的抽样极限误差: 样本平均数的抽样极限误差:以绝对值形式 表示的样本平均数的抽样误差的可能范围, 表示的样本平均数的抽样误差的可能范围, 用符号表示为: 用符号表示为:
样本成数
从成数总体中抽取样本容量为n的样本 从成数总体中抽取样本容量为 的样本 样本中具有此种特征的单位占全部样本单位 数的比例称为样本成数,记作p 数的比例称为样本成数,记作p p=n1/n
抽样调查第6章 整群抽样与系统抽样知识讲解
Y K
2
N0N
K i 1
Yi Y
2
由这个思路无法给出其均方偏差的估计量
系统抽样的效率
与简单随机抽样的比较
(N 1)S 2 N0 (K 1)S外2 (N0 1)KS内2 V (YˆSE ) N(K 1)S 2
V (YˆSYS) N0N(K 1)S外2 N (N 1)S 2 N (N K )S内2 V (YˆSYS) V (YˆSE ) N(N K)(S 2 S内2 )
K 2 1 k 1 K k K K 1 i1
N0 j 1
Yij Y
2 (K, N较大时)
Deff
V (YˆCSE V (Yˆ)
)
1 (N0 1)C
C较大,N0较大时,整群抽样精度差得多
对第一级为简单随机抽样的二阶抽样有
Deff 1 C (n0 1)
整群抽样的设计效应
实际当各群容量不等时,常用 1
V (YˆCSE )
K2 k
1
k K
1 K 1
K i 1
Ni
Yij
j 1
Y K
2
(3)V (YˆCSE )的一个无偏估计量为
v(YˆCSE )
K2 k
1
k K
1 k 1
k i 1
Ni
Yi j
j 1
YˆCSE K
2
目标量的估计
定理6.2 对有放回PPS整群抽样,总体总数Y的估计有
(Ni 1) (Yij Y )2
i 1
j 1
若群内各单元指标均相等,则C达最大值1
群内相关系数是衡量群内单元同质性的一个指标
整群抽样的设计效应
Ni N0 (i 1,2, , K)时
抽样调查-第6章整群抽样
(1 n
f
)Sb2
下面我们看一个整群抽样的例题
返回
【例4.11】 在一次对某中学在校生零花钱的调查
中,以宿舍作为群进行整群抽样,每个宿舍都有M=6 名学生。用简单随机抽样在全部N=315间宿舍中抽取
n=8间宿舍。全部48个学生上周每人的零花钱 yij 及
相关计算数据如下表。试估计该学校学生平均每周
sb2
1 0.0254 86
926 .63 18.81
s( y) v( y ) 18.81 4.34
于是置信度为95%的置信区间为98.17±1.96×4.34, 也即[89.66元,106.68元】
返回
2、整群抽样效率分析
在整群抽样中,由于
V (y) 1 f nM
而样本群内方差为:
sw2
1 n(M 1)
n i 1
M
( yij yi )2
j 1
1 n
n i 1
1 M 1
M
( yij
j 1
yi )2
1 n
n i 1
si2
220.79
返回
由相关系数的估计式有
sb2
sb2 sw2 (M 1)sw2
故
y
1 n
n i 1
yi
75 89 93.33 8
98.17
sb2
M n 1
n i 1
(yi
y)
6 [(75 98.17)2 (93.33 98.17)2 926.63 8 1
返回
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解:
(1)
2
n
(1 )
12 2 (1
100
) 1.19(千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X x 400 2 1.19 397.62 ~ 402.38( 千克 ) x
2 N n
n N1
但实际中,往往N很大,n很小,故改用下列公式:
2
n
(1 )
x
nN
上例中,若为不重复抽样,则:
400 (1
100
) 1.99(小时)
x 100 10000
(二) 成数的抽样平均误差
已知:成数的方差为p(1-p)
在重复抽样情况下:
p (1 p )
第六章 抽样调查
第一节 抽样调查的意义 第二节 抽样调查的基本概念 第三节 抽样平均误差 第四节 全及指标的推断 第五节 抽样方案设计 第六节 必要抽样单位数的确定 第七节 假设检验
第一节 抽样调查的意义
一、抽样调查的概念 抽样调查是按随机原则,从全部研
究对象中抽取一部分单位进行观察,并 根据样本的实际数据,对总体的数量特 征做出具有一定可靠程度的估计和判断 其中心问题是如何根据已知的部分资料 来推断未知的总体情况。
(3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均 亩产量的可能范围为:
X 400 3 1.19 396.43 ~ 403.57( 千克 )
例2
某机械厂日产某种产品8000件,现采用纯 随机重复抽样方式,从中抽取400件进行观 察,其中有380件为一级品,试以概率 95.45%的可靠程度推断全部产品的一级品率 的范围。
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N
例
某玻璃器皿厂某日生产15000只印花玻璃杯,现 按重复抽样方式从中抽取150只进行质量检验,结 果有147只合格,其余3只为不合格品,试求这批印 花玻璃杯合格率(成数)的抽样平均误差。
N 15000 n 150
p 147 98% 150
样本平 均数 x
40 42 44 46 48 42 44 46 48 50
重置抽样分布--样本平均数的分布
样本平均数 x
34 36 38 40 42 44 46 48 50 合计
频数
1 2 3 4 5 4 3 2 1
25
E(x)xff 42(元)
2(x)(x X f)2f16(元 2)
调查来确定S,代替σ; 4. 用估计的方法。
抽样平均误差的影响因素:
1. 全及总体标志变异程度。——正比关系 2. 抽样单位数目的多少。 ——反比关系 3. 不同的抽样方式。 4. 不同的抽样组织形式。
随机抽样的抽样平均误差
(一) 平均数的抽样平均误差 重复抽样
x
n
或 2
x
n
例
二、抽样调查的特点
1.抽样调查是非全面调查。 2.抽样调查是用样本的指标数值去推算总体 的指标数值。 3.抽样调查是按随机原则抽选调查单位。 4.抽样调查中产生的抽样误差,可以事先计 算并加以控制。
第二节 抽样调查的基本概念
一、全及总体和抽样总体 二、抽样方法
1.重复抽样分布 2.不重复抽样分布
A B DC D E
A B EC D E
– 考虑顺序时:样本个数=Nn=52=25
– 不考虑顺序时:样本个数= CN nn-1((NN-1n)-!n1)!!
不重复抽样
• 例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2
A
A
B
B
AC BC
D
D
C D
•
E
考虑顺序时:样本个数
m n
p
1
当试验次数n充分大时,可以用 频率代替概率。
大数定理的意义:个别现象受偶然因素影响,但是,对总体 的大量观察后进行平均,就能使偶然因素的影响相互抵消, 从而使总体平均数稳定下来,反映出事物变化的一般规律。
中心极限定理
中心极限定理:
1.独立同分布中心极限定理:
x
~
N
p
p(1 p) n
0.98(10.98) 1.14% 150
若按不重复抽样方式:
p
p(1 p) (1 n )
n
N
0.98(10.98) (1 150 ) 1.1374%
150
15000
抽样误差的作用
1. 在于说明样本指标的代表性大小。
误差大,则样本指标代表性低; 误差小,则样本指标代表性高; 误差等于0,则样本指标和总体指标一样大。
2. 说明样本指标和总体指标相差的 一般范围。
第四节 全及指标的推断
一、优良估计
• 无偏性 • 一致性 • 有效性
二、点估计
• 点估计的含义:直接以样本指标作为相应 全及指标的估计量。
x X
p
P
S
2
2
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得
重复抽样:又称有放回抽样。
例
1 ,1 ,1 , LL
5000 5000 5000
不重复抽样:又称不放回抽样。
例
1 ,1 ,1 , LL
5000 4999 4998
重复抽样
• 例如从A、B、C、D、E五个字母中随机
抽取两个作为样本。N=5,n=2
A B AC D E
A B BC D E
A B CC D E
N
• 总体成数P是指具有某种特征的单位在总体中 的比重。成数是一种结构相对数,设总体单 位总数目是N,总体中有该特征的单位数是N1。 设x是0、1变量,则有:
P N1 N
样本成数
• 现从总体中抽出n个单位,如果其中有相应特 征的单位数是n1,则样本成数是:
p n1 n
• P也是一个随机变量,利用样本平均数的分布
性质结论,即有:
E(p) p
p
np 1 p
n-1
样本容量与样本个数
• 样本容量:一个样本中所包含的单位数, 用n表示。
• 样本个数:又称样本可能数目,指从一 个总体中所可能抽取的样本的个数。对 于有限总体,样本个数可以计算出来。 样本个数的多少与抽样方法有关。
二、抽样方法
• 验证了以下两个结论:
E(x)X 2 ( x ) 2
n
• 抽样平均数的标准差 反映所有的样本平均 数与总体平均数的平 均误差,称为抽样平 均误差,用 表示。
x
x
n
取得σ的途径有:
1. 用过去全面调查或抽样调查的资料,若同时 有n个σ的资料,应选用数值较大的那个;
2. 用样本标准差S代替全及标准差σ; 3. 在大规模调查前,先搞个小规模的试验性的
解: 抽样一级品率:
注 抽样误差是由于抽样的随机性而产生的样本
指标与总体指标之间的平均离差。
按照定义:
x
(xX )2 K
重复抽样分布--样本平均数的分布
• 某班组5个工人的日工 资为34、38、42、46、 50元。
• = 42
• 2 = 32
• 现用重复抽样的方法 从5人中随机抽2个构 成样本。共有52=25个 样本。如右图。
X
, 2 n
2.德莫福-拉普拉斯中心极限定理:
X~Nnp,npq
大样本的平均数近似服从正态分布。
第三节 抽样平均误差
一、抽样误差的概念及其影响程度
在统计调查中,调查资料与实际情况不 一致,两者的偏离称为统计误差。
登记误差 统计误差代表性误差随 偏机 差误差实 抽际 样误 平差 均误差
• 全及指标:反映总体数量特征的指标。 其数值是唯一的、确定的。
• 抽样指标:根据样本分布计算的指标。 是随机变量。
全及指标和抽样指标
总体
样本
全及指标X、2Fra bibliotekP抽样指标
平均数
x
标准差、方差 S、 S2
成数
p
变量总体和属性总体
• 变量总体各单位标志值可用数量表示
X X
显著性水平,其取值大小由实际问题确定,经常取 1%、5%和10%。
参数估计的两个要求:
– 精度:估计误差的最大范围,通过极限 误差来反映。显然,Δ越小,估计的精度 要求越高,Δ越大,估计的精度要求越低。 极限误差的确定要以实际需要为基本标 准。
– 可靠性:估计正确性的一个概率保证, 通常称为估计的置信度。
x1
x1
x2
x2
x3
x3
x4
表示有(1)100%的
区间包含了X
x4
当F(t)=68.27%时,抽样极限误差等于抽样平均误差 的1倍(t=1); 当F(t)=95.45%时,抽样极限误差等于抽样平均误差 的2倍(t=2); 当F(t)=99.73%时,抽样极限误差等于抽样平均误差 的3倍(t=3);
到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X1002克 , 合 格 率 P 98% 。
三、全及指标估计概述
• 设待估计的全及指标是 X ,用以估计该
参数的统计量是 x ,抽样估计的极限误
差是 x ,即: