第六章-抽样调查
自考-市场调查与预测-第6章-抽样方法
1 定义总体 确定调查对象全体:从抽样元素、抽样 单位、抽样范围、抽样时间角度考虑 例如…
2 确定抽样框架 抽样总体中,抽样元素的表现形式。总体中 的每一个元素都在抽样框架中出现一次,且 仅出现一次。如户籍簿。 适用性、完整性。 3 确定抽样单位 容纳总体的基本单位,大于等于样本元素。 取决于抽样框架和调查方法。 电话调查——电话号码 邮寄调查——地址或姓名
B 平均值估计 C 百分比估计样本容量
根据允许误差大小估计样本量
不同抽样方法样本容量的确定 影响因素: 调查目的;总体大小;总体构成;抽样方式 计算公式:见表6-4
其它调查方法介绍
2、自愿样本
被调查者自愿参加,成为样本中的一分子,向
调查人员提供有关信息
–
例如,参与报刊上和互联网上刊登的调查问
第6章 抽样方法
普查与抽样调查 抽样程序
常用抽样方法
样本容量的确定
6.1普查与抽样调查
抽样设计的重要性 案例6-1 普查的相关概念和案例 P159 抽样调查的概念 抽样是通过抽取总体中的部分单位,收集 这些单位的信息,从而对总体进行推断的 一种手段。 抽样调查的含义 P163 抽样调查的适用范围
第一节 抽样方法
6.3 常用抽样方法
1 简单随机抽样 2 分层随机抽样 3 分群随机抽样 4 等距随机抽样 5 任意抽样 6 判断抽样 7 配额抽样 8 滚雪球抽样
1 简单随机抽样 1、抽样方法 根据研究目的选定总体,首先对总体中所 有的观察单位编号,遵循随机原则,采用不放 回抽取方法,从总体中随机抽取一定数量观察 单位组成样本。 2、具体方法 ①抽签法
统计学第六章抽样调查
Part
05
系统抽样技术
系统抽样原理及步骤
• 系统抽样原理:系统抽样是一种等距抽样方法,它首先确定一个抽样间隔,然后在总体中按照这个间隔进行抽 样。这种方法适用于总体单位排列有序且周期性变化的情况。
系统抽样原理及步骤
01
系统抽样步骤
02
确定总体范围和抽样框;
03
计算抽样间隔,确定样本量;
系统抽样原理及步骤
01
03 02
分层标准选择与确定方法
• 以调查对象的某些自然特征或社会特征作 为分层标准。
分层标准选择与确定方法
专家判断法
依靠专家经验判断选择合 适的分层标准。
数据分析法
通过对历史数据或相关数据的 分析,找出影响调查指标的主 要因素,作为分层标准。
试验法
通过试验确定不同分层标准 对调查结果的影响程度,选 择最优的分层标准。
缺点
由于样本可能被重复抽取,导致样本的代表性降 低。
缺点
操作相对复杂,需要记录已经抽取过的样本。
简单随机抽样优缺点分析
操作简单
简单随机抽样的操作过程相对简单,易于理解和实施。
等概率原则
保证了每个单位被抽中的机会相等,避免 具有代表性:当样本量足够大时,简单随机抽样可以获得具有代表性的样本。
整群抽样优缺点比较
• 适用于某些特定情况:对于某些总体分布不均匀或难以划分的情况,整群抽样 可能更为适用。
整群抽样优缺点比较
抽样误差较大
01
由于是以群为单位进行抽样,可能导致抽样误差较大。
样本代表性不足
02
如果群的划分不合理或随机性不足,可能导致样本代表性不足。
对群内个体差异考虑不足
03
统计学原理-第六章 抽样调查(复旦大学第六版)
2.样本总体:简称样本,是从全及总体中随机
抽取出来,代表全及总体部分单 位的集合体。单位数用n表示。
5
二.全及指标和抽样指标
(一)全及指标
X 总体平均数: X N 总体成数:P
2
XF 或X F Q=
2 2
N1 N N
(X-X) 总体方差: = 总体标准差:= (X-X)
(一)考虑顺序的不重复抽样数目
N! A N ( N 1)(N 2) ( N n 1) ( N n)! 4 3 2 1 2 例如A4 12 2 1
n N
(二)考虑顺序的重复抽样数目
B N
n N 2 4
n 2
例如 B 4 16
10
(三)不考虑顺序的不重复抽样数目
Ex X
28
2、一致性 当抽样单位数充分大时,抽样指标和未知 的总体指标之间的绝对离差为任意小的可能性 也趋于必然性。
x X 任意小
3、有效性
即用抽样指标估计总体指标,要求作为优良估 计量方差应该比其他估计量的方差小。
2
x X f
2
f
2
x X f
x
x E ( x)
2
18
说明:根据数理统计理论,在重复抽样条件下, 抽样平均误差与全及总体的标准差成正比例关系。 与抽样总体单位平方根成反比关系。
19
在不重复抽样情况下,抽样平均误差计算公式如下:
x x
N n 250 4-2 ( )= ( ) =9.13(件) n N 1 2 4-1
2
N
X X F 或 F X X F 或 F
统计学第六章 抽样法
第六章 抽样法
序号
1 2 3 4
5 6 7 8
9 10 11 12
13 14 15 16 合计
样本变量x
40、40 40、50 40、70 40、80
50、40 50、50 50、70 50、80
70、40 70、50 70、70 70、80
80、40 80、50 80、70 80、80
-
x
x E(x)
总体
研究如何利用 样本数据来 推断总体特 征。
内容包括:参 数估计和假 设检验。
目的:对总体
特征作出推
样 本
断。
这是推断统计学研 究的问题
5
第六章 抽样法
描述统计与推断统计的关系
反映客观 现象的数
据
概率论
(包括分布理论、大 数定律和中心极限定
理等)
样本数
描述统计
推断统计
据
总体数 据
(统计数据的搜集 、整理、显示和分
13
第六章 抽样法
第二节 有关抽样的基本概念(2)
(二)抽样总体
也称子样,样本或样本总体,它是从全 及总体中随机抽取出来的,代表全及总体的 那部分单位的集合体。抽样总体的单位数称 为样本容量,用n表示,对于N来说,n是很 小的。
总体
样 本
14
第六章 抽样法
第二节 有关抽样的基本概念(3)
• 二 全及指标和抽样指标p.249 (一) 全及指标
研究总体中 的品质标志
总体成数 P N1
N
总体成数标准差 P
P1 P
17
第六章 抽样法
第二节 有关抽样的基本概念(5)
(二)抽样指标
抽样指标是由样本总体各单位标志值 或标志特征计算的综合指标,也称统计量。 与全及指标相对应有:样本平均数,样本 标准差;样本成数,样本成数的标准差。
第六章 抽样调查
第六章抽样调查第一节抽样调查的意义及全然概念一、抽样调查的意义抽样调查(随机抽样):按照随机原那么从总体中抽取一局部单位进行瞧瞧,并运用数理统计的原理,以被抽取的那局部单位的数量特征为代表,对总体作出数量上的推断分析。
二、抽样调查的适用范围抽样调查方法是市场经济国家在调查方法上的必定选择,和普查相比,它具有正确度高、本钞票低、速度快、应用面广等优点。
一般适用于以下范围:1.实际工作不可能进行全面调查瞧瞧,而又需要了解其全面资料的事物;2.虽可进行全面调查瞧瞧,但比立困难或并不必要;3.对普查或全面调查统计资料的质量进行检查和修正;4.抽样方法适用于对大量现象的瞧瞧,即组成事物总体的单位数量较多的情况;5.利用抽样推断的方法,能够关于某种总体的假设进行检验,判定这种假设的真伪,以决定取舍。
三、抽样调查的全然概念(一)全及总体和抽样总体(总体和样本)全及总体:所要调查瞧瞧的全部事物。
总体单位数用N表示。
抽样总体:抽取出来调查瞧瞧的单位。
抽样总体的单位数用n表示。
n≥30大样本n<30小样本(二)全及指标和抽样指标(总体指标和样本指标)全及指标:全及总体的那些指标。
抽样指标:抽样总体的那些指标。
第二节抽样调查的组织形式通常有以下四种组织形式:一、简单随机抽样(纯随机抽样)即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。
随机抽选可有各种不同的具体做法,如:1.直截了当抽选法;2.抽签法;3.随机数码表法;二、类型抽样(分类抽样)先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原那么抽取样本,组成一个总的样本。
类型的划分:一是必须有清楚的划类界限;二是必须明白各类中的单位数目和比例;三是分类型的数目不宜太多。
类型抽样的好处是:样本代表性高、抽样误差小、抽样调查本钞票较低。
要是抽样误差的要求相同的话那么抽样数目能够减少。
两种类型:1.等比例类型抽样(类型比例抽样);2.不等比例类型抽样(类型适宜抽样)。
第六章抽样调查习题答案
第六章抽样调查习题答案一、单项选择题1、 C2、 A3、 D4、 D5、C6、 D7、 C8、 A9、 D 10、A11、 D 12、 C 13、 B 14、 A 15、A16、 B 17、 B 18、 D 19、 A 20、A21、 A 22、 D 23、 D 24、 B 25、A二、判断题1、 CD2、 AE3、 BCD4、 ABDE5、ABD6、 AB7、 ABCD8、 AC9、 ABCD三、判断题1、×2、√3、√4、√5、√6、×7、√8、×9、√ 10、√11、× 12、√ 13、√ 14、× 15、×16、√ 17、√ 18、×四、填空题1、随机、部分、总体2、计算、控制3、重复、不重复4、大于5、点估计、区间估计6、增加到4倍、减少三分之二、减少四分之三 7、大样本、小样本 8、正、反五、复习思考题1、影响抽样误差的主要因素有哪些?答:影响抽样误差大小的因素主要有:(1)总体单位的标志值的差异程度。
差异程度愈大则抽样误差愈大,反之则愈小。
(2)样本单位数的多少。
在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小。
(3)抽样方法。
抽样方法不同,抽样误差也不相同。
一般说,重复抽样比不重复抽样,误差要大些。
(4)抽样调查的组织形式。
抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度也会影响抽样误差。
2、什么是抽样调查?它有哪些特点?答:抽样调查是根据部分实际调查结果来推断总体标志总量的一种统计调查方法,属于非全面调查的范畴。
它是按照科学的原理和计算,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据以代表总体,推断总体。
(1)只抽取总体中的一部分单位进行调查。
(2)用一部分单位的指标数值去推断总体的指标数值(3)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。
统计学课件第六章抽样调查PPT课件
特点
每个样本被选中的机会都 相等,样本的代表性相对 较好。
分层抽样
定义
先将总体按一定标准分成 若干层次或群,然后从各 层或群中按随机原则抽取 样本。
方法
分类抽样、比例抽样、类 型抽样。
特点
能够提高样本的代表性, 降低误差,减少资源浪费。
系统抽样
定义
先将总体中的所有个体按某种顺序排列,然后按 照固定的间隔或系统选取样本。
改进抽样方法
采用更科学的抽样方法和技术,如分层抽样、系统抽样等,以提 高样本的代表性。
提高样本代表性
在抽样过程中尽量减少非随机误差,如无回答、不完整数据等, 以提高样本对总体的代表性。
05 抽样调查的组织与实施
抽样调查的设计
确定调查目的
明确调查的目标和意图,为后 续的抽样设计提供指导。
确定调查对象
合理安排问题的顺序、布局和格式,以提高 问卷的易用性和回答率。
确定调查方式
选择合适的调查方式,如自填式、面访式等, 并确定数据收集的途径。
测试与修正
对问卷进行测试和修正,确保问卷的准确性 和可靠性。
调查的实施与质量控制
培训调查员
对调查员进行培训,确保他们了解调 查目的、问卷内容、调查方法等。
现场实施
将总体分成若干个群集或组,然后从每个 群集或组中抽取一定数量的样本,也称为 簇抽样或组抽样。
抽样调查的应用场景
01
02
03
04
市场调查
通过对目标市场的部分消费者 进行调查,了解市场需求、消 费者行为和产品反馈等信息。
社会调查
通过对一定范围内的社会成员 进行调查,了解社会现象、人 口状况和社会问题等信息。
统计学课件第六章抽样调查ppt课 件
《社会调查研究方法》 第六章 抽样
《社会调查研究方法》第六章抽样在社会研究中,最常见的总体是由社会中的某些个人组成的,这些个人便是构成总体的元素,比如,当我们对某省大学生的择业倾向进行研究和探讨时,该省所有在校大学生的集合就是我们研究的总体,而每一个在校大学生便是构成总体的元素。
又比如,我们打算研究某城市居民的家庭生活质量,那么,该市所有的居民家庭就构成我们研究的总体,而其中的每一户家庭都是这个总体中的一个元素。
样本(sample)就是从总体中按一定方式抽取出的一部分元素的集合。
或者说,一个样本就是总体的一个子集。
比如,从某省总数为12.8万人的大学生总体中,按一定方式抽取出1 000名大学生进行调查,这1 000名大学生就构成该总体的一个样本(当然,从一个总体中可以抽取出若干个不同的样本)。
在社会研究中,资料的收集工作往往是在样本中完成的。
明白了总体和样本的概念,再来理解抽样的概念就十分容易了。
比如,从3 000名工人所构成的总体中,按一定方式抽取200名工人的过程;或者从1 000户家庭构成的总体中,按一定方式抽取一个由100户家庭构成的样本的过程,都叫做抽样。
比如,上面所举的例子中,单个的大学生既是构成某省12.8万名大学生这一总体的元素,又是我们从总体中一次直接抽取出1000名大学生的样本时所用的抽样单位;但是,当我们从这一总体中一次直接抽取出40个班级,而以这40个班级中的全部学生(假定正好1000名)作为我们的样本时,抽样单位(班级)与构成总体的元素(学生)就不是一样的了。
比如,从一所中学的全体学生中,直接抽取200名学生作为样本,那么,这所中学全体学生的名单就是这次抽样的抽样框;如果是从这所中学的所有班级中抽取部分班级的学生作为调查的样本,那么,此时的抽样框就不再是全校学生的名单,而是全校所有班级的名单了。
因为此时的抽样单位已不再是单个的学生,而是单个的班级了。
在统计中最常见的总体值是某一变量的平均值,比如,某市待业青年的平均年龄、某厂工人的平均收入等等,它们分别是关于某市待业青年这一总体在年龄这一变量上的综合描述,以及某厂工人这一总体在收入这一变量上的综合描述。
2013年第6章 抽样调查
2.优缺点及适用范围
优点: 与简单随机抽样比,省去了一个个抽样的时间。 能使样本均匀分散在调查总体中,不会集中于某 个层次,样本代表性增强了 缺点:进行排列时需要总体各个单位的详细资 料;总体单位差异较大或排列有规律时,调查 精确度有影响 商场抽每天销售量 适用范围:同质性较高的总体
2.经验法
经验法确定抽样数目的范围 -非随机抽样用
总体 规模 100 以下 100~ 1000 1 000~ 5000 5000~ 10000 10000~ 100000 100000 以上
抽样数 占总体 比重(%)
50以上
50~20
30~10
15~3
5~ 1
1以下
6.3 抽样调查方式
抽样调查方式
2.样本单位是从总体中抽选出来进行调查观察的 单位样本单位数n
(三)指标和标志 指标是总体的数量特征 数量指标,反映总体总规模或总水平,如人口 数,产量,耕地面积。 质量指标,反映总体内在质量,如产品合格率, 劳动生产率等。 标志反映的是总体单位的特征。 品质标志,如人的性别,籍贯等 数量标志,人的年龄,身高,职工工资等
(4)简单随机抽样法的优缺点及适用范围 优点 完全按照随机的原则进行抽样,简单直观 缺点 抽月收入 要有完整样本框 高的 如需编号,总体量大面广则难度较大; 有可能 全被抽到 总体单位差异较大时,样本代表性差; 适用范围 适用于总体单位数不多且差异较小的
(二)等距抽样
1.定义 等距抽样又称机械抽样或系统抽样,它是先将总体 各单位按某一标志排队,并给总体中所有个体编号,然后 抽取一个编号,并按照相同的间隔距离来抽取其他样本单 位。 编号 并根据总体单位数和样本单位数计算出抽样距离(即相 同的间隔),然后按相等的距离或等间隔来抽取样本单位。 L=N/n 标志采取方法可以选择与调查主题相关的或者不相关的 举例:某地区有零售店110户,采用等距抽样抽取11户 如何抽?
第六章抽样
册和登记表(抽样框)就可进行。
• 其局限是,只适用于总体单位数量不多,且分布
较均匀的调查总体,即单位间差异性不大的研究
对象,否则将无法保证样本的代表性。
• 练习 请利用随机数表,从N=60总体中抽取15个样本。
系统抽样
• 系统抽样(等轴抽样、等距抽样、机械抽样): 把总体的单位进行编号排序,在计算出某中间隔, 然后按这个固定的间隔抽取个体的号码来组成样 本的方法。 • 基本和简单随机抽样一样,计算公式也一样。 • 需要完整的样本框,直接从总体中抽取个体。
• 获得完全正确的样本框几乎是不可能的。 • 制定抽样框是抽样的关键步骤之一。 • 当抽样是分段进行时,在几个不同的抽样层次上 进行时,则要分别建立起几个不同的样本框。 • 比如:研究某市小学生的学习情况。从500所小 学中抽取10所小学,再从这10所小学,每个小学 抽取3个班级,被抽中的班级中再抽取10名同学。 所以要有三个样本框: 全市学校名单 每所抽中学校班级名单 每个被抽中班级学生的名单
抽样的概念
• 统计值(样本值):样本中某一个变量的综合描 述。 • 是从样本中计算出来的。 • 是作为总体值的估计值。
2 抽样的作用
• 用十分有限的人力、财力、时间去了解庞杂、广 阔、纷繁、多变的社会现象。 • 比如:民意测验,要求迅速、准确。往往调查对 象不到2000人。
3.抽样的类型
• 概论抽样 • 非概率抽样
决定抽样方案
• 对于具有不同研究目的、不同范围、不同对象和 不同客观条件的社会研究,所使用的抽样方法是 不一样的。 • 依据研究的目的的要求、依据各种抽样的特点, 以及其他有关因素来觉得具体采用哪种抽样方法。 • 同时确定样本规模以及主要的精确程度。
实际抽取样本
第六章 抽样调查
第六章 抽样调查一、单项选择题1.随机抽样的基本要求是严格遵守( )①准确性原则;②随机原则;③代表性原则;④可靠性原则。
2.抽样调查的主要目的是( )①广泛运用数学的方法; ②计算和控制抽样误差;③修正普查的资料; ④用样本指标来推算总体指标。
3.抽样总体单位亦可称( )①样本; ②单位样本数; ③样本单位; ④总体单位。
4.反映样本指标与总体指标之间抽样误差可能范围的指标是( )①样本平均误差; ②抽样极限误差; ③可靠程度; ④概率程度。
5.在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是( )①抽样单位数占总体单位数的比重很小时;②抽样单位数占总体单位数的比重很大时;③抽样单位数目很少时; ④抽样单位数目很多时。
6.在其他条件不变的情况下,抽样单位数目和抽样误差的关系是( ) ①抽样单位数目越大,抽样误差越大;②抽样单位数目越大,抽样误差越小;③抽样单位数目的变化与抽样误差的数值无关; ④抽样误差变化程度是抽样单位数变动程度的21。
7.用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的( )①2倍; ②3倍; ③4倍; ④5倍。
8.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称为( )①分层抽样;②简单随机抽样;③整群抽样;④等距抽样。
9.全及总体按其各单位标志性质不同,可以分为( )①有限总体和无限总体; ②全及总体和抽样总体;③可列无限总体和不可列无限总体;④变量总体和属性总体。
10.抽样指标是( )①确定性变量; ②随机变量; ③连续变量; ④离散变量。
11.用考虑顺序的重置抽样方法,从4个单位中抽选2个单位组成一个样本,则样本可能数目为( )①1642=; ②10!3!2!5=; ③12!2!4=; ④6!2!2!4=。
12.无偏性是用抽样指标估计总体指标应满足的要求之一,无偏性是指( ) ①样本平均数等于总体平均数; ②样本成数等于总体成数;③抽样指标等于总体指标; ④抽样指标的平均数等于总体指标。
市场调研与预测第六章 抽样
分层随机抽样技术及其应用
注意:分层时要注意各层之间要有明显的差异, 不致发生混淆;要知道各层中的单位数目和比 例;分层的数目不宜太多,每个层次内每个个 体应保持一致性等。 分层抽样具体形式:等比例分层抽样、非比例 分层抽样
分群随机抽样技术及其应用
运用分群抽样技术抽取样本,先把调查总体区分 为若干个群体,然后用单纯随机抽样法,从中抽 取某些群体进行全面抽查。 如果不是对所抽取的群体进行全面抽查,而是进 一步划分为若干个小群体,再按随机原则抽取一 个或一部分小群体来调查,称为多段分群抽样。 运用分群抽样技术抽取样本,抽选工作比较简易 方便,抽中的单位比较集中,但是由于样本单位 集中在某些群体,而不能均匀分布在总体中的单 位,若群与群的差异较大,抽样误差会增大。
随机抽样
随机抽样又称为概率抽样,是对总体中每一个 体给予平等的抽取机会的抽样技术。 随机抽样的类别: 随机抽样的类别: (1)简单随机抽样:是在总体单位中不进行 任何有目的的选择,按随机原则,纯粹偶然的 方法抽取样本的技术。 (2)分层随机抽样:把调查总体按其属性不 同分为若干层次,然后在各层中随机抽取样本 的技术。
随机抽样的类别
(3)分群随机抽样:是把调查总体区分为若 干个群体,然后用单纯随机抽样法,从中抽取 某些群体进行全面调查的技术 (4)系统随机抽样:在总体中先按一定标志 顺序排列,并根据总体单位数量和样本单位数 计算出抽样距离,然后按相同的距离或间隔抽 选样本单位的技术
随机抽样的优点和不足
优点: 优点: 1.调查范围和工作量比较小,又排除了认为的干扰, 能省时、省力、省费用。 2.随机抽样能够计算调查结果的可靠程度。 不足: 不足: 1.对所有调查样本都给予平等看待,难以体现重点。 2.抽样范围广,所需时间长,参加调查的人员和费 用多。 3.需要具有一定专业技术的专业人员进行抽样和资 料分析。
第六章 抽样
例:以某高校6000名在校大学生为总体:
抽样1:按一定方式抽取300名大学生作样本;
抽样2:按一定方式抽取10个班作样本;
分析:两种抽样方式下的抽样单位和抽样框
(四)抽样框sample frame
一次直接抽样时总体中所有元素的名单。 抽样框是抽样操作依据的名单,是和调查的总体相 对应的
究总体的操作化界定,规定了调查对象选择的具体指标。
• 目标总体和调查总体吻合度越高,调查的代表性就越好;否则会
产生覆盖误差。
(二)制定抽样框
1.抽样框是对研究总体的进一步操作。
2.抽样框的意义
(1)抽样框与研究/调查总体之间可能不匹配,可能包含研 究总体之外的某些人,或可能遗漏其中的某些人. (2) 根据样本所得到的结果,只能代表组成抽样框的各个 要素的集合 (3) 样本的大小(规模)与其能否正确代表总体比较起 来,是一项不太重要的因素。
(五)参数值——又称总体值,是关于总体中某一变量的 的综合描述,或者说是总体中所有元素的某种特征的综 合数量表现。 –参数值只有对总体中每一个元素都进行调查或测量才 能得到。 (六)统计值——又称样本值,是关于样本中某一变量的 综合描述,或者说是样本中所有元素的某种特征的综合 数量表现。 –统计值是从样本中计算出来的,它是相应的参数值的 估计量。
一、简单随机抽样
(一)定义
又称纯随机抽样,是概率抽样的最基 本形式。 它是按等概率原则,直接从含有N个 元素的总体中随机抽取n个元素组成样本 (N>n)。
(二)选取样本的两种办法
1.抽签方式 (1)将总体名单从1到N编号,形成抽样框; (2)准备N张卡片,每张卡片上的号码与总体 名单编号对应,将卡片放在盒子里,混合均匀; (3)根据抽样设计的样本规模,从盒内n次取 出n张卡片; (4)根据取出的卡片上的号码,找到总体名单 上对应的元素,构成样本。
抽样调查-第6章整群抽样
s( y) v( y ) 18.81 4.34
于是置信度为95%的置信区间为98.17±1.96×4.34, 也即[89.66元,106.68元】
2、整群抽样效率分析
在整群抽样中,由于
V (y) 1 f nM
Sb2
估计量的方差主要依赖群间的变异性。因此
整群抽样中
Sb2
S
2 w
较大,则整群抽样就会损失精度。
deff V ( y) 1 (M 1)
VSRS ( y)
这表明,整群抽样的方差约为简单随机抽样方差的
1 (M 1) 倍
整群抽样估计效应与群内相关系数 关系密切,
若群内各单元的值都相等,则群内方差S
2 w
0
此时, 1 为最大值,deff M 即整群抽样的估计
量方差是简单随机抽样估计量方差的倍。
v(Y )
N
2M
2v( y)
N
2M
(1 n
f
)Sb2
下面我们看一个整群抽样的例题
【例4.11】 在一次对某中学在校生零花钱的调查
中,以宿舍作为群进行整群抽样,每个宿舍都有M=6 名学生。用简单随机抽样在全部N=315间宿舍中抽取
n=8间宿舍。全部48个学生上周每人的零花钱 yij 及
相关计算数据如下表。试估计该学校学生平均每周
i1
M (N 1)
1 f nM
Sb2
定理4.3 V ( y) 的样本估计为:
v( y)
1 f nM
sb2
由于 sb2是Sb2 的无偏估计, 因而 v( y)是V ( y) 的无偏估计。
总体总值 Y NM Y 的估计量为:
Y NM y
总体总值 Y NM Y 的估计量的方差为:
统计基础第六章
(一)全及总体和样本总体
1.全及总体:简称总体或母体, 指所要调查研究对象的全体。
2.样本总体:简称样本或子样,指在 全及总体中按随机原则抽取的那部分 单位所构成的集合体。
(二)全及指标和样本指标
1.全及指标:也称母体参数,反 映总体某种属性的综合指标。
总体 N
2.样本指标:也称样本统计量 或抽样指标,反映抽样总体综合指标。
一、样本容量的影响因素
1
总体各单位之间
9 % 0 2 .6 % 8 P 9 % 0 2 .6 % 8
( 9 % 0 2 .6 % 8 1)0 0 N 0 ( P 9 % 0 0 2 0 .6 % 8 1)000
该地有两台以上彩电8 的7用3 户2N0 数P 在9287638200户到92680户之间 。
第四节 样本容量的确定
组成总体的各研究对象称之为总体单位。用N表示
样本总体
样本总体又称子样,简称样本它是由从总体 中按一定程序抽选出来的那部分总体单位所 作成的集合。
n3,0称为大 ;n样 3,0称 本为小 . 样本
全及总体是唯一确定的,而样本总体是随机的。
(二)全及指标和样本指标 1.全及指标。全及指标是根据全及总体各单位
第六章 抽样调查
本章相关内容
第一节 抽样调查的意义和作用 第二节 抽样误差 第三节 抽样推断 第四节 必要抽样数目的确定
目标要求
能力(技能)目标
知识目标
熟练运用抽样估计的一 般原理推断全及总体的
掌握随机抽样的涵义;
指标;
掌握抽样调查方法;
熟练运用抽样估计原理 进行区间估计;
掌握抽样平均误差的计算 方法;
如何衡量总体指标落在误差范围内的概率大小呢?
统计学第六章抽样调查
标 差 总 标 差 、 本 准 s 准 : 体 准 σ 样 标 差
总体参数和样本统计量符号
总体指标符号 总体容量: N 总体平均数: µ 总体成数: P 总体方差: σ2 总体标准差: σ 样本指标符号 样本容量: n 样本平均数: x 样本成数: p 样本方差: S2 样本标准差: S
抽样组织形式
抽样估计效果好坏,关键是抽样平均误差的 抽样估计效果好坏,关键是抽样平均误差的 抽样平均误差 控制。抽样平均误差小, 控制。抽样平均误差小,抽样效果从整体上 看就是好的;否则,抽样效果就不理想。 看就是好的;否则,抽样效果就不理想。 抽样平均误差受以下几方面的因素影响: 抽样平均误差受以下几方面的因素影响:
抽样调查的基本概念 抽样调查的基本概念 重复抽样和不重复抽样
重复抽样:又称有放回的抽样 有放回的抽样,从总体中 重复抽样 有放回的抽样 抽取样本时,每次被抽中的单位都再被 放回总体中参与下一次抽样。 不重复抽样:又称无放回的抽样 无放回的抽样,总体中 不重复抽样 无放回的抽样 随机抽选的单位经观察后不放回到总体 中,即不再参加下次抽样。
µ ( p) =
P (1 − P ) n
不重复抽样条件下: 不重复抽样条件下: 条件下
µ ( p) =
P (1 − P ) n (1 − ) n N
抽样极限误差
样本平均数的抽样极限误差: 样本平均数的抽样极限误差:以绝对值形式 表示的样本平均数的抽样误差的可能范围, 表示的样本平均数的抽样误差的可能范围, 用符号表示为: 用符号表示为:
样本成数
从成数总体中抽取样本容量为n的样本 从成数总体中抽取样本容量为 的样本 样本中具有此种特征的单位占全部样本单位 数的比例称为样本成数,记作p 数的比例称为样本成数,记作p p=n1/n
抽样调查第6章 整群抽样与系统抽样知识讲解
Y K
2
N0N
K i 1
Yi Y
2
由这个思路无法给出其均方偏差的估计量
系统抽样的效率
与简单随机抽样的比较
(N 1)S 2 N0 (K 1)S外2 (N0 1)KS内2 V (YˆSE ) N(K 1)S 2
V (YˆSYS) N0N(K 1)S外2 N (N 1)S 2 N (N K )S内2 V (YˆSYS) V (YˆSE ) N(N K)(S 2 S内2 )
K 2 1 k 1 K k K K 1 i1
N0 j 1
Yij Y
2 (K, N较大时)
Deff
V (YˆCSE V (Yˆ)
)
1 (N0 1)C
C较大,N0较大时,整群抽样精度差得多
对第一级为简单随机抽样的二阶抽样有
Deff 1 C (n0 1)
整群抽样的设计效应
实际当各群容量不等时,常用 1
V (YˆCSE )
K2 k
1
k K
1 K 1
K i 1
Ni
Yij
j 1
Y K
2
(3)V (YˆCSE )的一个无偏估计量为
v(YˆCSE )
K2 k
1
k K
1 k 1
k i 1
Ni
Yi j
j 1
YˆCSE K
2
目标量的估计
定理6.2 对有放回PPS整群抽样,总体总数Y的估计有
(Ni 1) (Yij Y )2
i 1
j 1
若群内各单元指标均相等,则C达最大值1
群内相关系数是衡量群内单元同质性的一个指标
整群抽样的设计效应
Ni N0 (i 1,2, , K)时
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章 抽样调查一、单项选择题1.随机抽样的基本要求是严格遵守( )①准确性原则;②随机原则;③代表性原则;④可靠性原则。
2.抽样调查的主要目的是( )①广泛运用数学的方法; ②计算和控制抽样误差;③修正普查的资料; ④用样本指标来推算总体指标。
3.抽样总体单位亦可称( )①样本; ②单位样本数; ③样本单位; ④总体单位。
4.反映样本指标与总体指标之间抽样误差可能范围的指标是( ) ①样本平均误差; ②抽样极限误差; ③可靠程度; ④概率程度。
5.在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是( )①抽样单位数占总体单位数的比重很小时;②抽样单位数占总体单位数的比重很大时;③抽样单位数目很少时; ④抽样单位数目很多时。
6.在其他条件不变的情况下,抽样单位数目和抽样误差的关系是( ) ①抽样单位数目越大,抽样误差越大;②抽样单位数目越大,抽样误差越小;③抽样单位数目的变化与抽样误差的数值无关; ④抽样误差变化程度是抽样单位数变动程度的21。
7.用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的( )①2倍; ②3倍; ③4倍; ④5倍。
8.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称为( )①分层抽样;②简单随机抽样;③整群抽样;④等距抽样。
9.全及总体按其各单位标志性质不同,可以分为( )①有限总体和无限总体; ②全及总体和抽样总体;③可列无限总体和不可列无限总体;④变量总体和属性总体。
10.抽样指标是( )①确定性变量; ②随机变量; ③连续变量; ④离散变量。
11.用考虑顺序的重置抽样方法,从4个单位中抽选2个单位组成一个样本,则样本可能数目为( )①1642=; ②10!3!2!5=; ③12!2!4=; ④6!2!2!4=。
12.无偏性是用抽样指标估计总体指标应满足的要求之一,无偏性是指( ) ①样本平均数等于总体平均数; ②样本成数等于总体成数;③抽样指标等于总体指标; ④抽样指标的平均数等于总体指标。
13.抽样平均误差就是抽样平均数(或抽样成数)的( )①平均数;②平均差;③标准差;④标准差系数。
14.在同样条件下,不重置抽样的抽样平均误差与重置抽样的抽样平均误差相比,有()①前者小于后者;②前者大于后者;③两者相等;④无法判断。
15.抽样调查中()①既有登记性误差,也有代表性误差;②只有登记性误差,没有代表性误差;③没有登记性误差,只有代表性误差;④既没有登记误差,也没有代表性误差。
16.在抽样设计中,最好的方案是()①抽样误差最小的方案;②调查单位最少的方案;③调查费用最省的方案;④在一定误差要求下费用最少的方案。
17.随着样本单位数的无限增大,样本指标和未知的总体指标之差的绝对值小于任意小的正整数的可能性趋于必然性,称为抽样估计的()①无偏性;②一致性;③有效性;④充足性。
18.能够事先加以计算和控制的误差是()①抽样误差;②登记误差;③标准差;④标准差系数。
19.在一定抽样平均误差的条件下,要提高推断的可靠程度,必须()①扩大误差;②缩小误差;③扩大极限误差;④缩小极限误差。
20.根据抽样调查的资料,某企业生产定额平均完成百分比为165%,抽样平均误差为1%,概率为0.9545时,可据以确定生产定额年均完成百分比为()①不大于167%;②不大于167%和不小于163%;③不小于167%;④不大于163%和不小于167%。
21.对400名大学生抽取19%进行不重复抽样调查,优等生比重为20%,概率为0.9545,优等生比重的极限抽样误差为()①4.0%;②4.13%;③9.18%;④8.26%。
22.事先确定总体范围,并对总体的每个单位编号,然后根据《随机数码表》或抽签的方式来抽取调查单位数的抽样组织形式,被称为()①简单随机抽样;②机械抽样;③分层抽样;④整群抽样。
23.先将全及总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样调查组织方式被称为()①简单随机抽样;②机械抽样;③分层抽样;④整群抽样。
24.按地理区域划片所进行的区域抽样,其抽样方法属于()①简单随机抽样;②等距抽样;③类型抽样;④整群抽样。
25.整群抽样采用的抽样方法()①只能是重置抽样;②只能是不重置抽样;③主要是重置抽样;④主要是不重置抽样。
26.抽样平均误差反映了样本指标与总体指标之间的()①实际误差;②实际误差的绝对值;③平均误差程度;④可能误差范围。
27.抽样平均误差与抽样极限误差比较,一般来说()①大于抽样极限误差;②小于抽样极限误差;③等于抽样极限误差;④可能大于、可能小于、可能等于。
28.所谓小样本一般是指样本单位数()①30个以下;②30个以上;③100个以下;④100个以上。
29.点估计具体推断方法是( ) ①X x =,p=P,σ22=S ; ②X x =,p=P,σ22≠S ; ③X x =∆+,p+△=P,σ22=S ;④X x =∆±,p±△=P,σ22=∆±S 。
30.在区间估计中,有三个基本要素,它们是( )①概率度,抽样平均误差、抽样数目;②概率度、点估计值、误差范围;③点估计值、抽样平均误差、概率度;④误差范围、抽样平均误差、总体单位数。
31.对某单位职工的文化程度进行抽样调查,得知其中80%的人是高中毕业,抽样平均误差为2%。
当概率为95.45%时,该单位职工中具有高中文体程度的比重是( )①等于78%;②大于84%;③在76%与84%之间;④小于76%。
二、多项选择题1.抽样法是一种( )①搜集统计资料的方法;②对现象的总体进行科学估计和推断的方法; ③随机性的非全面调查的方法; ④快速准确的调查方法;⑤抽选少数典型单位所进行的调查方法。
2.抽样推断中的抽样误差( )①是不可避免要产生的; ②是可以通过改进调查方法来消除的;③是可以事先计算出来的;④只能在调查结束后才能计算;⑤其大小是可以控制的。
3.影响抽样误差的因素有( )①是有限总体还是无限总体; ②是重复抽样还是不重复抽样;③总体被研究标志的变异程度;④抽样单位数目的多少;⑤抽样组织方式不同。
4.抽样法的基本特点是( )①根据部分实际资料对全部总体的数量特征做出估计;②深入研究某些复杂的专门问题;③按随机原则从全部总体中抽选样本单位;④调查单位少,调查范围小,了解总体基本情况;⑤抽样推断的抽样误差可以事先计算并加以控制。
5.用抽样指标估计总体指标应满足的要求是( )①一致性;②准确性;③客观性;④无偏差;⑤有效性。
6.抽样平均误差( )①是抽样平均数(或抽样成数)的平均数;②是抽样平均数(或抽样成数)的平均差;③是抽样平均数(或抽样成数)的标准差;④是反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度; ⑤是计算抽样极限误差的衡量尺度。
7.要增大抽样推断的概率保证程度,可以( )①缩小概率度; ②增大抽样误差范围;③缩小抽样误差范围;④增加抽样数目;⑤增大概率度。
8.抽样方案的检查包括()①准确性检查;②及时性检查;③全面性检查;④代表性检查;⑤预测性检查。
9.在其它条件不变的情况下,抽样极限误差的大小和概率的保证程度的关系是()①允许误差范围愈小,概率保证程度愈大;②允许误差范围愈小,概率保证程度愈小;③允许误差范围愈大,概率保证程度愈大;④成正比关系;⑤成反比关系。
10.在一定误差范围的要求下()①概率度大,要求可靠性低,抽样数目相应要多;②概率度大,要求可靠性高,抽样数目相应要多;③概率度小,要求可靠性低,抽样数目相应要少;④概率度小,要求可靠性高,抽样数目相应要少;⑤概率度小,要求可靠性低,抽样数目相应要多。
11.抽样方案设计必须掌握的基本原则是()①随机原则;②可比性原则;③系统性原则;④可靠性原则;⑤效果原则。
三、填空题1.一般地说,用抽样指标估计总体指标应该有三个要求,这三个要求是:①;②;③。
2.抽样平均误差就是抽样平均数(或抽样成数)的。
它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的。
3.常用的抽样方法有抽样和抽样;抽样和抽样。
4.常用的抽样组织形式有,①、②、③、④、⑤。
5.误差范围(∆)、概率度(t)同抽样误差(μ)三者之间的关系是。
6.简单随机抽样的成数抽样平均误差计算公式是:重复抽样条件下用:;不重复抽样条件下用:。
7.影响样本规模的主要因素有:①;②;③;④。
8.对于简单随机重复抽样,若其他条件不变,则当误差范围∆缩小一半,抽样单位数必须倍,若∆扩大一倍,则抽样单位数为原来的。
9.点估计是直接用估计总体指标的推断方法。
点估计不考虑及。
10.区间估计是在一定的下,用以值为中心的一个区间范围估计总体指标数值的推断方法。
四、简答题1.什么是随机原则?在抽样调查中为什么要坚持随机原则?2.什么是抽样估计?它有什么特点?3.什么是抽样误差?影响抽样误差的因素有哪些?4.假定抽样单位数增加4倍、1.5倍时,随机重复抽样平均误差是如何变化的?当抽样单位数减少50%或减少30%时重复抽样的平均误差又如何变化?5.抽样估计的优良标准是什么?6.什么是极限抽样误差,它与概率度,抽样平均误差有什么关系?五、计算题1.进行随机抽样为使误差减少50%、10%和5%,抽样单位数应如何改变?2.某工厂4500名职工中,随机抽选20%,调查每月看电影次数,所得分配数次以上的比重,其误差不超过3%。
3.某地区采用纯随机抽样的方法,对职工文化程度进行调查,抽查100名职工,4.某煤矿对所生产的煤的灰份进行抽样测定,要求误差不超过0.1%,概率0.6827,根据下列两次抽样的结果所求得的方差,计算抽样调查所必要的抽样单⑴抽样年平均收入;⑵年平均收入的抽样平均误差;⑶概率为0.95时,职工平均收入的可能范围。
6.某日化工厂用机械大量连续包装洗衣粉,要求每袋按一公斤包装,为保证质量,生产过程中每隔8小时检验一小时产品,共检验20次,算出平均重量为1.005公斤,抽样总体各群间方差平均数0.002公斤。
计算⑴抽样平均误差;⑵要求概率99.73%,使产品的重量不低于1±0.03公斤为标准,问上述检验的产品能否合格?7.在500个抽样产品中,有95% 一级品。
试测定抽样平均误差,并用0.9545的概率估计全部产品一级品率的范围。
8.某乡1995年播种小麦2000亩,随机抽样调查其中100亩,测得亩产量为450斤,标准差为50斤。
现要求用100亩的情况推断2000亩的情况,试计算。
⑴抽样平均亩产量的抽样平均误差;⑵概率为0.9973的条件下,平均亩产量的可能范围;⑶概率为0.9973的条件下,2000亩小麦总产量的可能范围。