抽样的组织形式
抽样的方案有哪几种形式组成的
抽样的方案有哪几种形式组成的抽样的方案有哪几种形式组成的导言:在社会科学研究、市场调查、质量控制等领域,抽样是一种常用的数据收集方法。
通过抽取样本,研究人员可以对总体进行推断,从而节省时间和资源。
抽样的方案有多种形式组成,每种形式都有其独特的优势和适用场景。
本文将从简单随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样和方便抽样六个方面,详细介绍抽样的各种形式组成。
一、简单随机抽样简单随机抽样是最基础的抽样形式之一。
在简单随机抽样中,每个个体被抽到的概率是相等的,且相互独立。
简单随机抽样的步骤包括:确定抽样框架、指定抽样单位、随机抽取样本以及进行数据收集和分析。
简单随机抽样的优势在于操作简单、结果可靠,适用于总体分布均匀的情况。
二、系统抽样系统抽样是一种按照预定规则抽取样本的方法。
在系统抽样中,研究人员需要确定采样的间隔,即每隔多少个单位抽取一个样本。
系统抽样的优势在于操作简单、结果可靠,适用于总体分布均匀的情况,比简单随机抽样更加高效。
三、分层抽样分层抽样是将总体划分为几个层次,然后从每个层次中随机抽取样本。
分层抽样的目的是考虑到不同层次的差异性,确保样本能够充分代表总体的各个层次。
分层抽样的优势在于能够提高样本的代表性和准确性,适用于总体具有层次结构的情况。
四、整群抽样整群抽样是将总体划分为若干个群组,然后从每个群组中抽取全部个体作为样本。
整群抽样的优势在于操作简单、成本较低,适用于总体具有群组结构的情况。
然而,整群抽样可能导致样本的内部差异较大,需要进一步分析群组内个体的差异。
五、多阶段抽样多阶段抽样是将总体划分为多个阶段,然后从每个阶段中抽取样本。
多阶段抽样的优势在于能够充分利用分层抽样和整群抽样的优点,减少调查成本,适用于总体具有复杂结构的情况。
六、方便抽样方便抽样是一种根据研究者的方便性选择样本的抽样方法。
方便抽样的优势在于操作简单、成本低,适用于初步调研或是样本难以获取的情况。
然而,方便抽样往往产生偏倚,样本的代表性和准确性无法保证。
抽样的几种主要形式
3、分层随机抽样
类型随机抽样
将总体单位按其属性特征先分为若干层(即类型),然后在层中按随机原则抽取样本的随机抽样形式。
优点:同一类型中每个单位的差异较小,而且各种类型的情况都能包括在所抽取的样本之中,所以其代表性较高,抽样误差比简单随机抽样和等距随机抽样都要小。
抽样的几种主要形式
一、随机抽样形式
类型
别称
解释
优缺点及运用范围
1、简单随机抽样
纯随机抽样
按照随机原则从总体中不进行任何分组划类、排序等先行工作,直接地抽取调查样本。
是其他各种随机抽样形式的基础。一般用于总体单位数目不大的情况。
2、等距随机抽样
系统抽样
或机械抽样
将总体各单位按某一标志顺序排列,按一定间隔距离抽取样本的随机抽样形式。
优点:方便省力,简单易行。
缺点:样本的代表性差,有很大的偶然性。
2、判断抽样
立意抽样,在我国被很多人称为典型调查
研究者依据主观判断选取有代表性的对象作为样本,这种样本的代表性取决于研究者对总体的了解程度和判断能力。
优点:总体规模小,所涉及范围较窄时,样本的代表性较好。
缺点:反之,代表性不佳。一般说,它所获的样本资料不具有推断总体的品格。
4、整群随机抽样
聚类随机抽样
将总体划分为若干群,以群为单位从总体中随机抽取若干群,再对抽中的群内各单位实行普查的随机抽样形式。
优点:被调查单位集中在少数群里,便于组织调查。节省人力、物力、财力。
缺点:由于样本过分集中在少数群内,在总体中分布不均,因此,代表性较差。
5、多阶段随机抽样
一种综合整群抽样和其他元素级抽样(如简单随机抽样、等距抽样、分层抽样)于一身的抽样形式,它把从调查总体中抽取样本的过程分成两个或两个以上阶段进行。
抽样方案设计
统计学
(二)分层抽样
分层抽样也称类型抽样或分类抽样,它是先将总体的N个单位按 某一标志分为K层,每层包含Ni个单位(i=1、2、···k),然后 ,按一定要求分别从每层随机抽取ni个单位,构成总容量为n的 样本,以样本的观测结果推断各层的数量特征和总体数量特征的 一种抽样组织形式。
抽样方案设计
(三)等距抽样
统计学
抽样方案设计
一、抽样方案设计的基本原则 1、保证实现抽案设计
二、抽样调查组织形式
(一)简单随机抽样
简单随机抽样又称纯随机抽样或完全随机抽样。它是直接从 总体 N个单位中完全随机地抽取 n个单位,并使总体中每一个单 位都有一定被抽中概率的抽样组织形式,在直观上看,这是种最 符合随机原则、最基本、最简单的抽样组织形式。
抽样方案设计
(四)整群抽样
整群抽样也称集团抽样,它是当总体的所有基本单位自然组 合为或被划分为若干个群后,从中随机抽取部分群并对抽中群内 的全部基本单位进行调查的一种抽样组织形式。
(五)多阶段抽样
多阶段抽样(也称多级抽样),就是把抽取样本的过程分为 两个或更多个阶段进行。先从总体中抽选若干大的样本单位,也 叫第一阶段抽样;然后,从被抽中的若干大的单位中抽选较小的 样本单位,也叫第二阶段抽样;依此类推,直到最后抽出基本调 查单位。
等距抽样也叫系统抽样或机械抽样,它是在总体N个单位按某 一标志排队后,从头到尾编上1~N的号码,并等分成n段,每段 包含K个单位,然后在第一段的K个单位中随机抽取一个单位 ( 设为第i号,1≤i ≤ K),作为起点单位,以后每隔一定的间隔抽 取下一个单位,共抽取n个单位构成样本的抽样组织形式。n个 单位观测值的统计结果作为总体参数的估计值。
抽样调查的意义理论依据与组织形式
0.98 (1 0.98) 1.14% 150
若按不重复抽样方式:
p
p(1 p) (1 n )
n
N
0.98 (1 0.98) (1 150 ) 1.1374%
150
15000
例:估计某乡粮食亩产量,从5000亩中随机抽取100
亩,计算得出样本平均亩产量为450公斤,方差780 公斤,则粮食平均亩产量的平均抽样误差是多少?
25
0
0
5
25
10
100
15
225
0
0
5
25
10
100
15
225
20
400
-
2 500
(xX )2
抽样平均误差( )
x
n
2500 10(元) 25
(n为样本配合总数)
以上资料编成次数分配表如下:
x
样本数f (即次数分配)
10
1
15
2
20
3
25
4
30
5
35
4
40
3
45
2
50
1
合计
25
2
(x X) f f
x
n
10
五、纯随机抽样的抽样平均误差
(一) 平均数的抽样平均误差 1.重复抽样
x
n
或 2
x
n
取得σ的途径有:
1. 用过去全面调查或抽样调查的资料,若同时有n个σ
的资料,应选用数值较大的那个;
2. 用样本标准差S代替全及标准差σ;
3. 在大规模调查前,先搞个小规模的试验性的调查来
确定S,代替σ;
n
第七章 抽样调查
数据计算出样本均值(平均耐用时间)
x=1055小时,样本成数(合格率) p=91% 依据样本统计量可以对总体参数进行估 计(估计方法将在第三节介绍)。
六、抽样推断的基本原理
样本指标 1、理论基础: 大数定律 中心极限定理 2、抽样估计的基本要求:
无偏性、有效性、一致性
总体指标
第二节 抽样组织方式
对无限总体不能采用全面调查。
另外,有些产品的质量检查具有破坏性,不可能进行全面调
查,只能采用抽样调查。 从理论上讲,有些现象虽然可以进行全面调查,但实际上没 有必要或很难办到,也要采用抽样调查
抽样调查可以用于工业生产过程的质量控制。
三、抽样推断的内容
(一)参数估计。特点是不知道总体的数量特征,
X
x
2
K
p
P p
K
2
抽样平均数平均误差的计算公式:
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正 比,与样本容量成反比。(当总体标准差未知 时,可用样本标准差代替)
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
1 则: x 0.577 3n 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。 抽样单位数增加 0.5倍,即为原来的 1.5倍
则:
1 x 0.8165 1.5n 1.5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165 倍。
例:某施工班组5个工人的日工资分别为:34、38、
例:
某厂生产一种新型灯泡共2000只,随机抽出400只作耐 用时间试验,测试结果平均使用寿命为4800小时,样 本标准差为300小时,求抽样推断的平均误差? 已知:
抽样估计样本容量与抽样组织形式
n
t 2 2
2
x
• 若采用不重复抽样,也可确定必要的抽样数目:
•
n
NZ
2
2
2
N 2 z 2 2
x
2
1
n
t 2 2
2
x
2
n
t 2 2 N ( x )2 N t 2
2
3
1、 估计总体均值的样本容量
设样本均值与总体均值之间的允许误差
为 x ,已知总体方差时 ,在1 的置信
度下,估计总体均值时的样本容量为:
均每瓶101.5片,标准差为3片。试以99.73%的把握程度推断成品库
该种药平均每瓶数量的置信区间,如果允许误差减少到原来的 ,
其他1条件不变,问需要抽取多少瓶?
2
已知: n 100,x 101 .5(瓶),S=3(片),t=3
则: 3 0.3片
x
n
100
x t x 3 0.3 0.9(片)
12
面向21世纪 课程教材
第四章
抽样与抽样估计
第二节 三
• 从上述公式和例题可见,必要的抽样数目受以 下因素影响:
• (1)总体方差(或总体标准差)。
• (2)允许误差范围。
• (3)置信度(1-a)。
• (4)抽样方法。
• (5)抽样组织方式。
13
1、总体的变异程度高低(总体方差的大小)
其它条件不变的条件下,总体单位的差异程度大, 则应多抽,反之可少抽一些。
面向21世纪 课程教材
第四章
抽样与抽样估计
第二节 三
三、抽样容量的确定
• 样本容量是指样本中含有的总体单位数。一般把
抽样数目大于30的样本 称为大样本,而把抽样数 目小于30的样本称为小样本。对社会经济现象进 行抽样调查一般采用大样本。
抽样调查中的基本概念
这个定理告诉我们:在大样本情况下样本成数p近似服从
正态分布,记作
p
~N
P
,P(1- n P)
。
统计学
2、总体的分类
按单位标志的性质不同:分为变量总体和属性总体两种。
如果构成总体的每个单位标志的具体表现是用标志值表示 ,这种总体就是变量总体。
如果构成总体的每个单位的具全表现是用文字表示,这种 总体就是属性总体。
通常用符号N表示总体中的单位数量。
抽样调查中的基本概念
(二)样本(也称样本总体)
它是从全及总体中随机抽取出来的,用来代表全及总 体的那一部分单位的集合体。
(一)总体参数
1、什么是总体参数?
在抽样调查中,用来反映总体数量特征的总体指标,也称为总 体参数。
研究目的一经确定,总体也就唯一地确定了。所以总体指标 的数值是客观存在的、确定的、未知的,需要用样本资料去估计 推断的。分析一个总体常常可运用多个总体指标,通常所需要估 计的总体参数有总体平均数、结构相对指标、总体方差或总体标 准差等。
方差: P P(1 P)
标准差: P P(1 P)
X
1 0 合计
表7-1 属性总体平均数和方差计算表
F
F
X
F
F
(X X )2
(X X )2 F
F
P
P
(1−P)2
Q2P
Q
0
(0−P)2
P2Q
1
P
—
PQ
抽样调查中的基本概念
(二)样本统计量
1、什么是样本指标
根据样本资料计算的指标称为样本指标,又称为样本统计量
B
n N
N2
抽样调查中的基本概念
统计学课件:抽样推断
3.当总体X~N(, 2),从中抽取容量为n的样本,则
n
2
(n 1)s2
2
~
(2 n-1); 2
(xi x)2
i 1
2
~
(2 n-1)
4. 2—分布的性质 (1)分布可加性 若X ~ 2(n1),Y~ 2(n2 ), X,Y独立,则 X +Y ~ 2(n1+n2 ) (2)期望与方差 若X~ 2(n),则 E(X)= n,D(X)=2n
3、进行产品质量检验 4、进行假设检验
(一)总体和样本 1、总体 总体也称全及总体,指所有认识的研究对象全体,它是
有所研究范围内具有某种共同性质的全体单位所组成的 集合体。 一般用英文字母大写N来表示总体的单位数。 2、样本 样本又称子样,它是从全及总体中随机抽取出来,作为 代表这一总体的那部分单位组成的集合体。 一般用英文小写字母n来表示样本的单位数。
5. 分位点 设X ~ 2(n),若对于:0<<1,
存在 2 (n) 0 满足
P{X 2 (n)} ,
则称 2 (n) 为 2 (n) 分布的上分位点。
2
(n
)
(二)t 分布
若X 服从N (0,1),Y 服从自由度为n的 2分布, 且X 和Y 独立,则 X
Y /n 服从自由度为n的 t分布。
1、全及指标 根据各单位的标志值或标志属性计算的,反映总体
数量特征的综合指标称为全及指标,又称为参数。
设总体变量 X 为: X1, X 2 ,X N 则有:
X X XF N F
2 X X 2 X X 2 F
N
F
设总体 N 个单位,有 N1 个单位具有某种性质, N0 个单位不具有某种性质,
概率抽样的组织方式
概率抽样的组织方式
答:概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
调查的实践中经常采用的概率抽样方式有以下几种:
(1)简单随机抽样。
简单随机抽样指从包括总体N个单位的抽样框中随机地、逐个地抽取n个单位作为样本,每个单位入样的概率是相等的;
(2)分层抽样。
分层抽样是指将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计;
(3)整群抽样。
整群抽样是指首先将总体中若干个单位合并为组,这样的组称为群,抽样时直接随机抽取一个群,然后对中选群中的所有单位全部实施调查;
(4)系统抽样。
系统抽样是指将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位;
(5)多阶段抽样。
采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查;因为取得这些接受调查的单位需要两个步骤,所以将这种抽样方式称为二阶段抽样;这里,群是初级抽样单位,第二阶段抽取的是最终抽样单位。
将这种方法推广,使抽样的段数增多,就称为多阶段抽样。
(完整版)自考00974统计学原理-大纲
第一节计数活动与统计学的产生一、人类的计数和统计活动人类最初的计数活动,主要表现在对人们的剩余劳动成果或其视线所及的劳动对象加以清点和计量。
这就决定了计数本身只是一种零散的、无组织的、非经常性的和范围有限的个人活动。
(P2 )二、统计学的产生与发展一般认为,统计学的产生与发展有三个影响源泉(识记):即英国的政治算术(配第、格朗特)德国的国势学(康令、阿亨瓦尔)和法国的概率统计。
凯特勒将三者加以融合,形成近代统计学。
(P7 )(一)英国的政治算术(1)创始人:配第、格朗特(2)产生的背景:当时英国统治阶级为了管理国家、发展经济、争夺世界霸权,需要了解国内外的社会经济状况,于是在英国产生了政治算术学派。
(3)从数量方面研究社会经济现象。
(二)德国的国势学(1)创始人:康令、阿亨瓦尔(2)产生的背景:当时德国正处于封建制度解体时期,统治者要了解国内外政治经济情况,决定国策,在当时封建制的德国产生了国势学派。
(3)研究方法:对国家重要事项的记述,几乎完全偏重于品质方面而忽视了量的分析。
因此,国势学也被人们称为是有名无实的统计学。
(三)概率论与数理统计(1)创始人:凯特勒(2)产生背景:当时的资本主义国家的自然科学有了很大的发展,促使英美统计学界尝试用研究自然地方法研究社会经济现象,并引入了概率论,产生了数理统计学派。
(3)研究的方法:把概率论用到统计学,确定大数法则的原理分析社会经济现象复杂不定的偶然性,从中寻找其规律性。
(4)凯特勒将统计学的三个主要源泉加以融合、统一,形成和发展了近代统计学。
(四)现代统计学的发展趋势1、统计理论和方法不断得到完善和深化。
2、计算机的使用和统计软件的问世强化了统计计算的手段。
3、通用方法论科学的属性更加突出。
第二节统计的涵义和应用统计的含义和作用(P8 ,简答题)汉语“统计”一词的涵义(理解)包括三个方面的内容,即统计工作、统计资料和统计学。
统计工作:是指对客观事物总体数量方面进行计量、核算和分析的活动及过程。
抽样调查的组织形式
实例2答案:
产业类别 第一产业 第二产业 第三产业 合 计 总体单位数 10,000 30,000 50,000 90,000 样本单位数 100 300 500 900
等比例分配法考虑了各类型组规模不 等的因素,大的类型组多抽,小的类型组 少抽,有利于减少人为的抽样偏差,且计 算操作很方便。所以,实际工作中应用很 普遍。
小结:
抽样调查的组织形式有:简单随机抽样, 类型抽样,等距抽样,整群抽样。 抽样调查的组织方式完全取决于调查研究 的目的要求、调查对象的特点和客观的条 件。凡是能够最经济、最省时而又能够满 足预期精确度和可靠性要求的组织方式, 便是一种好的组织方式,这也是抽样设计 的最根本的原则。
思考题:
实例1表答案:
产业类别 总体单位数 样本单位数
第一产业 第二产业 第三产业
合 计
10,000 30,000 50,000
90,000
300 300 300
900
2、等比例分配
按各类型组在总体中所占的比 例分配样本单位数,使各类型组中 抽取的单位数占各类型组单位数的 比例相等。
实例2表:
产业类别 第一产业 第二产业 第三产业 合 计 总体单位数 10,000 30,000 50,000 90,000 样本单位数
注意:
当总体内部差异较大时,简单随机抽 样方法也不能保证抽中的样本单位在总体 中有较均匀的分布,以致抽样误差偏大。 因此,这种抽样方式限于总体规模不大, 内部差异也不很大的情况。
(二)类型抽样
类型抽样也称分层抽样,它是将总体全 部单位按照某个标志分成若干个类型组,然后 从各类型组中采用简单随机抽样方式或其他方 式抽取样本单位。 各类型组中样本数的分配,通常有以下三 种方法: 1.等额分配 2.等比例分配 3.最优分配
抽样的组织形式
抽样的组织形式为了保证从抽样结果能比较正确的推断出总体的数量特征,抽样时需要尽量遵守随机性原则。
但是,在实践中由于具体条件的影响尤其是总体分布特征等因素的限制,要完全保证随机性原则是很困难的。
因此,在抽样的时候必须根据所研究总体的特征和研究目的的要求,对抽样的程序和方法进行周密的设计和安排,这就称为抽样设计或抽样的组织形式。
常用的组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样等。
一、简单随机抽样(一)简单随机抽样的含义简单随机抽样又称纯随机抽样,不对总体做任何加工整理,按随机原则直接从总体中抽取调查单位的一种抽样调查方式。
简单随机抽样是最常用的一种抽样方式,但它必须满足两个条件:一是代表性,即要求样本分部与总体分布相同;而是独立性,即要求样本各单位相互独立。
简单随机抽样操作简单,易于掌握。
当总体单位数较少且标志变异程度不大时,或具有某种特征的单位均匀的分布在总体各部分时,可以采用这种组织形式;当总体标志变异程度较大时,这种方法所抽取的样本可能缺乏代表性,抽样误差就会较大。
(二)简单随机抽样的方法1、直接抽取法就是直接从调查对象中随即抽选。
例如:从水池中直接抽选一定数量的水进行化验;从仓库的不同位置抽取一定数量的产品样本进行检验等。
2、抽签法首先将总体单位按自然数的顺序编号为1.2.3……N,即总体共有几个总体单位就编几个标签。
然后将这些标签摇匀,根据需要按重复抽样和不重复抽样的方法,从中随即抽取n个标签作为样本单位进行研究。
3、随机数字表法这种方法首先要对总体各单位进行编号,然后在随机数字表中任选一个数字开始向任何方向数,遇到属于总体单位编号范围内的数字号码就确定为样本单位,一直到抽够预定的单位数为止。
若是不重复抽样,则碰上重复的数字就舍去,并继续往下数。
举例:二、类型抽样(一)类型抽样的含义类型抽样又叫分层抽样或分类抽样。
是先将总体单位按一定的标志分组,然后在各组中随机抽取样本的抽样组织方式。
统计学第六章抽样调查
标 差 总 标 差 、 本 准 s 准 : 体 准 σ 样 标 差
总体参数和样本统计量符号
总体指标符号 总体容量: N 总体平均数: µ 总体成数: P 总体方差: σ2 总体标准差: σ 样本指标符号 样本容量: n 样本平均数: x 样本成数: p 样本方差: S2 样本标准差: S
抽样组织形式
抽样估计效果好坏,关键是抽样平均误差的 抽样估计效果好坏,关键是抽样平均误差的 抽样平均误差 控制。抽样平均误差小, 控制。抽样平均误差小,抽样效果从整体上 看就是好的;否则,抽样效果就不理想。 看就是好的;否则,抽样效果就不理想。 抽样平均误差受以下几方面的因素影响: 抽样平均误差受以下几方面的因素影响:
抽样调查的基本概念 抽样调查的基本概念 重复抽样和不重复抽样
重复抽样:又称有放回的抽样 有放回的抽样,从总体中 重复抽样 有放回的抽样 抽取样本时,每次被抽中的单位都再被 放回总体中参与下一次抽样。 不重复抽样:又称无放回的抽样 无放回的抽样,总体中 不重复抽样 无放回的抽样 随机抽选的单位经观察后不放回到总体 中,即不再参加下次抽样。
µ ( p) =
P (1 − P ) n
不重复抽样条件下: 不重复抽样条件下: 条件下
µ ( p) =
P (1 − P ) n (1 − ) n N
抽样极限误差
样本平均数的抽样极限误差: 样本平均数的抽样极限误差:以绝对值形式 表示的样本平均数的抽样误差的可能范围, 表示的样本平均数的抽样误差的可能范围, 用符号表示为: 用符号表示为:
样本成数
从成数总体中抽取样本容量为n的样本 从成数总体中抽取样本容量为 的样本 样本中具有此种特征的单位占全部样本单位 数的比例称为样本成数,记作p 数的比例称为样本成数,记作p p=n1/n
6抽样调查
p(1 p) n 0.04 0.96 1 1 1 n 200 20 N
1.35%
P t p 1.961.35%, 2.65% p p P p p ,4% 2.65% 4% 2.65% 1.35% P 6.65%
x 2
n
n
, 为总体标准差
b.在简单随机不重复抽样条件下
x 2 N n
,为总体标准差 n N 1
当N很大时,
x 2
n 1 ,为总体标准差 n N
12
(2)样本成数的抽样平均误差 a.在简单随机重复抽样条件下
P(1 P) p ,P为总体成数 n
27
五、抽样估计方法 1. 点估计
直接用样本指标值作为相应总体指标的估计值, 也称为定值估计。 总体平均数估计值: X x 总体成数估计值: P p
28
总体方差估计值:
2 ( x x ) i
总体平均数方差
s
2 2
n 1
(当 n小于30时)
2 ( x x ) i
b.在简单随机不重复抽样条件下
P
P(1 P) N n ,P为总体成数 n N 1
当N很大时,
P(1 P) n P 1 ,P为总体成数 n N
13
总体标准差、总体成数的数据来源 计算抽样平均误差时,必须具备总体标准差和 总体成数的信息,但是这是不可能的!(为什么?)
2
二、抽样调查的特点
1.非全面调查
2.遵循随机原则抽取调查单位
3.根据样本指标数值推断总体指标数值 4.抽样误差可以事先计算并加以控制
抽样组织
第十章抽样组织一、本章重点1.保证实现抽样的随机性的原则和保证实现最大的抽样效果的原则是抽样方案设计的基本原则。
代表性的检查和准确性的检查是抽样方案检查的两个方面。
编制抽样框的目的是将总体所有单位置于可以被抽中的位置上,易于进行抽选工作,提高抽样调查的效果。
2.简单随机抽样是抽样调查的基本形式。
重点掌握重复抽样的必要抽样数目的确定。
等距抽样又称为机械抽样或系统抽样,可分为随机起点等距抽样、半距起点等距抽样、随机起点对称等距抽样。
它没有专门计算误差的公式,只能用简单随机抽样的公式来代替。
但它比简单随机抽样的误差要小。
3.类型抽样又叫做分层抽样。
是分组法和抽样原理的结合。
在分组时要坚持层内的齐一性和层间的差异性。
必须掌握类型抽样的估计量的计算和推断步骤。
在同样的情况下它比简单随机抽样的误差小。
4.整群抽样在进行分解时要注意群间的齐一性和群内的差异性。
由于抽选单位比较集中,调查较为方便。
掌握整群抽样的估计量和平均误差的计算。
5. 在多阶段抽样中,前几个阶段的抽样都类似于整群抽样。
每个阶段都会存在抽样误差。
为提高抽样结果的代表性,抽取的群数和抽样方式,都应注意样本单位的均匀分布。
对于群间方差大的阶段,应适当多抽一些,反之,则可以少抽一些。
每阶段的抽样方式可用简单随机抽样或等距抽样。
二、难点释疑1.由于类型抽样对于各组来讲属于全面调查,对于每组内部来说属于抽样调查。
所以,类型抽样的抽样误差仅与组内方差有关,与组间方差无关。
与类型抽样正好相反,整群抽样对于组与组之间来讲属于抽样调查,对于中选群内部来讲属于全面调查,因此,整群抽样与组内方差无关与组间方差有关。
2.必须澄清几个模糊认识。
简单随机抽样最符合随机抽样的原则,但是其误差不一定比其它调查方式小,在具体组织时也有困难;坚持随机原则照样存在着代表性误差;抽样误差最小的方案不一定是最好的调查方案,必须和一定的调查费用联系起来;多阶段抽样的阶段分得越多误差不一定就越小。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样的组织形式
为了保证从抽样结果能比较正确的推断出总体的数量特征,抽样时需要尽量遵守随机性原则。
但是,在实践中由于具体条件的影响尤其是总体分布特征等因素的限制,要完全保证随机性原则是很困难的。
因此,在抽样的时候必须根据所研究总体的特征和研究目的的要求,对抽样的程序和方法进行周密的设计和安排,这就称为抽样设计或抽样的组织形式。
常用的组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样等。
一、简单随机抽样
(一)简单随机抽样的含义
简单随机抽样又称纯随机抽样,不对总体做任何加工整理,按随机原则直接从总体中抽取调查单位的一种抽样调查方式。
简单随机抽样是最常用的一种抽样方式,但它必须满足两个条件:一是代表性,即要求样本分部与总体分布相同;而是独立性,即要求样本各单位相互独立。
简单随机抽样操作简单,易于掌握。
当总体单位数较少且标志变异程度不大时,或具有某种特征的单位均匀的分布在总体各部分时,可以采用这种组织形式;当总体标志变异程度较大时,这种方法所抽取的样本可能缺乏代表性,抽样误差就会较大。
(二)简单随机抽样的方法
1、直接抽取法
就是直接从调查对象中随即抽选。
例如:从水池中直接抽选一定数量的水进行化验;从仓库的不同位置抽取一定数量的产品样本进行检验等。
2、抽签法
首先将总体单位按自然数的顺序编号为1.2.3……N,即总体共有几个总体单位就编几个标签。
然后将这些标签摇匀,根据需要按重复抽样和不重复抽样的方法,从中随即抽取n个标签作为样本单位进行研究。
3、随机数字表法
这种方法首先要对总体各单位进行编号,然后在随机数字表中任选一个数字开始向任何方向数,遇到属于总体单位编号范围内的数字号码就确定为样本单位,一直到抽够预定的单位数为止。
若是不重复抽样,则碰上重复的数字就舍去,并继续往下数。
举例:
二、类型抽样
(一)类型抽样的含义
类型抽样又叫分层抽样或分类抽样。
是先将总体单位按一定的标志分组,然后在各组中随机抽取样本的抽样组织方式。
适用于总体内部各单位在被研究标志上有明显差别的抽样。
例如:研究农作物产量时,可以先按照地形条件分为山地、丘陵、平原三层,然后在各层中抽选样本单位;再如,研究职工工资水平时,可以先按照行业性质分为金融业、公务员、服务业、工业企业等,然后在每组里再随机抽选样本单位。
类型抽样实质上是统计分组和随机抽样的有机结合,这样可以保证样本对总体具有更高的代表性,计算出来的误差也相对较小。
类型抽样的基本原则是:分组时应尽量使组内差异小而组间差异大。
(二)类型抽样的方法
1、等比例抽样
就是从各层中按相同的比例抽取样本单位数。
样本单位数在各层的分配比例同总体单位在各层的分配比例相同。
等比例分层抽样法比较简便,而且抽样误差、总体指标的推断都比较简单,因此这种方法用的比较多。
2、不等比例抽样
是从各组中按不同的比例抽取样本单位数。
当组内标志值差异较大时,抽取的样本多一些;当组内标志值差异程度较小时,可以少抽取一些样本。
3、等数分层抽样
就是每组抽取相同数量的样本单位数。
对于总体中各组标志值相差不大时,用这种方法比较简单。
三、等距抽样
(一)等距抽样的含义
等距抽样又称系统抽样或机械抽样,是先按某一标志对总体各单位进行排队,然后每个一定的间隔抽取一个样本,直至抽够所要求的样本单位为止。
等距抽样的优点:将样本均匀的分布在总体中,提高了样本的代表性。
应用:目前,我国在农村经济抽样调查、城市住户抽样调查、人口抽样调查和产品质量抽样检验等方面广泛地采用了等距抽样。
举例:从10000名学生中随机抽取10%(1000名)进行消费状况的调查。
首先,对着10000名学生先按一定标准进行排序(可以按专业、学号,可以按姓氏笔画,可以按入学成绩),然后按照10%的比例也就是10个人里边抽取一个学生,也就是说间隔是10。
如果第一个间隔内(1~10号)选中了5号,则第二个间隔内应选(5+10=)15号,以此类推,直至选够1000名为止。
(二)等距抽样的分类
1、无关标志排队法
对总体排队时所依据的标志不是所要调查的标志,或者跟所要调查的标志无关或基本无关时,这种排队方法称为无关标志排队法。
例如:上例中研究学生消费状况时对学生总体按照学号、入学成绩进行的排队就是无关标志排队法。
2、有关标志排队法
对总体排队时所依据的标志是所要调查的标志,或与所要调查的标志有一定关系时,这种排队的方法就称为有关标志排队法。
例如:研究总体学生学习成绩时,对总体学生按照入学成绩进行的排队;再如,研究职工家庭生活水平时,对职工按照工资水平的高低进行的排队。
四、整群抽样
整群抽样也称分群抽样或集团抽样,是将总体中的单位按一定的标志或要求分成若干群,然后以群为单位,随机抽取几个群,对已抽中的群进行全面调查的一种抽样方式。
划分群的原则:第一,群与群之间不重叠,即总体内的任何一个总体单位只能归属于某一个群。
第二,总体单位毫无遗漏,即总体中任何一个总体单位必须归属到某一个群。
整群抽样的群,主要是自然形成的,如行政区域、地理区域等。
抽样的可靠度:如果群与群之间的差异较小而抽取的样本群较多时,抽样误差就小;如果群与群之间的差异较大,而抽取的样本群较少时,抽样误差就较大。
例如:对某市居民的月收入进行调查,采用整群抽样,就可以按行政区划分为不同街道,然后随机抽取一些街道,进行全面调查。
五、多阶段抽样
前面所介绍的几种抽样方式都是从总体中进行一次抽样就产生了样本的抽样方式,这是单阶段抽样。
但在实际中,总体包括的单位数很多,分布很广,也很复杂,要想通过一次抽样就得到比较完美的样本是很困难的,此时,可以将整个抽样过程分为几个阶段,然后逐阶段进行抽样,最终得到所需要的有代表性的样本,这就是多阶段抽样。
例如:对我国居民家庭收支情况进行调查,第一阶段可以先抽取调查城市,第二阶段再从这些城市中抽选住户,调查每户的月收支情况。
再如,我国农产量调查就是采用多阶段抽样调查,即先从省中抽县,再从选中的县抽乡,再从选中的乡抽村,再从选中的村抽地块,最后从选中的地块中抽取小面积的样本单位。