不等概率抽样的分类

合集下载

(硕)《抽样技术》第三讲 等概率与不等概率抽样比较研究

(硕)《抽样技术》第三讲  等概率与不等概率抽样比较研究

三、严格的πPS抽样
n是固定的;一阶包含概率与单 是固定的; 位规模大小严格成比例, 位规模大小严格成比例,即
πi = nZi
1.当 n = 2 的情况下 1.当 布鲁尔估计法: 布鲁尔估计法: 要求: 要求:总体中最大的单位必须小 于全部单位大小总和的 1 2
记第一个被抽取的单位为i 记第一个被抽取的单位为i,第一个单位 成比例的概率抽取。 按与 Z i (1 − Z i ) 成比例的概率抽取。
设从总体中不放回地抽去 n 个 单位, 单位, 令 π i 为第 i 个单位入样的概率 (一阶包含概率). 一阶包含概率). π ij 为第 i 和第 j 个单位同时入 样的概率(二阶包含概率). 样的概率(二阶包含概率).
1. 霍维茨 汤普森估计量 霍维茨-汤普森 汤普森估计量
总体总值的估计量 X ˆ 估计量的方差为
2
( )
ˆ xi XHH M = ∑ m − M n ( n −1) i=1 i 0
第三节 不重复的 不等概率抽样
一、基本概念 1. πPS 抽样:不放回的与单元规模 抽样:
大小成比例的概率抽样称为严格的
πPS 抽样。 抽样。
2. 在不重复的不等概率抽样中,总 在不重复的不等概率抽样中, 体中的每个单位每次被抽中的概率 为 Zi 。
两个单位同时入样概率称为 二阶包含概率。 二阶包含概率。
包含概率的性质: 包含概率的性质:
(1)
∑π
i =1 N
N
i
=n = ( n − 1) π i
(2)
∑π
i≠ j N
ij
1 ∑∑i π ij = 2 n ( n − 1) (3) i =1 j >
N

抽样技术7不等概率抽样

抽样技术7不等概率抽样

抽样技术:7不等概率抽样1. 引言在进行数据分析和统计研究时,抽样是一种常用的技术。

抽样技术允许我们从总体中选择一个样本,以便推断总体的性质。

在抽样技术中,不等概率抽样是一种常见的方法,它允许我们以非均匀的概率抽取样本。

本文将介绍关于7种不等概率抽样方法的详细信息。

2. 简单随机抽样简单随机抽样是最根本的抽样方法之一,它要求每个个体被选中的概率相等且任意组合都是可能的。

然而,在某些情况下,简单随机抽样可能并不适用,例如当总体分布不均匀时,或者我们希望在样本中增加一定的多样性。

这时,我们可以考虑使用不等概率抽样方法。

3. 整群抽样整群抽样是一种不等概率抽样方法,它将总体划分为假设干个互不重叠的群组〔或称为簇〕,然后从每个群组中抽取样本。

整群抽样可以有效地减少抽样过程中的复杂性,并提高样本的效率。

整群抽样常用于调查社会群体或大型组织等场景。

4. 分层抽样分层抽样是一种根据总体特点进行划分的抽样方法,它将总体划分为假设干个层级或相似的子群〔层〕,然后从每个层中抽取样本。

通过分层抽样,我们可以保证样本在各层中的分布情况与总体相似,从而更为准确地推断总体的特征。

5. 系统抽样系统抽样是一种按照固定间隔选择样本的抽样方法。

它类似于简单随机抽样,但是通过定义一个间隔,我们可以按照一定的规律抽取样本。

例如,我们可以在总体中选取每隔一定数量的个体作为样本。

系统抽样在样本大小较大时表现出较高的效率。

6. 按比例分层抽样按比例分层抽样是一种常用的不等概率抽样方法,它根据总体各层的比例确定各层的样本容量。

比例分层抽样可以使得样本在各层中的分布与总体的比例相对应。

这种抽样方法适用于总体中的各个层存在不同比例的情况。

7. 两阶段抽样两阶段抽样是一种复杂的不等概率抽样方法,它将抽样过程分为两个阶段。

在第一阶段,我们从总体中选择一局部群组〔或称为簇〕,在第二阶段,我们从每个群组中抽取一定数量的样本。

两阶段抽样适用于总体较大或分布复杂的情况下,可以提高抽样的效率。

抽样技术期末复习总结资料金勇进版抽样技术考前点题整理

抽样技术期末复习总结资料金勇进版抽样技术考前点题整理

抽样技术期末考前点题整理【第一章绪论】一、概念类1、非概率抽样有哪些常见的类型?答:(1)判断选样(2)方便抽样(3)自愿样本(4)配额抽样2、抽样调查的作用有哪些?答:(1)节约费用(2)时效性强(3)可以承担全面调查无法胜任的项目(4)有助于提高调查数据的质量3、抽样调查与普查之间的关系是什么?答:(1)抽样调查可以作为普查的补充(2)抽样调查可以对全面统计资料进行评估和修正(3)利用抽样调查可以进行深层次的分析(4)利用抽样调查可以提前获得总体目标量的估计(5)普查可以为抽样框提供资料4、目标总体和抽样总体之间的关系是什么?答:(1)目标总体:是指所研究对象的全体,或者是研究人员希望从中获取信息的总体,它由研究对象中所有性质相同的个体所组成,组成目标总体的个体称作总体单元或单位。

(2)抽样总体:是指从中抽取样本的总体。

(3)关系:通常情况下,抽样总体应与目标总体完全一致,但实践中二者常不一致。

5、什么是抽样框?其有哪些类型?一个好的抽样框的基本标准是什么?答:(1)什么是:抽样总体的具体表现是抽样框。

通常,抽样框是一份包含所有抽样单元的名单。

给每个抽样单元编上一个号码,就可以按一定的随机化程序进行抽样。

对抽样框的基本要求是其应该具有抽样单元名称和地理位置信息,以便调查人员能够找到被选中的单元。

(2)类型[1] 名录框[2[ 区域框[3] 自然框(3)基本标准[1] 抽样框与目标总体保持一致[2] 能够提供与调查目的有关的尽可能多的准确、完整的辅助信息6、什么是抽样误差和非抽样误差?抽样误差的表现形式有哪些?答:(1)抽样误差:是指由抽取样本的随机性所造成的样本值与总体值之间的差异。

只要采用抽样调查,抽样误差就不可避免。

(2)非抽样误差:是相对于抽样误差而言的。

它的产生不是由于抽样误差的随机性,而是由于其他多种原因引起的估计值与总体参数之间的差异。

(3)抽样误差的表现形式[1] 抽样实际误差[2] 抽样标准误[3] 抽样极限误差7、抽样调查的步骤有哪些?答:(1)第一步:确定调研问题(2)第二步:设计抽样方案(3)第三步:问卷设计(4)第四步:实施调查过程(5)第五步:数据分析处理(6)第六步:撰写调研报告8、与非概率抽样相比,概率抽样有哪些优点?答:(1)样本的抽取遵循随机性原则(2)可以运用概率估计的方法对总体数量特征进行推断(3)抽样误差可以计算并加以控制9、概率抽样的特点有哪些? 答:(1)按一定的概率以随机原则抽取样本(2)每个单元被抽中的概率是已知的或者是可以计算出来的(3)当用样本量对总体目标量进行估计时,要考虑到该样本被抽样的概率【第二章 简单随机抽样】一、概念类1、简单随机抽样的抽取规则是什么? 答:(1)按随机原则取样,在取样时排除任何主观因素选择抽样单元,避免任何先入为主的倾向性,防止出现系统误差。

三阶段不等概率抽样设计

三阶段不等概率抽样设计

三阶段不等概率抽样设计
三阶段不等概率抽样设计是一种常用的抽样方法,用于从整体群体中选择代表性样本。

它将样本选择过程分为三个阶段,每个阶段的概率不等,具体步骤如下:
1. 第一阶段:按照一定的抽样概率,从总体中选择第一阶段的样本单元。

这可能涉及到某些抽样单元的非选择或重复选择,以达到样本的多样性。

2. 第二阶段:在第一阶段选择的样本单元中,按照一定的概率再次进行抽样,选择第二阶段的样本单元。

这个阶段的抽样概率可能与第一阶段有所不同,以达到更好的样本覆盖和精度。

3. 第三阶段:在第二阶段选择的样本单元中,按照一定的概率再次进行抽样,选择最终的样本个体。

同样,这个阶段的抽样概率可能与前两个阶段有所不同。

通过三阶段不等概率抽样设计,可以灵活地选择样本单元,并通过控制抽样概率来保证样本的代表性和可靠性。

这种设计方法在实际应用中可以更好地适应不同的调查需求和场景,提高样本选择的效果。

抽样技术7不等概率抽样

抽样技术7不等概率抽样

M0
M2 0
例 某企业欲估计上季度每位职工的平均病假天数。该 企业共8个分厂,现用不等概整群抽样拟抽取3个分厂, 并以置信度95%计算其置信区间。
分厂编号
职工人数 Mi
累积区间
1
1200
1-1200
2
450
1201-1650
3
2100
1651-3750
4
860
3751-4610
5
2840
4611-7450
17 21
15.00 1045 22*
12.30 220 23
3.86 4600 24 15.80 2370 25
9.00 21.00
940 26 640 27
mi
yi
1.50
10
8.00
80
28.42 13672
9.01 3845
0.75
480
5.00 28.43
311 9284
9.97
842
5.20
放回不等概率抽样对总体特征的估计
三、Hansen-Hurwitz(汉森-郝维茨)估计量及其性质:
样本单元被抽中的概率z1, ,zn ,则对总体总量Y的估计是
YˆHH
1 n
n i 1
yi zi
(1)E(YˆHH ) Y
(2)V (YˆHH )
1 n
N i 1
Zi
(
Yi Zi
Y )2
(3)v(YˆHH )
其中第2、19号被抽中两次
解:根据题中所给资料,n=30,M0=9542, 利用汉森-郝维茨估计量,则有:
YHH
1 n
n 1
yi M 0 zi n

抽样技术第6章 不等概率抽样

抽样技术第6章 不等概率抽样

第6章 不等概率抽样1 不等概率抽样原理等概率抽样通常容易设计和解释,但并不总是如不等概率抽样一样的可行、实用、有效。

因为等概率抽样(psu’s)可能导致方差很大(尤其是对于无偏估计量)、管理困难以及成本难以控制。

而不等概率抽样的特点是以不等概率抽取psu’s 、m i 的数目相同,因此不等概率抽样使得每一个样本被抽取的概率相等、调查成本可控、每一个初级样本单元(psu )的样本数相等、方差急剧减小。

当采用不等概率抽样时,我们可以自由的调整选择不同初级样本单元(psu’s )作为样本的概率,并在估计中补充合适的权重。

核心是选择一个给定单元的概率已知: πi =P(psu i), ψi = P(psu i on first sample), ωi =1/πi1.1 抽取一个初级样本单元假定我们只要抽取N 个初级样本单元(psu )中的一个作为样本(n=1)。

初级样本单元i 的总值用t i 表示,我们需要估计总体总值t.用抽取一个初级样本单元的简单例子来说明不等概率抽样的思想。

先来考虑一个所有总体已知的情形。

一个城镇拥有四个超市,从100平方米到1000平方米按面积大小排列。

通过抽取一个超市,来估计四个超市上个月的总营业收入。

你可能预期大超市比小超市的营业收入多而且大超市的收入波动性也明显大于小超市。

因为仅抽取一个超市,所以在第一个回合中一个超市被抽取的概率 ψi 等于这个超市包含在样本中的概率πi 。

即,πi = ψi =P(超市i 被选取),此概率与超市的面积成比例。

超市A 占四个超市总面积的1/16,则它被抽取的概率为1/16。

为了说明性目的,假定我们已知总体的所有总值t i :我们可以以以上给定的概率选择一个容量为1的概率样本,通过洗散16张卡片并从中选择1张。

如果卡片数字为1,则选择超市A;如果卡片数字为2或3,则选择超市B;…… 在估计量中,我们通过使用 ψi 补充选取的不等概率权重。

如果超市面积与超市营业收入近似成比例,那么超市A 的营业收入在总收入的1/16,则可用超市A 的营业收入的16倍来估计四个超市的总收入。

不等概率抽样问题的研究

不等概率抽样问题的研究

不等概率抽样问题研究目录摘要 (1)1 不等概率抽样方法的介绍 (2)1.1 不等概率抽样估计的定义 (2)1.2 不等概率抽样 (2)1.2.1 放回不等概率抽样 (2)1.2.2 不放回不等概率抽样 (5)2 结论 (9)谢辞 (11)参考文献 (12)不等概率抽样问题研究李娟指导教师:苗刚摘要:在实际抽样中,我们常常遇到很多不同的情况,对于不同的情况我们也会采用不同的抽样方法进行研究。

常用的抽样方法主要有等概率抽样与不等概率抽样。

本文将针对不等概率抽样问题进行研究。

关键词:抽样;不等概率;样本;指标在现实生活中,由于现实的局限性,我们常常需要对总体进行抽样估计,抽样估计的方法也是多种多样。

在实际运用中,我们常常会发现运用等概率抽样方法来对总体指标进行估计时会出现单位均值估计不足的缺陷,那么我们应该如何改变这种现状,以提高抽样估计的效率呢?随着抽样调查在我国应用领域的不断扩展,很多学者对于抽样调查中等概率抽样估计的不足提出了建议。

他们提议如果我们运用不等概率抽样方法对总体指标进行估计,那么这些问题将迎刃而解。

1 不等概率抽样方法的介绍1.1 不等概率抽样估计的定义不等概率抽样估计,也就是大单位赋予大的入样概率,小单位赋予小的入样概率,入样概率一般与单位规模大小成正比。

1.2不等概率抽样方法的分类不等概率抽样方法按不同的分类方法可以分成许多不同的类型。

但最主要的分类方法是按抽样过程中被抽到的单位是否被放回总体中进行分类,分为放回不π。

等概率抽样)psPPS和不放回不等概率抽样()(抽样抽样1.2.1 放回不等概率抽样所谓放回不等概率抽样,是指在抽样之前就给总体中每一个单位赋予一个确定的抽样概率,在放回抽样的每一次抽取中,每个单位被抽中的概率都不变,直到抽够n个样本单位为止,对于放回不等概率抽样,由于每次抽取时总体的分布都不变,所以各次抽取是相互独立的,因此,无论抽样的实施,还是目标量的估计,都特别简单,这是这种抽样方法的最大优点。

非概率抽样

非概率抽样

非概率抽样四种类型:就近抽样、目标式或判断式抽样、滚雪球抽样、配额抽样就近抽样(偶遇抽样、方便抽样、自然抽样)定义:是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。

举例:为了调查某市的交通情况,研究者到离他们最近的公共汽车站,把当时正在那里等车的人选作调查对象。

其他类似的偶遇抽样还有:在街口拦住过往行人进行调查;在图书馆阅览室对当时正在阅读的读者进行调查;在商店门口、展览大厅、电影院等公众场所向进出往来的顾客、观众进行的调查;利用报刊杂志向读者进行调查;老师以他所教的班级的学生作为调查样本的调查等等。

与随机抽样的相似点:都排除了主观因素的影响,纯粹依靠客观机遇来抽取对象。

与随机抽样的不同点:偶遇抽样没有保证使总体中的每一个成员都具有同等的被抽中的概率。

那些最先被碰到的、最容易见到的、最方便找的对象具有比其他对象大得多得机会被我们抽中。

优缺点:优点——方便省力;缺点——样本的代表性差,有很大的偶然性,我们不能依赖偶遇抽样得到的样本来推论总体。

实例:“都市里的吉卜赛人——对武汉市外来务工、经商人员的调查”,《青年研究》2001年第6期,作者:刘玉、方洋、晏德光这篇文章根据实地调查,从生活、工作、社会帮助与保障、观念等几个方面对武汉市外来务工、经商人员的生活状态进行了初步的描述分析,发现文化水平对城市外来人口的收入情况影响不大,但是对观念有一定的影响。

方法:调查对象。

本次调查以武汉市外来务工、经商人员为对象。

具体做法如下:在武汉市外来务工、经商人员集中的地方(汉正街)的几条主街道发放调查问卷,由调查员按照非随机抽样中的偶遇抽样原则抽取一定的人员进行调查。

资料的收集方法。

本次调查问卷由58个问题组成,主要询问了外来务工、经商人员的基本社会特征、工作、收入与支出、观念、社会交往以及对现有生活的满意度等方面的问题。

实际发放问卷280份,回收有效问卷252份,有效回收率90 0%。

不等概率抽样的分类

不等概率抽样的分类

估计量
对于放回不等概抽样,对总体总量的估计 是汉森-赫维茨(Hansen-hurwitz)估计
YˆHH1ni n1
yi zi
M0 n
n yi m i1 i
例如:估计超市销售额, m:员工人数 解释公式意义
V
(YˆH H
)
1 n
N
Z
i
(
Y Z
i i
Y
)2
v (YˆH H
)
1 n
n
( yi Zi
第五章 不等概抽样
Sampling With Unequal Probabilities
每个单元入样的概率
?--------非概率,等概率,不等概
不等概率抽样的概念和特点 放回不等概率抽样(重点) 不放回不等概率抽样
不等概率抽样的概念和特点
前面讨论的简单随机抽样和分层随机抽样都是等概率抽样, 即,每个总体单元都具有相同的入样概率。等概率抽样容 易设计和解释,但实际中有时并非可行的,当总体单元之 间差异不大时,简单随机抽样简单、有效。但是当总体单 元之间(或抽样单元规模)差异非常大时,常采用不等概 率抽样,即,每个单元入样的概率不相等。
度,减少抽样误差,但使用它也由条件,就是必 须要有说明每个单元规模大小的辅助变量来确定 每个单元入样的概率,这在抽样设计及估计时都 是必须得。
不等概率抽样的分类
放回不等概抽样
代码法 拉希里法
不放回不等概抽样
逐个抽取 重抽法 全样本抽取;样本量随机 系统抽样法
放回不等概率抽样:
每次在总体中对每个单元按入样概率进行抽样,抽取出来的 样本单元放回总体,然后进行下一次抽样,这样,每次抽 样过程都是从同一个总体独立进行的,这种不等概率抽样 称为(有)放回不等概率抽样

抽样技术不等概率抽样

抽样技术不等概率抽样

抽样技术:不等概率抽样引言在统计学和数据分析中,抽样技术是一项重要的工具,用以从总体中选择一部分元素进行研究。

而抽样技术的核心就是如何从总体中选取样本,以保证样本能够准确地反映总体的特征。

其中一种常用的抽样技术是不等概率抽样。

不等概率抽样是指在抽取样本时,各个个体被选中的概率不相等。

与等概率抽样相比,不等概率抽样更能满足实际问题的需求,更能提高样本的效率和精确性。

本文将介绍不等概率抽样的原理、常用方法以及应用案例,希望能够帮助读者更好地理解和应用抽样技术。

不等概率抽样的原理不等概率抽样的原理基于概率论和统计学的基本原理。

在进行不等概率抽样时,需要根据总体的特征和研究目的,选择合适的抽样方法和样本选择概率,以使样本能够准确地反映总体。

不等概率抽样的核心在于赋予每个个体被选中的概率,也称为抽样概率。

抽样概率可以根据总体特征和研究目的进行选择,常见的选择方法包括:概率比例抽样、系统抽样、整群抽样等。

概率比例抽样是一种根据个体在总体中所占比例来确定抽样概率的方法。

具体而言,可以先计算出样本所需的个体数目,再根据各个个体在总体中的比例,分配相应的抽样概率。

这样可以保证样本能够按比例反映总体的特征。

系统抽样是一种按照一定规律选择样本的方法。

具体而言,可以在总体中确定一个起始点,然后以固定的间隔选择样本个体。

系统抽样具有简单方便、无需随机表和随机数的优点,常用于总体具有周期性分布的情况。

整群抽样是一种将总体划分为若干群体,然后随机选择部分群体进行抽样的方法。

这种方法适用于总体分布不均匀,但各群体内部相对均匀的情况。

通过整群抽样,可以减小样本误差,提高样本的代表性。

不等概率抽样的常用方法不等概率抽样有多种不同的方法和技术,根据实际问题的需求和样本特征的不同,可以选择合适的抽样方法。

以下将介绍几种常用的不等概率抽样方法。

简单随机抽样是不等概率抽样中最基本的方法之一。

简单随机抽样是指每个个体都有相等的被选中概率,且个体间的选择是相互独立的。

第六章 不等概率抽样

第六章 不等概率抽样

1 n(n 1)
n ( yi z i 1 i
yHH )2
(7.7)
§2 不放回的不等概率抽样
上一节讲述了有放回不等概率抽样,无论从实施上还是 从估计计算以及精度估计都显得十分方便。但是,一个单元 被抽中两次以上总会使样本的代表性打折扣,从而引起抽样 误差的增加。因此,实际调查工作者一般倾向于使用不放回 形式。
M0Zi成为整数)。对于具整数 Mi的第 i 个单元赋予一个与 Mi
相等的代码数,见表7—1。
表7—1
pps 抽样时各单元的代码数
单元 i 单元大小Mi
代码数
1
M1
2
M2
1, 2, , M1
M1 1, M1 2, , M1 M2
N 1
N 1
N 1
N
MN
Mi 1, Mi 2, , Mi MN M0
样概率严格地与其“大小”成比例感兴趣,这就是所谓的ps
抽样。
1、包含概率 i , ij
不放回不等概率抽样中,总体中每个单元被包含到样本
的概率,即入样概率 i p(i)是个重要的概念,而且任意
两个单元包含到样本中去的概率ij p(i, j) 也是个重要的
“大小”,并记M0
N
i
1
Mi
则可取 Zi Mi M0
此时多项抽样体现了每次抽样时单元的入样概率与单元的大 小成比例,即为pps抽样。
多项抽样是最简单的不等概率抽样,它的实施方法通常 有两种,以pps抽样为例。
(1)代码法 它适合于 N不太大的情形。假定所有的 Mi 为整数,倘若 在实际中存在 Mi不是整数的话,则可以乘以一个倍数使一切 Mi为整数(对一般的多项抽样,也总可找到整数 M0 ,使一切

常见的非概率抽样方法

常见的非概率抽样方法

常见的非概率抽样方法非概率抽样,又称为不等概率抽样或非随机抽样,就是调查者根据自己的方便或主观判断抽取样本的方法。

它不是严格按随机抽样原则来抽取样本,所以失去了大数定律的存在基础,也就无法确定抽样误差,无法正确地说明样本的统计值在多大程度上适合于总体。

虽然根据样本调查的结果也可在一定程度上说明总体的性质、特征,但不能从数量上推断总体。

非概率抽样依抽样特点可分为方便抽样、定额抽样、立意抽样、滚雪球抽样和空间抽样。

①方便抽样样本限于总体中易于抽到的一部分。

最常见的方便抽样是偶遇抽样,即研究者将在某一时间和环境中所遇到的每一总体单位均作为样本成员。

“街头拦人法”就是一种偶遇抽样。

某些调查对被调查者来说是不愉快的、麻烦的,这时为方便起见就采用以自愿被调查者为调查样本的方法。

方便抽样是非随机抽样中最简单的方法,省时省钱,但样本代表性因受偶然因素的影响太大而得不到保证。

②定额抽样定额抽样也称配额抽样,是将总体依某种标准分层(群);然后按照各层样本数与该层总体数成比例的原则主观抽取样本。

定额抽样与分层概率抽样很接近,最大的不同是分层概率抽样的各层样本是随机抽取的,而定额抽样的各层样本是非随机的。

总体也可按照多种标准的组合分层(群),例如,在研究自杀问题时,考虑到婚姻与性别都可能对自杀有影响,可将研究对象分为未婚男性、已婚男性、未婚女性和已婚女性四个组,然后从各群非随机地抽样。

定额抽样是通常使用的非概率抽样方法,样本除所选标识外无法保证代表性。

③立意抽样立意抽样又称判断抽样,研究人员从总体中选择那些被判断为最能代表总体的单位作样本的抽样方法。

当研究者对自己的研究领域十分熟悉,对研究总体比较了解时采用这种抽样方法,可获代表性较高的样本。

这种抽样方法多应用于总体小而内部差异大的情况,以及在总体边界无法确定或因研究者的时间与人力、物力有限时采用。

④滚雪球抽样以若干个具有所需特征的人为最初的调查对象,然后依靠他们提供认识的合格的调查对象,再由这些人提供第三批调查对象,……依次类推,样本如同滚雪球般由小变大。

非概率抽样方式

非概率抽样方式

非概率抽样方式(三)非概率抽样方式非概率抽样,又称为不等概率抽样或非随机抽样,是调研者根据自己的方便或主观判断抽取样本的方法。

主要有偶遇抽样、主观抽样、滚雪球抽样、、定额抽样等类型。

1.偶遇抽样,也称就近抽样、方便抽样或自然抽样。

它是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。

其优点是方便省力,其缺点是样本的代表性差,,有很大的偶然性。

2.主观抽样,也称目标式抽样、判断式抽样或立意抽样。

它是调查者根据自己的主观分析,来选择和确定调查对象的方法;。

主观抽样取得的样本.其代表性取决于研究者对总体的了解程度和判断能力。

主观抽样的优点是,可以充分发挥研究人员的主观能动性,其缺点是,样本的代表性难以判断,不能推论。

3.滚雪球抽样。

当我们无法了解总体情况时,可以从总体中的少数成员入手。

对他们进行调查向他们询问还知道哪些符合条件的人,再去找那些人并询问他们知道的人,如同滚雪球一样。

我们可以找到越来越多具有相同性质的群体成员。

4.定额抽样。

定额抽样从对总体性质的了解开始,在某一总体中考虑具有某种属性的人数所占的比例,然后从具有这种属性的人群中收集数据,并按各类人在总体中的比例赋予它的适当的比重。

这样收集数据,从理论上讲应当能够代表总体。

这种方法存在的问题是:定额的比例必须精确,但由于最新的关于总体性质变化的信息并不容易得到,往往造成抽样中的偏差。

(四)抽样中的误差问题进行抽样调查可产生两类误差,一类是抽样误差,另一类是非抽样误差。

1.抽样误差:由抽样的随机性产生,属于随机误差抽样误差是指主要指样本平均数与总体平均数之差、样本比率与总体比率之差。

抽样误差中通常运用最多的抽样平均误差,即指样本平均数或样本比率的标准差。

在重复抽样条件下,(1)样本平均数的抽样平均误差公式为其中, 为总体标准差,n为样本个案数。

(2)样本比率的抽样平均误差公式为:其中,P为总体比率,n为样本个案数实际计算时,则以样本标准差代替总体标准差,以样本比率代替总体比率。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.5
4
13.7
5
7.8
6
15
7
10
8
3.6
9
6
10

M0
1.1 =738
Mi 100
6 145
15 137
78 150 100
36 60 11 738
Mi 100
累计 6
151 166 303 381 531 631 667 727 738
代码 1~6
7~151 152~166 167~303 304~381 382~531 532~631 632~667 668~727 728~738
YˆHH M0
2
=30434161880
s YˆHH v YˆHH 174454
r

t
s YˆHH YˆHH
1.96 174118 757087
6.20
510
n
Yˆ M y HH
0
i

3676 30
10926 38.23
10926 38.23
1024 13.70


510 6.2


765404(百元)
n m i1 i
v YˆHH

M
2 0
n n 1
n yi i1 mi
YˆHH
2


M
2 0
n n 1
n i 1

yi mi
YˆHH M0
2

可以证明
E(YˆHH ) Y E v(YˆHH ) V (YˆHH )
例5.2
某部门要了解所属8500家生产企业当月完成的利 润,该部门手头已有一份去年各企业完成产量的 报告,将其汇总得到所属企业去年完成的产量为 3676万吨。考虑到时间紧,准备采用抽样调查来 推算当月完成的利润。根据经验,企业的产量和 利润相关性比较强,且企业的特点是规模和管理 水平差异比较大,通常大企业的管理水平较高些, 因此采用以与去年产量成比例的PPS抽样,从所属 企业中抽出一个样本量为30的样本,
每次在总体中对每个单元按入样概率进行抽样,抽取出来的 样本单元放回总体,然后进行下一次抽样,这样,每次抽 样过程都是从同一个总体独立进行的,这种不等概率抽样 称为(有)放回不等概率抽样
放回不等概率抽样中,最常用的是按照总体单元的规模大 小来确定单元在每次入样的概率,典型的是PPS抽样。
PPS抽样的实施主要有两种方法:代码法与拉希里法。
采用不等概率抽样来减少抽样方差而不采 用清晰的分层。采用不同的概率来选择初 级样本单元,并且在估计中采用不同的权 数来进行弥补。
抽样的关键是每个样本的选择概率是已知 的。
P(单元i在第一次抽取中被抽中 )= i
P(单元i被选入样本)= i
不等概率的适用情形
第一,抽样单元在总体中所占的地位不一致。 第二,调查的总体单元与抽样总体的单元不一致 第三,改善估计量。 注:不等概率抽样的优点主要是大大提高了估计精
通常的做法:牺牲“简单”来提高抽样效率。
(1)将总体单元按规模分层,对较大单元的层抽样比高一些,特大层的 抽样比甚至可以100%,而较小单元的层抽样比低一些。
(2)采用不等概抽样来减少抽样方差,即赋予每个单元与其规模成比例 的入样概率,然后在估计中采用不同的权数来进行弥补。
分层抽样:抽样选择概率小的单位会有较 高的权数。
二、放回的
PPS
抽样
(Probability Proportional
to Size
Ui Mi
M i 区域
1
8
8
2
20 28
3
40 68
.
.
.
.
.
.
.
.
.
1—8
9—28 Zi
29—68

Mi M0

Mi
N
Mi
i 1
.
. 也. 称PPS
1代码法案例 一种多项抽样
i
Mi
1
0.6
2
14.5
3
2拉希里方法
不需要累计,两次随机数决定抽中的单位。 第一次:1-N之间的随机数i 第二次: 1-maxM之间的随机数m 如果Mi> m,第i个单位被抽中
估计量
对于放回不等概抽样,对总体总量的估计 是汉森-赫维茨(Hansen-hurwitz)估计
YˆHH
1 n
n i 1
i
mi
yi
i
mi
yi
i
mi
yi
1* 38.23 10926 10
6.50 1900 19
1.50
10
2 13.70 1024 11 15.00 864 20
8.00
80
3
0.75
13 12
7.00
17 21 28.42 13672
4
2.85
30 13 16.00 1045 22* 9.01 3845
5
2.00 1102 14 12.30 220 23
0.75
480
6
5.00
7 10.80
600 15 290 16
3.86 4600 24 15.80 2370 25
6.00 28.43
311 9284
8
2.00
430 17
9.00 940 26
9.97
842
9
8.81
992 18* 21.00 640 27
yi zi

M0 n
n yi m i1 i
例如:估计超市销售额, m:员工人数 解释公式意义
V
(YˆHH
)

1 n
N
Zi
(
Yi Zi
Y )2
v(YˆHH
)

1 n
n
( yi Zi
YˆHH )2
(n 1)
v YˆHH

1 n
1 n 1
n i1
yi zi
度,减少抽样误差,但使用它也由条件,就是必 须要有说明每个单元规模大小的辅助变量来确定 每个单元入样的概率,这在抽样设计及估计时都 是必须得。
不等概率抽样的分类
放回不等概抽样
代码法 拉希里法
不放回不等概抽样
逐个抽取 重抽法 全样本抽取;样本量随机 系统抽样法
放回不等概率抽样:
第五章 不等概抽样
Samห้องสมุดไป่ตู้ling With Unequal Probabilities
每个单元入样的概率
?--------非概率,等概率,不等概
不等概率抽样的概念和特点 放回不等概率抽样(重点) 不放回不等概率抽样
不等概率抽样的概念和特点
前面讨论的简单随机抽样和分层随机抽样都是等概率抽样, 即,每个总体单元都具有相同的入样概率。等概率抽样容 易设计和解释,但实际中有时并非可行的,当总体单元之 间差异不大时,简单随机抽样简单、有效。但是当总体单 元之间(或抽样单元规模)差异非常大时,常采用不等概 率抽样,即,每个单元入样的概率不相等。
相关文档
最新文档