Cha8整群抽样
第七章 整群抽样
y 1 yi i M M
y
j 1
M
总体总值及按群平均的总体均值:
Y Yi Yij
i 1 i 1 j 1 A A M
Y 1 A Y Yi A A i 1
样本总值及按群平均的样本均值:
y yi yij
i 1 i 1 j 1 a a M
• 总体均值 Y 的无偏估计: y y 1 aM aM
V ( y) 1 f 2 Sb aM
1 a y y y ij i a M i 1 j 1 i 1
a
M
• 方差:
2 • 方差的无偏估计: v ( y ) 1 f sb
aM
第二节
群大小相等的整群抽样
LOGO
第一节
抽样方式
LOGO
• 实施理由: ① 缺少调查单位的必要信息无法对其直接编制抽样框实施 概率抽样,而由调查单位组成的群是现成的或者群很容 易划分从而编制群抽样框非常容易时,常采用整群抽样。 ② 使调查实施便利、节省费用而采用整群抽样。 ③ 对某些由特殊结构的群组成的总体实施整群抽样能使精 度有较大提高。
第七章 整群抽样
本章要点
LOGO
对于整群抽样,本章给出了群大小相等和群大小不等 的整群抽样方法及与之匹配的估计量、估计量的方差及方差 的估计量。 • 具体要求: • 掌握群大小相等情形对群进行简单随机抽样简单估计量的 无偏性、方差及方差的无偏估计,掌握群的划分原则;了 解群内方差、群间方差概念及其对整群抽样精度的影响。 • 掌握群大小不等情形与简单随机抽样相匹配的简单估计量、 比率估计量及与抽样相匹配的汉森-赫维茨估计量及性质。 • 掌握估计总体比例的整群抽样方法及简单估计量、比率估 计量。
整群抽样
当各群所含次级单元数相等时,就称群
的大小相等;当各群所含次级单元数不 相等时,就称群的大小不相等。
第二节 群规模相等时的估计
一、符号说明 二、估计量 三、整群抽样效率分析
一、符号说明
设总体有N个群,每个群包含的单元数M相等 (或相近). 符号: 总体群数: N 样本群数:n 总体第 i 群中第 j 个单元的指标值: Yij 样本第 i 群中第 j 个单元的指标值: yij 第 i 群中的单元数: M i
注意: 整群抽样的随机性体现在群与群间不重 叠,也无遗漏,群的抽选按概率确定。 如果把每一个群看作一个单位,则整群 抽样可以被理解为是一种特殊的简单随 机抽样。 整群抽样是由一阶抽样向多阶段抽样过 渡的桥梁.此章介绍的是单阶段整群抽样.
(二)特点 优点: 1. 抽样框编制得以简化。
M1 M 2 ... M N M
它们之间的关系为:
1 2 2 S [( N 1) Sb N ( M 1) S w ] NM 1
2
M 仍为M ,不难 将 Y 改为 y ,n 代替 N ,由于是整群抽样, 得到样本方差平方和的关系式:
1 2 2 s [( n 1) sb n( M 1) sw ] nM 1
二、估计量
(一)均值估计量的定义
若群的抽取是简单随机的,且群的大小(M)相等, 则总体均值的估计为:
1 n y yi n i 1 i 1 j 1 nM
n
M
yij
(二)估计量 y 的性质
性质1
y 是 Y 的无偏估计
Y E( y) Y M
性质2
y 的方差为:
(抽样检验)第七章整群抽样
第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。
08-第八章_整群抽样
i = 1,2, , N ; j = 1,2,, M 。记 y ij 为样本第 i 群中第 j 的小单元(次级
单元)的指标值, i = 1,2, , n ; j = 1,2, , M ,又 f =
n 是抽样比。 N
Yi = å Yij , y i = å y ij
j =1 j =1
M
M
分别是总体和样本中第 i 群的指标和,简称为群和。
过程完毕。 在求出了总体均值 Y 的无偏估计量 y 及其方差 V ( y ) 后,我们现在求估 计量方差的估计量 v( y ) 。 容易知道, v( y ) = 过程如下: 因为对群的抽样是简单随机的, 若将 Y i =
1- f 2 sb nM Yi 看作是单元指标值, 则Y i M
的样本方差
2 sb S2 2 2 是总体方差 b 的无偏估计,从而 sb 是 Sb 的无偏估计。也 M M
N
N
M
因为中间项等于零
N é M ù ( Y Y )( Y Y ) = ( Y Y ) (Yij - Y i )ú i i i ê åå å å ij i =1 j =1 i =1 ë j =1 û N M
= å (Y i - Y ) × 0
i =1
N
=0
所以平方和的分解式变为
åå (Yij - Y ) 2 = åå (Yij - Y i ) 2 + åå (Y i - Y ) 2
过程如下: 如果将 Z i =
1 M (Yij - Y i ) 2 作为单元的指标值,则它的样本均值 å M - 1 j =1
n M 1 n é 1 M 1 2ù 2 y y = ( ) ( yij - y i )2 = sw åê å ij i ú n( M - 1) åå n i =1 ë M - 1 j =1 i =1 j =1 û
整群抽样
上式中的分子为:
பைடு நூலகம்
(Y
N
ij
Y )(Yik Y )
NM ( M 1) 2
第二节 群规模大小相等时的估计
上式中的分母为:
2 ( Y Y ) ij N M
NM
故 又可写为:
NM 1 2 S MN
2 (Yij Y )(Yik Y ) ( NM 1)(M 1) S 2
(1)
第二节 群规模大小相等时的估计
2.
估计量
性质1:
y 的性质
y 是 Y 的无偏估计,即
E y Y
因为是按简单随机方法抽取群,所以样本群均值 总体群均值 Y 的无偏估计,因而
y是
Ey Y
M
Y
第二节 群规模大小相等时的估计
性质2
y 的方差为
1 f V ( y) n N 1 1 f 2 Sb nM
从方法上看,整群抽样可以看成单阶段抽样向多阶段抽样 过渡的桥梁。如果抽出群后,对其中所有的次级单元进 行调查,称为单阶段整群抽样;如果抽出群后,在次级 单元中进一步抽取子样本,称为两阶段抽样;如果进一 步在两阶段抽样的子样本中按更低一级的单元再抽子样 本,称为三阶段抽样;如此类推,等等。如果最后一个 阶段所抽出的单元是组成总体的基本单元,一般称为多 阶段抽样,将在后面章节讨论;如果最后一个阶段所抽 出的单元是群(基本单元的集合),可将其称为多阶段 整群抽样,也即是多阶段抽样中的一种情形。本章仅介 绍单阶段整群抽样。
Y Yi N y yi n
n
N
第二节 群规模大小相等时的估计
Y
: 总体中的个体均值
(各群 M i M)
08整群抽样
8.3群大小不等的整群抽样
一、记号
M i 表示群的大小,M 0 M i为总体中小单元的总数。
i 1 N
群和: 第i群的 平均数: 平均
Yi Yij
j 1
Mi
yi yij
j 1
Mi
Yi Yi Mi
yi yi Mi 1 n y yi n i 1
ij
1 Y N 群和: 按小 单元 的均值: Y
估计量 1 ˆ Y Ny N yi n i 1 估计量的理论方差
2 1 N 2 1 f ˆ) N V (Y Yi Y n N 1 i 1 n
估计量的方差估计 ˆ ) N 1 f 1 y y 2 v(Y i n n 1 i 1
n 2
1 f 1 n 2 v (Y ) N yi y 2 nM 0 n 1 i 1
群内方差 群间方差
1 N S M Yi Y N 1 i 1
2 b
2
故 则
2 N ( M 1) S w ( N 1) Sb2 S2 , 若 NM 1 NM , N 1 N , NM 1 2 ( M 1) S w Sb2 2 S M
三、设计效应
2
为对这两个方差作比较,需对( NM 1) S 2作分解:
三、设计效应
Y
N M i 1 j 1
ij
Y
2 w
2
Yij Yi M Yi Y
N M 2 N i 1 j 1 i 1
2
记
N M 2 1 S yij Yi N ( M 1) i 1 j 1
抽样技术 5 整群抽样
2.群内相关系数:是表达总体中群内小单元间相关程度 的一个指标。 定义:
(Y
E (Yij Y )(Yik Y ) E (Yij Y )
2 i 1 j k
N
M
ij
Y )(Yik Y )
2 NCM 2 ( Y Y ) ij i 1 j 1 N M
NM 2 (Yij Y )(Yik Y )
学生2
学生3 学生4 学生5 学生6
83
74 82 66 87
83
79 111 101 69
89
94 109 79 80
105
98 107 129 90
99
132 87 99 124
100
116 99 107 105
115
117 99 106 120
80
63 130 105 86
试估计该学校平均每个学生每周的零花钱,并给出置信 度为95%的置信区间。
11 22 17 26 16 27
12 33 17 40 24 17
13 15 10 4 6 8
14 17 18 12 11 10
15 13 9 5 7 9
16 18 23 13 15 8
17 33 5 26 30 11
18 26 15 13 17 3
19 7 32 4 6 9
20 15 1 1 6 5
2 ( Y Y ) i N
Y
N 1
i
Y
2
N 1
5.2 群规模大小相等时的估计
3、 V ( y ) 的样本估计为
1 f 2 1 f v( y ) sb nM n
M n s ( yi y)2 n 1 i 1
整群抽样
(Yij Y )(Yik Y )
i 1 j k
NM ( M 1) / 2 2 (Yij Y )(Yik Y )
i 1 j k N M
MN
( M 1)( NM 1) S 2
M ( N 1) Sb2 ( NM 1) S 2 c ( M 1)( NM 1) S 2
ˆ) 1 f ˆ V (Y V (Y ) 2 M0 nM 2
(Y Y )
i 1 i
N
2
N 1
ˆ) 1 f ˆ v(Y v(Y ) 2 M0 nM 2
(y
i 1
n
i
y )2
n 1
按简单随机抽样抽群,采用比率估计量
对群进行简单随机抽样,总体均值的比估计量为
ˆ YR
1 Y N
Y
j 1
N
i
为总体的“群和平均”。 为样本的“群和平均”。
1 y y yi n j 1
Y 1 N M Y Yij 为总体均值。 M NM i 1 j 1 y 1 n M y yij 为样本均值。 M nM i 1 j 1
N M 1 S (Yij Y )2 NM 1 i 1 j 1 2
ˆ 是无偏估计,其方差为 Y HH
N N Y M 1 2 2 i 0 ˆ ) Z ( Y ) V (Y M ( Y Y ) i i HH i n i 1 Zi n i 1 V (Yˆ ) 的一个无偏估计为
HH
v(YHH )
ˆ
n yi ˆ 2 M 02 n 1 2 ( Y ) ( y y ) i HH n(n 1) i 1 zi n(n 1) i 1
抽样调查-第6章整群抽样
将样本中n个群的群总和平均。
估计公式为:
y
n Mi yi i1 nM
1 nM
n i1
yi
y M返回来自如果总体群平均规模 M 未知,可以用样本群
n
平均规模
m
i1
Mi
代替.因此得到总体总值
Y
n
N
的估计:
Y
M0
y
式中,M 0 M i 为总体中的
i1
个体单元总数.
总体总值估计量
而样本群内方差为:
sw2
1 n(M 1)
n i 1
M
( yij yi )2
j 1
1 n
n i 1
1 M 1
M
( yij
j 1
yi )2
1 n
n i 1
si2
220.79
返回
由相关系数的估计式有
sb2
sb2 sw2 (M 1)sw2
sb2
由于 sb2是Sb2 的无偏估计, 因而 v( y)是V ( y) 的无偏估计。
总体总值 Y NM Y 的估计量为:
Y NM y
返回
总体总值 Y NM Y 的估计量的方差为:
V (Y ) V (NM y) N 2M 2V ( y)
v(Y )
N 2M
2v( y)
N 2M
NM
2 (Yij Y )(Yik Y )
i1 jk
(M 1)(NM 1)S 2
返回
事实上,前面提到的V (y) 可以用群内相关系数
抽样调查整群抽样与系统抽样
个体的次序随机排列
对总体的某种排列次序,系统抽样精度可能优于 简单随机抽样也可能劣于简单随机抽样,但对N个个 体的所有N!种排列而言,系统抽样的平均精度与简单 随机抽样相等
V(YˆS
K
Y)SK
N0
(
N0
Yij
Yj)2
i1 j1
j1
N 0
K
K(Y ji Y i)22 K K N 0N 0(Y ji Y i)Y (jl Y l)
i 1j 1
j 1i l
K N0N0
(Yji
Yi)
(Yjl
Yl)0,系统
抽
样
优
于样分
j1 il
系统抽样的效率
例 假设总体有表中的30个单元,欲取5个构成系统样 本,与简单随机抽样和分层抽样同样本量的结果进行 比较(两种排列方式).
个体指标与其次序有线性关系 个体指标与其次序有某种周期关系 个体的次序随机排列
个体指标与其次序有线性关系
Y ii,i 1 ,2 , ,N 设 U i(Y i)/i
则 U N 2 1 ,S 2N 1 1iN 1(U i U )2 (N 1 1 )N 2
系统抽样
U ˆSYSN1 2N(NK) V(UˆSY)SN2(1K221)
然后对号码1,2,…,K作随机抽样,若i入样,则 K+i,2K+i,…,皆入样,组成一个系统样本
若将同一列个体看做一个群,系统抽样可视为整群抽样
一般假定N=KN0,并且只从1~K中抽选一个样本单元
(标准抽样检验)第七章整群抽样
(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
整群抽样的名词解释
整群抽样的名词解释整群抽样,又称为群体抽样或者区块抽样,是一种常用的统计调查方法。
它是指在一个总体被划分为若干个互不重叠的群体或区块后,从每个群体或区块中随机选择一部分作为样本,以代表整个总体。
通过对这些样本进行观察、测量或调查,得到统计数据,并从中进行总体特征的推断。
整群抽样的使用可以在众多领域中发现,比如社会学、市场调查、地理学、教育学等。
在实际应用中,整群抽样通常用于大规模人口普查、大型调研项目、投票调查或者对特定群体的概况了解等情况。
那么为什么要选择整群抽样呢?其理论基础在于群体内的个体之间存在相似性或相关性,而不同群体之间存在差异性。
通过选择每个群体的一部分作为样本,我们可以在保证样本的代表性的同时减少调查的成本和工作量。
同时,整群抽样还可以提高样本的效率,这是因为在群体内进行调查的效率通常高于对个体进行调查。
然而,尽管整群抽样有诸多优势,但是在实际应用中也有一些注意事项。
首先,选择合适的群体划分是整群抽样的重要环节。
群体应该是有明确边界的,并且总体中的每个个体应该属于一个且仅属于一个群体。
如果群体之间的差异较大,那么总体的推断可能存在一定误差。
其次,正确的选择群体大小也是重要的。
如果群体的大小太小,那么样本的代表性可能会下降,从而影响到总体的推断。
相反,如果群体的大小过大,那么在调查过程中的工作量和费用可能会过高。
另外,对于整群抽样会遇到的聚类效应需要特别关注。
聚类效应是指群体内个体之间的相似性或相关性导致样本中的个体之间存在聚集现象。
如果聚类效应严重,那么在数据分析时需要考虑聚类效应的影响并进行相应的修正。
最后,整群抽样在实际应用中也面临着时间和经济的限制。
在某些情况下,可能由于时间和经费的限制,只能选择部分群体进行抽样。
在这种情况下,需要对群体进行合理的选择,以保证所选群体的代表性。
综上所述,整群抽样是一种常用的统计调查方法,通过选择一部分群体作为样本来代表整个总体,并通过对样本进行观察、测量或调查,得到统计数据并进行总体特征的推断。
整群抽样
三、群的大小不等时 在许多情况下,总体各群的大小 M是不完全相 i 等,或完全不相等的。若各群的大小相差不大时, 总体参数的估计量可按简单估计或比估计来确定: (一)简单估计
如果群的抽取是简单随机的,则可将每个群的 总和 Yi 看作是第 i 群的指标,于是总体总和
Y
Y
i 1
N
i
的简单估计可依照简单随机抽样的情形来做。
五、整群抽样与分层抽样的比较 综合前面的分析,比较整群抽样和分层抽样 可以发现二者在分组(层或群)的条件、调查的 方式、分组(层或群)的目的、分组(层或群) 的原则、总体方差的分解等方面都存在着较为明 显的差别。
第二节
等概率整群抽样的情形
一、群的大小相等时 (一)估计量 整群抽样是以群为单位进行抽样,如果群的 抽取是简单随机的,则当群的大小都相等时,可 以将简单随机抽样理解为是一种特殊的整群抽样, 特别当总体分群后的每个群都只包括一个次级单 元时,整群抽样和简单随机抽样一致。因此,整 群抽样的估计量可以比照简单随机抽样方式来构 造。
4.如果把每一个群看作一个单位,则整群抽 样可以被理解为是一种特殊的简单随机抽样。 5.整群抽样也是多阶段抽样的前提和基础。
6.整群抽样有特殊的用途。有些现象的研究, 如果直接调查作为基本单元的个体,很难说明问 题,必须以一定范围所包括的基本单元为群体, 进行整群抽样,才能满足调查的目的。
7.整群抽样要求分群后各群所含次级单元数 目应该确知,否则会给抽样推断带来不便。
(二)比估计
当群的大小不等时,在对群进行简单随机抽
样的情况下,Y Yi M i ,我们注意到它同比率
R Yi
i 1 N
N
N
X 形式上完全相同,只不过在这里是
抽样检验GB8
抽样检验GB2828一、抽样检验的由来二次世界大战时期,美国军方采购军火时.在检验人员极度缺乏的情况下,为保证其大量购入军火的品质,专门组织一批优秀数理统计专家、依据数学统计理论,建立厂一套产品抽样检验模式。
满足战时的需要。
二、抽样检验的定义从群体中随机取样(抽取一部分).然后对该部分进行检验、把其结果与判定基准相比较、然后利用统计的方法.来判断群体的合格或不合格的检验过程。
三、基本概念及用语1.群体与样本。
群体就是提供被做为调查(或检查)的对象.或者称采取措施的对象。
也常称为批,群体(批)大小常以N表示,亦称批量N。
工序间、成品、进出库检验以及购入构验等经常组以整批的形式交付检验的。
不论是一件件的产品、还是散装料,一般都要组成批,而后提交检验,有些情形,中间产品由于条件的限制不允许组成批以后再提交给下一道工序进行检验、但可采用连续抽样检验 (如每小时抽取1台产品进行检验的抽样方式。
样本就是指我们从群体中(或批中),抽取的部分个体。
抽取的样本数量常以n表示。
2.批的组成。
构成一个批的单位产品的生产条件应尽可能相同,即是应当由原、辅料相同,牛产员工变动不大生产时期大约相同等生产条件下生产的单位产品组成批。
此时.批的特性值只有随机波动.不会有较大的差别。
这样做.主要是为了抽取样品的方便及抽样品更具有代表性.从而使抽样检验更为有效,如果有证据表明,不同的机器设备、不同的操作者或不同批次的原材料等条件的变化对产品质量有明显的影响时,应当尽可能以同一机器设备、同一操作者或同—批次的原材料所生产的产品组成批,构成批的上述各种条件,通常很少能够同时满足。
如果想使它们都得到满足,往往需要把批分得比较小.这样品质一致而且容易追溯。
但这样做,会使检验工作量大大增加.反而不能达到抽样检验应有的经济效益、所以,除作产品品质时好时坏,波动较大.必须采用较小的批以保证批的合理外,当产品品质较稳定时〔比如生产过程处于统计控制状态〕,采用大批量是经济的、当然,在使用大批量时,应当考虑到仓库场地限制以及不合格批的返工等可能造成的困难。
整群抽样
技术部
行政部
销售部
ቤተ መጻሕፍቲ ባይዱ
制造部
THE END
谢 谢 观 看!
《社会调查与统计分析》
第四章 抽样
知识点8 整群抽样
学习导航
整群抽样
整群抽样的定义 整群抽样的优缺点 整群抽样和分层抽样的区别运用
1. 整群抽样( Cluster Sampling )的定义
又称为集体抽样或群体抽样 ,是从总体中随机抽取一些 小的群体,然后由所抽出的若干个小群体内的所有元素 构成调查的样本的方法。 整群抽样区别于其它抽样方法的最大特点在于它的抽样 单位不是单个元素,而是成群的元素 。
2. 整群抽样的优缺点
优点 „ (1)在于可以简化抽样的过程 „ (2)节省时间、人力和经费 缺点就是其样本的分布面不大、样本对总体的代表性相 对较差。
3. 整群抽样与分层抽样区别运用
不同子群相互之间差别不大、而每个子群内部的异质性 较大时,则适合于采用整群抽样的方法;
反之,当不同子群相互之间差别很大、而每个子群内部 的差异不大时,则特别适合于采用分层抽样的方法。
抽样调查第6章 整群抽样与系统抽样知识讲解
Y K
2
N0N
K i 1
Yi Y
2
由这个思路无法给出其均方偏差的估计量
系统抽样的效率
与简单随机抽样的比较
(N 1)S 2 N0 (K 1)S外2 (N0 1)KS内2 V (YˆSE ) N(K 1)S 2
V (YˆSYS) N0N(K 1)S外2 N (N 1)S 2 N (N K )S内2 V (YˆSYS) V (YˆSE ) N(N K)(S 2 S内2 )
K 2 1 k 1 K k K K 1 i1
N0 j 1
Yij Y
2 (K, N较大时)
Deff
V (YˆCSE V (Yˆ)
)
1 (N0 1)C
C较大,N0较大时,整群抽样精度差得多
对第一级为简单随机抽样的二阶抽样有
Deff 1 C (n0 1)
整群抽样的设计效应
实际当各群容量不等时,常用 1
V (YˆCSE )
K2 k
1
k K
1 K 1
K i 1
Ni
Yij
j 1
Y K
2
(3)V (YˆCSE )的一个无偏估计量为
v(YˆCSE )
K2 k
1
k K
1 k 1
k i 1
Ni
Yi j
j 1
YˆCSE K
2
目标量的估计
定理6.2 对有放回PPS整群抽样,总体总数Y的估计有
(Ni 1) (Yij Y )2
i 1
j 1
若群内各单元指标均相等,则C达最大值1
群内相关系数是衡量群内单元同质性的一个指标
整群抽样的设计效应
Ni N0 (i 1,2, , K)时
抽样技术考试重点
分层抽样、整群抽样和二阶段抽样的区别和联系分层抽样:是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。
其分层要求各层之间差异大,层内个体间差异小.整群抽样:将总体中若干个单位合并为组,这样的组称为群。
抽样时,直接抽取群。
然后对中选群的所有单位全部实施调查。
其分群要求群与群之间差异小,群内个体间差异大.二阶段抽样:从总体行所有一阶单元中抽取一部分单位,相当于从总体所有群众抽取部分群的整群抽样,而再每个抽中的一阶单元中分别抽取部分二阶单元,就相当于分层抽样,即先整群,后分层抽样。
其实质是分层抽样与整群抽样的有机结合。
分层抽样样本量的分配比例分配:是指各层按各层单位数占总体单位数的比例,也就是按各层的层全进行分配,即.最优分配:是指在分层随机抽样中,如何将样本量分配到各层,使得在总费用给定的条件下,估计量的方差最小,即.尼曼分配:最优分配在每层抽样费用相同时的特例,即。
什么是πPS抽样,如何实现如果我们事先对总体中的每一个单位都有一个度量其规模大小的指标值,则记.对于固定的样本量,若总体中每个单位入样概率——一阶包含概率与其规模大小严格称比例,我们称这种不放回的与单位规模大小成比率的概率抽样为严格的πPS抽样。
实现方法:严格,n=2布鲁尔方法、德宾方法,n>2水野方法、布鲁尔方法、拉奥—桑福特方法;非严格:耶茨-格伦迪方法、拉奥—哈特利—科克伦方法、泊松抽样。
系统抽样对线性排列趋势的调整方法首位校正法:即将不加权的均值估计量改变为加权的估计,加权时样本中所有中间单位的权数都是1,但对样本的第一个和最后一个单位分别赋予的权。
其中i为1~k中所抽样本,+为首,-为尾。
中心系统抽样法:在总体的第一组中,将位置居中的单位作为抽样起点,其抽样模型为:{k/2+jk}(j=0,1,…,n—1)。
平衡系统抽样法(分组对称抽样法):对号码1~k随机抽取一个单位,若第r号单位入样,则其抽样模型为{r+2jk,2(j+1)k—r+1}(j=0,1,…,n/2-1)。
抽样检验理论
适用于对连续批的检验 按照接收质量限(AQL)为检索依据 特点:
应用最广泛的抽样标准,兼顾生产方风险与使用方风险 使用比较复杂 与孤立批的抽样方法相比检验投入相对较小
常用抽样检验标准介绍 Common Sample Inspection Standard
数抽样程序及抽样表(适用于连续批的检查)》;并于 2003 年发布了与 此等同的国家标准 GB/T2828.1-2003
抽样检验理论概述 Sample Inspection Theory Introduction
1.4 概念 Conception
检验批 Inspection Lot
提交进行检验的一批产品,也是作为检验对象而汇集起来的一批产品 通常检验批应由同型号、同等级和同种类(尺寸、特性、成分等),且生产
抽样方案
最简单的一次抽样方案由样本量n和用来判定批接收与否的允收数Ac组成,记 为(n,Ac),即从批量中抽取n个单位产品,如果其中的不良数≦ Ac接收此 批;如果其中的不良数≧ Ac+1不接受此批
Ac为允收数,指样本中可接受的最大不良数;Re为拒收数,通常Re=Ac+1
抽样检验理论概述 Sample Inspection Theory Introduction
抽样检验理论概述 Sample Inspection Theory Introduction
1.4 概念 Conception
不合格 Nonconforming
单位产品的任何一个质量特性不符合规定要求 通常根据不合格的 严重程度必要时将它们进行分类
• A 类不合格:认为最被关注的一种不合格 • B 类不合格:认为关注程度比 A 类稍低的一种类型的不合格 • C 类不合格:关注程度低于 A 类和 B 类的一类不合格
整群抽样[1]
习题七一、 单选题1.整群抽样中的群的划分标准为( A )。
A.群的划分尽可能使群间的差异小,群内的差异大B.群的划分尽可能使群间的差异大,群内的差异小C.群的划分尽可能使群间的差异大,群内的差异大D.群的划分尽可能使群间的差异小,群内的差异小 2.整群抽样的一个主要特点是( C )。
A.方便B.经济C.可以使用简单的抽样框D.特定场合中具有较高的精度 3.群规模大小相等时,总体均值Y 的简单估计量为( A )。
A.∑∑===n i Mj ijynM Y 111ˆB.()∑∑==-=n i Mj ij y M n Y 1111ˆ C.∑∑===n i Mj ij y n Y 111ˆD.∑∑===n i Mj ijyNY 111ˆ4.下面关于群内相关系数的取值说法错误的是(D )。
A.若群内次级或基本单元变量值都相等则20S ω=,此时ρ取最大值1B.若群内方差与总体方差相等,则0≈ρ,此时表示分群是完全随机的C.若群内方差大于总体方差时,则ρ取负值D.若20b S =时,ρ达到极小值,此时11-=M ρ5.整群抽样中,对比例估计说法正确的是( B )。
A.群规模相等时,总体比例P 的估计可以为:11ni i p n A ==∑B.群规模不等时,总体比例P 的估计可以为:11()/()n niii i p A M===∑∑C.群规模相等时,总体比例P 的方差估计为:211()(1)()n i v p in n p P ==--∑D.群规模不等时,总体比例P 的方差估计为:2121()1()ni i i v p n n p A M M==•--∑二、多选题1.下面关于整群抽样的说法,有哪些是正确的?(ABC DE ) A.通常情况下抽样误差比较大B.整群抽样可以看作为多阶段抽样的特殊情形,即最后一阶抽样是100%的抽样C.调查相对比较集中,实施便利,节省费用D.整群抽样的方差约为简单随机抽样的方差的1(1)cM ρ+-倍E.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(1)cM ρ+-倍2.关于整群抽样(群规模相等)的设计效应,下面说法正确的有(ABCD ) A.()1(1)()c srsV y deff M y V ρ=≈+-B.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(1)cM ρ+-倍C.群内相关系数的估计值为2222(1)ˆb cbM s s ss ωωρ-=+-D.要提高整群抽样估计效率,可通过增大群内单元的差异实现E.整群抽样的精度取决于群内相关系数,群内相关系数越大,则估计量的精度越高 3.关于群规模不等时,可以采用的估计量形式有( B CD )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(NM
1)
( *) )
与此类似,样本方差可表示为: 与此类似,样本方差可表示为:
2 2 s 2 = ( n 1) sb + n ( M 1) s w
( nM
1)
注意: 这里样本方差s2不是总体方差S2的无偏估计
若将 Yi = Yi M 看作是单元指标值, 则它的样本方差 s 2 M 看作是单元指标值, b
3.总方差的分解 .
的定义得: 由S2的定义得:
( NM 1) S 2 =
N
∑∑ (Y
N M i =1 j =1
M
ij
Y
)
2
= ∑∑ ij Yi + Yi Y NM Y S
i =1 j =1
N
M
(
)
2
Y Y 2 + Y Y = ∑∑ ( ij i ) i i =1 j =1
N M 2 N
yi
188 180.5 149.75 207.875 244.25 278.5 182.75 211.5 253.125 191.125 274.75 258.375
si
27.19244 17.98412 17.31845 29.1667 45.19719 63.87488 38.76578 27.47986 44.52427 28.28648 43.70273 43.52319
2 i =1 N
(
)
2
+ ∑∑ (Yij Yi )
N M i =1 j =1
2
2 = ( N 1) Sb2 + N ( M 1) S w
2 ( NM 1) S 2 = ( N 1) Sb2 + N ( M 1) S w
2 S 2 = ( N 1 ) S b2 + N ( M 1 ) S w
1整群抽样的概念和特点 整群抽样的概念和特点
整群抽样的特点: 整群抽样的特点: (1)无需所有小单元的明确的抽样框; )无需所有小单元的明确的抽样框; (2)由于调查的样本相对集中,可节省调查时间和费用, )由于调查的样本相对集中,可节省调查时间和费用, 因此总的抽样效率相对较高. 因此总的抽样效率相对较高.
ρc =
E Yij Y Yik Y E Yij Y
(
(
)(
)
)
2
分析: 分析:
对于固定的群i, 对于固定的群 ,两个不同的小单元指标离差的乘积可表示 为:
(Y
ij
Y
)(Y
ik
Y , j ≠ k
M M ( M 1) 2 = 个,总体中共 2
)
这样的离差乘积每个群中共有 有
NM ( M 1) 2
1 Y = NM
Y
y
N
是 Y 的无偏估Biblioteka 故 的无偏估计,M ij
∑∑ Y = Y
i =1 j =1
M
的无偏估计是总的样本均值: 无偏估计是总的样本均值: 估计是总的样本均值 y 1 n M y= ∑∑ yij = M nM i =1 j =1 .
2.估计量方差 .
1 f 1 N ∵V ( y) = (Yi Y ) 2 ∑ n N 1 i =1
是总体均值
∑∑ (Yij Yi )
N M i =1 j =1
2
2 N ( M 1) = S w
的无偏估计. 无偏估计.
4.估计量方差的无偏估计 .
2 S 2 = ( N 1 ) S b2 + N ( M 1 ) S w
(NM
1)
由此构造S 的无偏估计如下: 由此构造 2的无偏估计如下
个楼层96户居民人均月食品消费额资料 表1 12个楼层 户居民人均月食品消费额资料 个楼层
yij i 1 2 3 4 5 6 7 8 9 10 11 12 1 240 210 149 202 210 394 192 230 274 232 342 228 2 187 192 168 187 285 256 121 205 208 187 294 294 3 162 184 145 166 308 192 172 187 195 150 267 182 j 4 185 148 130 232 198 280 165 176 307 182 309 312 5 206 186 170 205 264 267 152 212 264 175 258 267 6 197 175 144 263 275 334 224 253 258 212 198 254 7 154 169 125 198 183 216 195 189 210 169 244 232 8 173 180 167 210 231 289 241 240 309 222 286 298 样本均值 样本标准差
的估计量及其方差可从上面的结果推出. 总体总和 Y = NMY 的估计量及其方差可从上面的结果推出.
【例】(冯P213例8.1) 例 )
在一次某城市居民小区进行的居民食品消费调查中, 在一次某城市居民小区进行的居民食品消费调查中, 以每个楼层为群进行整群抽样.每个楼层都有 个住户. 以每个楼层为群进行整群抽样.每个楼层都有M=8个住户. 个住户 用简单随机抽样在全部N=510个楼层中抽取 n=12个楼层. 个楼层中抽取 个楼层. 用简单随机抽样在全部 个楼层 全部96个样本户人均月食品消费额 ij及 按楼层的平均数 全部 个样本户人均月食品消费额y 个样本户人均月食品消费额 与标准差s 如表.试估计该居民小区人均食品消费额的户平均值, 与标准差 i如表.试估计该居民小区人均食品消费额的户平均值, 并给出95%的置信区间. 的置信区间. 并给出 的置信区间
2 2 S 2 = ( N 1) sb + N ( M 1) sw
( NM 1)
N很大时 很大时, 当N很大时,
2 ≈ 1 s 2 + ( M 1) s 2 S b w M 1 f 2 Sb 的无偏估计为: 类似构造 V ( y ) = 的无偏估计为: nM 1 f 2 v( y ) = sb nM
8.2.3群内相差系数 群内相差系数
群内相关系数( 群内相关系数(interclass correlation coefficient) ) ρc表示同一群内部不同小单元的指标值 对总体均值的离差 乘积的期望值 与总体中所有小单元指标值对总体均值 离差平方的期望值之比. 即群内相关系数定义式: 离差平方的期望值之比. 即群内相关系数定义式:
Sb2 的无偏估计. 的无偏估计, 是总体方差 S M 的无偏估计, 所以 s 是 的无偏估计.
2 b
2 b
作为单元的指标值, 另外如果将 Zi = ∑ (Yij Yi ) ( M 1) 作为单元的指标值,
M 2 j =1
2 yij yi ) n ( M 1) = sw 则其样本均值 ∑∑ ( n M 2 i =1 j =1
群内方差: 2 群内方差: S w =
N
M
1 n 2 = ∑ si n i =1
8.2.2估计量及其性质 估计量及其性质
1.总的总体均值 Y 的估计量 .
群大小相等时,对群的抽样常采用简单随机抽样. 群大小相等时,对群的抽样常采用简单随机抽样. 简单随机抽样 如果将群和Y 作为群的指标值, 如果将群和 i作为群的指标值,则Yi的总体平均值 1 n 的 简单估计为 y = ∑ yi = My n i =1 由简单随机抽样的性质, 由简单随机抽样的性质 总的总体均值
总体 平均群和: 平均群和:
Yi Y =∑ i =1 N
N
样本
y=∑
i =1 n
yi n
1 总均值 Y = NM 按小单元): (按小单元):
Y Yij = ∑∑ i =1 j =1 M
N M
N
M
1 y= nM
y ∑∑ yij = M i =1 j =1
n
M
n M 1 2 2 1 总方差 2 S = ∑∑ (Yij Y ) s = nM 1 ∑∑ (nij y ) 2 NM 1 i =1 j =1 按小单元): (按小单元): i =1 j =1
式的分子为: 个,因此(1)式的分子为: 因此 式的分子为
分子=
∑∑ (Y
N M i =1 j < k
ij
Y Yik Y
)(
)
NM ( M 1) 2
分母= 分母 ∑∑ (Y
N M i =1 j =1
ij
Y
N
)
2
MN =
NM 1 2 S MN
故
ρc =
2 b
y
的方差的估计为
v( y ) = 1 f 2 1 0.02344 sb = × 14186.18 = 144.3089 nM 12 × 8
s ( y ) = 144.3089 = 12.013
95%的置信区间 y ± u a s ( y ) = 218.375 ± 1.96 × 12.013 的置信区间 即(194.83,241.92). , ).
j =1
y i = ∑ y ij
j =1
Yi 的均值( 群i的均值(按小单元): Yi = 的均值 按小单元): M
的方差( 群i的方差(按小单元): 的方差 按小单元):
yi yi = M
ij
∑ (Y
j =1
M
Yi )
2
S i2 =
( yij yi ) 2 ∑ si2 =
j =1
M
M 1
M 1
主要内容: 主要内容 1整群抽样的概念和特点 整群抽样的概念和特点 2群大小相等的情形 群大小相等的情形 3群大小不相等的一般情形 群大小不 群大小 4估计总体比例 的整群抽样 估计总体比例P的整群抽样 估计总体比例