多阶段抽样

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

均值的估计量为 1 n Mi 1 y yi n i 1 M nM 可以证明 ,估计量
Mi i 1 mi
n
y
j 1
mi
ij
y 是无偏的。其方差为:
N M i 2 (1 f 2i ) 2 1 f1 N M i 1 2 V ( y) ( Yi Y ) ( ) S 2i n( N 1) i 1 M Nn i 1 M mi
M
1 N 1 N M Y Yi Yij 为总体按次级单元的平均数。 N i 1 NM i 1 j 1
N 1 S (Yi Y ) 2为总体初级单元间的方差。 N 1 i 1 2 1
N M 1 2 S ( Y Y ) ij i 为总体初级单元内的方差。 N ( M 1) i 1 j 1 2 2
1 N
S
i 1
N
2 2i
2 S2
N E2 [( n 1) s ] E2 ( yi y ) 2 i 1
2 1
E2 ( yi 2 ) nE2 ( y 2 )
i=1 n
n
[ E2 ( yi )]2 V2 ( yi ) n [ E2 ( y )]2 V2 ( y )
在不等概率抽样中,如果是不放回抽样,且每个单元入
样概率与其大小或规模 M i 严格成比例,即当n固定时, 记 PS抽样。 i M,则称抽样形式为严格的 i M0
其中
M0 Mi
i 1
N
对于二阶段抽样,若第一阶段抽样按放回的多项抽样抽取
初级单元,第i个初级单元被抽中的概率为 i ( 则全部次级单元的总体均值的无偏估计量为
1 f1 2 f1 (1 f 2 ) 2 E[v y ] E s1 s2 nm n 1 f1 f1 (1 f 2 ) 2 E ( s1 ) E2 ( s 2 2 ) n nm 1 f1 2 (1 f1 )(1 f 2 ) 2 f1 (1 f 2 ) 2 S1 S2 S2 n nm nm 1 f1 2 1 f 2 2 S1 S2 n nm V y
N Mi N
Mi Pi i 1 M
N
样本比例为:
1 n Mi 1 p pi= n i 1 M nM
M i mi yij i 1 mi j 1
n
估计量p是无偏的,其方差为:
1 f1 N M i 2 1 N M i 2 (1 f 2i ) 2 V ( p) ( ) ( Pi P) ( ) Pi (1 Pi ) n( N 1) i 1 M Nn i 1 M mi

(二)总体总值的估计

总体总量 Y 的估计值为 Y NMy ,方差的无偏估计为
v( y ) N M v( y )
2 2
(三)总体比例的估计
Ai Yij 为总体第i个初级单元中具有某种特征的次级单元数
j 1 M
Ai Pi M
m
为总体第i个初级单元中具有某种特征的次级单元比例
2 ( Y Y ) ij i n 1 f 2 j 1 m M 1 i 1 M
1 f1 i 1 1 f2 1 n 2 E1 ( S 2 i ) n N 1 mn n i 1 1 f1 2 1 f 2 1 N 2 S1 ( S ) n mn N i 1 2 i 1 f1 2 1 f 2 2 S1 S2 n mn


假设总体由N个初级单元组成,每个初级单元 又由若干个二级(次级)单元组成,若在总体 中按一定的方法抽取n个初级单元,对每个被 抽中的初级单元再抽取若干二级单元进行调查, 这种抽样被称为二阶段抽样。 如果每个二级单元又由更小的三级单元组成, 那么可以对每个被抽中的二级单元中的三级单 元再进行抽样,则整个抽样过程就是三阶段抽 样。以此类推,可以定义更高阶的多阶段抽样。
1 N s ( yi y ) 2 为样本初级单元间的方差。 n 1 i 1
2 1
n m 1 s ( yij yi ) 2 为样本初级单元内的方差。 n(m 1) i 1 j 1 2 2
1 m yi yij m j 1
(一)总体均值的估计

如果采用简单随机抽样的方法,第一阶段抽出n个初级单 元,第二阶段从每个抽中的单元中抽出m个次级单元,其 中每个初级单元都含有M个次级单元,且对每个初级单元, 第二阶段抽样都是相互独立的,则样本按次级单元的均 值 是总体均值 的无偏估计,即 Y y
i
(Y Y )
N
2
V ( y ) 的无偏估计量是
1 f1 2 f1 (1 f 2 ) 2 v( y ) s1 s2 n nm
证明:
n m 1 2 E ( s ) E1 E2 ( s ) E1 E2 n( m 1) ( yij yi ) i 1 j 1 m 1 1 n 2 E1 E2 ( yij yi ) ( m 1) j 1 n i 1 M 1 n 1 2 E1 (Yij Yi ) n i 1 M 1 j 1 2 2 2 2
V ( y ) V1[ E2 ( y )] E1[V2 ( y )] 1 n 1 n V1 E2 ( yi ) E1 V2 ( yi ) n i 1 n i 1 1 1 n V1 Yi E1 2 n n i 1
n
2
2 S 2i i 1
n


其中
1 n Yn Yi n i 1
2 E ( s12 ) E1 E ( s 2 1 )
n Yi Yn E1 i 1 n 1 1 f2 2 2 S1 S2 m


2
n 2 1 f S 2i 2 E1 i 1 m n
ai yij 为样本第i个初级单元中具有某种特征的次级单元数
j 1
pi
ai m
为样本第i个初级单元中具有某种特征的次级单元比例
总体中具有某种特征的次级单元对总体中所有次
级单元数比例P的无偏估计量为
1 n 1 n m p pi yij n i 1 nm i 1 j 1


二阶段抽样中,一个估计量 ˆ 的均值可以表示为 ˆ)] E( ) E1[ E2 ( 二阶段抽样中,一个估计量 ˆ 的方差可以表示为


ˆ)] V ( ) V1[E2 ( )] E1[V2 ( ˆ) 证明:令 E (

ˆ)] 根据 E1[ E2 (
E( y ) Y
且方差为
1 f1 2 1 f 2 2 V ( y) S1 S2 n nm
证明:
1 n 1 n E ( y ) E1[ E2 ( yi )] E1 E2 ( yi ) n i 1 i 1 n n n 1 1 E1 Yi Yi Y n i 1 N i 1
估计量方差的样本估计为:
n M i 2 (1 f 2i ) 2 1 f1 n M i 1 2 v( y ) ( yi y ) ( ) s2i n(n 1) i 1 M nN i 1 M mi
(二)总体比例估计
两阶段均采用等概率抽样
总体比例为 :
1 P Yij / M 0 M i Pi / M 0= N i 1 j 1 i 1


ˆ )2 ] V ( ) E( )2 E1[E2 ( 2 2 ˆ) 2 E2 ( ) E2 ( ) 2 E2 ( 2 [ E2 ( )] V2 ( ) 2 E2 ( ) 2 V ( ) E1[E2 ( ) ] E1[V2 ( )] ˆ)] V1[E2 ( )] E1[V2 (
2 2



初级单元大小相等 时的二阶段抽样
符号说明
设总体划分为N个初级单元,每个初级单元中含有M个次级单元。
Yij 为总体第i个初级单元中第j个次级单元的指标值。
Yi Yij 为总体第i个初级单元的指标和。
j 1
M
1 Yi M
Y 为总体第i个初级单元指标按次级单元的平均数。
j 1 ij
总体中具有某种特征的次级单元对总体中所有次 级单元数比例P的无偏估计量 p 的方差V ( p)为
N 1 f1 1 N 1 f2 M 2 V ( p) ( Pi P) PQ i i n N 1 i 1 nm N ( M 1) i 1
V ( p) 的一个无偏估计为
i 1 n
1 f2 2 1 1 f2 1 n 2 2 Yi S 2i n Yi n. 2 . m n m i 1 i 1 n i 1
n
2
2 S 2i i 1
n
源自文库
1 f2 n 2 1 f2 1 n 2 2 Yi n Yi S 2i m i 1 nm i 1 n i 1 n 2 ( n 1)(1 f 2 ) n 2 Yi Yn S 2i nm i 1 i 1
随机抽样方式就称为不等概率随机抽样,简称不等概
率抽样。
最常用且较为简单的不等概率抽取初级单元的方法是
以各初级单位所包含的次级单元数在总体全部次级单 元总数中所占的比重来确定的。
在不等概率抽样中,如果是放回抽样,且每个单元的入
样概率与其大小或规模 M i 严格成比例,即当n固定时, 记 i M i M 0 ,则称抽样形式为PPS抽样。
从总体的N个初级单元中抽取n个初级单元,并从每个被 抽中的初级单元中抽取m个次级单元组成样本。
yi yij 为样本第i个初级单元的指标和。
j 1
yij 为样本第i个初级单元中的第j个次级单元的指标值。
m
1 n 1 n m y yi yij 为样本按次级单元的平均数。 n i 1 nm i 1 j 1
估计量方差的样本估计为 :
n M i 2 (1 f 2i ) 1 f1 n M i 2 1 2 v( p ) ( ) ( pi p) ( ) pi (1 pi ) n(n 1) i 1 M Nn i 1 M (mi 1)
不等概率抽取初级单元
如果总体中每个单元的入样概率是不相等的,则这种
n 1 f1 n f (1 f ) 2 1 2 v( p ) ( p p ) pi (1 pi ) i 2 n(n 1) i 1 n (m 1) i 1
初级单元大小不等的二阶段抽样
等概率抽取初级单元
(一)总体均值估计
设总体划分为N个初级单位,各初级单位中所包含的次级 单元数为: M i (i=1,2,…,N)。
M 0 M i 为总体所包含的次级单元总数 。
i 1 N
M
Mo 为各初级单元中所包含的次级单元数的均值。 N
N
1 N Mi Y Yij / M 0 M iYi / M 0= Yi 为总体按次级单元平均。 N i 1 M i 1 j 1 i 1
N Mi
两个阶段都采用简单随机抽样,则全部次级单元的总体
相关文档
最新文档