第七章 整群抽样

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 b
样本群内方差:
a M 1 a 2 1 2 s si ( y y ) ij i a i 1 a(M 1) i 1 j 1 2 w
样本第i群群内方差:
1 M s ( yij y i )2 M 1 j 1
2 i
第二节
群大小相等的整群抽样
LOGO
二、估计量及其性质
AM ( M 1) 2
• 分母:
2 ( Y Y ) ij i 1 j k
AM

AM 1 2 S MN
• 经计算可以得到:
2 (Yij Y )(Yik Y )
i 1 j k
A
M
( AM 1)( M 1) S 2
第二节
• 变形:
群大小相等的整群抽样
总体总值及按群平均的总体均值:
Y Yi Yij
i 1 i 1 j 1 A A Mi
Y 1 A Y Yi A A i 1
样本总值及按群平均的样本均值:
y yi yij
i 1 i 1 j 1 a a mi
y 1 a y yi a a i 1
二、估计量及其性质
ˆ AM y • 总体总值Y的无偏估计: Y
• 方差: •
2 A ˆ ) M (1 f ) S 2 V (Y b a
2 A M (1 f ) 2 ˆ v ( Y ) sb 方差的无偏估计: a
第二节
群大小相等的整群抽样
LOGO
【例7.1】某居民小区共有600个单元,每个单元均居住10户。现以单元 为群进行整群抽样,随机抽取15个单元,调查每户每周食品支出费用, 调查结果及各单元样本均值和标准差如表7-1所示。
第一节
抽样方式
LOGO
• 实施理由: ① 缺少调查单位的必要信息无法对其直接编制抽样框实施 概率抽样,而由调查单位组成的群是现成的或者群很容 易划分从而编制群抽样框非常容易时,常采用整群抽样。 ② 使调查实施便利、节省费用而采用整群抽样。 ③ 对某些由特殊结构的群组成的总体实施整群抽样能使精 度有较大提高。
M0: 总体包含调查单位总数 M 0 M i
i 1
A
第三节
群大小不等的整群抽样
LOGO
一 、符号说明
总体第 i群总值及均值: Yi
Yij
j 1 Mi
样本第 i群总值及均值: yi yij
j 1
mi
Yi 1 Mi Yi Yij M i M i j 1 yi 1 mi yi yij mi mi j 1
a A ˆ y Ay • 总体总值 Y的无偏估计: Y i a i 1
A
• 方差:
2 A ˆ ) (1 f ) V (Y a
2 ( Y Y ) i i 1
A 1
2
ˆ) • 方差的无偏估计: v(Y
( y y) A (1 f )
i 1 i
a
2
a
a 1
a M
A
M
1 A M 总体方差: S (Yij Y )2 AM 1 i 1 j 1
2
M A 总体群间方差: S (Y i Y )2 A 1 i 1
2 b
A M 1 A 2 1 2 ( Y Y ) 总体群内方差: S Si i ij A i 1 A(M 1) i 1 j 1 2 w
yij: 样本中第i群的第j单位调查标志值
Mi: 第i群规模(单位个数) 本节中,M1= M2 =……=MN =M
第二节
群大小相等的整群抽样
LOGO
一 、符号说明
总体第 i群总值及均值:
Yi Yij
j 1 M M
Y 1 Yi i M M
Yij j 1
ij
M
样本第 i群总值及均值: yi yij
M ( A 1) Sb2 ( AM 1) S 2 ( AM 1)( M 1) S 2
LOGO
2 ① 当群内方差 Sw 0 时, 1为极大值; 2 2 ② 当群内方差与群间方差相等,即 Sw 时, Sb 0;
(分群过程完全随机,为简单随机抽样)
1 ③ 当群间方差 S 0 时, ,为极小值,此时各群的 M 1
y 1 a y yi a a i 1
第二节
群大小相等的整群抽样
LOGO
一 、符号说明
按调查单位平均的总体均值:Y Y 1 AM AM
y 1 按调查单位平均的样本均值:y aM aM
1 A Y Yij Y i A i 1 M i 1 j 1
1 a y y y ij i a M i 1 j 1 i 1
第三节
群大小不等的整群抽样
LOGO
一 、符号说明
A Y 1 A 按调查单位平均的总体均值: Y Yi M i Y i M 0 M 0 i 1 i 1 M 0
1 a 按调查单位平均的样本均值: y y i a i 1
第三节
群大小不等的整群抽样
LOGO
二、按简单随机抽样抽群,采用简单估计量
j 1
y 1 yi i M M
y
j 1
M
总体总值及按群平均的总体均值:
Y Yi Yij
i 1 i 1 j 1 A A M
Y 1 A Y Yi A A i 1
样本总值及按群平均的样本均值:
y yi yij
i 1 i 1 j 1 a a M
试求该居民小区平均每户每周食品支出费用并给出其置信水平为95%的 置信区间。
第二节
群大小相等的整群抽样
LOGO
三、整群抽样效果分析及群的划分原则
当直接对调查单位进行简单随机抽样时,有:V ( y )
1 f 2 V ( y) V ( y) ( Sb S 2 ) aM
2 0, Sb S2
r • 表明:整群抽样估计量精度与群内相关系数有密切关系, 越大即群内调查单位之间相似程度越大,群内差异越小, 估计量方差就越大。
第二节
群大小相等的整群抽样
LOGO
• 若按简单随机抽样直接从总体中抽取aM个调查单位,则 样本均值的方差为:
1 f 2 Vsrs ( y ) S aM
• 整群抽样的设计效应为:
(基本出发点是群的组成应有利于整群样本估计量精度尽可能高)
• 二是如何确定群的规模。
(群的规模的选择取决于精度与费用之间的平衡)
第二节
群大小相等的整群抽样
LOGO
一 、符号说明
总体由A个群组成,从中随机抽取a个群,对抽中群的所有单位全部调查。
A: 总体群数 a: 样本群数 Yij: 总体第i群的第j单位调查标志值
• 总体均值 Y 的无偏估计: y y 1 aM aM
V ( y) 1 f 2 Sb aM
1 a y y y ij i a M i 1 j 1 i 1
a
M
• 方差:
2 • 方差的无偏估计: v ( y ) 1 f sb
aM
第二节
群大小相等的整群抽样
LOGO
第一节
抽样方式
LOGO
二、整群抽样的特点
• 调查精度:整群抽样估计量的精度(估计量方差)与群的 划分有直接关系。 • 调查费用:整群抽样调查单位相对集中,平均单位调查费 用较少,因此可以通过适当扩大群样本量以提高整群抽样 的精度,同时使调查费用仍比较省。
第一节
抽样方式
LOGO
三、群的划分原则
一般群是自然形成的,或者是现有的单位。 当群需通过划分确定时需考虑两个问题: • 一是如何定义群的组成;
1 M 2 ( Y Y ) 总体第i群群内方差: S i ij M 1 j 1
2 i
第二节
群大小相等的整群抽样
LOGO
一 、符号说明 样本方差:
a M 1 s ( yij y)2 aM 1 i 1 j 1 2
样本群间方差:
M a s ( y i y )2 a 1 i 1
群的划分原则:使群内差异尽可能大,群间差异尽可能小。
第二节
群大小相等的整群抽样
LOGO
四、群内相关系数与设计效应
• 群内相关系数定义:
E (Yij Y )(Yik Y ) E (Yij Y )2
A M
• 分子:
(Y
i 1 j k
A M
ij
Y )(Yik Y )
第七章 整群抽样
本章要点
LOGO
对于整群抽样,本章给出了群大小相等和群大小不等 的整群抽样方法及与之匹配的估计量、估计量的方差及方差 的估计量。 • 具体要求: • 掌握群大小相等情形对群进行简单随机抽样简单估计量的 无偏性、方差及方差的无偏估计,掌握群的划分原则;了 解群内方差、群间方差概念及其对整群抽样精度的影响。 • 掌握群大小不等情形与简单随机抽样相匹配的简单估计量、 比率估计量及与抽样相匹配的汉森-赫维茨估计量及性质。 • 掌握估计总体比例的整群抽样方法及简单估计量、比率估 计量。
1 f 2 S aM
2 0, Sb S2
2 0, Sb S2
在相同的调查单位样本量aM下,只有当群间方差Sb2 比总 体方差 S 2 小时整群抽样才优于简单随机抽样。
第二节
群大小相等的整群抽样
LOGO
总体方差分解:
A M A M 1 1 2 S (Yij Y ) [(Yij Y i ) (Y i Y )]2 AM 1 i 1 j 1 AM 1 i 1 j 1 2
第一节
抽样方式
LOGO
一、整群抽样及其实施理由
• 定义:
一级抽样单位
设总体由A个初级抽样单位组成,在总体中按某种方 法抽取a个初级抽样单位,如果对被抽中初级抽样单位的次 级单位不再进行抽样观测而是全部进行调查,则称此抽样方 法为整群抽样(cluster sampling),初级抽样单位称为群。
将总体划分为若干群,以群为抽样单位,对群中的所有单位进行调查。 二级抽样单位

2 ( Y Y ) M ( Y Y ) i i ij 2 i 1 j 1 i 1
A
M
A
AM 1
2 A( M 1) S w ( A 1) Sb2 AM 1
2 S 2是常数,故当群内方差 Sw 对于固定的总体, 增大(或减 小)时,群间方差 Sb2 必然减小(或增大)。
• 表明:按调查单位的相同样本量,整群抽样的方差为简单 随机抽样的方差的 1 ( M 1) 倍。
V ( y) deff 1 ( M 1) Vsrs ( y )
第三节
群大小不等的整群抽样
LOGO
一 、符号说明
总体由A个群组成,第i群含Mi个调查单位
A: 总体群数 a: 样本群数 Yij: 总体第i群的第j单位调查标志值 yij: 样本中第i群的第j单位调查标志值 Mi: 第i群规模(单位个数)
• 方差的无偏估计:
ˆ) 1 f ˆ v(Y v(Y ) 2 M0 aM 2
a 1
• Y 及Y 的简单估计量的方差主要取决于群总值之间的差异。
• 在实际问题中常有各个群规模差异很大,而群的均值之间差异很小, 则群总值之间必然差异较大,此时简单估计量的精度很低。
第三节
群大小不等的整群抽样
LOGO
三、按简单随机抽样抽群,采用比率估计量
• Y 的比率估计量:
ˆ YR
A
y
i 1 a i 1
a
i
m
i
(有偏)
2
i
ˆ 1 f • 方差: V (Y ) R 2 aM
(Y YM )
第三节
群大小不等的整群抽样
LOGO
ቤተ መጻሕፍቲ ባይዱ• 总体均值 Y 的无偏估计:
A
ˆ ˆ Y Ay y Y M0 M0 M
2 i
,其中 M
M0 A
• 方差:
ˆ) 1 f ˆ V (Y V (Y ) 2 M0 aM 2
(Y Y )
i 1
A 1
2 ( y y ) i i 1 a
2 b
均值都相等。
1 • 的取值范围是: ,1 M 1

的样本估计是:
2 2 sb sw r 2 2 sb (M 1)sw
第二节
群大小相等的整群抽样
LOGO
• y 的方差用群内相关系数近似表示:
1- f ( AM - 1) 2 轾 V ( y) = S 臌 1 + (M - 1) r 2 a M ( A - 1) 1- f 2 轾 ? S 臌 1 (M - 1) r aM
相关文档
最新文档