抽样调查第八章-调查中的复杂样本PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 多 次 重 复 2. 与 抽 样 方 式 无 关 ,但 每 个 样 本 抽 样 方 式 一 致 。
得 到 K 个 关 于 的 估 计 , 记 为 ˆ a ( a 1 , 2 ,... k )
-
5
k
ˆa
ˆ
k
E (ˆ)
k(ˆa ˆ)2
(ˆ)
k(k 1 )
E { (ˆ) } V (ˆ)
无偏估计
表 一 各 类 别 回 答 结 果
随 机 组 经 常 很 少 没 有 无 明 确 回 答 未 回 答 合 计
1 1 6 4 0 1 7 2 1 9 9 4 2 2 0 3 0 1 7 3 1 5 8 5 3 1 8 3 5 1 6 1 1 5 8 5 4 1 7 3 1 1 4 2 1 6 8 0 5 1 4 3 2 1 5 3 1 8 8 2 6 1 5 3 2 1 2 4 1 6 7 9 7 1 9 3 0 1 7 3 1 7 8 6 8 1 3 3 7 1 1 3 1 8 8 2
S1
城区 拒答户
数 合拒合格答格调户调查数查户户数数样样本本
1 Sxy1122
41
S2
合格调查户 数
150
拒答户 数
37
合格调查 户数
149
2
40
149
30
148
3
38
145
38
150
总计
119
444
105
447
Rˆ XYˆˆ11YXˆˆ22
2240.251 891
R ˆ1 2(R ˆ1R ˆ2)1 2(0 .26 0 .8 2) 30 5 .25
第一节 概述
一、 什么是复杂样本
二、基本思路
典型抽样方法? 复杂设计:多种抽样方法结合,多 种抽样框
复杂估计:非线性,无回答调整, 加权估计,事后分层
重1.抽“复样制”(复制样本),泰勒级数,广 2“迭代” 义方差函数
三 特点
不是百分之百准确,但简化了复杂过程
-
1
第二节 随机组法
一. 什么是随机组法(Random Group Method)
v1(R ˆ)k(k11)k1(R ˆR ˆ )20.000274
v2(R ˆ)k(k11)k1(R ˆR ˆ)20.00 - 0274
12
案 例 : 美 国 A A A M o t e l的 调 查
调 查 内 容 : 意 向 调 查 抽 样 框 : 文 档 卡 片 调 查 设 计 主 要 特 征 : 调 查 结 果 : 见 表 一 、 表 二
2121 1 5
3220 1 5
4212 0 5
5131 2 7
6220 1 5
7131 1 6
8121 2 6
9221 0 5
1 0 1 2 0 2 5
-
16
合 计 1 4 2 1 9 1 1 5 5
总数
问 题 1 : 合 同 汽 车 旅 馆 的 估 计 值 及 方 差 ? 问 题 2 : 回 答 为 “ 经 常 ” 的 合 同 汽 车 旅 馆 的 数 量 及 方 差 ? 问 题 3 : 估 计 回 答 “ 很 少 ” 与 “ 没 有 ” 的 比 例 及 其 方 差 ?
3.按照第2步的方法有放回地再抽取9个样本,10个样本
(或随机组) 互相独立。 4.结果有854个汽车旅馆被抽入总样本,向每一个单元
寄一张调查表。其他单元不是合同汽车放馆,不属于被 调查总体。没有单元被重复观测。 5.10天后,对无回答的单元第二次寄调查表,再过一 星期第三次寄调查表。如果一个单元24天后仍无返回调 查表,就被认为是无回答者。 6.将无回答者按随机组的数字顺序排列,并从每3个相 邻组中随机抽选一个。忽略对- 随机组估计量独立性的破14 坏。
不同的名称: replicate samples 重复样本 ultimate cluster 末级群 交叉样本 等
不同的术语来自于不同的应用。
-
2
设 y 1 , y 2 ,... y n 为 来 自 同 一 总 体 的 变 量 值 , 则
Y 的方差可用
n
1
1
n
(yi
y)2
估
计
,
记 ˆ1 为 的 一 个 估 计 量 , 同 样 方 法 重 复 K 次 , 则 可 得 到 ˆ1 ,ˆ 2 ,... ˆ k
k (ˆa ˆ ) 2
1 (ˆ) k (k 1)
E(ˆ)E(ˆ) E(ˆ)E(ˆ)
k
(ˆa ˆ) 2
2 (ˆ) k (k 1)
保守估计
-
9
因 为 :
(ˆa ˆ)2 (ˆa ˆ)2K (ˆ ˆ)2 故 有 1(ˆ) 2(ˆ)
研 究 表 明 , 在 复 杂 调 查 应 用 中 , E {ˆ( ˆ)2}是
微 不 足 道 的 。
-
Βιβλιοθήκη Baidu
10
例 题 :
住 户 调 查 , 多 阶 段 分 层 抽 样 。 抽 取 样 本 S1, 放 回 后 再 按 照 同 样 方 式 抽 取 S2
调 查 得 到 ˆ1与 ˆ2
ˆ(ˆ1ˆ2)
2
(ˆ) 1
2(21)
2
(ˆaˆ)2=(ˆ1 4ˆ2)2
-
11
利用随机组方法估计拒答率及其方差
-
3
记 作
ˆ 1 k kˆi (ˆ) k (k 1 1 ) k(ˆi ˆ)2
它 是 参 数 V (ˆ ) 的 无 偏 估 计 , 称 估 计 量 ˆi(i 1 ,2 .k .).为 随 机 组 。
随 机 组 产 生 的 二 种 方 式 : 独 立 和 不 独 立
-
4
二、独立随机组
独立随机组的操作程序:
9 1 9 3 9 1 9 2 1 4 9 3 1 0 1 7 3 9 1 5 2 1 5 8 8 合 计 1 6 8 3 4 5 1 5 3 - 2 5 1 6 3 8 155 4
表 二 对 无 回 答 子 样 本 访 问 的 结 果
随 机 组 经 常 很 少 没 有 暂 时 关 闭 合 计
1122 1 6
-
6
的置信区间为
ˆ Z / 2 (ˆ )
ˆ k N(,2)
z (ˆ ) 2 /k
以比率估计为例
Y
X
ˆa
Yˆa Xˆ a
-
7
ˆ1k
k
Y ˆa X ˆa
k
Yˆa / k Yˆa
ˆ
a 1
k X垐a / k
Xa
a 1
全样本估计
-
8
对线性估计量,ˆ 与 ˆ 相同
对非线性估计量,ˆ 与 ˆ 通常不同
-
13
172个抽屉 64张卡片,卡片可能是可能是合同汽车 旅馆、饭店、空白卡片等
1.总体中约有5000个合同汽车旅馆,并准备抽取约700个 单元作总样本,这样,总抽样比约为700/5000,即约7 个里面抽1个。所以,每一个抽屉都各增加6张空白卡片, 这样每个抽屉都有70张卡片。
2.从每一个抽屉中随机抽取一张卡片,组成一个172张卡 片的样本。抽样在不同的抽屉中是互相独立的。
得 到 K 个 关 于 的 估 计 , 记 为 ˆ a ( a 1 , 2 ,... k )
-
5
k
ˆa
ˆ
k
E (ˆ)
k(ˆa ˆ)2
(ˆ)
k(k 1 )
E { (ˆ) } V (ˆ)
无偏估计
表 一 各 类 别 回 答 结 果
随 机 组 经 常 很 少 没 有 无 明 确 回 答 未 回 答 合 计
1 1 6 4 0 1 7 2 1 9 9 4 2 2 0 3 0 1 7 3 1 5 8 5 3 1 8 3 5 1 6 1 1 5 8 5 4 1 7 3 1 1 4 2 1 6 8 0 5 1 4 3 2 1 5 3 1 8 8 2 6 1 5 3 2 1 2 4 1 6 7 9 7 1 9 3 0 1 7 3 1 7 8 6 8 1 3 3 7 1 1 3 1 8 8 2
S1
城区 拒答户
数 合拒合格答格调户调查数查户户数数样样本本
1 Sxy1122
41
S2
合格调查户 数
150
拒答户 数
37
合格调查 户数
149
2
40
149
30
148
3
38
145
38
150
总计
119
444
105
447
Rˆ XYˆˆ11YXˆˆ22
2240.251 891
R ˆ1 2(R ˆ1R ˆ2)1 2(0 .26 0 .8 2) 30 5 .25
第一节 概述
一、 什么是复杂样本
二、基本思路
典型抽样方法? 复杂设计:多种抽样方法结合,多 种抽样框
复杂估计:非线性,无回答调整, 加权估计,事后分层
重1.抽“复样制”(复制样本),泰勒级数,广 2“迭代” 义方差函数
三 特点
不是百分之百准确,但简化了复杂过程
-
1
第二节 随机组法
一. 什么是随机组法(Random Group Method)
v1(R ˆ)k(k11)k1(R ˆR ˆ )20.000274
v2(R ˆ)k(k11)k1(R ˆR ˆ)20.00 - 0274
12
案 例 : 美 国 A A A M o t e l的 调 查
调 查 内 容 : 意 向 调 查 抽 样 框 : 文 档 卡 片 调 查 设 计 主 要 特 征 : 调 查 结 果 : 见 表 一 、 表 二
2121 1 5
3220 1 5
4212 0 5
5131 2 7
6220 1 5
7131 1 6
8121 2 6
9221 0 5
1 0 1 2 0 2 5
-
16
合 计 1 4 2 1 9 1 1 5 5
总数
问 题 1 : 合 同 汽 车 旅 馆 的 估 计 值 及 方 差 ? 问 题 2 : 回 答 为 “ 经 常 ” 的 合 同 汽 车 旅 馆 的 数 量 及 方 差 ? 问 题 3 : 估 计 回 答 “ 很 少 ” 与 “ 没 有 ” 的 比 例 及 其 方 差 ?
3.按照第2步的方法有放回地再抽取9个样本,10个样本
(或随机组) 互相独立。 4.结果有854个汽车旅馆被抽入总样本,向每一个单元
寄一张调查表。其他单元不是合同汽车放馆,不属于被 调查总体。没有单元被重复观测。 5.10天后,对无回答的单元第二次寄调查表,再过一 星期第三次寄调查表。如果一个单元24天后仍无返回调 查表,就被认为是无回答者。 6.将无回答者按随机组的数字顺序排列,并从每3个相 邻组中随机抽选一个。忽略对- 随机组估计量独立性的破14 坏。
不同的名称: replicate samples 重复样本 ultimate cluster 末级群 交叉样本 等
不同的术语来自于不同的应用。
-
2
设 y 1 , y 2 ,... y n 为 来 自 同 一 总 体 的 变 量 值 , 则
Y 的方差可用
n
1
1
n
(yi
y)2
估
计
,
记 ˆ1 为 的 一 个 估 计 量 , 同 样 方 法 重 复 K 次 , 则 可 得 到 ˆ1 ,ˆ 2 ,... ˆ k
k (ˆa ˆ ) 2
1 (ˆ) k (k 1)
E(ˆ)E(ˆ) E(ˆ)E(ˆ)
k
(ˆa ˆ) 2
2 (ˆ) k (k 1)
保守估计
-
9
因 为 :
(ˆa ˆ)2 (ˆa ˆ)2K (ˆ ˆ)2 故 有 1(ˆ) 2(ˆ)
研 究 表 明 , 在 复 杂 调 查 应 用 中 , E {ˆ( ˆ)2}是
微 不 足 道 的 。
-
Βιβλιοθήκη Baidu
10
例 题 :
住 户 调 查 , 多 阶 段 分 层 抽 样 。 抽 取 样 本 S1, 放 回 后 再 按 照 同 样 方 式 抽 取 S2
调 查 得 到 ˆ1与 ˆ2
ˆ(ˆ1ˆ2)
2
(ˆ) 1
2(21)
2
(ˆaˆ)2=(ˆ1 4ˆ2)2
-
11
利用随机组方法估计拒答率及其方差
-
3
记 作
ˆ 1 k kˆi (ˆ) k (k 1 1 ) k(ˆi ˆ)2
它 是 参 数 V (ˆ ) 的 无 偏 估 计 , 称 估 计 量 ˆi(i 1 ,2 .k .).为 随 机 组 。
随 机 组 产 生 的 二 种 方 式 : 独 立 和 不 独 立
-
4
二、独立随机组
独立随机组的操作程序:
9 1 9 3 9 1 9 2 1 4 9 3 1 0 1 7 3 9 1 5 2 1 5 8 8 合 计 1 6 8 3 4 5 1 5 3 - 2 5 1 6 3 8 155 4
表 二 对 无 回 答 子 样 本 访 问 的 结 果
随 机 组 经 常 很 少 没 有 暂 时 关 闭 合 计
1122 1 6
-
6
的置信区间为
ˆ Z / 2 (ˆ )
ˆ k N(,2)
z (ˆ ) 2 /k
以比率估计为例
Y
X
ˆa
Yˆa Xˆ a
-
7
ˆ1k
k
Y ˆa X ˆa
k
Yˆa / k Yˆa
ˆ
a 1
k X垐a / k
Xa
a 1
全样本估计
-
8
对线性估计量,ˆ 与 ˆ 相同
对非线性估计量,ˆ 与 ˆ 通常不同
-
13
172个抽屉 64张卡片,卡片可能是可能是合同汽车 旅馆、饭店、空白卡片等
1.总体中约有5000个合同汽车旅馆,并准备抽取约700个 单元作总样本,这样,总抽样比约为700/5000,即约7 个里面抽1个。所以,每一个抽屉都各增加6张空白卡片, 这样每个抽屉都有70张卡片。
2.从每一个抽屉中随机抽取一张卡片,组成一个172张卡 片的样本。抽样在不同的抽屉中是互相独立的。