非抽样误差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1)R0
10001
1 0.4608
1
0.4
1468
n0 587, n1 881,n0 271
CT 1.0 1468 1.2 881 13.5 271 6183.7(0 元)
(二)加权调整法
一般是:回答率低的赋予大的权数,回答率 高的赋予较小的权数
如每个样本单元回答率Pi,那么对回答数据 进行加权调整时,以1/Pi为权数进行调整, 不过,一般Pi是未知的。
爱情,亲情,友情,让人无法割舍。 21.1.2 2021 年1月2 日星期 六9时2 0分27 秒21.1 .2
谢谢大家!
(一)二重抽样法 (二)加权调整法 (三)估算法
(一)二重抽样法
1 定义
先对总体采用费用较低但无回答较高的 方法调查,得到回答层的观测值。然后 对无回答层中随机抽选一个子样本用一 种回答率较高的方法进行调查,得无回 答层的观测值。从而得到总体参数的估 计值。称为二重抽样法。
2 估计量及估计量方差
例11-1 解:按题意,c=1.0,c1=1.2, c0=13.5,R0=0.4。则:
0
c c1R1 c0 (1 R0 )
1 1.2 0.6 0.4608 13.5 (1 0.4)
n 1000的简单随机样本,fpc 0, S 2 n 1000 V
则:n
S2 V
1
(1
0
其他参考书目:
《调查中的非抽样误差》 Judith T.Lessler 等著 中国统计出版社
第十一章 非抽样误差
第一节 非抽样误差主要来源及分类
调查误差
影响抽样误差的大小的因素
估计方法
样本量
抽样误差
抽样设计
总体变异程度
总体大小
一 、非抽样误差主要来源
1 非抽样误差是指除抽样误差外,由于 其他各种原因而引起的误差。
V ( y)
(1 n
1 )S 2 N
R0 n
1
h
1
S
2 0
3 无回答层抽样比及样本量的确定
CT cn c1n1 c0n cn c1R1n c0 0 R0n 使CTV 最小的最优 0
0
S
2 0
(c
c1
R1
)
c0 (S
2
R0
S
2 0
)
给定V ,则:n
N[S 2
(1/
0
1)
R0
S
2 0
NV S 2
t 0
t 0
(三)估算法
估算法是指当无回答出现时,用适当的 方式对每个缺失的无回答数据进行估计 或直接用别的现有数据替代。
常用于项目无回答。
可用现有回答数据的整体或分类平均数 /众数/回归估计估算缺失项目,或者, 用与无回答单元其他特征基本类似的单 元的数据直接替代。
本章小结
1 非抽样误差的主要来源、分类 2 抽样框误差的种类 3 无回答误差、降低措施及调整
第四篇 抽样的其他技术和问题
第四篇 抽样的其他技术和问题
十、二重抽样 教学目的与要求:使学生理解二重抽样的基
本理论 教学难点与重点:估计量及估计量方差的一
般公式
第四篇 抽样的其他技术和问题
十一、非抽样误差 教学目的与要求:了解各类非抽样误差及其
一般的处理方法。 教学难点与重点:无回答误差
第三节 无回答误差
一、定义:
无回答是指由于种种原因没有能 够对被抽出的样本单元进行计量, 没有获得有关这些单元的数据。
二、表现:
1.单元无回答和项目无回答 单元无回答: 项目无回答: 2.有意无回答和无意无回答
三、无回答的影响
1.无意无回答的影响: 2.有意无回答的影响: 主要影响有效样本量,会造成估计量方
原样本样本量n, n1个单元回答,样本均值为yn1 ; 无回答的单元为n0,在其中用简单随机再抽取n0
个单元,抽样比 0 n0 / n0事先确定,再次访问
得样本均值为yn0 ,Y的一个无偏估计为: 1
y r1 yn1 r2 yn0 n [n1 yn1 n0 yn0 ]
S 02是无回答层的方差,R0是总体无回答率
日复一日的努力只为成就美好的明天 。21:2 0:272 1:20: 2721: 20Sat urday, January 02, 2021
安全放在第一位,防微杜渐。21.1.2 21.1.2 21:20 :2721 :20:2 7Janu ary 2, 2021
加强自身建设,增强个人的休养。20 21年1 月2日 下午9时 20分2 1.1.22 1.1.2
第二节 抽样框误差
一、抽样框误差的产生
抽样框是有关总体全部单元的名录、地 图等的框架。
一般,抽样总体和目标总体一致。 如果不一致,就会产生抽样框误差。
二、抽样框误差的种类
1.丢失目标总体单元。 2.包含非目标总体单元。 3.两总体单元不完全一一对应,即复合
连接 4.辅助信息不完全或不正确。
科学,你是国力的灵魂;同时又是社 会发展 的标志 。下午 9时20 分27秒 下午9 时20分 21:20: 2721. 1.2
每天都是美好的一天,新的一天开启 。21.1 .221.1 .221: 2021: 20:27 21:20 :27Ja n-21
相信命运,让自己成长,慢慢的长大 。2021 年1月 2日星 期六9时 20分2 7秒Sat urday , January 02, 2021
非抽样误差存在于各种抽样和调查中, 而且不能通过增大样本量而得到控制。
二、从抽样调查的环节来看,可分为:
1 调查设计过程中引起的误差 2 调查实施过程中产生的误差 3 数据汇总和处理过程中引起的误差
三、按非抽样误差的来源、性质和处理方 法不同常可分为三类:
1 抽样框误差 2 无回答误差 3 计量误差
生活中的辛苦阻挠不了我对生活的热 爱。21 .1.221 .1.2Saturda y, January 02, 2021
Fra Baidu bibliotek
人生得意须尽欢,莫使金樽空对月。 21:20: 2721: 20:27 21:20 1/2/2 021 9:20:27 PM
做一枚螺丝钉,那里需要那里上。21 .1.221 :20:2 721:2 0Jan- 212-J an-21
精益求精,追求卓越,因为相信而伟 大。20 21年1 月2日 星期六 下午9时 20分2 7秒21 :20:2 721.1. 2
让自己更加强大,更加专业,这才能 让自己 更好。 2021年 1月下 午9时2 0分21 .1.221 :20Ja nuary 2, 2021
这些年的努力就为了得到相应的回报 。2021 年1月 2日星 期六9时 20分2 7秒21 :20:2 72 January 2021
波利茨、西蒙斯的调整方法
ti是其他5晚在家的可接受调查的天数。
Pˆi
pi
1 (t 6
1),t
0.1.2.3.4.5
按t分为6组,t组均值yt ,频数nt
总体均值的估计为:
5
5
yt nt / pt
yt nt /(t 1)
y ps
t 0 5
t0 5
nt / pt
nt /(t 1)
差的增大,造成估计的偏倚。
四、降低无回答的措施与方法
1.改进调查的组织,加强对调查员的培训 2.多次访问 3.替换样本单元 4.对敏感性问题(所调查的内容涉及私人机密而
不愿或不便于公开表态或陈述的问题)。可采用一 定技术:一般用随机化回答技术,即被调查 者对所调查问题采取随机回答的方式。
五、对无回答的调整
给定CT,则:n
c
CT c1R1
c0
0 R0
当S
2 0
S 2且N较大时, 0和n的简化式为
0
c c1R1 c0 (1 R0 )
给定V ,则:n
S2 V
1
1 (
0
1)R0
例11-1
欲进行一次民意测验,N很大,按精度要求需要抽 取n=1000人(简单随机抽样)。现拟先采用邮寄 问卷调查,预期无回答率为40%,然后对所有无 回答的再抽一个简单随机子样本进行派员访问。设 邮寄一份问卷的费用是1.0元,对回答的每份问卷 数据处理费用是1.2元,派员调查与数据处理费用 合计每份13.5元。假定无回答层方差与总体方差 相等,试求为满足精度要求应邮寄多少份问卷?对 无回答者进行派员调查的比例是多少?预期费用多 少?