抽样调查中无法消除的误差
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样调查中无法消除的误
差
篇一:抽样调查中无回答误差分析与控制
抽样调查中无回答误差分析与控制
提要无回答问题是影响抽样调查统计数据质量和利用效益的一个重要因素,也是非抽样误差的一个重要来源。
分析抽样调查中的无回答误差并讨论控制方法具有重要的理论和现实意义。
关键词:抽样调查;非抽样误差;无回答误差;随机化回答技术
统计调查的目的是取得能准确反映客观实际状况的统计数据。
但在许多时候,调查结果并不能准确地表现事实,总会有误差出现,尤其是在大规模的调查中更是如此。
误差分为抽样误差和非抽样误差,前者是由于抽样的随机性导致的,可以计算,也可以通过调整样本容量或者改变抽样方式来加以改善或控制;而后者既难以计算又难以控制,成为影响调研结果可靠程度的重要原因。
非抽样误差按照来源和性质不同,可以分为抽样框误差、无回答误差和计量误差。
其
中,无回答误差比较普遍,是影响统计数据质量和利用效益的一个重要因素。
在国外,对无回答问题的研究已经比较系统,而我国在这方面的研究却尚未成熟,抽样调查实践中更是缺乏对无回答的控制手段。
一、无回答误差及研究历程
无回答是指在资料收集过程中,调查对象由于各种原因没有回答调查者所需的资料和信息。
无回答情况一般发生在以人为调查对象的时候。
无回答误差是指在调查中由于各种原因,调查人员没能够从入选样本的单元处获得所需要的信息,数据缺失从而造成估计量的偏误。
它是由Bowley于1915年最先提出的,至今关于统计调查中无回答问题的理论研究大致可划分为三个阶段:第一阶段是宣传期(1915年至四十年代),有关学者开始了对无回答问题的初步研究,并强调处理无回答问题的重要性;第二阶段是专题研究期(20世纪四十年代中后期至七十年代末)。
这一时期许多学者对无回答问题进行了大量的专题研究,提出了无回答处理补救的经典方法;第三阶段是迅速发展期(20世纪八十年代初至今)。
这一时期涌现出了一批对回答方法理论进行系统总结的专著,并且以多重插补法为标志涌现出许多关于无回答多重插补的文献。
二、无回答误差产生的原因及影响
篇二:抽样调查中误差的控制
[摘要] 在抽样调查中,非抽样误差产生的原因十分复杂,且种类繁多,其对整个抽样调查的影响是不容忽视的。
本文对各种非抽样误差产生的原因进行了全面、深入的分析,并提出了防范非抽样误差的具体措施。
[关键字] 抽样调查;非抽样误差;抽样误差;控制措施[中途分类号] F222.1 [文献标识码] A [文章编号] 1008—9306(2001)05—0056—03 抽样调查是目前我国收集统计资料的一种主要方法,但抽样调查的结果始终要受到抽样误差和非抽样误差的影响。
其中抽样误差是不可避免的,它是由样本的结构与总体结构的随机差异导致产生的,其大小可以通过调整样本容量、改变抽样方式等加以控制;非抽样误差由于其产生的原因复杂而且又不易预测和非随机性等特点而难以控制,成为影响抽样调查结果准确性的重要原因。
因此,如何控制和减少抽样调查中的非抽样误差,确保抽样调查资料的质量,是我国统计界普遍关注的一个问题。
一、非抽样调查误差的产生及分解
非抽样误差产生的原因很多,从抽样设计,调查问卷的制定,调查人员的素质,到调查数据的处理,每一个环节都可能出现误差。
根据非抽样误差产生的方式和出现的阶段不同,可以将非抽样误差分解为以下几类:
(一)非抽样误差按其产生的方式不同,可以分为登记
性误差和系统性误差
登记性误差是指在调查过程中,由于工作出现失误而造成的误差。
产生登记性误差的主要原因可以归纳为两类:一类是由于计量手段的局限性所带来的难以绝对符合实际而出现的误差;另一类是由于登录、计算、抄报、汇总错误及被调查者所报不实或调查者有意虚报满报等所带来的误差。
系统性误差,是指在抽取样本单位时,由于加入主观意愿,破坏了随机抽样原则使样本不足以代表总体而造成的误差。
(二)非抽样误差按其产生的环节不同,可以分为设计误差、调查误差和汇总误差
设计误差是指在抽样设计阶段产生的误差。
产生设计误差的主要原因是由于采用了有缺陷的抽样框或者是调查问卷设计不科学所造成的。
抽样框是用来代表总体,从中抽选样本的一个框架。
一个理想的抽样框应该是每个总体单位在目录名单上出现一次,不重不漏,在可能的条件下还应包括与所研究变量相关的辅助资料,以便利用这些资料搞好抽样设计,减少非抽样误差。
但在实际中,一个理想的抽样框有时是很难取得的,如果我们采用了,有缺陷的抽样框,就必然会产生抽样框误差。
抽样框误差主要来自作业总体单位和目标总体单位的不理想联接、抽样框陈旧及误差的辅助信息的使用。
其中抽样框陈旧是指抽样框所提供的信息与实际情况差异较大。
抽样框陈旧会带来以下问题:(1)丢失目标总体
单位。
即有些目标总体单位没有在抽样框中出现。
(2)包含非目标单位。
即抽样框中包含了一些不属于研究对象的总体单位。
(3)丢失目标单位和包含非目标单位同时存在。
这些问题的出现都会导致抽样误差的产生。
调查问卷设计不科学,主演表现在有的调查问卷设计缺乏应有的技巧和提问艺术,或主体不明确,重点不突出,或条理不清楚,或逻辑性较差,或提问不够清晰明确等;还有的调查问卷在设计过程中只考虑研究者的方便,不顾被调查者的实际情况,或内容过于庞杂,或内容中涉及敏感提问太多,或所提问题的答案涵义不明确等,所有这些都会导致非抽样误差。
调查误差是指在调查过程中产生的误差。
这种误差从其产生的人员来划分主要包括调查人员误差和被调查人员误差两种。
调查人员误差的产生是由于调查工作过失和故意舞弊所致,如调查者自身的素质不高,工作粗糙、登陆马虎等所造成的误差都属于调查者的误差。
故意舞弊是指调查者是为了自己省事,根本没有按照调查方案的规定进行调查,而是随意编
甚至纂改调查资料。
被调查者误差的产生有的是由于被调查者对问题的理解发生差错或是因为被调查者即以不清回答有苦难而造成的;有的是由于调查的问题涉及到被调查者的利益故意错答所致;有的是由于调查的问题涉及到一些敏感性的问题或是提问方式不当而拒绝回答所致。
其中被调查
人员误差按被调查者是否回答,又可分为无回答误差和回答误差两种。
前者包括调查单位的无回答和调查项目的无回答。
调查单位的无回答是指未能从抽选样本中的一部分单位取得调查资料。
调查项目的无回答是指在抽样调查中对调查方案中的个别项目未能得到回答。
无回答误差产生的原因可归纳为以下两种:一是由随机抽样所确定的被调查单位在具体调查时未能接触到,致使被调查单位没有接受调查;二是虽然接触到了被调查者,但他们不合作,要么是调查涉及到个人隐私、商业秘密等敏感性问题而不愿意回答,要么是调查问卷中所列的调查项目超出了被调查者的实际能力和条件或调查项目复杂而无法回答。
后者产生的原因主要是由于被调查者所持有的立场、观点不同,文化水平、经济利益等方面存在差异,有意或无意的形成对客观现象的认识存在偏差。
如有的被调查者对一些问题没有正确的判断和见解,人云亦云;有的被调查者由于受调查员自身观点的影响而没能真正回答自己的观点;还有的被调查者由于受经济利益的驱动有意歪曲事实等等。
汇总误差是指在调查数据汇总、整理和数据传输过程中产生的误差。
这种误差的形成原因主要是由于我国统计数据处理技术落后和汇总人员的失误所致。
二、对非抽样误差的预防和控制
非抽样误差产生的原因十分复杂,误差种类繁多,对社会
经济造成的危害非常严重。
因此,我们应当针对非抽样误差产生的原因,从各方面、各环节出发,采取相应的措施对其实施有效的预防和控制。
(一)科学设计调查方案
抽样调查过程是一项系统工程,事先必须进行周密设计,制定出科学的调查方案,才能在调查的过程中减少非抽样误差。
科学的设计调查方案,应着重从抽样框和问卷设计两方面进考虑。
在抽样框方面,要求设计者在编制抽样框之前必须对调查总体的分布结构有一定的认识,在抽选样本之前,要对抽样框加以检查,发现可能存在的问题,进行识别和处理,并采取一定措施加以补救。
在问卷设计方面,要求设计者在设计问卷时要做到所提问题除了要符合调查主题外,还要看能否使被调查者完全明确调查的意图并乐意配合作出正确的回答。
具体来讲,应注意以下几点:(1)问卷设计的问题应当围绕调查的目的展开,切忌问一些不着边际的问题。
(2)所提问题要涵义明确,用词要恰当,简明扼要,符合逻辑,并注意礼貌。
(3)问卷中的用词要客观,不要有倾向性或诱导性。
(4)必须考虑被调查者的实际能力和条件,尽力避免被调查者不容易理解或不可能回答的问题,同时应少用专业术语。
(5)对一些敏感性问题,要想法淡化其敏感程度。
(6)所提问题的内容要单一,避免几个问题放在一起。
(7)问卷的内容不
能太多,不要过多占用被调查者的时间而影响其工作和休息。
(二)加强培训,提高抽样调查队伍的整体素质
抽样调查对抽样调查队伍的素质有较高的要求,它要求统计人员不但要有较高的专业造诣、高度的责任感、良好的职业道德和高度的敬业精神,而且还要有较强的实际工作能力。
调查问卷的设计者应具备的素质和能力是掌握统计推断的大量知识,了解调查内容的有关知识,具有一定的心理学知识并对计算机数据处理有所了解。
调查人员应具备的素质和能力,一是要有实事求是的工作态度和责任心,善于联系群众;二是熟悉调查目的和内容;三是能掌握并熟练地运用各种科学的调查方式、方法和技术,并能根据搜集资料的特点,合理的选择应用调查方法。
汇总分析人员应具备的素质和能力是能够准确无误的处理数据信息,熟练地应用统计分析方法并能熟练地撰写调查报告。
要全面提高统计队伍的整体素质应采取多种途径和方法,通过举办短期培训班定期和不定期的理论研讨会,经验交流会,到高等院校进修等方式,培养一支高素质的统计队伍。
对调查
育,使调查人员能够明确调查的目的和意义,增强工作责任感和责任心。
二是要对调查人员进行调查方法和调查内容的系统培训,以便调查人员能够尽快掌握调查方法,充分了解调查内容,减少工作差错。
(三)重视对调查员的挑选和管理
在抽样调查中,调查员直接同社会上形形色色的人群打交道,如果调查员在调查中不讲究访问技巧和措辞艺术,不善于和不同类型的人打交道,就不可能得到被调查者的有效配合。
如果调查员缺少实事求是的工作态度和责任心,没有吃苦耐劳的精神,就不可能取得准确的统计资料。
因此对调查员的挑选和管理是一项重要的工作,也是减少调查误差的一个关键。
首先,应挑选好调查员。
选择调查员应从理论专业知识、道德品质、应变能力等方面入手,选择那些思想和业务素质较好,工作能力强,应加强对调查人员的管理,要建立行之有效的约束机制,防止调查人员弄虚作假。
(四)采用多种途径,减少被调查者误差
抽样调查要求被调查者能够提供准确、完整的资料,但在实际调查时,由于各种原因,往往会遇到不回答或故意回答错误的情况,而导致被调查者误差的发生。
针对这一情况,一方面要采取适当的方式教育、感化被调查者,使其对调查能有正确的认识,愿意与调查者有效配合;另一方面还要采取有效的方法,减少被调查误差的发生。
对于一些涉及个人隐私和商业秘密的问题的调查,可以采用随机化回答技术,对被调查者提供的资料保密等来提高回答率。
对于被调查者有意无意提供了有偏差的数据而产生的误差,可以采用与有关记录核对、逻辑性检查或用重新调查进行核对等方法对调
查的资料进行修正。
对于那些为了某种利益有意歪曲事实,虚报、瞒报,故意造假产生的误差产生严重后果的要追究其法律责任。
(五)做好调查资料的汇总工作,防止汇总误差
对于在调查数据汇总和数据传输过程中产生的误差,从其形成的原因来看,应从两方面进行控制。
一是要对调查资料进行严格审核,制定科学的整理方案。
二是要采用先进的计算机整理技术。
总之,非抽样误差的大小,直接关系到抽样调查结果的准确性和可靠性。
深入分析各种非抽样误差产生的原因,从而找到预防和控制非抽样误差的具体措施,才能确保抽样调查结果的准确性,提高抽样调查资料的质量。
[参考文献]
[1]陈元江*市场调查的非抽样误差控制[J].中国统计,2000,(4):17—18
[2]王宝海*抽样调查中项目无回答的预防力补救[J].统计与决策,2001,(6):18—19
篇三:统计学第六章作业参考答案
第六章抽样调查
一、单项选择
1、在抽样调查中,必须遵循(B )抽取样本
A、随意原则
B、随机原则
C、可比原则
D、对等原
则
2、抽样调查的主要目的在于(C )A、计算和控制抽样误差B、了解全及总体单位的情况C、用样本指标推断总体指标D、对调查单位作深入的研究
3、在抽样调查中,无法避免的误差是(D )A、登记误差B、计算误差C、记录误差D、抽样误差
4、样本指标和总体指标(B )A、前者是个确定值,后者是个随机变量B、前者是个随机变量,后者是个确定值
C、两者均是确定值
D、两者均是随机变量
5、抽样平均误差反映了样本指标与总体指标之间的( B )A、可能误差范围B、平均误差程度
C、实际误差
D、实际误差的绝对值
6、抽样平均误差是(C )A、全部样本指标的平均数B、全部样本指标的平均差
C、全部样本指标的标准差
D、全部样本指标的标志变异系数
7、在其他条件保持不变的情况下,抽样平均误差(A )
A、随着总体标志变动程度的增加而加大
B、随着总体标志变动度的增加而减少
C、随着总体标志变动度的减少而加大
D、不随总体标志变动度的改变而改变
8、在其他条件保持不变的情况下,抽样平均误差(B )
A、随着抽样数目的增加而加大
B、随着抽样数目的增加而减少
C、随着抽样数目的减少而减少
D、不会随着抽样数目的改变而改变9、在同等条件下,重复抽样和不重复抽样相比较,其抽样平均误差( B )A、前者小于后者B、前者大于后者
C、两者相等
D、无法确定哪一个大
10、从2000名学生中按不重复抽样方法抽取了100名进行调查,其中有女生45名,则样本成数的抽样平均误差为( B )A、0.24% B、4.85% C、4.97% D、以上都不对
11、抽样极限误差反映了样本指标与总体指标之间的( D )A、抽样误差的平均数B、抽样误差的标准差C、抽样误差的可靠程度D、抽样误差的可能范围
12、若总体平均数X=50,在一次抽样调查中测得x=48,则以下说法正确的是
( C )
A、抽样极限误差为2
B、抽样平均误差为2
C、抽样实际误差为2
D、以上都不对
13、计算必要抽样数目时,若总体方差已知,应当从几个可供选择的样本方差中挑选出数值( C )A、最(来自: 小龙文档网:抽样调查中无法消除
的误差)小的B、任意的C、最大的D、适中的
14、在简单重复随机抽样条件下,欲使误差范围缩小一半,其他要求不变,则样本容量必须( B )A、增加2倍B、增加3倍C、减少2倍D、减少3倍
二、多项选择
1、从一个全及总体可以抽取一系列样本,因此(BCE )
A、总体指标是个随机变量
B、抽样指标是个随机变量
C、抽样指标的数值不是唯一的
D、抽样指标总是小于总体指标
E、抽样指标可能大于、等于或小于总体指标
2、抽样平均误差是(ABD )A、反映样本指标与总体指标的平均误差程度B、样本指标的标准差C、总体指标的标准差
D、衡量抽样指标对于全及指标代表程度的尺度
E、样本指标的平均数
3、采用类型抽样的组织形式(ACE )A、需要对总体各单位进行分组B、组内是进行全面调查
C、抽样误差较其它几种组织形式要小
D、最符合随机原则
E、适用于总体各单位标志值差异较大的总体
4、在其它条件不变的情况下,抽样极限误差的大小和推断的可靠程度的关系是
(CD )
A、允许误差范围越大,推断的可靠程度越低
B、允许误差范围越小,推断的可靠程度越高
C、扩大极限误差的范围,可以提高推断的可靠程度
D、缩小极限误差的范围,只能降低推断的可靠程度
E、扩大或缩小极限误差范围与推断的可靠程度无关
5、影响样本容量大小的因素有(ACDE )A、总体标准差的大小
B、样本各单位标志差异程度的大小
C、抽样估计的可靠程度
D、允许误差的大小
E、抽样的方法和组织形式
三、计算
1、某工厂有1500名职工,从中随机抽取50名职工作为样本,调查其工资水平,调查结果如下表:
②以95.45%的可靠性估计该厂职工的月平均工资和工资总额的区间。
在95.45%的概率条件下,该厂职工的月平均工资在934.42元至987.58元之间,职工工资总额在1401630元至1481370元之间。
2、某家电视台为了解某项广告节目的收视率,随机电话抽样调查500户城乡居民户作为样本,调查结果是:有160户居民户收看该广告节目。
试以99.73%的概率保证程度推断:
①收视率的可能范围;②若收视率的允许误差缩小为原来的一半,则样本容量如何?
已知:F(t)?99.73%,t?3??p?t?p?3?2.09%?6.27%
32%?6.27%?P?32%?6.27%
即:25.73%?P
38.27%
3、某农场某年播种小麦2000亩,随机抽样调查其中100亩,测得平均亩产为
455斤,标准差为50斤,试计算:①平均亩产量的抽样平均误差;②概率为95%的条件下,平均亩产量的可能范围;
③概率为95%的条件下,2000亩小麦总产量的可能范围。
4、某企业为调查其生产的一批机械零件合格率。
根据过去的资料,该企业该类机械零件合格率曾有过99%、97%和95%,现要求误差不超过1%,抽样估计的可靠程度为95%,问需要抽查多少个零件进行检测?
5、某工厂生产一种新型灯泡5000只,随机抽取100只作耐用时间试验。
测得结果是:平均寿命为4500小时,标准差300小时,试在90%概率保证下,估计该新式灯泡平均寿命区间。
若概率保证程度提高到95%,允许误差缩小一半,试问应抽取多少只灯泡进行测试?。