抽样论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样调查中非抽样误差的研究
摘要:在统计实践中,由于调查经费和时间的限制,往往不可能采取全面调查,而只能采取抽样调查的方法,抽样调查过程中由于抽样总体的代表性及人为的因素的影响,必不可少地会产生误差。因此从理论上讲非抽样误差应该使是可以避免的,但在实际工作中是很难做到的,本文主要分析了非抽样误差产生的原因和应对的方法。
关键词:抽样调查;分类;原因;对策
一、引言
抽样调查时目前我国搜集统计资料的一种主要方法,但是抽样调查的结果始终要受到抽样误差和非抽样误差的影响。抽样误差是由于样本随机性引起的,根据样本数据计算的对总体目标量的估计是随样本而异的。由此产生的误差即是抽样误差。抽样误差是不可避免的,其大小可以通过调查样本容量,改变抽样方式等加以控制。非抽样误差是指除抽样误差以外,由于各种原因引起的。非抽样误差由于其产生的原因及其复杂且具有不易观测和非随机性等特点而难以控制。两种误差构成了总方差,两者之间呈此消彼长的关系,一般情况下同时减少两类误差是很困难的。非抽样误差占据了很大的一部分,怎样通过降低非抽样误差。从而降低总方差,有着非常重要的现实意义。
二、非抽样误差的分类
非抽样误差可归为三类:抽样框误差.无回答误差和计量误差。以下就这三类误差分别进行讨论:
1.抽样框误差:理想的抽样框是使目标总体和被抽样总体一致,但在实践中,难免存在目标单位和样本单位不完全对应的情况。从而使得目标总体与被抽样总体不一致,产生误差。这种误差不是来自于抽样的随机性,而是产生于不完善的抽样框。称之为抽样框误差。抽样框误差主要来源于以下几个方面:丢失目标总体单位、包含非目标总体单位、复合联接、不正确的辅助信息以及抽样框老化等。
当某些目标单位没有在抽样框中出现时,这些目标单位就构成丢失单位,对于这种情况,我们可通过其他途径将其纳入到抽样框中,或对抽样框的数据进行
调整;若抽样框包含某些非目标总体单位,应利用其他相关信息对抽样框进行调整.以此修正抽样框误差;对于复合联接问题,可通过先验信息进行调整;对于老化的抽样框。则需要对抽样框进行及时更新。
2.无回答误差是指在调查过程中,由于各种原因没有能够对被选出的样本单位进行计量.因而无法获得所需要的信息。无回答可分为有意不回答和无意不回答,主要表现为:遗漏、无法查找、社会参与意识薄弱、拒绝回答,前两种都属于无意不回答,后两种则属于有意不回答。根据无回答的表现原因,我们可以采取相应的处理方法.比如:对无意不回答。就要求调查人员在调查过程中认真仔细,对工作抱有负责的态度;对有意不回答,则要求调查单位事先做好宣传,尽量取得被调查者的支持和理解,同时也要尊重被调查者的隐私和自由。
3.计量误差产生的原因主要有:(1)调查问卷的设计不舍理引起的误差,这就要调查单位在设计调查问卷时考虑全面;(2)调查人员个人导致的误差,每个调查员的业务素质和能力相差很大,对调查项目中某些细节的理解也可能与问题的设计初衷有所出入;(3)被调查者引起的误差,被调查者可能因为某些顾虑而给出不符合自身实际的答案。最后,某些利益相关群体可能会影响调查结果,使其向他们所希望的方向发展,这就使得数据结果完全背离事实,对实际毫无意义。
三、降低非抽样误差的方法
1、抽样框误差
(1)联接丢失单位。这种方法主要适用于不能覆盖总体单位而引起的误差。所谓联接丢失单位的意思就是抽样样本丢失的个体和抽样样本中某个值相联结。联接丢失单位,最重要的基础是在抽样的过程中能发现被丢失的单位,如果不能发现,那么联接丢失单位也就无从谈起。
(2)采用辅导样框。有许多时候,一个样框不能涵盖抽样的总体,其最大的问题是抽样目标会重叠,它可能既隶属于主样框又隶属于辅助样框,该目标总体选中的可能性就增大。
(3)及时更新样框。这就是解决样框老化和辅助信息不准确最有效的方法。当然样框更需要较大的资金投入。所以一般样框更新可以采用分批更新,一年更新样框20%,分五年更新的方式。
(4)对复合联接的处理。复合连接一般又可以分为两种情况,一是“多对一”,
就是一个目标单位与一个以上的抽样单位相连接.“一对多”的情况则相反。最简单的方式就是利用复合联接的调查数据对目标总体单位数以及目标总体总量和均值进行估计。另外一种方法就是确定惟一的联接规则,让多个抽样单位只有一个进入到抽样总体中。
2、无回答误差
(1)访问员。访问员必须要有相当的责任心,有相应的学历背景,可以保证他们对于问卷的理解不出太大的偏差。对于访问员的培训也显得非常重要,培训分为两个方面,一是沟通技巧的提高,二是责任心的培养。咨询公司需要建立一个非常完善的质量控制体系,对访问员的访问进行及时的控制。
(2)加强与被访者的沟通。加强与被访者的沟通就是所谓提高沟通技巧,这些方法可以分为两类,一是与消费者初次见面时的沟通技巧,二是某个专项问题的沟通技巧,比如如何询问消费者的收人情况等等。
(3)事先通知。在访问员接触到被访者之前,先进行一定的沟通,比如打电话等,消除消费者的疑虑,然后再进行正式的访问,将会极大地降低拒访率。(4)物质奖励。物质奖励要适度,不要过高或过低。
(5)多次访问。多次访问指第一次访问被拒绝后,进行第二次乃至第三次访问,直到被访者愿意接受采访为止。
(6)替换。替换就是在某个抽样单位拒绝采访以后,放弃该单位,寻找与其背景相同的人作为替换,进入抽样总体。替换有其优点,就是实际操作相对于多次访问要简单,但是如果不是随机替换,就需要事先了解被访问的背景,这一般是很难做到的。纯粹随机替换会造成抽样总体与目标总体之间产生较大的差异。而且使访问的随意性增加,最后影响到数据的真实性。
减少无回答误差的方法还有很多,比如二重抽样和加权法等等。
3、计量误差
计量误差可以分为三类:一是问卷设计阶段产生的误差;二是记忆误差;三是其他误差。
(1)问卷设计产生的误差。一是主要来自于不同的措辞的不同表达。包括文字表达本身产生歧义,文字表达不够简练等等。一般问卷要求用词简单,不要用专用词。二是在问卷中出现倾向性和诱导性的词汇。对一个问题的两种提法往往导