抽样调查步骤与要点简介
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样调查步骤及要点简介
祖明(调查总队副总队长,高级统计师)
王成(调查总队主任科员、高级统计师)
市北路283号10号楼邮政编码:210003
抽样调查是指从研究对象的总体中随机抽取一部分个体作为样本进行调查,据此推断总体的数字特征。抽样调查是社会经济调查中最常用的调查方法。目前研究者对抽样调查方法和原理研究得较多,但对抽样调查的实施过程及其中需要注意的要点则很少谈及。本文将侧重具体的操作对抽样调查过程步骤作一简单的介绍。
首先要明确研究的目的和研究对象。抽样调查总是为满足某一个或多个目的而开展的;为达到研究目的,需要选择合适的对象加以研究。
其次要制定调查计划(方案)。调查能否取得成功,取决于许多因素,甚至完美的计划也不能确保调查成功,但不周到的计划肯定导致失败。调查计划(方案)包括调查容的确定,制表的准备,时间安排,总体围,抽样框的选择,成本估计,样本设计,调查问卷设计,试调查,根据试调查的情况对问卷再行修改和完善,调查表、调查指导手册和其他培训资料的印刷,确定调查对象,调查员和调查对象报酬的安排,培训调查员,调查质量控制和数据处理等等步骤。各环节的顺序并非必须,如问卷设计可以
在抽样设计前,调查对象的确定也可以和放在抽样设计之后紧接着开展。出于容上的考虑,每个过程不一定都详加讨论,下文将选择其中需要注意的重点加以说明。
一、总体围的确定和调查设计
ⅰ调查设计要有所取舍。从所接触到的高校科研等一些研究机构设计的调查项目存在的局限性看,调查设计中值得关注的是调查的设计者必须检查或考虑所需要的容是否可通过调查对象的回答得到正确的答案,不管数据是否需要,如果在可接受的精度调查对象的回答可能性不大的话,就没有必要选择,要果断地加以删除,如果数据是必须的,最好采取其他的途径来取得。比如离婚情况的调查,出于隐私,面对面访问的效果就很难保证,这时候抽样调查反而不如到民政部门调取数据。
ⅱ选择合适的调查类型。连续性调查和一次性调查。当对一个特殊的问题需要立即调查时,往往采用一次性调查。一次性调查时效快、成本低,但不能提供连续的时间序列数据,同时调查是一次性的,调查人员不能固定,很难有机会发展改进调查技术现场工作,也很难积累经验和吸收新的知识来提高调查效益。
调查计划中的一个重要容就是调查容在连续性调查和一次性调查中的组织与分配。要尽早确定哪些主题是要通过连续性调查取得,哪些主题应单独调查。在连续性调查中,最好建立一个连接调查指标,这些调查指标在每一次调查中都得以保留,这样
不同的主题可以进行交叉汇总。例如农村住户调查只对收支指标进行连续性调查,请求调查对象以日记帐形式对其日常生活的开支加以登记;而对调查对象的居住、人口及劳动力等情况开展一次性调查。
单主题和多主题。单主题调查是通过一次调查或一个调查周期,只对单一的主题进行调查;同时对不同的主题开展调查则是多主题调查。多主题调查更节约成本、提高效率。现在的抽样技术已经可以将多个主题完美地结合在一起进行抽样而不失代表性。如粮食亩产调查是单主题调查,而播种面积则是将多个主要粮食品种结合在一起,在一套网点上开展的多主题调查。
ⅲ调查的进度和时间安排。时间安排的一个重要考虑因素是调查访问时间是短时间完成还是较长时间完成,并且跟需要招聘的访问员的性质也紧密相关。如访问员是老师或学生,最好在学校假日期间。另外是集中调查还是分散调查对时间的要求也不一样:集中调查能尽快取得调查资料,但需要更多的现场调查人员,对人员素质的要求较高,否则取得的调查资料不尽可靠;分散调查可以使用少量的调查人员,如农业调查,一个调查员可以调查同一地域的不同季节的农业生产情况。
ⅳ总体围的确定。根据研究的目的,确定要研究的对象,研究对象的集合就是总体围。对调查总体需要进行各种研判,例如,住户调查,总体中是否要包括一些孤立的人群(诸如无家可归的人)、是否要包括偏远的群体(诸位渔民)、是否包括军人等等,
都需要仔细推敲,这些群体不仅调查成本较高,即便想纳入到总体中也非常困难。
二、样本抽选
ⅰ编制抽样框。理论上讲,抽样框是总体中带有标识资料的每个单位的集合,但一是往往很难得到总体中所有单位的资料;二是样本框还需要取舍修匀。即便取得了所有的资料,由于资料的两极(畸大畸小)通常呈严重偏离状态,比如收入,收入最高的可达数十亿,甚至几百亿,而收入最低的则负很多,这样的单位万一被抽中,不仅样本的代表性成问题,调查数据的前后起伏也将非常大,所以总体进入样本框后还涉及到取舍修匀的问题。三是实际操作中还要考虑工作是否便于开展。同样以农村住户抽样为例,样本框通常以存在调查机构的地区资料为依据,主要的考虑就是调查工作便于开展,当然这些调查机构在最初设立时已经过代表性等诸多方面的充分论证。因此样本框一般都不是总体的全部,而是部分。
ⅱ样本容量的确定。确定样本容量的方法有2种,一种是理论方法,给出一定的调查精度,利用公式计算出满足条件的最小样本量;一种是在给定调查费用的情况下,按单位调查成本确定最大有效的样本量。而通常是两者结合起来,即如果满足给定调查精度的样本容量超过了经费、工作负担,在实际操作时,就必须采取折衷的办法。有时候也会按照逼近法的原理,得出样本容
量。大体过程是在理论样本容量的基础上逐渐减少样本量,然后经过测算,如果给定的要求都能得到满足,效果很理想,但工作量仍难以承受,则可以继续减少样本量,直至最终的样本量在精度和可承受度方面取得平衡;反之,则增加样本数量,然后测算,如果给定的要求仍不能得到满足,则继续增加样本数量,直至精度和工作量之间取得平衡。
ⅲ样本抽选。样本抽选的方法有简单随机抽样、等距抽样(简单等距、对称等距抽样)、类型抽样、整群抽样、多阶段抽样、MPPS抽样等方法,这里不作详细介绍。
三、调查表的设计
ⅰ调查表的问题要简单易懂。调查访问收集的信息完全取决于提什么问题和怎样提问,尤其要注意的是将复杂的概念通过简单的提问方式表达出来。同样地,提问的方式具体的比笼统的好,比如“本月(本周)你在哪个单位工作?”比“现在你的就业情况”更容易回答;提问还要避免模糊,如“上周你生过病和看过医生吗?”这种情况,生过病但没看过医生的就难以回答了。
ⅱ调查问卷的设计还要考虑被调查者的负担——提问时间不能太长,太多的问题会使被调查者产生不愿合作的厌烦情绪。但这个问题往往受到需求的影响:很明显,在调查表里增添一些调查容比重新开展调查要节省许多。而且如果被调查者对调查感兴趣的话,他们更乐于回答提问,比如给的调查礼品较具诱惑,