郝大海《社会调查研究方法》笔记和课后习题详解(数据处理)【圣才出品】
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
十万种考研考证电子书、题库、视频学习平台
第八章数据处理
8.1复习笔记
【知识框架】
【重点难点归纳】
一、资料检查与校订
1.资料检查
资料检查是指对调查得到的原始资料质量的审查与核实,目的是确定哪些资料可以接受,
十万种考研考证电子书、题库、视频学习平台
哪些资料要剔除。
它主要通过对回收问卷的完整性、准确性和真实性的检查来实现。
(1)检查问卷
①资料的完整性主要通过问卷填答的完整程度反映出来,资料不完整包括以下情况:
a.问卷的某一页或某几页漏填;
b.问卷中的一个或多个问题没有填答。
②资料的准确性主要依赖于访问实施的准确程度,即访问员(或被访者)是否按要求实施了访问(或进行了回答),答案是否按要求作了记录。
如果回收问卷中出现以下情况,就表明访问没有严格按要求实施,相应的问卷资料是不准确的:
a.问卷是由不符合要求的被访者填答的;
b.问卷记录的访问日期是在调查规定的截止日期以后;
c.问卷记录的答案有错误。
对检查出来的有问题的问卷,基本处理原则是:能纠正就纠正,无法纠正的作废卷处理。
在实践中,资料搜集上查验出了问题,要找到该访问员让其对漏答情况给出解释,对错误的回答记录做出相应判断,也可以要求访问员重新访问。
在由研究者自行进行的检查中,如废卷数量影响到样本的代表性,就要按相同的概率抽样原则重新选择一些被访者,进行补充调查。
(2)回访
①资料真实性检查一般是在资料搜集结束后,由熟悉访问员情况的分区(组)督导或专门训练的复查员通过随机抽取5%~l5%已访问过的被访者进行回访来实现的。
对被访者的回访既可以采用打电话,也可以通过邮寄回访问卷的方式进行。
十万种考研考证电子书、题库、视频学习平台
②复查的内容主要是确认访问员是否按规定访问了指定的被访者,访问员在访问中是否有违规操作行为。
复查应该是标准化的,要有复查问卷和格式统一的复查记录表。
复查问卷应包括以下内容:
a.复查对象的原问卷编号;
b.复查的次数及时间记录;
c.确认访问员是否来访过;
d.确认访问员是否访问了指定的被访者;
e.(如果赠送礼品)确认访问员是否已送出礼品;
f.复查对象对访问员访问态度的评价;
g.从原问卷中挑选一些较敏感、较难回答或事实性的题目,回访复查对象,以检验访问员是否有违规操作行为。
③在实际访问中,访问员的违规或舞弊行为主要表现为:
a.没有按规定访问指定的被访者。
非指定被访者回答的问卷,会产生系统误差,使得样本失去代表性。
b.用电访或邮寄代替面访。
一旦此类情况发生,问卷的标准化程度会出现偏差,就会降低资料的可比性。
c.故意漏问某些较敏感或较难问的题目。
这种作弊行为很难在完整性检查中查出,它的存在会影响资料的内在效度。
d.自己填答问卷。
如果是在调查中发现此类行为,不仅要将回访中发现的那些问卷作废,还要将该访问员所有已完成的问卷作为废卷处理,并要立即中止作弊访问员的资格。
十万种考研考证电子书、题库、视频学习平台
2.资料校订
(1)校订工作,即从问卷中找出那些错误或不令人满意的答案,并对之进行相应的处理。
校订工作最好能在调查实施中由督导人员同步进行,因为这有利于在调查现场修正答案,特别是在调查区域较大时。
(2)校订过程中经常遇到的问题包括:
①访问员没问某些问题,或没记录某些问题的答案;
②访问员的记录字迹不清;
③记录的答案模棱两可或含义不清楚;
④访问员在规定跳题的地方没跳,或在不该跳题的地方却跳了。
校订人员遇到以上情况,除了要对其进行必要的标记,使之区别于问卷的正常记录方式外,还要对这些不合格问卷进行处理。
二、资料编码
1.编码的一般规则
(1)编码定义
资料编码原则上是将被访者对一个问题的回答,分配一个相对应的计算机软件能够识别的代码,这个代码就是代表该项回答内容的编码。
绝大多数情况下,编码都采用数字作为代码,但对于有些特殊答案,研究人员偶尔也采用字母作为代码。
(2)编码方式
①研究者在问卷设计时事先赋予被访者所可能回答的选项一个代码,编码时逐一记录被
十万种考研考证电子书、题库、视频学习平台
访者回答的选项代码,这种与问卷设计同步进行的编码形式被称为事前编码或预编码。
封闭式问题通常采取事前编码的方式。
②研究者在访问结束后,逐一就被访者的回答进行编码的工作,这种编码方式被称为事后编码。
开放式问题和封闭式问题中的“其他”选项,通常采取事后编码。
(3)编码时需要特别注意的要点
①在编码的过程中,除了要对被访者的每一个回答选项进行编码外,还需对问卷编号、访问员编号等相关内容按统一标准进行编码,这样做可以为查找问卷错误提供极大的便利。
②如果被访者的回答内容本身就是一些数字资料,如被访者的年龄、收入等,在编码时应尽可能保留原来资料的面貌,以使资料的使用者有更大的空间可以自己处理所需要的变量类型。
③对于“不确定”、“不知道”或“其他”这样的特殊选项,在编码设计时要使用固定的代码,例如“98”、“998”等,在整份问卷中前后最好完全一致。
2.开放式题目的事后编码技术
(1)开放式问题和封闭式问题中的“其他”选项,由于是被访者用自己的话来回答问题,故答案的范围无法事先预知,一般采取事后编码。
(2)在事后编码中应注意的问题
①编码员要对已出现的各种答案进行分类。
在事后编码正式开始前,研究者应该针对每一个需要事后编码的项目给出一份代码指南。
②代码指南的编制要在设计问卷时就开始,在焦点小组讨论、深度访谈和试调查过程中,研究者要有意识地摘要记录每个不同的答案。
随后将所有不同的答案做成分类表,并给每个
十万种考研考证电子书、题库、视频学习平台
答案建立草拟的代码,从而形成初步的代码指南。
③编码时,研究者首先要为编码员提供每一个编码项目的代码指南,其次需附上几张单页编码纸,将需要编码项目的名称和撰写答案的位置清楚地标在每页的顶端。
④有两种方法可应对分类含义不清晰的答案:a.将其合并到已有的类别中去;b.设立一个新代码。
有经验的编码员通常会选择后一种。
⑤对于事后编码,不允许编码员在分隔的地点,依照不同的编码手册独立地编码。
因为这样会出现同一个代码对应两个不同的答案的情况,从而产生严重的数据错误。
3.编码手册的编制
事前编码和事后编码所用的编码手册最后将合并为一个编码手册。
(1)编码手册的作用
①编码手册最直接的作用是提供一套标准化的编码作业程序;
②编码手册是编码作业的一份操作档案;
③编码手册是数据分析人员了解数据文件的指南。
(2)编码手册的内容
①与编号有关的内容,包括栏位、问卷题号、变量编号等。
a.栏位表明的是某个变量在数据文件中列的位置;
b.问卷题号是问卷中每个问题的原始编号;
c.变量编号是变量在编码手册中从头至尾连续排列的一个顺序号,与问卷题号顺序相同,但不是一一对应。
②与变量编码有关的内容,包括变量名称和变量标签。