第九章 调查资料的审核与整理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2,逻辑一致性清理
其基本思路是依据问卷中的问题相互之间所存 在内在的逻辑联系,来检查前后数据之间的合 理性.
3,数据质量抽查
采用随机抽样的方法,从样本的全部个案中, 抽取一部分个案,进行校对,用这一部分个案 校对的结果,来估计和评价全部数据的质量.
第四节 统计表和统计图
1,统计表的构成与制作 (1)统计表的构成.(见表7,表8)
一是检查出问卷资料中的问题; 二是重新向被调查者核实.
在实践中,资料的审核工作有两种不同的做法:
一种是在收集资料的过程中进行,即边收集边审核. 这种资料审核的方式称为实地审核. 另一种做法是,先将资料全部收回,然后再集中时间 进行审核.这种资料审核方式称为系统审核或集中审 核.
二,资料的复查
指的是研究者在调查资料收回后,又由其他人对所调 查的样本中的一部分个案进行第二次调查,以检查和 核实第一次调查的质量.
复查的基本做法是:
由研究者自己或者由研究者重新选择另外的调查员, 从原来的调查员所调查过的样本中,随机抽取5%-15 %的个案重新进行调查,一方面核实原来的调查员是 否真的对个案进行过调查;另一方面可将两次调查的 结果进行对比,以检查第一次调查的质量.
第二节 资料的编码和录入
一,问卷编码
编码就是给每个问题及答案一个数字作为它的 代码. 1,答案代码的确定 (见表1,2) 2,问题栏码的确定
见表3
3,编码手册 在编码手册中,研究者将编码的项目和 问题一一列出,逐一规定它们的代码, 宽度,栏码简要名称,答案赋值方式及 其他特殊规定等等. 见表四,表五
二,数据的录入
数据录入的方式主要有两种: 一是直接从问卷上将编好码的数据输入计算机; 另一种是先将问卷上编好码的数据转录到专门的登录 表上,然后再从登录表上将数据输入计算机.(见表6) 研究者要做好以下几方面的工作: (1)挑选和培训输入人员. (2)统一规定数据输入格式和数据文件名. (3)每个输入人员独立完成各自所输的那一部分问卷 (4)完成问卷输入任务后,由研究者把他们的数据合 起来形成一个总的数据文件,以供统计分析时使用.
(2)统计表的制作
(见表9,表10) 首先,表的标题要简短明了,要能确切说明表中数据 的内容. 其次,表的纵栏标题与横行标题要准确反映变量取值 的含义,他们的排列顺序也应具有一定的逻辑结构. 第三,表中的数据资料必须注明计量单位,比如频数 单位(人数,个数,户数等)和频率单位(百分比). 第四,对于一般频数分布表,应列出合计栏,以便获 得整体情况的资料. 最后,各种表格应以横线为主,能够不用竖线则尽量 不用.既便需要用竖线的表格,也应是开口式的,即 表的左右两端不划竖线.
(2)圆形图.又称扇形图 它是以圆内不同扇形面积的大小来表示 总体中不同部分所占的比重,形象地反 映总体地内部结构.
(见图3) (3)折线图.又称曲线图 它是通过上下变化的线段来反映所研究现象随时间变 化的过程和发展趋势的图形. 一个图中只含一条曲线,称为单式曲线图. 如果一个图中同时包含两条以上的曲线,称为复式曲 线图. (见图4,图5)
�
第三节 数据清理
1,有效范围清理
对于问卷中的任何一个变量来说,它的有效的编码值 往往都有某种范围,而当数据中的数字超出了这一范 围时,可以肯定这个数字一定是错误的.
这种错误数字的出现可以发生在资料处理的每 一个阶段:
首先,它可以发生在原始问卷中的回答上. 其次,它可以发生在编码员对问卷的编码结果上. 第三,它可以发生ຫໍສະໝຸດ Baidu计算机录入员输入数据的过程中.
从统计表的结构上看,通常都是由表号,总标题,横 行标题,纵栏标题,数字注释和资料来源等要素所构 成.
表号是表的序号,位于表顶端左角. 总标题是表的名称,它位于表的顶端,紧接在表号后面. 横行标题是横行的名称,又称横标目,它位于表的左侧. 纵栏标题是纵栏的名称,又称纵标目,位于表的最上一格. 数字是统计表的实质性内容. 注释或资料来源是对表中资料的一种说明.
问题栏码即指定该问题的编码值共几位,以及它们在 整个数据文件中所处的位置.
栏码的指定方法是:
首先从问卷的第一个项目或问题开始,根据每 一个项目或问题答案数码的位数,来确定该项 目或问题所占有的宽度; 再根据前后顺序来确定其在整个数据排列中所 处的位置,这样从头依次往后排列. 栏码的意义就是规定数据中的哪几位数字对应 于问卷中的特别变量.
2,统计图 统计图主要有条形图,圆形图和
折线图3种. (1)条形图.又称矩形图
它是以宽度相等,长度不等的长条来表示不同的统计 数字,比如表示频数或百分比的多少等等. 只有一组对象的条形图称为简单条形图. 把两组或两组以上的对象的条形并列在一起,共同构 成一个条形图,这种条形图称为复合条形图 . (见表11,图1,图2)
第九章 调查资料的审核与整理
第一节 原始资料的审核和复查 第二节 资料的编码和录入 第三节 数据清理 第四节 统计表和统计图
第一节 原始资料的审核和复查
一,资料的审核
指研究者对所收集的原始资料(主要是问卷)进 行初步的审查和核实,校正错填,误填的答案, 剔出乱填,空白和严重缺答的废卷.
资料的审核工作包含两方面的内容: