资料整理PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6来自上海市民生活方式问题调查表
1 您的性别:
1.1
(1)男 (2)女
2 您的年龄:
2.3
(1)18-25周岁 (2)26-35周岁
(3)36-45周岁(4)46-60周岁
(5)61周岁以上
3 您的文化程度:
3.6
(1)小学以下(2)小学(3)初中
(4)高中或技校(5)中专(6)大专
(7)大学本科以上
12
编码手册示例
项目名称 ……
变量 名
…
含义 ……
宽度 栏码 答案赋值 …… …… ……
问题8 ……
8-1
就业广告
1
12 0=未选中
8-2 职业介绍所
1
13 1=选中
8-3
招工单位
1
14
8-4 政府劳动部门
1
15
8-5 其他各类组织
1
16
8-6 各种社会关系
1
17
8-7
其他
1
18
…
……
…… …… …………
10
数据片断
V
ID
A1 A2 A3 … …
1 2 3 4 5 6 7 8 9 ……
5 0 0 1 3 1 2 2 4 ……
5 0 0 1 4 2 3 0 3 ……
…… …… …… …… …… …… …… …… …… ……
11
特殊题型的编码
复选题的编码:编码成为K个变量,即题目中 的每一个答案选项,都被设定为一个(0-1)新 的二分复选变量;如果该答案选项没有被选中, 则复选变量取值为0,被选中则取值为1。 例:8、您一般通过下列哪些渠道搜集就业信息? (可选多项) 1 就业广告 2 职业介绍所 3 招工单位 4 政府劳动部门 5 其他各类组织 6 各类社会关系 7 其他(请说明)
7
特殊说明
任何调查中都不免有一些回答者对一个问题不 做任何回答的情况,为此对问卷中的每个提问 要增加一个无回答编码。通常的习惯是用9或几 个9来代表无回答。当9是真实回答时,须改用 其它不可能出现的数字作编码。 对于专门的社会调查,除对问卷或调查表中的 所有问题进行编码外,还应对每一份问卷中包 括的下述项目进行编码:问卷编号、问卷所属 区域或部门、其他要进行统计的分类标准。
200 0
1
46
平均 数
0.38 0.06 0.15 0.57 0.04 0.63 0.23
14
排序题的编码
例:请在下列各种提供就业信息渠道的选 项中,选出三种您最常使用的,并依程度 标出1、2、3的次序。 1 就业广告 2 职业介绍所 3 招工单位 4 政府劳动部门 5 其他各类组织 6 各类社会关系 7 其他(请说明)
其他
1
18
…
……
…… …… …………
16
三、资料的录入
数据录入的方式主要有两种:
一种是直接从问卷上将编好码的数据输入计 算机; 另一种是先将问卷上编好码的数据转录到专 门的登录表上,然后再从登录表上将数据输 入计算机。
17
资料的录入
研究者必须对数据的输入工作进行精心组 织和安排。
挑选和培训输入人员。 统一规定数据输入格式和数据文件名。 每个输入人员独立完成各自所输的那一部分 问卷。 在每个输入人员完成各自所负责的问卷输入 任务后,由研究者把他们的数据合起来形成 一个总的数据文件,以供统计分析时调用。
A3
…
含义 城区
个案号 性别 年龄
文化程度
……
宽度 1
4 1 2 1
……
栏码 1
2~5 6
7~8 9
……
答案赋值
1=武昌 2=汉阳 3=江汉 4=江岸 5=青山 6=硚口 7=洪山 根据问卷上的编号填写 1=男 2=女 按实际填答年龄填写, 大于99岁的填99 1=小学及以下 2=初中 3=高中及中专 4=大专以上 …………
1
资料收集
资料收集是通过对社会现象的观察、量度与探 究来获取社会信息的过程。 资料收集的方法:
问卷法 量表与测验法
访问法 观察法 文献法 实验法
2
3
一、资料的审查
真实性,即看资料是否真实可靠地反映了调查 对象的客观情况。 准确性,即看资料是否按照统一要求回答填写。 完整性,包括两个方面的内容:一是资料总体 的完整性,如回收率;二是每份资料的完整性。 其他:比如提供资料者的身份是否符合所规定 的调查对象的身份;等等。
18
四、数据清理
1、有效范围清理。 错误数字的出现可以发生在资料处理的每一个阶
段。 首先,它可以发生在原始问卷中的回答上(回答
者); 其次,它可以发生在编码员对问卷的编码结果上
(编码员粗心); 第三,它可以发生在计算机录入员输入数据的过
程中(录入员)。
19
20
有效范围清理例
性别
Cum ulativ e
4
二、资料的编码
编码就是将文字资料转化为数字形式 的过程,当然也可使用阿拉伯数字之 外的其他符号来编码,如英文字母等。 编码分为两步,第一步是对回答进行 分类,第二步是建立回答类别与变量 数值间的对应关系。
5
资料编码的方法
预编码:是在设计问卷时对回答的每一个种类 都制定好其编码值,并印在问卷上。限于回答 类别事先已知的问题。 后编码:多用于开放性问题的编码。 边缘编码:不仅指定了编码值,而且给出了每 个项目记录回答(编码)的空间。在问卷上每 个调查项目旁边的空白处标明填写编码的位置。 问卷回收后,将每份问卷上的回答变成指定位 置上的编码。
15
编码手册示例
项目名称 ……
变量 名
…
含义 ……
宽度 栏码 答案赋值 …… …… ……
问题8 ……
8-1
就业广告
1
12 0=未选中
8-2 职业介绍所
1
13 1=排名第一
8-3
招工单位
1
14 2=排名第二
8-4 政府劳动部门
1
15 3=排名第四
8-5 其他各类组织
1
16
8-6 各种社会关系
1
17
8-7
8
编码手册
在编码手册中,研究者要将需要编码的项 目和问题一一列出,逐一规定它们的代码、 宽度、栏码、简要名称、答案赋值方式及 其它特殊规定等。整个手册的格式要规范 统一,指示要明确,且容易理解,便于操 作。
9
编码手册
项目名称 区
个案号 问题A1 问题A2 问题A3
……
变量 名 V
ID A1 A2
13
复选题分析描述统计结果
变量 变量标签 名
个数 最小值 最大值 选中 频次
8-1 就业广告
200 0
1
76
8-2 职业介绍所 200 0
1
12
8-3 招工单位
200 0
1
30
8-4 政府劳动部门 200 0
1
114
8-5 其他各类组织 200 0
1
8
8-6 各类社会关系 200 0
1
126
8-7 其他
FrequencyPercenVt alid PercentPercent
Valid 男
1 您的性别:
1.1
(1)男 (2)女
2 您的年龄:
2.3
(1)18-25周岁 (2)26-35周岁
(3)36-45周岁(4)46-60周岁
(5)61周岁以上
3 您的文化程度:
3.6
(1)小学以下(2)小学(3)初中
(4)高中或技校(5)中专(6)大专
(7)大学本科以上
12
编码手册示例
项目名称 ……
变量 名
…
含义 ……
宽度 栏码 答案赋值 …… …… ……
问题8 ……
8-1
就业广告
1
12 0=未选中
8-2 职业介绍所
1
13 1=选中
8-3
招工单位
1
14
8-4 政府劳动部门
1
15
8-5 其他各类组织
1
16
8-6 各种社会关系
1
17
8-7
其他
1
18
…
……
…… …… …………
10
数据片断
V
ID
A1 A2 A3 … …
1 2 3 4 5 6 7 8 9 ……
5 0 0 1 3 1 2 2 4 ……
5 0 0 1 4 2 3 0 3 ……
…… …… …… …… …… …… …… …… …… ……
11
特殊题型的编码
复选题的编码:编码成为K个变量,即题目中 的每一个答案选项,都被设定为一个(0-1)新 的二分复选变量;如果该答案选项没有被选中, 则复选变量取值为0,被选中则取值为1。 例:8、您一般通过下列哪些渠道搜集就业信息? (可选多项) 1 就业广告 2 职业介绍所 3 招工单位 4 政府劳动部门 5 其他各类组织 6 各类社会关系 7 其他(请说明)
7
特殊说明
任何调查中都不免有一些回答者对一个问题不 做任何回答的情况,为此对问卷中的每个提问 要增加一个无回答编码。通常的习惯是用9或几 个9来代表无回答。当9是真实回答时,须改用 其它不可能出现的数字作编码。 对于专门的社会调查,除对问卷或调查表中的 所有问题进行编码外,还应对每一份问卷中包 括的下述项目进行编码:问卷编号、问卷所属 区域或部门、其他要进行统计的分类标准。
200 0
1
46
平均 数
0.38 0.06 0.15 0.57 0.04 0.63 0.23
14
排序题的编码
例:请在下列各种提供就业信息渠道的选 项中,选出三种您最常使用的,并依程度 标出1、2、3的次序。 1 就业广告 2 职业介绍所 3 招工单位 4 政府劳动部门 5 其他各类组织 6 各类社会关系 7 其他(请说明)
其他
1
18
…
……
…… …… …………
16
三、资料的录入
数据录入的方式主要有两种:
一种是直接从问卷上将编好码的数据输入计 算机; 另一种是先将问卷上编好码的数据转录到专 门的登录表上,然后再从登录表上将数据输 入计算机。
17
资料的录入
研究者必须对数据的输入工作进行精心组 织和安排。
挑选和培训输入人员。 统一规定数据输入格式和数据文件名。 每个输入人员独立完成各自所输的那一部分 问卷。 在每个输入人员完成各自所负责的问卷输入 任务后,由研究者把他们的数据合起来形成 一个总的数据文件,以供统计分析时调用。
A3
…
含义 城区
个案号 性别 年龄
文化程度
……
宽度 1
4 1 2 1
……
栏码 1
2~5 6
7~8 9
……
答案赋值
1=武昌 2=汉阳 3=江汉 4=江岸 5=青山 6=硚口 7=洪山 根据问卷上的编号填写 1=男 2=女 按实际填答年龄填写, 大于99岁的填99 1=小学及以下 2=初中 3=高中及中专 4=大专以上 …………
1
资料收集
资料收集是通过对社会现象的观察、量度与探 究来获取社会信息的过程。 资料收集的方法:
问卷法 量表与测验法
访问法 观察法 文献法 实验法
2
3
一、资料的审查
真实性,即看资料是否真实可靠地反映了调查 对象的客观情况。 准确性,即看资料是否按照统一要求回答填写。 完整性,包括两个方面的内容:一是资料总体 的完整性,如回收率;二是每份资料的完整性。 其他:比如提供资料者的身份是否符合所规定 的调查对象的身份;等等。
18
四、数据清理
1、有效范围清理。 错误数字的出现可以发生在资料处理的每一个阶
段。 首先,它可以发生在原始问卷中的回答上(回答
者); 其次,它可以发生在编码员对问卷的编码结果上
(编码员粗心); 第三,它可以发生在计算机录入员输入数据的过
程中(录入员)。
19
20
有效范围清理例
性别
Cum ulativ e
4
二、资料的编码
编码就是将文字资料转化为数字形式 的过程,当然也可使用阿拉伯数字之 外的其他符号来编码,如英文字母等。 编码分为两步,第一步是对回答进行 分类,第二步是建立回答类别与变量 数值间的对应关系。
5
资料编码的方法
预编码:是在设计问卷时对回答的每一个种类 都制定好其编码值,并印在问卷上。限于回答 类别事先已知的问题。 后编码:多用于开放性问题的编码。 边缘编码:不仅指定了编码值,而且给出了每 个项目记录回答(编码)的空间。在问卷上每 个调查项目旁边的空白处标明填写编码的位置。 问卷回收后,将每份问卷上的回答变成指定位 置上的编码。
15
编码手册示例
项目名称 ……
变量 名
…
含义 ……
宽度 栏码 答案赋值 …… …… ……
问题8 ……
8-1
就业广告
1
12 0=未选中
8-2 职业介绍所
1
13 1=排名第一
8-3
招工单位
1
14 2=排名第二
8-4 政府劳动部门
1
15 3=排名第四
8-5 其他各类组织
1
16
8-6 各种社会关系
1
17
8-7
8
编码手册
在编码手册中,研究者要将需要编码的项 目和问题一一列出,逐一规定它们的代码、 宽度、栏码、简要名称、答案赋值方式及 其它特殊规定等。整个手册的格式要规范 统一,指示要明确,且容易理解,便于操 作。
9
编码手册
项目名称 区
个案号 问题A1 问题A2 问题A3
……
变量 名 V
ID A1 A2
13
复选题分析描述统计结果
变量 变量标签 名
个数 最小值 最大值 选中 频次
8-1 就业广告
200 0
1
76
8-2 职业介绍所 200 0
1
12
8-3 招工单位
200 0
1
30
8-4 政府劳动部门 200 0
1
114
8-5 其他各类组织 200 0
1
8
8-6 各类社会关系 200 0
1
126
8-7 其他
FrequencyPercenVt alid PercentPercent
Valid 男