第讲数据的编码录入与整理

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3题-2
第3题-3
第4题-工作 第4题-学校 第4题-环境 第5题 第6题
编码
1-男 ;0-女 1-没上过学;2-小学;3-初中;4-高中;5-大专以上 1-相貌;2-文化水准;3-气质风度;4-志同道合;5-人品;6-家庭 条件;7-个人收入;8-其他
1-相貌;2-文化水准;3-气质风度;4-志同道合;5-人品;6-家庭 条件;7-个人收入;8-其他
1-选;0-不选 1-选;0-不选

1
不选 0
1-选;0-不选

1
四、缺失值的处理
1. 概念 缺失值是指在数据采集与整理过程中丢失的内容,往往会给统计
分析带来一些麻烦和误差。
2. 类型 用户缺失值 在问卷调查中把不回答的选项当作缺失值来处理 缺失值可用研究者能识别的数字来表示如“0、9、99” 系统缺失值 指计算机默认的缺失方式,如输入数据空缺、输入非法字符等
每一个个案记录的是一个研究对象各个属性的具体数值,如学生信息 (姓名、性别、年龄等)
每一行为一条记录
每一列为一个字段
学生表
字段
每个记录只能对应一个对象且仅为一个
个案
学号 0604231 0604253 0605321 0606002
姓名 张三 李四 王五 赵六
性别 男 女 女 男
出生日期 87-1-1 88-6-30 88-8-18
六、定义变量
6. 变量定义的信息复制 如果有多个变量的类型相同,可以先定义一个变量,然后把该变量定 义的信息复制给新变量 操作步骤: 先定义一个变量 在该变量行号上单击右键,在快捷菜单中选择“Copy” 选择同类型新变量所在行,单击右键,在快捷菜单中选择 “Paste”
七、数据的录入
定义完所有变量后,单击“Data View”标签,在数据编辑窗口输入 数据。
六、定义变量
启动SPSS后进入数据编辑窗口,显示为一个空文件,输入数据前首先要 定义变量。
建立数据 文件
定义数据文件结 构
数据加工 整理
录入、修改、保存 数据
统计分 析
解释分析 结果
六、定义变量
定义变量所包含的内容:
变量名(Name):变量的名称 变量类型(Type):变量的类型 宽度(Width):存储变量值的最大值(1-可存储1个字节的字符,2-可存储1个
启动SPSS; 方法一:File→Open→Data.
数据导入后,查看“Variable View”标签中的字段名、类型、宽度等。
方法二:练习通过复制、粘帖的办法 把2-recode.xls中的数据通过复制,在SPSS中粘帖的办法导入到SPSS
把导入后的数据文件保存为2-recode.sav
九、数据的整理
变量名
限定了一次最多可以选择项目的个数; 不能直接对题目进行编码,必须先确定最多选择,第3题-1
并给每个选项建立一个变量;
如编码示例中的第3题
第3题-2
任意多项二分法
第3题-3
表示每一次可以任选几个选项;
编码方法把每一个被选项作为一个变量来定义, 第4题-工作
每个变量只能选择“1或0”; 如编码示例中的第4题
1. 概念 数据整理是对录入的数据进行转换、检测、量 表统分、个案选择、文件拆分与合并等操作 ,使原始数据生成后续研究所需要的数据。
2. 操作 SPSS实现数据整理的功能主要集中在“Data” 和“Transform”两个菜单
九、数据的整理
3. 例二:数据分值的转换
数据分值的转换是通过对数据进行重新编码来实现的。在SPSS中 主要通过Recode命令来实现
1-相貌;2-文化水准;3-气质风度;4-志同道合;5-人品;6-家庭 条件;7-个人收入;8-其他 1-选;0-不选 1-选;0-不选 1-选;0-不选
A B C(A-1,B-2,C-3)
A B C(A-3,B-2,C-1)
样例

1
小学
2
文化水准 2
志同道合 4
人品
5

1
不选
0

1
A
1
A
3
三、编码类型
数据录入如果按逐行进行,按Tab键改变行 数据录入如果按逐列进行,按Enter键改变列 系统默认的数据文件保存类型为“.sav”
八、数据的导入
SPSS具有强大的与其他软件共享数据文件的功能,所以能够导 入多种格式的数据
1. 能够导入SPSS的数据文件: *.sys、*.por、*.xls、*.slk、*.w*、*.dbf、*.dat、*.syd、*.sas7dbat等
4 您购买房屋时,会考虑哪些因素(任 (1)离工作地点的远近 (2)小孩所就读的学校 (3)居家附近
选):
的环境
5 您对心理学感兴趣: 6 您对学英语感到厌恶:
(1)不感兴趣 (2)感兴趣 (3)非常感兴趣 (1)不厌恶 (2)厌恶 (3)非常厌恶
二、数据问卷与编码(举例)
问卷编码方案
变量名 第1题 第2题 第3题-1
1. 数值型数据的编码 数值型数据的编码就是根据调查问卷的评分标准对变量赋予分值。 通常采用三点计分、四点计分和五点计分等方式进行评分 如选项A、B、C计分为1、2、3 如选项A、B、C、D计分为1、2、3、4
编码示例中的第5、6题就是属于数值型编码 第5题是正向数值型(被选项的程度越高,分值越大) 第6题是反向数值型(被选项的程度越高,分值越小)
第4题-学校 第4题-环境
编码
样例
1-相貌;2-文化水准;3-气质风度; 文化 2 4-志同道合;5-人品;6-家庭条件; 水准 7-个人收入;8-其他
1-相貌;2-文化水准;3-气质风度; 志同 4 4-志同道合;5-人品;6-家庭条件; 道合 7-个人收入;8-其他
1-相貌;2-文化水准;3-气质风度; 人品 5 4-志同道合;5-人品;6-家庭条件; 7-个人收入;8-其他
汉字) 小数位数(Decimals):变量为数值类型时,小数后的位数 变量标签(Label):对变量名的注释。光标在变量名上时,会显示该标签 变量值标签(Values):变量标签的取值 缺失值(Missing Values):定义缺失的值,例如,当定义99为缺失值时,当该变
量的值为99时,把它认为是缺失值 显示数据的列宽(Colums):与上面“宽度”不同,它只管显示 对齐方式 (Align):左对齐、右对齐、居中 量度类型(Measure):定比变量(Scale)、定序变量(Ordinal)、定类变量(
二、数据问卷与编码(举例)
问卷量表
序号
调查内容
选项
1 您的性别: 2 你的文化程度:
(1)男 (2)女 (1)没上过学 (2)小学 (3)初中 (4)高中 (5)大专以上
3 您想选择下列哪些择偶条件(任选三 (1)相貌 (2)文化水准 (3)气质风度 (4)志同道合 (5)人品 (6)
项):
家庭条件 (7)个人收入 (8)其他
a).打开shift-MIS.mdb文件,选中“表”对象,再选中“学生表”。
八、数据的导入
4. 例一(1):把Access中shift-MIS.mdb中的“学生表”信息导入到SPSS 中.
b).菜单上,文件→导出…,“保存类型”选择“Microsoft Excel 972003(.xls)”,文件名自动为“学生表” →“导出”
变量名采用 “1、2、3、…”来编赋码 值;如编码示例中的第样2例题
第1题
1-男 ;0-女

1
第2题
1-没上过学;2-小学;3-初中;4-高中;5-大专以上
小学
2
通常对非数值型数据编码,主要起到分组的作用,不能进行各种算术运算
三、编码类型
3. 多项选择题 多项选择题就是题目答案的选项是多选项
限定多选项分类法
变量名
编码
第5题
A B C(A-1,B-2,C-3)
A
第6题
A B C(A-3,B-2,C-1)
A
样例 1 3
三、编码类型
2. 非数值型数据的编码
非数值型数据的编码,首先要确定编码规则,然后根 据规则对变量赋予分值。
双值型变量的编码
多采用“0、1”或“1、2”来赋值;如编码示例中的第1题
多值型变量的编码
SPSS保留的关键词不能作为变量名 AND、OR、NOT、WITH、TO、BY、GT、GE、LT、LE、EQ 、NE、ALL等
SPSS中允许使用中文变量名,但尽量不要使用,以免出现兼容性 问题
六、定义变量
2. 定义变量类型、宽度及小数位数 在Type下单击单元格,打开变量类型窗口,选择变量类型 常用变量类型有: 数值型(Numeric) 日期型(Date) 货币型(Dollar) 字符型(String)
九、数据的整理
3. 例二:数据分值的转换 Into Same Variables:编码后数据存放在原变量中,覆盖原数据 Into Different Variables:编码后数据存放在新定义的变量中,保留原数据
九、数据的整理
3. 例二:数据分值的转换
假设一套量表共10题,每题有A、B、C三个选项,现有10个被 试作答。要求根据评分规则,将被试的原始数据选择转换为量表分数
八、数据的导入
4. 例一(1):把Access中shift-MIS.mdb中的“学生表”信息导入到SPSS 中.
c). 启动SPSS,File→Open→Data,“文件类型”选择“Excel(*.xls)” ,找到“学生表.xls”文件后→“打开”
d).保存为:学生表.sav
八、数据的导入
4. 例一(2):数据的导入 将EXCEL文件2-recode.xls导入到SPSS中
六、定义变量
5. 定义缺失值 在Missing下单击单元格,打开缺失值窗口,输入缺失值 ⊙ No missing values:没有缺失值 ⊙ Discrete missing values:定义1~3个单一数为缺失值 ⊙ Range plus one optional discrete missing values:定义指定 范围为缺失值,同时指定另外一个不在这一范围的单一数为缺 失值
88-12-24
专业编号 01 02 03 02
五、数据处理中的操作术语
样本(Sample) 是指具有共同属性的所有研究对象,如学生的所有信息 样本包含多个个案,在数据表格中表示为“n行”
变量(Variable) 是指问卷中每一个问题,数据库里字段,数据表格中表示为“一列”
量值(Value) 是指问卷中的答案,也称为观测值,在SPSS系统里,单元格中的数 值就是变量值
Nominal)。只用于统计制图时坐标轴变量的区分和SPSS决策树模块的变量 定义。
六、定义变量
单击数据编辑窗口左下方的“Variable View”标签或双击列的题 头(Var),打开变量定义窗口,进行变量定义。
六、定义变量
1. 定义变量名 在定义变量窗口中Name下的单元格中输入变量名 变量名必须以字母开头,长度不超过8个
在Width、Decimal下单元格,选择宽度和小数位数,系统默认为“8” 和“2”;或者在变量类型窗口中设置
六、定义变量
3. 定义变量标签 在Label下单击单元格,输入变量标签 SPSS允许变量标签长度为255字节
4. 定义变量值标签 变量值标签是对变量的每一可能取值进一步描述,当变量是定类或 定序变量时,非常有用。变量值标签系统默认为None 在Values下单击单元格,打开变量值标签窗口,输入变量值标签
第1讲
数据的编码、录入与整理
一、数据的编码、录入与整理
1. 原理 是研究者利用SPSS进行统计分析的必要前提。 就是把通过问卷调查获得的资料转变为SPSS能够识别的数据文件,
为各种统计分析做好准备。 2. 数据编码概念
数据编码是指把需要加工处理的数据库信息,用特定的数字来表 示的一种技术。
根据一定数据结构和目标的定性特征,将数据转换为代码或编码 字符,在数据传输中表示数据的组成,并作为传送、接受和处理的一 组规则和约定。
. 通常把缺失值标记为“ ”
四、缺失值的处理
3. 缺失值处理方法 替代法:采用统计命令或在相关统计功能中利用参数替代 Transform →Replace Missing Values
剔出法:剔除有缺失值的题目或剔除有缺失值的整份问卷
五、数据处理中的操作术语
个案(Cases)
一个研究对象就是一个个案;一个个案就是一条记录;在数据表格中 表示为“一行”
2. 导入数据文件的操作步骤: 执行菜单命令File → Open → Data” 选择导入数据文件的类型
3. 通过复制粘贴导入数据 在原系统中打开需要导入的数据文件 复制粘贴到SPSS中
八、数据的导入
4. 例一(1):把Access中shift-MIS.mdb中的“学生表ቤተ መጻሕፍቲ ባይዱ信息导入到SPSS 中.
相关文档
最新文档