SPSS数据库建立操作过程指南
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS数据库建立操作过程指南
一、SPSS数据库建立的目的
我们在线系统或者实地回收的数据都是excel格式的,而我们做数据分析一般要在统计软件中进行,目前我们使用最多的统计软件是SPSS,所以我们首先要建立一个SPSS数据库。
注:现在使用最多的SPSS软件为SPSS 18.0和SPSS 19.0,本操作过程指南使用的是SPSS 19.0
二、SPSS数据库介绍
SPSS数据库包含数据视图和变量视图
1 、数据视图
数据视图中的内容就是我们excel中的原始数据,一行为一个个案(即case),一列为一个变量。
见下面截图:
2 、变量视图
变量视图包括名称、类型、宽度、小数、标签、值标签、缺失值等。
见下面截图:
1)名称即变量名,变量名必须以字母、汉字或字符@开头,其他字符可以是任何字母、数字或_、@、#、$等符号;变量最后一个字符不能是句号;不能
使用空白字符或其他特殊字符(如“!”、“?”等)。
变量名一般用题号表示,变量名不能有重复的。
2)类型即变量类型,一般为数值型和字符型,选择性的题目最好设为数值型的,如果设为字符型的,空白的数据不默认缺失,而是看做有答案的数据,在
分析的时候也会出来空白的百分比,这样得到的每个选项的百分比会有偏
差。开放题以及半开放题的变量类型默认是字符型的,不能改为数值型
的,否则会使数据缺失。
3)宽度即数据的列宽。
4)标签为变量标签,一般用题目或选项表示,单选题一般用题目表示,多选题一般用选项表示。
5)值标签为单选题的每个选项代表的含义。
6)缺失值默认为无,我们可设1-3个离散数值为缺失值,也可设一个范围加一个离散值为缺失值。设为缺失值的数值在分析的时候不会出现。
一个完整的SPSS数据库包括:
变量名、数据、变量标签、值标签、多选集
三、SPSS数据库建立的几大步骤
(一)步骤列表
1、多选题有其他请注明的先在它前面插入一列,并将有文字说明的case赋值为1
2、对照问卷改变量名,并附标签。(在excel中进行)
3、将改过变量名的excel合格数据导入spss,导之前要把变量名下面的一行(即标签)删除。注意保存spss数据库。
4、将之前赋好的标签贴到spss数据库中,然后观察一下数值型变量类型是否正确,不正确的改正。
5、用spss语句为单选题赋值标签,多选题定义多选集(一般都是二分法)。
(二)具体步骤
2、对照问卷改变量名,并附标签。
改变量名的目的:一是,便于分析,二是,别人使用该数据库时也能明白每个变量的含义。
方法:将原始数据的第一行和第二行(即原始变量名和标签)转置粘贴到一个新的excel sheet表格中,在原变量名和标签中间插入两列,对照原始标签和问卷改变量名并赋标签,对于不同的题目类型,变量名和标签有所不同。
2.1 对于单选题:
变量名一般用题号表示,标签一般用题目(即原始标签)表示。
例:一个单选题的题目为:S2、您的年龄是?(单选)
那么它的变量名即为S2,标签为S2、您的年龄是?(单选)
变量名可以用原始标签按符号“、”分列得到,不需手动的输入或复制粘贴。
2.2 对于多选题
一个选项是一个变量,它的变量名一般用题号+下划线+选项序号表示,标签用选项内容表示。
例:一个多选题的题目为:
S4、请问在近一个月内,您在超市购买过以下哪些类别的食品?(可多选)
选项内容为
1、糖果类(如硬糖、口香糖、奶糖等)
2、乳制品类(液态牛奶、奶粉、奶酪等)
3、烘焙面点类(小面包、蛋糕、铜锣烧等)
4、方便食品类(方便面、速冻食品、罐头等)
5、调味品类(盐、味精、酱油等)
6、饮料类(碳酸饮料、果汁、绿茶等)
第一个选项“糖果类(如硬糖、口香糖、奶糖等)”它的原始变量名为:N901
糖果类(如硬糖、口香糖、奶糖等),改过之后的变量名为S4_1,标签为糖果
类(如硬糖、口香糖、奶糖等),这个标签可用mid公式由原始变量名提取得到,
即:MID(B4,5,LEN(B4)-4) ,B4为原始变量名所在的单元格,5为提取的起始
位置,LEN(B4)-4为提取的长度,由于选项内容的长度不固定,而选项前面的
长度是固定的,所以我们用这个字符窜的长度减去前面的长度表示需要提取的
长度。
2.3对于矩阵单选、矩阵多选
矩阵单选、矩阵多选相当于多个单选题和多个多选题,我们可以在题号后面加一个字母区分开,具体见excel“变量对应”sheet表。
5、用spss语句为单选题赋值标签,多选题定义多选集(一般都是二分法)。
5.1为单选题赋值标签
单选题赋值标签有两种方法:
1)我们可以手动的输入选项为每个单选题赋值标签,在值处输入选项序号,标签处输入选项内容,然后点击添加,输入完所有选项后点击确定即可。
见下面截图:
但是这种方法不适合多个选项,对于多个选项的单选题,我们可以用语法:
2)在spss数据库中点击文件—新建---语法,然后在语法中输入value labels以及变量名,然后将选项的值和内容复制到语法中,注意值在前面,内容在后面,可以先复制到excel中,调整好后再复制到语法中,例如:
value labels S1
1 河南
2 山东
3 安徽
4 浙江
5 其他.
S1为变量名,1 河南等为选项的值及内容
注意:语法中不能有“/”,可将“/”替换为“\”。
5.2 多选题定义多选集
1)在spss中点击分析—表---多响应集
2)打开定义多重响应集窗口,将一个题的所有选项变量拖到集合中的变量框中(注多选题有其他请注明的只需将“其他”变量拖进变量框中,“其他请注明”的变量不用拖进去。3)选择变量编码:如果数据为0、1两种值,则选择二分法,计数值为1,如果数据为1、2、3、4...(选项的值)则选择类别。一般的多选题都为二分法,开放题编码后的变量为类别。4)输入集名称和集标签,这个类似单选题的变量名和标签,即集名称为多选题的题号,集标签为多选题的题目内容。
5)点击添加
6)定义下一个多选集的时候,可以点击刚定义过的多选集,将它的变量拖出去,重新选择新的变量,并改集名称和集标签,这样做的目的是方便找到变量而且变量编码不须重新选择(如果数据类型相同)
7)定义完所有多选集后点击确定即可,点击粘贴即可将语法保存下来。
见下面截图: