SPSS数据库建立操作过程指南

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SPSS数据库建立操作过程指南

一、SPSS数据库建立的目的

我们在线系统或者实地回收的数据都是excel格式的,而我们做数据分析一般要在统计软件中进行,目前我们使用最多的统计软件是SPSS,所以我们首先要建立一个SPSS数据库。

注:现在使用最多的SPSS软件为SPSS 18.0和SPSS 19.0,本操作过程指南使用的是SPSS 19.0

二、SPSS数据库介绍

SPSS数据库包含数据视图和变量视图

1 、数据视图

数据视图中的内容就是我们excel中的原始数据,一行为一个个案(即case),一列为一个变量。

见下面截图:

2 、变量视图

变量视图包括名称、类型、宽度、小数、标签、值标签、缺失值等。

见下面截图:

1)名称即变量名,变量名必须以字母、汉字或字符@开头,其他字符可以是任何字母、数字或_、@、#、$等符号;变量最后一个字符不能是句号;不能

使用空白字符或其他特殊字符(如“!”、“?”等)。

变量名一般用题号表示,变量名不能有重复的。

2)类型即变量类型,一般为数值型和字符型,选择性的题目最好设为数值型的,如果设为字符型的,空白的数据不默认缺失,而是看做有答案的数据,在

分析的时候也会出来空白的百分比,这样得到的每个选项的百分比会有偏

差。开放题以及半开放题的变量类型默认是字符型的,不能改为数值型

的,否则会使数据缺失。

3)宽度即数据的列宽。

4)标签为变量标签,一般用题目或选项表示,单选题一般用题目表示,多选题一般用选项表示。

5)值标签为单选题的每个选项代表的含义。

6)缺失值默认为无,我们可设1-3个离散数值为缺失值,也可设一个范围加一个离散值为缺失值。设为缺失值的数值在分析的时候不会出现。

一个完整的SPSS数据库包括:

变量名、数据、变量标签、值标签、多选集

三、SPSS数据库建立的几大步骤

(一)步骤列表

1、多选题有其他请注明的先在它前面插入一列,并将有文字说明的case赋值为1

2、对照问卷改变量名,并附标签。(在excel中进行)

3、将改过变量名的excel合格数据导入spss,导之前要把变量名下面的一行(即标签)删除。注意保存spss数据库。

4、将之前赋好的标签贴到spss数据库中,然后观察一下数值型变量类型是否正确,不正确的改正。

5、用spss语句为单选题赋值标签,多选题定义多选集(一般都是二分法)。

(二)具体步骤

2、对照问卷改变量名,并附标签。

改变量名的目的:一是,便于分析,二是,别人使用该数据库时也能明白每个变量的含义。

方法:将原始数据的第一行和第二行(即原始变量名和标签)转置粘贴到一个新的excel sheet表格中,在原变量名和标签中间插入两列,对照原始标签和问卷改变量名并赋标签,对于不同的题目类型,变量名和标签有所不同。

2.1 对于单选题:

变量名一般用题号表示,标签一般用题目(即原始标签)表示。

例:一个单选题的题目为:S2、您的年龄是?(单选)

那么它的变量名即为S2,标签为S2、您的年龄是?(单选)

变量名可以用原始标签按符号“、”分列得到,不需手动的输入或复制粘贴。

2.2 对于多选题

一个选项是一个变量,它的变量名一般用题号+下划线+选项序号表示,标签用选项内容表示。

例:一个多选题的题目为:

S4、请问在近一个月内,您在超市购买过以下哪些类别的食品?(可多选)

选项内容为

1、糖果类(如硬糖、口香糖、奶糖等)

2、乳制品类(液态牛奶、奶粉、奶酪等)

3、烘焙面点类(小面包、蛋糕、铜锣烧等)

4、方便食品类(方便面、速冻食品、罐头等)

5、调味品类(盐、味精、酱油等)

6、饮料类(碳酸饮料、果汁、绿茶等)

第一个选项“糖果类(如硬糖、口香糖、奶糖等)”它的原始变量名为:N901

糖果类(如硬糖、口香糖、奶糖等),改过之后的变量名为S4_1,标签为糖果

类(如硬糖、口香糖、奶糖等),这个标签可用mid公式由原始变量名提取得到,

即:MID(B4,5,LEN(B4)-4) ,B4为原始变量名所在的单元格,5为提取的起始

位置,LEN(B4)-4为提取的长度,由于选项内容的长度不固定,而选项前面的

长度是固定的,所以我们用这个字符窜的长度减去前面的长度表示需要提取的

长度。

2.3对于矩阵单选、矩阵多选

矩阵单选、矩阵多选相当于多个单选题和多个多选题,我们可以在题号后面加一个字母区分开,具体见excel“变量对应”sheet表。

5、用spss语句为单选题赋值标签,多选题定义多选集(一般都是二分法)。

5.1为单选题赋值标签

单选题赋值标签有两种方法:

1)我们可以手动的输入选项为每个单选题赋值标签,在值处输入选项序号,标签处输入选项内容,然后点击添加,输入完所有选项后点击确定即可。

见下面截图:

但是这种方法不适合多个选项,对于多个选项的单选题,我们可以用语法:

2)在spss数据库中点击文件—新建---语法,然后在语法中输入value labels以及变量名,然后将选项的值和内容复制到语法中,注意值在前面,内容在后面,可以先复制到excel中,调整好后再复制到语法中,例如:

value labels S1

1 河南

2 山东

3 安徽

4 浙江

5 其他.

S1为变量名,1 河南等为选项的值及内容

注意:语法中不能有“/”,可将“/”替换为“\”。

5.2 多选题定义多选集

1)在spss中点击分析—表---多响应集

2)打开定义多重响应集窗口,将一个题的所有选项变量拖到集合中的变量框中(注多选题有其他请注明的只需将“其他”变量拖进变量框中,“其他请注明”的变量不用拖进去。3)选择变量编码:如果数据为0、1两种值,则选择二分法,计数值为1,如果数据为1、2、3、4...(选项的值)则选择类别。一般的多选题都为二分法,开放题编码后的变量为类别。4)输入集名称和集标签,这个类似单选题的变量名和标签,即集名称为多选题的题号,集标签为多选题的题目内容。

5)点击添加

6)定义下一个多选集的时候,可以点击刚定义过的多选集,将它的变量拖出去,重新选择新的变量,并改集名称和集标签,这样做的目的是方便找到变量而且变量编码不须重新选择(如果数据类型相同)

7)定义完所有多选集后点击确定即可,点击粘贴即可将语法保存下来。

见下面截图:

相关文档
最新文档