基于SPSS软件在市场调研中的数据录入方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于SPSS软件在市场调研中的数据录入
方法
作者:白高洪杨鹏程岛宁
来源:《科学与技术》 2018年第6期
摘要:介绍了SPSS在市场调研中数据录入的方法,以及对于录入数据中遇到的问题和麻烦提供了解决的方法,为人们进一步对于SPSS在数据录入上提供了方法。
关键词:问卷录入方式;数据录入;数据验证
一、认识SPSS软件
SPSS为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务
的软件产品及相关服务的总称。SPSS对于调查问卷数据的录入和分析,更加准确直观的看出数
据给我们的信息。利用SPSS录入问卷数据的有很多种不一样的情况,多选题、单选题、开放性问题、半开放问题等,选用不同的录入方法的时候要考虑到不同的功能和特点。
二、数据结构设计
在录入数据之前,首先要在变量视图中设计调研问卷的数据结构。调研问题的类型可分为
开放性问题、半开放性问题、单选题、多选题,在数据结构设计中需要采取不同的方法来处理。
(1)开放性问题的变量设计。
开放性问题是指允许被调研者自己填写答案,而不提供选择项。
例如:你的姓名?()
开放性问题的变量设计只需要设计一个变量来存储问题的答案,变量的类型根据答案的内
容可以设置为字符型、数值型或日期型。变量宽度也根据答案内容来确定,一个汉字为2个字符,一个数字或字母为一个字符。因为变量的内容需要被调研者自行录入,所以值标签不需要
设置。度量标准一般为名义类型。
(2)半开放问题的变量设计
半开放题指有选项,并且最后一个是开放性的选项,
例如:你的职业是(A、教师,B、学生,C、其他,--)
这一类题目在录入时可以用两个变量对其进行定义,在第一个变量中,"其他,--"为选项
之一;第二个变量将"其他,--"的具体内容看做一个独立的开放题,按照开放题的录入方式进
行数据录入,没有选择该选项的数据作为缺失值处理。
(3)单选题的变量设定
单选题的数据录入只需要设置一个变量,然后将变量的标签值设置为每一个选项。
例如:你所在的城市是(A.成都、B.重庆、C.昆明)。
这里我们对于选项的编辑上,为了方便我们后期的数据的录入一般会对数据进行编辑,比
如1代表成都,2代表重庆,3代表昆明,这样就可以录入到数据视图里面。单选题的录入有三种方式,但是为了方便问卷后期的计算,一般我们采用数值代码+值标签的形式。
(4)多选题的变量设定
多选题是调查问卷中极为常见的一种问题类型。多选题的答案至少为两项,选出的结果不
同当然这就需要设置多个变量来存储答案,多选题的变量设定方法有两种,多重二分法和多重
分类法
第一种方法多重二分法适用于不限定最多选项数量的问题。多重二分法是把多选题的每一
个选项的选择是否都进行记录,所以变量的数量与选项数量相等。如:你有贷款嘛?(A.车贷、B.房贷、C、其它贷款)这时候可以把这个问题拆分成三个问题,你有车贷吗?(是否)你有
房贷吗?(是否)你有其他贷款吗?(是否)。然后设置三个变量来存储调研的答案。
第二种方法多重分类法适用于选项多,但有最多选项数量限制的问题,例如一个有8个选
项的多选题,要求最多选两项。针对这类问题就可以采用多重分类法来设置变量。变量的数量
与最多选择选项数量相等的变量相同,一个变量录入一个答案即可。若变量数大于选项数,对
缺少的选项对应的变量采用空值处理。
三、在数据视图里面录入调研获得的数据
在SPSS录入变量的时候,对于值标签的设定是很有必要的。标签量和值的设定下我们可以更好地去录入数据,可以减少对于文字的编辑量。还可以采用Excle文件来采集数据,然后复
制粘贴到SPSS中,降低录入数据的难度。
四、设置验证条件
检验录入数据是否符合业务规则,查找出不合规的数据。首先需要设置变量验证规则,验
证规则分为单变量验证规则和多变量交叉验证规则。单变量验证规则可以设置录入数据的值范
围或值列表。例如:年龄数据的录入范围可以设定为最大值100,最小值0。多变量交叉验证规则是用来约束变量之间的关系,例如在多选题的多个变量中,不能出现重复值。
检查异常值(重复值、空值)对于异常值和极端值,最好的方法通过频数表来观察有无异
常值,但是这样过于繁琐不便于很快的找出是哪一条记录的问题,最简单的方法是选择根据自
己的需要选择变量进行排序,这样就可以更好的看出哪一条数据出现了问题,也可以快速的对
于这条记录进行修改。
五、数据录入格式的规则
(1)每一个个案在不同的记录中出现,即每一个个案的数据应该占据一行。
(2)每一个测量指标/影响因数只能占据一列的位置,即同一个指标的测量数据应当录入
到
同一个变量中去。
六、变量视图的几种情况
(1)认识变量视图
名称:代表这个变量的代号
类型:数值型:是用0--9的数字和其他的特殊的符号组成的类型。字符型:字符型数据以字符串方式存储,不能做四则运算,但可以拆分、合并、检索等操作。日期型:日期型数据用
来存储日期和时间。
测量尺度:统计分析中只有变量的存储类型是不够的,很多时候不能说明变量的一些特征,这时候就需要有测量尺度。名义尺度是按照事物的某种属性对其进行分类或分组,变量的取值
仅代表类别差异,不能比较各类大小。有序尺度是对事物之间等级或顺序的差别的一种测量,
可以比较优劣或排序。定距尺度是对事物类别或次序之间间距的测量。定比尺度是能够测算两
个测度值之间的比值的一种计量尺度。等距尺度和定比尺度统称为"标度"。
标签:可以对变量含义进行详细说明
值:可以对变量的取值的含义加以说明。
缺失值:用于设定自定义缺失值,主要用于问卷数据
参考文献
[1]张文彤,邝春伟著《SPSS统计分析基础教程》第2版
[2]方颖《利用SPSS软件处理临床治疗率》[J]《医学理论与实践》2011
作者简介:白高洪(1996.09-)男,研究方向:数据营销;杨鹏程(1997.06)男,研究方向:数据营销;岛宁(1978.05-)女,讲师,研究方向:数据营销。