SPSS软件中多项选择题处理方法研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS软件的多项选择题处理方法分析The Analysis on Treatment Methods Of Multiple Response s in SPSS
湖南商学院信息系(410205)李灿[内容摘要] 在各类调查问卷中,多项选择题应用十分普遍,所以对多项选择
题如何进行数据的录入和分析就显得十分重要。
本文将从实战的角度阐述如何使用SPSS统计软件的多重应答处理方法,举例说明了对多项选择题答案如何进行数据编码和变量设置,并对数据分析方法加以深入剖析。
Abstract: In all kinds of questionnaire investigations, it is very general that multiple-choice questions are used, so how to input and analyze that seems very important to multiple-choice questions. This text ,expatiates how to use multiple response method with SPSS software, explains how to set up digital codings and variables for example in terms of practicality, and analyzes its analytical method thoroughly .
[关键词] 多项选择题;多重应答处理过程;多重二分法;多重分类法
Keywords: Multiple-choice questions,Multiple Response,Multiple dichotomy method,Multiple category method
在各类调查问卷中,多项选择题(或复选题)应用十分普遍。
多项选择题是指对同一个问题可能有多个候选答案。
它对于广泛搜集被调查对象的态度倾向、探索不同人群的态度组合以及为进一步编制心理量表均有重要的作用。
由于被调查者的态度千差万别,组合类型更是多样,如何精确、有效地分析获得各选项及其组合的选择信息成为许多SPSS 软件新手面临的一个难题。
SPSS(Statistical Product and Service Solutions),即社会产品及服务解决方案。
SPSS软件是国际公认的最优秀的统计分析软件包之一。
与其他统计软件相比(如SAS 软件),SPSS 软件不用基于一些较为繁琐、枯燥的语句和命令,只要用户具备一般的计算机和统计原理知识,就能运用鼠标进行操作,得到所需要的统计分析结果。
目前S P S S 的版本已经发展到了SPSS13.0。
在SPSS软件中有多重反应分析过程(Multiple Response),即多项选择题处理过程,但有关专著对多项选择题数据文件的建立与分析方法论述得较少或不够实用。
本文将以在某次家用轿车消费观念调查的两个问卷项目为例来进行介绍:
项目1、您的性别:1-男 2-女
项目2、您购车时,哪些因素会影响你的购车决策。
(允许选择3个答案,而且要求被调查者按主次顺序选出答案,如521,即价格最重要,其次是款式,再次是性能。
)
1、性能 2-款式 3-油耗 4-品牌 5-价格 6-颜色 7-其他
从实战的角度阐述如何使用SPSS统计软件的多重应答处理方法,举例说明了对多项选择题答案如何进行数据编码和变量设置,并对数据分析方法加以深入剖析。
一、多项选择题的数据编码和变量设置
对于多项选择题,根据选择项目的多少和分析目的,在SPSS软件中常用的2种数据编码和变量设置的方法:
1、多重二分法(multiple dichotomy method),对于多项选择题的每一个选项看作一个变量来定义。
0代表没有被选中,1代表被选中。
这样,多项选择题中有几个选项,就会变成几个单选变量,这些单选变量的选项都有两个,就是未选和选中,即0或1。
如项目2有7个多选项,可将7个选项分别设置1个变量,即该问题分解为7个变量,每个变量设置变量值0和1。
0表示“未选”,1表示“选中”。
如上述项目2,可设置数值变量:a1、a
2、a3……a7(见表1)。
若某人购车决策影响因素同时选择价格、款式和性能,可在变量a1、a2和a5中分别输入1,a
3、a
4、a 6和a7中输入0;也可在变量a3、a4、a 6和a7中不输入任何数值,当缺失值处理。
数据全部输入完毕后,通过变量转换,将缺失值转换为0。
如果选择项较多,而被调查者最多只选择其中少数几项时,这种方法就有点烦琐,输入数据时容易出错,采取多重分类法更方便一些。
表1 多项二分法编码表
定义几个单选变量。
每个变量的选项都一样,都和多项选择题的选项相同。
每个变量代表被调查者的一次选择,即记录的是被选中的选项的代码。
由于被调查者可能不会全部都选,在数据录入时,一般从这些变量的靠左边的变量开始录入,右边的变量自然就是缺失值。
当被调查者对多项选择题中的选项全部选择时,这些变量中都有一个选项代码,此时没有缺失值。
如项目2您想选择哪些择偶条件(任选三项),有3个多选项,可将3个选项分别设置3个变量,即该问题分解为3个变量b1、b2、b3,每个变量设置变量值1、2、3、4、5、6和7(见表2)。
若某人购车决策影响因素同时选择价格、款式、和性能,可在变量b1输入5、b2中分别输入2, b3中输入1。
表2 多重分类法编码表
在对收集到的问卷进行数据分析之前,首先应该定义多项选择题的数据集合,即哪些项目构成一个多选题。
在SPSS统计软件中多项选择题的数据集合的定义,可以通过两种不同的方式进入:
1、从菜单Analyze-﹥Multiple Response进入,
2、从菜单Analyze-﹥Tables-﹥Multiple Response Tables进入。
进入多重反应分析过程后,就可以对多项选择题的数据集合的定义。
以上两种方式进入的界面不相同,但定义方式是相同的即直接点击Define Sets按钮。
进入多项选择题变量集的定义过程后,具体定义的步骤如下:
第一步:在Variables in Set框是选入需要加入同一个多项选择题变量集的变量系列,这些变量必须进行分类,并按照相同的方式来编码。
若项目2是按多重二分法编码,将Set Definition框中的a1、a2、a3……a7放入Variables in Set框,在Variables Are Coded As单选框中的选择dichotomies(多重二分法编码方式),在Counted value右侧框中输入1。
若项目2是按多重分类法编码,将Set Definition 框中的b1、b2、b3放入Variables in Set框,在Variables Are Coded As单选框中的选择categories(多重分类法编码方式),则需要设定取值范围,在该范围内的记录值纳入分析。
一般的取值范围是该多项选择题选项的最大和最小代码,因此在range右侧框中输入1,through后输入7。
第二步:定义多重反应分析的变量集的名称并附上名称标签。
在Name框是输入多项选择题变量集的名称,项目2用的是“GCJCYXYS”。
在Lable框是多项选择题变量集定以一个名称标签,项目2用的是“购车决策影响因素”。
第三步:单击Add钮,将定义完成的“变量集”填加到“多选集”( Multiple Response sets)中, 此时变量集名前自动添加了集符号“$" (如: $GCJCYXYS)。
Mult Response Sets框是存放已定义好的多项选择题变量集的列表,在此框中可定义多个,它左侧的三个按钮Add、Change和Remove,分别用于添加、修改和移出变量集的定义。
第四步:最后单击Close按钮,相应的多项选择题变量集就定义完成了。
在SPSS统计软件中的多重反应分析过程(Multiple Response),最多可以定义20
个多项选择题变量集,对于一次问卷调查一般不会有超过20个的多项选择题,所以完全够用了。
三、多项选择题的分析过程
多项选择题的数据集合定义完成之后,就可以对数据进行分析。
分析包括两种:频数分析和列联表分析。
(一)频数分析过程
多项选择题的频数分析过程(Freqencies),只能通过Multiple Response菜单里的Freqencies过程实现,生成多项选择题的频数分析表比较简单。
从菜单Analyze-﹥Multiple Response-﹥Freqencies进入。
然后从Mult Response Sets框中将分析对象(本例如购车决策影响因素$GCJCYXYS)选入右边的Table(s) for 框,其他默认,单击OK钮,多项选择题的频数表就生成了。
如表3所示。
在本次调查中,对170名受访者的调查结果为:在决策影响因素中,居于前三位的分别为:价格被选率最高29.4%,其次是油耗为20.2%,再次是品牌为18.0%。
表.3 购车决策影响因素多项选择题的频数分析表
多项选择题的列联表分析过程(Crosstabs),可以产生多重交叉列联表,而且可以对单元格进行很细致的分析。
列联表分析可以通过两种不同的方式进入:
1、从菜单Analyze-﹥Multiple Response-﹥Crosstabs进入。
2、从菜单Analyze-﹥Tables-﹥Multiple Response Tables进入。
在Mult Response Sets框中,显示已经定义好得多项选择题变量集,本例把变量集“购车决策影响因素”$GCJCYXYS选入Colums框。
把变量sex放入Rows 框,并对性别要定义变量值的范围,单击Define Ranges钮, 定义最小值和定义最大值,本例定义最小值为1,定义最大值为2(1=“男”,2=“女”)。
对于Option 子对话框,本例选择了Cell Percengtage(百分比)的Row,Percengtage Based on选择的是Case, 一般选择其默认状况即可。
最后单击OK钮,便得到多项选择题的列联表(见表4)。
表4 多项选择题的列联表sex*$JCSX Cross tabulation
名男性中,价格被选率最高为84.5%(49/58),其次是油耗为60.3%(35/58),
再次是性能为58.6%(34/58)。
在被调查的112名女性中,价格被选率最高为90.2%(101/112),其次是油耗为60.7%(68/112),再次是品牌为52.7%(59/112)。
四、多项选择题答案的排序分析
在有些调查不仅要研究多项选择题的组合,还要研究答案的排序情况。
如本例中的购车决策影响因素,允许选择3个答案,而且要求被调查者按主次顺序选出答案,如521,即价格最重要,其次是款式,再次是性能。
针对此种情况,多项选择题的数据编码和变量设置只能采取多重分类法(multiple category method)。
分析结果若想得到每个选项的交叉列联表,有三种方法:
1、从菜单Analyze-﹥Multiple Response-﹥Crosstabs进入,此时需要把变量sex放入Rows框,单击Define Ranges钮, 定义最小值为1,定义最大值为2。
把变量b1、b
2、b3(b1是购车决策影响因素中最重要的、其次是b2、再次是b3)放入Columns框,单击OK钮即可。
2、从菜单Analyze-﹥Descriptive Statistics-﹥Crosstabs进入,把变量sex 放入Rows框,把变量b1、b2、b3选入Columns框,单击OK钮即可。
3、从菜单Analyze-﹥Tables-﹥Multiple Response Tables进入,把变量sex 放入Rows框,把变量b1选入Columns框,单击OK钮得到性别与最重要购车决策影响因素列联表,然后分别把b1换成b2,把b1换成b3,就分别得到性别与其次购车决策影响因素列联表和性别与再次购车决策影响因素列联表。
注意不能把变量b1、b2、b3同时选入Columns框。
通过上面三种方法都能得到性别与最重要的、其次的和再次的购车决策影响因素列联表,从而看出性别间购车决策的差异。
参考文献:
[1]、余益兵,复选题的spss数据编码技巧分析,统计教育[J],2005,7。
[2]、吴增基等主编,现代社会调查方法[M],上海人民出版社,2003年6月。
[3]、洪楠、林爱华、候军等主编,Spss for Windows统计产品和服务解决方案教程[M],清华大学出版社,2003年4月。