多选题分析方法初探
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多选题分析方法初探
本文的分析方法适合于所有类型多选题,但是针对那些选项数比较多的多选题可能更加使用。
本文最后的分析结果以图形界面的方式显示出来,这是因为本人对图形的偏好,同时我也认为很少有人对数字有什么感觉。特别地,当题目的选项数超过10以上时,如果想从这些题项间看出端倪,恐怕得有一定的修行。
在开始介绍本文的分析方法之前,我简单介绍一下我们常用的多选题的分析方法以及这种分析方法不足的地方。
以前采用的方法:
如果常常使用SPSS,我们知道SPSS中提供了两套程式来解决多选题的问题:
第一种是在Multiple Response菜单下先定义多选题Set, 定义好Sets之后,Frequencies 和 Crosstabs 菜单就会变量,我们就可以使用Frequencies 和Crosstable程序就行相关的分析(不是相关分析,呵呵)。这类分析相关的图解如下:
第二种分析方法是基于SPSS的tables模块。在Tables 模块里至少有两个子程序支持Multiple Responses (MR, 以下没有特别说明,MR代表多选题,并不代表Mental Retardation). General Table & Multiple Responses Table 模块都支持MR分析,另外在Multiple Responses Sets里面可以定义Sets,这个功能和第一种方法里面介绍的一样。图解如下:
这两种方法基本上是等效的,但如果你装有Tables模块,建议使用第二种,因为不要钱的东西自然会要打些折扣。Multiple Responses 是Basic模块,不需要另外付钱。第一种方法定义的集合在重启之后会全部消失,你需要重来一次,嘿嘿,这个工作量不轻松,不信自己试试看。另外,这个方法提供的交叉表功能有限,不能做很复杂的表格。更为重要的一点是,SPSS13.0之前的版本第一种方法不能直接产生表格,而是TXT的log文件,这个玩意儿弄到PPT或者Word里面去,有的事情做了,有点像SAS。似乎不太适合批量生产表格的市场研究人员。因此强烈建议使用第二种方法,如果你的SPSS程序装有Tables模块。
我们现在使用的方法:
在漫长的等待之后,我开始介绍今天要做的方法,我们前面的铺垫还是很有帮助的。我们开始介绍一下我们的数据。我们的数据是假设是基于一个媒体调查,这些数据并不具有真实性,没有实际意义,这些数据只服务于这篇文章的介绍,不用于任何实际的参考,即使这些数据看起来可能有一些实际意义,由此引起的任何版权纠纷和经济损失作者不承担任何责任。
Variable(Set) Label Level Values
上班族 2 学生3 司机
Sort 人群 3 1
流行音乐 2 娱乐 10 资讯
Radio 广播节目 10 1
TV 电视节目10 1 音乐2时尚 10 体育
单位配车 2 出租车 9 步行
Out 外出交通工具 9 1
其中,sort是单选题,Radio 和TV、out是多选题集合。
在SPSS中我们有两种定义多选题的方式:Count和Category,我采用第一种。我们假设这些数据已经录好在数据库中(你可以采用很多数据录入软件,不要试图在SPSS里面录入数据)。
分析准备:
第一步:我们首先要得到各多选题的频数分布或者说交叉分布,这是必须的,因为我们后续的分析是基于各题项之间的分布的。实质上,在第一部分中我们得到的频数分布表就为我们提供了这样的数据,问题是我们的分析不能仅仅止于此。因为我们很少会把频数分析结果作为最终结果,其中的原因是这种数据提供的大量信息被繁杂的选项所覆盖,同时我们也不能得到多选题和其他题项之间的关系。
第二步:从得到的频数数据(频数分布表或者交叉表)中,我们把多选题的结果作为单选题来处理。这是可行的,因为我们在做频数分析的时候,也没有另外区分单选题和多选题。实质上,多选题也可以手工来做的,就是把各个选项的选择情况画“正”字累加,但这个功能太繁就交给电脑去做的。电脑能做的就只有这么多了,这是因为包括SPSS在内的大软件处理的都是单项题,对于多项题则无能为力了。我们的这一步至观重要,如果有人证明了这种方法的荒谬性,那下面所有的处理都是非法的。
第三步:把表格中的数据(知道了开始的时候提示使用第二种方法的好处了吧,我们只要阿export到excel中去了),我们的数据需要先转到excel中去,如果直接向SPSS里面copy,保证是自讨苦吃。
第四步:在Excel中把数据处理成SPSS能接受的数据格式,即标准的变量格式,最后记得保存。
第五步:在SPSS中打开刚才保存的excel数据,不要说打不开。另存为SPSS数据。
第六步:数据分析前的最后第二步。利用Data菜单下面的Restructure命令,把数据转化成Long格式。另存为SPSS数据。
第七步:Data菜单下面的weight cases,把你刚才转变后的数据加权,这表示一条数据代表几条数据。好,分析前的准备工作都做好了。
演示:
定义变量集
这是定义后的结果:
产生交叉表:
这就是产生的交叉表:
开始copy或者export,随你的便,这是粘贴后的结果:
整理后的结果:
注意到标记的那个地方是我自己加上去的,其中的那些英文是我自己该过的,为的是让SPSS 能够认出这些变量。
转到SPSS中是这个样:
记得另存为,开始转化称Long Data:
这是点击之后的结果:
这是转化好之后的结果:
记得Weight:
完工了。
注意要把字符型变量转化成数字变量,这不用我教吧。保存好之后,你就会发现这样的数据你一定认识。下面知道怎么分析了吗,继续往下看吗!
分析:
做个对应分析: