SPSS学习系列17. 交叉表与多选题
交叉列表和多选题分析
交叉列表和多选题分析交叉列表(交叉表)和多选题分析是数据分析中常用的方法,尤其在市场调查、社会科学研究等领域。
以下是关于交叉列表和多选题分析的基本概念和应用:交叉列表(交叉表)交叉列表(也被称为交叉表或列联表)是一种用于展示两个或多个分类变量之间关系的表格。
在交叉表中,行和列分别代表不同的分类变量,每个单元格则显示这两个变量特定类别组合的频数或百分比。
通过交叉表,可以直观地观察不同变量类别之间的关联和分布。
例如,在市场调查中,可以使用交叉表来分析不同年龄段和性别的消费者对某一产品的偏好。
行可以代表年龄段,列可以代表性别,单元格中的数值则可以表示各年龄段和性别组合中对该产品的偏好程度。
多选题分析多选题(也称为多重响应集)是指一个问题中有多个选项可以被选中的题型。
在数据分析中,多选题分析通常涉及对多选题答案的编码和处理,以便进行统计分析和解释。
多选题分析的一个常见方法是使用多重响应交叉表。
这种方法将多选题的不同选项作为行或列变量,通过计算频数、百分比等指标来展示不同选项之间的关联和分布。
同时,还可以使用卡方检验等方法来检验不同变量之间是否存在显著的关联。
注意事项1. 数据编码:在进行多选题分析之前,通常需要将多选题的答案进行编码,将每个选项转换为一个或多个二进制变量(0或1),以便进行后续的统计分析。
2. 样本量:对于多选题分析,样本量的大小对结果的可靠性有很大影响。
样本量越大,结果的稳定性和可靠性通常越高。
3. 统计显著性:在分析结果时,需要注意统计显著性水平。
通常,如果p值小于0.05(或其他预设的显著性水平),可以认为两个变量之间存在显著的关联。
4. 解释和应用:最后,需要对分析结果进行解释和应用。
这包括理解不同变量之间的关联模式、解释统计指标的含义以及根据分析结果做出决策或提出建议。
总之,交叉列表和多选题分析是数据分析中常用的方法,可以帮助研究人员更好地理解和解释数据中的关系和模式。
在应用这些方法时,需要注意数据编码、样本量、统计显著性和结果解释等方面的问题。
定量问卷调查中多项选择题的spss分析方法
定量问卷调查中多项选择题的SPSS分析方法2009-05-11 13:26多项选择题是定量问卷调查中常见的封闭式选择题,这种选择题的出现可以在确定的范围内更多的考察被调研对象的看法。
在针对消费者的调研中,这种选择题多是出现在针对品牌知名度,包括提示前知名度、第一提及率,提示后知名度的分析中。
î常见的分析方法一般的研究分析手段主要应用包括EXCEL与SPSS在内的频次分析,然后再将在不同数据字段同一类选项数据进行加总,然后再以被调研对象的总体数量为基数,二者相除来得到多项选择题中各选项在总体中的占有率,这种各选项占有率的加总大于1。
例如某类产品品牌知名度调查中,关于该类产品您能想起哪些品牌?01 品牌A 02品牌B 03品牌C 04品牌D 05品牌E 06品牌F 07其它品牌_____该问题在数据字段设计时最少要设计10个字段以供数据录入与分析。
按上面的数据分析方法,先在这10个字段中进行分别的频次计算,然后进行加总再除以总基数,得到该选项的总体占有比率。
以A选项为例:(01字段中A的占有率+02字段中A的占有率+ …… +06字段中A的占有率)/被调对象总数=A的占有率以此类推分别计算出其它品牌的占有率,频次计算次数与分类加和计算次数比较繁杂,其工作量在被选项较少时还算省事,但当被选项数量在十几个、二十几个甚至三十几个时,该分析方法则极大降低了分析人员的工作效率。
î高效率数据分析方法运用SPSS重组再分析的数据方法将极大提高数据分析效率并降低人为计算失误。
在SPSS数据库中运用“Multiple Response”对多组数据进行组合再定义,这样会针对每个单一选择题定义出一个新的字段组,在新字段组中对变量区间进行定义,再针对新字段组进行频次分析。
当完成单一字段设置后,可运用程序段对其它多项选择题进行再利用分析,这样可以大大提高多项选择题数据分析效率。
分析程序例举:**************MULT RESPONSEGROUPS=$tsh '新字段组名称' (var00018 var00019 var00020 var00021var00022 var00013 var00014 var00015 var00016 var00017 (1,111))/FREQUENCIES=$tsh .*************多重应答数据深度分析方法及其SPSS操作多重应答数据深度分析方法及其SPSS操作出处:零点研究咨询集团发布日期:2007年06月21日 15:39多重应答(Multiple Response),又称多选题,是市场调查研究中十分常见的数据形式。
调查问卷数据SPSS分析中—多项选择问题处理方法
SPSS多项选择问题处理方法 多项选择题是定量问卷调查中常见的封闭式选择题,这种选择题的出现可以在确定的范围内更多的考察被调研对象的看法。
在针对消费者的调研中,这种选择题多是出现在针对品牌知名度,包括提示前知名度、第一提及率,提示后知名度的分析中。
î常见的分析方法一般的研究分析手段主要应用包括EXCEL与SPSS在内的频次分析,然后再将在不同数据字段同一类选项数据进行加总,然后再以被调研对象的总体数量为基数,二者相除来得到多项选择题中各选项在总体中的占有率,这种各选项占有率的加总大于1。
例如某类产品品牌知名度调查中,关于该类产品您能想起哪些品牌?01 品牌A 02品牌B 03品牌C 04品牌D 05品牌E 06品牌F 07其它品牌_____该问题在数据字段设计时最少要设计10个字段以供数据录入与分析。
按上面的数据分析方法,先在这10个字段中进行分别的频次计算,然后进行加总再除以总基数,得到该选项的总体占有比率。
以A选项为例:(01字段中A的占有率+02字段中A的占有率+ …… +06字段中A的占有率)/被调对象总数=A的占有率以此类推分别计算出其它品牌的占有率,频次计算次数与分类加和计算次数比较繁杂,其工作量在被选项较少时还算省事,但当被选项数量在十几个、二十几个甚至三十几个时,该分析方法则极大降低了分析人员的工作效率。
î高效率数据分析方法运用SPSS重组再分析的数据方法将极大提高数据分析效率并降低人为计算失误。
在SPSS数据库中运用 “Multiple Response”对多组数据进行组合再定义,这样会针对每个单一选择题定义出一个新的字段组,在新字段组中对变量区间进行定义,再针对新字段组进行频次分析。
当完成单一字段设置后,可运用程序段对其它多项选择题进行再利用分析,这样可以大大提高多项选择题数据分析效率。
分析程序例举:**************MULT RESPONSEGROUPS=$tsh '新字段组名称' (var00018 var00019 var00020 var00021var00022 var00013 var00014 var00015 var00016 var00017 (1,111))/FREQUENCIES=$tsh .*************多重应答数据深度分析方法及其SPSS操作多重应答数据深度分析方法及其SPSS操作出处:零点研究咨询集团 发布日期:2007年06月21日 15:39多重应答(Multiple Response),又称多选题,是市场调查研究中十分常见的数据形式。
SPSS软件中不同类型多选题的编码和分析方法
选择 了几个答案 ,录入人员都要对每个子变量进行数据
录 入 , 定 程 度 上增 加 了 出现 录入 错 误 的风 险 。而 多 重 分 一
的分布情况 。对例 1 可以比较不 同性 别被 访者选 用交通
工 具 的 差 异 , 到 的 列 联 分 析 表 如 表 2 可 以 看 到 不 同性 得 ,
多选题 的数据编 码提出 了改进 方法 ,提 高了数据录 入转
换 的效率 , 春枝等 人 (mo 尝 试提 出了对 多选题 数据 王 2 )
a一 l3中输入 1其他变量输入 0 , 。
另一种处理不 定项多选题 的录入方 式是 多重分类编
进行深度挖掘的方法 。在实际研究工作中 , 研究 者也总结
了不 同类 型多选题的 特点 和处理方法 ,为更好地开展工
作提供 了许多支持 。本 文将 分别探 讨不定项多选题 、 定项 多选题 和定项排序多选题 适用的录入编 码方式和深度分 析方法 。
兴 缓 厌烦 绪; 方 也可 从多 角 掘所 趣, 解 情 另一 面 以 个 度挖
研 究 的 问 题 ,方 便 对 调 查 结 果 进 行 进 一 步 量 化 分 析和 统 计处 理 。
理 论 与 方 j 法
S 软件 中不 同类型 PS S 多选题 的编码和分析方法
问卷调查 法是社会 科学领 域常 用的一 种研究 手段 。
研究者将 所要研究的问题编 制成 问题表格 ,通过 被访者 自行 填答 或对被 访者的当面询 问 ,了解他们对 某一现象 或 问题的看法和意 见。问卷 的设计 要根据调查 内容的特 点, 选择使用不 同的题型 。一方面可 以提高被访者的答题
码法 , 仍然 根据选项 的个数 确定 子变 量 , 设定 b一 , l2 l 1b 一
SPSS知识学习系列17.交叉表与多选题
17. 交叉表与多选题(一)基本理论分类变量包括无序分类变量、有序分类变量、多选题变量集。
对于分类变量的描述统计,主要是对分类变量各水平值分别进行频数和比例计算,再进步计算所需的一些相对频数指标。
一、单分类变量的统计描述1. 频数分布分类变量的分析,首先要了解:各类别的样本数(频数),以及占总样本量的百分比;对有序分类变量,还需要了解:累积频数、累积百分比。
2. 集中/离散趋势观察原始频数,或者使用众数。
对于分类变量,集中/离散趋势是一体的。
3. 相对频数指标(1)比(Riatio)两个有关指标之比A/B, 用来反映相对的大小关系,例如,月销售额/销售人数;(2)构成比用于描述事物内部各构成部分所占的比重,例如,百分比、累积百分比;(3)率(Rate)率是具有时间概念或速度、强度意义的指标,表示某个时期内某事件发生的频率或强度,例如速率、频率、费率、发病率等。
二、多分类变量的联合描述列联表。
例如,r×c二维列联表:(1)共n个样本;(2)按两种属性A、B,属性A有r个水平值:A1, …, A r; 属性B有c个水平值:B1, …, B c. 属性A=A i,属性B=B j的样本数为n ij.(3)n i. = “属性A=A i”的合计数,n.j = “属性B=B j”的合计数。
注:多分类变量对应高维列联表。
三、多选题的统计描述多选题是调查问卷的常见题型,因为多选题是回答同一个大问题,所以不能割裂开来单独分析,需要做汇总处理。
1. 应答人数(Count)选择各题项的人数,原始频数;2. 应答人数百分比选择该项的人数占总人数的百分比,可以反映该选项在人群中的受欢迎程度;3. 应答人次(Response)选择各选项的总人次,1个受访者选择2个选项,即2人次;4. 应答次数百分比在做出的所有选择中,选择该项的人次占总人次数的比例。
(二)SPSS实现有某调查问卷的数据文件(部分):变量属性:一、单分类变量的描述——频率变量“s4”表示学历:问题1:描述受访者的学历分布情况【分析】——【描述统计】——【频率】,将“学历”选入【变量】框,点【确定】得到S4. 学历频率百分比有效百分比累积百分比有效初中/技校或以下 154 13.4 13.4 13.4 高中/中专 313 27.3 27.3 40.7 大专331 28.9 28.9 69.6 本科 292 25.5 25.5 95.0 硕士或以上 57 5.0 5.0 100.0合计1147100.0100.0注:详细操作见第15篇《频率图表》。
spss多选题处理
SPSS中多选题(复选题)的录入及统计分析多选题,就是说一个题目可以有多个答案。
在录入的时候有两种选择。
我们举例说明:Q1 你经常使用的搜索引擎是哪几个?1 百度2 Google3 雅虎4 其他假设有5个被访者,分别选择了A 1B 1,2C 1,2,3D 2,3E 1,4一数据录入有两种录入法,分别是二分法和分类法。
1 二分法,数据结构如下二分法的特点是,题目有几个选项,SPSS数据文件中就有相应的几个变量以之对应。
选项选中为1,不选中为0(也可以自己定义)。
2 分类法,数据结构如下分类法的话,就是把选项序号依次输入到SPSS里面就可以了。
变量个数等于同时选中的选项个数的最大值。
如果是把数据先录入到txt中的话,那么一定要注意题目之间的分隔符和选项直接的分隔符不能选一样的。
比如,题目之间用TAB或逗号分开,选项之间用|分开。
二多选题定义SPSS中处理多选题,其实有两个模块。
一个是在菜单 Analyze -- Multiple Response 中,这个地方定义的多选题是临时的,如果你关闭SPSS后再打开,多选题还得重新定义。
除非你使用Syntax,否则不推荐。
另一个就是在 Data -- Define Multiple Respones Sets 中(也可以在 Analyze -- Tables -- Multiple Respones Sets 中打开,其实是一样的),推荐用这种方法定义。
1 二分法:1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到 "Variables in Set" 这个框中2)在Variable Coding里选中 Dichotomies,即二分法3)在Category Label Source里选 "Variable Labels"4)Set Name:填入多选题编号,Set Label:填入多选题的题干(或其他你觉得合适的标签)5)点击Add2 分类法:1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到 "Variables in Set" 这个框中2)在Variable Coding里选中 Categories,即分类法3)Set Name:填入多选题编号,Set Label:填入多选题的题干(或其他你觉得合适的标签)4)点击Add定义完以后,就会生成以$号开头的多选变量集了。
最新spss之多重响应-多选题录入及交叉分析。
↓ 频率(Frequencies) 步骤二
确定响应变量 ↓
确定控制因素 ↓
参数默认,OK
频率
变量
统计量
图表 格式
显示频率表格
图表值 频率
条形图 饼图 直方图 在直方图上显示正太曲线
百分比
结果分析
有效 缺失
统计量
频率
百分比 有效百分比
累计百分比
多重响应分析
多重响应即spss对多项选 择题的统计。
步骤一:对多选题的结果 进行数据转换
转换方法:多项选择二 分法(Multiple dichotomy method)
把多选题的每一个选项当 作一个单独的二元变量来 定义,取值0代表没有被 选中,取值1代表被选中。
步骤二:定义多重相应变量集 分析(Analyze)
变量的命名规则
变量名必须以字母、汉字或字符@开头,其他字符可以是 任何字母、数字或_、@、#、$等符号。
变量最后一个字符不能是句号。 变量名总长度不能超过8个字符(即4个汉字)。 不能使用空白字符或其他特殊字符(如“!”、“?”
等)。
变量命名必须惟一,不能有两个相同的变量名。 在SPSS中不区分大小写。例如,HXH、hxh或Hxh对SPSS而
分析(Analyze)
↓
多重响应(Multiple Response)
↓
频率(Frequencies)
在二分集内按照列表顺序排除个案 在类别内按照列表顺序排除个案
结果分析
Pesponses 响应 Pesponses|N = 同行N /N的总计 Percent of Cases = 同行N/有效N
定义变量
不定项多选题交叉表分析
图25.20表-定制表
(3)定制表设置:图25.21,展⽰⽅式包括,常规、紧凑和层,个⼈喜好选择“紧凑型”,⼤家随意。
将“电信服务”放⼊列,性别放⼊⾏。
图25.21 定制表设置
(4)检验统计设置,图25.22,选择独⽴性检验(卡⽅)(T),同时为了⽐较列,即9个电信服务之间有⽆差异,选择“⽐较列⽐例”,并选择Bonferroni校正。
图25.22检验统计设置
主要结果:
【2045】有序Logistc回归,为什么不能计算OR值,那还玩啥?
【2042】这张ROC图有两个问题,你能识别吗?
【2041】为什么SPSS读取Excel数据乱码或空值,真实案例
【2040】谁说SPSS不能画统计地图
【2039】单因素⽅差分析没有原始数据怎么办?
【2038】别犯愁了,SPSS数据录⼊格式就这4种,松哥给你总结好了【2037】如何计算⼆项logistic回归模型的灵敏度、特异度等指标【2036】如何⽐较不同组相关的⼀致性?
【2035】松哥带您分享⼀篇⽂章带来的若⼲思考【荐荐荐】
【2034】松哥松哥告诉我,中位数95%可信区间怎么做?
【2033】如何让SPSS根据⾃⾝数据库⾏号产⽣ID特征变量
【2032】SPSS如何实现百分数的平⽅根反正弦变换
【2031】相关样本⾮参数检验如何实现两两事后⽐较
【2030】多元回归中交互作⽤的评价
【2029】SCI编辑让我报告LSD-t检验的t值,可是SPSS没有啊,怎么办?。
SPSS多选题处理新方法
SPSS多选题处理新方法总第期问题探讨摘要多选题数据编码和录入是多选题数据处理的难点数据录入人员手工录入数据时通常直接采用二分编码法或分类编码法录入多选题数据此方法不仅费时费力还容易出错。
本文主要介绍简单、快捷的多选题“原始编码录入法”再通过软件自带的函数和函数将其转换为二分编码或分类编码。
关键词多选题二分编码分类编码编码转换当同一个问题的选项可以同时允许多个值存在时我们称为之多项选择题或称多重应答题。
在市场调查等问卷设计时根据调查目的合理设置多项选择题有助于确保调查信息准确性和全面性同时也能够节约一定的成本。
比如在关于品牌使用习惯消费价值观等方面的调查问卷设计者更需要考虑调查对象选择的灵活性和多样性在这种情况下设置多选题比设置单选题往往更符合实际情况所获得的信息量也更多因而更具有决策参考价值。
然而在现实中由于多选题数据录入的复杂性导致大数多调查者不愿意在问卷中设置多选题。
综观目前相关文献大部分将重点放在多选题如何分析和检验上而对多选题数据处理的难点———数据的录入和转换探讨不够深入以下内容主要讨论多选题编码问题以及如何使用“原始编码法”录入数据再探讨如何利用自带的函数轻松、快速和准确地完成多选题的数据转换将其转换为二分编码或分类编码。
一、处理多选题数据时认可的编码方式对多选题数据处理有一定的格式要求因此在数据录入之前我们应该了解多选题分析时要求的数据编码和排列格式。
目前中认可的多选题分析数据格式为二分编码或者分类变码。
、多选题结果的二分编码多选题二分编码法其原理就是将多选题的每个选项都拆分成一个“是否”问题即二项迫选问题拆分出的二项迫选问题数目是该多选题的选项数。
问题您选择时考虑的主要因素是什么价格包装味道知名度流程程度其它。
假设甲选择了乙选择了使用二分编码法就相当于将问题变成以下格式个二项迫选问题。
假如采用或来记录每一个选项被选中的情况“”表示被试该选项没有被选中“”表示该选项被选中。
这样我们在中需要设置六列即用六个变量来记录该多选题每一选项被选择的状况我们在分别设如、、、、、六个变量分别记录每一选项被选择的状况甲选择了我们就记为、、、、、。
多选题数据的SPSS多重对应分析操作方法
某 次 市 场 调 研 项 目 中 向 被 访 者 收 集 以 下 数 据 , A1 题 为 多 选 题 , 把 上 述 数 据 以 第 二 种 方 式 录 入 进 SPSS 软 件 中, 其中设置 a101、a102、a103 三个变量用来录入多选题 A1, 并定义好相应的变量值标签( Values) 如图 1。
四、多重对应分析
现在我 们 运 用 多 重 对 应 分 析 方 法 来 研 究 “购 买 品 牌 ” ( A1 题) 、“性别”和“年龄”三个变量之间的联系。
选 择 菜 单 Analyze→ Data Reduction→ Optimal Scal-
ing , 默 认 弹 出 对 话 框 中 的 设 置 ( 如 图 3) , 点 击 Define, 选 中变量“a”、“b”、“c”、“d”、“e”、“性别”和“年龄”, 然后通过 点击 Define Range , 为每个变量设置取值范围: “a”、“b”、 “c”、“d”、“e”、“性别”的取值范围在 1~2 之间, “年龄”的取 值范围在 1~5 之间( 如图 4) , 点击 OK 后得到多重 对 应 分 析图( 如图 5) 。
3 ■ 2008 ■ 市场研究 ! "
理论与方法
三、多选题两种数据录入格式的转换
由于只有第一种数据录入方式才是符合统计分析原 则的数据排列格式, 能够直接进行后续的统计推断, 而第 二种录入方式只是一种简化纪录方式, 需要转化为前者。 其转化方法操作如下:
选择 菜 单 File→New→Syntax, 在 弹 出 的 Syntax 对 话 框 中 输 入 相 应 的 命 令 , 其 中 新 变 量 “a”代 表 被 访 者 是 否 选 择 了 “A 牌 ”这 个 选 项 ( 1 代 表 选 择 , 0 代 表 未 选 择 ) 这 样 通 过上述数据转换, 我们就把 a101、a102、a103 三个旧变量 ( 以第二种录入方式) 的数据转 化 成 了 a、b、c、d、e 5 个 新 变量( 以第一种数据录入方式) 的数据, 并定义好新的变 量值标签( Values) , 如图 2。
SPSS-多重响应-频率和交叉表案例分析(问卷调查分析)
SPSS-多重响应-频率和交叉表案例分析(问卷调查分析)2011-09-29 16:35马上要国庆了,公司待遇不错,一口气放10天假,真是太高兴了,已经买了飞机票,飞机票贵的一滚,来回居然要2000多,伤不起啊!!在10.1休假前,希望跟大家讨论一下SPSS-多重响应--频率和交叉表分析,希望大家能够多提点提点在云南电信网上营业厅做了一个关于“客户不使用电信3g业务的原因有哪些的问卷调查,问题所示:这份问卷调查总更有35人参与,样本容量偏少,其中1:选择 A :3G资费过高的有 14人2:选择 B: 网络覆盖率低,信号不稳定的 15人3:选择 C:买手机太麻烦的 15人4:选择 D: 换手机号麻烦 15人5:选择 E: 3G功能用处不大 9人6:选择F: 朋友使用后,觉得不好 10人第一步:我们将 A , B, C , D , E ,F,六个答案选项分别做为一个单独的变量,分别赋值为“0”和“1”,0代表没有被选中,“1”代表被选中,这个就是所谓的“二分法”在SPSS中进行数据编码后,如下所示:点击“分析-多重响应---定义变量集---进入如下所示页面:根据如上图所示,填写变量集名称,标签,以及在”二分法” 计算值选项中填入“1”再点击”添加“ 添加成后,点击”关闭“按钮再点击”分析-多重响应--频率分析----分析结果如下所示:上图结果很直观,结果,我就不分析了百分比=N/总计 =14/78=17.9%个案百分比=N/参与人数(有效人数)=14/33=42.4% 下面来进行“交叉表”分析,如下所示:从上图可知:多重响应交叉表中有“行,列,层”三个选框1:我们将“变量集" 移入”行“列表框内,将”客户类型“移入”列框内,层选框可以不选,有需要时再选,层选项框是用来分层进行统计分析的(我进行了分层,如上图所示)比如:我想计算每一个答案有多少被选中,有多少没有选中,可以采用分层,分为“选中”和“未选中”两个层次“客户类型”是指来进行“问卷调查”人的分类,分为“3g老客户”“3g一般客户” "很少用3g客户“”不用3g客户“等类型,点击“选项”进入如下所示页面:点击确定,可以得到如下结果:因为我们上图选中的“列”所以,计算的是列单元格百分比,也进行了分层处理,分为“没有选中”和“选中”两个层次。
spss之多重响应 多选题录入及交叉分析。
定义变量
名称(Name) 类型(Type)
宽度(Width)
小数(Decimals) 标签(Lable)
值(Values)
缺失(Missing) 列(Columns) 对齐(Align) 度量标准(Measure)
变量名称 Name
SPSS默认的变量为Var00001、 Var00002等,用户也可以根据自己的 需要来命名变量。SPSS变量的命名和 一般的编程语言一样,有一定的命名 规则,具体内容如下。
步骤三:多重响应分析
分析(Analyze)
↓
多重响应(Multiple Response)
↓
频率(Frequencies)
在二分集内按照列表顺序排除个案
在类别内按照列表顺序排除个案
结果分析
Pesponses 响应 Pesponses|N = 同行N /N的总计 Percent of Cases = 同行N/有效N
度量(Scale)
数据的输入与保存
定义了所有变量后,单击“Data View”标签,即可在出现的数据视图 (编辑)窗中输入数据。 数据录入时可以逐行录入,也可以分析过程不仅能够输 出详细的频数分布表,而且能够按照 用户的要求输出特定的百分位点,还 能够输出条形图等统计图。
行
列
层
定义范围
SPSS问卷分析篇之非参数检验——交叉表分析
SPSS问卷分析篇之非参数检验——交叉表分析SPSS问卷分析篇之非参数检验——交叉表分析标签:SPSS 调查问卷销售渠道-------------------------------------------------------->【概念】均值检验、方差检验都是针对综述变量并涉及总体的的统计参数,但在数据分析的过程中,有很多类别数据或顺序数据,对这些数据的分析主要是应用频数及分布特征来分析,这类分析统称为非参数统计分析。
非参数检验是对非参数统计分析的显著性进行检验,与参数检验相比,对数据分布、数据测量尺度没有特别要求,计算较为简单,特别适用于类别测量或顺序变量的统计分析。
对于一个调查样本,通常会利用分组变量,将调查样本划分为若干个相互独立的子样本,通过统计各子样本的调查结果,发现各子样本的差别或联系,应用多个独立样本的非参数检验,判断这些差别或联系的显著性,进而判断分组变量是否有统计意义。
如在市场调查中,用个人资料对调查样本进行分组,并分析这些分组在不同问题上是否存在差异,此时就需要使用非参数检验的方法(多样本非参数检验)。
在调查问卷分析中,经常要用到多个分组变量进行交叉统计分析,并对分析结果的显著性进行检验,此时可用SPSS菜单crosstable功能的卡方检验。
【案例】假设我们已经取得某调查问卷数据,其中包含字段:购买休闲服地点(步行街、街道服装店、百货店、综合购物广场、综合超市、服装批发市场、其他);性别(男、女);现在我们想知道性别在购物地点的选择上有没有差异。
1、SPSS——analysis——描述统计——crosstable2、统计量中选择“卡方”检验3、结果此图的上半部分:频数分析表,指出男性和女性分别在不同的购物地点的频数,大概可以看出男性和女性各自不同的消费习惯;下半部分:卡方检验,pearson chi假设行和列变量相互独立,即假设男性和女性在选择购物地点时没有差别,现在现住小于0.05,原假设不正确,所以,男性和女性在选择购物地点时有显著差异,这可以指导我们在开拓新的铺面时,准确把握顾客和选择合适的地点。
关于多选题和排序题的SPSS处理
关于多选题和排序题的SPSS处理理论与方法关于多选题和排序题的SPSS 处理笪王宣承张利张敏强问卷调查法是市场研究中常用的一种研究手段。
研究者将所要研究的问题编制成问题表格,以邮寄、当面作答或者追踪访问方式填答,从而了解被试者对某一现象或问题的看法和意见。
该方法有很多优点,它成本低,可大规模施测,而且可以突破空间的限制进行远距离的调查,大大节省了时间、人力和物力。
问卷调查的结果经过量化,可进一步进行统计处理和数据挖掘。
问卷调查法对于调查问卷的设计要求较高,设计者不仅要在内容上了解相关专业的知识背景和被访者的心理行为规律,而且在形式上要合理的搭配各种题型,做出美观的布局设计。
这样做一方面可以提高被访者的答题兴趣,缓解厌烦情绪;另一方面也可以从多个不同角度挖掘所研究问题的答案。
在问卷设计中,常见的题型包括单选题、多选题、排序题和问答题。
其中单选题是最常见的题型,实践中可通过频数统计,箱型图及各种高级统计方法对其进行分析,流行的统计软件SPSS 中也包含多个用于处理单选题的模块。
问答题作为主观题,通常不进行编码和统计分析,只作为定性研究来处理。
多选题和排序题是两种常见的题型,多选题的优势是它可以广泛的搜集被访者的态度信息,探索不同人群的态度组合,为进一步编制或修订量表提供依据。
排序题可以同时测查被访者对多个选项的态度倾向。
同的编码和处理方式。
1. 不定项多选题这是最常见的多选题方式,即一道题目有多个选项,每个选项都可以勾选或者不选。
例1:你在选购电子产品时,会考虑以下哪些因素:A 价格D 保修B 性能E 外观C 质量F 品牌编码:对于这种题型,通常的采用“0-1”编码进行处理,即为每个选项单独设立一个变量,本例可设定a1_1,a1_2到a1_6共6个变量,它们代表从A 、B 到F 共6个备选选项。
如果被试的选择为ABD ,则在a1_1,a1_2和a1_4中输入1,其他变量输入0。
其他学者也提出了用某些函数或编程方法快速实现数据的录入,但最终都要转换为“0-1”编码的形式。
SPSS软件中多项选择题处理方法研究定1
SPSS软件中多项选择题处理方法研究定1D进入多重反应分析过程后,就可以对多项选择题的数据集合的定义。
以上两种方式进入的界面不相同,但定义方式是相同的即直接点击Define Sets按钮。
进入多项选择题变量集的定义过程后,具体定义的步骤如下:第一步:在Variables in Set框是选入需要加入同一个多项选择题变量集的变量系列,这些变量必须进行分类,并按照相同的方式来编码。
若项目2是按多重二分法编码,将Set Definition框中的a1、a2、a3……a7放入Variables in Set 框,在Variables Are Coded As单选框中的选择dichotomies(多重二分法编码方式),在Counted value右侧框中输入1。
若项目2是按多重分类法编码,将Set Definition框中的b1、b2、b3放入Variables in Set框,在Variables Are Coded As 单选框中的选择categories(多重分类法编码方式),则需要设定取值范围,在该范围内的记录值纳入分析。
一般的取值范围是该多项选择题选项的最大和最小代码,因此在range右侧框中输入1,through后输入7。
第二步:定义多重反应分析的变量集的名称并附上名称标签。
在Name框是输入多项选择题变量集的名称,项目2用的是“GCJCYXYS”。
在Lable框是多项选择题变量集定以一个名称标签,项目2用的是“购车决策影响因素”。
第三步:单击Add钮,将定义完成的“变量集”填加到“多选集”( Multiple Response sets)中, 此时变量集名前自动添加了集符号“$" (如: $GCJCYXYS)。
Mult Response Sets框是存放已定义好的多项选择题变量集的列表,在此框中可定义多个,它左侧的三个按钮Add、Change和Remove,分别用于添加、修改和移出变量集的定义。
SPSS学习系列17. 交叉表与多选题
17. 穿插表与多项选择题〔一〕根本理论分类变量包括无序分类变量、有序分类变量、多项选择题变量集。
对于分类变量的描述统计,主要是对分类变量各水平值分别进展频数和比例计算,再进步计算所需的一些相对频数指标。
一、单分类变量的统计描述1. 频数分布分类变量的分析,首先要了解:各类别的样本数〔频数〕,以及占总样本量的百分比;对有序分类变量,还需要了解:累积频数、累积百分比。
2. 集中/离散趋势观察原始频数,或者使用众数。
对于分类变量,集中/离散趋势是一体的。
3. 相对频数指标〔1〕比〔Riatio〕两个有关指标之比A/B, 用来反映相对的大小关系,例如,月销售额/销售人数;〔2〕构成比用于描述事物内部各构成局部所占的比重,例如,百分比、累积百分比;〔3〕率〔Rate〕率是具有时间概念或速度、强度意义的指标,表示某个时期内某事件发生的频率或强度,例如速率、频率、费率、发病率等。
二、多分类变量的联合描述列联表。
例如,r×c二维列联表:〔1〕共n个样本;〔2〕按两种属性A、B,属性A有r个水平值:A1, …, A r; 属性B 有c个水平值:B1, …, B c. 属性A=A i,属性B=B j的样本数为n ij.〔3〕n i. = “属性A=A i〞的合计数,n.j = “属性B=B j〞的合计数。
注:多分类变量对应高维列联表。
三、多项选择题的统计描述多项选择题是调查问卷的常见题型,因为多项选择题是答复同一个大问题,所以不能割裂开来单独分析,需要做汇总处理。
1. 应答人数〔Count〕选择各题项的人数,原始频数;2. 应答人数百分比选择该项的人数占总人数的百分比,可以反映该选项在人群中的受欢送程度;3. 应答人次〔Response〕选择各选项的总人次,1个受访者选择2个选项,即2人次;4. 应答次数百分比在做出的所有选择中,选择该项的人次占总人次数的比例。
〔二〕SPSS实现有某调查问卷的数据文件〔局部〕:变量属性:一、单分类变量的描述——频率变量“s4〞表示学历:问题1:描述受访者的学历分布情况【分析】——【描述统计】——【频率】,将“学历〞选入【变量】框,点【确定】得到S4. 学历频率百分比有效百分比累积百分比有效初中/技校或以下154 高中/中专313 大专331 本科292 硕士或以上57 合计1147注:详细操作见第15篇?频率图表?。
如何用spss软件分析多项选择题
要做问卷调查分析,涉及多项选择题,怎样用spss进行分析?现在弄出来的的只是单个选项的分析,怎样可以对整个题目进行分析哦?知道的说下
满意答案
随遇而安 7级 2009-06-11
简单的说,每个答案设置成一个变量,变量值设为0和1,1表示这个答案被选中,0表示没有被选中。
处理的话,可用analyze—multiple response来做。
评论(0)00
其他回答(3)
热心问友 2009-06-09
发
评论(0)00
皇室电脑 5级 2009-06-13
Hale Waihona Puke 最佳答案 如下步骤:启动SPSS中,点File菜单,点New,选择Syntax,出现一个空白的格式文件。复制你上述命令,然后用鼠标选择上述命令,点击“Run"菜单。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
17. 交叉表与多选题(一)基本理论分类变量包括无序分类变量、有序分类变量、多选题变量集。
对于分类变量的描述统计,主要是对分类变量各水平值分别进行频数和比例计算,再进步计算所需的一些相对频数指标。
一、单分类变量的统计描述1. 频数分布分类变量的分析,首先要了解:各类别的样本数(频数),以及占总样本量的百分比;对有序分类变量,还需要了解:累积频数、累积百分比。
2. 集中/离散趋势观察原始频数,或者使用众数。
对于分类变量,集中/离散趋势是一体的。
3. 相对频数指标(1)比(Riatio)两个有关指标之比A/B, 用来反映相对的大小关系,例如,月销售额/销售人数;(2)构成比用于描述事物内部各构成部分所占的比重,例如,百分比、累积百分比;(3)率(Rate)率是具有时间概念或速度、强度意义的指标,表示某个时期内某事件发生的频率或强度,例如速率、频率、费率、发病率等。
二、多分类变量的联合描述列联表。
例如,r×c二维列联表:(1)共n个样本;(2)按两种属性A、B,属性A有r个水平值:A1, …, A r; 属性B 有c个水平值:B1, …, B c. 属性A=A i,属性B=B j的样本数为n ij.(3)n i. = “属性A=A i”的合计数,n.j = “属性B=B j”的合计数。
注:多分类变量对应高维列联表。
三、多选题的统计描述多选题是调查问卷的常见题型,因为多选题是回答同一个大问题,所以不能割裂开来单独分析,需要做汇总处理。
1. 应答人数(Count)选择各题项的人数,原始频数;2. 应答人数百分比选择该项的人数占总人数的百分比,可以反映该选项在人群中的受欢迎程度;3. 应答人次(Response)选择各选项的总人次,1个受访者选择2个选项,即2人次;4. 应答次数百分比在做出的所有选择中,选择该项的人次占总人次数的比例。
(二)SPSS实现有某调查问卷的数据文件(部分):变量属性:一、单分类变量的描述——频率变量“s4”表示学历:问题1:描述受访者的学历分布情况【分析】——【描述统计】——【频率】,将“学历”选入【变量】框,点【确定】得到S4. 学历频率百分比有效百分比累积百分比有效初中/技校或以下154 13.4 13.4 13.4 高中/中专313 27.3 27.3 40.7 大专331 28.9 28.9 69.6 本科292 25.5 25.5 95.0 硕士或以上57 5.0 5.0 100.0 合计1147 100.0 100.0注:详细操作见第15篇《频率图表》。
二、多分类变量的联合描述——交叉表问题2:描述“性别”和“学历”的交叉频数分布1. 【分析】——【描述统计】——【交叉表】,打开“交叉表”窗口,将“性别”选入【行】框,将“学历”选入【列】框,勾选“显示复式条形图”注:若是3个分类变量的三维列联表,将第3个分类变量选入【层1的1】框,通过【下一张】可以设置更多层;2. 【精确】设置计算概率值的方法,保持默认;【统计量】设置计算行/列变量关联性的统计指标和检验方法,保持默认;【格式】【Bootstrap】一般不用设置;3. 点【单元格】,勾选【计数】的“观察值”,勾选【百分比】的“列”,【非整数权重】选默认的“四舍五入单元格计数”;点【继续】回到原窗口,点【确定】得到注:若将变量“城市”选入第1步中的【层1的1】框,则得到三维列联表,S2. 性别* S4. 学历* S0. 城市交叉制表S0. 城市S4. 学历合计初中/技校或以下高中/中专大专本科硕士或以上100北京S2. 性别男计数28 43 59 47 11 188S4. 学历中的 % 47.5% 51.8% 50.9% 46.5% 57.9% 49.7% 女计数31 40 57 54 8 190S4. 学历中的 % 52.5% 48.2% 49.1% 53.5% 42.1% 50.3% 合计计数59 83 116 101 19 378S4. 学历中的 % 100.0% 100.0% 100.0% 100.0% 100.0% 100.0%200上海S2. 性别男计数23 64 54 64 16 221S4. 学历中的 % 48.9% 52.5% 62.1% 59.3% 69.6% 57.1% 女计数24 58 33 44 7 166S4. 学历中的 % 51.1% 47.5% 37.9% 40.7% 30.4% 42.9% 合计计数47 122 87 108 23 387S4. 学历中的 % 100.0% 100.0% 100.0% 100.0% 100.0% 100.0%300广州S2. 性别男计数23 60 78 58 9 228S4. 学历中的 % 47.9% 55.6% 60.9% 69.9% 60.0% 59.7% 女计数25 48 50 25 6 154S4. 学历中的 % 52.1% 44.4% 39.1% 30.1% 40.0% 40.3% 合计计数48 108 128 83 15 382S4. 学历中的 % 100.0% 100.0% 100.0% 100.0% 100.0% 100.0%合计S2. 性别男计数74 167 191 169 36 637S4. 学历中的 % 48.1% 53.4% 57.7% 57.9% 63.2% 55.5% 女计数80 146 140 123 21 510S4. 学历中的 % 51.9% 46.6% 42.3% 42.1% 36.8% 44.5% 合计计数154 313 331 292 57 1147S4. 学历中的 % 100.0% 100.0% 100.0% 100.0% 100.0% 100.0%(三)多选题处理——多重响应一、多选题的编码多选题的编码方式有两种:1. 多重二分法是标准的多选题数据格式,即每个选项各设一个变量,“选中=1”“未选中=0”例如,C0题:请问您的家庭目前有下列还贷支出吗?(1)房贷(2)车贷(3)其他一般消费还贷用变量C0_1、C0_2、C0_3分别代表上述3个选项,取值“1=选中、0=未选中、99=拒答”;注:“99=拒答”后续可作为缺失值,或合并到“0=未选中”。
2. 多重分类法若题项较多限定回答数较少,多重二分法就显得太啰嗦(过多的“未选中”),此时适合用多重分类法:为所有选项设置一套值标签,需要多少个变量取决于限选项数。
例如,Q题:如果你喝酒,主要受哪方面的影响?(限选2项,请按主次程度排出顺序,不喝酒的不用填)(1)家人(2)朋友同学(3)影视剧(4)文学作品(5)网络(6)风俗习惯(7)其他用变量Qa_1、Qa_2分别表示第1影响、第2影响,取值为选项编号,如Qa_1=3, Qa_2=2.二、设定多选题变量集多选题按前文的编码方式录入后只是若干个离散的变量,SPSS 并不知道它们代表一道多选题,这就需要将其设置为多选题变量集(也称为多重响应集),SPSS提供了两种方式:方法1:【分析】——【表】——【多响应集】方法2:【分析】——【多重响应】——【定义变量集】二者操作基本相同,区别在于方法1可以保存定义的信息,方法2关闭数据文件后相应信息将丢失。
下面以方法2为例,有数据文件:多选题变量是c0和a3,其中c0_1, c0_2, c0_3是多重二分法编码;a3a_1, a3a_2是多重分类法编码。
1. 【分析】——【多重响应】——【定义变量集】,打开“定义多重响应集”窗口;2. 将变量“c0_1, c0_2, c0_3”选入【集合中的变量】框;勾选【将变量编码为】的“二分法”,在【计数值】框输入“1”,即指定“1”表示选中;【名称】框输入“C0”,【标签】框输入“家庭每月还贷情况”;点【添加】;3. 将变量“a3a_1, a3a_2”选入【集合中的变量】框;勾选【将变量编码为】的“类别”,在【范围】框输入取值范围:“0”到“150”;【名称】框输入“A3a”,【标签】框输入“家庭经济状况”;点【添加】,得到注意:同一多选题必须采用相同的编码方式和编码值。
三、多选题的频数对前文得到的“多重响应集”C0进行频数分析。
1. 【分析】——【多重响应】——【频率】,打开“多响应频率”窗口,将多响应集“C0”选入【表格】框;【缺失值】处理“在二分集内按照列表顺序排除个案”对应多重二分法多选题,“在类别内按照列表顺序排除个案”对应多重分类法多选题;点【确定】得到在1147受访者中,共有163人选择了至少一个贷款种类。
共199个有效回答(各种贷款种类共被选择199次),其中房贷118次,车贷33次,其他一般消费还贷48次;响应百分比,给出了每类贷款选择次数占总选择数的百分比;个案百分比,给出了选择某类贷款的人数占总人数的百分比,即应答人数百分比,以房贷为例,118/163=72.4%; 最后的122.1%说明163个人平均每人选择了1.221种贷款。
四、多选题的列联表分析若要就多选题对不同人群分别描述,即对多选题变量集合其它分类变量进行交叉表描述。
问题:按“婚姻状况”考察贷款情况1.【分析】——【多重响应】——【交叉表】,打开“多响应交叉表”窗口,将变量“s7婚姻状况”选入【行】框,将【多响应集】“$C0$”选入【列】框;2. 选中【行】框中的“s7(? ?)”,点【定义范围】,打开“定义变量范围”子窗口,根据变量s7的取值范围,【最小值】框输入“1”,【最大】框输入“3”3. 点【继续】回到原窗口,点【选项】打开“选项”子窗口,勾选【单元格百分比】的“行”;注:“百分比基于”可选择是基于“应答人数”还是“应答人次”; “跨响应集匹配变量”当行/列变量均为多重分类法多选题时,可以让结果表格按两个变量集取值一一对应的方式来生成。
点【继续】回到原窗口,点【确定】得到s7*$C0 交叉制表家庭每月还贷情况a总计C0. 请问您的家庭目前有下列还贷支出吗:房贷C0. 请问您的家庭目前有下列还贷支出吗:车贷C0. 请问您的家庭目前有下列还贷支出吗:其他一般消费还贷S7. 婚姻状况已婚计数912330 120s7 内的 % 75.8%19.2%25.0%未婚计数27101742s7 内的 % 64.3%23.8%40.5%离异/分居/丧偶计数11s7 内的 %0.0%0.0%100.0%总计计数1183348 163百分比和总计以响应者为基础。
a. 值为 1 时制表的二分组。
可以发现已婚人群的房贷比例高于未婚人群,而未婚人群的车贷和其他消费还贷比例则均高于已婚人群,但要注意上述结论只是基于163个有贷款的受访者计算的,而不是全部1147个受访者。