五级量表
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三个方面,给不给中间选项(既不满意,也不不满意)的问题。给了,则会有懒惰者,或是不懂装懂者,选这个选项---其实是没有表
明态度。不给,则等于强迫每个人回答,即使有些人真的没有任何好恶,你也迫使他必须给个答复。这方面的论文也很多。
第四,语言的运用。有实验表明,一个五级量表“verysatisfied","somewhatsatisfied","neithersatisfiednordissatisfied","somewhatdissatisfied""verydissatisfied"和另一个五级量表"verysatisfied","somewhatsatisfied","neithersatisfiednornotsatisfied","notverysatisfied""notsatisfiedatall"提问的效果是不同的。区别在于,前一个用了“satisfied"和"dissatisfied"。两个词,一个积极,一个消极。后一种用的是"satisfied"和"notsatisfied",实际上只用了积极的表达。结论是第一种较好(但我忘记这结论是怎么得到了)。我不知道中文里有没有人做相应的实验。有兴趣的不妨试试。
第二个方面是,无论用列表也好,还是刻度也好,分多少组(给多少个点)比较合适。一般如果用文字表述,可以分3组,5组,7组。10组或更多就过于复杂,而且给被访问人造成太大的困难(如果他们需要阅读,记忆和思考得太多,不利于他们准确积极的完成问卷)。我记得有学者通过实验得出结论,认为5组是最好的。其实,分100组或者给100点是没有意义的。一个人说“我满意的程度是63”和另一个人说”我满意的程度是62“,有本质区别吗?你能说第一个人就比第二个更满意?(应该说回答60到69的基本是一样的,甚至75到100的在做结论的时候,都被划分到非常满意的一组去了)况且,不同的人对程度的标准是不同的。是一个比较模糊的概念。也许第二个人比第一个还更满意,但他觉得打个62分已经够高了。我们推想回答者做这道题的思路。应该是先确定态度的积极和消极,然后再在程度上上下衡量一下。非常满意的会往75分以上打,比较满意的一般在75到50之间选一个点。63和62没有区别。可见5到7个分组,甚至10个,足以。
希望大家提提意见,谢谢!
Ashura:
多谢dreamhawk,开了个好话题:)
本来开了这个版之后一直打算写一个话题来大家讨论的,但最近工作实在太忙了。。。呵呵。没有时间细细讲,但一个思路是,消费者的“满意”的态度和“不满意”态度根本就不是一码事。换成统计的话,满意和不满意之间根本不是一个连续的、线性的关系。
解决的办法往往是换成七级量表,或换算成100分制,这样差异会相对比较明显。
感觉被访者非常有选比较满意的倾向,这是真实的吗?在做分析的时候就算换算成百分数往往分值差异也很小,感觉以此为基础分析真的很牵强!
问题是:
1、对于这种类型问题的研究是否有其他更好的方法?
2、这种五级量表统计出的结果信度和效度到底如何?
前几天写过一个研究报告,为某“产品”设计了20余个属性,研究被试的重要性感知
,数据出来以后换算成100分,结果20余个属性基本都在80-85分之间,很多属性只有小数点后的差异,勉强写了个重要性排序。幸亏大家都在用这种方法,客户可能也习惯了,没说什么。但感觉这种分析实在没多大意义,而且还有产生误导的可能。(看了一下统计数据,选择两个否定选项的样本只有2%左右)
FW操作需要一些时间和一些花费(用尺量的话),在我们如此“竞争”激烈的市场研究行业里,很多老板是不愿意多此一举的。
dreamhawk:
CBC,我觉得你所提到的方法其实类似于把五级量表变成七级量表这类变相拉长量表的办法,实际上没有本质差别。而且用尺量可操作性比较差,还不如在不满意与满意之间画条线,标上10个刻度让被访者选。这样更好操作,但仍然是把原来的量表拉长,并没有在根本上解决这个问题。
基本原则之一就是一个道题只解决一个问题。但是由于实践中大家这样问了几十年了,也就这样问下去了。
这种问题,除了列表的方法,一般还有用scale或thermometer的方法。比如“请用下面的10点温度计来表明您对这项政策的支持程度---1表示根本不支持,10表示完全支持”,然后让被访问者从1到10中选一个数字。它假定回答者是把5.5作为中点,以上是积极态度,以下是消极态度。而且,每个点之间的距离要假设是均等的。5与6之间的距离,和8与9之间的距离一样。这种问法实际和五级量表,十级量表没有本质区别。用量表的时候,我们也是假设每组之间的差别是均等的---即使有人认为“极其”与“非常”之间的程度差别,和“非常”与“比较”之间的不等。但实际答卷中,回答者是趋向将他们均等化的。用刻度/温度计的方法引伸出下面这些问卷设计上的问题---
五级量表
关于五级量表的信度和效度问题[转贴]本文章被浏览1060次
dreamhawk:
您对xxx是否满意?
1、非常不满意2、比较不满意3、一般4、比较满意5、非常满意
您对xxx观点是否同意?
1、非常不同意2、比较不同意3、一般4、比较同意5、非常同意
这种类型的题大家都不陌生吧。但感觉统计出结果后基本选择的都是3、4,其次是5,1、2选项基本是浪费。这种题在进行比较时往往差异很小。
个人观点,满意度的数值只有在比较中才有意义。
百岛的高人如果有什么新的思路还希望能拿出来碰撞一下,说不定会有火花:)三克油
huihui:
部分同意做梦的鹰的想法。满意度的数据在比较中才有意义,我们只能指望Respondent提供他们对两种product或attribute的比较,受访者之间的个人差异,使得他们不可能对使得他们产生同一满意度的某个attribute给出相同的分数。而在比较中,这种差异就可以部分地剔除掉。
dreamhawk:
看来这问题大家也都没有什么好办法呀,上周六北大的市场研究演讲会不知是否有人听了,最后一个发言的刘德寰教授就谈了这个问题,而且也有一些探索和发现。但我没拿到ppt资料,百岛的兄弟们谁有的话传上来一份给大家参考吧。
对于满意度是否是线性的问题,我觉得只要是在完全公平的情况下,能起到拉开满意度差距并能更多的避免人的肯定性(中庸)思维影响的改进应该是有意义的。毕竟我们关心的不是最终满意度是70分还是80分,而是自己和竞争队手的比较,以及自己和自己在时间轴上的比较。
最后,关于答题人有选择“非常和比较满意”的倾向。这是对的。在纸笔或网络访问中,答题人还有选择较先看到的选项的倾向。所以,我们往往把消极选项列在前面,积极选项列在后面(从非常不满意开始,到非常满意结束),以减轻这个问题。在电话访问中,一般我们不中和了。
Ashura:
实际上这个问题也就是数据的偏态分布的问题。改进有些来自于测试方法或者量表上的创新,比如,量表将一般到满意之间的评价增加,使得被访者更好的从满意的状态中区分出自己属于哪一个层次,但问题是,即使这样,也很难真正消除偏态的状态。
个人认为非线性的数据理解有助于更好的解决这个问题。传统上,我们在做满意度研究的时候,喜欢把满意度理解成一维的,线性的分布,但是,从kano模型的贡献来看,数据的非线性关系将能更好的解释消费者的满意度状况。
因此,仅仅从现有的模式下进行改进,怕是触不到筋骨的。改变无论是问卷设计,还是统计方法,都是需要的。:)
zyc119:
这些都是基于经典测量理论的,有钱就用项目反应的吧。
apolloson:
现在很多同行其实还是把“满意”和“不满意”当作线性来看的,纯粹是将错就错了。
PS一下:“市场研究之道”人气严重不足啊
现在的问题是仅仅是比较仍然不能完全剔除,有没有其它的方法?
CBC:
告诉你一个比较“高级”的办法做参考:
1.理论上我们需要不间断变量
2.实际上我们要被访者能更直观地回答
于是国外就有了一个办法,
量表是问卷上印的一根根标准长度的直线,被访者拿笔在线的任意位置划一下,表达他的倾向度。然后用问卷扫描仪器自动衡量从左端到划线处的长短,给出精确到0.Xmm的量度,算做打分的分数。
有人提出1-10,十个数字没有中点。那些中立的人没有一个点可以选择;
有人说1还是有“量”的。应该用“0”表示根本不支持,根本不满意,这样的概念;用5作为中点。这样就是一个11点温度计。
有人说1-10都是正数,和“积极”VS“消极”的概念不符,应用-5表示根本不支持,0表示中立,+5表示非常支持。但这样又似乎太复杂---回答人至少要有正负数的基本概念。文盲(和大多数美国人)答不了这道题。
若晨:
我的经验是不要给每个选项一个固定的定义,只给出两端的定义,了然后让消费者在一个范围内(范围可长一些)打分效果好一些。
还有一种方法,就是不设定上限,让被访者打分,然后统i计众数由研究员判断在多少的范围属于某种定义,最后再统计多个定义分别的频数和百分比。
CBC的方法理论上要合理一些,但执行起来肯定问题多多,难度大大的说。
仍然非常感谢你的思路:)
目前有种方法比较好,比如
您认为xx报纸的总体风格更倾向于
严肃--,--,--,--,--,--,--,--活泼
操作时量表两边的词汇必须是反义词,但都不能是贬义词,这样可以比较真实地反映被访者的心理感受。但这种方法适应面太窄,只能有针对性地解决小部分问题。
关于这个问题我考虑挺长时间了,但都没什么好办法,还希望各位大虾共同探讨。
另外,apolloson提到的中国人向来认为60分时及格(中间值),我也很有同感,所以我一直很质疑量表两端是否必须对等。事实是两个否定的选项也的确没什么人选,如果有极个别人选了,只要一问则必然和这个被试的某次不愉快经历有关。那么在某些特定情况下设计不平衡量表是否会更适合呢?但不平衡量表似乎很难找到依据,也很难有科学的有说服力的设计。
[新贴]:
对于这个问题我有一些新的想法不知是否可以试试:
具体操作如下:
把问卷分成两部分,题目完全一样,但涉及到五级量表问题时一半问卷采用否定命题,另一半采用肯定命题。
比如:
一半问卷问:您对“我经常阅读报纸杂志中的广告”这一观点
1、非常不同意2、比较不同意3、一般4、比较同意5、非常同意
另一半问卷问:您对“我很少阅读报纸杂志中的广告”这一观点
SarahZ:
你其实提出了一个很大的问题。国外有很多关于这个问题的论文,但学者们论述的侧重点有所不同。他们大致是从下面几个方面来分析的:
第一个方面是“程度”问题有几种问法。你所列举的这道满意程度问题实际上是将两个问题合在一起问了---第一,问满意还是不满意(YESORNO)。第二,问满意或不满意的程度(VERY,SOMEWHAT)。理论上讲,这是应该分成两道题L来问的。因为调查的
基于kano的模型分析是一个方法,问题在于,因题量较多,问卷长度和研究的深度势必受到影响。另外,也许可能考虑将数据的分段回归。
问卷印刷要注意,问卷上的线长度要跟设计好的长度一样长短;如果没有扫描仪器的话,反正中国劳动力便宜,叫几个访问员用尺子量一下,标出得分即可(精确到mm就可以了)。
缺点:
有些客户习惯了传统的打分题得出的数据,新方式得出数据可能带来偏差,虽然可能新方法更科学更准确,但由于和历史数据比较,没把握说差异是否显著,所以为了求太平,就延用原来的打分方式吧。
1、非常不同意2、比较不同意3、一般4、比较同意5、非常同意
两批问卷样本数要保持一致,在数据录入时第一批问卷按选项付值,第二批问卷相反,选择一的付值为5,选五的付值为1,然后综合在一起进行数据分析。
感觉这样设计后期统计分析也很好操作并能在一定程度上避免被试的肯定性思维影响。由于语句或满意度都由同一被试完成,所以也并不影响各语句或属性间的对比。但相信这样统计出来的数据值会比传统方法低,客户看了会感觉不爽,但个人感觉这样更客观也更适合比较。不知这样操作是否值得一试,还请各位大虾发表意见。
明态度。不给,则等于强迫每个人回答,即使有些人真的没有任何好恶,你也迫使他必须给个答复。这方面的论文也很多。
第四,语言的运用。有实验表明,一个五级量表“verysatisfied","somewhatsatisfied","neithersatisfiednordissatisfied","somewhatdissatisfied""verydissatisfied"和另一个五级量表"verysatisfied","somewhatsatisfied","neithersatisfiednornotsatisfied","notverysatisfied""notsatisfiedatall"提问的效果是不同的。区别在于,前一个用了“satisfied"和"dissatisfied"。两个词,一个积极,一个消极。后一种用的是"satisfied"和"notsatisfied",实际上只用了积极的表达。结论是第一种较好(但我忘记这结论是怎么得到了)。我不知道中文里有没有人做相应的实验。有兴趣的不妨试试。
第二个方面是,无论用列表也好,还是刻度也好,分多少组(给多少个点)比较合适。一般如果用文字表述,可以分3组,5组,7组。10组或更多就过于复杂,而且给被访问人造成太大的困难(如果他们需要阅读,记忆和思考得太多,不利于他们准确积极的完成问卷)。我记得有学者通过实验得出结论,认为5组是最好的。其实,分100组或者给100点是没有意义的。一个人说“我满意的程度是63”和另一个人说”我满意的程度是62“,有本质区别吗?你能说第一个人就比第二个更满意?(应该说回答60到69的基本是一样的,甚至75到100的在做结论的时候,都被划分到非常满意的一组去了)况且,不同的人对程度的标准是不同的。是一个比较模糊的概念。也许第二个人比第一个还更满意,但他觉得打个62分已经够高了。我们推想回答者做这道题的思路。应该是先确定态度的积极和消极,然后再在程度上上下衡量一下。非常满意的会往75分以上打,比较满意的一般在75到50之间选一个点。63和62没有区别。可见5到7个分组,甚至10个,足以。
希望大家提提意见,谢谢!
Ashura:
多谢dreamhawk,开了个好话题:)
本来开了这个版之后一直打算写一个话题来大家讨论的,但最近工作实在太忙了。。。呵呵。没有时间细细讲,但一个思路是,消费者的“满意”的态度和“不满意”态度根本就不是一码事。换成统计的话,满意和不满意之间根本不是一个连续的、线性的关系。
解决的办法往往是换成七级量表,或换算成100分制,这样差异会相对比较明显。
感觉被访者非常有选比较满意的倾向,这是真实的吗?在做分析的时候就算换算成百分数往往分值差异也很小,感觉以此为基础分析真的很牵强!
问题是:
1、对于这种类型问题的研究是否有其他更好的方法?
2、这种五级量表统计出的结果信度和效度到底如何?
前几天写过一个研究报告,为某“产品”设计了20余个属性,研究被试的重要性感知
,数据出来以后换算成100分,结果20余个属性基本都在80-85分之间,很多属性只有小数点后的差异,勉强写了个重要性排序。幸亏大家都在用这种方法,客户可能也习惯了,没说什么。但感觉这种分析实在没多大意义,而且还有产生误导的可能。(看了一下统计数据,选择两个否定选项的样本只有2%左右)
FW操作需要一些时间和一些花费(用尺量的话),在我们如此“竞争”激烈的市场研究行业里,很多老板是不愿意多此一举的。
dreamhawk:
CBC,我觉得你所提到的方法其实类似于把五级量表变成七级量表这类变相拉长量表的办法,实际上没有本质差别。而且用尺量可操作性比较差,还不如在不满意与满意之间画条线,标上10个刻度让被访者选。这样更好操作,但仍然是把原来的量表拉长,并没有在根本上解决这个问题。
基本原则之一就是一个道题只解决一个问题。但是由于实践中大家这样问了几十年了,也就这样问下去了。
这种问题,除了列表的方法,一般还有用scale或thermometer的方法。比如“请用下面的10点温度计来表明您对这项政策的支持程度---1表示根本不支持,10表示完全支持”,然后让被访问者从1到10中选一个数字。它假定回答者是把5.5作为中点,以上是积极态度,以下是消极态度。而且,每个点之间的距离要假设是均等的。5与6之间的距离,和8与9之间的距离一样。这种问法实际和五级量表,十级量表没有本质区别。用量表的时候,我们也是假设每组之间的差别是均等的---即使有人认为“极其”与“非常”之间的程度差别,和“非常”与“比较”之间的不等。但实际答卷中,回答者是趋向将他们均等化的。用刻度/温度计的方法引伸出下面这些问卷设计上的问题---
五级量表
关于五级量表的信度和效度问题[转贴]本文章被浏览1060次
dreamhawk:
您对xxx是否满意?
1、非常不满意2、比较不满意3、一般4、比较满意5、非常满意
您对xxx观点是否同意?
1、非常不同意2、比较不同意3、一般4、比较同意5、非常同意
这种类型的题大家都不陌生吧。但感觉统计出结果后基本选择的都是3、4,其次是5,1、2选项基本是浪费。这种题在进行比较时往往差异很小。
个人观点,满意度的数值只有在比较中才有意义。
百岛的高人如果有什么新的思路还希望能拿出来碰撞一下,说不定会有火花:)三克油
huihui:
部分同意做梦的鹰的想法。满意度的数据在比较中才有意义,我们只能指望Respondent提供他们对两种product或attribute的比较,受访者之间的个人差异,使得他们不可能对使得他们产生同一满意度的某个attribute给出相同的分数。而在比较中,这种差异就可以部分地剔除掉。
dreamhawk:
看来这问题大家也都没有什么好办法呀,上周六北大的市场研究演讲会不知是否有人听了,最后一个发言的刘德寰教授就谈了这个问题,而且也有一些探索和发现。但我没拿到ppt资料,百岛的兄弟们谁有的话传上来一份给大家参考吧。
对于满意度是否是线性的问题,我觉得只要是在完全公平的情况下,能起到拉开满意度差距并能更多的避免人的肯定性(中庸)思维影响的改进应该是有意义的。毕竟我们关心的不是最终满意度是70分还是80分,而是自己和竞争队手的比较,以及自己和自己在时间轴上的比较。
最后,关于答题人有选择“非常和比较满意”的倾向。这是对的。在纸笔或网络访问中,答题人还有选择较先看到的选项的倾向。所以,我们往往把消极选项列在前面,积极选项列在后面(从非常不满意开始,到非常满意结束),以减轻这个问题。在电话访问中,一般我们不中和了。
Ashura:
实际上这个问题也就是数据的偏态分布的问题。改进有些来自于测试方法或者量表上的创新,比如,量表将一般到满意之间的评价增加,使得被访者更好的从满意的状态中区分出自己属于哪一个层次,但问题是,即使这样,也很难真正消除偏态的状态。
个人认为非线性的数据理解有助于更好的解决这个问题。传统上,我们在做满意度研究的时候,喜欢把满意度理解成一维的,线性的分布,但是,从kano模型的贡献来看,数据的非线性关系将能更好的解释消费者的满意度状况。
因此,仅仅从现有的模式下进行改进,怕是触不到筋骨的。改变无论是问卷设计,还是统计方法,都是需要的。:)
zyc119:
这些都是基于经典测量理论的,有钱就用项目反应的吧。
apolloson:
现在很多同行其实还是把“满意”和“不满意”当作线性来看的,纯粹是将错就错了。
PS一下:“市场研究之道”人气严重不足啊
现在的问题是仅仅是比较仍然不能完全剔除,有没有其它的方法?
CBC:
告诉你一个比较“高级”的办法做参考:
1.理论上我们需要不间断变量
2.实际上我们要被访者能更直观地回答
于是国外就有了一个办法,
量表是问卷上印的一根根标准长度的直线,被访者拿笔在线的任意位置划一下,表达他的倾向度。然后用问卷扫描仪器自动衡量从左端到划线处的长短,给出精确到0.Xmm的量度,算做打分的分数。
有人提出1-10,十个数字没有中点。那些中立的人没有一个点可以选择;
有人说1还是有“量”的。应该用“0”表示根本不支持,根本不满意,这样的概念;用5作为中点。这样就是一个11点温度计。
有人说1-10都是正数,和“积极”VS“消极”的概念不符,应用-5表示根本不支持,0表示中立,+5表示非常支持。但这样又似乎太复杂---回答人至少要有正负数的基本概念。文盲(和大多数美国人)答不了这道题。
若晨:
我的经验是不要给每个选项一个固定的定义,只给出两端的定义,了然后让消费者在一个范围内(范围可长一些)打分效果好一些。
还有一种方法,就是不设定上限,让被访者打分,然后统i计众数由研究员判断在多少的范围属于某种定义,最后再统计多个定义分别的频数和百分比。
CBC的方法理论上要合理一些,但执行起来肯定问题多多,难度大大的说。
仍然非常感谢你的思路:)
目前有种方法比较好,比如
您认为xx报纸的总体风格更倾向于
严肃--,--,--,--,--,--,--,--活泼
操作时量表两边的词汇必须是反义词,但都不能是贬义词,这样可以比较真实地反映被访者的心理感受。但这种方法适应面太窄,只能有针对性地解决小部分问题。
关于这个问题我考虑挺长时间了,但都没什么好办法,还希望各位大虾共同探讨。
另外,apolloson提到的中国人向来认为60分时及格(中间值),我也很有同感,所以我一直很质疑量表两端是否必须对等。事实是两个否定的选项也的确没什么人选,如果有极个别人选了,只要一问则必然和这个被试的某次不愉快经历有关。那么在某些特定情况下设计不平衡量表是否会更适合呢?但不平衡量表似乎很难找到依据,也很难有科学的有说服力的设计。
[新贴]:
对于这个问题我有一些新的想法不知是否可以试试:
具体操作如下:
把问卷分成两部分,题目完全一样,但涉及到五级量表问题时一半问卷采用否定命题,另一半采用肯定命题。
比如:
一半问卷问:您对“我经常阅读报纸杂志中的广告”这一观点
1、非常不同意2、比较不同意3、一般4、比较同意5、非常同意
另一半问卷问:您对“我很少阅读报纸杂志中的广告”这一观点
SarahZ:
你其实提出了一个很大的问题。国外有很多关于这个问题的论文,但学者们论述的侧重点有所不同。他们大致是从下面几个方面来分析的:
第一个方面是“程度”问题有几种问法。你所列举的这道满意程度问题实际上是将两个问题合在一起问了---第一,问满意还是不满意(YESORNO)。第二,问满意或不满意的程度(VERY,SOMEWHAT)。理论上讲,这是应该分成两道题L来问的。因为调查的
基于kano的模型分析是一个方法,问题在于,因题量较多,问卷长度和研究的深度势必受到影响。另外,也许可能考虑将数据的分段回归。
问卷印刷要注意,问卷上的线长度要跟设计好的长度一样长短;如果没有扫描仪器的话,反正中国劳动力便宜,叫几个访问员用尺子量一下,标出得分即可(精确到mm就可以了)。
缺点:
有些客户习惯了传统的打分题得出的数据,新方式得出数据可能带来偏差,虽然可能新方法更科学更准确,但由于和历史数据比较,没把握说差异是否显著,所以为了求太平,就延用原来的打分方式吧。
1、非常不同意2、比较不同意3、一般4、比较同意5、非常同意
两批问卷样本数要保持一致,在数据录入时第一批问卷按选项付值,第二批问卷相反,选择一的付值为5,选五的付值为1,然后综合在一起进行数据分析。
感觉这样设计后期统计分析也很好操作并能在一定程度上避免被试的肯定性思维影响。由于语句或满意度都由同一被试完成,所以也并不影响各语句或属性间的对比。但相信这样统计出来的数据值会比传统方法低,客户看了会感觉不爽,但个人感觉这样更客观也更适合比较。不知这样操作是否值得一试,还请各位大虾发表意见。