第十一章 多维标度法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.计算初步图形结构中各点之间的距离
为叙述方便,有时我们将A,B,C三种品牌分 别称为第一、第二、第三品牌。 用欧氏距离公式计算A品牌和B品牌(第一品牌 和第二品牌)的距离
d12 ( 10 1 ) (5 - 5) 9
2 2
同样计算d13,d23,并将它们排成矩阵形式 (dii=dii),这个矩阵称为初步图形结构的距离矩 阵,如表3所示。
例1 设一群消费者对A,B,C三种品牌的药物 牙膏的相似程度的评定次序列于下表中,其中 1表示两种品牌最相似,3表示两种品牌最不相 似(差异最大)。从表中可知,A牌和B牌牙膏最 相似,C牌和B牌的相似次之,A牌和C牌相似 性最差。我们将表1称为三种牙膏的相似次序 矩阵。
A牌 B牌 1 B牌 3 2 C牌 各种品牌的相似次序矩阵是多维标度法的输入 资料。在第四节中我们将介绍几种建立相似次 序矩阵的方法。
下面我们来介绍克鲁斯克系数的含义。
用dij表示初步图形结构中i品牌和j品牌间的 距离,如果用所有dij确定的相似次序和原 始相似次序矩阵的次序不一致,就要将dij 进行逐步调整,使得调整后i品牌和j品牌间 的距离đij确定的相似次序和原始次序完全 一致,调整过程参见表4。
表4的第一,二列由表1得出。第三列为初步图形结构中和第 二列对应的品牌间的距离。第四列中列出了dij调整为đij的 过程。表中第三列的第二个距离大于第一个距离,与原始次 序一致,可不必调整。但第三列的第三个距离则比较第二个 距离小,与原始次序不一致,故需作调整。调整的方法是将 它们求平均,得13.5。这个平均值大于第一个距离值9,故 可用它作为新的第二、三个距离。得到第三次调整值đij,如 表中第6列所示。这时,调整值的次序9<13.5≤13.5与原始 次序已完全一致,无须再作调整了。而若仍不一致,则应继 续调整,直至调整后的đij的次序与原始次序完全一致为止。
第十一章
多维标度法
(Multidimensional Scaling)
第一节 引
言
第一节 引
言
多维标度法(MDS)是著名计量心理学家谢泼 德(Shephard)和克鲁斯克 (Kruskal)分别于 1962年和1964年发展起来的一种计量心理学 技术。 多维标度法现在已经广泛应用于心理学、市 场调查、社会学、物理学、政治科学以及生 物学等领域的数据分析方法。
图5
3.多维标度法的结果是试探性的,而不 是结论性的
在例1中,我们将x坐标命名为疗效(数值越 大疗效越高),而将y坐标命名为价格(数值 越大,价格越低)。 用多维标度法得出的图形结构,其坐标反 映品牌的什么特性,是由市场研究者凭经 验估计出来的,因此不能把它作为市场的 一个最后模型,而应把它作为一个待检验 的假设,再用其他方法加以验证。
对于例1,利用表4可以算出克鲁斯克系数S如下:
如选用S=0.025作为判别图形结构是否 需要修改的临界值,现因S=0.1,故需要对 初步图形结构进行修改。
4.修改初始图形结构,得出一个新图形结构
若S大于事前所规定的临界值,则要移动初始图 形结构中各点的位置,使得点际间之距离次序较 前一图形结构的距离次序更接近初始输入资料的 次序。用(x,y)表示品牌i的旧坐标,(x’i,y’i)表示 品牌i的新坐标,它们的关系如下:
克鲁斯克系数定义如下:
其中n为品牌数,dij为初步图形结构中i品牌与j品 牌间的距离,đij为调整后i品牌与j品牌间的距离。
若一图形结构有
这时克鲁斯克系数的分子为0,S=0,表示该图形结构十 分理想,不需要再修改。 用克鲁斯克系数检验某一图形结构是否与原始资料次序配 合良好,可用表5。
表3
品牌 A B C
A B C
0 9 12
9 0 15
12 15 0
3.检验初步图形结构是否需要修改
如果初步图形结构的距离矩阵所确定的相 似次序(距离越小越相似)与原始相似次序矩 阵的次序完全一致,则认为初步图形结构 在所选定维数(本例是二维)空间中是最有代 表性的。 但一般来说,两者次序是很难一致的,这 时要通过“克鲁斯克”系数来检验初步图 形是否需要修改。
第三节 几点说明
上一节中,我们介绍了多维标度法的原理 和计算的大致步骤,本节我们讨论使用多 维标度法时值得注意的几个问题。
1.坐标空间维数的确定
多维标度法中要求代表品牌的点,其点间 距离的次序能完全反映品牌间原始输入的 相似次序。理论上已经证明,如果有n个不 同的品牌,那么用n-1维空间的点来表示品 牌,就能做到这点。然而用这样高维的空 间的点来代表品牌,那就使多维标度法失 去形象直观的特点。为此,实用上我们通 常分别用二,三,四维空间的点去试算, 从中选出“最好”的空间。
广义的MDS可以将聚类分析和对应分析 (Correspondence Analysis)也包括进来。 根据它所利用的信息来看,多维标度法 可以分为两大类: 一类称为非度量的MDS(nonmetric MDS); 另一类为量度的MDS(metric MDS)。 前者使用了研究对象间距离(或相似度) 的排序信息,而后者用的是实际上的数 量指标。
所谓“最好”可以有两种标准。一种是规 定克鲁斯克系数的一个临界值,当一个图 形结构的克鲁斯克系数小于这个临界值, 就认为好。如果二维空间图形结构达不到 好的标准,就用三维空间图形结构,余此 类推。 另一种途径是分别对二,三,四,……维 空间图形结构求出其最小的克鲁斯克系数, 然后用空间维数作为横坐标,对应的克鲁 斯克系数作为纵坐标,在坐标系中描图(例 如下图4)。
一、配对比较法
二、配对评分法
研究者预先设计好一个八点双极评分表,并将n 种品牌每两种配成一对,共有
三、诱导法
研究者先找出品牌的某些特性,然后将每 一种特性配成一双极评分表。例如对牙膏 来说,可用下列特性:
在调查时,应答者对每一特性,给各种品 牌进行评分。例如:对于预防腐烂,洁银 牙膏的评分为6,田七牙膏的评分为5;对 于牙齿变白,洁银牙膏的评分为5,田七牙 膏的评分为6。根据每种品牌在各特性上的 评分,可以同各种品牌在应答者心目中的 距离。计算公式如下:
第一节 引
言
第一节 引
言
1970---1972年格林(Green) 将多维标度法应用于 市场研究方面,主要研究消费者的态度,衡量消 费者的感觉和偏好。 运用多维标度法将消费者对各种品牌产品的偏好 和感觉资料,变换成空间坐标图。 用坐标图中的点代表各种品牌; 各点之间的距离则表示各种品牌在消费者心目中 的相似或差异程度; 各点到坐标的距离则表示消费者对某一品牌、某 种特性的评价。 这种方法将消费者对各种品牌之间的相似或差异 程度的评价,用距离及图形表示出来,因此具有 形象直观的特点
对于图4的情形,空间维数从…一增至二,或 增至三,克鲁斯克系数均有较大 的下降,而从三 维到四维或四维到五维,克鲁斯克系数变化不大, 故可取三维空间来构图。
2.多维标度法不能确定图形结构的绝对位置 必须注意用多维标度法构造出的图形结构, 只能确定各种品牌之间的相对位置, 但 其绝对位置则不能完全确定。例如,在图5 中各种图形结构都是等价的,都可以作为 多维标度法的结果。
第二节
多维标度法的原理和计算步骤
在聚类分析中,对于给定坐标的一组点群, 我们很容易计算它们两两之间的距离 或相 似系数(如同火车站的里程表或运价表)。 多维标度法可以说是上述问题的逆问题, 即给定样品两两之间的距离或相似度的排 序,反求各样品点的坐标。 下面通过一个具体例子说明多维标度法的 原理和计算步骤。
4.结果依赖于品牌的选择
用多维标度法得出的图形结构,其空间的 维数与所研究的品牌有关。如果研究者遗 留了某些重要的品牌,则某些关键的坐标 就不会在结果中出现。另一方面,如果竞 争的品牌收集过多,则会使空间维数大大 增加,使结果失去直观形象。
第四节 收集资料的方法
多维标度法与其他方法不同,其输入资料 是各种品牌之间的相似或差异资料。这类 资料的收集方法很多,而每种方法对于调 查问卷的设计和资料的处理,都有不同程 度的影响。 本节将介绍以下几种方法
其中a(0<a<1)是比例系数,n为品牌个数。(如 果初始图形结构在r维坐标空间上建立,则应有r 组公式,其表达式和(2)式类似)。
前例中,若取a=0.618,那么
A牌牙膏的新x坐标为:
由上得出第一次修改后的新图形结构列于 表6中
重复第二至第四步,直至克鲁斯克系数S达 到预先规定的数值。经过22次重复计算后, S降至0.02,得到的最后图形结构列于表7, 其图形见图3。
这里的输入资料是消费者对各种品牌产品 之间的相似或差异程度的评价,其输出则 是与品牌有关的特性以及各种品牌在各特 性中的位置。 因此,多维标度法是用间接方法推断出品 牌有关的特性。 在许多情形中,我们可能不知道那些特性 与品牌有关,或者应答者不能够或不愿意 准确地回答,这时必须采用间接推断的方 法。
第一节 引
言
多维标度法是基于研究对象之间的相似性,将研 究对象在一个低维的(一般小于等于二维)的空间 形象地表示出来,进行聚类或维度内含分析的 一种图示法。 说得详细一点,MDS是这样一种方法:在N个物 品中已知它们的相似度(或距离),要寻找一个低 维空间表示,使物品间的亲近(proximity)关系能 和原来的相似度有一个近似的匹配。 这个匹配的数量近似,可以用一个称为克鲁斯 克系数“Stress‘’的指标来表达。
其中r表示特性数日,dij表示品牌i和品牌j的距离, xik表示品牌i在特性k上的评分,xjk表示品牌j在特 性k上的评分。 将所有品牌的两两距离计算出来,便可列出距离 矩阵,例如,有A,B,C三种品牌,则其距离矩 阵为:
四、主观分组法
当品牌的数目太多时,应用前面的三种方 法,需要应答者回答的内容太多,容易 引起应答者不耐烦。为了解决这个问题, 可以采取主观分组法,它可分为:固定组 数分组法和变动组数分组法。
图3中的A,B,C三点 代表A,B,C三种牙膏 在消费者心目中的位置。 A牌和B牌牙膏的疗效较 好,但价格偏高。 C牌牙膏的价格低廉, 但疗效不理想。 若图中有一消费者心目 中理想的品牌位置I,那 么我们可以将现有A,B, C品牌与理想品 牌的差 异,提供给生产者在生 产时加以考虑,以便使 现有的产品更接近理想 产品。
1.构造初步图形结构
例1中,我们构造一个二维坐标空间,A,B,C 三种牙膏在该坐标空间中分别用A,B,C点表 示(见图1),其坐标列于表2中。
牙膏品牌 A牌 B牌 C牌 x坐标 10 1 10 y坐标 5 5 17
15
10
5
5
10
15
构造初步图形结构中的 第一个问题是选择多少维坐标空间的点来表示各品牌产 品,这个问题我们将在第三节中详细讨论。 第二个问题是如何确定不同品牌的产品在坐标空间中的 坐标。原则上我们可以随机地用任意不同点代表不同品 牌,但这样做会大大增加逐步修改初步图形结构的工作 量。 一种可行的方法是将表1进行因子分析,选择和坐标维 数相同的公共因子数,将各品牌的因子载荷值分别作为 它的坐标。 我们用这种方法对例1确定出不同品牌的产品在所选坐 标空间中的坐标。由于该初步图形结构的点间距离已和 原始输入次序相同,因此不用再修改初步图形结构。 为了说明修改初步图形结构的步骤和方法,表1中我们 用航海三角测量技术来给出初步图形结构。
多维标度法的基本思想:
用r维空间(r待定)中的点分别表示各样品,使得各 样品间距离的次序能完全反映原始输入的相似次 序(两样品间的距离越短,则越相似)。通常,要 通过两步来完成。 首先构造一个r维坐标空间,并用该空间中的点分 别表示各样品,此时点间的距离未必和原始输入 次序相同,通常把这一步称为构造初步图形结构。 其次是逐步修改初步图形结构,以得到一个新图 形结构,使得在新结构中,各样品的点间距离次 序和原始输入次序尽量一致。 下面我们将通过例1来具体说明其构造步骤。