第十一章 多维标度法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对于例1,利用表4可以算出克鲁斯克系数S如下:
如选用S=0.025作为判别图形结构是否 需要修改的临界值,现因S=0.1,故需要对 初步图形结构进行修改。
4.修改初始图形结构,得出一个新图形结构
若S大于事前所规定的临界值,则要移动初始图 形结构中各点的位置,使得点际间之距离次序较 前一图形结构的距离次序更接近初始输入资料的 次序。用(x,y)表示品牌i的旧坐标,(x’i,y’i)表示 品牌i的新坐标,它们的关系如下:
图5
3.多维标度法的结果是试探性的,而不 是结论性的
在例1中,我们将x坐标命名为疗效(数值越 大疗效越高),而将y坐标命名为价格(数值 越大,价格越低)。 用多维标度法得出的图形结构,其坐标反 映品牌的什么特性,是由市场研究者凭经 验估计出来的,因此不能把它作为市场的 一个最后模型,而应把它作为一个待检验 的假设,再用其他方法加以验证。
其中r表示特性数日,dij表示品牌i和品牌j的距离, xik表示品牌i在特性k上的评分,xjk表示品牌j在特 性k上的评分。 将所有品牌的两两距离计算出来,便可列出距离 矩阵,例如,有A,B,C三种品牌,则其距离矩 阵为:
四、主观分组法
当品牌的数目太多时,应用前面的三种方 法,需要应答者回答的内容太多,容易 引起应答者不耐烦。为了解决这个问题, 可以采取主观分组法,它可分为:固定组 数分组法和变动组数分组法。
所谓“最好”可以有两种标准。一种是规 定克鲁斯克系数的一个临界值,当一个图 形结构的克鲁斯克系数小于这个临界值, 就认为好。如果二维空间图形结构达不到 好的标准,就用三维空间图形结构,余此 类推。 另一种途径是分别对二,三,四,……维 空间图形结构求出其最小的克鲁斯克系数, 然后用空间维数作为横坐标,对应的克鲁 斯克系数作为纵坐标,在坐标系中描图(例 如下图4)。
例1 设一群消费者对A,B,C三种品牌的药物 牙膏的相似程度的评定次序列于下表中,其中 1表示两种品牌最相似,3表示两种品牌最不相 似(差异最大)。从表中可知,A牌和B牌牙膏最 相似,C牌和B牌的相似次之,A牌和C牌相似 性最差。我们将表1称为三种牙膏的相似次序 矩阵。
A牌 B牌 1 B牌 3 2 C牌 各种品牌的相似次序矩阵是多维标度法的输入 资料。在第四节中我们将介绍几种建立相似次 序矩阵的方法。
第一节 引
言
多维标度法是基于研究对象之间的相似性,将研 究对象在一个低维的(一般小于等于二维)的空间 形象地表示出来,进行聚类或维度内含分析的 一种图示法。 说得详细一点,MDS是这样一种方法:在N个物 品中已知它们的相似度(或距离),要寻找一个低 维空间表示,使物品间的亲近(proximity)关系能 和原来的相似度有一个近似的匹配。 这个匹配的数量近似,可以用一个称为克鲁斯 克系数“Stress‘’的指标来表达。
第二节
多维标度法的原理和计算步骤
在聚类分析中,对于给定坐标的一组点群, 我们很容易计算它们两两之间的距离 或相 似系数(如同火车站的里程表或运价表)。 多维标度法可以说是上述问题的逆问题, 即给定样品两两之间的距离或相似度的排 序,反求各样品点的坐标。 下面通过一个具体例子说明多维标度法的 原理和计算步骤。
2.计算初步图形结构中各点之间的距离
为叙述方便,有时我们将A,B,C三种品牌分 别称为第一、第二、第三品牌。 用欧氏距离公式计算A品牌和B品牌(第一品牌 和第二品牌)的距离
d12 ( 10 1 ) (5 - 5) 9
2 2
同样计算d13,d23,并将它们排成矩阵形式 (dii=dii),这个矩阵称为初步图形结构的距离矩 阵,如表3所示。
多维标度法的基本思想:
用r维空间(r待定)中的点分别表示各样品,使得各 样品间距离的次序能完全反映原始输入的相似次 序(两样品间的距离越短,则越相似)。通常,要 通过两步来完成。 首先构造一个r维坐标空间,并用该空间中的点分 别表示各样品,此时点间的距离未必和原始输入 次序相同,通常把这一步称为构造初步图形结构。 其次是逐步修改初步图形结构,以得到一个新图 形结构,使得在新结构中,各样品的点间距离次 序和原始输入次序尽量一致。 下面我们将通过例1来具体说明其构造步骤。
第一节 引
ຫໍສະໝຸດ Baidu
言
第一节 引
言
1970---1972年格林(Green) 将多维标度法应用于 市场研究方面,主要研究消费者的态度,衡量消 费者的感觉和偏好。 运用多维标度法将消费者对各种品牌产品的偏好 和感觉资料,变换成空间坐标图。 用坐标图中的点代表各种品牌; 各点之间的距离则表示各种品牌在消费者心目中 的相似或差异程度; 各点到坐标的距离则表示消费者对某一品牌、某 种特性的评价。 这种方法将消费者对各种品牌之间的相似或差异 程度的评价,用距离及图形表示出来,因此具有 形象直观的特点
其中a(0<a<1)是比例系数,n为品牌个数。(如 果初始图形结构在r维坐标空间上建立,则应有r 组公式,其表达式和(2)式类似)。
前例中,若取a=0.618,那么
A牌牙膏的新x坐标为:
由上得出第一次修改后的新图形结构列于 表6中
重复第二至第四步,直至克鲁斯克系数S达 到预先规定的数值。经过22次重复计算后, S降至0.02,得到的最后图形结构列于表7, 其图形见图3。
第三节 几点说明
上一节中,我们介绍了多维标度法的原理 和计算的大致步骤,本节我们讨论使用多 维标度法时值得注意的几个问题。
1.坐标空间维数的确定
多维标度法中要求代表品牌的点,其点间 距离的次序能完全反映品牌间原始输入的 相似次序。理论上已经证明,如果有n个不 同的品牌,那么用n-1维空间的点来表示品 牌,就能做到这点。然而用这样高维的空 间的点来代表品牌,那就使多维标度法失 去形象直观的特点。为此,实用上我们通 常分别用二,三,四维空间的点去试算, 从中选出“最好”的空间。
广义的MDS可以将聚类分析和对应分析 (Correspondence Analysis)也包括进来。 根据它所利用的信息来看,多维标度法 可以分为两大类: 一类称为非度量的MDS(nonmetric MDS); 另一类为量度的MDS(metric MDS)。 前者使用了研究对象间距离(或相似度) 的排序信息,而后者用的是实际上的数 量指标。
这里的输入资料是消费者对各种品牌产品 之间的相似或差异程度的评价,其输出则 是与品牌有关的特性以及各种品牌在各特 性中的位置。 因此,多维标度法是用间接方法推断出品 牌有关的特性。 在许多情形中,我们可能不知道那些特性 与品牌有关,或者应答者不能够或不愿意 准确地回答,这时必须采用间接推断的方 法。
4.结果依赖于品牌的选择
用多维标度法得出的图形结构,其空间的 维数与所研究的品牌有关。如果研究者遗 留了某些重要的品牌,则某些关键的坐标 就不会在结果中出现。另一方面,如果竞 争的品牌收集过多,则会使空间维数大大 增加,使结果失去直观形象。
第四节 收集资料的方法
多维标度法与其他方法不同,其输入资料 是各种品牌之间的相似或差异资料。这类 资料的收集方法很多,而每种方法对于调 查问卷的设计和资料的处理,都有不同程 度的影响。 本节将介绍以下几种方法
图3中的A,B,C三点 代表A,B,C三种牙膏 在消费者心目中的位置。 A牌和B牌牙膏的疗效较 好,但价格偏高。 C牌牙膏的价格低廉, 但疗效不理想。 若图中有一消费者心目 中理想的品牌位置I,那 么我们可以将现有A,B, C品牌与理想品 牌的差 异,提供给生产者在生 产时加以考虑,以便使 现有的产品更接近理想 产品。
下面我们来介绍克鲁斯克系数的含义。
用dij表示初步图形结构中i品牌和j品牌间的 距离,如果用所有dij确定的相似次序和原 始相似次序矩阵的次序不一致,就要将dij 进行逐步调整,使得调整后i品牌和j品牌间 的距离đij确定的相似次序和原始次序完全 一致,调整过程参见表4。
表4的第一,二列由表1得出。第三列为初步图形结构中和第 二列对应的品牌间的距离。第四列中列出了dij调整为đij的 过程。表中第三列的第二个距离大于第一个距离,与原始次 序一致,可不必调整。但第三列的第三个距离则比较第二个 距离小,与原始次序不一致,故需作调整。调整的方法是将 它们求平均,得13.5。这个平均值大于第一个距离值9,故 可用它作为新的第二、三个距离。得到第三次调整值đij,如 表中第6列所示。这时,调整值的次序9<13.5≤13.5与原始 次序已完全一致,无须再作调整了。而若仍不一致,则应继 续调整,直至调整后的đij的次序与原始次序完全一致为止。
1.构造初步图形结构
例1中,我们构造一个二维坐标空间,A,B,C 三种牙膏在该坐标空间中分别用A,B,C点表 示(见图1),其坐标列于表2中。
牙膏品牌 A牌 B牌 C牌 x坐标 10 1 10 y坐标 5 5 17
15
10
5
5
10
15
构造初步图形结构中的 第一个问题是选择多少维坐标空间的点来表示各品牌产 品,这个问题我们将在第三节中详细讨论。 第二个问题是如何确定不同品牌的产品在坐标空间中的 坐标。原则上我们可以随机地用任意不同点代表不同品 牌,但这样做会大大增加逐步修改初步图形结构的工作 量。 一种可行的方法是将表1进行因子分析,选择和坐标维 数相同的公共因子数,将各品牌的因子载荷值分别作为 它的坐标。 我们用这种方法对例1确定出不同品牌的产品在所选坐 标空间中的坐标。由于该初步图形结构的点间距离已和 原始输入次序相同,因此不用再修改初步图形结构。 为了说明修改初步图形结构的步骤和方法,表1中我们 用航海三角测量技术来给出初步图形结构。
一、配对比较法
二、配对评分法
研究者预先设计好一个八点双极评分表,并将n 种品牌每两种配成一对,共有
三、诱导法
研究者先找出品牌的某些特性,然后将每 一种特性配成一双极评分表。例如对牙膏 来说,可用下列特性:
在调查时,应答者对每一特性,给各种品 牌进行评分。例如:对于预防腐烂,洁银 牙膏的评分为6,田七牙膏的评分为5;对 于牙齿变白,洁银牙膏的评分为5,田七牙 膏的评分为6。根据每种品牌在各特性上的 评分,可以同各种品牌在应答者心目中的 距离。计算公式如下:
第十一章
多维标度法
(Multidimensional Scaling)
第一节 引
言
第一节 引
言
多维标度法(MDS)是著名计量心理学家谢泼 德(Shephard)和克鲁斯克 (Kruskal)分别于 1962年和1964年发展起来的一种计量心理学 技术。 多维标度法现在已经广泛应用于心理学、市 场调查、社会学、物理学、政治科学以及生 物学等领域的数据分析方法。
克鲁斯克系数定义如下:
其中n为品牌数,dij为初步图形结构中i品牌与j品 牌间的距离,đij为调整后i品牌与j品牌间的距离。
若一图形结构有
这时克鲁斯克系数的分子为0,S=0,表示该图形结构十 分理想,不需要再修改。 用克鲁斯克系数检验某一图形结构是否与原始资料次序配 合良好,可用表5。
对于图4的情形,空间维数从…一增至二,或 增至三,克鲁斯克系数均有较大 的下降,而从三 维到四维或四维到五维,克鲁斯克系数变化不大, 故可取三维空间来构图。
2.多维标度法不能确定图形结构的绝对位置 必须注意用多维标度法构造出的图形结构, 只能确定各种品牌之间的相对位置, 但 其绝对位置则不能完全确定。例如,在图5 中各种图形结构都是等价的,都可以作为 多维标度法的结果。
表3
品牌 A B C
A B C
0 9 12
9 0 15
12 15 0
3.检验初步图形结构是否需要修改
如果初步图形结构的距离矩阵所确定的相 似次序(距离越小越相似)与原始相似次序矩 阵的次序完全一致,则认为初步图形结构 在所选定维数(本例是二维)空间中是最有代 表性的。 但一般来说,两者次序是很难一致的,这 时要通过“克鲁斯克”系数来检验初步图 形是否需要修改。