多元统计分析:多维标度法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( 1) C C ( 2) cij cii
i, j 1, 2,
,n
则矩阵 C 为相似系数阵, cij 称为第 i 点与第 j 点间的相似系数。
整数 r 和 R r 中的 n 个点 X1 , X 2 ,
2 dij ( X i X j )( X i X j )
, X n ,使得
i, j 1, 2,
,n
则称 D 为欧氏距离阵 3.相似系数阵
定义 10.3 一个 n n 阶的矩阵 C (cij )nn ,如果满足条件:
定义10.1 一个n n阶的矩阵D=(dij ) n n ,如果满足条件:
( 1) D D ( 2) dij 0, dii 0,
i, j 1, 2,
,n
则矩阵 D 为广义距离阵, d ij 称为第 i 点与第 j 点间的距离。
定义 10.2 对于一个 n n 的距离阵 D (d ) , 如果存在某个正 ij nn
表10.1
1 1 2 3 4 5 6 7 8 9 10 0 587 1212 701 1936 604 748 2139 2182 543 2 587 0 920 940 1745 1188 713 1858 1737 597 3 1212 920 0 879 831 1726 1631 949 1021 1494
第十章
第一节 第二节 第三节 引言
多维标度法
古典多维标度法(Classical MDS) 权重多维标度(WMDS)
第四节
实例分析与计算实现
第一节 引 言
在实际中我们会经常遇到这些的问题,给你一组城市,你总
能从地图上测出任何一对城市之间的距离。但若给你若干城 市的距离,你能否确定这些城市之间的相对位置呢?假定你 知道只是哪两个城市最近,哪两个城市次近等等,你是否还 能确定它们之间的相对位置呢?假定通过调查了解了10种饮 料产品在消费者心中的相似程度,你能否确定这些产品在消 费者心理空间中的相对位置呢?在实际中我们常常会遇到类 似这样的问题。 多维标度法(Multidimensional Scaling)就是解决这类问题 的一种方法,它是一种在低维空间展示“距离”数据结构的 多元数据分析技术,简称MDS。 多维标度法起源于心理测度学,用于理解人们判断的相似性。 Torgerson拓展了Richardson及Klingberg等人在三、四十年 代的研究,具有突破性地提出了多维标度法,后经
Shepard和Kruskal等人进一步加以发展完善。多维标度法 现在已经成为一种广泛用于心理学、市场调查、社会学、物 理学、政治科学及生物学等领域的数据分析方法。 多维标度法解决的问题是:当n个对象(object)中各对对象 之间的相似性(或距离)给定时,确定这些对象在低维空间 中的表示(感知图Perceptual Mapping),并使其尽可能与 原先的相似性(或距离)“大体匹配”,使得由降维所引起 的任何变形达到最小。多维空间中排列的每一个点代表一个 对象,因此点间的距离与对象间的相似性高度相关。也就是 说,两个相似的对象由多维空间中两个距离相近的点表示, 而两个不相似的对象则由多维空间两个距离较远的点表示。 多维空间通常为二维或三维的欧氏空间,但也可以是非欧氏 三维以上空间。
多维标度法内容丰富、方法较多。按相似性(距离)数据测
量尺度的不同MDS可分为:度量MDS和非度量MDS。当利 用原始相似性(距离)的实际数值为间隔尺度和比率尺度时 称为度量MDS(metric MDS),当利用原始相似性(距离)的 等级顺序(即有序尺度)而非实际数值时称为非度量 MDS(nonmetric MDS)。按相似性(距离)矩阵的个数和 MDS模型的性质MDS可分为:古典多维标度CMDS(一个 矩阵,无权重模型)、重复多维标度Replicated MDS(几个 矩阵,无权重模型)、权重多维标度WMDS(几个矩阵, 权重模型)。本章仅介绍常用的古典多维标度法和权重多维 标度法。
据概念。 1.相似数据与不相似数据 相似数据:如果用较大的数据表示非常相似,用较小的 数据表示非常不相似,则数据为相似数据。如用10表示 两种饮料非常相似,用1表示两种饮料非常不相似。 不相似数据:如果用较大的数值表示非常不相似,较小 的数值表示非常相似,则数据为不相似数据,也称距离 数据。如用10表示两种饮料非常不相似,用1表示两种饮 料非常相似。 2.距离阵
第二节 古典多维标度法 (Classical MDS)
一 相似与距离的概念 二 古典多维标度分析的思想及方法
三 度量MDS的古典解
四 非度量MDS的古典解(nonmetric MDS)
首先我们提出这样一个问题,表10.1是美国十城市之间的飞
行距离,我们如何在平面坐标上据此标出这10城市之间的相 对位置,使之尽可能接近表中的距离数据呢?
1= Atlanta , 2=Chicago,
3= Denver,
4= Houston,
5= Los Angeles
6= Miami , 7= New York, 8=S an Francisco , 9=Seattle, 10= Washington. DC们首先明确与多维标度法相关的数
美国10城市间的飞行距离
4 701 940 879 0 1374 968 1420 1645 1891 1220 5 1936 1745 831 1374 0 2339 2451 347 959 2300 6 604 1188 1726 968 2339 0 1092 2594 2734 923 7 748 713 1631 1420 2451 1092 0 2571 2408 205 8 2139 1858 949 1645 347 2594 2571 0 678 2442 9 2182 1737 1021 1891 959 2734 2408 678 0 2329 10 543 597 1494 1220 2300 923 205 2442 2329 0