星座图与调和曲线图

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

星座图

星座图是将高维空间中的样品点投影到平面上的一个半圆内,用投影点表示样品点。具体的作图步骤是:

(1)将数据{X ki }变换为角度{θki },使0〈θki 〈π,常取变换方法如下(极差标准化):

180min max min 111⨯--====Li n L Li n L Li n

L ki ki X X X X θ k =1,…,n i =1,…,p

(2)适当地选一组权系数 w 1, w 2, …,w p ,其中 w i >0 且11=∑=p i i w

。重要的变量相应的权数可取大一点。最简单的取法

为w p =1/p ,i =1,…,p 。

(3)画出一个半径为1的上半圆及半圆底边的直径。

(4)对给定的第k 次观测X k =(X k 1, X k 2,…, X kp ),对应着上半圆内的一个点“·”或“*”和一条由折线表示的路径。路径的折点坐标是

星号位于路径的终点,其坐标为( U k (p ), V k (p )

)。

将这些坐标(U 1(1), V 1(1)), (U 1(2), V 1(2)),…,(U 1(p), V 1(p))所对应的点分别记为o 1, o 2, …,o p ,连接o 1, o 2, …,o p 即为第一⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ = = = = ∑ ∑ = = n

k W V p L W U L i ki i L k L i ki i L k , , 1 sin , , 1 cos 1 ) ( 1 ) ( θ θ

个样品点的路径。

从上面表达式不难看出路径终点的横坐标就是点o1到点o p的横坐标之和,终点的纵坐标是点o1到点o p的纵坐标之和。

如果将n个样品点的路径折线和星号位置都画出来,就很像天文学中星座的图象,故称之为星座图。下面对消费数据,使用相同的权数即w1, w2,…,w6=1/6作星座图。

调和曲线图

调和曲线图是D.F.Andrews1972年提出的三角多项式作图法,所以又称为三角多项式图。其思想是把高维空间中的一个样品点对应于二维平面上的一条曲线。

设p维数据x = (x1, x2, … , x p)',对应的曲线是:

上式当t在区间[-π, π]上变化时,其轨迹是一条曲线。

在多项式的图表示中,当各变量的数值太悬殊时,最好先标准化后再作图。这种图对聚类分析帮助很大,如果选择

聚类统计量为距离的话,同类的曲线非常靠近拧在一起,不同类的曲线相互分开,非常直观。

调和曲线图有两点优良数学性质:一是保持线性性,二是与一般的欧式距离之间的关系。

上面的变换是一个连续函数,我们定义两个样本X与Y 之间的距离为如下平方积分形式(事实上也是一种常用的范数):

愿意复习三角函数积分的可以做一做,其实很简单的。最后可以发现这个距离与欧式距离(后者)有如下关系:

根据这条性质我们马上可以得知前面观察图线聚类的数学依据。

相关文档
最新文档