应用多元统计分析第六章习题解答..

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n 2 n 2 tj 2 j 2
故二值变量的相关系数为:
Cij (7)
(x
t 1 n t 1
n
ti
xi )(xtj x j )
2 ( x x ) tj j t 1 n
2 ( x x ) ti i
ad bc (a b)(c d ) (a c)(b d )
* *
6
第六章 聚类分析
6-2 试证明二值变量的相关系数为(6.2.2)式,夹角余
弦为(6.2.3)式.
证明:设变量Xi和Xj是二值变量,它们的n次观测值记 为xti, xtj (t=1,…,n). xti, xtj 的值或为0,或为1.由二值变 量的列联表(表6.5)可知:变量Xi取值1的观测次数 为a+b,取值0的观测次数为c+d;变量Xi和Xj取值均为1的 观测次数为a,取值均为0的观测次数为d 等等。利用两 定量变量相关系数的公式:
D
( 4)
X ( 3) 0 10 0 CL 2
④ 所有样品合并为一类CL1,并类距离 D4=10.
12
第六章 聚类分析
最长距离法的谱系聚类图如下:
Name of Observation or Cluster X1
X4
X2
X5
X3
0
1
2
3
4
5
6
7
8
9
10
Maximum Distance Between Clusters
(6.2.2)
9
第六章 聚类分析
利用两定量变量夹角余弦的公式:
cos ij
其中
x x
t 1
n
ti tj
x
t 1
n
2 ti
x
t 1
n
2 tj
x x
t 1
n
ti tj
a, x a b, x a c
t 1 2 ti t 1 2 tj
n
n
故有 c
a (6.2.3) ij (9) cos ij (a b)(a c)
* ik * kj
d ik d kj
(因d ik 0, d kj 0)
对一切i, k , j.
5
故d*是一个距离.
第六章 聚类分析
(4) 设d (1)和d ( 2)是距离, 令d * d (1) d ( 2) . d 虽满足前2个条件, 但不一定满足三角不等式. 下面用反例来说明d 不一定是距离.
* ij * ij * ij
d cd ij cd ji d , 对一切i, j;
* ji
3
第六章 聚类分析

d cd ij c(d ik d kj ) cd ik cd kj
* ij
d d , 对一切i, k , j.
* ik * kj
故d*=ad是一个距离. (3) 设d为一个距离,c>0为常数,显然有
X ( 2) X ( 3) 3 5 0 X (5) 7 10 8 0 CL 4
11
第六章 聚类分析
② 合并{X(2),X(5)}=CL3,并类距离 D2=3.
D
( 3)
0 X ( 3) 10 0 CL 4 CL3 9 8 0
③ 合并{CL3,CL4}=CL2,并类距离 D3=8.
13
第六章 聚类分析
用类平均法:
D ( 0 ) D (1) 0 4 6 1 6 0 9 7 3 0 10 0 5 8 0
rij
(x
t 1 n t 1
n
ti
xi )(xtj x j )
2 ( x x ) tj j t 1
7
2 ( x x ) ti i
n
ab ac ( xti xi )(xtj x j ) xti xtj nxi x j a n n n t 1 t 1 1 1 [an (a b)(a c)] [a (a b c d ) (a b)(a c)] n n ad bc n
应用多元统计分析
第六章部分习题解答
第六章 聚类分析
6-1 证明下列结论: (1) 两个距离的和所组成的函数仍是距离; (2) 一个正常数乘上一个距离所组成的函数 仍是距离; (3)设d为一个距离,c>0为常数,则 d * d d c 仍是一个距离; (4) 两个距离的乘积所组成的函数不一定是 距离;
证明 : (1)设d 和d 为距离, 令d d
(1) ( 2)
(1)
d .
( 2)
2
以下来验证d满足作为距离所要求的3个条件.
第六章 聚类分析
① ②ห้องสมุดไป่ตู้③
(2) 设d是距离,a >0为正常数.令d*=ad,显然有
① ②
d cd ij 0, 且仅当X (i ) X ( j )时d 0;
n n
第六章 聚类分析
ab ( xti xi ) x nx a b n n t 1 t 1 ( a b) 1 [n (a b)] (a b)(c d ) n n
n 2 n 2 ti 2 i
2
8
第六章 聚类分析
ac ( xtj x j ) x nx a c n n t 1 t 1 ( a c) 1 [n (a c)] (a c)(b d ) n n
10
第六章 聚类分析
6-3 下面是5个样品两两间的距离阵
D ( 0 ) D (1) 0 4 6 1 6 0 9 7 3 0 10 0 5 8 0
试用最长距离法、类平均法作系统聚类,并画出谱系 聚类图.
解:用最长距离法: ① 合并{X(1),X(4)}=CL4, 0 9 0 ( 2) 并类距离 D1=1. D


4
第六章 聚类分析
1 1 ③ d d ij c 1 c / d ij 1 c /( d ik d kj )
* ij
d ij
d kj d ik d ik d kj c d ik d kj c d ik d kj c d kj d ik d ik c d kj c d d
相关文档
最新文档