应用多元统计分析课后习题答案详解北大

合集下载

应用多元统计分析课后习题答案详解北大高惠璇(第五章部分习题解答)

应用多元统计分析课后习题答案详解北大高惠璇(第五章部分习题解答)

所以样品x=2.5判归 1. 判归G 因0.5218>0.3798>0.0984,所以样品 所以样品 判归
8
第五章 判别分析
5 − 3 设总体Gi 的均值为µ ( i ) (i = 1,2),同协差阵Σ. 1 ′µ (1) + a′µ ( 2 ) ), (其中a = Σ −1 ( µ (1) − µ ( 2) )), 记µ = (a 2 试证明(1)E(a′X | G1 ) > µ ; (2)E(a′X | G2 ) < µ . 1 (1) 1 (1) (2) ′X | G1) − µ = a′µ − (a′µ + a′µ ) = (a′µ(1) − a′µ(2) ) 解: E(a 2 2 1 (1) (2) −1 (1) (2) = (µ − µ )′Σ (µ − µ ) > 0, (因Σ > 0) 2 1 (1) (2) −1 (1) (2) 类似可证: E(a′X | G2 ) − µ = − (µ − µ )′Σ (µ − µ ) < 0,. 2 即 E(a′X | G1) > µ, E(a′X | G2 ) < µ .
第五章 判别分析
所以 q1 f1 ( x) = 0.1613, 类似可得 q2 f 2 ( x) = 0.0304, q3 f 3 ( x) = 0.1174,
所以样品x=2.5判归 1. 判归G 因0.1613>0.1174>0.0304,所以样品 所以样品 判归
7
第五章 判别分析
解三:后验概率判别法 解三 后验概率判别法, 后验概率判别法 计算样品x已知 已知,属 的后验概率: 计算样品 已知 属Gt的后验概率 qt f t ( x) P(t | x) = 3 (t = 1,2,3) ∑ qi fi ( x) 当样品x=2.5时,经计算可得 时 当样品

应用多元统计分析课后习题答案详解北大高惠璇(第二章部分习题解答) (2).ppt

应用多元统计分析课后习题答案详解北大高惠璇(第二章部分习题解答) (2).ppt

4 3
u1u2
1
2
exp[
1 2
(2u12
u22
2u1u2 )]du1du2
1
2
u12
u1e 2
1
2
u2e
1 2
(
u2
u1
)
2
du2
du1
1
2
u12
u1e 2
1
2
(u2
u1
)e
1 2
(u2
u1
)
2
du2
u1
e
1 2
(
u2
u1
)
2
du2
du1
1
2
u e
2
u12 2
2
x12
22
x1
65
x12
14
x1
49)
1 2
(
x2
x1
7)2
e e dx2
2
1 e
1 2
(
x12
8
x1
16)
2
1
2
e dx
1 2
(
x2
x1
7
)
2
2
1 e
1 2
(
x1
4
)
2
2
X1 ~ N(4,1).
类似地有
f2 (x2 ) f (x1, x2 )dx1
1
e
1 4
(
x2
3)2
X
X X
(1) (2)
~
N
2
p
(1) (2)
,
1 2
2 1
,
其中μ(i) (i=1,2)为p维向量,Σi (i=1,2)为p阶矩阵,

应用多元统计分析课后习题答案详解北大高惠璇第二章部分习题解答.ppt

应用多元统计分析课后习题答案详解北大高惠璇第二章部分习题解答.ppt

X1
1
18
第二章 多元正态分布及参数的估计
P{Y 0} P{X1 1或X1 1} P{X1 1} P{X1 1} (X1 ~ N(0,1)) 2(1) 0.3174 0
若(X1 , X2 ) 是二元正态分布,则由性质4可知,
它的任意线性组合必为一元正态. 但Y= X1-X2 不是正态分布,故(X1 , X2 ) 不是二元正态分布.
]
g( y1, y2 )
设函数 g( y1, y2 ) 是随机向量Y的密度函数.
15
第二章 多元正态分布及参数的估计
(3) 随机向量
Y
YY12
~
N2
7 4
,
I2
(4) 由于
X
X X
1 2
0 1
11
Y1 Y2
CY
0 1
11 74
34
,
0 1
11I
2
0 1
11
1 1
21
19
第二章 多元正态分布及参数的估计
2-17 设X~Np(μ,Σ),Σ>0,X的密度函数记为 f(x;μ,Σ).(1)任给a>0,试证明概率密度等高面
f(x;μ,Σ)= a
是一个椭球面.
(2)
当p=2且
2
1
1
(ρ>0)时,
概率密度等高面就是平面上的一个椭圆,试求该椭圆
的方程式,长轴和短轴.
证明(1):任给a>0,记
y12 y22 22y2 14( y1 y2 ) 65
y12 14y1 49 y22 8y2 16
( y1 7)2 ( y2 4)2
2即1 e 21 e
1 2
(

应用多元统计分析课后习题答案详解北大高惠璇习题解答公开课一等奖优质课大赛微课获奖课件

应用多元统计分析课后习题答案详解北大高惠璇习题解答公开课一等奖优质课大赛微课获奖课件

0 8
X (2)
X
(3)
0
X (5) CL4
第11页 11
第六章 聚类分析
② 合并{X(2),X(5)}=CL3,并类距离 D2=3.
0 D(3) 10
9
0 8
0
X (3)
CL4 CL3
③ 合并{CL3,CL4}=CL2,并类距离 D3=8.
D(4) 100
0
X (3) CL2
④ 所有样品合并为一类CL1,并类距离 D4=10.
n p nq nr2
(X
(k)
X
(q) )'( X
(k)
X
( p) )
n2p nr2
D
2 pk
nq2 nr2
Dq2k
n p nq nr2
(X
(k)
X
( p) )'( X
(k)
X
( p)
X
( p)
X
(q) )
n p nq nr2
(X
(k)
X
(q) )'( X
(k)
X
(q)
X
(q)
X
( p) )
第26页 26
故d*是一个距离.
第5页
5
第六章 聚类分析
(4) 设d (1)和d (2)是距离, 令d * d (1) • d (2).
d *虽满足前2个条件,但不一定满足三角不等式.
下面用反例来说明d *不一定是距离.
设di(j1)
d (2) ij
X (i) X ( j) (m 1), 则di*j
X (i) X ( j)
D
2 pk
nq nr

应用多元统计分析课后习题答案详解北大高惠璇(第七章习题解答)

应用多元统计分析课后习题答案详解北大高惠璇(第七章习题解答)
7-8
精品课件 14
第七章 主成分分析
精品课件 15
第七章 主成分分析
7-9
精品课件 16
第七章 主成分分析
精品课件 17
第七章 主成分分析
7-10
精品课件 18
第七章 主成分分析
77--1112
精品课件 19
应用多元统计分析
第七章习题解答
第七章 主成分分析
试从7-Σ1和相关阵R设出X发=(求X1出, 总X2)体′主的成协分方,差阵14 1040,
并加以比较. 解:
精品课件 2
第七章 主成分分析
精品课件 3
第七章 主成分分析
精品课件 4
第七章 主成分分析
其7中-ρ2 为X1和X2的设相X=关(X系1,数X(2)ρ′>~0)N.2(0,Σ),协方1差1Σ=
解:
精品课件 11
第七章 主成分分析
7-7 设4维随机向量X的协差阵是
2
12
13 14
12 2
14 13
13 14 2
12
14 Βιβλιοθήκη 1312 2,
其中 1 21 31,421 4 21.3
试求X的主成分.
精品课件 12
第七章 主成分分析
解:
精品课件 13
第七章 主成分分析
第七章 主成分分析
解:
1
精品课件 8
第七章 主成分分析
7-4
等概率密度
设总体X=(X1,…,Xp)′~Np(μ,Σ) (Σ>0),
椭球为
(X-μ)′Σ-1(X-
μ)=C解2(:C为常数).
试问椭球的主轴方向是什么?
精品课件 9
第七章 主成分分析

应用多元统计分析课后习题答案详解北大高惠璇 习题解答

应用多元统计分析课后习题答案详解北大高惠璇 习题解答
17
第七章 主成分分析
7-10
18
第七章 主成分分析
77--1112
19
主成分向量为
Z ( X 1 ,X 2 ,X 3 ) 或 Z ( X 2 ,X 1 ,X 3 )
三个主成分的方差分别为4,4,2.
10
第七章 主成分分析
7-6
设3维总体X的协差阵为
2 2
2 2
0
2
0 2 2
试求总体主成分,并计算每个主成分解释的方差比例
解:
11
第七章 主成分分析
7-7 设4维随机向量X的协差阵是
2
12
பைடு நூலகம்
13 14
12 2
14 13
13 14 2
12
14
13
12 2
,
其中 1 21 31,421 4 21.3
试求X的主成分.
12
第七章 主成分分析
解:
13
第七章 主成分分析
7-8
14
第七章 主成分分析
15
第七章 主成分分析
7-9
16
第七章 主成分分析
应用多元统计分析
第七章习题解答
第七章 主成分分析
7-1 设X=(X1, X2)′的协方差阵 试从Σ和相关阵R出发求出总体主成分,
14
1040,
并加以比较.
解:
2
第七章 主成分分析
3
第七章 主成分分析
4
第七章 主成分分析
7-2 设X=(X1, X2)′~N2(0,Σ),协方差Σ=
其中ρ为X1和X2的相关系数(ρ>0). (1) 试从Σ出发求X
1
1

应用多元统计分析课后习题答案详解北大高惠璇(第四章部分习题解答).ppt

应用多元统计分析课后习题答案详解北大高惠璇(第四章部分习题解答).ppt




1 2 1
201
a b



1 2 3

def


X

ˆ


aˆ bˆ


( X X )1
X Y


1 0
2 1
21
1 2 1
1
201

1 0
2 1
21
~ F(1,1)
3
因 V 2 ,
ˆ 2
V

ˆ
2 0
,
故 V 或V ,
1V
1
否定域为
{ } {V V } { f }
10
第四章 回归分析
4-2 在多元线性回归模型(4.1.3)中(p=1),试求出参数 向量β和σ2的最大似然估计.
解:模型(4.1.3)为

1 3
( y1
aˆ0 )2
( y2
aˆ0 )2
( y3
3aˆ0 )2
7
第四章 回归分析

1 3
(Y

Zaˆ0
)(Y

Zaˆ0
)

1 3
Y
(I3

Z
(Z Z
)1 Z
)Y
1 Y BY
3
考虑
ˆ
2 0
ˆ
2

1 Y (B 3

A)Y
B A X ( X X )1 X Z (Z Z )1 Z
应用多元统计分析
第四章部分习题解答
第四章 回归分析
4-1

y1 y2

应用多元统计分析课后习题解答详解北大高惠璇(第二章部分习题解答)

应用多元统计分析课后习题解答详解北大高惠璇(第二章部分习题解答)

2 2
X 2 ~ N (3,2).
10
第二章 多元正态分布及参数的估计
12 Cov( X1, X 2 ) E[( X1 E( X1))( X 2 E( X 2 )]
E[( X1 4)( X 2 3)]
(x1 4)(x2 3) f (x1, x2 )dx1dx2
令uu21
x1 x2
X
X X
(1) (2)
~
N2 p
(1) (2)
,
1 2
2 1
,
其中μ(i) (i=1,2)为p维向量,Σi (i=1,2)为p阶矩阵,
(1) 试证明X(1) +X(2)和X(1) -X(2) 相互独立.
(2) 试求X(1) +X(2) 和X(1) -X(2) 的分布.
解 :(1) 令
Y
2
x12
22
x1
65
x12
14
x1
49)
1 2
(
x2
x1
7)2
e e dx2
2
1 e
1 2
(
x12
8
x1
16)
2
1
2
e dx
1 2
(
x2
x1
7
)
2
2
1 e
1 2
(
x1
4
)
2
2
X1 ~ N(4,1).
类似地有
f2 (x2 ) f (x1, x2 )dx1
1
e
1 4
(
x2
3)2
4
第二章 多元正态分布及参数的估计
(2) 因
Y
X1 X1

应用多元统计分析课后习题答案详解北大高惠璇第八章习题解答

应用多元统计分析课后习题答案详解北大高惠璇第八章习题解答
p i 1 p
所以
Q(m)
i 1 j 1 2 ij
p
p
j m1
(
2 j i 1
p
2 2 i
)
j m 1
,
2 j
16
p
第八章 因子分析
8-5 试比较主成分分析和因子分析的 (1) 主成分分析不能作为一个模型来描述,它只 是通常的变量变换,而因子分析需要构造因子模型; (2) 主成分分析中主成分的个数和变量个数p相 同,它是将一组具有相关关系的变量变换为一组互 不相关的变量(注意应用主成分分析解决实际问题 时,一般只选取前m(m<p)个主成分),而因子分析的 目的是要用尽可能少的公共因子,以便构造一个结 构简单的因子模型;
(2) ( AA D) 1 D 1 D 1 A( I AD 1 A) 1 A1 D 1 ; (3) A( AA D) 1 ( I m AD 1 A) 1 AD 1. 解:利用分块矩阵求逆公式求以下分块矩阵的逆:
记B221 I m AD A,
17
第八章 因子分析
(3) 主成分分析是将主成分表示为原变量的线 性组合,而因子分析是将原始变量表示为公因子 和特殊因子的线性组合,用假设的公因子来“解 释”相关阵的内部依赖关系. 这两种分析方法又有一定的联系.当估计方法 采用主成分法,因子载荷阵A与主成分的系数相 差一个倍数;因子得分与主成分得分也仅相差一 个常数.这种情况下可把因子分析看成主成分分 析的推广和发展. 这两种方法都是降维的统计方法,它们都可用 来对样品或变量进行分类.
18
2 11 2 21 2 3 2 31
a 1
2 31 2 3
a11a21 0.63 a11a31 0.45 a31a21 0.35

最新应用多元统计分析课后习题答案详解北大高惠璇(第五章部分习题解答)

最新应用多元统计分析课后习题答案详解北大高惠璇(第五章部分习题解答)
* ( 2) 2 2
X ( 2 ) * ( 2 ) X ( 2) * ( 2) P P 2 2 2 2 P U a P U b (1) ( 2 ) (1) ( 2 ) . . 1 2 2 1 (b) (a )
10
第五章 判别分析
10 20 18 12 20 7 ( 2) 15, 25, 1 12 32, 2 7 5 . 先验概率q1 q2 , 而L(2 | 1) 10, L(1 | 2) 75.试问样品 20及X 15 各应判归哪一类? X (1) 20 20 ( 2) (1) 按Fisher准则
(1) (1)
14
第五章 判别分析
18 12 (2)Bayes 准则(假设 1 2 12 32 ) 解 :由定理5.2.1, 只须计算 h1 ( X ) q2 L(1 | 2) f 2 ( X ), h2 ( X ) q1 L(2 | 1) f1 ( X ), 并比较大小, 判X属损失最小者.考虑 h1 ( X ) L(1 | 2) f 2 ( X ) 75 f 2 ( X ) h2 ( X ) L(2 | 1) f1 ( X ) 10 f1 ( X ) 1 ( 2) 1 ( 2) 7.5 exp{ ( X ) ( X ) 2 1 (1) 1 (1) ( X ) ( X )} 2
11
第五章 判别分析
或取B ( )( ) 10 20 100 100 15 25 10, 10 100 100 (组间) 类似于例5.3.1的解法, A-1B的特征根就等于

应用多元统计分析章节后习题答案详解北大高惠璇习题解答市公开课金奖市赛课一等奖课件

应用多元统计分析章节后习题答案详解北大高惠璇习题解答市公开课金奖市赛课一等奖课件

第10页 10
第八章 因子分析
8-3 验证下列矩阵关系式(A为p×m阵)
(1) (I AD1A)1 AD1A I (I AD1A)1;
(2) ( AA D)1 D1 D1A(I AD1A)1 A1D1;
(3) A( AA D)1 (Im AD1A)1 AD1.
解:利用分块矩阵求逆公式求下列分块矩阵逆:
(3) 主成份分析是将主成份表示为原变量线性 组合,而因子分析是将原始变量表示为公因子和 特殊因子线性组合,用假设公因子来“解释”相 关阵内部依赖关系.
这两种分析办法又有一定联系.当预计办法采 用主成份法,因子载荷阵A与主成份系数相差一 个倍数;因子得分与主成份得分也仅相差一个常 数.这种情况下可把因子分析当作主成份分析推 广和发展.
并计算误差平方和Q(2).
解 : m 2的因子模型的主成分解为:
0.8757 0.1802
A(
1l1,
2
l2
)
0.8312
0.4048,
0.7111 0.6950
第7页
7
第八章 因子分析
D
0.2007 0 0
0 0.1452
0
0.0100131
则m 2的正交因子模型为
X1 0.8757F1 0.1802F2 1 X 2 0.8312F1 0.4048F2 2 X 3 0.7111F1 0.6950F2 3
p
m
p
S ilili ilili ilili
i 1
i 1
i m 1
其中1 2 p 0 为S特性值,li为相应原则
特性向量。
第14页 14
第八章 因子分析
设A,D是因子模型主成份预计,即

应用多元统计分析课后习题答案详解北大高惠璇部分习题解答

应用多元统计分析课后习题答案详解北大高惠璇部分习题解答
解:检验三个尺寸(变量)是否符合这一规律的问题
可提成假设检验问题.因为
1 : 2 : 3 6 : 4 :1 C 0
其中
C
1 0
0 1
6 4
23
,
注意:
第24页/共46页
1 3
6 , 且 2 4
1
3 1
12
63 43
00.
24
第三章 多元正态总体参数的检验

C
2 1
3 0
0 6
~
Nr (0, 11),
X (2) ( )
~
N pr (0, 22 ),

X
n p
xij
X (1) | X (2) , nr n( pr)

W
X
X
X (1)X (1) X (2)X (1)
X X
(1) X (2) X
(2) (2)
WW1211
W12 W22
,
即 W11 X (1)X (1), W22 X (2)X (2)
样本,样本均值为X,样本离差阵为A.记μ=(μ1,…,μp)′.为检验
H0:μ1=μ2=…=μp ,H1:μ1,μ2,…,μp至少有一对不相等.令
C 11
1 0
0 1
0 0
,
1 0 0 1( p1)p
则上面的假设等价于H0:Cμ=0p-1,H1:Cμ≠ 0p-1
试求检验H0 的似然比统计量和分布.
Tx2 n(n 1)(X ) Ax1( X )
~ T 2 ( p, n 1).
令 Y(i) CX (i) d (i 1,..., n)
其中C是pp非退化常数矩阵,d是p1常向量。

应用多元统计分析课后习题答案详解北大高惠璇部分习题解答省名师优质课赛课获奖课件市赛课一等奖课件

应用多元统计分析课后习题答案详解北大高惠璇部分习题解答省名师优质课赛课获奖课件市赛课一等奖课件

4.7067
取a 1 A1( (1) (2) )
d
1 65 1381
3323 ,
则aAa
1,
且a满足 : Ba Aa ( d 2 ).
12
第五章 鉴别分析
判别效率(a) aBa 4.7067.
aAa
Fisher线性判别函数为u( X ) aX
1 89765
(32
X1
33X
2 判别准则为 判X G1 , 当W ( X ) 0,
判X G2 , 当W ( X ) 0, 试求错判概率P(2 |1)和P(1| 2).
解 : 记a 1 ( (1) (2) ),W ( X ) ( X )a是X的
线性函数,当X
G1时,W
(
X
)
~
N1
(1,
2 1
), 且
20
第五章 鉴别分析
20 20
时,
u
(
X
(1)
)
1 89765
(32,33)
20 20
4.3390
因u( X (1) ) 4.3390 u* , 判X (1) G2.
当X (1)
15 20
时,
u
(
X
(2)
)
1 89765
(32,33)1250
3.8050
因u( X (2) ) 3.8050 u* 判X (2) G1.
其中W ( X ) a( X *)
( X * )1( (1) (2) ) ,
* 1 ( (1) (2) ).
2 10
第五章 鉴别分析
5-4 设有两个正态总体G1和G2,已知(m=2)
(1)
1105, (2)

应用多元统计分析课后习题答案详解北大高惠璇(第六章习题解答)知识讲解

应用多元统计分析课后习题答案详解北大高惠璇(第六章习题解答)知识讲解
应用多元统计分析
第六章部分习题解答
第六章 聚类分析
6-1 证明下列结论:
(1) 两个距离的和所组成的函数仍是距离;
(2) 一个正常数乘上一个距离所组成的函数
仍是距离;

(3)设d为一个距离,c>0为常数,则 d * d
仍是一个距离;
d c
(4) 两个距离的乘积所组成的函数不一定是
距离;
证明: (1)设d (1)和d (2)为距离, 令d d (1) d (2).
④ 所有样品合并为一类CL1,并类距离 D4=10.
12
第六章 聚类分析
最长距离法的谱系聚类图如下:
Name of Observation or Cluster
X1
X4
X2
X5
X3
0
1
2
3
4
5
6
7
8
9
10
Maximum Distance Between Clusters
13
第六章 聚类分析
用类平均法:
并类距离 D1=1.
D(2)
0 9 3 7
0 5 10
0 8
X(2)
X
(3)
0
X (5) CL4
11
第六章 聚类分析
② 合并{X(2),X(5)}=CL3,并类距离 D2=3.
D(3) 100 9
0 8
0CCXL(L334)
③ 合并{CL3,CL4}=CL2,并类距离 D3=8.
D(4) 100 0CX(3L2)
X1
X4
X2
X5
X3
0
1
2
3
4
5
6

应用多元统计分析章节后习题答案详解北大高惠璇八章节习题解答

应用多元统计分析章节后习题答案详解北大高惠璇八章节习题解答
15
第八章 因子分析
m1 lm 1 0 m 1 BB ( m1 lm1 ,, p l p ) p l 0 p p

j m 1


p
2 j
tr(BB BB ) tr(BB BB) tr[(E D)( E D)] tr[E E E D DE DD] Q(m) 0 0 ( i2 ) 2
(
i 1 2 2 2 2
p
2 2 i
)
2 2 3
Q(1) ( ) [( ) ( ) ( ) ] 2 2 0.6795 0.3672 [0.2331 0.3091 0.4943 ] 0.5966 0.3943 0.2023 2 2 2 2 2 Q(2) 3 [( 12 ) 2 ( 2 ) ( 3 ) ] 2 2 2 2 0.3672 [0.2007 0.1452 0.01131 ] 0.1348 0.06149 0.07331
18
(2) ( AA D) 1 D 1 D 1 A( I AD 1 A) 1 A1 D 1 ; (3) A( AA D) 1 ( I m AD 1 A) 1 AD 1. 解:利用分块矩阵求逆公式求以下分块矩阵的逆:
记B221 I m AD A,
1 1 1 21 A B112 B221 A D B
I m AB
A B
1 221
B
22
把B22· 1和B11· 2式代入以上各式,可得:
( D AA) 1 D 1 D 1 A( I m AD 1 A) 1 AD 1 A( D AA) 1 ( I m AD 1 A) 1 AD 1 I m A( D AA) 1 A ( I m AD 1 A) 1 (3) ( 2)

最新[理学]应用多元统计分析课后习题答案详解北大高惠璇第六章习题解答课件PPT

最新[理学]应用多元统计分析课后习题答案详解北大高惠璇第六章习题解答课件PPT
t1
xi)2
n
t1
xt2i
nxi2
abnab2 n
(ab)[n(ab)]1(ab)(cd)
n
n
8
第六章 聚类分析
n (xtj
t1
xj)2
n
t1
xt2j
nx2j
acnac2 n
(ac)[n(ac)]1(ac)(bd)
n
n
故二值变量的相关系数为:
n
Cij(7)
(xtixi)x(tjxj)
t1
dik dkj,对一i切 ,k, j.
(2) 设d是距离,a >0为正常数.令d*=ad,显然有
① di*jcd ij0,且仅 X(i)当 X(j)时 di*j0; ② di*jcd ijcdjid*ji,对一 i,j;切
3
第六章 聚类分析
6-2 试证明二值变量的相关系数为(6.2.2)式,夹角余
并类距离 D1=1.
D(2)
0 9 3 7
0 5 10
0 8
X(2)
X
(3)
0
X (5) CL4
11
第六章 聚类分析
② 合并{X(2),X(5)}=CL3,并类距离 D2=3.
D(3) 100 9
0 8
0CCXL(L334)
③ 合并{CL3,CL4}=CL2,并类距离 D3=8.
D(4) 100 0CX(3L2)
n
(xti xi)(xtj xj )
rij
t1 n
n
(xti xi)2
(xtj xj )2
t1
t1
7
第六章 聚类分析
n
(xti xi)(xtj

应用多元统计分析课后习题答案详解北大高惠璇(第五章部分习题解答)

应用多元统计分析课后习题答案详解北大高惠璇(第五章部分习题解答)

特征向量时等号成立 .
又S 1B ( X (1) X (2) )( X (1) X (2) )S 1与
D 2 ( X (1) X (2) )S 1( X (1) X (2) )
有相同的特征值 .故1 D2;
18
第五章 判别分析
以下来验a就 证是D2对应的一个特征: 向量 S1BaS1(X(1) X(2))(X(1) X(2))S1(X(1) X(2))
应用多元统计分析
第五章部分习题解答
第五章 判别分析
5-1 已知总体Gi (m=1)的分布为: N((i),i2) (i=1,2) ,按
距离判别准则为(不妨设μ(1)>μ(2),σ1<σ2)
xx G G21,,若 若x**或 xx**,,
其中
解:
*
1(2) 1
2(1) 2
试. 求错判概率P(2|1)和P(1|2).
2
PU a PU b
(1) 2
(2) 1
(1) 1
(2) 2
.
.
(b) (a)
4
第五章 判别分析
5-2 设三个总体的分布分别为: G1为N(2,0.52), G2为
N(0,22),G3为N(3,12).试问样品x=2.5应判归哪一类? (1) 按距离准则; (2) 按Bayes准则 q1q2q31 3,L(j|i) 1 0,,ii jj
所以 q1f1(x)0.16,1类 3 似可得 q2f2(x)0.03,0q34f3(x)0.11,74
因0.1613>0.1174>0.0304,所以样品x=2.5判归G1.
7
第五章 判别分析
解三:后验概率判别法,
计算样品x已知,属Gt的后验概率:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0

X (5) CL4
11
第六章 聚类分析
② 合并{X(2),X(5)}=CL3,并类距离 D2=3.
D(3) 100 9
0 8
0


X (3)
CL4 CL3
③ 合并{CL3,CL4}=CL2,并类距离 D3=8.
D(4) 100
0

X (3) CL2
④ 所有样品合并为一类CL1,并类距离 D4=10.
2
第六章 聚类分析
① ② ③
(2) 设d是距离,a >0为正常数.令d*=ad,显然有

d
* ij

cd i j
0, 且仅当X (i)

X
(
j
)时d
* ij

0;

d
* ij
cdij
cd ji

d
* ji
, 对一切i,
j;
3
第六章 聚类分析

d
* ij
cdij

c(dik
d kj )
ac n
1 [an (a b)(a c)] 1 [a(a b c d ) (a b)(a c)]
n
n
ad bc n
n
( xti
t 1
xi )2

n t 1
xt2i
nxi2

a

b

n
a

b
2
n
(a b) [n (a b)] 1 (a b)(c d )
n
( xti xi )(xtj x j )
rij
t 1 n
n
(xti xi )2
( xtj x j )2
t 1
t 1
7
第六章 聚类分析
n ( xti
t 1
xi )(xtj
xj)
n t 1
xti xtj
nxi x j
anab n
cdik
cd kj

d
* ik

d
* kj
,
对一切i,
k
,
j.
故d*=ad是一个距离.
(3) 设d为一个距离,c>0为常数,显然有


4
第六章 聚类分析

d
* ij


dij dij c
1 1 c / dij

1
1 c /(dik
dkj )
dik dkj
dik

d kj
12
第六章 聚类分析
最长距离法的谱系聚类图如下:
Name of Observation or Cluster
X1
X4
X2
X5
X3
0
1
2
3
4
5
6
7
8
9
10
Maximum Distance Between Clusters
13
第六章 聚类分析
用类平均法:
D(0)

D (1)


0 4 6
0 9
6
第六章 聚类分析
6-2 试证明二值变量的相关系数为(6.2.2)式,夹角余弦为(6.2.3)式.
证明:设变量Xi和Xj是二值变量,它们的n次观测值记为xti, xtj (t=1,…,n). xti, xtj 的值或为0,或为1.由二值变量的列联表(表6.5)可知:变量Xi取 值1的观测次数为a+b,取值0的观测次数为c+d;变量Xi和Xj取值均为1的观 测次数为a,取值均为0的观测次数为d 等等。利用两定量变量相关系数的 公式:
D (1)


4 6
0 9
0


1 6
7 3
10 5
0 8
0
试用最长距离法、类平均法作系统聚类,并画出谱系聚类图.
解:用最长距离法:
① 合并{X(1),X(4)}=CL4, 并类距离 D1=1.
0
X (2)
D(2)


9 3 7
0 5 10
0 8

X (3)
t 1

n
n
(xti xi )2
(xtj x j )2
t 1
t 1
ad bc (a b)(c d ) (a c)(b d )
(6.2.2)
9
第六章 聚类分析
利用两定量变量夹角余弦的公式:
n
xti xtj
c osij
t 1 n
n
其中
xt2i
t 1
D(3) 1306 2 106 2
0 165 4
0


X (3)
CL4 CL3
③ 合并{CL3,CL4}=CL2,并类距离 D3=(165/4)1/2.
D(4) 1201 2
应用多元统计分析
第六章部分习题解答
第六章 聚类分析
6-1 证明下列结论:
(1) 两个距离的和所组成的函数仍是距离;
(2) 一个正常数乘上一个距离所组成的函数仍是距离;
(3)设d为一个距离,c>0为常数,则
仍是一个距离;
d* d
(4) 两个距离的乘积所组成的函数不一定是距离; d c
证明 : (1)设d (1)和d (2)为距离, 令d d (1) d (2) . 以下来验证d满足作为距离所要求的3个条件.
xt2j
t 1
n
n
n
xti xtj a,
xt2i a b, xt2j a c
t 1
t 1
t 1
故有 cij (9) cosij
a (a b)(a c)
(6.2.3)
10
第六章 聚类分析
6-3 下面是5个样品两两间的距离阵
0

D(0)

0

1 7 10 0
6 3 5 8 0
① 合并{X(1),X(4)}=CL4,并类距离 D1=1.
0
D(2)



92 32
65 2
0 52 136
2
0 100
2
X (2)
X (3)
0


X (5) CL4
14
第六章 聚类分析
② 合并{X(2),X(5)}=CL3,并类距离 D2=3.
dik dkj c dik dkj c dik dkj c
dik d kj dik c dkj c
(因dik 0, dkj 0)

d
* ik

d
* kj
对一切i, k, j.
故d*是一个距离.
5
第六章 聚类分析
(4) 设d (1)和d (2)是距离, 令d * d (1) d (2) . d *虽满足前2个条件, 但不一定满足三角不等式. 下面用反例来说明d *不一定是距离.
n
n
8
第六章 聚类分析
n
( xtj
t 1
xj )2

n t 1
xt2j

nx
2 j

a

c

n
a

c
2

n
(a c) [n (a c)] 1 (a c)(b d )
n
n
故二值变量的相关系数为:
Cij (7)
n
(xti xi )(xtj x j )
相关文档
最新文档