典型相关分析的实例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
a
24
5个λ与典型相关系数
1 1 0 .8 7 4 2 2 2 0 .7 3 7 3 3 3 0 .5 1 1 0 4 4 0 .3 5 4 4 5 5 0 .1 4 8 2
a
25
4. 求A、B关于λi的变量系数
(求解第1典型变量系数)
Aaa 如矩A阵 关于第一特 0.7征 64的 根 3 矩阵为:
a
6
a
7
简单相关系数矩阵
a
8
简单相关系数公式符号
Corr(X)=R11 Corr(X,Y)=R12
Corr(Y,X)=R21 R21 R12
a
Corr(Y)=R22
9
简单相关系数 描述两组变量的相关关系的缺点
➢只是孤立考虑单个X与单个Y间的相关 ,没有考虑X、Y变量组内部各变量间的 相关。
➢两组间有许多简单相关系数(实例为30 个),使问题显得复杂,难以从整体描 述。
的应用。
a
4
实例(X与Y地位相同)
a
5
1985年中国28 省市城市男生 (19~22岁)的调查数据。记形态指标身
高(cm)、坐高、体重(kg)、胸围、肩 宽、盆骨宽分别为X1,X2,…,X6;
机能指标脉搏(次/分)、收缩压 (mmHg) 、舒张压(变音)、 舒张压(消 音)、肺活量(ml)分别为Y1,Y2,…, Y5。现欲研究这两组变量之间的相关 性。
间最大相关)
..... ……
第五对典型相关变量间的典型相关系数为:
5 =Corr(U5,V5) (与U1、Βιβλιοθήκη Baidu1 、…、 U4、V4
无关; U5与V5 间最大相关)
有:
12L50
a
12
典型相关变量的性质
1, i j
1, i j
(1) Corr(Ui,Uj ) 0, i j Corr(Vi,Vj ) 0, i j
4. 可以证明A、B有相同的非零特征根;
a
16
3. 求A或B的λi(相关系数的平方)与 i ,
i=1,…,m,即 i i2 ;
4. 求A、B关于λi的特征根向量即变量加权系
数。
a
17
(二)典型相关系数计算实例
1. 求X,Y变量组的相关阵 R=
R11
R
21
R12
R
22
a
18
Corr(X)=R11 Corr(X,Y)=R12
Corr(Y,X)=R21
a
Corr(Y)=R22
19
2. 求矩阵A、B
A(R11)1R12(R22)1R21 B(R22)1R21(R11)1R12
a
20
A矩阵(p×p)
a
21
B矩阵(q×q)
a
22
3. 求矩阵A、B的λ(相关系数 的平方)
AIBI0
A、B有相同的非零特征值
a
23
B矩阵求λ (典型相关系数的平方)
a
11
X*1,X*2,…,X*p和Y*1,Y*2,…,Y*q分别为X1, X2,…,Xp和Y1,Y2,…,Yq的正态离差标准化值。 记第一对典型相关变量间的典型相关系数为:
1 =Corr(U1,V1)(使U1与V1 间最大相关)
第二对典型相关变量间的典型相关系数为:
2 =Corr(U2,V2)(与U1、V1 无关; 使U2与V2
0.5298 0.4586 0.3053 0.3986 0.29190.1778a11
a11
0.09120.07010.16690.19390.00070.0168a12
a12
0.2274
0.2739
0.5489
0.0840
0.5238 0.4468a130.7643a13
0.0966 0.0376 0.0510 0.3877 0.25230.1759a14
典型相关是简单相关、多重相关的推广; 或者说简单相关系数、复相关系数是典型相 关系数的特例。
a
3
典型相关是研究两组变
量之间相关性的一种统计分析 方法。也是一种降维技术。
由Hotelling (1935, 1936)最早 提出,Cooley and Lohnes (1971)、 Kshirsagar (1972)和 Mardia, Kent, and Bibby (1979) 推动了它
ρ22
2
c22
Y2
• 1与2是三个X变项的线性组合。 • η1与η2代表两个aY变项的线性组合。 14
二、典型相关系数及其检验
a
15
(一)求解典型相关系数的步骤
1.
求X,Y变量组的相关阵
R= R11
R
21
R12
R
22
;
2. 求矩阵 A、B
3. A(R11)1R12(R22)1R21
B(R22)1R21(R11)1R12
典型相关分析
Canonical Correlation Analysis
a
1
一、引言
a
2
(一)何时采用典型相关分析
1. 两个随机变量Y与X
简单相关系数
2. 一个随机变量Y与一组随机变量X1,X2,…,
Xp
多重相关(复相关系数)
3. 一组随机变量Y1,Y2,…,Yq与另一组随
机变量X1,X2,…,Xp 典型(则)相关系数
0.5298 0.4586 0.3053 0.3986 0.29190.1778a21
a21
0.09120.07010.1669 0.1939 0.00070.0168a2 2
a22
0.2274
0.2739
0.5489
a
10
(二)典型相关分析的思想
采用主成分思想寻找第i对典型(相关)变 量(Ui,Vi):
Ui ai1X1*ai2X2*L ai,pX*p aX*
Vi bi1Y1*bi2Y2*L bi,qYq* bY* i 1,2,L m,min(p,q)m
典型相关系数 i Corr(Ui,Vi) 典型变量系数或典型权重 a、b
(2)
典型相关系数, i j
Corr(Ui
,Vj
)
0,
i j
【除前面(i 1)个CanR之外的最大者】
3 Ui、Vi的均数为0,方差为1。
a
13
(三)典型相关分析示意图
X1 b11 b21
b12 X2 b22
b13
X3
b23
典型典加型权相系典关数型系变数量
1
ρ11
1
c11
Y1
c21
c12
2
a14
0.09150.09790.06690.037700.0061 0.0806a15
a15
0.0948 0.1421 0.1757 0.0210 0.2171 0.3142a16
a16
此外,还应 U1满 (a足 11X1*a16X6*)的方1差 。为
a
26
求解第2典型变量系数
Aaa 如矩A阵 关于第一特 0.5征 43的 根 6 矩阵为: