典型相关分析的实例(专业知识)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 =Corr(U2,V2)(与U1、V1 无关; 使U2与V2
间最大相关)
..... ……
第五对典型相关变量间的典型相关系数为:
5 =Corr(U5,V5) (与U1、V1 、…、 U4、V4
无关; U5与V5 间最大相关)
有:
1 2 5 0
内容详尽
12
典型相关变量的性质
1, i j
1, i j
身高(cm)、坐高、体重(kg)、胸围、 肩宽、盆骨宽分别为X1,X2,…,X6;
机能指标脉搏(次/分)、收缩压 (mmHg) 、舒张压(变音)、 舒张压(消 音)、肺活量(ml)分别为Y1,Y2,…, Y5。现欲研究这两组变量之间的相关 性。
内容详尽
6
内容详尽
7
简单相关系数矩阵
内容详尽
8
简单相关系数公式符号
典型相关是简单相关、多重相关的推广; 或者说简单相关系数、复相关系数是典型相 关系数的特例。
内容详尽
3
典型相关是研究两组变
量之间相关性的一种统计分析 方法。也是一种降维技术。
由Hotelling (1935, 1936)最早 提出,Cooley and Lohnes (1971)、 Kshirsagar (1972)和 Mardia, Kent, and Bibby (1979) 推动了它
内容详尽
22
3. 求矩阵A、B的λ(相关系数 的平方)
A I B I 0
A、B有相同的非零特征值
内容详尽
23
B矩阵求λ (典型相关系数的平方)
典型相关分析
Canonical Correlation Analysis
内容详尽
1
一、引言
内容详尽
2
(一)何时采用典型相关分析
1. 两个随机变量Y与X
简单相关系数
2. 一个随机变量Y与一组随机变量X1,X2,…,
Xp
多重相关(复相关系数)
3. 一组随机变量Y1,Y2,…,Yq与另一组随
机变量X1,X2,…,Xp 典型(则)相关系数
Corr(X)=R11 Corr(X,Y)=R12
Corr(Y,X)=R21
R21 R12
内容详尽
Corr(Y)=R22
9
简单相关系数 描述两组变量的相关关系的缺点
➢只是孤立考虑单个X与单个Y间的相关 ,没有考虑X、Y变量组内部各变量间的 相关。
➢两组间有许多简单相关系数(实例为30 个),使问题显得复杂,难以从整体描 述。
数。
内容详尽
17
(二)典型相关系数计算实例
1. 求X,Y变量组的相关阵 R=
R11
R21
R12
R22
内容详尽
18
Corr(X)=R11 Corr(X,Y)=R12
Corr(Y,X)=R21
内容详尽
Corr(Y)=R22
19
2. 求矩阵A、B
A (R11)1 R12 (R22 )1 R21 B (R22 )1 R21(R11)1 R12
b12 X2 b22
b13
X3
b23
典型典加型权相系典关数型系变数量
11
ρ11
η11
c11
Y1
源自文库
c21
c12
22
ρ22
η2 2
c22
Y2
• 1与2是三个X变项的线性组合。
• η1与η2代表两内个容详Y尽变项的线性组合。
14
二、典型相关系数及其检验
内容详尽
15
(一)求解典型相关系数的步骤
1.
求X,Y变量组的相关阵
的应用。
内容详尽
4
实例(X与Y地位相同)
X1, X2, …, Xp
Y1, Y2, …, Yq
1 临床症状
所患疾病
2 原材料质量
相应产品质量
3 居民营养
健康状况
4 生长发育(肺活量) 身体素质(跳高)
5 人体形态
人体功能
内容详尽
5
1985年中国28 省市城市男生
(19~22岁)的调查数据。记形态指标
内容详尽
21
B矩阵(q×q)
0.2611 -0.0560 -0.0337 -0.0551 -0.0312 -0.0053 0.5572 0.1009 0.0034 -0.0543 -0.0632 -0.0843 0.0859 0.0013 0.1743 -0.1175 -0.0007 0.1183 0.2550 0.1490 -0.1052 0.1390 0.3531 0.2912 0.5573
典型变量系数或典型权重 a、b
内容详尽
11
X*1,X*2,…,X*p和Y*1,Y*2,…,Y*q分别为X1, X2,…,Xp和Y1,Y2,…,Yq的正态离差标准化值。 记第一对典型相关变量间的典型相关系数为:
1 =Corr(U1,V1)(使U1与V1 间最大相关)
第二对典型相关变量间的典型相关系数为:
内容详尽
10
(二)典型相关分析的思想
采用主成分思想寻找第i对典型(相关)变 量(Ui,Vi):
Ui
ai1 X1*
ai
2
X
* 2
ai
,
p
X
* p
aX *
Vi bi1Y1* bi2Y2* bi,qYq* bY *
i 1, 2, m,min( p, q) m
典型相关系数 i Corr(Ui ,Vi )
R=
R11
R21
R12
R22
;
2. 求矩阵 A、B
A (R11)1 R12 (R22 )1 R21 B (R22 )1 R21(R11)1 R12
可以证明A、B有相同的非零特征根;
内容详尽
16
3. 求A或B的λi(相关系数的平方)与 i ,
i=1,…,m,即 i i2 ;
4. 求A、B关于λi的特征根向量即变量加权系
(1) Corr(Ui ,U j ) 0, i j Corr(Vi ,Vj ) 0, i j
(2)
典型相关系数, i j
Corr
(U
i
,V
j
)
0,
i j
【除前面(i 1)个CanR之外的最大者】
3 Ui、Vi的均数为0,方差为1。
内容详尽
13
(三)典型相关分析示意图
X1 b11 b21
内容详尽
20
A矩阵(p×p)
0.5298 0.4586 0.3053 0.3986 -0.2919 -0.1778 -0.0912 -0.0701 -0.1669 -0.1939 -0.0007 -0.0168
0.2274 0.2739 0.5489 0.0840 0.5238 0.4468 0.0966 0.0376 0.0510 0.3877 -0.2523 -0.1759 -0.0915 -0.0979 -0.0669 -0.0377 0.0061 -0.0806 0.0949 0.1421 0.1757 -0.0210 0.2171 0.3142
间最大相关)
..... ……
第五对典型相关变量间的典型相关系数为:
5 =Corr(U5,V5) (与U1、V1 、…、 U4、V4
无关; U5与V5 间最大相关)
有:
1 2 5 0
内容详尽
12
典型相关变量的性质
1, i j
1, i j
身高(cm)、坐高、体重(kg)、胸围、 肩宽、盆骨宽分别为X1,X2,…,X6;
机能指标脉搏(次/分)、收缩压 (mmHg) 、舒张压(变音)、 舒张压(消 音)、肺活量(ml)分别为Y1,Y2,…, Y5。现欲研究这两组变量之间的相关 性。
内容详尽
6
内容详尽
7
简单相关系数矩阵
内容详尽
8
简单相关系数公式符号
典型相关是简单相关、多重相关的推广; 或者说简单相关系数、复相关系数是典型相 关系数的特例。
内容详尽
3
典型相关是研究两组变
量之间相关性的一种统计分析 方法。也是一种降维技术。
由Hotelling (1935, 1936)最早 提出,Cooley and Lohnes (1971)、 Kshirsagar (1972)和 Mardia, Kent, and Bibby (1979) 推动了它
内容详尽
22
3. 求矩阵A、B的λ(相关系数 的平方)
A I B I 0
A、B有相同的非零特征值
内容详尽
23
B矩阵求λ (典型相关系数的平方)
典型相关分析
Canonical Correlation Analysis
内容详尽
1
一、引言
内容详尽
2
(一)何时采用典型相关分析
1. 两个随机变量Y与X
简单相关系数
2. 一个随机变量Y与一组随机变量X1,X2,…,
Xp
多重相关(复相关系数)
3. 一组随机变量Y1,Y2,…,Yq与另一组随
机变量X1,X2,…,Xp 典型(则)相关系数
Corr(X)=R11 Corr(X,Y)=R12
Corr(Y,X)=R21
R21 R12
内容详尽
Corr(Y)=R22
9
简单相关系数 描述两组变量的相关关系的缺点
➢只是孤立考虑单个X与单个Y间的相关 ,没有考虑X、Y变量组内部各变量间的 相关。
➢两组间有许多简单相关系数(实例为30 个),使问题显得复杂,难以从整体描 述。
数。
内容详尽
17
(二)典型相关系数计算实例
1. 求X,Y变量组的相关阵 R=
R11
R21
R12
R22
内容详尽
18
Corr(X)=R11 Corr(X,Y)=R12
Corr(Y,X)=R21
内容详尽
Corr(Y)=R22
19
2. 求矩阵A、B
A (R11)1 R12 (R22 )1 R21 B (R22 )1 R21(R11)1 R12
b12 X2 b22
b13
X3
b23
典型典加型权相系典关数型系变数量
11
ρ11
η11
c11
Y1
源自文库
c21
c12
22
ρ22
η2 2
c22
Y2
• 1与2是三个X变项的线性组合。
• η1与η2代表两内个容详Y尽变项的线性组合。
14
二、典型相关系数及其检验
内容详尽
15
(一)求解典型相关系数的步骤
1.
求X,Y变量组的相关阵
的应用。
内容详尽
4
实例(X与Y地位相同)
X1, X2, …, Xp
Y1, Y2, …, Yq
1 临床症状
所患疾病
2 原材料质量
相应产品质量
3 居民营养
健康状况
4 生长发育(肺活量) 身体素质(跳高)
5 人体形态
人体功能
内容详尽
5
1985年中国28 省市城市男生
(19~22岁)的调查数据。记形态指标
内容详尽
21
B矩阵(q×q)
0.2611 -0.0560 -0.0337 -0.0551 -0.0312 -0.0053 0.5572 0.1009 0.0034 -0.0543 -0.0632 -0.0843 0.0859 0.0013 0.1743 -0.1175 -0.0007 0.1183 0.2550 0.1490 -0.1052 0.1390 0.3531 0.2912 0.5573
典型变量系数或典型权重 a、b
内容详尽
11
X*1,X*2,…,X*p和Y*1,Y*2,…,Y*q分别为X1, X2,…,Xp和Y1,Y2,…,Yq的正态离差标准化值。 记第一对典型相关变量间的典型相关系数为:
1 =Corr(U1,V1)(使U1与V1 间最大相关)
第二对典型相关变量间的典型相关系数为:
内容详尽
10
(二)典型相关分析的思想
采用主成分思想寻找第i对典型(相关)变 量(Ui,Vi):
Ui
ai1 X1*
ai
2
X
* 2
ai
,
p
X
* p
aX *
Vi bi1Y1* bi2Y2* bi,qYq* bY *
i 1, 2, m,min( p, q) m
典型相关系数 i Corr(Ui ,Vi )
R=
R11
R21
R12
R22
;
2. 求矩阵 A、B
A (R11)1 R12 (R22 )1 R21 B (R22 )1 R21(R11)1 R12
可以证明A、B有相同的非零特征根;
内容详尽
16
3. 求A或B的λi(相关系数的平方)与 i ,
i=1,…,m,即 i i2 ;
4. 求A、B关于λi的特征根向量即变量加权系
(1) Corr(Ui ,U j ) 0, i j Corr(Vi ,Vj ) 0, i j
(2)
典型相关系数, i j
Corr
(U
i
,V
j
)
0,
i j
【除前面(i 1)个CanR之外的最大者】
3 Ui、Vi的均数为0,方差为1。
内容详尽
13
(三)典型相关分析示意图
X1 b11 b21
内容详尽
20
A矩阵(p×p)
0.5298 0.4586 0.3053 0.3986 -0.2919 -0.1778 -0.0912 -0.0701 -0.1669 -0.1939 -0.0007 -0.0168
0.2274 0.2739 0.5489 0.0840 0.5238 0.4468 0.0966 0.0376 0.0510 0.3877 -0.2523 -0.1759 -0.0915 -0.0979 -0.0669 -0.0377 0.0061 -0.0806 0.0949 0.1421 0.1757 -0.0210 0.2171 0.3142