典型相关分析(1)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Corr(Y)=R22
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
简单相关系数 描述两组变量的相关关系的缺点
只是孤立考虑单个X与单个Y间的相关 ,没有考虑X、Y变量组内部各变量间的 相关。 两组间有许多简单ห้องสมุดไป่ตู้关系数(实例为30 个),使问题显得复杂,难以从整体描 述。(复相关系数也如此)
i 1,2,, min( p, q) m
CanRi Corr (U i ,Vi ) 典型相关系数 典型变量系数或典型权重 a、b
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
X*1,X*2,…,X*p和Y*1,Y*2,…,Y*q分别为X1,X2, …,Xp和Y1,Y2,…,Yq的正态离差标准化值。 记第一对典型相关变量间的典型相关系数为: CanR1=Corr(U1,V1)(使U1与V1 间最大相关) 第二对典型相关变量间的典型相关系数为: CanR2=Corr(U2,V2)(与U1、V1 无关; 使U2 与V2 间最大相关)…… 第五对典型相关变量间的典型相关系数为: CanR5=Corr(U5,V5) (与U1、V1 、…、 U4、 V4无关; U5与V5 间最大相关) 有: 1≥CanR1≥CanR2≥……≥CanR5≥0
3
【除前面(i 1 )个CanR 之外的最大者】
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
(三)典型相关分析示意图
X1
X2 X3 X4 X5 X6
X
U1 U2 U3 CanR1 CanR2 CanR3 CanR4 CanR5
Y
V1 V2 V3
Y1
Y2 Y3 Y4 Y5
U4
U5
V4
V5
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
二、典型相关系数及其检验
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
(一)求解典型相关系数的步骤
1. 求X,Y变量组的相关阵R= 2. 求矩阵A、B
A ( R11 ) R12 ( R22 ) R21
1 1 1
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
…求解第5典型变量系数
Aa a 如矩阵A关于第一特征根0.022的矩阵为: 0.1778 a51 a51 0.0168 a52 a52 a 0.4468 a53 0.022 53 0.1759 a54 a54 a a 0.0806 55 55 a 0.3142 a56 56 0.4586 0.3053 0.3986 0.2919 0.5298 0.0912 0.0701 0.1669 0.1939 0.0007 0.2274 0.2739 0.5489 0.0840 0.5238 0.0376 0.0510 0.3877 0.2523 0.0966 0.0915 0.0979 0.0669 0.03770 0.0061 0.0948 0.1421 0.1757 0.0210 0.2171 * 此外,还应满足U 5 (a51 X 1* a56 X 6 )的方差为1。
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
典型相关是研究两组变
量之间相关性的一种统计分析 方法。也是一种降维技术。
由Hotelling (1935, 1936)最早 提出,Cooley and Lohnes (1971)、 Kshirsagar (1972)和 Mardia, Kent, and Bibby (1979) 推动了它 的应用。
2. 求矩阵A、B
A ( R11 ) R12 ( R22 ) R21 B ( R22 ) R21 ( R11 ) R12
1 1 1 1
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
A矩阵(p×p)
0.5298 0.4586 0.3053 0.3986 -0.2919 -0.1778 -0.0912 -0.0701 -0.1669 -0.1939 -0.0007 -0.0168 0.2274 0.0966 0.2739 0.0376 0.5489 0.0510 0.0840 0.5238 0.4468
典型相关分析
Canonical Correlation Analysis
统计本科《应用多元分析》
一、引言
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
(一)何时采用典型相关分析
1. 两个随机变量Y与X 简单相关系数 2. 一个随机变量Y与一组随机变量X1,X2,…, Xp 多重相关(复相关系数) 3. 一组随机变量Y1,Y2,…,Yq与另一组随 机变量X1,X2,…,Xp 典型(则)相关系数 典型相关是简单相关、多重相关的推广; 或者说简单相关系数、复相关系数是典型相 关系数的特例。
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
实例(X与Y地位相同)
X1, X2, …, Xp
1 临床症状
2 原材料质量 3 居民营养 4 生长发育(肺活量) 5 人体形态
Y1, Y2, …, Yq
所患疾病
相应产品质量 健康状况 身体素质(跳高) 人体功能
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
* 此外,还应满足U1 (a11 X 1* a16 X 6 )的方差为1。
0.1778 a11 a11 0.0168 a12 a12 a 0.4468 a13 0.7643 13 0.1759 a14 a14 a a 0.0806 15 15 a 0.3142 a16 16
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
典型相关变量的性质
1, i j (1) Corr (U i , U j ) 0, i j (2) 1, i j Corr (Vi , V j ) 0, i j
典型相关系数, i j Corr (U i , V j ) i j 0, U i、Vi的均数为0,方差为1
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
求解第2典型变量系数
Aa a 如矩阵A关于第一特征根0.5436的矩阵为: 0.1778 a21 a21 0.0168 a22 a22 a 0.4468 a23 0.5436 23 0.1759 a24 a24 a a 0.0806 25 25 a 0.3142 a26 26 0.4586 0.3053 0.3986 0.2919 0.5298 0.0912 0.0701 0.1669 0.1939 0.0007 0.2274 0.2739 0.5489 0.0840 0.5238 0.0376 0.0510 0.3877 0.2523 0.0966 0.0915 0.0979 0.0669 0.03770 0.0061 0.0948 0.1421 0.1757 0.0210 0.2171 * 此外,还应满足U 2 (a21 X 1* a26 X 6 )的方差为1。
(二)典型相关系数计算实例
1. 求X,Y变量组的相关阵R=
R11 R 21 R12 R22
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
Corr(X)=R11
Corr(X,Y)=R12
Corr(Y,X)=R21
Corr(Y)=R22
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
简单相关系数矩阵
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
简单相关系数公式符号
Corr(X)=R11
Corr(X,Y)=R12
Corr(Y,X)=R21
R21 R12
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
B矩阵求λ
(典型相关系数的平方)
0.2611- λ -0.0053 -0.0632 -0.1175 -0.1052 -0.0560 0.5572 -λ -0.0337 0.1009 -0.0551 0.0034 0.0013 0.2550 - λ -0.0312 -0.0543 0.1743 0.1490 0.5573 -λ
1985年中国28 省市城市男生(19~ 22岁)的调查数据。记形态指标身高 (cm)、坐高、体重(kg)、胸围、肩宽、 盆骨宽分别为X1,X2,…,X6;机能 指标脉搏(次/分)、收缩压(mmHg) 、舒 张压(变音)、 舒张压(消音)、肺活量 (ml)分别为Y1,Y2,…,Y5。现欲研 究这两组变量之间的相关性。
-0.0843 -0.0007 0.1390
0.0859 - λ
0.1183 0.3531
0.2912
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
5个λ 与典型相关系数
λ1= 0.7643 λ2= 0.5436 λ3= 0.2611 λ4=0.1256 λ5=0.0220
1 CanR1 0.8742 2 CanR2 0.7373 3 CanR3 0.5110 4 CanR4 0.3544 5 CanR5 0.1482
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
4. 求A、B关于λi的变量系数 (求解第1典型变量系数)
Aa a 如矩阵A关于第一特征根0.7643的矩阵为: 0.4586 0.3053 0.3986 0.2919 0.5298 0.0912 0.0701 0.1669 0.1939 0.0007 0.2274 0.2739 0.5489 0.0840 0.5238 0.0376 0.0510 0.3877 0.2523 0.0966 0.0915 0.0979 0.0669 0.03770 0.0061 0.0948 0.1421 0.1757 0.0210 0.2171
R11 R 21
R12 R22
1
B ( R22 ) R21 ( R11 ) R12
可以证明A、B有相同的非零特征根 3. 求A或B的λi(相关平方)与CanRi,i= 1,…,m
4. 求A、B关于λi的特征根向量即变量系数
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
-0.0632 -0.0843 0.0859 -0.1175 -0.0007 0.1183 -0.1052 0.1390 0.3531
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
3. 求矩阵A、B的λ (相关系 数的平方)
A I B I 0
A、B有相同的非零特征值
0.3877 -0.2523 -0.1759 0.0061 -0.0806 0.2171 0.3142
-0.0915 -0.0979 -0.0669 -0.0377 0.0949 0.1421 0.1757 -0.0210
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
B矩阵(q×q)
0.2611 -0.0560 -0.0337 -0.0551 -0.0312 0.1009 0.0034 0.0013 0.2550 0.2912 -0.0543 0.1743 0.1490 0.5573 -0.0053 0.5572
2019年1月16日 第四军医大学卫生统计学教研室 宇传华
(二)典型相关分析的思想
采用主成分思想寻找第i对典型(相关)变 量(Ui,Vi):
* U i ai1 X ai 2 X ai , p X a X * 1 * 2 * p * Vi b Y b Y b Y b Y * i1 1 * i2 2 * i ,q q