实用统计方法——第二讲 典型相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实例(X与Y地位相同)
X1, X2, …, Xp
1 临床症状
Y1, Y2, …, Yq
所患疾病
2
3
原材料质量
居民营养
相应产品质量
健康状况
4
5
生长发育(肺活量)
人体形态
身体素质(跳高)
人体功能
1985年中国28 省市城市男生 (19~22岁)的调查数据。记形态指标 身高(cm)、坐高、体重(kg)、胸围、 肩宽、盆骨宽分别为X1,X2,…,X6; 机能指标脉搏(次/分)、收缩压 (mmHg) 、舒张压(变音)、 舒张压(消 音)、肺活量(ml)分别为Y1,Y2,…, Y5。现欲研究这两组变量之间的相关 性。
ຫໍສະໝຸດ Baidu
0.1890 -0.9874 -0.7753 0.1948 0.8108 0.1467
X5 -0.1193 -0.0626 -0.2509 -0.5860
0.9523 -0.5140
5组(标准化)典型变量系数(X)
U1 0.5852X 0.2175X 0.1948X
* 1 * 2 * 6
5组(标准化)典型变量系数(X)
U1 X1 X3 X4 X6 X2 -0.2175 0.5288 U2 0.0189 U3 0.7823 0.6032 U4 0.1289 0.1229 U5 1.5590 0.6988 1.0488 0.5852 -1.1443 0.0352 -0.8298
1.6213 -0.7370 -0.4066 -1.1704
λ3= 0.2611
λ4=0.1256 λ5=0.0220
4. 求A、B关于λi的变量系数 (求解第1典型变量系数)
Aa a 如矩阵A关于第一特征根 .7643 0 的矩阵为: 0.3986 0.2919 0.5298 0.4586 0.3053 0.0912 0.0701 0.1669 0.1939 0.0007 0.2274 0.2739 0.5489 0.0840 0.5238 0.3877 0.2523 0.0966 0.0376 0.0510 0.0915 0.0979 0.0669 0.03770 0.0061 0.0948 0.1421 0.1757 0.0210 0.2171 * 此外,还应满足 1 a11 X 1* a16 X 6)的方差为。 U ( 1 0.1778 a11 a11 0.0168 a12 a12 a 0.4468 a13 0.7643 13 0.1759 a14 a14 a 0.0806 a15 15 a 0.3142 a16 16
3. 求A或B的λi(相关系数的平方)与 i ,
i=1,…,m,即 i i ;
2
4. 求A、B关于λi的特征根向量即变量加权系 数。
(二)典型相关系数计算实例
1. 求X,Y变量组的相关阵 R=
R11 R12 R R 22 21
Corr(X)=R11
Corr(X,Y)=R12
求解第2典型变量系数
Aa a 如矩阵A关于第一特征根 .5436 0 的矩阵为: 0.1778 a21 a21 0.0168 a22 a22 a 0.4468 a23 0.5436 23 0.1759 a24 a24 a 0.0806 a25 25 a 0.3142 a26 26
-0.0843 -0.0007 0.1390
0.0859 - λ
0.1183 0.3531
0.2912
5个λ 与典型相关系数
λ1= 0.7643 λ2= 0.5436
1 1 0.8742 2 2 0.7373 3 3 0.5110 4 4 0.3544 5 5 0.1482
(二)典型相关分析的思想
采用主成分思想寻找第i对典型(相关)变 量(Ui,Vi):
U i ai1 X ai 2 X ai , p X a X
* 1 * 2 * p
*
Y * Vi b Y b Y b Y b
* i1 1 * i2 2 * i,q q
…求解第5典型变量系数
Aa a 如矩阵A关于第一特征根 .022 0 的矩阵为: 0.1778 a51 a51 0.0168 a52 a52 a 0.4468 a53 0.022 53 0.1759 a54 a54 a 0.0806 a55 55 a 0.3142 a56 56
3
U i、Vi的均数为0,方差为1。
(三)典型相关分析示意图
典型加权系数 典型相关系数 典型变量
X1 b11 b21 b12 X2 b22 b13 X3 b23 ρ22
1 1
ρ11
1 η1
c11 c21 c12
Y1
2 2
η2 2
c22
Y2
• 1与2是三个X变项的线性组合。 • η1与η2代表两个Y变项的线性组合。
典型相关是简单相关、多重相关的推广; 或者说简单相关系数、复相关系数是典型相 关系数的特例。
典型相关是研究两组变
量之间相关性的一种统计分析 方法。也是一种降维技术。
由Hotelling (1935, 1936)最早 提出,Cooley and Lohnes (1971)、 Kshirsagar (1972)和 Mardia, Kent, and Bibby (1979) 推动了它 的应用。
-0.0632 -0.0843 0.0859 -0.1175 -0.0007 0.1183 -0.1052 0.1390 0.3531
3. 求矩阵A、B的λ (相关系数 的平方)
A I B I 0
A、B有相同的非零特征值
B矩阵求λ
(典型相关系数的平方)
0.2611- λ -0.0053 -0.0632 -0.1175 -0.1052 -0.0560 0.5572 -λ -0.0337 0.1009 -0.0551 0.0034 0.0013 0.2550 - λ -0.0312 -0.0543 0.1743 0.1490 0.5573 -λ
典型相关分析
Canonical Correlation Analysis
一、引言
(一)何时采用典型相关分析
1. 两个随机变量Y与X 简单相关系数 2. 一个随机变量Y与一组随机变量X1,X2,…, Xp 多重相关(复相关系数) 3. 一组随机变量Y1,Y2,…,Yq与另一组随 机变量X1,X2,…,Xp 典型(则)相关系数
...... U 5 0.8298X 1.5590X 0.5140X
* 1 * 2 * * 6
X 表示为正态离差标准化 X原变量,即 的 X X X S
简单相关系数矩阵
简单相关系数公式符号
Corr(X)=R11
Corr(X,Y)=R12
Corr(Y,X)=R21 R21 R12
Corr(Y)=R22
简单相关系数 描述两组变量的相关关系的缺点
只是孤立考虑单个X与单个Y间的相关 ,没有考虑X、Y变量组内部各变量间的 相关。 两组间有许多简单相关系数(实例为30 个),使问题显得复杂,难以从整体描 述。
i 1, 2, m, min( p, q) m
典型相关系数 i Corr (Ui ,Vi ) 典型变量系数或典型权重 a、b
X*1,X*2,…,X*p和Y*1,Y*2,…,Y*q分别为X1, X2,…,Xp和Y1,Y2,…,Yq的正态离差标准化值。 记第一对典型相关变量间的典型相关系数为: 1 =Corr(U1,V1)(使U1与V1 间最大相关) 第二对典型相关变量间的典型相关系数为: 2 =Corr(U2,V2)(与U1、V1 无关; 使U2与V2 间最大相关) ..... ……
二、典型相关系数及其检验
(一)求解典型相关系数的步骤
1. 求X,Y变量组的相关阵 R= 2. 求矩阵 A、B
A ( R11 )1 R12 ( R22 ) 1 R21 B ( R22 )1 R21 ( R11 ) 1 R12
R11 R 21 R12 R22
;
可以证明A、B有相同的非零特征根;
Corr(Y,X)=R21
Corr(Y)=R22
2. 求矩阵A、B
A ( R11 ) R12 ( R22 ) R21 B ( R22 ) R21 ( R11 ) R12
1 1 1 1
A矩阵(p×p)
0.5298 0.4586 0.3053 0.3986 -0.2919 -0.1778 -0.0912 -0.0701 -0.1669 -0.1939 -0.0007 -0.0168 0.2274 0.0966 0.2739 0.0376 0.5489 0.0510 0.0840 0.5238 0.4468
第五对典型相关变量间的典型相关系数为: 5 =Corr(U5,V5) (与U1、V1 、…、 U4、V4 无关; U5与V5 间最大相关) 有:
1 2 5 0
典型相关变量的性质
1, i j 1, i j (1) Corr (U i ,U j ) Corr (Vi ,V j ) 0, i j 0, i j 典型相关系数, i j (2) Corr (U i ,V j ) i j 0, 【除前面(i 1 )个CanR之外的最大者】
0.3986 0.2919 0.5298 0.4586 0.3053 0.0912 0.0701 0.1669 0.1939 0.0007 0.2274 0.2739 0.5489 0.0840 0.5238 0.3877 0.2523 0.0966 0.0376 0.0510 0.0915 0.0979 0.0669 0.03770 0.0061 0.0948 0.1421 0.1757 0.0210 0.2171 * 此外,还应满足 5 a51 X 1* a56 X 6)的方差为。 U ( 1
0.3877 -0.2523 -0.1759 0.0061 -0.0806 0.2171 0.3142
-0.0915 -0.0979 -0.0669 -0.0377 0.0949 0.1421 0.1757 -0.0210
B矩阵(q×q)
0.2611 -0.0560 -0.0337 -0.0551 -0.0312 0.1009 0.0034 0.0013 0.2550 0.2912 -0.0543 0.1743 0.1490 0.5573 -0.0053 0.5572
0.3986 0.2919 0.5298 0.4586 0.3053 0.0912 0.0701 0.1669 0.1939 0.0007 0.2274 0.2739 0.5489 0.0840 0.5238 0.3877 0.2523 0.0966 0.0376 0.0510 0.0915 0.0979 0.0669 0.03770 0.0061 0.0948 0.1421 0.1757 0.0210 0.2171 * 此外,还应满足 2 a21 X 1* a26 X 6)的方差为。 U ( 1