典型相关分析模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例 :考 查 吸 烟 者 的 年 龄 体 形( 指 标 为 :X 1 — — 年 龄 ; X 2 — — 体 重 ;X 3 — — 日 吸 烟 量 ;
X 4 — — 胸 围 ) 与 基 本 健 康 状 况 ( 指 标 为 :Y1 — — 脉 搏 ;Y2 — — 收 缩 压Y;3 — — 舒 张 压 )
从
数
学
手
段
上
看
,
就
是
先
求
矩
阵
A
1 XX
XY
1 YY
YX
或
B
1 YY
YX
1 XX
XY
的
非
零
特
征
根
2 1
2 2
2 r
0
A
,再 求 矩 阵
和
B
与 各 特 征 根 相 配 对 的 分 别 满 足 条 件 ai XX ai 1 , bi YY bi 1 的 特 征
向 量 ai , bi i 1,2, , r 。
130
85
26
131
25
82.9
72
135
80
28
128
35
88.1
75
140
90
29
126
40
88.4
78
140
92
27
126
45
80.6
73
138
85
32
118
20
88.4
70
130
80
31
120
18
87.8
68
135
75
34
124
25
84.6
70
135
75
36
128
25
88.0
75
140
80
38
在经济学中研究几种主要肉食品的价格与销售量之间的相关性; 在气象学中研究相继两天气象因子间的相关性; 在卫生防疫中研究某些疾病与生活习惯之间的相关性,等等。
典 型相关分 析方法 采用主成 分分析 的做法, 在每一 组变量 中都 适 当 构 造 若 干 个 有 代 表 性 的 综 合 性 指 标( 变 量 的 线 性 组 合 ), 通 过 考 察 这 些 综 合 性 指 标间的相关性来揭示两组原始变量间的相关关系。
设 a a 1 , a 2 , , a p , b b1 , b 2 , , b q 是 两 个 按 某 种 规 则
确定的常值向量,
则 a X a1 X 1 a 2 X 2 a p X p 可 看 作 是 第 一 组 随 机 变 量
X 1 , X 2 , , X p 的 某 项 综 合 性 指 标 ,
较 为 合 理 的 限 制 是 a D X a 1 且 b D Y b 1 。
于 是 构 造 具 有 最 大 相 关 系 数 的 两 个 综 合 性 指 标a X 与b Y 的
a D X a 1 b D Y b 1
问题就转化为在约束条件
,
之下求
a , b , 使 a Cov X , Y b 达 到 最 大 。
之间的相关关系。
由于总体的协差阵未知,为了进行样本典型相关分析 ,随机抽取了容量为 15 的样本,
测得观测值如表 10.1 所示。
表 10.1
年龄
体重 日吸烟量 胸围
脉搏
收缩压 舒张压
( 岁 ) ( 斤 ) ( 支 ) ( 厘 米) (次/分) (mm Hg) (mm Hg)
25
125
30
83.5
70
如果
p
q
维
随
机
向
量
X Y
的
协
方
差
矩
阵
XX YX
XY YY
已知
则
aCovX ,Y b a XY b
aDX a a XX a
bDY b b YY b
(10.14) (10.15) (10.16)
两 综 合 性 指 标 aX 与 bY 的 构 造 就 转 化 为 求 解 约 束 优 化 问 题
由
a X , bY
Cov a X D a X
, bY D bY
a Cov X ,Y b a D X a bD Y b
可 知 , 若 不 对 向 量 a , b 加 以 适 当 限 制 , 使 相 关 系 数a X , b Y 达
到最大的 a,b 将不唯一。
这是 因为,随 机变量乘 以常数后 不改变相 互间的相 关系数。
典型相关分析
典型相关分析是研究两组随机变量
X X 1 , X 2 , , X p 与 Y Y1 ,Y2 , ,Yq 之 间 的 相 关 关 系 ,
探讨它们之间相关关系的表达方式与强弱的度量。 在实际问题中,经常遇到要研究一部分变量与另一部 分变量之间的相关关系,
例如:
在工厂里, 考察原料的若干项质量指标 X 1 , X 2 , , X p 与 产品的若干项主要 质 量 指 标 Y1 , Y2 , , Yq 之 间 的 相 关 性 ;
0.149 0.177 0.705 0.759
0.037 0.002 00.0.00097
求得矩阵 A 的特征根:21 0.915,22 0.339 ,23 0.032 ,24 0.000
相应得典型相关系数: 1 0.957,2 0.582 ,3 0.182 ,4 0
124
23
85.6
72
145
86
41
135
40
86.3
76
148
88
46
143
45
84.8
80
145
Fra Baidu bibliotek
90
47
141
48
87.9
82
148
92
48
139
50
81.6
85
150
95
45
140
55
88.0
88
160
95
0.415
A
1 XX
XY
1 YY
YX
=
0.132 00..139993
0.233 0.157 0.334 0.455
它 们 间 具 有 最 强 的 线 性 相 关 性 , 其 相 关 系 数1 称 第 一 典 型 相 关 系 数 ; 称 a 2 X , b2Y 是 X ,Y 的 第 二 对 典 型 相 关 变 量 , 它 们 间 的 线 性 相 关 性 仅 次
于 第 一 对 典 型 相 关 变 量 , 其 相 关 系 数 2 称 第 二 典 型 相 关 系 数 ; 等 等 。
s
min a ,b
.t. a
a XX
XY
a
b
1
b YY b 1
(10.17)
经过一系列的理论推导,
可 以 匹 配 出 r 对 综 合 性 指 标 aiX 和biY ,i 1,2 , , r , 根 据 它 们 间 相 关 系 数 的 大 小 , 依 次 称 a1 X ,b1Y 是X ,Y 的 第 一 对 典 型 相 关 变 量 ,
b Y b1Y1 b 2Y 2 bqY q 可 看 作 是 第 二 组 随 机 变 量
Y1 , Y 2 , , Y q 的 某 项 综 合 性 指 标 , 规 则 是 希 望 通 过 适 当 选 择 向 量 a X b Y a,b , 使 综 合 性 指 标 与 有 最 大 相 关 系 数 。