典型相关分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
典型相关分析研究的问题是,如何选取典型变量的最优线性组合。选取原则是:在所有 线性组合 U 和 V 中, 选取典型相关系数为最大的 U 和 V , 即选取 a
(1) (1)
和b
(1)
使得 U 1 = a ′ X
(1) ( 2)
与 V1 = b ′ Y 之间的相关系数达到最大(在所有的 U 和 V 中) ,然后选取 a
说明, λ 既是矩阵 A ,同时也是矩阵 B 的特征值,同时也表明,相应的 a 与 b 分别是
2
特征值 λ 的特征向量。
2
而且,根据证明,矩阵 A 和 B 的特征值还具有以下的性质: (1)矩阵 A 和 B 有相同的非零特征值,且相等的非零特征值的数目就等于 p 。 (2)矩阵 A 和 B 的特征值非负。 (3)矩阵 A 和 B 的全部特征值均在 0 和 1 之间。 根据前边,我们知道,λ = ν = a ′
(
X 1 , X 2 ,…, X p
)′
和Y =
(
Y1 , Y2 ,…, Yq
)′ ,
E ( X ) = µ1
E (Y ) = µ 2 Cov ( X , Y ) = ∑ 12 =
于是,对于矩阵
Cov ( X ) = ∑ 11 Cov (Y ) = ∑ 22
第二组变量的均值和协方差为矩阵为
第一组与第二组变量的协方差为矩阵为
∑
12
b = ρ ,所以 λ 为其典型变量 U 和 V 之间的简单
相关系数。 又由于要求其相关系数达到最大(按习惯考虑为正相关),所以取矩阵 A 或 B 的最大特 征值 λ1 的平方根 λ1 ,作为相关系致,同时由特征值 λ1 所对应的两个特征向量 a
2 2 (1)
和b
(1)
有:
U 1 = a ′ (1) X 和 V1 = b′ (1)Y
(1)
(2 )
L a (k ) 和 b (1) , b (2 ) L b (k ) ,则可得 k 对线性组合:
(1) ⎧ U 1 = a1(1) X 1 + a 2 X 2 + L + a (p1) X p ⎪ (2 ) (2 ) (2 ) ⎪U 2 = a1 X 1 + a 2 X 2 + L + a p X p ⎨ M ⎪ ( ) ( k k ⎪U p = a1 X 1 + a 2 ) X 2 + L + a (pk ) X p ⎩
第八章
典型相关分析
在对经济问题的研究和管理研究中, 不仅经常需要考察两个变量之间的相关程度, 而且 还经常需要考察多个变量与多个变量之间即两组变量之间的相关性。 典型相关分析就是测度 两组变量之间相关程度的一种多元统计方法。
第一节
典型相关的基本原理
(一)典型相关分析的基本思想 典型相关分析方法(canonical correlation analysis)最早源于荷泰林(H,Hotelling) 于 1936 年在《生物统计》期刊上发表的一篇论文《两组变式之间的关系》 。他所提出的方法 经过多年的应用及发展,逐渐达到完善,在 70 年代臻于成熟。由于典型相关分析涉及较大 量的矩阵计算, 其方法的应用在早期曾受到相当的限制。 但随着当代计算机技术及其软件的 迅速发展,弥补了应用典型相关分析中的困难,因此它的应用开始走向普及化。 典型相关分析是研究两组变量之间相关关系的一种统计分析方法。为了研究两组变量
∑
21
'
(9—1—1)
⎡X ⎤ Z= ⎢ ⎥ ⎣Y ⎦
有
均值向量
⎡ E ( X )⎤ ⎡ µ1 ⎤ µ = E (Z ) = E ⎢ ⎥=⎢ ⎥ ⎣ E (Y ) ⎦ ⎣ µ2 ⎦
(9—1—2)
协方差矩阵
( p+q ×
ห้องสมุดไป่ตู้∑ )(
p+q )
= E (Z − µ ) (Z − µ )
′
⎡ E ( X − µ )( X − µ )′ 1 1 =⎢ ⎢ E (Y − µ )( X − µ )′ 2 1 ⎣ ⎡ ∑ 11 ⎢( p× p ) =⎢ ⎢ ∑ 21 ⎢(q× p ) ⎣
(i )
和b
(i )
的值和原始数据 X i 、Yi 分别代入 U i 、 Vi 的表达式中求得的值, 称为第 i 个
典型变量的得分。如同因子得分,典型变量的得分可以构成得分平面等值图,借以进行分类 和统计分析。 另外,这里,我们也直接给出典型变量所具有的性质: 性质 1: 由 X 1 X 2 … X P 所组成的典型相关变量 U 1 、 U 2 … U p 互不相关,同样由
U = a1 X 1 + a 2 X 2 + L + a p X p = a ′X
V = b1Y1 + b2Y2 + L + bq Yq = b ′Y
′ ′ a = (a1 , a 2 , L, a p ) , b = (b1 , b2 , L, bq ) 分别为任意非零常系数向量,则
可得,
Var (U ) = a ′ Cov ( X )a = a ′ ∑ 11 a
(一)总体典型变量与典型相关系数 由上一节的数学描述我们知道, 典型相关分析希望寻求 a 和 b 使得 ρ 达到最大, 但是由 于随机变量乘以常数时不改变它们的相关系数, 为了防止不必要的结果重复出现, 最好的限 制是令 Var (U ) =1 和 Var (V ) =1。于是,我们的问题就转化为,在约束条件为 Var (U ) =1 和 Var (V ) =1 下,寻找非零常数向量 a 和 b 使得相关系数 Corr (U ,V ) = a ′ 大。 根据数学分析中条件极值的求法,引入拉格朗日(Lagrange)乘数,问题则转化为,求
Y1 Y2 … Yq ,所组成的典型相关变量 V1 、V2 … V p 也互不相关,并且它们的方差均等于 1。
用数学表达式为
Var (U k ) = Var (Vk ) =1
Cov (U k ,U l ) = Corr (U k ,U l ) =1 Cov (U k ,U l ) = Corr (U k ,U l ) =0
(三)典型相关分析的应用 典型相关分析的用途很广。在实际分析问题中,当我们面临两组多变量数据,并希望 研究两组变量之间的关系时,就要用到典型相关分析。 例如,为了研究扩张性财政政策实施以后对宏观经济发展的影响,就需要考察有关财 政政策的一系列指标如财政支出总额的增长率、财政赤字增长率、国债发行额的增长率、税 率降低率等与经济发展的一系列指标,如国内生产总值增长率、就业增长率、物价上涨率等 两组变量之间的相关程度。又如,为了研究宏观经济走势与股票市场走势之间的关系,就需 要考察各种宏观经济指标如经济增长率、失业率、物价指数、进出口增长率等与各种反映股 票市场状况的指标如股票价格指数、股票市场融资金额等两组变量之间的相关关系。再如, 工厂要考察所使用的原料的质量对所生产的产品的质量的影响, 就需要对所生产产品的各种 质量指标与所使用的原料的各种质量指标之间的相关关系进行测度。 又如,在分析评估某种经济投入与产出系统时,研究投入和产出情况之间的联系时,投 入情况面可以从人力、物力等多个方面反映,产出情况也可以从产值、利税等方面反映; 再如在分析影响居民消费因素时,我们可以将劳动者报酬、家庭经营收入、转移性收入 等变量构成反映居民收入的变量组,而将食品支出、医疗保健支出、交通和通讯支出等变量 构成反映居民支出情况的变量组, 然后通过研究两变量组之间关系来分析影响居民消费因素 情况。 第二节 典型变量与典型相关系数的求法
Var (V ) = b ′ Cov (Y )b = b ′
∑
22
b
Cov (U ,V ) = a ′ Cov ( X , Y ) b = a ′ ∑ 12 b
则称 U 与 V 为典型变量,它们之间的相关系数 ρ 称为典型相关系,即
ρ = Corr (U ,V ) =
a ′∑ 12 b a ′∑ 11 a b ′∑ 22 b
k =l k ≠l
其中, k , l = 1,2,……, p
Cov (Vk ,Vl ) = Corr (Vk ,Vl ) =1 Cov (Vk ,Vl ) = Corr (Vk ,Vl ) =0
k =l k ≠l
k , l = 1,2,……, q
将分别以 a ′ 和 b ′ 左乘上式,得
a ′ ∑12 b = λa ′∑11 a = λ b′
∑
21
a = νb′∑22 b = ν
又因为
(a ′ ∑12 b)′ = b ′
故 λ = ν = a′
∑
12
a, b=ρ ,
∑
12
说明, λ 的值就是线性组合 U 和 V 之间的相关系数。因此上述方程可写成:
− λ ∑11 a + ∑12 b = 0
∑
为求解方程,先以
12
21
a − λ ∑22 b = 0
−1 22
∑ ∑
−1 11
左乘以上述第二式,并将第一式代入,得
2 1 ( ∑ 12 ∑ − )a =0 22 ∑ 21 − λ ∑11
同理,将
∑ ∑
21
左乘以上述第一式,并将第二式代入,得
−1 ( ∑ 21 ∑ 11 ∑ 12 − λ2 ∑22 )b = 0
′ E ( X − µ1 )(Y − µ 2 ) ⎤ ⎥ ′⎥ E (Y − µ 2 )(Y − µ 2 ) ⎦
( p×q ) (q× q )
∑
12
∑
22
⎤ ⎥ ⎥ ⎥ ⎥ ⎦
要研究两组变量 X 1 , X 2 ,…, X p 和 Y1 , Y2 ,…, Yq 之间的相关关系,首先分 别作两组变量的线性组合,即
将上边两式分别左乘以
∑
−1 11
和
−1 22
∑
−1 22
,得
(∑
令
−1
11
∑ ∑ ∑
12
21
− λ2
)a=0
1 −1 ( ∑− − λ2 )b = 0 22 ∑ 21 ∑ 11 ∑ 12
A= B=
则得
∑ ∑ ∑ ∑
−1 11 −1 22 12 −1 22
21
∑ ∑ ∑ ∑
21 −1 11
12
2 ⎧ ⎪ Aa = λ a ⎨ 2 ⎪ ⎩ Bb = λ b
和
(1) (1) ⎧ V1 = b1(1)Y1 + b2 Y2 + L + bq Yq ⎪ (2 ) (2 ) (2 ) ⎪V2 = b1 Y1 + b2 Y2 + L + bq Yq ⎨ M ⎪ ( ) ( (k ) k k ⎪V p = b1 Y1 + b2 )Y2 + L + bq Yq ⎩
它们的相关系数为 λ1 ≥ λ 2 ≥ L ≥ λ p 。 称 λ1 ≥ λ 2 ≥ L ≥ λ p 为典型相关系数,称 U 1 、V1 ,U 2 、V2 …… U p 、V p 为其典型变 量。 将a
∑
12
b 达到最
φ (a, b ) = a ′ ∑ 12 b −
λ
(a′∑ 2
11
a −1 −
)
ν
2
(b′∑
11
b − 1 的极大值点, 其中 λ ,ν 是拉格
)
朗日乘数。由极值的必要条件,需求 φ 对 a 和 b 的偏导数,并令其等于零,得到的极值条件 为:
⎧ ∂φ = b − λ ∑11 a = 0 ⎪ ⎪ ∂a ∑12 ⎨ ⎪ ∂φ = ∑ a − ν ∑ b = 0 21 22 ⎪ ⎩ ∂b
这就是所要选取的第一对线性组合, 也即第一对典型变量, 它们在所有的线性组合 U 和 V 中 具有有最大的相关系数 λ1 。 若求出矩阵 A 或 B 的 p 个非零特征根( p 是矩阵 为
2 2 λ1 ≥ λ2 2 ≥ L ≥ λp ≥ 0
∑
12
的秩,这里实际上 p < q ) ,设
相应的特征向量是与 a , a
X 1 , X 2 ,…, X p 和 Y1 , Y2 ,…, Yq 之间的相关关系,采用类似于主成分分析的方
法,在两组变量中,分别选取若干有代表性的变量组成有代表性的综合指标,通过研究这两 组综合指标之间的相关关系, 来代替这两组变量间的相关关系, 这些综合指标称为典型变量。 (二)典型相关分析的数学描述 设有两随机变量组 X = 不妨设 p ≤ q 。 对于 X , Y ,不妨设第一组变量的均值和协方差为矩阵为
和b
( 2)
使得
U 2 = a ′ ( 2 ) X 与 V2 = b′ ( 2)Y 的相关系数在与 U 1 和 V1 不相关的组合 U 和 V 中最大,继续下去,
都不相关的线性组合 U p , V p 为止。 此时 p 直到所有分别与 U 1 , U 2 LU p −1 和 V1 , V2 LV p −1 , 等于诸变量 X 与 Y 之间的协方差矩阵的秩。 典型变量 U 1 和 V1 , U 2 和 V2 …… U p 和 V p 是根据它们的相关系数由大列小逐对提取, 直到两组变量之间的相关性被分解完毕为止。