典型相关-spss

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八章 典型相关分析

在对经济问题的研究和管理研究中,不仅经常需要考察两个变量之间的相关程度,而且还经常需要考察多个变量与多个变量之间即两组变量之间的相关性。典型相关分析就是测度两组变量之间相关程度的一种多元统计方法。

第一节 典型相关的基本原理

(一)典型相关分析的基本思想 典型相关分析方法(canonical correlation analysis)最早源于荷泰林(H,Hotelling)于1936年在《生物统计》期刊上发表的一篇论文《两组变式之间的关系》。他所提出的方法经过多年的应用及发展,逐渐达到完善,在70年代臻于成熟。由于典型相关分析涉及较大量的矩阵计算,其方法的应用在早期曾受到相当的限制。但随着当代计算机技术及其软件的迅速发展,弥补了应用典型相关分析中的困难,因此它的应用开始走向普及化。

典型相关分析是研究两组变量之间相关关系的一种统计分析方法。为了研究两组变量

1X ,2X ,…,p X 和1Y , 2Y ,…,q Y 之间的相关关系,采用类似于主成分分析的方

法,在两组变量中,分别选取若干有代表性的变量组成有代表性的综合指标,通过研究这两组综合指标之间的相关关系,来代替这两组变量间的相关关系,这些综合指标称为典型变量。 (二)典型相关分析的数学描述

设有两随机变量组=X (

1X ,2X ,…,)′p

X 和=Y (

1Y , 2Y ,…,q

Y )′,

不妨设p ≤q 。

对于X ,Y ,不妨设第一组变量的均值和协方差为矩阵为 ()X E =1µ Cov ()X =∑

11

第二组变量的均值和协方差为矩阵为

()Y E =2µ Cov ()Y =

22

第一组与第二组变量的协方差为矩阵为

Cov ()Y X ,=∑12= ∑21'

于是,对于矩阵 Z = ⎥⎦

⎣⎡Y X 有 (9—1—1) 均值向量 µ=E ()Z =E ()()⎥⎦⎤⎢⎣⎡Y E X E =⎥⎦

⎢⎣⎡21µµ (9—1—2)

协方差矩阵

()()

+×+q p q p =E ()µ−Z ()′

−µZ

=()()()()()()()()⎥

⎥⎦

⎢⎢

⎣⎡′−−′

−−′

−−′

−−2212211

1µµµµµµµµY Y E X Y E Y X E X X E =()

()

()

()

⎥⎥⎥⎥

⎢⎢⎢

⎢⎣⎡∑

∑∑∑××××q q p q q

p p p 22

2112

11

要研究两组变量1X ,2X ,…,p X 和1Y , 2Y ,…,q Y 之间的相关关系,首先分别作两组变量的线性组合,即

p p X a X a X a U +++=L 2211=X a ′

V =q q Y b Y b Y b +++L 2211=Y b ′

()′

=p a a a a ,,,21L ,(

)′

=q b b b b ,,,21L 分别为任意非零常系数向量,则可得,

Var ()U =a ′Cov ()a X = a ′∑11a Var ()V =b ′Cov ()b Y = b ′

22

b

Cov ()V U ,=a ′Cov ()Y X ,b = a ′∑12b

则称U 与V 为典型变量,它们之间的相关系数ρ称为典型相关系,即

ρ=Corr ()V U ,=

b

b a a b a ∑∑∑′′′221112

典型相关分析研究的问题是,如何选取典型变量的最优线性组合。选取原则是:在所有 线性组合U 和V 中,选取典型相关系数为最大的U 和V ,即选取)

1(a

和)

1(b

使得1U =X

a )

1(′与1V =Y b )

1(′之间的相关系数达到最大(在所有的U 和V 中),然后选取)

2(a

和)

2(b

使得

2U =X a )2(′与2V =Y b )2(′的相关系数在与1U 和1V 不相关的组合U 和V 中最大,继续下去,

直到所有分别与121,−p U U U L 和121,−p V V V L ,都不相关的线性组合p U ,p V 为止。此时p 等于诸变量X 与Y 之间的协方差矩阵的秩。

典型变量1U 和1V ,2U 和2V ……p U 和p V 是根据它们的相关系数由大列小逐对提取,直到两组变量之间的相关性被分解完毕为止。

(三)典型相关分析的应用

典型相关分析的用途很广。在实际分析问题中,当我们面临两组多变量数据,并希望研究两组变量之间的关系时,就要用到典型相关分析。

例如,为了研究扩张性财政政策实施以后对宏观经济发展的影响,就需要考察有关财政政策的一系列指标如财政支出总额的增长率、财政赤字增长率、国债发行额的增长率、税率降低率等与经济发展的一系列指标,如国内生产总值增长率、就业增长率、物价上涨率等两组变量之间的相关程度。又如,为了研究宏观经济走势与股票市场走势之间的关系,就需要考察各种宏观经济指标如经济增长率、失业率、物价指数、进出口增长率等与各种反映股票市场状况的指标如股票价格指数、股票市场融资金额等两组变量之间的相关关系。再如,工厂要考察所使用的原料的质量对所生产的产品的质量的影响,就需要对所生产产品的各种质量指标与所使用的原料的各种质量指标之间的相关关系进行测度。

又如,在分析评估某种经济投入与产出系统时,研究投入和产出情况之间的联系时,投入情况面可以从人力、物力等多个方面反映,产出情况也可以从产值、利税等方面反映;

再如在分析影响居民消费因素时,我们可以将劳动者报酬、家庭经营收入、转移性收入等变量构成反映居民收入的变量组,而将食品支出、医疗保健支出、交通和通讯支出等变量构成反映居民支出情况的变量组,然后通过研究两变量组之间关系来分析影响居民消费因素情况。

第二节 典型变量与典型相关系数的求法

(一)总体典型变量与典型相关系数

由上一节的数学描述我们知道,典型相关分析希望寻求a 和b 使得ρ达到最大,但是由于随机变量乘以常数时不改变它们的相关系数,为了防止不必要的结果重复出现,最好的限制是令Var ()U =1和Var ()V =1。于是,我们的问题就转化为,在约束条件为Var ()U =1和Var ()V =1下,寻找非零常数向量a 和b 使得相关系数Corr ()V U ,=a ′

12

b 达到最

大。

根据数学分析中条件极值的求法,引入拉格朗日(Lagrange)乘数,问题则转化为,求

()=b a ,φa ′∑12b ()

−′−

∑12

11

a a λ

()

12

11

−′∑b b ν

的极大值点,其中νλ,是拉格

朗日乘数。由极值的必要条件,需求φ对a 和b 的偏导数,并令其等于零,得到的极值条件为:

⎪⎪⎩⎪⎪⎨

⎧=−=∂∂=−=∂∂∑∑∑∑0022211112

b a b

a b a νφλφ

将分别以a ′和b ′左乘上式,得

a ′

b ∑12λλ=′=∑a a 11

b ′

a ∑

21

νν=′=∑b b 22

相关文档
最新文档