典型相关分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

典型相关分析

问题的提出

设牛肉价格,猪肉价格分别用随机变量1x ,2x 表示;牛肉消费量,猪肉消费量分别用随机变量3x ,4x 表示。我们要研究随机向量

()12,x x '与随机向量()34,x x '之间的相关关系.

为此,首先建立1x ,2x ,3x ,4x 的相关矩阵R .若

1

0.1810.5640.4990.18110.3550.7570.5640.35510.1030.4990.7570.1031R --⎛⎫ ⎪-

⎪= ⎪-- ⎪--⎝⎭

由R 可以看到各个变量之间的关系,例如,310.564r =-,表明牛肉涨价,则消费量下

降;42

0.757r =-,表明猪肉涨价,则消费量下降;320.355r =,表示猪肉价格与牛肉消

费量之间的相关系数,即猪肉涨价时,人们转而多买牛肉,故牛肉消费量上升;反之,牛肉

涨价时,人们转而多买猪肉,从而猪肉消费量上升. 由上例看出,为研究随机向量

()12,x x '和()34,x x '之间的相关关系,可以从相

关阵R 出发,找出两个随机向量的各个分量两两之间的相关程度,并由此进行分析。设两个随机向量的维数分别为

1p ,2p ,这时共有12p p ⨯个相关系数,分析起来比较繁琐,并且

由于各个分量之间的关系错综复杂,这种分析很难抓住事物的本质.

因此,我们希望构造“价格向量"()12,x x '的函数(常用线性函数)称为“价格指数”,

同时构造“消费向量”

()34,x x '的函数(常用线性函数)称为“消费指数”,并要求价格指

数和消费指数具有最大的相关关系,然后在价格指数和消费指数的基础上分析价格向量和消费向量的相关性,这就是典型相关分析的思想。

一般来说,设x 和y 分别为

p 维和q 维随机向量,为了研究x 和y 之间的相关关系,

我们的想法是,找出x 各分量的一个线性组合,同时找出

y 各分量的一个线性组合,并使这

两个线性组合表示的变量具有最大的相关性,我们称这种相关为典型相关,称这一对新变量为典型变量.继而,还可以找出由x ,y 出发找出第二对线性组合,使其与第一对线性组合不相关,而这一对线性组合之间又具有最大的相关性,于是得到第二对典型变量。如此继续下去,使x 和

y 间的相关性基本提取完毕为止。然后在典型变量的基础上分析x 和y 相关性。

上述统计方法称为典型相关分析.

典型相关分析的应用范围十分广泛。在经济学中,用以研究价格向量与消费向量之间的联系;在生物学中,用以研究生物群这一组变量与生物环境这一组之间的联系;在教育统计中,用以研究高考各科成绩与大学各科成绩之间的联系等等.

例 设()12,x

x x '=和()12,y y y '=均为2维随机变量,(),x y '''的相关阵

1

0.1810.5640.4990.18110.3550.7570.5640.35510.1030.4990.7570.1031R --⎛⎫ ⎪-

⎪= ⎪-- ⎪--⎝⎭

试求()12,x

x x '=和()12,y y y '=的典型变量及典型相关系数.

解 记

⎪⎪⎭⎫ ⎝⎛=1181.0181.0111R ⎪⎪⎭

⎝⎛---=757.0355.0499.0564.012R 221

0.1030.1031-⎛⎫∑= ⎪-⎝⎭ 1221'∑=∑

(1) 求1

1

22

210.6220.2800.5630.728A --⎛⎫

=∑∑= ⎪

--⎝⎭ 1

1

11

1222

210.6150.0910.0940.635A --⎛⎫

=∑∑∑∑= ⎪

⎝⎭

(2) 求A 的非零特征根 A 的非零特征根为 2

1

0.718λ=

, 2

2

0.532λ=

(3) 求A 相应于2

1λ,2

2λ的规格化特征向量 (设*i μ

A 相应于2

i λ

的特征向量,

*i

C =,**1i i i

C μμ=,则i μ 为A 相应于2

i λ的规格化特征向量,1,

,i r =)

A 相应于21λ,2

2λ的规格化特征向量取为

()10.6120.688μ'= ()20.7020.644μ'=-

(4) 求典型变量和典型相关系数 令1111

122211111A νλμλμ---=∑∑= ,12212A νλμ-=,则

()10.2220.997ν'=--,()20.8460.101ν'=-

于是()12,x

x x '=和()12,y y y '=的典型变量为

11120.6120.688z x x x μ'==+ 11120.2220.997w v y y y '==-- 22120.7020.644z x x x μ'==- 22120.8460.101w v y y y '==-+

典型相关系数为

10.847λ=

20.729λ=

相关文档
最新文档