多元统计典型相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
典型相关分析的基本思想
典 型 相 关 分 析 求 解 方 法
典型相关分析通常可采取两种方法:
方法1 讨论第一组每个变量和第二组每个变量 的相互关系,得到pq个相关系数,再用这些相 关系数反应两组变量的关系。
BUT 。。在两组变量较多时,方法繁琐也不容 易抓到问题实际。
简单相关系数的局限性
--- 用来描述两个变量的之间的线性相关性。
哈罗德· 霍特林(HaroldHotelling,1895— 1973):统计学界、经济学界、数学界 公认大师
典 型 相 关 分 析 相 关 实 例
典型相关分析的应用十分广泛。。。。。 例如~~
X1, X2, …, Xp Y1, Y2ቤተ መጻሕፍቲ ባይዱ …, Yq
1 小伙子追求姑娘的指标要求 姑娘向往的小伙子的指标 ~~ 外貌, 身高, 学历。。。 ~~~工作,家庭,人品。。 2 创新投入~~人员,研究开发经 创新产出~~专利,论文, 费,设施。。 产品。。 3 长子头的~~长度, 宽度 4 身体形态 ~~ 年龄,体重, 胸围 次子头的~~长度,宽度 健康状况~~脉搏,血压
也是一种运用于多元统计中的降维技术。
其目的是识别并量化两组变量之间的联系, 将两组变量相关关系的分析,转化为一组变量 的线性组合与另一组变量线性组合之间的相关 关系分析。
统 计 思 想 和 基 本 理 论
典型相关分析最早由1936年霍特林 Hotelling在《生物统计》上发表的论文《两 组变量之间的关系》提出, 其计算方法后经 过多年的应用日趋完善。
典 型 相 关 分 析 求 解 方 法
一元统计分析: 用相关系数来衡量两个随机变量 之间的线性相关关系;用复相关系数研究一个 随机变量和多个随机变量的线性相关关系。 Q: 遇到比较两组变量的相关性问题,怎 么办? 多元统计分析: 运用典型相关分析研究两组变量 x1,x2…xp 与 y1, y2…yq之间的线性关系, 将每一组变量作为一个整体进行分析。。。两 组变量间的相关关系。
典型相关分析及应用
研究多个变量与多个变量之间的相关性
典型相关分析
典型相关分析基本理论
典型相关分析求解方法 典型相关系数的假设检验 典型相关分析在SPSS中的运用
统 计 思 想 和 基 本 理 论
典型相关分析 ( Canonical Correlation Analysis) 是研究两组变量之间相关关系的一种多元计 方法。它能够揭示出两组变之间的内在联系。
(i ) (1) aP XP
a(i ) X(1)
(i ) (2) Vi b1(i ) X1(2) b2 X2
(i ) (2) bq Xq
b(i) X(2)
典型相关分析的基本思想
D(U ) D(aX (1) ) aCov( X (1) , X (1) )a aΣ11a D(V ) D(bX (2) ) bCov( X (2) , X (2) )b bΣ22b Cov(U ,V ) aCov( X (1) , X (2) )b aΣ12b aΣ12b Cov(U ,V ) Corr(U ,V ) D(U ) D(V ) aΣ11a bΣ22b
只是孤立考虑单个X与单个Y间的相关,没 有考虑X、Y变量组内部各变量间的相关。 两组间有许多简单相关系数(例~每组30个 变量),使问题显得复杂,难以从整体描述。
难以抓到重点
典 型 相 关 分 析 求 解 方 法
方法2 在每组变量中选择若干个由代表性的综 合指标,这些指标是原始变量的线性组合,代 表了原始变量的大部分信息, 且两组综合指标 的相关程度最大。 (类似于主成分分析法)
典型相关分析的基本思想
一般情况,设
为两个相互关联的随机向量,分别在两组变量中选取若
(1) X (1) ( X1(1) , X 2 ,
(1) (2) , Xp ) 、 X (2) ( X1(2) , X 2 ,
(2) , Xq )
干有代表性的综合变量Ui、Vi,使得每一个综合变量是
原变量的线性组合,即
(i ) (i ) (1) Ui a1 X1(1) a2 X2 (i ) (1) aP XP
a(i ) X(1)
(i ) (2) Vi b1(i ) X1(2) b2 X2
(i ) (2) bq Xq
b(i) X(2)
与
a
典型相关分析的基本思想
b
(i ) (i ) (1) Ui a1 X1(1) a2 X2
5 人口出生~~多孩率,计划生育 教育生活水平~~初中毕业 率 率,收入水平,生活水平
典 型 相 关 分 析 相 关 实 例
再如~~~
考察一些与财政政策有关的指标--如财政支出 总额的增长率,财政赤字增长率,税率降低, 和 与经济发展的一系列指标如国内GDP增长率, 就业增长率,物价上涨率等,来研究扩张性财 政政策实施后对宏观经济发展的影响.
典型相关分析的基本思想
第一步:估计组合系数使得对应的典型变量和相关系 数达到最大。最大的相关系数为第一典型相关系数 ,且称有最大相关系数的这对典型变量为典型相关 变量。 第二步:再次估计组合相关系数,找出第二大的典型 相关系数,称为第二典型相关西湖,称有第二大相 关系数的这对典型变量为第二典型相关变量。。 设两组的变量个数为p, q, p<q, 那么寻求典型变量 的过程可一直重复, 直到得到P对典型变量。。
新产生的综合指标成为典型相关变量 Canonical Variable,通过少数的几个综合变 量来反应两组变量的相关性质。
方法2更为简洁直接 ~~ 典型相关分析的中心思想。
典型相关分析的基本思想
• 首先在每组变量中找出变量的线性组合,使得两组的线性 组合之间具有最大的相关系数。 • 然后选取和最初挑选的这对线性组合不相关的线性组合, 使其配对,并选取相关系数最大的一对,如此继续下去, 直到两组变量之间的相关性被提取完毕为此。 • 被选出的线性组合配对称为典型变量,它们的相关系数称 为典型相关系数。典型相关系数度量了这两组变量之间联 系的强度。