第九章对应分析资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用多元统计分析
第九章对应分析
对应分析又称相应分析,于1970年由法国统计学家J.P.Beozecri提出的.它是在R型和Q型因子分析基础上发展起来的多元统计分析方法,故也称为R-Q型因子分析.
因子分析方法是用少数几个公共因子去提取研究对象的绝大部分信息,既减少了因子的数目,又把握住了研究对象的相互关系.在因子分析中根据研究对象的不同,分为R型和Q型,如果研究变量间的相互关系时采用R型因子分析;如果研究样品间相互关系时采用Q型因子分析.
无论是R型或Q型都未能很好地揭示变量和样品间的双重关系.
另方面在处理实际问题中,样本的大小经常是比变量个数多得多.当样品个数n很大(如n>100),进行Q型因子分析时,计算n阶方阵的特征值和特征向量对于微型计算机的容量和速度都是难以胜任的.
还有进行数据处理时,为了将数量级相差很大的变量进行比较,常常先对变量作标准化处理,然而这种标准化处理对于变量和样品是非对等的,这给寻找R型和Q型之间的联系带来一定的困难.
第九章什么是对应分析
对应分析方法是在因子分析的基础上发展起来的,它对原始数据采用适当的标度方法.把R型和Q型分析结合起来,同时得到两方面的结果---在同一因子平面上对变量和样品一块进行分类,从而揭示所研究的样品和变量间的内在联系.
对应分析由R 型因子分析的结果,可以很容易地得到Q 型因子分
析的结果,这不仅克服样品量大时作Q 型因子分析所带来计算上的困
难,且把R 型和Q 型因子分析统一起来,把样品点和变量点同时反映到
相同的因子轴上,这就便于我们对研究的对象进行解释和推断.
第九章 对应分析的基本思想
由于R 型因子分析和Q 型分析都是反映一个整体的不同侧面,因
而它们之间一定存在内在的联系. 对应分析就是通过一个变换后的
过渡矩阵Z 将二者有机地结合起来.
具体地说,首先给出变量间的协差阵R S =Z'Z 和样品间的协差阵
Q S =ZZ' ,由于Z'Z 和ZZ'有相同的非零特征根,记为12...m λλλ≥≥≥,如
果R S 的特征根i λ对应的特征向量为i v ,则Q S 的特征根i λ对应的特征向量i i i u Zv λ=.由此可以很方便地由R 型因子分析而得到Q 型因子分析
的结果.
对应分析的基本思想
由A 的特征根和特征向量即可写出R 型因子分析的因子载荷阵
(记为R A )和Q 型因子分析的因子载荷阵(记为Q A ).
§9.1 什么是对应分析
基本思想
由于A和B具有相同的非零特征根,而这些特征根又正是各个公共因子的方差,因此可以用相同的因子轴同时表示变量点和样品点,即把变量点和样品点同时反映在具有相同坐标轴的因子平面上,以便对变量点和样品点一起考虑进行分类.
第十章典型相关分析
相关分析是研究多个变量与多个变量之间的相关关系.如研究两个随机变量之间的相关关系可用简单相关系数表示;研究一个随机变量与多个随机变量之间的相关关系可用全相关系数表示.
1936年Hotelling首先将相关分析推广到研究多个随机变量与多个随机变量之间的相关关系,故而产生了典型相关分析,广义相关系数等一些有用的方法.
第十章什么是典型相关分析
在实际问题中,经常遇到要研究一部分变量和另一部分变量之间的相关关系,例如:
在工业中,考察原料的主要质量指标(1,.....,p X X ) 与产品的主要
质量指标(1,.....,p Y Y )间的相关性;
在经济学中,研究主要肉类的价格与销售量之间的相关性;
在地质学中,为研究岩石形成的成因关系,考察岩石的化学成份
与其周围围岩化学成份的相关性;
在气象学中为分析预报24小时后天气的可靠程度,研究当天和前
一天气象因子间的相关关系;
第十章 什么是典型相关分析
在教育学中,研究学生在高考的各科成绩与高二年级各主科成
绩间的相关关系;
在婚姻的研究中,考察小伙子对追求姑娘的主要指标与姑娘想往
的小伙子的主要尺度之间的相关关系;
在医学中,研究患某种疾病病人的各种症状程度与用科学方法检
查的一些结果之间的相关关系;
在体育学中,研究运动员的体力测试指标与运动能力指标之间的
相关关系等.
第十章 什么是典型相关分析
一般地,假设有一组变量1,.....,p X X 与另一组变量1,.....,p Y Y (也可以
记为1,....,p p q X X ++),我们要研究这两组变量的相关关系,如何给两组变
量之间的相关性以数量的描述,这就是本章研究的典型相关分析.
当p=q=1时,就是研究两个变量X 与Y 之间的相关关系.简单相关
系数是最常见的度量.其定义为
第十章 什么是典型相关分析
当p ≥ 1 ,q=1时(或 q ≥ 1 , p =1)
设
则称
为Y 与(X1,…,Xp) 的全相关系数.
其实Y 对X 的回归为
1(|)()()Y YX XX X E Y X x def x μμϕ-
=+∑∑-
且 并称R 为全相关系数 .
第十章 什么是典型相关分析 当p,q>1时,利用主成分分析的思想,可以把多个变量与多个变
量之间的相关化为两个新变量之间的相关.
也就是求α=(α1,…, αp )
'和β =(β1,…, βq ) ' , 使得新变量:
V = α1X 1+…+αp X p = α 'X
1~(,),0XX XY p YX YY X N Y μσ+∑∑⎛⎫⎛⎫∑∑=> ⎪ ⎪∑⎝⎭⎝⎭
1/21
YX XX XY YY R σ-⎛⎫∑∑∑= ⎪⎝⎭(,())Y x R
ρϕ=