对应分析数学模型解析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对应分析数学模型解析

1.对应分析模型的提出

在因子分析时常常会出现以下三个问题:

第一,因子分析分为R型和Q型,寻找变量的公因子就采用R型,寻找样品的公因子就采用Q型;R型是从变量的相关系数矩阵出发,Q型是从样品的相似矩阵出发。在因子分析中把R型和Q型互相割裂单独进行,有些问题只做R型分析,有些只做Q型分析,即使有些问题同时做了这两种分析,在解释时也无法将它们有机地联系起来。然而变量和样品是分不开的,这也就说明R型分析和Q 型分析是不可分割的。

第二,在实际生活中,我们往往取得样本数目要远远大于变量的数目,这就给Q型因子分析带来了计算上的困难。比如说,有150个样品,每个样品分析10个变量,如果做R型因子分析时只需计算10

10⨯阶的变量向关系数矩阵的特征值和特征向量,而Q型因子分析则要计算150

150⨯阶的样品相似矩阵的特征值和特征向量,这个计算量相当可观。

第三,在因子分析中我们为了能将量纲不同的变量进行比较,往往要对变量进行标准化处理,然而这种标准化只能对变量进行,对样品则无从谈标准化,所以标准化对变量和样品是非对等的,这也就给R型和Q型因子分析之间的联系带来障碍。

针对以上问题,我们综合了Q型和R型因子分析的优点,并将他们统一起来使得由R型的分析结果很容易得到Q型的分析结果,这就克服了Q型分析计算量大的问题,更重要的是可以把变量和样品的载荷反映在相同的公因轴上,这样把变量和样品连接起来便于解释和推断。

2. 基本思想:是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。首先编制两变量的交叉列联表,将交叉列联表中的每个数据单元看成两变量在相应类别上的对应点;然后,对应分析将变量及变量之间的联系同时反映在一张二维或三维的散点图;最后,通过观察对应分布图就能直接地把握变量之间的类别联系;

3. 它最大特点:是能把众多的样品和众多的变量同时作到同一张图解

上,将样品的大类及其属性在图上直观而又明了地表示出来,具有直观性。另外,它还省去了因子选择和因子轴旋转等复杂的数学运算及中间过程,可以从因子载荷图上对样品进行直观的分类,而且能够指示分类的主要参数(主因子)以及分类的依据,是一种直观、简单、方便的多元统计方法。

4.对应分析的原理和方法

(1)对应分析的数据变换方法

设有n 个样品,每个样品有p 个变量,其资料阵为:

⎪⎪⎪⎪⎪⎭

⎫ ⎝⎛=np n2n12p 22211p 12x x x x x x x x x 11X 现在,我们既要对变量求它的主成分又要对样品求主成分,用p n ⨯阵X 表示数据阵,它的样品离差阵是()ij a A =,其中 p j i x x x x a j kj n k i ki ij ,1,))((1=--=

∑= 或者 '-='=n n n n n I I n

I D X D X A 1其中 而将样品看成是变量时,它的离差阵为 p p p p p l I p

I D X XD A 1,*-='= 因此,一般A 和A *的非零特征根不一样。

由于Z Z Z Z ''和有相同的非零特征根,现在我们将数据阵A 做一变换,成为Z ,使得的作用和能起到和A Z Z *A Z Z ''。

分别用分..

.,.x j x i x 和别表示X 的行和、列和与总和,那么

T

x x x x x x n i p

j ij p i ij

j p

j ij

i ====∑∑∑∑====11..1

.1

.

..../),(/x x p p x X P ij ij ij ===即令 那么就有,1,1011=<<∑∑==n i p

j ij ij p p 且

因而ij p 可解释为“概率”。 类似的,用j i p p ..,表示P 阵的行和列和,那么就可以得出一个列联表,通过分析就有:

⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫ ⎝⎛..

2.1..2.1,,,,,,i ip i i i i i ip i i i i x x x x x x p p p p p p 称作i 行的形象,其和为1。 类似的,有:

⎪⎪⎭

⎫ ⎝⎛=⎪⎪⎭⎫ ⎝⎛j nj j j j j j nj j j j

j x x x x x x p p p p p p .,,,,,,.2.1..2.1 称作j 列的形象,其和为1。 考虑点集 1(){(/,

,/)|1,,}i i ip i N R p p p p i n ==,行形象点集。 1(){(/,,/)|1,,}j j nj j N C p p p p j p ==,列形象点集。 由于/ij i p p 发生的机会是i p ,故第j 个列变量的期望是(记作j g ) 111/n n n

ij j i ij j i i i i p g p p p p ======∑∑∑

相关文档
最新文档