SPSS软件中对应分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对应分析

当A 与B 的取值较少时,把所得的数据放在一张列联表中,就可以很直观的对A 与B 之间及它们的各种取值之间的相关性作出判断,当ij P 较大时,则说明属性变量A 的第i 状态与B 的第j 状态之间有较强的依赖关系.但是,当A 或者B 的取值比较多时,就很难正确的作出判断,此时就需要利用降维的思想简化列联表的结构.

几个基本定义:

我们此处讨论因素A 有n 个水平,因素B 有p 个水平。 行剖面:当变量A 的取值固定为i 时(i=1,2,…,n ),变量B 的各个状态相对出现的概率情况,即:可以方便的把第i 行表示成在p 维欧氏空间中的一个点,其坐标为:

)

,,,(..2

.1i ip i i i i r

i

p p p p p p p = ,i=1,2,… , n ,

实际上,该坐标可以看成p 维超平面121=+++p x x x 上的点。记n 个行剖面的集合为n(r)。

由于列联表行与列的地位是对等的,由上面行剖面的定义方法,可以很容易的定义列剖面。 列剖面:

)

,,,(..2.1j nj

j j j j c

j

p p p p p p p = ,j=1,2,… , p,

实际上,该坐标可以看成n 维超平面121=+++n x x x 上的点。记p 个列剖面的集合为p(c)。

定义了行剖面和列剖面之后,我们看到属性变量A 的各个取值情况可以用p 维空间的n 个点来表示,而B 的不同取值情况可以用n 维空间上的p 个点来表示。而对应分析就是利用降维思想,把A 的各个状态表现在一张二维图上,又把B 的各个状态表现在一张二维图上,且通过后面的分析可以看到,这两张二维图的坐标有着相同的含义,即可以把A 的各个取值与B 的各个取值同时在一张二维图上表示出来。 距离:

通过行剖面与列剖面的定义,A 的不同取值可以利用P 维空间中

的不同点表示,各个点的坐标分别为r

i P (i=1,2,…,n )。而B

的不同取值可以用n 维空间中的不同点表示,各个点的坐标分别

为c

j P (j=1,2,…,p )。对此,就可以引入距离概念来分别描

述A 的各个状态之间与B 的各个状态之间的接近程度。 定义A 的第k 状态与第l 状态之间的加权距离为:

2

1

..2

)

(

),(.

.

∑=-

=p

j j lj j kj l k p p p p p p l k D ,

该距离也可以看做是坐标为:

)

,

,,

(

.

..

2.2.

1.1i p ip

i i i i p p p p p p p p p ,i=1,2,…,n (1)

的任意两点之间的普通欧式距离。

类似的,定义属性变量B 的两个状态s ,t 之间的加权距离为:

2

1

...2

)(),(.∑=-

=n

i t

i it

i is

p p p p p p t s D s

总惯量:

根据上面的准备,可以给出行剖面集合n(r)的总惯量的定义: 由(1)式定义的n 个点与其重心的欧式距离之和称为行剖面集合n(r)的总惯量,记为I I 。

注意:(1)总惯量类似方差,反映差异信息。

(2)经过数学分解,我们可以得知,总惯量与2

χ统计量

仅相差一个常数,而由前面列联表的分析我们知道,2

χ统计量

反映了列联表横栏与纵栏的相关关系。

对应分析就是在总惯量信息损失最小的前提下,简化数据结构以反映两属性变量之间的相关关系。实际上,总惯量的概念类似于主成分分析或因子分析中方差总和的概念。在SPSS 软件中进行对应分析,系统会给出对总惯量的提取情况。

完全对应的,我们对列进行相应分析,可以得到列剖面集

合的总惯量为:2

1χn

I I I J ==

SPSS 中有一个概念:惯量:相当于因子分析中的特征根,用于说明对应分析各个维度的结果能够解释列联表中两变量联系的程度。

对应分析基本理论:

经过上述变化后,就可以直接计算属性变量各个状态之间的距离,通过距离大小反映各个状态之间的接近程度,同类型的状态之间距离应当较短,而不同类型的状态之间距离应当较长,据此可以对各个状态之间进行分类以简化数据结构。但是,这样做不能对两个属性变量同时进行分析。因此,我们不计算距离,代之求协方差矩阵,进行主成分分析,提取主成分,用主成分所定义的坐标轴作为参照系,对两个变量的各个状态进行分析。 计算行剖面的协方差矩阵Z Z r '=∑,列剖面的协方差矩阵

Z Z c '=∑。具体分解过程可参考《多元统计分析》,何晓群。

由矩阵的知识可知,Z Z r '=∑,Z Z c '=∑有相同的非零特征根。

j j j j r u u Z Z u λ='=∑ ,对该式两边左乘矩阵Z ',有 )()(j j j u Z u Z Z Z '=''λ ,

即)()(j j j c u Z u Z '='∑λ。

该式表明:对于因素A 降维,投影方向为 ,,21u u ,

对于因素B 降维,投影方向为 ,,21'

u Z u Z ' ,这两个直角坐标

重合。这样,因素A 和因素B 降维后可以在同一个坐标轴中表示出来,只不过对坐标轴有一个拉伸。

注意: r ∑与c ∑具有相同的非零特征根,而这些特征根正是各个公因子所解释的方差,或提取的总惯量的份额,即有:

相关文档
最新文档