典型相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
整体检验
整体检验的结果表明典型相关系数对于总体之间的相关具有解释力,有推断意义。
择业价值观两变式的解释力
择业价值倾向两变式对本组观测变量总方差的代表比例
Cv1-1表示第一组观测变量 为第一个变式所解释的比例 Cv1-2表示第一组观测变量 为第二个变式所解释的比例
Prop Var .241 .759
-1 2 Σ11 Σ12 Σ-1 Σ a λ a1 0 22 21 1
1 将 12 11 左乘(3)的第一式,并将第二式代入,得
-1 Σ21Σ11 Σ21b1 - λΣ12a1 0
1 1 的特征根 22 12 11 21
Σ21Σ Σ12b1 - λ Σ22b1 0
典型相关的数据要求
等距或等比数据 称名或顺序数据
需要注意的是第二类数据需要转化为虚拟变量之后,才能
进行典型相关分析。
单个观测变量数据分布符合正态分布;多个观测变量的联 合数据分布符合多元正态分布;误差的方差是齐性的。
典型相关的基本假设
典型相关分析是一种多元分析方法,因此它的检验也是多 元检验,多元假设涉及多个典型相关系数的同时检验。
各变量之间的相关矩阵
择业价值倾向与求职效能感不同纬度皮尔逊相关分析 1 1.000 .724 2 .724 1.000 3 .162 4 .127 5 .117
个人取向 社会取向 职业倾向 信息搜集
P-COR P-COR P-COR P-COR
求职胜任力 P-COR
.162 .127 .117
.035 .057 .117
a1Σ12b1 λ 1 Σ 21a1 b
Σ12 Σ-1 22 Σ21a1 - νΣ12b1 0
并将第一式代入,得
1 1 的特征根 11 12 22 21
是 2 ,相应的特征 2 Σ12 Σ-1 Σ a λ Σ11a1 0 向量为 22 21 1 1
(1)
的极大值,其中和是 Lagrange乘数。
a Σ12b1 - λΣ11a1 0 1 Σ 21a1 - νΣ 22b1 0 1
(2)
Σ12b1 - λΣ11a1 = 0 Σ21a1 - νΣ22b1 = 0
(3)
将上面的3式分别左乘 a 1 和 b 1
首先分别在每组变量中找出第一对线性组合,使其具有 最大相关性
u1 a11 x1 a21 x2 a p1 x p v1 b11 y1 b21 y2 bq1 yq
然后再在每组变量中找出第二对线性组合,使其分别与 本组内的第一线性组合不相关,第二对本身具有次大的 相关性。
u2 a12 x1 a22 x2 a p 2 x p v2 b12 y1 b22 y2 bq 2 yq
u2和v2与u1和v1相互独立,但u2和v2相关。如此继续下 去,直至进行到r步,两组变量的相关性被提取完为止。 rmin(p,q),可以得到r组变量。
u1 a11 x1 a21 x2 V1 b11 y1 b21 y2 b31 y3
(u1 , v1 ) ?
x1
y1 y2 y3
u2 a12 x1 a22 x2 v2 b12 y1 b22 y2 b32 y3
x2
(u2 , v2 ) ?
如果我们记两组变量的第一对线性组合为:
u1 = a 1X
v1 = b 1Y
其中:
a1 (a11 , a21 ,, a p1 ) 方差求解特征根和特征 b1 (b11 , b21,, bq1 )
向量的计算
Var (u1 ) a 1Var ( X)a1 a1 Σ11a1 1 Var ( v1 ) b 1Var (Y)b1 b1 Σ 22b1 1
CV1-1 CV1-2
择业价值倾向两变式对第二组观测变量总方差的代表比例 Prop Var CV2-1 CV2-2
Cv2-1表示第二组观测变量 为第一个变式所解释的比例 Cv2-2表示第二组观测变量 为第二个变式所解释的比例
.010 .011
求职效能感两变式的解释力
求职效能感两变式对本组观测变量总方差代表比例 Prop Var CV2-1 CV2-2
求职效能感三个维度对典型变式的负载量
对于求职效能感
变式1表明其主要是受职业倾向的影响,负方向,其中职 业倾向的负载量较大,为-0.943;
变式2表明主要是受信息搜集能力的影响,正方向,其中
信息搜集能力的负载量较大,为0.970
择业价值倾向两个纬度的交叉负载量
求职效能感三个纬度的交叉负载量
1 和 1是相应于 结论: 2 既是M1又是M2的特征根, M1和M2的特征向量。
至此,典型相关分析转化为求M1和M2特征根和特征向量的 问题。 第一对典型变量提取了原始变量X与Y之间相关的主要部分, 如果这部分还不能足以解释原始变量,可以在剩余的相关中再
求出第二对典型变量和他们的典型相关系数。
-1 11 2 -1 2 Σ-1 Σ Σ Σ b λ b1 0 22 21 11 12 1
-1 M1 = Σ11 Σ12 Σ-1 22 Σ 21 -1 M 2 = Σ-1 Σ Σ 22 21 11 Σ12
是 2 ,相应的特征 向量为 1
令
2 M a = λ a 1 2 M b = λ b 2
.019 .006
结论
典型相关分析的结果表明,尽管典型便是能够较好的解释 观测变量,但是择业价值倾向对求职效能感并存在好的解
释力。
举例
在对大学生的择业价值倾向和求职效能感的分析中,我们 试图了解二者之间的相关关系。 其中择业价值倾向可以分为社会价值取向( X1 )和个人 价值取向( X2 )两个维度;而求职效能感有职业倾向 ( Y1 )、求职胜任力( Y2 )、搜索求职信息能力 ( Y3 )三个维度。
可以形成两个典型变式
Cv2-1表示第二组观测变量 为第一个变式所解释的比例 Cv2-2表示第二组观测变量 为第二个变式所解释的比例
.435 .412
求职效能感两变式对第二组观测变量总方差代表比例
Prop Var CV1-1 CV1-2
Cv1-1表示第一组观测变量为第 一个变式所解释的比例 Cv1-2表示第一组观测变量为第 二个变式所解释的比例
.035 1.000 .597 .502
.057 .597 1.000 .529
.117 .502 .529 1.000
典型相关系数及其平方和
择业价值倾向和求职效能感之间的典型相关系数及其平方和 Root No. Eigenvalue 1 2 .045 .015 Pct. Cum. Pct. Canon Cor. 75.421 24.579 75.421 100.000 .208 .121 Sq. Cor .043 .015
u1 ,v1 Cov(u1 ,v1 ) a 1Cov(X, Y)b1 a1 Σ12b1
所以,典型相关分析就是求1和b1,使uv达到最大。
求解方法
根据数学分析中条件极值的求法,引入 Lagrange乘数,求极值问题,则可以转化为求
(a1 , b1 ) a1 Σ12b1 (a1 Σ11a1 1) (b 1 Σ 22b1 1) 2 2
交叉负载量的解释
在对择业价值倾向与求职效能感的分析中发现,变式1个人价值取向 对求职效能感的负载量较大,为0.145,变式2中社会价值取向的对求 职效能感的负载量较大,为0.121。
即个人价值取向的得分越高,个体对自己择业能力的判断则越低;可 以解释为社会价值取向得分越高,个体对自己信息搜集能力的评价越 积极。
数据统计分析实例
——大学生择业价值取向与求职效能感的关系分析
在对410名在校大学生的择业价值倾向和求职效能感的分 析中,我们试图了解二者之间的相关关系。
其中择业价值倾向可以分为社会价值取向( X1 )和个人
价值取向( X2 )两个维度;而求职效能感有职业倾向 ( Y1 )、求职胜任力( Y2 )、搜索求职信息能力 ( Y3 )三个维度。
根据典型相关系数的分析,可以发现,变源自文库1的特征值为0.045, 变式2的特征值0.015。
择业价值取向典型相关系数
U1=-1.449个人价值取向+1.042社会价值取向 U2=-0.009个人价值取向+1.006社会价值取向
择业价值倾向两纬度对典型变式的负载量
对于择业价值取向
变式1表明其主要是受个人价值取向的影响,负方向,在 对负载量的分析中也发现个人价值取向的负载量较大,为
H0:cr1=cr2=^=crd=0
其中cr表示总体中对应的典型相关系数,下标表示该典型 相关系数的序号。
该假设的意义是总体中对应的相关系数都是0,即总体中 变量组在个维度上都是不相关的。
典型相关分析运算思路
对于两组变量
( x1 , x2 ,, x p )
( y1 , y2 ,, yq )
-0.695;
变式2表明主要是受社会价值的影响,正方向,在对负载 量的分析中发现社会价值取向的负载量较大,为1.000;
求职效能感各纬度典型相关系数
U1=-1.029职业倾向+(-0.192)求职胜任力+0.391信息搜集能力 U2=-0.307职业倾向+0.074求职胜任力+1.085信息搜集能力
典型相关分析
基本内容
典型相关的基本思想及举例 典型相关的数据要求 典型相关的基本假设 典型相关分析运算思路 数据统计分析实例
典型相关的基本思想
通常情况下,为了研究两组变量
( x1 , x2 ,, x p ) ( y1 , y2 ,, yq )
的相关关系,可以用最原始的方法,分别计算两组变 量之间的全部相关系数,一共有pq个简单相关系数, 这样不能两组变量之间的整体相关信息。如果能够采 用类似于主成分的思想,分别找出两组变量的各自的 某个线性组合,讨论线性组合之间的相关关系,则更 简捷。
a1Σ12b1 - λa1Σ11a1 = 0 1 Σ 21a1 - νb1 Σ 22b1 = 0 b
a1Σ12b1 (u1, v1 )
将 Σ12 Σ-1 左乘(3)的第二式,得 22
-1 Σ12 Σ-1 Σ a νΣ Σ 22 21 1 12 22 Σ22b1 0