SAS软件与统计应用教程
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SAS软件与统计应用教程
STAT
(3) 典型相关系数的检验 用似然比法检验典型相关系数与零的差别是否显著, 其原假设为小于此对典型变量典型相关系数的所有典型 相关系数都为0,其p值依次为0.0010,0.0509和0.5089 等等,如图7-5所示,说明前两对典型相关系数基本具 有显著意义(在α > 0.0509的显著水平下)。因此,两 组变量相关性的研究可转化为研究前两对典型相关变量 的相关性。
STAT
肺活量 y5 4508 4469 4398 4068 4339
…
16 17 18
…
167.94 168.82 168.02
…
90.91 91.3 91.26
…
55.97 56.07 55.28
…
86.66 85.87 85.63
…
38.17 37.61 39.66
…
27.16 26.67 28.07
SAS软件与统计应用教程
STAT
这些综合变量被称为典型变量,或典则变量,第1对 典型变量间的相关系数则被称为第1典型相关系数。典 型相关系数能简单、完整地描述两组变量间关系的指标。 当两个变量组均只有一个变量时,典型相关系数即为简 单相关系数;当其中的一组只有一个变量时,典型相关 系数即为复相关系数。
STAT
2. 分析设置
在INSIGHT模块中打开数据集Mylib.xtyjn。 1) 选择菜单“Analyze”“Multivariate(Y X)(多元 分析)”,打开“Multivariate(Y X)”对话框; 2) 将6项形态指标:x1至 x6选为X变量,将5项机能指 标: y1至 y5选为Y变量,如图7-1左所示。
SAS软件与统计应用教程
STAT
2) 同一对典型相关变量 U i 和V i 之间的相关系数为 CanRi,不同对的典型相关变量之间互不相关,即:
CanRi Corr(U i ,V j ) 0 i j i j
3) Ui和Vi的均值为0,方差为1(i = 1,…,m)。 4) 1 ≥ CanR1 ≥ CanR2 ≥ … ≥ CanRm ≥ 0
【例7-1】1985年中国28省市城市男生(19~22岁)的调查 数据,见表7-1。其中6项形态指标:身高(cm)、坐高、 体重(kg)、胸围、肩宽、盆骨宽,分别记为x1 ,x2,…, x6;5项机能指标:脉搏(次/分)、收缩压(mmHg)、舒张 压(变音)、舒张压(消音)、肺活量(ml),分别记为y 1 , y2,…,y5。
SAS软件与统计应用教程
STAT
(5) 标准化变量的典型相关变量的系数 输出结果中还给出标准化变量的典型变量系数,如图 所示。 来自机能指标的第一典型变量CY1为(原始变量的右 上角带“*”表示为标准化变量):
SAS软件与统计应用教程
STAT
4. 典型相关系数的求解步骤
1) 求X,Y变量组的相关阵
R11 R= R21 R12 ; R22
2) 求矩阵
A = (R11)–1R12(R22)–1R21
和 B = (R22)–1R21(R11)–1R12, 可以证明A、B有相同的非零特征值; 3) 求A或B的特征值λi与CanRi,A或B的特征值即为典 型相关系数的平方:λi = (CanRi)2,i = 1,…,m。
SAS软件与统计应用教程
STAT
5. 特征根
特征根(eigenvalue)是方差分析和多元检验的基础,特 征根与典型相关系数之间的数量关系为:
CanRi2 第i特征根 1 CanRi2
上式可以理解为第i对典型变量表示观测变量总方差 作用的指标,它的值越大说明表示作用越大。
SAS软件与统计应用教程
SAS软件与统计应用教程
STAT
第七章 典型相关与对应分析
7.1 典型相关分析
7.2 对应分析
www.zhuanyeshantie.net整理发布
SAS软件与统计应用教程
STAT
7.1
典型相关分析
7.1.1 典型相关分析的概念与步骤
7.1.2 用INSIGHT模块实现典型相关分析
7.1.3 用“分析家”实现典型相关分析
SAS软件与统计应用教程
STAT
(1) 全部总体典型相关系数为0 H0:CanRi = 0,i = 1,…,m H1:至少有一个CanRi ≠ 0 检验的似然比统计量为
1 (1 ri2 )
i 1 m
对于充分大的n,当H0成立时,统计量
1 Q1 [n ( p q 3)] ln 1 2
近似服从自由度为pq的2分布。
SAS软件与统计应用教程
STAT
(2) 部分总体典型相关系数为0 仅对较小的典型相关作检验: H0:CanRi = 0,i = s,…,m,2 ≤ s ≤ m H1:至少有一个CanRi ≠ 0 其检验的统计量为
k 1
i k 1
(1 ri2 )
SAS软件与统计应用教程
STAT
3. 典型相关变量的性质
各对典型相关变量所包括的相关信息互不交叉,且满 足: 1) U1,U2,…,Um互不相关,V1,V2,…,Vm互不 相关,即其相关系数为
1, i j Corr(Ui ,U j ) 0, i j 1, i j Corr(Vi ,V j ) 0, i j
SAS软件与统计应用教程
STAT
3. 结果分析
(1) 典型相关系数 第1典型相关系数为0.939573,校正值为0.908276,标 准误差为0.026207,典型相关系数的平方为0.882797; 第2典型相关系数为0.877842,校正值为0.842459,标准 误差为0.051294,典型相关系数的平方为0.770606,如 图所示。
前两个典型相关系数比形态指标和机能指标两组间的 任何一个相关系数都大。
SAS软件与统计应用教程
STAT
(2) 典型变量所解释的变异 第二部分是的5个特征根(Eigenvalues),包括:特 征根、相邻两个特征根之差、特征根所占方差信息量的 比例和累积方差信息量的比例。从中可以看出,前两对 典型变量所能解释的变异占总变异(方差)的91.18%, 如图7-4所示。其它三个典型相关变量的作用很小,一 共只解释了总变异的9%,可以不予考虑。
38.44 38.3
26.53
27.38 27.14
74.3
77.5 77.7
112.3
117.4 113.3
69.3
75.3 72.1
50.2
63.6 52.8Biblioteka Baidu
4195
4039 4238
设表中数据已经存放在数据集Mylib.xtyjn中,试分析形 态指标和机能指标这两组变量间的相关性。
SAS软件与统计应用教程
SAS软件与统计应用教程
STAT
3) 单击“Output”按钮,在打开的对话框中选中 “Canonical Correlation Analysis(典型相关分析)” 复选框,单击下面的“Canonical Correlation Options (典型相关选项)”按钮,打开“Canonical Correlation Options”对话框, 并按下图右所示设置。 4) 三次单击“OK”按钮,得到分析结果。
m
对于充分大的n,当H0成立时,统计量
Qk 1
k 1 [n k ( p q 3) ri 2 ] ln k 1 2 i 1
近似服从自由度为(p – k)(q– k)的2分布。
SAS软件与统计应用教程
STAT
7.1.2 用INSIGHT模块实现典型相关分析
1. 实例
SAS软件与统计应用教程
STAT
(4) 典型相关结构 典型相关结构(下图)分别是各组原始变量与典型变 量两两之间的相关系数矩阵。从相关系数判断,形态指 标中除x5(0.0514)、x6(0.2433)外各变量与第一典型 变量间的相关性都比较高,机能指标中除y2(0.0975) 外各变量与第一典型变量间的相关性也都比较高。
x5与第二典型变量间的相关性比较高,y2与第二典型 变量间的相关性比较高。 y1与前两个典型变量的相关系数为负值。
SAS软件与统计应用教程
STAT
说明,第一对典型变量对肩宽x5和收缩压y2的解释作 用不大。 另外,从形态指标组的变量和机能指标组的典型变量 之间,以及机能指标组的变量和形态指标组的典型变量 之间的相关系数可见,各组变量与前两对典型变量之间 均有较强的相关。
STAT
6. 典型相关系数的标准误
1 CanRi2 SECanRi n 1
7. 典型相关系数的假设检验
典型相关系数的假设检验包括对全部总体典型相关系 数的检验和对部分总体典型相关系数的检验。对数据的 要求: 1) 两个变量组均应服从多维正态分布: (X,Y)~Np+q(μ,σ2) 2) n > p + q
…
76.2 77.2 74.5
…
110.9 113.8 117.2
…
68.5 71 74
…
56.8 57.5 63.8
…
4141 3905 3943
19
20 21
167.87
168.15 168.99
90.96
91.5 91.52
55.79
54.56 55.11
84.92
84.81 86.23
38.2
7.1.4 用CANCORR过程实现典型相关分析
SAS软件与统计应用教程
STAT
7.1.1 典型相关分析的概念与步骤
1. 典型相关分析的基本思想
典型相关分析采用主成分的思想浓缩信息,根据变量 间的相关关系,寻找少数几对综合变量(实际观测变量 的线性组合),用它们替代原始观测变量,从而将二组 变量的关系集中到少数几对综合变量的关系上,通过对 这些综合变量之间相关性的分析,回答两组原始变量间 相关性的问题。除了要求所提取的综合变量所含的信息 量尽可能大以外,提取时还要求第一对综合变量间的相 关性最大,第二对次之,依次类推。
SAS软件与统计应用教程
表7-1 城市男生(19~22岁)形态与机能调查数据
编 号 1 2 3 4 5 身高x1 173.28 172.09 171.46 170.08 170.61 坐高 x2 93.62 92.83 92.78 92.25 92.36 体重 x3 60.1 60.38 59.74 58.04 59.67 胸围 x4 86.72 87.39 85.59 85.92 87.46 肩宽 x5 38.97 38.62 38.83 38.33 38.38 盆骨宽 x6 27.51 27.82 27.46 27.29 27.14 脉搏 y1 75.3 76.7 75.8 76.1 72.9 收缩压 y2 117.4 120.1 121.8 115.1 119.4 舒张压 y3 74.6 77.1 75.2 73.8 77.5 舒张压 y4 61.8 66.2 65.4 61.3 67.1
SAS软件与统计应用教程
STAT
4) 求A、B关于λi的特征向量。设ai为A关于λi的特征向 量,bi为B关于λi的特征向量,则ai'和bi'为(第i对)典型 变量系数。即第i对典型相关变量(Ui,Vi): Ui = ai'X* = ai1X1* + ai2X2* + … + aipXp* Vi = bi'Y* = bi1Y1* + bi2Y2* + … + biqYq* i = 1,2,…,m = min(p,q);其中X*,Y*为原变量组 的标准化。
SAS软件与统计应用教程
STAT
记第一对典型相关变量间的典型相关系数为: CanR1 = Corr(U1,V1)(使U1与V1间最大相关); 第二对典型相关变量间的典型相关系数为: CanR2 = Corr(U2,V2)(与U1、V1无关;使U2与V2间最 大相关)… 第m对典型相关变量间的典型相关系数为: CanRm = Corr(Um,Vm)(与U1,V1,…,Um–1,Vm–1无 关;Um与Vm间最大相关)
SAS软件与统计应用教程
STAT
2. 典型相关系数与典型相关变量
设X = (X1,X2,…,Xp)',Y = (Y1,Y2,…,Yq)'是两 个随机向量。利用主成分思想寻找第i对典型相关变量 (Ui,Vi): Ui = ai1X1 + ai2X2 + … + aipXp = ai'X Vi = bi1Y1 + bi2Y2 + … + biqYq = bi'Y i = 1,2,…,m = min(p,q);称ai'和bi'为(第i对)典 型变量系数或典型权重。