SAS软件应用之典型相关分析

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 x 12 x 2 pxp 1y 12y 2 qy q
SAS软件应用之典型相关 分析
典型相关
• 对于任意一组系数 (1,2,,p)和 (1,2,,q都) 可以通过上式求出一对典型变量,典型相 关分析中称之为典型变量。进而可以求出 典型变量的简单相关系数,称之为典型相 关系数。
• x 组的p个变量组合成一个,y组的q个变量 也组合成一个,然后计算简单相关来衡量 两组之间的相关性。问题是如何组合?
SAS软件应用之典型相关 分析
典型相关
• 典型相关分析方法的基本原理是:所有研 究的两组变量为x组和y组,x 组有p个变 量 (x1,x2,,xp,) y 组有q个变量 (y1,y2,,yq), 则分别对这两组变量各做线性组合后,再 计算此两加权和的简单相关系数,然后以 这个简单相关系数当做这两组变数之间相 关性的衡量指标。即
• 如果两个组中变量的个数为p,q,p<q,那么寻 求典型变量的过程可以一直连续进行下去,直到 得到p对典型变量为止。
SAS软件应用之典型相关 分析
典型相关
• 从上述分析的过程可以看出,第一对典型 变量的第一典型相关系数描述了两个组中 变量之间的相关程度,且它提取的有关这 两组变量相关性的信息量最多。第二对典 型变量的第二典型相关系数也描述了两个 组中变量之间的相关程度,但它提取的有 关这两组变量相关性的信息量次多。以此 类推,
• 典型相关分析的第一步是估计组合系数, 使得对应的典型变量和的相关系数达到最 大。这个最大的相关系数是第一典型相关 系数,且称具有最大相关系数的这对典型 变量为第一典型变量。
SAS软件应用之典型相关 分析
典型相关
• 典型相关分析的第二步是再次估计组合系数,使 得对应的典型变量相关系数达到第二大,且第二 对典型变量中的第一次变量与第一对典型变量中 的每一个变量不相关。这个最二大的相关系数是 第二典型相关系数,且称具有最二大相关系数的 这对典型变量和为第二典型变量。
SAS软件应用之典型相关 分析
典型相关分析的理论架构
• 设两组变量分别为x组有p个变量 (x1,x2,,xp,)T 而y组有q个变量 (y1,y2,,yq),T 典型相关分析是
找x组的线性组合 x1 *1x11x2 2 与1pxp y组
的线性组合 y1 *b 1y 1 1b1y 22 b ,1qyq 使得简单 相关系数为最大,其中
• 其中这些系数都是一些常数,就是组合的 比例,由于是线性组合,所以 11 12 1p1 且 b11b12 b1q1。
SAS软件应用之典型相关 分析
典型相关
• 有两个问题需要解决:
• 给定不同组合比例 11,12,,1以p 及 b11,b12,,b1,q
都可以算出不一样的简单相关系数,这使得这个 方法非常的不科学,每个人都可以依照自己的喜 好来决定组合比例,并且在衡量两组变量之间相 关性的问题上,也没有一个统一的标准。 • 各组内变量之间的尺度不太相同,例如身高的尺 度跟脚掌长度的尺度就不相同,显然前者的变异 数会大于后者,这种情况是不合理的。
SAS软件应用之典型相关 分析
典型相关
• 针对第一个问题,“在所有的组合中,寻找 一个组合使得简单相关系数为最大”,可能 是个好想法;另外,寻找一个组合使得简 单相关系数为最小,此简单相关系数就是 典型相关系数,而典型相关系数的平方称 为典型根。
SAS软件应用之典型相关 分析
典型相关
• 对于第二个问题,解决的方法就是对资料 进行标准化。
SAS软件应用之典型相关 分析
典型相关
• 设两组变量分别为x组有p个变量 (x1,x2,,xp,)T 而y组有q个变量 (y1,y2,,yq),T 我们先分别把 x组和y组的变量组合起来(当然是用线性 组合),也就是
x 1 *1x 11x 2 2 1 pxp
y1 *b 1y 1 1 b 1y 2 2 b 1 qyq
第20章 典型相关分析
SAS软件应用之典型相关 分析
学习目标
• 了解典型相关分析的数学表达方式,假定 条件;
• 熟悉典型相关系数的数学含义; • 掌握典型变量系数的数学含义; • 掌握简单相关,复相关和典型相关的意义; • 掌握典型相关分析的SAS过程步:
CANCORR过程步。
SAS软件应用之典型相关 分析
SAS软件应用之典型相关 分析
典型相关
• 典型关系分析是分析两组变量之间相关性的一种 统计分析方法,它包含了简单的Pearson相关分 析(两个组均含一个变量)和复相关分析(一个 组含有一个变量,而另一组含有多个变量)这两 种特殊情况。典型相关分析的基本思想和主成分 分析的基本思想相似,它将一组变量与另一组变 量之间单变量的多重线性相关性研究转化为对少 数几对综合变量之间的简单线性相关性的研究, 并且这少数几对变量所包含的线性相关性的信息 几乎覆盖了原变量组所包含的全部相应信息。
Fra Baidu bibliotek
概述
• 对于两个变量,是用它们的相关系数来衡量它们 之间的线性相关关系的。当考虑一个变量与一组 变量的线性相关关系时,是用它们的多重相关系 数来衡量。但是,许多医学实际问题中,常常会 碰到两组变量之间的线性相关性研究问题。例如, 教育研究者想了解3个学术能力指标与5个在校成 绩表现之间的相关性;对于这类问题的研究引进 了典型相关系数的概念,从而找到了揭示两组变 量之间线性相关关系的一种统计分析方法——典 型相关分析。
SAS软件应用之典型相关 分析
典型相关
• 可以得知,由上述方法得到的一系列典型 变量的典型相关系数所包含的有关原变量 组之间相关程度的信息一个比一个少。如 果少数几对典型变量就能够解释原数据的 主要信息,特别是如果一对典型变量就能 够反映出原数据的主要信息,那么,对两 个变量组之间相关程度的分析就可以转化 为对少数几对或者是一对典型变量的简单 相关分析。这就是典型相关分析的主要目 的。
11
1
12
1 p
b 11
b1
b
12
b 1 q
SAS软件应用之典型相关 分析
典型相关分析的理论架构
• 设x组的共变异数矩阵为 , xx y组的共变异
数矩阵为 yy,x与y的共变异数矩阵为 ,xy
相关文档
最新文档