SAS软件应用之典型相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11 12 1 1 p
b11 b 12 b1 b1q
典型相关分析的理论架构
设x组的共变异数矩阵为 xx, y组的共变异 数矩阵为 yy ,x与y的共变异数矩阵为 , * x 则 1 的变异数为 * x) 1 xx 1 Var( x1 ) Var(1 * y1 的变异数为
典型相关
设两组变量分别为x组有p个变量(x1 , x2 ,, x p ) , 而y组有q个变量( y1 , y2 ,, yq )T,我们先分别把 x组和y组的变量组合起来(当然是用线性 组合),也就是 * x1 11 x1 12 x2 1 p x p
T
y b11 y1 b12 y2 b1q yq
* 1
其中这些系数都是一些常数,就是组合的 比例,由于是线性组合,所以11 12 1 p 1 且b11 b12 b1q 1 。
典型相关
有两个问题需要解决: 给定不同组合比例 11 ,12 ,,1 p以及 b11 , b12 ,, b1q , 都可以算出不一样的简单相关系数,这使得这个 方法非常的不科学,每个人都可以依照自己的喜 好来决定组合比例,并且在衡量两组变量之间相 关性的问题上,也没有一个统一的标准。 各组内变量之间的尺度不太相同,例如身高的尺 度跟脚掌长度的尺度就不相同,显然前者的变异 数会大于后者,这种情况是不合理的。
典型相关
典型相关分析的第二步是再次估计组合系数,使 得对应的典型变量相关系数达到第二大,且第二 对典型变量中的第一次变量与第一对典型变量中 的每一个变量不相关。这个最二大的相关系数是 第二典型相关系数,且称具有最二大相关系数的 这对典型变量和为第二典型变量。 如果两个组中变量的个数为p,q,p<q,那么寻 求典型变量的过程可以一直连续进行下去,直到 得到p对典型变量为止。
Fra Baidu bibliotek
典型相关
典型相关分析方法的基本原理是:所有研 究的两组变量为x组和y组,x 组有p个变 量 ( x1 , x2 ,, x p ), y 组有q个变量( y1 , y2 ,, yq ) , 则分别对这两组变量各做线性组合后,再 计算此两加权和的简单相关系数,然后以 这个简单相关系数当做这两组变数之间相 关性的衡量指标。即
典型相关分析的理论架构
T ( x , x , , x ) 设两组变量分别为x组有p个变量 1 2 p,
T ( y , y , , y ) 而y组有q个变量 1 2 q ,典型相关分析
是找x组的线性组合 x1* 11 x1 12 x2 1p x p 与y * y 组的线性组合 1 b11 y1 b12 y2 b1q yq ,使得简 单相关系数为最大,其中
典型相关
针对第一个问题,“在所有的组合中,寻 找一个组合使得简单相关系数为最大”, 可能是个好想法;另外,寻找一个组合使 得简单相关系数为最小,此简单相关系数 就是典型相关系数,而典型相关系数的平 方称为典型根。
典型相关
对于第二个问题,解决的方法就是对资料 进行标准化。 典型相关分析的第一步是估计组合系数, 使得对应的典型变量和的相关系数达到最 大。这个最大的相关系数是第一典型相关 系数,且称具有最大相关系数的这对典型 变量为第一典型变量。
典型相关
从上述分析的过程可以看出,第一对典型 变量的第一典型相关系数描述了两个组中 变量之间的相关程度,且它提取的有关这 两组变量相关性的信息量最多。第二对典 型变量的第二典型相关系数也描述了两个 组中变量之间的相关程度,但它提取的有 关这两组变量相关性的信息量次多。以此 类推,
典型相关
可以得知,由上述方法得到的一系列典型 变量的典型相关系数所包含的有关原变量 组之间相关程度的信息一个比一个少。如 果少数几对典型变量就能够解释原数据的 主要信息,特别是如果一对典型变量就能 够反映出原数据的主要信息,那么,对两 个变量组之间相关程度的分析就可以转化 为对少数几对或者是一对典型变量的简单 相关分析。这就是典型相关分析的主要目 的。
第20章 典型相关分析
学习目标
了解典型相关分析的数学表达方式,假定 条件; 熟悉典型相关系数的数学含义; 掌握典型变量系数的数学含义; 掌握简单相关,复相关和典型相关的意义; 掌握典型相关分析的SAS过程步: CANCORR过程步。
概述
对于两个变量,是用它们的相关系数来衡量它们 之间的线性相关关系的。当考虑一个变量与一组 变量的线性相关关系时,是用它们的多重相关系 数来衡量。但是,许多医学实际问题中,常常会 碰到两组变量之间的线性相关性研究问题。例如, 教育研究者想了解3个学术能力指标与5个在校成 绩表现之间的相关性;对于这类问题的研究引进 了典型相关系数的概念,从而找到了揭示两组变 量之间线性相关关系的一种统计分析方法——典 型相关分析。
典型相关
典型关系分析是分析两组变量之间相关性的一种 统计分析方法,它包含了简单的Pearson相关分 析(两个组均含一个变量)和复相关分析(一个 组含有一个变量,而另一组含有多个变量)这两 种特殊情况。典型相关分析的基本思想和主成分 分析的基本思想相似,它将一组变量与另一组变 量之间单变量的多重线性相关性研究转化为对少 数几对综合变量之间的简单线性相关性的研究, 并且这少数几对变量所包含的线性相关性的信息 几乎覆盖了原变量组所包含的全部相应信息。
1 x1 2 x2 p x p
1 y1 2 y2 q yq
典型相关
对于任意一组系数(1 , 2 ,, p ) 和(1 , 2 ,, q ) 都 可以通过上式求出一对典型变量,典型相 关分析中称之为典型变量。进而可以求出 典型变量的简单相关系数,称之为典型相 关系数。 x 组的p个变量组合成一个,y组的q个变量 也组合成一个,然后计算简单相关来衡量 两组之间的相关性。问题是如何组合?
b11 b 12 b1 b1q
典型相关分析的理论架构
设x组的共变异数矩阵为 xx, y组的共变异 数矩阵为 yy ,x与y的共变异数矩阵为 , * x 则 1 的变异数为 * x) 1 xx 1 Var( x1 ) Var(1 * y1 的变异数为
典型相关
设两组变量分别为x组有p个变量(x1 , x2 ,, x p ) , 而y组有q个变量( y1 , y2 ,, yq )T,我们先分别把 x组和y组的变量组合起来(当然是用线性 组合),也就是 * x1 11 x1 12 x2 1 p x p
T
y b11 y1 b12 y2 b1q yq
* 1
其中这些系数都是一些常数,就是组合的 比例,由于是线性组合,所以11 12 1 p 1 且b11 b12 b1q 1 。
典型相关
有两个问题需要解决: 给定不同组合比例 11 ,12 ,,1 p以及 b11 , b12 ,, b1q , 都可以算出不一样的简单相关系数,这使得这个 方法非常的不科学,每个人都可以依照自己的喜 好来决定组合比例,并且在衡量两组变量之间相 关性的问题上,也没有一个统一的标准。 各组内变量之间的尺度不太相同,例如身高的尺 度跟脚掌长度的尺度就不相同,显然前者的变异 数会大于后者,这种情况是不合理的。
典型相关
典型相关分析的第二步是再次估计组合系数,使 得对应的典型变量相关系数达到第二大,且第二 对典型变量中的第一次变量与第一对典型变量中 的每一个变量不相关。这个最二大的相关系数是 第二典型相关系数,且称具有最二大相关系数的 这对典型变量和为第二典型变量。 如果两个组中变量的个数为p,q,p<q,那么寻 求典型变量的过程可以一直连续进行下去,直到 得到p对典型变量为止。
Fra Baidu bibliotek
典型相关
典型相关分析方法的基本原理是:所有研 究的两组变量为x组和y组,x 组有p个变 量 ( x1 , x2 ,, x p ), y 组有q个变量( y1 , y2 ,, yq ) , 则分别对这两组变量各做线性组合后,再 计算此两加权和的简单相关系数,然后以 这个简单相关系数当做这两组变数之间相 关性的衡量指标。即
典型相关分析的理论架构
T ( x , x , , x ) 设两组变量分别为x组有p个变量 1 2 p,
T ( y , y , , y ) 而y组有q个变量 1 2 q ,典型相关分析
是找x组的线性组合 x1* 11 x1 12 x2 1p x p 与y * y 组的线性组合 1 b11 y1 b12 y2 b1q yq ,使得简 单相关系数为最大,其中
典型相关
针对第一个问题,“在所有的组合中,寻 找一个组合使得简单相关系数为最大”, 可能是个好想法;另外,寻找一个组合使 得简单相关系数为最小,此简单相关系数 就是典型相关系数,而典型相关系数的平 方称为典型根。
典型相关
对于第二个问题,解决的方法就是对资料 进行标准化。 典型相关分析的第一步是估计组合系数, 使得对应的典型变量和的相关系数达到最 大。这个最大的相关系数是第一典型相关 系数,且称具有最大相关系数的这对典型 变量为第一典型变量。
典型相关
从上述分析的过程可以看出,第一对典型 变量的第一典型相关系数描述了两个组中 变量之间的相关程度,且它提取的有关这 两组变量相关性的信息量最多。第二对典 型变量的第二典型相关系数也描述了两个 组中变量之间的相关程度,但它提取的有 关这两组变量相关性的信息量次多。以此 类推,
典型相关
可以得知,由上述方法得到的一系列典型 变量的典型相关系数所包含的有关原变量 组之间相关程度的信息一个比一个少。如 果少数几对典型变量就能够解释原数据的 主要信息,特别是如果一对典型变量就能 够反映出原数据的主要信息,那么,对两 个变量组之间相关程度的分析就可以转化 为对少数几对或者是一对典型变量的简单 相关分析。这就是典型相关分析的主要目 的。
第20章 典型相关分析
学习目标
了解典型相关分析的数学表达方式,假定 条件; 熟悉典型相关系数的数学含义; 掌握典型变量系数的数学含义; 掌握简单相关,复相关和典型相关的意义; 掌握典型相关分析的SAS过程步: CANCORR过程步。
概述
对于两个变量,是用它们的相关系数来衡量它们 之间的线性相关关系的。当考虑一个变量与一组 变量的线性相关关系时,是用它们的多重相关系 数来衡量。但是,许多医学实际问题中,常常会 碰到两组变量之间的线性相关性研究问题。例如, 教育研究者想了解3个学术能力指标与5个在校成 绩表现之间的相关性;对于这类问题的研究引进 了典型相关系数的概念,从而找到了揭示两组变 量之间线性相关关系的一种统计分析方法——典 型相关分析。
典型相关
典型关系分析是分析两组变量之间相关性的一种 统计分析方法,它包含了简单的Pearson相关分 析(两个组均含一个变量)和复相关分析(一个 组含有一个变量,而另一组含有多个变量)这两 种特殊情况。典型相关分析的基本思想和主成分 分析的基本思想相似,它将一组变量与另一组变 量之间单变量的多重线性相关性研究转化为对少 数几对综合变量之间的简单线性相关性的研究, 并且这少数几对变量所包含的线性相关性的信息 几乎覆盖了原变量组所包含的全部相应信息。
1 x1 2 x2 p x p
1 y1 2 y2 q yq
典型相关
对于任意一组系数(1 , 2 ,, p ) 和(1 , 2 ,, q ) 都 可以通过上式求出一对典型变量,典型相 关分析中称之为典型变量。进而可以求出 典型变量的简单相关系数,称之为典型相 关系数。 x 组的p个变量组合成一个,y组的q个变量 也组合成一个,然后计算简单相关来衡量 两组之间的相关性。问题是如何组合?