实验九-典型相关分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课时授课计划
课次序号:22一、课题:实验九典型相关分析
二、课型:上机实验
三、目的要求:1.掌握典型相关分析的理论与方法、模型的建立与显著性检验;
2.掌握利用典型相关分析的SAS过程解决有关实际问题.
四、教学重点:典型相关分析的SAS过程.
教学难点:相关分析的理论与方法、模型的建立与显著性检验.
五、教学方法及手段:传统教学与上机实验相结合.
六、参考资料:
《应用多元统计分析》,高惠璇编,北京大学出版社,2005;
《使用统计方法与SAS系统》,高惠璇编,北京大学出版社,2001;
《多元统计分析》(二版),何晓群编,中国人民大学出版社,2008;
《应用回归分析》(二版),何晓群编,中国人民大学出版社,2007;
《统计建模与R软件》,薛毅编著,清华大学出版社,2007.
七、作业:4.9 4.10
八、授课记录:
九、授课效果分析:
实验九典型相关分析(Canonical Correlation Analysis) (2学时)
一、实验目的和要求
能利用原始数据与相关矩阵、协主差矩阵作相关分析,能根据SAS输出结果选出满足要求的几个典型变量.
二、实验内容
1.典型相关分析的SAS过程—PROC CANCORR过程
基本语句:
PROC CANCORR
WITH variables;
RUN;
说明:此过程输入数据可以是原始数据,也可以是相关系数矩阵或协方差矩阵,输出结果包含相关系数矩阵、典型相关系数、典型变量的系数、典型变量对之间的相关性检验的F统计量值、自由度、p值、典型变量与原始变量的相关系数等.
(1)proc cancorr语句的<选项列表>:
●OUT=SAS 数据集——创建含原始数据和典型相关变量得分(观测值)的SAS集.
●OUTSTAT=SAS 数据集——创建含原始变量的样本均值、样本标准差、样本相关
系数阵、典型相关系数和典型变量的标准化和非标准化系数等SAS 集.
● CORR (或C )——打印原始变量的样本相关系数矩阵.
● NCAN=m ——规定要求输出的典型变量对个数,默认为两组变量个数较小者. ● EDF=n-1——针对输入原始数据集为样本相关系数矩阵或样本协方差矩阵,借此选项指定样本容量为观测个数减1.输入为原始观测数据时,省略此项.
● all ——所有输出项.
● noprint ——不输出分析结果.
● short ——只输出典型相关系数和多元分析统计数. ● simple ——简单统计数.
● vname =变量名——为var 语句的变量定义名称. ● vprefix =前缀名——为var 语句的典型变量定义前缀. ● wname =变量名——为with 语句的变量定义名称. ● wprefix =前缀名——为with 语句的典型变量定义前缀.
(2)VAR variables ——VAR 后列出进行相关分析的第一组变量名称. (3)WITH variables ——WITH 后列出进行相关分析的第二组变量名称
var 与with 语句经常同proc cancorr 语句一起使用.其他语句类似corr 过程.
2. 典型相关分析步骤
两组随机变量
T q T p Y Y Y X X X ),,,(,),,,(2121 ==Y X ,
取值 T q T
p y y y x x x ),,,(,),,,(2121 ==y x n 组观测数据 T iq i i i T ip i i i y y y x x x ),,,(,
),,,(2121 ==y x ,
标准化样本
)
,,,(),,,(222
21111**2
*1
*
pp
p ip i i T ip
i i i
s x x s x x s x x x x x ---== x T q iq i i i
y y y y y y ),,,(11
112
21111*σσσ---= y n i ,,2,1 =
样本相关系数矩阵
⎪⎪⎭
⎫ ⎝⎛=2221
1211
R R
R R R 为总体T
T T ),(Y X 相关系数矩阵ρ的估计. 样本典型相关分析步骤:
(1)求21122
121
11
*
R R R R A --∧=(121
11211
22*
R R R R B --∧=)的特征值
022221≥≥≥≥∧∧∧p
ρρρ
(2)求21122
12111
*
R R R R A --∧=和121
11211
22*
R R R R B --∧=对应的正交单位化特征向量
∧∧∧p e e e ,,,21 和∧
∧∧p f f f ,,,21
(3)第k 对典型相关变量为
*
2122**
2111*,
y R f x R e -
∧∧-
∧∧
==T k
k T k
k
V U ,
其中 ),,,(),,,,(*
*
2*
1*
*
*
2*
1*
q p y y y x x x ==y x
样本典型相关系数为
∧
=∧
∧k V U k k ρρ
*
*,, p k ,,2,1 =
(4)典型相关系数的显著性检验
0:0:)(1)(0≠↔=k k k k H H ρρ p k ,,2,1 =
统计量 ),(~121/1/112)
(0k k H k
k
t k k k k d d F d d F k 真ΛΛ-= 检验p 值为 )),(()(210k k k k k H k f d d F P f F P p ≥=≥=
若α
(0k H .