实验九-典型相关分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

课时授课计划

课次序号:22一、课题:实验九典型相关分析

二、课型:上机实验

三、目的要求:1.掌握典型相关分析的理论与方法、模型的建立与显著性检验;

2.掌握利用典型相关分析的SAS过程解决有关实际问题.

四、教学重点:典型相关分析的SAS过程.

教学难点:相关分析的理论与方法、模型的建立与显著性检验.

五、教学方法及手段:传统教学与上机实验相结合.

六、参考资料:

《应用多元统计分析》,高惠璇编,北京大学出版社,2005;

《使用统计方法与SAS系统》,高惠璇编,北京大学出版社,2001;

《多元统计分析》(二版),何晓群编,中国人民大学出版社,2008;

《应用回归分析》(二版),何晓群编,中国人民大学出版社,2007;

《统计建模与R软件》,薛毅编著,清华大学出版社,2007.

七、作业:4.9 4.10

八、授课记录:

九、授课效果分析:

实验九典型相关分析(Canonical Correlation Analysis) (2学时)

一、实验目的和要求

能利用原始数据与相关矩阵、协主差矩阵作相关分析,能根据SAS输出结果选出满足要求的几个典型变量.

二、实验内容

1.典型相关分析的SAS过程—PROC CANCORR过程

基本语句:

PROC CANCORR

; VAR variables;

WITH variables;

RUN;

说明:此过程输入数据可以是原始数据,也可以是相关系数矩阵或协方差矩阵,输出结果包含相关系数矩阵、典型相关系数、典型变量的系数、典型变量对之间的相关性检验的F统计量值、自由度、p值、典型变量与原始变量的相关系数等.

(1)proc cancorr语句的<选项列表>:

●OUT=SAS 数据集——创建含原始数据和典型相关变量得分(观测值)的SAS集.

●OUTSTAT=SAS 数据集——创建含原始变量的样本均值、样本标准差、样本相关

系数阵、典型相关系数和典型变量的标准化和非标准化系数等SAS 集.

● CORR (或C )——打印原始变量的样本相关系数矩阵.

● NCAN=m ——规定要求输出的典型变量对个数,默认为两组变量个数较小者. ● EDF=n-1——针对输入原始数据集为样本相关系数矩阵或样本协方差矩阵,借此选项指定样本容量为观测个数减1.输入为原始观测数据时,省略此项.

● all ——所有输出项.

● noprint ——不输出分析结果.

● short ——只输出典型相关系数和多元分析统计数. ● simple ——简单统计数.

● vname =变量名——为var 语句的变量定义名称. ● vprefix =前缀名——为var 语句的典型变量定义前缀. ● wname =变量名——为with 语句的变量定义名称. ● wprefix =前缀名——为with 语句的典型变量定义前缀.

(2)VAR variables ——VAR 后列出进行相关分析的第一组变量名称. (3)WITH variables ——WITH 后列出进行相关分析的第二组变量名称

var 与with 语句经常同proc cancorr 语句一起使用.其他语句类似corr 过程.

2. 典型相关分析步骤

两组随机变量

T q T p Y Y Y X X X ),,,(,),,,(2121 ==Y X ,

取值 T q T

p y y y x x x ),,,(,),,,(2121 ==y x n 组观测数据 T iq i i i T ip i i i y y y x x x ),,,(,

),,,(2121 ==y x ,

标准化样本

)

,,,(),,,(222

21111**2

*1

*

pp

p ip i i T ip

i i i

s x x s x x s x x x x x ---== x T q iq i i i

y y y y y y ),,,(11

112

21111*σσσ---= y n i ,,2,1 =

样本相关系数矩阵

⎪⎪⎭

⎫ ⎝⎛=2221

1211

R R

R R R 为总体T

T T ),(Y X 相关系数矩阵ρ的估计. 样本典型相关分析步骤:

(1)求21122

121

11

*

R R R R A --∧=(121

11211

22*

R R R R B --∧=)的特征值

022221≥≥≥≥∧∧∧p

ρρρ

(2)求21122

12111

*

R R R R A --∧=和121

11211

22*

R R R R B --∧=对应的正交单位化特征向量

∧∧∧p e e e ,,,21 和∧

∧∧p f f f ,,,21

(3)第k 对典型相关变量为

*

2122**

2111*,

y R f x R e -

∧∧-

∧∧

==T k

k T k

k

V U ,

其中 ),,,(),,,,(*

*

2*

1*

*

*

2*

1*

q p y y y x x x ==y x

样本典型相关系数为

=∧

∧k V U k k ρρ

*

*,, p k ,,2,1 =

(4)典型相关系数的显著性检验

0:0:)(1)(0≠↔=k k k k H H ρρ p k ,,2,1 =

统计量 ),(~121/1/112)

(0k k H k

k

t k k k k d d F d d F k 真ΛΛ-= 检验p 值为 )),(()(210k k k k k H k f d d F P f F P p ≥=≥=

若α

(0k H .

相关文档
最新文档