相关与回归分析过程ppt课件

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

❖ ①两变量间存在线性 相关趋势
❖ ②没有发现明显的异 常值
Data corr_1; Input x y@@; Cards; 820 165 780 158 720 130 867 180 690 134 787 167 934 186 679 145 639 120 820 158 ; Proc corr spearman; Var x y; Run;
说明: 1、Corr语句后的选择项很多,主要 是一些控制的功能。 2、var语句指明的分析变量。 3、partial语句作偏相关分析 4、freq语句指明频数变量 5、with语句用来指定和var语句中的 变量形成特定的组合。
简单相关分析
例1 某医院研究某种代乳粉的营养价值是用大白鼠做试验,得大鼠进食量和体重 增量间的关系的原始数据如下,试分析两者有无直线相关关系。
相关与回归
相关分析简介
在医学科学研究中,常常要分析两个变量之间的关系,例如身高和体重、年 龄和血压、体温和脉搏、药物剂量和疗效等问题,因此涉及到研究两个变量 的相互关系。这时就涉及到两个变量之间的相关与回归。
相关分析简介
❖ 连续变量的相关指标(最常见)
积差相关系数,又称Pearson相关系数:定量描述线性相关程度好坏的常 用指标,只适用于两变量呈线性相关时。 特点: 相关系数r 是一个无单位的量值,且-1< r <1;
续表一
体重指数(X3) 4.032 4.116 3.673 3.562 2.998 3.360 3.024 3.171 3.401 3.628 3.751
编号(ID) 23 24 25 26 27 28 29 30 31 32
收缩压(Y) 137 132 149 132 120 126 161 170 152 164
r > 0 为正相关,r < 0 为负相关; r 越接近于1,说明相关性越好;越接近于0,相关性越差。
Spearman等级相关系数:当数据不满足条件双变量正态时。
相关分析简介
❖ 有序变量的相关指标
Gamma统计量:描述有序分类变量数据联系强度的指标,以下指标都是 基于Gamma统计量衍生出来的。 Kendall‘s Tau-b:反映两个有序分类变量的一致性。 Kendall‘s Tau-c: 对Kendall‘s Tau-b进行了校正。
相关分析简介
❖ 名义变量的相关指标
列联系数:基于2值得出 Phi and Cramer‘s V:也是基于2值得出 Lambda 系数:用于反映自变量对因变量的预测效果 不确定系数
相关分析简介
❖ 其他相关指标
Eta Kappa 值 OR、RR等
相关分析简介
❖ 实际上,在Freq过程中measures选择项提供了非常整齐的相关分析指 标体系,如上图。
Cards;
135 45
0
2.876
122 41
0
3.251
130 49
0
3.100
158 52
0
3.768
146 54
1
2.979
129 47
1
2.790
162 60
1
3.668
157 54
1
3.612
144 44
1
2.368
180 64
1
4.637
166 59
1
3.877
…… ;
控制x1影响后的结果
❖ 前面介绍的相关分析是分析两个计量资料间的关系,在计算积差相关系 数、Spearman 相关系数时候,都没有考虑第三方的影响,这就导致可能对 事物的解释出现偏差。下面以一个例子对此作进一步的说明。
表1 32例40岁以上男性的BMI指数、年龄、吸烟与收缩压实测值
编号(ID) 1 2 3 4 5 6 7 8 9 10 11
收缩压(Y) 135 122 130 158 146 129 162 157 144 180 166
年龄(X1) 45 41 49 52 54 47 60 54 44 64 59
吸烟(X2) 0 0 0 0 1 1 1 1 1 1 1
体重指数(X3) 2.876 3.251 3.100 3.768 2.979 2.790 3.668 3.612 2.368 4.637 3.877
年龄(X1) 53 50 54 48 43 43 63 63 62 65
吸烟(X2) 0 0 1 1 0 1 0 1 0 0
续表二
体重指数(X3) 3.296 3.210 3.301 3.017 2.789 2.956 3.80 4.132 3.962 4.010
Data corr_2;
Input y x1-x3@@;
相关分析简介 除了Freq过程的measures选择项外,SAS还提供了其他更专业的相关分析 过程:
PROC CORR 过程:线性相关、秩相关和偏相关分析 PROC CANCORR 过程:典型相关分析(略)
相关分析CORR过程:
功能:分析变量间的相关关系 格式: Proc corr <选择项>; Var 分析变量1…分析变量p; Partial 分析变量1…分析变量p; freq 频数变量; With 分析变量…;
编号(ID) 12 13 14 15 16 17 18 19 20 21 22
收缩压(Y) 138 152 138 140 134 145 142 135 142 150 144
年龄(X1) 51 64 56 54 50 49 46 57 56 56 58
吸烟(X2) 1 0 0 1 1 1 1 0 0 1 0
进食量和体重增量的数据
动ຫໍສະໝຸດ Baidu编号 进食量feed
体重增量 weight
1 2 3 4 5 6 7 8 9 10 820 780 720 867 690 787 934 679 639 820 165 158 130 180 134 167 186 145 120 158
简单相关分析 首先绘制散点图,结果如下:
Proc corr data=corr_2; Var y x2 x3; Partial x1; Run;
pearson相关系数和p值
指定计算spearman秩相关系数,Spearman相关系数和P值 默认时只计算pearson相关系数。
简单相关分析 ❖ 大家可以发现,对相同的数据,秩相关系数的绝对值比积差相关系数小, 为什么?
❖ 显然,这是由于在秩变换或数据按有序分类处理时损失信息所导致的。
偏相关分析
相关文档
最新文档