11章 两变量间相关与回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例11-1 某医师测得10名3岁儿童的体表 面积(m2)与体重(kg)原始资料见表11-1第 2、3栏,试分析三岁儿童体表面积与体重间 的相关关系。
儿童号 (1) 1 2 3 4 5 6 7 8 9 10
合计
表11-1
体重 X (2) 11.0 11.8 12.0 12.3 13.1 13.7 14.4 14.9 15.2 16.0 134.4
计算步骤如下:
1、绘制散点图:
Y
0.66
0.64
0.62
0.60
0.58
0.56
0.54
0.52
11
12
13
14
15
16
X
2、相关系数的计算
l X X ( X x ) 2 X 2 (n X ) 2 1 8 3 1 . 2 4 1 3 1 4 0 . 4 2 2 4 . 9 0 4
l Y Y = X - y = Y 2 ( n Y ) 2 3 . 2 9 4 8 5 . 7 1 2 0 6 6 2 0 . 0 1 5 4
Yˆ abX
a称为截距, b称之为斜率或回归系数,表示 当自变量X每改变一个单位,因变量Y平均变动 的单位数。
最小二乘法:
b X x (Y y ) X YX Yn lXY
(X x )2
X 2 ( X )2n lXX
aybx
二、实例求Biblioteka Baidu回归方程
例11-2 某地测得10名3岁儿童的体表面积(m2)与 体重(kg)资料见表11-1第2、3栏,试求3岁儿童由 体重推算体表面积的回归方程。
4、相关系数的假设检验
H0:ρ= 0,两变量间无直线相关关系 H1:ρ≠0,两变量间有直线相关关系
α= 0.05
t r 0.9592 9.5959 1r2 10.95922
n2
102
=n-2=10-2=8,查附表 2,得 P<0.01,按α= 0.05 水准拒绝 H0,
接受 H1,可认为三岁儿童体表面积与体重间存在直线相关关系。
l X X X x 2 X 2 X 2n
=1831.24 - (134.4)2/10 =24.9040
l Y Y Y y 2 Y 2 Y 2n
=3.294834 - (5.7266)2/10=0.015439
l X Y X x ( Y y ) X X Y Y n
两事物或现象间相关的密切程度。
(7)要注意资料的同质性。
图11-4 样本来自不同总体时对相关性的影响
data li11_1;
input x y@@;
cards;
11.0
0.5283
11.8
0.5299
12.0
0.5358
12.3
0.5292
13.1
0.5602
13.7
0.6014
四、相关分析中应注意的问题 (1) 进行相关分析的资料应有实际意义。 (2)相关系数的计算适用双变量正态分布资料 (3) 进行相关分析前应先绘制散点图。
图11-3 异常点对相关分析的影响
(4)相关关系不完全等同于因果关系。 (5)实际工作中计算出的相关系数仅是样本
相关系数 (6)不要把相关系数的假设检验结果误认为
l X Y ( X x ) ( Y y ) X Y ( X n ) ( Y ) 7 7 . 5 5 9 5 ( 1 3 4 . 4 ) 1 ( 0 5 . 7 2 6 6 ) 0 . 5 9 4 0
r lX Y 0.5940 0.9592 lX XlY Y 24.9040.0154
0.5830
207.36 0.339889
0.6102
222.01 0.372344
0.6075
231.04 0.369056
0.6411
256.00 0.411009
5.7266
1831.24 3.294834
XY (6) 5.81130 6.25282 6.42960 6.50916 7.33862 8.23918 8.39520 9.09198 9.23400 10.25760 77.55946
某地10名三岁儿童体重与体表面积
体表面积 Y
X2
Y2
(3)
(4)
(5)
0.5283
121.00 0.279101
0.5299
139.24 0.280794
0.5358
144.00 0.287082
0.5292
151.29 0.280053
0.5602
171.61 0.313824
0.6014
187.69 0.361682
3.绘制回归线
0.66
0.64
0.62
0.60
Y
0.58
0.56
0.54
0.52
11
12
13
14
15
16
X
图11-5 三岁儿童的体表面积与体重的回归线
三、直线回归方程的假设检验
1、回归系数的假设检验——方差分析
SS总=SS回+SS剩
总回剩 回1, 剩n2
SS回
F
回 MS回
SS剩
MS剩
剩
S回 SbX lYlX 2 YlXXb2lXX
=77.55946 - 134.4×5.7266/10=0.593956 SS 回=0.02385×0.593956=0.014166
SS剩=0.015439-0.014166=0.001273
F=89.024, P<0.01
拒绝H0, 接受H1,回归方程有统计学意义, 故可认为小儿体表面积与体重之间有直线回归 关系存在。
二、实例求解回归方程
1、绘制散点图。 2、计算
77.55946 - 134.4×5.7266/10 b=───────────────= 0.02385
1831.24 - (134.4)2/10
a=0.57266 - 0.02385×13.44=0.25212
Y ˆ0.2520 1.0223 X85
计算公式
r XxYy lX Y Xx2 Yy2 lX X lY Y
lX X = X - x2= X 2 - X 2n
lY Y = Y - y2= Y 2 - Y 2n
lX Y = X - x Y - y = X Y - ( X ) n ( Y )
三、相关分析的步骤
14.4
0.5830
14.9
0.6102
15.2
0.6075
16.0
0.6411
;
proc corr;
var x y; run;
proc plot;plot y*x='*';run;
第二节 直线回归
相关分析是描述两变量之间相互关系 回归分析是分析两变量间是否有依存关系 一、直线回归方程
儿童号 (1) 1 2 3 4 5 6 7 8 9 10
合计
表11-1
体重 X (2) 11.0 11.8 12.0 12.3 13.1 13.7 14.4 14.9 15.2 16.0 134.4
计算步骤如下:
1、绘制散点图:
Y
0.66
0.64
0.62
0.60
0.58
0.56
0.54
0.52
11
12
13
14
15
16
X
2、相关系数的计算
l X X ( X x ) 2 X 2 (n X ) 2 1 8 3 1 . 2 4 1 3 1 4 0 . 4 2 2 4 . 9 0 4
l Y Y = X - y = Y 2 ( n Y ) 2 3 . 2 9 4 8 5 . 7 1 2 0 6 6 2 0 . 0 1 5 4
Yˆ abX
a称为截距, b称之为斜率或回归系数,表示 当自变量X每改变一个单位,因变量Y平均变动 的单位数。
最小二乘法:
b X x (Y y ) X YX Yn lXY
(X x )2
X 2 ( X )2n lXX
aybx
二、实例求Biblioteka Baidu回归方程
例11-2 某地测得10名3岁儿童的体表面积(m2)与 体重(kg)资料见表11-1第2、3栏,试求3岁儿童由 体重推算体表面积的回归方程。
4、相关系数的假设检验
H0:ρ= 0,两变量间无直线相关关系 H1:ρ≠0,两变量间有直线相关关系
α= 0.05
t r 0.9592 9.5959 1r2 10.95922
n2
102
=n-2=10-2=8,查附表 2,得 P<0.01,按α= 0.05 水准拒绝 H0,
接受 H1,可认为三岁儿童体表面积与体重间存在直线相关关系。
l X X X x 2 X 2 X 2n
=1831.24 - (134.4)2/10 =24.9040
l Y Y Y y 2 Y 2 Y 2n
=3.294834 - (5.7266)2/10=0.015439
l X Y X x ( Y y ) X X Y Y n
两事物或现象间相关的密切程度。
(7)要注意资料的同质性。
图11-4 样本来自不同总体时对相关性的影响
data li11_1;
input x y@@;
cards;
11.0
0.5283
11.8
0.5299
12.0
0.5358
12.3
0.5292
13.1
0.5602
13.7
0.6014
四、相关分析中应注意的问题 (1) 进行相关分析的资料应有实际意义。 (2)相关系数的计算适用双变量正态分布资料 (3) 进行相关分析前应先绘制散点图。
图11-3 异常点对相关分析的影响
(4)相关关系不完全等同于因果关系。 (5)实际工作中计算出的相关系数仅是样本
相关系数 (6)不要把相关系数的假设检验结果误认为
l X Y ( X x ) ( Y y ) X Y ( X n ) ( Y ) 7 7 . 5 5 9 5 ( 1 3 4 . 4 ) 1 ( 0 5 . 7 2 6 6 ) 0 . 5 9 4 0
r lX Y 0.5940 0.9592 lX XlY Y 24.9040.0154
0.5830
207.36 0.339889
0.6102
222.01 0.372344
0.6075
231.04 0.369056
0.6411
256.00 0.411009
5.7266
1831.24 3.294834
XY (6) 5.81130 6.25282 6.42960 6.50916 7.33862 8.23918 8.39520 9.09198 9.23400 10.25760 77.55946
某地10名三岁儿童体重与体表面积
体表面积 Y
X2
Y2
(3)
(4)
(5)
0.5283
121.00 0.279101
0.5299
139.24 0.280794
0.5358
144.00 0.287082
0.5292
151.29 0.280053
0.5602
171.61 0.313824
0.6014
187.69 0.361682
3.绘制回归线
0.66
0.64
0.62
0.60
Y
0.58
0.56
0.54
0.52
11
12
13
14
15
16
X
图11-5 三岁儿童的体表面积与体重的回归线
三、直线回归方程的假设检验
1、回归系数的假设检验——方差分析
SS总=SS回+SS剩
总回剩 回1, 剩n2
SS回
F
回 MS回
SS剩
MS剩
剩
S回 SbX lYlX 2 YlXXb2lXX
=77.55946 - 134.4×5.7266/10=0.593956 SS 回=0.02385×0.593956=0.014166
SS剩=0.015439-0.014166=0.001273
F=89.024, P<0.01
拒绝H0, 接受H1,回归方程有统计学意义, 故可认为小儿体表面积与体重之间有直线回归 关系存在。
二、实例求解回归方程
1、绘制散点图。 2、计算
77.55946 - 134.4×5.7266/10 b=───────────────= 0.02385
1831.24 - (134.4)2/10
a=0.57266 - 0.02385×13.44=0.25212
Y ˆ0.2520 1.0223 X85
计算公式
r XxYy lX Y Xx2 Yy2 lX X lY Y
lX X = X - x2= X 2 - X 2n
lY Y = Y - y2= Y 2 - Y 2n
lX Y = X - x Y - y = X Y - ( X ) n ( Y )
三、相关分析的步骤
14.4
0.5830
14.9
0.6102
15.2
0.6075
16.0
0.6411
;
proc corr;
var x y; run;
proc plot;plot y*x='*';run;
第二节 直线回归
相关分析是描述两变量之间相互关系 回归分析是分析两变量间是否有依存关系 一、直线回归方程