医学统计学PPT:直线相关和回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
71
63
63
67
68
68
70
64
Page 13
绘制散点图
71
Y 成年后身高(单位:英寸)
69
67
65
63 30
32
34
36
38
X 2岁时的身高(单位:英寸)
40
Page 14
lXX
X2
2
X
272 2
9318
70.00
n
8
lYY
Y2
2
Y
5342
35712
67.50
-2
-1
0
1
2
Page 25
相关系数的z 值的抽样分布( = 0.8)
200
150
100
50
0
0
1
2
3
4
Page 26
相关系数的可信区间估计
➢将 r 变换为 z ; ➢根据 z 服从正态分布,估计 z 的可信区间;
1 z u sz z u n 3
➢再将 z 变换回 r 。
Page 27
相关系数的可信区间估计
问题的提出
➢以往方法的局限
仅限于考察一个观察指标
Page 4
问题的提出
➢ 人的体重往往随着身高的增加而增加。二者之间 是否存在某种关联?如果存在,可否用身高来推 测体重的多少?
➢ 儿童所能发出的最长音调往往和年龄有关。同样, 是否可以建立年龄和音调长度的数量关系?
➢ 人的肺活量往往随着胸围的增加而增加。 ➢ 举重运动员所能举起的最大重量是否与他的体重
➢总体相关系数用希腊字母ρ表示,而样本相 关系数用r表示,取值范围均为[-1,1]。
Page 9
直线相关的图示
正相关
负相关
零相关
零相关
0<r<1 完全正相关
-1<r<0 完全负相关
r=0 零相关
r=0 零相关
r=1
r=-1
r=0
r=0
Page 10
直线相关的图示与相关系数的关系
-01r<r<=r=r-<01<110
n
8
lXY
XY
X Y
n
18221
272 534 8
65.00
Page 15
r lXY
65.00
0.9456
lXX lYY 70.00 67.50
Page 16
相关系数的假设检验
➢H0:ρ=0,两变量间无直线相关的关系; ➢H1:ρ≠0。
t r 0 r , n 2
sr
1 r2
r
e2z e2z
1 1
z 近似服从均数为
1 2
ln(1
r
)
/(1
r
),
标准差为 1/ n 3 的正态分布。
Page 23
相关系数的z 值的抽样分布( = - 0.8)
200
150
100
50
0
0
0.5
源自文库
1.0 1.5
2.0
Page 24
相关系数的z 值的抽样分布( = 0)
200
150
100
50
0
0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0
Page 21
相关系数的抽样分布( =0.8)
300 200 100
0 0 0.2 0.4 0.6 0.8 1.0
Page 22
R.A. Fisher(1921) 的 z 变换
z 1 ln 1 r 2 1r
Page 11
直线相关系数的计算
r X X Y Y lXY X X 2 Y Y 2 lXX lYY
Page 12
➢ 以下资料选自Galton的一项研究,目的是探讨成年 时身高是否与两岁时的身高(单位:英寸)有关。
两岁时的 身高(英寸)
39
30
32
34
35
36
36
30
成年 身高(英寸)
Page 18
总体相关系数的区间估计
➢从相关系数不等于0的总体中抽样,样本相
关系数的分布是偏态的。
Page 19
相关系数的抽样分布( = - 0.8)
300 200 100
0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0
Page 20
相关系数的抽样分布( = 0)
300 200 100
Fisher’s 变换
r
z
正态近似
Fisher’s 反变换
的95%CI
z的95%CI
Page 28
z 1 ln(1 0.9456) 1.7885 2 1 0.9456
1.7885 1.96 / 8 3 = (0.9120,2.6650)
e2z 1 e20.9120 1 llow e2z +1 e20.9120 1 0.7221
lup
e2z 1 e2z +1
e22.6650 e22.6650
Page 6
2.相关的概念
➢当两个数值变量之间出现如下情况:当一个 变量增大,另一个也随之增大(或减少),我 们称这种现象为共变,也就是有相关关系。
➢若两个变量同时增加或减少,变化趋势是同 向的,则两变量之间的关系为正相关 (positive correlation);若一个变量增加时,另 一个变量减少,变化趋势是反向的,则称为 负相关(negative correlation)。
有关?
Page 5
相关关系与确定性关系
➢所谓确定性关系是指两变量间的关系是函数 关系。已知一个变量的值,另一个变量的值 可以通过这种函数关系精确计算出来。
➢C =2R ➢S=vt
➢非确定性关系是指两变量在宏观上存在关系, 但并未精确到可以用函数关系来表达。
➢青少年身高随年龄增长而增高; ➢体表面积与体重有关
Medical statistics
医学统计学
直线相关和回归分析
直线相关分析
Linear Correlation Analysis
相关分析:主要内容
➢问题的提出 ➢相关关系与确定性关系 ➢相关和直线相关的概念 ➢直线相关的图示 ➢直线相关系数的计算 ➢直线相关系数的假设检验和区间估计
Page 3
n2
Page 17
➢H0:ρ=0,两变量间无直线相关的关系;
➢H1:ρ≠0,两变量间有直线相关的关系;
➢α =0.05
t 0.9456 7.1196 1 0.94562
82
➢ν=8-2=6
➢以自由度为6查附表2的t界值表,得P<0.01, 按α=0.05的水准拒绝H0,接受H1,认为2岁 时的身高和成年身高之间存在正相关。
Page 7
直线相关的概念
➢直线相关(linear correlation),又称简单相 关,用以描述两个呈正态分布的变量之间的 线性共变关系,常简称为相关。
Page 8
➢用以说明具有直线关系的两个变量间相关关 系的密切程度和相关方向的指标,称为相关 系数(correlation coefficient),又称为积差 相关系数(coefficient of product-moment correlation),Pearson相关系数 。