医学统计学PPT:直线相关和回归

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
两指标间的关系分析
Linear correlation and regression
直线相关和回归
➢ 以往方法的局限
仅限于考察一个观察指标
医学研究中常要分析变量间的关系,如: ➢ 身高和体重 ➢ 年龄和血压 ➢ 人的肺活量与胸围 ➢ 药物剂量与动物死亡率 ➢ 环境介质中污染物浓度与污染源距离
内容提要:
150
100
50
0
-2
-1
0
1
2
相关系数的z 值的抽样分布( = 0.8)
200
150
100
50
0
0
1
2
3
4
相关系数的可信区间估计
➢ (1) 将 r 变换为 z ; ➢ (2) 根据 z 服从正态分布,估计 z 的可信区间;
1 z u sz z u n 3
➢ (3) 再将 z 变换回 r 。
➢ X 自变量,解释变量 (independent variable, explanatory variable)
相关系数的可信区间估计
Fisher’s 变换
r
z
正态近似
的95%CI Fisher’s 反变换 Z的95%CI
z 1 ln(1 0.9456) 1.7885 2 1 0.9456
1.7885 1.96 / 8 3 = (0.9120,2.6650)
llow
e2z 1 e2z +1
e20.9120 e20.9120
r X X Y Y
l XY
X X 2 Y Y 2
百度文库
l XX lYY
X 的离均差平方和:
2
lXX X X
Y 的离均差平方和:
2
lYY Y Y
X与Y 间的离均差积和: lXY X X Y Y
离均差平方和、离均差积和的展开:
lXX
2
XX
X2
X2
n
lYY
2
Y Y
Y2
Y2
n
l XY
X
X Y
Y
XY
X Y
n
➢ 以下资料选自Galton的一项研究,目的是探讨成年时 身高是否与两岁时的身高(单位:英寸)有关。
两岁时的 身高(英寸)
39 30 32 34 35 36 36 30
成年 身高(英寸)
71 63 63 67 68 68 70 64
➢ 7.1 确定性关系和相关关系 ➢ 7.2 直线相关 ➢ 7.3 直线回归 ➢ 7.4 直线相关和回归应用注意事项
7.1 相关关系与确定性关系
➢ 确定性关系:两变量间是函数关系
圆的周长与半径的关系: C=2R
X与Y的函数关系:
Y=a+bX
➢ 非确定性关系:两变量在宏观上存在关系,但 并未精确到可以用函数关系来表达。
年龄与血压的关系;
身高与体重的关系;
体重与体表面积的关系;
药物浓度与反应率的关系;
相关关系
➢ 当一个变量增大,另一个也随之增大(或 减少),我们称这种现象为共变,或相关 (correlation)。两个变量有共变现象,称 为有相关关系。
➢ 相关关系不一定是因果关系。
7.2 直线相关
➢ 直线相关(linear correlation),又称简单相 关,用以描述两个呈正态分布的变量之间的线 性共变关系,常简称为相关。
➢ 用以说明具有直线关系的两个变量间相关关系
的密切程度和相关方向的指标,称为相关系数 (correlation coefficient),又称为积差相 关系数(coefficient of product-moment correlation),Pearson相关系数 。
➢ 总体相关系数用希腊字母ρ表示,而样本相关 系数用r表示,取值范围均为[-1,1]。
1 1
0.7221
lup
e2z 1 e2z +1
e22.6650 e22.6650
1该可0信.99区0间4 有1 什么含义?
7.3 直线回归
直线回归是把两个变量之间的关系用适当的方 程式表达出来,可以从一个自变量推算另一个 应变量。
直线回归的定义
➢ Y 因变量,响应变量 (dependent variable, response variable)
相关关系示意图
正相关
负相关
零相关
零相关
0<r<1 (a)
完全正相关
-1<r<0 (c)
完全负相关
r0 (e)
零相关
r0 (g)
零相关
r=1
r=-1
r=0
r=0
(b)
(d)
(f)
(h)
相关系数的性质
➢ -1 ≤ r ≤ 1 ➢ r>0为正相关 ➢ r<0为负相关 ➢ r=0为零相关或无相关
Pearson相关系数的计算
相关系数的抽样分布( = 0)
300 200 100
0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0
相关系数的抽样分布( =0.8)
300 200 100
0 0 0.2 0.4 0.6 0.8 1.0
R.A. Fisher(1921) 的 z 变换
绘制散点图
71
Y 成年后身高(单位:英寸)
69
67
65
63 30
32
34
36
38
40
X 2岁时的身高(单位:英寸)
lXX
X2
2
X
272 2
9318
70.00
n
8
lYY
Y2
2
Y
5342
35712
67.50
n
8
lXY
XY
X Y
n
18221
272 534 8
➢ α =0.05 t 0.9456 7.1196 1 0.94562
82
➢ ν=8-2=6 ➢ 以自由度为6查附表2的t界值表,得P<0.01,
按α=0.05的水准拒绝H0,接受H1,认为2岁时
的身高和成年身高之间存在正相关。
相关系数的抽样分布( = - 0.8)
300 200 100
0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0
65.00
r lXY
65.00
0.9456
lXX lYY 70.00 67.50
相关系数的假设检验
➢ H0:ρ=0,两变量间无直线相关的关系;
➢ H1:ρ≠0。
t r 0 r , n 2
sr
1 r2
n2
➢ H0:ρ=0,两变量间无直线相关的关系; ➢ H1:ρ≠0,两变量间有直线相关的关系;
z 1 ln 1 r 2 1r
r e2z 1 e2z 1
z
近似服从均数为
1 2
ln(1
r)
/(1
r )

标准差为 1/ n 3 的正态分布。
相关系数的z 值的抽样分布( = - 0.8)
200
150
100
50
0
0
0.5
1.0 1.5
2.0
相关系数的z 值的抽样分布( = 0)
200
相关文档
最新文档