双变量回归与相关()

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Sy1.631 2 2 1 0 (15 5 14 .5 .3 75 )3 2 31.669
1.9 1 1 2 .1 8 0 1 .61 6 (8 .4 9 ,1 15.42
注y ˆ意 t.sy ˆ与 : y ˆ t.sy不同
(2)控制: 指当要求因变量Y在一定范围内波动时,如何控制自变
量X的取值。 例 :已知血糖正常范围为(4.44~6.66 mmol/L),在例6.1
伴随关系
二、直线相关
1. 相关系数(, r) 概念 表示两变量直线相关的密切程度和方向。 相关系数波动范围: -1 r 1
(1)密切程度: |r| 1,相关越密切; |r| 0,相关越弱。 r=1或 -1,称完全相关; r=0, 称零相关,表示不存在直线相关关系,但
血糖
YI 12.21 14.54 12.27 12.04 7.88 11.10 10.43 13.32 19.59 9.05
胰岛素
Xi 15.2 16.7 11.9 14.0 19.8 16.2 17.0 10.3 5.9 18.7
病例号
I 11 12 13 14 15 16 17 18 19 20
解得:X( 33.95, 38.79)mU/L
(3)应用直线回归时注意事项: 1)应有实际意义; 2)分析前应绘制散点图; 3)应在实际回归范围内应用; 4)要假设检验,且结论不能绝对化。
某地有风俗,每当小孩出生, 均在自家庭院中种上一棵树,随 着树的生长,小孩也在长高。你 认为两者是什么关系?
20名糖尿病人的血糖水平与胰岛素水平的散点图
直线回归方程的求法
原理(最小二乘法): 各散点距离回归直线纵向距离平方和为最小而得到直线。
计算:
l xy l xx
回归直线必通过点
2. 建立直线回归方程的具体步骤
表 6.1 20 名糖尿病人血糖(mmol/L)与胰岛素(mU/L)测定值
病例号
I 1 2 3 4 5 6 7 8 9 10
一、直线回归
1. 直线回归方程
:X为某值时应变量Y 的平均估计值
a:截距 b:回归系数 注意:直线回归方程与函
数方程的不同 Y= a + bX
表 6.1 20 名糖尿病人血糖(mmol/L)与胰岛素(mU/L)测定值
病例号
I 1 2 3 4 5 6 7 8 9 10
血糖
YI 12.21 14.54 12.27 12.04 7.88 11.10 10.43 13.32 19.59 9.05
胰岛素
Xi 15.2 16.7 11.9 14.0 19.8 16.2 17.0 10.3 5.9 18.7
病例号
I 11 12 13 14 15 16 17 18 19 20
血糖
Yi 6.44 9.49 10.16 8.38 8.49 7.71 11.38 10.82 12.49 9.21
胰岛素
Xi 25.1 16.4 22.0 23.1 23.2 25.0 16.8 11.2 13.7 24.4
XY=3510.45, n=20, X=17.33, Y=10.85
bΣΣxx2-y(Σ(Σxx)2(/)Σny)/52n4550.5.18620.4585
aybx10.85(0.458)517.3318.7961
y ˆ1.7 890 6.415x85
3. 直线回归的假设检验 即推断总体回归系数()是否为零 (1)方差分析
t0.05,182.101
即:11.9182.101×0.3396= ( 11.08, 12.76 )
个体Y值的预报区间(容许区间)
yˆ t. sy
Sy Sy.x
பைடு நூலகம்
1 1 (x x)2 n (x x)2
意义:
当X是某一固定值时,按一定概率估计 应因变量Y的波动范围。
6.1资料,当X=15,求Y的波动范围(=0.05)
资料的基础上,问欲将血糖水平控制在正常范围内时,血中 胰岛素应维持在什么范围内? (=0.05)
4 .4 4 y ˆ t0 .0,1 5 s 8 y (1.7 89 0 .4 65 1 x ) 8 2 .15 0 1 .6 13 6 .6 6 y ˆ t0 .0,1 5 s 8 y (1.7 89 0 .4 65 1 x ) 8 2 .15 0 1 .6 13
4. 直线回归方程的应用
(1)预测: 1)点预测: 一般把易于测定、控制的变量作为自变量,建 立回归方程,然后对难以测定或控制的变量值进行 预测。
2)区间预测:
当X是已知时,按一定概率估计应变量值或其均数 所在范围
当X为某固定值时,Y总体均数的可信区间 yˆ t . s yˆ
S yˆ S y . x
即:SS总=SS回归+SS残余
查附表3,P806,F0.01(1,18)=8.29 P< 0.01
(2)t检验
H0: = 0 H1: 0
t b0 S b
t=(-0.4585 - 0)/0.0699=-6.56 = 18,t0.01(18) = 2.878 P < 0.01
F = t2=(-6.56)2 = 43.03
1 n
(x x)2 (x x)2
S y.x
MS 剩余
SS 剩余(残) n2
例6.1资料,当 X= 15 mU/L,求Y总体均数 的95%可信区间。
yˆt0.05,18syˆ
y ˆ 1 .7 89 0 .4 5 5 7 1 8 1 5 .9 5 118
Sy ˆ 1.632 1 2 0(15 514 .5 .3 753 )3 20.3996
双变量回归与相关
温医公卫学院黄陈平
概念: 回归与相关是研究两个或多个变量之间相互关系的
一种分析方法。 回归:
是研究变量之间在数量上依存关系的一种方法。 相关:
是研究随机变量之间相互联系密切程度和方向的方法。 直线相关与回归:
只涉及两个变量,而且分析是否呈直线关系,是回 归、相关分析中最简单的一种。又称简单相关和回归。
血糖
Yi 6.44 9.49 10.16 8.38 8.49 7.71 11.38 10.82 12.49 9.21
胰岛素
Xi 25.1 16.4 22.0 23.1 23.2 25.0 16.8 11.2 13.7 24.4
X = 346.6, Y=217.00, X2=6552.16, Y2=2517.1014
相关文档
最新文档