医学统计学简单回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例:以凝血酶浓度(单位/毫升)估计凝血时间(秒)的回归方程为
ˆ Y 21.78 6.98 X
简单线性回归 2013-8-15
(一)简单线性回归模型的一般形式
13
ˆ Y a bX
ˆ Y 的意义
给定X 时,Y 的估计值 给定X 时,Y 的平均值(总体均数的点估计) 举例
简单线性回归
2013-8-15
简单线性回归
2013-8-15
(一)简单线性回归模型的一般形式
9
总体回归模型表示为:
Yi X i i
样本回归模型表示:
ˆ Y a bX
简单线性回归 2013-8-15
(一)简单线性回归模型的一般形式
10
ˆ Y a bX
a 的意义
a 截距、常数项 (intercept, constant) X=0 时,Y 的估计值 a 的单位与Y 值相同 当X 可能取0时,a 才有实际意义。
2013-8-15
(二)线性回归分析的基本步骤
29
1. 绘制散点图(观察是否有线性趋势、异常点) 2. 估计回归参数,列出回归方程 3. 对回归方程进行假设检验 4. 在散点图上绘制回归直线 5. 解释回归系数的统计学意义
6. 评价回归方程的拟合效果
简单线性回归
2013-8-15
教材例题
30
对14名40~60岁健康妇女的体重(Kg)与基础代谢(KJ/d) 进行回归分析: 绘制散点图
48
作回归分析应有实际意义 进行回归分析时,应先绘制散点图 进行回归分析时,应避免超出自变量的取值范围,任 意外延 残差图是考察是否满足回归分析条件的简单有效的方

简单线性回归
2013-8-15
•直线回归与直线相关的区别与联系
49
区别
相关、回归分析的作用不同
相关表示相互关系,没有依存关系;而回归有依存关系; r没有单位,b有单位; 对资料的要求不同: 相关要求双变量正态分布,回归分析条件(4个) 当X和Y都是随机的,可以进行相关和回归分析; 当Y是随机的(X是控制的),理论上只能作回归而不能作相关分 析;
Y t ,n 2 S Y t ,n 2 SY . X
Y
简单线性回归


1 (X X ) 2 n (X X )
2
2013-8-15
总体回归直线的95%的置信带
3、个体Y的预测值的容许区间估计
43
给定X 时, Y 值的容许区间( Y 值可能的变动范围)。
Y t ,n 2 SY Y t ,n 2 SY . X
5800 5300
基础代谢(KJ/day)
4800 4300 3800 3300 2800 30 35 40 45 50 55 60 65 70 75
体重 (kg)
简单线性回归
2013-8-15
教材例题
31
建立回归方程
ˆ Y 1106 .788 61.423 X
简单线性回归
2013-8-15
19 18 凝 17 血 16 时 15 间 ( 秒) 1 4 13 12 0.5
0.7
0.9
1.1
1.3
凝血酶浓度( 单位/ 毫升)
(一)简单线性回归模型的一般形式
8
若描述凝血酶浓度和凝血时间在数量上的依存关系时 (回归分析),应变量为凝血酶浓度,自变量为凝血 酶时间。 Y 表示应变量,因变量,响应变量 (dependent variable, response variable) X 表示自变量,解释变量,预测因子 (independent variable, explanatory variable,predictor) 用数学上的二元一次方程形式表示简单线性回归
简单线性回归
2013-8-15
(一)简单线性回归模型的一般形式
11
ˆ Y a bX
b 的意义
b 斜率(slope) b 的单位为 (Y 的单位 / X 的单位) b>0,直线从左下方走向右上方,Y 随 X 增大而增大; b<0,直线从左上方走向右下方,Y 随 X 增大而减小;
b=0,表示直线与 X 轴平行,X 与Y 无直线关系
(二)线性回归分析的基本步骤
14
1. 绘制散点图(观察是否有线性趋势、异常点) 2. 估计回归参数,列出回归方程 3. 对回归方程进行假设检验
4. 在散点图上绘制回归直线
5. 解释回归系数的统计学意义
6. 评价回归方程的拟合效果
简单线性回归
2013-8-15
(二)线性回归分析的基本步骤
15
绘制散点图(观察是否有线性趋势、异常点)
(三)线性回归分析的条件
36
线性(linear):因变量Y与自变量X呈线性关系 独立(independent):各观察值间相互独立 正态性(normality):给定X,Y 服从正态分布 等方差性(equal variance):在自变量X的取值范围内, 不论X取何值,Y都具有相同的方差。
简单线性回归
(Y Y )2

SS回归 (Y Y )2 回归的贡献,回归平方和:
(sum of squares due to regression)
简单线性回归
2013-8-15
Y 的自由度分解
23
总的自由度:n-1 回归自由度:1 剩余自由度:n-2
简单线性回归
2013-8-15
(二)线性回归分析的基本步骤
凝血酶浓度
a. Depen dent Variable: 凝 血 时 间
简单线性回归
2013-8-15
(二)线性回归分析的基本步骤
26
在散点图上绘制回归直线 解释回归系数的统计学意义
简单线性回归
2013-8-15
(二)线性回归分析的基本步骤
27
评价回归方程的拟合效果
剩余标准差: 剩余标准差反映的是扣除X对Y的线性影响后Y的变异 剩余标准差越小,回归方差的拟合效果越好
简单线性回归
2013-8-15
一、线性回归
5
简单线性回归模型的一般形式
线性回归分析的基本步骤 线性回归分析的条件
简单线性回归
2013-8-15
(一)简单线性回归模型的一般形式
6
例: 随机抽取15名健康成年人,测定其血液的凝血酶浓度 (单位/毫升)及凝固时间(秒),数据如下表所示:
简单线性回归
2013-8-15
在回归分析中,将b称为回归系数(regression coefficient)
简单线性回归
2013-8-15
(一)简单线性回归模型的一般形式
12
ˆ Y a bX
b 的意义 b 表示X 每增加(减)一个单位,Y 平均改变b个单位
例:1~7岁儿童以年龄(岁)估计体重(Kg)的回归方程为
ˆ Y 7 2X
应变量Y的总变异的分解

P
(X,Y)
Y
(Y Y )


Y
(Y Y)
( Y) Y
Y
Y
X
Y的总变异(离均差平方和)分解
22
总变异:
SS总 (Y Y ) 2

(sum of squares about the mean of Y)
SS剩余 剩余(残差)的变异: (sum of squares about regression)
SY X MS剩余

ˆ Y Y

2
n2
简单线性回归
2013-8-15
(二)线性回归分析的基本步骤
28
评价回归方程的拟合效果 决定系数(确定系数):r2
r
2
SS回归 SS总
决定系数反映的是回归引起的变异占Y总变异的 比重 决定系数越大(越接近1),回归的拟合效果越好
简单线性回归
24
方差分析
ANOVAb
Model 1 Regression Residual Total Sum of Squares 19.684 3.249 22.933 df 1 13 14 Mean Square 19.684 .250 F 78.757 Sig. .000a
a. P re dic tors: (Consta nt), 凝血酶浓度 b. Dependent Variable: 凝血时间
简单线性回归
2013-8-15
(二)线性回归分析的基本步骤
20
方差分析
将应变量Y的总变异划分成两部分,一部分是由线性回归所致 的变异,另一部分是由残差所致的变异 总的离均差平方和相应划分为两部分 总的自由度相应划分为两部分
SS总 SS回归 SS剩余
总 回归 剩余
简单线性回归 2013-8-15
均数界值×标准差
简单线性回归
2013-8-15
1、总体回归系数 的可信区间估计
40
根据 t 分布原理估计: 总体回归系数
1 置信区间
b t ,n 2 sb
简单线性回归
2013-8-15
2、
Y 的置信区间估计 ˆ
41
样本 Y的均数 给定X时Y的均数
Y

总体
Y


Y
(Y的条件均数) 根据 t 分布原理根据:
教材例题
假设检验(方差分析)
教材例题
假设检验(t 检验)
教材例题
34
绘制直线
6000
基础代谢(KJ/d)
5000
4000 体重(Kg) 3000 35 40 45 50 55 60 65 70 75
简单线性回归
2013-8-15
教材例题
35
评价回归方程的拟合效果
简单线性回归
2013-8-15
简单线性回归
2013-8-15
(二)线性回归分析的基本步骤
25
回归系数的t检验
b t Sb
n2
Coefficientsa
Standa rdized Coeffic ients Beta t 27.860 -.926 -8.874 Sig. .000 .000
Unstandardized Coefficients Model 1 (Consta nt) B 21.774 -6.980 Std. Error .782 .787
2013-8-15
二、线性回归的应用
38
回归分析中的区间估计 总体回归系数的置信区间估计
给定X=Xp时,Y 的总体均数的置信区间估计
给定X=Xp时,个体Y值的容许区间估计
简单线性回归
2013-8-15
二、线性回归的应用
39
复习
总体均数的置信区间: 均数界值×标准误 个体的容许区间(参考值范围):
简单线性回归
2013-8-15
•直线回归与直线相关的区别与联系
第十二章 简单线性回归
Simple linear regression analysis
流行病学与卫生统计学教研室 曹 明 芹
Regression 释义
第十二章 简单线性回归
3
线性回归
线性回归的应用 残差分析 回归分析应注意的问题
非线性回归
简单线性回归
2013-8-15
一、线性回归
4
线性相关:分析两个变量的相关关系的方向及密切程 度的统计方法 欲分析两个变量在数量上的依存关系或者由一个易测 变量推测另一个难测变量,采用回归分析。 简单线性回归:涉及一个应变量和一个自变量 多重线性回归:涉及一个应变量和多个自变量 例:体重与体表面积、胰岛素水平与血糖水平 用身高、体重、肺活量估计心室输出量
( X ,Y )
b
l xy
l xx
a Y bX
可使用计算器计算或软件计算
ˆ Y a bX
简单线性回归 2013-8-15
(二)线性回归分析的基本步骤
19
对回归方程进行假设检验 方差分析 回归系数的t检验
b≠0,推断是否 =0 ,若 =0,则回归关系不存在。
H0: =0,无直线回归关系; H1:≠0,有直线回归关系;


1 ( X X )2 1 n ( X X )2
简单线性回归
2013-8-15
Y个体值95%预测带
三、残差分析
45
ˆ i Yi Yi
残差分析作用(直观图示) 评价资料是否符合回归分析的条件 识别异常点 了解资料和回归模型之间的关系
简单线性回归
2013-8-15
四、回归分析应注意的问题
ˆ i Yi Yi
ˆ 即实测值Y与假定回归线上的估计值 Y 的纵向距离
最小二乘法(least sum of squares):回归的残差平方和最小, 即各实测点至直线的纵向距离的平方和最小。
简单线性回归
2013-8-15
(二)线性回归分析的基本步骤
18
估计回归参数,列出回归方程
最小二乘法原理估计的回归直线必过点 公式为
19 18 凝 17 血 16 时 15 间 ( 秒) 1 4 13 12 0.5
0.7
0.9
1.1
1.3
凝血酶浓度( 单位/ 毫升)
简单பைடு நூலகம்性回归
2013-8-15
(二)线性回归分析的基本步骤
16
估计回归参数,列出回归方程
求解a、b,实际上就是“合理地”找到一条能最好地代表数据 点分布趋势的直线。 最小二乘法原理估计 残差(residual)或剩余
相关文档
最新文档