最新27简单回归分析汇总

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X 1.1 1.2 1.0 0.9 1.2 1.1 0.9 0.6 1.0 0.9 1.1 0.9 1.1 1.0 0.7 Y 14 13 15 15 13 14 16 17 14 16 15 16 14 15 17
在定量描述健康人凝血酶浓度(X)与凝 血时间(Y)数据的数量上的依存关系时,将 凝 血 酶 浓 度 称 为 自 变 量 (independent
教学目标
了解回归的思想来源 掌握线性回归方程的计算,回归系数
的假设检验的思想和步骤 了解回归方程的应用
第一节 简单线性回归
双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 (X1,Y1), (X2,Y2), …, (Xn,Yn) 目的:研究X和Y的数量关系 方法:回归与相关
ei Yi Yˆ
(Xi , Yi)
Yˆ abX
X
回归参数的估计方法
b lXY (X X )(Y Y )
lXX
(X X )2
aYbX
式中 lXY 为 X 与 Y 的离均差乘积和:
lX Y (X X )(Y Y ) X Y ( X n )( Y )
本例:n=15 ΣX=14.7 ΣX2=14.81
ΣY=224 ΣXY=216.7 ΣY2=3368
216.7(14.7)(224)
b
15 6.98020
(14.7)2
14.81
15
a224 (6.980 )12.4 70 2.1 77393
15
15
Y ˆ2.7 173 6.9 93 8X 02
解题步骤5步
1.由原始数据及散点图观察两变 量间是否有直线趋势
当这种数量关系为曲线关系时,称为 曲线回归/非线性回归(curve regression/nonlinear regression)。
简单线性回归模型
Yi Xi i
样本线回归方程
Yˆ abX
Y ˆ 为各X处Y的总体均数的估计。
1.a 为回归直线在 Y 轴上的截距 ➢ a > 0,表示直线与纵轴的交点在
27简单回归分析
“回归”已成为表示变量之间某种数量依 存关系的统计学术语,相关并且衍生出“回 归方程”“回归系数”等统计学概念。如研 究糖尿病人血糖与其胰岛素水平的关系,研 究儿童年龄与体重的关系等。
简单回归分析
Simple linear regression analysis
参考书
1. 徐勇勇主编. 医学统计学(第二版). 北 京:高等教育出版社,2004
2. 杨树勤主编. 卫生统计学(第二版). 北 京:人民卫生出版社,1991
3. 方积乾主编. 医学统计学与电脑实验(第 二版). 上海:上海科学技术出版社,2001
4. 孙振球主编. 医学统计学(供研究生用). 北京:人民卫生出版社,2004
本章内容
第一节 简单线性回归 第二节 线性回归的应用 第三节 残差分析
简单、基本——直线回归、直线相关
线性回归的概念及其统计描述
直线回归的概念
目的:研究应变量Y对自变量X的数量依 存关系。
特点:统计关系。 X值和Y的均数的关系, 不同于一般数学上的X 和Y的函数关系
为了直观地说明直线回归的概念,以15
名健康人凝血酶浓度(X)与凝血时间(Y)
数据(表1)进行回归分析,得到图1所 示散点图(scatter plot)
总体回归系数β的的统计推断
样本回归系数b的标准误
sb
s y.x
n
(Xi X )2
i1
sy.x
n
(Yˆi Yi )2
i 1
线性回归模型的假设条件
1.线性(line) 自变量和因变量之间的关系 有线性趋势 散点图
2.独立(independence) n个个体之间相
互独立
专业知识,残差图
3.正态(normal)各x所对应的y服从正态 (误差项服从正态分布 )
残差的直方图,正态概率图
4. 等方差(equal variance) 各x值变动 时,相应的y有相同的变异性
variable),用 X 表示;凝血时间称为应变 量(dependent variablBaidu Nhomakorabea),用 Y 表示
相关系数反映了散点的疏密,一个变量 对另一个变量的影响需用回归分析。
对于线性回归,若只有1个自变量,称 为简单回归(simple regression);若有 2个或2个以上自变量,称为多重回归 (multiple regression)。
2.计算 X 、Y 的均数 X 、Y ,离均 差平方和 l XX 、 lYY 与离均差积和 l XY 。
3、计算有关指标的值 4、计算回归系数和截距 5、列出回归方程
绘制回归直线
此直线必然通过点( ,X )且Y 与纵坐标轴相交于
截距a 。如果散点图没有从坐标系原点开
始,可在自变量实测范围内远端取易于读 数的 值代入回归方程得到一个点的坐标, 连接此点与点( , )也可X 绘出Y 回归直线。
原点的上方 ➢ a < 0,则交点在原点的下方 ➢ a = 0,则回归直线通过原点
2. b为回归系数,即直线的斜率
➢ b>0,直线从左下方走向右上方,Y 随 X 增大而 增大;
➢ b<0,直线从左上方走向右下方,Y 随 X 增大而 减小;
➢ b=0,表示直线与 X 轴平行,X 与Y 无直线关系
b 的统计学意义是:X 每增加(减) 一个单位,Y 平均改变b个单位
➢ 求解a、b实际上就是“合理地”找到一条能 最好地代表数据点分布趋势的直线。
原则:最小二乘法(least sum of squares),即可 保证各实测点至直线的纵向距离的平方和最小
最小二乘法(least square method)
Y
(Xn , Yn)
(X2 , Y2)
(X1 , Y1)
散点图,残差图
公式(2)称为样本回归方程,它是 对两变量总体间线性关系的一个估计。根 据散点图我们可以假定,对于 X 各个取 值,相应Y 的总体均数 Y|X 在一条直线上
(图 2),表示为 Y|XX
回归参数的估计 ——最小二乘原则
➢ 残差(residual)或剩余值,即实测值Y与假定
回归线上的估计值 Y ˆ 的纵向距离 Y Yˆ 。
相关文档
最新文档