医学统计学多元线性回归分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
醇、甘油三脂、空腹胰岛素、糖化血红 蛋白、空腹血糖的测量值列于表15-2中, 试建立血糖与其它几项指标关系的多元 线性回归方程。
2020/3/29
医学统计学
表15-2 27名糖尿病人的血糖及有关变量的测量结果
序号 i
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
2020/3/29 26
27
总胆固醇
(mmol/L)
X1
5.68 3.79 6.02 4.85 4.60 6.05 4.90 7.08 3.85 4.65 4.59 4.29 7.97 6.19 6.13 5.71 6.40 6.06 5.09 6.13 5.78 5.43 6.50 7.98 11.54 5.84 3.84
糖化血
红蛋白(%)
X4
8.2 6.9 10.8 8.3 7.5 13.6 8.5 11.5 7.9 7.1 8.7 7.8 9.9 6.9 10.5 8.0 10.3 7.1 8.9 9.9 8.0 11.3 12.3 9.8 10.5 6.4 9.6
血糖
(mmol/L)
Y
11.2 8.8 12.3 11.6 13.4 18.3 11.1 12.1 9.6 8.4 9.3 10.6 8.4 9.6 10.9 10.1 14.8 9.1 10.8 10.2 13.6 14.9 16.0 13.2 20.0 13.3 10.4
胰岛素
(μU/ml)
X3
4.53 7.32 6.95 5.88 4.05 1.42 12.60 6.75 16.28 6.59 3.61 6.61 7.57 1.42 10.35 8.53 4.53 12.79 2.53 5.28 2.96 4.31 3.47 3.37 1.20 8.61 6.45
lij
( Xi Xi )( X j X j )
XiX j
Xi X j , i , j=1,2, ,m n
ljY
( X j X j )(Y Y )
X jY
Xj
Y , j 1, 2L , m
n

2020/3/29
5.9433
0.1424X医1 学统0计.3学515X 2
• Multiple linear regression • Choice of independent variable • Application
2020/3/29
医学统计学
讲述内容
第一节 多元线性回归 第二节 自变量选择方法 第三节 多元线性回归的应用
及其注意事项
2020/3/29
医学统计学
Y1
X22

X2m
Y2




Xn2

Xnm
Yn
条件
(1)Y 与 X1, X 2 , , X m 之间具有线性关系。 (2)各例观测值Yi (i 1,2, , n) 相互独立。 (3)残差 e 服从均数为 0、方差为 2 的正态分布,它等价于对任意
一组自变量 X1, X 2 , , X m 值,应变量 Y 具有相同方差,并且服从正态
Q (Y Yˆ)2 [Y (b0 b1 X 1b2 X 2 bm X m )]2
求偏导数
原理
最小二乘法
l11b1 l12b2 l1mbm l1Y l21b1 l22b2 l2mbm l2Y lm1b1 lm2b2 lmmbm lmY
b0 Y (b1X 1b2 X 2 bm X m )
医学统计学
表15-3 多元线性回归方差分析表 ( 0.05)
变异来源 自由度 SS
MS
F
P
总变异
n-1
SS 总
回归
m
SS 回
SS 回 /m
MS 回/MS 残
残差
n-m-1 SS 残 SS 残 /(n-m-1)
表15-4 例15-1的方差分析表 ( 0.05)
2分020布/3/2。9
医学统计学
(1)求偏回归系数b0 ,b1,b2 , ,bm
建立回归方程

般 步
Yˆ b0 b1X 1b2 X 2 bm X m

2020/3/29
(2)检验并评价回归方程 及各自变量的作用大小
医学统计学
二、多元线性回归方程的建立
例15-1 27名糖尿病人的血清总胆固
0 为常数项, 1 ,2 , ,m 为偏回归系数,表示在其它自
变量保持不变时,
X
增加或减少一个单位时
j
Y
的平均变
化量,e 是去除 m 个自变量对 Y 影响后的随机误差(残差)。
2020/3/29
医学统计学
表15-1 多元回归分析数据格式
例号
X1Baidu Nhomakorabea
1
X11
2
X21


n
Xn1
X2

Xm
Y
X12

X1m
甘油三脂
(mmol/L)
X2
1.90 1.64 3.56 1.07 2.32 0.64 8.50 3.00 2.11 0.63 1.97 1.97 1.93 1.18 2.06 1.78 2.40 3.67 1.03 1.71 3.36 1.13 6.21 7.92 10.89
0医.92学统计学
1.20
第一节 多元线性回归
2020/3/29
医学统计学
一、多元线性回归模型
• 变量:应变量 1 个,自变量m 个,共 m+1 个。 • 样本含量:n • 数据格式见表15-1 • 回归模型一般形式:
Y 0 1 X 12 X 2 m X m e
上式表示数据中应变量 Y 可以近似地表示为自变量
X1, X 2, , X m 的线性函数。
▪ 目的:作出以多个自变量估计应变量的多元
线性回归方程。
▪ 资料:应变量为定量指标;自变量全部或大
部分为定量指标,若有少量定性或等级指标 需作转换。
▪ 用途:解释和预报。 ▪ 意义:由于事物间的联系常常是多方面的,
一个应变量的变化可能受到其它多个自变量 的影响,如糖尿病人的血糖变化可能受胰岛 素、糖化血红蛋白、血清总胆固醇、甘油三 2020/3/29 脂等多种生化指医标学统的计学影响。
0.2706X3
0.6382X 4
三、假设检验及其评价
(一)对回归方程
1. 方差分析法:
H0 : 1 2 m 0 , H1 : 各(j j=1,2,,m)不全为 0,
0.05
SS总 SS回 SS残
F
SS回 / m SS残 (/ n m
1)
MS回 MS 残
2020/3/29
F ~ F(m,n m 1)
相关文档
最新文档