《医学统计学》教学课件-多重线性回归
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(%)
(mmol/L)
X1
X2
X3
X4
Y
1
5.68
1.90
4.53
8.2
11.2
2
3.79
1.64
7.32
6.9
8.8
3
6.02
3.56
6.95
10.8
12.3
27
3.84
1.20
6.45
9.6
10.4
各变量的离差矩阵
4阶线性方程组
建立多元回归方程
方程的求解过程复杂,可借助于SPSS、SAS等统计软件来完成 SPSS:Analyze→Regression→Linear regression
F 8.278
Si g. .000a
2.偏回归系数的假设检验
H0 : j 0;H1 : j 0,
方差分析法、t检验法
2.偏回归系数的假设检验
方差分析法:
F SS回( X j )/1 SS残 /2
1 1 2 n - m -1
SS回(Xj)为第j 个自变量的偏回归平方和,是考察在其它自变量存在于回归 方程中的条件下,某一自变量Xj对因变量Y 的回归效应;相当于从回归方程中
→dependent:Y independent:x1-x5
OK
SPSS的结果
Coeffi c ie ntsa
Unstandardi zed Coeffi ci ents
M odel
1
(Constant)
B
Std. Error
8.429
.607
x1
.126
.096
x2
.044
.008
x3
.057
.009
coefficient)简称回归系数,在其它自变量保持不变时 Xi(i=1,2,…,m)每改变一个单位时,应变量Y的平均变化 量。
ε:去除m个自变量对Y的影响后的随机误差,又称残差
多元线性回归模型的应用条件:
1.线性趋势:Y与Xi间具有线性关系 2.独立性:应变量Y的取值相互独立 3.正态性:对任意一组自变量取值,因变量Y服从正态分
剔除后所引起的回归平方和的减少量。
H0 : j 0;H1 : j 0,j=1,2,…,m;
第五节 多重线性回归
有学者认为血清中低密度脂蛋白增高,是引起动脉硬 化的一个重要原因。现测量了40名被怀疑患有动脉 硬化的就诊患者的载脂蛋白AⅠ、载脂蛋白B、载脂 蛋白E、载脂蛋白C、低密度脂蛋白的含量,资料如 下表所示,请对此作分析。
表1 40名就诊患者血清中载脂蛋白的测量结果(单位:mg/dl)
序号i 载脂蛋白AⅠ 载脂蛋白B 载脂蛋白E 载脂蛋白C
X1
1
173
X2
X3
X4
106
7.0
14.7
2
139
132
6.4
17.8
3
198
112
6.9
16.7
4
1Hale Waihona Puke Baidu8
138
7.1
15.7
…
…
…
…
…
39
173
123
8.7
19.0
40
132
131
13.8
29.2
低密度 脂蛋白
Y 137 162 134 188 … 188 122
表3 多元回归分析数据格式
例号 X1
X2
Xm
Y
1
X11 X12
X1m
Y1
2
X21 X22
X2m
Y2
n
Xn1 Xn2
Xnm
Yn
一、多元线性回归模型
一般形式为:
Y 0 1X1 2 X 2 ... m X m
β0 :常数项,又称为截距
β1,β2,…,βm: 偏 回 归 系 数 (Partial regression
布 4.方差齐性:对任意一组自变量取值,因变量y的方差相
同 后两个条件等价于:残差ε服从均数为0、方差为σ2的正
态分布
多元线性回归的分析步骤:
1.根据样本数据求得模型参数的估计值,得到应变量 与自变量数量关系的表达式: Y b0 b1X1 b2 X 2 ...... bm X m 此公式称为多元线性回归方程
2.对回归方程及各自变量作假设检验,并对方程的拟 合效果及各自变量的作用大小作出评价。
多元线性回归方程的建立:
利用最小二乘法原理估计模型的参数: (使残差平方和最小)
表2 27名糖尿病人的血糖及有关变量的测量结果
序号 总胆固醇 甘油三酯 胰岛素 糖化血红蛋白
血糖
i (mmol/L) (mmol/L) (U/ml)
12.3
27
3.84
1.20
6.45
9.6
10.4
1.人的体重与身高、胸围有关 2.人的心率与年龄、体重、肺活量有关
3.人的血压值与年龄、性别、劳动强度、饮食习惯、吸烟 状况、家族史等有关
4.射频治疗仪定向治疗脑肿瘤过程中,脑皮质的毁损半径 与辐射的温度、照射的时间有关
…
多元线性回归:简称为多元回归,分析一 个应变量与多个自变量间的线性关系。
SS总 lYY 222.5519 SS回 0.142467.6962 0.351589.8025 0.2706142.4347 0.638284.5570
133.7107 SS残 222.5519 133.7107 88.8412
ANOVAb
M od e l
1
Re gre ssi o n
表2 27名糖尿病人的血糖及有关变量的测量结果
序号 i
总胆固醇 甘油三酯 胰岛素
(mmol/L) (mmol/L) (U/ml)
X1
X2
X3
糖化血红蛋白 (%) X4
血糖 (mmol/L)
Y
1
5.68
1.90
4.53
8.2
11.2
2
3.79
1.64
7.32
6.9
8.8
3
6.02
3.56
6.95
10.8
Sum of Squares 133.711
df 4
Re si du a l
88.841
22
T o ta l
222.552
26
a. Predictors: (Constant), x4, x2, x3, x1
b. Dependent Variable: y
Mean Square 33.428 4.038
x4
.032
.006
x5
-.017
.013
a. Dependent Vari abl e: y
Standardi zed Coeffi ci ents
Beta
.112 .476 .434 .431 -.105
t 13.893
1.305 5.693 6.491 5.048 -1.318
列出回归方程为:?????
Si g. .000 .201 .000 .000 .000 .196
二、多元回归方程的假设检验
回归方程是否成立? 各偏回归系数是否等于0?
1.多元线性回归方程的假设检验:
方差分析法: (所有回归系数均为0)
1.多元线性回归方程的假设检验:
H0 : 1 2 m 0 H1 : i (i 1, 2, , m)不全为0