常用多因素回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ANOVAc df 1 28 29 2 27 29 Mean Square 1593.353 29.712 857.229 26.328 F 53.626 Sig. .000 a
2
32.560
.000 b
a. Predic tors : (Cons tant), 瘦 素 b. Predic tors : (Cons tant), 瘦 素 , 体 重指 数 c. Depende nt Varia ble : 脂 联素
a Coefficients
Model 1 2
(Cons tant) 瘦素 (Cons tant) 瘦素 体 重指 数
Uns tandardized Coefficients B Std. Error 30.528 1.882 -1.161 .159 53.481 10.848 -.753 .242 -1.087 .507
2016/12/4 2016/12/4 公共卫生学院 医学统计与流行病学系 20
20
Enter法
Model 1 (Cons tant) 体重指数 病程 瘦素 空腹血糖 Uns tandardized Coefficients B Std. Error 58.199 11.575 -1.030 .530 -.131 .211 -.811 .253 -.579 .447
t 5.028 -1.942 -.621 -3.211 -1.293
Sig. .000 .063 .540 .004 .208
a. Dependent Variable : 脂 联 素
Stepwise法:
Model 1 2 (Cons tant) 瘦素 (Cons tant) 瘦素 体 重指 数
ˆ 58.199 1.030X 0.131X 0.811X 0.579X Y 1 2 3 4
t 16.219 -7.323 4.930 -3.112 -2.145
Sig. .000 .000 .000 .004 .041
a. Depende nt Variab le: 脂 联素
ˆ 53.4811.087 X 0.753X Y 1 3
(Χ1:体重指数;Χ3:瘦素)
2016/12/4
p
e P 0 1 X 1 ... p X p 1 e
0 1 X 1 ... p X p
P ln( ) 0 1 X 1 ... p X p 1-P
OR exp( i )
2016/12/4 公共卫生学院 医学统计与流行病学系 5
两者关系如何?
2016/12/4
2016/12/4 公共卫生学院 医学统计与流行病学系
12
(1)回归方程的假设检验(方差分析)
•用于回答总的来说回归方程是否成立
H0:β1 = β2 =… = βm =0 H1:β1, β2,…, βm不全为0
0.05
Model 1 Regres s ion Res idual Total Regres s ion Res idual Total Sum of Squares 1593.353 831.948 2425.301 1714.458 710.844 2425.301
Coefficientsa Standardized Coefficients Beta -.343 -.067 -.566 -.139 95% Confidence Interval for B Lower Bound Upper Bound 34.359 82.039 -2.122 .062 -.566 .304 -1.332 -.291 -1.500 .343
a Coefficients
Uns tandardized Coefficients B Std. Error 30.528 1.882 -1.161 .159 53.481 10.848 -.753 .242 -1.087 .507
Standardized Coefficients Beta -.811 -.525 -.362
多重线性回归、logistic回归与Cox回归的比较
2016/12/4
公共卫生学院 医学统计与流行病学系
3
多重线性回归模型
2016/12/4
公共卫生学院 医学统计与流行病学系
4
Logistics回归模型:
lo g it ( P ) 0 1 X 1 ... p X
P ln( ) 0 1 X 1 ... p X p 1-P
2016/12/4
2016/12/4 公共卫生学院 医学统计与流行病学系
13
讨论 此方差分析表得出的结论是什么?
2016/12/4
公共卫生学院 医学统计与流行病学系
14
(2)模型拟合情况
2016/12/4
公共卫生学院 医学统计与流行病学系
15
(3)各偏回归系数的假设检验(t检验)
• 回归方程有统计学意义并不说明每一个偏回归系数都 有意义。 0.05 H0: βi =0 , H1: βi ≠ 0
实习七
常用多因素回归分析
2016/12/4
公共卫生学院 医学统计与流行病学系
1
目的要求
1. 掌握多重线性回归、logistic回归及生存分 析的资料特征及应用; 2. 掌握多重线性回归、logistic回归及生存分 析的分析步骤; 3. 正确解读SPSS结果。
2
2016/12/4
公共卫生学院 医学统计与流行病学系
2016/12/4
2016/12/4 公共卫生学院 医学统计与流行病学系 16
3.多重线性回归的前提条件(LINE):
• 1.线性(Line) :因变量和自变量组合之间的 关系有线性趋势。(残差图) • 2.独立(Independence):样本中的个体之间 相互独立。 (专业知识、D-W 统计量) • 3.正态(Normal):给定各个X值后,相应的 Y值服从正态分布。 (残差直方图) • 4.等方差(Equal variance) :各X值变动时, 相应的Y有相同的变异度。(残差图)
Cox回归模型
RR exp( i )
2016/12/4 公共卫生学院 医学统计与流行病学系 6
讨论内容
一、 为了研究有关糖尿病患者体内脂联素 水平的影响因素,某医师测定了30名男性患者 的体重指数BMI(kg/m2)、病程DY(年)、瘦素 LEP(ng/ml)、空腹血糖FPG(mmol/L)及脂 联素ADI(ng/ml)水平,数据如表7-1所示。
由标准化残差的直方图可见,近似正态分布;
2016/12/4
2016/12/4 公共卫生学院 医学统计与流行病学系
19
自变量筛选方法
Enter: 强行进入法,候选变量全部纳入模型,不 作任何筛选。一般生物学上认为有意义的,需纳 入校正其他的因素时可使用Enter法。
Stepwise:逐步法,确定两个界值α引入 和α剔除 ,用于 变量入选或剔除,当在候选变量中偏回归平方和 最大者P值小于α引入 时,引入相应变量,当已进入 回归方程的变量中偏回归平方和最小者,P值大 于α剔除时,剔除相应变量。如此反复,直至未入选 的变量中无符合条件的选入项,入选的变量中无 可剔除的项,此时即到回归方程。
Standardized Coefficients Beta -.811 -.525 -.362
t 16.219 -7.323 4.930 -3.112 -2.145
Sig. .000 .000 .000 .004 .041
a. Depende nt Variab le: 脂 联素
讨论 1.如何判断自变量对因变量的影响大小及方向? 2.本例中如何比较体重指数、病程、空腹血糖、瘦素对 脂联素水平影响大小? 3.通过以上分析可以得到什么结论?
体重指数 ( X1) 24.14 26.45 25.22 27.22 25.93 26.99 25.71 28.41 26.39 28.73 27.46 27.99 28.41 30.69 29.39
2016/12/4
公共卫生学院 医学统计与流行病学系
8
多重线性回归
估计线性 回归方程
假设检验 (回归模型、偏 回归系数)
2016/12/4
2016/12/4 公共卫生学院 医学统计与流行病学系 17
残差图以及残差直方图:
图10-1 多重线性回归模型的残差图
图10-2 多重线性回归模型的残差直方图
2016/12/4
2016/12/4 公共卫生学院 医学统计与流行病学系 18
本例:
标准化残差大部分在(-2,+2)之间;残差图近似 矩形,说明资料满足线性及方差齐性条件; D-W统计量值为2.275,故认为满足独立条件;
结合所学知识,应该如何进行统计分析?
2016/12/4 公共卫生学院 医学统计与流行病学系 7
表7-1 脂联素水平与相关因素的测量数据
体重 指数 ( X 1) 24.22 24.22 19.03 23.39 19.49 24.38 19.03 21.11 23.32 24.34 23.82 22.86 24.49 23.37 20.81 病程 ( X2 ) 10.0 3.0 15.0 3.0 4.0 6.0 2.9 9.0 5.0 2.0 8.0 20.0 12.0 6.0 7.0 瘦素 ( X3) 5.75 9.32 2.50 5.66 2.83 6.86 3.22 4.90 3.54 4.51 8.47 9.92 6.01 4.31 3.46 空腹 血糖 ( X4 ) 13.6 6.2 11.1 9.7 7.3 7.3 7.7 6.0 6.7 7.2 9.1 8.1 7.0 6.3 7.1 脂联素 (Y ) 29.36 14.31 26.08 19.62 42.82 22.76 31.00 17.28 30.25 24.28 18.94 16.08 29.50 25.64 32.26 病程 ( X2 ) 5.0 4.0 2.3 3.0 6.0 12.0 7.0 4.0 4.0 10.0 16.0 10.0 2.0 1.5 3.0 瘦素 ( X3) 10.21 19.31 8.65 8.54 7.21 8.75 13.07 8.90 23.26 19.05 19.44 17.33 14.59 22.06 20.56 空腹 血糖 ( X4 ) 7.4 5.1 7.6 8.6 8.9 7.0 13.5 13.5 8.2 6.9 6.5 6.1 6.8 8.1 7.5 脂联素 (Y ) 16.01 19.03 17.46 20.36 15.92 15.34 8.05 12.31 5.59 8.59 8.89 14.10 11.74 5.18 6.12
2016/12/4 公共卫生学院 医学统计与流行病学系 10
10
思考: 回归方程中Y ˆ 、常数项、各偏回归系数的 含义;
2016/12/4
公共卫生学院 医学统计与流行病学系
11
2.构建多重线性回归方程后,请思考:
回归方程是否有统计学意义? 回归方程的拟合效果如何?
方差分析和 t 检验的目的分别是什么?
讨论前提条件 (残差图) 应用:筛选危险 因素、估计变量 值、预测、控制
2016/12/4
公共卫生学院 医学统计与流行病学系
9
1.构建由X1,X2,X3 ,X4预测Y的多重 线性回归方程 (SPSS输出结果)
a Coefficients
Model 1 2
(Cons tant) 瘦素 (Cons tant) 瘦素 体 重指 数
t 16.219 -7.323 4.930 -3.112 -2.145
Sig. .000 .000 .000 .004 .041
95% Confidence Interval for B Lower Bound Upper Bound 26.672 34.383 -1.486 -.837 31.223 75.739 -1.249 -.256 -2.127 -.047
Uns tandardi zed Coefficients B Std. Error 30.528 1.882 -1.161 .159 53.481 10.848 -.753 .242 -1.087 .507
Standardi zed Coefficients Beta -.811 -.525 -.362