SPSS曲线回归多元分析等
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2007年1月
60 50 40 30 20 10 0 0 20 40 x 60 80
y
70 60
y = -0.7525x + 46.46 R 2 = 0.8856
y
50 40 30 20 10 0 0
y = -15.966Ln(x) + 72.283 R 2 = 0.9654
20
40 x
60
80
120 100 80 60 40 20 0 0 20 40 x 60 80
ˆ b0 b1x 拟合复合曲线模型 y
ˆ e(b0 b1x) 拟合复合比级数曲线模型 y ˆ b0 b1 ln x 拟合对数方程 y
ˆ b0 b1x b2 x 2 b3 x3 拟合三次方程 y ˆ e(b0 b1 / x) 拟合 S 形曲线 y ˆ b0eb1x 拟合指数方程 y ˆ b0 b1 / x 拟合方程 y ˆ b0 xb1 拟合乘幂曲线模型 y ˆ 1/(1/ u b0 b1x ) 。选择 拟合 Logistic 曲线模型 y
2007年1月
SPSS软件计算
Analyze Regression Binary Logistic… Dependent: y Covariates: x1~ x8 Method: Forward Ward Save…—— Predicted Values Probabilities Group membership Option—— CI for exp 95% Probability for Stepwise Entry: 0.1 Removal 0.15
0.1380 0.1017 0.0053 0.0361 1.0921 0.0563 0.0566 0.1597 1.6458
ˆ 19.7451 7.7771(ln X ); R 2 0.9922 Y
2007年1月
(四)比较决定系数,确定“最佳”方 程
30 25 20 15 10 5 0 0 y^ = 10.863x + 7.7607 2 R = 0.9391
2007年1月
注意事项
4. 多分类logistic回归 应变量
心理疾病分为精神分裂症、抑郁症、神 经官能症等(名义变量nominal variables) ;疗效评价分为无效、好转、显效、痊愈( 有序变量ordinal variables)。
参见“余松林主编。医学统计学(七年制 全国规划教材,第17章, 2002年3月 )”
2007年1月
Linear Quadratic Compound Growth Logarithmic Cubic S Exponential Inverse Power Logistic
拟合直线方程,与 Linear 过程的直线回归相同 ˆ b0 b1x b2 x 2 拟合二次方程 y
2007年1月
注意事项
1. 分类自变量的哑变量编码
为了便于解释,对二项分类变量一 般按0、1编码,一般以0表示阴性或较 轻情况,而1表示阳性或较严重情况。 如果对二项分类变量按+1与-1编码,那 么所得的 OR exp( 2 ),容易造成错误的 解释。
2007年1月
西、中西、中三种疗法哑变量化
32例40岁以上男性的年龄、吸烟 、 Quetelet指数与收缩压
2007年1月
多元回归分析数据格式
2007年1月
Spss 应用
从菜单选择 Regression Linear… Method中的选项: Enter 所选自变量强行全部选入方程 Stepwise 逐步回归法 重要的结果 R、R Square、 Adjust R Square反映模型 对应变量变异的解释程度。Adjust R Square尤其用于自变量个数不等的模型 之间的比较。 2007年1月
SPSS 统计软件
曲线拟合 多元回归 Logistic回归分析
Cox回归分析
一、曲线拟合
Curve fitting
2006级研究生
医学研究中,X与Y两变量的数量关系并 非总是线性的,如 • 毒物剂量——动物死亡率
• 年龄——身高
• 时间——血药物浓度
可用曲线直线化估计(Curve estimation) 或 非线性回归(Nonlinear regression) 方法进行统计学分析。
2007年1月
曲线直线化估计的步骤
绘制散点图,根据图形和专业知识选取曲线类 型(可同时选取几类) 按曲线类型,作曲线直线化变换 建立变换数据间的直线回归方程
(假设检验,计算决定系数)
比较决定系数选取“最佳”方程
写出曲线方程
2007年1月
2007年1月
常见的曲线回归方程
①幂函数: ②对数:
2007年1月
二、多元(重)线性回归 Multiple linear regression
2006级研究生
例 子
人的体重与身高、胸围 血压值与年龄、性别、劳动强度、饮食 习惯、吸烟状况、家族史 糖尿病人的血糖与胰岛素、糖化血红蛋 白、血清总胆固醇、甘油三脂 射频治疗仪定向治疗脑肿瘤过程中,脑 皮质的毁损半径与辐射的温度、与照射的 时间 2007年1月
y
60 50
y = 159.93x-0.7191 R 2 = 0.8293
y
40 30 20 10 0 0 20
y = 56.665e-0.038x R 2 = 0.9551
40 x
60
80
非线性回归方程
非线性回归与一般线性回归的求解方法不 同在于: 1. 需要给定参数(a、b)的初始值 2. 采用迭代方法,不断更新估计的参数, 直至稳定在某一值为止。 优点:在需要变换Y时,结果更可靠。
(一)53例接受手术的前列腺癌患者情况
2007年1月
(二)26例冠心病病人和28例对照进行 病例对照研究
?
?
2007年1月
26例冠心病病人和28例对照者进行 病例对照研究
2007年1月
一、logistic回归模型
2007年1月
概率预报模型
exp( 0 1 X 1 p X p ) 1 exp( 0 1 X 1 p X p )
1 1 exp[ ( 0 1 X 1 p X p )] 1 1 e
( 0 1 X 1 p X p )
2007年1月
条件logistic回归
2007年1月
应用及其注意事项
应变量为(二项)分类的资料 (预测、判别、危险因素分析等等)
ˆ Y
7.23 12.62 15.77 18.01 19.75 21.16 22.36 23.40
残差平方
0.2 7.6 0.4 12.3 0.6 15.7 0.8 18.2 1.0 18.7 1.2 21.4 1.4 22.6 1.6 23.8 合计140.3
2.5902 57.76 0.8396 151.29 0.2609 246.49 0.0498 331.24 0.0000 349.69 0.0332 457.96 0.1132 510.76 0.2209 566.44 4.1078 2671.63
2007年1月
实例
Brown(1980)在术前检查了53例前列腺 癌患者,拟用年龄(AGE)、酸性磷酸酯酶 (ACID)两个连续型的变量,X射线(X_RAY)、 术前探针活检病理分级(GRADE)、直肠指检 肿瘤的大小与位置(STAGE)三个分类变量与 手术探查结果变量NODES(1、0分别表示癌 症的淋巴结转移与未转移 )建立淋巴结转 移的预报模型。 2007年1月
ANOVA方差分析表中的Sig.反映模型是否 有统计学意义 Coefficients表中B为各自变量系数(回归 系数)。Beta为标准化回归系数,其绝 对值用于说明自变量的重要性。t、Sig. 检验各系数是否有统计学意义。 逐步回归的重要选项 Method要选为Stepwise Options中要设定合适的选入选出标准(注 :Removal中设定的p值必须大于Entry 中的设定。)
25 20 15 10 5 0 y^ = 7.7771Ln(x) + 19.745 2 R = 0.9922
0.5
1
0.5367
1.5
2
0
0.5
1
1.5
2
30 25 20 15 10 5 0 0
y^ = 19.3248 x 2 R = 0.9823
30 25 20 15 10 5 0
y^ = 8.7302e0.7136x R2 = 0.8425
三、Logistic回归
Logistic regression
2006级研究生
第一节.非条件logistic回归 第二节.条件logistic回归 第三节. 应用及其注意事项
2007年1月
什么情况下采用Logistic回归
医学研究中常碰到应变量的可能取值 仅有两个(即二分类变量),如发病与未 发病、阳性与阴性、死亡与生存、治愈与 未治愈、暴露与未暴露等,显然这类资料 不满足多元(重)回归的条件
缺点:a.计算复杂;b.初始值不适当时,估计不 准确.
2007年1月
采用SPSS进行曲线拟合
曲线直线化
Analyze Regression Curve Estimation … 可选Power 、Logarithmic、Exponential、 Quadratic、Cubic 等
非线性回归
Analyze Regression Nonlinear … 设置模型: Model Expression 参数赋初值:Parameters…
1西 X1 0 其它 1 中西 X2 0 其它
疗法 西 中西 中
50 20 18 70 35 0 1 0 0 0 性别 年龄 1 1 0 0 1
X1 1 0 0
X1 X2 1 0 0 0 1
X2 0 1 0
原资料
姓名 张山 李四 王五 刘六 赵七 性别 年龄 疗法 1 1 0 0 1 50 20 18 70 35 中西 西 中 中 中西
X'=lnX
-1.6094 -0.9163 -0.5108 -0.2231 0 0.1823 0.3365 0.4700 -2.2708
2007年1月
(一)绘制散点图,决定曲线类型 ˆ =a+blnX (二)曲线直线化变换 Y
2007年1月
(三)建立直线回归方程
X Y X'=lnX -1.6094 -0.9163 -0.5108 -0.2231 0 0.1823 0.3365 0.4700 -2.2708 (lnX)2 Y2 (lnX)Y -12.2314 -11.2705 -8.0196 -4.0604 0.0000 3.9012 7.6049 11.1860 -12.8898
0.5
1
1.5
2
0
0.5
1
1.5
2
2007年1月
利用线性回归拟合曲线(例2)
表9-11 15名重伤病人的住院天数X与预后指数Y
编 号
1
2
2
5
3
4
5
6wenku.baidu.com
7
8
9 10 11 12 13 14 15 53 60 65 8 4 6
X Y
7 10 14 19 26 31 34 38 45 52 8 11
54 50 45 37 35 25 20 16 18 13
③指数函数:
b ˆ Y aX
或
ˆ ) ln a b ln( X ) ln(Y
或
ˆ a b ln( X ) Y
bX ˆ Y ae
ˆ ) ln a bX ln(Y
④多项式:
⑤logistic: ˆ
2 n ˆ Y a b1 X b2 X bn X
ˆ /(1 ˆ )] a bX 1 /(1 e a bX ) 或 ln[
哑变量化
姓名 张山 李四 王五 刘六 赵七
孙八
0
29
西
孙八
0
29
1
0
2007年1月
注意事项
2.自变量的筛选 不同的筛选方法有时会产生不同的模 型。实际工作中可同时采用这些方法,然 后根据专业的可解释性、模型的节约性和 资料采集的方便性等,决定采用何种方法 的计算结果。
2007年1月
注意事项
3.交互作用 交互作用的分析十分复杂,应 根据临床意义与实际情况酌情使用。
此模型, “Upper bound”框被激活,输入数值,作 为上界
利用线性回归拟合曲线(例1)
例 上海医科大学微生物学教研室以已知浓度X的免疫球蛋 白A(IgA, μg/ml)作火箭电泳, 测得火箭高度Y(mm)如表1 所示。试拟合Y关于X的非线性回归方程。
编号 1 2 3 4 5 6 7 8 合计 X 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 Y 7.6 12.3 15.7 18.2 18.7 21.4 22.6 23.8 140.3