实用spss十三logistic回归模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

浙江大学医学院流行病与卫生统计学教研室 沈毅
Baidu Nhomakorabea
哑变量设置
在回归模型中,回归系数b表示其他自变量不变,x
每改变一个单位时,所预测的y的平均变化量,当x 为连续性变量时,这样解释没有问题,二分类变量 由于只存在两个类别间的比较,也可以对系数得到 很好的解释。但是当x为多分类变量时,仅拟合一 个回归系数就不太合适了,此时需要使用哑变量 (dummy variable)方式对模型进行定义。
浙江大学医学院流行病与卫生统计学教研室 沈毅
哑变量设置
例2 Hosmer 和Lemeshow于1989年研究了低出生体 重婴儿的影响因素,结果变量为是否娩出低出生体重 儿(变量名为LOW,1表示低出生体重儿,0表示非 低出生体重儿),考虑的自变量有产妇妊娠前体重、 产妇年龄、种族、是否吸烟、早产次数、是否患高血 压等。(数据文件见:logistic_step.sav。)
Satep age
1
l wt
-.025 -.014
.037 .007
浙江大学医学院流行病与卫生统计学教研室 沈毅
模型简介
❖ logistic回归模型:
log it(P) 0 1 X1 L p X p
P exp(0 1 X1 L p X p ) 1 exp(0 1 X1 L p X p )
1 P
1
1 exp(0 1 X1 L p X p )
Internal Value 0 1
❖ 此表为应变量取值水平编码,SPSS默认取值水平 高的为阳性结果。
浙江大学医学院流行病与卫生统计学教研室 沈毅
简单分析实例
结果分析
Model Summary
Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square
浙江大学医学院流行病与卫生统计学教研室 沈毅
哑变量设置
浙江大学医学院流行病与卫生统计学教研室 沈毅
哑变量设置
浙江大学医学院流行病与卫生统计学教研室 沈毅
哑变量设置
选入无序多 分类变量
设置参照水 平
浙江大学医学院流行病与卫生统计学教研室 沈毅
哑变量设置
❖ 哑变量(种族)的设置情况
结果分析
Categorical Variables Codings
二分类logistic回归模型
浙江大学医学院流行病与卫生统计学教研室 沈毅

非条件logistic回归
模型简介
简单分析实例


哑变量设置

自变量的筛选方法与逐步回归

模型拟合效果与拟合优度检验
模型的诊断与修正
条件logistic回归
浙江大学医学院流行病与卫生统计学教研室 沈毅
模型简介
对分类变量的分析,当考察的影响因素较少,且也为分类 变量时,常用列联表(Contingency Table)进行整理, 并用2检验或分层2检验进行分析,但存在以下局限性:
浙江大学医学院流行病与卫生统计学教研室 沈毅
简单分析实例
浙江大学医学院流行病与卫生统计学教研室 沈毅
简单分析实例
选入应变量
选入自 变量
浙江大学医学院流行病与卫生统计学教研室 沈毅
简单分析实例
结果分析
Dependent Variable Encoding
Original Value 未患 病 患病
浙江大学医学院流行病与卫生统计学教研室 沈毅
简单分析实例
例1 某医师希望研究病人的年龄age、性别sex (0为女性、1为男性)、心电图检验是否异常 ecg(ST段压低、0为正常、1为轻度异常、2为 重 度 异 常 ) 与 冠 心 病 ca 是 否 有 关 , 数 据 见 logistic_binary.sav。
无法描述其作用大小和方向,更不能考察各因素间是否 有交互作用;
当控制的分层因素较多时,将导致检验结果不可靠; 2检验无法对连续性自变量进行分析(致命缺陷)。
浙江大学医学院流行病与卫生统计学教研室 沈毅
模型简介
logistic回归模型适合于应变量为二项分类的资料, 在医学研究领域中的应用广泛。如流行病病因学研 究(包括队列研究、病例对照研究、横断面研究 等)、临床疗效研究(如疗效与治疗方法、患病轻 中重等因素关系)、卫生服务研究(如是否就诊与 性别、年龄、文化程度的关系)等等。
a. Variable(s) entered on step 1: sex, ecg, age.
df 1 1 1 1
Si g. .013 .023 .008 .002
Exp(B) 3.882 2.395 1.097 .004
❖ 此表输出模型中的各自变量的偏回归系数及其标准
误、Wald 2、自由度、P 值、OR值(即exp(B))。
1
86.811a
.237
.316
a. Estimation terminated at iteration number 5 because parameter estimates changed by less than .001.
❖ 本表输出当前模型的-2log(似然值)和两个伪决 定系数,但对于logistic回归而言,通常看见的伪决 定系数不像线性回归模型中的决定系数那么大。
Frequency
种族 白人
96
黑人
26
其他种族
67
Parameter coding
(1) 1.000
(2) .000
.000
1.000
.000
.000
浙江大学医学院流行病与卫生统计学教研室 沈毅
哑变量设置
结果分析
Variables in the Equation
B
S.E.
Wal d
df
Si g.
浙江大学医学院流行病与卫生统计学教研室 沈毅
简单分析实例
结果分析
Variables in the Equation
B
S.E.
Wal d
Satep sex
1
ecg
1.356 .873
.546
6.162
.384
5.162
age
.093
.035
7.000
Constant -5.642
1.806
9.757
浙江大学医学院流行病与卫生统计学教研室 沈毅
模型简介-适用条件
反应变量为二分类变量或某事件的发生率; 自变量与logit(P)之间为线性关系; 残差合计为0,且服从二项分布; 各观测间相互独立。 ❖ logistic回归模型应该使用最大似然法来解决方程的 估计和检验问题,不应当使用以前的最小二乘法进行参数 估计。
相关文档
最新文档