logistic回归模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

简单分析实例
结果分析
Variables in the Equation
B
S.E. Wald df
Sig. Exp(B)
Satepsex 1 ecg
1.356 .873
.546 6.162 .384 5.162
1 .013 3.882 1 .023 2.395
age .093 .035 7.000
1 .008 1.097
二分类logistic回归模型
非条件logistic回归
模型简介

简单分析实例


哑变量设置

自变量的筛选方法与逐步回归

模型拟合效果与拟合优度检验
模型的诊断与修正
条件logistic回归
模型简介
对分类变量的分析,当考察的影响因素较少,且也为分类 变量时,常用列联表(Contingency Table)进行整理, 并用2检验或分层2检验进行分析,但存在以下局限性:
模型的诊断与修正
❖ 多重共线性的识别:
目前SPSS的logistic过程中尚没有关于多重共线性 诊断的结果输出,代替方法之一是运用相同的反应 变量与自变量,拟合线性回归模型,并进行相应的 共线性诊断。
条件logistic回归-简介
匹配设计(matched design)是在设计阶段控制混杂因素的 一种方法。当得到一名研究病例后,选择一名或多名非病例 作为对照,选择相应对照的条件是:某些需要控制的混杂因 素与该病例之间相同或相似,从而形成一个匹配的对子。一 个匹配的对子可以只有 1个病例和1个对照,称1:1匹配; 当病例很罕见时,常采用 1个病例,多个对照,此时称为1: m匹配,常用的 m一般小于等于4,不同的对子,m可以不同; 还可设计m:n匹配,即不同对子的病例与对照个数均可不同, 这样的设计增加了收集资料的灵活性。
Forward:Conditional (最可靠) Forward:LR Forward:Wald (应当慎用) Backward: Conditional (最可靠) Backward:LR Backward:Wald(应当慎用)
模型的诊断与修正
❖ 多重共线性的识别:
多重共线性的对偏回归系数的影响与线性回归模型中的表现 一致,如增加或删除一条记录,模型中偏回归系数值发生较 大变化,专业上认为有意义的因素无统计学意义等等。 如果在进行logistic模型分析中,尤其是在向模型中引入交 互作用项时出现了回归结果反常现象,则自变量之间的多重 共线性是需要排除的一种可能。
Байду номын сангаас
选入应变量
选入自 变量
简单分析实例
结果分析
Dependent Variable Encoding
Original Value 未患病 患病
Internal Value 0 1
❖ 此表为应变量取值水平编码,SPSS默认取值水平 高的为阳性结果。
简单分析实例
结果分析
Model Summary
-S2teLpog likC eo lihxo&odSnell R NaSgqeulkaere rke R Square
❖ SPSS中的拟合方法:
用变量差值拟合:只适用于1:1配对的情况,用
Multinomial logistic 过程实现;
用分层Cox模型拟合:适用范围非常广。
条件logistic回归-实例分析
例4 Mack等人预考察服用雌激素与患子宫内膜癌的关 系,对退休居住在社区的妇女进行病例对照研究。除服 用雌激素以外,研究的自变量还包括肥胖、胆囊病史、 服用其他非雌激素药物。数据见1_1_logistic.sav。
Const-a5n.6t 42 1.806 9.757
1 .002 .004
a.Variable(s) entered on step 1: sex, ecg, age.
❖ 此表输出模型中的各自变量的偏回归系数及其标准
误、Wald 2、自由度、P 值、OR值(即exp(B))。
逐步回归
❖ 6 种筛选自变量的方法
1
8 6 .81 1 a
.237
.316
aE . stimation terminated at iteration numbe changed by less than .001.
❖ 本表输出当前模型的-2log(似然值)和两个伪决 定系数,但对于logistic回归而言,通常看见的伪决 定系数不像线性回归模型中的决定系数那么大。
条件logistic回归-简介
对于这类匹配设计资料,如果采用以上介绍的非条件 logistic回归方法,将会降低检验效能。而应当采用 条件logistic回归模型(conditional logistic regression model)又称配对logistic回归模型进行 分析。
条件logistic回归
模型简介
❖ logistic回归模型:
lo g it(P )01 X 1 p X p
P1 ex ep x(p (0 0 1 X 1X 1 1 pX pX p)p)
1P1exp(011 X 1 pXp)
模型简介-适用条件
反应变量为二分类变量或某事件的发生率; 自变量与logit(P)之间为线性关系; 残差合计为0,且服从二项分布; 各观测间相互独立。 ❖ logistic回归模型应该使用最大似然法来解决方程的 估计和检验问题,不应当使用以前的最小二乘法进行参数 估计。
简单分析实例
例1 某医师希望研究病人的年龄age、性别sex (0为女性、1为男性)、心电图检验是否异常 ecg(ST段压低、0为正常、1为轻度异常、2为 重 度 异 常 ) 与 冠 心 病 ca 是 否 有 关 , 数 据 见 logistic_binary.sav。
简单分析实例
简单分析实例
无法描述其作用大小和方向,更不能考察各因素间是否 有交互作用;
当控制的分层因素较多时,将导致检验结果不可靠; 2检验无法对连续性自变量进行分析(致命缺陷)。
模型简介
logistic回归模型适合于应变量为二项分类的资料, 在医学研究领域中的应用广泛。如流行病病因学研 究(包括队列研究、病例对照研究、横断面研究 等)、临床疗效研究(如疗效与治疗方法、患病轻 中重等因素关系)、卫生服务研究(如是否就诊与 性别、年龄、文化程度的关系)等等。
相关文档
最新文档