非条件Logistic回归实例解析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.其他变量,如性别,心电图轻度异常与 正常比较均没有统计学意义(p>0.05 )。
学习要点:
1.了解Logistic回归分析的基本思想; 2.了解Logistic回归分析的医学应用; 3.熟悉非条件Logistic回归分析在SPSS19.0 中操作演练及统计结果解释;
4.了解非条件Logistic回归分析的注 意事项。
OR值定义及其意义
OR值=(病例中暴露的比例/病例中非暴露的 比例)/(对照中暴露的比例/对照中非暴露的 比例)
OR值=2,说明病例中暴露于某个危险因素的 比例为对照组的2倍,说明该因素可能与疾病 发生有关。
统计结果解释
结果显示:最终引入模型的变量及常数项的偏 回归系数值B,标准误(SE),Wald卡方值 (Wals),自由度(df),P值(Sig),及其 OR值(ExpB)和OR的95%CI。
4.了解非条件Logistic回归分析的注 意事项。
三、SPSS19.0实例应用与解析
1、自变量进入模型的方法:
一般分为:进入法(enter)、前进法(forward) 和后退法(backward)3种,后两种方法还可 以分为条件(conditional)、偏拟然比(LR) 和Wald检验3种。如果变量较少,通常采用进入 法,如果变量太多,则选用前进LR,前进LR相 当于多重线性回归分析中的逐步回归,本例当中 采用进入法。
学习要点:
1.了解Logistic回归分析的基本思想; 2.了解Logistic回归分析的医学应用; 3.熟悉非条件Logistic回归分析在SPSS19.0 中操作演练及统计结果解释;
4.了解非条件Logististic回归分析的基本思想
多重线性回归模型适用于分析一个连续型因变 量与一组自变量之间的关系,但如果因变量为 分类变量,那么因变量与自变量之间就丧失了 线性关系,则不适用线性回归分析来解决,但 经过Logit变化后,就可以将模型转变为线性 关系,这就产生了Logistic回归模型。
1、线性回归资料:
比如肺活量可能与患者的年龄、身高、体重、 胸围等因素是否有关?

适合用线性相关与回归的模型。
2、分类回归资料:
比如冠心病发生与否和患者的性别、年龄、心 电图是否异常等因素是否有关?

适合用非条件Logistic回归模型。
3.Logistic回归模型分类: (1)非条件Logistic回归:又称为二分类
同样,对于自变量的赋值也要尽量遵循这一 规则,以免导致解释的方向反了。
4、非条件Logistic回归分析的注意事项
2.哑量设置:Logistic回归分析的变量包括连续变量、 等级变量和分类变量,对于连续变量和分类变量(转换 为哑变量)直接引入模型。
等级变量需要则须满足一个前提条件:即等级分组与 Logit(p)呈线性关系,其效应等比例增加或降低。
单因素分析(t检验、卡方检验等)主要筛 选出可能影响因素,回归分析筛选出相关性因 素。
5、思考与交流?
如何运用SPSS19.0在Logistic回归中分析两个
变量之间的协调作用(交互作用)?
我的读书报告汇报完毕了。 感谢老师和同学们听取了我的读书报告,
对于报告中存在的问题或不足,欢迎大 家给予批评和指点。 谢谢!!
将研究因素、混杂因素及其交互作用全部纳入模型,能够 在控制混杂因素的作用下,对研究因素与因变量间的联系作 出定量描述。
2.筛选危险因素:
如果自变量太多或变量作用不清楚,则需要事先按规定的 检验水准,将有统计学意义的变量纳入模型,而将无统计学 意义的变量剔除,以保证模型最优。
3.预测与判断:
4、非条件Logistic回归分析的注意事项
1.赋值注意:二分类过程默认以因变量较大 取值的概率P来建立模型,因此赋值要注意, 0代表不发生(即不感兴趣的事件,y=0),1 代表发生(即感兴趣的事件,y=1)
比如,以是否患有心脏病为因变量,那么 y=1表示有心脏病,y=0表示无心脏病。
因变量的赋值决定了模型的解释,须注意!
这是非条件Logistic回归的重要作用,我们可以给定变量 的数值,则可通过回归方程计算相应的概率预测值,对个体 所属类别作出概率性的判断。
学习要点:
1.了解Logistic回归分析的基本思想; 2.了解Logistic回归分析的医学应用; 3.熟悉非条件Logistic回归分析在SPSS19.0 中操作演练及统计结果解释;
结果解释:
1、年龄的回归系数为0.163, Wald检验结 果P<0.05,有统计学意义,OR值为1.178,CI 为1.042-1.330,说明年龄大的患者患冠心病的 概率比年龄小的患者大1.178倍。
结果解释:
2.心电图的第二个哑变量,即心电图(2) 也有统计意义,其回归系数为2.650,p<0.05, OR值为14.160,CI为1.467-136.709,说明 心电图重度异常与正常的相比较,患有心脏 病的概率要高。
本例的心电图表现哑量设置
若以第一个(F)为参考,产生2个哑变量如下:
0 0 该组为参考的正常水平,在统计中无法体现。 1 0 该组反映轻度异常与正常水平的比较。 0 1 该组反映重度异常与正常水平的比较。
若以最后一个(L)为参考,产生2个哑变量如下:
1 0 该组反映正常组与重度异常的比较 0 1 该组反映轻度异常与重度异常的比较。 0 0 该组为参考的重度异常水平,在统计中无法体现。
4.理解危险因素和有利因素,注意以下几点: (1)因变量的赋值方向:比如疾病发生与否,
不发生=0,发生=1,那么0R值>1的自变量为危 险因素,OR值<1的自变量为有利因素。比如治 疗效果,无效=0,有效=1,那么0R值>1的自变 量为有利因素,OR值<1的自变量为危险因素。 如果自变量赋值0和1互换后,OR值意义相反。
B(年龄)=0.163 ,OR=1.178,指年龄大的患者患心脏病 的概率是年龄小患者的1.178倍,提示年龄大是危险因素。
B(年龄)=-1.155,OR=0.315,指年龄大的患者患心脏病 的概率是年龄小患者的31.5%倍,提示年龄大是有利因素。
4、非条件Logistic回归分析的注意事项
非条件Logistic回归实例解析
SPSS19.0统计软件 在医学统计中实例应用演示
学 生:李清金 导 师:黄宣银
SPSS19.0简介
SPSS的全称 Statistical Program for Social Sciences, 即社会科学统计程序。该软件是公认的最优秀的统计分析软 件包之一。
SPSS19.0软件面向行业应用人员,软件设计突出统计方法 的成熟、实用、易用性、界面易操作性及与文字处理软件等 的交互性上。
相比以前SPSS版本,19.0版具备多国语言操作界面,当然 也有中文版的!在18.0版前都是英文版的,除非安装中文破 解版,但装破解版的容易引起一些系统错误。
本人可提供软件:SPSS19.0版:win7-64试用版 win7-32 破解版、云端版 SPSS18.0版:云端版
如疗效好、中、差与血型A、B、AB、O型的区别? 如果满足此条件可以连续变量的形式引入模型,否则只
能用哑变量来分析。
4、非条件Logistic回归分析的注意事项
3.回归系数:Logistic回归的回归系数与线性 回归系数有区别,自变量作用大小取决于 Exp(B)即OR值,而不是其回归系数。因此 Logistic回归系数又成“伪回归系数”。
2、自变量---设置哑变量
如果自变量为多分类变量,比如血型,由于多分类 变量和因变量之间不存在线性关系,需用哑变量的 方式来分析,系统将产生K-1个哑变量(K为该变量 的水平数)
哑变量设置有对比方式和参考类别两种设置项目, 对比方式有指示符、简单、差值等形式,我们通常 默认指示符,而参考类别需要以最后一个或者第一 个为参照,其他水平与参考水平做比较。
2自变量设置哑变量?如果自变量为多分类变量比如血型由于多分类变量和因变量之间不存在线性关系需用哑变量的方式来分析系统将产生k1个哑变量k为该变量的水平数?哑变量设置有对比方式和参考类别两种设置项目对比方式有指示符简单差值等形式我们通常默认指示符而参考类别需要以最后一个或者第一个为参照其他水平与参考水平做比较
4.理解危险因素和有利因素
(2)哑变量的赋值方向:注意参考类别选择。 比如本例心电图异常情况,选择L和F两个参
考类型,选择方向不同,其解释的方向也不 同,具体参考前面结果。
4、非条件Logistic回归分析的注意事项
5.自变量的处理技巧:若自变量为3-5个,一般 选择进入法,若自变量>5个,一般采取前进 (LR);此外,自变量比较多的资料,应该先 采用单因素分析对自变量进行筛选,然后对单 因素分析有统计意义的变量进行Logistic回归 分析。
学习要点:
1.了解Logistic回归分析的基本思想; 2.了解Logistic回归分析的医学应用; 3.熟悉非条件Logistic回归分析在SPSS19.0 中操作演练及统计结果解释;
4.了解非条件Logistic回归分析的注 意事项。
二、了解Logistic回归分析的医学应用
1.校正混杂因素:
Logistic回归,即回归模型中的因变量是二元分类 变量,比如疾病发生与否和患者年龄、性别、体重 等因素是否有关。
(2)条件Logistic回归:又称为1:1配对 Logistic回归,即回归模型中的因变量是多元分类 变量,比如以年龄为配对条件,有无肺癌的患者与 饮酒、服用NSAIDs 、服用激素等因素是否有关。
相关文档
最新文档