Logistic回归(1)..

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
• 具体方法是: ①先拟合不包含待检验因素的logistic模型,求对 数似然函数值; ②再拟合包含待检验因素的logistic模型,求另一 个对数似然函数值; ③比较两个对数似然函数值差别的大小
G D 不包含此变量的模型-D 包含此变量的模型 不含此变量的似然函数 2 =-2ln d d 含此变量的似然函数
18
Leabharlann Baidu
Model 1 2 3 4
L PiYi (1 Pi )1Yi
i 1 n
通常用最大似然估计法求解模型中参数的估计 值
5.假设检验
• (1)回归方程的假设检验 • H0:所有 i 0, i 0,1,2, , p H1: i 0 某个 • 计算统计量为:G=-2lnL,服从自由度等于n-p 2 的 分布 • (2)回归系数的假设检验 • H0: i 0 H1: i 0 ,自由度等于1。 计算统计量为:Wald
bi bi * S i / S y , 其中S i 为X i的标准差, S y 为y的标准差。
'
Logistic回归的参数估计及意义 P表示某个体发生某病的概率,自变量表示 m个危险因素,式中的常数项表示在无各危险因 素时的发病概率对不发病概率之比的自然对数, 而logistic回归系数表示当危险因素每变化1个单 位时(其它危险因素取值的变化量。 二 、Logistic回归的参数估计及意义 似然函数
资料:1. 应变量为反映某现象发生与不发生的 二值变量;2. 自变量宜全部或大部分为分类 变量,可有少数数值变量。分类变量要数量 化。
39 3
用途:研究某种疾病或现象发生和多个危 险因素(或保护因子)的数量关系。 用 检验(或u检验)的局限性: 1.只能研究1个危险因素; 2.只能得出定性结论。
Ln(OR) logit[ P(1)] logit[ P(0)] ( 0 i 1) ( 0 i 0) i
14
bi 为 i的估计值,此值越大, 其因素对Y影响越大。
• 故对于样本资料OR=exp( b i ) • 95%置信区间为: exp(bi 1.96SE(bi )) • 可见 i 是影响因素Xi增加一个单位所引起的对数 优势的增量,反映了其对Y作用大小。 • 如果要比较不同因素对Y作用大小,需要消 除变量量纲的影响,为此计算标准化回归系数


注:是否患病中,‘0’代表否,‘1’代表是。 性别中‘1’代表男,‘0’代表女,吸烟中‘1’ 代表吸烟,‘0’代表不吸烟。地区中,‘1’代 表农村,‘0’代表城市。
Logistic回归
-- Logistic回归与多重线性回归联系与区别
联系:
用于分析多个自变量与一个因变量的关 系,目的是矫正混杂因素、筛选自变量和更 精确地对因变量作预测等。 区别: 线性模型中因变量为连续性随机变量, 且要求呈正态分布. Logistic回归因变量的 取值仅有两个,不满足正态分布。
2
39
4
种类: 1. 成组(非条件)logistic回归方程。
2. 配对(条件)logistic回归方程。
39
5
第一节
logistic回归
(非条件logistic回归 )
39
6
(一)基本概念和原理
1.应用背景 Logistic回归模型是一种概 率模型,适合于病例—对照研究、 随访研究和横断面研究,且结果发 生的变量取值必须是二分的或多项 分类。可用影响结果变量发生的因 素为自变量与因变量,建立回归方 程。
可知,不发病的概率为:
1 1 p 1 exp( 0 1 X 1 p X p )12
经数学变换得:
ln[p /(1 p)] 0 1 X 1 p X p
定义:
logit( p) ln[p /(1 p)]
为Logistic变换,即:
Logit( p) 0 1 X 1 p X p
4、回归系数βi的意义
流行病学的常用指标优势比(odds ratio,OR)或称比数比,定义为:暴露 人群发病优势与非暴露人群发病优势 之比。 P1 /(1 P1 ) 即Xi的优势比为: OR P0 /(1 P0 )
7
2、Logistic回归模型的数据结构 设资料中有一个因变量 y 、 p 个自变量 x1, x2,…,xp ,对每个实 验对象共有 n 次观测结果,可将原 始资料列成表2形式。
8
• 表2 1
2 3 … n
Logistic回归模型的数据结构
X1 X2 X3 …. XP
实验对象 y
y1
y2 y3 … yn
11
3、 Logistic回归模型
令: y=1 发病(阳性、死亡、治愈等) y=0 未发病(阴性、生存、未治愈等)

将发病的概率记为P,它与自变量x1, x2,…,xp之间的Logistic回归模型为:

p
exp( 0 1 X 1 p X p )
1 exp( 0 1 X 1 p X p )
a11
a21 a31 … an1
a12
a22 a32 … an2
a13
a23 a33 … an3

… … … …
a1p
a2p a3p … anp
━━━━━━━━━━━━━━━━━━ 其中:y取值是二值或多项分类
9
表3 肺癌与危险因素的调查分析 • 例号 是否患病 性别 吸烟 年龄 地区 • 1 1 1 0 30 0 • 2 1 0 1 46 1 • 3 0 0 0 35 1 • … … … … … … • 30 0 0 0 26 1
Logistic回归分析
Logistic
regression
1
讲述内容:
第一节 logistic回归
第二节 条件logistic回归
第三节 logistic回归的应用 及其注意事项
39
2
目的:作出以多个自变量(危险因素)估计 应变量(结果因素)的logistic回归方程。 属于概率型非线性回归。
相关文档
最新文档