Logistic回归分析分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
归 模 型
P
?
1 1? e?Z
其中?0 为常数项, ?1,?2,? ,?m为回归系数。
ln
? ??1
P ?P
???=?
0
?
? 1 X1
?
? 2 X2
?L
?
? mXm ?
logitP
取值范围 概率P:0~1,logitP:-∞~∞。
39
9
1P
00..55
Z : ?? , 0, ?
P : 0, 0.5, 1
39
14
二、logistic回归模型的参数估计
1. 参数估计
原理:最大似然 ( likelihood )估计
n
? L ?
P Yi i
(1
?
Pi )1? Yi
i?1
n
? ln L ? [ Yi ln Pi ? (1 ? Yi ) ln(1 ? Pi )] i?1
b0 , b1 , b2 ,? , bm
改变一个单位时logit P 的改变量。
39
11
优势比OR(odds ratio)
流行病学衡量危险因素作用大小的 比数比例 指标。
计算公式为:
ORj
?
P1 /(1? P0 /(1?
P1 ) P0 )
式中 P1 和 P0 分别表示在 X j 取值为 c1 及 c0 时 的发病概率, ORj 称作多变量调整后的优势比, 表示扣除了其他自变量影响后危险因素的作用。
44
57
4
1
1
416
265 151
39
18
源自文库
logistic 回归计算后得
lolgo经igsiltsloioctgigcisi回st经回itci归c回归lo计回归g计i算s归计t算ic后计算后回得算后得归得后计:得算b0后=-得0.9099 , Sb0 =0.1358 ; b1 =0.885 b0b=0 -=0-b.090.0=990-099.99,0b,09=9S-bS00,.b=90 0=09.S019b.031=53,085.81S;3b;05=Sb80b1b.11=;1=30=05.0.88b1.1885;=5800650.b68,1;8=,506.b882,5=60.,5261 , Sb2 =0.15 SSb1 b=1 0=S.01b.151=05000.01;5S;0b1b0=2b0;=2.10=5.0b5.0225=62;016.15b,22,吸6=S10烟Sb.5, 2b2=2与60=1S.0不1b.,251=吸75027S烟.2b12 5=的70.21优57势2 比: OR?1 ? exp
39
15
2. 优势比估计 可反映某一因素两个不 同水平(c1,c0)的优势比。
OR? ? exp[ j
bj (c1 ? c0 )]
若自变量 X j 只有暴露和非暴露两个水 平,则优势比ORj 的1 ? ? 可信区间估计公式为
exp(b j ? u? S / 2 bj )
39
16
例16-1 表16-1是一个研究吸烟、饮酒与食道癌关 系的病例-对照资料,试作 logistic回归分析。
m
? ? ? ( ? 0 ? ? j c1 ? ? t X t ) ? ( ? 0 ? ? j c0 ? ? t X t )
t? j
t? j
? ? j (c1 ? c0 )
39
13
即 ORj ? exp[? j (c1 ? c0 )]
若X j
?
?1
? ?
0
暴露 非暴露 ,
c1 ? c0 ? 1,
?? ?
0,
ORj
?1
无作用
则有 ORj ? exp ? j , ? j ??>0, ORj ? 1 危险因子
?
??? 0, ORj ? 1 保护因子
当 P ?? 1, 则有OR ? P1 /(1? P1) ? RR P0 /(1? P0 )
由于 OR j 值与模型中的常数项 ? 0 无关, ? 0 在危险因素分析中通常视其为无效参数。
发生 , 未发生
自变量X1, X2,L , Xm
在m个自变量的作用下阳性结果发生的概率记作 :
P ? P(Y? 1| X1, X2,? , Xm)
0? P?1
39
8
P
?
1
?
exp[?
(?0
?
?1 X1
1 ?
?
2
X2
?
L
?
? m Xm)]
若令 :
回
Z ? ? 0 ? ? 1 X1 ? ? 2 X2 ? ? ? ? m Xm
第十六章 logistic回归分析
(Logistic Regression)
39
1
Content
? Logistic regression ? Conditional logistic regression ? Application
39
2
讲述内容:
第一节 logistic回归 第二节 条件logistic回归 第三节 logistic回归的应用
确
X1
?
??1 ?
吸烟
定
?0 不吸烟
各 变 量
X2
?
??1 ?
?0
饮酒 不饮酒
编
码
Y
?
??1 ?
病例
?0 对照
39
17
表16-1 吸烟与食道癌关系的病例-对照调查资料
分层 吸烟 饮酒 观察例数 阳性数 阴性数
g
X1
X2
ng
dg
ng? dg
1
0
0
199
63 136
2
0
1
170
63 107
3
1
0
101
39
12
与 logisticP 的关系:
对比某一危险因素两个不同暴露水平 X j ? c1 与 X j ? c0 的发病 情况(假定其它因素的水平相同),其优势比的自然对数为 :
ln
OR j
?
ln
? ? ?
P1 P0
/(1 ? /(1 ?
P1 P0
) )
? ? ?
?
logit
P1
?
logit
P0
m
及其注意事项
39
3
目的:作出以多个自变量(危险因素)估计
应变量(结果因素)的logistic回归方程。
属于概率型非线性回归。
资料:1. 应变量为反映某现象发生与不发生的
二值变量;2. 自变量宜全部或大部分为分类
变量,可有少数数值变量。分类变量要数量
化。
39
4
用途:研究某种疾病或现象发生和多个危 险因素(或保护因子)的数量关系。
用? 2检验(或u检验)的局限性:
1.只能研究1个危险因素; 2.只能得出定性结论。
39
5
种类: 1. 成组(非条件)logistic回归方程。 2. 配对(条件)logistic回归方程。
39
6
第一节 logistic回归
(非条件logistic 回归 )
39
7
一、基本概念
应变量 Y ? ???10
0
Z
-4 -3 -2 -1 0 1 2 3 4
图16-1 logistic函数的图形
39
10
模 型
ln
?P ??1? P
???=?
0
?
?1X1 ?
?2 X2
?L
?
? m Xm
?
logitP
参 数
常数项 ? 0 表示暴露剂量为0 时个体发病
的
与不发病概率之比的自然对数。
意 义
回归系数 ? j ( j ? 1,2,? , m) 表示自变量 X j