Logistic回归分析(2)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

P(Y A 1) P (YB 1)
P (Y A 0) P (YB 0)
e e
A ( 0 1 X 1A 2 X 2 k X kA ) A A A
1 e ( 0 1 X 1 2 X 2 k X k )
B B ( 0 1 X 1B 2 X 2 k X k ) B B B
13
3. 分析药物或毒物的剂量反应 在一些药物或毒物的剂量-反应实 验研究中,同种类的每一只动物的药物耐受量可能有很大不同, 不同剂量使动物发生“阳性”反应的概率分布常呈正偏态,将剂 量取对数后则概率分布接近正态分布。如果用 P 表示在剂量为 X 1 时的阳性率,则 logistic 模型为: P ; 1 exp[( 0 ln X )] 用这一模型可以求出任一剂量反应的阳性率。
e ( 1 X 1 2 X 2 k X k )
A A A A ( 1 X 1A 2 X 2 k X kA ) B B ( 1 X 1B 2 X 2 k X k )
or
e e P (YA 1 either YA 1 or YB 1)
1.流行病学危险因素分析
logistic回归分析的特点之一是参数意义清楚,
即得到某一因素的回归系数后,可以很快估计出这
一因素在不同水平下的优势比或近似相对危险度, 因此非常适合于流行病学研究。logistic回归既适合 于队列研究(cohort study),也适合于病例-对照研究 (case-control study),同样还可以用于断面研究(cross-
如对于半数效应量 X 0 (恰好有一半动物起“阳性反应”的剂量) 1 0.5 exp[(b0 b ln X 0 )] 1 X 50 e b0 1 exp[(b0 b ln X 0 )]
b
如果药物或毒物不止一种,也可以用logistic模型分析其联合作用。
14
4.预测与判别
x3 1 0 0
0
配对Logistic回归SPSS操作步骤:


Analyze-----Survival----COX Regression----Time框(outcome)-----Status框 ( Status ) -----Define Event:Single value 1:continue-----Covariates框(x1、x2、 x3)-----Strata框(id)---Options---at last step------ok
19
4. 关于模型的常数项
在大多数情况下,logistic 回归模型常数项没有太大意 义,所以不需要对常数项做解释和假设检验。只有在 大规模的队列研究、临床诊断试验和疗效评价试验中, 不同暴露层或处理组的阳性率与研究总体人群的分布 一致时,常数项才有意义。 条件 logistic 回归中,常数项在建立条件似然函数时 被约掉而得不到估计,所以条件 logistic 回归模型不 能用于预测。
logistic回归是一个概率型模型,因
此可以利用它预测某事件发生的概率。
在临床上也可以根据疾病与临床检查
指标资料,建立logistic回归模型,
对新的对象可根据其临床检查指标, 计算其患某种疾病的概率的大小,进 行判别分析。
15
实际应用中还应注意以下几点:
1、流行病学研究中,logistic 回归既可用于的病例-对照 研究也可用于队列研究,但病例-对照研究资料的得不到 真正的发病概率,只能获得 OR 值,在发病率较小的 情况下与相对危险度 RR 值近似相等。 2、logistic 模型中的自变量与反应概率之间呈对称 S 形曲 线关系,在概率 P 变动范围较小的情况下,如流行病 学研究中,条件容易满足;但在某些实验研究中,如 毒物剂量和动物死亡率的剂量反应研究中,P 的变化 范围很大,两者的关系虽然呈 S 形但并不对称,此时 可考虑进行变量变换,如对数变换。 3、非条件 logistic 回归模型也可用于判别分析,在自变量 为分组情况下,其判别效果优于线形判别。
Total a. Dependent Variable: OUTCOME
Omnibus Tests of Model Coefficientsa Overall (score) -2 Log Likelihood Chi-square df 1.920 7.093 2 Change From Previous Block Chi-square df Sig. 11.943 2 .003
第二节 条件logistic回归
一、原理
配对资料。最常用的是每组中有 一个病例和若干个对照, 即 1: M 配对 研究(一般 M 3) 。
1
表5 1: M 条件logistic回归数据的格式
匹配组 i 1 组内编号* 应变量 t 0 1 2 M Y 1 0 0 X1 X101 X 111 X 121 X 1M1 危险因素 X2 X 102 X 112 X 122 X 1M2 … … … … … … … … … Xm X 10m X 11m X 12m X 1Mm


0 1 0 0



n
0 1 2
Xn01 X n11 X n21
X n02 X n12 X n22
X n0m X n1m X n2m

M

0

X nM1

X n M2

X nMm
2
* t = 0 为病例,其他为对照
P(YA 1 either YA 1 or YB 1) P (YA 1) P(YB 0) P(YA 1) P (YB 0) P(YA 0) P(YB 1)
16
Biblioteka Baidu2)数值变量资料的赋值
若自变量是数值变量,最好将其按变量值的大 小分成几组,按顺序赋值为1, 2,, k ,否则参数 的实际意义可能不明确。例如,对于年龄变量, 如果利用实际数值,则求出的 OR 值表示年龄 每增加一岁时的优势比,实际意义不大。此时, 如果将年龄分成几个不同的水平(年龄段), 就比较容易解释,处理上也比较灵活,分析时既 可以按得分处理,也可以将其化作 k 1 个哑变量, 并在分析中对差别不大的水平做必要的合并。
18
3. 模型的评价
模型评价包括两部分内容:一是对模型中的每个自 变量进行检验,二是对所建立的回归方程进行拟合 优度检验。关于自变量检验前面已作了介绍,但应 注意变量是否显著及作用的大小是相对的,因此通 常分探索性研究和验证性研究两种情况加以说明。 对前者主要选择一个最佳的自变量组合,对后者则 主要分析某一个自变量是否有统计学意义,为此需 要对混杂因素进行调整。
1
A B [ 1 ( X1A X1B ) 2 ( X 2 X2 ) k B ( X kA X k )]
1 e ---- conditional logistic model.
3
2.条件logistic回归分析


可采用分层COX模型来拟合。 例如:某市调查三种生活因素与胃 癌的关系,资料见表5。
Variables not in the Equation a Step 2 X1 Score .037 df 1 Sig. .847
a. Residual Chi Square = .037 with 1 df Sig. = .847
第五节 logistic回归的应用及其注意事项
一、logistic回归的应用
SPSS结果
Case Processing Summary N Cases available in analysis Cases dropped Event a Censored Total Cases with missing values Cases with non-positive time Censored cases before the earliest event in a stratum Total 10 10 20 0 0 0 0 20 Percent 50.0% 50.0% 100.0% .0% .0% .0% .0% 100.0%
20
5. 多分类 logistic 回归 当因变量 Y 是一个多分类指标,特别是有序多分类
指标时,如流行病学中某些慢性病的危险因素研究, 观察结果为“无、轻、中、重”等不同等级资料, 可以采用多分类 logistic 回归或有序多分类 logistic 进行分析。
21
17
(3)因变量赋值
与分类变量赋值方法相同,但需注意“阳性反应”的 赋值,如果因变量 Y 赋值的顺序相反,回归系数绝 对值不变,但符号相反。 变量的取值形式在作危险性因素分析时,以定性资料 的形式出现为好。
2. 样本含量
logistic 回归统计推断是建立在大样本基础上的, 要求有足够的样本含量。经验上病例和对照的人 数应至少各有 30~50 例,模型中变量个数越多, 需要的样本含量越大。对于配对资料,样本的对 子数应为纳入模型中自变量个数的 20 倍以上。
1 e ( 0 1 X 1 2 X 2 k X k ) 1
1 e ( 0 1 X 1 2 X 2 k X k ) 1
B B B A A A
1 e ( 0 1 X 1 2 X 2 k X k ) Substitute and simplify: P (Y A 1 either Y A 1 or YB 1)
sectional study)
12
2.临床试验数据分析 临床试验的目的大多是为了评价某种药物或治疗方法
的效果,如果有其他影响效果的非处理因素(如年龄、病
情等)在试验组和对照组中分布不均衡,就有可能夸大或 掩盖试验组的治疗效果。 尽管在分组时要求按随机化原则分配,但由于样本含 量有限,非处理因素在试验组和对照组内的分布仍有可 能不均衡,需要在分析阶段对构成混杂的非处理因素进 行调整。当评价指标为二值变量时(如有效和无效),可以 利用logistic回归分析得到调整后的药物评价结果。对于 按分层设计的临床试验可以用相同的方法对分层因素进 行调整和分析。
Step 2
Sig. .029
a. Beginning Block Number 1. Method: Forward Stepwise (Likelihood Ratio)
Variables in the Equation Step 2 X2 X3 B 1.727 2.284 SE 1.249 1.679 Wald 1.912 1.852 df 1 1 Sig. .167 .174 Exp(B) 5.624 9.821
表3 配对资料(1:1) 对子号 病例 对照 x1 x2 x3 x1 x2 1 1 3 0 1 0 2 0 3 1 1 3 3 0 1 2 0 2 … … … … … … … 10 2 2 2 0 0 注:X1蛋白质摄入量,取值:0,1,2,3 X2不良饮食习惯,取值:0,1,2,3 X3精神状况 ,取值:0,1,2
相关文档
最新文档