第14章有序多分类逻辑斯蒂回归模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Logit 变换的分别为p1、p1+p2、p1+p2 +p3,对k 个自变量拟
合三个模型如下:
log it[ p( y 1)]
常数项不同,回归系
log
it(
p1 )
ln
1
p1 p1
ln
p2
p1 p3
p4
数完全相同的
1 1x1 2 x2 k xk
将反应变量按不同的取值水平分割成两个等级,对这
两个等级建立反应变量为二分类的Logistic 回归模型。
不管模型中反应变量的分割点在什么位置,模型中各
自变量的系数都保持不变,所改变的只是常数项。此
时求出的OR 值表示自变量每改变一个单位,反应变量
提高一个及一个以上等级的比数比。 OR exp(i )
log
it[ p( y
2)]
log
it(
p1
p2 )
ln
1
p1 ( p1
p2 p2
)
ln
p1 p3
p2 p4
2 1x1 2 x2 k xk
log it[
p( y
3)]
log
it( p1
p2
ຫໍສະໝຸດ Baidu
p3 )
ln
1
p1 ( p1
p2 p2
p3 p3
)
ln
p1
p2 p4
p3
3 1x1 2 x2 k xk
张文彤版本的常数项 前均为负号
• 根据上述公式,可以分别求出:
• 由上述建立的模型可以看出,这种模型实际上是依次
• 与名义多分类因变量有所不同,定性有序多分类因变量采用 累积logit模型,该模型可利用有序这一特点,得到比基线类别有更简单解释的模型。
• Y的累积概率是指Y落在一个特定点的概率,对结果为类别j 时,其累积概率为:
p(Y j x) p1 p2 pj , j 1, , k • 累积概率满足: p(Y 1) p(Y k) 1
• 张文彤认为,这里拟合的模型中常数项之前的符号应
当是“负号”,原因在于此处的常数项正好表示低级
别和高级别相比的情况,且必然有
, 但由
于研究者主要关心的是各参数(系数)的大小,因此
这种差异影响不大。并且由SPSS给出的系数无需再添
加符号。
• 某大学医院外科采用两种不同的绷带和两种不同的包扎 方式进行腿溃疡的治疗处理。治疗的结果分三种:不愈、 有效和痊愈。试分析治疗方法对治疗效果的影响。
• 累积概率的模型并不利用最后一个概率,因为它必然等于1
14.1 有序回归的基本思想
log
it
(
p
j
)
ln
1
p
j
p
j
j
1x1 2 x2
n xn
pj = p(y≤j | x),它表示 y 取前 j 个值的累积概率。
累积概率函数:
pj p( y
• 平行性检验(只适用于位置模型/位置参数/斜率系数)
• 当因变量维多值变量时,模型包含多个回归方程。Logistic回 归分析要求这多个回归方程中自变量的系数是相等的。因此 需要做平行行检验,也称为比例比数假设检验(test fo the proportional odds assumption),使用的方法是计分检验法。 当P>a时,接受平行的原假设。否则,应该将因变量的某些 值进行合并,减少因变量的取值个数,使得多值变量logistic 回归模型平行性成立。还可以尝试其他链接函数。
• 如果各种连接函数都无法满足平行性假定,则需要考虑回归 系数是否会随着分割点而发生改变。此时最好使用无序多分 类的Logistic 回归进行模型拟合,然后再根据系数估计值考 虑如何进行处理。
• 以4 水平的反应变量为例,假设反应变量的取值为1 、2 、3 、
4 ,相应取值水平的概率为p1、p2、p3、p4,则此时进行
• Logistic回归
因变量
二项Logistic回归
多项Logistic回归
有序回归 Probit回归
第14章 有序回归
(有序多分类因变量Logistic回归)
• 14.1 有序回归的基本思想 • 14.2 有序回归的案例分析
14.1 有序回归的基本思想
• 研究中常遇到反应变量为有序多分类(k>2)的资料,如城 市综合竞争力等级、满意度等可以划分为低、中、高。
j
x)
1
exp( j exp( j
x) x)
,当1
j
k 1
1,当j k
J等级分为两类:{1,,j } 与 { j+1,,k}
在这两类的基础上定义的 logit 表示:属于后 k-j 个等级的累积 概率与前j个等级的累积概率的优势的对数,故该模型称为累 积优势模型 (cumulative odds model)。
第一个模型表示了y 取第一个值的概率p1与x的关系;第二个模 型表示了y 取前两个值的累积概率p2与x的关系。这两个模型的 常数项不同,回归系数完全相同的。 y 取第一个值的概率
p(1)=p1 ,y 取第二个值的概率p(2)=p2 -p1,y 取第三个值的概率 p(3)=1- p2 。它们的截距不同,斜率相同,所以是J-1条平行直线 族。多值因变量logistic回归模型要求进行数据的平行性检验。
• 设因变量 y 表示治疗效果,0=不愈、1=有效、2=痊愈。 设自变量x1表示绷带种类,自变量 x2 表示包扎方式。
• 对于多值因变量模型,平行性假设决定了每个自变量的 OR值对于前k-1个模型是相同的。例如,变量x1的 OR=5.172,它表示使用第一种绷带治愈腿溃疡的可能性 是使用第二种绷带的5.172倍;它也表示使用第一种绷带 至少有效的可能性是使用第二种绷带的5.172倍。
多元回归中的几种重要模型
• 第一部分:多重共线情况的处理
– 第10章 岭回归分析( Ridge Regression )
• 第二部分:自变量中含定性变量的处理 – 第11章 自变量中含有定性变量的回归分析
• 第三部分:因变量中含有定性变量情况的处理 – 第12章 二项Logistic回归 – 第13章 多项Logistic回归 – 第14章 有序回归(等级回归分析) – 第15章 Probit回归(概率单位回归) – 第16章 最佳尺度回归