第9章-定性数据的建模分析(含SPSS)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

可得到Logistic回归方程为:
1 P

e 0 1x1 2 x2 ... k xk
(9.4)

P 1 e 0 1x1 2 x2 ...k xk
❖ 其中 0 、1 为常数和解释变量的系数, e 为自然数,其
曲线为s 型。
❖ 某一事件不发生地概率为: ❖ Prob(no event)=1- Prob(event) (9.5) ❖ 二元Logistic模型对数据要求为: ❖ (1)被解释变量应具二分特点。 ❖ (2)解释变量数据最好为多元正态分布。
❖ (3)Step卡方值是在建立模型的过程中,当前与下一步
❖ - 2ll 之间的差值。 ❖ SPSS将自动计算似然比卡方的观测值和相伴概率 p 值。
如果相伴概率值小于给定的显著水平 ,则应拒绝零假设; 反之,如果相伴概率值大于给定的显著水平,则不应拒绝零 假设。
❖ 2、回归系数的显著性检验
❖ Logit回归系数显著性检验的目的是逐个检验模型 中各解释变量是否与Logit有显著的线性关系,对解 释Logit是否有重要贡献。其原假设是,即某回归系 数与零无显著差异,相应的解释变量与Logit之间的 线性关系不显著。
第九章 定性数据的建模分析
本章内容
❖ 第一节 解释变量中含有定性变量的回归模型 ❖ 第二节 二项Logistic回归模型 ❖ 第三节 判别分析
第一节 解释变量中含有定性变量的回归模型
❖ 在回归分析中,我们对一些解释变量是定性变量 的情形先给予数理化,处理方法是引进只取0和1两 个值的虚拟变量。当某一属性出现时,虚拟变量取 值为1,否则为0。
❖ (三)二项Logistic回归模型中回归系数的含义 ❖ 在应用中人们通常更关心的是解释变量给发生比
❖ 带来的变化。 ❖ 当Logistic回归模型的回归系数确定后,将其代
入的函数,即

exp( 0 i xi )

(9.6)
❖ 当其他解释变量保持不变而研究 xi 变化一个单 位对 的影响时,可将新的发生比设为 *,则有:
❖ 复杂情况是指定定性变量可能取多类值的情况。
❖ 假设以采掘业、建筑业、房地产业和社会服务业4个行业
的上市公司为例,研究企业资本结构问题,其中 y 为企业资
本结构,
❖ x 为企业规模,D1i 为审计意见,另外再考虑行业差异D2i 。
为了用虚拟变量反映这4个行业,我们初步设想引入如下4个
0-1型解释变量:
* exp( 1 0 i xi ) exp( i ) (9.7)
❖ 于是有

*
exp( 1 )
(9.8)
❖ 由此可知,当 xi 增加一个单位时,将引起发生比扩大
❖ exp( i ) 倍。一般化则为
❖ ❖
*
exp( i )
(9.9)
❖ 式(9.9)表明,当第 i 个解释变量发生一个单元的变化
量全体与Logit的线性关系是否显著,是否可以用线 性模型拟合。其原假设是:各回归系数同时为0,解 释变量全体与Logit的线性关系 L
)2
2 log( Lxi L
)
2 log(Lxi
) (2 log(L))
(9.10)
❖ 好的模型的似然比值较高,其 - 2ll 值相对较小。似
然比值的变化说明当变量进入与被剔除出模型对数据
拟合度方面的变化。
❖ 常用的3种卡方统计量分别为Model、Block、Step。
❖ (1)Model统计量检验除常数项以外,模型中所有变量系 数为零的假设。
❖ (2)Block卡方值为当前 - 2ll 值与后一组变量进入模型后
的 - 2ll 值之差。
❖ (一)简单情况

简单情况是指定性变量只取两类可能性
的情况。
❖ 例如研究企业资本结构问题, y 为企业资
本结构,x 为企业规模。另外再考虑审计意
见两种情况:

Di 1,非标准的审计意见
Di
0,标准无保留审计意见
❖ 企业资本结构的回归模型为:
❖ yi 0 1x1 2Di
(9.1)
❖ (二)复杂情况
❖ 回归系数显著性检验采用的检验统计量是统计量, 数学定义为
❖ ❖
时,几率的变化值为 exp i 。解释变量的系数为正值,意味
着事件发生的几率会增加,exp i 的值大于1;解释变量的
系数为负值,意味着事件发生的几率会减少,exp i 的值小
于1;当为0时,此值等于1。
❖ (四)二项Logistic回归模型的检验 ❖ 1、回归模型的显著性检验 ❖ Logistic回归模型显著性检验的目的是检验解释变
❖ ❖
D1 D1
1,采掘业 0,其他
D3 D3
1,房地产业 0,其他
D2 D2
1,建筑业 0,其他
D4 D4
1,社会服务业 0,其他
❖ 可是这样作却产生了一个新的问题,即4个 自变量之和恒等于1,构成完全多重共线性。 解决这个问题的方法很简单,我们只需去掉一 个0-1型变量,只保留3个0-1型解释变量即可。
所以,对于具有 个分k 类的变量,当确定了
参照系后,只需设置 k 个10-1型解释变量。
❖ 企业资本结构的回归模型为:

(9.2)
yi 0 1x1 2D1i 3D2i
第二节 二项Logistic回归模型
❖ 一、二项Logistic回归模型概述 ❖ (一)二项Logistic回归模型的应用背景 ❖ 在许多会计研究问题中,所研究的被解释变量往往只有
“是”或“否”两个可能结果,就需要设置虚拟变量。当被 解释变量为虚拟变量时,建立一般的多元线性回归模型就会 出现以下问题:(1)残差不再满足且的假设条件。(2)残 差不再服从正态分布。(3)被解释变量的取值区间受限制。 由此可见,当被解释变量是0-1型变量时,无法直接采用一般 的多元线性回归模型建模,通常应采用Logistic回归模型。 本章只介绍二项Logistic回归模型。
❖ 利用Logistic回归可以直接预测观测量相对于某一事件的 发生概率
❖ 在一般的多元回归中,若以概率 P 为被解释变量,则方程为:
(9.3) P 0 1x1 2x2 ... k xk
❖ 但用该方程计算时,常会出现 P 1或 P 0 的不合理情
形。为此需要对 P 作对数单位转换,即 log itP ln( P ) ,于是
相关文档
最新文档