第9章 定性数据的建模分析(含SPSS)精编资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如果相伴概率值小于给定的显著水平,则应拒绝零假设;
反之,如果相伴概率值大于给定的显著水平,则不应拒绝零 假设。
❖ 2、回归系数的显著性检验
❖ Logit回归系数显著性检验的目的是逐个检验模型 中各解释变量是否与Logit有显著的线性关系,对解 释Logit是否有重要贡献。其原假设是,即某回归系 数与零无显著差异,相应的解释变量与Logit之间的 线性关系不显著。
❖ 假设以采掘业、建筑业、房地产业和社会服务业4个行业
的上市公司为例,研究企业资本结构问题,其中 y为企业资
本结构,
❖ x为企业规模,D1i 为审计意见,另外再考虑行业差异D2i 。
为了用虚拟变量反映这4个行业,我们初步设想引入如下4个
0-1型解释变量:
❖ ❖
D1 D1
1,采掘业 0,其他
D3 D3
第9章 定性数据的建模分析(含 SPSS)
第一节 解释变量中含有定性变量的回归模型
❖ 在回归分析中,我们对一些解释变量是定性变量 的情形先给予数理化,处理方法是引进只取0和1两 个值的虚拟变量。当某一属性出现时,虚拟变量取 值为1,否则为0。
❖ (一)简单情况

简单情况是指定性变量只取两类可能性
“是”或“否”两个可能结果,就需要设置虚拟变量。当被 解释变量为虚拟变量时,建立一般的多元线性回归模型就会 出现以下问题:(1)残差不再满足且的假设条件。(2)残 差不再服从正态分布。(3)被解释变量的取值区间受限制。 由此可见,当被解释变量是0-1型变量时,无法直接采用一般 的多元线性回归模型建模,通常应采用Logistic回归模型。 本章只介绍二项Logistic回归模型。
❖ (三)二项Logistic回归模型中回归系数的含义 ❖ 在应用中人们通常更关心的是解释变量给发生比
❖ 带来的变化。 ❖ 当Logistic回归模型的回归系数确定后,将其代
入的函数,即

ex0p i(x i)

(9.6)
❖ 当其他解释变量保持不变而研究 x i 变化一个单 位对 的影响时,可将新的发生比设为 *,则有:
着事件发生的几率会增加,expi 的值大于1;解释变量的
系数为负值,意味着事件发生的几率会减少, expi的值小
于1;当为0时,此值等于1。
❖ (四)二项Logistic回归模型的检验 ❖ 1、回归模型的显著性检验 ❖ Logistic回归模型显著性检验的目的是检验解释变
量全体与Logit的线性关系是否显著,是否可以用线 性模型拟合。其原假设是:各回归系数同时为0,解 释变量全体与Logit的线性关系不显著。
❖ (1)Model统计量检验除常数项以外,模型中所有变量系 数为零的假设。
❖ (2)Block卡方值为当前 -2ll 值与后一组变量进入模型后
的 -2ll值之差。
❖ (3)Step卡方值是在建立模型的过程中,当前与下一步
❖ -2ll 之间的差值。 ❖ SPSS将自动计算似然比卡方的观测值和相伴概率 p值。
的情况。
❖ 例如研究企业资本结构问题, y 为企业资
本结构, x为企业规模。另外再考虑审计意
见两种情况:

Di 1,非标准的审计意见
Di
0,标准无保留审计意见
❖ 企业资本结构的回归模型为:
❖ y i01 x 1 2 D i
(9.1)
❖ (二)复杂情况
❖ 复杂情况是指定定性变量可能取多类值的情况。
1,房地产业 0,其他
D2 D2
Fra Baidu bibliotek
1,建筑业 0,其他
D4 D4
1,社会服务业 0,其他
❖ 可是这样作却产生了一个新的问题,即4个 自变量之和恒等于1,构成完全多重共线性。 解决这个问题的方法很简单,我们只需去掉一 个0-1型变量,只保留3个0-1型解释变量即可。
所以,对于具有 个分k类的变量,当确定了
参照系后,只需设置 k个10-1型解释变量。
❖ 企业资本结构的回归模型为:

(9.2)
y i 0 1 x 1 2 D 1 i 3 D 2 i
第二节 二项Logistic回归模型
❖ 一、二项Logistic回归模型概述 ❖ (一)二项Logistic回归模型的应用背景 ❖ 在许多会计研究问题中,所研究的被解释变量往往只有
❖ 回归系数显著性检验采用的检验统计量是统计量, 数学定义为
❖ ❖
Walid(SiI )2
(9.11)
❖ 式(9.11)中, i 是回归系数,S I 是回归系数的标 准误差。检验统计量服从自由度为1的卡方分布。

❖ lo L L x i) g 2 2 (lo L L x i) g 2 ( lo L x i) g ( 2 ( lo L )g )(9.1(0) ❖ 好的模型的似然比值较高,其 -2ll 值相对较小。似
然比值的变化说明当变量进入与被剔除出模型对数据 拟合度方面的变化。
❖ 常用的3种卡方统计量分别为Model、Block、Step。
* ex 1 p 0 (ix i) ex i)(p 9.7)(
❖ 于是有

*
exp(1)
(9.8)
❖ 由此可知,当 xi 增加一个单位时,将引起发生比扩大
❖ expi() 倍。一般化则为
❖ ❖
*
exp(i
)
(9.9)
❖ 式(9.9)表明,当第 i个解释变量发生一个单元的变化
时,几率的变化值为 expi 。解释变量的系数为正值,意味
❖ 利用Logistic回归可以直接预测观测量相对于某一事件的 发生概率
❖ 在一般的多元回归中,若以概率 P为被解释变量,则方程为:
(9.3) P 0 1 x 1 2 x 2 . .k . x k
❖ 但用该方程计算时,常会出现 P1或 P0 的不合理情
形。为此需要对 P作对数单位转换,即 loigtPln(P),于是
可得到Logistic回归方程为:
1P

e01x12x2...kxk
(9.4)

P1e01x12x2...kxk
❖ 其中 0 、1 为常数和解释变量的系数, e为自然数,其
曲线为s 型。
❖ 某一事件不发生地概率为: ❖ Prob(no event)=1- Prob(event) (9.5) ❖ 二元Logistic模型对数据要求为: ❖ (1)被解释变量应具二分特点。 ❖ (2)解释变量数据最好为多元正态分布。
相关文档
最新文档