上市公司财务困境预测——基于信息熵与Logistic回归的实证
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2012年第9期总第219期
【财税审计】
上市公司财务困境预测———基于信息熵与Logistic回归的实证分析
曹珊珊
(上海海事大学经济管理学院,上海201306)
[摘要]以沪深两市1370家上市公司作为研究样本,摒弃了以往研究中惯用的配对方法,采用信息熵理论对财务指标的预测能力进行了客观测定,并选取预测能力最强的前11个指标作为输入变量,构建了基于Logistic回归的上市公司财务困境预测模型,并对模型进行了实证检验。研究结果表明:每股净资产、营业毛利率等11个绝对财务指标和相对财务指标对公司是否陷入财务困境有较强的预测能力。
[关键词]信息熵;Logistic回归;财务困境
[中图分类号]F275[文献标识码]B[文章编号]2095-3283(2012)09-0149-04
一、引言
依据上市公司经过审计后披露的财务报告,选取关键的财务指标构建合理的财务困境预测模型,对投资者和债权人了解企业财务状况和上市公司高管防范企业财务危机,以及监管部门监督上市公司质量和预防证券市场风险都具有重要的作用。因此,财务困境预测的意义在于构建财务困境预测模型,及时预报财务状况,为经营者、投资者、银行等金融机构、相关企业或注册会计师提供及时的决策和管理信息。
根据我国的具体情况,本文对上市公司是否陷入财务困境的界定是以其是否因“财务状况异常”遭到“特别处理”为标志的。
二、样本选取
表1训练样本和测试样本结构表
训练样本测试样本合计ST公司8228110
非ST公司8663941260合计9484221370
根据我国上市公司的年报披露制度,上市公司当年的财务报告披露的最后截止日期为下一年4月30日,因此上市公司当年是否被ST是由公司上年的财务报表决定的,采用公司被ST前一年的数据来建立预测模型会高估模型的预测能力,因此本文采用上市公司被ST前2年的数据即2009年的财务数据来建立模型。在剔除存在数据缺失和存在异常值的企业后,本文选取了2011年沪深两市1370家上市公司作为样本,其中包括110家ST 公司,1260家正常公司。本文数据来自锐思金融研究数据库(RESSET/DB )。为了客观评价所建立模型的预测精度,本文按照3:1的比例随机将总样本分为训练样本和测试样本,其结构如表1,在利用训练样本构建预测模型后,将分别检验模型对训练样本和测试样本的预测准确率。
三、基于信息熵的预测指标选取
在用Logistic回归模型进行公司财务困境预测时,关键是选取那些对公司财务状况预测能力强的财务指标来建立模型。在信息论中熵是用来测度随机变量的不确定性的,熵越大不确定性越大,在企业是否陷入财务困境的评估中,如果某初选财务指标的引入可以有效地减少因变量的熵,则该财务指标就有一定的预测能力,因变量的熵改变量越大,说明该指标的预测能力越强,因此本文采用因变量熵的改变量来对初选指标进行筛选。具体模型如下:
假设y代表公司是否被ST,企业被ST用Y=1表示,企业不被ST时用Y=0表示,用X=(x1,x2,……x n)
表示上市公司的各个财务指标。根据离散随机变量熵的定义可知Y的熵为:
I(Y)=-(p
1
logp
1
+p
2
logp
2
)(1)其中P1,P2分别表示ST公司和非ST公司在所有公司中所占的比率。财务指标X i的降熵的计算步骤如下:
(1)首先选择X
i
的一个分割点C0,根据X i<C0和
X
≥
C
把所有贷款企业分为两组,然后分别计算每一组Y的信息熵:
I
j
(Y)=-(p
1j
logp
1j
+p
2j
logp
2j
)(2)其中P1j,P2j分别表示违约企业和非违约企业在每一组中所占的比率j=1,2。
(2)然后根据公式(1)和(2)可以计算出指标X
i
的降熵为:
△I(Y)=I(Y)-[q1I1(Y)+q2I2(Y)](3)
回归的实证分析
其中,
q 1,q 2分别表示两组公司占公司总数的比重。改变C 0值可以得到指标X i 的不同的降熵,使ΔI (Y )最大的C 0就是指标X i 的最佳分割点。某个财务指标的降熵越大说明该财务指标的预测能力越强。计算每个财务指标在其最佳分割点处的降熵就可以对财务指标的预测能力进行排序,保留降熵值大的指标,剔除降熵值小的指标。最后对保留的财务指标进行因子分析就可以得到用于Logistic 建模的公共因子。
四、
Logistic 风险评估模型实证检验(一)基于信息熵的指标选取
本文选取企业盈利能力、企业营运能力、企业偿债能力、企业成长能力、企业现金流量五个方面的相对指标和营运资金、
公司资产总值、所有者权益、每股净资产五个绝对指标作为初选指标。具体指标如表2所示。
利用MATLAB 软件计算每个初选指标的降熵,计算结果见表2。计算结果显示,在预测中,虽然各初选指标对企业违约风险都有一定的预测能力,但各初选财务指标的预测能力相差很大。本文选取降熵较大的V26(每股净资产)、
V12(营业毛利率)、V13(营业净利率)、V15(总资产报酬率)、V14(成本费用率)、V16(总资产净利率)、
V28(净利润)、V31(所有者权益)、V1(资本充足率)、
V5(资产负债率)、V29(净营运资金)11个预测能力最强的指标来建立模型。
(二)因子分析提取公共因子
由于企业财务指标之间有较大的相关性,而多重共线性会对Logistic 模型的参数估计精确度产生较大的影响,本文采用因子分析法来解决变量间多重共线性的影响,因此本文采用因子分析提取的公共因子来进行Logis-tic 回归建模。
根据分析得到因子方差分解表(表3),由表3可知特征值大于1的前4个公共因子累计方差贡献率达到了87.19%,说明这4个公共因子能够反映原11个指标绝大部分信息。因此选取FAC_1、
FAC_2、FAC_3、FAC_4这4个因子作为最终进行Logistic 回归建模的指标。
表2初选财务指标体系和各指标的降熵值
指标代码指标名称ΔI (Y )排名偿债能力指标
V1营运资本配置率
0.185********V2流动比率0.146957513V3速动资产比率0.14366596515V4现金流动负债比率
0.14556717214V5资产负债率0.185********V6产权比率0.11467446219V7利息保障倍数0.132********营运能力指标V8应收账款周转率0.0456059227V9存货周转率0.01335811531V10流动资产周转率0.0412*******V11资产周转率0.06818625924盈利能力指标V12营业毛利率0.2757651082V13营业净利率0.2461753623V14成本费用利润率0.2374147855V15总资产报酬率0.2393156014V16总资产净利率0.2358496466V17净资产收益率0.1892741569成长能力指标V18营业收入增长率0.10486910520V19营业利润增长率0.0398*******V20净利润增长率0.0532*******V21净资产增长率0.139********V22总资产增长率0.139********现金流量指标V23现金流动负债比率
0.0831*******V24现金流量利
息保障倍数0.0356*******V25现金流量债务比0.0883*******关键绝对量财务指标V26每股净资产0.3082373511V27营业收入0.0771*******V28净利润0.2155618877V29净营运资金0.17280000912V30总资产0.06155537925V31
所有者权益合计
0.195037731
8
表3
因子方差分解表
Component
Initial Eigenvalues
Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings Total %of Variance Cumulative %Total %of Variance Cumulative %Total %of Variance Cumulative %
1 5.34248.56748.567 5.348.56748.57 3.9936.2736.265
2 2.08818.97967.546 2.0918.97967.55 2.1019.1355.395
3 1.15710.51578.061 1.1610.51578.06 2.0718.8074.197
4 1.0059.13787.198 1.01
9.137
87.20
1.43
13.00
87.198
5
.658
5.978
93.176