基于随机森林的上市公司财务危机预警分析
基于随机森林模型的上市公司财务失败预警研究
第29卷第2期湖南文理学院学报(自然科学版) V ol. 29 No. 2 2017年6月 Journal of Hunan University of Arts and Science(Science and Technology) Jun. 2017 doi: 10.3969/j.issn.1672–6146.2017.02.005基于随机森林模型的上市公司财务失败预警研究周学忠1, 彭朝晖2, 曾杨1(1. 长沙理工大学数学与统计学院, 湖南长沙, 410114; 2. 长沙理工大学经济管理学院, 湖南长沙,410114)摘要: 基于2003年1月—2016年5月我国A股连续2年财务亏损的上市公司样本, 实证研究了随机森林模型对上市公司财务失败预警的应用。
通过与逻辑斯蒂回归模型所得结果比较, 证明了随机森林模型的预测精度高于逻辑斯蒂回归模型。
关键词: 财务失败; 预警; 随机森林中图分类号:F 222.3 文献标志码: A文章编号: 1672–6146(2017)02–0017–04Financial crisis warning model based on the random forestZhou Xuezhong1, Peng Zhaohui2, Zeng Yang1(1. College of Mathematics and Statistics, Changsha University of Science and Technology, Changsha 410114, China;2. School of Economics and Management, Changsha University of Science and Technology, Changsha 410114,China)Abstract: Using the sample that losses for two consecutive years of listed companies in China'sA shares from January 2003 to May 2016, the application of Random Forest on the prediction of listed companies financial failure is studied. Compare with Logistic model, it is confirmed that the accurace rate of the Random Forest is better than Logistic model.Key words: financial crisis; crisis warning; random forest改革开放以来, 我国的资本市场快速发展, 资本市场已经成为我国企业的筹集资金的重要途径。
[全]SPSS数据分析基于Logistic上市公司财务危机预警分析
SPSS数据分析基于Logistic上市公司财务危机预警分析财务危机财务危机又称财务困境,是指企业由于营销、决策或不可抗拒因素的影响,使经营循环和财务循环无法正常持续或陷于停滞的状态,具体表现包括持续性亏损、无偿付能力、违约和破产等。
财务危机将给投资者、债权人以及银行等金融机构带来风险,所以他们都希望在投资决策时就能得到关于财务危机的警示。
财务危机给企业和社会带来了严重的影响,适时、准确地对企业财务危机进行预测分析是市场竞争机制的客观要求。
因此利用相关信息构建有效的财务危机预警模型,获得上市公司财务状况恶化的预警信号,对于投资者、债权人、经营者以及监管者等诸多方面都具有重要的现实意义。
logistic回归Martin首次运用多元Logistic模型进行银行破产预测,后来Ohison选取了9个财务变量,又运用该模型来预测企业的财务危机。
Logistic模型在20世纪80年代以后得到了较为广泛的应用,一些学者对其进行了改进和扩展,如Charitou 和Trigeorgis采用Logistic回归方法并结合期权定价模型中的相关变量构建了财务危机判别模型,对1983年到1994年期间的139家美国企业进行了对比检验,结果发现到期债务面值、企业资产的当期市价、企业价值变化的标准差等期权变量在预测破产方面作用显著。
数据来源打开数据概览如下所示:操作步骤依次单击菜单“分析—回归—二元Logistic”执行二元逻辑回归过程。
选择因变量和协变量,方法选择向后有条件。
选择“选项按钮”依次选择分类图、霍斯默—莱梅肖拟合优度、在最后一个步骤、在模型中包含常量。
点击“确定按钮”,输出结果。
结果分析数据摘要信息。
“案例处理摘要”表格给出了原始数据中用于分析的案例、缺失案例的统计信息,显示所有185个案例都用来建模,没有缺失信息。
“因变量编码”表格给出了目标变量的编码取值,06/07首ST的取值为1。
进入模型的变量。
给出了最终模型中包含的和未包含的变量的统计量信息:方程中的变量显著性都小于0.05,而不在方程中的变量显著性都大于0.05,这说明最终回归方程中的各自变量对方程的贡献都是显著的。
上市公司财务危机预警系统理论研究与实证分析
上市公司财务危机预警系统理论研究与实证分析 对于财务危机恶化的上市公司,描述性分析表明制造业公司依然比重 最大。
而财务危机程度最严重的公司在批发和零售贸易行业所占比重都比 较大,仅次于制造业。
随着财务危机恶化程度的加重,财务危机不同程度公司的平均资产规 模是递减的。
我们发现资产规模在 1 亿元到 10 亿元的公司最易出现财务危机。
资产规模在 100 亿元以上的公司出现连续两年亏损的概率很小 ,而资 产规模在 50 亿元以上的公司出现连续三年亏损的概率很小,资产规模在 20 亿元以上的出现资不抵债情形较小。
在亏损两年后财务危机危机的恶化程度有加重趋势 , 并且亏损程度越 严重的公司,其债务负担也越沉重,整体财务状况都呈下降趋势。
在判断连续两年亏损的公司是否会恶化成连续三年亏损方面 ,盈利能 力和成长性、偿债能力、清偿资产总资产指标的判别力强,而经营能力指标 和现金流指标无判别作用。
研究表明,行业变量和规模变量在财务危机恶化预警系统中并不显著, 反映出行业因素和规模因素并不是影响上市公司财务危机恶化的主要因 素。
本课题研究目的有两个,一是通过实证研究检验出若干预警能力强的 财务指标,建立起一套行之有效的动态财务危机预警系统 ,并且能够根据已 建立的财务危机预警系统,运用现有的公开数据,预测出下一年度出现财务 危机的公司,为投资者的投资决策提供依据; 二是对已面临财务危机的公司, 通过实证研究检验出影响公司财务危机进一步恶化的因素 ,并建立动态财 务危机恶化预警系统。
通过对上市公司财务危机预警系统及上市公司财务危机恶化的预警 系统的研究,我们有如下结论 1、上市公司的财务危机是一个时期概念,有开端和终止,从财务危机出 现的那一时点起,直至公司破产都属于财务危机过程,并且上市公司出现的 财务危机有着程度之分。
2、在预测上市公司是否发生财务危机上,净利润比总资产、投资收益 占利润总额比重、应收帐款周转率、营业利润增长率、净资产增长率、长 期负债比总资产、净利润增长率、存货周转率等共 8 个财务指标有着显著 的判别作用。
上市公司财务风险预警
1引言目前,我国整体经济受到国际经济形势影响,面临下行压力,众多公司融资困难,陷入财务困境。
在此背景下,构建有效的财务危机预警模型以识别潜在财务风险,对于企业自身规避风险、投资者制定投资计划和经济社会健康发展具有重大意义。
当前,学者基于机器学习中的各种分类算法来构建预警模型:陈志君[1]以我国通信行业上市公司为研究对象,通过筛选财务指标,采用逻辑回归建立财务危机预警模型,该模型的正确率达到79%。
李长山[2]的研究表明,由逻辑回归构建的预警模型能够有效识别我国制造业公司的财务风险。
连晓丽[3]以A 股上市的正常公司和ST 公司为研究样本,发现基于随机森林的财务危机预警模型在不同的市场行情下均有较高的准确率。
孟杰[4]通过对比随机森林与支持向量机、逻辑回归、分类决策树和神经网络在我国上市公司财务失败预警时的表现,得出随机森林模型预测精度更高、更稳健的结论。
游甜[5]选取财务指标和非财务指标,对比分析优化后的支持向量机、BP_Adaboost 和kNN 在企业财务危机预测时的表现,发现支持向量机模型具有更高的判别正确率。
周廷炜[6]利用优劣解距离法和网格寻优算法优化支持向量机预测模型,提高了该模型识别上市公司退市风险的能力。
薛慧[7]构建了基于LightGBM 的财务风险预警模型,并与随机森林等常用模型进行对比分析,结果表明,参数优化后的LightGBM 模型对电力行业上市公司财务风险预测的效果更好。
在现有的研究中,加权K 近邻法被应用于机械故障诊断[8,9]、楼宇室内定位[10,11]和图像识别[12,13]等工业领域,取得了有效的成果。
而目前加权K 近邻法并未涉及对企业财务危机进行预警分析,因此,文章基于大数据分析方法,利用加权K 近邻算法来构建上市公司财务预警模型,并与随机森林和支持向量机进行对比研究,分析不同模型的性能,帮助企业及时辨识财务风险,实现企业健康发展的良性循环。
2指标选取与数据处理有效的危机预测机制应发挥早期预警作用,提前对危机事件发出警示。
基于随机森林对创业板上市公司财务风险的研究
基于随机森林对创业板上市公司财务风险的研究摘要本文基于随机森林算法对创业板上市公司的财务风险进行了研究。
具体而言,本文采用贝叶斯信息准则(BIC)和交叉验证(CV)两种方法确定了最佳决策树数量和最佳决策树深度。
然后我们使用确定的模型对创业板上市公司的财务风险进行了预测,并分析了影响财务风险的主要因素。
研究结论表明,随机森林算法可以有效地预测公司的财务风险,同时影响公司财务风险的主要因素是营业收入、营业利润、资产负债率和股东权益比率。
关键词:随机森林;创业板;财务风险;贝叶斯信息准则;交叉验证AbstractIn this paper, we use the random forest algorithm to study the financial risk of listed companies on the Growth Enterprise Board. Specifically, we use both the Bayesian information criterion (BIC) and cross-validation (CV) to determine the optimal number of decision trees and the optimal depth of decision trees. Then, we use the determined model to predict the financial risk of companies on the Growth Enterprise Board and analyze the main factorsaffecting financial risks. The research conclusion shows that the random forest algorithm can effectively predict the financial risk of companies, and the main factors affecting the financial risk of companies are operating income, operating profit, asset-liability ratio, and shareholder equity ratio.Keywords: random forest; Growth Enterprise Board; financial risk; Bayesian information criterion; cross-validation引言财务风险是指公司在经营活动中可能面临的经济损失或财务危机的风险。
基于粗糙集和随机森林的环保企业财务风险预警模型构建
基于粗糙集和随机森林的环保企业财务风险预警模型构建张菲
【期刊名称】《中国农业会计》
【年(卷),期】2024(34)8
【摘要】为精确预测环保企业的财务风险,本文研究建立基于粗糙集和随机森林的预测模型。
首先利用粗糙集对财务风险的影响因子进行属性约简,然后应用交叉验证和网格搜索优化随机森林模型的参数,建立基于粗糙集-随机森林的环保企业财务风险预警模型,并将该模型的预测结果与传统随机森林模型的预测结果进行对比分析。
结果表明,粗糙集-随机森林预警模型的预测精度高于传统随机森林模型,粗糙集-随机森林预警模型预测结果的准确率、精确率、召回率和F1分数分别为
0.988764、0.975904、1.000000和0.987805,与传统随机森林模型的预测结果相比,有显著提升。
由此可知,粗糙集-随机森林预警模型能精确预测环保企业的财务风险,帮助企业意识到潜在的财务风险,并提高企业经营质量。
【总页数】5页(P51-55)
【作者】张菲
【作者单位】辽宁工程技术大学工商管理学院
【正文语种】中文
【中图分类】F27
【相关文献】
1.基于双重限制相似关系粗糙集的畜产品风险预警模型构建
2.基于双重限制相似关系粗糙集的畜产品风险预警模型构建
3.构建基于粗糙集和BP神经网络的信用风险预警模型
4.基于随机森林构建脓毒症风险预警模型及其评价
5.基于改进随机森林算法的财务风险预警模型构建研究
因版权原因,仅展示原文概要,查看原文内容请购买。
某公司财务危机预警分析
某公司财务危机预警分析某公司财务危机预警分析财务危机是指企业财务状况出现严重困境,无法偿还债务或经营亏损,进而可能面临破产的危险情况。
财务危机不仅对企业自身造成巨大的影响,还会对整个经济系统和市场信心产生负面影响。
因此,对企业财务危机进行预警分析,提前发现危机迹象,采取必要的措施进行防范,对公司的可持续发展至关重要。
1.财务指标预警分析财务指标预警是应用财务数据进行预测和分析,发现财务危机的迹象。
常用的财务指标预警方法包括财务比率分析和财务模型分析。
财务比率分析是通过计算各项财务指标,对企业的财务状况进行评估。
常用的财务比率包括资产负债率、流动比率、速动比率、营运资金周转率等。
如果这些财务比率出现异常波动或超过行业平均水平,可能意味着财务危机的发生。
财务模型分析是应用数学和统计方法,建立财务模型,对企业的财务状况进行量化分析。
常用的财务模型包括多元线性回归模型、灰色预测模型、神经网络模型等。
通过对历史数据的分析和预测,可以预测企业的未来财务状况。
2.经营预警分析经营预警分析是指通过对企业的经营活动进行分析,发现企业经营状况的变化,判断企业是否面临财务危机。
常用的经营预警指标包括销售额、利润率、现金流量等。
销售额是企业健康经营的重要指标,如果销售额出现大幅下降或增长缓慢,可能意味着市场需求下降或竞争加剧,企业可能面临财务危机。
利润率是企业盈利能力的反映,如果利润率不断下降,可能意味着企业生产成本增加或产品价格下降,企业难以维持正常运营,可能面临财务危机。
现金流量是企业经营活动的重要指标,如果现金流量出现持续净现金流为负的情况,可能意味着企业无法及时偿付债务或支付运营成本,可能面临财务危机。
3.市场预警分析市场预警分析是通过对市场环境和行业竞争状况进行分析,判断企业是否面临财务危机。
常用的市场预警指标包括市场份额、行业增长率、产品竞争力等。
市场份额是企业在行业中的市场占有率,如果市场份额持续下降,可能意味着企业竞争力不断减弱,可能面临财务危机。
基于SMOTE-随机森林的互联网金融公司财务风险预警模型
作者: 李玉占[1]
作者机构: [1]南阳独山风景区管理委员会,河南南阳473000
出版物刊名: 经济研究导刊
页码: 79-80页
年卷期: 2020年 第33期
主题词: SMOTE算法;随机森林;财务风险预警
摘要:以我国的互联网金融上市公司为研究样本,在目前国内外对于企业财务风险预警研究的基础上,结合互联网金融公司的特点,利用SMOTE算法并与随机森林相结合,建立互联网金融公司的财务风险预警模型。
研究表明,随机森林预警模型有着稳定的识别精度和较好的预测性能,因此具有广泛的实践价值。
财务危机大数据报告分析(3篇)
第1篇一、报告背景随着我国经济的快速发展,企业规模不断扩大,市场竞争日益激烈。
然而,近年来,我国企业财务危机事件频发,给企业自身、产业链上下游以及社会稳定带来了严重影响。
为深入了解企业财务危机的成因、特点及发展趋势,本文通过对大量财务危机案例的大数据进行分析,旨在为相关企业和政府部门提供有益的参考。
二、数据来源及分析方法1. 数据来源本文数据来源于公开报道的企业财务危机案例、企业年报、行业报告等,涉及上市公司、非上市公司以及不同行业的企业。
2. 分析方法(1)描述性统计分析:对财务危机案例的基本情况进行统计描述,如危机发生时间、企业规模、行业分布等。
(2)相关性分析:分析财务危机案例中可能存在的关联因素,如宏观经济环境、行业发展趋势、企业管理水平等。
(3)回归分析:建立财务危机预测模型,分析影响企业财务危机的关键因素。
三、财务危机大数据分析结果1. 财务危机案例基本情况(1)危机发生时间:近年来,我国企业财务危机事件呈上升趋势,尤其在2015年、2016年期间,危机事件频发。
(2)企业规模:财务危机案例中,中小企业占比较高,但大型企业也不乏其例。
(3)行业分布:财务危机案例涉及多个行业,其中制造业、房地产业、建筑业、金融业等受影响较大。
2. 财务危机成因分析(1)宏观经济环境:宏观经济波动、政策调整等因素对企业经营产生较大影响,导致部分企业陷入财务困境。
(2)行业发展趋势:部分行业由于产能过剩、市场需求下降等原因,导致企业盈利能力下降,进而引发财务危机。
(3)企业管理水平:部分企业管理不善,如财务管理混乱、投资决策失误等,导致企业财务状况恶化。
(4)融资环境:融资难、融资贵等问题,使得企业难以获得足够的资金支持,加剧了财务危机。
3. 财务危机影响因素分析(1)宏观经济指标:GDP增长率、CPI、PPI等宏观经济指标与财务危机发生存在一定的相关性。
(2)行业特征:不同行业的企业在财务危机发生概率上存在差异,如产能过剩、市场需求下降等因素。
上市公司财务危机预警研究
上市公司财务危机预警研究作者:张志敏来源:《合作经济与科技》2020年第20期[提要] 本文以A股上市公司作为研究对象,运用python中的sklearn模块,以随机森林算法对上市公司财务危机预警指标进行选取,并与依据显著性相关性选取出的指标进行对比,找出两者在指标选取上存在的差异,并依据选取的财务指标分别建立随机森林模型;与此同时,还分别构建Logistic回归模型、SVM支持向量机模型、决策树模型,并进行展开比较。
分析表明:充分利用随机森林展开上市公司财务危机预警研究比传统的方式更准确,更能够精确预判上市公司财务危机。
关键词:特征递归消除;随机森林;logistic回归;财务危机预警中图分类号:F23 文献标识码:A收录日期:2020年7月2日一、引言近年来,我国A股市场每年都会出现许多被特殊处理的公司,且上市公司在资本市场上占有很重要的地位,因此,对上市公司的财务危机预警展开研究有着重要的战略意义。
上市公司作为推动经济发展的重要主体,对其进行财务危机预警规避财务风险显得尤为重要,出现财务危机既不利于公司的稳定发展,还减少了经营管理者及投资人的合法利益,通过财务危机预警分析模型可以对公司财务展开预估,给扭转财务危机局面提供充裕的空间,减少公司倒闭的概率。
随着机器学习算法、大数据、人工智能的发展,越来越多的学者将其引入到风险识别及危机预警中,并有研究表明机器学习算法在风险识别及危机预警方面具有较大的优势。
二、随机森林概述随机森林算法是有由Leo Breiman和Adele Cutler(2001)最早提出的,是一种集成学习算法,它将不同的决策树进行组合,利用这种组合降低单一决策树有可能带来的片面性和判断不准确性,它也是目前机器学习算法和数据挖掘算法最为热门的研究领域之一。
他的基本思想是:首先利用Bootstrap重抽樣方法从N个原始训练样本中抽取n(n本文会用到随机森林的一大特点,即利用OOB评估来评估模型的分类效果。
基于随机森林的上市公司财务舞弊识别研究
基于随机森林的上市公司财务舞弊识别研究[提要] 在参考前人研究成果的基础上,引入组合分类方法中的随机森林技术,对2000~2008年有财务舞弊行为的上市公司及相应的控制样本数据进行分析,模型达到较高的预测率。
随机森林在特征指标选择和预测精度方面都有很好的效果,目前还鲜有文献将这一技术运用到经济管理相关研究中。
关键词:财务舞弊识别;随机森林;R语言财务舞弊即财务报告舞弊,通常是指管理当局采取伪造、掩饰等手法,编制和发布虚假财务信息,诱导投资者做出错误的决策,从而实现自身利益最大化的违法行为。
近年来,上市公司财务舞弊现象正因其层出不穷的发生态势和所带来的巨大损失得到各界的广泛关注,各界在谴责那些舞弊企业道德丧失的同时,更是对研究出有效识别财务舞弊的方法提出迫切希望。
一、文献综述目前,财务舞弊识别研究主要涉及定性研究和定量研究两方面,定性研究主要通过对企业会计报表进行深度考察并试图发现其中的矛盾,以此来甄别舞弊。
如,刘姝威(2002)就利用这种方法揭发了曾轰动一时的银广夏和蓝田股份的财务舞弊案。
定量研究则主要依托于统计学和数据挖掘方法,对舞弊企业与非舞弊企业控制样本进行建模,并通过模型来预测企业是否舞弊。
常用的方法诸如逻辑回归模型、判别分析、神经网络、决策树、支持向量机等。
如Beneish(1999)利用Probit 判别方法建立模型,模型的准确预测率达到75%,并在实际中得到了一定程度的运用。
顾宁生等(2009)用学习矢量量化(LVQ)神经网络进行建模,同时将模型与BP神经网络、支持向量机的预测效果进行对比,发现LVQ神经网络的效果最好。
王敏(2011)结合舞弊三角理论采用逻辑回归模型建模,研究表明,法人股比例越高、监事会会议次数越多、当年的审计意见类型为非标准审计意见的公司越容易发生财务舞弊行为。
二、研究方法近年来,很多学者采用数据挖掘方法进行财务舞弊识别研究,但这些方法的实际效果往往有限,究其原因,Breiman(1996)认为数据挖掘领域很多算法都是不稳定的,当训练集稍微有变动都会使识别效果大打折扣。
基于随机森林的行业财务风险识别方法
基于随机森林的行业财务风险识别方法随着各个行业的快速发展,财务风险也愈加显著。
如何对行业中的财务风险进行识别并及时应对,成为了企业发展的重要方向和保障。
基于随机森林的行业财务风险识别方法已经成为了当前较为先进且广泛应用的方法之一。
一、随机森林的基本概念随机森林(Random Forest)是一种常用的机器学习方法,由多个决策树组成。
在决策树的建立过程中,通过改变训练数据和特征的随机性来增加模型的多样性和鲁棒性,对于输入数据进行预测。
随机森林具有天然的“特征选取”功能,不需要对数据进行过多的预处理。
二、行业财务风险的特点行业财务风险的特点是多方面的,例如:1. 多级指标体系。
财务指标、市场指标、运营指标等都可能影响行业财务风险。
2. 涉及面广。
行业财务风险在不同的行业中体现的方式不同,例如在金融行业中主要体现为信用风险,而在制造业中主要体现为经营风险。
3. 数据量大、复杂度高。
行业财务风险监控需要依靠大量金融、经济、商业信息和数据,数据来源多样,数据处理和分析难度大;风险监控的结果不够明确,会存在误判等问题。
三、基于随机森林的行业财务风险识别方法基于随机森林的行业财务风险识别方法可以通过构建不同行业的特征体系和随机森林模型,对行业财务风险进行预测和识别。
具体步骤如下:1. 数据准备。
需要准备多个行业的财务报表、市场报告、经济指标、商业新闻等数据作为训练数据,在此基础上设置训练集和测试集,可将训练集用于随机森林的训练,测试集用于评估模型性能。
2. 特征体系构建。
根据具体行业特点和财务风险特点,构建不同行业特有的财务指标、市场指标、运营指标等特征。
构建特征时可以考虑指标的分类、权重、相关性等。
3. 随机森林模型训练。
将构建好的特征矩阵、训练数据作为参数输入到随机森林模型中,对模型进行训练和调参,生成具有较好泛化性和预测能力的模型。
4. 模型评估和预测。
将测试集数据输入到随机森林模型中,对模型进行预测,得到财务风险的结果。
基于神经网络模型的上市公司财务危机预警研究
基于神经网络模型的上市公司财务危机预警研究【摘要】本文基于神经网络模型探讨了上市公司财务危机预警的研究,引言部分介绍了研究背景和研究意义。
正文中分别讨论了神经网络模型在财务预警中的应用以及相关研究综述。
接着详细讨论了如何构建基于神经网络模型的财务危机预警模型,并进行了实证分析和结果讨论。
最后对模型的优劣势进行了分析。
结论部分总结了研究结果和意义,同时展望了未来的研究方向。
通过本文的研究可以为财务决策者提供更精准的财务危机预警方法,从而更好地保护公司的财务安全。
【关键词】神经网络模型、财务危机预警、上市公司、研究背景、研究意义、财务预警、相关研究、模型构建、实证分析、结果讨论、优劣势分析、研究结论、未来研究方向。
1. 引言1.1 研究背景随着经济全球化的不断深化和市场的日益竞争,上市公司面临越来越多的财务风险和危机,如财务造假、资金链断裂、经营亏损等。
财务危机不仅会对公司自身造成严重的影响,还可能波及到整个市场和整个经济体系。
及时发现和预警上市公司财务危机成为了重要的课题。
基于神经网络模型的上市公司财务危机预警研究,在当前的经济环境下具有重要的现实意义和理论价值。
通过深入研究神经网络模型在财务预警中的应用,可以为上市公司提供更有效的财务风险管理工具,促进公司的可持续发展和市场稳定。
1.2 研究意义财务危机对于上市公司来说是一个严峻的挑战,可能导致公司破产、股价暴跌、员工失业等严重后果。
及时预警和识别上市公司的财务危机具有重要的意义。
基于神经网络模型的财务危机预警研究能够有效地提高预警准确性和预测能力,为投资者、监管机构以及公司管理者提供及时的风险提示和决策支持。
通过对神经网络模型在财务预警中的应用、相关研究综述、构建基于神经网络模型的财务危机预警模型、实证分析与结果讨论以及模型优劣势分析的研究,我们可以更深入地了解并探讨这一领域的前沿技术和应用方法。
这不仅有助于提升财务危机预警的准确性和效率,还有助于完善公司治理、推动健康的资本市场发展。
基于随机森林的上市公司财务危机预警分析
基于随机森林的上市公司财务危机预警分析中央财经大学杨翰林、王开骏、谢幽篁摘要本文在现有对上市公司财务分析技术的基础上,借助于杜邦分析系统的思路,对影响上市公司运营状况的财务变量进行了系统的分析和筛选。
通过随机森林算法建立了对上市公司财务危机预测(以ST为标志)的模型,并对两类分类误差的权衡进行了分析,给出了变量对分类的重要性排序。
其次分类效果的反馈验证了财务变量选取的有效性。
同时,相比于国内学者类似研究,本文在分类误差上得到了更高的精度。
在灵敏度分析中,针对两类误差权重设定、训练集合样本数量、两类样本抽样比率对分类精度的影响进行了深入的讨论,并给出了有助于提高分类精度的适应性方法。
最后通过GICS对划分行业后的样本进行了分类,对不同行业单独应用随机森林算法,得出了更好的分类精度,验证了行业的差异性以及行业划分的必要性。
关键字:财务危机ST 随机森林一、引言市场经济作为竞争型的经济制度,在优胜劣汰的规律下,促进了企业生产、经营的效率和效益,同时也加速了落后企业的破产。
这种竞争机制从宏观层面看,通过淘汰在当下经济环境里无法适应市场需求和发展的企业,从而成就了资源的效率最大化。
但从微观层面看,若企业在竞争中出于劣势或与市场规律不兼容,企业往往陷入财务危机,由此引发的破产风险也意味着利益相关者的损失。
因此基于市场经济导向性,企业经营风险以及其利益相关者的考虑,资本市场有必要发展一种自我评估技术以分析企业的经营能力。
对企业自身来说,一种有效的分析和预警机制可以管理和控制风险并对企业经营策略进行及时的调整与改进;对投资者而言,投资者可以以此技术分析对上市公司的投资风险,确保投资盈利;对银行等债权人而言,可以评估借款企业的信用风险、确定借款利率并跟踪贷款公司违约风险。
一般来说,财务危机是指企业无力按时偿还到期的无争议的债务的困难与危机。
Altman (1968)认为“企业失败包括在法律上的破产、被接管和重组等”,其实质是把财务危机等同于企业破产,这是最准确也是最极端的标准;Beaver(1966)认为“银行透支、未支付优先股鼓励、债券违约”为财务危机之标志;Carmichael (1972)认为企业财务危机是由于流动性不足、权益不足、债务拖欠等因素;而Ross等人则认为“财务危机指企业经营性现金流量不足以抵偿到期债务”。
基于随机生存森林的企业财务危机研究
基于随机生存森林的企业财务危机研究
肖叶宇1 ꎬ张 闪2
(1.吉林大学数学学院ꎬ吉林 长春 130012)
(2.南京财经大学应用数学学院ꎬ江苏 南京 210023)
[摘要] 以沪深两市 A 股制造业上市公司为样本ꎬ将随机生存森林模型引入企业财务危机研究中去. 通过计算
modelꎬCox model with backward stepwise variable selection and Lasso ̄Cox models. The prediction performance of the
Random Survival Forest is better than the three Cox models. At the same timeꎬcombined with the survival function and
Xiao Yeyu1 ꎬZhang Shan2
(1.College of MathematicsꎬJilin UniversityꎬChangchun 130012ꎬChina)
(2.School of Applied MathematicsꎬNanjing University of Finance and EconomicsꎬNanjing 210023ꎬChina)
本建立的ꎬ共有 B 个样本. 则公司 i 的累积风险函数袋外数据估计为:
B
∗
=
H∗
e ( t | xi )
I iꎬb H ∗
∑
b (t |
b=1
B
I iꎬb
∑
b=1
xi )
ꎬ
上市公司财务危机预警模型研究
上市公司财务危机预警模型研究上市公司财务危机预警模型研究引言财务危机是指一个上市公司面临严重的财务困难和经营风险,可能导致破产或资不抵债的情况。
在现代市场经济中,上市公司的财务危机在一定程度上影响着整个经济系统的稳定和发展。
因此,预测和预警上市公司财务危机变得至关重要。
本文将研究上市公司财务危机预警模型,以提供对公司未来风险的预测和警示。
一、上市公司财务危机的定义和特征财务危机是指企业在经济环境中出现严重的财务问题并导致经营困难的情况。
上市公司财务危机具有以下特征:1.严重的财务问题:财务问题可能包括资金短缺、高度负债、流动性危机、盈利能力下降等。
2.经营困难:财务问题的出现会导致企业经营困难,包括产品销售下滑、市场份额缩水、供应链问题等。
3.潜在破产风险:财务危机进一步发展可能导致企业无力偿还债务,甚至破产。
二、财务危机预警的重要性财务危机对于上市公司和整个经济系统都带来严重的影响。
因此,提前预测和预警财务危机具有重要意义。
1.保护投资者利益:通过财务危机预警模型,投资者能够更早地识别有潜在风险的上市公司,从而避免巨大的投资损失。
2.维护金融市场稳定:当上市公司发生财务危机时,其影响往往会扩散到金融市场。
预测并及时处理这些风险,有助于维护金融市场的稳定。
3.促进经济发展:财务危机会导致企业经营困难,从而影响整个经济系统的稳定和发展。
预测并预警财务危机,有助于降低企业经济风险,推动经济的持续发展。
三、现有的财务危机预警模型为了预测和预警上市公司财务危机,研究者提出了多种预警模型。
其中比较有代表性的有Altman模型、Springate模型和Zmijewski模型。
1.Altman模型:Altman模型是一种经典的财务危机预警模型,它基于公司财务数据和统计分析来进行预测。
模型主要通过计算Z值来评估公司的财务状况,从而预测财务危机的可能性。
2.Springate模型:Springate模型是基于财务比率的预警模型。
上市公司财务危机预警的实证分析
其 中 :x 速 动 比率 .x 资 产 净 是 是
是 是 ( )财 务危 机 预 警模 型 的 设 利 率 .x。 总 资 产 周转 率 ,x 净 利 润 一
计及检验
增长率 ,xs 是营运资金 占用率 ,x 是每 e
这 里 所 构 建 的财 务危 机 预 警模 型 股 经 营 性 现 金 流 量 .x 是 现 金 流 动 负 债 能 会 导 致 财 务 危 机 的 因素 和 特 征 通 过 是 基于传 统z 评分 模型 的改进 其 指 比 ,b至b为 系数 。 值 选 用 5 家 破 产  ̄ 5 家 非 破 产 企 业 的 0 [o 1 有效 的财务危机预 警分析 .进 行风 险防 标 的选 取 较 以 往 的 模 型 相 比 ,除 继 续 保
型 ,从 而实现对企业 的财务危机预 警 ,
模 增长 率指标 。如 表 1 示 .展示 的是 财 件 可 以 计 算 出 z 型 的 临 界 值 下 限 为 所
.
37 73 上 限 为 1 5 5 6 即 当 企 业 29 2 3 7 。 国 内外 学 者 早 已 进 行 了 研 究 。但 是 ,在 务 危 机 预 警 模 型 的 指 标 构 成 。通 过 所 选 0 的Z 处在0 7 93 值 3 2 7 ≤z≤ 1 2 3 7 区 .5 5 6 是 否存在 财务 危机 的z 范 围确认 上 , 值 取 的 这 7 指 标 ,从 企 业 的 偿 债 能 力 、 个
上市公司财务危机预警的实证分析
■ 王 满 李坤榕
2 0 年 一 场 席 卷 全 球 的 金 融 风 暴 务 状 况 为 原 则 ,并 能 够 充 分 考 虑 来 自企 08
基于机器学习方法的上市公司财务预警模型对比研究
基于机器学习方法的上市公司财务预警模型对比研究近年来,随着我国经济的快速发展,上市公司数量不断增加。
同时,在商业领域,公司财务风险一直是企业家最关注的问题之一。
因此,建立有效的财务预警模型,及时发现企业财务风险,防范风险,成为了各大公司财务人员的重要工作之一。
随着机器学习技术的发展,基于机器学习方法的财务预警模型被广泛应用于企业风险管理中。
本文旨在对不同的基于机器学习方法的财务预警模型进行对比研究。
本文选取了典型的机器学习方法,包括逻辑回归、支持向量机、随机森林、神经网络等作为建模算法,并从数据集、特征选取、模型评估等方面对比研究了各种财务预警模型的优缺点。
在数据集方面,所有模型都需要一个大而全的数据集,这样才能保证模型的有效性。
但是不同模型中所采用的数据预处理方法却有很大的差异。
例如,逻辑回归模型和支持向量机模型在特征工程阶段都需要进行特征选择,减少数据集维度,从而提高模型的准确性。
而随机森林和神经网络模型则不需要进行特征选择,而是通过特定的算法自我调整以获取最佳结果。
在特征选取方面,不同的模型采取不同的策略来选择最佳特征集合。
逻辑回归模型采用了逐步回归算法进行特征选择,即筛选出与目标变量相关性较强的特征,并逐步加入模型以获得最优模型。
而支持向量机模型则采用了核函数分类算法,将数据集映射到高维特征空间中进行分类。
随机森林和神经网络模型则通过随机子空间和隐藏层神经元数目优化,选择最优的特征子集。
在模型评估方面,不同的模型使用不同的评估指标。
逻辑回归和支持向量机模型使用的评估指标是准确率和召回率,也就是正确分类的样本数除以总样本数,以及正确分类的真实风险样本数除以真实风险样本数。
随机森林和神经网络模型则使用的评估指标是重要性因子和误差率,也就是特征子集对于分类的贡献率以及分类错误的样本数除以总样本数。
综上,不同的机器学习方法都有各自的优缺点。
逻辑回归和支持向量机模型可解释性强,易于理解,但是对于数据集的需求较高。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于随机森林的上市公司财务危机预警分析中央财经大学杨翰林、王开骏、谢幽篁摘要本文在现有对上市公司财务分析技术的基础上,借助于杜邦分析系统的思路,对影响上市公司运营状况的财务变量进行了系统的分析和筛选。
通过随机森林算法建立了对上市公司财务危机预测(以ST为标志)的模型,并对两类分类误差的权衡进行了分析,给出了变量对分类的重要性排序。
其次分类效果的反馈验证了财务变量选取的有效性。
同时,相比于国内学者类似研究,本文在分类误差上得到了更高的精度。
在灵敏度分析中,针对两类误差权重设定、训练集合样本数量、两类样本抽样比率对分类精度的影响进行了深入的讨论,并给出了有助于提高分类精度的适应性方法。
最后通过GICS对划分行业后的样本进行了分类,对不同行业单独应用随机森林算法,得出了更好的分类精度,验证了行业的差异性以及行业划分的必要性。
关键字:财务危机ST 随机森林一、引言市场经济作为竞争型的经济制度,在优胜劣汰的规律下,促进了企业生产、经营的效率和效益,同时也加速了落后企业的破产。
这种竞争机制从宏观层面看,通过淘汰在当下经济环境里无法适应市场需求和发展的企业,从而成就了资源的效率最大化。
但从微观层面看,若企业在竞争中出于劣势或与市场规律不兼容,企业往往陷入财务危机,由此引发的破产风险也意味着利益相关者的损失。
因此基于市场经济导向性,企业经营风险以及其利益相关者的考虑,资本市场有必要发展一种自我评估技术以分析企业的经营能力。
对企业自身来说,一种有效的分析和预警机制可以管理和控制风险并对企业经营策略进行及时的调整与改进;对投资者而言,投资者可以以此技术分析对上市公司的投资风险,确保投资盈利;对银行等债权人而言,可以评估借款企业的信用风险、确定借款利率并跟踪贷款公司违约风险。
一般来说,财务危机是指企业无力按时偿还到期的无争议的债务的困难与危机。
Altman (1968)认为“企业失败包括在法律上的破产、被接管和重组等”,其实质是把财务危机等同于企业破产,这是最准确也是最极端的标准;Beaver(1966)认为“银行透支、未支付优先股鼓励、债券违约”为财务危机之标志;Carmichael (1972)认为企业财务危机是由于流动性不足、权益不足、债务拖欠等因素;而Ross等人则认为“财务危机指企业经营性现金流量不足以抵偿到期债务”。
总上所述,企业陷入财务困境的主要原因是盈利能力不足,可持续经营能力下降从而导致企业违约可能性增加。
我国学者以及法律法规对财务危机没有像上述如此鲜明的定义和界定。
其次,由于信息不对称,即管理者与企业自身信息、投资者、债权人与管理者的获取信息差异,企业在何时、何种情况下发生财务危机也不得而知。
同时,企业陷入财务困境是一个动态、连续的过程而并非简单地划分为陷入财务困境和没有陷入财务困境两种类别。
再次,中国资本市场发展较晚,还没有形成自己的规律和特点,导致学者无法准确挖掘中国企业财务危机的本质。
在本篇实证研究论文中,我们需要可以观测到的标准来确定样本属性,即某一时刻的某一上市公司的财务状况以及是否发生财务危机。
鉴于定义财务危机的困难以及所得上市公司年度财务数据的属性,我们认为财务危机的标志为沪深两市的上市公司因财务状况异常而被“特别处理(ST)”。
这样界定财务危机的具体原因是:我国资本市场尚无一家上市公司破产清算,以外国部分学者提出的以破产为标准不合适;上市公司是否被ST具有可测性,信息来源可靠;被ST的绝大数上市公司是因为连续两年在年度报表中表现出连续亏损或最近一年的每股净资产低于每股面值,或者同时出现两种情况,这说明是否ST对上市公司的财务状况有非常良好的概括性和解释能力,在很大程度上度量了财务危机。
因此本文对财务危机的研究也以被ST的上市公司展开。
这种对财务危机的界定方式在国内类似分析中比较主流,如陈静(1999),张玲(2000),张鸣(2005)等。
国外学者对财务危机的分析研究主要基于财务报表分析,其具体方法是研究会计变量、会计比率对公司财务的影响。
研究结果发现财务危机是否会发生很大程度体现在财务比率上,如Smith and Winakor。
一般国外的方法如下:(1)单变量分析:Fitzpartrick(1932)应用单个财务比率将样本划为破产和非破产两组并将其配对,最终发现判别能力最高的是权益收益率(ROE)和资本结构(权益负债率)两个会计指标。
(2)一元判别分析:Beaver对1954-1964年间的79家财务失败企业和79加持续经营的企业的30个财务比率进行了研究,并认为:现金债务比、资产收益率、资产负债率对预测财务危机是有效的,而现金债务比预测效果最好,预测的准确率达80%以上。
但该指标对持续经营企业预测的准确率高于财务失败企业,在一定程度上影响了模型的优越性。
(3)多元判别分析:Altman选取了1946-1965年间规模相似的的33家破产和持续经营公司为样本并配对从企业变现能力、偿债能力、盈利能力、发展能力、变现能力五个方面的的财务比率中选取了营运资本/总资产、留存收益/总资产、息税前收益/总资产、股票市值/负债账面价值和销售收入/总资产五个指标建立了Z-Score模型,并在1977提出改进的ZETA模型。
ZETA模型选用了资产收益率(ROA)、盈利波动率、流动比率、资本化率和总资产作为指标,分别表示企业的各种特征,最终ZETA模型得到广泛的认可和应用。
(4)Logit模型:Ohlson(1980)采用Logit模型,应用Logistic函数进行回归分析,并引进了与公司特征有关的哑变量。
他的具体做法是通过回归分析得出公司财务危机的概率测度,并通过此概率判断公司的经营风险。
此模型在预测能力和稳健性具有显著的优越性。
国内学者使用的研究方法主要与国外的方法相同,主要差别是选取的财务指标不同。
具体所选指标如下表1所示。
表1 历史研究中选取的指标一览*在不同学者的研究中,同一财务指标的计算方法、名称可能不同。
二、本文研究方法介绍(一)随机森林综述在本文的研究中,使用数据挖掘技术中的随机森林算法。
随机森林方法本质是根据训练集合种植大量的决策树,并对所有决策树的预测结果进行投票从而选出被最高频率预测到的结果。
在建立决策树过程中,属性的选择指标设定为Gini指标。
Gini指标所谓决策树创造的基本思想是:在对所有属性遍历的可能的分割方法中,若一种方法能使得Gini最小,就选择该分割方式作为此节点的分割标准,并在进行分割以后生成的节点根据每一个属性创建树枝,直至满足条件为止。
随机森林的特点是建立多株决策树时,为第k棵决策树生成随机向量,且独立同分布于前面的随机向量,…,。
用训练集和随机向量生成一棵决策树,得到分类模型h(X,),其中X为输入变量(自变量)。
通过上述方法构造不同训练集增加分类模型间的差异,可提高组合分类模型的外推预测能力。
k轮训练后,可以得到一个分类模型序列{(X),(X),…,(X)},再用它们构成一个多分类模型系统,该系统的最终分类结果采用简单多数投票法。
最终的分类决策:其中,表示组合分类模型,是单个决策树分类模型,Y表示输出变量(或称目标变量),I(·)为示性函数。
该式说明了使用多数投票决策的方式来确定最终的分类。
可以证明,随机森林的预测误差(其中X,Y表示是在X,Y测度上的分布;mg为投票的边际函数,为实际应分到的类别所得票数与最大票数的差)会收敛到:该预测误差PE=由切比雪夫不等式可知其中s被定义为分类器组合的强度,),并最终可以证明PE 的最大值不超过,其中为随机向量间的相关系数。
随机森林算法的优点有:精度高、能处理大量数据;在分类过程中给出变量优越性的估计;存在大量的数据缺失时仍保证精度;运算速度快、不会产生过度拟合。
在分析财务危机时,随机森林算法需要的数据有:1998年到2009年混合行业的被ST和正常经营的上市公司;将上市公司分成五个主要行业类别,1998年到2009年的被ST和正常经营的上市公司(用于行业分类下的随机森林算法)。
基于对前人研究的思考和我们的分析和财务观点,本文选取了一组不同层次的财务指标作为数据集合。
所谓不同层次,即反映整体运营水平的一般性指标和反映运营细节的具体指标。
财务指标的选取在下文有详细的分析。
(二)财务指标选取前人研究财务危机时,主要用到财务比率对公司财务状况(是否ST, 在国外的研究中则是是否破产)的回归分析,其选取的指标,根据归纳,基本是反映上市公司总体经营状况的传统财务比率,如资产利润率、权益报酬率、资产负债率等。
前人通过对这些指标与公司财务危机的关系的研究,都得到了很好的预测精度。
这些指标在公司陷入财务危机时能以很高的正确率将财务异常公司从正常公司中区分出来,因为这些指标与上市公司是否被ST有非常强的相关性。
比如,根据ST的定义,连续两个会计年度亏损的上市公司会被ST。
这就说明收益指标与公司是否被ST有直接关系。
因此,在我们的分析模型中,这些传统指标也优先纳入考虑。
在本文的研究中,称这一类指标为一级指标。
通过进一步研究发现:虽然上市公司陷入财务危机的原因基本相同(流动性危机、盈利能力下降等),但仅仅依靠少数反映总体情况的财务指标是难以解释上市公司财务危机的。
即使个别指标可以有效地将被ST上市公司与正常上市公司区分开来,这些指标也会由于过于笼统而出现解释能力不足的情况。
比如若我们只选用资产利润率(衡量单位资产盈利能力的财务比率),我们可以得到较准确的分类,但由于这个指标具有很强的概括性和标志性,我们无法得知某个特定上司公司经营状况的细节,也无法预知这个上市公司在生产运营中的缺陷,比如销售利润率过低,资金周转率低等。
同时,这些传统指标也会无法蕴含充分的公司财务信息,无法将上市公司运营的具体情况表现出来。
因此,当这种情况存在于某一上市公司时,早期表面的盈利很可能会隐藏企业营运中存在的风险(流动性风险、营业成本过高等),而忽略这些细节将使我们因为未发掘公司潜在的营运风险而牺牲了自己的投资。
对于这个问题,国内的学者目前还没有过充分的研究。
在我们的分析中,基于杜邦分析系统的思想,我们将这些反映总体经营水平的指标按一定方法分解为一些反映公司运营情中体现具体某一个方面的指标,增加体现公司财务状况的信息量。
我们称这一类指标为二级指标。
从指标象征属性的方面考虑,国内主流的研究仅仅考虑“静态”的财务比率,如资产负债率等,而忽略“流量”等统计数据,如现金比率、营运资本等;从会计实务角度来看,我国从1998年才引进现金流量表。
而Deakin(1972)研究发现与现金流等动态财务数据的指标也对公司财务状况分析起着重要的作用。
Gentry, Newbold和Whiteford (GN&W)基于传统静态财务指标和现金流指标建模并得到同样的结论。