数据挖掘技术在虚假财务报表识别中的应用研究
浅谈数据挖掘技术在财务舞弊识别中的应用及发展路径

浅谈数据挖掘技术在财务舞弊识别中的应用及发展路径作者:孙小岚来源:《今日财富》2020年第31期摘要:回顾了上市公司产生财务舞弊的原因和识别方法,在此基础上介绍了现阶段常用的大数据挖掘方法以及研究成果,对大数据挖掘的发展前景作了一定的评述。
关键词:上市公司财务舞弊;数据挖掘;神经网路根据中国《独立审计具体准则第8号》,财务舞弊被定义为会计报表不实反映公司真正经济业务的故意行为。
财务舞弊由于收益巨大,很多上市公司无视法律,使用编造财务数据,虚增利润等一系列的财务舞弊手段给投资人带来了巨大的损失。
从银广厦的利润造假到万福生科的财务造假,各种舞弊手段隐蔽而复杂。
目前审计主要依赖人工检查的方式审核财务报表,由于审计人员的经验及主观判断的不同,对于相同的财务报表审计结果也不同,再加上财务造假手段多样,涉及会计科目繁多,人力成本受限,使得审计质量不高。
在“互联网+”及大数据背景下,企业可以通过大数据挖掘技术分析公司海量数据和财务舞弊之间的关系,并以此识别公司的财务舞弊行为。
一、上市公司财务舞弊动因理论Bologna和Lindquist提出了会计领域内的冰山理论,他们认为浮在海平面之上的一部分是能被直接观察的企业内部管理方面的问题,比如企业目标、组织架构等;位于海平面之下的部分则是财务造假者蓄意掩饰的内容,这部分内容难以被揭示,包括管理层的主观意愿、个人记录等。
反舞弊专家Albrecht则提出财务造假三角理论,即产生财务舞弊的诱因有三个,第一是财务舞弊产生的动机,包括不能扭亏为盈公司将终止上市,公司出现财务危机导致融资困难,或者公司现金流面临枯竭等,这一系列的外因是管理层受到的外在压力。
而融资压力是我国上市公司面临的最大问题之一,无论公司是需要上市、增发股票还是银行贷款,都需要达到财务上的硬性指标。
国内的学者在此理论基础上也提出了财务造假的其他成因,包括为了推进IPO或者增发、防止被ST,和机构联手进行股价操纵等。
会计实务:数据挖掘技术在虚假财务报表识别中的应用研究

数据挖掘技术在虚假财务报表识别中的应用研究
识别虚假财务报表十分困难。
从审计师的角度,大量的做假案例表明:财务报表做假大都是公司最高管理当局授意下的做假。
在我国国有股一股独大的特殊背景下,财务报表做假还是大股东控制和配合下的做假。
做假公司上下串通一气欺骗审计师,公司的内控制度如同摆设。
同时,我国做假公司往往采用虚构交易和事实的手段,通过伪造原始凭证恶意欺诈,审计师若单纯采用从报表向总账、明细账、记账凭证及原始凭证追索的审查方法,则难以发现做假行为。
从监管层和中小投资者的角度,审计师、承销商、律师、银行,甚至地方政府也经常参与上市公司做假,或出谋划策,或提供便利。
做假者的做假动机不尽相同,手段层出不穷,使得虚假财务报表呈现出个案化的特征。
在资源和信息有限的条件下,监管层和中小投资者也难以辨别真伪。
但这并不意味着面对虚假财务报表就束手无策。
首先,尽管建立在内控信任和抽样为基础上的审计程序失效,但在审计风险评价阶段的分析性复核的审计程序在发现和检查财务报表做假方面仍然是个有效的方法。
一个健康、真实的企业,一般来说,经过一年的生产经营、投资和融资活动,从期初的状态转换为期末状态,企业重要的财务指标之间应该保持一定的勾稽关系、均衡和惯性。
一旦企业做假,这种均衡状态将被打破,可能就会在一组或几组财务指标之间出现异常或。
大数据时代下企业财务报告舞弊的识别

大数据时代下企业财务报告舞弊的识别随着大数据技术的不断发展和应用,越来越多的企业开始利用大数据分析的方法来识别企业财务报告中可能存在的舞弊行为。
大数据技术的应用给企业财务报告的舞弊识别带来了新的机遇和挑战。
本文将探讨大数据时代下企业财务报告舞弊的识别方法及其重要性。
1.数据挖掘技术数据挖掘技术是大数据技术中的一种重要手段,可以通过对企业财务数据的挖掘和分析,发现其中的规律和模式,从而识别出可能存在的舞弊行为。
数据挖掘技术可以通过对大量的财务数据进行分析,找出异常数据或者不合理的模式,从而发现潜在的问题。
2.人工智能技术人工智能技术在识别企业财务报告舞弊方面也发挥着重要作用,通过对大数据的深度学习和模式识别,可以自动发现可能存在的舞弊行为。
人工智能技术可以通过建立模型和算法,对企业的财务数据进行自动分析和识别,发现其中的异常情况。
3.数据可视化技术数据可视化技术可以将庞大的财务数据以直观的图表和图像的形式呈现出来,使得人们可以更直观地了解企业的财务状况和可能存在的问题。
数据可视化技术可以帮助人们更好地理解财务数据中的规律和异常情况,从而更容易地发现潜在的舞弊行为。
1. 财务指标分析法财务指标分析法是一种常见的识别企业财务报告舞弊的方法,通过对企业的财务指标进行分析,可以从中找出一些异常情况。
对企业的净利润率、资产负债率、经营现金流等指标进行分析,可以发现其中的异常情况,从而识别出可能存在的舞弊行为。
3. 专家经验判断法专家经验判断法是一种通过专家的经验和知识对企业的财务数据进行分析,从而识别出可能存在的舞弊行为的方法。
通过专家的经验和判断,可以发现财务报告中的异常情况,从而及时发现潜在的舞弊行为。
1. 提高识别准确率大数据技术的应用可以大大提高企业财务报告舞弊的识别准确率,通过对庞大的财务数据进行分析,可以更容易地发现潜在的异常情况,从而及时发现潜在的舞弊行为。
4. 促进企业治理大数据技术的应用可以促进企业的良好治理,通过对财务数据的深度分析和识别,可以更好地监督企业的财务状况,减少可能存在的舞弊行为,进而提高企业的经营效率和管理水平。
数据挖掘技术在财务报表中的应用研究

数据挖掘技术在财务报表中的应用研究随着经济全球化和数字化时代的到来,财务报表已成为公司中不可或缺的一部分。
财务报表不仅提供了公司财务状况的静态分析,还可以分析公司的经营效率和风险。
然而,财务报表数据量巨大,传统静态分析方法效率低下,难以分析和挖掘潜在的商业价值。
因此,数据挖掘技术的应用逐渐受到了财务报表分析者和决策者的重视。
一、数据挖掘技术在财务报表中的应用1.1 财务指标预测数据挖掘技术可以有效地应用于财务指标预测。
通过对历史数据的分析和挖掘,可以预测未来某些财务指标的变化趋势和数值。
这对于公司高管在未来的决策中有着极大的参考价值。
1.2 财务风险评估通过数据挖掘技术,可以挖掘出可能产生潜在风险的数据,并依据分析结果,对公司的财务风险进行评估。
这些风险包括公司的经营风险、市场风险、财务风险等。
通过有效评估和预测这些财务风险,高管们可以更好地制定相应的决策方案,从而降低公司面临的风险。
1.3 偏离异常检测异常点对财务分析的影响是极大的,因此它的检测非常关键。
通过数据挖掘技术,可以对财务报表数据进行偏离异常点的检测,识别出那些长期存在的异常数据。
这一过程不仅有助于发现过分离或将有可能引起大规模风险的错误,更可以使得数据分析更加符合实际情况,从而提高分析结果准确度。
二、常用数据挖掘技术在财务报表中的应用2.1 聚类分析聚类分析是一种通过寻找数据之间的相似性,将数据点划分为聚类的方法。
在财务领域,聚类分析可以高效地对同一产业的公司进行分类,划分出相似的公司。
通过这一步骤,决策者可以更好的了解同样在同一产业中的公司的财务状态,进一步进行财务决策。
2.2 预测模型预测模型是一种建立变量之间函数关系,然后利用历史数据推断未来趋势的方法。
在财务领域,这个方法可以帮助预测公司未来的收入和支出,进而制定相应的计划和战略。
2.3 决策树决策树可以根据历史数据中识别出的规律来生成树形图,各个分支描述了分析结果和相关联的行动。
基于数据挖掘的财务欺诈检测技术研究

基于数据挖掘的财务欺诈检测技术研究随着信息技术的飞速发展,财务欺诈越来越成为企业管理中的重要问题。
传统的财务审计方法已经不足以满足现代企业的需求。
而基于数据挖掘的财务欺诈检测技术则成为一种新的解决方案,受到了越来越多企业的关注。
一、数据挖掘技术简介数据挖掘是指从大量数据中,利用统计学、人工智能等技术,自动地发掘出其中的规律和模式,以达到预测、分类、聚类、关联等目的的过程。
数据挖掘技术广泛应用于金融、电子商务、医疗、教育等领域,是企业管理中不可或缺的技术手段。
二、财务欺诈检测技术财务欺诈是指企业在财务报表中故意隐瞒、夸大或虚构财务信息,以谋取私利的行为。
常见的财务欺诈手段包括虚构交易、财务造假、应收账款转移等。
传统的财务审计主要侧重于对企业财务报表的准确性和合规性进行审核。
但针对财务欺诈行为,其效果并不理想。
这时,基于数据挖掘的财务欺诈检测技术可以起到一定的检测和预警作用,有效地防范和减轻企业财务风险。
三、数据挖掘在财务欺诈检测中的应用1.异常检测异常检测是指通过对企业各项财务指标进行分析,发现其中与其他指标相比对较为异常的数据。
这些异常数据可能是由于财务欺诈所引起的,也可能是由于其他原因所引起的。
检测到一些异常数据之后,需要进一步加以核实。
2.模型预测模型预测是指根据历史数据,利用机器学习等技术,建立模型对未来的财务数据进行预测,以判断当前的数据是否存在异常。
对存在异常数据的企业进行核查、审计等进一步处理。
3.关联分析关联分析是指通过对财务数据进行关联挖掘,发现不同变量之间的关系,从而发现异常现象。
比如,对应收账款的变化情况与利润之间的关系进行分析,可以发现存在应收账款转移的情况,从而发现是否存在财务欺诈行为。
四、财务欺诈检测技术面临的挑战尽管基于数据挖掘的财务欺诈检测技术具有很大的潜力,但也面临一些挑战。
主要包括以下几点:1.财务欺诈行为难以发现由于企业在实行财务欺诈行为时往往采取隐蔽的手段,欺诈的痕迹不易发现。
上市公司虚假会计报识别技术

上市公司虚假会计报识别技术随着社会经济的不断发展,上市公司的数量也与日俱增。
作为股市重要的参与者和监督对象,上市公司的财务报告对于投资者的决策至关重要。
然而,由于不法分子的存在,虚假会计报告成为了影响投资者判断的一个重要因素。
为了识别上市公司虚假会计报告,各类虚假会计报识别技术应运而生。
一、数据挖掘技术在虚假会计报识别中的应用数据挖掘是通过发掘数据中的模式、规则和趋势,从中提取潜在的、以前未知的大量信息的一种技术。
在虚假会计报识别中,数据挖掘技术可以通过分析财务数据、市场数据等多个维度的信息,检测出异常数据或者隐藏的模式。
这些异常数据和模式可能是虚假会计报的重要线索。
二、人工智能技术在虚假会计报识别中的应用人工智能技术是指利用计算机模拟、扩展和承担人的智能的一种技术。
对于虚假会计报识别来说,人工智能技术可以通过学习大量的历史数据和经验,模拟人类的思维和判断过程,自动识别出会计报告中的虚假信息。
例如,基于机器学习的算法可以根据准确率和召回率来评估财务指标的可信度,进而判断是否存在虚假会计报告。
三、比对技术在虚假会计报识别中的应用比对技术是指将两个或多个数据进行比对,找出相同和不同之处的一种技术。
在虚假会计报识别中,比对技术可以将上市公司的财务报告与其他公司或者行业的财务报告进行比对,找出其中的差异。
如果发现某家上市公司与其他公司或者行业在相同经济环境下指标差异过大,可能存在虚假会计报的可能性。
四、情感分析技术在虚假会计报识别中的应用情感分析技术是指通过自然语言处理和文本挖掘的技术,对文本中的情感倾向进行分析和识别的一种技术。
在虚假会计报识别中,情感分析技术可以对上市公司的公告、新闻以及高管访谈等信息进行情感极性分析。
如果发现上市公司相关人员在信息中存在大量的负面情感,可能存在虚假会计报的风险。
通过以上的技术手段,可以提高虚假会计报的识别准确率和效率,为监管机构和投资者提供重要的决策依据。
然而,虚假会计报识别技术仍然面临一些挑战。
大数据时代下企业财务报告舞弊的识别

大数据时代下企业财务报告舞弊的识别随着大数据时代的到来,企业财务报告舞弊的识别也面临着新的挑战和机遇。
传统的财务报告舞弊识别方法主要依赖人工审核和经验判断,效率低、可靠性差。
而大数据时代的到来,为企业财务报告舞弊的识别带来了很大的便利和可能性。
一、数据挖掘技术的应用数据挖掘技术是大数据时代的核心技术之一,通过对海量数据进行分析和挖掘,可以发现其中的规律和异常。
在企业财务报告舞弊的识别上,可以通过数据挖掘技术发现交易异常、会计准则违规等情况。
通过对大量的财务数据进行分析,可以发现存在虚假交易、数据造假等违规行为。
二、机器学习算法的应用机器学习是大数据时代的另一个重要技术,通过对大量数据的学习和训练,可以让机器具备自主学习和判断的能力。
在企业财务报告舞弊的识别上,可以通过机器学习算法对财务数据进行分析和判断,发现异常和潜在的舞弊行为。
可以通过训练一个舞弊检测模型,让其自动判断财务数据中是否存在报告舞弊的情况。
数据可视化技术可以将大量的数据以图表、图形等形式展示出来,更直观地呈现数据的特征和规律。
在企业财务报告舞弊的识别上,可以通过数据可视化技术将财务数据进行可视化展示,发现其中的异常和趋势。
可以通过绘制财务指标的趋势图、对比图等,来判断财务报告中是否存在舞弊行为。
四、人工智能技术的应用人工智能技术是大数据时代的重要组成部分,通过模拟人类智能的思维方式和行为模式,实现对数据的分析和处理。
在企业财务报告舞弊的识别上,可以通过人工智能技术进行数据模式识别、舞弊行为模拟等分析。
可以通过人工智能技术检测财务报告中的潜在问题和漏洞,提前预警和防范财务报告舞弊的风险。
以上仅是大数据时代下企业财务报告舞弊识别的几个方面,实际应用中还可以结合其他技术和手段进行综合分析。
还需要特别强调的是,大数据时代下企业财务报告舞弊的识别并非完全依赖于技术手段,而是需要财务人员和监管机构的共同努力和配合。
只有结合人工智能技术和人工智能的智能检测,才能更加准确地识别企业财务报告舞弊,并采取相应的防范措施。
数据挖掘技术在财务分析中的应用研究

数据挖掘技术在财务分析中的应用研究随着科技的不断进步和财务数据的不断积累,财务分析也在不断向更高级别、更科学化的方向发展。
数据挖掘技术作为一种新型的信息处理技术,已经在财务领域得到了广泛的应用。
本文将探讨在财务分析中,数据挖掘技术的应用研究。
一、数据挖掘在财务分析中的基本概念数据挖掘,即从大量的数据中,发现其中有用的信息和知识的过程。
财务分析则是针对财务数据进行分析,以便得到公司财务状况的详细报告。
数据挖掘技术与财务分析结合使用,可以更精确地找出财务数据中的规律和趋势,更及时地获取财务信息,更有效地作出决策。
数据挖掘技术主要包括分类、聚类、关联规则、机器学习等几类方法。
其中,分类方法可用于财务数据的预测,聚类方法可用于寻找相似的财务数据,关联规则方法可用于寻找财务数据之间的关联性,机器学习方法可用于训练模型,预测财务数据变化趋势等。
二、数据挖掘技术在财务分析中的具体应用1、财务风险预测在公司经营过程中,难免会出现各种风险。
数据挖掘技术可以通过对财务数据的分析,预测公司的财务风险。
如通过分析公司的财务指标、股票价格等数据,可以预测公司是否会陷入债务危机、是否会出现股票下跌等风险。
2、财务数据分析数据挖掘技术可以对公司的各种财务数据进行分类、聚类等分析方法,以此来识别财务数据中的规律和趋势。
比如可以通过分析公司的利润、成本、资产等财务指标,来评估公司的财务状况。
3、评估投资风险投资是公司经营过程中不可缺少的一部分。
数据挖掘技术可以通过对公司的财务数据的分析,来评估投资的风险和潜在收益。
如通过分析公司的财务指标,可以评估公司的运营能力、增长潜力、风险等,进而对投资决策进行更好的指导。
4、预测财务业绩财务业绩是公司经营状况的重要指标之一。
数据挖掘技术可以通过分析历史财务数据,预测未来业绩的变化趋势。
通过对公司的销售情况、资产负载、现金流等数据进行分析,可以更准确地预测公司的未来财务业绩。
三、数据挖掘技术在财务分析中的挑战数据挖掘技术在财务分析中的应用虽然得到了广泛的认可,但仍然面临着一些挑战。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据挖掘技术在虚假财务报表识别中的应用研究作者:黄辉来源:《财会通讯》2008年第02期识别虚假财务报表十分困难。
从审计师的角度,大量的做假案例表明:财务报表做假大都是公司最高管理当局授意下的做假。
在我国“国有股一股独大”的特殊背景下,财务报表做假还是大股东控制和配合下的做假。
做假公司上下串通一气欺骗审计师,公司的内控制度如同摆设。
同时,我国做假公司往往采用虚构交易和事实的手段,通过伪造原始凭证恶意欺诈,审计师若单纯采用从报表向总账、明细账、记账凭证及原始凭证追索的审查方法,则难以发现做假行为。
从监管层和中小投资者的角度,审计师、承销商、律师、银行,甚至地方政府也经常参与上市公司做假,或出谋划策,或提供便利。
做假者的做假动机不尽相同,手段层出不穷,使得虚假财务报表呈现出个案化的特征。
在资源和信息有限的条件下,监管层和中小投资者也难以辨别真伪。
但这并不意味着面对虚假财务报表就束手无策。
首先,尽管建立在内控信任和抽样为基础上的审计程序失效,但在审计风险评价阶段的分析性复核的审计程序在发现和检查财务报表做假方面仍然是个有效的方法。
一个健康、真实的企业,一般来说,经过一年的生产经营、投资和融资活动,从期初的状态转换为期末状态,企业重要的财务指标之间应该保持一定的勾稽关系、均衡和惯性。
一旦企业做假,这种均衡状态将被打破,可能就会在一组或几组财务指标之间出现异常或矛盾。
如果这种异常和矛盾无法解释,则预示着会计做假的可能。
分析性复核就是用来调查财务指标之间是否异常变动的审计程序。
其次,尽管做假公司采用不同的做假手段,有着不同的做假动机,但对上市公司而言,做假行为对财务报表的影响方向基本一致,都是虚增资产,隐藏负债,虚构利润。
因此,虚假财务报表可能会表现出一些与真实报表不同的特征。
另外,从犯罪心理学可知,做假公司的做假行为往往是由同一群人在操纵和实施,其在一定时期内所能动用的资源和经验是有限的,这就必然在做假手段上表现出一定的惯性、反复性和模仿性。
有经验的专业人士就可能通过财务报表发现冰山的一角。
用数据挖掘技术识别虚假财务报表的研究在国外已得到一定的应用。
这些研究尽管所选择的识别变量不同,数据挖掘的技术不同,所使用的软件也不同,但大都能得出类似的结论,即数据挖掘技术是一种有效的识别工具。
一、数据挖掘技术弥补财务报表审计局限数据挖掘在识别虚假财务报表方面具有很独特的优点。
相对于专业人士的经验判断,用数据挖掘技术识别虚假财务报表面对海量的上市公司财务数据,在缩短反应时间、合理配置资源、减少主观和随意判断及提高判断准确率上都有其独有的优势。
这对于监管层加强打击力度,提高监管效率;投资者减少投资损失;审计师控制审计风险,减少法律诉讼都具有重要的实用价值。
监管层在资源有限的条件下只有建立仔细分析、明智决策、衡量成本和产出的新型情报侦察系统,而数据挖掘技术建立的虚假财务报表识别模型在这方面用处很大,它可以自动从上市公司年报、中报、季报等财务数据中提取识别指标变量,计算每家公司财务报表做假的概率。
监管人员设定一个对虚假财务报表的容忍率,就可得到做假概率大于容忍率的所有上市公司的列表。
这些公司可初步判断为高风险公司,是监管层需要密切关注的对象。
通过专家分析等侦查手段在掌握了初步证据后可对这些公司实地调查。
同样,监管层根据公司做假概率和容忍率将上市公司进行分类,不同的类别采用不同的侦查手段和分配不同的资源和时间,这样监管层在对上市公司违法违规的调查中就掌握了主动权。
如果监管层、投资者和审计师借助数据挖掘技术等手段及时有效识别虚假财务报表,必将改变造假者的预期,使其造假时心有余悸,从而减少做假行为的发生。
数据挖掘技术有助于增强对做假行为的识别能力,使潜在的做假者时刻存在危机感,从而防范做假行为的发生。
二、数据挖掘技术建立识别虚假财务报表的模型(一)样本选择虚假财务报表呈现多种途径,如资产评估、非经常损益和主业增长等,由于前两种在短期内都会明显改变企业的财务结构,因此很难从财务指标异动中区分欺诈公司和正常公司。
而对于主业增长型企业,自然增长企业的财务结构理应体现一定的规律性,其指标异动往往蕴涵了一定的财务风险。
由于不同类型会计欺诈的识别指标迥异,将其归为一类会弱化指标的识别作用,因此本文对会计信息欺诈的识别模型定为主业增长型利润操纵。
基于此,笔者选择了41家财务欺诈公司中单纯涉及营业利润操纵的25家作为欺诈公司的样本,参照公司则在深沪两市历史上无虚假陈述现象,历年被会计师出具标准无保留审计意见的上市公司中选取了与上述欺诈公司行业、资产规模、会计期间均匹配的25家公司。
在选择样本时,为尽量统一标准,同时减少缺省值,做假的财务报表都是年度报表或基本报表,中报做假的公司不予考虑。
为消除时间对指标值的系统性影响,尽量使真实财务报表样本公司的财务报表所属年度与做假公司虚假财务报表的年度分布保持一致。
(二)数据处理(行业标准值的选择)分析性复核是调查各项比率或趋势的异常变动。
显然,要确认是否异常关键是找到正常或标准值。
行业标准值选择不当,可能会对分析产生误导。
行业标准值的选择可以针对每一家样本公司在所有上市公司中去寻找与其处于同一行业和规模的公司,计算这些公司的各项指标,取其均值或中位数作为行业标准值。
这种方法存在的问题是:做假样本做假年度大多集中在1996、1997、1998三年,而在2001年证监会的《上市公司行业分类指引》发布前,国内上市公司的行业分类极为混乱,在已有系统下,难以找到满意的计算行业标准的公司。
2002年财政部统计司出版的《2002年企业绩效评价标准值》在国民经济十大门类的基础上共划分了160个行业,揽括了做假公司所在的行业,本文将其作为行业标准值的来源。
考虑到上市公司大多是业绩较好的国有大中型企业,所以取值时以大型企业的良好值为基础(对文化艺术业、广播电影电视业等由于未划分规模,则取全行业的良好值)。
同时,考虑到指标计算时本身会剔除前期的影响,因此忽略不同时间年度对标准值的影响。
(三)指标体系设置本文的目的是识别虚假财务报表,而不是作为财务预警或分析做假公司做假的原因,所以识别变量的选择大都是针对采用做假手段后对财务报表的异常影响和经过掩饰后的虚假报表,而不是针对做假前做假公司的财务状况的异常和经过还原后的真实报表。
在分析前,事先并不知道哪个指标在做假中出现最频繁,表现最突出,因此将利润类、资产负债类、现金流量类的主要指标列示如下:(1)利润类指标有:收入,包括主营业务收入、其他业务收入、投资收益、营业外收入;费用,包括主营业务成本、其他业务支出、营业费用、主营业务税金、管理费用、财务费用、营业外支出、所得税;净利润。
(2)资产负债类指标有:资产类,分为流动资产、长期投资、固定资产、无形资产等,包括现金、银行存款、应收账款、存货、短期投资等;负债类指标,分为流动负债和长期负债,包括短期借款、应付账款、预收账款、应付工资、应交税金、预提费用等;所有者权益类指标,是所有者对企业的投资,包括国家投资、法人投资、个人投资、外商投资等。
(3)现金流量类指标有:经营活动现金流量,分为现金流入、现金流出、经营活动的净现金流量;投资活动现金流量,分为现金流入、现金流出、经营活动的净现金流量;筹资活动现金流量,分为现金流入、现金流出、经营活动的净现金流量;本期现金净增加(净减少);期初现金余额;期末现金余额等。
(4)由于本文总的样本数只有25个(其中17个用于训练,8个用于模型评价),所以可能的识别变量就只有20个。
因此,本文结果中的指标变量只有10个左右。
(四)识别模型建立本文的目的是从众多的财务报表中识别虚假财务报表,也即数据分类。
第一步是学习,用分类的算法分析训练数据,学习模型或分类法以分类规则形式提供,由于本文提供了每个训练样本的类标号(虚假或真实),因此本文模型的学习是有指导的学习;第二步是分类,用测试数据评估分类规则的准确率,如果准确率可以接受,则规则可用于新的数据的分类。
本文采用SAS软件EM模块提供的分类方法来建立识别模型。
EM中的数据分类模型主要有logistic回归法、近邻法、决策树、神经元网络、二阶段、主成分神经模型等。
SAS 分类功能的完成还需要通过数据集的确定(包括数据集中样本选择和指标变量的确定)、抽样等准备,另外还需要对模型的反复探索、修改、再建模等过程,通过一定方法评估出一个相对成功的记分代码,最后保留该记分代码,应用到新的数据中去。
EM中可将分类处理过程用图形化模块组成一个处理流程图,并依此来组织整个审计的分类过程。
分类识别方法主要有人工神经网络、决策树、遗传算法、近邻算法以及规则推导等,本文主要以数据挖掘的分类识别其中又以神经网络算法为主。
一是数据的输入。
将是否为虚假报表(0-1变量,1表示样本是虚假报表)作为分类的目标变量。
二是数据的分割。
以是否为虚假报表为分层变量,将数据集中60%作为训练集(Train),用于学习最优的连接的权;20%作为确认集(Validation),用于不同神经网络结构的选择和模型评价;20%作为测试集(Test),用于获得对总体错误的最终无偏估计。
三是变量的选择。
由于总样本数只有25个(其中17个用于训练,8个用于模型评价),根据历史资料和以往研究者的成果,再参考点击(右键)Neural network的result的分析结果,本文最终确定的识别变量为(相对于行业标准值的变化率)应收账款周转率、存货周转率、主营业务利润率、主营业务收入增长率和资产负债率。
三、主要结论(一)模型结果为加快学习过程,笔者对训练样本中输入层的每个输入单元的值进行规范化,使其落入0和1之间。
规范化采用标准离差的方法。
模型的优劣利用Profit/loss矩阵来判断,具体方法是在Input Data Source中编辑目标轮廓(Edit target profile)中的利润矩阵(Profitmatrix)。
最后通过EM模块的分类分析(分析全部数据,包括预测和训练数据),各分类工具的第一类错误频数α和第二类错误频数p的值分别如表1所示。
表1证实了上述结果的正确性,同时也发现并证实了Neural network是相对最优的分类工具。
本文主要采用神经网络的分类方法。
在神经元模块的隐藏层中,设置连接函数为线性函数;激活函数为Hyperbolic Tangent函数;允许偏差。
在输出层,设置连接函数为线性函数;激活函数为Hyperbolic Tangent函数;错误函数为Bernoulli函数(针对0-1变量)。
神经网络建立的识别模型对真实财务报表识别的正确率为83.33%,对虚假财务报表识别的正确率为71.43%。
从另一角度看,当用该模型识别财务报表时,如果模型判断为真实财务报表,则正确率为88.24%;如果模型判断为虚假财务报表,则正确率为62.5%。