2021年浅议数据挖掘技术与财务分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅议数据挖掘技术与财务分析
摘要:目前企业普遍面临数据 ___、知识匮乏的困境。企业在进行财务分析时如何在海量的资源中挖掘出有用的信息,为管理和决策服务,是企业迫切需要解决的问题。文章主要研究了数据挖掘技术在财务分析中的应用问题,介绍了数据挖掘的基本原理,并对数据挖掘在财务分析的应用以及应用存在的困难进行了探讨。
关键词:数据挖掘技术;
财务分析
财务报表是综合反映企业一定时期财务状况、经营成果、现金流量状况及财务状况变动的文件,是企业和投资者进行财务分析的主要依据。但是企业普遍面临数据 ___、知识匮乏的困境,如何从海量的信息资源中挖掘出潜在的信息,为管理和决策服务,是企业迫切需要解决的问题。数据挖掘为解决该问题提供了新的途径。
一、数据挖掘基本原理介绍
数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘将人们对数据的应用,从低层次的简单查
询,提升到从数据中挖掘有用的信息和知识,提高决策能力的水平。
(一)数据挖掘的主要功能
数据挖掘的目标是从数据库中发现隐含的、有意义的信息,主要有以下功能:
1、估计与预测。估计是根据已有积累的资料来推测某一属性的值,预测是根据对象属性的过去观察来估计该属性未来之值。数据挖掘技术能够自动的在大型数据库中寻找预测 ___。
2、关联和序列发现。关联是要找出在某一 ___或是资料中会同时出现的东西;
序列发现与关联关系很密切,所不同的是序列发现中相关的对象是以时间来区分的。
3、聚类。数据库中的记录可被化分为一系列有意义的子集,即聚类。聚类技术要点是在划分对象时不仅考虑对象之间的距离,还要求划分出的类具有某种内涵描述,从而避免了传统技术的某些片面性。
4、描述。描述的功能是对负责的数据库提供简要的描述,其主要目的是为了在使用别的功能时对数据先有较好的了解,然后再建立分析模型。
5、偏差检测。数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。
(二)数据挖掘的基本步骤
SAS研究所提出的SEMMA方法是目前最受欢迎的一种数据挖掘方法,其描述的数据挖掘的大致过程包括取样、探索修改、模型和评价。
1、数据取样。在进行数据挖掘之前,首先要根据数据挖掘的目标选定相关的数据库。通过创建一个或多个数据表进行抽样。所抽取的样本数据量既要大到足以包含有实际意义的信息,同时又不至于大到无法处理。
2、数据探索。数据探索就是对数据进行深入调查的过程,通过对数据进行深入探察以发现隐藏在数据中预期的或未被预期的关系和异常,从而获取对事物的理解和概念。
3、数据调整。在上述两个步骤的基础上对数据进行增删、修改,使之更明确、更有效。
4、建模。使用人工神经网络、回归分析、决策树、时间序列分析等分析工具来建立模型,从数据中发现那些能够对预测结果进行可靠预测的模型。
5、评价。就是对从数据挖掘过程中发现的信息的实用性和可靠性进行评估。
二、数据挖掘在财务决策中的应用
从财务分析的角度来看,数据挖掘是一种新的财务信息处理技术,其主要特点是能对会计数据库以及其他业务数据库中的大量数据进行抽取、转换、分析及其他模型化处理,从中提取辅助决策的关键性数据。数据挖掘其实是深层次的财务数据分析方法。分析这些数据主要目的是为企业决策提供真正有价值的信息,进而获取更大企业价值的最大化。
(一)网络经济时代企业财务分析的变化
随着网络经济时代的到来,现在的财务分析与传统财务分析相比,数据使用的广泛性大大提高,而且还产生如下变化:
1、财务分析信息使用者发生变化。传统财务分析信息注重提供给现有投资者,主要为现有的投资者提供企业相关的分析资料。在网络经济时代,随着资本市场的不断发展和完善,企业的股东结构日趋多元化,这就要求企业不仅要考虑现有投资者的分析资料要求,更要将企业推向潜在的投资者,吸引潜在投资者注意,以此增强其发展潜力。
2、财务分析导向性发生变化。传统财务分析主要是面向过去。在网络经济时代财务分析不仅要面向过去,更要面向未来。由于潜在投资者的增多,财务分析信息使用者更需要的是能为其提供决策依据的信息,进而决定是否采取某一行动或决策。这就要求企业全面分析企业内部和外部的经营发展情况和趋势,向使用者充分暴露有关未来发展前景,赢利预测和现金流量的信息。
3、财务分析时效性发展变化。传统财务分析信息一般实时反映。在网络经济时代,要求企业成为一个信息系统,利用网络随时向外提
供信息,以满足投资者等利害关系人进入企业网页或有关搜索引擎上搜索当日、当时企业情况的需要。
4、财务分析对象范围发生变化。传统财务分析的对象主要是有形资产。在网络经济时代,知识资源、人力资源、企业文化资源和顾客市场资源等已成为公司最重要的资源,企业的无形资产在整个资产总额中的份额将大大超过有形资产。将知识资源、人力资源、企业文化资源和顾客市场资源等无形资产纳人资产要素范畴势在必行。
(二)数据挖掘在财务分析中的应用
由于以上变化,使得对财务分析的方法有了更高的要求。财务数据挖掘其实是一类深层次的财务数据分析方法,同传统的财务分析相比,它具有以下特点:首先,数据挖掘所采用的基础数据更加全面,不仅包含财务报表中的数据,而且可以包括会计业务基础数据、非财务数据以及其他相关业务数据,如企业背景资料、人力资源信息等;
其次,财务分析可以提供更有价值的信息,不仅可以利用钻取、切片、漂移、旋转等功能简单而直观地引导用户从多角度、多侧面观察数据,而且可以将分析数据统一管理起来,使用户在同一界面下选择分析的重点,获取所有分析数据;
再次,财务分析的时效性更强,影响的范围更大,有助于吸引潜在的投资者。利用数据挖掘技术进行财务分析的基本过程如下:
1、确定财务分析对象。定义财务分析的对象,根据财务分析的目的选择合适的分析模型,采用相应的数据挖掘方法。
2、数据收集。数据收集是数据挖掘的首要步骤,数据可以于现有的会计信息系统,也可以从数据仓库中得到,还可以是其他业务系统中的数据。
3、数据。数据收集阶段得到的数据可能有一定的“污染”,可能存在自身的不一致性或者有缺失数据的存在等,因此数据的是必须的。同时通过数据,可以对数据做简单的泛化处理,从而在原始数据的基础之上得到更为丰富的数据信息,便于下一步数据挖掘的顺利进行。数据主要包括以下内容:(1)数据选择。搜索所有与财务分析对象有关的内部和外部数据信息,根据财务分析的目的并从中选择出适用于数据挖掘的数据。(2)数据简化。有些数据属性对财务分析是没用的,这些属性的存在会大大影响挖掘效率,甚至还可以导致挖掘结果的偏差。数据简化是在对发现任务和数据本身内容理解的基础上,寻找依赖于发现目标的表达数据的有用特征,以缩减数据规模,从而在尽可能保持数据原貌的前提下最大限度地精简