一种新型的计算机审计模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一种新型的计算机审计模型
0 引言
在信息技术飞速发展的大形势下,企业ERP系统、电子商务、电子政务及会计电算化等逐渐普及,审计工作面临巨大的挑战,计算机审计取代过去传统的手工审计,成为现代审计领域的一个重要课题,对海量数据的计算机审计及智能审计更是迫切需要解决的问题。
近年来,数据管理技术和市场上一个方兴未艾的领域一一数据仓库及其相关的OLAP数据挖掘等技术,已经服务于金融、保险、电信、邮电等多个行业领域,为各级经营管理者提供了宝贵的决策性支持,如用于信用分析、风险分析、欺诈检测、客户关系管理等。
但其在审计行业的应用,还只在试验探索阶段,或只关注其中某个技术与审计结合,或局限在某个特定的审计领域。
本文提出了一种新型的计算机审计模型,将数据仓库、OLAP、数据挖掘等技术的优势充分地应用于审计行业,以辅助计算机审计,降低审计风险,提高审计效率,保证审计质量。
1 审计现状与发展需求
1.1 审计现状
审计是由专职机构和人员,对被审计单位的财政、财务收支及其他经济活动的真实性、合法性和效益性进行审查和评价的独立性经济监督活动。
随着计算机、数据库、网络等信息技术的飞速发展,会计电算化形势的形成,电子商务、电子政务系统的普及,审计方式也相应地由手工审计转变为计算机审计。
当前的计算机审计(主要指针对数据的审计)面临很大的压力
与挑战:
a)审计数据量大。
在信息技术高速发展的时代,被审计单位积累了大量的业务数据,并且仍在急剧增长。
b)数据的不一致性。
被审计单位的数据,可能来自不同的
业务信息系统,或以不同的存储方式存在,因此,这些数据难免具有不一致性,诸如异构、冗余、缺值、数据类型不一致、数据单位不一致、表示方式不一致、数据错误等。
c)审计时限限制。
审计工作是一项复杂的任务,在实际操
作中,每项审计任务均受到审计时限的限制,力求提高审计效率是刻不容缓的。
d)审计知识经验有限。
审计行业跨度较大,不同的行业,
审计知识也不尽相同,而且每个审计人员仅有自己积累的那一部分经验,无法共享。
e)信息不对称。
对同一个问题,不同的审计人员关注的重点不同,得到的审计结果也不尽相同,信息的不对称性必将影响审计的质量[1] 。
f )现代计算机技术利用不充分,审计效率及质量不高。
使用传统的审计软件,在进行数据分析时,仍只能靠简单的表或记录查询,仍局限于依靠审计人员积累的审计经验来发现异常数据,隐藏信息不易暴露,常有漏审、误审等现象发生。
为克服上述困难,有效地针对海量数据开展审计已成为计算机审计领域迫切需要解决的问题。
虽然目前计算机审计已能够利用DB2、Oracle 等大型数据库进行数据处理,并进行简单的分析,但对于如何有效地处理、分析数
据,有效地作出决策还有待进一步探索,这就需要引入数据仓库、OLAR数据挖掘等技术。
1.2 技术发展数据仓库技术是将各种有效的操作型数据集成到统一的环境中,以提供决策型数据访问的技术和模块的总称。
它所做的一切都是为了让用户更快、更方便地查询所需要的信息,提供决策性支持。
数据仓库的体系结构[2] 如图1 所示。
1.2.1 数据预处理数据源是业务系统中存在的操作型数据,通常数据量很大,产生规则不尽相同,难免有噪声、空缺、不一致、冗余等数据的存在。
为提高数据质量,从而提高数据分析的效率及分析结果的质量,需要进行必要的数据预处理,如数据清理、数据集成、数据变换和数据规约。
1.2.2 数据仓库
数据经过预处理之后,被加载到数据仓库。
W.H.Inmon[3] 描述数据仓库(data warehouse,DW) 为:一个面向主题的、集成的、非易失的、且随时间变化的数据集合,用来支持管理人员的决策。
数据仓库的目标是支持全面的、大量的数据存储,并依靠客户端工具来实现高层次的决策支持。
1.2.3 数据组织数据仓库可采用索引机制、查询优化器、连接策略、数据排序、采样、并行处理等技术,管理大量数据,以方便快速地访问。
数据仓库还支持多维分析的查询模式,E.F.Codd 在1993 年提出了联机分析处理(OLAP的概念,简单地说,它是针对特定问题的联机数据访问和分析,通过对信息的多个角度(维)进行快速、一致、稳定地交互访问,决策分析人员可以深入地观察[4] 。
多维性是OLAP的灵魂,选择合理的多维数据模型,适当的OLAP
服务器,有效地组织数据仓库中的数据,为数据分析提供便利。
1.2.4 数据分析
1)普通分析
2)多维分析
OLAF技术使多维数据分析成为现实,分析人员在数据立方体结构的基础上,借助OLAP工具提供的切片、切块、上卷、下钻、转轴等操作,多维、快速、一致地分析数据。
3)数据挖掘
数据挖掘(data mining )是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的,人们事先不知道的,但又是潜在有用的信息和知识的过程[5] 。
利用各种分析工具,可以从海量数据中发现未知的模型或数据间隐含的关系,并以此作出预测。
常见的数据挖掘功能有数据描述、关联分析、分类和预测、聚类分析、孤立点分析、演变分析等。
笔者认为将数据仓库、OLAR数据挖掘等技术应用到审计行业,辅助计算机审计是可行的,且很有必要。
现代审计领域,计算机审计的发展需要利用此类相关技术建设审计数据仓库,与联机分析处理、数据挖掘有机集成,并实现各种数据挖掘算法,对海量数据进行智能化和多元化的分析、关联,从而发现审计线索,帮助审计人员正确作出决策。
2 审计数据仓库模型的设计
图2 为传统计算机审计软件的工作方式。
传统的计算机审计,对不同来源的审计数据也执行了抽取、净化、转换等操作,但相对于数据仓库而言,数据库在对海量数据的组织管理方面有很多
缺陷,并且在传统计算机审计方式下,审计数据的分析以及审计线索的发现,仍局限于依靠审计人员的经验,审计效率很低。
本文提出一种新型的计算机审计模型,如图3 所示。
该模型克服了传统审计软件的不足,实现了新环境下高效计算机审计的目标。
新型的计算机审计模型实现了数据仓库、OLAR数据挖掘等技术的有机集成,并且在适当的环节引进其他先进技术,指导计算机审计高效实施。
相对于传统审计软件,该模型具有如下优势:
a)审计数据交由数据仓库管理,数据仓库的优势无疑为面
向海量数据的审计带来诸多好处
b)审计数据的组织可以使用索引机制、OLAR并行处理等先进的数据仓库技术,实现快速、高效地访问数据的目标。
c)支持多维分析。
使用OLAP工具,多角度、多方位地分析数据,可以快速地发现审计线索,暴露某些不易发现的隐藏信息也成为可能。
d)有指导分析,并且实现了审计经验的积累与共享。
分析审计数据,不再局限于依靠审计人员仅有的经验,规则库中积累的所有经验知识及数据挖掘发现的审计规则均可以作为指导规
则。
在审计数据仓库模型的指导下,审计人员利用先进的信息技术,按照如下步骤,顺利完成计算机审计任务。
2.1 审计数据仓库
2.1.1 确定审计目标及审计重点
前期准备阶段,由审计单位相关负责人制订审计计划。
审计人员准备
实施审计任务时,根据审计计划,进一步了解被审计单位的业务系统、财务系统、业务数据的特点等,确定审计的目标、内容及审计重点。
信息技术的发展,使得业务的运作模式各有特点,数据的产生规则也不尽相同,呈现出不同的表现形式。
审计人员只有与被审计单位相关人员及时沟通,才能较深刻地了解被审计单位的内部控制制度以及数据的特点,降低审计风险。
2.1.2 建立审计数据模型,完成数据仓库的逻辑/ 物理设计
熟悉被审计单位的数据特点并明确审计目标之后,审计人员根据相关的法律、法规、审计知识以及确定的审计重点,建立审计数据模型。
确定关键的审计主题域,每个主题必要的数据支持,待分析的指标、度量等,设计数据仓库的逻辑/ 物理结构,提取的审计数据需要根据模型进行转换、集成。
例如,在对某商业银行金融审计时,审计主题域可设为存款业务审计、贷款业务审计、银行卡业务审计等。
对于贷款业务审计主题,贷款方式、贷款用途、贷款期限、贷款机构、贷款对象、贷款时间等都是必要的数据支持,同时贷款金额、贷款利率、贷款利息等作为数据分析的度量指标。
审计数据模型设计是一项相当复杂的任务,也是审计工作中较为关键的步骤。
2.1.3 确定数据源根据确定的数据模型,进一步分析被审计单位的业务数据,确定数据源。
数据源的定位,可以根据审计主题逐步完成。
比如金融审计时,先选择那些与存款业务相关的数据,如会计报表、存/ 取款交易记录、账户信息等,接着分析与贷款业务相关的数据等。
业务信息系统的多样性导致了审计数据源的多样性,它们以不同的数据库存储形式存在,如Oracle 、DB2、SQLServer 、Access 等;可以是文本数据,如Text 、Word 文档;可以是Excel 表格;甚至可以是XML文档等。
因此,异构性数据是审计工作重点关注的问题,需要对其进行后文将要提到的数据预处理。
2.1.4 选择适当的数据仓库技术和平台
根据审计的实际需求,结合数据的特点,通过比较当前不同数据仓库产品的优劣,选择合适的产品作为审计数据仓库。
主要考虑的因素有:与业务系统集成的方便性、数据量、数据类型支持、数据组织策略等。
2.1.5 从先前确定的数据源中抽取、净化、转换和集成数据,并且加载到审计数据仓库
针对前面提到的数据源的多样性,确定数据抽取策略、数据转换机制,对于噪声数据如缺值、数据单位不一致等,则要明确数据净化方法,注意去掉重复记录等,保证加载到数据仓库中的数据是集成的、一致的。
此类规则属于元数据范畴,需要集中管理。
例如,选择某大型数据库厂商提供的数据仓库产品做平台,对于文本文件,可以使用特殊的分隔符(如Tab 键)区分不同的属性(值),换行符区分不用的记录行,记录属性名称的映射关系;针对数据存储格式不一致等问题,则以数据仓库的格式为目标进行转换,实现数据的一致性;对于缺值问题,则可以取记录的平均值或某个预定的默认值,或者作为特殊数据单独管理;进行必要的数据集成,以满足分析的需求等。
数据抽取转换是审计实施的关键步骤,计算机审计软件也不例外,但是
现有的抽取转换机制具有一定的局限性,需要不断完善,不断强大其功能。
另外,只有被审计单位提供了真实的数据,才能保证净化、转换、加载到数据仓库中的数据的有效性。
对于有加密机制的数据,则需要被审计单位提供解密机制或者解密之后的数据。
2.1.6 管理元数据
元数据有两类:a) 数据仓库的设计和管理人员用于开发和日常管理数据仓库时用的数据。
包括数据源信息、数据转换的描述、数据仓库内对象和数据结构的定义、数据清理和数据更新时用的规则、源数据到目的数据的映射、数据导入历史记录等;b )从业务角度描述的数据仓库中的数据。
包括主题描述及其包含的数据、查询、报表等。
2.1.7 组织管理加载到数据仓库中的数据审计数据模型及审计目标是数据组织与管理的依据,采用先进的技术,如索引优化、OLAP等技术对数据仓库中的数据进行有效的组织管理,以提供快速高效的数据访问接口。
在数据仓库的基础上,使用OLAP工具,采用合理的多维数据模型,完成事实表、维表等的设计,方便多维分析。
例如在银行存款业务审计时,对存款金额、利息等作为事实表属性,而维度可以选择存款机构、存款账户、存款时间等。
2.1.8 录入其他相关资料
与审计相关的法律、法规、审计业务知识可以录入数据仓库,以供查阅。
比较成熟的审计理论、审计经验也可以规则的形式录入数据仓库,与后面将要提到的数据挖掘发现的审计规则相结合,指导审计人员快速发现审计线索,提高审计效率。
2.2 审计数据分析
在审计数据仓库的基础上,通过数据分析发现审计线索,挖掘隐藏的审计知识。
2.2.1 简单分析
选择适当的报表、分析工具,借鉴先进的查询、统计技术(也可以自己编程实现),对数据进行一般性分析。
感观的认识往往更能给人留下深刻的印象,因此可以借鉴数据可视化技术及统计分析图如柱状图、饼状图、直方图等来直观地表现数据分析结果。
另外,在涉及到有地域信息的数据时,可以借鉴GIS 相关技术,将数据信息在地域中体现,进行空间数据挖掘,有助于数据分析。
同时,在确定审计目标数据后,可以跟踪位置信息,如跟踪某个客户活动的地域范围信息等。
通常的审计软件只提供普通的报表分析工具,且此类分析是在审计经验的指导下完成的,具有一定的盲目性,犹如盲人摸象,效率很低。
本文提到的审计数据仓库模型还引入其他一些先进的分析、挖掘技术,可以大大提高审计效率,这些技术在传统审计软件中
是没有的。
2.2.2 多维分析
使用OLAP工具,多维多角度分析数据。
可以借助切片、切块、上卷、下钻等操作多维分析数据仓库中的数据,异常数据容易被发现,而通常此类信息凭经验是很难发现的。
比如在银行存款业务审计时,分析该行某一年的存款数额及利息关系,以时间作为分析的维度,发现某一季度存款额提高,但是利息收入却在下降,因而怀疑该季度有异常存款发生,审计人员继续深入
调查该季度的存款数据,通过下钻操作,分析该季度下每个月份的数据,确定是否有异常存款存在。
2.2.3 有指导分析
使用数据挖掘工具发现审计规则,积累审计经验,并且利用审计规则指导审计操作。
数据挖掘可以在任何类型的数据存储上进行,本模型指数据仓库基础上的数据挖掘,通常数据挖掘过程需要的数据提取、数据清洗、数据转换等操作已经在数据仓库建设阶段完成,数据仓库中的数据是没有噪声的、一致的、高质量的数据,为后续的数据挖掘提供了诸多的便利。
尽管如此,进行特定的数据挖掘之前,仍需深入地分析。
例如在选择某种数据挖掘算法后,要根据需求,筛选出感兴趣的属性,或者对不同的属性赋予不同的权值等。
挖掘审计规则:如图3 所示,从数据仓库中抽样提取部分数据,作为样本集数据,采用一定的数据挖掘算法,发现某些隐含的规则,将那些有价值的规则更新到审计规则库中。
此外,发现规则的过程可以采用多种数据挖掘算法相结合的方式,追求规则尽量准确、完善。
规则指导审计:审计规则库中的规则是审计人员积累的审计经验以及通过数据挖掘发现的具有一定可信度的审计规则的集合,它们可以用来指导审计,以快速发现审计线索,进而重点审计。
这样,一方面提高了审计的效率;另一方面,审计规则库不断扩大,审计经验得到积累,并且实现了共享,提高了审计的质量。
现行的贷款五级分类制度将贷款分为正常贷款、关注贷款、次级贷款、可疑贷款和损失贷款。
对商业银行贷款业务进行审计时,可以利用数据挖掘技
术,发现合理的贷款分类规则,快速定位可疑的不良贷款,进而追踪审计。
例如利用决策树方法发现信用贷款占不良贷款的多数,这样审计人员可以明确审计重点,提高审计效率。
2.3 审计深入开展
在前面数据分析的基础上,定位重点审计对象,利用先进的计算机技术或其他方式追踪线索,重点审计该类数据,分析审计结果,提出审计报告。
3 结束语
本文提出的新型的审计模型――审计数据仓库模型,可以指导审计人员高效地开展审计工作。
该模型利用数据仓库技术,有
效地解决了面向海量数据的审计;利用OLAR数据可视化等技
术,多维、方便、快捷、直观地分析数据,快速发现异常数据,提供审计线索,提高了审计效率;并且利用数据挖掘等技术发现有价值的审计模式,结合审计人员的经验,实现了审计经验知识的积累与共享,并指导审计人员快速定位审计重点,提高了审计的效率及质量。
该模型的提出,为审计软件今后的发展提供了思路,同时对智能审计作了初步探索,智能审计未来的发展需要借鉴数据挖掘、人工智能等先进技术的发展,有待进一步的研究。