OLAP多维分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

0L人?多维分析一一流通行业审计新思路[摘要]信息技术全面发展的今天,财务信息系统的应用范围越来越广,特别是在流通行业,作用越来越大。同时,审计风险模型不断演变,风险导向审计的概念日益流行。在商品数据丰富的流通行业,审计亟待利用现有强大的财务数据仓库来进行数据分析,利用信息技术进行有效的审计决策。本文探讨了在流通行业中利用0[仙分析技术对数据进行多个维度的查询分析,快速确定审计风险数据和挖掘分析风险数据的审计新思路。

[关键词]OLAP多维分析审计数据仓库

一、OLAP多维分析技术介绍

联机分析处理(OLAP)的概念最早是由关系数据库之父£^

^于1993

0(

年提出的,他同时提出了关于%仙的12条准则。

联机分析处理的用户是专业分析人员及管理决策人员,他们在分析业务经营的数据时,从不同的角度来审视业务的衡量指标是一种很自然的思考模式。例如在流通行业分析销售数据,可能会综合时间周期、产品类别、分销渠道、地理分布、客户群类等多种因素来考量。

联机分析处理的主耍特点,是直接仿照用户的多角度思考模式,预先为用户组建多维的数据模型,在这里,维指的是用户的分析角度。例如对销售数据的分析,时间周期是一个维度,产品类别、分销渠道、地理分布、客户群类也分别是一个维度。一旦多维数据模型建立完成,用户可以快速地从各个分析角度获取数据,也能动态的在各个角度之间切换或者进行多角度综合分析,具有极大的分析灵活性。这也是联机分析处理在近年来被广泛关注的根本原因,它从设计理念和真正实现上都与旧有的管理信息系统有着本质的区别。

数据仓库与OLAP的关系是互补的,现代OLAP系统一般以数据仓库作为基础,即从数据仓库中抽取详细数据的一个子集并经过必要的聚集存储到0LAP#

储器中供前端分析工具读取。

随着数据仓库的发展,0[八?也得到了迅猛的发展。数据仓库侧重于存储和管理面向决策主题的数据:而况仙则侧重于数据仓库中的数据分析,并将其转换成辅助决策信息。OLAP的一个重要特点是多维数据分析,这与数据仓库的多维数据组织正好形成相互结合、相互补充的关系。

OLAP技术使数据仓库能够快速响应重复而复杂的分析查询,从而使数据仓库能有效地用于联机分析。OLAP的多维数据模型和数据聚合技术可以组织并汇总大量的数据,以便能够利用联机分析和图形工具迅速对数据进行评估。当分析人员搜寻答案或试探可能性时,在得到对历史数据查询的回答后,经常需要进行进一步查询。OLAP系统可以快速灵活地为分析人员提供实时支持。

我们利用50[ Server 2000下的々服17315 $6^1^65来进行数据仓库应用下的OLAP实现,帮助我们进行审计的决策支持。模式如图1所示。

图1 OLAP实现模式

二、利用况仙进行审计多维分析的过程

1.我们需要获取流通行业审计数据源

本文案例中我们从某市烟草销售公司获得烟草销售财务数据。当我们从该

单位直接采集过来的时候数据可能是凌乱的,无法被我们直接应用的。如图2

所示。

图2烟草销售公司销售财务数据

原始的数据源数据难免有各种错误、可能不完整或不一致。数据预处理技术可以大大提高数据的质量,从而有助子提高其后的挖掘过程的精度和性能。

2.构建用于多维分析的数据仓库

通过了解被审计单位提供的数据字典,了解基础数据中各表中存储数据的内容、各字段的含义以及各表之间的关联关系,然后从与某业务类别相关的基

础数据表中选择反映该业务类别主要信息的字段,组织这些字段,来构建我们的数据仓库模型。

构建数据仓库的过程中,首先确定数据分析所包含的主题域,即审计风险的统计量(销售数量、销售金额、销售税额)。然后对主题域内容进行较明确的描述,包括时间、公司部门、产品、客户等维度的属性组。

根据概念模型确定的主题域,结合项目背景,设计数据仓库的维表和事实表的逻辑模式。维表设计中一个很重要的问题是维粒度的层次划分。粒度指的是数据仓库中数据单元的细节程度或综合程度的级别。细节程度越高,粒度级就越低;相反,细节程度越低,粒度级就越高。例如,时间维按照粒度层次由高到低可划分为年、月、日三个等级。粒度层次划分适当与否直接影响到数据仓库重要存储的数据量、查询方法和数据仓库整个体系结构。事实表描述用户关心的主题信息,比如销售金额的大小、销售需要上缴税金的多少等。维表和事实表通过公共码联系在一起,形成一个完整的主题域。事实表依靠外键和维表建立联系。例如,销售收入事实表与时间维表的联系就是依靠外键联系实现的。最终我们确定的数据仓库模型。接下来耍做的就是根据我们设计好的数据仓库模型建立数据仓库的事实表和维度表,然后导入相应的数据,并且做一定程度的数据清洗。根据我们设计的数据仓库模型,我们要建立1个事实表,4 个维度表。按照关键字段建立关系。到此,我们的小型数据仓库已经完成了。

3.创建多维数据集

现在我们打开Analysis Manager,连接分析服务器以后,创建一个多维数据

集。

多维数据集是联机分析处理(01“)中的主要对象,是一项可对数据仓库中的数据进行快速访问的技术。多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。

多维数据集由其所包含的度量值和维度定义。例如,一个用于销售分析的

多维数据集内包括度量值销售金额、销售数量和销售税额以及维度time、company、customer和product。该多维数据集使最终用户得以按^服、

company、customer和product将销售金额、销售数量和销售税额分成各种

类别。

4.利用Excel数据透视表进行OLAP外部数据展示和分析

建立£1(^1数据透视表,并对数据透视表进行外部烟草公司销售数据分析多维数据连接。如图4所示。

图4透视表销售数据连接

完成后,我们首先获得一张空白的数据透视表,在空白透视表的一侧我们

看到销售分析的一些字段列表,在这些字段列表中既有我们需要的度量值字段,

也有全部的维度地段,通过对相应字段的拖拉至相应位置,可以获得各种各样

的销售数据多维展示。如图5所示,我们获得2003年各个月份的销售和交税情

况。

我们可以非常清楚地发现,12月份销售金额特别大,那么这个月份的销售就是审计的高风险区域了,需要详细审计,而且同时我们也发现12月份的税金却少了,这个不正常的现象需要审计人员的高度重视,必须采取详细审计的审计措施。

既然我们己经发现12月份的销售金额和税金出现异常情况,我们就想看看12月份到底哪个分拨公司的销售金额和税额出现异常。可以如图6的维度直观观察。

"图6 12月份各个分拨公司销售情况

不难发现,其中0县烟草公司岀现了比较大的异常现象,属于高风险,应该对这个分拨公司的12月份业务进行详细审计,采取相应的审计措施。

相关文档
最新文档