数据仓库与OLAP在营销决策系统中应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

以纺织公司营销决策支持系统为例探讨了利用基于数据仓库的OLAP进行联机分析的方法,首先介绍了数据仓库的基本特征和结构模型,以及OLAP技术的功能和实现方式,然后以基于数据仓库的阜新市经纬纺织公司营销决策系统原型为实例,把抽象的理论具体化,最后探讨了数据仓库发展的必然趋势和最终目的,并提出了关于OLAP研究方向的观点。

0 引言
在当今信息化社会中,随着数据量爆炸式的增长和各行业对计算机应用需求的多样化、深入化,信息系统的用户需要从大量事务数据中归纳出业务的规律性及其发展趋势,以支持决策制定,传统的OLTP分析方法己不能满足需求。

要提高分析决策的效率和有效性,决策型分析处理及其数据必须与操作型事务处理及其数据相分离,这种分离导致以单一数据库为中心的数据环境发展为体系化环境,而数据仓库则是体系化环境的核心,是建立决策支持系统的基础,以数据仓库为基础的数据库应用已成为主流之一。

1 数据仓库的概念和结构模型
(1)概念和基本特征
公认的数据仓库之父W.H.Inmon将其定义为“数据仓库是面向主题的、集成的、随时间变化的,但信息本身相对稳定的数据集合,用以支持管理决策过程”。

数据仓库的几个基本特征:
“面向主题”主题是一个在较高层次将数据归类的标准,每一个主题对应一个宏观分析领域。

“集成”是指原始数据进入数据仓库前,必须先经过加工与集成,统一原始数据中的矛盾之处,并将原始数据的结构从面向应用转换到面向主题。

“随时间变化”是指数据仓库内的数据是历史数据,数据时限长,且数据包含时间项属性。

“稳定”是指数据集成进入数据仓库后极少或根本就不改变。

(2)结构模型
数据仓库定义了结构元素来实现数据的结构模型:事实、维度、粒度。

事实:所分析的目标数据,如:销售量、销售额、库存量、库存额等;维度:事实信息的属性,如:销售发生的时间、客户、地区、销售产品的品种、规格等;粒度:划分维度的单位,就好比数轴的单位,如时间维度可按日计,也可按旬、月、年计等。

数据仓库的结构模型包括星型模型和雪花模型以及星型雪花模型,利用结构
模型建立事实表和维度表,作为OLAP的分析基础。

星型模型如图1所示,中间为事实表,包括与之相关联的维度信息和事实信息;四围为维度表(如时间、客户、产品、地区等),每个维表有自己的属性。

维表和事实表通过关键字相关联。

使用星型模型主要是为了提高查询的性能和便于用户安排不同的查询。

图1 星型模型
雪花模型比星型模型增加了层次结构,如图2所示这种结构体现了维的不同粒度的划分。

使用雪花模型进一步增加了查询的范围。

在实际应用中,往往有若干个事实表,它们分别和各维度表关联,构成扩展的雪花模型。

在有些查询中,可能会用到若干个同时连接了相同维表的事实表。

图2 雪花模型
2 OLAP的功能和实现方法
OLAP的基本特征是满足用户从多角度观察目标即多维分析,那么多维分析就是OLAP工具的基本功能。

OLAP应具有以下基本功能特征:(1)具备灵活报表功能;(2)非限制性的维和聚合层次;(3)多维查看。

OLAP是数据库上层的一个应用,它需要有底层的数据库作为它的数据来源。

在OLAP实现方法的研究主要有两个方向:基于多维数据库的 OLM(MOLAP)和基于关系数据库的OLAP(ROLAP)MOLP,即Multi-Dimension OLAP,将按照主题定义的OLAP分析所要的数据,生成并存储成多维数据库,形成超立方体的结构。

生成的多维立方体己经计算生成了一些汇总值。

当用户发出请求时,从维立方体中取得数据,而不是从数据仓库中取得数据,这样对用户响应的时间快,但由于多维立方体的生成,造成了数据的存储空间增大。

并且多维立方体中,不可能存储大量的细节数据,综合数据较多,所以分析的颗粒度不会太细。

ROLAP以关系型结构进行多维数据的表示和存储,而不生成多维立方体,只是存储数据模型与数据仓库数据之间的映射关系,真正的关系物理存储在数据库中。

在进行多维分析时,OLAP服务器根据定义的模型,根据用户的分析需求,从数据仓库中取得数据,进行实时分析。

这样增加了对用户的响应时间,但数据只存储在一次,相对MOLAP,节省了空间,并且分析可以到具体细节数据,考察数据的颗粒度较小。

当分析应用的灵活性较大或进行多因素分析预测时,应以ROLAP为主。

MOLAP和ROLAP各有所长。

MOLAP是近来应多维分析而产生的,它以多维数据库为核心。

多维数据库在数据存储及综合上都有着关系数据库不可比拟的一些优点。

但它毕竟是一种新技术,在许多方面还有待于进一步提高。

而ROLAP
则以广泛应用的RDBMS为基础,因此在技术成熟及各方面的适应性上较之 MOLAP 占有一定的优势。

3 实例
在“阜新市经纬纺织公司营销决策支持系统”中,使用了以数据仓库为基础的OLAP技术,使用者是企业的决策者和部门领导,他们关心的问题包括整个企业的销售、生产、库存、计划、营销人员的业绩等许多方面。

对各种问题进行仔细分析后,可归纳出所有的事实与维,并确定维的粒度。

在确定了事实、维和粒度之后,用雪花模型表示事实、维和粒度之间的关系,并确定对应的事实表和维表,完成了数据仓库的构建。

之后,根据领导决策分析的要求,完成用户界面的设计和OLAP的功能设计。

这里,用户界面按功能分类,按网页的浏览形式设计,能较好地满足各类用户的使用要求。

另外,由于系统中的数据来源比较复杂,数据量较大,因此,OLAP选用ROLAP的形式,以保证数据处理的速度和方便数据仓库主题的扩充。

该系统投入运行后,运行效果良好,受到了用户的普遍好评。

4 结论
目前我们对数据仓库的研究还主要着眼于数据数仓库的构建和维护的基本理论、方法上。

下一步应该把重点放在数据仓库的有效应用研究上,如何针对具体应用建构最有效的模型,以及随着信息来源的不断增多和更新速度的不断加快,实时的OLAP也应是研究的一个重点,最后就是与数据挖掘的整合工作,充分发挥二者的功能。

相关文档
最新文档