多维数据模型与OLAP实现
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多维数据模型与OLAP实现
近年来,随着网络技术和数理分析在银行业中的广泛应用,西方商业银行开始广泛采用人口地理统计理论,运用数据挖掘及商业智能
对用户请求的快速响应和交互式操作。
OLAP技术在国内兴起和发展的过程中,人们对某些基本概念还有不同的理解。比如,OLAP与多维数据模型的关系,多维数据模型与多维数据库(MDD,MultiDimensionalDatabase)的关系,MOLAP(Multidime
nsionalOLAP,多维联机分析处理)、ROLAP(RelationalOLAP,关系联机分析处理)和HOLAP(HybridOLAP,混合联机分析处理)间的差异,多维数据库与多维联机分析处理是不是完全一致等问题,还有待于进一步澄清。
一、多维数据模型及相关概念
同的维属性。
2.维:是人们观察数据的特定角度,是考虑问题时的一类属性。
属性的集合构成一个维(如时间维、机构维等)。
3.维分层:同一维度还可以存在细节程度不同的各个描述方面(如时间维可包括年、季度、月份、旬和日期等)。
4.维属性:维的一个取值,是数据项在某维中位置的描述(例如“某年某月某日”是在时间维上位置的描述)。
5.度量:立方体中的单元格,用以存放数据。
OLAP的基本多维分析操作有钻取(Rollup,Drilldown)、切片(Slice)、切块(Dice)及旋转(P
钻取包含向下钻取和向上钻取
在多维数据结构中
OLAP多维数据模型的实现有多种途径,其中主要有采用数组的多维数据库、关系型数据库以及两者相结合的方式,人们通常称之为MOLAP、ROLAP和HOLAP。但MOLAP的提法容易引起误解,毕竟根据OLAP的多维概念,ROLAP也是一种多
维数据的组织方式。
1.多维联机分析处理(多维数据库管理系统)多维联机分析处理严格遵照库德的定义,自行建立多维数据库来存放联机分析系统的数据,它以多维数据组织方式为核心
当利用多维数据库存储OLAP数据时,不需要将多维数据模型
进而创建数据块。
图3显示了数据块和索引块的关系。稀疏维和密度维的引入在一定程度上降低了立方体的存储冗余问题。此外,通过数据压缩技术可
降低数据块的存储空间。
2.关系联机分析处理(关系数据库管理系统)
ROLAP以关系数据库为核心,以关系型结构进行多维数据的表示和存储,将多维数据库的多维结构划分为两类表:一类是事实表,用来存储数据和维关键字;另一类是维表,对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息。维表和事实表通过主关键字和外关键字联系在一起,形成“星型模式”。对于层次复杂
Key或DimensionKey);⑤信息可修改。
雪花架构是对星型架构的变形,它将星型架构下的维表格经过正规化处理,使其能表现更丰富的信息,也使得信息处理更加灵活。
3.混合联机分析处理
混合联机分析处理利用多维联机分析处理技术存储上层汇总数
据,利用关系联机分析处理存储细节数据,即低层是关系型的,高层是多维矩阵型的。这种方式具有更好的灵活性。
还有其他一些实现OLAP的方法,如提供一个专用的SQLServer,对某些存储模式(如星型、雪花型)提供对SQL查
询的特殊支持。
OLAP扩展等,大大提高了关系联机分析处理的访问效率。相比较而言,关系联机分析处理技术具有更大的可伸缩性。
银行业的数据仓库项目,由于具有超海量数据的特性,OLAP产品及其存储模式的选择尤其重要。
在项目实施过程中,对OLAP产品和存储模式的选择应考虑企
业数据量的大小、数据处理过程、访问效率和性价比等多个方面。由于多维联机分析处理访问具有高效性,可以将企业应用的大部分聚集层数据以MOLAP形式存储;对有大量细节数据的应用,为防止立方体存储空间过于膨胀,可考虑对于聚集数据以MOLAP方式存储;而对于原子数据可以以ROLAP方式存储。
需要快速响应的多维数据集。