多维数据组织与分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

昆明理工大学信息工程与自动化学院学生实验报告

( 2016 — 2017 学年第二学期)

课程名称:数据仓库与数据挖掘开课实验室:信自楼444 2017年5 月4 日

一、上机目的

目的:

1.理解维(表)、成员、层次(粒度)等基本概念及其之间的关系;

2.理解多维数据集创建的基本原理与流程;

3.理解并掌握OLAP分析的基本过程与方法;

4. 学会使用基本的MDX语句

二、上机内容

1.基于上次实验建立的地铁数据仓库,构建地铁公司收入的多维数据集。

2.使用维度浏览器进行多维数据的查询、编辑操作。

3.对多维数据集进行切片、切块、旋转、钻取操作。

4.使用MDX语句对多维数据集进行切片。

注意:可参照Analysis Services的教程,构建多维数据集。要求时间和站点维度采用层次结构。

利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模型及其OLAP操作过程。实验完成后,应根据实验情况写出实验报告。

三、实验原理及基本技术路线图(方框原理图或程序流程图)

请描述联机分析处理的相关基本概念(MOLAP、ROLAP、切片、切块、旋转、钻取等)。

1.MOLAP:表示基于多维数据组织的OLAP实现。使用多维数组存储数据。

特点:将细节数据和聚合后的数据均保存在cube中,所以以空间换效率,查询时效率高,但生成cube时需要大量的时间和空间。

2.ROLAP:表示基于关系数据库的OLAP实现。将多维数据库的多维结构划分为事实表,和维表。

特点:将细节数据保留在关系型数据库的事实表中,聚合后的数据也保存在关系型的数据库中。

这种方式查询效率最低,不推荐使用。

3.切片:在给定数据立方体的一个维上进行选择操作就是切片,切片的结果是得到一个二维平面数

据。

4.切块:在给定数据立方体的两个或多个维上进行选择操作就是切块,切块的结果得到一个子立

方体。

5.旋转:维度变换的方向,即在表格中重新安排维的放置(例如行列互换)。

6.钻取:改变维的层次,变换分析的粒度。它包括向下钻取和向上钻取。

四、实验方法、步骤(或:程序代码或操作过程)

1.多维数据集

(1)卡类型维度

(2)卡类别维度

(3)时间维度

(4)站点维度

(5)进出站

(6)多维数据集建立

(7)处理多维数据集

(8)部署完成

(9)钻取

(10)旋转

(11)

(12)切片

(13)切块

五、实验过程原始记录( 测试数据、图表、计算等)

1.多维数据集

2.钻取

旋转

切片

切块

六、实验结果、分析和结论(误差分析与数据处理、成果总结等。其中,绘制曲线图时必

须用计算纸或程序运行结果、改进、收获)

1.通过本次实验,我们理解了OLAP的多维数据分析的概念,简单实现了一个多维数据分

析模型,对多维数据分析的基本操作(切片、切块、钻取、旋转)有一个基本的认识。

2.在进行模型建立过程中,因为建立数据仓库过程中数据导入问题,需要我们重新检查

数据仓库的ETL过程,寻找问题并予以解决,这一过程是一个循环往复的过程,直至

所有问题都得以解决,OLAP的多维数据集才能顺序建立并进行相关操作,所以在ETL

过程中认真细心,尽量考虑周全,可以避免建立OLAP多维数据集时的很多问题

相关文档
最新文档