多维数据组织与分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多维数据组织与分析 Prepared on 22 November 2020

昆明理工大学信息工程与自动化学院学生实验报告

( 2016 — 2017 学年第二学期)

一、上机目的

目的:

1.理解维(表)、成员、层次(粒度)等基本概念及其之间的关系;

2.理解多维数据集创建的基本原理与流程;

3.理解并掌握OLAP分析的基本过程与方法;

4. 学会使用基本的MDX语句

二、上机内容

1.基于上次实验建立的地铁数据仓库,构建地铁公司收入的多维数据

集。

2.使用维度浏览器进行多维数据的查询、编辑操作。

3.对多维数据集进行切片、切块、旋转、钻取操作。

4.使用MDX语句对多维数据集进行切片。

注意:可参照Analysis Services的教程,构建多维数据集。要求时间和站点维度采用层次结构。

利用实验室和指导教师提供的实验软件,认真完成规定的实验内

容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模型及其OLAP操作过程。实验完成后,应根据实验情况写出实验报告。

三、实验原理及基本技术路线图(方框原理图或程序流程图)

请描述联机分析处理的相关基本概念(MOLAP、ROLAP、切片、切块、旋转、钻取等)。

1.M OLAP:表示基于多维数据组织的OLAP实现。使用多维数组存储数

据。

特点:将细节数据和聚合后的数据均保存在cube中,所以以空间换效率,查询时效率高,但生成cube时需要大量的时间和空间。

2.R OLAP:表示基于关系数据库的OLAP实现。将多维数据库的多维结构

划分为事实表,和维表。

特点:将细节数据保留在关系型数据库的事实表中,聚合后的数据也保存在关系型的数据库中。这种方式查询效率最低,不推荐使用。

3.切片:在给定数据立方体的一个维上进行选择操作就是切片,切片的

结果是得到一个二维平面数据。

4.切块:在给定数据立方体的两个或多个维上进行选择操作就是切块,

切块的结果得到一个子立方体。

5.旋转:维度变换的方向,即在表格中重新安排维的放置(例如行列互

换)。

6.钻取:改变维的层次,变换分析的粒度。它包括向下钻取和向上钻

取。

四、实验方法、步骤(或:程序代码或操作过程)

1.多维数据集

(1)卡类型维度

(2)卡类别维度

(3)时间维度

(4)站点维度

(5)进出站

(6)多维数据集建立

(7)处理多维数据集

(8)部署完成

(9)钻取

(10)旋转

(11)

(12)切片

(13)切块

五、实验过程原始记录( 测试数据、图表、计算等)

1.多维数据集

2.钻取

旋转

切片

切块

六、实验结果、分析和结论(误差分析与数据处理、成果总结等。其中,绘制曲线图时必须用计算纸或程序运行结果、改进、收获)

1.通过本次实验,我们理解了OLAP的多维数据分析的概念,简

单实现了一个多维数据分析模型,对多维数据分析的基本操作

(切片、切块、钻取、旋转)有一个基本的认识。

2.在进行模型建立过程中,因为建立数据仓库过程中数据导入问

题,需要我们重新检查数据仓库的ETL过程,寻找问题并予以

解决,这一过程是一个循环往复的过程,直至所有问题都得以

解决,OLAP的多维数据集才能顺序建立并进行相关操作,所

以在ETL过程中认真细心,尽量考虑周全,可以避免建立

OLAP多维数据集时的很多问题

相关文档
最新文档