数据仓库与数据挖掘实验二(多维数据组织与分析)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、实验内容和目的

目的:

1.理解维(表)、成员、层次(粒度)等基本概念及其之间的关系;

2.理解多维数据集创建的基本原理与流程;

3.理解并掌握OLAP分析的基本过程与方法;

内容:

1.运用Analysis Server工具进行维度、度量值以及多维数据集的创建(模拟案例)。

2.使用维度浏览器进行多维数据的查询、编辑操作。

3.对多维数据集进行切片、切块、旋转、钻取操作。

二、所用仪器、材料(设备名称、型号、规格等)

操作系统平台:Windows 7

数据库平台:SQL Server 2008 SP2

三、实验原理

在数据仓库系统中,联机分析处理(OLAP)是重要的数据分析工具。OLAP的基本思想是企业的决策者应能灵活地、从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。

OLAP是在OLTP的基础上发展起来的,OLTP是以数据库为基础的,面对的是操作人员和低层管理人员,对基本数据的查询和增、删、改等进行处理。而OLAP是以数据仓库为基础的数据分析处理。它具有在线性(online)和多维分析(multi-dimension analysis)的特点。OLAP超越了一般查询和报表的功能,是建立在一般事务操作之上的另外一种逻辑步骤,因此,它的决策支持能力更强。

建立OLAP的基础是多维数据模型,多维数据模型的存储可以有多种不同的形式。MOLAP和ROLAP是OLAP的两种主要形式,其中MOLAP(multi-dimension OLAP)是基于多维数据库的OLAP,简称为多维OLAP;ROLAP(relation OLAP)是基于关系数据库的

OLAP,简称关系OLAP。

OLAP的目的是为决策管理人员通过一种灵活的多维数据分析手段,提供辅助决策信息。基本的多维数据分析操作包括切片、切块、旋转、钻取等。随着OLAP的深入发展,OLAP也逐渐具有了计算和智能的能力,这些能力称为广义OLAP操作。

四、实验方法、步骤

要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模型及其OLAP操作过程。实验完成后,应根据实验情况写出实验报告。

五、实验过程原始记录(数据、图表、计算等)

本实验以实验一建立的数据仓库为基础,使用Microsoft的SQL Server Business Intelligence Development Studio工具,建立OLAP相关模型,并实现OLAP的一些简单基本功能。

◆首先打开SQL Server Business Intelligence Development Studio工具,新建一个Analysis

Service项目,命名为:DW

◆新建:数据源,连接实验一中建立的数据仓库

◆新建数据源视图,选择OLAP中要用到的所有表

◆建立维度表和事实表之间的主外键关系,如下

根据订单主题建立分析维度:发货方式、下单方式、订单状态、订单价值、销售人员、日期(年月日/年月旬日/年季月日/年月周日)、客户(年龄/性别/客户类型/所在地区/年收入/职称/受教育程度/婚姻状况/拥有车辆数/子女数量)

以【订单价值】维度为例,说明如下:

选择使用现有表,选择订单价值表:V_SUBTOTAL_VALUES

选择所有属性,设置维度名称为:订单价值,完成

添加一个层次结构,处理维度,查看效果

显示字段按字符排序,显然不符合习惯,给维度添加一个属性关系,做为字段排序依据,重新处理后查看效果

其他各维度建立完成后效果如下(部分):

◆建立多维数据集,确定度量值(修改相应度量值的显示名称),选择已经建好的维度

◆OLAP模型建立完成,如下为对多维数据集进行切片、切块、旋转、钻取的操作示例

切片【订单价值-订单数量】

切块【订单价值-订单数量-客户受教育程度】

旋转【订单价值-订单数量-客户受教育程度→客户受教育程度-订单数量-订单价值】

钻取【客户所在地区:国家→省→市-订单数量】

六、实验结果、分析和结论(误差分析与数据处理、成果总结等。其中,绘制曲线图时必须用计算纸)

通过本次实验,我们理解了OLAP的多维数据分析的概念,简单实现了一个多维数据分析模型,对多维数据分析的基本操作(切片、切块、钻取、旋转)有一个基本的认识。同时,在进行模型建立过程中,因为建立数据仓库过程中数据导入问题,需要我们重新检查数据仓库的ETL过程,寻找问题并予以解决,这一过程是一个循环往复的过程,直至所有问题都得以解决,OLAP的多维数据集才能顺序建立并进行相关操作,所以在ETL过程中认真细心,尽量考虑周全,可以避免建立OLAP多维数据集时的很多问题。

相关文档
最新文档