第3章 数据仓库系统的设计与开发答辩PPT课件

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

常用方法:关系表(通用数据库物理设计法) 关键任务:物理数据库表及其存储结构设计
第3章 目 录
1 数据仓库系统的设计与开发概述 2 基于SQL2005的数据仓库数据库设计 3 使用SQL2005建立多维数据模型 4 小结
3.2基于SQL Server的数据仓库数据库设计
SQL Server 2005介绍 集成了三个服务。
数据仓库与数据挖掘
第3章 数据仓库系统的设计与开发
通过对数据仓库的概念、体系结 构与存储结构、ETL过程等内容了 解以后,如何建立数据仓库系统 呢?
教师:郭荣熙
第3章 目 录
1 数据仓库系统的设计与开发概述 2 基于SQL2005的数据仓库数据库设计 3 使用SQL2005建立多维数据模型 4 小结
数据仓库系统的开发与设计是一个动态的反馈和循环过程。 一个数据仓库系统包括: 数据仓库数据库 数据分析应用系统
3.1.2数据仓库系统的生命周期
分析
体系结构设计
逻辑模型
概念模型 规范与需求分析 用户评价与反馈
数据库与元数据
设计
数据仓库 系统的 生命周期
维护
数据的ETL处理 中间件开发
系统维护 系统上线应用
3.1.1建立一个数据仓库系统的参考步骤
收集和分析业务需求步骤 建立数据模型和数据仓库的物理设计 定义数据源 选择数据仓库技术和平台 从操作型数据库中抽取、清洗及转换数据到数据仓库 选择访问和报表工具,选择数据库连接软件,选择数据分析和数据
展示软件 更新数据仓库
3.1.2数据仓库系统的生命周期
3.2.3采用信息包图法进行概念模型设计
工作: 确定系统边界:决策类型、需要的信息、原始信息 确定主题域及其内容:主题域的公共键码、联系、属性组 确定维度:如时间维、销售位置维、产品维、组别维等 确定类别:相应维的详细类别 确定指标和事实:用于进行分析的数值化信息
3.2.3采用信息包图法进行概念模型设计
实施
安装与测试 系统
数据填充与调试
3.1.3建立数据仓库系统的两种思维模式
自顶向下(Top-down) 将数据通过ETL汇集到数据仓库中,然后再把数据通过复制的方
式存入各个数据集市中。 自底向上(Bottom-Up)
通过ETL将数据汇集到数据集市中,再将数据汇集到数据仓库中。
3.1.4数据仓库数据库的设计步骤
SQห้องสมุดไป่ตู้ Server 2005的数据仓库架构
3.2基于SQL Server的数据仓库数据库设计
MS SQL Server 2005的数据仓库架构
服务Service
SQL Server Business Intelligence Development Studio
集成(SSIS)
分析(SSAS)
有反复的逐步设计过程
面向用户的需求 详细的技术细节
业务 需求
收集、分析和确认
概念模型设计
常用方法:信息包图法 关键任务:分析和理解数据仓库中的主题
将需求模型转为关系模型
逻辑模型设计
常用方法:星形图法 关键任务:事实表与维度表的设计,包括事实、
粒度、聚合与分割、维度等问题的确定
由关系模型转为存储模型
物理模型设计
信息包图的建立
信息包: 维度
类别
指标和事实 空白信息包图样式
3.3.3采用信息包图法进行概念模型设计
〖例〗试画出销售分析的信息包图。 解:首先根据销售分析的实际需求,确定信息包的维度、类别和指标
与事实: (1)维度:包括日期维、区域维、产品维、客户维、广告维(待用)
等。 (2)类别:确定各维的详细类别,如:日期维包括年(5)、季度
包括以下步骤:
分析组织的业务状况及数据源结构 组织需求调研,收集业务需求 采用信息包图法进行数据仓库的概念模型设计 利用星形图进行数据仓库的逻辑模型设计 数据仓库的物理模型设计
3.2.1分析组织的业务状况及数据源结构
以SQL Server 2005实例数据库Adventure Works DW中所描述 Adventure Works Cycles公司的用户需求为例。 公司概况 业务系统流程介绍 对数据源结构的分析与理解
3.1数据仓库系统的设计与开发
建立一个数据仓库系统的参考步骤 数据仓库系统的生命周期 创建数据仓库系统的两种思维模式 数据仓库数据库的设计步骤
3.1.1建立一个数据仓库系统的参考步骤
数据仓库系统的建立是一个复杂而漫长的过程。涉及到: 源数据库系统 数据仓库对应的数据库系统 数据分析与报表工具 ……
报表(SSRS)
作用Function
数据抽取 数据整合
商业智能应用BI
从企业各业务数据中 获取有用信息,实现 与业务流程的统一
OLAP 数据挖掘
为已有数据建立模 型,分析并找出数 据的内在关系
自定义报表 数据展现
对分析结果提供类型 多样、美观且适合不 同需求的图表和报告
3.2基于SQL Server的数据仓库数据库设计
(20)、月(60)、日(1800),括号中的数字分别指出各类别的 数量;区域维包括国家(10)、省州(100)、城市(500)、销售 点(8000),括号中的数字同样分别指出各类别的数量;类似地, 可以确定产品维、客户维、广告维等的详细类别。 (3)指标和事实:确定用于进行分析的数值化信息,包括实际销售 额、计划销售额和计划完成率。
信息包图 星型、雪花模型 物理数据模型
概念模型 逻辑模型 物理模型
3.2.3采用信息包图法进行概念模型设计
信息包图法简介
信息包图:是数据仓库的数据模型的第一层或最高层。由于大多数 商务数据是多维的,但传统的数据模型表示三维以上的数据有一定 困难。而信息包图简化了这一过程并且允许用户设计多维信息包并 与开发者和其他用户建立联系。这种模型集中在用户对信息包的需 要,信息包提供了分析人员思维模式的可视化表示。
3.2.3采用信息包图法进行概念模型设计
3.2.2组织需求调研,收集业务需求
坚持数据驱动+用户(需求)驱动的设计理体念,因此需要充分了解用 户的需求,进而对需求进行分析。
关于用户需求的调研(确定主题域) 对用户需求调研结果的分析(确定度量指标和维度)
3.2.3采用信息包图法进行概念模型设计
面向用户的需求
细 化 层 次
更详细的 技术细节
相关文档
最新文档