数据仓库-数据集市-BI-数据分析-介绍 ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

OLTP on-line transaction processing,传统的关系型数据库的主要应用,主要是基本的
、日常的事务处理,例如银行交易
数据集市:面向特定主题和部门级的数据仓库,是数据仓库的子集,数据仓库是
提供跨部门的,统一数据视图
ppt课件
5
数据仓库与OLTP系统的差别
对比项 用户
功能 DB设计 数据
数据仓库介绍
ppt课件
议程
1. 数据仓库概念及由来 ✓ 基本概念 ✓ 产生背景
2. 数据仓库搭建 ✓ 数据整合 ✓ 数据建模 ✓ 数据管控
3. Oracle数据仓库产品介绍
ppt课件
2
什么是数据仓库
一个面向主题的、集成的、非易失性的、随时间 变化的数据的集合,以用于支持管理层决策过程。
ppt课件
非常复杂 传统ER模型 低
较为交单 维度建模 高
交付 时间 部署成本
指导思想
需要很长的启动时间
较高的启动成本,较低的后续项目开 发成本 长期规划
反映历史变化:操作型数据库主要关心当前某一个时间段内的数据,而数据仓
ppt课库件中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时 4
几个相关的概念
BIBusiness Intelligence,即商业智能,一类由数据仓库(或数据集市)、查询报表、数据分析、
数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的技术及其应用
复杂的查询 上百个 100GB-TB
6
数据仓库是怎么产生的
在数据库技术的支持下,一大批成熟的业务信息系统投入运行,为企业发展做出了 巨大贡献。各类信息系统大多属于面向事务处理的OLTP系统,经过多年的运行, 积累了大量的数据,而管理决策层对数据分析基础平台的需求却日益强烈。
数据可信性:两个部门提供的数据是不一样的,让管理者无所适从
3
数据仓库的特点
面向主题:操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分
离,而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户 使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。
集成的:面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独
立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基 础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内 的信息是关于整个企业的一致的全局信息。
相对稳定的:操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。
数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数 据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作, 但修改和删除操作很少,通常只需要定期的加载、刷新。
数据挖掘从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非
平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、 数据库、可视化技术等
OLAP On-Line Analytical Processing是数据仓库系统的主要应用,支持复杂的分析操作
,侧重决策支持,并且提供直观易懂的查询结果
自下而上 1. 根据特定的业务过程建立数据集市; 2. 在各部门数据集市之上递增构建整个 企业的数据仓库
ppt课件
12
两种数据仓库构建方式对比
对比项 体系结构
复杂度 建模工具 易访问性
自上而下
先建立全企业的原子级数据仓库,然 后在此基础上建立部门级应用
自下而上
按照业务过程建立集市, 再通过整合建立数据仓库
报表的生产率问题:由于OLTP的单项系统导致数据的分散性和相同元素定
义不一致所致不可能把数据转换成信息
数据动态集成问题:不同的需求,要求将操作型环境和分析型环境相分离
历史数据问题:单项系统之间保留的历史数据时间范围不一致,无法满足
DSS分析的需要数据的综合问题:非细节数据、多种程度的综合 提升现有的信息:
10
议程
1. 数据仓库概念及由来 ✓ 基本概念 ✓ 产生背景
2. 数据仓库搭建 ✓ 数据整合 ✓ 数据建模 ✓ 数据管控
3. Oracle数据仓库产品介绍
ppt课件
11
两种数据仓库构建方式
自上而下 1. 进行全企业的数据建模和数据整合,并建
立原子级数据仓库; 2. 对于各部门的应用再建立相应的数据集市
ppt课件
7
数据仓库解决的问题
1. 企业范围内的信息共享 2. 准确、一致的集成数据 3. 面向整个企业和最终用户,针对分析需要,进行数据重组,形成一套全新的、 相对完整的数据视图,能够进行快速访问,精确、灵活分析
ppt课件
ห้องสมุดไป่ตู้
8
数据仓库之父
数据仓库之父比尔·恩门(Bill Inmon)在1991年出版的 “Building the Data Warehouse”(《建立数据仓库》 )一书中所提出的定义被广泛接受 主张使用第三范式进行数据仓库建模
ppt课件
9
数据仓库领域另外一名重要的人物
ppt课件
比尔·恩门的对头 随着拉尔夫·金博尔(Ralph Kimball)博士出版了他的第
一本书“The DataWarehouse Toolkit”(《数据仓库工具 箱》),数据仓库行业就开始喧哗起来,恩门的“Building the Data Warehouse”主张建立数据仓库时采用自上而下 (DWDM)方式,以第3范式进行数据仓库模型设计,而他 生活上的好朋友Ralph Kimball在“The DataWarehouse Toolkit”则是主张自下而上(DMDW)的方式,力推数据集 市建设,以致他们的FANS吵闹得差点打了起来,直至恩门推 出新的BI架构CIF(Corporation information factory),把 Kimball的数据集市包括了进来才算平息。
OLTP 操作人员、底层管理人员
数据仓库(OLAP) 决策人员,高级管理人员
日常操作处理
分析决策
面向应用
面向主题
原始数据、细节性数据、当前值数据、 导出数据、综合性数据、
可更新、一次处理的数据量小
历史数据、不可更新但周
期性刷新,一次处理的数
据量大
工作单位 用户数 DB大小
ppt课件
简单的事务 上千个 100MB-GB
相关文档
最新文档