BI基础知识PPT(共32页)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
知识。
-Gartner Group
BI 是将数据转换成知识并将知识应用到商业行为上的一个过
程。
- Data Warehouse Institute
商业智能领域:DSS、OLAP、数据仓库、ETL、数据集市、
数据挖掘、商业建模...为提高企业运营性能而采用的一系列方
法、技术和软件的总和
主题
BI各概念关系
针对特定问题的联机数据访问和数据分析技术
满足对数据进行多角度、快速、一致、交互、深入观察
使用预定义的多维数据视图对数据进行分析处理,支持对数据的切片、切块、钻取。
多维数据库是一种以多维数据存储形式来组织数据的数据管理系统,在使用时需要
将数据从关系数据库中转载到多维数据库中方可访问。
On-Line Transaction Processing
>无冗余(Non redundant)
>用于报表和决策支持(Reporting and decision making)
最详细的数据和信息(Detailed Data)
任何时候,针对任意数据,提出任意业务问题(Ask any question, any data, any
time)
Байду номын сангаас
数据仓库的特点
Time),即用户在终端上送入数据之后,到计算机对这个请求给出答复所需要的时间。
OLTP 数据库旨在使事务应用程序仅写入所需的数据,以便尽快处理单个事务。
OLTP与OLAP
用户
功能
DB 设计
数据
存取
工作单位
用户数
DB 大小
OLTP
OLAP
操作人员,低层管理人员
决策人员,高级管理人员
日常操作处理
面向应用
business process
Enterprise consistency
achieved through bus
主题
BI各概念关系
商业智能
数据仓库
OLAP技术
DSS产品
数据挖掘
商业智能工具
OLTP与OLAP
On-Line Analytical Processing
也称为面向交易的处理系统,其基本特征是顾客的原始数据可以立即传送到计算
中心进行处理,并在很短的时间内给出处理结果。这样做的最大优点是可以即时地处
理输入的数据,及时地回答。也称为实时系统(Real time System)。衡量联机事务
处理系统的一个重要性能指标是系统性能,具体体现为实时响应时间(Response
商业智能
数据仓库
OLAP技术
DSS产品
数据挖掘
商业智能工具
企业数据仓库EDW
企业数据仓库定义:
企业数据仓库作用:
基于数据/信息来回答相关的业务
详细交易及相关业务数据的集合
问题和提供决策支持,并确保:一
包含必要的内部与外部信息
致、集成的数据存储
来自于多个数据源/业务操作系统
数据仓库领域的两位大师
Ralph Kimball
数据仓库方面的知名学者
理论:Mutildimensional Architecture(MD)
主要著作:《数据仓库工具箱-维度建模的完全指南》、
《数据仓库生命周期工具箱- 设计、开发和部署数据仓库的专家方
法》
http://www.kimballgroup.com
Inmon
Kimball
Overall approach
Top-down
Bottom-up
Complexity of the method
Quite complex
Fairly simple
Data Orientation
Data derived
Process oriented
Primary audience
IT audience
End user
Tool
3NF
Dimensional Modeling
Architectural structure
Enterprise wide ,
Data warehouse feeds
department databases
Data mart model a single
Intelligence
Data Mart
Operation Database
Database System
主题
BI各概念关系
商业智能
数据仓库
OLAP技术
DSS产品
数据挖掘
商业智能工具
商业智能Business Intelligence
BI 是将数据转换成信息的过程,然后通过发现将信息转化为
任意的数据粒度
保存一定的时间周期
在整个企业的业务范围
按照企业内业务规则所决定的模型来存储 保持企业内一致的信息视图
企业内一致的信息视图(Single Version of the Truth)
>集成的企业信息(Integrated corporate information)
>不针对特定应用(Application neutral)
当前的, 最新的细节的, 二
维的
读/写数十条记录
简单的事务
上千个
100MB-GB
分析决策
面向主题
历史的, 聚集的, 多维的集成的,
统一的
读上百万条记录
复杂的查询
上百个
100GB-TB
ROLAP表示基于关系数据库的OLAP实现(Relational OLAP)
MOLAP表示基于多维数据组织的OLAP实现(Multidimensional OLAP)
ROLAP vs MOLAP
ROLAP
MOLAP
沿用现有关系数据库技术
专用技术
响应速度相对molap要慢
性能好,响应速度快
数据转载计算速度快
数据转载速度慢
存储空间耗费小,维数没有限制
需要进行预计算,可能导致数据爆炸,
维数有限,无法支持维的动态变化
Bill Inmon
数据仓库之父,数据仓库概念的创始人
理论: Corporate Information Factory(CIF)
主要著作:《数据仓库》、《企业信息工厂》
http://inmoncif.com
企业信息工厂
数据仓库总线
企业总线
总线架构矩阵
数据架构形态
各数据架构比较
Inmon vs Kimball
BI基础知识
主题
BI各概念关系
商业智能
数据仓库
OLAP技术
DSS产品
数据挖掘
商业智能工具
各种概念之间的关系
Business Intelligent System
Decision Support System
Data Warehouse
OLAP
Data Mining
Artificial
相关文档
最新文档