商务智能(1).ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
事务处理不适宜DSS应用的原因:
– 事务处理和分析处理的性能特性不同; – 数据集成问题; – 数据动态集成问题; – 历史数据问题; – 数据的综合问题。
5
7.2.2 数据仓库的定义
W. H. Inmon的定义:数据仓库是面向主题的、 集成的、稳定的且随时间变化的数据集合,用 以支持企业或组织的决策分析过程。 数据仓库的特性:
– 面向主题; – 集成; – 稳定性; – 随时间变化性。
6
7.2.3 数据仓库中的数据组织
1、数据仓库的组织结构
高度综合级
元
轻度综合级
数
据
当前细节级
早期细节级
7
数据仓库的组织结构
数据仓库中的数据分四个级别:
– 早期细节级 – 当前细节级 – 轻度综合级 – 高度综合级
8
2、粒度与分割
(1)粒度
– 切片和切块 – 钻取 – 旋转
17
7.5.2 数据挖掘
1、数据挖掘的概念
– 数据挖掘是从大型数据库中提取人们感兴趣 的知识
2、数据挖掘的分析方法:
– 关联分析 – 序列模式分析 – 分类分析 – 聚类分析
18
第七章结束,谢谢!!
19
– 必须有数据的积累; – 建立数据仓库; – 提供开发和应用工具。
2
7.2 数据仓库概述
7.2.1 从数据库到数据仓库 7.2.2 数据仓库的定义 7.2.3 数据仓库中的数据组织
3
7.2.1 从数据库到数据仓库
数据处理的分类:
– 操作型处理(或事务处理); – 分析型处理(或信息处理)。
4
从数据库到数据仓库
分片7 分片8
第三季度 分片9 分片10
分片11 分片12
第四季度 分片13 分片14
分片15 分片16
10
7.3 数据仓库建模
数据仓库的数据概念模型是数据的多维 视图,它直接影响到前端工具、数据存 储的设计和OLAP的查询引擎。
11
订货表
订单号
订货日期
客户表 客户号 客户名称 客户地址
销售员 销售员号 销售员姓名
15
7.5.1 OLAP的多维数据分析
1、OLAP的概念
– OLAP称为在线事务处理,它是利用一种叫做多维结 构的专用数据结构对数据仓库中的数据进行复杂分 析
– OLAP有以下几个基本概念
• 变量 •维 • 维的层次 • 维成员 • 多维数组 • 数据单元
16
2、OLAP多维数据分析
多维分析是指对多维形式组织起来的数据采取 切片、切块、钻取、旋转等各种分析动作,以 求剖析数据,使最终用户能从多个角度、多侧 面地观察数据库中的数据,从而深入地了解包 含在数据中的信息内涵。 多维数据分析的基本动作:
第7章 商务智能
主要内容
7.1 商务智能概述 7.2 数据仓库概述 7.3 数据仓库建模 7.4 数据仓库系统的开发过程 7.5 数据仓库的前端访问和分析工具
1
7.1 商务智能概述
商务智能的基本任务:收集、管理和分析数据, 通过先进的工具把数据转换为有用的信息,然 后将这些信息发布到整个企业,促进企业科学 决策的制定,有效获得更具有战略意义的决策。 商务智能是数据处理技术与多种技术,如人工 智能技术、统计技术、数据仓库技术的有机集 合。
– 指数据仓库的数据单位中保存数据的细化或 综合程度的级别。
(2)分割
– 指把逻辑上是统一的整体的数据分割成较少 的、可以独立管理的物理单元进行存储。
– 通常采用按时间分割。
9
例 商品销售数据的分割
2000年 家电类 日用化工类 针织服装类 副食类
第一季度 分片1 分片2
分片3 分片4
第二季度 分片5 分片6
13
7.4 数据仓库系统的开发过程
流wenku.baidu.com:
– 启动工程 – 建立技术环境 – 设计主题进行数据建模 – 设计数据仓库中的数据库 – 数据转换程序 – 管理元数据 – 开发用户决策的数据分析工具 – 管理数据仓库环境
14
7.5 数据仓库的前端访问和分析工具
数据仓库的前端访问和分析工具是供业 务分析和决策人员访问目标数据库中的 数据,并作进一步的深入分析之用。 OLAP数据挖掘工具是常用的数据仓库的 前端访问和分析工具。
城市
7.3.1 星型模型
事实表
订单号 销售员号 客户号 产品号 日期标识 地区名称 数量 总价
地区表
地区名称 省别
产品表 产品号 产品名 产品目录 单价
日期表 日期标识 日 月 年
12
7.3.2 雪花模型
雪花模型是对星型模型的扩展。 雪花模型对星型模型的维表进一步标准 化。 优点:通过最大限度地减少数据存储量 以及把较少的标准化表联合在一起来改 善查询性能。
– 事务处理和分析处理的性能特性不同; – 数据集成问题; – 数据动态集成问题; – 历史数据问题; – 数据的综合问题。
5
7.2.2 数据仓库的定义
W. H. Inmon的定义:数据仓库是面向主题的、 集成的、稳定的且随时间变化的数据集合,用 以支持企业或组织的决策分析过程。 数据仓库的特性:
– 面向主题; – 集成; – 稳定性; – 随时间变化性。
6
7.2.3 数据仓库中的数据组织
1、数据仓库的组织结构
高度综合级
元
轻度综合级
数
据
当前细节级
早期细节级
7
数据仓库的组织结构
数据仓库中的数据分四个级别:
– 早期细节级 – 当前细节级 – 轻度综合级 – 高度综合级
8
2、粒度与分割
(1)粒度
– 切片和切块 – 钻取 – 旋转
17
7.5.2 数据挖掘
1、数据挖掘的概念
– 数据挖掘是从大型数据库中提取人们感兴趣 的知识
2、数据挖掘的分析方法:
– 关联分析 – 序列模式分析 – 分类分析 – 聚类分析
18
第七章结束,谢谢!!
19
– 必须有数据的积累; – 建立数据仓库; – 提供开发和应用工具。
2
7.2 数据仓库概述
7.2.1 从数据库到数据仓库 7.2.2 数据仓库的定义 7.2.3 数据仓库中的数据组织
3
7.2.1 从数据库到数据仓库
数据处理的分类:
– 操作型处理(或事务处理); – 分析型处理(或信息处理)。
4
从数据库到数据仓库
分片7 分片8
第三季度 分片9 分片10
分片11 分片12
第四季度 分片13 分片14
分片15 分片16
10
7.3 数据仓库建模
数据仓库的数据概念模型是数据的多维 视图,它直接影响到前端工具、数据存 储的设计和OLAP的查询引擎。
11
订货表
订单号
订货日期
客户表 客户号 客户名称 客户地址
销售员 销售员号 销售员姓名
15
7.5.1 OLAP的多维数据分析
1、OLAP的概念
– OLAP称为在线事务处理,它是利用一种叫做多维结 构的专用数据结构对数据仓库中的数据进行复杂分 析
– OLAP有以下几个基本概念
• 变量 •维 • 维的层次 • 维成员 • 多维数组 • 数据单元
16
2、OLAP多维数据分析
多维分析是指对多维形式组织起来的数据采取 切片、切块、钻取、旋转等各种分析动作,以 求剖析数据,使最终用户能从多个角度、多侧 面地观察数据库中的数据,从而深入地了解包 含在数据中的信息内涵。 多维数据分析的基本动作:
第7章 商务智能
主要内容
7.1 商务智能概述 7.2 数据仓库概述 7.3 数据仓库建模 7.4 数据仓库系统的开发过程 7.5 数据仓库的前端访问和分析工具
1
7.1 商务智能概述
商务智能的基本任务:收集、管理和分析数据, 通过先进的工具把数据转换为有用的信息,然 后将这些信息发布到整个企业,促进企业科学 决策的制定,有效获得更具有战略意义的决策。 商务智能是数据处理技术与多种技术,如人工 智能技术、统计技术、数据仓库技术的有机集 合。
– 指数据仓库的数据单位中保存数据的细化或 综合程度的级别。
(2)分割
– 指把逻辑上是统一的整体的数据分割成较少 的、可以独立管理的物理单元进行存储。
– 通常采用按时间分割。
9
例 商品销售数据的分割
2000年 家电类 日用化工类 针织服装类 副食类
第一季度 分片1 分片2
分片3 分片4
第二季度 分片5 分片6
13
7.4 数据仓库系统的开发过程
流wenku.baidu.com:
– 启动工程 – 建立技术环境 – 设计主题进行数据建模 – 设计数据仓库中的数据库 – 数据转换程序 – 管理元数据 – 开发用户决策的数据分析工具 – 管理数据仓库环境
14
7.5 数据仓库的前端访问和分析工具
数据仓库的前端访问和分析工具是供业 务分析和决策人员访问目标数据库中的 数据,并作进一步的深入分析之用。 OLAP数据挖掘工具是常用的数据仓库的 前端访问和分析工具。
城市
7.3.1 星型模型
事实表
订单号 销售员号 客户号 产品号 日期标识 地区名称 数量 总价
地区表
地区名称 省别
产品表 产品号 产品名 产品目录 单价
日期表 日期标识 日 月 年
12
7.3.2 雪花模型
雪花模型是对星型模型的扩展。 雪花模型对星型模型的维表进一步标准 化。 优点:通过最大限度地减少数据存储量 以及把较少的标准化表联合在一起来改 善查询性能。