决策支持系统数据挖掘概述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.定义部件 2.数据获取部件 3.管理部件 4.目录部件(元数据) 5.DBMS部件
决策支持系统——第四讲 决策支持的新技术
二.数据仓库的结构构成
1.数据仓库的构成
高度综合数据层 轻度综合数据层 当前基本数据层
历史基本数据层
决策支持系统——第四讲 决策支持的新技术
二.数据仓库的结构构成
2.数据仓库的元数据
(3)关于数据仓库映射的元数据
用该类元数据反映数据仓库中的数据项是从哪个 特定数据源填充的,经过哪些转换、变换和加载 过程。 这类数据可以用来生成程序,以完成数据的转换 工作,即实现操作型数据转换为面向主体的数据 仓库的数据。
决策支持系统——第四讲 决策支持的新技术
2.数据仓库的元数据
2.数据仓库的元数据
(2)关于数据模型的元数据
① I/O对象:支持数据仓库I/O操作的各种对象; ② 关系:两个I/O对象之间的关联; ③ 关系成员:描述每个关系中两个I/O对象的具体
角色、关系度以及约束条件;
④ 关系关键字:描述两个I/O对象如何建立关联。
决策支持系统——第四讲 决策支持的新技术
第一节 数据仓库技术
4.1.1 数据仓库的基本知识 4.1.2 数据仓库系统的结构 4.1.3 数据仓库的运行结构 4.1.4 数据集市的结构
决策支持系统——第四讲 决策支持的新技术
第二节 数据挖掘技术
4.2.1 数据挖掘概述 4.2.2 数据挖掘基本过程与步骤 4.2.3 数据挖掘的任务与挖掘方法 4.2.4 数据挖掘与数据仓库的关系
DB数据
细节的 在存取时准确的
可更新的 操作需求事先可知道
事务驱动 面向应用 一次操作数据量小 支持日常操作
DW数据
综合或提炼的 代保过去的数据
不更新 操作需求事先不知道
分析驱动 面向分析 一次操作数据量大 支持决策需求
决策支持系统——第四讲 决策支持的新技术
3.DW是作为DSS的基础的分析型DB,用
内容; ③ 指导从当前基本数据到轻度综合数据、轻度综
合数据到高度综合数据的综合算法的选择。
决策支持系统——第四讲 决策支持的新技术
三.数据仓库的工具集
1.分析工具
(1)查询工具 (2)可视化工具
2.挖掘工具
决策支持系统——第四讲 决策支持的新技术
四.数据进入DW的过程与建立DW的步骤
1.数据进入DW的基本过程(教材p221)
① 提取:从操作型数据库中选择并提取所需要的字 段;
② 变换:为来自数据源的数据指定常用的格式和名 称;
③ 净化:更正错误的数据; ④ 加载:把净化过的数据载入到DW数据里; ⑤ 汇总:提前计算出任何期待的DW数据的汇总供以
后使用。
决策支持系统——第四讲 决策支持的新技术
2.建立DW的步骤
① 收集和分析业务需求 ② 建立数据模型和数据仓库的物理设计(包括划分
粒度和数据分割两部分内容) ③ 定义数据源 ④ 选择DW技术和平台 ⑤ 从操作型DB中提取、转换、净化并加载到DW中 ⑥ 选择访问和报表工具 ⑦ 选择DB连接软件 ⑧ 选择数据分析和数据展示软件 ⑨ 更新DW
决策支持系统——第四讲 决策支持的新技术
四.数据库与数据仓库的区别
1.数据库是面向业务的,使用者是企业的一般业务 人员,进行企业日常数据处理和维护工作。 2.数据仓库是面向决策的,使用者是企业的高层管 理人员,它也是使用关系数据库,当数据仓库不负 责处理业务。 3.数据库注重的是企业运行的当前数据,任务是收 集和记录企业的原始业务数据,而DW面对的是非即 时性的历史数据,通过从业务数据中提取,加工处 理后提供给决策人员。
决策支持系统——第四讲 决策支持的新技术
4.1.2 数据仓库系统的结构
关系 数据库
数据文件
其他 数据
数据仓库 管理工具
抽取 转换 转载
元数据库
数据建 模工具
综合 数据
当前 数据
历史 数据
用户查 询工具
C/S 工具
OLAP 工具
DM 工具
决策支持系统——第四讲 决策支持的新技术
一.数据仓库管理系统
来存放大容量的只读数据,为制定决策提供 所需的信息。
4.DW是与操作型系统相分离的、基于标准
企业模型集成的、带有时间属性的,即与企 业定义的时间段相关的、面向主题且不可更 新的数据集合。
5.……
决策支持系统——第四讲 决策支持的新技术
三.数据仓库的特点
1.数据仓库是面向主题的。 2. 数据仓库是集成的。 3.数据仓库是稳定的。 4.数据仓库是随时间变化的。 5.数据仓库中的数据量很大。 6.数据仓库软硬件要求较高。
决策支持系统——第四讲 决策支持的新技术
4.1.1 数据仓库的基本知识
二.数据仓库的概念
1.W.H.Inmon
是面向主题的、集成的、稳定的、随时间变化的数 据集合,用于支持经营管理中的决策制定过程。
面向主题 集成 稳定 随时间变化
决策支持系统——第四讲 决策支持的新技术
2.SAS软件研究所的观点
(4)关于数据仓库使用的元数据
① 元数据告诉数据仓库中有什么数据,它们是 从哪儿来的,即如何按主题查看数据仓库的 内容;
② 元数据提供已有的可重复利用的查询语言信 息。
决策支持系统——第四讲 决策支持的新技术
2.数据仓库的元数据
(5)元数据的作用——DW的核心
① 定位数据仓库的目录作用; ② 数据从业务环境向数据仓库传送时数据的目录
决策支持系统——第四讲 决策支持的新技术
第三节 联机分析处理技术
4.3.1 基本概念 4.3.2 OLAP的数据组织 4.3.3 OLAP的多维数据分析方法 4.3.4 OLAP的发展
决策支持系统——第四讲 决策支持的新技术
4.1.1 数据仓库的基本知识
一.从数据库到数据仓库
事务处理环境不适宜决策应用的主要原因: 1.事务处理环境和分析处理的性能、特性不同 2.数据集成问题 3.数据动态集成问题 4.历史数据问题 5.数据的综合问题 6.不同的使用对象
2.数wenku.baidu.com仓库的元数据
(1)关于数据源的元数据
① 数据源中所有的物理数据结构,包括所有的数据 项和数据类型;
② 所有数据项的业务定义; ③ 每个数据项更新频率,以及由谁或哪个过程更新
的说明; ④ 每个数据项的有效值; ⑤ 其他系统中具有相同业务含义的数据项的清单。
决策支持系统——第四讲 决策支持的新技术
相关文档
最新文档