数据仓库概述[1]

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据仓库概述
PPT文档演模板
2020/11/21
数据仓库概述[1]
课程简介:
1. 为什么出现数据仓库与数据挖掘?
— 啤酒与尿布 — 7-11
2. 研究内容
— 从海量数据中找到规律与联系,为决策提 供支持
3. 数据仓库与数据库的不同
PPT文档演模板
数据仓库概述[1]
数据库与数据仓库
PPT文档演模板
PPT文档演模板
数据仓库概述[1]
面向主题示例
库存管理子系统:
领料单(领料单号,领料人,商品号,数量,日期) 进料单(进料单号,订单号,进料人,收料人,日期) 库存(商品号,库房号,库存量,日期) 库房(库房号,仓库管理员,地点,库存商品描述)
人事管理子系统:
员工(员工号,姓名,性别,年龄,文化程度,部门号) 部门(部门号,部门名称,部门主管,电话)
PPT文档演模板
数据仓库概述[1]
¢ William H.Inmon:数据仓库是一个面向主题 的、集成的、非易失的且随时间变化的数据
集合,用于支持管理人员的决策。
William H. Inmon: William H. Inmon是世界公认的“数据仓库之父”, 是数据仓库及其相关技术网站 www.billinmon.com 的 合 作 伙 伴 , 是 “企业信息工厂”的创造者之一。他一直致 力于数据库和数据仓库技术方面的研究,在 数据管理和数据仓库技术方面以及数据处理 的 管 理 方 面 撰 写 了 40 多 本 著 作 , 发 表 过 600 多 篇 学 术 论 文 , 并 且 经 常 应 邀 在 技 术 和学术会议上演讲。
¢ 1.1 数据仓库的产生 ¢ 1.2 数据仓库的含义 ¢ 1.3 数据仓库的特征 ¢ 1.4 数据库系统与数据仓库 ¢ 1.5 数据仓库的基本结构 ¢ 1.6 数据仓库的基本概念 ¢ 1.7 数据仓库的数据组织
PPT文档演模板
数据仓库概述[1]
1.1 数据仓库的产生
1. 数据处理分为两类:
事物处理
分析处理
2. 传统数据库较难满足分析处理的要求:
¢
历史数据需求量大
¢
不同系统的数据难以集成(蜘蛛网问题)
¢
对大量数据的访问性能不足
¢
事务处理和分析处理数据环境的分离
PPT文档演模板
数据仓库概述[1]
1.2 数据仓库的含义
对于什么是数据仓库,还有许多不同的定义,如:
¢
“数据仓库是融合方法、技术和工具以在完整的平台上
同的用户有不同的要求,同一个用户的要求也会随 时间而经常变化,因此,数据仓库中的主题有时会 因用户主观要求的变化而变化的。
PPT文档演模板
数据仓库概述[1]
面向主题
¢ 为特定数据分析领域提供的数据与传统数据库中的 数据是有不同的。传统数据库中的数据是原始的、 基础的数据,而特定分析领域数据则是需要对它们 作必要的抽取、加工与总结而形成。
数据仓库概述[1]
考核方法:
¢ 考核采取笔试结合实验的方法: 实验成绩 30% 笔试成绩 70%
PPT文档演模板
数据仓库概述[1]
第一章 数据仓库概述
本章介绍了数据仓库技术产生的背景、数据仓库的含义与特征、数 据仓库与操作型数据库系统的区别和数据仓库的基本体系结构。
PPT文档演模板
数据仓库概述[1]
数据仓库之父--Bill Inmon
PPT文档演模板
数据仓库概述[1]
1.3 数据仓库的特征 ¢ 数据仓库的数据是面向主题的 ¢ 数据仓库的数据是集成的 ¢ 数据仓库的数据是非易失的 ¢ 数据仓库的数据是随时间不断变化的
PPT文档演模板
数据仓库概述[1]
面向主题
¢ 主题(Subject):特定的数据分析领域与目标。 ¢ 面向主题:为特定的数据分析领域提供数据支持。 ¢ 数据仓库是面向分析、决策人员的主观要求的,不
PPT文档演模板
数据仓库概述[1]
面向主题示例
¢ 例:一个面向事务处理的“商场”数据库系统,其数据 模式如下 采购子系统:
订单(订单号,供应商号,总金额,日期) 订单细则(订单号,商品号,类别,单价,数量) 供应商(供应商号,供应商名,地址,电话)
销售子系统:
顾客(顾客号,姓名,性别,年龄,文化程度,地址,电话) 销售(员工号,顾客号,商品号,数量,单价,日期)
将数据提交给终端用户的一种手段”。
¢
“数据仓库是对分布在企业内部各处的业务数据的整合、
加工和分析的过程”。
¢
“数据仓库是一种具有集成性、稳定性和提供决策支持的
处理”。
¢
“为查询和分析(不是事务处理)而设计的关系数据库”
20世纪80年代中期,“数据仓库”这个名词首次出现在号称 “数据仓库之父”W.H.Inmon的《Building Data Warehouse》一 书中,在该书中,W.H.Inmon把数据仓库定义为“一个面向主 题的、集成的、稳定的、随时间变化的数据的集百度文库,以用于支 持管理决策过程。”(“A data warehouse is a subject-oriented, integrated, non-volatile, time-variant collection of data in support of management decisions.”)
PPT文档演模板
数据仓库概述[1]
面向主题示例
¢ 如果按照面向主题的方式进行数据组织,首先应该 抽取主题,即按照管理人员的分析要求来确定主题, 而与每个主题相关的数据又与有关的事务处理所需 的数据不尽相同。
¢ 在每个主题中,都包含了有关该主题的所有信息, 同时又抛弃了与分析处理无关或不需要的数据,从 而将原本分散在各个子系统中的有关信息集中在一 个主题中,形成有关该主题的一个完整一致的描述。 面向主题的数据组织方式所强调的就是要形成一个 这样一致的信息集合
主要参考书:
1.《数据仓库》 Inmon W.H 著 机械工业出版社 2.《数据挖掘 – 概念与技术》 Jiawei Han & Micheline Kamber 著 机械工业出版社 3.《数据挖掘 》 朱明 著 中国科学技术大学出版社 4.《数据仓库与联机分析处理》 王珊等 著 科学出版社
PPT文档演模板
数据仓库概述[1]
PPT文档演模板
主要学习内容:
第一篇 数据仓库与OLAP
1. 数据仓库 2. 联机分析处理技术(OLAP) 3. 数据预处理技术
— 数据清洗 — 数据集成和变换 — 数据约简
第二篇 数据挖掘
1. 数据挖掘技术
— 关联规则挖掘、分类、聚类分析 — 数据挖掘在各领域的应用等。
数据仓库概述[1]
相关文档
最新文档