数据仓库 概述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概述
• 数据仓库在我国的发展
– 前景:随着计算机技术的发展,尤其是分布式 技术的发展,数据仓库在我国有着广阔的发展 空间和良好的发展前景。例如:
• 由于银行商业化的步伐正在加大,各大中型银行在 入世的机遇和挑战下,开始重新考虑自身的业务, 特别是信贷风险管理方面特别注意,因而有关信贷 风险管理和风险规章的基于数据仓库的决策支持系 统的需求逐渐增多; • 由于电子商务的迅速发展,越来越多的电子商务网 站,开始考虑如何将数据仓库应用于商品销售分析、 顾客的诚信度分析等,为客户提供更进一步的个性 化服务; • 如移动通信等各大型企业也开始考虑着手进行决策 支持以及数据仓库规划。
数据仓库
引子
• 计算机渗透: All aspects of our life • 计算机:Tools,Definition • 市场与技术:没有市场技术等于零
– – – – – – – – CRM PDM PCM MRP,MRPII,ERP E-Government EC EPM ……
为决策服务
引子
面向主题的(Subject Oriented) 集成的(Integrate) 相对稳定的(Non-Volatile) 反映历史变化(Time Variant) 的数据集合 用于支持管理决策。
数据仓库
• 教学内容
– – – – – – – – – 数据仓库的现状、发展 数据仓库的体系结构 元数据 维度建模 ETCL OLAP 数据仓库与Web 数据挖掘基础 数据仓库的部署
概述
• 数据挖掘的发展
–数据挖掘是与数据仓库密切相关的一个信息技 术新领域,它是信息技术自然演化的结果。 –随着数据库技术的迅速发展以及数据库管理系 统的广泛应用,人们积累的数据越来越多,但 缺乏挖掘数据中隐藏的知识的手段,导致了 “数据爆炸但知识贫乏的”现象。 –自80年代后期以来,联机分析处理(OLAP) 和数据挖掘技术应运而生。
• 据IDC调查,使用数据仓库的投资汇报率平均超过400%, 尤其是从小型数据仓库开始实施的平均汇报率超过500%。 • 数据仓库(Data Warehouse)是一个面向主题的 (Subject Oriented)、集成的(Integrate)、相对稳定 的(Non-Volatile)、反映历史变化(Time Variant)的 数据集合,用于支持管理决策。
引子
• 一个数据仓库也许会在一个数据库当中实 现,但数据仓库与数据库仍然是两个不同 的概念。 • 成功的数据仓库都是使用数据库管理系统 来实现的。 • 实现数据仓库不一定非得有数据库系统的 存在。 • 一个数据仓库就是一个具有某种特性的数 据集合。
引子
数据仓库(Data Warehouse)是一个:
– 充分发掘您数据资产的价 值 。 – 将信息转化为知识 ,将知识转化为竞争优势 。 – 它必须象最宝贵的业务资产一样管理 。 – 信息就是策略资产,数据就是金钱 。 – 象管理金钱一样管理数据,您必须用不同的方式管理 。
引子
• 信息系统领域是一个“不成熟”的领域。(TPS、MIS、DSS)
– 数据缺乏可信性(数据无时基,数据算法上的差异,抽取的多层次, 外部数据问题,无起始公共数据源)。 – 生产率(或者说生产率低)是不可预测的。 – 数据转化为信息的不可行性,数据时标性。
• White Collar:KM • Problem:信息泛滥,知识贫乏 • DSS:By Data、Information、 Knowledge • Solution:DB,DW,DM DSS • 知讯者生存 • 黄金有价,信息无价 几乎所有的数据厂商都推出了自己 的数据仓库解决方案 :IBM,
概述
• NCR公司为WalMart建立了第一个数据仓库 • 加拿大的IDC公司调查了多家实现了数据仓库的欧美企业, 结果表明:数据仓库为企业提供了巨大的收益。 • IBM的实验室在数据仓库方面已经进行了10多年的研究, 并将研究成果发展成为商用产品。 • 其他数据库厂商在数据仓库领域也纷纷提出了各自的解决 方案。
MS,Informix,Oracel, Sybase,CA etc.
引子
• 如今的管理人员都了解,无论他们的核心业务是什么,他们 都从事着“ 信息业务”。他们所作出的决策对其结果有直接 的影响。高效利用信息去管理和影响决策过程的企业将获得 巨大的竞争优势 。 • 面向事务处理的强大信息系统已十分常见,它们使全球各地 的企业拉开了档次,如果企业需要在行业中领先,他们就需要 能够重新发现和应用现有信息的分析型系统 。 …… • 分析系统可以深入分析当前浩如烟海的数据,寻找基于事 实, 有意义而且可行的信息 。
数据Baidu Nhomakorabea库
• 教学方式
– 以课堂教学为主,以电子教案的内容为主线 – 课外阅读指定的参考文献并利用网上资源,加 深对教学内容的理解 – 上机实习
数据仓库
• 考核方式及要求
– 撰写课程论文一篇
• 课程论文的内容不仅包括数据仓库与数据挖掘的综 述,而且应包括对某一方面深入的分析、独立的见 解或实际应用。 • 课程论文的格式按照正式发表学术论文的要求,篇 幅一般可大于正式发表的论文。
– – – – Sybase Oracle MS Informix
概述
• 数据仓库在我国的发展
– 现状:数据仓库的概念已经被国内用户接受多年,但在应用方面 的收效仍很有限。 – 原因:
• 尚不存在可靠的、完善的、被广泛接受的数据仓库 标准; • 现有的数据库系统不健全,数据积累还不够,无法 提出决策支持需求; • 缺乏能够担负规划、设计、构建和维护数据仓库的 重任的复合型人才; • 缺乏数据仓库前端工具(如OLAP工具、数据挖掘 工具等); • 由于国内外文化的差异,一些用于构建数据仓库的 知名产品无法处理一些难以预料的问题,使得建立 数据仓库的困难加大。
– 上机实习 – 笔试
数据仓库
• 教材及参考书
– 《Building the Data Warehouse》, W. H. Inmon,机械工业出版社(Fourth Edition) – 数据仓库基础 【美】Paulraj Ponniah 电子工 业出版社 – 因特网上有关参考资料和文献 – 学术刊物上有关论文