数据仓库的开发设计过程

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据仓库之路

FAQ

FAQ目录

一、与数据仓库有关的几个概念 (2)

1.1目录 (2)

二、数据仓库产生的缘故 (6)

三、数据仓库体系结构图 (7)

四、数据仓库设计 (8)

4.1数据仓库的建模 (8)

4.2数据仓库建模的十条戒律: (9)

五、数据仓库开发过程 (9)

5.1数据模型的内容 (9)

5.2数据模型转变到数据仓库 (10)

5.3数据仓库开发成功的关键 (11)

六、数据仓库的数据采集 (11)

6.1后台处理 (12)

6.2中间处理 (12)

6.3前台处理 (13)

6.4数据仓库的技术体系结构 (13)

6.5数据的有效性检查 (15)

6.6清除和转换数据 (15)

6.7简单变换 (16)

6.8清洁和刷洗 (17)

6.9集成 (18)

6.10聚拢和概括 (20)

6.11移动数据 (20)

七、如何建立数据仓库 (22)

7.1数据仓库设计 (22)

7.2数据抽取模块 (23)

7.3数据维护模块 (24)

一、与数据仓库有关的几个概念

1.1目录

☐Datawarehouse

☐Datamart

☐OLAP

☐ROLAP

☐MOLAP

☐ClientOLAP

☐DSS

☐ETL

☐Adhocquery

☐EIS

☐BPR

☐BI

☐Datamining

☐CRM

☐MetaData

Data warehouse

本世纪80年代中期,“数据仓库之父”William H.Inmon先生在其《建立数据仓库》

一书中定义了数据仓库的概念,随后又给出了更为精确的定义:数据仓库是在企业治理和决策中面向主题的、集成的、与时刻相关的、不可修改的数据集合。与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分析的过程。而不是一种能够购买的产品。

Data mart

即数据集市,或者叫做“小数据仓库”。假如讲数据仓库是建立在企业级的数据模型之上的话。那么数据集市确实是企业级数据仓库的一个子集,他要紧面向部门级业务,同时只面向某个特定的主题。数据集市能够在一定程度上缓解访问数据仓库的瓶颈。

OLAP

联机分析处理(OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的。当时,Codd认为联机事务处理(OLTP)已不能满足终端用户对数据库查询分析的需要,SQL对大数据库进行的简单查询也不能满足用户分析的需求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此Codd提出了多维数据库和多维分析的概念,即OLAP。Codd提出OLAP 的12条准则来描述OLAP系统:

准则1 OLAP模型必须提供多维概念视图

准则2 透明性准则

准则3 存取能力推测

准则4 稳定的报表能力

准则5 客户/服务器体系结构

准则6 维的等同性准则

准则7 动态的稀疏矩阵处理准则准则8 多用户支持能力准则

准则9 非受限的跨维操作

准则10 直观的数据操纵

准则11 灵活的报表生成

准则12 不受限的维与聚拢层次

相关文档
最新文档