数据仓库的设计方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实际上,数据库实际步骤也包括了数据库应用 系统的设计过程。
有关对数据处理特性的描述中,不同的数据库 的设计过程、数据库设计的不同阶段应该具有不 同的数据模式。如在需求分析阶段,应该是用户 应用需求模式;在概念设计阶段,应该是产品的 概念模式;而在逻辑设计阶段,则应该是有关数 据产品支持的数据模型。
(4)稳定阶段:主要任务是在使用决策支持和数 据仓库过程中不断的改进,是数据仓库逐渐成熟。
2. 数据仓库的开发流程
(1)数据仓库规划分析阶段,在该阶段的工作内 容主要包括:
A.分析数据仓库应用环境,调查数据仓库开发需 求,完成数据仓库的开发规划。
B.建立包括实体关系图、星型模型、雪花模型、 元数据模型以及数据源分析的主题区数据模型, 并根据主题区数据模型开发数据仓库逻辑的模型。
了适应特定的商业应用提出数据仓库系统的发展 前景。 (2)规划和成长阶段:此阶段为开展商业活动。
(3)控制阶段:在这个阶段要用控制和整合的办 法将应用系统整合,把聚焦点正确地转移到“集 中化方法”上,以求在企业级的真正数据仓库中, 为企业决策分析提供强有力的支持,从而将多个 数据仓库结合起来,形成一个决策支持环境。
图3-3 数据库的不同模式
应用1 应用要求 应用2 应用要求 应用3 应用要求
应用4 应用要求
应用1 外模式
应用2 外模式
应用3 外模式
应用4 外模式
映象
概念 模式
逻辑 模式
内模式
综合
转换
映象
3.1.2 数据仓库开发流程
设计和建立数据仓库应采取工程管理的方式进行。 1.数据仓库系统的4个阶段 (1)设想阶段:在数据仓库设想阶段,一般是为
分区1 分区2
编写模式 实 施 装入数据 阶 数据库试运行 段
Creat….. Load……
运
行 维 护
性能监测、转储/恢复 数据库重组和重构
模块设计 IPO表
IPO表…… 输入: 输出: 处理:
程序编码、 编译联结、测试
Main( ) …… If…… Then …… end
新旧系统转换、运行、维护(修正性、适 应性、改善性维护)
在数据库实施阶段,设计人员的主要工作是使用 DBMS所提供的语言和宿主语言,根据数据库逻
辑设计阶段和数据库物理设计阶段的成果建立数 据库,并编制和调试数据库应用程序。
在数据库运行和维护阶段,设计人员的主要工 作是将是运行后的数据库正式运行,并在运行过 程中,对数据库所反映出的问题不断修改、评价、 调试和完善。
设计 体系 结构
规划与 确定需
求
规划 分析阶段
数据仓库 开发过程
设计实 施阶段
数据库 与元数 据设计
确定 数据 抽取源
数据仓 库评价
使用维护 阶段
开发 中间 件
数据 仓库 维护
数据 仓库 应用
填充与 测试数 据仓库
3. 数据仓库的开发特点
数据仓库的使用也即在数据仓库中建立DSS应用。
数据仓库的开发特点包括: (1)数据仓库开发要从数据出发 (2)数据仓库使用的需求不可能在开发初期就明
确 (3)数据仓库的开发是一个不断循环的过程,是
启发式的开发。
3.1.3 数据仓库需求分析
数据仓库的需求分析根据不同领域可以划分为 业主(投资者)的需求、设计的需求、开发者的 需求和最终用户的需求等方面。
数据流图和判定表(判定树)、数据字典 中处理过程的描述
概 念 结 构 设计
概念模型(E-R图) 数据字典
系统说明书包括: A.新系统要求、 方案和概图 B.反映新系统信 自流的数据流图
逻 辑 结 构 设计
某种数据模型 关系
非关系
系统结构图 (模块结构)
wk.baidu.com
图3-2 数据库结构设计(2)
存储安排 物 理 方法选择 设 存取路径建立 计
3.2.3 数据仓库的数据抽取、加载与复制 3.2.4 数据仓库逻辑模型的确定 3.2.5 数据仓库物理模型的确定 3.2.6 数据仓库测试 3.3 数据仓库典型解决方案
3.1.1 数据库设计方法简述
在相当长的一段时期内,数据库设计主要采用的 是手工试凑方法。
按照规范设计的思想,一般将数据库设计细分为 数据库需求分析阶段、数据库概念设计阶段、数 据库逻辑设计阶段、数据库物理设计阶段、数据 库实施阶段和数据库运行、维护六个阶段。
F.将数据从现有系统中传送到仓库中。
(3)数据仓库的使用维护阶段,在该阶段的工作 内容主要包括:
A.将数据仓库投入实际应用,并在应用中改进和 维护数据仓库。
B.对数据仓库进行效益评价,以为下一个循环提 供依据。
图3-4 数据仓库的生命周期开发应用全过程
开发概 念模型
开发 逻辑 模型
需求分析阶段 概念设计阶段
设计逻辑结构 数据模型优化
逻辑设计阶段
设计物理结构
评价设计,性能预测 不满意
物理实现
不满意
试验性运行
使用、维护数据库
物理设计阶段 数据库实施阶段 数据库运行、维护阶段
图3-2 数据库结构设计(1)
设计 阶段
需求 分析
数据
设计描述
处理
数据字典、全系统中数据项、 数据流、数据存储的描述
从数据仓库的应用角度来看,DSS分析员一般 是企业的中上层管理人员,他们对决策分析的需 求不能预先做出规范的说明,只能给设计人员一 个抽象的(模糊的)描述。
应用需求 (数据、处理)
转换规则、 DBMS功能、
优化方法
应用要求, DBMS详 细特征
图3-1 数据库设计步骤
需求收集和分析 设计概念结构
数据仓库设计
第3章 数据仓库设计
3.1 数据仓库的需求与规划 3.1.1 数据库设计方法简述 3.1.2 数据仓库开发流程 3.1.3 数据仓库需求分析 3.1.4 数据仓库规划 3.2 建立数据仓库 3.2.1 数据仓库的平台与结构选择 3.2.2 数据仓库接口与中间件设计
(2)数据仓库设计实施阶段,在该阶段的工作内 容主要包括:
A.按照数据仓库的逻辑模型设计数据仓库的体系 结构。
B.设计数据仓库的物理数据库。
C.用物理数据库元数据填充面向最终用户的元数 据库。
D.对数据仓库中每个目标字段确认其在业务系统 或外部数据源中的数据来源。
E.开发(或购买)用于抽取、清洁、交换和合并 数据等中间件的程序。
有关对数据处理特性的描述中,不同的数据库 的设计过程、数据库设计的不同阶段应该具有不 同的数据模式。如在需求分析阶段,应该是用户 应用需求模式;在概念设计阶段,应该是产品的 概念模式;而在逻辑设计阶段,则应该是有关数 据产品支持的数据模型。
(4)稳定阶段:主要任务是在使用决策支持和数 据仓库过程中不断的改进,是数据仓库逐渐成熟。
2. 数据仓库的开发流程
(1)数据仓库规划分析阶段,在该阶段的工作内 容主要包括:
A.分析数据仓库应用环境,调查数据仓库开发需 求,完成数据仓库的开发规划。
B.建立包括实体关系图、星型模型、雪花模型、 元数据模型以及数据源分析的主题区数据模型, 并根据主题区数据模型开发数据仓库逻辑的模型。
了适应特定的商业应用提出数据仓库系统的发展 前景。 (2)规划和成长阶段:此阶段为开展商业活动。
(3)控制阶段:在这个阶段要用控制和整合的办 法将应用系统整合,把聚焦点正确地转移到“集 中化方法”上,以求在企业级的真正数据仓库中, 为企业决策分析提供强有力的支持,从而将多个 数据仓库结合起来,形成一个决策支持环境。
图3-3 数据库的不同模式
应用1 应用要求 应用2 应用要求 应用3 应用要求
应用4 应用要求
应用1 外模式
应用2 外模式
应用3 外模式
应用4 外模式
映象
概念 模式
逻辑 模式
内模式
综合
转换
映象
3.1.2 数据仓库开发流程
设计和建立数据仓库应采取工程管理的方式进行。 1.数据仓库系统的4个阶段 (1)设想阶段:在数据仓库设想阶段,一般是为
分区1 分区2
编写模式 实 施 装入数据 阶 数据库试运行 段
Creat….. Load……
运
行 维 护
性能监测、转储/恢复 数据库重组和重构
模块设计 IPO表
IPO表…… 输入: 输出: 处理:
程序编码、 编译联结、测试
Main( ) …… If…… Then …… end
新旧系统转换、运行、维护(修正性、适 应性、改善性维护)
在数据库实施阶段,设计人员的主要工作是使用 DBMS所提供的语言和宿主语言,根据数据库逻
辑设计阶段和数据库物理设计阶段的成果建立数 据库,并编制和调试数据库应用程序。
在数据库运行和维护阶段,设计人员的主要工 作是将是运行后的数据库正式运行,并在运行过 程中,对数据库所反映出的问题不断修改、评价、 调试和完善。
设计 体系 结构
规划与 确定需
求
规划 分析阶段
数据仓库 开发过程
设计实 施阶段
数据库 与元数 据设计
确定 数据 抽取源
数据仓 库评价
使用维护 阶段
开发 中间 件
数据 仓库 维护
数据 仓库 应用
填充与 测试数 据仓库
3. 数据仓库的开发特点
数据仓库的使用也即在数据仓库中建立DSS应用。
数据仓库的开发特点包括: (1)数据仓库开发要从数据出发 (2)数据仓库使用的需求不可能在开发初期就明
确 (3)数据仓库的开发是一个不断循环的过程,是
启发式的开发。
3.1.3 数据仓库需求分析
数据仓库的需求分析根据不同领域可以划分为 业主(投资者)的需求、设计的需求、开发者的 需求和最终用户的需求等方面。
数据流图和判定表(判定树)、数据字典 中处理过程的描述
概 念 结 构 设计
概念模型(E-R图) 数据字典
系统说明书包括: A.新系统要求、 方案和概图 B.反映新系统信 自流的数据流图
逻 辑 结 构 设计
某种数据模型 关系
非关系
系统结构图 (模块结构)
wk.baidu.com
图3-2 数据库结构设计(2)
存储安排 物 理 方法选择 设 存取路径建立 计
3.2.3 数据仓库的数据抽取、加载与复制 3.2.4 数据仓库逻辑模型的确定 3.2.5 数据仓库物理模型的确定 3.2.6 数据仓库测试 3.3 数据仓库典型解决方案
3.1.1 数据库设计方法简述
在相当长的一段时期内,数据库设计主要采用的 是手工试凑方法。
按照规范设计的思想,一般将数据库设计细分为 数据库需求分析阶段、数据库概念设计阶段、数 据库逻辑设计阶段、数据库物理设计阶段、数据 库实施阶段和数据库运行、维护六个阶段。
F.将数据从现有系统中传送到仓库中。
(3)数据仓库的使用维护阶段,在该阶段的工作 内容主要包括:
A.将数据仓库投入实际应用,并在应用中改进和 维护数据仓库。
B.对数据仓库进行效益评价,以为下一个循环提 供依据。
图3-4 数据仓库的生命周期开发应用全过程
开发概 念模型
开发 逻辑 模型
需求分析阶段 概念设计阶段
设计逻辑结构 数据模型优化
逻辑设计阶段
设计物理结构
评价设计,性能预测 不满意
物理实现
不满意
试验性运行
使用、维护数据库
物理设计阶段 数据库实施阶段 数据库运行、维护阶段
图3-2 数据库结构设计(1)
设计 阶段
需求 分析
数据
设计描述
处理
数据字典、全系统中数据项、 数据流、数据存储的描述
从数据仓库的应用角度来看,DSS分析员一般 是企业的中上层管理人员,他们对决策分析的需 求不能预先做出规范的说明,只能给设计人员一 个抽象的(模糊的)描述。
应用需求 (数据、处理)
转换规则、 DBMS功能、
优化方法
应用要求, DBMS详 细特征
图3-1 数据库设计步骤
需求收集和分析 设计概念结构
数据仓库设计
第3章 数据仓库设计
3.1 数据仓库的需求与规划 3.1.1 数据库设计方法简述 3.1.2 数据仓库开发流程 3.1.3 数据仓库需求分析 3.1.4 数据仓库规划 3.2 建立数据仓库 3.2.1 数据仓库的平台与结构选择 3.2.2 数据仓库接口与中间件设计
(2)数据仓库设计实施阶段,在该阶段的工作内 容主要包括:
A.按照数据仓库的逻辑模型设计数据仓库的体系 结构。
B.设计数据仓库的物理数据库。
C.用物理数据库元数据填充面向最终用户的元数 据库。
D.对数据仓库中每个目标字段确认其在业务系统 或外部数据源中的数据来源。
E.开发(或购买)用于抽取、清洁、交换和合并 数据等中间件的程序。