如何进行数据仓库的建设实施
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据中心概念 数据仓库概念 背景与目的 建设步骤建议 迭代关系 实例说明
数据仓库概念:
数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数 据集合,用于支持管理决策。 数据仓库可以帮助用户更好地理解信息,从新的角度看待这些信息,以 便获得更好的洞察力,看到模式和趋势,并更好地进行商业决策。数据 仓库为整个企业的需要服务。 数据仓库需要访问不同的数据源,需要存储海量的数据,需要对企业数 据进行分析,并用适当的方式展现给出来。数据仓库的建设不仅涉及到 许多先进的技术,更涉及到企业所有的业务知识,所以说数据仓库不是 一个产品,而是一个具体的解决方案。
数据源分析
数据源范围 数据源格式 数据更新频率 数据量 数据质量
Data Profiling 数据特性
Custom Profiling 客户化数据特性
需求分析
•
调研计划
实际调研
需求规格说明书
调研内容:针对不同层面的人员,调研内容不同
•
– – – – – – –
对中间管理层
中间管理层通常需要上报哪些指标?和此分析主题相关的有哪些指标? 平时领导层通常询问哪些指标?在这些指标中哪几个和此分析主题有关? 中间管理层目前的工作重点有哪些和此主题相关,和哪几个指标相关? 中间管理层本身最关心哪几个指标? 中间管理层对下属的工作人员都考核哪些指标?哪几个指标与此分析主题有关? 针对这些指标,中间管理层目前采用何种获取方式? 针对这些指标,中间管理层目前都进行哪些分析,采用何种分析手段,采用何种分 析方法? 目前状况下,针对这些指标都有哪些展现方式? 中间管理层对数据仓库的期望是什么? 中间管理层希望决策分析系统能提供哪些分析功能? 中间管理层希望以何种方式来看这些指标? 中间管理层希望对这些指标进行哪些方面的比较?
Bill_data_oth
数据源分析
数据源范围 数据源格式 数据更新频率 数据量 数据质量
名称
用电类 电价表 行业 欠费信息表 客户信息 电量与电费表 地区(单位)
代码
AC_ELEC_CLASS AC_TARIFF AC_TRADE_TYPE CHG_RECEIVABLES EP_CUST_INFO EP_RESULT SU_AREA
数据中心(数据仓库)的 建设实施
深圳海联讯科技股份公司 张千福
一体化平台总体拓扑图
展 现 层 的 应 用 集 成
企
基本 应用 基础支 撑功能
业 门
户
扩展 应用 搜索
协同工作 对8大系统中 协同办公的 规范要求 Portlet框架
待办事宜 对应用集成 项目的规范 要求 虚拟门户
BI展现 对BI接入的 规范要求
从业务逻辑入手,分析各指标的组成关系;
多主题处理逻辑分析
综合考虑各分析主题间的逻辑关系;
逻辑分析
处理逻辑分析 支撑数据分析 业务元数据建立
单一主题支撑数据分析
单个主题分析所需要的原始支撑数据分析
多主题支撑数据分析
所有主题统一考虑做需要的支撑数据分析
逻辑分析
处理逻辑分析
支撑数据分析
业务元数据建立
内容4
…
需求分析
调研计划
实际调研
需求规格说明书
• 调研方式:
– 当面访谈; – 问卷调查; – 访谈及问卷提纲模板请参见附录2
需求分析
调研计划 实际调研 需求规格说明书 实例
• •
– – – – – – – – –
调研内容:针对不同层面的人员,调研内容不同 对企业领导层
领导层目前的工作重点有哪些和此主题相关,和哪几个指标相关? 领导层最关心哪几个指标? 针对这些指标,领导层目前采用何种获取方式? 针对这些指标,领导层目前都进行哪些分析,采用何种分析手段,采用何种分析方 法? 目前状况下,针对这些指标都有哪些展现方式? 领导层对数据仓库的期望是什么? 领导层希望决策分析系统能提供哪些分析功能? 领导层希望以何种方式来看这些指标? 领导层希望对这些指标进行哪些方面的比较?
单位代码
行业代码表 电压代码表 时段
Dept
Code_trade_new Codvolt Code_period
用户类别
用户使用电表 用电分类代码表 用电分类与用电性质关系表
Code_user_type
User_ammeter rep_salse_kind rep_salse_relation
其它电费数据
代码
AC_ELEC_CLASS AC_TARIFF AC_TRADE_TYPE CHG_RECEIVABLES EP_CUST_INFO EP_RESULT SU_AREA SU_DEPT AC_VOLT_GRADE
数据量
92 355 595 1309341 147692 2775326 15 102 6
Web内容管理
单点登录
个性化定制
多渠道接入
门户管理与维护
业务流程集成
数据中心
商务智能 数据仓库 企业资源 管理平台 全 局 数 据 字 典 公 共 信 息 模 型
身份认证登录
身份 管理 认证 代理
业务系统
人力资源 安全生产 物资管理 协同办公 业务数据集成 营销管理 财务管理
安 全 管 理
运 维 管 理
更新
维表(缓慢变化) 维表(缓慢变化) 维表(缓慢变化) 月 维表 月 维表(缓慢变化)
部门
电压
SU_DEPT
AC_VOLT_GRADE
维表(缓慢变化)
维表(缓慢变化)
数据源分析
数据源范围 数据源格式 数据更新频率 数据量 数据质量
名称
用电分类 电价表 行业 欠费信息表 客户信息 电量与电费表 地区(单位) 部门 电压
名称
用电分类 电价表 行业 欠费信息表 AC_ELEC_CLASS AC_TARIFF AC_TRADE_TYPE CHG_RECEIVABLES
代码
客户信息
电量与电费表 地区(单位) 部门 电压
EP_CUST_INFO
EP_RESULT SU_AREA SU_DEPT AC_VOLT_GRADE
数据源范围
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
数据源分析
数据源范围
数据源格式
数据更新频率
数据量
数据质量
数据源范围
包括数据源逻辑范围和物理范围
数据源格式
理解各数据源的格式,确定统一的格式,制定相应的转换规则
数据源范围
数据源分析
数据源格式
数据更新频率
数据量
数据质量
ORACLE数据源
调研计划
需求分析
实际调研
需求规格说明书
•
调研内容:针对不同层面的人员,调研内容不同
•
– – – – –
对IT人员
此主题所需要的数据源都取自哪些业务系统? 与本主题有关的现有的业务系统的数据结构怎样? 与本主题有关的现有的业务系统的数据更新频率如何? IT人员对数据仓库的期望是什么? IT人员在平时的工作中最关心的哪些指标?
V_2
地 市
部署在地市的 业务系统数据
特色业务应用数据
数据 缓冲区
综合数据库
数据中心建设过程
数据展现 性能调优 元 数 据
系 统 建 设 过 程 应用设计 ODS建模 数据仓库建模 数据的获取与整合 源数据分析
管
理
逻辑分析
需求分析
迭代式开发
逻辑分析
ODS 建模
需求分析 数据仓库 建模
应用设计 数据获取 与整合
业务元数据包括以下信息:
使用者的业务术语所表达的数据模型、对象名和属性名; 访问数据的原则和数据来源; 系统所提供的分析方法及公式、报表信息。
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
ODS建模
需求分析
调研计划 实际调研 需求规格说明书
•
–
需求规格说明书
需求规格说明书模板详见附录4
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
逻辑分析
处理逻辑分析 支撑数据分析 业务元数据建立
单一主题处理逻辑分析
SYBASE数据源
名称 数据源分析
数据源格式
数据更新频率
数据量
数据质量
代码
User_inf User_cost bill_data
用户基本信息 按户电费数据 电费数据
用电性质代码表
用电类别 电价表 计费日期对应电价日期
Code_e_kind
Code_usage_date Price cal_price_date
– – – – –
需求分析
调研计划 实际调研 需求规格说明书
• •
– – – – – – –
调研内容:针对不同层面的人员,调研内容不同 对业务人员
平时工作中最关心的是哪些指标?有哪几个指标与此分析主题有关? 平时直属领导通常询问哪些指标?在这些指标中哪几个和此分析主题有关? 业务人员目前的工作重点有哪些和此主题相关,和哪几个指标相关? 业务人员对数据仓库的期望是什么? 业务人员希望系统能提供哪些分析功能? 业务人员希望以何种方式来看这些指标? 业务人员希望对这些指标进行哪些方面的比较?
数据集市
安全生产数据集市 财务与绩效集市 人力资源集市
省 电 力 数 据 中 心
部署在省的 八大业务系 统数据
EAI
数据仓库
O_5
O_4
营销集市 数据挖掘集市
O_2
部署在地市,通过数据 复制到网省数据中心 的业务系统数据
缓冲区
其它集市
对下接口区 影像/文档型数据 元数据 网省下传数据
V_1
数据交换平台 或 ETL 或 数据复制
狭义数据中心:
狭义的数据中心是指数据仓库和建立在数据仓库之上的决策分析应用, 具体包括:数据源,数据的ETL,ODS数据库,数据仓库,数据集市,商 务智能应用和元数据管理等。
在此作业指导书中,除非特别说明数据中心都是指侠义的数据中心, 即数据仓库及建立在数据仓库之上的商务智能和决策分析应用。
作业指导书概述
数据源 分析
国网典设建议的甲方项目组织
网省项目组 PM 项目经理 助理
业务 负责人
业务系统 负责人
数据中心 实施负责人
各业务部门 代表
各业务系统 开发商代表
软/硬件平台 提供商PIM
集成商 PIM
海联讯的项目组织
项目经理
QAL/CML
需求定义
设计
开发
测试
部署实施
需求采集
需求分析
数据获取 开发
应用功能 开发
整体架构图
总 部 数 据 中 心
O_7
部属在总部 的业务系统 数据
ODS 统一视 图区 O_8 O_9
数据仓库 数据集市 O_10
EAI
O_6
缓冲区
对下接口区 数据交换平台 总部下传数据 网省上传数据 对上接口区 V_3
ODS O_1 统一视 图区 O_3
O_x:数据横向移动 V_x:数据纵向移动
ETL2
人员 目录 认证 目录 项目管理 综合管理 操作型数据 存储(ODS) ETL1
数
据 交 换
网省公司
网省公司
基本概念
广义数据中心:
数据中心是提供所有应用系统的运营场所。 数据中心也是容纳用以支持应用系统运行的基础设施(包括服务器、网 络、存储设备)的物理地点。 数据中心本身的ODS、数据仓库及建立在其上的决策分析应用。 数据中心需要有一套成熟的运行、维护体系支持其日常运行,保证应用 系统高效地不间断运行,数据被正确的访问
逻辑模型 物理模型 验证实例
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
数据展现 性能调优
元 数 据
系 统 建 设 过 程
应用设计
ODS建模
数据的获取与整合
管
理
数据仓库建模
逻辑分析
源数据分析
需求分析
数据仓库建模
逻辑模型 物理模型 验证实例
ODS逻辑模型
逻辑结构:完成实体的定义,各实体间的关系等 存储周期(立即删除、过一段时间删除或者是备份到其它介质上) 存储粒度(与源系统基本保持一致)
ODS物理模型
数据的存储结构 索引策略 数据存放位置(硬盘或磁带等) 存储分配 分区设计
ODS建模
逻辑模型 物理模型 验证实例
数据仓库逻辑模型
Hale Waihona Puke Baidu
划分粒度层次 确定数据分割策略 确定存储周期 定义关系模式
数据仓库物理模型
数据的存储结构 索引策略 数据存放位置(硬盘或磁带等) 存储分配 分区设计
数据仓库建模
逻辑模型 物理模型 验证实例
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
架构设计
数据建模
数据质量 分析
物理数据 设计
数据获取 设计
应用功能 设计
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
需求分析
调研内容
内容1
调研计划
实际调研
需求规格说明书
调研对象
调研时间
调研地点
内容2
内容3
数据仓库概念:
数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数 据集合,用于支持管理决策。 数据仓库可以帮助用户更好地理解信息,从新的角度看待这些信息,以 便获得更好的洞察力,看到模式和趋势,并更好地进行商业决策。数据 仓库为整个企业的需要服务。 数据仓库需要访问不同的数据源,需要存储海量的数据,需要对企业数 据进行分析,并用适当的方式展现给出来。数据仓库的建设不仅涉及到 许多先进的技术,更涉及到企业所有的业务知识,所以说数据仓库不是 一个产品,而是一个具体的解决方案。
数据源分析
数据源范围 数据源格式 数据更新频率 数据量 数据质量
Data Profiling 数据特性
Custom Profiling 客户化数据特性
需求分析
•
调研计划
实际调研
需求规格说明书
调研内容:针对不同层面的人员,调研内容不同
•
– – – – – – –
对中间管理层
中间管理层通常需要上报哪些指标?和此分析主题相关的有哪些指标? 平时领导层通常询问哪些指标?在这些指标中哪几个和此分析主题有关? 中间管理层目前的工作重点有哪些和此主题相关,和哪几个指标相关? 中间管理层本身最关心哪几个指标? 中间管理层对下属的工作人员都考核哪些指标?哪几个指标与此分析主题有关? 针对这些指标,中间管理层目前采用何种获取方式? 针对这些指标,中间管理层目前都进行哪些分析,采用何种分析手段,采用何种分 析方法? 目前状况下,针对这些指标都有哪些展现方式? 中间管理层对数据仓库的期望是什么? 中间管理层希望决策分析系统能提供哪些分析功能? 中间管理层希望以何种方式来看这些指标? 中间管理层希望对这些指标进行哪些方面的比较?
Bill_data_oth
数据源分析
数据源范围 数据源格式 数据更新频率 数据量 数据质量
名称
用电类 电价表 行业 欠费信息表 客户信息 电量与电费表 地区(单位)
代码
AC_ELEC_CLASS AC_TARIFF AC_TRADE_TYPE CHG_RECEIVABLES EP_CUST_INFO EP_RESULT SU_AREA
数据中心(数据仓库)的 建设实施
深圳海联讯科技股份公司 张千福
一体化平台总体拓扑图
展 现 层 的 应 用 集 成
企
基本 应用 基础支 撑功能
业 门
户
扩展 应用 搜索
协同工作 对8大系统中 协同办公的 规范要求 Portlet框架
待办事宜 对应用集成 项目的规范 要求 虚拟门户
BI展现 对BI接入的 规范要求
从业务逻辑入手,分析各指标的组成关系;
多主题处理逻辑分析
综合考虑各分析主题间的逻辑关系;
逻辑分析
处理逻辑分析 支撑数据分析 业务元数据建立
单一主题支撑数据分析
单个主题分析所需要的原始支撑数据分析
多主题支撑数据分析
所有主题统一考虑做需要的支撑数据分析
逻辑分析
处理逻辑分析
支撑数据分析
业务元数据建立
内容4
…
需求分析
调研计划
实际调研
需求规格说明书
• 调研方式:
– 当面访谈; – 问卷调查; – 访谈及问卷提纲模板请参见附录2
需求分析
调研计划 实际调研 需求规格说明书 实例
• •
– – – – – – – – –
调研内容:针对不同层面的人员,调研内容不同 对企业领导层
领导层目前的工作重点有哪些和此主题相关,和哪几个指标相关? 领导层最关心哪几个指标? 针对这些指标,领导层目前采用何种获取方式? 针对这些指标,领导层目前都进行哪些分析,采用何种分析手段,采用何种分析方 法? 目前状况下,针对这些指标都有哪些展现方式? 领导层对数据仓库的期望是什么? 领导层希望决策分析系统能提供哪些分析功能? 领导层希望以何种方式来看这些指标? 领导层希望对这些指标进行哪些方面的比较?
单位代码
行业代码表 电压代码表 时段
Dept
Code_trade_new Codvolt Code_period
用户类别
用户使用电表 用电分类代码表 用电分类与用电性质关系表
Code_user_type
User_ammeter rep_salse_kind rep_salse_relation
其它电费数据
代码
AC_ELEC_CLASS AC_TARIFF AC_TRADE_TYPE CHG_RECEIVABLES EP_CUST_INFO EP_RESULT SU_AREA SU_DEPT AC_VOLT_GRADE
数据量
92 355 595 1309341 147692 2775326 15 102 6
Web内容管理
单点登录
个性化定制
多渠道接入
门户管理与维护
业务流程集成
数据中心
商务智能 数据仓库 企业资源 管理平台 全 局 数 据 字 典 公 共 信 息 模 型
身份认证登录
身份 管理 认证 代理
业务系统
人力资源 安全生产 物资管理 协同办公 业务数据集成 营销管理 财务管理
安 全 管 理
运 维 管 理
更新
维表(缓慢变化) 维表(缓慢变化) 维表(缓慢变化) 月 维表 月 维表(缓慢变化)
部门
电压
SU_DEPT
AC_VOLT_GRADE
维表(缓慢变化)
维表(缓慢变化)
数据源分析
数据源范围 数据源格式 数据更新频率 数据量 数据质量
名称
用电分类 电价表 行业 欠费信息表 客户信息 电量与电费表 地区(单位) 部门 电压
名称
用电分类 电价表 行业 欠费信息表 AC_ELEC_CLASS AC_TARIFF AC_TRADE_TYPE CHG_RECEIVABLES
代码
客户信息
电量与电费表 地区(单位) 部门 电压
EP_CUST_INFO
EP_RESULT SU_AREA SU_DEPT AC_VOLT_GRADE
数据源范围
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
数据源分析
数据源范围
数据源格式
数据更新频率
数据量
数据质量
数据源范围
包括数据源逻辑范围和物理范围
数据源格式
理解各数据源的格式,确定统一的格式,制定相应的转换规则
数据源范围
数据源分析
数据源格式
数据更新频率
数据量
数据质量
ORACLE数据源
调研计划
需求分析
实际调研
需求规格说明书
•
调研内容:针对不同层面的人员,调研内容不同
•
– – – – –
对IT人员
此主题所需要的数据源都取自哪些业务系统? 与本主题有关的现有的业务系统的数据结构怎样? 与本主题有关的现有的业务系统的数据更新频率如何? IT人员对数据仓库的期望是什么? IT人员在平时的工作中最关心的哪些指标?
V_2
地 市
部署在地市的 业务系统数据
特色业务应用数据
数据 缓冲区
综合数据库
数据中心建设过程
数据展现 性能调优 元 数 据
系 统 建 设 过 程 应用设计 ODS建模 数据仓库建模 数据的获取与整合 源数据分析
管
理
逻辑分析
需求分析
迭代式开发
逻辑分析
ODS 建模
需求分析 数据仓库 建模
应用设计 数据获取 与整合
业务元数据包括以下信息:
使用者的业务术语所表达的数据模型、对象名和属性名; 访问数据的原则和数据来源; 系统所提供的分析方法及公式、报表信息。
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
ODS建模
需求分析
调研计划 实际调研 需求规格说明书
•
–
需求规格说明书
需求规格说明书模板详见附录4
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
逻辑分析
处理逻辑分析 支撑数据分析 业务元数据建立
单一主题处理逻辑分析
SYBASE数据源
名称 数据源分析
数据源格式
数据更新频率
数据量
数据质量
代码
User_inf User_cost bill_data
用户基本信息 按户电费数据 电费数据
用电性质代码表
用电类别 电价表 计费日期对应电价日期
Code_e_kind
Code_usage_date Price cal_price_date
– – – – –
需求分析
调研计划 实际调研 需求规格说明书
• •
– – – – – – –
调研内容:针对不同层面的人员,调研内容不同 对业务人员
平时工作中最关心的是哪些指标?有哪几个指标与此分析主题有关? 平时直属领导通常询问哪些指标?在这些指标中哪几个和此分析主题有关? 业务人员目前的工作重点有哪些和此主题相关,和哪几个指标相关? 业务人员对数据仓库的期望是什么? 业务人员希望系统能提供哪些分析功能? 业务人员希望以何种方式来看这些指标? 业务人员希望对这些指标进行哪些方面的比较?
数据集市
安全生产数据集市 财务与绩效集市 人力资源集市
省 电 力 数 据 中 心
部署在省的 八大业务系 统数据
EAI
数据仓库
O_5
O_4
营销集市 数据挖掘集市
O_2
部署在地市,通过数据 复制到网省数据中心 的业务系统数据
缓冲区
其它集市
对下接口区 影像/文档型数据 元数据 网省下传数据
V_1
数据交换平台 或 ETL 或 数据复制
狭义数据中心:
狭义的数据中心是指数据仓库和建立在数据仓库之上的决策分析应用, 具体包括:数据源,数据的ETL,ODS数据库,数据仓库,数据集市,商 务智能应用和元数据管理等。
在此作业指导书中,除非特别说明数据中心都是指侠义的数据中心, 即数据仓库及建立在数据仓库之上的商务智能和决策分析应用。
作业指导书概述
数据源 分析
国网典设建议的甲方项目组织
网省项目组 PM 项目经理 助理
业务 负责人
业务系统 负责人
数据中心 实施负责人
各业务部门 代表
各业务系统 开发商代表
软/硬件平台 提供商PIM
集成商 PIM
海联讯的项目组织
项目经理
QAL/CML
需求定义
设计
开发
测试
部署实施
需求采集
需求分析
数据获取 开发
应用功能 开发
整体架构图
总 部 数 据 中 心
O_7
部属在总部 的业务系统 数据
ODS 统一视 图区 O_8 O_9
数据仓库 数据集市 O_10
EAI
O_6
缓冲区
对下接口区 数据交换平台 总部下传数据 网省上传数据 对上接口区 V_3
ODS O_1 统一视 图区 O_3
O_x:数据横向移动 V_x:数据纵向移动
ETL2
人员 目录 认证 目录 项目管理 综合管理 操作型数据 存储(ODS) ETL1
数
据 交 换
网省公司
网省公司
基本概念
广义数据中心:
数据中心是提供所有应用系统的运营场所。 数据中心也是容纳用以支持应用系统运行的基础设施(包括服务器、网 络、存储设备)的物理地点。 数据中心本身的ODS、数据仓库及建立在其上的决策分析应用。 数据中心需要有一套成熟的运行、维护体系支持其日常运行,保证应用 系统高效地不间断运行,数据被正确的访问
逻辑模型 物理模型 验证实例
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
数据展现 性能调优
元 数 据
系 统 建 设 过 程
应用设计
ODS建模
数据的获取与整合
管
理
数据仓库建模
逻辑分析
源数据分析
需求分析
数据仓库建模
逻辑模型 物理模型 验证实例
ODS逻辑模型
逻辑结构:完成实体的定义,各实体间的关系等 存储周期(立即删除、过一段时间删除或者是备份到其它介质上) 存储粒度(与源系统基本保持一致)
ODS物理模型
数据的存储结构 索引策略 数据存放位置(硬盘或磁带等) 存储分配 分区设计
ODS建模
逻辑模型 物理模型 验证实例
数据仓库逻辑模型
Hale Waihona Puke Baidu
划分粒度层次 确定数据分割策略 确定存储周期 定义关系模式
数据仓库物理模型
数据的存储结构 索引策略 数据存放位置(硬盘或磁带等) 存储分配 分区设计
数据仓库建模
逻辑模型 物理模型 验证实例
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
架构设计
数据建模
数据质量 分析
物理数据 设计
数据获取 设计
应用功能 设计
实施过程
1
需求分析 逻辑分析 ODS建模 数据仓库建模 数据源分析
6
数据获取与整合 应用分析 性能调优 数据展现
2
7
3
8
4
9
5
10
元数据管理
需求分析
调研内容
内容1
调研计划
实际调研
需求规格说明书
调研对象
调研时间
调研地点
内容2
内容3