范式建模维度建模比较

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
报表,物理设计命名、调度任务、文档方面的规范
1.9编写详细设计映射文档
详细设计文档包括从源系统到维度模型的每个数据层的物理映射文档。
1.1.6审查和验证模型
详细设计文档出来后,要和业务用户和团队成员进行评审,记录下来评
审过程中的问题,形成问题清单。
.完成设计文档
最后确定设计文档,进行下一步的ETL开发。
参考资料数据仓库工具箱:维度建模的完全指南(第二版)》
三、优缺点比较
范式建模优点
范式建模缺点
从关系型数了业务系统的数据模型,能够比较之上,在某些时候反而限制了整个
方便的实现数据仓库的建模数据仓库模型的灵活性,性能等,
特别是考虑到数据仓库的底层数据
向数据集市的数据进行汇总时,需
1.1.2第二范式(2NF):唯一性一个表只说明一个事物;
1.1.3第三范式(3NF):每列都与主键有直接关系,不存在传递依赖;
1.2特点:
同一份数据只存放在一个地方,因此只能从一个地方获取,没有数
据冗余,保证了数据一致性;
解耦(系统级与业务级),方便维护;
设计思路自上而下,适合上游基础数据存储,同一份数据只存储一
进行维度建模的关系结构:
维度C维度B
FKFK
维度DFKFK维度A
事实表
FKFK
维度E⋯⋯.
可以看出,星形模式的维度建模由一个事实表和一组维表成,且具有以下特点:
a.维表只和事实表关联,维表之间没有关联;
b.每个维表的主码为单列,且该主码放置在事实表中,作为两边连
接的外码;
c.以事实表为核心,维表围绕核心呈星形分布;
2.1特点:
模型结构简单,星型模型为主
开发周期短,能够快速迭代
维护成本较高
维度建模是面向分析,为了提高查询性能可以增加数据冗余,反规范化的设计技

设计思路是自下而上,适合下游应用数据存储,适合统计多层次维度的汇总,开
发周期短,缺点是维护成本高
1.3维度建模的常见模式
1.1.4星形模式
星形模式(Star Schema)是最常用的维度建模方式,下图展示了使用星形模式
1.5维度建模设计流程图
1.6高层模型设计
日期
订单杂项订单产品
客户
1.7识别维度和度量
有了高层模型,就要设计维度和度量,维度和度量清单不仅仅是业务用户所关心,
还要从业务过程出发,自上而下的设计所涉及的维度和度量。防止业务用户的需
求变化带来的冲击。
1.8确定命名规范
在详细设计之前,为DW/BI系统制定规范,主要包含源系统、主题、业务术语、
度的定义时,往往需要重新进行维
度数据的预处理。而在这些与处理
过程中,往往会导致大量的数据冗
余。
模型结构简单,星型模型为主缺点是维护成本高
要进行一定的变通才能满足相应的
需求
没有数据冗余,保证了数据一致性,缺点是开发周期一般比较长
方便维护,方便解耦
维度建模优点维度建模缺点
维度建模非常直观,紧紧围绕着业需要进行大量的数据预处理,因此
务模型,可以直观的反映出业务模会导致大量的数据处理工作
型中的业务问题
开发周期短,能够快速迭代当业务发生变化,需要重新进行维
当于将星形模式的大维表拆分成小维表,满足了规范化设计。然而这种模式在实
际应用中很少见,因为这样做会导致开发难度增大,而数据冗余问题在数据仓库
里并不严重。
1.4维度建模的设计方法
根据根据业务确定事实表粒有了业务过程
选择适用于业
过程的优先级度,最好是原子和粒度,就要选
务过程的事实。
选定业务过程。级粒度。择相关的维度。
份,没有数据冗余,方便解耦,易维护,缺点是开发周期一般比较
长,维护成本高;
二、维度建模
维度建模是一种将数据结构化的逻辑设计方法,它将客观世界划分为度量
和上下文。度量是常常是以数值形式出现,事实周围有上下文包围着,这种上下
文被直观地分成独立的逻辑块,称之为维度。维度建模是面向分析,为了提高查
询性能可以增加数据冗余,反规范化的设计技术。
1.1.5雪花模式
雪花模式(Snowflake Schema)是对星形模式的扩展,每个维表可继续向外连接
多个子维表。下图为使用雪花模式进行维度建模的关系结构:
维度表B1 FK
维度表C维度表B
FK
FKFK
维度表B2
维度表DFK维度表A
FK事实表
维度表A1
FKFK
维度表E⋯⋯.
星形模式中的维表相对雪花模式来说要大,而且不满足规范化设计。雪花模型相
范式建模维度建模
一、范式建模
这样的设计方式是在关系型数据库中常用的,Inmon的范式建模法的最大
优点就是从关系型数据库的角度出发,结合了业务系统的数据模型,能够比
较方便的实现数据仓库的建模。
1.1范式化模型设计需满足下面三大范式:
1.1.1第一范式(1NF):原子性字段不可再分,否则就不是关系数据
库;
相关文档
最新文档