维度建模与关系建模的比较
常用的数据建模方法
常用的数据建模方法在数据分析和数据科学领域,数据建模是一项核心任务,它涉及将现实世界中的业务过程和数据转化为适合分析和处理的结构化形式。
常用的数据建模方法可以根据不同的需求和问题进行选择,下面介绍几种常见的数据建模方法。
1. 关系数据模型:关系数据模型是一种常用的数据建模方法,它使用关系型数据库来组织和管理数据。
关系数据模型使用表格的形式来表示实体和实体之间的关系,并使用主键和外键来建立表之间的联系。
这种模型适用于需要进行复杂查询和关联操作的场景,如企业管理系统和金融交易系统。
2. 维度建模:维度建模是一种基于维度和事实的数据建模方法。
在维度建模中,数据被组织成事实表和维度表的形式。
事实表包含了业务过程中的度量指标,而维度表则包含了描述度量指标的上下文信息。
维度建模适用于分析型应用场景,如数据仓库和商业智能系统。
3. 实体关系模型:实体关系模型是一种用于建模现实世界中实体和实体之间关系的方法。
在实体关系模型中,实体用实体类型来表示,而关系用关系类型来表示。
实体关系模型适用于需要建立实体和实体之间关系的应用场景,如社交网络和知识图谱。
4. 层次数据模型:层次数据模型是一种用于表示具有层次结构关系的数据的方法。
在层次数据模型中,数据被组织成树形结构,其中每个节点都有一个父节点和零个或多个子节点。
层次数据模型适用于需要表示层次结构的数据,如组织结构和产品分类。
5. 对象关系模型:对象关系模型是一种将面向对象和关系型数据模型相结合的方法。
在对象关系模型中,数据被视为对象的集合,每个对象具有属性和方法,并且可以通过对象之间的关系进行连接和操作。
对象关系模型适用于需要同时处理结构化和半结构化数据的应用场景,如XML数据处理和文档管理系统。
除了上述常用的数据建模方法,根据不同的需求和问题,还可以使用其他的数据建模方法,如网络数据模型、面向文档模型等。
选择合适的数据建模方法可以帮助我们更好地理解和分析数据,从而得出有价值的洞察和决策。
维度模型入门知识点总结
维度模型入门知识点总结一、基本概念1. 数据仓库数据仓库是用于存储和管理企业中各类数据的系统,它具有集成、主题、时间变化、非易失性等特点,可用于辅助企业决策、分析和报告等需求。
2. 维度模型维度模型是数据仓库中最常见的数据建模方法之一,它将业务中的数据按照主题进行划分,并以星型或雪花型的结构进行建模,通过维度模型可以更好地支持数据分析和报告需求。
3. 星型模式星型模式是维度模型中的一种建模方法,它以一个事实表为中心,周围是多个维度表,通过关联键将多个维度表和事实表连接在一起,形成星型的结构。
4. 雪花型模式雪花型模式是维度模型中的另一种建模方法,它在星型模式的基础上,将一些维度表中的属性进一步分解为子维度表,形成类似雪花的结构。
二、重要组成部分1. 事实表事实表是维度模型的核心部分,它包含一组数值型的度量,并与多个维度表进行关联,用于记录业务中的事实数据。
2. 维度表维度表描述了事实表中度量所需要的所有维度信息,例如产品、时间、地点等,维度表中的每一行都代表一个唯一的维度值。
3. 关联键关联键是用来连接事实表和维度表之间的关键字段,通过关联键可以建立事实表和维度表之间的关联关系。
4. 层次结构在维度模型中,一些维度表可能存在着层次结构,例如时间维度表中的年、季度、月等层次结构,这些层次结构可以帮助用户更方便地进行数据分析和报告。
5. 缓慢变化维度在实际业务中,一些维度表中的数据可能会发生变化,维度模型需要支持对这些维度数据的变化进行有效的管理,包括类型1、类型2和类型3等不同的变化处理方式。
三、建模技巧1. 选择合适的主题在进行维度模型建模时,需要选择合适的主题来进行划分,主题需要满足业务需求、易于理解和维护等条件。
2. 保持简单维度模型的建模应该尽量保持简单,避免过多的冗余和复杂的关联关系,以提高数据查询和报告的性能。
3. 选择适当的粒度在建模时,需根据业务需求选择适当的粒度,以确保事实表中的度量能够捕捉到业务中的所有重要信息。
数据库设计中的维度建模与关系模型
数据库设计中的维度建模与关系模型在数据库设计中,维度建模和关系模型是两种重要的方法。
它们分别在不同的场景下发挥着重要的作用。
本文将对这两种方法进行详细的介绍和比较分析。
1. 维度建模维度建模是一种面向主题的数据库设计方法,它的核心思想是将数据按照不同的主题进行分类,并建立一个具有层次结构的数据模型。
在维度建模中,通常采用星型模型(Star Schema)或雪花模型(Snowflake Schema)来表示数据之间的关系。
星型模型是维度建模中最简单的模型之一,它由一个事实表(Fact Table)和多个维度表(Dimension Table)组成。
事实表存储了与某个特定的业务主题相关的事实数据,而维度表用于描述事实表中的数据。
维度表是一个包含了该维度的所有属性(如地理位置、时间、产品等)的表格,而事实表中的数据与维度表中的数据通过外键关联起来。
雪花模型基于星型模型,通过进一步拆分维度表,将一些维度表的属性再次细分成更小的维度表。
这样可以使得数据模型更加灵活,但同时也增加了数据冗余的可能性。
维度建模的优点在于:a. 易于理解和使用。
维度建模采用简单的模型结构来表示数据之间的关系,使得用户可以快速理解数据模型并进行查询和分析。
b. 高效的查询性能。
维度建模中的星型模型适用于大多数查询场景,可以通过索引的方式快速检索数据。
2. 关系模型关系模型是一种广泛应用的数据模型,它用关系(表)来表示数据之间的关系,并利用关系之间的连接来实现数据查询和处理。
关系模型使用结构化查询语言(SQL)进行数据操作。
在关系模型中,数据被组织成多个表,每个表都有列(属性)和行(记录)。
表与表之间通过外键关系进行连接。
关系模型使用范式(Normalization)来规范化数据,以减少数据冗余和提高数据的一致性。
关系模型的优点在于:a. 灵活性和扩展性。
关系模型可以根据具体需求进行灵活的数据模型设计,支持数据结构的变化和扩展。
b. 数据完整性和一致性。
数仓学习-维度建模
数仓维度建模(如有侵权请联系删除)一、什么是维度建模按照事实表,维度表来构建数据仓库,数据集市。
将数据结构化的逻辑设计方法,它将客观世界划分为度量和上下文。
二、维度建模的优势和原则1、优势和缺点a) 维度建模是可预测的标准框架。
允许数据库系统和最终用户查询工具在数据方面生成强大的假设条件,这些数据主要在表现和性能方面起作用。
b) 星型连接模式的可预测框架能够忍受不可预知的用户行为变化。
c) 具有非常好的可扩展性,以便容纳不可预知的新数据源和新的设计决策。
可以很方便在不改变模型粒度情况下,增加新的分析维度和事实,不需要重载数据,也不需要为了适应新的改变而重新编码。
较好的扩展性意味着以前的所有应用都可以继续运行,并不会产生不同的结果。
但是,维度建模法的缺点也是非常明显的,由于在构建星型模式之前需要进行大量的数据预处理,因此会导致大量的数据处理工作。
而且,当业务发生变化,需要重新进行维度的定义时,往往需要重新进行维度数据的预处理。
而在这些与处理过程中,往往会导致大量的数据冗余。
另外一个维度建模法的缺点就是,如果只是依靠单纯的维度建模,不能保证数据来源的一致性和准确性,而且在数据仓库的底层,不是特别适用于维度建模的方法。
2、维度建模的原则原则1、载入详细的原子数据到维度结构中维度建模应该使用最基础的原子数据进行填充,以支持不可预知的来自用户查询的过滤和分组请求,用户通常不希望每次只看到一个单一的记录,但是你无法预测用户想要掩盖哪些数据,想要显示哪些数据,如果只有汇总数据,那么你已经设定了数据的使用模式,当用户想要深入挖掘数据时他们就会遇到障碍。
当然,原子数据也可以通过概要维度建模进行补充,但企业用户无法只在汇总数据上工作,他们需要原始数据回答不断变化的问题。
原则2、围绕业务流程构建维度模型业务流程是组织执行的活动,它们代表可测量的事件,如下一个订单或做一次结算,业务流程通常会捕获或生成唯一的与某个事件相关的性能指标,这些数据转换成事实后,每个业务流程都用一个原子事实表表示,除了单个流程事实表外,有时会从多个流程事实表合并成一个事实表,而且合并事实表是对单一流程事实表的一个很好的补充,并不能代替它们。
数据仓库建模方法总结
数据仓库建模方法总结数据仓库建模是数据仓库构建过程中的重要环节,它决定了数据仓库的数据结构和查询性能。
本文将总结几种常见的数据仓库建模方法,包括维度建模、事实建模和标准化建模,并比较它们的优缺点。
1. 维度建模维度建模是一种常见的数据仓库建模方法,它基于维度表和事实表的概念。
维度表包含描述业务过程的属性,如时间、地点、产品等,而事实表包含与业务过程相关的度量。
维度表和事实表通过共同的键连接起来,形成星型或雪花型的模型。
优点:1) 简单直观:维度建模易于理解和使用,可以快速设计和构建数据仓库。
2) 查询性能高:维度建模的星型结构简化了查询的关联操作,提高了查询性能。
缺点:1) 一对一关系:维度表和事实表之间是一对多的关系,无法处理多对多的关系。
2) 数据冗余:维度表中的属性可能存在冗余,造成数据冗余和一致性问题。
2. 事实建模事实建模是基于主题的数据仓库建模方法,它以业务过程为核心构建事实表,包括维度键和度量。
事实表记录了业务过程发生的事实信息,维度键用于连接事实表和维度表,度量用于度量业务过程的指标。
优点:1) 灵活性高:事实建模能够适应复杂的业务逻辑和多对多的关系。
2) 数据粒度控制:事实表可以根据需要控制数据的粒度,提供灵活的查询和分析能力。
缺点:1) 设计复杂:事实建模的设计复杂度较高,需要考虑多对多的关系和度量的粒度控制。
2) 查询性能相对低:事实建模需要进行多表关联操作,查询性能相对较低。
3. 标准化建模标准化建模是一种将数据仓库模型与关系数据库模型类似的建模方法。
它将数据存储在标准化的表中,通过复杂的关联操作来查询和分析数据。
标准化建模与维度建模和事实建模相比,更适用于小型数据仓库和查询较少的情况。
优点:1) 数据一致性:标准化建模减少了数据冗余,提高了数据一致性。
2) 灵活可扩展:标准化建模可以适应不同的查询需求,支持灵活的查询和分析。
缺点:1) 查询复杂:标准化建模需要进行多表关联和聚合操作,查询复杂度较高。
数据仓库中的维度建模与事实表设计
数据仓库中的维度建模与事实表设计数据仓库是一个集成的、主题导向的、时间可变的、非易失性的数据存储,用于支持管理决策。
在数据仓库中,维度建模和事实表设计是非常重要的,它们是数据仓库设计的核心。
维度建模是指将数据仓库中的数据组织成一个统一的、易于理解的维度模型,而事实表设计则是指如何将业务过程和指标以一种易于查询和分析的方式存储到数据库中。
在本文中,我们将探讨数据仓库中的维度建模与事实表设计的相关内容。
一、维度建模维度建模是数据仓库设计的核心,它是数据仓库中维度和事实之间的关系模型。
维度模型由事实表和维度表组成,它们之间存在着一对多的关系。
维度模型是一个简单直观的模型,它将业务过程和指标以一种易于理解的方式组织起来。
1.维度表在维度建模中,维度表是非常重要的,它是用来描述业务对象的表。
维度表通常包含了多个属性字段,每个属性字段描述了业务对象的一个特定属性。
比如,在销售数据中,维度表可能包含了产品、时间、地点等属性字段。
2.事实表事实表是数据仓库中存储业务过程和指标的表,它包含了一个或多个度量字段,度量字段是用来度量业务活动的指标。
事实表和维度表之间通过外键关联起来,事实表中的度量字段通常是和维度表的外键字段关联的。
3.星型模式维度模型通常被称为星型模式,因为它的结构呈现出星型的形状。
在星型模式中,中心的事实表被围绕着多个维度表组织起来,形成了一个星型的结构。
4.雪花模式除了星型模式之外,还有一个常见的维度模型是雪花模式。
在雪花模式中,维度表的层次结构被规范化成多个维度表,这样可以节省存储空间,但也会增加查询复杂度。
5.维度层次维度表中的属性字段通常是按照层次结构组织起来的,比如在时间维度中,可以有年、季度、月、日等层次。
在维度建模中,采用自然层次结构的维度表是非常重要的,它可以帮助用户更加方便地进行查询和分析。
维度建模是数据仓库设计的核心,它可以帮助用户更加方便地理解业务过程和指标。
通过合理的维度建模,可以提高数据仓库的查询性能,减少数据冗余,提高数据的一致性和可靠性。
数据仓库建模方法
数据仓库建模方法每个行业有自己的模型,但是不同行业的数据模型,在数据建模的方法上,却都有着共通的基本特点。
什么是数据模型数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射。
在这里,数据模型表现的抽象的是实体和实体之间的关系,通过对实体和实体之间关系的定义和描述,来表达实际的业务中具体的业务关系。
数据仓库模型是数据模型中针对特定的数据仓库应用系统的一种特定的数据模型,一般的来说,我们数据仓库模型分为几下几个层次。
图 2. 数据仓库模型通过上面的图形,我们能够很容易的看出在整个数据仓库得建模过程中,我们需要经历一般四个过程: ?业务建模,生成业务模型,主要解决业务层面的分解和程序化。
?领域建模,生成领域模型,主要是对业务模型进行抽象处理,生成领域概念模型。
?逻辑建模,生成逻辑模型,主要是将领域模型的概念实体以及实体之间的关系进行数据库层次的逻辑化。
?物理建模,生成物理模型,主要解决,逻辑模型针对不同关系型数据库的物理化以及性能等一些具体的技术问题。
因此,在整个数据仓库的模型的设计和架构中,既涉及到业务知识,也涉及到了具体的技术,我们既需要了解丰富的行业经验,同时,也需要一定的信息技术来帮助我们实现我们的数据模型,最重要的是,我们还需要一个非常适用的方法论,来指导我们自己针对我们的业务进行抽象,处理,生成各个阶段的模型。
为什么需要数据模型在数据仓库的建设中,我们一再强调需要数据模型,那么数据模型究竟为什么这么重要呢?首先我们需要了解整个数据仓库的建设的发展史。
数据仓库的发展大致经历了这样的三个过程:?简单报表阶段:这个阶段,系统的主要目标是解决一些日常的工作中业务人员需要的报表,?以及生成一些简单的能够帮助领导进行决策所需要的汇总数据。
这个阶段的大部分表现形式为数据库和前端报表工具。
?数据集市阶段:这个阶段,主要是根据某个业务部门的需要,进行一定的数据的采集,整理,按照业务人员的需要,进行多维报表的展现,能够提供对特定业务指导的数据,并且能够提供特定的领导决策数据。
维度论文
维度理解论文摘要:数据仓库技术的快速发展,使得从数据库中获取信息快速高效准确。
但涉及一个能够真正支持用户进行决策分析的数据仓库,并非是一件轻而易举的事情。
这需要经历一个从实现环境到抽象模型,从抽象模型到具体实现的过程。
要完成这一过程,必须依靠各种不同的数据模型。
本文主要将介绍维度的定义、维度建模、维度的类型引言传统的数据库技术是以单一的数据资源,即数据库为中心,进行从事务处理、批处理到决策分析等各种类型的数据处理工作。
近年来,计算机技术正向着两个不同的方向扩展:一是广度计算;二是深度计算。
特别是数据库处理可以大致地划分为两大类:操作型处理和分析型处理(或信息型处理)。
这种分离划清了数据处理的分析型环境与操作型环境之间的界限,由原来的以单一数据库为中心的数据环境发展为一种新的体系化环境,从而导致了数据仓库技术的出现和迅速发展。
1、维度建模维度建模是应用于数据仓库的一种逻辑设计方案,其基本思想是以某种数据立方体的形式表示大部分与业务有关的数据,各种测度值包含在这种数据立方体的各个单元格中,其中数据维度通过立方体的边定义和说明。
将其中的维度表和事实表这两个组块融合到一起,就构成了数据仓库的基本维度模型。
维度建模的优点如下:(1)维度模型是可预测的标准框架。
(2)用户行为不可预知的变化因星型模型的可预测标准框架而弱化。
(3)良好的扩展性,可将不可预测的新的设计决策以及数据源容纳进来。
(4)业务环境中常见的建模情况可以通过维度模型中诸多的标准方案处理。
(5)越来越多的管理实用程序及软件使维度模型可以用于诸多聚集的管理决策和使用过程。
2 维度建模中的三种模型❝星形模型(Star Schema)❝雪花模型(Snowflake Schema)❝多维模型(Multi-dimension Schema)3 一些影响维度建模的因素❝数据或展现的安全性❝复杂的查询和分析4 维度的类型❝缓慢变化维(Slowly Changing Dimension)❝快速变化维(Rapidly Changing Dimension)❝大维(Huge Dimension)和迷你维(Mini-Dimension)❝退化维(Degenerate Dimension)5维度建模的一般过程❝ 1 确定每个事实表的粒度❝ 2 确定维度的属性❝ 3 确定维度的层次❝ 4 确定每个事实所需要关联的维度❝ 5 确定事实,包括预先计算的❝ 6 确定缓慢变化维6维度建模的优缺点维度建模法的优点是,维度建模非常直观,紧紧围绕着业务模型,可以直观的反映出业务模型中的业务问题。
数据仓库的建模方法
数据仓库的建模方法
数据仓库的建模方法一般可以分为以下几种:
1. 维度建模:维度建模是一种基于维度模型的建模方法。
它以事实表和维度表为核心,通过定义维度和事实之间的关系来描述数据仓库中的数据。
维度建模的优点是简单直观,易于理解和使用,适合一些小到中等规模的数据仓库。
2. 基于实体关系模型的建模方法:这种建模方法将数据仓库建模看作是一个基于实体关系模型的数据库设计问题。
它使用实体、关系和属性等概念来描述数据仓库中的数据,通过规范化、反规范化等技术来优化数据模型。
这种建模方法适用于复杂的数据仓库,具有很强的灵活性和扩展性。
3. 模式化设计方法:模式化设计是一种基于模式的建模方法,它将数据仓库中的数据分为不同的模式或层次,每个模式或层次都有特定的功能和目的。
模式化设计方法可以使数据仓库更加灵活和可扩展,能够更好地满足用户的需求。
4. 主题建模:主题建模是将数据仓库建模看作是一种主题导向的建模方法。
它以业务主题为核心,将数据仓库中的数据组织成一系列的主题模型,每个主题模型都包含与该主题相关的事实和维度。
主题建模的优点是能够更好地满足用户的查询需求,提供更准确、可理解和可用的数据。
不同的建模方法适用于不同的情况和需求,选择合适的建模方法对于数据仓库的
成功实施和运营非常重要。
关系模型、维度模型
关系模型、维度模型关系模型与维度模型在数据建模领域,关系模型和维度模型是两种常用的数据模型。
它们分别适用于不同的数据分析和处理场景,能够帮助我们更好地理解和组织数据。
本文将分别介绍关系模型和维度模型的特点、使用场景以及优缺点。
一、关系模型关系模型是一种基于关系代数和关系演算理论的数据模型,以关系为核心,通过表格的形式来表示数据之间的联系。
关系模型中的数据被组织成一个或多个表,每个表由若干行(元组)和列(属性)组成,每一列代表一个属性,每一行代表一个记录。
关系模型的特点:1. 结构简单:关系模型使用表格来表示数据,形式简洁明了,易于理解和使用。
2. 数据一致性:关系模型中的数据遵循一定的完整性约束,保证数据的一致性和准确性。
3. 灵活性:关系模型支持对数据进行灵活的查询和操作,能够满足各种数据处理需求。
4. 可扩展性:关系模型可以通过增加新的表和关系来扩展数据模型,适应不断变化的数据需求。
关系模型适用于需要进行复杂数据处理和分析的场景,如企业的业务管理、金融分析、人力资源管理等。
通过使用关系模型,可以对数据进行灵活的查询、连接和聚合操作,提取出有价值的信息。
关系模型的缺点:1. 处理复杂查询性能较低:对于包含多表连接和复杂条件的查询,关系模型的性能可能会较低,需要进行优化。
2. 数据冗余:关系模型中存在数据冗余的问题,可能会导致数据更新困难和存储空间的浪费。
二、维度模型维度模型是一种以事实表和维度表为核心的数据模型,用于支持OLAP(联机分析处理)和数据仓库的构建。
维度模型中,事实表用于存储具体的业务指标数据,维度表用于存储与业务指标相关的描述性信息。
维度模型的特点:1. 简单直观:维度模型使用事实表和维度表的形式来表示数据,结构简单直观,易于理解和使用。
2. 高性能:维度模型的设计经过优化,可以支持快速的查询和分析操作,适用于大规模数据的处理。
3. 数据一致性:维度模型中的事实表和维度表之间通过关联关系进行连接,保证数据的一致性和准确性。
维度建模的四个阶段
维度建模的四个阶段维度建模是面向数据仓库的一种建模方法,包括四个阶段:需求分析、概念设计、逻辑设计和物理设计。
本文将逐一介绍这四个阶段的重点内容。
1. 需求分析阶段需求分析是维度建模的第一步,目的是梳理业务需求,识别数据仓库的用户和应用场景。
在此阶段,需要完成以下工作:(1) 确认业务需求在业务需求确定阶段,需求分析人员需要了解业务所涉及的各种因素,包括公司业务流程、客户类型、产品品类、销售渠道、地理位置等。
他们需要收集和整理所有业务问题,直到可以从这些问题中确定关键的业务维度。
(2) 确定数据仓库的目标用户数据仓库的目标用户包括各级管理人员,业务分析师和数据分析人员。
在需求分析阶段,需要明确数据仓库的计划,确定数据仓库的数据结构和查询方式,以及对数据的使用和应用提供支持的用户类型。
(3) 定义数据来源数据来源包括内部和外部数据源。
在需求分析阶段,需要确定这些数据源的可用性、数据质量和数据完整性,并确定数据的组织方式和格式。
2. 概念设计阶段概念设计是维度建模的第二步,目的是创建高层次、抽象的模型,以概括数据仓库所包含的信息。
在此阶段,需要完成以下工作:(1) 定义业务维度和度量业务维度是描述业务内容的主要因素。
业务维度通常包括时间、地理位置、产品、客户等。
度量是对业务维度进行计算和汇总的数值指标,如销售额、消耗量、交易次数等。
(2) 制定业务流程图业务流程图是一种业务结构图。
它通常描述了企业的业务流程,并展示了数据库的设计和继承审核路线。
业务流程图可以支持数据仓库的概念设计,为逻辑设计提供了基础。
(3) 定义数据仓库的结构定义数据仓库的结构可以为逻辑设计提供概念上的数据模型。
结构通常体现了数据的层次结构,包括多维数据、维度、指标、维度等。
3. 逻辑设计阶段逻辑设计是维度建模的第三步,目的是实现精度、准确和清晰的数据模型。
在此阶段,需要完成以下工作:(1) 设计数据模型在逻辑设计阶段,数据模型的设计人员将根据概念模型和需求分析的结果开发数据模型。
商务智能题库整理
商务智能--复习提纲一.选择题(第一次作业)1.数据仓库是随着时间变化的,下面的描述不正确的是AA.数据仓库随时间变化不断删去旧的数据内容B.捕捉到的新数据会覆盖原来的数据C.数据仓库随时间的变化不断增加新的数据内容D.数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合2. OLAP在辅助决策时,基于用户建立的一系列假设驱动,通过OLAP来证实或者推翻这些假设是个()的过程CA集成B转换C演绎D归纳3.不同操作型系统之间的数据一般是相互独立、异构的。
而数据仓库中的数据是对分散的数据进行抽取、清理、转换和汇总后得到的,这样就保证了数据仓库的数据关于整个企业的()DA时变性B非易失性C差异性D一致性4.如下图所示操作是OLAP分析的哪种操作( D )A切片B旋转C下钻D上钻5.数据立方体中的数据单元格是一个数值函数,该函数可以对数据立方体求值,如下哪个函数可以用来对数据立方体进行度量()CA.substring()B.rand()C.sum()D.trunc()6.关于数据仓库数据的时变性,如下描述不正确的是DA操作型系统存储的是当前数据,而数据仓库中的数据是历史数据B数据仓库中的数据是按照时间顺序追加的,它们都带有时间属性C数据仓库的数据时限一般要远远长于操作型数据的数据时限D数据仓库对响应时间要求不严格,处理时间从几秒到几分钟,有时甚至几小时7.数据仓库是面向主题的,逻辑意义上每一个商业主题都对应与企业决策包含的分析对象,一家保险公司的数据仓库的主题可能包含哪些BA顾客储蓄账B顾客、账户、索赔C顾客保险金额D顾客账单8.假如警察要得到某犯罪嫌疑人在指定时间段的通话记录最有可能在( C )系统中获得A决策支持系统B电信营业账务系统C电信数据仓库系统D元数据管理系统9.下面关于数据粒度的描述不正确的是BA数据综合度越高,粒度也就越大,级别也就越高B数据越详细,粒度就越小,级别也就越高C粒度是指数据仓库小数据单元的详细程度和级别D粒度的具体划分将直接影响数据仓库中的数据量以及查询质量10.数据仓库并非只是数据的简单累积,而是要经过一系列的处理过程,即ETL,ETL过程包括哪些CA数据操作、数据挖掘、数据转义B数据存储、数据维护、数据分析C数据抽取、数据转换、数据装载D数据定义、数据建模、数据管理11.企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的AA尽可能多的适合的数据B得分集数据是建模集数据的一部分C数据越多越好D以上三条都正确12.关于基本数据的元数据是指DA基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息B基本元数据包括日志文件和简历执行处理的时序调度信息C基本元数据包括与企业相关的管理方面的数据和信息D基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息13.数据立方体中的数据单元格中的数据可以通过如下哪些函数获得?AA分布聚集函数count()、sum()、min()、max()和代数聚集函数avg()、stddev()B分析函数C分布聚集函数count()、sum()、min()、max()D聚集函数avg()、stddev()14.关于OLAP和OLTP的说法,下列不正确的是BA.OLTP以应用为核心,是应用驱动的B.OLAP事务量大,但事务内容比较简单且重复率高C.OLAP的最终数据来源与OLTP不一样D.OLTP面对的是决策人员和高层管理人员15.数据挖掘是通过()的方式在海量数据中主动找寻模型,自动发掘隐藏在数据中的价值信息,OLAP分析结果为挖掘提供分析依据。
维度建模和关系建模
维度建模和关系建模
维度建模和关系建模都是数据建模的重要方法。
维度建模强调的是面向业务的数据建模方法,它将数据按照业务事实进行分类,建立一系列维度和度量。
维度建模的核心是星型模型和雪花模型,这两种模型能够有效地处理大量数据,而且易于理解和查询。
关系建模则是基于关系数据库的数据建模方法,它是以关系为中心的数据建模方法。
关系建模通过定义实体和实体之间的关系来描述数据,建立一系列关系表。
关系建模的核心是ER图,ER图通过实体、属性和关系的定义来描述数据。
关系建模适合处理大量复杂的数据,但是其数据模型比较抽象,稍微复杂一些的查询可能需要使用较为复杂的SQL语句。
两种建模方法各有优缺点,根据业务需求和数据特点选择合适的建模方法是非常重要的。
在实际应用中,维度建模和关系建模也可以结合使用,有时候一个问题需要维度建模来解决,而另一个问题则需要关系建模来解决。
维度建模和关系建模都是数据建模中不可或缺的方法,它们为数据分析和决策提供了有力的支持。
- 1 -。
数据仓库建模方法
数据仓库建模方法数据仓库建模方法是为了满足企业对大量数据的分析和决策需求而设计的一种数据架构。
数据仓库建模方法包括了维度建模和实体关系建模两种主要方法。
本文将详细介绍这两种建模方法的特点和优势。
维度建模是一种面向主题的建模方法,它将业务问题划分为不同的主题,并通过维度表和事实表来描述和表达这些主题。
维度表是描述业务过程的属性,例如时间、地点、产品等,而事实表则是记录与这些维度相关的数值型数据。
维度建模的主要特点是简单、直观且易于理解,能够提供非常灵活和高效的数据分析能力。
此外,维度建模还可实现多维数据分析,应对复杂和多级层次的业务需求。
在维度建模中,事实表和维度表之间通过主键、外键和关联关系进行连接。
维度表用于描述和分析事实表中的数据,维度表之间可以形成维度层次结构。
通过层次结构,用户可以从高层次的概念逐渐细化到低层次的细节,以满足不同的数据分析需求。
同时,维度建模还支持多维分析的功能,用户可以根据不同的维度来进行数据切片、钻取、旋转和透视等操作,以发现数据之间的关联和趋势。
相比之下,实体关系建模是一种面向过程的建模方法,它采用实体和关系来描述和表达业务过程。
实体关系建模将业务过程划分为不同的实体和关系,通过实体之间的关系来描述业务过程的逻辑顺序和依赖关系。
实体关系建模的主要特点是严谨、规范和结构化,能够满足复杂和具体的业务需求。
该方法适用于业务过程较为复杂、涉及多个环节和多个实体的场景。
在实体关系建模中,实体表示业务过程中的具体对象,实体之间通过关系描述它们之间的联系。
关系包括一对一、一对多和多对多三种类型。
通过实体和关系的组合,可以构建一个完整的数据模型,从而在数据仓库中实现具体的业务过程。
实体关系建模相对于维度建模更加直接和具体,用户可以根据实体和关系进行数据分析和决策。
虽然维度建模和实体关系建模有不同的特点和优势,但在实际应用中,两种方法常常结合使用。
在数据仓库中,可以采用维度建模来描述和分析主题和维度之间的关系,同时使用实体关系建模来描述和规划业务过程之间的关系。
关系建模维度建模
关系建模维度建模
嘿,朋友!咱今天来聊聊关系建模和维度建模这俩货。
你说啥是关系建模?这就好比是给你的宝贝物件儿整了个条理清晰
的柜子。
每样东西都有它特定的位置,相互之间的联系明明白白。
就
像一个大公司,各个部门分工明确,谁跟谁汇报,清清楚楚,一点不
乱套。
维度建模呢?它就像是给你建了个超级市场!不同的货架上摆着各
种各样的东西,你想找啥,顺着货架一路看过去,轻松就能找到。
比
如说你要买水果,直奔水果区就行。
那关系建模有啥特点?它对数据的一致性和完整性要求那叫一个高!就跟你考试的时候,每道题都得答得严丝合缝,少一点都不行。
而且
数据之间的关联那是错综复杂,像个蜘蛛网,一不小心就容易绕晕喽。
维度建模呢?它可注重快速获取数据和分析了!就好比你饿了想赶
紧找点吃的,打开冰箱就能拿到,不用在一堆东西里费劲翻找。
再打个比方,关系建模像是一本严谨的学术著作,每一页、每一行
都得逻辑严密,容不得半点马虎。
维度建模呢,则像一本轻松的漫画书,一眼就能看明白大概,轻松又愉快。
那啥时候用关系建模?要是你的数据特别复杂,对准确性要求极高,像银行的交易数据,那关系建模就是不二之选。
啥时候用维度建模?当你需要快速出报表,快速做分析,好比电商看销售数据,那维度建模就能大显身手。
不过,你可别觉得这俩就完全不相干。
它们有时候也能相互配合,就像一对好搭档。
比如说,先通过关系建模把基础数据整理好,再用维度建模来做分析,那效果,杠杠的!
总之,关系建模和维度建模各有各的好,就看你怎么用,用对了地方,那就是如虎添翼,用错了,可就麻烦喽!。
数据仓库建模方法与工具的比较分析
数据仓库建模方法与工具的比较分析数据仓库是企业中存储大量数据、支持数据分析和决策的重要组成部分。
为了构建一个高效的数据仓库,数据建模方法和工具的选择至关重要。
不同的方法和工具具有不同的特点和功能,本文将对几种常见的数据仓库建模方法和工具进行比较分析。
一、建模方法比较分析1. 维度建模:维度建模是一种常见且常用的数据仓库建模方法。
它通过将数据组织为事实表和维度表的形式,以明确定义数据的度量和上下文。
维度建模简单直观,易于理解和使用,适用于大多数数据仓库场景。
同时,由于维度建模遵循星型或雪花模式的结构,查询性能较高,适用于在线分析处理(OLAP)。
2. 实体关系建模:实体关系建模是一种传统的数据库建模方法,也可以应用于数据仓库建模。
它通过标识实体和定义实体之间的关系来描述数据,并使用E-R图进行可视化。
实体关系建模具有严谨的定义,能够完整地表示不同实体和关系之间的结构和约束。
然而,实体关系建模难以处理多对多关系和大型数据集,对数据仓库建模的复杂度和可维护性要求较高。
3. 模式设计建模:模式设计建模是一种面向对象的数据建模方法,适合复杂的数据仓库场景。
它以概念上的类和类之间的继承、关联关系来组织数据,并使用类图进行可视化。
模式设计建模具有高度灵活性和可扩展性,能够处理复杂的数据关系和多层次的数据组织结构。
然而,模式设计建模的学习曲线较陡峭,对于非技术人员而言可能较为复杂。
二、工具比较分析1. PowerDesigner:PowerDesigner是一款全面的数据建模和架构设计工具。
它支持多种建模方法,包括维度建模、实体关系建模和模式设计建模等,能够满足不同数据仓库建模需求。
PowerDesigner提供了直观的用户界面和强大的功能,可以帮助用户进行数据建模、数据分析和数据管理等工作。
但是,PowerDesigner的学习和使用成本相对较高。
2. ER/Studio:ER/Studio是一款专业的实体关系建模工具,被广泛应用于数据仓库建模领域。
维度建模——精选推荐
维度建模⼀、概念维度建模(dimensional modeling)是数据仓库建设中的⼀种数据建模⽅法,将数据结构化的逻辑设计⽅法,由Kimball 最先提出这⼀概念。
按照事实表,维表来构建数据仓库,数据集市。
主要有星型模型、雪花模型。
优点:1、维度建模是可预测的标准框架。
允许数据库系统和最终⽤户查询⼯具在数据⽅⾯⽣成强⼤的假设条件,这些数据主要在表现和性能⽅⾯起作⽤。
2、星型连接模式的可预测框架能够忍受不可预知的⽤户⾏为变化。
3、具有⾮常好的可扩展性,以便容纳不可预知的新数据源和新的设计决策。
可以很⽅便在不改变模型粒度情况下,增加新的分析维度和事实,不需要重载数据,也不需要为了适应新的改变⽽重新编码。
较好的扩展性意味着以前的所有应⽤都可以继续运⾏,并不会产⽣不同的结果。
缺点:1、由于在构建星型模式之前需要进⾏⼤量的数据预处理,因此会导致⼤量的数据处理⼯作。
⽽且,当业务发⽣变化,需要重新进⾏维度的定义时,往往需要重新进⾏维度数据的预处理。
⽽在这些与处理过程中,往往会导致⼤量的数据冗余。
2、另外⼀个维度建模法的缺点就是,如果只是依靠单纯的维度建模,不能保证数据来源的⼀致性和准确性,⽽且在数据仓库的底层,不是特别适⽤于维度建模的⽅法。
⼆、总线架构和总线矩阵维度建模的数据仓库中,有⼀个概念叫Bus Architecture,中⽂⼀般翻译为“总线架构”。
总线架构是Kimball的多维体系结构(MD)中的三个关键性概念之⼀,另两个是⼀致性维度(Conformed Dimension)和⼀致性事实(Conformed Fact)。
⼀致性维度就好⽐企业范围内的⼀组总线,不同数据集市的事实的就好⽐插在这组总线上的元件。
这也是称之为总线架构的原因。
实际设计过程中,我们通常把总线架构列表成矩阵的形式,其中列为⼀致性维度,⾏为不同的业务处理过程,即事实,在交叉点上打上标记表⽰该业务处理过程与该维度相关。
这个矩阵也称为总线矩阵(Bus Matrix)。
数据仓库(二)之维度建模篇
数据仓库(二)之维度建模篇•概述维度建模是一种将数据结构化的逻辑设计方法,它将客观世界划分为度量和上下文。
度量是常常是以数值形式出现,事实周围有上下文包围着,这种上下文被直观地分成独立的逻辑块,称之为维度。
它与实体-关系建模有很大的区别,实体-关系建模是面向应用,遵循第三范式,以消除数据冗余为目标的设计技术。
维度建模是面向分析,为了提高查询性能可以增加数据冗余,反规范化的设计技术。
•维度建模优点•事实表事实表存储了从业务活动或事件提炼出来的性能度量,它主要包含维度表的外键和连续变化的可加性数值或半可加事实。
事实表产生于业务过程中而不是业务过程的描述性信息。
它一般是行多列少,占了数据仓库的90%的空间。
在维度模型中也有表示多对多关系的事实,其他都是维度表。
事实表粒度事实表的粒度是产生事实行的度量事件的业务定义。
粒度确定了事实表的业务主键,事实表的所有度量值必须具有相同的粒度。
事实表类型1.事务事实表它是面向事务的,其粒度是每一行对应一个事务,它是最细粒度的事实表。
2.周期快照事实表它是按照良好的时间周期间隔(每天,每月)来捕捉业务活动的执行情况,一旦装入事实表就不会再去更新,它是事务事实表的补充,而非替代品。
3.累积快照事实表它用于描述业务过程中某个不确定时间跨度里的活动,它随着业务活动的发生会不断的更新。
事实表区别:•维度表维度表是对业务过程的上下文描述,主要包含代理键、文本信息和离散的数字。
它是进入事实表的入口,丰富的维度属性给出了对事实表的分析切割能力,它一般是行少列多。
如果属性值是离散的,用于过滤和标记的,就放到维度表里,如果是属性值是连续取值,用于计算的,就放到事实表中。
维度表类型缓慢变化维1.类型1字段值发生变化时覆盖原来的值。
2.类型2字段值发生变化时会新增一行,重新分配代理键,每一行添加开始日期,结束日期,版本号,是否当前值。
3.类型3每条记录会新增一列来标识变化前的值,发生变化时,把旧值放到新增的列中,把新值覆盖旧值。
数据仓库设计与建模的维度层级与维度关联的设计方法(九)
数据仓库设计与建模的维度层级与维度关联的设计方法引言:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的、可供多维分析的数据集合,维度是数据仓库中最重要的构成部分之一。
本文将重点讨论数据仓库设计与建模过程中的维度层级与维度关联的设计方法。
一、维度的定义与分类维度是描述数据的参考标准,包括如时间、地域、产品等。
维度的分类主要有层级维度和事实维度。
层级维度是通过将一个维度分为多个层级来表示多个不同的属性,例如将时间维度分为年、季度、月份等。
事实维度则是描述具体事件或事物的属性,例如产品的销售数量、销售金额等。
二、维度层级的设计方法在进行维度层级的设计时,需要考虑到数据仓库中对数据的分析需求以及数据的层级结构。
以下是几种常见的维度层级设计方法:1. 顶层到底层设计法:将一个维度从最顶层开始往下分层,每一层包含比上一层更具体的属性。
例如,时间维度可以从年开始,分为四个季度,再细分为十二个月份。
这种设计方法使数据具备多样化的层级结构,方便用户进行各种维度分析。
2. 底层到顶层设计法:与顶层到底层设计法相反,从底层开始往上分层,每一层包含比上一层更一般的属性。
例如,时间维度可以从具体的日期开始,再根据需要合并为月份、季度、年份等。
这种设计方法使数据具备更简化的层级结构,方便用户进行基本维度分析。
3. 分治法:将一个维度按照业务需求进行划分,每个划分作为一个独立的层级。
例如,时间维度可以按照年、季度、月份进行划分,每个划分可分别建立相应的层级。
这种设计方法使数据仓库结构清晰,方便用户进行特定业务需求的维度分析。
三、维度关联的设计方法在数据仓库中,维度之间的关联关系是非常重要的,它是实现多维分析的基础。
以下是几种常见的维度关联的设计方法:1. 直接维度关联:直接维度关联是指在事实表中直接引用一个维度表。
例如,订单事实表可以引用产品维度表,通过产品ID进行关联。
这种设计方法简单直接,方便数据查询,但对于维度的变动需要对事实表进行相应的更新。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
维度建模与关系建模的比较徐辉强北京大学智能科学系1001213776摘要:数据仓库技术的快速发展,使得从数据库中获取信息快速高效准确。
但涉及一个能够真正支持用户进行决策分析的数据仓库,并非是一件轻而易举的事情。
这需要经历一个从实现环境到抽象模型,从抽象模型到具体实现的过程。
要完成这一过程,必须依靠各种不同的数据模型。
本文主要将介绍两种数据数据仓库建模技术实体关系建模与维度建模,并比较两者之间的关系关键词:数据仓库、实体关系建模、维度建模1、引言传统的数据库技术是以单一的数据资源,即数据库为中心,进行从事务处理、批处理到决策分析等各种类型的数据处理工作。
近年来,计算机技术正向着两个不同的方向扩展:一是广度计算;二是深度计算。
特别是数据库处理可以大致地划分为两大类:操作型处理和分析型处理(或信息型处理)。
这种分离划清了数据处理的分析型环境与操作型环境之间的界限,由原来的以单一数据库为中心的数据环境发展为一种新的体系化环境,从而导致了数据仓库技术的出现和迅速发展。
数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。
数据仓库研究和解决从数据库中获取信息的问题。
数据仓库的特征在于面向主题、集成性、稳定性和时变性。
数据仓库之父William H. Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。
数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它并不是所谓的“大型数据库”。
数据仓库的方案建设的目的,是为前端查询和分析作为基础,由于有较大的冗余,所以需要的存储也较大。
设计好一个数据仓库是一个相对比较复杂的过程,需要抽象数据进行具体化,并且建立好模型,因此在这个过程中,模型设计是一个比较重要的一环。
2、关系建模实体关系模型是通过两个概念(“实体”和“关系”)构造特定的数据模型,实体关系模型是一种抽象的工具,能够简化复杂的数据关系,并用规范的方式表示出来,使其易于理解。
关系模型:用二维表的形式表示实体和实体间联系的数据模型。
关系数据模型是以集合论中的关系概念为基础发展起来的。
关系模型中无论是实体还是实体间的联系均由单一的结构类型——关系来表示。
在实际的关系数据库中的关系也称表。
一个关系数据库就是由若干个表组成。
关系模型主要的组成部分有:1)关系数据结构单一的数据结构——关系现实世界的实体以及实体间的各种联系均用关系来表示,从用户角度看,关系模型中数据的逻辑结构是一张二维表。
2)关系操作集合常用的关系操作包括查询操作和插入、删除、修改操作两大部分。
其中查询操作的表达能力最重要,包括:选择、投影、连接、除、并、交、差等。
关系模型中的关系操作能力早期通常是用代数方法或逻辑方法来表示,分别称为关系代数和关系演算。
关系代数是用对关系的代数运算来表达查询要求的方式;关系演算是用谓词来表达查询要求的方式。
另外还有一种介于关系代数和关系演算的语言称位结构化查询语言,简称SQL。
3)关系的数据完整性包括:域完整性、实体完整性、参照完整性和用户自定义的完整性。
域完整性:指属性的取值范围,如性别取值应为男或女。
实体完整性(Entity Integrity)规则:若属性A是基本关系R 的主属性,则属性A不能取空值。
例如:在课程表(课程号,课程名,教师,周课时数,备注)中,“课程号”属性为主键,则“课程号”不能取相同的值,也不能取空值。
参照完整性规则:若属性(或属性组)F是基本关系R的外键,它与基本关系S的主键Ks相对应(关系R和S不一定是不同的关系),则对于关系R中每个元组在属性F上的值必须为:1)或者取空值(F中的每个属性值均为空);2)或者等于S中某个元组的主键值。
域完整性、实体完整性和参照完整性是关系模型中必须满足的完整性约束条件,只要是关系数据库系统就应该支持域完整性、实体完整性和参照完整性。
除此之外,不同的关系数据库系统根据其应用环境的不同,往往还需要一些特殊的约束条件,用户定义的完整性就是对某些具体关系数据库的约束条件。
3、维度建模维度建模(dimensional modeling)是数据仓库建设中的一种数据建模方法。
Kimball 最先提出这一概念。
其最简单的描述就是,按照事实表,维表来构建数据仓库,数据集市。
这种方法的最被人广泛知晓的名字就是星型模式(Star-schema)。
实体关系(E-R)建模通常用于为单位的所有进程创建一个复杂的模型。
这种方法已被证实在创建高效的联机事务处理(OLTP) 系统方面很有效。
相反,维度建模针对零散的业务进程创建个别的模型。
例如,销售信息可以创建为一个模型,库存可以创建为另一个模型,而客户帐户也可以创建为另一个模型。
每个模型捕获事实数据表中的事实,以及那些事实在链接到事实数据表的维度表中的特性。
由这些排列产生的架构称为星型架构或雪花型架构,已被证实在数据仓库设计中很有效。
维度建模将信息组织到结构中,这些结构通常对应于分析者希望对数据仓库数据使用的查询方法。
1999 年第三季度西北地区的食品销售额是多少?表示使用三个维度(产品、地理、时间)指定要汇总的信息。
星型模式之所以广泛被使用,在于针对各个维作了大量的预处理,如按照维进行预先的统计、分类、排序等。
通过这些预处理,能够极大的提升数据仓库的处理能力。
特别是针对3NF 的建模方法,星型模式在性能上占据明显的优势。
同时,维度建模法的另外一个优点是,维度建模非常直观,紧紧围绕着业务模型,可以直观的反映出业务模型中的业务问题。
不需要经过特别的抽象处理,即可以完成维度建模。
这一点也是维度建模的优势。
但是,维度建模法的缺点也是非常明显的,由于在构建星型模式之前需要进行大量的数据预处理,因此会导致大量的数据处理工作。
而且,当业务发生变化,需要重新进行维度的定义时,往往需要重新进行维度数据的预处理。
而在这些与处理过程中,往往会导致大量的数据冗余。
另外一个维度建模法的缺点就是,如果只是依靠单纯的维度建模,不能保证数据来源的一致性和准确性,而且在数据仓库的底层,不是特别适用于维度建模的方法。
4、两者的比较ER模型(实体关系模型)有两个基本的组成部分,实体和实体之间的关系,ER模型的最高境界是去除数据中的一切冗余,这对于事务处理非常有益,它是事务处理简单明了,可以想象一家公司收到订单并且销售产品给客户,在关系数据库没有出现之前,我们将原始的纸质记录作为一条有许多字段的记录来处理,把这些交易数据输入计算机,在这样的记录里有一些字段的记录重复出现,比如客户的姓名和地址,每当一个新订单产生时就会重复出现一次,而且,由于所有客户地址都是相互独立的,更新客户地址就成一件乱糟糟的处理事务。
数据存储不仅冗余而且很难保持一致性。
关系数据库中事务处理的成功得益于ER建模及其范式化技术。
尽管如此,我们在努力地让事务处理高效的同时,却创建了一个不容易查询的数据库。
即使是一个简单的订单处理过程也会在数据库中创建许多的表,而且这些表之间的连接关系像蔓延的蜘蛛网一般纷乱。
一个企业的ER模型可能有几百个逻辑实体,像SAP那样的高端系统则有几千个实体。
没有关系数据库专业知识的最终用户不理解也记不住ER模型,使用ER建模技术违背了建立数据仓库的基本理由---也就是直接高效地获取数据。
自从关系数据库出现以来,数据库设计人员就注意到这个问题,并做了多种努力和尝试,但最终发现将这种及其复杂的模型向最终用户讲明白是非常困难的事,就连他们自己使用起来也非常复杂和难以记忆。
因此许多设计人员开始退回一步,尝试一些不那么规范有一些冗余但“简单一点的设计”。
令人吃惊的事这些“简单点”的设计看起来都非常的相似。
几乎所有这些简单点的设计都可以被看做是“维度模型”。
这种自然而然的维度建模方法并不是某一个人发明出来的,当我们将可理解性和查询性能作为数据库设计的主要目标时,这种方法就有了不可抗拒的力量而被人们采用。
在数据仓库环境中,主要从事联机分析处理(OLAP),根据系统对数据周期的要求,采用批处理方式进行数据整理,数据一次性装入数据库中,一般不再进行插入、更新等操作,OLAP系统要反映业务的发展趋势,保证数据高效查询且易于理解分析、保证数据围绕商务对象及其对活动来组织、并且要回答全局问题,此时,维度模型取代了ER模型。
维度建模也有两个基本的组成部分,对象(维度、关键指标)和对象之间相互作用的度量(事实、分析空间),维度建模是非范式化,允许数据冗余,其结构简单易于理解,当利用关键指标对分析空间进行分析时,可以直观方便地进行切片、切块、上卷、下钻、聚合等处理,因此,非常适合于OLAP系统。
5、总结维度模型,相对关系模型,有着很多优势,但是也面临着一些挑战,主要有非标准化、使用多重事实表查询、维表数据量、聚集管理、雪片和数据共享等问题。
总之,维度建模技术是众多数据建模技术中的一种,维度建模在解决策略类问题时特别有用,然而在解决其他问题时效率并不高。
使用维度数据建模,简单的决策支持系统能够实现高性能的目标。