数据库维度的基本概念
数据库设计中的维度建模与事实建模
数据库设计中的维度建模与事实建模在数据库设计中,维度建模和事实建模是两种重要的建模方法。
维度建模和事实建模针对不同的数据类型和数据关系进行建模,在构建数据仓库或者业务智能系统时起到关键的作用。
本文将介绍维度建模和事实建模的概念、原则以及应用场景。
一、维度建模维度建模是指以维度为中心进行数据建模的方法。
维度是一种反映业务面向用户部门的数据元素,是衡量和分析业务过程的关键属性,如时间、地点、产品、客户等。
维度建模的核心概念是"星型模型",其中一个中心表(事实表)与多个维度表相连。
1. 基本原则(1)维度应该具有唯一性和确定性。
(2)维度应该是可测量的属性,并且应该为业务过程的关键属性。
(3)维度之间应该具有层次关系。
2. 维度建模的步骤(1)识别关键业务过程和需求。
(2)识别和定义需要使用的维度。
(3)确定维度之间的层次关系。
(4)设计事实表,并且确定与维度表之间的关系。
(5)设计维度表。
(6)定义维度表之间的关系。
3. 应用场景维度建模适用于需要对业务过程进行度量和分析的场景,如经营决策、市场分析、销售分析等。
维度建模能够提供简洁、易于理解的数据模型,使得用户能够直观地分析和进行决策。
二、事实建模事实建模是指以事实为中心进行数据建模的方法。
事实是与业务过程中的事件和活动相关的数据集合,如销售金额、订单数量等。
事实建模的核心概念是"雪花模型",其中一个中心表(事实表)与多个维度表相连,并且维度表之间可以进一步展开。
1. 基本原则(1)事实应该与业务过程息息相关。
(2)事实应该是可计量和可观察的。
(3)事实应该能够满足系统设计的需求。
2. 事实建模的步骤(1)识别需要度量和分析的业务过程。
(2)确定需要度量的事实,并进行定义和测量。
(3)确定需要使用的维度,并与事实表建立关系。
(4)确定维度之间的关系,并进行细化。
3. 应用场景事实建模适用于需要对业务过程中的事件和活动进行度量和分析的场景,如销售分析、客户行为分析、物流分析等。
数据仓库多维数据模型的设计
1、数据仓库基本概念1.1、主题(Subject)主题就是指我们所要分析的具体方面。
例如:某年某月某地区某机型某款App的安装情况。
主题有两个元素:一是各个分析角度(维度),如时间位置;二是要分析的具体量度,该量度一般通过数值体现,如App安装量。
1.2、维(Dimension)维是用于从不同角度描述事物特征的,一般维都会有多层(Level:级别),每个Level 都会包含一些共有的或特有的属性(Attribute),可以用下图来展示下维的结构和组成:以时间维为例,时间维一般会包含年、季、月、日这几个Level,每个Level一般都会有ID、NAME、DESCRIPTION这几个公共属性,这几个公共属性不仅适用于时间维,也同样表现在其它各种不同类型的维。
1.3、分层(Hierarchy)OLAP需要基于有层级的自上而下的钻取,或者自下而上地聚合。
所以我们一般会在维的基础上再次进行分层,维、分层、层级的关系如下图:每一级之间可能是附属关系(如市属于省、省属于国家),也可能是顺序关系(如天周年),如下图所示:1.4、量度量度就是我们要分析的具体的技术指标,诸如年销售额之类。
它们一般为数值型数据。
我们或者将该数据汇总,或者将该数据取次数、独立次数或取最大最小值等,这样的数据称为量度。
1.5、粒度数据的细分层度,例如按天分按小时分。
1.6、事实表和维表事实表是用来记录分析的内容的全量信息的,包含了每个事件的具体要素,以及具体发生的事情。
事实表中存储数字型ID以及度量信息。
维表则是对事实表中事件的要素的描述信息,就是你观察该事务的角度,是从哪个角度去观察这个内容的。
事实表和维表通过ID相关联,如图所示:1.7、星形/雪花形/事实星座这三者就是数据仓库多维数据模型建模的模式上图所示就是一个标准的星形模型。
雪花形就是在维度下面又细分出维度,这样切分是为了使表结构更加规范化。
雪花模式可以减少冗余,但是减少的那点空间和事实表的容量相比实在是微不足道,而且多个表联结操作会降低性能,所以一般不用雪花模式设计数据仓库。
数据仓库中的多维数据模型设计与实现教程
数据仓库中的多维数据模型设计与实现教程在数据仓库中,多维数据模型设计与实现是一项关键任务。
它不仅可以帮助企业组织和分析庞大的数据量,还能提供决策支持和洞察力。
本文将介绍数据仓库中多维数据模型的概念、设计原则以及实现方法,帮助读者全面了解和掌握这一重要主题。
一、多维数据模型的概念多维数据模型是基于数据的特征和关联性来组织数据的一种模型。
它通过将数据按照不同的业务维度进行分组和分类,将数据以多维方式呈现,从而提供了更加直观和灵活的数据分析能力。
多维数据模型主要由维度、度量和层次结构组成。
1. 维度:维度是描述业务问题的属性,它可以是时间、地理位置、产品、客户等。
维度用来描述数据的特征,例如销售额可以按照时间、地理位置和产品维度进行分析。
2. 度量:度量是可以进行数值计算和分析的数据,例如销售额、利润、数量等。
度量用来描述数据的量度,便于进行各种统计分析。
3. 层次结构:层次结构是维度之间的关系,它描述了维度之间的层次结构和上下级关系。
例如时间维度可以由年、月、日等层次结构组成。
二、多维数据模型的设计原则在设计多维数据模型时,需要遵循一些原则,以确保模型的合理性和有效性。
1. 简单性:多维数据模型应该尽可能简单,避免过于复杂的维度和层次结构。
简单的模型易于理解和维护,提高数据分析效率。
2. 一致性:多维数据模型中的维度和度量应该保持一致性,避免冗余和重复。
一致的模型有助于提高查询效率和数据一致性。
3. 可扩展性:多维数据模型应该具有良好的扩展性,能够容纳未来的需求变化和数据增长。
设计时需要考虑到未来可能发生的维度扩展和度量变化。
4. 性能优化:多维数据模型的设计也要考虑到查询性能的优化。
根据实际需求和查询模式,合理设计维度的层次结构、聚集表和索引等,以提高查询效率。
三、多维数据模型的实现方法在实现多维数据模型时,需要选择合适的工具和技术来支持模型的构建和数据的加载。
1. 数据抽取和转换:多维数据模型的实现通常需要进行数据抽取和转换,将源系统的数据转化为可用于多维模型的格式。
数据维度的名词解释
数据维度的名词解释数据维度是指用于描述一组数据的可度量或可观察方面的属性。
在数据分析和数据挖掘中,维度是非常重要的概念,它通过定义不同的属性,可以帮助我们更好地理解和解释数据。
一、什么是数据维度数据维度是用于表示数据的特定方面或属性。
它是一种将数据集合划分成不同类别或类别的过程。
通过对数据进行维度建模,可以将数据集组织成一个多维数据立方体,其中数据的每个维度都表示不同的特征或描述。
举个例子来说,假设我们要分析一家电子商务公司的销售数据。
在这个数据集中,我们可以使用多个维度对销售进行描述,如产品、地区、销售时间等。
通过将数据按照这些维度进行划分,我们可以更好地了解不同产品在不同地区和时间下的销售情况。
这样的维度建模有助于我们从不同的角度来观察数据,并发现数据中隐藏的模式和趋势。
二、数据维度的类型数据维度可以根据其性质和组织方式进行分类。
常见的数据维度类型包括:1. 时间维度:时间维度用于描述数据发生或记录的时间点或时间段。
例如,销售数据中的年份、季度、月份等都可以作为时间维度来分析销售情况的季节性变化和趋势。
2. 地理维度:地理维度用于描述与地理位置相关的数据特征。
例如,销售数据中的国家、城市、区域等都可以作为地理维度来分析不同地域的销售情况和市场发展趋势。
3. 产品维度:产品维度用于描述数据中的不同产品或商品。
例如,销售数据中的产品类别、品牌、型号等都可以作为产品维度来分析不同产品的销售情况和市场需求。
4. 客户维度:客户维度用于描述与客户相关的数据特征。
例如,销售数据中的客户类型、客户等级、客户地域等都可以作为客户维度来分析不同客户群体的购买行为和市场潜力。
5. 行为维度:行为维度用于描述与特定行为或事件相关的数据特征。
例如,用户行为数据中的点击、购买、访问时长等都可以作为行为维度来分析用户行为轨迹和决策过程。
通过将数据按照不同的维度进行划分,我们可以更好地理解数据的内在关系和潜在规律。
这种维度分析有助于我们获取有关数据集的更多信息,从而做出更准确的决策和预测。
数仓事实表和维度表
数仓事实表和维度表数据仓库(Data Warehouse)是一个用于支持大规模数据分析和决策制定的数据库系统。
在数据仓库中,事实表和维度表是两个核心组件,它们在数据存储和分析过程中起着重要的作用。
事实表(Fact Table)是一个用于存储数仓中的事实数据的表。
事实表通常包含大量的记录,用于描述业务中的事实或事件。
事实表的每一行记录都与一个或多个维度表相关联,通过这种关联关系,我们可以对事实数据进行分析和查询。
例如,在一个销售数据仓库中,事实表可以存储每次销售交易的详细信息,如销售日期、产品ID、客户ID、销售数量和销售金额等。
维度表(Dimension Table)是用于描述事实数据所属的特定维度的表。
维度通常描述了业务中的各种特征,如时间、地理位置、产品、客户等。
维度表的每一行记录包含了一个唯一的标识符和与该维度相关的其他属性信息。
维度表与事实表之间通过共同的标识符建立关联,从而实现数据的分类、分组和筛选。
例如,在销售数据仓库中,时间维度表可以存储每一天的日期信息,如年、季度、月份和星期等。
事实表和维度表的设计与建模是数仓架构的关键步骤之一。
在设计事实表时,我们需要仔细分析业务需求,并确定需要存储的事实数据的粒度。
事实表的粒度应该是尽可能细粒度的,以便于后续的分析和查询。
同时,我们还需要确定事实表与维度表之间的关联关系,选择合适的联接键进行关联操作。
这些关联关系将决定了数仓中数据的聚合和汇总方式。
维度表的设计同样重要。
在设计维度表时,我们需要确定哪些属性是维度属性,并通过标识符和其他属性进行描述。
维度表的属性应具有确定性和稳定性,以便于数据的一致性和可靠性。
此外,我们还可以为维度表添加层级结构,以支持多层次的数据分析和查询。
例如,地理位置维度可以包含国家、省份、城市等多个层级。
在数据仓库中,事实表和维度表的设计要根据具体的业务需求和分析目标进行调整和优化。
有时候,我们可能需要对事实表进行分区和索引,以提高数据查询的效率。
数据库设计中的维度建模与关系模型
数据库设计中的维度建模与关系模型在数据库设计中,维度建模和关系模型是两种重要的方法。
它们分别在不同的场景下发挥着重要的作用。
本文将对这两种方法进行详细的介绍和比较分析。
1. 维度建模维度建模是一种面向主题的数据库设计方法,它的核心思想是将数据按照不同的主题进行分类,并建立一个具有层次结构的数据模型。
在维度建模中,通常采用星型模型(Star Schema)或雪花模型(Snowflake Schema)来表示数据之间的关系。
星型模型是维度建模中最简单的模型之一,它由一个事实表(Fact Table)和多个维度表(Dimension Table)组成。
事实表存储了与某个特定的业务主题相关的事实数据,而维度表用于描述事实表中的数据。
维度表是一个包含了该维度的所有属性(如地理位置、时间、产品等)的表格,而事实表中的数据与维度表中的数据通过外键关联起来。
雪花模型基于星型模型,通过进一步拆分维度表,将一些维度表的属性再次细分成更小的维度表。
这样可以使得数据模型更加灵活,但同时也增加了数据冗余的可能性。
维度建模的优点在于:a. 易于理解和使用。
维度建模采用简单的模型结构来表示数据之间的关系,使得用户可以快速理解数据模型并进行查询和分析。
b. 高效的查询性能。
维度建模中的星型模型适用于大多数查询场景,可以通过索引的方式快速检索数据。
2. 关系模型关系模型是一种广泛应用的数据模型,它用关系(表)来表示数据之间的关系,并利用关系之间的连接来实现数据查询和处理。
关系模型使用结构化查询语言(SQL)进行数据操作。
在关系模型中,数据被组织成多个表,每个表都有列(属性)和行(记录)。
表与表之间通过外键关系进行连接。
关系模型使用范式(Normalization)来规范化数据,以减少数据冗余和提高数据的一致性。
关系模型的优点在于:a. 灵活性和扩展性。
关系模型可以根据具体需求进行灵活的数据模型设计,支持数据结构的变化和扩展。
b. 数据完整性和一致性。
问卷调查 数据库设计 维度
问卷调查数据库设计维度
维度(Dimension)在数据库设计中是指数据库中的一组相关属性或特征,它描述了事物或实体的某个方面。
在数据仓库或数据分析领域,维度常用于描述商业活动的不同方面,例如时间、地理位置、产品、客户等。
维度通常与事实表(Fact table)结合使用,构成了星型模型或雪花模型。
通过使用维度,可以对事实数据进行分析和报表,从而提供用户对业务数据的全面认识和深入了解。
在进行问卷调查的数据库设计中,维度可以包括以下几个方面:
1. 调查时间维度:包括调查日期、调查时段等时间相关的属性,用于分析调查结果在不同时间维度上的变化趋势。
2. 调查地点维度:包括调查地区、调查场所等地理位置相关的属性,用于分析调查结果在不同地理位置上的差异。
3. 调查对象维度:包括被调查者的属性,例如年龄、性别、教育程度等,用于分析不同人群在调查结果上的差异。
4. 问卷题目维度:包括问卷的题目、选项等属性,用于分析不同题目对调查结果的影响。
5. 调查结果维度:包括调查结果的各个指标、评分等属性,用于对调查结果进
行统计和分析。
以上仅是一些可能的维度示例,具体的问卷调查数据库设计需要根据实际情况而定。
在设计维度时,需要考虑维度之间的关系和层次结构,并灵活应用维度建模技术,以满足用户的数据分析需求。
数据库设计中的维度建模与日期模型研究
数据库设计中的维度建模与日期模型研究随着数据的迅速增长和企业对数据洞察力的需求不断增加,数据库设计变得越来越重要。
维度建模和日期模型作为数据库设计中的常用技术,被广泛应用于各类企业的数据仓库和商业智能系统中。
本文将探讨维度建模和日期模型的概念、设计原则以及其在数据库设计中的应用。
一、维度建模概述维度建模是一种将事实数据与维度数据连接起来的设计技术。
维度是描述业务过程或事务的属性或者业务分类的基础数据。
维度建模通过将业务过程或者事务数据沿着业务分类进行拆分,并通过维度进行关联,形成一个多维度的数据结构,方便分析、查询和报告。
在维度建模中,最常见的是星型模型和雪花模型。
星型模型由一个事实表和多个维度表组成,每个维度表与事实表之间是一对多的关系。
而雪花模型在星型模型的基础上,通过细化维度表进行归一化,以减少数据冗余。
维度建模具有简单、易理解、易扩展等特点,非常适用于企业业务数据的分析和洞察。
二、日期模型研究日期模型是维度建模的一种特殊类型,用来处理与日期相关的数据,如销售数据、交易数据等。
在日期模型中,时间被当做一个维度进行处理,与其他维度进行连接,以实现更详细的分析和查询需求。
日期模型的设计原则主要包括:1. 粒度日期模型中的时间粒度需要根据业务需求进行确定。
不同的业务场景可能需要不同的时间粒度,如按日、按周、按月、按季度或按年。
在设计日期模型时,需要根据实际情况选择适当的粒度,以满足业务分析和查询的需求。
2. 事实表与维度表的设计在日期模型中,事实表通常用来存储与日期相关的业务度量数据,如销售额、利润等。
维度表则用来描述与日期相关的业务分类和属性。
通过将事实表与维度表进行关联,可以实现更加灵活和深入的数据分析。
3. 关联关系在日期模型中,需要特别注意日期维度表与其他维度表之间的关联关系。
日期维度表应该与事实表建立一对多的关联,而与其他维度表建立一对一的关联。
这样可以确保日期维度的数据被正确地应用于事实表和其他维度的数据分析中。
数据仓库中的维度建模与事实表设计
数据仓库中的维度建模与事实表设计数据仓库是一个集成的、主题导向的、时间可变的、非易失性的数据存储,用于支持管理决策。
在数据仓库中,维度建模和事实表设计是非常重要的,它们是数据仓库设计的核心。
维度建模是指将数据仓库中的数据组织成一个统一的、易于理解的维度模型,而事实表设计则是指如何将业务过程和指标以一种易于查询和分析的方式存储到数据库中。
在本文中,我们将探讨数据仓库中的维度建模与事实表设计的相关内容。
一、维度建模维度建模是数据仓库设计的核心,它是数据仓库中维度和事实之间的关系模型。
维度模型由事实表和维度表组成,它们之间存在着一对多的关系。
维度模型是一个简单直观的模型,它将业务过程和指标以一种易于理解的方式组织起来。
1.维度表在维度建模中,维度表是非常重要的,它是用来描述业务对象的表。
维度表通常包含了多个属性字段,每个属性字段描述了业务对象的一个特定属性。
比如,在销售数据中,维度表可能包含了产品、时间、地点等属性字段。
2.事实表事实表是数据仓库中存储业务过程和指标的表,它包含了一个或多个度量字段,度量字段是用来度量业务活动的指标。
事实表和维度表之间通过外键关联起来,事实表中的度量字段通常是和维度表的外键字段关联的。
3.星型模式维度模型通常被称为星型模式,因为它的结构呈现出星型的形状。
在星型模式中,中心的事实表被围绕着多个维度表组织起来,形成了一个星型的结构。
4.雪花模式除了星型模式之外,还有一个常见的维度模型是雪花模式。
在雪花模式中,维度表的层次结构被规范化成多个维度表,这样可以节省存储空间,但也会增加查询复杂度。
5.维度层次维度表中的属性字段通常是按照层次结构组织起来的,比如在时间维度中,可以有年、季度、月、日等层次。
在维度建模中,采用自然层次结构的维度表是非常重要的,它可以帮助用户更加方便地进行查询和分析。
维度建模是数据仓库设计的核心,它可以帮助用户更加方便地理解业务过程和指标。
通过合理的维度建模,可以提高数据仓库的查询性能,减少数据冗余,提高数据的一致性和可靠性。
多维数据库维度层次的理解
多维数据库维度层次的理解多维度数据库是按照多维数据模型的思想来建立的。
而一个多维数据模型是由多个维度和实事组成。
维度是多维数据模型中非常重要的概念,要进行多维分析、编写高效准确的MDX 查询,首先要对维及其维度的概念分层有比较深刻的理解。
维是描述事实的角度,也即观察数据的角度。
一个多维数据模型通常都包含多个维度。
比如:描述企业的销售信息这样一个事实,我们就可能要用到客户维度、时间维度、产品维度、仓库维度等。
在多维数据库中,维度表的来源通常都是关系数据库中的基础数据表,如上面提到的客户维度就来自关系数据库中的客户表,产品维度就来自关系数据库中的产品表等等。
而这些维度表除了与事实表相关联的键属性以外还有很多其它的数据表属性。
在基于关系数据库的查询中,我们可能更多的关注表之间的关系。
而在多维数据库中,应该把思维改进一下,应该理解和注意维度属性之间的关系,分析维度中每个属性之间的关系。
而维度属性之间的关系就引出了本文的中心——维度层次。
还是上面那个企业销售的例子,对于客户维度,除了键属性外,可能还会有客户的名字属性,所在国家,所在城市以及省,性别,教育情况,职业等信息。
通过分析这些属性的值,可以发现:城市是属于某个省的,而省又是属于某个国家的,所以在这些属性的值中就表现了一种层次关系。
分析这个层次结构如下图:图一:客户维度属性层次分析图上图中左边是客户维度表中国家属性,城市属性和省属性所组成的层次表示,右边就是这几个属性的值之间的关系。
在SSAS中,图中左边的部分表示一个层次,这个层次由四个级别组成,这四个级别分别是:国家,省,城市和客户。
在这个层次中国家是粒度最大的级别,客户是粒度最小的级别。
在进行多维数据分析的时候,我们就可能会在这个层次的不同级别上进行综合或分析,上卷或下钻。
维度中的层次关系有的时候是隐含的,由数据的意义表示。
所以维度层次有的时候可以自动生成,但更多的时候是人为定义的。
对维进行概念分层使得我们可以在任意的抽象级别分析数据。
数据库数据仓库设计维度建模与事实表设计
数据库数据仓库设计维度建模与事实表设计数据库数据仓库设计维度建模与事实表设计是在建立数据库数据仓库时必不可少的一部分。
数据仓库是一个用于存储和管理大量数据的信息系统,旨在帮助企业进行决策支持和数据分析。
在设计数据库数据仓库时,维度建模与事实表设计是两个关键的步骤,本文将对这两个方面进行详细说明。
一、维度建模维度建模是数据仓库设计的核心环节。
维度是一个用于描述事实的结构属性,是数据仓库中对数据进行分类和归纳的基础。
维度建模的目标是建立一个能够满足业务需求、易于理解和维护的数据模型。
在维度建模中,最常用的方法是星型模型和雪花模型。
星型模型是以一个中心事实表为核心,通过多个维度表与事实表进行关联,形成星型的结构。
而雪花模型则在星型模型的基础上,将某些维度进一步拆分为多个维度表,形成雪花状的结构。
在选择维度建模方法时,需要考虑业务需求和数据结构的复杂性。
星型模型适用于简单的业务场景,而雪花模型适用于复杂的业务场景。
此外,还需要考虑数据的冗余和一致性。
星型模型会产生冗余的数据,但对于查询性能较好;而雪花模型能够减少冗余数据,但对查询性能有一定的影响。
二、事实表设计事实表是数据仓库中最重要的表之一,用于存储与业务过程相关的度量数据。
事实表是一个包含了主键和度量列的表,主键一般由维度表的主键组成,而度量列则包含业务指标的数值,如销售额、订单数量等。
在事实表设计中,需要考虑以下几个方面:1. 选择合适的度量列:度量列是事实表的核心内容,需要根据业务需求选择合适的度量指标。
度量指标应该是可度量、可计算和可聚合的。
2. 定义粒度:粒度是指度量数据的统计单位。
在定义粒度时,需要根据业务需求和数据可用性进行权衡。
较细的粒度可以提供更详细的数据,但会增加查询的复杂性和计算的开销。
3. 设计主键:主键是用于唯一标识每一条记录的列。
在设计主键时,需要考虑唯一性、稳定性和可读性。
4. 建立索引:对于常用的查询字段和条件,可以通过建立索引来提高查询性能。
数据维度的概念
数据维度的概念数据维度是数据集中的各个属性或特征的数量和类型。
它是描述数据集的重要概念,帮助我们理解数据的结构和特征,从而进行更深入的数据分析和挖掘。
数据维度可以被分为两类:定量(Quantitative)和定性(Qualitative)。
定量数据维度是数值型的,可以进行数学计算和统计分析,如年龄、身高、体重等。
而定性数据维度是非数值型的,代表一种特征或类别,如性别、国家、颜色等。
在数据分析中,数据维度体现了数据的多样性和复杂性。
一个数据集的维度量化了数据集中包含的特征数量,不同的维度反映了数据集中不同的信息内容。
通过对数据维度的理解和分析,我们可以揭示数据之间的关系和变化趋势,深入挖掘数据中的信息,支持决策制定和问题解决。
数据维度的重要性可以从以下几个方面来说明:1. 描述数据集:数据维度可以帮助我们描述和理解数据集的属性和特征。
对于一个包含多个特征的数据集,每个维度都表示了数据集的一个方面,通过分析每个维度的分布和趋势,我们可以了解数据集的整体情况及其变化。
2. 理解数据关系:数据维度可以帮助我们理解不同特征之间的关系。
在多维数据集中,不同的维度可能存在关联或相关性,通过对数据维度的分析,我们可以发现特征之间的相互作用,并建立合适的模型来解释和预测数据的行为。
3. 数据降维和预处理:在实际数据分析任务中,数据维度通常很高,这种高维度数据给数据分析和挖掘带来了困难。
通过分析数据维度的重要性和相关性,我们可以进行数据降维,减小数据维度的数量,保留最关键的信息,提高模型的效率和准确性。
4. 模型选择和评估:数据维度也对模型选择和评估起到重要的影响。
不同的模型对维度的要求和处理能力不同,有些模型对高维度数据表现好,而有些模型则更适合低维度数据。
通过对数据维度的分析,我们可以选择合适的模型进行分析和挖掘,并根据数据维度的特点进行模型评估和验证。
数据维度的概念可以通过一个简单的例子来进行说明。
假设我们有一个销售数据集,包含了产品ID、销售额、销售日期、销售地点等多个属性。
维度模型数据仓库基础对象概念一览
维度模型数据仓库基础对象概念一览一、度量、指标、指标器度量和维度构成OLAP的主要概念,对于在事实表或者一个多维立方体里面存放的数值型的、连续的字段,就是度量。
这符合上面的意思,有标准。
一个度量字段肯定是统一单位,比如元、户数。
假设一个度量字段。
当中的度量值可能是欧元又有可能是美元,那这个度量没法汇总。
在OLAP中还有计算度量的说法,用一个总费用除以用户数。
得到每户平均费用。
但这到底还算不算度量了呢?这已经不是原本意义上的度量了,仅仅是为了称呼方便而已。
这就得说到指标,英文的Metric。
在绩效管理软件里面,一般是有这个概念的。
其定义可表述为"它是表示某种相对程度的值"。
差别于度量概念,那是一种绝对值,尺子量出来的结果。
汇总出来的数量等。
而指标至少须要两个度量之间的计算才干得到,比如ARPU,用收入比上用户数,比如收入增长率,用本月收入比上上月收入。
当然可能指标的计算还须要两个以上的度量。
而Indicator的字面意思为指示器,在KPI中,最后一个I就是它,可是用中文称呼它的时候,总是叫"关键绩效指标",而没有叫做"指标器",也就造成一些混乱。
我们身边充当指示器的有:红绿灯。
提醒行人车辆是否等待或通行;监控室里的警报灯。
提醒哪儿出现异常。
汽车仪表盘。
提醒驾驶员油是否足够,速度怎样。
它们起到的作用是传递一种宏观的信息。
促使人的下一步行动。
红灯停绿灯行。
看到警报亮起要赶紧派人查看。
眼下常见的企业绩效管理软件中,仪表盘(有的地方称作驾驶舱)的展示界面也是不可缺少。
正是用这样的直观而比較有象征性的指示器反映企业运营状况。
能够设想提出KPI的初衷。
是希望企业通过一些粗略(非细节)的信息(而非数据)来为下一步的决策作出根据。
导致不同的决策行为必然是离散的输入。
最简单的就是一个开关。
是或不是(比如警报灯)。
假设说度量和指标是定量话,指示器就是一种定性的。
数据仓库设计与建模的维度表与维度层级设计原则(六)
数据仓库设计与建模的维度表与维度层级设计原则在数据仓库的设计与建模过程中,维度表与维度层级的设计是至关重要的一环。
维度表是数据仓库中最重要的组件之一,它包含了用于描述业务过程的各种维度信息。
而维度层级设计则决定了在数据仓库中如何组织和组织这些维度信息。
本文将讨论数据仓库设计与建模的维度表与维度层级设计原则,并提供一些实用的建议。
一、维度表设计原则1. 清晰明确的维度定义:在设计维度表之前,我们应该对维度进行清晰明确的定义。
维度是指用于描述业务过程的特定属性,如时间、地点、产品等。
每个维度应该具有唯一的标识符,并且应该能够与其他维度进行关联。
2. 单一职责原则:每个维度表应该只包含与特定维度相关的信息。
避免在同一个维度表中混合不同维度的信息,以确保数据的完整性和一致性。
3. 高度度量性:维度表中的每个属性都应该是可度量的,即可以用于定义度量和分析业务指标。
例如,在时间维度表中,可以包括年、季度、月份等可度量的属性。
4. 完整性和稳定性:维度表应该包含完整且稳定的信息。
避免在维度表中包含过于细节或不稳定的信息,以减少数据冗余和数据更新的复杂性。
5. 紧凑性和自治性:维度表应该尽可能紧凑,并且是自包含的。
避免在维度表中嵌入其他表的信息,以保持整个数据仓库的灵活性和可扩展性。
二、维度层级设计原则1. 层次结构:维度层级是指将维度数据按照某种特定的层次结构进行组织和管理。
在设计维度层级时,应该考虑到业务需求和查询要求。
例如,在时间维度表中,可以按年、季度、月份进行层级划分。
2. 层级的独立性:每个层级应该是独立的,并且具有唯一的标识符。
这样可以方便使用者在针对不同层级进行查询和分析,同时也便于维护和更新。
3. 有效性和可用性:维度层级应该是有效和可用的。
有效性指数据在各个层级之间的关联性和逻辑性,可用性指数据在某个特定层级上的可操作性和可理解性。
4. 分层次维度:有时候,某些维度可能需要按照不同的维度进行分层划分,以满足特定业务需求。
数据库维度的基本概念
基本概念:1.多维数据集:多维数据集是联机分析处理(OLAP) 中的主要对象,是一项可对数据仓库中的数据进行快速访问的技术。
多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。
2.维度(dimension):是多维数据集的结构性特性。
它们是事实数据表中用来描述数据的分类的有组织层次结构(级别)。
这些分类和级别描述了一些相似的成员集合,用户将基于这些成员集合进行分析。
3.度量值:在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一列,而且通常为数字。
此外,度量值是所分析的多维数据集的中心值。
即,度量值是最终用户浏览多维数据集时重点查看的数字数据。
您所选择的度量值取决于最终用户所请求的信息类型。
一些常见的度量值有sales、cost、expe nditures 和production count 等。
4.元数据:不同OLAP 组件中的数据和应用程序的结构模型。
元数据描述OL TP 数据库中的表、数据仓库和数据集市中的多维数据集这类对象,还记录哪些应用程序引用不同的记录块。
5.级别:级别是维度层次结构的一个元素。
级别描述了数据的层次结构,从数据的最高(汇总程度最大)级别直到最低(最详细)级别。
6.数据挖掘:数据挖掘使您得以定义包含分组和预测规则的模型,以便应用于关系数据库或多维OLAP 数据集中的数据。
之后,这些预测模型便可用于自动执行复杂的数据分析,以找出帮助识别新机会并选择有获胜把握的机会的趋势。
7.多维OLAP (MOLAP):MOLAP 存储模式使得分区的聚合和其源数据的复本以多维结构存储在分析服务器计算机上。
根据分区聚合的百分比和设计,MOLA P 存储模式为达到最快查询响应时间提供了潜在可能性。
总而言之,MOLAP更加适合于频繁使用的多维数据集中的分区和对快速查询响应的需要。
8.关系OLAP (ROLAP):ROLAP 存储模式使得分区的聚合存储在关系数据库的表(在分区数据源中指定)中。
数据仓库-维度
数据仓库-维度各维度类型渐变维描述渐变维(SCD. Slowly Change Dimension),是⼀种在多维数据仓库中实现维度历史的技术类型SCD1通过更新维度记录直接覆盖已存在的值,它不维护记录的历史⼀般⽤于修改错误的数据SCD2在源数据发⽣变化时,给维度记录建⽴⼀个新的版本记录,从⽽维护维度历史。
不删除、修改已存在的数据,新增⼀条数据SCD3通常⽤作保持维度记录的⼏个版本。
通过给某个数据单元增加多个列来维护历史。
例如,为了记录客户地址的变化,customer_dim维度表有⼀个customer_address列和⼀个previous_customer_address列,分别记录当前和上⼀个版本的地址。
SCD3可以有效维护有限的历史,⽽不像SCD2那样保存全部历史。
很少使⽤,只适⽤于数据的存储空间不⾜并且⽤户接受有限维度历史的情况维度⼦集由来有些需求不需要最细节的数据。
想要某个⽉的销售汇总,⽽不是某天的数据相对于全部的销售数据,只对某些特定状态的数据更感兴趣事实数据需要关联到特定的维度,这些特定维度包含在从细节维度选择的⾏中,所以叫维度⼦集。
维度⼦集⽐细节维度的数据少,因此更易使⽤,查询也更快描述⼦维度是⼀种⼀致性维度,由基本维度的列与⾏的⼦集构成。
细节维度称为基本维度,维度⼦集称为⼦维度基本维度表与⼦维度表具有相同的属性或内容,这样的维度表具有⼀致性。
⼀致的维度具有⼀致的维度关键字、属性列名字、属性定义以及属性值。
当构建聚合事实表,或者需要获取粒度级别较⾼的数据时,需要⽤到⼦维度。
类型包含属性⼦集的⼦维度当事实表获取⽐基本维度更⾼粒度级别的度量时,需要上卷到⼦维度基本维度和⼦维度表的主键是不同的⽐如,⽇数据上卷到⽉数据包含⾏⼦集的⼦维度基本维度和⼦维度具有同样粒度级别的细节数据基本维度和⼦维度表的主键是相同的⽐如,基本维度表中包含多种类型的数据,现在只想根据其中某⼀类型的数据做统计视图维度⼦集优点不真实存储物理数据,不需要额外的存储空间可规避数据不⼀致的潜在风险减少数据冗余缺点当基本维度表和⼦维度表的数据量相差悬殊时,性能会⽐物理表差很多如果定义的视图的查询很复杂,并且视图很多的话,可能会对元数据存储系统造成压⼒,严重影响查询性能。
大数据分析基础——维度模型
大数据分析基础——维度模型大数据分析基础——维度模型1基本概念维度模型的概念出自于数据仓库领域,是数据仓库建设中的一种数据建模方法。
维度模型主要由事实表和维度表这两个基本要素构成。
1.1维度维度是度量的环境,用来反映业务的一类属性,这类属性的集合构成一个维度,也可以称为实体对象。
维度属于一个数据域,如地理维度(其中包括国家、地区、省以及城市等级别的内容)、时间维度(其中包括年、季、月、周、日等级别的内容)。
维度是维度建模的基础和灵魂。
在维度建模中,将度量称为“事实” ,将环境描述为“维度”,维度是用于分析事实所需要的多样环境。
例如,在分析交易过程时,可以通过买家、卖家、商品和时间等维度描述交易发生的环境。
维度所包含的表示维度的列,称为维度属性。
维度属性是查询约束条件、分组和报表标签生成的基本来源,是数据易用性的关键。
1.2事实表事实表是维度模型的基本表,每个数据仓库都包含一个或者多个事实数据表。
事实数据表可能包含业务销售数据,如销售商品所产生的数据,与软件中实际表概念一样。
事实表作为数据仓库维度建模的核心,紧紧围绕着业务过程来设计,通过获取描述业务过程的度量来表达业务过程,包含了引用的维度和与业务过程有关的度量。
事实表中一条记录所表达的业务细节程度被称为粒度。
通常粒度可以通过两种方式来表述:一种是维度属性组合所表示的细节程度:一种是所表示的具体业务含义。
作为度量业务过程的事实,一般为整型或浮点型的十进制数值,有可加性、半可加性和不可加性三种类型。
相对维度来说,通常事实表要细长,行的增加速度也比维度表快的多,维度表正好相反。
事实表有三种类型 :1.事务事实表:事务事实表用来描述业务过程,眼踪空间或时间上某点的度量事件,保存的是最原子的数据,也称为“原子事实表\周期快照事实表”。
2.周期快照事实表:周期快照事实表以具有规律性的、可预见的时间间隔记录事实,时间间隔如每天、每月、每年等。
3.累积快照事实表:累积快照事实表用来表述过程开始和结束之间的关键步骤事件,覆盖过程的整个生命周期,通常具有多个日期字段来记录关键时间点,当过程随着生命周期不断变化时,记录也会随着过程的变化而被修改。
维度是什么意思如何理解
维度是什么意思如何理解
维度,⼜称为维数,是数学中独⽴参数的数⽬。
在物理学和哲学的领域内,指独⽴的时空坐标的数⽬。
0维是⼀个⽆限⼩的点,没有长度。
维度的概念
从⼴义上讲:维度是事物“有联系”的抽象概念的数量,“有联系”的抽象概念指的是由多个抽象概念联系⽽成的抽象概念,和任何⼀个组成它的抽象概念都有联系,组成它的抽象概念的个数就是它变化的维度,如⾯积。
此概念成⽴的基础是⼀切事物都有相对联系。
从哲学⾓度看,⼈们观察、思考与表述某事物的“思维⾓度”,简称“维度”。
例如,⼈们观察与思考“⽉亮”这个事物,可以从⽉亮的“内容、时间、空间”三个思维⾓度去描述;也可以从⽉亮的“载体、能量、信息”三个思维⾓度去描述。
什么叫维度
维度应该是⼀种“属性、范围、系数、承受能⼒”意思的包涵。
在不同的对象指代不同的意思。
⽐如,宇宙的维度、钢铁的维度、某事件的维度各代指⾃⾝某⼀领域的扩张系数。
⼼理维度即是⼼理某⽅⾯的承受能⼒,在此类事件中可伸缩的弹性有多⼤。
超过了这个维度,会在此⽅⾯发⽣什么变化等。
数仓维表定义
数仓维表是指在数据仓库中,根据不同的维度对数据进行分类和组织的一种方式。
维表是一种预先定义好的表格,其中包含了各种维度信息,如时间、地点、人员、事件等。
在数仓中,维表通常被用来组织和存储数据,以便在进行分析和查询时能够快速定位和检索数据。
维表的定义通常包括以下几个方面:1. 维度定义:定义维表中各个维度的名称和含义,如时间、地点、人员、事件等。
这些维度应该尽可能具体和详细,以便能够覆盖各种可能的查询和分析需求。
2. 表格结构:定义维表中的各个列和数据类型,以及各个维度之间的关系。
通常,维表中的列应该尽可能减少,以便能够快速检索和查询数据。
3. 索引设计:为了提高查询速度,通常需要对维表进行索引设计。
根据不同的查询需求,可以选择不同的索引类型,如单列索引、组合索引等。
4. 数据更新:维表中的数据应该定期更新,以确保数据的准确性和实时性。
同时,还应该考虑数据更新的频率和方式,以避免对查询性能产生影响。
在数仓中,维表的应用非常广泛。
通过使用维表,可以更好地组织和存储数据,提高查询速度和准确性。
同时,维表还可以帮助开发人员更好地理解数据仓库的结构和数据之间的关系,从而更好地进行数据分析工作。
以下是一个示例维表的定义:维度名称:客户维度定义:客户是购买产品或服务的个人或组织。
表格结构:* 客户ID:客户的唯一标识符。
* 姓名:客户的姓名或名称。
* 地址:客户的居住或办公地址。
* 联系方式:客户的电话号码、电子邮件地址或其他联系方式。
* 购买历史:客户的历史购买记录,包括购买的商品、时间、价格等信息。
索引设计:为了提高查询速度,可以对客户ID、姓名、地址等关键字段建立单列索引或组合索引。
数据更新:定期更新客户信息,包括新客户的加入、老客户的流失等。
同时,根据业务需求定期更新购买历史数据。
通过以上定义,我们可以更好地理解维表在数仓中的角色和应用。
在实际情况中,维表的设计和应用还需要根据具体业务需求和数据分析需求进行调整和完善。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基本概念:1.多维数据集:多维数据集是联机分析处理(OLAP) 中的主要对象,是一项可对数据仓库中的数据进行快速访问的技术。
多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。
2.维度(dimension):是多维数据集的结构性特性。
它们是事实数据表中用来描述数据的分类的有组织层次结构(级别)。
这些分类和级别描述了一些相似的成员集合,用户将基于这些成员集合进行分析。
3.度量值:在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一列,而且通常为数字。
此外,度量值是所分析的多维数据集的中心值。
即,度量值是最终用户浏览多维数据集时重点查看的数字数据。
您所选择的度量值取决于最终用户所请求的信息类型。
一些常见的度量值有sales、cost、expe nditures 和production count 等。
4.元数据:不同OLAP 组件中的数据和应用程序的结构模型。
元数据描述OL TP 数据库中的表、数据仓库和数据集市中的多维数据集这类对象,还记录哪些应用程序引用不同的记录块。
5.级别:级别是维度层次结构的一个元素。
级别描述了数据的层次结构,从数据的最高(汇总程度最大)级别直到最低(最详细)级别。
6.数据挖掘:数据挖掘使您得以定义包含分组和预测规则的模型,以便应用于关系数据库或多维OLAP 数据集中的数据。
之后,这些预测模型便可用于自动执行复杂的数据分析,以找出帮助识别新机会并选择有获胜把握的机会的趋势。
7.多维OLAP (MOLAP):MOLAP 存储模式使得分区的聚合和其源数据的复本以多维结构存储在分析服务器计算机上。
根据分区聚合的百分比和设计,MOLA P 存储模式为达到最快查询响应时间提供了潜在可能性。
总而言之,MOLAP更加适合于频繁使用的多维数据集中的分区和对快速查询响应的需要。
8.关系OLAP (ROLAP):ROLAP 存储模式使得分区的聚合存储在关系数据库的表(在分区数据源中指定)中。
但是,可为分区数据使用ROLAP 存储模式,而不在关系数据库中创建聚合。
9.混合OLAP (HOLAP):HOLAP 存储模式结合了MOLAP 和ROLAP 二者的特性。
10.粒度:数据汇总的层次或深度。
11.聚合|聚集:聚合是预先计算好的数据汇总,由于在问题提出之前已经准备了答案,聚合可以改进查询响应时间。
12.切块:由多个维的多个成员限定的分区数据,称为一个切块。
13.切片(slice):由一个维的一个成员限定的分区数据,称为一个切片。
14.数据钻取:最终用户从常规多维数据集、虚拟多维数据集或链接多维数据集中选择单个单元,并从该单元的源数据中检索结果集以获得更详细的信息,这个操作过程就是数据钻取。
15.数据挖掘模型:数据挖掘使您得以定义包含分组和预测规则的模型,以便应用于关系数据库或多维OLAP 数据集中的数据。
之后,这些预测模型便可用于自动执行复杂的数据分析,以找出帮助识别新机会并选择有获胜把握的机会的趋势。
数据库维度(Database dimension)“数据库维度”是与某个键属性相关的维度属性的集合,而该键属性又与度量值维度中的事实数据相关。
维度属性(Dimension attribute)“维度属性”被绑定到维度表中的一个或多个列并包含成员。
维度属性可以包含客户名称、月份名称和产品名称。
成员(Member)“成员”是维度属性(包括度量值维度)的值。
层次结构中的成员可以是叶成员、父成员、数据成员或“(全部)”成员。
度量值(Measure)“度量值”是来自事实数据表的值,也称为“事实数据”。
度量值维度的值有时也通称为“成员”。
度量值通常是数值,但也可以是字符串值。
Measures 维度(Measures dimension)“度量值维度”是包含多维数据集中所有度量值的维度。
度量值维度是一种特殊的维度,其中的成员通常是根据各个维度属性(存在指定的度量值)的当前成员(通常采用求和或计数方式)进行聚合。
度量值组(Measure Group)“度量值组”是SQL Server 2005 Analysis Services 多维数据集中的相关度量值集合(通常是来自同一事实数据表的度量值)。
在SQL Server 2005 Analy sis Services 中,一个多维数据集可包含多个度量值组。
“(全部)”成员((All) member)“(全部)”成员是属性层次结构或用户定义的层次结构中的所有成员的计算值。
计算成员(Calculated member)“计算成员”是在查询时定义和计算的维度成员。
可以在用户查询或MDX 计算脚本中定义计算成员,并将其存储在服务器上。
一个计算成员对应于定义它们的维度中的多个维度表行。
数据成员(Data member)“数据成员”是在父子层次结构中与父成员相关联的子成员。
数据成员包含其父成员的数据值,而不是该父成员的子级的聚合值。
父成员(Parent member)“父成员”是父子层次结构中的成员,包含其子级的聚合值。
叶成员(leaf member)“叶成员”是层次结构中不包含子级的成员。
子成员(Child member)“子成员”是层次结构中位于顶层下面的成员。
键属性(Key attribute)数据库维度的“键属性”是维度中的所有非键属性(以直接或间接方式)所链接到的属性。
键属性通常也是粒度属性。
粒度属性(Granularity attribute)多维数据集维度的属性,它将维度链接到度量值维度内度量值组中的事实数据。
如果粒度属性和键属性为不同的属性,则非键属性必须直接或间接地链接到粒度属性。
在多维数据集中,粒度属性定义维度的粒度。
多维数据集维度(Cube dimension)“多维数据集维度”是多维数据集中的数据库维度实例。
属性层次结构(Attribute hierarchy)“属性层次结构”是包含以下级别的属性成员层次结构:包含所有非重复属性成员的叶级别,叶级别的各个成员也称为“叶成员”。
中间级别(如果属性层次结构为父子层次结构)。
可选的“(全部)”级别(IsAggregatable=True),它包含属性层次结构的叶成员的聚合值。
“(全部)”级别的成员也称为“(全部)”成员。
默认情况下,将为每个维度属性定义属性层次结构(AttributeHierarchyEnabled =True)。
属性层次结构默认为可见(AttributeHierarchyVisible=True)。
均衡层次结构(Balanced hierarchy)“均衡层次结构”是顶级成员与任何叶成员之间存在相同级别数的层次结构。
不齐整层次结构(Ragged hierarchy)请参见“非均衡层次结构(Unbalanced hierarchy)”。
非均衡层次结构(Unbalanced hierarchy)“非均衡层次结构”是顶级与叶级之间存在不同级别数的层次结构。
父子层次结构即是不齐整层次结构的一个例子。
非均衡层次结构也称为“不齐整层次结构”。
父子层次结构(Parent-child hierarchy)“父子层次结构”是一种将维度属性设置为parent 类型的特殊的属性层次结构。
父子层次结构是由子成员和父成员构成的非均衡层次结构。
父子层次结构包含以下级别:包含父成员子级的子级别。
父成员的子级包含聚合到父成员的属性成员(包括数据成员)。
包含父成员的中间级别。
可选的“(全部)”级别(IsAggregatable=True),它包含父子层次结构叶成员的聚合值,“(全部)”级别的成员也称为“(全部)”成员。
每个维度中只能存在一个父子层次结构,并且必须与键属性相关。
用户定义的层次结构(User-defined hierarchy)“用户定义的层次结构”是属性层次结构的均衡层次结构,旨在帮助用户浏览多维数据集数据。
用户定义的层次结构不添加到多维数据集空间。
在某些情况下可以隐藏用户定义的层次结构中的级别并使其以非均衡的形式显示。
属性关系(Attribute relationship)“属性关系”是属性间的一对多关系,例如州省市自治区和城市维度属性间的关系。
成员属性(Member property)成员属性是特性成员的属性,例如客户的性别或产品的颜色。
单元(Cell)多维数据集中的“单元”是度量值维度成员的成员与多维数据集中各个属性层次结构的成员相交处所在的空间。
度量值维度的成员可以是叶成员(单个事实数据)或聚合成员(例如,特定年份聚合的销售额)。
维度的成员可以是叶成员、数据成员、父成员或“(全部)”成员。
多维数据集空间(Cube space)“多维数据集空间”是多维数据集属性层次结构的成员与多维数据集的度量值的交集。
子多维数据集(Subcube)“子多维数据集”是表示多维数据集的筛选视图的多维数据集子集。
可以使用MD X 计算脚本中的Scope 语句或MDX 查询中的嵌套select 语句定义子多维数据集。
带有嵌套select 语句的子多维数据集(Subcube with Subselect)用MDX 查询中的嵌套select 语句定义的子多维数据集包含符合子多维数据集定义的所有成员,其结果如下:包含层次结构的“(全部)”成员与包含层次结构的每个叶成员的结果是相同的。
包含任何成员将包括其祖先和后代。
包含用户定义的层次结构中某级别的每个成员将包含该用户定义的层次结构中的所有成员,但可排除不与此级别成员共存的其他层次结构的成员(例如不包含客户的城市)。
多维数据集中的每个“(全部)”成员始终存在于从该多维数据集创建的子多维数据集中。
子多维数据集中的聚合值将进行直接求和。
SQL Server数据库维度表和事实表概述:事实表每个数据仓库都包含一个或者多个事实数据表。
事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行。
事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性纬度表的主键,而维度表包含事实记录的特性。
事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与纬度表中对应项的相关索引字段之外的任何数据。
包含在事实数据表中的“度量值”有两中:一种是可以累计的度量值,另一种是非累计的度量值。
最有用的度量值是可累计的度量值,其累计起来的数字是非常有意义的。
用户可以通过累计度量值获得汇总信息,例如。
可以汇总具体时间段内一组商店的特定商品的销售情况。
非累计的度量值也可以用于事实数据表,单汇总结果一般是没有意义的,例如,在一座大厦的不同位置测量温度时,如果将大厦中所有不同位置的温度累加是没有意义的,但是求平均值是有意义的。