概念模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

概念模型

在收集分析需求并做了详细的需求调研之后,我们对企业需求有了一个比较清晰的了解,这时我们需要对数据仓库做概念模型的设计。通常采用面向对象的设计方法,示例数据库中的对象如客户、产品和供应商等多维信息。数据仓库的概念模型通常采用信息包图法来进行设计,要求将信息包图的5个组成部分(名称、维度、类别、层次和度量)全面地描述出来。

1.信息包图的建立

利用信息包图可以完成以下工作:

(1)定义业务中涉及的共同主题范围,例如时间、区域、产品和客户等。

(2)设计可以跟踪的、确定一个业务事件怎样被运行和完成的关键业务指标。

(3)决定数据怎样被传递给数据仓库的用户。

(4)确定用户怎样按层次聚合和移动数据。

(5)确定在给定的用户分析或查询中实际包含了多少数据。

(6)定义怎样访问数据、估计数据仓库大小、确定数据仓库里数据的更新频率。

我们用Adventure Works DW示例数据仓库中的Adventure Works Cycles公司的销售情况为例制作信息包图。

通过对Adventure Works Cycles公司的销售情况的进一步了解和分析,可以得到如下结论:

(1)获取各个业务部门对业务数据的多维特性分析结果,确定影响销售额的维度,包括时间、区域、产品和客户等维度。

(2)对每个维度进行分析,确定维度与类别之间的传递和映射关系,如在Adventure Works业务数据库中,时间维度有年度、季度、月和日等级别。

(3)确定用户需要的度量指标体系,这里以销售情况作为事实依据确定的销售相关指标包括实际销售额、计划销售额、计划完成率等。

有了以上分析,就可以得出销售分析的信息包示意图。

度量指标:实际销售额、计划销售额、计划完成率

图1:销售分析的信息包示意图

2.设计基于主题域的概念模型

根据分析需求所确定的Adventure Works Cycles公司的分析主题及主题域结构如下图所示:

图2:主题及主题域的划分

将每个主题涉及到的表和主题之间的关系表联系起来,就可以形成下图所示的原始概念模型(实体关系图):

图3:划分了主题域的原始概念模型(ER图) 至此,数据仓库的概念模型已经建立完毕。

相关文档
最新文档