概念模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概念模型
在收集分析需求并做了详细的需求调研之后,我们对企业需求有了一个比较清晰的了解,这时我们需要对数据仓库做概念模型的设计。通常采用面向对象的设计方法,示例数据库中的对象如客户、产品和供应商等多维信息。数据仓库的概念模型通常采用信息包图法来进行设计,要求将信息包图的5个组成部分(名称、维度、类别、层次和度量)全面地描述出来。
1.信息包图的建立
利用信息包图可以完成以下工作:
(1)定义业务中涉及的共同主题范围,例如时间、区域、产品和客户等。
(2)设计可以跟踪的、确定一个业务事件怎样被运行和完成的关键业务指标。
(3)决定数据怎样被传递给数据仓库的用户。
(4)确定用户怎样按层次聚合和移动数据。
(5)确定在给定的用户分析或查询中实际包含了多少数据。
(6)定义怎样访问数据、估计数据仓库大小、确定数据仓库里数据的更新频率。
我们用Adventure Works DW示例数据仓库中的Adventure Works Cycles公司的销售情况为例制作信息包图。
通过对Adventure Works Cycles公司的销售情况的进一步了解和分析,可以得到如下结论:
(1)获取各个业务部门对业务数据的多维特性分析结果,确定影响销售额的维度,包括时间、区域、产品和客户等维度。
(2)对每个维度进行分析,确定维度与类别之间的传递和映射关系,如在Adventure Works业务数据库中,时间维度有年度、季度、月和日等级别。
(3)确定用户需要的度量指标体系,这里以销售情况作为事实依据确定的销售相关指标包括实际销售额、计划销售额、计划完成率等。
有了以上分析,就可以得出销售分析的信息包示意图。
度量指标:实际销售额、计划销售额、计划完成率
图1:销售分析的信息包示意图
2.设计基于主题域的概念模型
根据分析需求所确定的Adventure Works Cycles公司的分析主题及主题域结构如下图所示:
图2:主题及主题域的划分
将每个主题涉及到的表和主题之间的关系表联系起来,就可以形成下图所示的原始概念模型(实体关系图):
图3:划分了主题域的原始概念模型(ER图) 至此,数据仓库的概念模型已经建立完毕。