多维数据建模

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

多维数据模型

很多研究表明，随着数据的积累，达到一定规模后，目前数据库领域中的几种数据模型已经不能满足数据日益增长的需求。很难为决策支持服务。而且这些传统的数据模型主要运用在面向事物的分析处理中。为了满足对大量数据进行分析处理，需要一种新的模型来实现数据的组织。多维数据模型以描述分析数据的多维特征为目标，最终形成一个模拟现实的多维逻辑视图。在多维数据模型中，数据可分为两部分，第一部分是决策者要分析的对象，通常称为事实，它包含的是一些度量信息。第二部分是决策者进行分析时考察的角度，通常称为维，它包含的是关于度量的描述性信息。多维数据建模技术是数据仓库，OLAP的基础。在实际应用中，由于信息的不完全，不精确，导致很难完全划分出一个明确的不相交界。在对多维数据建模技术的研究上，许多学者提出了相关的模型。最主要的是普通多维数据模型研究。

Li和Wang根据OLAP应用的特点，引入了一种称作分组代数的查询语言，对多维数据进行了形式化的描述。他们在多维立方体基础上引入了一种分组代数，为多维分析和OLAP应用提供了一种独立的，公开的方法。该模型的优点在于：它是真正意义上的概念模型，具有较强的描述能力，同时还提供了一套称为分组代数的代数查询语言。然而由于它只能映射到一个单一的数值，，因此只能描述一个单一的数值，而不能描述复杂的事实。同时它也没有考虑到维层次之间的部分包含关系，对于非到上的维层次关系等复杂维结构也没有较好的解决方案。

Gyssens和Lakshmanan对结构化的形式和内容进行了明确的区分，为其模型引入了代数操作描述以及相应的微积分操作描述，其研究主要集中在概念层，并没有涉及到具体实现细节。

纵观多维数据模型，以代数的结构，特别是偏序关系和映射概念为基础，借助于高等数学中的微积分等知识给出多维数据的模型。这些模型往往都只考虑一类或者几类关系。往往都是基于数学上的理论，给出的比较复杂的模型，或者是给出相对数学上约束比较宽松，但是精确度不够的一些模型。

在处理多维数据模型的中的最主要的一点事如何处理好事实和维，如何能在多维数据的任意一个维上使用聚集函数处理度量属性和描述属性，这是很重要的一点。此外多维数据的聚集技术也有待我们更一步的发掘和完善，精确地数学计算和精确地确定性这是聚集技术的一个重要方向。

在多维数据的模型上，我们目前做出的仅仅是一点点开始，还有许多理论有待开发和研究，以便于寻找更加优化的模型来处理多维数据。