数据库原理及应用 书本答案 单元 (11)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

问答题

1、请解释下列名词

①、数据仓库:数据仓库是支持管理决策过程的、面向主题的、集成的、随时间而增长的、持久的数据集合。

②、粒度:粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。

③、分割:分割是将数据分散到各自的物理单元中去,以便能分别独立处理,以提高数据处理的效率。

④、维:维是人们观察数据的特定角度,是考虑问题时的一类属性。

⑤、星形模型:星形模型是一个事实表同时连接很多多维表,类似星形状。

⑥、雪花模型:雪花模型是对星形模型的扩展,每个维都可以沿半径向外连接到多个维。

2、简述OLAP与OLTP的异同点

相同点:OLAP与OLTP都是数据处理的方式

3、简述数据仓库与数据挖掘的关系

答、数据仓库技术的发展与数据挖掘有着密切密切的关系,数据仓库的发展是促进数据挖掘越来越热的原因之一。数据挖掘和数据仓库作为决策支持新技术,在近十年来得到迅速发展。作为数据挖掘对象,数据仓库技术的产生和发展为数据挖掘技术开辟了新的战场,同时也提出了新的要求和挑战。数据仓库和数据挖掘是相互结合起来一起发展的,二者是相互影响,相互促进的。但是,数据仓库并不是数据挖掘的先决条件,因为有很多数据挖掘可直接从操作数据源中挖掘信息。

4、简述你对数据仓库未来发展趋势的看法。

答:数据仓库是数据管理技术和市场上一个方兴未艾的领域,有着良好的发展前景。数据仓库技术的发展自然包括数据抽取、存储管理、数据表现和方法论等方面。在数据抽取方面,未来的技术发展将集中在系统集成化方面。它将互连、转换、复制、调度、监控纳入标准化的统一管理,以适应数据仓库本身或数据源可能的变化,使系统更便于管理和维护。

在数据管理方面,未来的发展将使数据库厂商明确推出数据仓库引擎作为服务器产品与数据库服务器并驾齐驱。在这一方面,带有决策支持扩展的并行关系数据库将最具发展潜力。在数据表现方面,数理统计的算法和功能将普遍集成到联机分析产品中,同时与Internet/Web技术紧密结合,推出适用于Internet、终端免维护的数据仓库访问前端。

软件产品的发展日新月异,作为数据管理市场的热点,数据仓库必定会占据越来越广的市场。为了在市场中占据有有利的竞争地位,各个数据仓库的主流厂商也必定会不断发展完

善自己的产品。

5、简述数据仓库的特点。

①、面向主题

业务系统是以优化事务处理的方式来构造数据结构的,对于某个主题的数据常常分布在不同的业务数据库中,这对于商务分析和决策支持来说是极为不利的,因为这意味着访问某个主题的数据实际上需要去访问多个分布在不同数据库中的数据集合。

数据仓库将这些数据集中于一个地方,在这种结构中,对应某个主题的全部数据被存放在同一数据表中,这样决策者可以非常方便地在数据仓库中的一个位置检索包含某个主题的所有数据。

②、集成

操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的;而数据仓库中的数据是在对原有分散的数据库数据作抽取、清理的基础上经过系统加工、汇总和整理得到的。所以,必须在某一个主题的统帅下,需要将数据进行提取、净化、转换和装载等集成操作。

③、稳定

业务系统一般只需要当前数据,在数据库中一般也存储短期数据,因此在数据库系统中数据是不稳定的,它记录的是系统中每一个变化的瞬态。但对于决策分析而言,历史数据是相当重要的,许多分析方法必须以大量的历史数据为依托。没有历史数据的详细分析是难以把握企业的发展趋势的,因此,数据仓库对数据在空间和时间的广度上都有了更高的要求。

一般情况下,数据仓库的数据一旦加载,将作为数据档案长期保存,几乎不再做修改和删除操作。数据仓库可以看成是一个虚拟的只读数据库系统。在数据集成性中已经说明了数据仓库在数据存储方面是分批进行的,定期执行提取过程为数据仓库增加记录,但是这些记录一旦加入,就不再从系统中删除。正是由于数据仓库的这个显著特点,使得数据仓库不需要在并发读写控制上投入过多的精力,因为所有的用户只是以只读的方式访问数据仓库。

④、随时间变化

业务数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含较久远的历史数据,因此总是包括一个时间维,以便可以研究趋势和变化。数据仓库系统通常记录了一个单位从过去某一时期到目前的所有时期的信息,通过这些信息,可以对单位的发展历程和未来趋势作出定量分析和预测。

6、什么是空间数据库?简述空间数据库的特点及用途。

定义:空间数据库是以描述空间位置和点、线、面、体特征的拓扑结构位置数据及描述这些特征性能的属性数据为对象的数据库。

特点:空间数据用于表示空间物体的位置、形状、大小和分布特征等信息,描述所有二维、三维和多维分布的关于区域的信息,它不仅具有表示物体本身的空间位置及状态信息,还具有表示物体的空间关系的信息。目前的空间数据库成果,大多数以地理信息系统的形式出现,主要应用于环境和资源管理、土地利用、城市规划、森林保护、人口调查、交通、税收、商业网络等领域的管理与决策。

用途:空间数据库的目的是利用数据库技术实现空间数据的有效存储、管理和检索,为各种空间数据库用户服务。目前,空间数据库的研究,主要集中于空间关系和数据结构的形式定义,空间数据的表示与组织,空间数据查询语言,空间数据库管理系统。

相关文档
最新文档