数据库原理毕业论文(同名25270)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据库原理毕业论文(同名25270)
数据库原理
与应用论文
题目:数据库技术在信息化社会的应用及存在的问题姓名:曲歌
专业:财务管理
学校:哈尔滨理工大学
时间:6月13日
内容摘要
随着计算机技术与网络通信技术、多媒体技术的发展,数据库技术已成为信息社会中对大量数据进行组织与管理的重要技术手段及软件技术,是网络信息化管理系统的基础。

它不仅有完整的理论基础,而且随着硬件技术与软件技术的飞快发展,它的应用也越来越广泛。

然而信息技术的快速发展,是人们面临着这样的局面:CAD/CAM,CIMS,CASE,GIS等应用领域要求管理越来越复杂的信息,这些信息具有诸如多媒体数据,空间数据,科学数据,地理数据等等数据类型,这些数据与传统类型相比较,不但类型复杂,形式多样,而且存储、传输、操作使用和检索的方法也有许多新特点,新要求,一方面,需要用数据库技术和数据库系统来管理这些复杂的数据,以获得数据库系统所具备的许多数据管理功能,如查询、检索、恢复、并发控制,完整性、存储管理等。

另一方面,由于网络技术的蓬勃发展,信息处理早已从单用户环境发展到网络环境,这种环境为资源,信息的共享提供了极大的方便,并且由于多机协同工作从而大大提高了工作的效率,这两者的结合要求数据库管理系统能够在网络环境或异构环境中管理复杂的数据对象,传统的DBMS不能有效地处理复杂的多媒体数据,因而要求使用新的多媒体索引和检索技术。

多媒体数据库技术是计算机技术的重要组成部分,它能够同时获取、处理、编辑、存储和展示文字、声音、影像、图形等不同媒体,同时它具有多样性、集成性和交互性等特点。

只有解决好多媒体的关键性技术问题,才能得到广泛应用,促进它更快发展。

关键词:数据库新技术研究,多媒体数据库技术,多媒体数据库,多媒体
数据库管理系统(MMDBMS),存在的问题
目录
内容摘要 (2)
1、引言 (4)
2、数据库新技术…………………………………………………………………
4
2.1 分布式数据库………………………………………………………………
5
2.2 并行数据库…………………………………………………………………
7
2.3 知识数据库…………………………………………………………………
7
2.4 主动数据库…………………………………………………………………
7
2.5 模糊数据库…………………………………………………………………
8
2.6 空间数据库…………………………………………………………………
8
3、多媒体数据库 (8)
3.1 多媒体基础知识 (9)
3.2 多媒体管理系统 (10)
3.3 多媒体数据库技术 (11)
3.4 多媒体带来的问题 (13)
4、数据库设计中的几个问题 (14)
5、结语 (14)
参考文献 (15)
后记 (16)
1、引言
随着计算机应用领域的不断拓展和网络通信技术、多媒体技术的发展, 数据库已是计算机科学技术中发展最快、应用最广泛的重要分支之一,数据库技术的研究也取得了重大突破,他已成为计算机信息系统和计算机应用系统的重要的技术基础和支柱。

从20世纪60年代末开始, 数据库系统已从第一代层次数据库、网状数据库,第二代的关系数据库系统,发展到第三代以面向对象模型为主要特征的数据库系统。

关系数据库理论和技术在70~80年代得到长足的发展和广泛而有效地应用,80年代, 关系数据库成为应用的主流, 几乎所有新推出的数据库管理系统(DataBase Management System,DBMS)产品都是关系型的,他在计算机数据管理的发展史上是一个重要的里程碑,这种数据库具有数据结构化、最低冗余度、较高的程序与数据独立性、易于扩充、易于编制应用程序等优点,目前较大的信息系统都是建立在关系数据库系统理论设计之上的。

但是,这些数据库系统包括层次数据库、网状数据库和关系数据库,不论其模型和技术上有何差别,却主要是面向和支持商业和事务处理应用领域的数据管理。

然而,随着用户应用需求的提高、硬件技术的发展和
Internet/Intranet提供的丰富多彩的多媒体交流方式,促进了数据库技术与网络通信技术、人工智能技术、面向对象程序设计技术、并行计算技术等相互渗透,互相结合,成为当前数据库技术发展的主要特征,形成了数据库新技术。

2、数据库的新技术
各种学科技术与数据库技术的有机结合,从而使数据库领域中新内容、新应用、新技术层出不穷,形成了各种新型的数据库系统:分布式数据库系统、知识数据库系统、模糊数据库系统、并行数据库系统、多媒体数据库系统等;
数据库技术被应用到特定的应用领域,又出现了工程数据库、演绎数据库、时态数据库、统计数据库、空间数据库、科学数据库、文献数据库等,他们都继承了传统数据库的理论和技术,但已经不是传统意义上的数据库了,立足于传统数据库已有的成果和技术,加以发展进化,从而形成的新的数据库系统,有人称之为“进化”了的数据库系统;立足于新的应用需求和计算机未来的发展,研究出了全新的数据库系统,有人称之为“革新”了的数据库系统。

可以说新一代数据库技术的研究,新一代数据库系统的发展呈现了百花齐放的局面。

如图所示:
2.1分布式数据库
分布式数据库系统是在集中式数据库系统的基础上建立起来的,分布式数据库系统是分布式处理技术与数据库技术的结合,同时又是数据库技术与网络技术的产物。

分布式数据库系统是具有管理分布数据库功能的计算机系统。

一个分布式数据库是由分布于计算机网络上的多个逻辑相关的数据库组成的集合,网络中的每个结(一般在系统中的每一台计算机称为结点node)具有独立处理的能力(称为本地自治),可执行局部应用,同时,每个结点通过网络通讯系统也能执行全局应用。

所谓局部应用即仅对本结点的数据库执行某些应用。

所谓全局应用(或分布应用)是指对两个以上结点的数据库执行某些应用。

支持全局应用的系统才能称为分布式数据库系统。

对用户来说,一个分布式数据库系统逻辑上看如同集中式数据库系统一样,用户可在任何一个场地执行全局应用。

2.1.1分布式数据库具有如下优点:
a)更适合分布式的管理与控制。

分布式数据库系统的结构更适合具有地理分
布特性的组织或机构使用,允许分布在不同区域、不同级别的各个部门对其自身的数据实行局部控制。

例如:实现全局数据在本地录入、查询、维护,这时由于计算机资源靠近用户,可以降低通信代价,提高响应速度,
而涉及其他场地数据库中的数据只是少量的,从而可以大大减少网络上的信息传输量;同时,局部数据的安全性也可以做得更好。

b)具有灵活的体系结构。

集中式数据库系统强调的是集中式控制,物理数据
库是存放在一个场地上的,由一个DBMS集中管理。

多个用户只可以通过近程或远程终端在多用户操作系统支持下运行该DBMS来共享集中是数据库中的数据。

而分布式数据库系统的场地局部DBMS的自治性,使得大部分的局部事务管理和控制都能就地解决,只有在涉及其他场地的数据时才需要通过网络作为全局事务来管理。

分布式DBMS可以设计成具有不同程度的自治性,从具有充分的场地自治到几乎是完全集中式的控制。

c)系统经济,可靠性高,可用性好。

与一个大型计算机支持一个大型的冀中
是数据库在加一些进程和远程终端相比,由超级微型计算机或超级小型计算机支持的分布式数据库系统往往具有更高的性价比和实施灵活性。

分布式系统比集中式系统具有更高的可靠性和更好的可用性。

如由于数据分布在多个场地并有许多复制数据,在个别场地或个别通信链路发生故障时,不致于导致整个系统的崩溃,而且系统的局部故障不会引起全局失控。

d)在一定条件下响应速度加快。

如果存取的数据在本地数据库中,那末就可
以由用户所在的计算机来执行,速度就快。

e)可扩展性好,易于集成现有系统,也易于扩充。

f)对于一个企业或组织,可以采用分布式数据库技术在以建立的若干数据库
的基础上开发全局应用,对原有的局部数据库系统作某些改动,形成一个分布式系统。

这比重建一个大型数据库系统要简单,既省时间,又省财力、物力。

也可以通过增加场地数的办法,迅速扩充已有的分布式数据库系统。

2.1.2分布数数据库系统有如下缺点:
a)通信开销较大,故障率高。

例如,在网络通信传输速度不高时,系统的响
应速度慢,与通信县官的因素往往导致系统故障,同时系统本身的复杂性也容易导致较高的故障率。

当故障发生后系统恢复也比较复杂,可靠性有待提高。

b)数据的存取结构复杂。

一般来说,在分布时数据库中存取数据,比在集中
时数据库中存取数据更复杂,开销更大。

c)数据的安全性和保密性较难控制。

在具有高度场地自治的分布时数据库中,
不同场地的局部数据库管理员可以采用不同的安全措施,但是无法保证全局数据都是安全的。

安全性问题式分布式系统固有的问题。

因为分布式系统式通过通信网络来实现分布控制的,而通信网络本身却在保护数据的安全性和保密性方面存在弱点,数据很容易被窃取。

d)分布式数据库的设计、场地划分及数据在不同场地的分配比较复杂。

数据
的划分及分配对系统的性能、响应速度及可用性等具有极大的影响。

不同场地的通信速度与局部数据库系统的存取部件的存取速度相比,是非常慢的。

通信系统有较高的延迟,在CPU上处理通信信息的代价很高。

分布式数据库系统中要注意解决分布式数据库的设计、查询处理和优化、事务管理及并发控制和目录管理等问题。

在数据库研究领域中已有多年的历史和出现过一批支持分布数据管理的系统,如SDD1系统、DINGRES系统和 POREL系统等。

从概念上讲,分布式数据库是物理上分散在计算机网络各结点上,而逻辑上属于同一个系统的数据集合。

他具有数据的分布性和数据库间的协调性两大特点。

系统强调结点的自治性而不强调系统的集中控制,且系统应保持数据的分布透明性,使应用程序编写时可完全不考虑数据的分布情况。

无疑分布式是计算机应用的发展方向,也是数据库技术应用的实际需求,其技术基础除计算机硬、软件技术支持外,计算机通信与网络技术当然是其最重要的基础。

但分布式系统结构、分布式数据库由于其实现技术上的问题,当前并没有完全达到预期的目标,而客户/服务器(Client/Server,C/S)体系结构却正在风行,广义的理解, C/S也是一种分布式结构,按照C/S结构,一个数据处理任务至少是分布在2个不同的部件上完成。

C/S结构把任务分为2部分,一部分是由前端(Frontend,即Client)运行应用程序,提供用户接口,而另一部分是由后端(Backend,即Server)提供特定服务,包括数据库或文件服务、通信服务等。

客户机通过远程调用或直接请求应用程序提供服务,服务器执行所要求的功能后,将结果返回客户机,客户机和服务器通过网络来实现协同工作。

C/S结构具有性能优越、保护投资、易于扩展和保证数据完整性等优点。

当前,C/S技术日臻完善,客户机与服务器允许有多种选择,这样计算机系统就可以实现横向集成,即将来自不同厂家的、不同领域内的最好的产品集成在一起,组成一个性能价格比最优的系统。

当前已有多种数据库产品支持C/S结构,其中Sybase是较典型的代表。

2.2并行数据库
并行数据库系统是并行技术与数据库技术的结合,其发挥多处理机结构的优势,将数据库在多个磁盘上分布存储,利用多个处理机对磁盘数据进行并行处理,从而解决了磁盘“I/O”瓶颈问题,通过采用先进的并行查询技术,开发查询间并行、查询内并行以及操作内并行,大大提高查询效率。

其目标是提供一个高性能、高可用性、高扩展性的数据库管理系统,而在性能价格比方面,较相应大型机上的DBMS高得多。

并行数据库系统作为一个新兴的方向,需要深入研究的问题还很多,但可以预见,由于并行数据库系统可以充分地利用并行计算机强大的处理能力,必将成为并行计算机最重要的支撑软件之一。

在并行数据库领域,虽然取得了一些成果,但还有许多问题需要研究。

并行体系结构,并行操作算法,并行查询优化,并行数据库的物理设计,及并行数据库的数据加载及再组织技术。

2.3知识数据库
知识数据库系统的功能是如何把由大量的事实、规则、概念组成的知识存储起来,进行管理,并向用户提供方便快速的检索、查询手段。

因此,知识数据库可定义为:知识、经验、规则和事实的集合。

知识数据库系统应具备对知识的表示方法;对知识系统化的组织管理;知识库的操作;库的查询与检索;知识的获取与学习;知识的编辑;库的管理等功能。

知识数据库是人工智能技术与数据库技术的结合。

2.4主动数据库
主动数据库的主要目标是提供对紧急情况及时反应的能力,同时提高数据管理系统的模块化程度,主动数据库通常采用的方法是在传统的数据库系统中嵌入ECA(事件-条件-动作)规则,这相当于系统提供了一个自动检测机构,实现主动数据库的关键技术在于它的条件检测技术,,能够有效的对事件进行自动检测。

此外,如何扩充传统的数据库系统,使之能够描述,存储,管理ECA 规则,适应主动数据库;如何构造执行模型;如何进行事务调度;如何在传统数据库管理系统的基础上形成主动数据的体系结构;如何提高系统的整体效率等都是主动数据库。

2.5模糊数据库
模糊性是客观世界的一个重要属性,传统的数据库系统描述和处理的是精确的或确定的客观事物,但不能描述和处理模糊性和不完全性等概念,这是一个很大的不足,为此,开展模糊数据库理论和实现技术的研究,其目标是能够存储以各种形式表示的模糊数据,数据结构和数据联系、数据上的运算和操作、对数据的约束(包括完整性和安全性)、用户使用的数据库窗口用户视图、数据的一致性和无冗余性的定义等都是模糊的,精确数据可以看成是模糊数据的特例;模糊数据库系统是模糊技术与数据库技术的结合,由于理论和实现技术上的困难,模糊数据库技术近年来发展不是很理想,但他已在模式识别、过程控制、案情侦破、医疗诊断、工程设计、营养咨询、公共服务以及专家系统等领域得到较好的应用,显示了广阔的应用前景。

2.6 空间数据库
空间数据库系统主要面向GIS应用用来存储和处理电子地图等空间数据及其属性数据的数据库系统,是用于表示空间物体的位置、形状、大小和分布特征等诸方面信息的数据,适用于描述所有二维、三维和多维分布的关于区域的现象的数据库系统。

……
除了以上讲的这几个典型的数据库新技术,还有如面向对象数据库系统、工作流数据库、Web数据库,演绎数据库,数据网格等,这里仅以多媒体数据库为例,讲述一下数据库在信息化社会的应用及存在的问题。

3、多媒体数据库
数据库是为某种特殊目的组织起来的记录和文件的集合。

传统的数据库管理系统在处理结构化数据、文字和数值信息等方面是很成功的。

但是,随着时间的推移,多媒体信息也在激增:互联网上正在不断产生和存储大量的图像和视频,为了便于处理、发布和保存,许多印刷形式的绘画和图片被转化成数字形式;许多电视和报纸上的图片也被转化成了数字形式;人们每天都在不断采集大量的医学图像;卫星探测也不断产生更多的图片。

随着储存技术和数字技术发展,这种趋势还会继续下去,要管理和使用这些数量不多增加的多媒体信息和数据信息,只创建一个堆积它们的“仓库”是毫无用处的,如果不对多媒体信息进行组织以便快速的检索,就不可能有效的使用这些多媒体信息,如何对这些信息关联度大、结构复杂、媒体处理要求高的多媒体数据进行有效的管理和石油,成为多媒体信息系统的一大技术难题。

因此需要研究和建立能处理非结构化数据的新型数据库――多媒体数据库。

3.1多媒体基础知识
多媒体主要包括数字音频、数字图形及图像、多媒体数字视频、多媒体动画等;常用的多媒体文件格式有:
音频文件格式:wave格式,扩展名为WAV,利用该格式纪录的声音文件和原声基本一致,质量很高,但是文件太大;MOD格式,扩展名为MOD、ST3、XT、S3M、FAR、669等,该格式的文件里存放乐谱和乐曲使用的各种音色样本,具有回放效果明确、音色种类无限的特点;MPEG-3格式,扩展名为MP3现在流行的声音文件格式;real audio格式,扩展名为RA,这种格式可谓网络的灵魂,强大的压缩量和极小的失真使其在众多的格式中脱颖而出;还有CD Audio 格式、MIDI 格式等等。

视频文件格式:动画文件,GIF格式,FLIC格式,FLA格式等;影像格式,AVI 格式,quick time格式,MPEG格式 Real Video格式,ASF格式等。

图像文件格式:BMP格式,PCX格式,TIFF格式,GIF格式等。

多媒体数据可分为如下几类;数字字符型关系数据、文本数据、声音数据、图像数据。

下面分别给以介绍。

1.数字字符型关系数据
人们完成对信息的抽象后,就要建立与实体之间的关系。

它经常由字符和数值构成,具有非常规范的结构化形式。

因为采用结构化的形式后,使数据的内容表达得比较明确,所以,数据库对这种数据的操纵特别方便。

2.文本数据
计算机最早就可以处理文本数据,这在情报检索中得到了广泛地应用。

这种以长短不同的顺序字符流组成的文本其实也具有许多独特的性质,但就数据库而言,在理论和实践上都没有充分地反映出这种性质。

各种书籍、文献、档案等都是由文本媒体数据为主构成的。

文本是最常见的媒体形式。

3.声音数据
有了声音能够使一个对象或过程变得生动,而这种生动又带有了信息,同时声音也是应用中必须考虑的需要进行的有效管理的媒体,例如字典中每一词的发音、鸟类数据库中鸟的叫声等。

声音可以辅助其它媒体的表现,起到与感觉
相同的效果,如解说、注释、音响效果等。

但高质量的声音需要大容量的存储。

通常,单声道较好音质的声音数字化后需每分钟上兆的存储量。

声音也可以由音库中的音符合成而得,这样只需存储符号而无需存储波形。

中文语言合成效果尚不十分令人满意,但音乐合成效果已经很好了。

抽象化的声音数据已经转化为文本,许多成熟的技术都可以利用,非常有利于检索。

但如果对波形声音直接识别,还存在着一些困难,这对数据库的检索将是不利的。

4.图像数据
图像数据的表示方法有多种,分别基于抽象程序或时间。

位图式图像在照片、绘图、医学图像等方面经常采用,它只是对原图像的一种数字化。

图形是图像矢量化的结果,它是对原图像实行了某种程序的抽象而得,反映了一个物体的关键特征,常用于地理图、CAD图等方面。

图形和图像按一定顺序组成时间序列,就是动画和数字化视频,这时数据的组成及内容与时间就有了密切的关系。

一幅较高分辨率数字化的彩色图像约需1MB左右的存储空间,图形则由于抽象绘制指令而使存储量少得多,而动态视频由于在时间上的连续变化,通常每秒为25~30帧,对存储的要求要大得惊人,如不压缩处理几乎无法使用。

多媒体数据的特点
多媒体数据与传统数据库数据有显著的不同,因此,多媒体数据库有如下特点。

数据量巨大且媒体之间量的差异十分明显,而使得数据在库中的组织方法和存储方法复杂。

如何组织好多媒体数据库的数据,选择设计合适的物理结构和逻辑结构,才能保证应用的快速存取。

数据量大相应地支持信息系统范围扩大,同时应用范围也扩大了。

媒体种类的繁多使得数据处理变得复杂了.前边介绍了四种多媒体数据,而实际上,在具体实现时,常常根据系统定义、标准转换而常演变成几十种媒体形式。

从理论上讲,多媒体系统应能接受任何形式的数字化媒体形式,但却很难了解并且正确处理这些媒体的语义信息。

这些基于内容的语义在有些媒体中是易于确定的,但对另外一些媒体来说却不易于确定,甚至会因为应用的不同和观察者的不同而有差异,也不能仅用人工输入的方法加以限定。

面向对象的方法使异质数据类型的统一处理问题得到了缓解,但尚未完全解决。

多媒体不仅改变了数据库的接口,使其声、图、文并茂,而且也改变了数据库的操纵形式,其中最重要的便是查询机制和查询方法。

媒体的复合、分散、时序性质及其形象化的特点,使得查询不再只通过字符查询,查询的结果也不仅仅是一张表,而是多媒体的一组“表现”。

接口的多媒体化将对查询提出更复杂也是更友好的设计要求。

3.2、多媒体数据管理系统(MMDBMS)
多媒体数据库管理系统(MMDBMS)能够有效地存储和操作多媒体数据,在多媒体数据库中的数据被表示为文本、图像、语音、图形和视频图像等形式,用户可以定期地更新多媒体数据,从而使数据库中所包含的信息精确地反映现实性界。

随着数据库技术的发展`,一些MMDBMS已经能够存储和操作各种类型的数据,使用户能够通过MMDBMS对数据进行浏览或查询,并且可以在很短的时间内访问大量的相关数据。

这种MMDBMS对各种应用领域来说,都是非常有用的。

如CAI、CAD/CAM及航空交通管制等等。

开发MMDBMS涉及许多问题。

这些问题主要包括数据表示、数据操作、事务处理、元数据管理、数据发布、存储管理、服务质量、保证数据完整性和安全性、用户接口、异构性以及实时处理等。

相关文档
最新文档