数据库最新研究成果
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据库技术与其他相关技术相结合
分布式数据库系统
并行数据库 多媒体数据库 主动数据库 对象-关系数据库
并行数据库
计算机体系结构的一个明显发展趋势是
从单处理器结构向多处理器结构过渡 原因:
– 提高单处理器的性能越来越困难,单处理器 性能有物理极限 – 高性能处理器价格昂贵,可以用廉价的多处 理器来代替
–奠定了关系模型的理论基础,关系模型的规范说明。 –研究了关系数据语言 –攻克了系统实现中查询优化、并发控制、故障恢复 等一系列关键技术。促进了RDBMS产品的蓬勃发 展和广泛应用。
第二代数据库系统(续)
关系模型具有以下主要特点: 关系模型的概念单一,实体以及实体之间的联 系都用关系来表示 以关系代数为基础,形式化基础好 数据独立性强,数据的物理存储和存取路径对 用户隐蔽 关系数据库语言是非过程化的,将用户从编程 数据库记录的导航式检索中解脱出来,大大减 小了用户编程的难度
第一代数据库系统(续)
两种数据库系统具有下列共同特点:
1. 2. 3. 4.
支持三级模式的体系结构 用存取路径来表示数据之间的联系 独立的数据定义语言 导航的数据操纵语言
数据模型及数据库系统的发展
第一代数据库系统
第二代数据库系统 新一代数据库技术的研究和发展
第二代数据库系统
1970年IBM公司 San Jose 研究室的研究
场地A 分布式DBMS
场地E 分布式DBMS 网络 场地D 分布式DBMS
场地B 分布式DBMS
场地C 分布式DBMS
分布式数据库系统的特点(续)
分布式系统的优点 – 分布式控制 – 数据共享 – 可靠性和可用性得到加强 – 性能得到改善 – 可扩充性好
分布式数据库系统的特点(续)
分布式系统缺点 – 复杂 – 增加开销
数据库技术与其他相关技术相结合
分布式数据库系统
并行数据库 多媒体数据库 主动数据库 对象-关系数据库
数据库技术与其他相关技术相结合
分布式数据库系统
并行数据库 多媒体数据库 主动数据库 对象-关系数据库
分布式数据库系统
随着地理上分散的用户对数据共享的要
– – – – 全局外模式 全局概念模式 分片模式 分布模式
分布式数据库的体系结构(续)
分片模式 – 水平分片 – 垂直分片 – 混合分片
分布式数据库的体系结构(续)
分片时必须遵守的准则 – 完全性 – 可重构性 – 不相交性
分布式数据库的体系结构(续)
分布模式的分配方案 – 划分式 – 全副本式 – 部分重复式
求日益增强,以及计算机网络技术的发 展,在传统的集中式数据库系统基础上 产生和发展了分布式数据库系统
分布式数据库系统
1. 分布式数据库系统的特点
2. 分布式数据库的体系结构
分布式数据库系统
1. 分布式数据库系统的特点
2. 分布式数据库的体系结构
1.分布式数据库系统的特点
分布式数据库应具有以下特点: (1)数据的物理分布性 (2)数据的逻辑整体性 (3)数据的分布独立性(也称分布透明 性) (4)场地自治和协调 (5)数据的冗余及冗余透明性
数据模型及数据库系统的发展
第一代数据库系统
第二代数据库系统 新一代数据库技术的研究和发展
新一代数据库技术的研究和发展
一、应用领域的需求
二、传统数据库系统的局限性 三、第三代数据库技术的特点
一、应用领域的需求
新的数据库应用领域,如计算机辅助设计/管
理(CAD/CAM)、计算机集成制造(CIM)、办 公信息系统(OIS)、地理信息系统(GIS)、 知识库系统和实时系统等 新应用需求需要数据库系统支持以下功能:
2. 并行处理技术 3. 并行数据库与分布式数据库系统的区
别
1. 并行数据库系统的体系结构
目前并行计算机的体系结构主要有以下
几类:
– 紧耦合全对称多处理器(SMP)系统,所有 CPU共享内存与磁盘 – 松耦合群集机系统,所有CPU共享磁盘 – 大规模并行处理(MPP)系统,所有CPU 均有自己的内存和磁盘
数据库技术发展概述(续)
下图从数据模型、新技术内容、应用领域三个方面,通过
一个三维空间的视图,阐述了新一代数据库系统及其相互 关系。
数据库技术新进展
数据库技术发展概述
数据模型及数据库系统的发展 数据库技术与其它相关技术相结合 面向应用领域的数据库新技术
数据模型及数据库系统的发展
数据库技术与其他相关技术相结合
数据库技术与其他学科的内容相结合,是新一代数据
库技术的一个显著特征,涌现出各种新型的数据库系 统,例如:
– 数据库技术与分布处理技术相结合,出现了分布式数据库系 统; – 数据库技术与并行处理技术相结合,出现了并行数据库系统; – 数据库技术与人工智能技术相结合,出现了知识库系统和主 动数据库系统; – 数据库技术与多媒体技术相结合,出现了多媒体数据库系统; – 数据库技术与模糊技术相结合,出现了模糊数据库系统等。
并行数据库(续)
能否为越来越多的用户维持高事务吞吐
量和低响应时间以成为衡量DBMS性能 的重要指标 并行数据库以高性能、高可用性、高扩 充性为指标,充分利用多处理器平台的 能力,通过多种并行性,在联机事务处 理与决策支持应用两种典型环境中提供 优化的响应时间和事务吞吐量
并行数据库(续)
1. 并行数据库系统的体系结构
–(1)存储和处理复杂对象 –(2)支持复杂的数据类型 –(3)需要常驻内存的对象管理以及支持对大量对 象的存取和计算 – (4)实现程序设计语言和数据库语言无缝地集成 –(5)支持长事务和嵌套事务的处理
二、传统数据库系统的局限性
传统数据库系统的局限性主要表现在以下几个
方面:
–1. 面向机器的语法数据模型 –2. 数据类型简单、固定 – 3. 结构与行为分离 – 4. 阻抗失配(编程模式不同 、类型系统不匹配 ) – 5. 被动响应 – 6. 存储、管理的对象有限 – 7. 事务处理能力较差(只能支持非嵌套事务 )
第三代数据库技术的特点(续)
与传统数据库系统相比有许多优点,如
包含更多数据语义信息,对复杂数据对 象的表达能力更强等 面向对象数据库还只是一种新兴的技术, 它的发展远不如关系数据库成熟 是一项具有重大理论意义和应用前景的 数据库技术
数据库技术新进展
数据库技术发展概述
数据模型及数据库系统的发展 数据库技术与其它相关技术相结合 面向应用领域的数据库新技术
数据模型及数据库系统的发展
第一代数据库系统
第二代数据库系统 新一代数据库技术的研究和发展
数据模型及数据库系统的发展
第一代数据库系统
第二代数据库系统 新一代数据库技术的研究和发展
第一代数据库系统
第一代数据库系统指层次和网状数据库
系统,其代表是:
– 1969年IBM公司研制的层次模型的数据库管 理系统IMS(Information Management System)。 –数据库任务组DBTG(Data Base Task Group)于20世纪60年代末70年代初提出的 DBTG报告,数据库网状模型的典型代表 。
内存 处理器 内存 处理器
连接网络 · · ·
内存
· 处理器 · ·
磁盘
磁盘 · 磁盘 · ·
并行数据库系统的体系结构(续)
图 共享磁盘结构
· · 连接网络 ·
处理器
内存 磁盘
处理器
内存 磁盘
· 处理器 · · 内存 · 磁盘 · ·
并行数据库系统的体系结构(续)
三种结构各有利弊 – 共享内存结构相对来说容易实现,各处处理 器的负载较平衡;但存在访问内存和磁盘的 瓶颈,可伸缩性不佳,可用性不太好 – 共享磁盘结构消除了访问内存的瓶颈;但存 在访问磁盘的瓶颈,分布式缓存器也是一个 瓶颈,可扩充性不佳 – 无共享资源结构不易做到负载平衡;具有极 佳的可伸缩性
一个数据库可称为OODBS,必须满足以
下条件
– 支持一核心的面向对象数据模型 – 支持传统数据库系统所有的数据库特征
第三代数据库技术的特点(续)
在研究热潮中,许多厂商推出的产品粗
糙,质量低,导致OODBS有某种回归到 人工导航系统的倾向 面向对象数据库的实现方式
– 一种是在面向对象的设计环境中加入数据库 功能,如ORIEN,CLOS等 – 另一种是对传统数据库系统进行改进,使其 支持面向对象的数据模型,如 ORACLE8.0,INFORMIX9.0等
三、第三代数据库技术的特点
支持面向对象数据模型
面向对象模型的概念是: – 对象标识 – 封装 – 类和类层次 – 继承
第三代数据库技术的特点(续)
一个面向对象的数据库系统是一个持久
的、可共享的对象库的存储和管理者 一个对象库是由一个面向对象数据模型 所定义的对象的集合体
第三代数据库技术的特点(续)
数据模型是数据库系统的核心和基础 – 格式化数据模型(包括层次数据模型和网状 数据模型) – 关系数据模型 – 面向对象的数据模型等非传统数据模型
数据模型及数据库系统的发展 (续)
1、第一代数据库系统(层次数据库系统和网
状数据库系统 )
–格式化模型 ,层次模型是网状模型的特例
2、第二代数据库系统 (关系数据库系统 ) –关系模型简单、清晰,关系代数作为语言模型,关 系数据理论作为理论基础。关系数据库系统具有形 式基础好、数据独立性强、数据库语言非过程化等 特色 。 3、第三代数据库系统 –更加丰富的数据模型、更强大的数据管理功能、满 足新应用要求
• • • • 硬件开销 通信开销 冗余数据的潜在开销 保证数据库全局并行性、并行操作的可串行性、 安全性和完整性的开销
分布式数据库系统
1. 分布式数据库系统的特点
2. 分布式数据库的体系结构
2.分布式数据库的体系结构
原则
(若干个)局部数据模式+ (一个)全局数据模式 全局数据模式四个层次
分布式数据库的体系结构(续)
四层模式之间的联系和转换由三层映象
实现
– 映象1 定义全局外模式与全局概念模式之间 的对应关系 – 映象2 定义全局关系与片段之间的对应关系 – 映象3 定义片段与网络结点之间的对应关系
分布式数据库的体系结构(续)
分布透明性式分布式数据库系统的一个
显著特点 分布透明性三个层次从高到低依次为: 分片透明性、位置透明性和局部数据模 型透明性
分布式数据库系统的特点(续)
例子:
假设一个大公司拥有四个子公司,总公司与各子公司 各有一台计算机,并已联网,每台计算机带有若干终 端。场地A为公司的总部,位于场地B的公司负责制造 和销售其产品,位于场地CDE的公司负责销售其产品。 各场地都存储了本场地雇员的数据,场地B存储了产 品制造情况的数据,场地BCDE存储了本场地销售、 库存情况的数据。可执行的全局应用包括:总公司总 销售情况、总公司总库存情况、公司间的人员调动, 等等;可执行的局部应用包括:场地B检查产品制造 情况、场地E统计本子公司雇员的平均工资等等。这 是一个典型的分布式数据库系统。
数据库技术新进展
数据库技术发展概述
数据模型及数据库系统的发展 数据库技术与其它相关技术相结合 面向应用领域的数据库新技术
数据库技术发展概述
数据库系统已从第一代的网状、层次数
据库系统,第二代的关系数据库系统, 发展到第三代以面向对象模型为主要特 征的数据库系统。 数据库技术与网络通信技术、人工智能 技术、面向对象程序设计技术、并行计 算技术等互相渗透,互相结合,成为当 前数据库技术发展的主要特征。
员 E.F.Codd发表了题为“大型共享数据 库数据的关系模型”论文 ,为关系数据 库技术奠定了理论基础 。
第二代数据库系统(续)
20世纪70年代是关系数据库理论研究和原型开
发的时代。其中以IBM San Jose研究室开发的 System R和Berkeley大学研制的INGRES为典 型代表。 发展过程:
并行数据库系统的体系结构(续)
相应并行数据库系统的体系结构: – 共享内存结构 – 共享磁盘结构 – 无共享资源结构
并行数据库系统的体系结构(续)
图 共享内存结构
处理器 处理器
· 处理器 · ·
连接网络 全局共享内存
磁盘
磁盘 · 磁盘 · ·
Fra Baidu bibliotek行数据库系统的体系结构(续)
图 无共享资源结构