第九章P2P数据管理系统(ppt文档)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第九章 P2P数据管理系统
P2P系统的体系结构
P2P系统的体系结构分为三种:集中式、分布式和混合式。 (1) 集中式P2P网络
在集中式P2P网络中,维护着一个全局的目录服务器,它负责记录节 点的共享信息并回答对于这些信息的查询请求。提供者节点把共享信 息发布到目录服务器上,消费者节点首先在目录服务器上查找所需资 源的准确节点位置,然后连接节点完成数据交换。 集中式P2P网络与传统的client/server模式下的集中式系统虽然有相 似之处(都维护着一个中心服务器)但两者有着本质的区别:传统的 集中式系统的中心服务器不仅保存资源的目录信息,更为关键的是保 存全部的共享资源,客户端只能连接中心服务器并下载所需要的数据; 而集中式P2P网络的中心服务器只保留共享信息的目录,所有共享信 息依然保存在局部节点上。消费者节点在中心服务器上查找到资源提 供者节点后,完成节点之间的连接,并进行数据交换。
数据搜索及查询服务 提供此类服务的系统有Infrasearch、Pointera等等,主要用来在P2P网络中完 成信息检索。基于P2P网络的数据搜索与基于互联网中心服务器的数据搜索 截然不同,必须要考虑P2P网络拓扑结构的动态性以及节点的异构性,不同 节点所使用的软硬件平台以及数据语义也不一定相同。
分布式数据库系统原理与应用
第九章 P2P数据管理系统
主要内容
P2P系统概述 P2P系统的体系结构 P2P系统中的数据管理 资源的定位和路由 处理语义异构 查询处理与优化
第九章 P2P数据管理系统
第九章 P2P数据管理系统
基本概念
P2P模型(Peer-to-Peer模型,即对等计算模型) 是一种新型的 网络服务体系结构,是一种通过直接交换的方式来共享计算机资 源和服务的互联网应用模式。P2P系统具有很多的优势:
第九章 P2P数据管理系统
基本概念
分布式协同计算服务 如寻找外星人计划SETI@HOME。参加者把个人计算机上的空闲CPU时间 贡献出来,去协同分析和计算来自于位于波多黎各的阿雷西博(Arecibo) 射电望远镜观测到的数据,从而筛选出可能是地外生物发出的信号。相类 似的项目还有寻找最大质数项目GIMPS和Google的共同搜索项目Folding@ home。需要强调的是,在这些分布式协同计算应用中,都采用了一个集中 式事务管理器来协调节点的行为,包括任务的分派、同步和结果汇总。
第一,P2P系统中的每一个成员具有平等的地位,可同时充当 提供者和消费者两种角色。提供者可以向消费者提供共享的数据 和计算资源(存储空间或者是空闲的CPU时间);
第二,P2P系统具有很好的扩展性。系统成员可以动态地加入 和退出P2P系统,增加了系统的灵活性以及内容的Байду номын сангаас富性;
第三,在P2P系统中,数据是分散存储的,克服了传统集中式 数据存放方法所带来的性能瓶颈、单点失效等问题,提高了系统 的效率,也增加了系统的可用性和可靠性。
基本概念
(2) 从数据的分布性来看,分布式数据库和P2P 系统都是将数据分布地 存储到地理上分散的节点上,但是在分布式数据库系统中,全部数据首 先是一个整体,有一个全部节点公认的全局模式,全局数据经过分片和 分配被映射到了各个场地上存储起来,是一个全局与局部之间的映射关 系,而且分布存储的数据之间依然要严格保证数据的一致性;而在P2P 系 统中,没有全局数据的概念,也不强制要求数据必须保持一致性;
总结来看,基于模式的P2P数据管理系统与分布式数据库之间会有很多 的相似或相异点:
(1) 从网络拓扑结构上来看,分布式数据库中的节点相对稳定,通常 以受控的方式加入或退出网络;而在P2P 系统中,对等节点即兴地加入 或离开网络,网络拓扑结构具有很强的动态性,每个节点的逻辑位置也可 能改变;
第九章 P2P数据管理系统
第九章 P2P数据管理系统
基本概念
目前,基于P2P技术的应用是互联网上最为活跃的一个部分。统 计数据表明,P2P应用所产生的网络流量已经占据了约75%的互 联网总通信量。基于P2P技术的搜索引擎、文件共享机制、网络 视频音频分发机制为全球用户提供了更多的资源、更高的带宽以 及更好的服务质量。 下面介绍几个常用的基于P2P技术的互联网服务:
数据存储服务 如Microsoft 公司的Farsite和加州大学的Ocean Store等软件。数据在P2P网络 上的分散化存放可以减轻服务器负担,增加数据的可靠性和分发速度。
流媒体传输服务 主要包括PPLive、CoolStreaming等软件所提供的视频音频文件分发服务, 以及OICQ软件所提供的即时通信与文件传输服务、多人参与的计算机对弈 游戏等。
(3) 从查询处理上来看,在分布式数据库中,存在一个全局的查询处理 器,负责全局查询的分解和变换,同时还负责事务在不同节点上执行的 协调工作,由于网络拓扑相对稳定,因此基于分布式数据库的查询操作 可以检索到所有满足查询条件的元组;在P2P 系统中,不存在协调全局 的超级节点,查询从发起场地沿着某一路径转发,逐步定位查询结果。 由于网络结构不稳定,因此通常不能检索到全部的满足查询条件的结果。 查询结果的正确性和完整性极大地依赖于瞬间网络状态和语义映射。
第九章 P2P数据管理系统
基本概念
为了解决数据放置和检索所带来的巨大挑战,Gribble 等人提出将数据库 技术与P2P技术相结合,其中最重要的是在P2P系统中引入了数据模式的 概念,出现了基于数据模式的P2P数据管理系统。有力地解决了不同节点 之间的语义异构问题,提高了数据存储和查询的效率,并且能够支持复 杂查询。
数据共享服务 数据搜索及查询服务 分布式协同计算服务 数据存储服务 流媒体传输服务
第九章 P2P数据管理系统
基本概念
数据共享服务 早期出现的提供此类服务的系统有Napster和Gnutella,现在比较流行的是 eMule和BitTorrent。使用者通过运行提供此类服务的软件加入数据共享网 络,然后就可以直接从网络中已有的其它节点上下载感兴趣文件。与此同 时,自己也可以为其它节点提供下载服务。整个系统中,数据被分布地存 储在所有成员节点上,服务也由全部节点共同来担当。需要特别指出的是, 虽然数据不是集中存储,但数据的目录信息可能集中存储,这有利于提高 资源的定位效率。
相关文档
最新文档