第九章P2P数据管理系统(ppt文档)
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章 P2P数据管理系统
P2P系统的体系结构
P2P系统的体系结构分为三种:集中式、分布式和混合式。 (1) 集中式P2P网络
在集中式P2P网络中,维护着一个全局的目录服务器,它负责记录节 点的共享信息并回答对于这些信息的查询请求。提供者节点把共享信 息发布到目录服务器上,消费者节点首先在目录服务器上查找所需资 源的准确节点位置,然后连接节点完成数据交换。 集中式P2P网络与传统的client/server模式下的集中式系统虽然有相 似之处(都维护着一个中心服务器)但两者有着本质的区别:传统的 集中式系统的中心服务器不仅保存资源的目录信息,更为关键的是保 存全部的共享资源,客户端只能连接中心服务器并下载所需要的数据; 而集中式P2P网络的中心服务器只保留共享信息的目录,所有共享信 息依然保存在局部节点上。消费者节点在中心服务器上查找到资源提 供者节点后,完成节点之间的连接,并进行数据交换。
数据搜索及查询服务 提供此类服务的系统有Infrasearch、Pointera等等,主要用来在P2P网络中完 成信息检索。基于P2P网络的数据搜索与基于互联网中心服务器的数据搜索 截然不同,必须要考虑P2P网络拓扑结构的动态性以及节点的异构性,不同 节点所使用的软硬件平台以及数据语义也不一定相同。
分布式数据库系统原理与应用
第九章 P2P数据管理系统
主要内容
P2P系统概述 P2P系统的体系结构 P2P系统中的数据管理 资源的定位和路由 处理语义异构 查询处理与优化
第九章 P2P数据管理系统
第九章 P2P数据管理系统
基本概念
P2P模型(Peer-to-Peer模型,即对等计算模型) 是一种新型的 网络服务体系结构,是一种通过直接交换的方式来共享计算机资 源和服务的互联网应用模式。P2P系统具有很多的优势:
第九章 P2P数据管理系统
基本概念
分布式协同计算服务 如寻找外星人计划SETI@HOME。参加者把个人计算机上的空闲CPU时间 贡献出来,去协同分析和计算来自于位于波多黎各的阿雷西博(Arecibo) 射电望远镜观测到的数据,从而筛选出可能是地外生物发出的信号。相类 似的项目还有寻找最大质数项目GIMPS和Google的共同搜索项目Folding@ home。需要强调的是,在这些分布式协同计算应用中,都采用了一个集中 式事务管理器来协调节点的行为,包括任务的分派、同步和结果汇总。
第一,P2P系统中的每一个成员具有平等的地位,可同时充当 提供者和消费者两种角色。提供者可以向消费者提供共享的数据 和计算资源(存储空间或者是空闲的CPU时间);
第二,P2P系统具有很好的扩展性。系统成员可以动态地加入 和退出P2P系统,增加了系统的灵活性以及内容的Байду номын сангаас富性;
第三,在P2P系统中,数据是分散存储的,克服了传统集中式 数据存放方法所带来的性能瓶颈、单点失效等问题,提高了系统 的效率,也增加了系统的可用性和可靠性。
基本概念
(2) 从数据的分布性来看,分布式数据库和P2P 系统都是将数据分布地 存储到地理上分散的节点上,但是在分布式数据库系统中,全部数据首 先是一个整体,有一个全部节点公认的全局模式,全局数据经过分片和 分配被映射到了各个场地上存储起来,是一个全局与局部之间的映射关 系,而且分布存储的数据之间依然要严格保证数据的一致性;而在P2P 系 统中,没有全局数据的概念,也不强制要求数据必须保持一致性;
总结来看,基于模式的P2P数据管理系统与分布式数据库之间会有很多 的相似或相异点:
(1) 从网络拓扑结构上来看,分布式数据库中的节点相对稳定,通常 以受控的方式加入或退出网络;而在P2P 系统中,对等节点即兴地加入 或离开网络,网络拓扑结构具有很强的动态性,每个节点的逻辑位置也可 能改变;
第九章 P2P数据管理系统
第九章 P2P数据管理系统
基本概念
目前,基于P2P技术的应用是互联网上最为活跃的一个部分。统 计数据表明,P2P应用所产生的网络流量已经占据了约75%的互 联网总通信量。基于P2P技术的搜索引擎、文件共享机制、网络 视频音频分发机制为全球用户提供了更多的资源、更高的带宽以 及更好的服务质量。 下面介绍几个常用的基于P2P技术的互联网服务:
数据存储服务 如Microsoft 公司的Farsite和加州大学的Ocean Store等软件。数据在P2P网络 上的分散化存放可以减轻服务器负担,增加数据的可靠性和分发速度。
流媒体传输服务 主要包括PPLive、CoolStreaming等软件所提供的视频音频文件分发服务, 以及OICQ软件所提供的即时通信与文件传输服务、多人参与的计算机对弈 游戏等。
(3) 从查询处理上来看,在分布式数据库中,存在一个全局的查询处理 器,负责全局查询的分解和变换,同时还负责事务在不同节点上执行的 协调工作,由于网络拓扑相对稳定,因此基于分布式数据库的查询操作 可以检索到所有满足查询条件的元组;在P2P 系统中,不存在协调全局 的超级节点,查询从发起场地沿着某一路径转发,逐步定位查询结果。 由于网络结构不稳定,因此通常不能检索到全部的满足查询条件的结果。 查询结果的正确性和完整性极大地依赖于瞬间网络状态和语义映射。
第九章 P2P数据管理系统
基本概念
为了解决数据放置和检索所带来的巨大挑战,Gribble 等人提出将数据库 技术与P2P技术相结合,其中最重要的是在P2P系统中引入了数据模式的 概念,出现了基于数据模式的P2P数据管理系统。有力地解决了不同节点 之间的语义异构问题,提高了数据存储和查询的效率,并且能够支持复 杂查询。
数据共享服务 数据搜索及查询服务 分布式协同计算服务 数据存储服务 流媒体传输服务
第九章 P2P数据管理系统
基本概念
数据共享服务 早期出现的提供此类服务的系统有Napster和Gnutella,现在比较流行的是 eMule和BitTorrent。使用者通过运行提供此类服务的软件加入数据共享网 络,然后就可以直接从网络中已有的其它节点上下载感兴趣文件。与此同 时,自己也可以为其它节点提供下载服务。整个系统中,数据被分布地存 储在所有成员节点上,服务也由全部节点共同来担当。需要特别指出的是, 虽然数据不是集中存储,但数据的目录信息可能集中存储,这有利于提高 资源的定位效率。