非结构化P2P网络

合集下载

P2P网络拓扑结构

P2P网络拓扑
P2P 网络拓扑是P2P信息共享技术的基础, 它负责合理地组织网络中的节点以及节点上提供共享的信息资源, 并在此基础上高效地发送查询请求和查询应答消息, 其目的是在保证检索质量的情况下, 尽可能减少查询所引发的各种开销。
集中式
非结构化
全分布式混合式
P2P网络环装结构
全分布式结构化
P-Grid算法
• 作为反馈的索引值可以从以下两种方法得到: (1)乐观方法乐观算法建立在转发节点将成功完成查询请求的假定条件之上: 当一个节点向一个或几个邻居节点转发查询时, 就增加被选节点的索引值。 (2)悲观方法悲观算法与乐观算法相反: 当一个节点向一个或几个邻居节点转发查询时, 就减少被选节点的索引值 (假设转发节点将失败)。
尹禾 192121
目录
• 了解P2P • 了解网络拓扑结构
• P2P网络拓扑结构的分类与优缺点 • 拓扑结构及算法实现 • 总结与展望
P2P技术
P2P（Peer-to-Peer）网络，被叫做对等网络或对等计算，是一种有别于传统C/S（客户端/服务器）模式的分布式网络。
传统C/S网络模式
P2P网络模式
P-Grid算法是一种基于虚拟分布式搜索树的P2P系统：每个节点（Peer）只保存整棵树的一部分内容，这种树结构只有通过各个节点间的通信合作才能建立起来。 •2.基本思想 P-Grid定义了一种新的数据访问结构。它的基本思想是: 节点通过相互间随机的访问, 连续不断地分割搜索空间, 每个节点均保留足够的信息以便在以后响应搜索请求时与其它节点通信。最终形成的分布式访问结构就称为“P-Grid”(Peer Grid)。
•3.优点
搜索高效、快速，极大地减少了网络带宽，是一个真正的分布式系统，不需要中央协调者。

P2P 技术在互联网中的应用和分析

P2P 技术在互联网中的应用和分析随着信息技术的飞速发展，基于P2P 的分布式网络资源共享系统逐渐成为用户获取数据信息的重要手段，本文对P2P 技术的结构模式和特点进行描述，对P2P网络应用加以说明，并对未来P2P的发展进行了展望。

标签：P2P 技术网络应用探讨一、引言P2P（Peer-to-Peer）又称为对等网，是近几年非常流行的一种网络技术，和传统的客户机/ 服务器模式不同，P2P 技术依赖网络中所有参与者的处理能力和信息共享，它改变了人们部署网络硬件资源的方式，为网络的发展提供了一种新的思路。

P2P 技术具有良好的扩展性和健壮性，性价比较高，P2P 网络是建立的基础是IP 网络，网络中所有安装特定软件的客户端构成一个逻辑P2P 网络，网络中的资源和应用分布在所有客户端上，各用户之间的数据传输无需服务器的介入就能够直接通信，通过这样的方式，大量的客户资源能够充分得到利用，降低硬件成本和，简化了复杂性。

二、P2P的结构类型P2P 网络的结构主要有三种模式：中央式P2P 网络、无中心结构P2P 网络和混合式P2P网络。

1.中央式P2P中央式P2P 网络在硬件部署上有一个中心服务器，主要负责维护共享资源信息以及对客户端查询信息作出回应。

根据中心服务器提供的功能，又可分为以下三类：1.1服务器提供资源的发现，查询和存储。

这种模式与传统的C/S 模型中一样，所有资源都存放在服务器上，客户端从服务器上获取信息，但客户端之间并不具有信息交换能力。

1.2服务器提供发现和查询。

在这种结构中，客户端存储共享资源信息，服务器则提供索引信息，服务器与客户端、客户端与客户端都可以进行数据信息交互。

1.3服务器仅提供发现功能。

在这种方式下，服务器仅提供在客户端的列表信息，客户端彼此之间建立连接和通信。

如果某个用户需要获取某个资料文件，会根据服务器提供的列表清单，依次查询所有的客户端，直到找到所需的资源，如果没有找到，则返回错误信息。

非结构化P2P网络资源搜索算法研究

本地索引算法中，每个节点维护了距离自己ｍ步以内节点的数据索引，当节点收到查询请求时，它可以为ｍ步以内的所有节点处理查询请求，这里的ｍ是索引半径，是索引算法的参数。通过这种算法，可以把对资源的查询处理放到较少的节点上进行，从而降低资源搜索延时。本地索引算法工作过程如下：一个系统范围内的策略规定了查询消息的处理在哪些节点上进行，通常在深度为２ｍ＋ｌ的结点进行。深度不在策略中的结点不处理查询请求，只是简单地将查询消息转发给邻居。例如，如果搜索策略Ｐ＝（Ｏ，５），那么离查询结点深度为０和５的倍数上的结点会处理查询消息，其它节点只是简单地把查询转发给邻居节
１．２本地索引算法（ＬｏｃａｌＩｎｄｉｃｅｓ）
网络节点资源可以看成是节点文本的集合，即节点资源相关度可以通过计算文本相似度得到。本文通过扩展后缀树来表达节点文本内容，进而通过构建节点文本向量来计算节点资源的相关度。统计结果表明，标题、关键词和摘要所含信息代表了文本信息的７０％，并且摘要是从原始文本资源中提炼出来的最具代表意义的短句集合，反映了文档的主题内容，而且摘要相对较小，聚类速度快且效率高，因此在本文中我们主要是针对标题、关键词和摘要进行构建扩展后缀树。后缀树：一个有ｎ个字符的串Ｐ，它的后缀树是一棵有根的有向树，共有ｎ个叶子，分别标号为ｌ到ｎ。每一条边都用Ｐ的非空子串来表示。从任一节点出来的两条边，它们必须以不同的字符开始。从根节点到叶子节点ｉ，顺序经过的树边的串联，恰好为Ｐ从ｉ位置开始的后缀，即Ｐ。例如字符串ａｐｐｌｅ￥，它所有的后缀为：ａｐｐｌｅ￥，ｐｐｌｅ￥，ｐｌｅ￥，

第九章P2P数据管理系统

第九章 P2P数据管理系统
P2P系统的体系结构
P2P系统的体系结构分为三种：集中式、分布式和混合式。 (1) 集中式P2P网络
在集中式P2P网络中，维护着一个全局的目录服务器，它负责记录节点的共享信息并回答对于这些信息的查询请求。提供者节点把共享信息发布到目录服务器上，消费者节点首先在目录服务器上查找所需资源的准确节点位置，然后连接节点完成数据交换。集中式P2P网络与传统的client/server模式下的集中式系统虽然有相似之处（都维护着一个中心服务器）但两者有着本质的区别：传统的集中式系统的中心服务器不仅保存资源的目录信息，更为关键的是保存全部的共享资源，客户端只能连接中心服务器并下载所需要的数据；而集中式P2P网络的中心服务器只保留共享信息的目录，所有共享信息依然保存在局部节点上。消费者节点在中心服务器上查找到资源提供者节点后，完成节点之间的连接，并进行数据交换。
第九章 P2P数据管理系统
P2P系统的体系结构
P2P系统的体系结构分为三种：集中式、分布式和混合式。 (1) 集中式P2P网络
第一代P2P网络均采用集中式结构，其中典型的代表是Napster。 Napster是一种可以在网络中下载自己想要的MP3音乐文件的软件。安装了Napster系统的机器将成为一台服务器，可为其它用户提供音乐下载服务。Napster系统本身并不存储和提供MP3文件下载，它实际上提供的是整个网络中包含的MP3音乐文件 “目录”，即MP3音乐文件的地址，这个目录存放在一个集中的服务器上，而MP3音乐文件本身则分布在网络中的每一台机器上。使用者在目录服务器上找到想要的MP3音乐文件的位置，然后到指定的位置完成下载。2002年，Napster由于违反了知识产权保护法而被迫关闭。

非结构化P2P覆盖网络通信协议研究

ＣｍｕｅｎｉｅｒｇａｄｐｌａｉｓｏｐｔＥｇｎｅｉＡｐｉｔｎ计算机工程与应用ｒｎｎｃｏ
非结构化ＰＰ覆盖网络通信协议研究２
姚全珠，李薇，孔伟
ＹＯａｚｕＬｉＫＯＡＱｕｎｈ，ＩＷｅ，ＮＧｉＷｅ
摘
要：针对各种基于流言机制的通信协议在构造非结构化ＰＰ２覆盖网络中，其适用范围缺乏广泛的实证问题，出了一个通的节点采样服务，行高效和可靠的节点采样服务。在这种协议框架下通过实验分析了８以执种通信协议的差异。实验表明，用不同的通信协议，采所构造的非结构化ＰＰ覆盖网络就表现出多种不同的行为特性，２为构造非结构化ＰＰ盖网络中选取通信协议提供了重要的参考依据。２覆关键词：流言机制；节点采样服务；通信协议；非结构化ＰＰ２覆盖网络
西安理工大学计算机科学与工程学院，西安７０４１０８
ＳｈｏｆＣｏｕｅｃｅｃ＆Ｅｎｉｅｒｇ， ’ ｎＵｎｖｒｉｆＴｃｎｌｇＸｉａ０４ＣｈａｃｏｌｏｍｐｔｒＳｉｎｅｇｎｅｉＸｉａｉｅｓｙｏｅｈｏｏｙ， ’ ７１０８，ｉｎｔｎｎ
ＡｂｔａｔＧｏｓｐｂｓｄｏｓｒｃ：ｓｉ。ａｅｃｍｍｕｉａｉｎｐｏｏｏｓａｅｅｎｐｌｄｎｃｎｔｃｕｓｕｃｌｅ２ｖｒａｎｔｒｂｔｔｅｒｎｃｔｒｔｃｌｈｖｂｅａｐｉｉｏｓｒｔｎ仃ｔｒｄＰＰｏｅｌｙｅｗｏｋ．ｕｈｉｏｅｕ１ｓｏｅｏｐｌａｉｎａｅｈｌｃｏｘｅｓｖｅｉｃｌｎｌｓｓＴｉｃｐｓｆａｐｉｔｈｖｔｅａｋｆｅｔｎｉｅｍｐｒａａａｙｉ．ｈｓａｅｐｅｅｔａｅｅｃｒｍｅｒｇｓｉ — ａｅｃｏｉｐｐｒｒｓｎｓｇｎｔｆａｗｏｋ，ｏｓｐｂｓｄｉｐｅｓｍｐｉｇｅｖｃｔｉｌｍｅｔｒｌｂｅｎｆｃｅｔａｌｇｅｉｅＵｎｅｅｒｅｒｏｘｌｒａｄｏａｅｅｒａｌｓｒｉｅｏｍｐｅｎａｅｉｌａｄｅｎａｉｉｎｓｍｐｉｓｒｃ．ｄｒｔｆａｗｏｋｔｅｐｏｅｎｃｍｐｒｎｖｈｍｅｇｔｏｉｈｃｍｍｕｉａｉｎｒｔｃ１ｅｅｕｔｏｘｅｍｅｔｓｏｎｃｔｐｏｏｏ．ｒｓｌｏｈＴｓｆｅｐｒｉｎｓｈｗｔａｔｅｉｅｅｔｏｈｔｈｄｆｒｎｃｍｍｕｉａｉｎｒｔｃｌｏｓｒｃｓｕｏｎｃｔｐｏｏｏｃｎｔｔｏｕｏｔｆ

P2P网络的拓扑结构

P2P网络的拓扑结构拓扑结构是指分布式系统中各个计算单元之间的物理或逻辑的互联关系，结点之间的拓扑结构一直是确定系统类型的重要依据。

目前互联网络中广泛使用集中式、层次式等拓扑结构。

Internet本身是世界上最大的非集中式的互联网络，但是九十年代所建立的一些网络应用系统却是完全的集中式的系统，许多Web应用都是运行在集中式的服务器系统上。

集中式拓扑结构系统目前面临着过量存储负载、DOS（Denial of S ervice，拒绝服务）攻击，网络带宽限制等一些难以解决的问题。

Peer-to-Peer (简称P2P) 系统主要采用非集中式的拓扑结构，一般来说不存在上述这些难题。

根据结构关系可以将P2P系统细分为四种拓扑形式：•中心化拓扑（Centralized Topology）；•全分布式非结构化拓扑（Decentralized Unstructured Topology）；•全分布式结构化拓扑（Decentralized Structured Topology，也称作DHT网络）；•半分布式拓扑（Partially Decentralized Topology）。

其中，中心化拓扑最大的优点是维护简单，资源发现效率高。

由于资源的发现依赖中心化的目录系统，发现算法灵活高效并能够实现复杂查询。

最大的问题与传统客户机/服务器结构类似，容易造成单点故障，访问的“热点”现象和版权纠纷等相关问题，这是第一代P2P网络采用的结构模式，经典案例就是著名的MP 3共享软件Napster[1].Napster是最早出现的P2P系统之一，并在短期内迅速成长起来。

它实质上并非是纯粹的P2P系统，而是通过一个中央索引服务器保存所有Napster用户上传的音乐文件索引和存放位置的信息。

它的工作原理如图1所示。

当某个用户需要某个音乐文件时，首先连接到Napster中央索引服务器，在服务器上进行检索，服务器返回存有该文件的用户信息，再由请求者直接连到文件的所有者传输文件。

EIR：具有超级结点的非结构化P2P中多维数据搜索框架研究

收集与维护、Ｉ－ｒｅＥＲｔｅ树的构建与维护等方法和措施。关键词非结构化ＰＰ超级结点，２，多维数据，数据查询，索框架搜
ＥＩ：ＴｅＳａｃｒｍｅｒｆＭｕｔｄｍｅｓｏａｔｓｔｎＵｎｔｕｔｒｄＰＰＮｅｗｏｋｗｉｕｅ－ｅｒＲｈｅｒｈＦａｗｏｋｏｌｉｉｎｉｎｌ－Ｄａａｅｓｒｃｕｅ２ｔｒｔＳｐｒｐｅｏｈ
ＺＥＮＧ－ｎＣＨＥＮｈ— ｎＢｉＱｉｇＺｉＧａＣＨＥＮｎ－ａｗＵｉｈｎＨｅｇＦＲｕ－ｅ１Ｚ
（ｐｒｍｅｔｏｍｐｔｒＥｎｉｅｒＤｅａｔｎｆＣｏｕｅｇｎｅｉｎｇ，ＮａｈｉＣａｐｓｏｔｉａＮｏｍａｎａｍｕ，ＳｕｈＣｈｎｒｌＵｎｉｅｓｔｖｒｉｙ，Ｎａｈｉ２２５）ｎａ８２５（ｌｅｅｏｎｆｒａｉｎＳｉｎｅａｄＥｎｉｅｒｎｏＣｌｇｆＩｏｍｔｏｃｅｃｎｇｎｅｉｇ，ＣｅｔａｕｔｎｖｒｉｎｒｌＳｈＵｉｅｓｔｏｙ，Ｃｈｎｓ１０３ｚａｇｈａ４０８）
摘要在具有超级结点的非结构化ＰＰ系统中，究于具有超２研提级结点的非结构化ＰＰ网络的综合框架，该框架中，够实现对多维数据共享、引以及查询等操作的处理。以２在能索Ｒ—ｔｅｒ索引树为基础，出了一种能够应用于ＰＰ的扩展Ｒ—ｔｅ索引树，ＥＲｔｅ树，究了系统中集群信息的ｅ提２ｒｅ即Ｉ－ｅ研ｒ

计算机四级网络工程师试题库含答案

计算机四级网络工程师试题库含答案一、单选题（共82题，每题1分，共82分）1.数据传输速率为3.5×10 12 bps，它可以记为( )。

A、3.5KbpsB、3.5MbpsC、3.5TbpsD、3.5Gbps正确答案：C2.关于BitTorrent的描述中，正确的是( )。

A、源于MIT的开源系统B、最初的BitTorrent采用DHT技术C、不需要中心服务器D、不需要种子文件正确答案：A3.下列进程间通信的各种方法中，哪一个是“信箱”通信方式（）。

A、在内存中开辟若干区域，发送进程申请一个区域，并将信息送入，然后把它插入到接收进程的相应队列中，之后通知接收进程B、发送进程创建好连接两个进程的一个打开的共享文件，然后写入数据流；接收进程在需要时可以从该共享文件读出数据，写入和读出数据的长度是可变的C、在相互通信的进程之间设一公共区域，一组进程向该公共区域写，另一组进程从公共区域读，通过这种方式实现两组进程间的信息交换D、发送进程首先创建一个链接两个进程的通信机制，然后把信息送入该机制；发送进程和接收进程不直接建立联系，而接收进程可以在任何时刻从该机制中取走信息正确答案：D4.关于交换式以太网的描述中，正确的是( )。

A、基本数据单元是IP分组B、数据传输不会发生冲突C、核心设备是集线器D、需要执行IP路由选择正确答案：B5.处理器中对用户不可见的寄存器是( )。

A、地址寄存器B、条件码寄存器C、数据寄存器D、指令寄存器正确答案：A6.全文搜索引擎功能模块的组成为搜索器、检索器、用户接口和( )。

A、加密器B、交换器C、索引器D、网守正确答案：C7.关于Web服务系统的描述中，正确的是( )。

A、Web采用对等工作模式B、页面到页面的链接信息由URL维持C、Web页面通常符合HTTP规范D、Web的传输协议采用HTML正确答案：B8.从网络设计者角度看，Internet是一种( )。

A、城域网B、广域网C、局域网D、互联网正确答案：D9.某 4 核处理器的计算机系统中共有50个进程，那么，处于就绪状态的进程最多有几个( )。

P2P网络搜索技术

Chord：插入
Node 105
Key 5
K5 K20
N105
Circular ID space
N32
N90
K80
Chord结点加入算法
Chord的自适应需要保持两个不变的属性
每个结点的后继始终正确对每个对象k，结点successor(k)始终负责k的索引
为此，新结点n的加入需要完成几个任务
Chord/CAN/Tapestry/Pastry
目标相同
减少路由到指定文件的P2P跳数
减少每个Peer必须保持的路由状态
算法异同
都保证算法的跳数与Peer群组的大小相关或都指出算法能以高概率完成方法上的差别很小
Chord
每个Peer保持LogN其他Peer的踪迹(N是群组的全部Peer
“N90 has K80”
N32
K80 N90
N60
结点维护一个有m（ID位数）项的路由表，也称“指向表”（finger table），其中第i项指向结点s， s=successor(n+2i-1)，1≤i≤m，即s是在顺时针方向到n 的距离至少为2i-1的第一个结点，记做n.finger[i].node Chord路由表的特点：
1.2.3.4
Napster原理
4.3.2.1 search(A) --> 4.3.2.1
Fetch
Query
Reply
Where is file A?
分布式结构化P2P搜索
分布式结构化P2P搜索
结构化P2P网络中，每个节点都有固定的地址，整个网络具有相对稳定而规则的拓扑结构。依赖拓扑结构可以给网络的每个节点指定一个逻辑地址，并把地址和节点的位置对应起来。

p2p技术

1、什么是P2P技术？并说说明其优缺点点对点技术（point to point，简称P2P）又称对等互联网络技术，是一种网络新技术，依赖网络中参与者的计算能力和带宽，而不是把依赖都聚集在较少的几台服务器上。

P2P网络通常用于通过Ad Hoc连接来连接节点。

这类网络可以用于多种用途，各种档案分享软件已经得到了广泛的使用。

P2P技术也被使用在类似VoIP等实时媒体业务的数据通信中。

P2P网络的一个重要的目标就是让所有的客户端都能提供资源，包括带宽，存储空间和计算能力。

因此，当有节点加入且对系统请求增多，整个系统的容量也增大。

这是具有一组固定服务器的C/S结构不能实现的，这种结构中客户端的增加意味着所有用户更慢的数据传输。

P2P网络的分布特性通过在多节点上复制数据，也增加了防故障的健壮性，并且在纯P2P网络中，节点不需要依靠一个中心索引服务器来发现数据。

在后一种情况下，系统也不会出现单点崩溃。

当用P2P来描述Napster 网络时，对等协议被认为是重要的，但是，实际中，Napster 网络取得的成就是对等节点（就象网络的末枝）联合一个中心索引来实现。

这可以使它能快速并且高效的定位可用的内容。

对等协议只是一种通用的方法来实现这一点。

P2P在安全上的好处：隐私保护与匿名通信在P2P网络中，由于信息的传输分散在各节点之间进行而无需经过某个集中环节，用户的隐私信息被窃听和泄漏的可能性大大缩小。

此外，目前解决Internet隐私问题主要采用中继转发的方法，从而将通信的参与者隐藏在众多的网络实体之中。

在一些传统的匿名通信系统中，实现这一机制依赖于某些中继服务器节点。

而在P2P中，所有参与者都可以提供中继转发的功能，因而大大提高了匿名通信的灵活性和可靠性，能够为用户提供更好的隐私保护。

健壮服务与网络抗毁P2P采用了完全分布式架构，网络中的节点既可以获取其他节点的资源或服务、同时又是资源或服务的提供者，不依赖于少数集中控制节点，具有比传统的Client／Server网络更好的健壮性和抗毁性，成为构建高健壮性网络的有效方式。

P2P网络搜索技术

P2P网络搜索技术一、P2P技术简介（一）概念及特征。

P2P是peertopeer的缩写，是一种用于不同用户PC机之间共享他们所拥有的空闲软硬件资源（处理能力、存储能力、网络连接能力、可共享文件等），可以不经过中心节点直接互相访问和交换信息的技术。

它打破了传统的C/S式，在对等网络中，每个节点都具备客户机和服务器的双重特性，可以同时作为服务使用者和服务提供者。

与其他网络模型相比较，P2P有分散化、可扩展性和健壮性好、高性能等优点。

P2P技术目前的主要应用：文件共享与交换、协同工作、搜索引擎、分布计算、智能代理。

（二）P2P与C/S的区别。

每个对等点具有相同的地位，同时扮演着服务器和客户端两个角色，还具有路由和缓冲的功能。

P2P中每个结点可以很容易加入系统中，其中任一结点可以利用网络上其他对等体的信息资源、理器周期、速缓存和磁盘空间，P2P是基于内容的寻址方式。

P2P模式最主要的优点就是资源的高度利用率，所有节点的资源总和构成了整个网络的资源，整个网络可以被用作具有海量存储能力和巨大计算处理能力的超级计算机。

而且对等点越多，网络性能越好，网络随着规模的增大而越稳固。

信息在网络设备节点间直接流动，高速即时，降低中转服务成本。

但P2P也有些不足，P2P不易管理，对等点可以随意的加入或退出，会造成网络带宽和信息存有的不稳定。

二、P2P的几种搜索技术（一）P2P搜索的几种基本方式1、Index集中式架构。

存有一个提供索引功能的节点，这个节点的索引储存了资源所在的位置信息，给定资源的某种查询条件，索引可以迅速找出符合条件的资源及其所在的位置2、Hash分布式结构。

这种方式要求每一个资源都可以通过某种hash算法找到一个唯一的地址，发布资源时资源不是保存有本地，而是保存有这个资源hash后的地址所对应的节点中。

3、Flooding分布式架构。

这种方式要求每个节点都有查询本地资源的能力，每个节点都有d个邻居，这些节点之间通过邻居关系构成一个连通的网络。

纯分布式P2P网络结构浅析

纯分布式P2P网络结构浅析作者：刘凯张华来源：《电脑知识与技术》2012年第36期摘要：P2P（Peer-to-Peer）是现今广泛使用的一种网络模型，非结构化P2P模型和结构化P2P模型是其中两种基本拓扑结构。

非结构化模型一般使用洪泛方法实现，结构化P2P网络一般使用分布式哈希表构建。

该文在分析两种P2P网络的基础上，对比了结构化P2P模型和非结构化P2P模型中的典型案例的实现过程，并对其优缺点进行了总结。

关键词：P2P；洪泛；分布式哈希表中图分类号：TP393 文献标识码：A 文章编号：1009-3044（2012）36-8631-031 研究背景二十一世纪以来，信息技术迅速发展，互联网上的信息量快速增长，根据Google公司的报道，到2005年，Google已经索引了80.6亿个页面和10亿以上的图片，如何有效管理这些信息是一个热点和难点问题。

当前，互联网程序主要使用客户机/服务器（C/S）和浏览器/服务器（B/S）模式，这两种模式都以服务器为中心，由服务器负责存储资源和提供服务。

但随着互联网的发展，两种模式中服务器的负载越来越重，服务器成了发展的瓶颈，同时应用程序对服务器依赖性较大，一旦服务器出现故障，整个系统都面临崩溃。

P2P的出现，使得消除服务器为中心的网络瓶颈成为了可能。

最近几年，P2P计算已称为计算机中的热门话题之一。

P2P网络是一种分布式的网络，它打破了传统的C/S和B/S模式，在网络中每个计算机的功能和地位都是对等的，每个计算机既为其他用户提供服务，也想用其他用户所提供的服务，在P2P中，所有的运算、存储等都分布在各个计算机上，这样就减少了对服务器的依赖，减轻了服务器的负载。

2 P2P网络结构P2P系统一般要构造一个拓扑结构，在这个结构中需要解决节点命名，出错恢复和数据查询等问题，现有的P2P网络结构有以下几种：2.1混合型的P2P结构这种结构并不是完全的分布式P2P，这种结构中仍然有服务器的存在，不过服务器的作用发生了改变，和传统的C/S相比，此时服务器仅祈祷促成各种节点协调和扩展的功能，一般这种服务器我们称为索引服务器。

非结构化P2P网络的一种改进搜索算法

分析比较，表明改进后算法的高效性和可行性。
关键词：非结构化Ｐ２Ｐ网络；洪泛法；冗余查询包；搜索算法；模拟
中图分类号：ＴＰ３９３文献标识码：Ａｄｏｉ：１０．３９６９／ｊ．ｉｓ５．２０１３．１２．０１２
主要的搜索算法＿６。洪泛法的优点是算法思想简单，但是一个致命的缺陷是会产生冗余的查询数据包（下文中简称查询包），大量的冗余查询信息可能成为网络瓶颈而限制网络的性能，比如网络中资料利用率的下降和搜索效率的降低［８。。。
２０１３年第１２期文章编号：１００６－２４７５（２０１３）１２－００４４－０４
计算机与现代化ＪＩＳＵＡＮＪＩＹＵＸＩＡＮＤＡＩＨＵＡ
总第２２０期
非结构化Ｐ２Ｐ网络的一种改进搜索算法
叶培顺
（榆林学院信息工程学院，陕西榆林７１９０００）摘要：分析非结构化Ｐ２Ｐ网络中利用原始的洪泛法进行资源搜索时产生冗余查询包的原因，提出整改的措施和优化的机
制，在此基础上给出改进的搜索策略，同时设计出一种更好的分段搜索算法，并对其进行实验仿真，通过和洪泛法的模拟
ＩｍｐｒｏｖｅｄＳｅａｒｃｈＡｌｇｏｒｉｔｈｍｆｏｒＵｎｓｔｒｕｃｔｕｒｅｄＰ２ＰＮｅｔｗｏｒｋ
ＹＥＰｅｉ．ｓｈｕｎ

Chord算法（原理）

Chord算法（原理）算法是P2P中的四⼤算法之中的⼀个，是有MIT（⿇省理⼯学院）于2001年提出，其它三⼤算法各⾃是：Chord的⽬的是提供⼀种能在P2P⽹络⾼速定位资源的的算法，Cord并不关⼼资源是怎样存储的，仅仅是从算法层⾯研究资源的取得，因此Chord的API就简单到仅仅有⼀个set、get。

1、Chord是什么？Chord是⼀个算法，也是⼀个协议。

作为⼀个算法，Chord能够从数学的⾓度严格证明其正确性和收敛性；作为⼀个协议，Chord具体定义了每⼀个环节的消息类型。

当然，Chord之所以受追捧，另⼀个主要原因就是Chord⾜够简单，3000⾏的代码就⾜以实现⼀个完整的Chord。

Chord还能够被作为⼀个⼀致性哈希、分布式哈希（DHT）的实现。

2、覆盖⽹络（overlaynetwork）是指这样⼀种⽹络：构建在其它⽹络之上、⽹络节点之间通过虚拟或逻辑连接在⼀起，⽐⽅云计算、分布式系统都是覆盖⽹络，由于其都构建于TCP/IP之上，且节点之间有联系。

Chord也是构建于覆盖⽹络。

3、结构化与⾮结构化⽹络⾮结构化的P2P⽹络是指⽹络节点之间不存在组织关系，节点之间全然是对等的，⽐⽅第⼀代P2P⽹络Napster，这类⽹络结构清晰、简单，但查找没有多⼤的优化余地，常常採⽤全局或分区泛洪查找，查找时间长、且结果难以保证（有可能在找到前就超时）。

结构化的P2P⽹络与⾮结构化恰好相反，我们觉得⽹络在逻辑上存在⼀个⼈为设计的结构，⽐⽅Chord假定⽹络是⼀个环，Kadelima则假定为⼀颗⼆叉树，全部的节点均为树的叶⼦节点。

有了这些逻辑结构，就给我们资源查找引⼊了很多其它的算法和思路。

4、分布式哈希表（DHT）的主要想法是把⽹络上资源的存取像Hashtable⼀样，能够简单⽽⾼速地进⾏put、get，该思想的诞⽣主要是受第⼀代P2P（Napster）⽹络的影响。

与⼀致性哈希相⽐，DHT更强调的是资源的存取，⽽⽆论资源是否是⼀致性的。

计算机网络P2P

11
无结构P2P网络的特点
• 覆盖网拓扑结构无结构，指覆盖网没有固定、严格的拓扑结构，而是一个随机生成、松散组织的普通图，但总是符合某种模型的一种结构。 a.小世界模型：指任一两个网络节点间的距离很短，并且对每个节点而言，其邻居节点相识（互相连接）的频率很高，所以节点集群现象明显。 b.幂律模型：网络中拥有连接数L的结点占网络结点总数的份额正比于L-a ,a是取决于网络本身的常数因子，因此网络中大多数结点连接数很少，少数结点连接数很多。
资源的发布不接受两个角色合二为一，在生产和消费资源的角色上是对等的
P2P网络中无中介、等级、格式、区域和平台的限制，相互乊间直接交换信息和服务
可充分利用个人计算机的软硬件设备，信息和服务在节点间传输时交互的对象及接收的目标是确定的、有效的
无服务器参不空间分配，可提供实时的、可升级的信息
33
BitTorrent
传统下载方法不BT下载比较
HTTP、FTP下载原理
BT下载原理
BT下载：作为服务器的Peer把文件传给其他的Peer后，各个Peer之间也进行交互传。这样，单一的下载源就变成了多个源，Peer越多，彼此之间交互的范围和数量也就越大，下载速度也就越快。
34
BitTorrent
USENET的出现
丌对外提供应用服务，也丌存放仸何实体资源，只是作为实体资源的目录戒索引而存在
Napster的兴起
8
9
Napster客户端
Napster客户端
向索引服务器请求MP3文件
Napster客户端中央索引服务器
需要下载 MP3 文件的主机
Napster客户端
此主机上有所请求的MP3文件 Napster客户端

【国家自然科学基金】_非结构化p2p_基金支持热词逐年推荐_【万方软件创新助手】_20140803

科研热词 p2p网络非结构化p2p网络激励机制对等网络 p2p 虚节点稳定性点播异步传输子节点可扩展性分布式哈希表信任模型非结构化对等网非结构化p2p系统非结构化p2p 非结构化随机算法随机技术随机多图链路利用率路由延迟超级节点资源查找语义覆盖网络语义检索计算机应用覆盖网络覆盖算法被动蠕虫节点异构性聚类索引副本表稀缺资源索引副本扩散机制(nlir)算法稀缺资源移动agent 生日悖论混合式p2p网络模型查找的响应时间本体服务信任映射无偏抽样搜索算法搜索策略搜索命中率惩罚机制性能分析平衡点平衡二叉树对等网对等系统
2008年序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44
科研热词对等网络非结构化p2p 连接度超级节点洪泛对等计算 p2p网络非结构化路由算法资源查询资源共享资源信息服务覆盖网虚拟计算环境(ivce) 自治域系统聚类域联合授权策略迭代移动自组网移动代理模型搜索负载搜索时间拓扑误配拓扑失配投票应用层组播层次分析法(ahp) 对等组委托授权分布式文件共享分层非结构化p2p 免疫细胞信息缓存信息检索体系结构 web服务发现 super-peer层资源发现 p2pstreaming p2p markov决策过程 k+查询树 grid-p2p gnutella
推荐指数 5 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

P2P网络的搜索算法分析

P2P网络的搜索算法分析摘要：P2P网络的搜索算法是P2P技术的一个重要研究领域。

通过对P2P网络搜索算法定义和研究意义的介绍，让读者概略地了解此种搜索算法；并且通过对其分类，展示了其发展的过程；最后，通过典型P2P搜索算法的分析，进一步说明了其优越性和发展前景。

关键词：P2P；搜索算法；泛洪；ＤＨＴ1什么是P2P网络的搜索算法P2P是英文Peer to Peer（对等）的简称，又被称为“点对点”。

“对等”技术是一种网络新技术。

P2P技术可以不通过服务器的中转而实现计算机系统之间资源和信息的直接共享。

P2P 技术研究的一个重要分支便是搜索算法的研究。

P2P搜索算法即指基于P2P网络结构的搜索方式。

它的存在形式导致其与现有搜索技术有了很大的不同。

由于P2P 网络资源分散性极强，分布于各个节点；节点允许自由进退，资源不断变化处于动态。

而这两方面都使得P2P网络搜索的难度大大地增加。

2P2P网络搜索算法的分类对比2.1集中式集中式的搜索是以目录服务器为中心的搜索方式。

目录服务器会记录下网络中共享资源的所有信息并且会对对这些共享资源逐一进行索引和查找。

集中式搜索里，所有的对等点和已经知道地址的目录服务器都相互连接，因此，目录服务器会记下每个对等点的加入或离开，并随之更新系统索引表。

集中式搜索具有诸多优势，例如：搜索的速度快、内容全面，搜索过程中需要的信息量小，节省网络带宽等等。

但是，不容忽视的是，集中式搜索也有其自身无法克服的缺陷：由于中央服务器的瘫痪容易造成其整个网络的崩毁，因此大大降低了其搜索的可靠性和安全性；另外，中央目录服务器的更新维护费用都会由于网络规模的扩大而急剧增加，致使所需成本也大大提高；再有就是中央服务器的存在引起了共享资源在版权上的划分不清纷争不断，也因此这种搜索成为了非纯粹意义的P2P 网络模型。

2.2分布式搜索能够解决集中式搜索所具有以上的问题。

与集中式搜索相比较，分布式搜索没有目录服务器，或者说每个对等点都可称为一个服务器；每个对等点都具有相似的功能；对等点通过彼此相连串联起整个网络体系，依靠其所在的网络来搜索确定其余对等点和搜索资源。

一种有效的非结构化P2P网络资源搜索策略

慢，降低了系统的效率Ｌ。２Ｊ
１常见的非结构化ＰＰ网络资源搜索策略２
非结构化ＰＰ网络的基本搜索算法是洪泛２（ｌｄｇ算法，Ｆｏｉ）ｏｎ该算法的特点是路由时进行全网络遍历的盲搜索，网络的拓扑没有固定的结构，各个节点需要维护一个记录邻居节点的路由表，来传递查询消用息。当网络中的某个节点发出查询请求时，首先向它所有的邻居节点传输查询信息，如果某个邻居节点有符合条件的资源，响应该查询请求，便否则，居节点邻
李春秀，方爱刘
（东师范大学信息科学与工程学院，东济南２０１）山山５０４
摘
要：针对非结构化ＰＰ网络资源搜索算法中冗余消息数过多、２搜索效率低等问题，出了一种基于邻居一邻居节点的提
非结构化ＰＰ网络资源搜索策略，策略可以在一定程度上防止路由环路的产生，２该同时综合考虑邻居节点的活跃度和资源命中数，下一条邻居节点路径转发查询消息，查询信息发往目标可能存在的区域，选择将因此减少了发往网络的查询信息包数量，了网络带宽。实验结果表明，法可以减少大量的冗余查询信息，高资源搜索的成功率，一种有效节省该算提是的非结构化ＰＰ网络资源搜索策略。２
能力的不断增强，ｅｒｏｅｒ简称ＰＰ作为一种Ｐｅ—ｔ —Ｐｅ（２）

chord算法解析

直接从peer下载，不再需要经过目录服务器！！
2.1.2 基于目录服务器的P2P网络： Napster(4)
特点
索引发布和内容定位通过目录服务器进行,因此查询简单、高效，但是和客户/服务器模式一样，目录服务器存在瓶颈和单点失效问题，而且可扩展性差
2.1.3 层次P2P网络： KazaA(1)
SHA-1(“202.38.64.2”) =e1d9b25dee874b0c51db4c4ba7c9ae2b766fbf27
2.2.2 DHT原理(1)
将内容索引抽象为<K, V>对
K是内容关键字的Hash摘要
K = Hash(key)
V是存放内容的实际位置，例如节点IP地址等
但是内容定位(也称为索引查询)或者采用泛洪,或者采用目录服务器的方式,缺乏有效的、可扩展的索引查询机制，不能满足大规模网络的需求
2.2 几种结构化P2P
Chord Pastry CAN Tapestry
基于分布式Hash表 (DHT： Distributed Hash Table )
结构化P2P: 直接根据查询内容的关键字定位其索引的存放节点
层次P2P网络
Peer根据能力的不同，例如是否拥有足够强的计算存储能力，是否拥有公网IP，分为超级节点和一般节点
超级节点之间构成完全分布式的P2P网络超级节点和其所连接的一般节点构成基于目录服务器的P2P网络，
其中超级节点具有目录服务器的功能
2.1.1 完全分布式的P2P网络： Gnutella(1)
拥有 xyz.mp3的节点 1.2.3.4
应答
Value=1.2.3.4
谁拥有xyz.mp3?
2.1.3 层次P2P网络： KazaA(3)

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Directory Server
User
User
集中模型的优点和缺点
优点：结构简单便于管理资源检索响应比较快（不同情况不一定）管理维护整个网络消耗的网络带宽较低
集中模型的优点和缺点
缺点：服务器承担所有的检索工作，负载过重不完全符合P2P的原则服务器上的索引不能及时更新，检索结果不精确服务器受到攻击时，对服务影响较大容易受版权限制穿透防火墙能力差
混合模型同时吸取了完全分散式模型和层次模型的优点，构建高效的混合拓扑结构需要同时涉及这两种模型的问题。对于超级节点组成的完全分散式网络，更好的gossip协议和智能的TTL选择方法可以改善网络负载和搜索覆盖率的平衡性。超级节点的选取算法也影响混合P2P网络的服务质量。
P2P相关其他问题
混合模型
混合模型可以利用完全分散式模型在节点数不多时实现的高分散性，鲁棒性和高覆盖率。也利用层次模型对大规模网络提供可扩展性。在完全分散式模型中，TTL＝5时，网络的规模不超过20000，性能是较好的，如果每个超级节点管理50－200个普通节点，整个网络规模是可观的。
混合模型研究的重点
node ttl=4 ttl=5 ttl=6
Random Walk 覆盖率
newscast协议使用不同TTL的覆盖率
层次化模型(MBone)
在层次化模型中，把参与服务的部分性能较好的节点选出作为超级节点，超级节点管理普通节点，超级节点再由更高级一级的超级节点管理，构成层次化的结构。超级节点保存子节点的文件索引信息。
Random Walk
采用newscast协议(gossip的一种)得到的最大深度
10 9
hop
8 7 6 5
1
5
9
13
17
21
25
29
33
37
41
45
49
53
57
61
65
69
73
77
81
85
89
93
1E+04 最大深度
97
rate
100 20 40 60 80 0
5000 10000 15000 20000 25000 30000 35000 40000 45000 50000 55000 60000 65000 70000 75000 80000 85000 90000 95000 1E+05
混合模型
在完全分散式模型中，TTL＝5时，网络的规模不超过20000，网络覆盖率是相当高的
混合模型
层次化模型中，处于底层的超级节点是比较容易维护的，某个这种超级节点的离开对网络的影响不大。混合模型的思想是，把整个P2P网络建成一个二层结构，由普通节点和超级节点组成，一个超级节点管理多个普通节点，超级节点直接使用gossip协议构成完全分散式模型。
非结构化P2P网络
内容
1. 2. 3. 4. 5.
介绍集中模型: Napster 分散模型: Gnutella 层次化模型混合模型
介绍பைடு நூலகம்

集中模型(Napster)
分散模型Gnutella) 层次化模型(MBone) 混合模型(EDonkey)

集中模型: Napster
User User
分散模型：Gnutella
完全分散式P2P文件共享系统：没有中央索引服务器，所有的节点都是平等的，节点不仅提供文件下载服务，也提供文件搜索服务。搜索文件时，搜索请求遍历整个P2P网络，拥有相关文件的节点返回搜索结果。
分散式P2P路由

技术:

Flooding Replication & Caching Time To Live (TTL) Epidemics & Gossiping protocols Random Walkers & Probabilistic algorithms
层次化模型的优点和缺点
优点：相对于集中模型，索引信息不是保存在中央服务器上，不会产生服务器瓶颈，索引信息同步较快，相对于完全分散式模型，信息检索不会给网络造成较大流量。缺点：层次化模型对于非结构化网络，维护整个网络比较困难，特别是处于结构的顶层的节点在离开网络后，对网络的影响比较大，重构网络比较复杂。
安全性数据传输控制分散节点管理 P2P网络的测量和统计 P2P网络模拟移动P2P
分散式P2P路由
Hostcache Server H e.g. :6346
Gnutella Network N
Request/Receive a set of Active 1 Peers
!
Servent p
2 Connect to network
完全分散式模型的优点和缺点
优点：所有的节点都参与服务，不存在中央服务器，避免了服务器性能瓶颈部分节点受攻击不影响服务搜索结果比较及时，有效性比较强。
完全分散式模型的优点和缺点
缺点：采用flooding方式传播搜索请求，造成网络额外开销比较大，随P2P网络规模的扩大，网络开销成指数级增长。TTL =4, 5, 6, 7 , 8时， cache（20），msglen(100B), （每条请求） 16MB, 320MB, 6.4GB, 128GB, 2.56TB （每秒请求数随网络规模的扩大，是很可观的）搜索请求遍历整个P2P网络需要经过很多跳，完整的获得搜索结果延迟比较大。防火墙穿透能力差
rate
100 20 40 60 80 0
5000 10000 15000 20000 25000 30000 35000 40000 45000 50000 55000 60000 65000 70000 75000 80000 85000 90000 95000 1E+05
node ttl=4 ttl=5 ttl=6