博弈论框架下P2P系

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2011/11/1
同类用户系统中的Nash 同类用户系统中的Nash均衡 Nash均衡
假设在同类用户系统中每个参与者都从其他用 户那里得到相等的收益b,即对于所有i≠j,有 bi=bav=b(N-1),则
ui = −di + p(di )∑bij d j
j
u=-d+p(d)db(N-1)
讨论最简单的2个参与者的对称系统,则
用户的下载权限与他向系统所做的贡献成正比
2011/11/1
Nash均衡的引入 Nash均衡的引入
P2P网络中用户愿望: 希望最大限度地从网络系统中获益 假设每个博弈的人都是理性 理性的人,则 理性 选取某策略后,任意博弈方都不愿单独改变其策略, 因为每个参与者均不能因单方面改变自己的策略而获 每个参与者均不能因单方面改变自己的策略而获 利,只会使得他的当前利益减少,所以谁也没有兴趣 主动打破这种均衡 均衡,此时,便达到了Nash均衡 均衡。 均衡 均衡
* • 若bc=b,只有一个解: d1* = d 2 = 1
• 若b<b,不存在均势 • 若bc>b,有两个解,即可能有两个均势:
* * d1* = d 2 = d lo < 1
* * d1* = d 2 = d hi > 1
2011/11/1
Nash 均势的稳定性
假设参与者P2初始贡献为d2
P1对此最佳反应将是d1,设为d2的反函数r1(d2)
2011/11/1
b ij = B ij / c i
bi =

j
b ij
b av =
1 N

i
bi
• 差异服务概率函数P(di):Pj接受Pi下载文件请求的概率 差异服务概率函数P(d
dα p (d ) = 1+ dα
α >0
用户的贡献越小,他的请求就越可能被拒绝
2011/11/1
基于Nash 基于Nash均衡的激励模式 Nash均衡的激励模式
2011/11/1
Nash均衡的概念 Nash均衡的概念
Nash均衡,又称为非合作博弈均衡,是指博 弈中的每个参与者,真正成功的措施是针对其 他参与者所采取的每次行动,相应地采取最有 利于自己的反应。这样,每个参与者采取的策 略必定是他对于其他参与者策略的预测的最佳 反应。
2011/11/1
基于Nash 基于Nash均衡的激励模式 Nash均衡的激励模式
几个重要参数: • Nash贡献Di:用户共享的资源 Nash贡献D 贡献
定义无量纲di:di=Di/D0 D0(常量)为用户最少贡献量
• 用户总收益:ci*Di 用户总收益:
ci为每贡献一个单位的资源所获得的价值
• 价值矩阵Bij:Pj的贡献对Pi产生的价值 价值矩阵B
如果Pi对Pj的贡献不感兴趣,则Bij=0,一般有,Bij>=0,Bii=0
已知
b12 = b21 = b

* d1* = d 2 = d *,所以
仅且仅当b≥4≡bc时,有
d * = (b / 2 − 1) ± ((b / 2 − 1) 2 − 1)1/ 2
2011/11/1
同类用户系统中的Nash 同类用户系统中的Nash均衡 Nash均衡
在p(d)=d/(1+d)的条件下,bc=4就是激励参与者加 入系统的临界值。p(d)表达式不同,临界值bc也不同。 但临界值bc独立于系统中参与者的数量, bc独立于系统中参与者的数量 但临界值bc独立于系统中参与者的数量,即系统规模 大小不会影响临界值。 大小不会影响临界值。
图3
问题。
2011/11/1
2011/11/1
2011/11/1
Backdrops:
www.animationfactory.com
- These are full sized backdrops, just scale them up! - Can be Copy-Pasted out of Templates for use anywhere!
r2 ( d 1 ) ≡ d 2 = b 21 d 1 − 1
2011/11/1
同类用户系统中的Nash 同类用户系统中的Nash均衡 Nash均衡
( 因此,只要 d1* , d 2*)满足
* d1* = b12 d 2 − 1 * d 2 = b21d1* − 1
则存在Nash平衡 Nash平衡 Nash
2011/11/1
仿真结果分析
Nash均衡收敛仿真: Nash均衡收敛仿真: 均衡收敛仿真
• 均势贡献dav*随着利益b的增大单调 递增;当bav<bc时不断地迭代将使di趋 向0。
• 用户个数分别是500和1000的曲线大 体上是重合的,这说明所得结论并不受 系统大小的限制和参与者个数的影响, 因而在实际应用中不必考虑网络规模等
1)仅下载文件,而不为其他用户提供任何形式的下载服务。 2)仅下载文件,只为其他用户提供低质量的下载服务。 解决方法
引入激励模型
2011/11/1
传统的激励模型
•支付虚拟/真实货币(Micro Currency)模式
以“贡献资源挣积分,获取资源花积分”为准则
2011/11/1
传统的激励模型
•提供差异服务质量(Qos)模式
博弈论框架下P2P系统中的激励模型 博弈论框架下P2P系统中的激励模型 P2P
1. P2P网络传统激励模型 2. Nash均衡的概念 3. 基于Nash均衡的激励模式 4. 同类用户系统中的Nash均衡 5. 异类用户系统中的Nash均衡
2011/11/1
P2P网络特点:自组,自治,自愿
结果
广泛存在的free-riding现象,即:
u1 = − d1 + b12 d 2 p ( d1 )
u 2 = − d 2 + b21 d1 p ( d 2 )
假设p(d)=d/(1+d),P2贡献为d2,当然P2希望最大可能地从系统中受 益,因而
r1 ( d 2 ) ≡ d 1 = b 12 d
2பைடு நூலகம்
−1
是P1对P2的贡献做出的最好反应策略。同理,P2对P1的策略 就为
r1(d2) r2(d1)
稳定点
P2再次调整贡献,为的d1的反函数r2(d1)
d2 d1
不稳定点

d1* = r1 (r1 (r1 (L (d 2 ))))
* d 2 = r2 (r2 (r2 (L (d1 ))))
2011/11/1
异类用户系统中的Nash 异类用户系统中的Nash均衡 Nash均衡
同类用户是不现实,因此,结合实际必须考 虑异类用户系统的情况,这时
d i* = [ ∑ bij d * ]1 / 2 − 1 j
j≠i
异类Peer 系统Nash 均衡的一些性质 异类用户系统Nash 均衡与同类用户系统Nash均衡的比较
2011/11/1
仿真结果分析
图1 图2
图1和图2是500个异类参与者在系统中收益bij和贡献d*的分布情况。 图1中bij成Gamma(伽马)分布对应的bav=6.0。 图2为贡献d*的分布,其平均值dav*=3.64。 在同类用户系统中b=bav/(N-1),可计算出dhi*=3.73,与仿真试验结果只 相差了1.8% 。 表明在异类用户系统中各个参与者不断调整贡献的过程最终也会汇聚在 Nash 均衡点dhi*
• 效用函数Ui:U i = −ci Di + p(di )∑ Bij D j 效用函数U
j
第1项表示加入系统需要付出的代价,第2项是可从系统得到的收益 定义无量纲ui:u
i
=
U i ciD 0
,即 ui = −d i + p(d i )∑ bij d j
j
由P(0)=0,P(∞)=1,可知:
d i →0
lim ui = 0
d i →∞
lim ui = −∞
可见,无限增大贡献di,并不能无限地提高效用ui,直观地解释就 是参与者贡献越大,得到的服务质量就越好,但是参与者从系统中得 到总的收益并不是随着其贡献的增加无限增大的,而是有一个最大值。 前提是有一系统临界值bc,当bi>bc时效用函数才有可能取到最大。
相关文档
最新文档