11博弈9

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2011-9-28中南财经政法大学周月梅1争取自己快乐的同时给他人快乐,
不折不扣地进行帕累托改进,
来增加快乐的总量
.
§2.4纳什均衡的选择
纳什均衡在相当广泛的博弈类型中普遍存在,保证了这个均衡概念在博弈分析中的作用和地位。

纳什均衡也是分析其它类型博弈的核心均衡概念,如子博弈完美纳什均衡、完美贝叶斯均衡和贝叶斯纳什均衡等。

本身都是纳什均衡,实际上都是纳什均衡的某种精练。

2011-9-28中南财经政法大学周月梅2
2011-9-28中南财经政法大学周月梅3•一个博弈可能有多个均衡:
纳什均衡的多重性的问题:博
弈论并没有一个一般的理论
证明纳什均衡结果一定能出
现。

但也还是根据不同的理
念有一定的选择标准。

1,20,00,02,1芭蕾小丽
大海
足球芭蕾足球
1、帕累托上策均衡
•Pareto效率准则——经济的效率体现于配置社会资源以改善人们的境况,主要看资源是否已经被充分利用。

如果资源已经被充分利用,要想改善任何人都必须损害别的人,那么这个经济已经实现了帕累托效率。

相反,如果还可以在不损害别人的情况下改善一些人的境况,就说明经济资源尚未被充分利用,就不能说这个经济已达到Pareto效率。

2011-9-28中南财经政法大学周月梅4
帕累托最优状态是既定的资源配置状态的改变无法使得至
少有一个人的状况变好,而没有使任何人的状况变坏。

虽然有些博弈中存在多个纳什均衡,但很可能这些纳什均衡有明显的优劣差异,所有博弈方都偏好其中同一个纳什均衡。

该纳什均衡称为“帕累托上策均衡”。

国家2
战争和平
1战争
国家
和平
8 , -10-5 , -5
10 , 10-10, 8
容易看出,这个博弈中有两个纯策略纳什均衡,分别为(战争,战争)和(和平,和平)。

其中(和平,和平)是帕累托上策均衡。

2011-9-28中南财经政法大学周月梅5
2011-9-28中南财经政法大学周月梅6
•例如:猎人博弈
此博弈存在两个NE :一起打鹿得(10,10)和各自去打兔得(4,4)。

(4,4)
(4,0)兔(0,4)(10,10)鹿
兔鹿乙

•比较(10,10)与(4,4),明显,两人一起去猎鹿的盈利比各自去打兔的盈利要大得多。

甲、乙两人一起猎鹿得(10,10)为NE,比两人各自去打兔得(4,4)的NE具有Pareto优势。

Ø因此,猎人博弈的结局,最大可能是具有Pareto优势的那个NE,甲、乙一起猎鹿得(10,10)。

2011-9-28中南财经政法大学周月梅7
2011-9-28中南财经政法大学周月梅8注意:
I.
具有Pareto 优势的纳什均衡是各博弈方都得到改善的策略组合;
II.在博弈之前,博弈方预先交流会增加
Pareto 最优均衡的可能性;
III.风险优势的从属地位。

我的观点——“只要NE A 比NE B 具有一点Pareto 优势,那么NE B 比NE A 具有很大的风险优势,也认为将发生的是A 而不是B ”,这和常识背离,因而上述只是经济学研究的理性行为。

2011-9-28中南财经政法大学周月梅9
•例如行贿博弈:(7, 7)(8,0)
不受(0,8)(9,9)受
不受受乙
甲(2,2)(3,0)不受(0,3)(9,9)受不受受乙甲高薪格局低薪格局IV.Pareto 最优均衡的不足。

如何协调?
•仅仅“理性”是不够的;
•帕累托最优均衡:可以通过协商选择一个纳什均衡;cheap talking;
•文化与制度
•行业组织;
2011-9-28中南财经政法大学周月梅10
帕累托最优均衡
3.5“5.5“3.5“ 5.5“8, 83, 2 2, 36, 6
(3.5“,3.5”) 帕累托优于(5.5“,5.5”)
Cheap talk 可以
帮助协调到一个
帕累托最优均衡
2011-9-28中南财经政法大学周月梅11
2011-9-28中南财经政法大学周月梅12
猎人博弈和帕累托优势:4,44,00,410,10打兔猎人乙猎人甲猎鹿打兔猎鹿Ø有两个纳什均衡:
(猎鹿,猎鹿)与(
打兔,打兔);Ø可以认为:
(猎鹿,猎鹿)比(
打兔,打兔)有帕累托优势
2、聚点均衡
其实多重纳什均衡的困难,主要还在于不存在帕累托上策均衡。

如性别之争博弈的三个纳什均衡中,除了混合策略纳什均衡明显较差以外,两个纯策略纳什均衡之间不存在帕累托效率意义上的优劣关系,一个对大海有利,另一个则对小丽有利,因此两个博弈方究竟会怎么选择很难进行判断。

此类博弈问题其实是很多的,凡是涉及利益分配、合作条件等的博弈问题,都可能属于这种情况。

聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性。

2011-9-28中南财经政法大学周月梅13
Nash均衡:聚点(focal points)
在以下的选择中,如果你的选择与其他博弈方的选择一致的次数越多,你就赢得越多,那么,请问你在博弈中将采取什么战略?
(1)选择下述一个数并画圈:7,100,13,261,99,666。

(2)你要在中南财大与一个没有来过中南财大的高中同学会面,应在什么公共地点碰头?
(3)选择下述一个数并画圈:14,15,16,17,18,100。

(4)你与他人一起分蛋糕,你们各自报出期望分到的比例,但如果你们报的比例之和超过100%,大家都将一无所获。

2011-9-28中南财经政法大学周月梅14
2011-9-28中南财经政法大学周月梅
廉价磋商-“协调博弈”
•尽管无法保证磋商会达成一个协议,即使达成协议也不一定会被遵守,但在一些博弈中,事前磋商确实可以使某些均衡实际上出现。

B A U D 7,78,00,89,9R B
A U
D
L
聚点
法律和社会规范如何协调预期•法律和社会规范就是这种协调预期的规则,帮助人们在多个纳什均衡中筛选一个特定的纳什均衡。

社会规范是通过习惯、长期的交互博弈产生的行为规则,法律是立法机关制定的行为规则,但不论是法律还是社会规范,它们的功能都是协调预期。

2011-9-28中南财经政法大学周月梅16
交通博弈与交通规则
靠左行靠右行
靠左行靠右行
1,1
1,1
-1,-1 -1,-1
2011-9-28中南财经政法大学周月梅17
文化的冲突与协调
•为什么欧洲大陆的交通规则收敛于一致?
•英国将如何办?
•文化冲突,无论是组织和组织之间的,还是国家和国家之间的,大部分不过是游戏规则――社会规范和法律的冲突。

用博弈论的话来说,是一个均衡的选择问题;•全球化意味着资源的重新分配。

2011-9-28中南财经政法大学周月梅18
解决规则冲突的三个方式
•一是一个规则取代其他的规则。

让一部分人改变行为规范适应另一部分人,也就是所谓的“接轨”,如前面讲的欧洲大陆交通规则的演变所显示的。

•二是建立全新的规则。

如中国人和德国人在一起交流时都用英语,而不是中文,也不是德文;•三是建立协调规则的规则。

如“入乡随俗”,“客随主便”。

•究竟哪一种,与规则要解决的问题有关,也与其他因素有关。

2011-9-28中南财经政法大学周月梅19
一致与冲突
先走后走先
走后走-1,-12,1 1,2-1,-1
进门博弈
2011-9-28中南财经政法大学周月梅20
文化既解决冲突又协调预期
•尊老爱幼;
•妇幼保护;
•遵师重教;
•先来后到;
•社会分层与非对称权力(排位问题;黑社会组织);
•公平观念(如分蛋糕博弈);
•抓阄;
2011-9-28中南财经政法大学周月梅21
2011-9-28
中南财经政法大学周月梅
22
分蛋糕问题与公平观念
x1
x2
0.5
0.5
信息与身份(identity)
•信息对预期的协调很重要:如果不知道谁
是谁,协调就很困难;
•身份是传递信息的重要工具;
•身份的外在化:服饰,车座,秘书;
•学界的官本位问题;
为什么制度要有稳定性?
•制度是为了稳定预期,频繁的变化会打乱人们的预期;
2011-9-28中南财经政法大学周月梅23
2011-9-28
中南财经政法大学周月梅
24
3、风险上策均衡
帕累托上策均衡并不是有强制力的法则。

因此完全理性的决策者也不一定会选帕累托上策均衡。

8 , 0
9 , 97 , 7
0 , 81
U D
博弈方博弈方2
L R
有两个纯策略纳什均衡(U ,L)和(D ,R)。

称(D ,R)是这个博弈的—个“风险上策均衡”。

2011-9-28
中南财经政法大学周月梅
25
例如:串谋博弈
7,7
8,0
不作弊
0,89,9作弊不作弊作弊乙甲n 用划线法可求得这个博弈存在两个纳什均衡:
(作弊,作弊)、(不作弊,不作弊),
那么,哪一个发生的可能性较大呢?
2011-9-28中南财经政法大学周月梅26
•先考虑甲方
甲作弊时,甲赢得9和0的机会为一半对一半
甲不作弊时,甲赢得8和7的机会为一半对一半–结论,由于u 1(s 1,σ2)< u 2(s 2,σ2),从期望盈
利看,甲采取不作弊的策略较稳妥。

5
.4121
01219),(211=××+××=σs u 甲的期望盈利5
.7121
71218),(221=××+××=σs u 甲的期望盈利
•由于这个博弈是对称的,对乙的分析同理。

那么博弈的实际结局极有可能为(不作弊,不作弊),
即(7,7)为NE具有风险优势,风险优势指风险较小。

一般:
风险占优法(期望盈利比较法)——通过比较期望盈利的大小,选择NE中具有风险优势(风险较小)的策略。

2011-9-28中南财经政法大学周月梅27
2011-9-28
中南财经政法大学周月梅
28
为什么要相信?
C 1
C 2R 1R 2
9,90,88,0
7,7
不论乙选择什么,他都有积极性告诉甲他将选择C 1;所以没有理由认为甲应该相信乙的话。



2011-9-28
中南财经政法大学周月梅
29
4、相关均衡
对于博弈中多重纳什均衡选择的难题,我们也应该考虑博弈方主动寻求方法,设计某种形式的均衡选择机制,以解决多重纳什均衡选择。

“相关均衡”就是这样购一种均衡这择机制,相关均衡的基本思想可以通过下面的博弈模型来说明。

4 , 4
5 , 1 1 , 5
0 , 01
U D
博弈方博弈方2
L R
本博弈有(U,L)和(D,R)两个纯策略纳什均衡,另外有一个混合策略纳什均衡
[(1/2,1/2),(1/2,1/2)],
即两博弈方都以1/2的概率在自己的两个纯策略中随机
选择。

虽然该博弈的两个纯策略纳什均衡,都能使两博弈方得到6单位得益总和。

但在这两个策略纳什均衡下,双方的利益相差很大,因此很难在两博弈方之间形成自然的
妥协、聚点均衡的概念是不适用的。

如果采用混合策略
纳什均衡,因为有1/4的可能性遇到最不理想的(U,R),因此双方的期望得益都只有2.5单位,显然也不理想。

2011-9-28中南财经政法大学周月梅30
由于避免出现(U,R)结果符合双方的利益,因此双方有可能通过协商约定采用如“抛一硬币,出现正面就选择纳什均衡(U,L),出现反面就选择纳什均衡(D,R)”这样的选择规则。

按照这样的规则选择,那么两个纯策略纳什均衡(U,L)和(D,R)各有1/2出现的可能,且可以保证排除采用混合策略(U,R),双方的期望得益都是3,明显好于双方各自采用混合策略的期望得益,也解决了双方在两个纯策略纳什均衡选择方面的僵局。

同样的思想用到夫妻之争博弈上就是双方可能形成这样的约定:“如果天气好一起去看足球赛,天气不好则一起看时装表演”。

2011-9-28中南财经政法大学周月梅31
2011-9-28
中南财经政法大学周月梅
32
5,14,4
0,01,5
L
R 博弈方2U D
博弈方1相关均衡例子
三个纳什均衡:(U ,L )、(D ,R )
和混合策略均衡[(1/2,1/2),(1/2,1/2)]
结果都不理想,不如(D ,L )。

可利用聚点均衡(天气,抛硬币),但仍不理想。

相关装置:
1、各1/3概率A 、B 、C
2、博弈方1看到是否A ,博弈方2看到是否C
3、博弈方1见A 采用U ,否则D ;博弈方2见C 采用R ,否则L 。

相关均衡要点:1、构成纳什均衡2、有人忽略不造成问题
2011-9-28
中南财经政法大学周月梅
33
方案一、抛硬币选择
方案二、(能发出“相关信号”的“相关装置”)①装置以相同的可能性(1/3)发出A 、B 、C
三种信号;
②博弈方甲只能看到该信号是否为A ,博弈
方乙只能看到该信号是否为C ;③博弈方甲看到A 采用U ,否则采用D ,
博弈方乙看到C 采用R ,否则采用L 。

正面,甲选U ,乙选L ,结果为(U,L)反面,甲选D ,乙选R ,结果为(D,R)
2011-9-28
中南财经政法大学周月梅
34
•可能性
•对应的策略(U,L) (D ,R) (D,L)该策略机制有下列重要性质①排除了(U ,L);
②(U,L)、(D,R)、(D,L)各以1/3的概率出现;③甲、乙的期望盈利为
),(C A ),(C A ),(C A 3
105314311313
1013143153121=
×+×+×==
×+×+×=u u 优于u 1=3,u 2=3
不难发观该机制有下列重要性质:(1)保证L和R不会同时出现,即排除了(U,R);( 2)保证(U,L) 、(D,L)和(D,R)各以1/3的概率出现,从而使两博弈方的期望得益达到3+1/3,(3) 上述策略组合是一个纳什均衡;(4)上述相关装置并不影响双方在各种策略组合下的得益,因此并不影响原来的均衡。

即如果一个博弈方忽视信号,另一个博弈方也可以忽视信号。

并不影响各博弈方原来可能实现的利益。

我们称双方根据上述相关装置选择策略构成的纳什均衡为“相关均衡”。

2011-9-28中南财经政法大学周月梅35
2011-9-28中南财经政法大学周月梅
36
5、共谋和防共谋均衡①多人博弈的共谋问题
例如:设有三人,G 为:
(1,1,-5)
(-5,-5,0)
D
(-5,-5,0)(0,0,10)U R
L
乙甲(-1,-1,5)
(-5,-5,0)D
(-5,-5,0)(-2,-2,0)U R
L
乙甲丙
A
B
2011-9-28
中南财经政法大学周月梅
37
多人博弈中的共谋问题
本博弈的纯策略纳什均衡:(U ,L ,A )、(D ,R ,B )前者帕累托优于后者。

博弈的结果会是什么呢?
(U ,L ,A )有共谋(Coalition)问题:博弈方1和2同时偏离。

0,0,10-5,-5,0-5,-5,0
1,1,-5
L
R U D
博弈方2
博弈方1
博弈方3——A
-2,-2,0-5,-5,0-5,-5,0
-1,-1,5
L
R U D
博弈方2
博弈方1
博弈方3——B
2011-9-28
中南财经政法大学周月梅
38
也就是说进一步考虑静态博弈中纳什均衡分析的有效性问题时,很容易发现在多人博弈中,有可能存在部分博弈方之间联合追求小团体利益的行为,也可能会导致纳什均衡的不稳定性。

对这种可能性的考虑,导出了“防共谋均衡”的概念。

U D Ⅰ 博弈方ⅡL R
博弈方Ⅲ—A
-5,-5,0
0,0,101,1, -5
-5,-5,0-5,-5,0-2,-2,0-1,-1,5-5,-5,0
U
D
Ⅰ 博弈方Ⅱ
博弈方Ⅲ—B
该博弈有两个纯策略纳什均衡(U,L,A)和(D,R,B),且前者帕累托优于后者,而且在风险上策的意义上前者也优于后者。

如果博弈方各自独立决策和采取行动,不考虑部分博弈方存在串通一致行动的可能性,那么该博弈的结果应该是(U,L,A)。

但是,如果我们考虑到博弈方之间存在串通或共谋的可能性,那么(U,L,A)却并不一定是博弈的最终结果。

因为如果博弈方Ⅲ选择A,则只要博弈
方Ⅰ和博弈方Ⅱ达成一致行动的默契,分别采用D和R,他们就都可以获得l单位得益,大于(U,L,A)时得到的0得益。

上述共谋问题引出了”防共谋均衡”的思想。

2011-9-28中南财经政法大学周月梅39
②防共谋均衡
l防共谋均衡——如果一个博奕的某个策略组合满足下列要求:
a)没有任何单个博弈方的“串通”会改变博弈的结
果。

b)给定偏离的博弈方有再次偏离的自由时,没有
任何两个博弈方的”串通”会改变博弈的结果。

c)依次类推,直到所有博弈方都参加”串通”也不
会改变博弈的结果。

称这样的均衡策略组合为“防共谋均衡”。

前面例子中:(D,R,B)是防共谋均衡
(U,L,A)不是防共谋均衡2011-9-28中南财经政法大学周月梅40
2011-9-28中南财经政法大学周月梅41
课后练习
1、p104.10、12
2、对完全信息静态博弈
的分析问题思路进行总
结。

2011-9-28中南财经政法大学周月梅42。

相关文档
最新文档