博弈论第5次课——完全信息静态博弈
完全信息静态博弈
博弈论的发展前景
无论是从社会经济发展的客观要求,还是从经济学理论发展本身的规律来看,博弈论都有很大的发展前途。 1)博弈论本身具有优美深刻的本质魅力,新的分析工具和应用领域的不断发现,以及博弈论价值得到越来越充分 的认识,不断吸引大量学者加入学习、研究和应用博弈论的队伍。这是博弈论继续向前发展的根本基础和保证。 2)在博弈规则的来源、博弈方的行为模式和理性等基础理论方面,博弈论还存在不少没有很好解决的问题,有待 进一步研究和解决。这正是博弈论未来发展的动力。 3)当前合作博弈理论发展相对落后,这个领域有很大的发展潜力,很可能孕育出引发经济学新革命的重大成果。 非合作博弈和合作博弈理论的重新组合也可能给博弈论的发展提出新的方向和课题。
1)决策者考虑短期利益、个人或者小集团利益更多,决策者确实缺乏理智和理性; 2)局部地区或特定时期战争的利益比上述博弈中所假设的要大; 3)其他国家选择战争时还击比不还击损失小,先发制人则更能使自己相对有利;
以上因素都是导致发生战争机会增大的重要原因。
2)风险上策均衡法
风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏爱其中某 一个纳什均衡,则该纳什均衡就是一个“风险上策均衡”。
博弈论在我国经济中的应用
企业经营者的启示:
1)在我国经济体制改革和国有企业管理体制改革中,委托人—代理人理论和激励机制设计原理有很大的应用价 值。如,对“监督困难的委托人—代理人理论”的研究,找到可以调整各方面的利益关系和调动职工和经营者 的积极性和责任心的依据和方法。 2)博弈论领域中“囚徒困境”,“激励悖论”等众多模型和命题为企业经营者揭示了众多经济、经营活动中的 内在规律,企业决策者利用这些工具可以大大提高在价格和产量决策、经济合作和经贸谈判,参与投标拍卖, 处理劳资关系等问题的决策效率。
博弈论_完全信息静态博弈
p 1
p * (q )
2 3
q * ( p)
1 3
q 0
1 3
2 3
1
¹ 1.1. ³ ¾ ¤ À ¨ ¼ Ï Ì AÏ ³ ç Æ
博弈 =(N, (Si) iN , (Ui) iN ) 的策略式包含三要素: (1) 参赛者(players): i N={ 1, 2, 3,…….n} (2) 策略(strategies): s i Si=set of feasible (pure) strategies for player i, i N 策略组合(strategy profile) s=( s1,……,sn)=(s i, s-i ), s-i= X Sj 对手的
不完全信息
贝叶斯纳什均衡(BNE) 完美贝叶斯纳什均衡 (PBNE)或序列均衡 (SE ))
完全信息静态博弈 (Static games with Complete Information)的表示与求解
常见的几个博弈型态:
(1)
Duopoly双占
(2)
囚犯困境(Prisoner’s Dilemma):同时出招
重复优势解法(Iterated Dominance)
:逐次删去劣势策略(dominant strategy),但对两性 战争、飚车族与钱币配对等问题就无法解出。
纳什均衡(Nash Equilibrium)
定义:纳什均衡指一策略组合有以下特性:当参赛者 采此策略组合后,任一参赛者均无诱因偏离此一均衡 ; s*=(s1*,s2*,…..sn*)=(si*,s-i*)是一纳什均衡若且唯若 对所有参赛者i而言,ui(si*,s-i*)≧ui(si’,s-i*)对所有si’,Si 均成立。
完全信息静态博弈
• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。
•
R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)
•
F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。
1.1完全信息静态博弈:基础理论
纳什均衡与协议的理念
和纳什均衡推导密切相关的是协议的理念:对给定 的博弈,如果参与者之间要商定一个协议决定博弈 如何进行,那么一个有效的协议中的战略组合必须 是纳什均衡的战略组合,否则,至少有一个参与人 会不遵守该协议。 为更准确地理解纳什均衡这一概念,下面求解几个 例题。
寻找纳什均衡的方法:划线法
纳什均衡和重复剔除严格劣战略均衡的关系
如果用重复剔除严格劣战略把除战略组合{s*1,…,s*n} 外所有的战略组合都剔除掉,则该所存战略组合就是 此博弈惟一的纳什均衡。 不过,由于重复剔除严格劣战略并不经常会只剩下惟 一的战略组合,纳什均衡作为比重复剔除严格劣战略 更强的解的概念,自然受到更多关注,理由如下: 如果战略组合{s*1,…,s*n}是一个纳什均衡,它一定不 会被重复剔除严格劣战略所剔除,但也可能有重复剔 除严格劣战略无法剔除的战略组合,其本身却和纳什 均衡一点儿关系都没有。
博弈的要素:
现在我们回到一般情况。 博弈的标准式表述包括: (1)博弈的参与者; (2)每一参与者可供选择的战略集; (3)针对所有参与者可能选择的战略组合,每 一个参与者获得的收益。
考虑n个参与者的博弈: (1)参与者从1到n排序; (2)设其中任一参与者的序号为i,令Si代表参 与者i可以选择的战略集合(称为i的战略空间),其 中任意一个特定的战略用si表示(有时我们写成, si∈Si表示战略si是战略集Si中的要素); (3)令(s1,...,sn)表示每个参与者选定一个战略形 成的战略组合,ui表示第i个参与者的收益函数, ui (si,...,sn)即为参与者选择战略(s1,...,sn)时第i个 参与者的收益。
0
0
智猪博弈3:劳而不得!
完全信息静态博弈
2.3 重复剔除的占优均衡
➢ 重复剔除的占优均衡举例
si 称为局中人i的一
个(严格)劣战略 :若
存在 sˆi ,使得:
i(si, s i ) i(sˆi, s i )
则理性人决不会选
之。
上 A中
下
左 7, 7 5, 7 6, 6
B 中 6, 6 5, 8 5, 8
右 7, 6 8, 5 4, 8
2.3 重复剔除的占优均衡
0,0
1.3 基本分析思路与方法
上策均衡
严格下策反 复消去法 划线法
箭头法
上策:不管对手采取何种策略,这种策略都是最优的; 均衡:当这种结局出现时,所有局中人都不会改变他 们的选择。
严格下策反复消去法与上策均衡分别对应两种有一定 相对性的决策分析思路;严格下策反复消去法对应排 除法,即排除绝对最差策略的分析方法
极大化极小策略
(下,右)
B
(上, 右)
左
右
1,0 上
A
下
-1000,0
1,1 2,1
2.3 重复剔除的占优均衡
➢ 重复剔除的占优均衡(iterated dominance equilibrium ): 如果战略组合s*=(s1*,…,sn*)是重复剔除劣战略后剩下的唯一的战 略组合,我们称其为重复剔除的占优均衡。如果这种唯一的战略组合 是存在的,我们说该博弈是重复剔除占优可解的。
女 (交叉处海拔高度) :千尺
Y1
Y2
Y3
男 X1
6
1
5
X2
1
2
3
X3
4
3
5
X4
4
2
1
6
3
5
博弈论-完全信息静态博弈
u2 u2 ( P1, P2 ) P2q2 - c2q2 ( P2 - c2 )q2 (P2 - c2 )(a2 - b2 P2 + d2 P1 )
1 P (a1 + b1c1 + d1 P* ) 2 2b1
* 1
1 P (a2 + b2 c2 + d 2 P* ) 1 2b2
在许多博弈中,博弈方的策略是有限且非连 续时,其得益函数不是连续可导函数,无法 求得反应函数,从而不能通过解方程组的方 法求得纳什均衡。 即使得益函数可以求导,也可能各博弈方的 得益函数比较复杂,因此各自的反应函数也 比较复杂,并不总能保证各博弈方的反应函 数有交点,特别不能保证有唯一的交点。
2.4 混合策略和混合策略纳什均衡
c1 c2 2
u1 q1P(Q) - c1q1 q1[8 - (q1 + q2 )] - 2q1
6q1 - q1q2 - q12
u2 q2 P(Q) - c2q2 q2[8 - (q1 + q2 )] - 2q2
6q2 - q1q2 - q22
两寡头间的囚徒困境博弈
策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6
寻找混合策略纳什均衡概率分布的思路: 令各个博弈方随机选择纯策略的概率分布,满足 使对方或其他博弈方采用不同策略的期望得益相 同。
求此博弈中的混合策略纳什均衡
博弈方2 左
博弈 方1
右
0, 2 3, 0
上 下
2, 1 1, 2
* * * q1 q2 q3 24
* * * u1 u2 u3 576
Q* 72
经济博弈论完全信息静态博弈
19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
经济博弈论02完全信息静态博弈(Park)
合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。
完全信息静态博弈五
在有限参与方博弈中,如果每个参与人的纯策略空间是 欧氏空间上一个非空的、闭的、有界的凸集,得益函数是 连续的且对策略是拟凹的,那么,该博弈存在一个纯策略 纳什均衡。
第4页/共20页
2.5纳什均衡的存在性定理
【定理2.3】纳什均衡的存在性定理III
在有限参与方博弈中,如果每个参与人的纯 策略空间是欧氏空间上一个非空的、闭的、有 界的凸集,得益函数是连续的,那么,该博弈 存在一个混合策略纳什均衡。
第12页/共20页
聚点均衡
➢类似于“12点”,“0点”称为聚点(Focal Points),同时选择聚点构成的纳什均衡,称为聚 点均衡 ➢例二:城市均衡,要求两个博弈方将上海、 南京、长春、哈尔滨分成两组,分组相同,则 各自得益100元,不同则不得益。 ➢据点均衡反映了人们在纳什均衡选择的一些 规律性,但是并无一般规律,须具体对待
用R,否则用L
第16页/共20页
相关均衡
➢按照上述方法选择的纳什均衡为“相关均 衡” ➢最大的问题在于实现性问题,即在复杂的 现实问题面前,博弈方是否有能力设计出这 样的机制,并且能够相互理解并采纳这种机 制,是有一定疑问的。
第17页/共20页
共谋与防共谋均衡
➢纳什均衡在某些情况下可能不稳定,比如
第15页/共20页
相关均衡
➢策略组合(D,L)尽管不是纳什均衡,但是一种
双方总得益最多的结果,在猜硬币中不可能出
现。设计一种机制将其包括进入备选,同时又
可排除最坏情况出现。
➢“相关信号”:(1)一个装置以相同概率发出
A,B,C,三种信号;(2)1只能看到A,2只能看
到C;(3)1看到A采用U,否则用D,2看到C
完全信息静态博弈及其纳什均衡解
袈第四章完全信息动态博弈及其均衡解蝿1.完全且完美信息动态博弈蒆完全信息博弈指的是参与者的收益是共同知识。
螄完全且完美信息动态博弈指的是:博弈中的每一步中参与人都知道这一步之前博弈进行的整个过程。
因此,我完全且完美信息动态博弈的特点:(1)行动是顺序发生的;(2)下一步行动选择之前所有以前的行动都可以被观察到;( 3)每一可能的行动组合下的参与人的收益都是公共知识。
羈而不完美信息博弈指的是,在某一步参与人不知道以往博弈所进行的历史或者没有观察到以往的所有行动。
:假定甲在开采一个价值4万元的金矿时需要1 万元资金,乙有袅例4.1 .我们来考虑这样一个动态博弈1万元资金。
甲向乙借钱来开金矿。
在这个博弈的第一阶段,甲向乙承诺:如果乙借钱给他的话,那么他就会将采到的金子与乙对半分成,即(2 , 3)――乙得到2万元的金子,同时收回自己的1万元投资。
对于甲的承诺,乙如果不借钱给甲的话,那么博弈到此为止,双方收益为(0,1)。
如果乙借钱给甲的话,那么博弈进入第二个阶段。
在第二阶段中,若甲遵守他的承诺,分给乙一半的金子,这样两人的收益为(2 , 3),其中1万元为投资成本。
〖JP3〗然而,若甲违背自己的承诺,博弈就会进入到第三个阶段:如果乙同甲打官司,那么由于打官司费时费力,两个人的收益为(0 , 1);若乙不打官司,那么两个人的收益就为(5 , 0)。
参见图1。
膄甲肇乙不借葿(1, 2) ( 5, 0)芄图1.借钱博弈的博弈树袂蚆2.逆向归纳法与子博弈纳什均衡解羆逆向归纳法(Backward induction )又称逆推法,是指这样一种动态博弈求解方法:从博弈的最后一步开始,计算最后一步的参与人的最优行动, 逐步逆推到博弈开始时进行第- 步的参与人的最优行动,从而确定每个参与人的最优行动。
蚁在动态博弈中逆向归纳法能够进行的前提: 参与人是理性的 任何一步参与人都选择 最优策略;理性是公共知识一一参与人选择最优策略是其他人所能够预测的。
完全信息静态博弈ppt课件演示文稿
招认
囚徒2 招认 沉默 –5, -5 0, -8
-8, 0 -1 , -1
囚徒1
沉默
囚徒的困境
We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game;(2)the strategies available to each player;(3)the payoff received by each player for each combination of strategies that could be chosen by the players.
Definition: The normal-form representation of an-n-player game specifies the players‘ strategy spaces S1 , … , Sn and their payoff functions u1 ,…, un. We denote this game by G={S1, … ,Sn;u1, … , un}. 教材 P22
≥ ui( s1*…, sn-1* , si , sn+1* ,…, sn* ) ……………………………………….(NE)
for every feasible strategy si in Si; That is , si*solves max ui( s1*…, sn-1* , si, sn+1* ,…, sn* ). si∈Si
参与人2 左 中 右 上 1, 0 1, 2 0, 1
参与人1 下 0, 3 0,1 2,0 第二
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论——完全信息静态博弈 (混合纳什均衡)
郝 海 天津工程师范学院经济管理
完全信息静态博弈
古诺寡头竞争博弈 古诺模型又称古诺双寡头模型(Cournot duopoly model),它是由法国经济学家古诺于 1838年提出的。古诺模型是一个只有两个寡头厂 商的简单模型,该模型也被称为“双头模型”。古 诺模型的结论可以很容易地推广到三个或三个以上 的寡头厂商的情况中去。 公共地的悲剧 经济学家很早就观察到一个现象,当资源产权 没有得到明晰界定时,资源就会被过度利用。在18 世纪以前,苏格兰有着广褒的草地和牧场,但到了 19世纪,这些天然大牧场再也见不到了。由于草场 的所有权没有界定,牧民们的过度放牧使草场失去 了再生能力,牧草走向自然耗竭。
求其微分可得到政府最优化的一阶条件: 因此, 在混合策略均衡,流浪汉以0.2的概率选寻找工作, 0.8的概率选游荡。
vG 5 1 0
* 0.2
问题是,解政府的最优化问题得到的却是流浪汉 的混合策略。对此的可作如下解释:首先假定最优 混合策略是存在的。给定流浪汉选择混合策略(r, 1-r),政府选纯策略救济(即θ=1)的期望效用为: vG (1, ) 3 (1)(1 ) 4 1 (这里省略了选择第二个纯策略的概率)选择纯 策略不救济(即θ=0)的期望效用为: vG (0, ) 1 0(1 ) • 如果一个混合策略 ( 0, 1) 是政府的最优选择, 则一定意味着政府救济与不救济之间是无差异的,即: vG (1, ) 4 1 vG (0, ) * 0.2 。即若 0.2 上式意味着 政府将选择不 救济;
混合策略博弈
Player B L,pL U,pU Player A D,1-pU R,1-pL
(1,2)
(0,5)
(0,4)
(3,2)
If 2p U 5(1 p U ) 4pU 2(1 pU ) then B would play only Right. But there are no Nash equilibria in which B plays onபைடு நூலகம்y Right.
混合纳什均衡
女 足球 男 足球 芭蕾 2,1 0,0 芭蕾 0,0 1,2
如在“性别战”博弈中,有两个纯策略纳什 均衡:(足球,足球),(芭蕾,芭蕾)。事实 上,可以验证,还有一个混合策略纳什均衡,即 男的以2/3的概率选择足球赛,以1/3的概率选择 芭蕾舞;女的以1/3的概率选择足球赛,以2/3的 概率选择芭蕾舞。
混合策略博弈
Player B L,pL U,pU Player A D,1-pU R,1-pL
(1,2)
(0,5)
(0,4)
(3,2)
So for there to exist a Nash equilibrium, B must be indifferent between playing Left or Right; i.e. 2p U 5(1 p U ) 4 p U 2(1 p U ) p U 3 / 5.
1
K
1
ik 1.
i
用
n )代表混合策略组合 , 其中, i为i的一个混合策略 , 而 i 代表混合策略组合空间 • ( ). i
代表i的混合策略空间 ( ), ( ,, ,,
i i i
用vi ( ) vi ( i , i )表示参与人 i的期望效用函数 [ i ( 1 ,, i 1 , i 1 ,, n)是除i之外所有其他参与人的 混合 策略组合 , 它可被定义为 :
纳什均衡要求每个参与人的混合策略是给定对方的混合 策略下的最优选择。故θ*=0.5,r*=0.2是唯一的纳什均 衡。即在均衡时,政府以0.5的概率选救济,0.5的概率 选不救济;流浪汉以0.2的概率选找工作,以0.8的概率 选游荡。 从另一方面进行说明。假定政府认为流浪汉找工作的 概率严格小于0.2,则政府的唯一最优选择是纯策略不救 济;但若政府以1的概率选不救济,流浪汉的最优选择是 找工作,这又将导致政府选择救济,流浪汉则选游 荡,……。因此,r<0.2不构成纳什均衡。类似地,假定 政府认为流浪汉找工作的概率严格大于0.2,则政府的唯 一最优选择是纯策略救济;但若政府以1的概率选救济, 流浪汉的最优选择是游荡。因此,r>0.2不构成纳什均衡。 容易验证, θ<0.5和θ>0.5也都不构成纳什均衡。
0.2 ,政府将选择救济;只有当 0.2 时,政府才会选择混合策略 ( 0, 1) 或任何纯策 • 略。 要找出政府的均衡混合策略,需求流浪汉的最优 化问题。流浪汉的效用函数为: v L ( G , L ) (2 1(1 ) (1 )( 3 0(1 )) • ( 1) 3(1 ) • (2 1) 3 v L 最优化一阶条件为: (2 1) 0 因此, * 0.5 该结论可解释为:若θ<0.5,流浪汉的最优选择是找 工作;若θ>0.5,其最优选择是游荡;只有当θ=0.5时, 他才选择混合策略 ( 0, 1) 或任何纯策略。 •
纯策略博弈
Player B L R U Player A D (0,5) (3,2) No. No. No. No. Is (U,L) a Nash equilibrium? Is (U,R) a Nash equilibrium? Is (D,L) a Nash equilibrium? Is (D,R) a Nash equilibrium? (1,2) (0,4)
混合策略博弈
类似地,B也可以选择概率分布 (pL, 1-pL) ,即介于纯策略Left和纯 策略Right之间的混合策略。
混合策略博弈
Player B L U (1,2) R (0,4)
Player A
D
(0,5)
(3,2)
This game has no pure strategy Nash equilibria but it does have a Nash equilibrium in mixed strategies. How is it computed?
Player A D,1-pU
If B plays Left her expected payoff is 2pU 5(1 pU ). If B plays Right her expected payoff is 4pU 2(1 pU ).
混合策略博弈
Player B L,pL U,pU Player A D,1-pU R,1-pL
政府
救济 不救济
显然,该博弈没有纳什均衡。
例2:猜谜游戏(猜硬币)(支付矩阵如下表)。 儿童B
儿童A
正面 反面
正面 -1,1 1,-1
反面 1,-1 -1,1
该博弈是一个零和博弈,没有纳什均衡。如(正面, 正面)不是纳什均衡,因为给定B选正面,A的最优 选择是反面。类似地,(反面,正面)、(反面, 反面)、(正面,反面)都不是纳什均衡。 这两个例子虽然不存在上面所定义的纳什均衡,但 具有混合策略纳什均衡。
纯策略博弈
Player B L R
U Player A
(1,2)
(0,5)
(0,4)
(3,2)
D
在纯策略博弈时,不一定存在纳什均衡。 只有在混合策略博弈时,至少存在一个 纳什均衡。
混合策略博弈
除了纯策略Up和Down之外,A可 以选择一个概率分布(pU,1-pU),即 A选择Up的概率是pU,选择Down 的概率是1- pU。 在这样的情况下,A选择的是介于 纯策略Up和纯策略Down之间的一 个混合策略(mixed strategy), 表示为:(pU, 1-pU) 。
混合策略博弈
Player B L,pL U,pU Player A D,1-pU R,1-pL
(1,2)
(0,5)
(0,4)
(3,2)
So for there to exist a Nash equilibrium, B must be indifferent between playing Left or Right; i.e. 2p U 5(1 p U ) 4p U 2(1 pU )
混合策略博弈
Player B L,pL U,pU (1,2) R,1-pL (0,4)
Player A D,1-pU
(0,5)
(3,2)
If B plays Left her expected payoff(预期 报酬) is
2pU 5(1 pU )
混合策略博弈
Player B L,pL U,pU (1,2) (0,5) R,1-pL (0,4) (3,2)
•
vi ( i , i )
(
sS j 1
n
j
( s j )) ui ( s )
社会福利博弈的支付矩阵
流浪汉 找工作 游荡 3,2 -1,3 -1,1 0,0
政府
救济 不救济
假定政府的混合策略为σG=(θ,1-θ)(即政府以 θ的概率选救济,1-θ的概率选不救济),流浪汉 的混合策略为σL=(r,1-r)(即流浪汉以r的概率选 找工作,以1-r的概率选游荡)。则政府的效用函数 为: vG ( G , L ) (3 ( 1)(1 ) (1 )( 0(1 )) • (4 1) (1 ) • (5 1)
混合策略博弈
Player B L,pL
3 U, 5 Player A 2 D, 5
R,1-pL
(1,2)
(0,5)
(0,4)