国外博弈论课件lecture(7)
合集下载
mixed strategy equilibrium混合策略均衡课件
TABLE 1. The percentage of times Rod successfully returns. A non-cooperative, zero-sum game. (Rod, Stefan). No Nash equilibrium in pure strategies.
Zou Yasheng Game Theory & Business Strategy 6
Stefan’s task
Stefan wants to keep the successful return percentage as low as possible; Rod has the exact opposite interest: as high as possible . If the two players decide on their strategies before the match, knowing the above probabilities, what should their strategies be? To help answer this question, we now plot: the percentage of times Rod returns serve against the proband.
Zou Yasheng Game Theory & Business Strategy
2
Unpredictability
A critical element of strategy whenever one side likes a coincidence of actions while the other wishes to avoid it. • The ATO wants to audit tax evaders; tax cheaters hope to avoid an audit. • The elder sister wants to rid herself of the younger brother, who wants to be included. • The invaders want choice of the place of attack to surprise , the defenders want to concentrate the forces on the place of attack. • The beautiful people want exclusivity, the hoipolloi want to be up with the latest trends. (As Yogi Berra said, “That night club is so crowded, no-one goes there anymore .”) • What is the best amount of a fine given a frequency of detection?
国外博弈论课件lecture
完全信息博弈
总结词
所有参与者都拥有完全相同的信息, 即每个参与者都了解其他参与者的策 略和收益。
详细描述
完全信息博弈中,所有参与者都拥有 完全相同的信息,没有任何信息不对 称的情况。这种类型的博弈通常用于 分析具有高度透明度的竞争环境。
不完全信息博弈
总结词
至少有一个参与者不完全了解其他参与者的信息和策略。
博弈论广泛应用于经济学、政治学、社会学等领域,用于解释和预测行为主体的策 略选择和结果。
博弈论的发展历程
1944年,冯·诺依曼和摩根斯坦合著 的《博弈论与经济行为》标志着博弈 论的诞生。
20世纪70年代,泽尔腾提出了子博 弈精炼纳什均衡的概念,进一步丰富 了博弈论的理论体系。
20世纪50年代,纳什提出了纳什均 衡的概念,为博弈论的发展奠定了基 础。
斗鸡博弈
总结词
描述两个斗鸡在独木桥上相遇的情景,揭示了竞争中的策略和心理因素。
详细描述
斗鸡博弈是一个著名的博弈论案例,描述了两个斗鸡在独木桥上相遇的情景。每个斗鸡都有两种选择:前进或后 退。如果两只斗鸡都选择前进,它们将相撞并可能受伤;如果都选择后退,它们将保持安全但失去面子。这个案 例揭示了竞争中的策略和心理因素,如恐惧、面子和竞争意识等。
市场进入博弈
总结词
描述新企业和已存在的企业在决定是否进入市场时的 策略和利益关系。
详细描述
市场进入博弈是一个经典的博弈论案例,描述了新企 业和已存在的企业在决定是否进入市场时的策略和利 益关系。在这个情景中,已存在的企业可以选择保持 市场地位或进行阻挠,而新企业可以选择进入或不进 入市场。如果新企业决定进入市场,已存在的企业可 能会进行阻挠以保护自己的市场份额和利润。这个案 例揭示了市场进入和竞争中的策略和利益关系。
博弈论PPT课件
第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······
game theory lecture7博弈论
• a player mixes before playing the game but then remains loyal to the selected pure strategy.
behavioral strategy in Extensive-Form Games
a behavioral strategy is more in tune with the dynamic nature of the extensive-form game. When using such a strategy, a player mixes among his actions whenever he is called to play.
Normal-Form Representation of Extensive-Form Games
• Any extensive-form game can be transformed into a normal-form game by using the set of pure strategies of the extensive form (see definition 7.4) as the set of pure strategies in the normal form, and the set of payoff functions is derived from how combinations of pure strategies result in the selection of terminal nodes. • Therefore the normal-form representation of an extensive form will suffice to find all the Nash equilibria of the game.
behavioral strategy in Extensive-Form Games
a behavioral strategy is more in tune with the dynamic nature of the extensive-form game. When using such a strategy, a player mixes among his actions whenever he is called to play.
Normal-Form Representation of Extensive-Form Games
• Any extensive-form game can be transformed into a normal-form game by using the set of pure strategies of the extensive form (see definition 7.4) as the set of pure strategies in the normal form, and the set of payoff functions is derived from how combinations of pure strategies result in the selection of terminal nodes. • Therefore the normal-form representation of an extensive form will suffice to find all the Nash equilibria of the game.
博弈论ppt课件
非合作博弈的基本分类
完全信息 不完全信息
贝氏纳什均衡 (BNE) 完美贝氏纳什均衡 (PBNE)及序贯均 衡(SE)
静态
动态
纳什均衡(NE)
子博弈完美纳什 均衡(SPNE)
静态博弈与动态博弈
(static games and dynamic games)
• 同时决策或者同时行动的博弈属于静态 博弈;先后或序贯决策或者行动的博弈, 属于动态博弈 • 即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
如何在“博弈”中获胜?
• 日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球 • How can you win such games? • 许多博弈都包含着运气、技术和策略。 • 策略是为了获胜所需要的一种智力的技巧。 它是对于如何最好地利用身体(物质)的技 巧的一种算计。
导论
二、博弈论与诺贝尔经济学奖获得者
导论
三、博弈论的基本类型
合作博弈与非合作博弈
• 合作博弈(cooperative game) 达成有约束力的协议(binding agreement),强调团体理性,强调效 率、公正、公平 • 非合作博弈(non-cooperative game) 强调个人理性,其结果可能有效率, 也可能无效率。
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
• “乘客侧前轮”看起来是一个合乎逻辑的选择。 • 但真正起作用的是你的朋友是否使用同样的 逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。 • 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
博弈论完整版PPT课件
ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
博弈论最全完整ppt 讲解
完全信息
纳什均衡(NE)
子博弈完美纳什 均衡(SPNE)
不完全信息
贝氏纳什均衡 (BNE)
完美贝氏纳什均衡 (PBNE)及序贯均 衡(SE)
静态博弈与动态博弈
(static games and dynamic games)
同时决策或者同时行动的博弈属于静态 博弈;先后或序贯决策或者行动的博弈, 属于动态博弈
如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为一个常数, 这个博弈就叫常和博弈;
相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为一 个常数,这个博弈就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英国
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进 行分析”领域做出了重要贡献。
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
博弈论最全完整-讲解课件
(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
博弈论ppt课件
精选课件ppt
7
囚徒B 坦白
不坦白
囚徒A
坦白 -8,-8 0,-10
不坦白 -10,0 -1,-1
精选课件ppt
8
博弈的分类
ห้องสมุดไป่ตู้
1、从行动的先后次序来分,博弈可以分为 静态博弈 和 动态博弈。 静态博弈指在博弈中,参与人同时选择行动,或虽非同 时但后行动者并不知道前行动者采取了什么具体行动;
动态博弈指的是参与人的行动有先后顺序,且后行 动者能够观察到先行动者所选择的行动的博弈。
21世纪,应站在博弈论的前沿。尽管博弈经济学家很少,但其获诺贝尔
奖的比例最高。最能震动人类情感的是博弈,对未来最有影响力的还是
博弈。
精选课件ppt
6
著名的“囚徒困境”的例子
警察抓住了两个罪犯,但是警察局却缺乏足够的证据 指证他们所犯的罪行。如果罪犯中至少有一人供认犯 罪,就能确认罪名成立。为了得到所需的口供,警察 将这两名罪犯分别关押防止他们串供或结成攻守同盟, 并分别跟他们讲清了他们的处境和面临的选择:如果 他们两人都拒不认罪,则他们会被以较轻的妨碍公务 罪各判一年徒刑;如果两人中有一人坦白认罪,则坦 白者立即释放而另一人将重判10年徒刑;果两人都坦 白认罪,则他们将被各判8年监禁。问:两个罪犯会 如何选择(即是坦白还是抵赖)?
不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放 弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说 比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分 配。这样,2号将拿走98枚金币。
同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0) 或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时 给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号) 来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己 的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号 能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分 给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2, 0)或(97,0,1,0,2)。
博弈论课件 Lecture 7_Mixed-Strategy Nash Equilibrium
((⅓, ⅓, ⅓); (⅓, ⅓, ⅓)).
6
Main Lesson
If a mixed strategy is a BR, then each of the pure strategies involved in the mix must itself be a BR. In particular, each must yield the same expected payoff.
L(0) T(3/4) · , 2 1 M(0) · , · B(1/4) · , 4
2 C(1/3) 3,3 0,· 5,1
R(2/3) 1,1 2,· 0,7
Show that the indicated pair of strategies, (3/4,0, 1/4) for player 1 and (0, 1/3, 2/3) for player 2, is a mixed strategy Nash equilibrium?
4
Matching Pennies
Head 1
Tail
2 Head Tail 1, -1 -1, 1 -1, 1 1, -1
This game has no pure Nash equilibrium. It has an mixed strategy equilibrium:
((½, ½); (½, ½)).
12
Matching Pennies
Head 1
Tail
2 Head Tail 1, -1 -1, 1 -1, 1 1, -1
Find the mixed strategy NE.
13
Battle of the Sexes
A 1
B
6
Main Lesson
If a mixed strategy is a BR, then each of the pure strategies involved in the mix must itself be a BR. In particular, each must yield the same expected payoff.
L(0) T(3/4) · , 2 1 M(0) · , · B(1/4) · , 4
2 C(1/3) 3,3 0,· 5,1
R(2/3) 1,1 2,· 0,7
Show that the indicated pair of strategies, (3/4,0, 1/4) for player 1 and (0, 1/3, 2/3) for player 2, is a mixed strategy Nash equilibrium?
4
Matching Pennies
Head 1
Tail
2 Head Tail 1, -1 -1, 1 -1, 1 1, -1
This game has no pure Nash equilibrium. It has an mixed strategy equilibrium:
((½, ½); (½, ½)).
12
Matching Pennies
Head 1
Tail
2 Head Tail 1, -1 -1, 1 -1, 1 1, -1
Find the mixed strategy NE.
13
Battle of the Sexes
A 1
B
博弈论课件
扩展一:不完全信息博弈
不完全信息博弈的定义
01
在博弈中,参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度,可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略,研究候选人如何 制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调,分析政策 制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作,分析国家如何通过 外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡 。
特点
纳什均衡是一种稳定的状态,任何参 与者单方面改变自己的策略都不会获 得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略, 该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略,该 策略都能为参与者带来更低的收益 。
特点
在优势策略下,参与者没有理由改 变自己的策略;在劣势策略下,参 与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降,还可能引发市场恶性竞争,破坏市场秩序。此外,价格战还可能导致产品质量 下降,损害消费者利益。
案例二:国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中,各国之间往往存在着复杂的博弈关系。为了维护自身利益,各 国会采取不同的博弈策略,如通过外交手段、经济制裁、军事威胁等方式来达 到自己的目的。
博弈论最全完整ppt-讲解
迈克尔·斯彭斯 1948年生于美国的新泽 西,1972年获美国哈佛 大学博士头衔,现兼任 美国哈佛和斯坦福两所 大学的教授。
乔治·阿克尔洛夫 1940年生于美国的纽黑 文,1966年获美国麻省 理工学院博士头衔,现 为美国加利福尼亚州大 学经济学教授。
约瑟夫·斯蒂格利茨, 1943年生于美国的印第 安纳州,1967年获美国 麻省理工学院博士头衔, 曾担任世界银行的首席 经济学家,现任美国哥 伦比亚大学经济学教授
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的逻辑,或者
认为这一选择同样显然。并且是否你认为这一选择是否 对他同样显然;反之,是否她认为这一选择对你同样显 然。……以此类推。 也就是说,需要的是对这样的情况下该选什么的预期的 收敛。这一使得参与者能够成功合作的共同预期的策略 被称为焦点。心有灵犀一点通。
何最好地利用身体(物质)的技巧的一种算计。
什么是策略博弈?
What is a Game of Strategy?
• 策略思考本质上涉及到与他人的相互影响。其他人在同一时间、 对同一情形也在进行类似的思考。
• 博弈论就是用来分析这样交互式的决策的。 • 理性的行为指的是:明白自己的目的和偏好,同时了解自己行
如果一个博弈在所有各种对局下全体参与人之得 益总和总是保持为一个常数,这个博弈就叫常和 博弈;
相反,如果一个博弈在所有各种对局下全体参与 人之得益总和不总是保持为一个常数,这个博弈 就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
没有某个这样的暗示,默契的合作就完全不可能。
博弈论英文课件 (7)
Player 2’s expected payoff of playing s21: EU2(s21, (r, 1-r))=r×u2(s11, s21)+(1-r)×u2(s12, s21) Player 2’s expected payoff of playing s22: EU2(s22, (r, 1-r))= r×u2(s11, s22)+(1-r)×u2(s12, s22)
Static (or SimultaneousMove) Games of Complete Information
Matching pennies
Player 2 Head Player 1 Head Tail Tail
-1 ,
1 , -1
1
-1 ,
1 , -1 1
n Head is Player 1’s best response to Player 2’s strategy Tail n Tail is Player 2’s best response to Player 1’s strategy Tail n Tail is Player 1’s best response to Player 2’s strategy Head n Head is Player 2’s best response to Player 1’s strategy Head
n Player 1 plays a mixed strategy (r, 1- r ). Player 2 plays
a mixed strategy ( q, 1- q ).
Ø Ø
n Player 2’s expected payoff from her mixed strategy: v2((r, 1-r),(q, 1-q))=qEU2(s21, (r, 1-r))+(1-q)EU2(s22, (r, 1-r))
国外博弈论课件lecture(7)
a2A2
Max
t1T1
u2 ( s1 (t1 ), a2 ; t2 ) p2 (t1 | t2 )
*
June 24, 2003
73-347 Game Theory--Lecture 25
5
Bayesian Nash equilibrium: 2-player
In a static Bayesian 2-player game {A1, A2 ; T1, T2 ; p1, p2 ; u1, u2}, the * * strategies s1 (), s2 () are pure strategy Bayesian Nash equilibrium if for each i and j, (assume T1 {t11, t12 , ....},T2 {t21, t22 , ....})
* s2 (t 2 j )
* s2 (t2n )
* s1 (t1n )
player 1’s best response if her type is t1i
In the sense of expectation based on her belief
73-347 Game Theory--Lecture 25
June 24, 2003 73-347 Game Theory--Lecture 25 4
Bayesian Nash equilibrium: 2-player
In a static Bayesian 2-player game {A1, A2 ; T1, T2 ; p1, p2 ; u1, u2}, * * the strategies s1 (), s2 () are pure strategy Bayesian Nash equilibrium if
博弈论课件 Lecture 7_Mixed-Strategy Nash Equilibrium
5
Rock, Paper, Scissor
2
R
P
S
R 0, 0 -1, 1 1, -1
1 P 1, -1 0, 0 -1, 1
S -1, 1 1, -1 0, 0
This game has no pure Nash equilibrium too. It has an mixed strategy equilibrium:
16
Where to Meet a Friend Example
u1(P,θ2)=u1(L,θ2) 1q+0(1-q)=0q+2(1-q) q=⅔ u2(θ1,P)=u2(θ1,L) 2r+0(1-r)=0r+1(1-r) r=⅓ MNE: ((⅓,⅔,0),(⅔,⅓,0))
17
Finding All Mixed Strategy Nash Equilibria
The following systematic method of finding all mixed strategy Nash equilibria of a game is suggested by the characterization of an equilibrium in proposition:
9
A Useful Characterization of Mixed Strategy Nash Equilibrium
A mixed strategy profile (σ1*, σ2*, …, σN*) is a mixed strategy NE if and only if, for each player i,
L(0) T(3/4) · , 2 1 M(0) · , · B(1/4) · , 4
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
June 24, 2003
h
4
Bayesian Nash equilibrium: 2-player
In a static Bayesian 2-player game {A1, A2; T1, T2; p1, p2; u1, u2}, the strategies s1*(•), s2*(•) are pure strategy Bayesian Nash equilibrium if ➢ for each of player 1's types t1 T1, s1*(t1) solves
Introduction to static games of incomplete information
Normal-form (or strategic-form) representation of static Bayesian games
Bayesian Nash equilibrium Auction
s2* (t2 j )
s2* (t2n )
June 24, 2003
h
6
Battle of the sexes
At the separate workplaces, Chris and Pat must choose to attend either an opera or a prize fight in the evening.
June 24, 2003
h
5
Bayesian Nash equilibrium: 2-player
In a static Bayesian 2-player game {A1, A2; T1, T2; p1, p2; u1, u2}, the strategies s1*(•), s2*(•) are pure strategy Bayesian Nash equilibrium if
h
3
Static Bayesian games
The normal-form representation of an n-player static game G of incomplete information specifies: ➢ A finite set of players {1, 2, ..., n}, ➢ players’ action sets A1, A2 , A3, ..., An , ➢ players' type sets T1, T2, T3, ...,Tn, ➢ players' beliefs p1, p2, p3, ..., pn ➢ their payoff functions ui (a1, a2, ..., an; ti ) for a1 A1, a2 A2, ..., an An , ti Ti.
Both Chris and Pat know the following:
➢ Both would like to spend the evening together.
➢ But Chris prefers the opera.
➢ Pat prefers the prize fight.
Chris
June 24, 2003
h
2
Today’s Agenda
Review of previous class Battle of sexes with incomplete information
(version two) First-price sealed-bid auction
June 24, 2003
for each i and j, (assume T1 {t11, t12, ....},T2 {t21, t22, ....})
s1* (t11 ) s1*(t12 )
s1* (t1i ) s1*(t1n )
In the sense of expectation based on her belief
Max u1(a1, s2*(t2 ); t1) p1(t2 | t1)
a1A1 t2T2
➢ and for each of player 2's types t2 T2, s2*(t2 ) solves
Max
a2A2
u2 (s1*(t1), a2; t2 ) p2 (t1 | t2 )
Static (or SimultaneousMove) Games of Incomplete Information
Bayesian Nash Equilibrium
June 24, 2003
h
1
Outline of Static Games of Incomplete Information
Opera Prize Fight
Pat
Opera
Prize Fight
2, 1
0, 0
0, 0
1, 2
June 24, 2003
h
7
Battle of the sexes with incomplete
information (version two)
Pat’s preference depends on whether he is happy. If he is happy then his preference is the same.
player 2’s best response if her type is t2j
player 1’s best response if her type is t1i
In the sense of expectation based on her belief
s2* (t21) s2* (t22 )
If he is unhappy then he prefers to spend the evening by himself.
In a static Bayesian game, a strategy for player i is a function si ( ti ) for each ti Ti .
si ( ti ) specifies what player i does for her each type ti Ti