第六章 博弈论
博弈论PPT课件
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
博弈论
效用(英文:Utility),是经济学中最常用的概念之一。
一般而言,效用是指对于消费者通过消费或者享受闲暇等使自己的需求、欲望等得到的满足的一个度量。
正和博弈亦称为合作博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。
负和博弈,是指双方冲突和斗争的结果,是所得小于所失,就是我们通常所说的其结果的总和为负数,也是一种两败俱伤的博弈,结果双方都有不同程度的损失那是定理在一个有n个博弈方的博弈G=﹛S1,…,Sn:u1,…,un}中,如果n是有限的,且Si 都是有限集(对i=1,…,n),则该博弈至少存在一个纳什均衡,但可能包含混合策略。
是由纳什发现的。
美苏争霸的囚徒困境军备竞赛是囚徒困境的又一个典型例子。
下面讲的,源自30年前美国的博弈论课本,本书不敢掠美。
从军事上看,30多年前,美国和苏联是世界上的两个超级大国,它们相互对垒。
假定每一方都有两种策略选择,一个是扩军,发展战略核武器,甚至实施“星球大战”计划等;另一个是彻底裁军,直至不设军备。
如果双方都扩军,则各花费2 000亿美元用于军费。
彻底裁军,则军费为0。
在一个弱肉强食的世界上,如果美国裁军不设防,但是苏联扩军,苏联就可以任意欺侮和损害美国。
这样,美国会受到很大损失。
损失之大,直至丧失主权。
这使我们可以非正式地把这种情况下美国的赢利记做–∞,即负无穷大。
这时候,欺侮人的一方的赢利是多少呢?你可能想象应该是+∞,即正无穷大。
其实不然。
你想想,砍伐一片森林所造成的损失,难道可以用所得到的木材的价值来补偿吗?更不必说占领甚至炸毁对方一座城市,你所得到的远远低于对方的损失。
被欺侮一方的损失,并不会等量地转化为欺侮人的一方的利益,这常常是对抗的规律。
所以,在一方扩军欺侮别人而另一方裁军任人欺侮的情况下,我们假定欺侮人的一方将只掠夺到一个有限数额的财富,比方说10 000亿美元。
这10 000亿美元的掠夺成本是上面讲的2 000亿美元。
第6章 博弈论
二、博弈的要素
(一)构成要素
1、参与人players
一个博弈中的决策主体,其目的是通过选择战略(或 行动),以最大化自己的支付(效用)水平。
14
2、行动actions or moves 是参与人在博弈的某个时点的决策变量。 1)行动集合action set:可供某个参与人(i)选择 的所有行动的集合,写作Ai={ai}。 2)行动组合action profile:n个参与人的行动的有 序集a=(a1,„,ai,„,an)。 3)行动顺序the order of play:根据行动顺序,可 以将博弈分为静态博弈和动态博弈。因此,行动顺序 对于博弈结果非常重要。 在博弈论中,一般假定参与人的行动空间和行动顺 序是所有参与人的共同知识。
分析一下上述矩阵,可以发生囚犯A和B都面临一种两难境 地。如果他们都听从检察官的劝告而坦白的话,他们将
6
被判入狱5年;如果他们都选择不坦白的策略,他们都将只 被判2年。入狱2年当然比入狱5年要好得多,但问题是,即使 他们曾经订立攻守同盟,在背靠背后地被审讯的情况下,同 伙人还是可信任的吗?此时他们都将面临同伙人背叛的风险, 也就是面临被判8年的风险。特别是,如果检察官:“他已经 坦白了你还不坦白吗?”这两个囚犯谁还能守口如瓶呢?
29
(六)根据参与人对博弈进程信息,对动态博 弈进行划分
1.动态博弈中,若某参与人行动时,对此前行动的各 参与人(包括“自然”)的选择、行动完全了解,称为 “具有完美信息的”参与人。若其不完全了解此前全部 的博弈进程,称为“具有不完美信息的”参与人。
2.如果动态博弈中的所有参与人都是具有完美信息的, 则该动态博弈称为“完美信息动态博弈”,perfect information。若动态博弈中存在具有不完美信息的参 与人,该博弈称为“不完美信息动态博弈”, imperfect information。
经济博弈论第六章不完全信息静态博弈共39页
11
27.04.2020
6.1.3 海萨尼转换
基本思路:将静态博弈转化为动态博弈 (1)假设有一个名为“自然”的博弈方0,该博弈
方的作用是先为其他每个博弈方抽取他们的类型, 抽取的这些类型构成类型向量
t=(t1,…,tn),其中t i T i ,i=1,…,n。
(2)“自然”让每个博弈方知道到自己的类型, 但却不让其他博弈方知道。
10
27.04.2020
6.1.2 静态贝叶斯博弈的一般表示
静态贝叶斯博弈的一般表达式为: G={A1,…,An ;T1,…,Tn;u1,…,un}
其中Ai为博弈方i的行为空间(策略空间), Ti是博弈方i的类型空间,博弈方i的得益 ui=ui(a1,…,an,ti)为策略组合(a1,…,an ) 和类型ti的函数。
q1*a2C1C3 H(1)CL)
6
27.04.2020
6.1.1 不完全信息的古诺模型
与完全信息古诺模型比较 完全信息古诺模型中的的产量
q1*
a2C1 3
C2
q2*
a2C2 3
C1
CH C2 q2*(CH)q2*
CL C2 q2*(CL)q2*
ቤተ መጻሕፍቲ ባይዱ
7
27.04.2020
6.1.2 静态贝叶斯博弈的一般表示
厂商1只知道有两种可能性,一种是C2= C2(q2) = CH q2概率为θ另一种是C2= C2(q2)= C Lq2, 概率为1-θ,而CH>CL,也即边际成本有高、低两 种可能。
3
27.04.2020
6.1.1 不完全信息的古诺模型
厂商2在边际成本是较高的CH时会选择较低的产 量,而在边际成本为较低的CL时会选择较高的产 量。
博弈论第六章不完全信息静态博弈题库
博弈论第六章不完全信息静态博弈题库【原创版】目录一、引言二、不完全信息静态博弈的概述1.不完全信息的定义2.静态博弈的定义三、不完全信息静态博弈的解题方法1.严格优势策略2.纳什讨价还价解3.轴向讨价还价解四、应用案例分析五、总结正文一、引言在博弈论中,不完全信息静态博弈是一个重要的研究领域。
由于参与者在博弈过程中所拥有的信息不完全,这使得博弈过程变得更加复杂和有趣。
本文将介绍不完全信息静态博弈的概述,以及探讨如何解决这类问题。
二、不完全信息静态博弈的概述1.不完全信息的定义不完全信息指的是参与者在博弈过程中,无法完全了解其他参与者的策略或支付函数。
这种情况下,参与者需要根据自己所掌握的信息,来猜测其他参与者可能采取的策略。
2.静态博弈的定义静态博弈是指参与者在一定时间内,一次性地选择策略并完成博弈的过程。
静态博弈中,参与者不需要考虑时间顺序,只需关注当前状态下的最优策略。
三、不完全信息静态博弈的解题方法1.严格优势策略在完全信息静态博弈中,如果一个策略对某个参与者来说是严格优势的,那么他会选择这个策略。
在不完全信息静态博弈中,同样可以利用严格优势策略来求解。
即通过分析其他参与者可能采取的策略,找到一个对某个参与者来说严格优势的策略。
2.纳什讨价还价解纳什讨价还价解是解决不完全信息静态博弈问题的一种方法。
通过设计一种讨价还价机制,使得参与者可以在不完全信息的情况下,达成一种合作解。
纳什讨价还价解的关键是让参与者在博弈过程中,有动力去揭示自己的真实支付函数。
3.轴向讨价还价解轴向讨价还价解是另一种解决不完全信息静态博弈问题的方法。
它通过让参与者在博弈过程中,根据其他参与者的策略选择,来调整自己的策略,从而实现一种合作解。
轴向讨价还价解的优势在于,它可以在不完全信息的情况下,使得参与者的收益达到最大。
四、应用案例分析以寡头垄断市场为例,市场中有两个寡头企业,它们需要决定是否进行价格战。
在这个过程中,每个企业都需要考虑对方的策略选择。
第6章 博弈论
3、相同市场份额厂商的价格战 、
厂商B 厂商 降价 厂商A 厂商A 降价 不降价 30,30 , 20,70 , 不降价 70,20 , 50,50 ,
上策:无论对方如何选择都使自己利益极大化的策略。 上策:无论对方如何选择都使自己利益极大化的策略。 上策均衡:是博弈均衡的一种特殊状态。 上策均衡:是博弈均衡的一种特殊状态。
•
A和B都不会选择劣策略“不招”, 和 都不会选择劣策略 不招” 都不会选择劣策略“ 称为“剔除劣策略的占优策略均衡” 称为“剔除劣策略的占优策略均衡”。 其中“ 是占优于(优于 不招” 优于)“不招 其中“招”是占优于 优于 不招”的占 优策略。 优策略。 • 我们可以利用这个道理来分析日常 生活中的许多不合作现象。 生活中的许多不合作现象。
例子3: 苏格兰的草地为什么消失了? 例子 : 苏格兰的草地为什么消失了 ? 公 共资源经常被过度利用的原因。 共资源经常被过度利用的原因。
在 18世纪以前, 英国苏格兰地区有大量的 世纪以前, 世纪以前 草地, 其产权没有界定, 属公共资源, 大家 草地 , 其产权没有界定 , 属公共资源 , 都可以自由地在那里放牧。 如果限制放牧的 都可以自由地在那里放牧 。 数量, 没有被牛羊吃掉的剩余草皮还会重新 数量 , 长出大面积草场, 但如果不限制放牧规模, 长出大面积草场 , 但如果不限制放牧规模 , 过多的牛羊将草吃得一光二净, 则今后不会 过多的牛羊将草吃得一光二净 , 再有新草生长出来,草场就会消失。 再有新草生长出来,草场就会消失。
• 例子 : 为什么政府要负责修建公共设施,因为私 例子2 为什么政府要负责修建公共设施, 人没有积极性出资修建公共设施
设想有两户相居为邻的农家, 设想有两户相居为邻的农家 , 十分需要有一条好路从 居住地通往公路。修一条路的成本为4, 居住地通往公路。修一条路的成本为 ,每个农家从修好的 好路上获得的好处为3。如果两户居民共同出资联合修路, 好路上获得的好处为 。如果两户居民共同出资联合修路, 并平均分摊修路成本,则每户居民获得净的好处(支付) 并平均分摊修路成本 , 则每户居民获得净的好处 ( 支付) 为 3-(4/2)=1;当只有一户人家单独出资修路时, 修路的 ( ) ; 当只有一户人家单独出资修路时, 居民获得的支付为3-4=-1(亏损), “搭便车”不出资但 (亏损) 搭便车” 居民获得的支付为 仍然可以使用修好的路的另一户人家获得支付3-0=3,见表 , 仍然可以使用修好的路的另一户人家获得支付 2。 。
第六章最后通牒和独裁者博弈实验解析PPT课件
12
. 2020/5/24
四、实验报告
教师应该在学生完成实验的第八步骤且上交实验记 录单之后,再将本报告发放给学生。
13
. 2020/5/24
四、相关理论详述
1.动态博弈
所谓动态博弈,是指博弈参与人的行动存在着先后次序, 并且后行动的参与人能够观察到先行动者所选择的行动。 值得注意的是,后者必须至少能获得先发者的部分行为信 息,否则行为时间的先后就不会有任何效果。通俗的理解 是:“囚徒困境”就是同时决策的博弈,属于静态博弈; 而棋牌类游戏等是决策或行动有先后次序的博弈,属于动 态博弈。
还有的学者(Henrich et al ,2001) 曾在横跨四大洲的15个小型社
会中做了跨文化的最后通牒博弈实验。其实验结果显示,文化背景不
同的人在最后通牒游戏中的表现果然有明显差异。在亚马逊的马奇圭
噶部落,实验对象提议分给对方的钱平均只有26%,远低于西方文明
社会的45%。相反,巴布亚新几内亚阿乌部落的居民则愿意拿出一半
9
. 2020/5/24
项目
轮次 分配方目标收益平均数 分配方实际收益平均数 目标收益分布比例最大区段 目标收益分布最大区段所占
比例 无权方对方案的接受率
实验记录总表
最后通牒博弈
独裁者博弈
1 2 3 4 5 6 7 8 9 10 11 12
100% 100% 100% 100%
10
. 2020/5/24
目标收益区间段的频数
方的 的目标 的实际 方的选择
姓名 收益X 收益X/0 (接受/拒 1 2 3 4 5 6 7 8 9 10
绝)
1
…
…
…
…
小计
无分配权者对方案的接受率
博弈论(第六章)
好 1
卖 2 买 不买 买 不买 不卖 卖
差 1
不卖
(a)
谢富纪 2009年4月 6
1. 不完美信息动态博弈
买
卖
不买
1
不卖
好
1
买
2
差 卖
1
不卖
不买
(b ) 二手车交易扩展形
谢富纪 2009年4月 7
1. 不完美信息动态博弈
好 1 卖 2 买 不买 买 1 差 不卖 (0,0)
1 不卖 卖
(0,0) 不买
谢富纪
2009年4月
15
2. 完美贝叶斯均衡
所以,子博弈完美纳什均衡是完美贝叶斯均衡在完 全且完美信息动态博弈中的特例。 要求1实际上是解决完全但不完美信息动态博弈的 基本前提,要有一个判断,否则决策就会失去依据。 要求2序列理性相当于子博弈完美纳什均衡中的子 博弈完美性。而在多节点信息集开始的不构成子博 弈的部分中,序列理性通过要求各方遵循最大利益 原则而排除博弈方策略中不可信的威胁或承诺。 序列理性要求对保证完美贝叶斯均衡的真正稳定性 是很重要的。
选R),对博弈方1选L还是选M的可能性大小毫无
判断,则他将不知道选U和选D哪个更合理,也就 是说,对两条路径的判断是决策的必要基础,从而 也使均衡策略的基础。
谢富纪
2009年4月
18
2. 完美贝叶斯均衡
条件2的必要性: 如果不要求序列理性,则博弈方2有一个可为自己争取 到的收益3,即博弈方2威胁在轮到自己选择时唯一地 选D,这样策略组合: 博弈方1:第一阶段选R; 博弈方2:如果轮到自己选择,唯一选D。 是一个纳什均衡,也是一个子博弈完美纳什均衡(因为 该博弈没有子博弈)。 但博弈方2的上述策略在博弈方1不选R时选L的概率较 大时,明显包含一个不可信的威胁。因此要求2对于 保证不完美信息动态博弈的均衡策略中没有不可信的 威胁或者承诺具有关键作用。
第六章博弈论
一般认为,1944年美国数学家冯•诺依曼(John Von Neumann)和经济学家奥斯卡•摩根斯坦 (Oskar Morgenstern)合著的《博弈论与经济 行为》(The Game Theory and Economic Behavior) 一书的出版,标志着系统的博弈理 论的形成。
❖该书详尽地讨论了二人零和博弈, 并对合作博弈作了深入探讨,开辟 了一些新的研究领域。更重要的是 将博弈论加以空前广泛的应用,尤 其是在经济学上,由于博弈论数学 上的严整性与经济学应用上的广泛 性,一些经济学家将该巨著的出版 视为数理经济学确立的里程碑。
“保证最低价格”策略
❖ “保证最低价格”条款。
❖ 该条款一般规定:“顾客在本 商店购买这种商品一段时间内,如 果发现其他任何商店以更低的价格 出售同样的商品,本店将退还差价, 并补偿差额的10%。”
❖ 一、单项选择题:
❖ 分析下列的报酬矩阵,回答问题:
John的 开业长时间 咖啡 馆 开业短时间
✓ 第一,不能让对方事先知道自己可 能采取的策略。
✓ 第二,必须采取随机选择的原则。 ✓ 第三,选择策略的概率一定要使对
方无机可乘。
动态博弈
➢重复博弈 ➢序列博弈
重复博弈
❖ 对重复博奕的研究结果证明有一种 最好的策略:只需将一个原则贯穿始终, 即“以牙还牙”(Tit-for-tat)。
❖ 以牙还牙策略的获胜有一个十分重 要的条件,即博弈是无限次重复的。
❖王则柯 :《新编博弈论平话》 中信出版社 ❖ 王则柯主编:《21世纪经济学教材:博弈论
教程》中国人民大学出版社
❖ 《美丽心灵》(A Beautiful Mind )是一部关于一个 真实天才的极富人性的剧情片。故事的原型是数学家 小约翰-福布斯-纳什(Jr.John Forbes Nash)。英俊而又 十分古怪的纳什早年就作出了惊人的数学发现,开始 享有国际声誉。但纳什出众的直觉受到了精神分裂症 的困扰,使他向学术上最高层次进军的辉煌历程发生 了巨大改变。面对这个曾经击毁了许多人的挑战,纳 什在深爱着的妻子艾丽西亚(Alicia)的相助下,毫不畏 惧,顽强抗争。经过了几十年的艰难努力,他终于战 胜了这个不幸,并于1994年获得诺贝尔奖。这是一个 真人真事的传奇故事,今天纳什继续在他的领域中耕 耘着。
博弈论最全完整-讲解课件
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
研究生-第六章 博弈论与信息经济学
逆向选择
3.逆向选择与信贷市场 信贷配给是信贷市场上存在的一种典型现象,原因在于逆 向选择现象存在,高风险的项目驱赶了低风险的项目. 信贷市场中,一般高风险与高收益成正比,银行不了解贷 款者的类型,厂商知道自己的信息.导致贷款利率与银 行期望收益之间的变化如图所示,利率上升的(直接的) 收益效应大于(间接的)风险效应,π随r上升而上升; 当r>r*时,利率上升的(间接的)风险效应超过(直接 的)收益效应,π随r的上升而下降,银行期望收益最大 化的利率为r*.
隐藏行动 事前 隐藏信息 逆向选择模型 信号传递模型 信息筛选模型 隐藏信号的道德风险模型
事后
隐藏行动的道德风险模型
第一节 逆向选择
1.逆向选择与旧货市场(Akerlof,the market for lemons) 逆向选择:在鉴定交易契约前,进行市场交易的一方 可能因为占据信息优势,做出对自己有利,对另一方 有害的事情,从而降低了市场效率,甚至可能导致这 一市场的萎缩. 在旧货市场,卖者拥有信息,买者缺乏信息,买者以 平均质量的价格购买旧商品,将质量较高的旧商品逐 出市场,质量较差的旧商品留在市场,并最终成交. 即为旧货市场的逆向选择行为.
第三节 完全信息静态博弈(二) ——混合策略(mixed strategies) ——混合策略(mixed strategies)
1.混合策略 定义:σ*=(σ1*,…,σn*)=(σi*,σ-i *)是一纳什混合 策略均衡,当且仅当对所有局中人而言, σi* 是σ-i*的最适反应,ui(σi*,σ-i *)≥ ui(σI',σ-i *), σ σ σ ≥ σ σ 对所有σi'∈∑i成立). 持混合策略的前提是在均衡时两种策略的报酬会 相等,是预期支付最大化的推导结果. 2.案例分析 掷硬币
第六章、合作博弈 《经济博弈论基础》PPT课件
• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。
第六章博弈论初步详解
An Example of a Two-Player Game
The players are called A and B. Player A has two strategies, called “Up” and “Down”. Player B has two strategies, called “Left” and “Right”. The table showing the payoffs to both players for each of the four possible strategy combinations is the game’s payoff matrix.
The Prisoner’s Dilemma
Clyde S S Bonnie (-5,-5) C (-30,-1)
C (-1,-30) (-10,-10)
What plays are we likely to see for this game?
The Prisoner’s Dilemma
Clyde
Player B L R U (1,2) (0,4)
Player A
D
(0,5)
(3,2)
Pure Strategies
Player B L R
U Player A
(1,2)
(0,5)
(0,4)
(3,2)
D
ห้องสมุดไป่ตู้
Is (U,L) a Nash equilibrium? No. Is (U,R) a Nash equilibrium? No. Is (D,L) a Nash equilibrium? No.
Player B L R U
(3,9) (1,8)
博弈论课件
扩展一:不完全信息博弈
不完全信息博弈的定义
01
在博弈中,参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度,可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略,研究候选人如何 制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调,分析政策 制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作,分析国家如何通过 外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡 。
特点
纳什均衡是一种稳定的状态,任何参 与者单方面改变自己的策略都不会获 得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略, 该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略,该 策略都能为参与者带来更低的收益 。
特点
在优势策略下,参与者没有理由改 变自己的策略;在劣势策略下,参 与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降,还可能引发市场恶性竞争,破坏市场秩序。此外,价格战还可能导致产品质量 下降,损害消费者利益。
案例二:国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中,各国之间往往存在着复杂的博弈关系。为了维护自身利益,各 国会采取不同的博弈策略,如通过外交手段、经济制裁、军事威胁等方式来达 到自己的目的。
博弈论第六章习题
第六章习题一、判断下列表述是否正确,并作简单分析(1)完全但不完美信息动态博弈中各博弈方都不清楚博弈的进程,但清楚博弈的得益。
答:不一定,不是所有博弈方都不清楚博弈的进程,只要有一个博弈方都不完全清楚博弈的进程。
(2)不完美信息动态博弈中的信息不完美性都是客观因素造成的,而非主观因素造成.答:错。
信息不完美很多是人为因素所造成的,因为出于各自的动机和目的,人们在市场竞争或合作中常常会故意隐瞒自己的行为。
(3)在完全但不完美信息动态博弈中,若不存在混合策略,并且各博弈方都是主动选择且行为理性的,则不完美信息从本质上说是“假的”。
答:正确。
因为只包含理性博弈方的主动选择行为,利益结构明确,而且不同路径有严格优劣之分,从不需要用混合策略的动态博弈来说,所有博弈方选择的路径都可以通过分析加以确定和预测,根本无须观察。
从这个意义上说,这种博弈的不完美信息实际上都是假的. (4)子博弈可以从一个多节点信息集开始。
答:不能从多节点信息集开始,因为多节点必然分割信息集。
(5)不完美信息是指至少某个博弈方在一个阶段完全没有博弈进程的信息。
答:不是完全没有博弈进程的信息,而是没有完美的信息,只有以概率判断形式给出的信息。
二、用柠檬原理和逆向选择的思想解释老年人投保困难的原因。
答:“柠檬原理”是在信息不完美且消费者缺乏识别能力的市场中,劣质品赶走优质品,最后搞垮整个市场机制。
“逆向选择”是在同样不完美市场和消费者缺乏识别能力的市场中,当价格可变时,价格和质量循环下降,市场不断向低端发展的机制。
老年人投保的分析:大致思路是由于信息不对称,费用越来越高,投保人的健康状况好的比例越来越小,最终发展成为只有身体不好的人才参加投保。
如果允许调整费率,保险公司为了避免亏损降低风险,上调保费率,健康状况相对好一些的退出市场,整个市场状况恶化.……这就是逆向选择机制在老年保险市场上作用的结果。
三、用完全但不完美信息动态博弈的思想,讨论我国治理假冒伪劣现象很困难的原因。
博弈论 讲义[精]
第六章 不完全信息动态博弈-精练 贝叶斯纳什均衡
一 精练贝叶斯纳什均衡
基本思路 贝叶斯法则 精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡
二 信号传递博弈及其应用举例 三 博弈论概念简要总结
思维体操:
张同学、李同学都具有足够的推理能力。某天,他们正
所罗门王断案
两个女人为争夺一个孩子吵到所罗门王那里。一个女人说:“陛下, 我和这妇人同住一个房间。我生了一个孩子,三天以后这妇人也生 了一个孩子,房间里再没有别的人。夜里这妇人睡觉的时候,把自 己的孩子压死了。她半夜醒来,趁我睡着,把我的孩子抱去,把她 已经死了的孩子放在我的怀里。天亮要喂奶的时候,我才发现怀里 的孩子是死的,仔细察看,并不是我生的孩子。”另一个女人赶紧 说:“不对,活孩子是我的,死孩子才是她的。”吵得不可开交。
→唯一的均衡价格是P=2000,只有低质量的车成交, 高质量的车退出市场。 若假设车的质量θ∈[2000 ,6000]连续分布,均衡结 果为?
高质量的车退出市场,低质量的旧车充斥市场,结 果买者买到低质量车的现象。——逆向选择( adverse-selection)。
旧车市场的逆向选择来自买卖双方的信息不对称。
完全信息条件下,均衡价格P=6000(高质量)或 P=2000(低质量)。
买者不知道车的真实质量,如果两类车都进入市场, 车的平均质量Eθ =4000→买者愿出的最高价格 P=4000。 →高质量车的卖者将退出市场,只有低量 车θ= 2000的卖者愿意出售。
→买者知道高质量的车退出,市场上剩下的一定是 低质量的卖者。买者愿出的最高价格为P=2000
在接受推理面试。他们知道桌子的抽屉里有如下16张扑克牌:
第六章 猎鹿博弈
强强联合——金龙鱼和苏泊尔
• 金龙鱼是著名的食用油品牌,苏泊尔是著 名的炊具品牌,两者在都倡导新的健康烹 饪理念。就这样,两家企业策划了苏泊尔 和金龙鱼两个行业领导品牌“好油好锅, 引领健康时尚”的联合推广,在全国800家 卖场掀起了一场红色风暴。
• 4.汲取对方的优点,弥补自己的不足
• 在猎鹿博弈中,可能会出现两个猎人的实 力并不想当的情况,在生活中,我们也会 遇到双方实力不相当的情况,但是这并不 是一个难题。往往通过合作,最终双方都 得到了自己的最大收益。在日常生活中, 优势互补是一种绝佳的策略,双方在合作 的过程中,汲取对方的优点,弥补自己的 不足,最后实现共赢。
第六章 猎鹿博弈
本章内容
一、猎鹿博弈及其均衡 二、帕累托效率 三、人心齐,泰山移 四、不要吝于寻求帮助 五、和别人分享你的优势 六、不能独自取得成功 七、从合作走向共赢
一、猎鹿博弈及其均衡
• “猎鹿困境”是由18世纪法国伟大的启蒙思 想家、教育学家、文学家、政治哲学家 让·雅克·卢梭所提出的。他以此为出发点,依 次提出“自然状态”、“前政治社会”、 “公民社会”及“国际无政府状态”等重 要命题,建立起一套较为完整的国际关系 思想,对今天全球治理的思考有着重大的 理论与现实意义。
• 在猎鹿博弈中,每个人的策略选择对于个 人来说都是最优的,或者说,我的最优策 略是既定的,你的最优策略也是既定的, 我们两人是互为条件的。假如单方面改变 策略就会使另一方面临吃亏或者是无利可 图的居民,那合作就可能破裂。
手机厂商和零售卖场
• 对于零售卖场来说,手机厂商属于弱者, 其产品性价比高、品牌知名度高、利润空 间大、市场人员沟通能力强等都是手机厂 商的竞争优势。
得益矩阵为:
二、帕累托效率
管理经济学第六章博弈论和策略行为
案例6-2:性别之战 两个谈恋爱的人准备在周末晚上一起出去。男 的喜欢听音乐会,但女的喜欢看电影。当然,两个 人都不愿意分开活动。 不同的选择给他们带来的满足由表 2表示。
女
音乐会 电 影
音乐会
2 , 1 -1 , -1
男
电 影 -1 , -1 1 , 2
在这样一个对局中,男的和女的都没有支配性 策略。实际上,他们的最优策略依赖于对方的选择, 一旦对方选定了某一项活动,另一个人选择同样的 活动就是最好的策略。两个纳什均衡解。
四、顺序性博弈
序列博弈
现实生活中,还存在另一种博弈状态,即对局者
选择策略有时间先后的顺序,某些对局者可能率先采
取行动,这种博弈称为顺序性博弈。重复博弈和序列
博弈都是动态博弈。
先行动的参与者往往会有一定的优势。
案例6-6:双寡头垄断的两家企业都打算推出 一种新产品。四种可能的策略组合的利润结果见表 6, 单位是百万美元。
1、在一次性博弈中任何欺骗和违约行为都不会 遭到报复,囚犯困境的不合作解通常是难以避免的。
2、在无限期重复博弈中,报复的机会总是存在 的,所以,每一个参与者都不会采取违约或欺骗的 行为,囚犯困境合作均衡解是存在的。
3、在有限期重复博弈中,囚犯困境博弈的纳什 均衡是参与者的不合作。
4、在不能确定终止期的有限期重复博弈的囚犯 困境模型中,纳什均衡的合作解是可以存在的。
无新产品 有新产品
企业 B
无新产品 有新产品
4,4
3,6
6,3
2,2
1、如果企业谋求最大利润,本例存在两个纳什均衡。
两个纳什均衡:(无新产品 ,有新产品)和 (有新产品,无新产品)
2、按照最大最小决策准则,均衡解是: (无新产品 ,无新产品)
《运筹学》课件 第六章 博弈论
§1 基本概念
一、博弈论的定义 二、博弈理论的历史 三、博弈问题举例 四、博弈的分类
三、
1. 囚犯困境(Prisoners’ dilemma
囚犯困境是图克(Tucker)1950年提出的; 该博弈是博奕论最经典、著名的博弈; 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷。
所有局中人的策略组成的向量。)
s (s1,, si,, sn ) 表示n个局中人达成的
一个协议,当这个协议可以自动实施(Self-enforcing) 时,即没有任何局中人有积极性破坏这个协议,那么 这个协议就构成纳什均衡。
否则,若至少存在某些局中人有积极性偏离这个协 议,就构不成纳什均衡。
例:囚犯困境问题:
但是,尽管政府当时无力制止这种事情,公众也不 必担心彩电价格会上涨。这是因为,“彩电厂商自 律联盟”只不过是一种“囚徒困境”,彩电价格不 会上涨。在高峰会议之后不到二周,国内彩电价格 不是上涨而是一路下跌。这是因为厂商们都有这样 一种心态:无论其他厂商是否降价,我自己降价是 有利于自己的市场份额扩大的。
Ⅱ
坦白 抵赖
坦白
Ⅰ
-9,-9
0,-10
抵赖 -10,0 -1,-1
均衡解: 二人均坦白
相关概念介绍
➢博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
坦白 抵赖
➢ 博弈问题的基本要素 (1)局中人(Players)
现代博弈论主要指非合作博弈理论。非合作博弈 更受重视的原因:主导人们行为的主要还是个体理性, 而非集体理性;即,竞争是一切社会、经济关系的根 本基础,不合作是基本的,合作是有条件和暂时的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章博弈论
主要内容:本章共分四节:第一节,简单博弈与博弈均衡;第二节,重复博弈与序列博弈;第三节,威胁与承诺;第四节,几种相关的策略。
在第一、二节中将介绍博弈论的一些基本概念,在第三、四节中运用博弈论来分析寡占市场中厂商的一些竞争策略,包括厂商的定价策略、产品选择策略、阻止进入策略等。
教学重点:了解关于博弈论的基本概念,掌握上策均衡与纳什均衡的区别;学会运用重复博弈和序列博弈分析案例,并能够运用博弈论的基本知识分析厂商的基本竞争策略。
关键概念:博弈均衡上策上策均衡纳什均衡重复博弈序列博弈威胁承诺
第三节威胁与承诺
一、阻止市场进入的威胁
威胁与承诺是博弈论中的一个重要论题,它可以用来分析竞争中的一种重要现象。
“小镇上的折扣店”是市场进入中的一种较为特殊的现象,在更一般的情况中,一个市场不一定只能容纳一家厂商。
此时市场进入的博弈也有所不同。
例证 7 :阻止市场进入的威胁博弈
已有一个垄断经营者,现在有另一家厂商作为潜在的竞争者试图进入这个市场。
对垄断者来说,如果要想保住自己的垄断地位,就会设法阻止潜在竞争者的进入。
在这个博弈中,潜在竞争者有两种策略可以选择,即进入或不进入;垄断者也有两种策略,或者与进入者打一场商战,或者默许他的进入。
这个博弈的报酬矩阵如表 6.6 所示。
表 6.6 阻止市场进入的博弈
垄断者
商战默许
潜在进入者进入- 200 , 600 900 , 1 100 不进入0 , 3 000 0 , 3 000
在这个博弈中,策略选择是有着确定的顺序的:潜在进入者做出选择(进入或不进入)→垄断者决定(默许进入或进行商战)。
当然,潜在进入者在做出决策的时候必须要考虑垄断者的反应。
假定潜在进入者进入市场需要花费进入成本 200 万元。
对于进入者来说,如果其选择了进入市场的策略,当垄断者默许的时候,他可获利 900 万元;但如果垄断者决定与他进行一场商战时,垄断者依然可以获利 600 万元,而进入者将亏损 200 万元。
市场进入的扩展形式见图 6.2 。
对
于潜在进入者而言:当潜在进入者选择不进入市场时,实际上只有一种结局,因此,这里出现的结局只有三种。
对潜在进入者来说,最有利的结局当然是(进入,默许)。
如果进入者了解这个报酬矩阵的时候,他会发现,当他进入市场之后,垄断者在节点 2 可能采取的是默许的对策,因为此时垄断者的获利会比其选择商战利润多。
因此,潜在进入者在节点 1 将选择进入策略。
于是这个博弈最可能的结局是(进入,默许)。
注意,对于垄断者来说,“默许”是一个上策,但对于潜在进入者而言却没有上策,因而,这不是一个上策均衡,但却是一个纳什均衡。
对于垄断者而言,这一结局不是他所愿意看到的。
因此,垄断者的反应就是试图阻止其进入。
其中一种方式就是垄断者通过信息渠道用商战的信息威胁潜在进入者。
但如果垄断者面临的是如表 6.6 的报酬矩阵,垄断者的威胁是不可信的。
因为一旦潜在进入者进入该市场,垄断者只会默许他的进入。
这种垄断者通过声明并不能达到阻止其他竞争者进入市场的威胁被称为空头威胁。
二、承诺与可信性
在空头威胁无效的情况下,垄断者依然可以通过“承诺”的方法达到其阻止潜在进入者进入的目的。
所谓“承诺”是指对局者在不实行这种威胁会遭受更大损失的时候,采取的某种行动,这种行动使其威胁成为一种令人可信的威胁。
与承诺相比,空投威胁无法有效阻止市场进入的主要原因是,它是不需要任何成本的。
因此,只有当对局者采取了某种行动,而且这种行动需要较高的成本,才会使威胁变得可信。
垄断者的商战与垄断者的生产成本有关,商战的形式通常是低价竞争。
那么,垄断者阻止进入的一种重要承诺就是通过投资来形成一部分剩余的生产能力,这部分生产能力在没有其他厂商进入市场的时候是多余的,但在进入发生时则成为其低价竞争的有力武器。
例证 8 :实施承诺后的阻止市场进入博弈
假定垄断者需要投资 800 万元来实施这个承诺。
这一投资将改变博弈的报酬矩阵,新的报酬矩阵如表 6.7 所示。
表 6.7 实施承诺后的阻止市场进入的博弈
垄断者
商战默许
潜在进入者进入- 200 , 600 900 , 300 不进入0 , 2 200 0 , 2 200
在实施了承诺行动以后,假定潜在进入者不进入市场,或者潜在进入者进入市场而垄断者选择默许策略时,垄断者的多余生产能力不能得到利用,垄断者的上策不再是默许,而变成了商战。
因为垄断者采取商战策略的时候,生产能力得到了充分利用,反而仍可获得 600 万利润,其博弈的扩展形式如图 6.3 。
在图 6.3 中,节点 1 之后就是图 6.2 所展示的扩展形。
分析从节点 3 开始,此时垄断者应选择商战策略。
回到节点 2 ,潜在进入者将在(进入,商战)与不进入这两种结局中权衡,当然 0 利润比亏损好,所以潜在进入者选择不进入策略。
但在节点 1 的结局却是(进入,默许),此时垄断者将获利 1 100 万元,而节点 2 现在的结局是不进入,垄断者将获利 2 200 万元。
显然,垄断者采取的承诺行动将有效阻止进入。
而且,尽管垄断者投资了 800 万元,导致利润减少( 1 400 万元),但比 1 100 要多,因此,其将采取商战策略。
承诺能够阻止市场进入的关键在于其可信性,但承诺同时也给厂商自身的行为带来一定的限制。
这种通过限制自己的行为来获得竞争优势的做法被称为“策略性行动”。
策略性行动就是某人通过影响其他人对自己的行为的预期,来促使其他人选择对自己有利的策略,是某人通过限制自己的行为来限制其对局者的选择。
第四节几种相关的策略
一、“保证最低价格”的策略
“保证最低价格”策略是顾客在本商店购买产品在规定时间内,如果发现其他任何商店以更低的价格出售同样的商品,本店将退还差价并给予顾客一定的补偿。
保证最低价格条款使消费者至少在规定的时间内不会因为商品降价而后悔。
它无疑是厂商之间竞争的一种手段。
例证 9 :“保证最低价格”的博弈
假定推行保证最低价格条款的商店为商店 A ,其竞争对手为商店 B 。
当商店 A 把尼康相机的价格定位 5 000 元并推行保证最低价格条款的时候,商店 B 如何定价才最为有利呢?如果商店 B 的定价高于 5 000 元,顾客就会去商店 A 购买尼康相机;如果商店 B 的定价低于
5 000 元,他也不会争取到更多的顾客,因为,商店 A 已经有了保证最低价格的条款。
这样,对于商店 B 来说,他的最优定价策略就是与商店 A 制定同样的价格。
反之,对于商店 A 来说,如果他预期商店 B 将与其定制同样的价格话,假若市场上只有这两家商店,此时商店 A 将可以将尼康相机的价格定在“卡特尔”的利润最大化水平上,即 5 000 元将是一个垄断价格。
尽管两家商店没有达成任何协议,但商店 A 可以设想这两家商店构成一个“卡特尔”,并按垄断定价法则来制定价格。
由此可见,保证最低价格的条款实际上是商店之间形成默契的有效手段。
保证最低价格条款是一种承诺,由于法律的限制,它是绝对可信的。
这一承诺隐含着商店 A 向商店 B 发出的不要降价竞争的威胁,并使这种威胁产生其预期的效果。
二、研究与开发( R&D )策略
新产品的研究与开发是厂商在市场竞争中保持其有利地位的非常重要的手段。
在垄断竞争的市场中,为了不断获得短期的超额利润,厂商可能抱有研究与开发的强烈动机。
有些经济学家认为,在寡占市场中,由于厂商具有相当强的垄断势力,他们可能不愿意在研究开发活动中投入较多的资金,从而将不利于发明与创新,不利于长期的经济发展。
但这种说法未必符合实际情况。
在不少行业中,产品的改进和创新可能是寡占者之间竞争的主要手段,因而,研究与开发活动的策略就成为他们的关键策略。
例证 10 :研究与开发( R&D )的博弈
在美国一次性尿布市场中,宝洁公司( P&D )约占 50 %~ 60 %,金伯利——克拉克公司约占 30 %。
这是一个巨大的市场,每年的销售额可达约 40 亿美元,但其他公司仍然很难进入这个市场。
这个市场竞争的主要方面在于一次性尿布的生产成本,而成本的降低主要依靠不断的进行研究与开发,微小的技术改造或成本微小的降低都可能成为有利的竞争优势。
表 6.8 是这两家公司之间研究与开发竞争的报酬矩阵。
表 6.8 研究与开发活动的博弈
金伯利——克拉克
R&D 无 R&D
宝洁公司( P&D )
R&D 2 000 , 1 000 4 000 ,- 1 000 无 R&D - 1 000 , 3 000 3 000 , 2 000
对于这两家公司而言, R&D 都是上策,因此,这个博弈将达成一个上策均衡,两家公司都只能赚取较少的利润。
同时,这又是一个“囚徒的困境”。
但在这样一个博弈中,即使是无限次的对局,也很难达成相互合作的结果。
实际上,大量的研究与开发的投入也成为这个市场进入壁垒的主要来源之一。
对于一个进入者来说,要想在这个市场中夺得较大的市场份额。