第六章博弈论初步详解
第六讲博弈论课件
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪
踩
踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。
第六章第一讲重复博弈的类型解读
2020年11月18日
博弈论第六章
1
重复博弈的类型
“宽容”OR“不好惹”?
A家长教育孩子A的原则: 宽容
A的选择: 及时还击, 培养“不好惹”的声誉—— “他打你,你就打他”
C家长教育孩子C的原则: 好斗
若A与C之间的博 弈重复进行?
要与人为善
2020年11月18日
博弈论第六章
1
1 r r 市场利率
1 2 2 3 T 1T
T
2020年11月18日
t 1 博t 弈论第六章
13
t 1
重复博弈的类型
第一节 重复博弈的类型
➢二、无限次重复
➢(一)案例:寡头削价竞争
➢1.案例
➢
寡头1
➢
高价
低价
➢
高价
➢寡头2
4,4
➢
低价 5,0
0,5 1,1
2020年11月18日
重复博弈的类型
第一节 重复博弈的类型
➢二、无限次重复 ➢(一)案例:寡头削价竞争 ➢2.无限次重复博弈策略分析 ➢(3)以后各期
A、if寡头2合作,“高价”→ 寡头1坚持“高价”
2020年11月18日
B、 if寡头2不合作,“低价”→ 寡头1报复,永远低价
博弈论第六章
16
重复博弈的类型
第一节 重复博弈的类型
9
重复博弈的类型
第一节 重复博弈的类型
➢一、有限次重复
➢(二)定理:有限次重复博弈的均衡
G(T):有限次重复博弈 G:博弈 T:重复次数 G:阶段博弈,T<∞
2020年11月18日
若G有唯一的纳什均衡,
则G(T)的唯一子博弈精炼
经济博弈论第六章不完全信息静态博弈共39页
11
27.04.2020
6.1.3 海萨尼转换
基本思路:将静态博弈转化为动态博弈 (1)假设有一个名为“自然”的博弈方0,该博弈
方的作用是先为其他每个博弈方抽取他们的类型, 抽取的这些类型构成类型向量
t=(t1,…,tn),其中t i T i ,i=1,…,n。
(2)“自然”让每个博弈方知道到自己的类型, 但却不让其他博弈方知道。
10
27.04.2020
6.1.2 静态贝叶斯博弈的一般表示
静态贝叶斯博弈的一般表达式为: G={A1,…,An ;T1,…,Tn;u1,…,un}
其中Ai为博弈方i的行为空间(策略空间), Ti是博弈方i的类型空间,博弈方i的得益 ui=ui(a1,…,an,ti)为策略组合(a1,…,an ) 和类型ti的函数。
q1*a2C1C3 H(1)CL)
6
27.04.2020
6.1.1 不完全信息的古诺模型
与完全信息古诺模型比较 完全信息古诺模型中的的产量
q1*
a2C1 3
C2
q2*
a2C2 3
C1
CH C2 q2*(CH)q2*
CL C2 q2*(CL)q2*
ቤተ መጻሕፍቲ ባይዱ
7
27.04.2020
6.1.2 静态贝叶斯博弈的一般表示
厂商1只知道有两种可能性,一种是C2= C2(q2) = CH q2概率为θ另一种是C2= C2(q2)= C Lq2, 概率为1-θ,而CH>CL,也即边际成本有高、低两 种可能。
3
27.04.2020
6.1.1 不完全信息的古诺模型
厂商2在边际成本是较高的CH时会选择较低的产 量,而在边际成本为较低的CL时会选择较高的产 量。
第六章 寡头市场与博弈
博弈论的基本概念
合 A厂商 合 作 B厂商 作 不合作
5 5 6 3
图支付矩阵
3 6 4 4
不合作
如果A和B都选择合作的策略,则总的报酬最大为10, 每个参与者均得到5个单位的收益;如果A、B两者中有一 方选择合作而另外一方选择不合作,则选择合作的一方收 益为3,利益受损;而不合作的一方收益为6。若两者都选 择不合作,则各自的收益都是4。
重复博弈
但在有限期重复博弈中,囚犯困境博弈的纳什均衡是 参与者不合作。 无限期重复博弈的特征并不是真的“无限”期,而是 参与者都不知道末期的具体时间。所以,欺骗或者违约行 为总会被报复这样的威胁使得每一个参与者都会把合作策 略维持下去。换而言之,在有限期重复博弈中,如果任何 一个参与者都不能准确地知道哪一期是末期,那么就形成 了无限期重复博弈的结果。因此,在不能确定终止期的有 限期重复博弈的囚犯困境模型中,纳什均衡的合作解是可 以实现的。
重复博弈
每一个参与者只参加一次策略的选择。一旦每个参与 者的策略选定,整个博弈结局也就决定了,每个参与者不 可能再对博弈的过程施加什么影响。这类博弈被称为静态 博弈。 反复进行的博弈过程被称为动态博弈,重复博弈是动 态博弈的一种特殊的情况。在重复博弈中,同一个博弈过 程重复多次。 在无限期重复博弈的情况下,对于任何一方参与者的 欺骗和违约行为,其他参与者总会有机会予以报复。违约 或者说欺骗方就有可能永远失去和别人合作的机会,这可 以看做是一种惩罚。
二、寡头市场的优缺点
第一,由几家企业提供绝大多数的产量,企业 的生产规模一般较大,可以获得规模经济的好处。 第二,在有较多企业竞争的环境里面,各个企 业规模较小,并且竞争压力太大,企业的决策往往 只着眼于短期利润,而较少有能力和信心从事长期 的技术革新和产品革新策略。 第三,大型企业具有抵御风险的能力。 第四,大型企业必然要求有可以对庞大而且复 杂的生产过程进行管理的技术和经验。
《博弈论初步》课件
THANKS
感谢观看
02
纳什均衡是一种非合作博弈均衡 ,其中每个参与者都认为当前策 略是最好的,不会受到其他参与 者的欺骗或影响。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的策略,逐步逼近纳什均衡。这 种方法适用于较简单的博弈模型,但对于复杂的博弈模型 可能收敛速度较慢。
线性规划法
将纳什均衡问题转化为线性规划问题,通过求解线性规划 来找到纳什均衡。这种方法适用于具有线性特征的博弈模 型,但计算复杂度较高。
价格战与非价格战
博弈论分析了价格战和非价格战的利弊,为企业制定营销策略提供 博弈论可以用来分析选民的投票行为和政治立场,预测选举结果。
02
候选人策略
博弈论为候选人提供了制定最优竞选策略的方法,帮助他们在选举中获
胜。
03
政治联盟与利益交换
博弈论中的合作博弈理论可以用来分析政治联盟的形成和利益交换机制
特征值法
利用特征值和特征向量的性质来求解纳什均衡。这种方法 适用于具有矩阵特征的博弈模型,但需要一定的数学基础 。
纳什均衡的应用实例
1 2
价格竞争
在寡头市场中,企业之间通过价格策略进行竞争 ,最终形成价格均衡,即纳什均衡。
劳资谈判
劳资双方在谈判中会提出自己的工资要求,最终 达成工资协议,这也是一种纳什均衡。
博弈类型
合作博弈
定义
01
参与者通过合作达成共赢的博弈。
特点
02
存在合作协议,强调集体行动和收益分配。
应用场景
03
国际关系、商业合作、团队协作等。
非合作博弈
定义
应用场景
参与者追求各自利益最大化的博弈。
市场竞争、个人决策、资源分配等。
博弈论(第六章)
好 1
卖 2 买 不买 买 不买 不卖 卖
差 1
不卖
(a)
谢富纪 2009年4月 6
1. 不完美信息动态博弈
买
卖
不买
1
不卖
好
1
买
2
差 卖
1
不卖
不买
(b ) 二手车交易扩展形
谢富纪 2009年4月 7
1. 不完美信息动态博弈
好 1 卖 2 买 不买 买 1 差 不卖 (0,0)
1 不卖 卖
(0,0) 不买
谢富纪
2009年4月
15
2. 完美贝叶斯均衡
所以,子博弈完美纳什均衡是完美贝叶斯均衡在完 全且完美信息动态博弈中的特例。 要求1实际上是解决完全但不完美信息动态博弈的 基本前提,要有一个判断,否则决策就会失去依据。 要求2序列理性相当于子博弈完美纳什均衡中的子 博弈完美性。而在多节点信息集开始的不构成子博 弈的部分中,序列理性通过要求各方遵循最大利益 原则而排除博弈方策略中不可信的威胁或承诺。 序列理性要求对保证完美贝叶斯均衡的真正稳定性 是很重要的。
选R),对博弈方1选L还是选M的可能性大小毫无
判断,则他将不知道选U和选D哪个更合理,也就 是说,对两条路径的判断是决策的必要基础,从而 也使均衡策略的基础。
谢富纪
2009年4月
18
2. 完美贝叶斯均衡
条件2的必要性: 如果不要求序列理性,则博弈方2有一个可为自己争取 到的收益3,即博弈方2威胁在轮到自己选择时唯一地 选D,这样策略组合: 博弈方1:第一阶段选R; 博弈方2:如果轮到自己选择,唯一选D。 是一个纳什均衡,也是一个子博弈完美纳什均衡(因为 该博弈没有子博弈)。 但博弈方2的上述策略在博弈方1不选R时选L的概率较 大时,明显包含一个不可信的威胁。因此要求2对于 保证不完美信息动态博弈的均衡策略中没有不可信的 威胁或者承诺具有关键作用。
第六章博弈论
一般认为,1944年美国数学家冯•诺依曼(John Von Neumann)和经济学家奥斯卡•摩根斯坦 (Oskar Morgenstern)合著的《博弈论与经济 行为》(The Game Theory and Economic Behavior) 一书的出版,标志着系统的博弈理 论的形成。
❖该书详尽地讨论了二人零和博弈, 并对合作博弈作了深入探讨,开辟 了一些新的研究领域。更重要的是 将博弈论加以空前广泛的应用,尤 其是在经济学上,由于博弈论数学 上的严整性与经济学应用上的广泛 性,一些经济学家将该巨著的出版 视为数理经济学确立的里程碑。
“保证最低价格”策略
❖ “保证最低价格”条款。
❖ 该条款一般规定:“顾客在本 商店购买这种商品一段时间内,如 果发现其他任何商店以更低的价格 出售同样的商品,本店将退还差价, 并补偿差额的10%。”
❖ 一、单项选择题:
❖ 分析下列的报酬矩阵,回答问题:
John的 开业长时间 咖啡 馆 开业短时间
✓ 第一,不能让对方事先知道自己可 能采取的策略。
✓ 第二,必须采取随机选择的原则。 ✓ 第三,选择策略的概率一定要使对
方无机可乘。
动态博弈
➢重复博弈 ➢序列博弈
重复博弈
❖ 对重复博奕的研究结果证明有一种 最好的策略:只需将一个原则贯穿始终, 即“以牙还牙”(Tit-for-tat)。
❖ 以牙还牙策略的获胜有一个十分重 要的条件,即博弈是无限次重复的。
❖王则柯 :《新编博弈论平话》 中信出版社 ❖ 王则柯主编:《21世纪经济学教材:博弈论
教程》中国人民大学出版社
❖ 《美丽心灵》(A Beautiful Mind )是一部关于一个 真实天才的极富人性的剧情片。故事的原型是数学家 小约翰-福布斯-纳什(Jr.John Forbes Nash)。英俊而又 十分古怪的纳什早年就作出了惊人的数学发现,开始 享有国际声誉。但纳什出众的直觉受到了精神分裂症 的困扰,使他向学术上最高层次进军的辉煌历程发生 了巨大改变。面对这个曾经击毁了许多人的挑战,纳 什在深爱着的妻子艾丽西亚(Alicia)的相助下,毫不畏 惧,顽强抗争。经过了几十年的艰难努力,他终于战 胜了这个不幸,并于1994年获得诺贝尔奖。这是一个 真人真事的传奇故事,今天纳什继续在他的领域中耕 耘着。
第六章、合作博弈 《经济博弈论基础》PPT课件
• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。
第六章博弈论初步详解
An Example of a Two-Player Game
The players are called A and B. Player A has two strategies, called “Up” and “Down”. Player B has two strategies, called “Left” and “Right”. The table showing the payoffs to both players for each of the four possible strategy combinations is the game’s payoff matrix.
The Prisoner’s Dilemma
Clyde S S Bonnie (-5,-5) C (-30,-1)
C (-1,-30) (-10,-10)
What plays are we likely to see for this game?
The Prisoner’s Dilemma
Clyde
Player B L R U (1,2) (0,4)
Player A
D
(0,5)
(3,2)
Pure Strategies
Player B L R
U Player A
(1,2)
(0,5)
(0,4)
(3,2)
D
ห้องสมุดไป่ตู้
Is (U,L) a Nash equilibrium? No. Is (U,R) a Nash equilibrium? No. Is (D,L) a Nash equilibrium? No.
Player B L R U
(3,9) (1,8)
第六章最后通牒和独裁者博弈实验解析PPT课件精选全文完整版
最后通牒博弈实验是由德国经济学家Güth, Schmittberger, and
Schwarz (1982)来进行的,他们的实验结果显示传统博弈理论对最后通
牒博弈并没有得出一个有说服力的解释,而且也不能对现实世界中的
人们的行为提出满意的预测。从Güth等人的实验中观察到:在大多数
情况下提议者给响应者的分配比例的平均数不到70%,大约20%的提
12
. 2024/10/15
四、实验报告
教师应该在学生完成实验的第八步骤且上交实验记 录单之后,再将本报告发放给学生。
13
. 2024/10/15
四、相关理论详述
1.动态博弈
所谓动态博弈,是指博弈参与人的行动存在着先后次序, 并且后行动的参与人能够观察到先行动者所选择的行动。 值得注意的是,后者必须至少能获得先发者的部分行为信 息,否则行为时间的先后就不会有任何效果。通俗的理解 是:“囚徒困境”就是同时决策的博弈,属于静态博弈; 而棋牌类游戏等是决策或行动有先后次序的博弈,属于动 态博弈。
以上的钱给对方。某些部落中,送礼是很重要的文化传统,而且接受
了别人的馈赠之后,相对的也必须感恩图报。阿乌人就是如此,他们
对太过慷慨或太过吝啬的馈赠,通常都会拒绝。尽管有文化差异,实
验结果仍然和理性分析所预测的自私行为相去甚远。
19
. 2024/10/15
4、1 ~4轮中,你将与4个对手进行四次博弈,并填写对 手姓名和各轮收益。
7
. 2024/10/15
5、第5 ~8轮实验中,老师宣布你所在的一组同学具有分 配权时,你和你所在的这一组其他同学应该将分配方案写 在标有自己姓名的白纸上,并交给老师,由老师在你们制 定的分配方案中,找出本方目标利益最低的一个方案,选 出另一组同学中任意一位,尤其决定是否接受。如果他不 接受,则每个人得0元,如果他接受的方案正好是你提出的 方案,你和他就按照该方案填写对手姓名和本轮游戏收益。 如果他接受的方案是别人提出来的,那么你只能得0分。
博弈论初步
博弈论初步博弈论初步主要内容:博弈论的基本理论和运用博弈论进行决策的一般方法.教学目的:通过本章的教学, 要求学生了解博弈论的一般理论和运用博弈论进行决策的一般方法.目前, 博弈论发展的非常深入, 这里只是介绍一些初步知识. 在二十世纪四, 五十年代, 由冯·诺依曼(Von Neumann), 摩根斯坦(Morgenstern)把对策论, 运筹学引入经济学, 形成了最早的博弈论. 几十年来, 博弈论在经济学中发挥着越来越大的重要作用, 1994年的诺贝尔经济学奖就授予三位博弈论学家: 纳什(Nash), 泽尔腾(Selten)和海萨尼(Harsanyi).博弈论字面的意思是游戏策略, 及用类似游戏中解决问题的方法, 揭示解决社会, 经济及其他领域问题的策略, 对策, 因此有的还把博弈论译成对策论. 准确的说博弈论是在给定的条件下寻求最优策略, 这里给定的条件包含其他人的策略以及本人的决策对其他决策主体的影响.策略性活动在社会, 经济, 政治生活中大量存在, 也可以说, 整个社会, 经济, 政治生活都是博弈行为. 因此, 博弈论作为一种方法, 广泛的应用在经济, 政治, 军事, 外交中, 只是博弈论在经济学中应用的最广泛, 最成功. 如前面介绍过的古诺均衡, 就属于经济学中的博弈过程.第一节基本概念一, 博弈论1. 定义:博弈论是描述, 分析多人决策行为的一种决策理论, 是多个经济主体在相互影响下的多元决策, 决策的均衡结果取决于双方或多方的决策. 如下棋, 最后的结果就是由下棋双方你来我往轮流做出决策, 决策又相互影响, 相互作用而得出的结果.2. 博弈论与优化理论的异同点(1)相同点: 博弈论与优化理论都是在给定的条件下, 寻求最优决策的过程.(2)不同点:A, 优化理论可以看成是单人决策, 而博弈理论可以看成是多人决策.在优化理论的决策过程中, 影响结果的所有变量都控制在决策者自己手里; 而在博弈论的决策过程中, 影响结果的变量是由多个决策者操纵的. 如企业在追求成本最小化, 产量最大化, 利润最大化的过程中总是假定外部条件给定, 这实际上表明是一个优化问题, 因为除了给定的外部条件外, 剩下的因素都有决策者来控制, 从而决策者自己就能控制决策的结果; 如果外部条件不是给定的, 而是有其他主体参与的过程, 这时的决策过程就变成了一个博弈过程了, 因为决策的最终结果不但取决于决策者本身, 而且也取决于其他决策者的决策.B, 优化过程是一个确定的过程, 而博弈过程是确定性和不确定性的统一. 优化过程是一个确定的过程, 因为做出决策后, 确定的结果就出来了. 说博弈过程有确定性, 是因为决策各方的决策做出后, 每一方的收益就确定了; 说博弈过程有不确定性, 在于一方做出决策后, 影响结果的变量还有众多的其他决策者, 在不知道其他主体行为的情况下, 结果就不确定.例如: 在一次具体的战斗中, 一方是否发起进攻, 是一个决策. 如果发起进攻, 对方肯定有所反应, 客观上讲, 必然会有一个确定的结果存在, 这是确定性的表现. 但是最后的结果如何, 取决于对方如何应对, 所以在发起进攻时, 并不能知道结局是怎样的, 这就是不确定性的表现.如果一方发起进攻后, 另一方马上投降, 则战斗结束; 如果对方进行反攻, 从理论上来讲, 结果取决于双方实力以及双方收益的大小. 由此可以看出博弈的广泛存在, 在现实生活中做出任何决策时, 实际上都受到其他主体决策的影响并对我们做决策产生一定影响, 决策的结果除了由我们自己决定外还要受到其他决策主体的影响, 这实际上就是一个博弈过程.二, 参与者(PL A YER)参与博弈的利益主体叫做参与者. 在二人博弈中, 有两个参与者; 在三人博弈中, 有三个参与者; 在多人博弈中, 有多个参与者.三, 策略和策略空间1. 策略在给定条件博弈中, 参与者完整的一套行动计划叫做策略. 例如我国古代著名的谋略故事”田忌赛马”中, 国王的赛马计划是: 先出上等马, 再出中等马, 最后出下等马; 田忌的赛马计划是: 先出下等马, 再出上等马, 最后出中等马. 这里的赛马计划就是一套完整的行动计划, 也就是一个策略.2. 策略空间参与者可以选择的策略的全体就组成了策略空间. 例如在“田忌赛马”中, 共有六种行动方案可供选择: 上中下(先出上等马, 再出中等马, 最后出下等马), 上下中, 中上下, 中下上, 下上中, 下中上. 决策时田忌可以选择其中任何一个策略, 在故事中, 因为国王固定选择了上中下, 所以田忌选择了下上中, 从而赢得了比赛. 任何一人策略的改变都将使结果也随之改变, 比如国王选择了中下上, 而田忌选择了下上中, 则国王将赢得比赛.四, 报酬函数与报酬矩阵1. 报酬函数每一个参与博弈的参与者, 他的收益依附于各个参与者所出的策略, 这种收益与策略的依附关系就构成了报酬函数. 也就是说, 第i个参与者的收益取决于所有参与者的策略, 而不仅仅是自己的策略, 表示成数学式子就是: R i=R i(S1, S2, …Sn). 其中R i表示i个参与者的收益, Si (i=1, …n) 表示第i个参与者所出的策略.2. 报酬矩阵参与博弈的多个参与者的报酬可以用一个矩阵或框图表示, 这样的矩阵或框图就叫做报酬矩阵. 例如有甲乙两个供货商组成一个价格卡特尔, 双方都有选择遵守约定价格或者违反约定价格的权利. 报酬矩阵如下图所示:乙守约违约守约8, 86, 10甲违约10, 67, 7图8-1矩阵中每组数字中的前一个数字表示甲的收益, 后一个数字表示乙的收益. 当甲守约时, 乙如果守约, 收益为8, 乙如果违约, 收益为10; 当甲违约时, 乙如果守约, 收益为6, 乙如果违约, 收益为7. 所以, 当甲守约时, 乙会选择违约(10>8); 当甲违约时, 乙也会选择违约(7>6). 反之不管乙如何选择, 甲都会选择违约, 最终的结果是双方都选择违约. 报酬矩阵改变, 就会影响到双方的决策. 例如双方的报酬矩阵变成下图所示: 乙守约违约守约12, 12 2, 10甲违约10, 2 -4, -4图8-2此时双方可能都选择守约, 因为当甲守约时, 乙会选择守约(12>10); 当甲违约时, 乙也会选择守约(2>-4). 反之不管乙如何选择, 甲都会选择守约, 最终的结果是双方都选择守约.博弈过程参与者的决策行为要受到博弈规则的影响, 即博弈规则的变化会改变报酬矩阵中的报酬值. 比如在图8-1中, 由于卡特尔中的每一个供货商都追求自身利益的最大化, 并且没有措施来保证遵守价格约定, 表面上可能都信誓旦旦的承诺守约, 但是实际中双方会违约.如果卡特尔追求整体利益的最大化, 并且由于历史, 政治, 制度, 惩罚等措施来保证遵守价格约定, 双方就可能和平共处, 遵守价格约定. 在历次中东战争中, 由于民族宗教原因, OPEC石油的产量和价格都得到了严格的执行.五, 均衡及博弈的解当博弈的所有参与者都不想改换策略时, 所达到的稳定状态叫做均衡, 均衡的结果叫做博弈的解.比如图8-1中甲乙两个供货商组成的卡特尔. 不管甲如何选择, 乙必然选择违约, 同样不论乙如何选择, 甲必然选择违约. 最终双方都选择了违约, 并且只要给定的条件不变, 双方就都不会改变策略, 结果非常稳定, 达成均衡.在这个均衡中, 不管甲如何选择, 乙都不会改变策略, 同样无论乙如何选择, 甲也不会改变策略, 这种均衡就叫做占优均衡. 这种无论对方如何决策, 自己总是会选择的策略叫做占优策略, 由双方的占优策略所达成的均衡叫做占优均衡.再比如, 在学校中, 学生平时学习可能是非常努力也可能是非常懒散; 老师可能把考试题出的很难, 也可能出的很容易. 从博弈论的角度, 这里的老师和学生就构成了一个博弈, 双方的报酬矩阵如下: 老师出考题难易努力90, 85100, 90学生学习懒散50, 6090, 70图8-3由于老师出难题比出容易题要花费更多的时间和精力, 所以收益较低, 从而无论学生平时努力程度如何, 老师一定选择出容易的题; 由于学生只要努力学习就会取得更好的成绩, 所以无论老师所出考题难度如何, 学生一定会选择努力学习, 这同样构成一个占优均衡.经常遇到的还有一种均衡, 是有条件的均衡, 叫做纳什均衡. 简单的说就是敌变我变, 敌不变我亦不变. 在后面第二节中将详细介绍纳什均衡.六, 囚犯两难困境(p risoners’d ilemma)囚犯两难困境是博弈论中一个著名的例子, 讲的是甲乙两名嫌疑犯作案后被警察抓住, 分别被关在不同的屋子里受审, 双方不能互通消息, 每名嫌疑犯都面临坦白和不坦白两种选择. 警察告诉他们: 在两人都坦白的情况下, 各判刑10年; 在两人都不坦白的情况下, 各判刑3年; 在一人坦白另一人不坦白的情况下, 坦白的一方会被从轻处罚, 只被判刑1年, 不坦白的一方则被重判15年. 可以根据坦白后是否会受到制裁两种情况来讨论最终的均衡结果.1、坦白后不会受到制裁时的情况此时, 双方收益矩阵如下:乙不坦白坦白不坦白-3, -5-15, -1 甲坦白-1, -15-10, -10图8-4如图, 在乙不坦白的情况下, 如果甲坦白, 甲会被从轻处罚, 只被判刑1年, 乙被重判15年; 如果甲也不坦白, 由于证据不足, 甲乙都只会被判刑3年. 在乙坦白的情况下, 如果甲也坦白, 甲乙会被判刑10年; 如果甲不坦白, 乙会被从轻处罚, 只被判刑1年, 甲则被重判15年.可见, 在乙不坦白的情况下, 甲最好是坦白, 从而可以被从轻处罚; 在乙坦白的情况下, 因为被判刑10年总比15年要好, 甲最好也是坦白, 所以甲会选择坦白.同理, 无论甲如何选择, 乙的最好选择也是坦白. 结果双方都选择坦白, 都被判刑10年. 可见, 我国公安机关”坦白从宽, 抗拒从严“的心理攻势在大多数情况下都是可以奏效的. 囚犯两难困境说明个人的理性可能导致集体结果的不妙. 在现实社会中, 人人都追求完美反而可能会导致社会变得很糟糕.2. 坦白后会受到制裁时的情况博弈论的一个重要思想就是规则改变报酬矩阵, 改变了报酬矩阵就会影响到行为方式. 如果犯罪组织有着严格的惩罚制度, 任何一个罪犯坦白后, 不论坦白的事情严重与否, 犯罪组织一定会杀人灭口, 并且总是能迅速做到. 这个规则将改变报酬矩阵, 新的报酬矩阵如下图所示: 乙不坦白坦白不坦白-3, -3-15, -∝甲坦白-∝, -15-∝, -∝图8-5由于坦白后将被灭口, 所以收益将是-∝. 在乙不坦白的情况下, 甲最好是不坦白; 在乙坦白的情况下, 因为被判刑15年总比死去要好, 甲最好也是不坦白, 所以甲会选择不坦白. 同理, 无论甲如何选择, 乙的最好选择也是不坦白. 结果双方都选择不坦白, 各自被判刑3年.。
博弈论最全完整-讲解
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的
逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
例3:为什么教授如此苛刻?
问题是,一个好心肠的教授如何维持如 此铁石心肠的承诺?
他必须找到某种使拒绝变得强硬和可信 的方法。
拿行政程序或者学校政策来做挡箭牌 在课程开始时做出明确和严格的宣布 通过几次严打来获得“冷面杀手”的声
誉
导论
博弈均衡与一般均衡 博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型 主要参考文献
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
按照大家是否清楚对局情况下每个 局中人的得益。
“各种对局情况下每个人的得益是 多少” 是所有局中人的共同知识 (common knowledge)。
据“共同知识”的掌握分为完全信 息与不完全信息博弈。
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information)
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
第六章 猎鹿博弈
强强联合——金龙鱼和苏泊尔
• 金龙鱼是著名的食用油品牌,苏泊尔是著 名的炊具品牌,两者在都倡导新的健康烹 饪理念。就这样,两家企业策划了苏泊尔 和金龙鱼两个行业领导品牌“好油好锅, 引领健康时尚”的联合推广,在全国800家 卖场掀起了一场红色风暴。
• 4.汲取对方的优点,弥补自己的不足
• 在猎鹿博弈中,可能会出现两个猎人的实 力并不想当的情况,在生活中,我们也会 遇到双方实力不相当的情况,但是这并不 是一个难题。往往通过合作,最终双方都 得到了自己的最大收益。在日常生活中, 优势互补是一种绝佳的策略,双方在合作 的过程中,汲取对方的优点,弥补自己的 不足,最后实现共赢。
第六章 猎鹿博弈
本章内容
一、猎鹿博弈及其均衡 二、帕累托效率 三、人心齐,泰山移 四、不要吝于寻求帮助 五、和别人分享你的优势 六、不能独自取得成功 七、从合作走向共赢
一、猎鹿博弈及其均衡
• “猎鹿困境”是由18世纪法国伟大的启蒙思 想家、教育学家、文学家、政治哲学家 让·雅克·卢梭所提出的。他以此为出发点,依 次提出“自然状态”、“前政治社会”、 “公民社会”及“国际无政府状态”等重 要命题,建立起一套较为完整的国际关系 思想,对今天全球治理的思考有着重大的 理论与现实意义。
• 在猎鹿博弈中,每个人的策略选择对于个 人来说都是最优的,或者说,我的最优策 略是既定的,你的最优策略也是既定的, 我们两人是互为条件的。假如单方面改变 策略就会使另一方面临吃亏或者是无利可 图的居民,那合作就可能破裂。
手机厂商和零售卖场
• 对于零售卖场来说,手机厂商属于弱者, 其产品性价比高、品牌知名度高、利润空 间大、市场人员沟通能力强等都是手机厂 商的竞争优势。
得益矩阵为:
二、帕累托效率
管理经济学第六章博弈论和策略行为
案例6-2:性别之战 两个谈恋爱的人准备在周末晚上一起出去。男 的喜欢听音乐会,但女的喜欢看电影。当然,两个 人都不愿意分开活动。 不同的选择给他们带来的满足由表 2表示。
女
音乐会 电 影
音乐会
2 , 1 -1 , -1
男
电 影 -1 , -1 1 , 2
在这样一个对局中,男的和女的都没有支配性 策略。实际上,他们的最优策略依赖于对方的选择, 一旦对方选定了某一项活动,另一个人选择同样的 活动就是最好的策略。两个纳什均衡解。
四、顺序性博弈
序列博弈
现实生活中,还存在另一种博弈状态,即对局者
选择策略有时间先后的顺序,某些对局者可能率先采
取行动,这种博弈称为顺序性博弈。重复博弈和序列
博弈都是动态博弈。
先行动的参与者往往会有一定的优势。
案例6-6:双寡头垄断的两家企业都打算推出 一种新产品。四种可能的策略组合的利润结果见表 6, 单位是百万美元。
1、在一次性博弈中任何欺骗和违约行为都不会 遭到报复,囚犯困境的不合作解通常是难以避免的。
2、在无限期重复博弈中,报复的机会总是存在 的,所以,每一个参与者都不会采取违约或欺骗的 行为,囚犯困境合作均衡解是存在的。
3、在有限期重复博弈中,囚犯困境博弈的纳什 均衡是参与者的不合作。
4、在不能确定终止期的有限期重复博弈的囚犯 困境模型中,纳什均衡的合作解是可以存在的。
无新产品 有新产品
企业 B
无新产品 有新产品
4,4
3,6
6,3
2,2
1、如果企业谋求最大利润,本例存在两个纳什均衡。
两个纳什均衡:(无新产品 ,有新产品)和 (有新产品,无新产品)
2、按照最大最小决策准则,均衡解是: (无新产品 ,无新产品)
第6章 博弈论
小猪 按 等 2,4 0,0
7
大猪
按 等
3,1 7,-1
6.1 导论
二、完全信息静态博弈:
例2:智猪博弈 搭便车: 大股东VS小股东 大企业:开拓市场; 富人:修路,穷人:
8
6.1 导论
三、完全信息动态博弈:子博弈精炼纳什均衡
例3:市场进入阻扰
合作 进入 进入者 不进入 (0,300) 在位者 斗争
进入者认为高成本的概率是x, 进入:期望利润:40x+(-10)(1-x) x大于0.2时,进入者选择进入,高成本在位者选择默 许,低成本在位者选择斗争
12
6.1 导论
五、不完全信息动态博弈:
成语“黔驴技穷” 毛驴:出到贵州;老虎:观望 老虎:接近,获取驴的信息; 驴:大叫;老虎:逃走 老虎:习惯叫声,身体接触,驴:踢 老虎获得信息:驴就这点本事。 信号传递模型:
注意:战略与行动是两个不同的概念。 战略是行动的规则,而不是行动本身; 开发、不开发是行动,而战略则说明什么时候采取行动。 毛泽东:“人不犯我,我不犯人,人诺犯我,我必犯人”是战 略。 当然在静态中,行动和战略是相同的。
19
6.2 基本概念
支付(payoff) 在一个特定的战略组合下参与人得到的确定效用 水平或期望效用水平。用支付函数表示,即
* * 1 * n
21
6.2 基本概念
G {S1,Sn ;u1,un}
两寡头博弈:
G {q1 0, q2 0;1 (q1, q2 ),1 (q1, q2 )}
22
6.2 基本概念
博弈的战略式表达:
G {S1,Sn ;u1,un} Si ui
每个参与人的战略空间 每个参与人的支付函数
《运筹学》课件 第六章 博弈论
§1 基本概念
一、博弈论的定义 二、博弈理论的历史 三、博弈问题举例 四、博弈的分类
三、
1. 囚犯困境(Prisoners’ dilemma
囚犯困境是图克(Tucker)1950年提出的; 该博弈是博奕论最经典、著名的博弈; 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷。
所有局中人的策略组成的向量。)
s (s1,, si,, sn ) 表示n个局中人达成的
一个协议,当这个协议可以自动实施(Self-enforcing) 时,即没有任何局中人有积极性破坏这个协议,那么 这个协议就构成纳什均衡。
否则,若至少存在某些局中人有积极性偏离这个协 议,就构不成纳什均衡。
例:囚犯困境问题:
但是,尽管政府当时无力制止这种事情,公众也不 必担心彩电价格会上涨。这是因为,“彩电厂商自 律联盟”只不过是一种“囚徒困境”,彩电价格不 会上涨。在高峰会议之后不到二周,国内彩电价格 不是上涨而是一路下跌。这是因为厂商们都有这样 一种心态:无论其他厂商是否降价,我自己降价是 有利于自己的市场份额扩大的。
Ⅱ
坦白 抵赖
坦白
Ⅰ
-9,-9
0,-10
抵赖 -10,0 -1,-1
均衡解: 二人均坦白
相关概念介绍
➢博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
坦白 抵赖
➢ 博弈问题的基本要素 (1)局中人(Players)
现代博弈论主要指非合作博弈理论。非合作博弈 更受重视的原因:主导人们行为的主要还是个体理性, 而非集体理性;即,竞争是一切社会、经济关系的根 本基础,不合作是基本的,合作是有条件和暂时的。
《西方经济学简明教程》第6章 博弈论(game theory)
2)古诺模型- 纳什均衡
反应函数-已知对方的产量-自己的最优产量
广告博弈?
厂商乙
上策均衡
做 广 告 做 广 告
不 做 广 告
不做广告
厂 商 甲
30 20
30 50
50 20 40 40
第二节
信息经济学
不完全信息是指市场上买方与卖方所掌 握的信息是不对称的,一方掌握的信息多一 些,另一方所掌握的信息少一些。有些市场 卖方所掌握的信息多于买方,而另一些市场 买方所掌握的信息多于卖方。 本节我们将就不完全信息下所导致的逆 选择(adverse selection)、败德行为 (moral hazard)等进行讨论,并探讨由这 些问题而产生的效率损失。
囚 徒 困 境(prisoner’s dilemma) 囚徒 B 坦白 囚 徒 A 坦白 抵赖 -3,-3 - 6, 0 抵赖 0,-6 -1,-1
•3、上策均衡
不论其他参与人选择什么战略,他的最优战略是唯一的, 这样的最优战略被称为上策均衡,也被称为“占优战略” (dominant strategies)。
四、如何解决不完全信息下出现的 问题
• 不同的市场上因非对称信息而产生问题性 质不同,需要采取不同的方法解决。可以 通过政府解决,也可以不通过政府解决。
逆选择-信号传递和信号显示 道德风险-激励相容和制度设计
逆选择的结果:劣弊驱逐良币-差的商品总是将 好的商品驱逐出市场
二、败德行为
• 败德行为也称为道德公害,指在协议达 成后,协议的一方通过改变自己的行为, 来损害对方的利益。败德行为产生的原 因是非对称信息。 • 败德行为是在承保人无法觉察或监督投 保人行为的情况下所发生的。解决的办 法只能是通过某些制度设计使投保人自 己约束自己的行动。
经济学课件博弈论初步
博弈论是经济学中的重要分支,探讨决策者如何针对不同的情况做出最优或 是稳定的策略。本课件将带你入门博弈论。
博弈基础
玩家、策略、收益
博弈论的基础概念包括玩家(两 个或多个决策者)、策略(决策 者可选的不同行动)、收益(每 个玩家的利益)。
零和博弈和非零和博弈
纳什均衡
零和博弈是指通过一方赢得另外 一方的损失来实现收益。相反, 非零和博争中的博弈论应 用
通过博弈论模型,企业可以 优化价格、销售策略、广告 推广等方面来获得利益。
政治决策中的博弈论应 用
政治决策中的博弈论应用广 泛,例如国际贸易、军备竞 赛、公共压试验等。
社会博弈中的博弈论应 用
社会博弈包括合作、交叉、 竞争等情形。了解博弈论可 以让我们更好地了解社会行 为。
纳什均衡指的是玩家做出的最优 决策,即使其他玩家对此决策做 出的反应已知,其决策仍然是最 好的。
重要概念解析
1
支配策略
在某种情况下,一种选择比其他所有选
调和纳什均衡
2
择都要好,无论其他玩家选择什么。
指对于每个玩家而言,都不再存在更好
的策略。
3
子博弈完美均衡
针对某个博弈中的某个子博弈,所有玩 家都采取的策略构成了一个完美均衡。
2 博弈论的局限性
博弈论研究过程中需要进行简化和假设,从而忽略部分现实中的因素,需要结合其他学 科进行研究。
3 博弈论的未来趋势
随着经济、政治、社会等领域的日益发展,博弈论在有限理性、混合策略和进化博弈等 方面仍有很多研究空间。
博弈论的拓展
两人博弈论
多人博弈论
博弈树
常用的两人博弈论包括囚徒困境、 鸽子与鹰、石头剪子布等。
《博弈论教程》第六章课后习题整理
《博弈论教程》第六章课后习题整理,仅供参考!6—1这句话不对,根据定理6.1可知,只要博弈重复的次数有限,重复本身并不改变囚徒困境原来的均衡结果。
具体的博弈可参见p229-p230的例子。
6—2若N>L ,则min{N,L}=L,到了第N 阶段,当对手在N-L-1到N 阶段的最近连续L 次博弈中采取合作的策略,则我方继续合作,当对手在N-1阶段的博弈中采取背叛策略,则我方在N 到N+K 的连续K 次博弈中采取背叛策略,K 可能大于,等于或小于L ,K 和L 没有必然的关系;若N=L ,则min{N,L}=N=L,到了第N 阶段,当对手在1到N 的连续N 次博弈中采取合作的策略,则我方继续合作,当对手在N-1阶段的博弈中采取背叛策略,则我方在N 到N+K 的连续K 次博弈中采取背叛策略,K 可能大于,等于或小于L ,K 和L 没有必然的关系; 若N<L ,则min{N,L}=N,到了第N 阶段,当对手在1到N 的连续N 次博弈中采取合作的策略,则我方继续合作,当对手在N-1阶段的博弈中采取背叛策略,则我方在N 到N+K 的连续K 次博弈中采取背叛策略,N+K 可能大于,等于或小于L ,K 和L 没有必然的关系; 综上,K 和L 没有必然的关系。
写min{N,L}而不是简单的L 是因为不清楚背叛是发生在第N 阶段之前还是之后,这样写有利于做一个简明的判断。
6—3从今年的100元在明年的价值角度来看,在通货紧缩的年份,实际利率大于0(实际利率=名义利率-通货膨胀率,名义利率为正,通货膨胀率在通货紧缩时为负,),今年的100元到明年的价值大于100元,所以今年的100元比明年的100元好。
从货币的购买力角度来看,今年的100元的购买力大于明年的100元的购买力,那明年的100元更好。
6—4两公司都不做广告的收益大于纳什均衡的收益,故该博弈是囚徒困境博弈。
该博弈的合作策略是不广告,背叛策略是广告。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3,2)
Different results
According to maxmin principle, the equilibria solution is (D,R); While the nash equilibria solution of this example is (D,L) Which is better?
Some Applications of Game Theory
The study of oligopolies (industries containing only a few firms) The study of cartels; e.g. OPEC The study of externalities; e.g. using a common resource such as a fishery. The study of military strategies.
An Example of a Two-Player Game
The players are called A and B. Player A has two strategies, called “Up” and “Down”. Player B has two strategies, called “Left” and “Right”. The table showing the payoffs to both players for each of the four possible strategy combinations is the game’s payoff matrix.
An Example of a Two-Player Game
Player B
L U Player A D (0,0) (2,1) R
(3,9) (1,8)
二、博弈的分类
以结果为依据:
零和博弈(zero sum game) 正和博弈(positive sum game) 负和博弈(negative sum game) 合作博弈(cooperative game) 非合作博弈(noncooperative game)
The Prisoner’s Dilemma
To see if Pareto-preferred outcomes must be what we see in the play of a game, consider a famous second example of a two-player game called the Prisoner’s Dilemma.
Player B L R U
(3,9) (1,8)
(0,0) (2,1)
Player A
D
Nash Equilibrium
A play of the game where each strategy is a best reply to the other is a Nash equilibrium. Our example has two Nash equilibria; (U,L) and (D,R).
第六章 博弈论初步
内容提要
概述 完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
博弈论(Game Theory)
Game theory models strategic behavior by agents who understand that their actions affect the actions of other agents.
一、博弈的三要素
A game consists of
a set of players a set of strategies for each player the payoffs to each player for every possible list of str
J.Von.Neumann(1903-1957)
计算机之父; 天才的数学家; 数理经济学奠基人。 代表作品:《博弈论 与经济行为,经济学 领域的革命》,(与 摩根斯坦合著,1944)
John.Nash(1928_)
1948年进入普林斯顿 大学攻读数学博士学 位; 1950-51年提出纳什均 衡; 1958年患精神分裂症; 1994年获诺贝尔经济 学奖。
An Example of a Two-Player Game
Player B L R U Player A D
(3,9) (1,8)
(0,0) (2,1)
(U,L) and (D,R) are both Nash equilibria for the game.
An example
Player B
是否能达成协议
博弈的分类
博弈的次数
重复博弈 非重复博弈
博弈的次序
静态博弈(static game) 动态博弈(dynamic game)
完全信息 不完全信息
拥有的信息
三、均衡解
最大最小均衡 纳什均衡
An Example of a Two-Player Game
The Prisoner’s Dilemma
Clyde S S Bonnie (-5,-5) C (-30,-1)
C (-1,-30) (-10,-10)
What plays are we likely to see for this game?
Two-Player Games
A game with just two players is a twoplayer game. We will study only games in which there are two players, each of whom can choose between only two strategies.