博弈论及其应用-第四章1-rev
博弈论及应用4
二、重复博弈的分类
1、有限次重复博弈:给定一个基本博弈G(可以 是静态博弈,也可以是动态博弈),重复进行T 次G,并且在每次重复G之前各博弈方都能观察到 以前博弈的结果,这样的博弈过程称为“G的T次 重复博弈”,记为G(T)。而G则称为G(T)的“原 博弈”。G(T)中的每次重复称为G(T)的一个“阶 段”。
囚徒2
坦 白 不坦白
囚 坦白 -10,-10 -5,-13
徒 1
不坦白
-13,-5
-6,-6
(-10,-10)
二、一般结论
定理:设原博弈G有唯一的纯策略纳什均 衡,则对任意整数T,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方 每个阶段都采用G的纳什均衡策略。各博 弈方在G(T)中的总得益为在G中得益的T 倍,平均得益的与原博弈G中的得益。
的 子博弈Nash均衡就是……
但只要………….. 囚徒困境重复博弈的症结是在较多阶段的动态博 弈中逆推归纳法的适用性。
4.2.3多个纯策略纳什均衡博弈的 有限次重复博弈
一、三价博弈的重复博弈
显然(M,M)(L,L)是纯策略
Hale Waihona Puke 厂商2Nash均衡,但双方最
厂H
H 5,5
M 0,6
L 0,2
理想的策略(H,H)却不
1978年,塞尔顿提出的“连锁店悖论” 在n个市场(例如n个城市)都开设有连锁店的企业, 对各个市场的竞争者是否应该打击的策略选择?
“连锁店悖论”
由于竞争者不会同时进入,于是和每一个城市 的竞争者博弈,就可看成n次重复博弈。而每一 次博弈就是“先来后到”博弈,则竞争者进入,
在 位者不打击是唯一的Nash均衡。于是重复博弈
得益的总和。 计算有限次重复博弈的总体得益方法之二: 计算各阶段的平均得益
博弈论第4章多阶段可观察行动博弈的应用
• ——假定参与人1在t期可以获得的最小份额为m。t期的m 等价于t-1期的δ 1m,参与人2在t-1期最多得到1-δ 1m。因 此,参与人1在t-2期至少可以得到x1=m=1-δ 2(1-δ 1m) 。 于是,有m=(1-δ 2)/(1-δ 1δ 2);
• ——如果0<δ i<1,i=1,2,那么均衡结果不仅依赖于贴现因 子的相对比率,而且依赖于博弈期限长度T和谁在最后阶 段出价。然而,这种依存关系随T的变大而变小;
• ——定理(Rubinstein,1982):在无限期轮流出价博弈中,唯 一的子博弈精练纳什均衡结果是:x*=(1-δ 2)/(1-δ 1δ 2)。 具体地,如果δ 1=δ 2 =δ ,那么x*=1/(1+δ );
• ——证明:当T=∞时,从参与人1出价的任何一个阶段开始 的子博弈等价于从t=1开始的整个博弈。
• ——假定在时期t ≥ 3参与人1出价,参与人1能得到的最大 份额是M。在t-1时期,参与人1得到δ 1M,参与人2得到 1-δ 1M;在t-2时期,参与人2得到δ 2(1-δ 1M),参与人1 得到1-δ 2(1-δ 1M);
• ——如果参与人1提出更高的份额,那么参与人2将拒绝, 而在t+1期要求(1-δ 1)/(1-δ 1δ 2)。根据上面的等式(对称性) 可以得到,参与人1的支付是δ 1(1- (1-δ 1)/(1δ 1δ 2))=δ 12(1-δ 2)/(1-δ 1δ 2)<(1-δ 2)/(1-δ 1δ 2)。因此, 更高的要求不是一个最优策略;
博弈论课件第四章
3
合作博弈
参与者之间可以合作并制定共同策略,追求更大的利益。
纳什均衡理论
纳什均衡是博弈论中的一个重要概念,指的是当参与者根据对手的选择来选 择自己的策略时,不存在更好的选择。这种均衡状态具有稳定性和可持续性。
混合策略的应用
硬币翻转
混合策略可以应用于硬币翻转等 概率性决策中,以平衡风险。
剪刀石头布
博弈理论在法律
博弈论可在法律领域中应用于博弈模型的构建和法律决策的优化。
博弈论的应用领域
经济学
博弈论在经济学中用于研究市场竞争、拍卖和价格形成等问题。
政治学
博弈论在政治学中用于分析选举、合作和冲突等政治策略。
生物学
博弈论在生物学中用于研究进化和动物行为等领域。
博弈论中的主要模型
1
零和游戏
参与者的收益总和为零,一方的利益损失即为另一方的利益增益。
2
非合作博弈
参与者之间缺乏合作,每个参与者根据自身利益进行决策。
博弈论课件第四章
博弈论是研究决策制定和互动模型的学科,第四章将介绍博弈论的基本概念、 应用领域、主要模型以及纳什均衡理论和混合策略的应用,同时提供实际应 用案例。
博弈论的基本概念
1 参与者
博弈论研究多人决策制定过程中的参与者之间的互动。
2 策略
参与者在决策过程中可选择参与者根据他们的行动所获得的支付或效益。
混合策略可用于剪刀石头布等多 次对局中,通过随机选择策略以 增加不可预测性。
扑克筹码
混合策略可应用于扑克中的下注 决策,以提高筹码的价值和战略 性。
博弈论在实际问题中的应用案例
商业竞争
博弈论可用于分析企业在市场竞争中的策略选择和定价决策。
军事战略
博弈论初步及其应用
对未来的展望和期待
随着博弈论研究的不断深入和应用领域的不 断拓展,未来博弈论将进一步揭示人类行为 和社会现象的内在规律,为解决现实问题提 供更加有效的理论支持。
随着大数据和人工智能技术的发展,博弈论 将与这些领域进行更紧密的结合,为解决复 杂问题提供更加精准和高效的解决方案。
我们期待博弈论在未来能够发挥更大的作用 ,为人类社会的进步和发展做出更大的贡献 。
感谢您的观看
THANKS
扩展博弈论的理论框架
随着研究的深入,未来可以进一步扩展和完善博弈论的理 论框架,以更好地解释和预测各种复杂的博弈现象。
跨学科研究
未来可以进一步加强与其他学科的合作,通过跨学科的研 究来推动博弈论的发展和应用。
人工智能与机器学习
随着人工智能和机器学习技术的发展,未来可以探索如何 利用这些技术来改进博弈论的算法和计算能力,以更好地 解决大规模和复杂的博弈问题。
2
数据获取
在实际问题中,往往难以获取到全面和 准确的数据来支持博弈论分析。如何克 服数据限制,提高分析的可靠性和准确 性,是另一个挑战。
3
政策制定
将博弈论应用于政策制定需要充分考虑 政治、社会和经济等因素。如何平衡各 方利益,制定出有效的政策是博弈论在 实际应用中的重要挑战。
博弈论的未来研究方向与展望
06
结论
博弈论的重要性和应用价值
博弈论是研究决策过程中参与者之间相互影响、相互制约的学科,对于理解社会现象、解决实际问题 具有重要的理论价值和实际应用价值。
在经济学、政治学、社会学等领域,博弈论提供了深入分析参与者行为动机、预测行为结果的理论框架, 有助于更好地解释和预测现实世界中的各种现象。
博弈论在商业策略、国际关系、网络安全等领域也有广泛的应用,为相关问题的解决提供了新的思路和 方法。
博弈论及其应用1
博弈论及其应用——博弈论及生活中的应用(一)博弈论博弈论是专门研究两个或两个以上利益有冲突的个体,在相互作用下如何进行各自优化决策的理论。
有时也称为对策论,或者赛距理论。
是研究具有斗争或竞争性质现象的理论和方法,它是应用数学的一个分支,既是现代数学的一个新分支。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
博弈这一词语最早来源于棋弈。
精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。
博弈论是研究棋手们“出棋”着数中理性化、逻辑化的部分,并将其系统化为一门科学。
生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,而此时博弈论也扩展到了研究个体如何在错综复杂的相互影响中得出最合理的策略。
博弈论的历史:.萌芽时期:世纪甚至更早,瓦德格拉夫()在年提出两人博弈的极小化极大混合策略解;库诺特()在年、伯特兰德()在年分别提出了博弈论中经典的经济学模型;公元前,我国的齐威王田忌赛马的博弈思想,年前巴比伦犹太教法典中的“婚姻合同问题”。
.早期研究:源于上世纪初年齐默罗()提出了关于象棋博弈的定理是博弈论的第一个定理,提出的“逆推归纳法”( )则是博弈论的第一种有着一般意义的分析方法;冯.诺伊曼( )和摩根斯坦()在年给出了扩展形博弈定义,证明了有限策略的两人零和博弈有确定的结果等.博弈论的形成:冯.诺伊曼( )和摩根斯坦()年出版了《博弈论和经济行为》( ),在该著作中,引进了博弈论的扩展形( )和正规形( )或称策略形()、矩阵形( ), 定义了极小化极大解( ),并说明了解在所有两人零和博弈中的存在性,且提出了创建博弈论的一般理论的想法,给出了博弈论的一般框架、概念术语和表示方法.《博弈论和经济行为》的出版被公认为博弈论初步形成的标志。
巫合贤博弈论 (4)
訊息與策略經濟學第4章不完全訊息動態賽局4.1 不完全訊息動態賽局表示法…………………………………………………….......4-1 4.2 完美貝氏均衡與範例………………………………………………………………...4-3 4.3 傳訊賽局與信譽……………..……………………………………………………….4-8 4.4 序列均衡……………………………………………………………………………...4-6 4.5 實例與應用:邊緣運用策略..……..……………………………….…………………4-11 4.6 實例與應用:拍賣與出價……………………………………….……………………4-14 4.7實例與應用:機制設計.………………………………………………………………4-174.1不完全訊息動態賽局表示法:考慮上章應用1的阻絕進入(Entry Deterrence)賽局,但原廠商的建廠行動成為可以觀察:原廠商先出招,新廠商觀察對手行動後才出招,因此成為動態賽局了。
例1:y 進 ( 0, -1 ) 3C H = 建 21-y 不進( 2, 0 )1進 ( 2, 1 ) 1P 不建 2不進( 3, 0 )Ny 進 ( 1.5, -1 ))P -(11 建 21-y 不進 ( 3.5, 0 ) 1進( 2, 1 )5.1C L = 不建2不進( 3, 0 )在此賽局中該使用什麼樣的均衡觀念?我們可先研究一下這樣賽局的結構及表示方法,再討論該使用的均衡觀念。
12/8/2003© Prof. Ho-Mou Wu巫和懋2’s strategy :不因先驗機率 (prior probability) p 1改變了 觀察到原廠商已建廠x =1,2應選擇y =0(不進),嚇阻進入策略有效。
觀察到原廠商未建廠x =0,2應選擇y =1(進)1’s strategy :3C H =高成本時:建得2,不建也得2 5.1C L =低成本時:建得3.5,不建得2因此,H x []1 ,0∈,1x L =注意在這個賽局中,1的行動也傳遞了其成本高低的訊號:原廠商低成本時一定會建廠,但觀察到1的建廠行動尚不足確認1必定為低成本(因]1,0[∈H x ),但是可能性很大(可能要用到事後機率的貝氏算法,後面再討論)。
博弈论及其应用(人民大学,张红霞)
Cournot 寡头竞争模型
第i个参与者的产量(策略 )qi [0, ),i 1,2 第i个参与者的成本 Ci ( qi ), i 1,2 价格是总产量的函数, 即P P( q1 q2 )
第i个参与人的利润函数为
i (q1 , q2 ) qi P(q1 q2 ) Ci (qi ), i 1,2
张红霞 国民经济管理系
Cournot 寡头竞争模型
q2 R1(q2)
q2
*
NE R2(q1)
张红霞 国民经济管理系
q1*
q1
Cournot 寡头竞争模型
假如没有竞争,在完全垄断的情况下
max Q (a Q c)
Q
1 2 * * 由一阶条件得 Q (a c) q1 q2 (a c) 2 3 1 2 m 2 垄断利润 (a c) (a c)2 4 9
张红霞 国民经济管理系
Hotelling 价格竞争模型
商店1 0 1的消费群
x
2的消费群
商店2
1
原来去两边花 的钱一样 呀、、、、
张红霞 国民经济管理系
Hotelling 价格竞争模型
x满足 p1 tx p2 t (1 x) 商店1的需求情况D1 x, 商店2的需求D2 ( a c ); 纳什均衡利润 3 1 * * * * 1 ( q1 , q2 ) 2 ( q1 , q2 ) ( a c ) 2 9
张红霞 国民经济管理系
Cournot 寡头竞争模型
Cournot模型的重复剔除求解方法 – 可以利用重复剔除的方法求解Cournot模型 的均衡点。 – 从一方垄断开始
博弈论PPT资料整理
博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。
1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。
2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。
博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。
于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。
中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。
博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。
生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。
而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。
特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。
由此可见,博弈论是适合所有人的科学。
在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。
博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。
可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。
从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损如果势均力敌,则应考虑到对手的反击手段。
[经济学]博弈论基础讲义-第四章
第四章动态不完全信息博弈第一节. 序贯均衡的内涵一.问题的提出1.序贯理性2.一致信念二.序贯均衡的内涵1.例子2.定义a.行为战略b.序贯理性c.一致信念3.存在性三.序贯均衡的计算1.例子:一般计算2.例子:分析应用第二节. 序贯均衡的应用一.教育和信号传递1.假设2.分析二.垄断限价模型1.假设2.分析三.声誉模型1.假设2.分析四.序贯均衡之再精炼1.剔除劣弱战略2.直观标准3.垄断限价模型第四章不完全信息动态博弈第一节.序贯均衡的内涵一.问题的提出1.序贯理性——参与人在所有情况决策都是理性的,即在给定信念的条件下,以及其他参与人的选择条件下,自身选择是最优的例1:子博弈最优——纳什均衡(,)L l是否合理?——如果参与人2有机会选择,肯定选r而不是l;——(,)L l不是子博弈精炼纳什均衡。
例2:单点信息集最优——纳什均衡(,,)D a l是子博弈纳什均衡;——但如果参与人2有机会选择,但肯定选择d;——(,,)D a l不满足单点信息集理性。
例3:多点信息集最优——纳什均衡(,)A r是子博弈精炼纳什均衡;——(,)A r不满足多点信息集理性。
2.一致信念例1:与客观事实一致u=是否合理?——参与人2的信念2/3——2/3u=是不合理的,因为任何到达参与人2信息集都不可能产生此后验概率;——后验信念必须与先念信念保持一致。
例2:前后信念一致——参与人2的第2个信息集上的信念,是否合理?——不合理,给定参与人战略和第1个信息集的信念,利用贝叶斯法则计算信念与此不一致;——参与人前后信念保持一致。
例3:独立偏离——参与人3的信念0.9u =是否合理?——参与人1和参与人3的偏离是独立的,所以参与人3的合理信念为0.1u =;——不同参与人之间的偏离是独立的总结,一致信念要求:参与人偏离最小化,,参与人之间偏离是独立的;二.序贯均衡的定义1.例子——定义参与人1在信息集1.1和1.3以及参与人2在2.2上的序贯理性;——定义信息集1.3和2.2的信念?2.定义a.行为战略:参与人在某个信息集到行动集映射,——如果某个状态真正发生,参与人如何决策;——序贯理性是否满足?b.序贯理性:在任何信息集上,参与人在给定信念和所有后续行为战略,选择自身行为战略最大化预期效用。
博弈论的应用
4、斗鸡博弈
即电影中的汽车博弈:两个年轻人分别从一条街的两 头,驾车笔直地是向对方。第一个转向的人会颜面尽 失,但如果没有人转向,将会撞在一起。其收益矩阵 如下图:
存在两个纳什均衡:(不转向,转向)和(转向,不 转向)。A偏好第一个,B偏好第二个。但这两个都比 撞车好。它和保证博弈有所区别,双方做不相同的事 情比做相同的事情好。 年轻人B
如果参与人B选择c=0,那么参与人A将减少r,
使r尽可能小,所以r=0。因此,参与人A使r=0
就是对c=0的最优反应。并且,r=0一直都是A
的最优反应,直至c=1/3。当c=1/3,0≤r≤1都
是A的最优反应。对于所有的c>1/3,行参与人
的最优反应是r=1。
c1 B的反
•
••
三个紫色的点
映曲线
制的两条曲1线00。
行参与人的 90 期望收益
均衡点
80 行参与
50 人踢向
20
左方的
概率
0
0.7 1
而列参与人的选择将会使行参与人在每一个概率
上的期望收益最小化。因此,行参与人的期望收
益只能为红色线段部分。
列参与人的策略
假定列参与人扑向左方的概率为q,则当行参与人踢向 左方时,行参与人的期望收益为50q+80(1-q),当行 参与人踢向右方时,行参与人的期望收益为 90q+20(1-q)。
此外的策略有:声誉和缔结合同。
三、竞争博弈
竞争博弈是一种零和博弈,即博弈一方的收益 等于另一方的损失。多数体育竞技项目都是零 和博弈:一个组的1分等价于另一个组失去一 分。参与人之间的利益是完全相反的。
例如,在一个足球比赛中,行参与人主罚点球, 列参与人防守。如果列参与人扑错了方向,行 参与人得分的可能性大一些。同时,行参与人 可能善于踢向某一个方向,而列参与人可能善 于扑向某一个方向。但双方都有朝两个方向的 可能。
第四篇-博弈论
二、博弈论发展的里程碑
古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
伯特兰德模型(Bertrand) (1883)(价格竞争) 《博弈论与经济行为》(1944)
兔子 0,3 3,3
3、聚点(Focal point)均衡(夫妻博弈) 谢林(Schelling ,1960)指出在现实生活中人
们可能通过一些被标准化的博弈模型所抽象 掉了的信息来达到一个特定的均衡。如夫妻 博弈中,借助生日等信息双方选定特定的均 衡;如当让两个博弈方同时报一个时间,所 报时间相同时会获奖,尽管可能存在无数的 纳什均衡,但是双方选择“中午12点”“0点” 等的可能性要大于“12点20”。
开业 +2,+4
-2,-2
一、纳什均衡
1、定义:
在有n个参与人的标准型博弈
G (S1,...,Sn ;1,..., n )中,如果策略组合
s* (s1*,...,sn* )满足对每一个参与人i,si*是 该参与人针对其他参与人所选择策略 s*i (s1*,...,si*1, si*1,...,sn* )的最优反应策略, 则称策略组合s* (s1*,...,sn* )是该博弈的一 个纳什均衡。即:
按博弈收益信息的了解程度
– 完全信息博弈(Complete information) 囚徒困境等 – 不完全信息(Incomplete information)或不对称信息
(Asymmetric Information) 暗标拍卖和招投标
按对博弈过程的信息 (针对动态博弈)
博弈论最全完整-讲解课件
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
• 艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
• 因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
学习交流PPT
17
约翰· 海萨尼 1920年 生于美 国
约翰·纳什 1928年生于美国
莱因哈 德·泽尔 腾, 1930 年生于 德国
学习交流PPT
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和 美国人威廉-维克瑞(William Vickrey)
托马斯·谢林
学习交流PPT
24
导论
三、博弈论的基本类型
学习交流PPT
25
合作博弈与非合作博弈
• 合作博弈(cooperative game) 达成有约束力的协议(binding
agreement),强调团体理性,强调效率、公 正、公平 • 非合作博弈(non-cooperative game)
强调个人理性,其结果可能有效率,也可能 无效率。
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进行分 析”领域做出了重要贡献。
学习交流PPT
21
迈克尔·斯彭斯 1948年生于美国的 新泽西,1972年获 美国哈佛大学博士 头衔,现兼任美国 哈佛和斯坦福两所
• 也就是说,需要的是对这样的情况下该选什么 的预期的收敛。这一使得参与者能够成功合作 的共同预期的策略被称为焦点。心有灵犀一点 通。
博弈论课件 第四章
1
精选PPT
何为“重复博弈”?
重复博弈是指基本博弈重复进行构成的博弈过程。 – 重复博弈中每个阶段中的博弈方、可选策略、规则 和得益都是相同的----是特殊的动态博弈;
– 形式上是基本博弈的重复进行,但博弈方的行为和 博弈结果不一定是基本博弈的简单重复,因为博弈 方对于博弈会重复进行的意识,会使他们对利益的 判断发送变化,从而使他们在重复博弈过程不同阶 段的行为选择受到影响。
– 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的
每种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m
7
种策略组合,那么重复两次就有m2条博弈路径,重复次就有mt条博弈路径。
精选PPT
重复博弈的得益
任何博弈博弈方策略选择依据都是得益的大小。 计算重复博弈的“总得益”。 计算各阶段的“平均得益”。 时间有先后,引入贴现系数
推广:非零和或多个博弈方,博弈方的利益严格对立,
没有纯策略纳什均衡的其他严格竞争博弈中。在以这
些博弈作为原博弈构成的有限次重复博弈中,惟一的
子博弈完美纳什均衡就是所有博弈方都始终采用原博
12
弈的混合策略纳什均衡策略。
精选PPT
有限次重复猜硬币博弈
各博弈方的正确策略就是在每次重复中都采用 一次性博弈中的纳什均衡策略。
精选PPT
4.2.1 两人零和博弈的有限次重复博弈
重复零和博弈不会创造出新的利益。
合作的可能性根本不存在。即使双方都知道还要重复 进行许多次基本博弈,也不会改变它们在当前阶段博 弈中的行动方式,不可能变得(哪怕是暂时的)合作 和顾及对方的利益。
所有以零和博弈为原博弈的有限次重复博弈,博弈方 的正确策略都是重复一次性博弈中的纳什均衡策略。
博弈论及其应用纯战略纳什均衡的应用课件
纯战略纳什均衡的求解方法
迭代法
通过不断迭代计算每个参与者的 最优策略,逐步逼近纯战略纳什
均衡。
代数法
利用代数方法求解纯战略纳什均衡 ,适用于某些特定类型的博弈。
线性规划法
通过线性规划方法求解纯战略纳什 均衡,适用于具有线性特征的博弈 。
纯战略纳什均衡的应用场景
商业竞争
纯战略纳什均衡可用于分析商业 竞争中的策略选择和竞争格局。
06
纯战略纳什均衡在其他领域的应用
军事战略中的纯战略纳什均衡
总结词
军事战略中,纯战略纳什均衡可以应用于分析敌我双方的策略互动,制定最优的军事行 动计划。
详细描述
在军事战略中,纯战略纳什均衡可以用来分析敌对双方在战争中的策略互动。通过理解 对手可能的反应和最优行动,可以制定出最优的军事行动计划,以最大化己方的利益。 例如,在战争中,了解敌人的兵力部署和行动模式,可以预测其可能的反击或进攻,从
通过反复迭代计算来逼近纳什均衡。
03
纯战略纳什均衡
纯战略纳什均衡的定义
纯战略纳什均衡是一种博弈策略 组合,其中每个参与者在给定其 他参与者策略的情况下,选择自
己的最优策略。
在纯战略纳什均衡中,每个参与 者的最优策略都是基于其他参与 者的策略选择的,从而形成一种
稳定的策略组合。
纯战略纳什均衡是一种非合作博 弈的解概念,适用于各种不同类 型的博弈,如囚徒困境、寡头竞
政治博弈
在政治博弈中,纯战略纳什均衡 可用于分析政治家、利益集团等 参与者的策略选择和利益分配。
经济合作
在经济合作博弈中,纯战略纳什 均衡可用于分析国家之间的贸易 合作、关税战等策略选择和利益
分配。
04
纯战略纳什均衡在经济学中的应用
博弈论第4章答案
R R M 4.1.a 标准式1↖2 L ’ R ’4,1 0,0 3,0 0,1 2,2 2,2纯战略纳什均衡:( L, L ’ ) ( R, R ’ )子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ )精炼贝叶斯纳什均衡:( L, L ’ )4.1.b 标准式1↖2 L ’ M ’ R ’1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4纯战略纳什均衡:( R, M ’ )子博弈精炼纳什均衡:( R, M ’ )精炼贝叶斯均衡: 没有4.2标准式1↖2 L ’ R ’2,2 2,2 3,0 0,1 0,1 3,0六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。
求混合战略精炼贝叶斯均衡:设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p −−参与者2选择L ’和R ’的概率分别为,(1)q q −在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212120*1*1*0*p p p p p p +=+⇒=给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则:12121212[3*0*(1)][0*3*(1)]2*(1)41:**,*112p q q p q q p p p p p p q +−=+−=−−====又 联立得 所以 L LML LM L RL4.3答案(见4.5)4.4表示方法第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号;第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a )[(,),(,),1/2][(,),(,),1/2][(,),((1),),1/2][(,),(,),1,0]R R u u p R R d u p R R d u u p L R u d p q αα><+−===(b )[(,),(,),1/2,2/3][(,),(,),1,0][(,),(,),0,1]L L u u p q L R d u p q R L u d p q =<====中文版习题4.5答案(a )[(,),(,),1/3,1/2]R R u d p q >=(b )12121212[(,,),(,),1/3,1/2][(,,),(,),1/2,0]L L L u u p p q q L L R u d p p q q ==+<==+=。
博弈论第四章PPT课件
不完全承诺,增加行动成本
承诺行动与博弈结果
• 春节前夕,某小镇上两个商铺主甲和乙同时看到一个
赚钱机会:去城里贩一批鞭炮回来零售,购货款加上 运输费用共5000元,如果没有竞争对手,这批货在小 镇上能卖6000元;但如果另一家商铺同时在小镇上卖 鞭炮,价格下跌使得这批鞭炮只能卖4000元。纳什均 衡是什么?
• 假设甲先行动,商铺乙看到对方的选择后再决定是否
进货,子博弈精炼纳什均衡是什么?
承诺行动与博弈结果
如果甲先行动,但在博弈开始前商铺主乙有一次行动A的 机会,利用子博弈精炼均衡概念分析下述两种情况下的 博弈结果: (1)A:商铺主乙逢人便说自己一定要进货,无论对方如 何行动他都不会改变这个决定; (2)A:商铺主乙与某个嘲笑他说大话的第三者丙打赌: 如果自己到时不进货,向丙支付1500元;如果自己到时 候进货,丙向他支付100元。并且,乙将这个赌局通知甲。
分配给不同的局中人,并赋予行动时可选的策略; (4)局中人行动时的信息集合I; (5)对应局中人可能选择策略,各局中人在终结环节所得到
的报酬U。
战略式与扩展式
战略式表述 (strategic form representation) 多用矩阵
2
L
L
2,2
S -1,-1
1
-1,-1
1,1
S
(2,2) L
-10,0 0,300
不进入 (0,300)
进入者 进入
默许 (40,50) 在位者
斗争 (-10,0)
四、承诺行动(commitment)与 子博弈精炼纳什均衡
• 纳什均衡之所以不是精炼均衡,是因为不可置信的
威胁存在,如父母与子女之间的博弈。
博弈论及应用4
本章分三节
4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈
4.1 重复博弈引论
一、为何研究重复博弈
经济中的长期关系 例如(1)两家企业在一个市场上的长期竞争,(2)市场 例如 两家企业在一个市场上的长期竞争, 市场 两家企业在一个市场上的长期竞争 营 销中的回头客问题,(3)长期合同 长期合同(4)一次性买卖问题。 一次性买卖问题。 销中的回头客问题 长期合同 一次性买卖问题 人们的预见性。 人们的预见性。 由于人的思维的限制, 由于人的思维的限制,在短期行为中缺乏默契或合作 的关系,但在长期中这样的机会就大得多。 的关系,但在长期中这样的机会就大得多。即是未来利 益对当前行为的制约 有无确定的结束时间 信任、信誉、 信任、信誉、声誉问题
第四章 重复博弈
重复博弈:基本博弈(完全信息静态博弈, 重复博弈:基本博弈(完全信息静态博弈, 完全信息动态博弈)重复进行构成的博弈过程。 完全信息动态博弈)重复进行构成的博弈过程。虽 然形式上是基本博弈的重复进行, 然形式上是基本博弈的重复进行,但重复博弈中博 弈方的行为和博弈结果却不一定是基本博弈的简单 重复,因为博弈方对于博弈会重复进行的意识,会 重复,因为博弈方对于博弈会重复进行的意识, 使他们对利益的判断发生变化, 使他们对利益的判断发生变化,从而使他们在重复 博弈过程中的行为选择受到影响。 博弈过程中的行为选择受到影响。这意味着不能把 重复博弈当作基本博弈的简单叠加, 重复博弈当作基本博弈的简单叠加,必须把整个重 复博弈过程作为整体进行研究。 复博弈过程作为整体进行研究。, 在上述讨论中,如果一方偏离, 厂商2 厂商 H M L 另一方就报复, 另一方就报复,但值得注 8,8 3,9 3,5 厂 H 意的是报复方同样受损, 意的是报复方同样受损, 9,3 6,6 1,3 商 M 如果不去报复, 如果不去报复,以后各阶 1 L 5,3 5,3 4,4 段仍然合作, 段仍然合作,那么双方得益都 重复三价博弈的等价模型 会增加。于是上述触发策略是否可信? 会增加。于是上述触发策略是否可信? 不可信报复 如果不可信,第一阶段不管选什么策略, 如果不可信,第一阶段不管选什么策略,二阶段都选 (M,M),于是将 于是将(3,3)加到其余策略上,得到右边等价的 加到其余策略上, 于是将 加到其余策略上 得 益矩阵。结果第一阶段最佳策略不是(H,H),而是 而是(M,M) 益矩阵。结果第一阶段最佳策略不是 而是
博弈论4(逆向选择)
• (3)雇主考察员工劳动生产率的常见办 ) 法有: 法有: • 到原单位调查 需要支付调查成本 ; 到原单位调查(需要支付调查成本 需要支付调查成本); 试用期(需要支付监督成本 • 给予一个试用期 需要支付监督成本,并 给予一个试用期 需要支付监督成本, 非所有职位都适用); 非所有职位都适用 ; • 应聘测试 如笔试和面试,需要支付较高 应聘测试(如笔试和面试 如笔试和面试, 的机会成本); 的机会成本 ; • 凭关系介绍 需要承担感情投资风险 。 凭关系介绍(需要承担感情投资风险 需要承担感情投资风险)。
• 例子: 例子: • 阿克罗夫的柠檬市场-旧车市场(质量越 阿克罗夫的柠檬市场-旧车市场( 柠檬市场 来越低,价格越来越低); 来越低,价格越来越低); • 保险市场(投保人的健康状况越来越差, 保险市场(投保人的健康状况越来越差, 保价越来越高); 保价越来越高); • 信贷市场(贷款人的信用越来越差,利率 信贷市场(贷款人的信用越来越差, 越来越高); 越来越高); • 劳动力市场、保健品市场等等。 劳动力市场、保健品市场等等 等等。
• (2)假设全体劳动 ) 力总数为N, 力总数为 ,其劳动 生产率服从均值为E 生产率服从均值为 n 的正态分布(图 - 。 的正态分布 图3-5)。 经验和统计分析可 由经验和统计分析可 知,男性劳动生产率 平均高于女性(这对 平均高于女性 这对 于雇主来说属于公共 信息), 信息 ,这种劳动生 产率分布结构如图3 产率分布结构如图 所示。 -6所示。 所示
逆向选择与道德风险
• 教学要求: 教学要求: • 1 掌握逆向选择 • 2 掌握道德风险
逆向选择
• 1 定义: 定义: • 逆向选择是指交易双方在交易前的信息不 逆向选择是指交易双方在交易前的信息不 在交易前 对称, 对称,导致市场上交易的劣质商品比例越 来越高, 来越高,甚至导致优质品完全被驱出市场 的一种现象。 的一种现象。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
不完全信息下公共产品的提供
类型依存的行动空间: 此博弈的一个纯战略 ai (ci )是从[c, c ]到{0,1}的一个 函数,其中 0表示不提供, 1表示提供。 参与人i的支付函数为 ui (ai , a j , ci ) max(a1 , a2 ) ai ci
张红霞 博弈论及其应用
贝叶斯均衡的应用举例
张红霞 博弈论及其应用
贝叶斯均衡的应用举例
价格函数:P a q1 q2 ; 企业i的利润函数: i qi (a q1 q2 ci ), i 1,2 企业1的单位成本为: c1 c2L , p(c2 c2L ) 企业2的单位成本: c2 H H c , p ( c c ) 1 2 2 2
* 战略a 期望效 i ( i )的情况下最大化自己的 * * 用函数vi。换言之, a * ( a1 (1 ),, an ( n ))
是一个贝叶斯纳什均衡 ,如果对于所有的 i, ai Ai (i ),
ai * ai* (i ) arg max pi ( i i )ui ( ai , a ( i );i , i ) i
不完全信息下:参与人i的类型 i
i知道自己的类型,其他人不知道
参与人2 抓 不抓 1+ 1 ,0
参与人1
抓 不抓
-1,-1 0,1+2
0,0
张红霞 博弈论及其应用
贝叶斯博弈与混合战略均衡
在 [ , ] 上服从均匀分布 类型依存的战略: 参与人1: 1 1* ,抓;否则,不抓 参与人2: 1 1* ,抓;否则,不抓 分析:
L 2
企业1最大化自己的期望利润
1 1 L E 1 q1 (1 q1 q2 ) q1 (1 q1 q2H ) 2 2
由一阶条件可得
1 1 L 1 H 1 q (1 q2 q2 ) (1 Eq2 ) 2 2 2 2
* 1
张红霞 博弈论及其应用
贝叶斯均衡的应用举例
略空间、信息集、支付函数等任何特征
张红霞 博弈论及其应用
不完全信息和海萨尼转换
不完全信息意味着至少有一个参与人有多个类 型
i 表示参与人i的一个特定类型, i 表示参 与人i的所有可能类型的集合 ,i i
假定{i }in1 取自某个客观的分布函 数P(1 ,,n )
分布函数是所有参与人的共同知识
张红霞 博弈论及其应用
贝叶斯纳什均衡
不完全信息博弈的战略式表述
所有参与人同时行动,战略空间等同于其行
动空间 参与人的行动空间是类型依存的(typecontingent) 参与人的支付函数也是类型依存的
张红霞 博弈论及其应用
贝叶斯纳什均衡
不完全信息博弈的战略式表述
定义:n人静态贝叶斯博弈的战 略式表述包括: 参与人的类型空间 1 ,, n , 条件概率p1 ,, pn , 类型依存的战略空间 A1 (1 ),, An ( n ), 和类型依 存支付函数u1 ( a1 ,, an ; n ),, u1 ( a1 ,, an ; n )。 参与人i知道自己的类型 i i,条件概率描述 给定自己属于 i的情况下,参与人 i有关其他参 与人类型 i i的不确定性。表示如下 G { A1 ,, An ;1 ,, n ; p1 ,, pn ; u1 ,, un }
张红霞 博弈论及其应用
贝叶斯均衡的应用举例
不完全信息下的Cournot模型
参与人的类型是成本函数 假定企业1的单位成本是共同知识,企业2的
单位成本可能是低成本,也可能是高成本 企业2知道自己的成本,企业1只知道企业2 成本类型的各种可能性 每个企业的选择都是最大化自己的利润函数
张红霞 博弈论及其应用
贝叶斯均衡的应用举例
不完全信息下公共产品的提供
存在ci* ,当ci [c, ci* ]时,i才会提供。
* 同理,存在c* , 当 c [ c , c j j j ]时,j才会提供。
* z j Prob(c c j c* ) P ( c j j)
ci* 1 P(c* j)
张红霞 博弈论及其应用
贝叶斯均衡的应用举例
q2 q1(q2)
纳什均衡
贝叶斯均衡
1/2 11/24 5/24 1/6
q2L(q1)
q2H(q1)
1/4 1/3 5/12
张红霞 博弈论及其应用
q1
贝叶斯均衡的应用举例
不完全信息下公共产品的提供
公共品的好处(每人1单位是共同知识) 每人的提供成本只有自己知道(因此,提供成本是 参与人的类型)
均衡状态下两个反应函数都成立,求解得
* L* H* q1 1 / 3; q2 11/ 24; q2 5 / 24
与完全信息情况下纳什均衡的比较
* q1
1 1 5 * (1 q2 ); q2 ( q1 ), or 2 2 4
* q2
1 3 ( q1 ) 2 4
NE q1NE 1 / 4 ; q L 2 L 1 / 2; NE q1NE 5 / 12 ; q H 2H 1/ 6
博弈论及其应用
不完全信息静态博弈
不完全信息静态博弈
不完全信息和海萨尼转换 贝叶斯纳什均衡 贝叶斯纳什均衡的应用 不完全信息下的贝叶斯纳什均衡与完全 信息下的混合战略纳什均衡
张红霞 博弈论及其应用
不完全信息和海萨尼转换
完全信息:参与人的特征、类型是共同 知识 不完全信息:至少有一个参与人不知道 其他参与人的特征、类型
t=a-3/4=5/4, 或t=a-5/4=3/4依赖于企业2的实际成本 由一阶条件可得
1 q ( q1 ; t ) (t q1 ) 2
* 2
企业2的最优产量不仅依赖于企业1的产量,还依赖 于自己的成本
张红霞 博弈论及其应用
贝叶斯均衡的应用举例
1 5 1 3 H q ( q1 ); q2 ( q1 ) 2 4 2 4
张红霞 博弈论及其应用
不完全信和海萨尼转换
pi ( i i )为给定 i的条件下 i发生的概率 p ( i , i ) pi ( i i ) p ( i ) p ( i , i ) p( i ,i )
i
参与人i的条件概率:参与人i的信念
张红霞 博弈论及其应用
贝叶斯纳什均衡
贝叶斯均衡在本质上是一个一致性预测, 即每个参与人i都能正确地预测到具有类 * 型 j 的参与人j将选择 ai (i ) ,参与人i有 关其他参与人的信念(条件概率)的信 念不进入均衡的定义,唯一重要的是自 己的信念和其他参与人的类型依存战略 贝叶斯均衡存在多重性问题
海萨尼(Harsanyi)转换
Harsanyi1967-1968提出了海萨尼转换
(Harsanyi transformation) 针对不完全信息博弈提出的处理方法 引入虚拟参与人-“自然”(nature) 自然首先行动决定参与人的特征(如在位者 的成本函数),参与人自己知道自己的特征, 其他人不知道 不完全信息博弈由此转换为完全但不完美信 息博弈
令a 2, c1 1, c2L 3 / 4, c2H 5 / 4, 1 / 2 由此,企业2的成本期望值与企业 1相同
张红霞 博弈论及其应用
贝叶斯均衡的应用举例
企业2知道企业1的成本,企业2将最大化自己的利 润来选择产量
max 2 q2 (t q1* q2 )
张红霞 博弈论及其应用
贝叶斯博弈与混合战略均衡
抓钱博弈
参与人2 抓 不抓 1,0
参与人1
抓 不抓
-1,-1 0,1
0,0
张红霞 博弈论及其应用
贝叶斯博弈与混合战略均衡
纯战略NE:(抓,不抓),(不抓,抓); 混合战略NE:每个参与人以1/2的概率选择
抓
张红霞 博弈论及其应用
贝叶斯博弈与混合战略均衡
vi pi (i i )ui (ai (i ), ai (i );i ,i )
i
张红霞 博弈论及其应用
贝叶斯纳什均衡
定 义
n人不完全信息静态博弈 G { A1 ,, An ;1 ,, n ; p1 ,, pn ; u1 ,, un } 其纯战略贝叶斯纳什均 衡是一个类型依存 战略组合 {ai* ( i )}in1,其中每个参与人 i在给 定自己的类型 i 和其他参与人的类型依 存
* * ci* , c* 都满足 c 1 P ( 1 P ( c )) j
* 如果存在唯一的 c* , 则ci* c* 1 P ( c ) j
例如P ()为[0,2]上的均匀分布, P(c) c / 2 则有c* 1 c* / 2, c* 2 / 3
张红霞 博弈论及其应用
c1 , c2具有相同的、独立的定 义在[c, c ]上的分布 函数P(), P()是共同知识
张红霞 博弈论及其应用
贝叶斯均衡的应用举例
不完全信息下公共产品的提供
参与人B 提供 不提供 1-c1,1
参与人A
提供 不提供
1-c1,1-c2 1,1-c2
0,0
张红霞 博弈论及其应用
贝叶斯均衡的应用举例
不完全信息的情况很常见 例如市场进入博弈,进入者不清楚在位者的
特征:高成本还是低成本
张红霞 博弈论及其应用
不完全信息和海萨尼转换
高成本在位者
在位者
默许 进入者 进入 不进入 40,50 斗争 -10,0
0,300
0,300
张红霞 博弈论及其应用