博弈论的相关策略(ppt 30页)

合集下载

博弈论PPT课件

有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i，对于所有的 σi∈Mi，都有ui﹙σ*﹚≥ui﹙σi，σ-i*﹚，则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中解：设猜方猜正方的概率为p，猜反方的概率则为1－
无名氏（大众）定理
无名氏定理：在无穷次重复的由n个游戏者参与的博弈里，如果在每一次重复中博弈的行动集是有限的，则在满足下列三个条件时，在任何有限次重复中所观察到的任何行动组合都是某个子博弈完美均衡的惟一结果：
条件1：贴现因子接近于1；条件2：在每一次重复中，博弈结束的概率或等于0，或为非常小的一个正值；条件3：严格占优于一次性博弈中的最小最大收益组合的那个收益组合集是n维的。
博弈方
博弈方：独立决策、独立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等，不因博弈方之间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈，单人博弈是退化的博弈
策略
策略：博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同，而且可
游戏和经济等决策竞争较量的共同特征：规则、结果、策略选择，策略和利益相互依存，策略的关键作用
游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊朗、以色列和巴勒斯坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) （或称支付，或得益）

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

博弈论PPT课件

第1个数字表示企业1 的收入，第2个数字表示企业2的收入。
13
7.2.2合作博弈：建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈：怎样对付欺骗者 • 重复性博弈：反复进行多次博弈 • 重复性博弈的最优策略——针锋相对：模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单，不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为，但要给欺骗行为以处罚 ☞针锋相对是宽大的，允许对方恢复合作
可以采取降价策略，使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策：投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损失
29
7.3.4先发制人：使市场饱和
• 在各地布点，使新的进入者无法利用高运输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策略。
的违约问题 • 先合作，第N次违约的收入：
30+30+30+30+······+40
• 现实：不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工？ • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入：30+30+30+30+······
• 不合作收入：40+20+20+20 +······

博弈论与竞争策略课件(PPT 47张)

参与者 2
参与者 1
策略 a b c A 3 ，2 2 ，1 1 ，6 B 2 ，3 1 ，2 1 ，4 C 5 ，4 3 ，3 4 ，5
博弈论与竞争策略
假设参与者1认为参与者2选择 “C”，则参与者1应该选择 “a” 参与者1对 “C”的最优反应是 “a”. 假设参与者2认为参与者1选择 “c”，则参与者2应该选择 “A” 参与者2对 “c”的最优反应是 “A”.
动会叫Olympic Games。在英文中，game有竞赛
的意思，进行game的人是很认真的，不同于汉语
中游戏的概念。在汉语中，游戏有儿戏的味道。
博弈论与竞争策略
博弈论导论——博弈与我们的生活
周末了，带女朋友看球赛还是跟女朋友去听音乐会？母女博弈囚徒困境与价格战
博弈论与竞争策略
囚徒困境
博弈论导论——博弈论的五大要素（以情侣博弈为例）
决策主体：参与人、博弈方行动、策略、策略空间支付、得益次序博弈均衡
博弈论与竞争策略
博弈论导论——博弈的分类
合作博弈、非合作博弈
单人博弈、两人博弈、多人博弈
有限博弈、无限博弈
零和博弈、常和博弈、变和博弈
静态博弈、动态博弈、重复博弈（有限次-无限次）
囚徒B 囚徒A
坦白拒不交待ຫໍສະໝຸດ 坦白无期，无期死刑，释放
拒不交待
释放，死刑一年，一年

个体理性与集体理性的冲突
囚徒1：坦白囚徒2：坦白博弈论与竞争策略
博弈论导论—现代博弈论简单发展史
起源可以追溯到1944年数学家冯诺伊曼与经济学家摩根斯坦合著的《博弈论与经济行为》田忌赛马
博弈论与竞争策略

(8th)第13章--博弈论与竞争策略PPT课件

产品选择问题
问题
是否存在纳什均衡?
如果没有，为什么?
如果有，如何实现？
脆麦片企业 1
甜麦片
脆麦片
企业 2 甜麦片
-5, -5
10, 10
10, 10
-5, -5
.
Slide 21
海滩售货点的选址P454
背景两个竞争者, Y 和 C, 出售饮料海滩长200米游客沿海滩均匀分布 PY = PC 顾客选择最近点购买
占优策略
没有占优策略的博弈没有占优策略的博弈各自决策取决于对手的选择
.
Slide 14
广告博弈
做广告
企业B
不做广告
做广告
企业A
不做广告
10, 5 6, 8
15, 0 20, 2
.
Slide 15
广告博弈
观察
A: 没有上策，取决于B的选择
B: 做广告
做广告
问题
A的最佳选择是什么?
将损失限制在最小（10） --极大化极小策略
不投资企业 1
投资
企业 2
不投资
投资
0, 0
-10, 10
-100, 0
20, 10
.
Slide 29
纳什均衡
如果双方都是理性的并且拥有信息双方都投资纳什均衡
极大化极小策略：一种选择所有最小收益中的最大值的策略
.
Slide 30
纳什均衡
.
Slide 18
纳什均衡
产品选择问题
纳什均衡的例子两个生产早餐麦片的公司一家生产脆麦片，一家生产甜麦片每家企业的资源只能生产一种麦片非合作博弈
.

博弈论最全完整ppt 讲解

完全信息
纳什均衡（NE）
子博弈完美纳什均衡（SPNE）
不完全信息
贝氏纳什均衡（BNE）
完美贝氏纳什均衡（PBNE）及序贯均衡（SE）
静态博弈与动态博弈
(static games and dynamic games)
同时决策或者同时行动的博弈属于静态博弈；先后或序贯决策或者行动的博弈，属于动态博弈
如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为一个常数，这个博弈就叫常和博弈；
相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数，这个博弈就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。非常和（变和）博弈蕴含双赢或多赢。
导论
四、主要参考文献
博弈论为众多学科提供了分析的概念和方法：经济学和商学,政治科学,生物学, 心理学和哲学。
如何在“博弈”中获胜？
日常生活中的博弈（“游戏”）往往指的是诸如赌博和运动这样的东西：赌抛硬币百米赛跑打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。策略是为了获胜所需要的一种智力的技巧。
威廉·维克瑞， 1914-1996，生于美国
詹姆斯·莫里斯 1936年生于英国
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由：在“对充满不对称信息市场进行分析”领域做出了重要贡献。
即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈

第四篇博弈论PPT课件

• 此情况下由于博弈没有可预测的明确的博弈结果，所以就不能确定博弈方的策略。但是是否在这样的博弈中，各博弈方选择任何策略都是一样的，因此可以随意选择吗？
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) （严格竞争博弈）
（麻将、赌博、猜硬币）
• 常和博弈 (Constant-sum Games)
博弈）
（固定数量利润、财产分配的讨价还价
• 变和博弈（Variable-sum Games) (囚徒困境博弈、古诺模型）
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果： -5）
（坦白，坦白）——（-5，
• 集体理性决策的结果： -1）
（抵赖，抵赖）——（-1，
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型：价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈
出
硬正面币反面方
猜硬币方
正面
反面
-1，1
• 博弈论是系统研究各种博弈问题，寻求博弈方合理的策略选择和合理选择策略时的博弈结果，并分析结果的经济、效率意义的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型（Cournot) （1838）（两寡头通过产量决策进行竞争的模型;
• 伯特兰德模型（Bertrand) （1883）（价格竞争） • 《博弈论与经济行为》（1944）
六、博弈的表示方法
• 标准型（normal form ）收益矩阵
对简单的博弈适用（二人有限博弈）
• 扩展型（extensive form ）
博弈树
适用于动态博弈
• 特征式

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第三节威胁与承诺一、阻止市场进入的威胁
假定在一个市场中，已有企业经营，它是市场中的垄断者。现在有另一家企业作为潜在竞争者，试图进入这一市场。
目录
潜在进进入
入者
不进入
垄断者
商战
默许
-200， 600 0， 3000
900，1100 0，3000
潜在进入者
（1）
默许——900，1100 进入—— 垄断者
坦白
-5， -5 -8， -1
不坦白
-1，-8 -2，-2
目录
在本例中，两个对局者A和B都可选择坦白或不坦白两种策略，他们所有选择的不同组合可能得到四种结局。我们可将这四种结局依次表示为（坦白，坦白），（坦白，不坦白），（不坦白，坦白）和（不坦白，不坦白，）括号中前后两种策略分别为对局者A和B所选择的策略。矩阵中的数字表明在不同结局下他们各自的得益，前一数字是对局都A的得益。后一数字则是对局者B的得益。在本例中，囚犯得到的是惩罚，因而他们的得益是负的。
—
垄断者进入——（2）
默许——900，300 商战——－200，600
不进入——0，2200
潜在进入
者（1）— —
进入——900，1100 不进入——0，3000
目录
垄断者采取承诺行动后，澌潜在进入者的最优策略是不进入，垄断者尽管多投资了800了万元，但与（进入，默许）相比，付出这一代价是值得的。
企业A
10元 15元
企业B
10元
15元
100， 80 50， 170
180，30 150，120
目录
比较一下表7.2与表7.1，可以发现它内部的结构是十分相似的。如果两家企业都采取低价竞争的策略，他们的利润状况都将远远不如都采取高价策略的结局。但如果企业A 和B能够了解这一矩阵所示各种结果，并能采取一种相互合作的态度，那末，他们都采取定价15元的策略就能获得更高的利润。这两种两难境况与囚犯的困境是一样的。合作能够产生更高利润，但只要任何一方（例如企业A）采取不合作的态度（定价10元），它就可能获得对它更有利的结果，而另一方（企业B）则会受损（即此时A可盈利 180万元，而B则仅获利30万元）。
在这样一个对局中，最可能出现的是什么结局？显然，是两个都坦白，即（坦白，坦白）的结局。
二、上策与上策均衡
在市场竞争中，有许多情况与囚犯的困境是完全类似的，其中十分典型的是价格竞争的策略选择。
目录
假设一个市场中仅有A、B两家企业，每家企业可采取的定价10元或15元，我们可用下面的得益矩阵来说明每种策略组合的结果。现在矩阵中每一对数字，前一数字表示企业A可获得的利润，后一数字表示企业B能获得的利润，单位为万元。表7.2
目录
对序列博弈的分析可以采用博弈的扩展形式来进行。
企业A （1）
进入—— 企业B （2）
进入——－20，－20 不进入——50，0
进入——0，50 不进入—— 企业B
（3）不进入——0，0
目录
博弈扩展形的求解从右端开始，企业A的最佳选择是进入这个市场，而在此条件下，企业B的理性反应则是不进入。
目录
日本企业已经有了他们的标准，这种标准被称为 MUSE，而欧洲企业也在开发他们自己的技术标准。假定这两类企业的技术标准的策略选择将使他们得到如表9.４所示的得益矩阵。
日本企业日本标准欧洲标准
欧洲企业
日本标准
欧洲标准
100， 50 0， 0
30，20 60，90
目录
由上述得益矩阵可见，对日本企业来说，如果日本企业的欧洲企业都采用日本标准，他们获得最大得益；同样地，对欧洲企业来说，他们的最大得益也要求双方都采用欧洲标准。由此可见，协调对方都非常重要，如果他们各种采用自己的标准，他们的得益都将远远低于采用同一种标准的情况。
分析一下上述矩阵，可以发生囚犯A和B都面临一种两难境地。如果他们都听从检察官的劝告而坦白的话，他们将
目录
被判入狱5年；如果他们都选择不坦白的策略，他们都将只被判2年。入狱2年当然比入狱5年要好得多，但问题是，即使他们曾经订立攻守同盟，在背靠背后地被审讯的情况下，同伙人还是可信任的吗？此时他们都将面临同伙人背叛的风险，也就是面临被判8年的风险。特别是，如果检察官：“他已经坦白了你还不坦白吗？”这两个囚犯谁还能守口如瓶呢？
目录
现在，对A和B来说，他们面临怎样的选择呢？博弈论采用所谓的得益矩隈来描述这种对局，它列出对局者可以采取的各种策略，并估计出与每种策略的组合相对应的结果。本便量度种最简单的情况，即只有两个对局者，每年对局都都只有两种策略可供选择。囚犯A和B的得益矩阵如表7.1所示。
囚犯A
坦白不坦白
囚犯B
目录
二、承诺与可信性所谓承诺，是指对局者所采取的某种行动，这种行动使
其威胁成为一种令人可信的威胁。只有当对局者不实行，这种威胁会遭受更大损失时，这种威胁就变得没主了。空头威胁无法有效阻止潜在进入者进入市场，主要原因是它不需要任何成本，因而不可信。
垄断者阻止进入的一种重要承诺就是通过投资一部分剩余生产能力，这一部分剩余生产能力在没有其它企业进入市场时是多余的，但在进入发生时则成为价格竞争（商战）的有力武器。
可信的承诺确实能够阻止市场的进入，但是作出承诺的企业也确实因此对自己的行为施加了较严格的限制。这种通过限制自己的行为来获得竞争优势的做法称为企业的 “策略性行动”。
目录
第四节几种相关策略一、“保证最低价格”的策略
沃尔马的成功固然有各方面的因素，但关键在于其采取了成功的市场进入的策略。沃尔马的创业者山姆·华尔顿在这方面有着独到的见解。大多数的经营者都认为，大型折扣店依靠较低的价格、较低的装修与库存成本经营，要赚钱就必须要有足够大的市场容量，因此，这类商店无法在一个10万人口以下的城镇上须要有足够大的市场容量，因此，这类商店无法在一个10万人口以下的城镇上开始他的实践，到1970
目录
在这一对局中，有两个纳什均衡点，即（日本标准、日本标准），（欧洲标准，欧洲标准）。但实际情况是，日本与欧洲至今未达成有关HDTV技术标准的协议。同时，美国也在发展自己的HDTV技术标准，这个标准即不同于日本标准，又不同欧洲标准，美国人的态度使HDTV技术标准问题进一步复杂化了。
第二节重复博弈与序列博弈一、重复博弈
目录
年就开出了30家“小镇上的折扣店”，并获得了巨大的成功。一个10万人口以下的小镇所具有的市场容量并不太大，但却足够容纳下一个大型折扣店，并能让它盈得一定的利润。在70年代中期，当其他连锁店的经营者认识到这一点时，沃尔马已经大量占领了这样的市场。特别是，对这样的小镇来说，开出一家连锁折扣店可以盈利，因为这家折扣店可以成为小镇市场上的垄断者；但如果开出两家来，市场容量就不够大，这两家折扣店就必然要亏损。因此，对小镇市场来说，连锁折扣店的竞争就面临一种市场进入的博弈。表9.5是这一博弈的得益矩阵。
目录
若形成剩余生产能力，假定垄断者要增加投资800万元，这一投资将改变博弈的得益矩阵。
表7.7 实行承诺后的阻止市场进入博弈入
-200， 600 0， 2200
900，300 0，2200
扩展形式进行分析；
目录
承诺垄断者（0）不承诺
潜在进入者（2）—
博弈论与竞争策略第一节简单博弈与博弈均衡一、囚犯的困境
囚犯的困境。两个犯罪嫌疑人A和B因作案被逮捕，检察官将他们分别关在两间牢房里进行审读。检察官对A说， “我们实行的是‘坦白从宽，抗拒从严’的政策，如果你们两个人都不坦白，你们都将被判刑2年；如果你坦白了而他不坦白，那么你将只被1年，他将判8年；如果他坦白了而你不坦白，那么你判8年他判1年；如果你们两个都坦白，你们就将被从轻宣判。”当然，检察官对B说的话也是完全一样的。但实际上，如果两个人都坦白，却会因涉及更多的罪案而都被判刑5年。
目录
三、纳什均衡
现实中大量存在没有上策的情况，此时是否还存在对局的均衡状态呢？
性别之战。两个谈恋爱的人准备在周末晚上一起出去男的喜欢听音乐会，但女比较喜欢看电影。当然，两个人都不愿意分开活动。不同的选择给他们带来的满足由表9.3 表示。表9.3 性别之战
女
音乐会
电影
男
音乐会
电影
2， 1 0， 0
目录
事实上，上述博弈中存在两个均衡状态，即（电影，电影），（音乐会，音乐会），这种均衡叫纳什均衡。纳什均衡是这样一种状态，在对手策略选定的条件下，各个对局者所选择的策略都是最好的。上策均衡是纳什均衡的一种特殊情况。
在市场竞争中，同样存在与性别之战类似的情况。在公共标准的争夺。90年代初，日本企业的高清晰度电视（HDTV）的发展方面居于领先地位。高清晰度电视技术将极大地改善电视图象的质量，并将成为未来的互动式电视传播方式的基础。但高清晰度电视的发展面临一个重大的战略问题，即如何确定世界范围的技术标准？
上一节讨论的博弈都是一次性的，不再重复进行。但在现实中，企业之间的竞争一般都持续一个较长时期，在对局可以多次重复的情况下，竞争的结局是否有所改变呢？对博弈的参与者来说，此时是否存在一种最好的策略？
目录
现实中的企业没有一个会明确地预期什么时期会结束经营，因此企业的竞争格局就可能近似于无限次重复博弈，企业也就可能选择“以牙还牙”的策略，并导致相互合作的结局。近年来，我国在许多行业发生的价格竞争多少带有“恶性竞争”的意味。近来部分商业企业开始推行“实价销售”，这是对恶性价格竞争进行反思的结果。
（2）商战——－200，600
不进入—— 0，3000
目录
这个博弈的结局是（进入，默许）。但对垄断者来说，这一结局不是他所愿意看到的。因此，垄断者的自然反应是试图阻止潜在进入者的进入。问题是，垄断者如何才能阻止市场进入？