简明博弈论教程(11)

合集下载

尹伯成《西方经济学简明教程》(第7版)笔记和课后习题(含考研真题)详解(第8章博弈论和信息经济学)

第8章博弈论和信息经济学8.1 复习笔记一、博弈论1．博弈论与传统经济学博弈论本质上也是研究理性的经济主体的最大化行为，但比传统经济学更进一步，认为自己的效用（以及利润或收入）函数不仅依赖于自己的决策，也依赖于他人的决策。

现实的经济生活中，新古典经济学的两个基本假设均难满足：（1）市场是不完全竞争的，市场局中人之间往往是相互影响的，因此一方在决策时必须考虑对方反应，而这一扩张恰恰是博弈论主题。

（2）现实市场中，局中人间信息通常是不充分的。

2．博弈论的基本要素博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。

在策略性环境中，每一个人进行的决策和采取的行动都会对其他人产生影响。

因此，每个人在进行策略性决策和采取策略性行动时，要根据其他人的可能反应来决定自己的决策和行动。

博弈论的基本要素包括：（1）局中人：参与博弈（对策）并承担后果的利益主体，有时也称参与人。

（2）策略集合：指所有局中人可能采取的行动方案的总和。

（3）收益：指在每种策略组合情况下局中人采取特定策略得到的结果。

3．上策均衡和纳什均衡（1）上策：指不管其他局中人采取什么策略，某一局中人都采取自认为对自己最有利的策略。

均衡指博弈中所有局中人都不想改变自己策略的一种相对静止状态。

上策均衡是指不管其他局中人采取什么策略，每个局中人都选择了对自己最有利的策略所构成的一个策略组合。

（2）纳什均衡：指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。

（3）二者关系：纳什均衡不一定是上策均衡，但上策均衡一定是纳什均衡。

如表8-1所示，该博弈没有上策均衡，（策略A，策略A），（策略B，策略B）都是纳什均衡，但不是上策均衡。

表8-1 纳什均衡4．重复博弈和序列博弈（1）静态博弈指局中人同时决策或虽非同时决策，但后决策者不知道先决策者采取什么策略的博弈。

动态博弈指局中人决策有先有后，后决策者能观察到先决策者决策情况下的博弈。

博弈论讲义完整PPT课件

• 两个寡头企业选择产量的博弈：
如果两个企业联合起来形成卡特尔，选择垄断利润最大化的产量，每个企业都可以得到更多的利润。给定对方遵守协议的情况下，每个企业都想增加产量，结果是，每个企业都只得到纳什均衡产量的利润，它严格小于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章导论-囚徒困境
知识：完全信息博弈和不完全信息博弈。 ❖完全信息：每一个参与人对所有其他参与人的（对手）的特征、
战略空间及支付函数有准确的知识，否则为不完全信息。
第33页/共293页
第一章导论-基本概念
• 博弈的划分：
行动顺序信息
完全信息
静态
完全信息静态博弈纳什均衡
纳什（1950，1951）
不完全信息
不完全信息静态博弈贝叶斯纳什均衡
0，300 0，300
纳什均衡：进入，默许；不进入，斗争
第29页/共293页
第一章导论
• 人生是永不停歇的博弈过程，博弈意略达到合意的结果。 • 作为博弈者，最佳策略是最大限度地利用游戏规则，最
大化自己的利益； • 作为社会最佳策略，是通过规则使社会整体福利增加。
第30页/共293页
第一章导论-基本概念
一只河蚌正张开壳晒太阳，不料，飞来了一只鸟，张嘴去啄他的肉，河蚌连忙合起两张壳，紧紧钳住鸟的嘴巴，鸟说：“今天不下雨，明天不下雨，就会有死蚌肉。” 河蚌说：“今天不放你，明天不放你，就会有死鸟。”谁也不肯松口，有一个渔夫看见了，便过来把他们一起捉走了。
第17页/共293页
第一章导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”？
第20页/共293页

博弈论入门(课堂PPT)

共同价值和赢者的诅咒
• 两家代理：1个积极估价，1个消极估价
prob(v/s)11//22
vs2 vs2
• v均匀分布
• 出价b=?（一家和两家出价时有不同吗）
• 考察b=s-1这样一个对称策略
• 德士古公司的例子
15
几种常见的拍卖形式
• 英式公开叫价拍卖 • 荷式公开叫价拍卖 • 一价密封拍卖 • 二价密封拍卖
• 通过改革，陪审团制度在美国得到了比英国更好的发展。
22
投票程序
23
• 每个陪审员在陪审之前已经有一个大体的判断
• 他们的类型 • 非专业性——从众行为
– 如果评判有罪的人数多于无罪，则投有罪 – 如果评判无罪的人数多于有罪，则投无罪 – 如果双方人数相等，则依照自己的评判结果
投票
24
• 陪1：假设投有罪 • 陪2：若评判有罪，则投有罪；若评判无
• 在被问及对最终的价格是否感到意外时，Frija抛下一个“不”字，随即离开了
11
简化的暗标拍卖
密封递交标书统一时间公正开标标价最高者以所报标价中标中标博弈方的得益不仅取决于标价，还取决于他对拍
卖标的物的带有很大主观性的估计每个博弈方的估价通常是自己的私人信息
12
0.6
0.4
• 考虑这样一个对称策略：给定其他两个委员采取相同策略，以及对于其他成员拥有哪个政策更好的知识的信念，不论这个参与者什么类型，采取这个策略都使他收益最大。
19
• 自然决定四项：哪个政策更好，以及三个委员的类型。
• 当一个委员了解新政策时：投票给自己认为更好的策略是一个弱占优策略。
– 当另外两位投票相同时 – 当另外两位投票分歧时

博弈论教程

囚徒A 坦白不坦白
－5,－5
－10,0
0,－10
－1,－1
2.1.2 严格下策反复消去法（逐步剔除严格劣战略）例
L M R
U M 8,3 2,1 5,1 8,4 6,2 3,6
D
3,0
9,6
2,8
可以预测该博弈的合理结局为(U,L),即参与人A
选择策略U,而参与人B选择策略L。
2.2 Nash 均衡 2.2.1 Nash 均衡的定义 Nash 均衡是指这样的策略组合(或剖面): 为了极大化自己的收益(或效用), 每一个参与人所采取的策略一定应该是关于其他参与人所采取的策略的最佳反应. 因此没有一个参与人会轻率地偏离这个策略组合而使自己蒙受损失。
博
弈
论
第一章导论
1.1什么是博弈论(Game Theory) 1.1.1 从游戏到博弈
游戏都有一些共同的特点:
1.都具有一定的规则; 2.都有一个结果; 3.策略至关重要; 4.策略和利益有相互依存性
一、博弈论概述
1.1.1 博弈论的定义
博弈论研究的是人与人之间利益相互制约下策略选择时的理性行为及相应结局。豪尔绍尼（John C.Harsanyi）1994年诺贝尔经济学奖获奖致词：博弈论是关于策略相互作用的理论。博弈论研究人与人之间“斗智”的形式和后果，当人们利益存在冲突时，每个人所获得的利益不仅取决于自己所获取的行动，还依赖于其他人采取的行动，每个人都需要针对对方的行为选择作出对自己最有利的反应。
定义在有n个参与人的博弈 G={S1,S2…Sn;u1,u2,…un)中,策略组合 s*=(s1 *,s2 *,…sn *)是一个Nash均衡,如果对于每一个i, si*是给定其他参与人的选择: S-i*=(s1*,…si-1*,si+1*,…sn*)的情况下,第i个人的最优策略,即 ui(si*,s-i*)≥ui(si,s-i*) ,对所有的i∈Γ 或者用另一种表示方式,si*是下述最大化问题的解: si*∈arg ui(s1*,…si-1*,si,si+1*,…sn*),i=1,2,…n S *∈Si 因此,当且仅当没有一个参与人能从单方面背离某个策略组合的预见中增加自己的得益时,这个策略组合就是Nash均衡。

微观经济学第11章博弈论1

4.3 博弈论的成长和发展
一、第一个研究高潮，本世纪40年代末和50年代初

1950年纳什提出“纳什均衡”（Nash equilibrium）概念和证明纳什定理，发展非合作博弈的基础理论。 1950年Melvin Dresher和Merrill Flood在兰德公司（美国空军）“囚徒的困境”（Prison’s dilemma）博弈实验，（Howard Raiffa）独立进行这个博弈实验； 1952-1953年期间（L. S. Shapley）和（D. B. Gillies）提出“核”（Core）作为合作博弈的一般解概念 Shapley提出了合作博弈的“Shapley值”（Shapley value）概念等。奥曼（R. J. Aumann）“40年代末50年代初是博弈论历史上令人振奋的时期，原理已经破茧而出，正在试飞它们的双翅，活跃着一批巨人。”
1
运输路线得益矩阵
单人博弈实质个体最优化问题
-7000
-10000 -16000
运输路线扩展形
-10000
二、两人博弈

两人博弈即有两个博弈方的博弈两人博弈最常见，研究最多，是最基本和有用的博弈类型囚徒困境、猜硬币、齐威王田忌赛马等都是两人博弈两人博弈有多种可能性，博弈方的利益方向可能一致，也可以不一致
政府组织协调的必要性和重要性
寡头1：低价(70) 寡头2：低价(70)
2.2 赌胜博弈

赌博、竞技等构成的博弈问题，在经济中也有许多应用，赌胜博弈也是一类重要的博弈问题，对经济竞争和合作也有很大启示赌胜博弈的特点是一方得等于另一方失，不可能双赢，属于“零和博弈”

《博弈论初步》课件

THANKS
感谢观看
02
纳什均衡是一种非合作博弈均衡，其中每个参与者都认为当前策略是最好的，不会受到其他参与者的欺骗或影响。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的策略，逐步逼近纳什均衡。这种方法适用于较简单的博弈模型，但对于复杂的博弈模型可能收敛速度较慢。
线性规划法
将纳什均衡问题转化为线性规划问题，通过求解线性规划来找到纳什均衡。这种方法适用于具有线性特征的博弈模型，但计算复杂度较高。
价格战与非价格战
博弈论分析了价格战和非价格战的利弊，为企业制定营销策略提供博弈论可以用来分析选民的投票行为和政治立场，预测选举结果。
02
候选人策略
博弈论为候选人提供了制定最优竞选策略的方法，帮助他们在选举中获
胜。
03
政治联盟与利益交换
博弈论中的合作博弈理论可以用来分析政治联盟的形成和利益交换机制
特征值法
利用特征值和特征向量的性质来求解纳什均衡。这种方法适用于具有矩阵特征的博弈模型，但需要一定的数学基础。
纳什均衡的应用实例
1 2
价格竞争
在寡头市场中，企业之间通过价格策略进行竞争，最终形成价格均衡，即纳什均衡。
劳资谈判
劳资双方在谈判中会提出自己的工资要求，最终达成工资协议，这也是一种纳什均衡。
博弈类型
合作博弈
定义
01
参与者通过合作达成共赢的博弈。
特点
02
存在合作协议，强调集体行动和收益分配。
应用场景
03
国际关系、商业合作、团队协作等。
非合作博弈
定义
应用场景
参与者追求各自利益最大化的博弈。
市场竞争、个人决策、资源分配等。

博弈论简明教材

博弈论第一节博弈问题概述一、博弈的基本概念博弈论是近年经济学中发展得很快的一个分支。

博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的。

换句话说，博弈论研究当某一经济主体的决策既受到其它经济主体决策的影响，而且该经济主体的相应决策又反过来影响到其它经济主体时的决策问题和均衡问题。

在前面几讲中，除了寡头市场外，消费者的效用或厂商的利润都只依赖于他自己的选择，而与其他人的选择无关。

在这里，经济作为一个整体，各个经济主体的选择是相互影响的。

但对于单个的消费者或厂商来说，所有其它经济主体的行为都被包括在一个参数里。

这个参数就是价格。

除此以外，经济主体在决策时，面临的似乎是一个非人格化的东西。

经济主体既不需要考虑他人的选择对自己选择的影响，也何必需要考虑自己的选择对他人的影响。

而在本讲所介绍的博弈论中，消费者的效用或厂商的利润不仅依赖于自己的选择，而且依赖于具体的某一个或某一些其它经济主体的选择。

在经济学中，博弈论通常是放在寡头市场的分析中，因为在寡头市场上，某一寡头企业在决策时，不得不考虑其他寡头企业的反应。

但事实上，博弈行为是广泛存在的。

博弈分析的目的是使用博弈规则决定均衡。

博弈论的基本概念包括：参与人、行动、战略、博弈规则、信息、报偿、均衡。

参与人是指博弈中选择行动以最大化自身利益（效用、利润等）的决策主体（如个人、厂商、国家）。

行动是指参与人作的决策。

战略是指参与人选择行动的规则，它告诉参与人在什么情况下选择什么行动。

例如，“人不犯我、我不犯人；人若犯我、我必犯人”是一种战略。

这里，“犯”与“不犯”是两种不同的行动。

战略规定了什么时候选择“犯”，什么时候选择“不犯”。

博弈规则是指参与人共同接受的不同情况下的最优战略。

信息是指参与人在博弈中的知识，特别是有关其他参与人（对手）的特征和行动的知识。

报偿是参与人从博弈中获得的结果，它取决于所有参与人的行动或战略。

非合作博弈学习.pptx

• 政府管制使厂商从 “囚徒困境中” 解放出来，
说明自由竞争并不是最有效的经济体系，适
当的政府管制可以更有效的提高社会经济和
政治效益
10
第11页/共33页
3努力还是偷懒
甲
博弈的标准式
乙
努力
偷懒
努力（10，10）（2，15）
偷懒
（15，2）（5，5）
要改变合作困境，即改变博弈的均衡，可采取奖勤罚懒措施
32
第33页/共33页
第17页/共33页
• 如果大猪和小猪都去按压开关，然后两头猪从开关处奔向猪圈另一端的盛食槽。由于大猪跑的快，小猪跑得慢，因此大猪会比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按压开关的劳动却没有吃到食物。在此种情况下，大猪的收益为 5，小猪的收益为 -1。
• 如果大猪去按压开关，小猪在盛食槽旁等待。那么当大猪按下开关后，盛食槽内出现食物，小猪立即开始吃，大猪则需要花一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后，身强力壮的大猪会把小猪挤到一旁，吃光剩余的食物。在这种情况下，大猪得到的收益是 4，小猪得到的收益是 2。
第22页/共33页
二存在多个纳什均衡的博弈
• 1 性别博弈
男方
看足球听昆曲
女方
看足球
听昆曲
（10，2）（-1，-1）
（-1，-1）（2，10）
❖ 采用“划横线法”寻找“性别博弈”的纳什均衡 ❖ （男方看足球、女方看足球）和（男方听昆曲、女方听昆曲）都是“性别博
弈”的纳什均衡。 ❖ 在特定情况下，惯例和传统能够提供博弈的多重纳什均衡中那个更可能出现
（a，a）（d，c）
偷懒
（c，d）（b，b）

尹伯成《西方经济学简明教程》(第8版)课后习题详解(博弈论和信息经济学)

第8章博弈论和信息经济学1．简释下列概念：（1）上策均衡答：上策均衡又称占优策略均衡，是由博弈中的所有参与者的占优策略组合所构成的均衡。

因为在一个博弈里，如果所有参与人都有占优策略存在，那么，占优策略均衡是可以预测到的唯一均衡，因为没有一个理性的参与人会选择劣策略。

应该指出的是，占优策略均衡只要求每个参与人是理性的，而并不要求每个参与人知道其他参与人是理性的（也就是说，不要求“理性”是共同知识），这是因为，不论其他参与人是否是理性的，占优策略总是理性参与人的最优选择。

（2）纳什均衡答：纳什均衡是指这样一种策略集，在这一策略集中，每一个博弈者都确信，在给定竞争对手策略决定的情况下，他选择了最好的策略。

纳什均衡是由所有参与人的最优策略所组成的一个策略组合。

也就是说，给定其他人的策略，任何个人都没有积极性去选择其他策略，从而没有人有积极性去打破这个均衡。

（3）静态博弈答：静态博弈指局中人同时决策或虽非同时决策，但后决策者不知道先决策者采取什么策略的博弈。

在静态博弈中，局中人同时选择行动，或者虽然不是同时，但后行动者并不知道先行动者采取了何种具体行动，从而不能根据先行动者的行动来选择自己的行动。

（4）动态博弈答：动态博弈指局中人决策有先有后，后决策者能观察到先决策者决策情况下的博弈。

在动态博弈中，局中人的行动有先后顺序，并且后行动者能够观察到先行动者所选择的行动，从而可以根据先行动者的行动来决定自己的行动。

相应地，先行动者知道其行动会影响后行动者的行动选择，从而在决定自己的行动时会把这种影响考虑进去。

（5）极大极小化策略答：极大极小化策略指参与者所采取的使自己能够获得的极小收入极大化的策略。

极小收入是指采取某一种策略所能获得的最小收入。

以表8-1的支付矩阵为例，A采取守的策略所能获得的最小收入是2，而采取攻的策略所能获得的最小收入是-500。

表8-1 极大极小策略就表8-1所显示的策略而言，若A、B两人都采取极大极小化策略，均衡的结果是守与退的策略，两人都分别获得2的支付。

博弈论最全完整-讲解课件

• 王则柯、李杰编著，《博弈论教程》，中国人民大学出版社，2004年版。
• 艾里克.拉斯缪森（Eric Rasmusen）著，《博弈与信息：博弈论概论》，北京大学出版社，2003年版。
• 因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著，《信息经济学引论：激励与合约》,上海财经大学出版社，2004年版。
学习交流PPT
17
约翰· 海萨尼 1920年生于美国
约翰·纳什 1928年生于美国
莱因哈德·泽尔腾， 1930 年生于德国
学习交流PPT
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞(William Vickrey)
托马斯·谢林
学习交流PPT
24
导论
三、博弈论的基本类型
学习交流PPT
25
合作博弈与非合作博弈
• 合作博弈（cooperative game）达成有约束力的协议（binding
agreement），强调团体理性，强调效率、公正、公平 • 非合作博弈（non-cooperative game）
强调个人理性，其结果可能有效率，也可能无效率。
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由：在“对充满不对称信息市场进行分析”领域做出了重要贡献。
学习交流PPT
21
迈克尔·斯彭斯 1948年生于美国的新泽西，1972年获美国哈佛大学博士头衔，现兼任美国哈佛和斯坦福两所
• 也就是说，需要的是对这样的情况下该选什么的预期的收敛。这一使得参与者能够成功合作的共同预期的策略被称为焦点。心有灵犀一点通。

博弈论(第十一讲重复博弈与声誉)PPT课件

16
11.2 有限次重复博弈
11.2.1 有限次重复博弈——阶段博弈只有一个纳什均衡假设重复博弈要经历T个阶段而此时是T-1阶段，总支付为各个独立阶段的支付之和。在阶段T都会选择击中。用AT-2和GT-2 分别表示盟军与德军从阶段1到阶段T-2的各阶段支付之和，T 阶段的子博弈如下所示：
可以看出，AT-2和GT-2对求解过程不产生任何影响。
17
11.2 有限次重复博弈
11.2.1 有限次重复博弈——阶段博弈只有一个纳什均衡
对于阶段博弈而言，有一个纳什均衡的重要性在于它能够明确最后一个阶段中参与者如何选择。因此，对于重复博弈而言，倒数第二阶段的行为不会影响最后一个阶段，并且这一逻辑可以重复地应用到任何阶段直至初始阶段。
如果阶段博弈有唯一的纳什均衡，对于有限次重复博弈而言，唯一的子博弈精炼纳什均衡就是阶段博弈纳什均衡的重复。
9
11.1 基本概念
阶段博弈的支付在重复博弈中仅表现为一个阶段的支付。重复博弈中参与者的支付受到每一个独立阶段支付流的影响。假设T=5，重复博弈的历史为（不击中，不击中），（击中，不击中），（不击中，不击中），（不击中，击中），（击中，击中），第一个行动为协约国士兵的选择，则协约国士兵的独立阶段支付流为4,6,4,0,2。在重复博弈中参与者会选择能够产生最高支付的策略作为最终策略。支付流{4,6,4,0,2}劣于{6,6,6,0,2}，但是，很难比较支付流{6,4,4,2,6}与{4,6,4,0,2}。
10
11.1 基本概念
为了对不同的支付流进行比较，需要确定一个标准。一个标准就是对支付流进行加总，求得各阶段支付之和。这样做不仅因为简单，而且当单一阶段的支付增加时，总和也随之增加。对于上述三个支付流有：

博弈论专题PPT课件

流浪汉找工作游荡
B 正面反面
政救济 3，2 -1，3 A 正面 -1，1 1，-1 府1，-1 -1，1
（一）完全信息静态博弈：纳什均衡
----混合战略纳什均衡
• 纯战略： • 参与人在每一个给定信息的情况下只选择一个特定的行动 • 混合战略： • 参与人在每一个给定信息的情况下以某种概率分布随机地选
博弈信息：影响最后博弈结局的所有参与人的情报 “完美信息”-确定的结果 “不完美信息”-概率期望
依据支付结果分为零和博弈、常和博弈以及变和博弈
非合作博弈理论
完全信息
静态完全信息静态博弈
纳什均衡纳什（1950，1951）
不完全信息
不完全信息静态博弈贝叶斯纳什均衡海萨尼（1967－1968）
such that no player has incentive to unilaterally change her action. Players are in
equilibrium if a change in strategies by any one of them would lead that player to earn
动态
完全信息动态博弈子博弈精炼纳什均衡
泽尔腾（1965）不完全信息动态博弈精炼贝叶斯纳什均衡
泽尔腾（1975） Kreps和Wilson（1982）
Fudenberg和Tirole （1991）
（一）完全信息静态博弈：纳什均衡 Nash Equilibrium
A Nash equilibrium, named after John Nash, is a set of strategies, one for each player,

《博弈论教程》课件

博弈论的应用领域
经济学
博弈论在经济学中广泛应用于市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国际关系、政治制度、选举行为等领域。
社会学
博弈论在社会学中用于研究社会结构、社会互动、社会行为等领域。
计算机科学
博弈论在计算机科学中用于人工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中，所有参与者的最优策略组合，即在这种策略组合下，每个参与者都认为没有更好的选择。
纳什均衡是一种非合作博弈的解概念，适用于各种博弈类型，如囚徒困境、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略，逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中，企业通常会选择不同的策略，如快速进入、缓慢进入或等待观察等。这些策略的选择会影响到企业的收益和市场格局。
结论
市场进入博弈可以帮助企业制定出最优的市场进入策略，以最大化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息，即每个参与者都了解其他参与者的策略和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称，即某个参与者对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。

博弈论最全完整-讲解

问题是，大家都这么做。这样一来，所有人的成绩都不比大家遵守协议来得高。而且，大家还付出了更多的功夫。
正因为这样的博弈对所有参与者存在着或大或小的潜在成本，如何达成和维护互利的合作就成为一个值得探究的重要问题。
存在双赢的博弈吗？实用文档
6
例2：焦点博弈 “We Can’t Take the Exam,
获奖理由：在非合作博弈的均衡分析理论方面做出了开创性的贡献，对博弈论和经济学产生了重大影响。
实用文档
17
约翰·纳什 1928年生于美国
莱因哈德·泽尔腾， 1930 年生于德国
实用文档
约翰· 海萨尼 1920年生于美国
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由：前者在信息经济学理论领域做出了重大贡献，尤其是不对称信息条件下的经济激励理论的论述；后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。
实用文档
19
威廉·维克瑞， 1914-1996，生于美国
詹姆斯·莫里斯 1936年生于英国
实用文档
20
2001年诺贝尔经济学奖获得者
实用文档
35
第一章完全信息静态博弈
博弈论的基本概念及战略式表述纳什均衡
纳什均衡应用举例混合战略纳什均衡纳什均衡的存在性与多重性
实用文档
36
第一节博弈论的基本概念
与战略式表述
Байду номын сангаас
实用文档
37
博弈论的基本概念与战略式表述
博弈论（game theory）是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

《博弈论入门》PPT课件

即规定每个博弈方在进行决策时，可以选择的方案，做法或经济活动的水平，量值等。
在不同博弈中可供博弈方选择的策略或行为的数量很不相同，在同一个博弈中，不同博弈方的可选策略或行为的内容或数量也常不同，有时只有有限的几种，甚至只有一种，而有时又可能有许多种，甚至无限多种可选策略或行为。
精选PPT
男人无所谓忠诚，忠诚是因为背叛的砝码太低；女人无所谓忠贞，忠贞是因为受到的引诱不够.
某个综艺节目现场，女主持人气势咄咄的问一个男嘉宾，你为什么那么在乎钱，男嘉宾说：“钱能买到一切!” 现场的观众哗然了。
男嘉宾微笑的说：“我们做个测试吧。”
一个很简单的主题，你的一个仇人爱上了你的女友，现在
局中人所选择的策略构成的组合（招,招）被称为博弈均衡。
精选PPT
21
参与人（Players）
即在所定义的博弈中究竟有哪几个独立决策、独立承担结果的个人或组织。
对我们来说，只要在一个博弈中统一决策，统一行动、统一承担结果，不管一个组织有多大，哪怕是一个国家，甚至是由许多国有组成的联合国，都可以作为博弈中的一个参加方。并且，在博弈的规则确定之后，各参加方都是平等的，大家都必须严格按照规则办事。
人，也许是在权衡什么。一半的男人沉默了，另一半
的男人怯生生的说:“我要爱情。”身边的女友也有点
呆住了，一个女孩子站起来说：“如果一个男人肯出
五百万，我想我没有理由拒绝他。”沉默..................
精选PPT
26
男人选择了金钱，500万可以买一套房子，一部车子，全家过上好曰子，甚至可以开始自己的事业。一个男人说：“他是我的仇人，我有了这个500万，我可以含辛茹苦，我可以报仇，我可以计划我所有的未来，当个真正主宰自己的男人。”一些女人看着身边的男人，若有所思。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

11
• 赫鲁晓夫对美国飞机入侵苏联和古巴领空进行了谴责，但表示愿意同意同肯尼迪交换意见共同缓和国际紧张局势。肯尼迪政府认为在古巴导弹问题的主要目标即迫使苏联撤走导弹，消除对美国的军事威胁已经达到。苏美双方都采取措施履行了自己的承诺，古巴导弹危机成为了历史。
12
13
14
• 肯尼迪的估计概率区间下线大于我们的上限0.27，是美国人能接受的风险上限； • 赤裸裸的简单威胁“如果你们选择对抗，则遭遇一场核大战”实在是太大了，也太冒险了，对于美国人来说也是太大胆的威胁了。
23
• 肯尼迪只有用试探的方法去寻找苏联和他自己承受风险能力的边界； • 肯尼迪必须从十分安全的情况下开始试探，并且逐
渐增大风险。
24
• 边缘政策，就是故意将危机引向灾难的边缘。在某些时候奉行边缘政策，将可以提高局中人的谈判优势——参与人。 • 以国家政治军事斗争为例，假如两国长期军事对抗，双方都拥有核武器，那么较弱的一方为了避免常规战争就可以用发射核武器相威胁。但是，这种威胁有可能被强者一方认为是不可置信的。
26
• 在商业生活中也有这样的情况。为了维护就业和薪酬保障，工会有可能会故意制造恶性的罢工风险。因为工会可以让企业相信，如果企业不答应，那么工会自己难以控制劳工的罢工行动。 • 使用边缘政策的危险在于，它的确有可能导致擦枪走火，灾难性的后果也真的有可能发生。毕竟，边缘政策之所以能对对手起到威慑作用，正在于它的某些方面超越了局中人的控制能力，而这种对控制能力的超越的确有可能导致灾难发生。所以，边缘政策往往是谈判中万不得已的选择。
25
• 那么，弱者的一方又如何使其威胁可以置信呢？也许该国领导人可以下放核武器的控制权——将核武器布置在边境，对准敌国，并由某个将军掌握核按钮。这看起来是更危险了，但实际上可能对强者产生了真正的威慑，因为一旦在边境爆发战事，尽管弱国的领导人不想启动核按钮，但那位面临生死关头的将军也可能启动核按钮。 •
10
• 苏联面对着肯尼迪的封锁和威吓，态度前后发生了巨大变化。苏联开始时态度强硬，把美国的封锁照会当作不可接受的文件退还美国驻苏使馆。10月23日，苏联政府发表声明，警告美国政府“如果轻率玩火应对和平的命运负严重责任”。苏联政府呼吁各国政府和人民“强烈抗议美国侵略古巴和别国的行径，坚决谴责这些行动并阻止美国政府发动热核战争”。
21世纪经济学系列教材
中国人民大学出版社
• 第一节对于事件的一个简要叙述 • 第二节不对称信息博弈 • 第三节概率威胁 • 第四节边缘策略（冒险策略）博弈的操作
பைடு நூலகம்
3
4
5
• 古巴导弹危机（英语：Cuban Missile Crisis），又称加勒比海导弹危机，是 1962年冷战时期在美国、苏联与古巴之间爆发的一场极其严重的政治、军事危机。事件爆发的直接原因是苏联在古巴部署导弹。这个事件被看作是冷战的顶峰和转折点。在世界史中人类从未如此近地站在一场核战争的边缘。
15
16
• 如果一种无条件战争威胁太大了一直让人难以无法接受，并且你不能够发现其他相对小的威胁，你可以通过仅仅创造一种在对方选择对抗时对对方来说十分可怕的结局将发生的概率而不是必然发生的概率在未来的威胁变小一些。
17
18
19
20
21
22
• P<0.27，肯尼迪能接受必然发生的战争威胁； • 如果P位于0.27-0.38之间，则他就不得不使用边缘政策博弈； • 不确定性使得在控制局势和实施边缘政策博弈时需要小心翼翼。
6
• 1962年，加勒比海地区发生了一场震惊世界的古巴导弹危机（Cuba Missile Crisis）。这场危机差一点引发了核战争，使世界处于千钧一发之际。在人类进入核时代以来，在美苏军备竞赛和争夺世界霸权的激烈斗争中，没有任何一次危机达到如此惊心动魄的程度。
7
• 在漫长的冷战岁月中，美国曾四次动过使用核弹的念头。这四次核战边缘，只有古巴导弹危机最具一触即发之势，美苏双方在核弹按钮旁徘徊。古巴导弹危机不仅使研究国际关系的人们感兴趣，而且值得生活在和平时期的人们去回顾和思考。它作为国际关系史的经典事例，为我们以后解决危机冲突提供了良好的借鉴范式。
9
• 10月22日晚上6时，腊斯克把封锁的决定通告了苏联驻美大使。6时15分，西方国家驻华盛顿大使得到了来自美国政府有关封锁的通报。7时和7时30 分，肯尼迪发表电视讲话。肯尼迪指出，古巴建设的导弹基地可以击中西半球的大多数城市，构成了“对所有美洲国家的和平与安全的明显威胁”。苏联在古巴这种“秘密，迅速和不同寻常的集结”是“出于预谋的挑衅性地，不正当地改变现状的行动”，这对美国来说是完全不能接受的。肯尼迪强烈呼吁赫鲁晓夫“停止和取消对世界和平和我们两国稳定关系的这种秘密鲁莽并富有挑衅气味的威胁”，要求苏联放弃世界霸权的计划，结束危险的军备竞赛，从古巴撤走导弹并保持克制。
8
• 猪湾事件(Bay of Pig)后，古美关系继续恶化。美国把古巴看作是苏联在西半球扩张的跳板与基地，变本加厉地推行敌视古巴的政策。美古关系破裂后，特别是1961年5月卡斯特罗宣布古巴走社会主义道路后，苏联加紧改善同古巴的关系，以便在美国的腹背遏制它。苏联从政治，外交和经济上给古巴以支持。1962年7卡斯特罗月初，古巴国防部长劳尔·卡斯特罗访问苏联，受到了热烈的欢迎。美国认为在这次访问中苏古两国在军事方面进行了合作的探询，苏联答应向古巴提供军事援助。
27
• 第一节对于事件的一个简要叙述 • 第二节不对称信息博弈 • 第三节概率威胁 • 第四节边缘策略（冒险策略）博弈的操作
28
• 简要叙述边缘博弈与纯策略纳什均衡的区别和联系？ • 思考一下边缘政策在现实生活中有哪些应用情况？
29