第一讲(博弈论的产生)

合集下载

10博弈论的历史

32
阿克尔洛夫、斯彭斯和斯蒂格利茨的分析理论用途广泛，既适用于对传统的农业市场的分析研究，也适用于对现代金融市场的分析研究。同时，他们的理论还构成了现代信息经济的核心。
33
乔治· 阿克尔洛夫(George A.Akerlof) (1940-) 今年61岁的乔治· 阿克尔洛夫教授出生于美国的康涅狄格州的纽海文。1966年毕业于麻省理工学院，获得博士学位，自1980年到现在，一直在加州大学伯克莱分校任经济学首席教授。
21
詹姆斯· 莫里斯
22
威廉· 维克瑞（WILLIAM VICKREY） (19141996) 威廉· 维克瑞（WILLIAM VICKREY）美国人，由于他在信息经济学、激励理论、博弈论等方面都做出了重大贡献，获得1996 年诺贝尔经济奖。
23
威廉· 维克瑞
24
问题：什么是完美贝叶斯均衡
第十章博弈论的历史和发展
1
本章结构
第一节博弈论的起源和形成第二节博弈论的成长和发展第三节博弈论的进一步发展
2
第一节博弈论的起源和形成
一、博弈论的起源博弈本质是人类的决策选择，是人们相互之间存在互动关系、策略对抗情况下的决策选择。博弈论来自于人们的社会实践，是人类实践经验和古老智慧的结晶和升华发展而来的。
25
3、1980－1990年代
博弈论走向成熟的时期
(1)现代经济活动规模、对抗性和竞争性的要求 (2)信息技术和社会经济信息化的发展 (3)数学和逻辑的方法更加全面而完整的分析决策过程
26
3、1980－1990年代
宏观博弈论微观博弈论金融博弈论等
27
第三节博弈论的进一步发展

运筹学博弈论

i a 2 1 3 a c 1 3 a c c 1 3 a c 9 1 a c 2
产量博弈的古诺模型是一种囚徒困境，无法实现博弈方总体和各个博弈方各自最大利益的结论，对于市场经济组织、管理，对于产业组织和社会经济制度的效率判断，都具有非常重要的意义。说明对市场的管理，政府对市场的调控和监管都是必须的。
纳什均衡(Nash Equilibrium)
通俗地说，纳什均衡的含义就是：
给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。
1. 纯战略Nash均衡
策略空间：每个博弈方的全部可选策略的集合 S1,Sn
博弈方 i的第 j个策略： si j Si 博弈方 i的得益：u i
每个参与人都想猜透对方的战略，而每个参与人又不愿意让对方猜透自己的战略。
这种博弈的类型是什么？如何找到均衡？
请举一些这样的例子：
✓石头、剪子、布游戏 ✓老虎、杠子、鸡、虫子游戏 ✓扑克游戏 ✓橄榄球赛 ✓战争中
大猪先到：大猪吃到9个单位，小猪吃到1个单位；小猪先到：小猪吃到4个单位，大猪吃到6个单位；同时到达：大猪吃到7个单位，小猪吃到3个单位。
局中人：大猪和小猪行动：按按钮吃东西
小猪
按
不按
大
猪
按 (5, 1) (4, 4)
不按 (9, -1) (0, 0)
24
大猪按等待
小猪的上策
寡头产量竞争——以两厂商产量竞争为例 Qq1 q2 PP(Q) aQ
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ a ( q 1 q 2 ) c ]1q
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ a ( q 1 q 2 ) c ]2q

01 第一讲博弈论的基本概念

信息是参与者有关博弈的知识。如在“囚徒困境”中，
甲乙两个小偷彼此都不知道对方的选择，这就是他们所有拥有的信息，信息对博弈的结果有很大的影响。当然，博弈者掌握的信息有时候不一定是真的，但无论真的或是假的，信息对博弈的结局都有影响。例如，两军对垒，双方都有可能制造一些假情报，假情报是一种假的信息，但如果敌方信以为真，胜负的天平可能会倾向自己这边。
第三，博弈涉及到行动者存在着策略选择的可能，博弈论用策略空间来表示参与者可以选择的策略。策略是参与者在给定信息集（即参与者所知道的信息）的情况下的行动规则。赤壁一战，曹兵大败，曹操落荒而逃，在选择是走通往华容道的小路，还是选择大路时，他面临着在两个策略之间进行选择。
在囚徒困境中，小偷面临着“招认”还是“不招认”
得最大利益，经济学和博弈论就认为他会那样做。
§3 博弈涉及的内容
第一，博弈涉及到至少两个独立的博弈参与者。参与者指（或参与人）的是一个博弈中的决策主体。他的目的是通过选择行动（或战略），努力使自己的效用或利益最大化。但是，他的行动的好处（称为“支付”）取决于另外的参与者。参与者可能是自然人，也可能是团体，如企业、部门、国家，等等。这里，重要的是，每个参与者必须有可供选择的行动和一个很好定义的偏好函数——他喜欢什么和不喜欢什么。例如，下围棋时参与者是对弈的两个人——两人博弈，高考填报志愿时的参与者是填报志愿的人——多人博弈。
你和这群人构成一个博弈。生活中博弈的案例很多，你会见到很多例子，只要涉及到人群的互动就有博弈。
§2 博弈论的基本假定
博弈论对人的基本假定是：人是理性的——
这也是经济学最基本的假设。
Байду номын сангаас
所谓理性的人，是指他在具体策略选择时的

第一章博弈论概述PPT课件

博弈论与信息经济学
Game Theory and Information Economics 天津大学管理与经济学部
授课：XXX
1
第一章博弈论概述（Game Theory）
授课：XXX
2
一、博弈论的定义
又称对策论，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。
➢ 博弈分析的基本假设（1）个人理性假设当事人在决策时能够充分考虑他所面临的局势，并能做出合乎理性的选择。
（2）最大化自己的收益假设当事人在决策时通常选择使自己收益最
大化的策略。
授课：XXX
12
坦白抵赖
➢ 博弈问题的基本要素
坦白
（1）局中人（Players）
抵赖
参与对抗的各方；不一定指自然人
若二人均不坦白，则只能因藏有枪支而被判刑1年；若有一人坦白而另一个不坦白，则坦白者无罪释放，
不坦白者被判刑10年；若二人都坦白了，则同判8年。此二人确系抢劫犯，请分析他们的抉择。
Ⅱ
坦白
Ⅰ
抵赖
坦白 -8，-8 -10，0
抵赖 0，-10 -1，-1
授课：XXX
均衡解：二人均坦白
11
相关概念介绍
他的故事被好莱坞拍成了电影《美丽心灵》，该影片获得了2002年奥斯卡金像奖的四项大奖
授课：XXX
7
2002年北京国际数学家大会（ICM）
授课：XXX
8
• 主演
罗素·克劳，Russell Crowe
詹妮弗·康纳利, Jennifer Connelly
授课：XXX
9
1. 囚犯困境（Prisoners’ dilemma

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

0 博弈论导言

0 序言0.1 博弈论的产生博弈论（game theory)又称对策论，是由美国数学家冯·诺依曼(Von. Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科，是一种处理竞争与合作问题的数学决策方法。

它既是现代数学的一个新分支，也是运筹学的一个重要学科。

目前在经济学、国际关系学、计算机科学、政治学、生物学、军事战略和其他很多学科都有广泛的应用。

0.2 博弈论的发展0.2.1博弈理论的早期研究一般认为，对于博弈理论的最早研究可以追溯到18世纪初。

瓦德格拉夫（Waldegrave）在1713年提出了两人博弈的极小化极大混合策略解。

古诺（Cournot）和伯特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型，两位学者分别从产量决策和价格决策分析垄断的双寡头竞争模型，确定了在竞争之下各自的最优反映函数。

这些都是关于博弈问题的早期的零星研究。

0.2.2博弈论发展的不同阶段（1）一般认为博弈论萌芽于20世纪初。

1913年齐默罗(Zermelo)提出的“逆推归纳法”(Backward Induction Procedure)是博弈论的第一种有着一般意义的分析方法。

博弈论创立的标志是冯·诺伊曼和摩根斯坦在1944年的《博弈论与经济行为》这部著作。

在该著作中，引进了博弈论的扩展形(Extensive Form)和策略形(Strategy)表示方式，提出了创建博弈论的基本概念术语，并对合作博弈进行了研究。

（2）20世纪的40年代末到50年代初，是博弈论的发展史上一个重要阶段。

越来越多的学者进行了博弈理论的研究。

1950年，纳什（John Nash）在他的博士论文《非合作博弈》中，将博弈论扩展到了非零和博弈，最终形成了非合作博弈理论的思想源泉，纳什均衡概念的提出以及纳什均衡存在性的纳什定理的证明，发展了以纳什均衡概念为核心的非合作博弈理论。

博弈论课件

博弈论强调参与者之间的互动关系，通过数学模型和理论分析来研究策略选择和均衡结果。
博弈论的发展历程
博弈论的起源可以追溯到20世纪初，当时数学家和经济学家开始研究游戏中的策略和均衡。
1944年，冯·诺依曼和摩根斯坦合著的《博弈论与经济行为》标志着博弈论的诞生。
随后，纳什、泽尔腾和哈萨尼等学者进一步发展了博弈论，形成了现代博弈论的基础。
商业竞争与合作
商业竞争
博弈论可以用于分析商业竞争中的策略和行为，例如价格战、广告战等。通过博弈论，企业可以更好地理解竞争对手的策略，制定出更有效的竞争策略。
商业合作
博弈论也可以用于分析商业合作中的策略和行为，例如供应链管理、合资企业等。通过博弈论，企业可以更好地理解合作伙伴的需求和期望，制定出更有效的合作策略。
贝叶斯纳什均衡
在不完全信息博弈中，如果所有参与者都根据自己掌握的信息选择最优策略，则所有参与者都能获得最大收益。
静态博弈与动态博弈
01
静态博弈
02
动态博弈
所有参与者在同一时间点选择策略并获得收益。
参与者的选择有先后顺序，后选择的参与者可以观察到先选择的参与者的策略和收益。
03
纳什均衡
纳什均衡的定义
博弈优化方法
线性规划
线性规划是一种数学优化方法，用于找到在满足一组约束条件下最大化或最小化目标函数的最优
解。
非线性规划
非线性规划是数学优化的一种方法，用于找到一组变量的最优值，使得一个或多个目标函数达到
最优。
动态规划
动态规划是一种通过将问题分解为相互重叠的子问题来解决问题的方法，每个子问题的解被保存
博弈论课件
汇报人：
汇报时间：202X-01-04

简述博弈论产生与发展过程

博弈论的发展历程一、博弈论起源博弈论（Game Theory）起源于上世纪初的数学领域，最初是作为数学的一个分支被研究的。

它主要研究在策略性决策场景中，参与者的最优行为及其相互影响。

这一理论的诞生，可以追溯到1913年，Borel在一般集合论的基础上定义了对策论的基本概念。

二、经典博弈理论在博弈论的发展历程中，经典博弈理论在上世纪中叶占据主导地位。

这一阶段的主要代表人物包括John von Neumann和Oskar Morgenstern。

他们于1944年合作发表了《博弈论与经济行为》一书，提出了著名的“冯·诺依曼-摩根斯坦博弈模型”，为现代博弈论的发展奠定了基础。

三、非合作博弈理论非合作博弈理论（Non-cooperative Game Theory）是上世纪50年代后期发展起来的，代表人物包括Gerard Debreu和John Harsanyi。

他们提出了非合作博弈的纳什均衡概念，成为现代博弈论中的重要基石。

非合作博弈理论主要研究在信息不完全或不确定的情况下，参与者如何选择自己的最优策略。

四、合作博弈理论与非合作博弈理论相对，合作博弈理论强调参与者之间的合作可能性和最优策略的均衡。

这一理论在上世纪60年代逐渐发展起来，代表人物包括R.B. Myerson和Roger Wollenstein。

合作博弈理论主要研究如何通过合作实现各方的利益最大化，以及如何分配这些利益。

五、演化博弈理论演化博弈理论（Evolutionary Game Theory）是在上世纪70年代发展起来的，其代表人物包括John Maynard Smith和George R. Price。

这一理论从生物进化论的角度出发，研究参与者如何通过学习和适应环境，实现最优策略的选择。

演化博弈理论在经济学、生物学和心理学等领域得到了广泛应用。

六、动态博弈理论动态博弈理论（Dynamic Game Theory）是在上世纪80年代开始发展的，其代表人物包括Arrow Kenneth J.和Leslie Richard Stallings。

《博弈论初步》课件

THANKS
感谢观看
02
纳什均衡是一种非合作博弈均衡，其中每个参与者都认为当前策略是最好的，不会受到其他参与者的欺骗或影响。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的策略，逐步逼近纳什均衡。这种方法适用于较简单的博弈模型，但对于复杂的博弈模型可能收敛速度较慢。
线性规划法
将纳什均衡问题转化为线性规划问题，通过求解线性规划来找到纳什均衡。这种方法适用于具有线性特征的博弈模型，但计算复杂度较高。
价格战与非价格战
博弈论分析了价格战和非价格战的利弊，为企业制定营销策略提供博弈论可以用来分析选民的投票行为和政治立场，预测选举结果。
02
候选人策略
博弈论为候选人提供了制定最优竞选策略的方法，帮助他们在选举中获
胜。
03
政治联盟与利益交换
博弈论中的合作博弈理论可以用来分析政治联盟的形成和利益交换机制
特征值法
利用特征值和特征向量的性质来求解纳什均衡。这种方法适用于具有矩阵特征的博弈模型，但需要一定的数学基础。
纳什均衡的应用实例
1 2
价格竞争
在寡头市场中，企业之间通过价格策略进行竞争，最终形成价格均衡，即纳什均衡。
劳资谈判
劳资双方在谈判中会提出自己的工资要求，最终达成工资协议，这也是一种纳什均衡。
博弈类型
合作博弈
定义
01
参与者通过合作达成共赢的博弈。
特点
02
存在合作协议，强调集体行动和收益分配。
应用场景
03
国际关系、商业合作、团队协作等。
非合作博弈
定义
应用场景
参与者追求各自利益最大化的博弈。
市场竞争、个人决策、资源分配等。

第六章博弈论

一般认为，1944年美国数学家冯•诺依曼(John Von Neumann)和经济学家奥斯卡•摩根斯坦 (Oskar Morgenstern)合著的《博弈论与经济行为》(The Game Theory and Economic Behavior) 一书的出版，标志着系统的博弈理论的形成。
❖该书详尽地讨论了二人零和博弈，并对合作博弈作了深入探讨，开辟了一些新的研究领域。更重要的是将博弈论加以空前广泛的应用，尤其是在经济学上，由于博弈论数学上的严整性与经济学应用上的广泛性，一些经济学家将该巨著的出版视为数理经济学确立的里程碑。
“保证最低价格”策略
❖ “保证最低价格”条款。
❖ 该条款一般规定：“顾客在本商店购买这种商品一段时间内，如果发现其他任何商店以更低的价格出售同样的商品，本店将退还差价，并补偿差额的10％。”
❖ 一、单项选择题：
❖ 分析下列的报酬矩阵，回答问题：
John的开业长时间咖啡馆开业短时间
✓ 第一，不能让对方事先知道自己可能采取的策略。
✓ 第二，必须采取随机选择的原则。 ✓ 第三，选择策略的概率一定要使对
方无机可乘。
动态博弈
➢重复博弈 ➢序列博弈
重复博弈
❖ 对重复博奕的研究结果证明有一种最好的策略：只需将一个原则贯穿始终，即“以牙还牙”（Tit-for-tat）。
❖ 以牙还牙策略的获胜有一个十分重要的条件，即博弈是无限次重复的。
❖王则柯：《新编博弈论平话》中信出版社 ❖ 王则柯主编：《21世纪经济学教材：博弈论
教程》中国人民大学出版社
❖ 《美丽心灵》（A Beautiful Mind ）是一部关于一个真实天才的极富人性的剧情片。故事的原型是数学家小约翰-福布斯-纳什(Jr.John Forbes Nash)。英俊而又十分古怪的纳什早年就作出了惊人的数学发现，开始享有国际声誉。但纳什出众的直觉受到了精神分裂症的困扰，使他向学术上最高层次进军的辉煌历程发生了巨大改变。面对这个曾经击毁了许多人的挑战，纳什在深爱着的妻子艾丽西亚(Alicia)的相助下，毫不畏惧，顽强抗争。经过了几十年的艰难努力，他终于战胜了这个不幸，并于1994年获得诺贝尔奖。这是一个真人真事的传奇故事，今天纳什继续在他的领域中耕耘着。

《博弈论的基本概念》课件

智猪博弈
• 总结词：描述大猪和小猪在食槽附近争夺食物的策略博弈。
• 详细描述：在智猪博弈中，一个大猪和一个小猪共同生活在一个猪圈里，食槽位于猪圈的一端。每次食物被放入食槽时，大猪和小猪都有两种选择：冲向食槽或继续等待。如果大猪选择冲向食槽，小猪的最佳策略是等待，因为大猪吃掉大部分食物后，小猪可以享用剩余的食物。相反，如果小猪选择冲向食槽，大猪的最佳策略也是等待，因为小猪可能无法抢到任何食物。因此，无论大猪如何选择，小猪的最佳策略都是等待；同样地，无论小猪如何选择，大猪的最佳策略也是等待。
合作博弈
特征
强调合作、协议和联盟，目标是实现共同利益。
应用领域
国际关系、商业合作、团队协作等。
非合作博弈
特征
强调竞争、自利和策略互动，目标是实现个人利益。
应用领域
市场竞争、个人决策、政治选举等。
动态博弈
特征
强调行动的顺序和信息传递，策略和行动需考虑时间因素。
应用领域
商业竞争、投资决策、谈判策略等。
《博弈论的基本概念》ppt课件
目录
• 博弈论简介 • 博弈论的基本类型 • 博弈论的基本概念 • 博弈论的经典案例 • 博弈论的未来发展
01
博弈论简介
博弈论的定义
01
博弈论：研究决策主体在相互影响、相互作用的环境中如何进行决策，以及这种决策的均衡结果的学科。
02
博弈论强调参与者之间的互动关系，通过数学模型和理论分析来研究策略选择和均衡结果。
应用领域：拍卖机制设计、保险市场分析、医疗资源分配等。

03
博弈论的基本概念
参与者
01
02
03
参与者
在博弈中，参与者是决策的主体，可以是个人或组织。

博弈论第一讲

A static (or simultaneous-move) game consists of:
A set of players (at least
two players) For each player, a set of strategies/actions Payoffs received by each player for the combinations of the strategies, or for each player, preferences over the combinations of the strategies

Static (or simultaneous-move) games of
complete information Normal-form or strategic-form representation
Fall, 2007, Fudan University Game Theory--Lecture 1 4
At the separate workplaces, Chris and Pat must choose to
attend either an opera or a prize fight in the evening. Both Chris and Pat know the following:

Fall, 2007, Fudan University Game Theory--Lecture 1 12
Sபைடு நூலகம்atic (or simultaneous-move) games of complete information
The players cooperate?

博弈论最全完整-讲解课件

• 王则柯、李杰编著，《博弈论教程》，中国人民大学出版社，2004年版。
• 艾里克.拉斯缪森（Eric Rasmusen）著，《博弈与信息：博弈论概论》，北京大学出版社，2003年版。
• 因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著，《信息经济学引论：激励与合约》,上海财经大学出版社，2004年版。
学习交流PPT
17
约翰· 海萨尼 1920年生于美国
约翰·纳什 1928年生于美国
莱因哈德·泽尔腾， 1930 年生于德国
学习交流PPT
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞(William Vickrey)
托马斯·谢林
学习交流PPT
24
导论
三、博弈论的基本类型
学习交流PPT
25
合作博弈与非合作博弈
• 合作博弈（cooperative game）达成有约束力的协议（binding
agreement），强调团体理性，强调效率、公正、公平 • 非合作博弈（non-cooperative game）
强调个人理性，其结果可能有效率，也可能无效率。
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由：在“对充满不对称信息市场进行分析”领域做出了重要贡献。
学习交流PPT
21
迈克尔·斯彭斯 1948年生于美国的新泽西，1972年获美国哈佛大学博士头衔，现兼任美国哈佛和斯坦福两所
• 也就是说，需要的是对这样的情况下该选什么的预期的收敛。这一使得参与者能够成功合作的共同预期的策略被称为焦点。心有灵犀一点通。

博弈论课件

扩展一：不完全信息博弈
不完全信息博弈的定义
01
在博弈中，参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度，可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略，研究候选人如何制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调，分析政策制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作，分析国家如何通过外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡。
特点
纳什均衡是一种稳定的状态，任何参与者单方面改变自己的策略都不会获得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略，该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略，该策略都能为参与者带来更低的收益。
特点
在优势策略下，参与者没有理由改变自己的策略；在劣势策略下，参与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降，还可能引发市场恶性竞争，破坏市场秩序。此外，价格战还可能导致产品质量下降，损害消费者利益。
案例二：国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中，各国之间往往存在着复杂的博弈关系。为了维护自身利益，各国会采取不同的博弈策略，如通过外交手段、经济制裁、军事威胁等方式来达到自己的目的。

博弈论第一章导论

甲盖住一枚硬币让乙猜，乙猜对了得一元，猜错了输一元。
乙
甲正面反面
正面－1，1 1，－1
反面 1，－1 －1，1
没有均衡结果
六安市长安小学
H
23
启示：
“知己知彼，百战不殆”
六安市长安小学
H
24
例2 囚徒困境
假设有两个小偷张三和李四被警察抓起来了，分别关在两间牢房内，每个人都有两个策略：坦白或抗拒。
权；警察与游行示威群众。
六安市长安小学
H
32
启示：
“退一步海阔天空”
六安市长安小学
H
33
例6：市场进入壁垒
市场上已有一个垄断企业（称为在位者），另一个企业（称为进入者）想进入该市场。
在位者
默许
斗争
进入者进入 40 ， 50 -10 ， 0 不进入 0 ， 300 0 ，300
这个博弈也有两个纳什均衡，一个是（进入，默
在非合作博弈的均衡分析理论方面做出了开创
性的贡献，对博弈论和经济学产生了重大影响。
六安市长安小学
H
18
莱因哈德·塞尔腾，1930年生于德国 1994年Nobel 经济学奖得主
在非合作博弈的均衡分析理论方面做出了开创
性的贡献，对博弈论和经济学产生了重大影响。
六安市长安小学
H
19
1.2 博弈论的定义
经济活动的水平、量值等。
六安市长安小学
H
21
3、进行博弈的次序（Orders）。
次序不同一般就是不同的博弈，即使博弈的其他
方面都相同。
4、博弈方的得益（Payoffs）。
即各博弈方从博弈中所获得利益称为得益。确定了上述四个方面就确定了一个博弈。

博弈论第一讲导论

博弈的四个基本要素
▲ 博弈的参加者(Player)——博弈方
独立决策、独立承担后果的个人或组织
▲ 各博弈方的策略(Strategies)或行为(Actions)
策略可以是定性的，也可以是量值化的
▲ 博弈的次序(Order)
选择是同时做出，还是有先后之分
▲ 博弈方的得益(Payoffs)
对应于每一组策略组合下的得失，得益客观存在，但博弈方并不一定都了解。
两人博弈——有两个博弈方的博弈
▲两人博弈有多种可能性，博弈方的利益方向可能一致，也可以不一致
▲在两人博弈中，掌握信息较多并不能保证得益也一定多
▲个人追求最大自身利益的行为，常常不能导致实现社会的最大利益
多人博弈——有三个或三个以上博弈方
可能存在“拆台者”：其策略选择对自身的利益并没有影响，但却会对其他博弈方的利益产生很大的，有时甚至是决定性的影响。
1，-1 3，-3 -1，1 1，-1， 1，-1 1，-1
1，-1 1，-1 3，-3 1，-1 1，-1 -1，1
1，-1 1，-1 1，-1 3，-3 -1，1 1，-1
-1，1 1，-1 1，-1 1，-1 3，-3 1，-1
1，-1 -1，1 1，-1 1，-1 1，-1 3，-3
得益矩阵
得益：各博弈方从博弈中所获得的利益
▲得益对应博弈的结果，也就是各博弈方策略的组合
▲得益是各博弈方追求的根本目标及行为和判断的主要依据
▲根据得益的博弈分类：零和博弈、常和博弈、变和博弈
▲零和博弈：也称“严格竞争博弈”，博弈方之间利益始终对立，偏好通常不同。
——猜硬币，田忌赛马，石头-剪刀-布
选择行策略的一方的得益

第一讲博弈论简介

博弈的分类和均衡
行动次序
信息
静态
动态子博弈精练纳什均衡泽尔腾精炼贝叶斯均衡泽尔腾等
完全信息
纳什均衡纳什贝叶斯均衡海萨尼
不完全信息
五、博弈的组成要素一个博弈一般由以下几个要素组成，包括：参与人、行动、信息、策略、得益、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)； 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策； 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排； 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识； 5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西； 6、均衡是所有参与人的最优策略或行动的组合；均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合，如在各参与人的均衡策略作用下，各参与人最终的行动或效用集合。
三、博弈论的理论体系在博弈论中，基本的出发点是理性经济人的假设，体现为数学模型也就是效用最大化的模型，或者在存在风险或不确定性的形式中，则为期望效用最大化模型。在此基础假设之上，博弈局势中每个决策主体都选择能使自己的期望效用最大的策略。由于利益之间存在相互关联，因此策略选择上也存在相互关联，每个人的最佳策略选择都要考虑到其他人的策略选择行为，而博弈论研究的就是这种策略之间的相互影响。
博弈论简介
第一讲、博弈论基本知识
一、博弈论的研究对象博弈论研究的是人与人之间利益相互制约下策略选择时的理性行为及相应结局。所谓相互制约，通常是指博弈中的任何一个局中人受到其它局中人行为的影响。反过来，它的行为也影响到其他局中人，由于这种相互依存性，游戏或博弈的结果依赖于每一个局中人的决策，没有一个人能完全控制所要发生的事情，也没有一个局中人处于孤独的状态。

第一讲(博弈论的产生)

– 指定案例分析 (30%) – 论文 (70%)
什么是博弈论？
• 博弈论, 英文称为Game Theory，它与 Game有什么联系呢？它是否与赌博和弈棋有关系呢？ • 尼姆游戏(Nim)：
– 用三枚硬币摆成两行，第一行一枚硬币，第二行两枚硬币，两位选手参与游戏，轮流取走硬币。选手可以从任意一行拿走任意数量的硬币，不允许在两行中挑选硬币，选手必须拿走至少一枚硬币。
• 游戏规则：
– 猪圈里有两头猪，一头大猪，一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。
什么是博弈论？
• 博弈论是研究人们如何进行决策，以及这种决策如何达到均衡的科学。 • 博弈论以新古典经济学完全理性的假设为基础。其原因是：
– 完全理性的行为比非理性的行为更加容易预测。 – 为经济系统中的效率评价提供了标准。
• 理性人的目的是使收益最大化。参与者以争夺得的收益多少来决定胜负。
• 简而言之，博弈论是研究战略的理论。
“战略”的适用范围
• 很多事物都会考虑到战略，因此“博弈论”适用范围非常广。
– 经济学、政治学、哲学、法学、商业以及社会问题和国际关系的分析。甚至也被应用于生物学。 – 博弈论虽源于数学，但本课程避开运用微积分等数学方法，利用非技术性手段向学生们介绍博弈论，并使之掌握博弈论的相关知识用以分析理解人类行为。
“智猪博弈”原版
小猪踩踏板不踩大猪踩踏板 -1，9 5, 4 -1, 10 0，0 不踩

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

“战略”的适用范围
• 很多事物都会考虑到战略，因此“博弈论”适用范围非常广。
– 经济学、政治学、哲学、法学、商业以及社会问题和国际关系的分析。甚至也被应用于生物学。 – 博弈论虽源于数学，但本课程避开运用微积分等数学方法，利用非技术性手段向学生们介绍博弈论，并使之掌握博弈论的相关知识用以分析理解人类行为。
蓝鸟
进入不进入
B 认罪抵赖 A 认罪 –8, –8 0, –10 抵赖 –10, 0 –1, –1
• 节点2表示小偷B掌握的（不完全）信息，该节点被称之为信息集(information set)。 Ø 当一方在不知情地情况下进行决策，或者对方同时决策，就将该参与者多有可能的选择都列在从一个节点出发的分支中，表示信息的不完全。 • 当信息比较充分时，通常采用扩展时。而对于缺乏信息的博弈，标准式可能更为合适和方便。
约翰
追求金发女郎追求其他女士
哈雷德追求金发女郎
追求其他女士
0,0 1,2
2,1 1,1
• 那么，两只猪各会采取什么策略？ • 答案是：小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
2 PDF 文件使用 "pdfFactory Pro" 试用版本创建
什么是博弈论？
• 博弈论是研究人们如何进行决策，以及这种决策如何达到均衡的科学。 • 博弈论以新古典经济学完全理性的假设为基础。其原因是：
– 完全理性的行为比非理性的行为更加容易预测。 – 为经济系统中的效率评价提供了标准。
• 理性人的目的是使收益最大化。参与者以争夺得的收益多少来决定胜负。
• 简而言之，博弈论是研究战略的理论。
4 PDF 文件使用 "pdfFactory Pro" 试用版本创建
收益矩阵的推导
• 收益矩阵能够简单明确的表现出博弈中各方的可选战略和其相应的收益情况的具体信息。
– E.g.成绩博弈 (Grade game) – 在座的每位同学将会被随机的与另一位同学组成一组。你们不知道会与谁分到一组。当我叫到名字的时候请在α和β中任选一个报给我。 – 分数设定规则如下：如果你选α，而你的组员选β，你的分数为A，组员分数为C；如果都选α，则分数都为B-；如果你选β，而你的组员选α，你的分数为C，而你的组员为A；如果都选β，则分数都为B+。
你 α β
组员 α Β 你 0，组员0 你3，组员-1 你-1，组员3 你2，组员2
金发女郎的双人博弈及其收益矩阵：
• 有两个或两个以上的男士。 • 有多个魅力十足的女士，且女士至少比男士多一人。 • 只有一个金发女郎。 • 相对于其他女士，男士们更喜欢金发女郎，不过有女伴总比没人陪伴要好。
“智猪博弈”（Pigs’ payoffs）
• 那么，“博弈论”中有哪些非技术性的方法可以用来分析战略呢？
– 可以用来描述两个或多个参与人的决策和效用的工具有：
• 标准式，表现为收益矩阵(payoff table) 。 • 扩展式，表现为决策树。
1 PDF 文件使用 "pdfFactory Pro" 试用版本创建
“智猪博弈”
• 小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。 • 大猪明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。 • “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是：每次落下的事物数量和踏板与投食口之间的距离。 • 如果改变一下核心指标，猪圈里还会出现同样的 “小猪躺着大猪跑”的景象吗？试试看。
课程基本信息
• • • • 课程名称：《博弈论》上课时间：周一（18:15 – 19:45）教室：教学楼B607 任课教师：汪琪（经济贸易管理学院）
– 联系方式：peggywq@ – Office hour：16:00-17:00 Mon.
第一讲博弈论现实生活中，人们在做决策时往往是有限理性的，因为人不可能搜集到所需的全部信息。
– 搜集信息需要成本，即大量的时间、精力和财力。人的精力和时间永远是有限的。 – 即使能够搜集到所有信息而做出收益最优的决策行为，这本身反而是最不理性的行为。
• Cost efficiency
• 如果根据理性行为的假设，人们在为自己谋求利益最大的时候就应该要精打细算。那么太精明是否就等于高明呢？
改变方案二
小猪踩踏板不踩大猪踩踏板 4, 4 4, 5 不踩 5，4 0, 0
改变方案三
小猪踩踏板不踩大猪踩踏板 -1, 9 9, 0 不踩 0, 9 0, 0
尼姆游戏的决策树
一个商业案例 – 金雀与蓝鸟
• 金雀是城里唯一的一家电信公司，蓝鸟试图进入这个市的电信市场。如果蓝年进入，金雀有两个选择：一是降价展开价格战；二是让蓝鸟进入并与之共享市场，并消减产量，保持价格不变。 • 蓝年的进入是一个不确定时间(contingency)。
收益矩阵的推导
• 上述信息可以汇总成以下的收益矩阵：组员 α β 你A，组员C 你 α 你B-，组员Bβ 你C，组员A 你B+，组员B+
如果考虑参与者都是理性人（分数等级越高越能带来更多的效用和满足），你的选择会是怎样的？
博弈的构成要素
• 一个博弈必须包含的四个要素：
– 2个或2个以上的参与者(player)。
博弈的“收益”要素
• 如果参与者的目的是使得对方成绩最高（当组员成绩提高，你会感到更加愉快）那么上述收益矩阵应该如何变化，你的选择会是怎样的？组员 α Β 你 α 你 0，组员0 你-1，组员3 β 你3，组员-1 你2，组员2
需要注意的是，就算同学们都是以提高对方成绩为目的的热心人，但是使自己收益最大的理性人假设仍旧是博弈中人们行为的准则。
“智猪博弈”原版
小猪踩踏板不踩大猪踩踏板 -1，9 5, 4 -1, 10 0，0 不踩
改变方案一
小猪踩踏板不踩 10，-1 大猪踩踏板 -1, 9 -1, 10 0, 0 不踩
“智猪博弈”
• 方案一的结果是小猪大猪都不去踩踏板了。小猪去踩，大猪将会把食物吃完；大猪去踩，小猪将也会把食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板的动力了。 • 方案二的结果是小猪、大猪都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的 “共产主义”社会，所以竞争意识却不会很强。 • 方案三的结果是小猪和大猪都在拼命地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好消费完。
“智猪博弈”
• 改变方案一：减量方案。投食仅原来的一半分量。 • 改变方案二：增量方案。投食为原来的一倍分量。 • 改变方案三：减量加移位方案。投食仅原来的一半分量，但同时将投食口移到踏板附近。 • 哪种改变方案好呢？ • 该博弈案例对我们有什么启发呢？ • 尝试画出不同方案的收益矩阵。
– 假设吃光所有的食物的收益为10，而争吃到一半的收益为5；去踩踏板要花力气因而减少1收益。
• 游戏规则：
– 猪圈里有两头猪，一头大猪，一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。
• 博弈是参与者在一定的环境条件下与既定的规则下，同时或先后，一次或者是多次选择策略并实施，从而得到某种结果的过程。
博弈的“收益”要素
• 在博弈中，每个参与者都有自己的收益或是目的。有时目的相同（e.g.获得更多的资源），有时却可能不同。 • 改变一下成绩博弈：
– 用数字代替成绩等级（A：3, B+：2，B：1，B-：0，C：-1） – 你以自己的利益最大为目的，你的选择是否会变化？
• 决策树的每一树枝节点代表了一种战略选择。
3 PDF 文件使用 "pdfFactory Pro" 试用版本创建
• 相机战略(contingent strategy)是在不确定事件发生时才会采取的战略。 • 也就是“如果-----就----”式的规则。 • 标准式中的战略一般都是相机战略。金雀与蓝鸟的收益矩阵：
– 案例：旅行者困境
旅行者困境
• 两个旅行者从一个出产细瓷花瓶的地方回来，都买了花瓶。可是在机场提行李的时候发现两人的花瓶都碎了。于是，他们向航空公司索赔。航空公司估计花瓶的价值在10000元以内，但不知道具体价格，于是让两个旅行者分别填写价格，如果价格一样，如数赔偿。如果写的不一样，就认为写得低的人说了真话，按地价格赔偿，并奖励说真话的人200元，而对说假话的人则罚款200元。 • 这两个旅行者会写多少钱呢？
• 具有主观能动性的参与者，其选择和决策与其他参与者相遇作用，相互影响。
– 博弈要有参与与各方争夺的资源或收益(the payoff)。
• 人们参与博弈是受到利益的影响和吸引。
– 参与者有自己能够选择的决策(strategy)。
• 战略是直接地针对某一个具体问题所采取的应对方式。
– 参与者拥有一定量地信息(information)。
金雀如果蓝鸟进入，就接受 3,5 0,10 如果蓝鸟进入，就展开价格战 -5,2 0,10
囚徒困境博弈(prisoners’ dilemma)
• 假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果一个犯罪嫌疑人坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白，则两人各被判刑8年；如果另一个犯罪嫌人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。 • 克格勃们的小花招。

第一讲(博弈论的产生)

10博弈论的历史

运筹学博弈论

01 第一讲 博弈论的基本概念

第一章 博弈论概述PPT课件

博弈论完整版PPT课件

0 博弈论导言

博弈论课件

简述博弈论产生与发展过程

《博弈论初步》课件

第六章博弈论

《博弈论的基本概念》课件

博弈论第一讲

博弈论最全完整-讲解课件

博弈论课件

博弈论第一章 导论

博弈论第一讲导论

第一讲博弈论简介

第一讲(博弈论的产生)

01 第一讲博弈论的基本概念

第一章博弈论概述PPT课件

博弈论第一章导论