运筹学博弈论 PPT

合集下载

《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u}，其中N=（1,2)， Si={(0,2),(1,1),(2,0)}，ui (s1, s2) = ri，i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败，成功
成功，失败
成功，失败
失败，成功
成功，失败
成功，失败
《博弈论》课程
（一）什么是博弈论
我们首先看几个例子。例1 石头、剪刀、布
猪八戒
石头石头孙悟空剪刀布未定，未定找水，休息休息，找水剪刀休息，找水未定，未定找水，休息布找水，休息休息，找水未定，未定
2
例2 诺曼底登陆
德军
加来设防加来登陆盟军
诺曼底登陆成功，失败
诺曼பைடு நூலகம்设防成功，失败
9
例4 进攻与防守双方争夺一个据点，有两条进攻路线X和Y，攻方有两个军，而防守方也有两个军，只有当守方的兵力不少于攻方时，才能击退进攻，否则据点将会失守。首先可知守方的防守方案（即策略）为(0,2)，(1,1)，(2,0)，即在X 线路和Y线路驻扎军队数，同样可以到的攻方的进攻方案(0,2)，(1,1)和(2,0)。容易看出，行动并非策略，策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心，因而博弈论对于各门社会科学而言，就具有了方法论意义，成为各门学科的有力分析工具。
6
（二）博弈表达的科学式
（1）博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然是很重要的。如果用参与者、策略和收益函数来科学地描述一个博弈，就称为博弈表达的策略式（或基本式、标准式）。

博弈论完整版PPT课件

ac 3
纳什均衡利润为：
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
国外经济学教科书改写，加入大量博弈论内容
博弈论进入主流经济学，反映了：
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学)，而
博弈论是一种新的数学。以前只有陆军，现在有了空军，其差异
不完全信息
静态
纳什均衡
（纳什）
贝叶斯纳什均衡
（海萨尼）
.
动态
子博弈精练纳什均衡
（泽尔腾）
精练叶贝斯纳什均衡
（泽尔腾等）
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈多人博弈
静态博弈动态博弈
合作博弈非合作博弈
零和博弈常和博弈变和博弈
根据参与人对其他参与人的
4-阶理性：C相信R相信C相信R相信C是理性的，C会将R1从R的战略空间中剔除, C不会选择C3；
5-阶理性：R相信C相信R相信C相信R相信C是理性的，R会将C3从C的战

《管理运筹学》12-管理博弈.pptx

一、博弈的基本要素
例12-4 田忌赛马
解建立博弈模型，局中人分别是齐王和田忌，每个局中人的策略是各个等级的马参赛的次序，他们都各有6个策略：（上，中，下），（上，下，中），（中，上，下），（中，下，上），（下，上，中），（下，中，上）。表 12-3给出了双方的赢得矩阵（第一个数字是齐王的赢得，第二个数字是田忌的赢得）。
一、博弈的基本要素
例12-3 囚徒困境
解 A和B为两个局中人，每个局中人都有两个策略：坦白或不坦白。按照各局中人的策略组合，共有四个局势： {坦白，坦白}，{坦白，不坦白}，{不坦白，坦白}，{不坦白，不坦白}。两个局中人的赢得函数可以用表12-2所示的一个双变量矩阵来表示。
表12-2 囚徒困境的赢得表
嫌疑犯A的策略坦白
不坦白
嫌疑犯B的策略
坦白
不坦白
-5，-5
0，-10
-10，0
-1，-1
一、博弈的基本要素
例12-4 田忌赛马
战国时期，齐威王常邀武臣田忌赛马赌金，双方约定共赛三局，每方分别出上、中、下三个等级的马一匹各赛一局，每局赌注千金。在同一等级马中，田忌的马都稍逊一筹，不如齐王的马，但田忌的上等马优于齐王的中等马，田忌的中等马优于齐王的下等马。试建立该问题的博弈模型。
一、博弈的基本要素
例12-4 田忌赛马
表12-3 田忌赛马博弈的赢得矩阵
齐王的策
田忌的策略
略（上中下）（上下中）（中上下）（中下上）（下上中）（下中上）
（上中下） 3，-3
1，-1
1，-1
1，-1
-1，1
1，-1
Байду номын сангаас
（上下中） 1，-1

第九章运筹学博弈论 ppt课件

则。
1988年法国人莫里斯-阿莱斯(Maurice Allais)
获奖理由：在市场理论及资源有效利用方面做出了
开创性贡献，并对一般均衡理论重新做了系统阐述。
1987年美国人罗伯特-索洛(Robert M. Solow)
获奖理由：对增长理论做出贡献。提出长期的经济
增长主要依靠技术进步，而不是依靠资本和劳动力的
获奖理由：对不同汇率体制下的货币和财政政策以及最
优货币区域的分析做出了伟大贡ppt献课件。
8
1998年印度籍经济学家阿马蒂亚-森(Amartya Sen) 获奖理由：对福利经济学以及发展经济学做出了突破
性贡献。 1997年美国经济学家迈伦-斯科尔斯(Myron S.
Scholes)和罗伯特-默顿(Robert C. Merton) 获奖理由：前者给出了著名的布莱克-斯科尔斯期权
获奖理由：在动态宏观经济学方面做出了
巨大贡献。 2003年美国经济学家罗伯特-恩格尔
(Robert F. Engle III)和英国经济学家克莱夫格兰杰(Clive W.J. Granger)
获奖理由：在经济时间数列中运用了统计
学的方法。
ppt课件
7
2002年美国学者丹尼尔-卡尼曼(Daniel Kahneman)和弗农-
ppt课件
4
在国外,1912年E.Zermelo用集合论研究过下棋问题,四十年代由于生产和战争的需要,博弈理论得到了发展,系统博弈理论的形成则以1944 年V.Neumann,O.Morgensten合著的《博弈论和经济行为》一书为标志.1994年瑞士皇家科学院决定将诺贝尔经济学奖授予纳什(Nash),哈萨尼(Harsanyi)和泽尔腾(Selten)三人,表彰他们在博弈理论和应用研究方面作出的杰出贡献. 目前,博弈论在定价,招投标,拍卖,委托代理以及很多重要的经营决策中得到应用,它已成为现代经济学的重要基础.

交通运筹学ppt-第10章博弈论

*** 博弈的结构和分类
• （1）根据参与方的数量可以分为单人博弈、两人博弈、多人博弈；
• （2）根据博弈中所选择策略的数量可以分为有限博弈和无限博弈；
• （3）根据得失函数的情况可以分为零和博弈、常和博弈及变和博弈；
• （4）根据博弈过程可以分为静态博弈、动态博弈和重复博弈； • （5）根据信息结构可以分为完全信息博弈和不完全信息博弈，
• 这两条性质表明：矩阵博弈的值是惟一的，即当一个局中人选择了最优纯策略后，他的赢得值不依赖于对方的纯策略。
• *** 矩阵博弈的混合策略
• 矩阵博弈的求解方法 • 1、线性规划法 • 2.基于优超原则的解法
【例10.8】两个局中人进行博弈，规则是两人互相独立地各自从1、2、3这三个数字中任意选写一个数字，如果两人所写的数字之和为偶数，则局中人Ⅱ付给局中人Ⅰ以数量为此和数的报酬；如果两人所写数字之和为奇数，则局中人Ⅰ付给局中人 Ⅱ以数量为此和数的报酬，试求出其最优策略。
• 求解矩阵博弈的最优纯策略的假设如下： • （1）每个局中人对双方拥有的全部策略及当
各自采取某一策略时的相互损失有充分了解； • （2）对策的双方是理智的，他们参与对策的
目的是力图扩大自己的收益，因而总是采取对自己有利的策略； • （3）双方在相互保密的情况下选择自己的策略，并不允许存在任何协议。 • 下面用一个例子来分析各局中人应如何选择最有利策略。
第10章博弈论
• 博弈论基本概念 • 博弈的结构和分类 • 有限二人零和博弈 • 数学定义 • 矩阵博弈的纯策略 • 矩阵博弈的混合策略
*** 博弈论基本概念
• 一般博弈模型包含三个基本要素。 • （1）局中人（players） • （2）策略集（strategies） • （3）得益函数（payoffs）

博弈论 PPT课件

所有别的游戏者策略的简记法
s-i＝（s1，…，si-1，si+1，…， sn）纳什均衡简述为： ui（si*，s-i*）≥ui（si，s-i*）， si∈Si
博弈方
博弈方：独立决策、独立承担博弈结果的个人或组织博弈规则面前博弈方之间平等，不因博弈方之间权利、地位的差异而改变博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈，单人博弈是退化的博弈
策略策略：博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同，而且可选策略数量也可不同有限博弈：每个博弈方的策略数都是有限的无限博弈：至少有某些博弈方的策略有无限多个
纳什均衡
策略空间：S1，……Sn 博弈方i的第j个策略：sij∈Si 博弈方i的得益：ui 博弈：G＝｛S1 ，…，Sn，u1，…，un｝纳什均衡：在博弈G＝｛S1 ，…，Sn，u1，…，un｝中，如果由各个博弈方的各一个策略组成的某个策略组合（ s1*，…， sn* ）中，任一i博弈方si*的策略，都是对其余博弈方策略的组合（ s1*，…，si-1*，si+1*，…，sn* ）的最佳对策，即ui（ s1*，…，si-1*，si*，si+1*，…，sn* ）≥ ui（ s1*，…，si-1*，sij， si+1*，…，sn* ）对任意sij∈Si都成立，则称（ s1*，…，sn* ）为G的一个纳什均衡
严格下策反复消去法
严格下策：不管其它博弈方的策略如何变化，给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略严格下策反复消去
左上下 1，0 0，4 1，3 中 1， 3 0， 2 右 0， 1 2， 0 左 1，0 0，4 中 1， 3 0， 2 左 1，0 中 1，3

博弈论PPT课件

2020/3/24
6
博弈论的发展
80年代后，克瑞普斯（kreps）和威尔逊（wilson）则对不完全信息动态博弈的研究作出了突出的贡献，并提出了更高级的均衡概念：“贝叶斯精炼纳什均衡”或称“完美贝叶斯均衡”。
严格地说，博弈论并不是经济学的一个分支。它是一种方法，实际上，它属于数学范畴。
2020/3/24
7
博弈论与经济学
– 博弈论在经济学领域应用最广泛，最成功；博弈论的许多成果是借助于经济学的例子来发展引申的。
– 经济学家对博弈论的贡献也越来越大，特别是在动态分析和不完全信息引入博弈后。
– 最根本性的原因是经济学和博弈论的研究模式是一样的，都强调个人理性，即追求给定条件下效用最大化。
大程度上相信A会开发，而A是否开发依赖于A在多大程度上认为需求是大的。假定A 认为高需求的概率为0.5，且B知道A的这个 “先验”信仰，B将选择不开发。这是因为，如果B开发，A高需求的“信仰”不会向下调整，A将选择开发，B利润为－3000万。
2020/3/24
14
博弈论的基本概念
参与人（player）也叫局中人，指的是一个博弈中的决策主体。
2020/3/24
2
博弈论的研究对象
研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论与传统经济学有关决策理论区别
– 后者涉及的个人决策，是在给定价格参数和收入的条件下，追求效用最大化的决策；个人效用只依赖于自己的选择，而不依赖于他人的选择。
– 而博弈论看来，个人效用不仅依赖于自己的选择，而且依赖于他人的选择；个人的最优选择是其他人选择的函数。
– 比如B的决策要在A之前作出，但B在决策之前通过市场调研对需求有了确切的了解，而 A却没有。那么，B应该如何决策呢？

《运筹学》课件第六章博弈论

§1 基本概念
一、博弈论的定义二、博弈理论的历史三、博弈问题举例四、博弈的分类
三、
1. 囚犯困境（Prisoners’ dilemma
囚犯困境是图克（Tucker）1950年提出的；该博弈是博奕论最经典、著名的博弈；该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题，但可以扩展到许多经济问题，以及各种社会问题，可以揭示市场经济的根本缺陷。
所有局中人的策略组成的向量。)
s (s1,, si,, sn ) 表示n个局中人达成的
一个协议，当这个协议可以自动实施（Self-enforcing）时，即没有任何局中人有积极性破坏这个协议，那么这个协议就构成纳什均衡。
否则，若至少存在某些局中人有积极性偏离这个协议，就构不成纳什均衡。
例：囚犯困境问题：
但是，尽管政府当时无力制止这种事情，公众也不必担心彩电价格会上涨。这是因为，“彩电厂商自律联盟”只不过是一种“囚徒困境”，彩电价格不会上涨。在高峰会议之后不到二周，国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态：无论其他厂商是否降价，我自己降价是有利于自己的市场份额扩大的。
Ⅱ
坦白抵赖
坦白
Ⅰ
-9，-9
0，-10
抵赖 -10，0 -1，-1
均衡解：二人均坦白
相关概念介绍
➢博弈分析的基本假设（1）个人理性假设当事人在决策时能够充分考虑他所面临的局势，并能做出合乎理性的选择。
（2）最大化自己的收益假设当事人在决策时通常选择使自己收益最
大化的策略。
坦白抵赖
➢ 博弈问题的基本要素（1）局中人（Players）
现代博弈论主要指非合作博弈理论。非合作博弈更受重视的原因：主导人们行为的主要还是个体理性，而非集体理性；即，竞争是一切社会、经济关系的根本基础，不合作是基本的，合作是有条件和暂时的。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

性研究。
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗，或策略有关键作用的游戏
博弈Game，博弈论Game Theory，Game即游戏、竞技游戏和经济等决策竞争较量的共同特征：规则、结果、策
略选择，策略和利益相互依存，策略的关键作用游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒困境
坦白是B的占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的囚徒A 占优战略
抵赖
占优策略(上策)均衡
占优策略(上策)通俗来说是：
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策略组合所构成的均衡。
囚徒困境（ Prisoners’Dilemma ）
运筹学博弈论
第一节博弈论概述
一、博弈论的产生和发展
1. 博弈在中国田忌赛马Байду номын сангаас弈
华容道博弈
从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年，冯 ·诺依曼和摩根斯顿发表《博弈论和经济行为》的一书，
标志着博弈论作为一门独立科学的开始，也标志着新古典经济学进入了一个新的发展阶段。
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略，将它剔除掉，重新构造一个不包括已剔除战略的新的博弈；然后继续剔除这个新的博弈中某一参与人的严格劣战略；重复进行这一过程，直到剩下唯一的参与人战略组合为止。这个唯一剩下的参与人战略组合，就是这个博弈的均衡解，称为“重复剔除的占优战略均衡”(iterated dominance equilibrium).
定义：博弈就是参与人（可能是个人，也可能是团体，如国家、企业、国际组织等）在一定得规则下，同时或先或后，一次或多次，从各自允许选择的行动或战略中进行选择并加以实施，而取得相应结果（支付函数）的过程。
都有一定的规则都有一个结果策略至关重要，游戏者不同的策略选择常会带来不同的游戏
结果策略和利益有相互依存性
智猪博弈（大小猪博弈）
智猪博弈：假设猪圈里有两头猪，一头大猪，一头小猪，猪圈的一端有一个猪食槽，另一端安装了一个按钮，控制猪食的供应。按一下按钮。将有10个单位的猪食进入猪食槽，供两头猪食用。两头猪面临选择的策略有两个：自己去按按钮或等待另一头猪去按按钮。如果某一头猪作出自己去按按钮的选择，它必须付出如下代价：第一，它需要收益相当于2个单位的成本；第二，由于猪食槽远离猪食，它将比另一头猪后到猪食槽，从而减少吃食的数量。
囚徒的困境是图克（Tucker）1950年提出的该博弈是博弈论最经典、著名的博弈该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题，但可以扩展到许多经济问题，以及各种社会问题，可以揭示市场经济的根本缺陷
基本模型
经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监8年。若二人都保持沉默（相关术语称互相“合作”），则二人同样判监1年。若二人都互相检举（互相“背叛”），则二人同样判监5年。
动态
完全信息动态博弈子博弈精炼纳什均衡代表人物：泽尔腾（1965）
不完全信息动态博弈精炼贝叶斯纳什均衡代表人物：泽尔腾（1975）克瑞普斯和威尔逊（1982）费登伯格和泰勒尔（1991）
10.2 完全信息静态博弈
10.2.1 策略型博弈模型及占优战略博弈 10.2.2 重复剔除的占优战略博弈 10.2.3 纳什均衡
博弈论：博弈论就是系统研究具有上述特征的博弈问题，寻求各博弈方合理选择战略情况下博弈的解，并对这些解进行讨论分析的理论。
博弈的分类及对应的均衡概念
完全信息
静态
完全信息静态博弈纳什均衡
代表人物：纳什（1950，1951）
不完全信息
不完全信息静态博弈贝叶斯纳什均衡
代表人物：海萨尼（1967-1968）
10.2.1 策略型博弈模型及占优战略博弈
非合作博弈模型从模型自身形式上可分为扩展型和策略型两种，一般用策略型模型描述完全信息静态博弈模型。
构成策略型博弈模型的三个要素: 局中人、策略、支付函数
参与人或局中人(Players) ：独立决策、独立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等，不因博弈方之间权利、地位的差异而改变
3. 1994年三位获诺奖的博弈论学者
John Nash
John Harsany
Leihaden Selten
4. 1996年诺贝尔经济学奖得主：詹姆斯·莫里斯：主要贡献：不对称信息条件下的激励理论
大家学习辛苦了，还是要坚持
继续保持安静
5. 2001年诺贝尔经济学奖得主：迈克尔 ·斯宾塞：在不对称信息市场分析方面所做出开创
只达到效率很差的个体理性解，没有实现团体理性解。前者是稳定的，是自动实施的；尽管团体理性解对大家都好，但它是不能自动实施的，需要改变条件。
提示：该博弈揭示了个体理性与团体理性之间的矛盾。——从个体利益出发的行为往往不能实现团体的最大利益，同时也揭示了个体理性本身的内在矛盾— —从个体利益出发的行为最终也不一定能真正实现个体的最大利益，甚至得到相当差的结果。
无限博弈：至少有某些博弈方的策略有无限多个
支付函数(Payoffs function) ：各博弈方从博弈中所获得的利益。
得益对应博弈的结果，也就是各博弈方策略的组合
得益是各博弈方追求的根本目标及行为和判断的主要依据
根据得益的博弈分类：零和博弈、常和博弈、变和博弈
例10.1 囚徒困境博弈
博弈方数量对博弈结果和分析有影响
根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈，单人博弈是退化的博弈
策略或战略（strategies）：博弈中各博弈方的选择内容。
策略有定性定量、简单复杂之分
不同博弈方之间不仅可选策略不同，而且可选策略数量也可不同
有限博弈：每个博弈方的策略数都是有限的