运筹学博弈论 PPT
合集下载
《博弈论》课程ppt课件
10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
博弈论完整版PPT课件
ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
《管理运筹学》12-管理博弈.pptx
一、博弈的基本要素
例12-4 田忌赛马
解 建立博弈模型,局中人分别是齐王和田忌,每个局中 人的策略是各个等级的马参赛的次序,他们都各有6个策 略:(上,中,下),(上,下,中),(中,上,下), (中,下,上),(下,上,中),(下,中,上)。表 12-3给出了双方的赢得矩阵(第一个数字是齐王的赢得, 第二个数字是田忌的赢得)。
一、博弈的基本要素
例12-3 囚徒困境
解 A和B为两个局中人,每个局中人都有两个策略:坦白 或不坦白。按照各局中人的策略组合,共有四个局势: {坦白,坦白},{坦白,不坦白},{不坦白,坦白},{不 坦白,不坦白}。两个局中人的赢得函数可以用表12-2所 示的一个双变量矩阵来表示。
表12-2 囚徒困境的赢得表
嫌疑犯A的 策略 坦白
不坦白
嫌疑犯B的策略
坦白
不坦白
-5,-5
0,-10
-10,0
-1,-1
一、博弈的基本要素
例12-4 田忌赛马
战国时期,齐威王常邀武臣田忌赛马赌金,双方 约定共赛三局,每方分别出上、中、下三个等级的马 一匹各赛一局,每局赌注千金。在同一等级马中,田 忌的马都稍逊一筹,不如齐王的马,但田忌的上等马 优于齐王的中等马,田忌的中等马优于齐王的下等马。 试建立该问题的博弈模型。
一、博弈的基本要素
例12-4 田忌赛马
表12-3 田忌赛马博弈的赢得矩阵
齐王的策
田忌的策略
略 (上中下)(上下中)(中上下)(中下上)(下上中)(下中上)
(上中下) 3,-3
1,-1
1,-1
1,-1
-1,1
1,-1
Байду номын сангаас
(上下中) 1,-1
第九章 运筹学博弈论 ppt课件
则。
1988年 法国人莫里斯-阿莱斯(Maurice Allais)
获奖理由:在市场理论及资源有效利用方面做出了
开创性贡献,并对一般均衡理论重新做了系统阐述。
1987年 美国人罗伯特-索洛(Robert M. Solow)
获奖理由:对增长理论做出贡献。提出长期的经济
增长主要依靠技术进步,而不是依靠资本和劳动力的
获奖理由:对不同汇率体制下的货币和财政政策以及最
优货币区域的分析做出了伟大贡ppt献课件。
8
1998年 印度籍经济学家阿马蒂亚-森(Amartya Sen) 获奖理由:对福利经济学以及发展经济学做出了突破
性贡献。 1997年 美国经济学家迈伦-斯科尔斯(Myron S.
Scholes)和罗伯特-默顿(Robert C. Merton) 获奖理由:前者给出了著名的布莱克-斯科尔斯期权
获奖理由:在动态宏观经济学方面做出了
巨大贡献。 2003年 美国经济学家罗伯特-恩格尔
(Robert F. Engle III)和英国经济学家克莱夫格兰杰(Clive W.J. Granger)
获奖理由:在经济时间数列中运用了统计
学的方法。
ppt课件
7
2002年 美国学者丹尼尔-卡尼曼(Daniel Kahneman)和弗农-
ppt课件
4
在国外,1912年E.Zermelo用集合论研究过下棋 问题,四十年代由于生产和战争的需要,博弈理 论得到了发展,系统博弈理论的形成则以1944 年V.Neumann,O.Morgensten合著的《博弈论 和经济行为》一书为标志.1994年瑞士皇家科 学院决定将诺贝尔经济学奖授予纳什(Nash),哈 萨尼(Harsanyi)和泽尔腾(Selten)三人,表彰他们 在博弈理论和应用研究方面作出的杰出贡献. 目前,博弈论在定价,招投标,拍卖,委托代理以及 很多重要的经营决策中得到应用,它已成为现代 经济学的重要基础.
交通运筹学ppt-第10章博弈论
*** 博弈的结构和分类
• (1)根据参与方的数量可以分为单人博弈、两人博弈、多人博 弈;
• (2)根据博弈中所选择策略的数量可以分为有限博弈和无限博 弈;
• (3)根据得失函数的情况可以分为零和博弈、常和博弈及变和 博弈;
• (4)根据博弈过程可以分为静态博弈、动态博弈和重复博弈; • (5)根据信息结构可以分为完全信息博弈和不完全信息博弈,
• 这两条性质表明:矩阵博弈的值是惟一的, 即当一个局中人选择了最优纯策略后,他 的赢得值不依赖于对方的纯策略。
• *** 矩阵博弈的混合策略
• 矩阵博弈的求解方法 • 1、线性规划法 • 2.基于优超原则的解法
【例10.8】两个局中人进行博弈,规则是两人互相独立地各自 从1、2、3这三个数字中任意选写一个数字,如果两人所写的 数字之和为偶数,则局中人Ⅱ付给局中人Ⅰ以数量为此和数的 报酬;如果两人所写数字之和为奇数,则局中人Ⅰ付给局中人 Ⅱ以数量为此和数的报酬,试求出其最优策略。
• 求解矩阵博弈的最优纯策略的假设如下: • (1)每个局中人对双方拥有的全部策略及当
各自采取某一策略时的相互损失有充分了解; • (2)对策的双方是理智的,他们参与对策的
目的是力图扩大自己的收益,因而总是采取对 自己有利的策略; • (3)双方在相互保密的情况下选择自己的策 略,并不允许存在任何协议。 • 下面用一个例子来分析各局中人应如何选择最 有利策略。
第10章 博弈论
• 博弈论基本概念 • 博弈的结构和分类 • 有限二人零和博弈 • 数学定义 • 矩阵博弈的纯策略 • 矩阵博弈的混合策略
*** 博弈论基本概念
• 一般博弈模型包含三个基本要素。 • (1)局中人(players) • (2)策略集(strategies) • (3)得益函数(payoffs)
博弈论 PPT课件
所有别的游戏者策略的简记法
s-i=(s1,…,si-1,si+1,…, sn) 纳什均衡简述为: ui(si*,s-i*)≥ui(si,s-i*), si∈Si
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织 博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变 博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人 博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略 策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可 选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限 多个
纳什均衡
策略空间:S1,……Sn 博弈方i的第j个策略:sij∈Si 博弈方i的得益:ui 博弈:G={S1 ,…,Sn,u1,…,un} 纳什均衡:在博弈G={S1 ,…,Sn,u1,…,un}中,如果 由各个博弈方的各一个策略组成的某个策略组合( s1*,…, sn* )中,任一i博弈方si*的策略,都是对其余博弈方策略的组 合( s1*,…,si-1*,si+1*,…,sn* )的最佳对策,即ui( s1*,…,si-1*,si*,si+1*,…,sn* )≥ ui( s1*,…,si-1*,sij, si+1*,…,sn* ) 对任意sij∈Si都成立,则称( s1*,…,sn* ) 为G的一个纳什均衡
严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略 严格下策反复消去
左 上 下 1,0 0,4 1,3 中 1, 3 0, 2 右 0, 1 2, 0 左 1,0 0,4 中 1, 3 0, 2 左 1,0 中 1,3
博弈论PPT课件
2020/3/24
6
博弈论的发展
80年代后,克瑞普斯(kreps)和威尔 逊(wilson)则对不完全信息动态博弈 的研究作出了突出的贡献,并提出了更 高级的均衡概念:“贝叶斯精炼纳什均 衡”或称“完美贝叶斯均衡”。
严格地说,博弈论并不是经济学的一个 分支。它是一种方法,实际上,它属于 数学范畴。
2020/3/24
7
博弈论与经济学
– 博弈论在经济学领域应用最广泛,最成功; 博弈论的许多成果是借助于经济学的例子来 发展引申的。
– 经济学家对博弈论的贡献也越来越大,特别 是在动态分析和不完全信息引入博弈后。
– 最根本性的原因是经济学和博弈论的研究模 式是一样的,都强调个人理性,即追求给定 条件下效用最大化。
大程度上相信A会开发,而A是否开发依赖 于A在多大程度上认为需求是大的。假定A 认为高需求的概率为0.5,且B知道A的这个 “先验”信仰,B将选择不开发。这是因为, 如果B开发,A高需求的“信仰”不会向下 调整,A将选择开发,B利润为-3000万。
2020/3/24
14
博弈论的基本概念
参与人(player)也叫局中人,指的是 一个博弈中的决策主体。
2020/3/24
2
博弈论的研究对象
研究决策主体的行为发生直接相互作用 时候的决策以及这种决策的均衡问题。
博弈论与传统经济学有关决策理论区别
– 后者涉及的个人决策,是在给定价格参数和收入的 条件下,追求效用最大化的决策;个人效用只依赖 于自己的选择,而不依赖于他人的选择 。
– 而博弈论看来,个人效用不仅依赖于自己的选择, 而且依赖于他人的选择;个人的最优选择是其他人 选择的函数。
– 比如B的决策要在A之前作出,但B在决策之 前通过市场调研对需求有了确切的了解,而 A却没有。那么,B应该如何决策呢?
《运筹学》课件 第六章 博弈论
§1 基本概念
一、博弈论的定义 二、博弈理论的历史 三、博弈问题举例 四、博弈的分类
三、
1. 囚犯困境(Prisoners’ dilemma
囚犯困境是图克(Tucker)1950年提出的; 该博弈是博奕论最经典、著名的博弈; 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷。
所有局中人的策略组成的向量。)
s (s1,, si,, sn ) 表示n个局中人达成的
一个协议,当这个协议可以自动实施(Self-enforcing) 时,即没有任何局中人有积极性破坏这个协议,那么 这个协议就构成纳什均衡。
否则,若至少存在某些局中人有积极性偏离这个协 议,就构不成纳什均衡。
例:囚犯困境问题:
但是,尽管政府当时无力制止这种事情,公众也不 必担心彩电价格会上涨。这是因为,“彩电厂商自 律联盟”只不过是一种“囚徒困境”,彩电价格不 会上涨。在高峰会议之后不到二周,国内彩电价格 不是上涨而是一路下跌。这是因为厂商们都有这样 一种心态:无论其他厂商是否降价,我自己降价是 有利于自己的市场份额扩大的。
Ⅱ
坦白 抵赖
坦白
Ⅰ
-9,-9
0,-10
抵赖 -10,0 -1,-1
均衡解: 二人均坦白
相关概念介绍
➢博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
坦白 抵赖
➢ 博弈问题的基本要素 (1)局中人(Players)
现代博弈论主要指非合作博弈理论。非合作博弈 更受重视的原因:主导人们行为的主要还是个体理性, 而非集体理性;即,竞争是一切社会、经济关系的根 本基础,不合作是基本的,合作是有条件和暂时的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
性研究。
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的 囚徒A 占优战略
抵赖
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
囚徒困境( Prisoners’Dilemma )
运筹学博弈论
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马Байду номын сангаас弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年 , 冯 ·诺 依 曼 和 摩 根斯顿发表《博弈论和经 济行为》的一书,
标志着博弈论作为一门独立科学的开始, 也标志着新古典经济学进入了一个新的发 展阶段。
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
都有一定的规则 都有一个结果 策略至关重要,游戏者不同的策略选择常会带来不同的游戏
结果 策略和利益有相互依存性
智猪博弈(大小猪博弈)
智猪博弈:假设猪圈里有两头猪,一头大猪,一头小猪, 猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制 猪食的供应。按一下按钮。将有10个单位的猪食进入猪食 槽,供两头猪食用。两头猪面临选择的策略有两个:自己 去按按钮或等待另一头猪去按按钮。如果某一头猪作出自 己去按按钮的选择,它必须付出如下代价:第一,它需要 收益相当于2个单位的成本;第二,由于猪食槽远离猪食, 它将比另一头猪后到猪食槽,从而减少吃食的数量。
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷
基本模型
经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人 入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双 方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称“背叛”对方), 而对方保持沉默,此人将即时获释,沉默者将判监8年。 若二人都保持沉默(相关术语称互相“合作”),则二人同 样判监1年。 若二人都互相检举(互相“背叛”),则二人同样判监5年。
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
10.2 完全信息静态博弈
10.2.1 策略型博弈模型及占优战略博弈 10.2.2 重复剔除的占优战略博弈 10.2.3 纳什均衡
博弈论:博弈论就是系统研究具有上述特征的博弈问 题,寻求各博弈方合理选择战略情况下博弈的解,并 对这些解进行讨论分析的理论。
博弈的分类及对应的均衡概念
完全信息
静态
完全信息静态博弈 纳什均衡
代表人物:纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
10.2.1 策略型博弈模型及占优战略博弈
非合作博弈模型从模型自身形式上可分为扩展型和 策略型两种,一般用策略型模型描述完全信息静态 博弈模型。
构成策略型博弈模型的三个要素: 局中人、策略、支付函数
参与人或局中人(Players) :独立决策、独 立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等,不因博弈方 之间权利、地位的差异而改变
3. 1994年三位获诺奖的博弈论学者
John Nash
John Harsany
Leihaden Selten
4. 1996年诺贝尔经 济学奖得主:詹姆 斯·莫里 斯:主要 贡献:不对称信息 条件下的激励理论
大家学习辛苦了,还是要坚持
继续保持安静
5. 2001年诺贝尔经济 学奖得主:迈克尔 ·斯 宾塞:在不对称信息市 场分析方面所做出开创
只达到效率很差的个体理性解,没有实现团体 理性解。 前者是稳定的,是自动实施的;尽管团体理性 解对大家都好,但它是不能自动实施的,需要改变 条件。
提示:该博弈揭示了个体理性与团体理性之间的矛 盾。——从个体利益出发的行为往往不能实现团体的 最大利益,同时也揭示了个体理性本身的内在矛盾— —从个体利益出发的行为最终也不一定能真正实现个 体的最大利益,甚至得到相当差的结果。
无限博弈:至少有某些博弈方的策略有无限多个
支付函数(Payoffs function) :各博弈方从 博弈中所获得的利益。
得益对应博弈的结果,也就是各博弈方策略的组合
得益是各博弈方追求的根本目标及行为和判断的主 要依据
根据得益的博弈分类:零和博弈、常和博弈、变和 博弈
例10.1 囚徒困境博弈
博弈方数量对博弈结果和分析有影响
根据博弈方数量分单人博弈、两人博弈、多 人博弈等。最常见的是两人博弈,单人博弈 是退化的博弈
策略或战略(strategies) :博弈中各博 弈方的选择内容。
策略有定性定量、简单复杂之分
不同博弈方之间不仅可选策略不同,而且可选策 略数量也可不同
有限博弈:每个博弈方的策略数都是有限的
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的 囚徒A 占优战略
抵赖
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
囚徒困境( Prisoners’Dilemma )
运筹学博弈论
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马Байду номын сангаас弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年 , 冯 ·诺 依 曼 和 摩 根斯顿发表《博弈论和经 济行为》的一书,
标志着博弈论作为一门独立科学的开始, 也标志着新古典经济学进入了一个新的发 展阶段。
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
都有一定的规则 都有一个结果 策略至关重要,游戏者不同的策略选择常会带来不同的游戏
结果 策略和利益有相互依存性
智猪博弈(大小猪博弈)
智猪博弈:假设猪圈里有两头猪,一头大猪,一头小猪, 猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制 猪食的供应。按一下按钮。将有10个单位的猪食进入猪食 槽,供两头猪食用。两头猪面临选择的策略有两个:自己 去按按钮或等待另一头猪去按按钮。如果某一头猪作出自 己去按按钮的选择,它必须付出如下代价:第一,它需要 收益相当于2个单位的成本;第二,由于猪食槽远离猪食, 它将比另一头猪后到猪食槽,从而减少吃食的数量。
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷
基本模型
经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人 入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双 方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称“背叛”对方), 而对方保持沉默,此人将即时获释,沉默者将判监8年。 若二人都保持沉默(相关术语称互相“合作”),则二人同 样判监1年。 若二人都互相检举(互相“背叛”),则二人同样判监5年。
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
10.2 完全信息静态博弈
10.2.1 策略型博弈模型及占优战略博弈 10.2.2 重复剔除的占优战略博弈 10.2.3 纳什均衡
博弈论:博弈论就是系统研究具有上述特征的博弈问 题,寻求各博弈方合理选择战略情况下博弈的解,并 对这些解进行讨论分析的理论。
博弈的分类及对应的均衡概念
完全信息
静态
完全信息静态博弈 纳什均衡
代表人物:纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
10.2.1 策略型博弈模型及占优战略博弈
非合作博弈模型从模型自身形式上可分为扩展型和 策略型两种,一般用策略型模型描述完全信息静态 博弈模型。
构成策略型博弈模型的三个要素: 局中人、策略、支付函数
参与人或局中人(Players) :独立决策、独 立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等,不因博弈方 之间权利、地位的差异而改变
3. 1994年三位获诺奖的博弈论学者
John Nash
John Harsany
Leihaden Selten
4. 1996年诺贝尔经 济学奖得主:詹姆 斯·莫里 斯:主要 贡献:不对称信息 条件下的激励理论
大家学习辛苦了,还是要坚持
继续保持安静
5. 2001年诺贝尔经济 学奖得主:迈克尔 ·斯 宾塞:在不对称信息市 场分析方面所做出开创
只达到效率很差的个体理性解,没有实现团体 理性解。 前者是稳定的,是自动实施的;尽管团体理性 解对大家都好,但它是不能自动实施的,需要改变 条件。
提示:该博弈揭示了个体理性与团体理性之间的矛 盾。——从个体利益出发的行为往往不能实现团体的 最大利益,同时也揭示了个体理性本身的内在矛盾— —从个体利益出发的行为最终也不一定能真正实现个 体的最大利益,甚至得到相当差的结果。
无限博弈:至少有某些博弈方的策略有无限多个
支付函数(Payoffs function) :各博弈方从 博弈中所获得的利益。
得益对应博弈的结果,也就是各博弈方策略的组合
得益是各博弈方追求的根本目标及行为和判断的主 要依据
根据得益的博弈分类:零和博弈、常和博弈、变和 博弈
例10.1 囚徒困境博弈
博弈方数量对博弈结果和分析有影响
根据博弈方数量分单人博弈、两人博弈、多 人博弈等。最常见的是两人博弈,单人博弈 是退化的博弈
策略或战略(strategies) :博弈中各博 弈方的选择内容。
策略有定性定量、简单复杂之分
不同博弈方之间不仅可选策略不同,而且可选策 略数量也可不同
有限博弈:每个博弈方的策略数都是有限的