博弈论 (1)(1)
第一章 博弈论概述PPT课件
Game Theory and Information Economics 天津大学管理与经济学部
授课:XXX
1
第一章 博弈论概述 (Game Theory)
授课:XXX
2
一、博弈论的定义
又称对策论,是研究决策主体的行为发生直 接相互作用时的决策以及这种决策的均衡问 题的学科。
➢ 博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
授课:XXX
12
坦白 抵赖
➢ 博弈问题的基本要素
坦白
(1)局中人(Players)
抵赖
参与对抗的各方;不一定指自然人
若二人均不坦白,则只能因藏有枪支而被判刑1年; 若有一人坦白而另一个不坦白,则坦白者无罪释放,
不坦白者 被判刑10年; 若二人都坦白了,则同判8年。 此二人确系抢劫犯,请分析他们的抉择。
Ⅱ
坦白
Ⅰ
抵赖
坦白 -8,-8 -10,0
抵赖 0,-10 -1,-1
授课:XXX
均衡解: 二人均坦白
11
相关概念介绍
他的故事被好莱坞拍成了电影《美丽心灵》,该影片获 得了2002年奥斯卡金像奖的四项大奖
授课:XXX
7
2002年 北京国际数学家大会(ICM)
授课:XXX
8
• 主演
罗素·克劳,Russell Crowe
詹妮弗·康纳利, Jennifer Connelly
授课:XXX
9
1. 囚犯困境(Prisoners’ dilemma
博弈论(第一、二章)
游戏2:摘柿子
甲 跑
摇 跑
乙
摇 跑
甲
摇
乙 跑
摇 跑
甲
不跑 (2,2)
(0,0)
(0,1) (2,0)
(0,3) (4,0)
游戏3:免费彩票博弈
每个人可以免费购买任意数量彩票,随机 抽取1张彩票中奖,奖金总额为1000万元/n,n 为彩票数量。
博弈论:研究理性人行为选择的理论
博弈论作用:帮助个人、组织等决策主 体深刻理解策略并明智的选择行动。
第二章 完全信息静态博弈
� 基本分析思路和方法 � 纳什均衡 � 混合策略 � 纳什均衡的选择
第一节 基本分析思路和方法
行动或策略(acቤተ መጻሕፍቲ ባይዱion or strategy)
si:局中人i的一个特定策略 Si:局中人i的策略集(strategy set)或策略空间 (strategy space),可以是离散的或连续的。
纳什的基本贡献是证明了非合作博弈均衡解 及其存在性,建立了作为博弈论基础的“纳 什均衡”概念;海萨尼则把不完全信息纳入 到博弈论方法体系中;泽尔腾的贡献在于将 博弈论由静态向动态的扩展,建立了“子博 弈精练纳什均衡”的概念。
1996莫里斯(James A.Mirrlees)和维克瑞(William Vickrey)
游戏1:军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1
C -1 +1 +1
游戏1:军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1
博弈论复习题(1)
1.设一四阶段两博弈方之间的动态博弈如图所示。
试找出全部子博弈,讨论该博弈中的可信性问题,求子博弈完美纳什均衡策略组合和博弈的结果。
2.假设一个工会是一个寡头垄断市场中所有企业唯一的劳动力供给者,就像汽车工人联合会对于通用、福特、克莱斯勒等大的汽车厂家。
令博弈各方行动的时间顺序如下:(1)工会确定单一的工资要求w ,适用于所有的企业(2)每家企业i 了解到w ,然后同时分别选择各自的雇佣水平L i ;(3)工会的收益为(w-w α)L ,其中w α为工会成员到另外的行业谋职可取得的收入,L=L 1+…L n 为工会在本行业企业的总就业水平;企业i 的利润为π(w ,L i ),其中决定企业i 利润水ABB A h g (2,4)(8,5)(3,6)(4,3)b (5,3)a c d f e平的要素如下。
所有企业都有同样的生产函数:产出等于劳动力q i=L i。
市场总产出为Q=q1+…+q n时的市场出清价格为p(Q)=a-Q。
为使问题简化,假设企业除了工资支出外没有另外的资本。
求出此博弈的子博弈精炼解。
在子博弈精炼解中,企业的数量是如何影响工会的效应的?为什么?(吉本斯2.2节 2.7答案)3.下图所示的同时行动博弈重复进行两次,并且第二阶段开始前双方可观测到第一阶段的结果,不考虑贴现因素。
变量x大于4,因而(4,4)在一次性博弈中并不是一个均衡收益。
对什么样的x,(双方参与者同时采取)下述战略是一个子博弈完美纳什均衡?第一阶段选择Q i,如果第一阶段的结果为(Q1,Q2),在第二阶段选择P i;如果第一阶段的结果为(y,Q2),其中y≠Q1,第二阶段选择R i;如果第一阶段的结果为(Q1,z),其中z≠Q1,第二阶段选择S i;如果第一阶段结果为(y,z),其中y≠Q1,且z≠Q2,则在第二阶段选P iP2 Q2 R2 S2P1Q1R1S1(2.10吉本斯)思路:逐个分析上述的四种情形:第一种情形,第一阶段选择Qi,第二阶段选择Pi,即双方均采取合作的策略,得益均为6;第二种情形和第三种情形下,实际上有一方是采取了不合作,其得益为x,另一方即利益受损方得益为2;第四种情形实际上是双方都不采取合作的策略,而根据题目要求,对于x,下述战略是一个子博弈精炼纳什均衡,所以x必须小于双方均合作时的收益6,否则第一种情形不会出现,因为既然x>6了,双方均会选择不合作而使情形一不会出现。
博弈论习题[1]
习题 2
解: 令(L,M,R)是参与人 A 的 战 略 ;( U,M,D)是参与人 B 的战略。从表 1A.2 中可以看出,对 于参与人 B 而言,M 战略是严格劣于 R 战略,按照重复提出的占有均衡剔除 M 战略,则得出 如表(a)博弈。在表(a)博弈,参与人 A 的 M 和 D 战略严格劣于 U 战略,重复剔除 M 和 D 战略,得出表(b)博弈。该博弈为单人决策,则重复剔除的占优均衡为(U,L)。
r3 ( A, A, A) = r3 ( A, A, B) = r3 (A, A, C) = {A, B, C} r3 ( A, B, A) = r3 ( A, B, B) = r3 (A, B, C) = {A, C} r3 ( A, C, A) = r3 ( A, C, B) = r3 ( A, C, C) = {C} r3 (B, A, A) = r3 (B, A, B) = r3 (B, A, C) = {A, C} r3 (B, B, A) = r3 (B, B, B) = r3 (B, B, C) = {B, C} r3 (B, C, A) = r3 (B, C, B) = r3 (B, C, C) = {C} r3 (C, A, A) = r3 (C, A, B) = r3 (C, A, C) = {C} r3 (C, B, A) = r3 (C, B, B) = r3 (C, B, C) = {C} r3 (C, C, A) = r3 (C, C, B) = r3 (C, C, C) = {A, B, C}
(0,0)律师得到 100 (0,0)律师得到 100)
通过上面的支付矩阵,我们可以得出答案,只有 A 和 B 都做出选择得到 50 的时候,他
们才能得到钱,不多一分也不少分,如果有一方想多得,二者将一分也得不到,钱全部归律
《产业经济学》第五章--(博弈1)讲解
在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。
博弈论 第一章
1 完全信息静态博弈1.0 对策论研究的内容与基本形式对策论研究的内容对策论研究多个行为主体的决策问题。
对策论研究的形式博弈(game),由多个行为主体构成的系统。
例Stackelberg modelCournot model博弈的类型参与者行动的时间与顺序同时行动——静态博弈;先后行动——动态博弈。
参与者的信息多少信息相同——完全信息;信息不同——不完全信息。
1.1 基本理论: 博弈的标准式和纳什均衡例1 儿童游戏:“石头、剪刀、布”。
博弈的标准式表示(normal-form representation)(1) 参与人( player).n 个参与人:1, 2, …, i, …, n.(2) 战略(strategy).一个参与人的战略是他采取的一个行动。
参与人i 的战略:s i.参与人i 的战略空间: S i.战略的一个组合: s ={s1,s2, …, s n}.简化表示:s-i ={ s1,…, s i -1,s i+1, …, s n }.(3) 收益(payoff).参与人i 的收益:u i= u i(s1,s2, …, s n)n个参与人博弈的标准形式表示:G = {S1, S2, …, S n;u1, u2, … , u n}完全信息(complete information):每个参与人知道其他人的战略空间和收益。
静态博弈(static game):所有的参与人同时行动。
每个人行动时,不知道其他人的行动。
例1(续):博弈{石头、剪刀、布} 的描述:参与人:1,2。
战略空间:S1 = S2 = {石头、剪刀、布}收益:两人出手的函数u1 (石头,石头) = 0,u1 (石头,剪刀) = 1,u1 (石头,布) = -1 …u2 (石头,石头) = 0,u2 (石头,剪刀) = -1,u2 (石头,布) = 1 ……收益表:两个参与人,有限个战略的博弈的表示方法。
P2石头剪刀布石头0 ,0 1 ,-1 -1 ,1P1剪刀-1 ,1 0 ,0 1 ,-1布 1 ,-1 -1 ,1 0 ,0博弈的问题:能否知道每个参与人选择的战略?例2: 囚徒困境(The Prisoner’s Dilemma)囚徒 2沉默招认沉默-1 ,-1 -9 ,0囚徒 1招认0 ,-9 -6 ,-6囚徒1的考虑:无论对方选沉默还是招认,自己选“招认”好于“沉默”。
博弈论习题1
1、一逃犯从关押他的监狱中逃走,一看守奉命追捕。
如果逃
犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。
逃犯逃脱可少坐10年牢,但一旦被抓住则要
加刑10年;看守抓住逃犯能得1000元奖金。
请用得益矩阵表示该博弈。
2、你正在考虑是否投资100万元开设一家饭店。
假设情况是
这样的:你决定开,则0.35的概率你将收益300万元(包
括投资),而0.65的概率你将全部亏损掉;如果你不开,
则你能保住本钱但也不会有利润。
请你:
(1)用得益矩阵表示该博弈。
(2)如果你是风险中性者,你会怎样选择?
(3)如果你是风险规避者,且期望得益的折扣系数为0.9,你的策略选择是什么?
3、假设长虹和创维这两家彩电生产商都可以选择集中力量研
发生产低档产品或高档产品,但他们在选择时都不知道对方的选择。
假设他们在不同选择下的收益矩阵如下图所示。
请问:该博弈的均衡是什么?。
博弈及博弈论(1)
与其应用
100503116盛盼盼
从以下几个方面来学习:
• • • • • • • 定义 发展 类型 要素基本概念 应用及分析 意义 相关理论
定义:
• 博弈论(Game Theory),亦名“对策论”、 “赛局理论”,属应用数学的一个分支, 博弈论 已经成为经济学的标准分析工具之一。目前在生 物学、经济学、国际关系、计算机科学、政治学、 军事战略和其他很多学科都有广泛的应用。博弈 论主要研究公式化了的激励结构间的相互作用。 是研究具有斗争或竞争性质现象的数学理论和方 法。也是运筹学的一个重要学科。 博弈论考虑游 戏中的个体的预测行为和实际行为,并研究它们 的优化策略。生物学家使用博弈理论来理解和预 测进化论的某些结果。
博弈论的发展:
• 我国古代的《孙子兵法》就不仅是一部军 事著作,而且算是最早的一部博弈论专著。 博弈论最初主要研究象棋、桥牌、赌博中 的胜负问题,人们对博弈局势的把握只停 留在经验上,没有向理论化发展,正式发展 成一门学科则是在20世纪初。
• 对于博弈论的研究,开始于策墨洛 (Zermelo,1913)、波雷尔(Borel,1921)及冯· 诺伊曼 (von Neumann, 1928),后来由冯· 诺伊曼和奥斯 卡· 摩根斯坦(von Neumann and Morgenstern, 1944,1947)首次对其系统化和形式化(参照 Myerson, 1991)。随后约翰· 福布斯· 纳什(John Forbes Nash Jr., 1950, 1951)利用不动点定理证 明了均衡点的存在,为博弈论的一般化奠定了坚 实的基础。
• • •
•
A\B
坦白 ห้องสมุดไป่ตู้赖
坦白
8,8 10,0
《博弈论基础》读书笔记(一)博弈标准式与纳什均衡
《博弈论基础》读书笔记(⼀)博弈标准式与纳什均衡在之前⼀个⽼师的安利下,还是开了这个博弈论的坑。
书是:这本书本⾝写的⾮常棒,⽽且很易懂,强烈安利。
顺便⾃⼰记录下读书的笔记和⼀些想法,同时也把书中⽐较难理解的地⽅⽤⾃⼰的理解说⼀下,希望能帮到⼤家。
第⼀章 1完全信息静态博弈在本章,我们来讨论如下简单形式的博弈(包含如下特点):1. 静态博弈:所有游戏的参与者同时选择⾏动,然后根据⾏动每个参与者得到各⾃的结果2. 完全信息博弈:即每⼀个参与者的收益函数在所有参与者之间是共同知识,即不存在信息的不对称性,也就是说每个参与者对游戏规则以及游戏演化机理完全明⽩。
关于本章的结构:在1.1节中我们先会介绍两个问题:1. 如何描述⼀个博弈问题2. 如何求得博弈问题的解在1问题中我们定义了博弈的标准式表述和严格劣战略的概念,在2问题中我们根据前⾯的介绍引出了纳什均衡的概念。
在1.2节中我们会运⽤前⾯的⼯具来分析古诺(Cournot,1838)的不完全竞争模型,使⽤纳什均衡的⽅式对之进⾏求解,之后我们将重回理论知识,我们将会定义混合战略,它可以理解为⼀个参与者并不能确定其他参与者会如何⾏动时应该选的战略,之后会引出纳什定理。
1.1节博弈的标准式和纳什均衡1.1.A 博弈的标准式表述⾸先举⼀个⼤家都⽐较熟悉的、很经典的例⼦:囚徒困境警⽅逮捕甲、⼄两名嫌疑犯,但没有⾜够证据指控⼆⼈⼊罪。
于是警⽅分开囚禁嫌疑犯,分别和⼆⼈见⾯,并向双⽅提供以下相同的选择:若⼀⼈认罪并作证检控对⽅(相关术语称“背叛”对⽅),⽽对⽅保持沉默,此⼈将即时获释,沉默者将判监10年。
若⼆⼈都保持沉默(相关术语称互相“合作”),则⼆⼈同样判监1年。
若⼆⼈都互相检举(相关术语称互相“背叛”),则⼆⼈同样判监8年。
对于这个博弈我们可以来使⽤如下矩阵来进⾏描述对于这个矩阵,其横纵轴分别为囚徒1、2所对应的选择。
⽅框⾥的值第⼀项代表在此选择下,囚徒1 的收益情况,第⼆项代表囚徒2的收益情况。
北京大学博弈论课件第1章博弈论概述
企业、社会团体、国家
博弈参与者可能多于两方,三方或多方博弈参与者
二、博弈策略(Strategy)
博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中,博弈参与者所能采取的博弈策略
均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中,博弈参与者所能采取的博弈策
博弈参与者:两个人 博弈过程:
两人在校门口集合,一起逛博物馆
博弈策略和结果
两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
博弈双方策略相互依赖,不独立。
其他博弈实例
棋类比赛:象棋、围棋等。古人“对弈”。 寡头市场:
遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为
“坦白”或“不坦白”
三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相
2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。
博弈论第1章-导论
第一章 导论 1.2 策略环境中的博弈思维 策略
确定策略集合? 可行策略清单。 两类人: 一是有自己的策略但是不知道用哪个好的人(强化自 己的策略性思考能力即可); 二是没有一个策略集合。(这个比较难) 自己无法决策,也没有可选择的策略,这就是难点
第一章 导论 1.2 策略环境中的博弈思维 策略
下上中 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 下中上 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
1.2.2 赌胜博弈
二、猜硬币博弈
猜硬币方
正面
盖 硬 币
反面
正面
-1,1
反面
1,-1 -1,1
方
1,-1
该博弈与上一个例子相似,即取胜的关键都是不能 让另一方猜到自己的策略而同时自己又要尽可能猜出对 方的策略。
一场是同等级马或 者田忌说的对称结 果 上马对下马,中马 对上马,下马对中 马
一、齐威王田忌赛马
田忌 比赛结 输赢结果 果 三场全 输3000金 负
两胜一负
一胜两负
赢1000金
两负一 胜
一负两 胜
输1000金
赢1000金
输1000金 田忌说的那种情况,
1.3.2 赌胜博弈
一、齐威王田忌赛马
如果齐王采取策略,赛马就变成了策略相依的决策 较量,构成了典型的赌胜博弈。
第一章 导论 1.2 策略环境中的博弈思维 预测与均衡
预测与均衡 在预测对手的策略是,要站在对手的角度评价, 思考这几种策略组合能为他带来多少利益。 N方的行动决定
N社的标题
经济
经济
A社的标题
政治
3 4
政治
6
博弈论初步(1)
【例题1.1.1】出硬币博弈———硬币配对游戏
解甲、乙两人各拿一枚1元硬币,背靠背各自将硬币正面(1元币值面)或反向(菊花图案面)朝上置于手掌心中握紧。
然后,转身面对面,同时展开手掌。
游戏规则是,如果两人掌上硬币都是正面朝上或都是反面朝上,那么甲就赢了乙1元钱,或者说乙输给了甲1元钱;如果两人掌上硬币是一正一反,那么乙就赢了甲1元钱,或者说甲输给了乙1元钱。
【例题1.1.2】价格竞争博弈
解企业A与企业B生产同一种商品在市场上形成双寡头垄断市场,它们对商品都可以选择三种价格(高价、中价或低价)投放市场。
市场规则:不管哪个企业开出较低价格,它就可以得整个市场;如果两个企业开价相同,它们将平分市场。
这里进一步给出企业A,B选择不同价格获得的收益情况:企业A选择“中价”,企业B选择“高价”,这时企业A独占市场收益10万元;企业A选择“低价”,而企业B选择“高价”或“中价”,这时企业A仍独占市场,但因定出“低价”,因此收益为8万元。
当企业B选择较低价格,情况类同。
当企业A,B同时都选择“高价”,这时它们平分市场,各自收益为6万元;同时都选择“中价”,各自收益为5万元;同时都选择“低价”,各自收益为4万元。
博弈论1:纯策略
如何制定规则来约束
• 世界上有两种符合集体利益的正义: 实质正义与规则正义。实质正义必须通过 规则正义来实现,否则将被虚置。因此规 则正义最重要。
• 分蛋糕或分粥故事: 20个人的小集体, 每天吃粥。如果所有人抡吃,导致纳什悖 论:每人早早来等粥,成本极高,对谁都 不利。
• 纳什均衡:在完全信息静态 博弈中各方都实现个利益最 大化的策略组合状态
• 纯策略:假定每个参加者每 次只选择一个策略进行博弈
• 混合策略:每个参加者每次 按照各种几率选择不同策略 进行博弈,如监督博弈
二、博弈案例1:占优策略与劣策略
(dominant strategy and dominated strategy) 课本上译为“支配性策略”与“被支配策略”
完全信息静态博弈游戏各方在完全知道博弈过程的三大要素的情况下同时选择策略完全信息动态博弈走象棋围棋游戏各方的完全知识博弈过程的三大要素的情况下相继作出策略选择不完全信息动态博弈国际市场竞争10矩阵的每个位置显示每个参加者的每个策略组合此位置即一博弈格局每个博弈格局上列出每个参加者的利益函数于是得到payoffmatrix例如
• Since then game theory has be taken as the Foundation for Understanding Complex Economic Issues
一、博弈论的基本理论框架
1/博弈论的理论意义与特征
▪ 古典经济学:根据资源稀缺性配置资源 的科学,价格是资源稀缺性的信号,由 此对经济行为进行成本收益分析,MR= MC实现利润最大化 忽视了他人决策对彼此经济利益的影响
• 制度经济学:
科斯:对人之间的交易过程的成本收益分析 诺斯:对交易过程的制度环境进行分析,包括 制度约束与制度变迁与交易过程的关系
博弈论(第一章)
博弈的表述方法的例题
例:囚徒困境博弈的集合表示:G=((坦白,不坦白), (坦 白,不坦白);(-5,-5),(0,-8),(-8, 0),(-1,-1)) 例:在两个公司竞争出售同一产品的博弈中,两个公司是两 个博弈方,两个公司的各自销售量q1,q2是策略空间,
两个公司的所获利润u1(q1,q2),u2(q1,q2)是得
①用损益矩阵表示 例1:故事齐威王与大将田忌赛马,赛马的规则是这样的,每次 双方各出三匹马,一对一比赛三场,每一场的输方要赔1000斤 铜给赢方,齐威王的三匹马和田忌的三匹马按实力都可以分为 上,中,下三等,但齐威王的上,中,下三匹马分别比田忌的 上,中,下三匹马略胜一筹,由于总是同等次的马进行比赛, 因此田忌都是连输三场。实际上,田忌的上马尽管不如齐威王 的上马,却比齐威王的中马和下马要好,而田忌的中马比齐威 王的下马要好一些。因此,田忌的谋士孙膑为田忌出了个主意, 用自己的下马对齐威王的上马,上马对齐威王的中马,中马对 齐威王的下马。这样,二胜一负,田忌反而能赢齐威王1000斤 铜,试写出其标准式表述。
你能否写出上述问题的矩阵形式?
(3)囚徒困境的应用
③ 假定你是一个公司的采购人员,考虑向两家供应商采 购100万只零件,每只零件的成本为6元。如果你分别 向两家供应商各订购50万只,则每个供应商就会把价 格定在10元。你可以设计一个采购策略,以便在两家 供应商之间制造出囚徒困境的情形,从而给自己带来 好处。如何取定这样的采购政策,并写出其矩阵的表 达形式。同时,考虑你的采购策略的使用条件是什么?
低价
80, 80 100, 20
20, 100 50, 50
(3)囚徒困境的应用
② 公共产品的供给也可以看作是一个囚徒困境问题,如 果大家都出钱兴办公用事业,所有的人福利都会增加。 问题是,如果我出钱你不出钱,我得不偿失,而如果 你出钱我不出钱,我可以占你的便宜。所以每个人的 最优选择都是“不出钱”,但是这种状态使得所有人 的福利得不到提高。
博弈论第一章
招认 囚徒1 沉默
囚徒2 招认 沉默 –5, -5 0, -8 -8, 0 -1 , -1
囚徒的困境
策略“沉默”严格劣于策略“招认”
博弈分析的目的:预测博弈的均衡结果, 即给定每个参与人都是理性的是共同知识, 什么是每个参与人的最优策略?什么是所有 参与人的最优策略组合?
*肯定性(sure-thing)或替代性(substitution) 公理:一个决策者在事件A发生的偏好选项1 胜于选项2,并且在事件A不发生时也 偏好选项1胜于选项2,那么就有,他 在知道事件A无论是发生还是不发生之 前都应该偏好选项1胜于选项2。
Chapter 1 完全信息静态博弈 Static Games of Complete Information In this chapter we consider games of the following simple form: first, the players simultaneously choose actions; then, the players receive payoffs that depend on the combination of actions just chosen. Within the class of such static (or simultaneous-move) games,we restrict attention to games of complete information. That
招认
囚徒2 招认 沉默 –5, -5 0, -8
-8, 0 -1 , -1
囚徒1
沉默
囚徒的困境
We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game; (2)the strategies available to each player; (3)the payoff received by each player for each combination of strategies that could be chosen by the players.
博弈论第一章答案
1.4 对 于 第 i个 厂 商 , 其 目 标 为 最 大 化 自 己 的 利 润 , 即 :
max πiqi
=
max(a qi ≥0
− qi
−
q−*i
− c)qi
;
由 一 阶 条 件 ∂π i / ∂qi = 0 , 可 得 : qi* = (a − q−*i − c) / 2 … … ( 1)
则 原 博 弈 的 混 合 战 略 纳 什 均 衡 为 : { (1/3, 2/3, 0), (2/3, 0, 1/3) }。 1.12 按 照 1.11 的 解 法 , 可 得 混 合 战 略 纳 什 均 衡 为 : { (2/3, 1/3), (3/4, 1/4) }。 过 程 略 。 1.13 此博弈有两个纯战略纳什均衡、一个混合战略纳什均衡。 纯 战 略 纳 什 均 衡 为 :( 向 企 业 1 申 请 , 向 企 业 2 申 请 );( 向 企 业 2 申 请 , 向 企 业 1 申 请 )。 混合战略纳什均衡为:
设 此 博 弈 的 纯 战 略 纳 什 均 衡 是 ( s1* , s2* )。
对于参与人
1来 说 ,
s1*
=
max{ max 0≤s1 ≤1−s*2
s1
,
max
1−s*2 <s1 ≤1
s1
}
=
max{1−
s2* , 0} = 1−
s2*
;
同 理 , s2* = 1− s1* 。
也 即 , 此 博 弈 的 纯 战 略 纳 什 均 衡 为 ( s1* , s2* ), 且 满 足 s1* + s2* = 1, 0 ≤ s1*, s2* ≤ 1。
c1 < c2 < a 且 2c2 > a + c1 时 , 纳 什 均 衡 解 为 角 点 解 , 即 q1* = (a − c1) / 2 , q2* = 0 。 此 题 目
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
2017-6-20
博弈论工具的作用
博弈论可以帮助我们分析存在两个或 数个行为主体时的最佳策略。如分析在 存在寡头垄断时一个企业的行为,以及 不同企业行为之间的相互影响。
博弈论应用的例子包括对寡头垄断行 为的分析,对外部性的分析,对军事策 略的分析,等等。
博弈论要素
一个完整的博弈包括以下要素: Ø 局中人(players):两个以上。 Ø 规则:谁在什么时候行动?如何行动? Ø 每个局中人有至少两个以上可供选择的 策
美国的数学家、经济学家纳什( John Nash), 美籍匈牙利经济学家海萨尼( John C. Harsanyi) 和德国经济学家泽尔滕( R.Selten)因对博弈论的卓 越贡献而获得 1994年度的诺贝尔经济学家。
海萨尼
值得一提的是纳什,他发表奠 定其在博弈论中重要地位的学术论文时, 年仅22岁,被人称为 “一个天才 ”。 1959年,纳什被精神病医生诊断为 “妄想性精神分裂 ”,饱受精神病折磨 40余年。
泽尔滕
博弈论工具的作用
博弈论是分析企业和个人行为的一个 重要工具,在分析企业与企业或个人与 个人之间的互动的时候尤为重要。
博弈论(game theory)研究企业或个 人(agent)的策略行为( strategic behavior),这些策略行为取决于其他企 业或个人的行动( action)互相依存又互 相影响。
第十章 博弈论与竞争策略
博弈论,又名对策论,它是用来扩展和深化对 厂商决策行为的分析的。博弈论的应用是微观经济 学的重要发展。
第一节: 第二节: 第三节: 第四节:
博弈的基本要素与分类 完全信息静态博弈 完全信息动态博弈 不完全信息博弈:静态与动态分析
2017-6-20
博弈论的诞生
• 1944年,由约翰.冯.纽曼和摩根斯坦恩合 作撰写《博弈论和经济行为 》一书出版, 宣告了博弈论的诞生。
博弈论工具的作用
非合作博弈(non-cooperative game ): 在非合作博弈中,不存在通过谈判协商( negotiation )或有约束力的合约( binding contract )的方式限制局中人的行 为。我们这里讨论的一般为非合作博弈
合作博弈( cooperative game ):在 合作博弈中,局中人通过谈判一个有约束 力的合约来实现其联合策略。
报酬矩阵与展开形式之间的关系
一个展开形式肯定有唯一相对 应的报酬矩阵;
但一个报酬矩阵可能反映多个 展开形式。如下面两个不同的展 开形式有相同的报酬矩阵。
Hale Waihona Puke 纳什均衡前面我们讨论了一个博弈的 表达形式。
现在我们来解这个两人博弈 ,即每个局中人的最佳策略是什 么?
我们还是用前面的那个例子。
Player A
纳什均衡
两人博弈的一个例子(续):
两个局中人,每个局中人各有两个选择,结 果有四个不同的策略选择组合:上左,上右,下 左,下右。
每个策略组合中,每个局中人的报酬已知,见 下页报酬矩阵(payoff matrix)或一般形式( normal form)。
2
2017-6-20
得益矩阵
Player B LR
Player A U (3,9) (1,8) D (0,0) (2,1)
This is the game’s payoff matrix.
通常的表达方式是,第一个局中人的报 酬在前,第二个局中人的报酬在后。
博弈论的扩展式
A 信息集(information set )
U B
L
R
D
B 决策结(decision
node)
L
R
(3,9) (1,8) (0,0) (2,1)
报酬矩阵也可以用 展开式(extensive form ) 或树形图(tree diagram)来表示。
• 1950-1951,约翰.纳什发表了两篇关于 非合作博弈的重要文章,塔克定义了 “囚 徒困境”的经典例子。奠定了非合作博弈 论的基石。
• 1994年,诺贝尔经济学奖授予了三位博弈 论专家:纳什、泽尔腾和海萨尼。标志着 博弈论在经济学中的地位正式得到承认。
博弈论
纳什
美藉匈牙利数学家冯 ·诺依曼(John Von Neuman ) 和美藉奥地利经济学家摩根斯顿( Morgenstern)相识于 普林斯顿大学,他们于 1944年出版了经典著作 《博弈论 与经济行为 》,为现代博弈论的发展奠定了基础。
(五)静态博弈和动态博弈
1.静态博弈:是指所有博弈方同时或可看作同时选择策 略、采取行动的博弈。
2.动态博弈:是指博弈方的选择、行动有先有后,而且后 选择、后行动的博弈方在自己进行选择、行动之前可以看到在 他之前选择、行动的博弈方的选择、行动的博弈。
两人博弈模型
作为博弈论的介绍,我们主要讨论 两人博弈(two-player game )模型,即 每个博弈只有两个局中人。
博弈论的信息集
信息集(information set )表明了哪一 个局中人应该作决定,并且个局中人作决 定所掌握的信息。
充分信息(perfect information ):一个 信息集里只有一个决策结。
不充分信息(imperfect information ): 一个信息集有多个决策结。局中人不能区 分其作决策时位于哪个决策结。
Player B LR
U (3,9) (1,8)
D (0,0) (2,1)
This is the game’s payoff matrix.
E.g. if A plays Up and B plays Right then A’s payoff is 1 and B’s payoff is 8.
同时,我们也假设每个局中人 只有两
个可供选择的策略 。
两人博弈的一个例子
我们将两个局中人叫做 A和B。 A有两个(策略)选择:上( up)或下( down)。 B有两个选择:左( left)或右(right)。 说明:(1)A和B的策略选择可以相同也可 以不同;( 2)每个策略选择可以被看作是一 个投资决定或者利益分配计划。
略(strategies)。 Ø 得益:每个可能的策略都有一个相应的 报
酬(payoffs)。 基本假设:局中人偏好于报酬高的结果。
博弈论分类
(二)单人博弈、双人博弈和多人博弈 (三)有限策略博弈和无限策略博弈 (四)零和博弈、常和博弈与变和博弈
1.零和博弈 2.常和博弈 3.变和博弈:不同策略组合下各博弈方的得益之和不相同。