2 同时决策博弈(1)
博弈论复习题(1)
1.设一四阶段两博弈方之间的动态博弈如图所示。
试找出全部子博弈,讨论该博弈中的可信性问题,求子博弈完美纳什均衡策略组合和博弈的结果。
2.假设一个工会是一个寡头垄断市场中所有企业唯一的劳动力供给者,就像汽车工人联合会对于通用、福特、克莱斯勒等大的汽车厂家。
令博弈各方行动的时间顺序如下:(1)工会确定单一的工资要求w ,适用于所有的企业(2)每家企业i 了解到w ,然后同时分别选择各自的雇佣水平L i ;(3)工会的收益为(w-w α)L ,其中w α为工会成员到另外的行业谋职可取得的收入,L=L 1+…L n 为工会在本行业企业的总就业水平;企业i 的利润为π(w ,L i ),其中决定企业i 利润水ABB A h g (2,4)(8,5)(3,6)(4,3)b (5,3)a c d f e平的要素如下。
所有企业都有同样的生产函数:产出等于劳动力q i=L i。
市场总产出为Q=q1+…+q n时的市场出清价格为p(Q)=a-Q。
为使问题简化,假设企业除了工资支出外没有另外的资本。
求出此博弈的子博弈精炼解。
在子博弈精炼解中,企业的数量是如何影响工会的效应的?为什么?(吉本斯2.2节 2.7答案)3.下图所示的同时行动博弈重复进行两次,并且第二阶段开始前双方可观测到第一阶段的结果,不考虑贴现因素。
变量x大于4,因而(4,4)在一次性博弈中并不是一个均衡收益。
对什么样的x,(双方参与者同时采取)下述战略是一个子博弈完美纳什均衡?第一阶段选择Q i,如果第一阶段的结果为(Q1,Q2),在第二阶段选择P i;如果第一阶段的结果为(y,Q2),其中y≠Q1,第二阶段选择R i;如果第一阶段的结果为(Q1,z),其中z≠Q1,第二阶段选择S i;如果第一阶段结果为(y,z),其中y≠Q1,且z≠Q2,则在第二阶段选P iP2 Q2 R2 S2P1Q1R1S1(2.10吉本斯)思路:逐个分析上述的四种情形:第一种情形,第一阶段选择Qi,第二阶段选择Pi,即双方均采取合作的策略,得益均为6;第二种情形和第三种情形下,实际上有一方是采取了不合作,其得益为x,另一方即利益受损方得益为2;第四种情形实际上是双方都不采取合作的策略,而根据题目要求,对于x,下述战略是一个子博弈精炼纳什均衡,所以x必须小于双方均合作时的收益6,否则第一种情形不会出现,因为既然x>6了,双方均会选择不合作而使情形一不会出现。
应用博弈论第二讲完全信息静态博弈
•
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。
•
例2
为什么中小企业不会花钱去开发新产品 ?
•
完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。
•
生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。
•
例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。
管理决策博弈法计算题
管理决策博弈法计算题(最新版)目录1.管理决策博弈法简介2.管理决策博弈法计算题的类型3.管理决策博弈法计算题的解法4.管理决策博弈法计算题的应用实例5.总结正文【1.管理决策博弈法简介】管理决策博弈法是一种用于解决管理决策问题的数学方法,它基于博弈论,通过分析决策者之间的相互作用,研究决策者的策略选择和决策结果。
管理决策博弈法可以帮助决策者在复杂的决策环境中找到最佳的决策策略,从而实现组织目标。
【2.管理决策博弈法计算题的类型】管理决策博弈法计算题主要包括以下几种类型:(1)静态博弈计算题:静态博弈是指在一次性决策中,决策者需要同时做出决策,并且每个决策者的决策不会受到其他决策者的影响。
(2)动态博弈计算题:动态博弈是指在多次性决策中,决策者需要根据其他决策者的决策结果,调整自己的决策策略。
(3)完全信息博弈计算题:完全信息博弈是指决策者拥有完全的信息,可以准确地预测其他决策者的决策结果。
(4)不完全信息博弈计算题:不完全信息博弈是指决策者拥有不完全的信息,无法准确地预测其他决策者的决策结果。
【3.管理决策博弈法计算题的解法】管理决策博弈法计算题的解法主要包括以下几种:(1)纳什讨价还价解法:纳什讨价还价解法是一种用于解决静态博弈问题的方法,它假设每个决策者都会选择最优的策略,并且每个策略都会考虑到其他决策者的可能策略。
(2)重复博弈解法:重复博弈解法是一种用于解决动态博弈问题的方法,它假设决策者会在多次决策中,根据其他决策者的决策结果,调整自己的策略。
(3)贝叶斯博弈解法:贝叶斯博弈解法是一种用于解决不完全信息博弈问题的方法,它假设决策者会根据自己拥有的信息,对其他决策者的策略进行概率分析,并选择最优的策略。
【4.管理决策博弈法计算题的应用实例】管理决策博弈法计算题在实际应用中,可以解决许多管理决策问题,例如:(1)定价决策:在市场竞争中,企业需要根据竞争对手的价格策略,选择最佳的定价策略。
第2次作业:P138-3
下面的两人博弈可以解释为两个寡头企业的价格竞争博弈,其中p是企业1 的价格,q是企业2的价格。企业1的利润函数是
π 1 = −( p − aq + c) 2 + q
企业2的利润函数是 π 2 = −( q − b ) + p 求解: (1)两个企业同时决策时的纳什均衡; (2)企业1先决策时的子博弈精炼纳什均衡; (3)企业2先决策时的子博弈精炼纳什均衡; (4)是否存在某些参数值(a,b,c)使得每一个企业都希望自己先决策?
∂π 1 = −2 * ( p − aq + c) = 0 企业1的最优选择 ∂p
p = aq − c
这是企业1对企业2的价格策略q的最优反应 第2步:因为企业2预测到对企业1的选择 p = aq − c 则企业2在先决策面临的问题就是
∂π 2 = −2 * (q − b) + a = 0 ∂q
a2 则: p = 2 + aq − c
π 1 = −( p − ab + c) + q
p = ab − c
∂π 1 = −2 * ( p − ab + c) = 0 ∂p
则: p = ab − c
q=b
即为精炼纳什均衡
(3)下面用逆向归纳法求解(企业2先决策)
π 1 = −( p − aq + c) 2 + q 首先,考虑企业2的价格q既定下的,
a a2 a2 π 2 = −(q − b) 2 + p = −( + b − b) 2 + + ab − c = + ab − c 2 2 4
当先决策的利润大于后决策时,企业才会希望先决策
a b > + b,即a < 0,企业1希望先决策 2 a2 + ab − c > ab − c,即a ≠ 0,企业2希望先决策 4
《产业经济学》第五章--(博弈1)讲解
在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。
第二讲纳什均衡
习题:齐威王田忌赛马矩阵
上中下 上中下
田忌
上下中 中上下 中下上 下中上 下上中
+3,-3 +1,-1 +1,-1 -1,+1 +1,-1
+1,-1 +3,-3 -1,+1 +1,-1 +1,-1
+1,-1 +1,-1 +3,-3 +1,-1 -1,+1
+1,-1 +1,-1 +1,-1 +3,-3 +1,-1
在第二行1 下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
20
第三节 纳什均衡
三、寻找纳什均衡的方法 (二)相对优势策略划线法 3.设定甲靠左行(第一行) 乙: 1>-1 乙相对优势策略:靠左行
在第一列 1下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
21
第三节 纳什均衡
四、古诺模型 max i 2.企业i的目标: π1=?,π2=? 3.企业利润最大化的一阶、二阶条件
1 0 q1 2 0 q2
2015年12月6日
2 1 2 0 2 q1 2 2 2 0 2 q 2
博弈论第二章 第二讲纳什均衡
35
第三节 纳什均衡
27
第三节
纳什均衡
要点:(1)箭 头指向的支付 大;(2)只有 一方单独改变 策略
三、寻找纳什均衡的方法 (三)箭头指向法 2.分析:(适度放牧,过度放牧) (1)给定乙不变,甲改变:0→10 (箭头向上) (2)给定甲不变,乙也不变
2015年12月6日
博弈论第二章 第二讲纳什均衡
博弈及博弈论(1)
与其应用
100503116盛盼盼
从以下几个方面来学习:
• • • • • • • 定义 发展 类型 要素基本概念 应用及分析 意义 相关理论
定义:
• 博弈论(Game Theory),亦名“对策论”、 “赛局理论”,属应用数学的一个分支, 博弈论 已经成为经济学的标准分析工具之一。目前在生 物学、经济学、国际关系、计算机科学、政治学、 军事战略和其他很多学科都有广泛的应用。博弈 论主要研究公式化了的激励结构间的相互作用。 是研究具有斗争或竞争性质现象的数学理论和方 法。也是运筹学的一个重要学科。 博弈论考虑游 戏中的个体的预测行为和实际行为,并研究它们 的优化策略。生物学家使用博弈理论来理解和预 测进化论的某些结果。
博弈论的发展:
• 我国古代的《孙子兵法》就不仅是一部军 事著作,而且算是最早的一部博弈论专著。 博弈论最初主要研究象棋、桥牌、赌博中 的胜负问题,人们对博弈局势的把握只停 留在经验上,没有向理论化发展,正式发展 成一门学科则是在20世纪初。
• 对于博弈论的研究,开始于策墨洛 (Zermelo,1913)、波雷尔(Borel,1921)及冯· 诺伊曼 (von Neumann, 1928),后来由冯· 诺伊曼和奥斯 卡· 摩根斯坦(von Neumann and Morgenstern, 1944,1947)首次对其系统化和形式化(参照 Myerson, 1991)。随后约翰· 福布斯· 纳什(John Forbes Nash Jr., 1950, 1951)利用不动点定理证 明了均衡点的存在,为博弈论的一般化奠定了坚 实的基础。
• • •
•
A\B
坦白 ห้องสมุดไป่ตู้赖
坦白
8,8 10,0
博弈决策
斗鸡博弈
此博弈的战略式表述
东尼 退怯
吉米
退怯
3,3
勇进
4,2
勇进 2,4 0,0
斗鸡博弈
分析
吉米
退怯 勇进
东尼 退怯
3,3 4,2
勇进 2,4 0,0
抵赖
( -10, 0)
( -1, -1)
囚徒困境(Prisoner’s Dilemma)
结论:
演奏家将会承认
Tchaikovsky呢?
演奏家 坦白
囚徒困境(Prisoner’s Dilemma)
坦白
Tchaikovsky 抵赖
( -8, -8)
( 0, -10)
抵赖
( -10, 0)
( -1, -1)
斗鸡博弈
应用:公共产品的供给; 两军对抗; 商业竞争:占领市场
市场进入阻挠
参与者:垄断企业(在位者),进入者 面临的情况:在位者垄断着某个市场,进入者想要打进
这个市场分一杯羹 行动(策略):在位者:默许,斗争;进入者:进入,
不进入 收益函数
进入者进入,在位者默许,则进入者40,在位者50 进入者不进入,在位者默许,进入者0,在位者300 进入者进入,在位者斗争,则进入者-10,在位者0 进入者不进入,在位者斗争,则进入者0,在位者300
( -1, -1)
演奏家 坦白
囚徒困境(Prisoner’s Dilemma)
坦白
Tchaikovsky
抵赖
( -8, -8)
( 0, -10)
2022《博弈论与经济行为》读后感
《博弈论与经济行为》读后感《博弈论与经济行为》,是被誉为“博弈论之父”和“计算机之父”的约翰·冯·诺伊曼和奥斯卡·摩根斯特恩合著的经济学著作,此书是一本功力深厚、学风严谨、达到国际高水平的极好的经济学教科书。
它对中国经济学发展和莘莘学子的贡献不可低估。
博弈论中的经典案例"囚徒困境”对现实经济生活的一-些简单的理论上的分析,虽然在现实生活当中影响人们决策和态度的因素很多,但是,博弈论作为现代经济学的前沿领域,始终是一个强有力的分析工具。
在当前现代企业中,此书上的理论也是当前许多公司运营的理论。
博弈论的定义是什么?古代有一句很出名的话是这样说的,生活中的每一个人都如同棋手一样,人们所做的每一个行为就如同棋盘上布下的一个棋局,精明能干的棋手深思熟虑,知道如何赢得最终的胜利,能给人们呈现出精彩绝伦的棋局。
博弈论就是对棋局中颇为理性和逻辑的部分进行呈现,并且以科学的形式展现出来。
也就是说,其研究的是个体如何在复杂多变相互牵制的影响中知道最为合理的策略。
从事实的角度出发,博弈论在古老的博弈游戏比如象棋和扑克的基础上产生。
数学家们一般都知道如何将具体的事情抽象化,借助完整的逻辑框架和体系对变化规律进行研究。
但是这是一件困难的事情,通过最为简单的二人对弈,能够了解到其中的绝妙之处;如果两方都知晓自己和对手的每一个思路并且把对方当作最优秀的棋手,那么甲乙的对弈绝对非常精彩,因为彼此知道对方的心思,要不断地揣摩和思考,然后确定下一个步骤。
简单来说博弈论可以被定义为一个过程,在这个过程中,一些个人、团队或其他组织面对特定的环境条件,在特定的规则下,依赖于他们必须选择和实施的行动或策略的信息,这些行动或策略允许他们同时选择一次或多次,并在保持最优解的情况下不断更换策略。
博弈论是指当决策因素的行为直接影响到双方的决策,以及这些决策之间的平衡问题。
为了取得最好的结果,参与者为取得最优解必须采取的措施和对策。
王则柯博弈论5同时博弈与序贯博弈
• 用 q1( q1 ≥ 0 )表示企业1的产量选择; • 用 q( q2 ≥ 0)表示 企业2在观测到 q1 后所选择 2 的产量; • 用 p(q) = A − q 表示当市场总产量为 q 时的市场 出清价格,其中 q = q1 + q2 • 企业 i 的利润是 π i (q1 , q2 ) = qi [ p (q ) − ci )], i = 1,2 • 每个企业的利润可写为:
π i (q1 , q2 ) = qi ( A − q1 − q2 − ci )
q2 = q2 (q1 )
max q2 ≥0 π 2 (q1 , q2 ) max q2 ≥0 q2 ( A − q1 − q2 − c2 )
π 2 (q1 , q2 ) = −(q2 ) + ( A − q1 − c2 )q2
• 策略组合?纳什均衡?子博弈精炼纳什均衡?
5-5 完美博弈的库恩定理
• 是否每个树型表示的动态博弈都有纳什均 衡呢? • 库恩定理 完美信息的有限序贯博弈 (sequential game of perfect information)都 有纳什均衡。
课堂练习
• 用策略组合的粗线表示法和纳什均衡的虚线排除法画出并 讨论全部可能的对局或者策略组合,以虚线标示不是纳什 均衡的那些对局。 • 用虚线圈住的子博弈和相应的标示具有偏离激励策略的箭 头,排除那些不是子博弈精炼均衡的纳什均衡,得到子博 弈精炼的纳什均衡。
– 每一个决策位置都是一个信息集。
• 同集同注
• 当博弈走到一个单点集的信息集时,面临决策的 局中人对于博弈迄今的历史是清楚的,他清楚博 弈具体走到了他的这个决策节点而不是别的决策 节点。 • 当博弈走到一个非单点集的信息集时,面临决策 的局中人对于博弈迄今的历史是不清楚的,他不 清楚博弃具体走到了他的这个信息集里面的哪个 决策节点。
同时博弈论
两人都丢面子
B
进
退
-3
0
进 -3
2
2
0
退0
0
Case4.石头剪子布
1. 博弈方1,2;
2. 可选策略: 石头、剪子 和布;
3. 几乎同时决 策;
4. 所得利益: 0表示没有输 赢;1表示赢; -1表示输。
博弈方2 石头 剪子 布
石 0,0 1,-1 -1,1 博头 弈 方 剪 -1,1 0,0 1,-1
1.2.6 完全信息博弈和不完全信息博弈
• 完全信息博弈:是指每一参与者都拥有所有其他参 与者的特征、策略集及得益函数等方面的准确信息的博弈。 • 不完全信息博弈:是指参与者只了解上述信息中的 一部分的博弈。
将博弈的信息特征和行为时间特征结合起来,可以进一 步把博弈细分为下面四种类型的非合作博弈,得到四种均衡:
乙
左
中
右
0
3
1
甲上 1
1
0
4
2
0
下0
0
2
划线法——情侣博弈battle of sexes
一对情侣面临周末晚上安排什么节目的决策,Jim 是铁杆球迷,怎肯放过一场世界杯的生死之战?Eva 崇尚高雅艺术,正好有一场《胡桃夹子》的芭蕾舞剧。 分开各自做喜欢的事,对于热恋中的他们也是一种折 磨,怎么办?
Eva
同时决策/行动博弈
• 完全信息静态博弈中的行为假定
理性参与人 ----追求支付最大化
完全信息
----对策略、策略组合及相关支付完全了解
独立决策
----无勾结(不管是明的还是暗的)
• 同步决策(静态博弈)
在寡头市场,当经理们必须在无法知道竞争对手的决策的情况下做出自己的 决策时,同步决策博弈发生。
二人有限同时博弈的例子
二人有限同时博弈的例子即使是二人同时决策,博弈论也为我们提供了警示世人别太"聪明"的例子两个旅行者从一个以出产细瓷花瓶著名的地方旅行回来,他们都买了花瓶。
提取行李的时候,发现花瓶被摔坏了。
他们向航空公司索赔。
航空公司知道花瓶的价格总在八九十元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。
于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。
如果两人写的一样,航空公司将认为他们讲真话,于是按照他们写的数额赔偿;如果两人写的不一样,航空公司就论定写得低的旅客讲的是真话,并且原则上照这个低的价格赔偿,但是对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。
就为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写100元,这样两人都能够获赔100元。
可是不,甲很聪明,他想:如果我少写1元变成99元,而乙会写100元,这样我将得到101元。
何乐而不为?所以他准备写99元。
可是乙更加聪明,他算计到甲要算计他写99元,"人不犯我,我不犯人,人若犯我,我必犯人",他准备写98元。
想不到甲还要更聪明一个层次,计算出乙要这样写98元来坑他,"来而不往非礼也",他准备写97元。
大家知道,下象棋的时候,不是说要多"看"几步吗,"看"得越远,胜算越大。
你多看两步我比你更强多看三步,你多看四步,我比你更老谋深算多看五步。
在花瓶索赔的例子中,如果两个人都”彻底理性",都能看透十几步甚至几十步上百步,那么上面那样"精明比赛"的结果,最后落到每个人都只写一两元的田地。
事实上,在彻底理性的假设之下,这个博弈惟一的纳什均衡,是两人都写0。
这就是哈佛大学巴罗教授提出的著名的"旅行者困境"。
一方面,它有启示人们在为私利考虑的时候不要太"精明",告诫人们精明不等于高明,太精明往往会坏事;但是另一方面,它对于理性行为假设的适用性提出了警告。
博弈论第二章 (1)
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3
3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略
二、重复剔除严格劣战略
(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5
02 完全信息静态博弈
假设C为单位成本,则两商店的利润分别为
( p , p ) ( p c) D ( p , p ) ( p , p ) ( p c) D ( p , p )
当a=1-b时,即两商店位于同一位置,完全无差异,则
p
*
1
p
* 2
c
如果企业的竞争战略是价格,则Bertrand证明,即使只 有两个企业,在均衡情况下,价格等于边际成本,企业的 利润为零,与完全竞争市场均衡一样。这就是“伯川德悖 论(Bertrand Paradox)”。 解开这个悖论的办法之一就是引入产品的差异性。
* * ,sn ) 的各一个策略组成的某个策略组合 (s1 中,任一参与人
* * 的策略,都是对其余参与人策略的组合 (s1 ,si*1 , si*1 ,...sn )
* * * * ,si*1, si* , si*1,...sn ) ui (s1 ,si*1, si , si*1,...s, 的最佳对策,即 ui (s1 n)
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1
6q1 q1q2 q12
u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2
6q2 q1q2 q22
古诺模型的反应函数
maxu1 max(6q1 q1q2 q12 )
* * ( ui (si* , s )对任意 s S i 都成立,则称 ) u ( s , s i i i i )
i
s
*
* * ( s1 , sn ) 为 G 的一个纳什均衡
妙趣横生博弈论读后感 [关于妙趣横生博弈论的读后感]
《妙趣横生博弈论读后感 [关于妙趣横生博弈论的读后感]》摘要:博弈大致有以下两种分类:按照博弈各方是否同时决策可以分为:同时决策博弈(静态博弈)、序贯决策博弈(动态博弈)、同时决策博弈与序贯决策博弈的混合博弈,在多次博弈中,背叛仍不可避免,但合作的几率会相比一次博弈有提高,教授是当时东北财经大学最年轻的教授(时年 35 岁, 32 岁时就破格晋升为教授),他把一门很深的学问给我们讲得惟妙惟肖,非常生动博弈大致有以下两种分类:按照博弈各方是否同时决策可以分为:同时决策博弈(静态博弈)、序贯决策博弈(动态博弈)、同时决策博弈与序贯决策博弈的混合博弈。
下面是有妙趣横生博弈论的读后感,欢迎参阅。
博弈小术语:收益矩阵、均衡、纳什均衡、零和博弈论,也称互动的决策论。
它的基本假设之一是人是理性的。
但现实并非如此,人不可能具有完备的知识也不可能时时理性。
尽管如此,人们仍然乐意用博弈论的方法来解释和分析现实社会现象。
每一次的人际交往都可以简化成两个基本选择:合作或背叛。
比如在前面的日志里提到的囚徒困境,在人际交往中普遍存在囚徒困境:双方明知合作能带来双赢,却因为理性的自私和信任的缺乏而导致合作难以形成。
当一次性博弈出现时,人们往往会选择背叛。
这在现实生活中也有很多例子,比如飞机场,为什么食品价格敢定那么高呢?因为它知道候机的乘客不会是它的长期客户。
而当博弈的终点不可知时,就又是另一回事了。
在多次博弈中,背叛仍不可避免,但合作的几率会相比一次博弈有提高。
至于如何更加有效地减少背叛,一种办法是引入惩罚机制,可以是带剑的法律或温和些的道德约束。
现实中的集体活动等候上车问题就是个例子,让那些迟到的人自己负责任就是一种惩罚措施。
当然,如果在开头就有一些善意的人出来表明合作态度对提高合作机会也是有帮助的,不管这些善意的人是出于何种目的。
一旦合作开始,人们就能体验到合作的好处,并乐于坚持一段时间。
至于时间的长短,关键是看博弈的终点是否明确。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 如,卡特尔结盟博弈、公共产品的供给、军备竞争及 经济改革等。
2.策略
• 策略:参与博弈的各局中人在进行决策时,可以 选择的方法、做法或经济活动的水平、量值等。 是局中人的决策内容。
左 1 上 2 2
局中人2 中 5 0
右 3
局中人1
下 1
7
0
2
3
2
左
局中人2 中 1 5
2 7 7 0 3 0
右
3
上 2 局中人1 下 1
对于对手的每一个具体的策略选择,相对优势策略总是有的, 但是不必唯一。
2
• 因为“全局优势策略一定是相对优势策 略”,所以用“劣势策略消去法’’做出 来的“优势策略均衡”,都可以用 “相对 优势策略划线法”做出来。 • 试:囚徒困境 • 公明博弈
个纳什均衡。
• 移动的方向要注意:
– 例如:情侣博弈的(2,1)。
论证否命题
• 一个策略组合要成为博弈的纳什均衡,必须在这
个策略组合下所有博弈参与人都没有单独改变策
略选择的动机。 • 但要论证一个策略组合不是博弈的纳什均衡,只 要指出在这个策略组合下有一个博弈参与人有单 独改变策略选择的动机,就已经足够。
2-5 相对优势策略和纳什均衡
• 相对优势策略
– 与绝对的优势策略不同,局中人的相对优势策 略,是在他的对手选定某个具体策略的条件下 他的优势策略。 – 优劣的相对性,是相对对手的具体策略选择而 言的。 – 在多人博弈的情况下,局中人的相对优势策略, 是在他的每个对手都选定各自的具体策略的条 件下他的优势策人有限博弈的每个局中人,找出 他相对于对手的每种可能的策略选择的相对优势策 略,并且在对手的这种策略选择和自己的相对优势 策略组成的具体的策略对局时自己的得益之下,划 一短线。当这样做完以后,矩阵中两个支付数字下 面都划了线的格子所表征的策略对局,就是这个博 弈的纳什均衡。
情侣博弈
男 足球 2
女 足球 1 0 -1 芭蕾 -1 2 1 芭蕾 0
纳什均衡: 足球,足球;芭蕾,芭蕾 先动优势 • 情侣博弈中,双方都没有严格优势策略和严格劣势策略。 • “纳什均衡”指明了情侣博弈等一大类局中人各策略之间 不存在绝对优劣关系的博弈的可能的结局。 • “相对优势策略”的组合
纳什均衡
• 局中人单独改变策略不会得到好处的对局即策略 组合,就叫做纳什均衡。 • 注意:纳什均衡是对局,是双方策略的组合,而 不是这些对局或者策略组合下相应的支付。
检验纳什均衡
• 盯住一个格子,如果这个格子里面右上方的数字 向右或者向左移动都不变大、这个格子里面左下 方的数字向上或者向下移动也都不变大,那么这 个格子代表的策略组合,就是这个二人博弈的一
3.支付
• 在每一个博弈中,给定一个策略组合,参与博弈 的每一个局中人都会有相应的支付。
• 支付,是指每个局中人从博弈中获得的利益,它 体现每个参与博弈的局中人的追求,也是他们行 为和决策的主要依据。 • 支付本身可以是利润、收入、量化的效用、社会 效益、福利等。
• 支付可取正值,也可取负值,取正值表示得益。
– 一次一次把认定的劣势策略消去,其中有些劣势策略 可以是弱劣势策略。
• 一个博弈的某个策略组合中的所有策略都是各个 局中人各自的优势策略,称为该博弈的一个优势 策略均衡。
寻找优势策略均衡求解的局限
• 关注于寻求优势策略试图得到优势策略均衡,往
往会漏掉博弈的一些可能的结果。如,公明博弈
• 一些博弈根本没有优势策略均衡。
需要说明的两点
• 随便用什么方法来标记都可以。 • 原则上,相对优势策略标记法适用于任何 有限博弈,即可用于多人有限博弈。
2-4 优势策略均衡
例子:公明博弈
• 装修行要2000元,可赚1000元; • 公明的保留价格正好就是2000元; • 以1200元成交,装修行赚了600元,公明省 了800元。
• 弱劣势策略——弱优势策略
• “严格优势策略”和“弱优势策略”统地称为“优 势策略” • “严格劣势策略”和“弱劣势策略”统地称为 “劣势策略”。 • “严格劣势策略逐次消去法”——“普通劣势策略 消去法”
• 二人有限博弈由它的一对支付矩阵A和B决定。 • 用一对支付矩阵(A,B)来表述一个博弈的时 候,称这个博弈被表示为双矩阵形式 (bimatrix form)。
有限博弈
• 局中人数目有限并且每个局中人可以选择 的(纯)策略的数目也有限的博弈,叫做有限 博弈(finite games)。 • 判断:
• 严格优势策略均衡
例子
L 0
T 局中人1 M B 0 2 0 2 1 2 0 4 5 1 1 3 3 局中人2 C
R 0
3 0
3
• 并不是每一个博弈都存在严格优势策略。
– 博弈并不一定存在严格优势策略和与之相对的严格劣
势策略,严格劣势策略逐次消去法在使用上有局限性。
• 弱优势策略:不管其他局中人选择什么策略,一 个局中人选择他的某个策略给他带来的支付(仅仅 只是)不低于他选择任何其他策略。
第二章 同时决策博弈(1)
• 2-1 二人同时博弈的三要素 • 2-2 支付矩阵 • 2-3 优势策略 • 2-4 优势策略均衡 • 2-5相对优势策略和纳什均衡 • 2-6相对优势策略划线法
2-1 二人同时博弈的三要素
• 博弈的三要素
– 局中人 – 策略/行动 – 支付/得益
1.局中人
• 局中人:一般是指博弈中独立决策、独立 承担博弈结果的个人或组织。 • 在不完全信息情形中,有时需要引入一个 “虚拟局中人”(pseudo-player),如,上 帝、老天爷、大自然等等。 • i=l,2,…,n表示局中人
S1 S2 S3 [0,1]
• 支付函数为:
u ( x yz 1 x, y , z) u( x yz 2 x, y , z) u( xy z 3 x, y , z)
2-3 优势策略
• 优势策略(dominant strategy)
– 在某个博弈中,如果不管其他局中人选择什么 策略,一个局中人的某个策略选择给他带来的 支付始终高于其他策略选择,或者至少不低于 其他策略选择,这样,只要这个局中人是一个 理性的局中人,那么他必定愿意选择这个策略。 – 优势策略可分为:
• 用 u i 表示局中人i的支付,它是策略组合 s 的函数。
• 支付向量
例子
• 石头,剪刀,布
– 策略集 – 策略组合 – 支付向量(1赢,0平,-1输)
2-2 支付矩阵
• 试写出“石头剪刀布”支付矩阵
二人博弈的一般性矩阵表示
• 双矩阵分解为两个支付矩阵
T.C.Schelling的贡献
2-6 相对优势策略划线法
• 对于策略之间只存在相对优劣关系的二人博弈问
题,如果策略集是有限的,比如局中人1有m个策
略选择,局中人2有n个策略选择,那么我们可以 写下m行n列共m×n个格子的支付矩阵。那么, 可以采取“相对优势策略划线法”(Method of underlining relatively dominant-strategies),找出 博弈的纳什均衡。
0大于-1
抵赖是B的严格劣策略
抵赖是A的严 格劣策略
严格优势(劣势)策略
严格劣势策略逐次消去法
• 严格劣势策略逐次消去法(Iterated Elimination of Strictly Dominated Strategies)
– 在分析一个局中人的决策行为时,首先把一个严格劣 势策略从该局中人的策略集中去掉,然后在剩下的策 略范围内,试图再找出这个局中人或者别的局中人的 一个严格劣势策略,并将它去掉。不断重复这一过程, 直到对每一个局中人而言,再也找不出严格劣势策略 为止,简记为IESDS。
• 整体的严格优势策略(strictly dominant strategy) 如: 囚徒困境 • 弱优势策略(weakly dominant strategy)
严格劣势策略
案例-囚徒困境
囚徒A
坦白
囚徒 B
抵赖
坦白 抵赖
-8,-8
-10,0
-8大于-10
0,-10
-1,-1
-8大于-10 0大于-1
• 在不同的博弈中,可供局中人选择的策略的数目 很不相同。
– 囚徒困境 – 古诺竞争的产量决策
数学表示
• 一般用 s i 表示局中人i可以选择的一个特定策略, 而 S i 表示局中人i可以选择的所有策略所构成的集 合,称为策略集(strategy set),也称为策略空间 (strategy space)。 • n个局中人每人选择一个特定的策略,则n维向量 s =( s1,… , s n )称为一个策略组合。 • 例:囚徒,古诺
– 诺曼底战役模拟博弈 – 囚徒困境博弈 – 企业古诺产量博弈
三人博弈
• 例子
– 局中人:A、B和C – 每个局中人有三种策略:数字1,2,3 – 支付:每个局中人得到4乘以三人中所选的数 字中的最小者,再减去自己所选的数字。
正规型(策略型)博弈定义
例子
• 考虑三个局中人参加的一个策略型博弈,三个局 中人的策略集一样,都是[0, 1]区间:
• N={1,2,…,n}表示局中人的集合。
• 博弈问题的根本特征是博弈本身具有策略 依存性。 • 博弈中局中人的个数是博弈结构的关键。
• 根据局中人的个数博弈可分为“二人博弈” 和“多人博弈”。
需要注意的两点
• 在二人博弈中,局中人双方的利益并不总是相互
完全冲突的,有时候也会出现双方利益方向一致