动态博弈剖析经典实例共53页
第五章 不完全信息动态博弈1
1、基本思路 、
在不完全信息动态博弈:①“自然 选择i类型 自然” 类型θ 参与人i自知 自知, 在不完全信息动态博弈:①“自然”选择 类型 i,θi参与人 自知, 其 他 人 -i 不 知 ; ② 在 N 选 择 后 , 参 与 人 i 开 始 行 动 ( 有 先 有 后 ( 动 态)),后行动者能观测到先行动者的行动,但不能观测到先行动者 )),后行动者能观测到先行动者的行动, 的类型(后者知前者的a,不知前者的θ) 的类型( 后者知前者的 , 不知前者的 ),但 a=a(θ),于是从 了 ( ) 于是从a了 解到θ(后行动者可以通过观察先行动者的行动a来推断其 来推断其θ或修正对 解到 ( 后行动者可以通过观察先行动者的行动 来推断其 或修正对 其类型的先验信念(概率分布) 然后③ 其类型的先验信念(概率分布),然后③后行动者选择自己的最优行 先行动者预测到自己的行动将被后行动者所利用, 动。先行动者预测到自己的行动将被后行动者所利用,就会设法选择 传递对自己最有利的信息,避免传递对自己不利的信息。 传递对自己最有利的信息,避免传递对自己不利的信息。 因此,博弈过程不仅是参与人选择行动的过程, 因此,博弈过程不仅是参与人选择行动的过程,又是参与人修正信念 的过程(主观概率) 的过程(主观概率)。 (1)两个例子 ) – 例1、“黔驴之技” 、 黔驴之技” – 例2、市场进入 、 (2)上一章的 )上一章的BNE无法全面分析上述动态博弈的均衡结果 无法全面分析上述动态博弈的均衡结果
k =1
2、贝叶斯法则 、
例1、“黔驴之技” 、 黔驴之技”
毛驴刚到贵州,是个庞然大物,老虎躲在树林偷偷地瞧(最优) ①毛驴刚到贵州,是个庞然大物,老虎躲在树林偷偷地瞧(最优)②老 虎走出树林, 想了解毛驴的真实本领的信息) 有一天毛驴大叫一声, 虎走出树林,(想了解毛驴的真实本领的信息),有一天毛驴大叫一声, 老虎被吓逃了(最优) 又过了几天,老虎习惯毛驴的叫声, 老虎被吓逃了(最优)③又过了几天,老虎习惯毛驴的叫声,老虎靠近 毛驴,毛驴用蹄子去踢老虎,这一踢向老虎传递的信息是“毛驴不过这 毛驴,毛驴用蹄子去踢老虎,这一踢向老虎传递的信息是“ 点本事而已” 老虎一下扑向毛驴,将其吃掉。这个故事里, 点本事而已”,老虎一下扑向毛驴,将其吃掉。这个故事里,老虎通过 观察毛驴的行为逐渐修正对毛驴的看法,直到看清它的真面目, 观察毛驴的行为逐渐修正对毛驴的看法,直到看清它的真面目,把它吃 掉。 这是一个PBNE,老虎的每一步行动都是给定它的信息下最优的。事实 这是一个 ,老虎的每一步行动都是给定它的信息下最优的。 上,这个故事里,毛驴的行为也是很理性的,它知道自己技能有限,所 这个故事里,毛驴的行为也是很理性的,它知道自己技能有限, 以不到万不得已是不用那仅有的一技的,否则它早就被老虎吃掉了。 以不到万不得已是不用那仅有的一技的,否则它早就被老虎吃掉了。 精练贝叶斯均衡( 精练贝叶斯均衡(PBNE):是不完全信息动态博弈均衡的基本均衡概 ) 它是泽尔腾( 念,它是泽尔腾(selten)的完全信息动态博弈子博弈精练 和海萨尼 )的完全信息动态博弈子博弈精练NE和海萨尼 的结合。 (Harsanyi)的不完全信息静态 )的不完全信息静态BNE的结合。 的结合
博弈论第四讲动态博弈
制止
(-2,5) 制止
仿冒
A 不仿冒
B
不制止 (0,10)
仿冒
A
B 不制止
不仿冒 (5,5)
(2,2)
(10,4)
节点: 边: 终节点:
引子
每一阶段节点数、每一个选择节点的可选行为 数量,都可以不同,比如
仿冒更多次数、仿冒的规模和程度、制止仿冒的力 度
也不是所有动态博弈都可以用扩展形
阶段很多,或在一个阶段有很多可以选择的行为, 如下棋
双寡头竞争:古诺(Cournot)博弈
设一市场有1,2两家厂商生产同样的产品。如果厂商1的产量为 q1,厂商2的产量为q2 ,则市场总产量为Q= q1+ q2 。设市场出 清价格P是市场总产量的函数P(Q)=a-(q1+q2)
两个企业同时选择产量,价格由市场决定; 假设每家公司的成本函数相同,并且每单位成本不随生产的数量
古诺寡头模型扩展--斯塔克博 格模型(Stackelberg)
先分析第二个厂商的决策:?
因为其决策时,厂商1的选择q1实际上已经决定了, 并且厂商2知道q1,因此对厂商2来说,相当于在给 定q1的情况下求使II2实现最大的q2 ,
II2对q2求导,得到q2必须满足:a-c- q1 -2 q2 =0, 即q2 *=(a-c- q1)/2
法律保障 --单次 企业信用体系--全寿命,一旦有失信发生,它的信用记录
有一笔摸不去的黑,将来它做生意也好,向银行贷款也好, 都会受此影响。所以国外企业对信用问题看的非常严重-- 电子商务的信用记录
关键在于必须增加一些对甲行为的制约!
在上面,甲选择不分,乙完全无可奈何;只能采取消极办法 -不借,保护自己不被骗
变化。更正规一些,每家公司具有常数边际成本函数;C(qi ) cqi
第四讲 动态博弈
R (0,0)
2
U
1
L (3,1) (2,2)
D
修改的市场进入博弈
试说明上述不可置信的威胁是什么? 现实生活中的例子:父亲坚决不同意女儿 的婚事,威胁说,如果女儿不与相爱的人 断绝关系,他就与女儿断绝父女关系。
逆向归纳法
逆向归纳法可以排除不可置信的威胁。之 所以可以如此,根本原因在于采用了一种 分析动态博弈的有效方法——逆向归纳法, 即从动态博弈的最后一个阶段博弈方的行 为开始分析,逐步倒推回前一个阶段相应 博弈方的行为选择,一直到第一个阶段的 分析方法。一般方法是:从最后一阶段开 始分析,每一次确定出所分析阶段博弈方 的选择和路径,然后再确定前一阶段的博 弈方选择和路径。
(L/L,L/S) (L/L,S/S) (S/L,L/S) (S/L,S/S)
(若史密斯选择大则选择大;若其选择小则选择大) (若史密斯选择大则选择大;若其选择小则选择小) (若史密斯选择大则选择小;若其选择小则选择大) (若史密斯选择大则选择小;若其选择小则选择小)
跟随领头羊Ⅰ表明只要添加一点复杂性,就 使得策略式表述变得晦涩难懂,几无用武之 地。策略式如下。
威胁是指一个参与人承诺一旦其他参与人 偏离均衡,他将采取的某种行动,威胁是 有 一定影响力的,尽管可能它从未被实施 过。
在位者
默许 斗争 进入 40,50 -10,0 进入者 不进入 0,300 0,300 市场进入博弈中,如若进入者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润,所以 斗争就是一种不可置信的威胁。但纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)就成为一个纳 什均衡。
例如,一个模型不能在一开始就说德国相信它打 赢一场与法国的战争的概率是0.8,而法国相信这 一概率只有0.4,因此它们急欲一战。恰恰相反, 它必须假定信念(先验概率)开始时是一致的, 随后因为私人信息而产生分歧。例如两个参与人 都认为德国获胜的概率是0.4,但若德国的将军是 个军事天才,则这一概率就是0.8,而且随后德国 人发现德国的将军确实是个天才。如果是法国抢 先宣战,那么法国的错误信念可能会导致一场战 争,而若德国能令人信服它对德国将军天才的私 人信息,则这场战争本可避免。
博弈课件第一章动态博弈4
系,是不能分割的整体. 因此在动态博弈中,研究某 个博弈方某个阶段的行为, 或者将各个阶段的行为割 裂开来研究是没有意义的. 动态博弈中某博弈方的策略 是指轮到他选择时, 针对前面阶段的各种情况,以及后续阶段可能的选择 所作相应选择的完整计划. 动态博弈的结果 包括双方(或多方)采用的策略 组合、实现的博路径和各博弈方的收益. 四、动态博弈的非对称性 因为动态博弈中各个博弈方的行为选择有先后次 序的,且后行为者能观察到此前博弈方的行为选择, 因此动态博弈中各博弈方的地位是不对称的. 另外,在 动态博弈中各博弈方的阶段选择不一定是交替进行的.
a1A1
假定参与者1的这一最优化问题也有唯一解, 表示为 a1 ,我们称 (a1 , R(a1 ))是这一博弈的逆向归纳解. 逆向归纳解不含有不可置信的威胁:因为参与者1能够 预测到参与者2 对1的可能选择的最优反应, 这一预测
排除了参与者2不可置信的威胁. 逆向归纳法背后的理性假设. 看下例三阶段两个参与者的动态博弈. 三阶段两个参与者的动态博弈的博弈树表示.
三阶段的“打”并不需要真正实施,但它是保证第 二阶段甲会分的关键,乙的策略中必须包含这个选 择. 既然双方上述策略构成一个纳什均衡,它应该 是具有稳定性的,但事实上乙根本就不会选择 “借” . 为什么会出现这种矛盾呢?主要在于乙第三阶段 的“起诉”是不可信的. 纳什均衡在动态博弈可能缺乏稳定性的根源在于 它不能排除博弈方策略中所包含的不可信的行为设定 不能解决动态博弈的相机选择引起的可信性问题. 动态博弈的有效分析概念,除了要符合纳什均衡 的基本要求以外,还必须满足另一个关键的要求,那 就是它(或者它们)必须能够排除博弈方策略中不可
博弈的结果: (借,还)
案例:开金矿博弈 版本3:法律保障不足的开金矿博弈 P1 不 还 P1
不对称信息动态博弈
不对称信息动态博弈第一节 不对称信息动态博弈的描述5.1.1 精炼贝叶斯纳什均衡在不对称信息博弈中,如果考虑博弈的动态性质,就会带来一些新的考量。
下面看看一个例子:例子5.1恋爱博弈在人生中,也许婚姻是最具代表性的不对称信息博弈,并且还是动态的博弈。
结婚的男女双方都不知道对方是否在未来的婚姻生活中是适合自己的。
为了简化分析,我们假定恋爱的一方(譬如男方)知道自己是否适合自对方的,但是对方(女方)并不知道男方是否适合她。
在图5.1中给出的一个不对称信息动态博弈中,“自然”N 首先选择参与人1(男方)的两种类型{}1112=,=θθ适合女方的男方不适合女方的男方中的某一种(当然,对于女方来说,是不是适合自己有多种含义,可以是是不是真心爱自己,也可以是不是能够挣钱,或者两者都有要求),参与人2(女方)对N 的选择具有不对称信息,她只知道男方适合或者不适合自己的可能性各占一半,我们称参与人2的先验概率为211212()()0.5P P θθ==,参与人2的类型是对称的。
(在现实中,可能男方自己也不知道自己是不是适合对方,譬如自己是否真心爱女方,或者是否能够挣钱;也就是说,男方自己对于自己的类型也是不清楚的;在这里,我们作简化的假定,即男方自己是知道自己的类型的 )男方有两个行动可以选择,一个是主动追求女孩L (L 在这里可以表示“爱”(Love ),也表示图中的左边(Left ),一个是不主动追求女孩R (表示“拒绝(refuse )”或者右边(right ));女孩也有两个行动可以选择,一个是向男孩示好l ,一个是不向男孩示好r (在这里的大小写没有男权主义的意思);N图5.1 恋爱博弈我们来分析这样的博弈是如何达到均衡的。
当女方看见男孩追求自己的时候,她不知道男孩子是否是适合自己的,连接两个L 点的虚线就表示女孩子不知道她位于哪一个点上,这两个点都是可能的,它们构成一个“信息集”h ;类似地,连接两个R 点的虚线表示女孩子看见男孩子没有主动追求自己的时候,她不知道她位于哪一个点上,这两个点都是可能的,它们构成一个“信息集”f 。
博弈论的实例分析
博弈论的实例分析一.“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。
讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。
可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。
A和B均坦白是这个博弈的纳什均衡。
这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。
即是说,不管A坦白或抵赖,B的最佳选择都是坦白。
反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。
结果,两个人都选择了坦白,各判刑8年。
在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。
二.电信价格竞争根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。
假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争,一开始的价格都是P0。
A(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)则刚刚成立不久,翅膀还没有长硬,是政府为了打破垄断鼓励竞争而筹建起来的。
正因为B是政府扶植起来鼓励竞争的,所以B得到了政府的一些优惠,其中就有B的价格可以比P0低10%。
这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。
在这样的市场分配下,A、B可以达到平衡,但由于B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成了影响。
这时候,A该怎么做?不妨假定:A降价而B维持,则A获利15,B损失5,整体获利10;A维持且B也维持,则A获利5,B获利10,整体获利15;A维持而B降价,则A损失10,B获利15,整体获利5;A降价且B也降价,则A损失5,B损失5,整体损失10。
生活中的博弈论案例
生活中的博弈论案例在生活中,我们经常会面临各种各样的选择和决策,而这些选择和决策往往都涉及到博弈论的原理。
博弈论是研究决策者之间策略的交互和结果的数学理论,它可以帮助我们更好地理解和分析生活中的各种情境。
下面,我将通过一些生活中的案例来说明博弈论的应用。
首先,我们来看一个经典的案例,囚徒困境。
假设有两名罪犯被捕,警察没有足够的证据来定罪,于是他们分开审讯。
如果两名罪犯都保持沉默,警察只能以轻罪定罪,每人判刑1年;如果其中一人交待,而另一人保持沉默,交待的罪犯将被免罪,而另一人将被判10年;如果两人都交待,那么每个人都将被判3年。
在这种情况下,每个人都会面临一个选择,是保持沉默还是交待对方。
这个案例中涉及到了合作与背叛、信任与背叛的问题,而最终的结果将取决于双方的选择。
另一个案例是超市定价策略。
假设有两家竞争对手的超市,它们在定价上存在博弈。
如果一家超市降低价格,另一家超市也会跟随降价,这样双方都会获得更少的利润;如果一家超市提高价格,而另一家超市保持不变,那么提高价格的超市将失去市场份额。
在这种情况下,双方都在考虑对方的策略来做出最优的决策,这就是典型的博弈论案例。
此外,还有许多其他生活中的例子可以用来解释博弈论的原理,比如政治竞选、商业竞争、劳资关系等。
在这些情境下,各方都在考虑对方的策略来做出自己的选择,而最终的结果往往是双方都在寻求最大化自己利益的平衡点。
总的来说,博弈论是一种非常有用的工具,可以帮助我们更好地理解和分析生活中的各种情境。
通过学习博弈论,我们可以更好地理解人们在决策过程中的行为,并且可以更好地制定自己的策略来应对各种情况。
希望通过这些案例的分析,可以帮助大家更好地理解博弈论的原理,从而在生活中做出更加明智的选择。
动态博弈
8 1 1 1
完全信息动态博弈
15721546 马广庆
E F
扩展式博弈
Lorem ipsum dolor sit amet, consectetur
扩展式博弈纳什均衡
Lorem ipsum dolor sit amet, consectetur
子博弈精炼纳什均衡
Lorem ipsum dolor sit amet, consectetur
逆向归纳法
Lorem ipsum dolor sit amet, consectetur
动态博弈实例分析
Lorem ipsum dolor sit amet, consectetur
重复博弈
Lorem ipsum dolor sit amet, consectetur
前言
• 智猪博弈 • 囚徒困境 • 古诺模型 • 市场进入阻扰模型 • 房地产开发博弈 • 田忌赛马
max u 2 (a1 , a 2 )
a 2 A2
2016
动态博弈模型
Stackelberg博弈模型 两个企业进行先后确定产量水平的两阶段动态博弈 第一阶段,作为领导者的企业1首先制定产量;第二阶段,作为跟随者的企业 2观察到企业1制定的产量水平后,按照利润最大化原则制定其产量。 假设两个企业的边际成本相等,c1 c 2 c - q1 q 2)其中a>0为常数, 市场需求函数为 p a ( 企业的战略选择,市场需求是共同知识。
• 动态博弈指的是参与人的行动有先后顺序,且后行动者能够观察到先行动者
•
所选择的行动。 注:也就是说在动态博弈中的参与人不仅要考虑自己策略对自己的影响,也 要考虑自己策略对他人的影响。
博弈论的经典案例
囚徒困境
“囚徒困境”反映的问题:
个人理性与集体理性的矛 盾!
囚徒困境
现实生活中哪些情形具有“囚徒困境”?
1. 寡头垄断市场上产量的确定,如石油输 出国组织(OPEC);
2. 公共产品的供给; 3. 美苏军备竞赛; 4. 素质教育与应试教育。
智猪博弈反映:
多劳者不多得!
智猪博弈
智猪博弈的实例:
1.股东对股份公司的监督; 2.股票市场; 3.大、小企业对新产品的开发; 4.公共产品的提供。
3 性别战
一对恋人决定周末出去活动。他们 的活动选择有——看足球和看芭蕾。
假设男孩喜欢看足球,女孩喜欢看 芭蕾,但他们又不愿意分开活动。如果 他们各自单独决策,将如何选择?
6 石头、剪刀、布
存在类似于猜硬币游戏的均衡吗?
7 市场进入阻扰博弈
在某一产品生产领域,一厂商(称为 在位者)单独生产该产品,获得高额利润 300。现有另一厂商(进入者)准备进入该 产品市场。
市场进入阻扰博弈
进入者面临的选择——“进入”或“不 进入”;
在位者面临的选择——“默许”或“斗 争”。
猜硬币
此时,甲乙都不再采用单纯“正”策 略和“反”策略,而是采用混合策略, 即以50%的概率选择策略“正”、 “反”。
甲——(50%,50%)
乙——(50%,50%)
6 石头、剪刀、布
B
石头 剪刀 布
石头 0,0 1,-1 -1, 1
A
剪刀 -1, 1 0, 0 1, -1
布 1,-1 -1,1 0, 0
囚徒困境
“囚徒困境”引申出来的结论:
一种制度(体制,协议)安排, 要 发 生 效 力 , 必 须 是 一 种 Nash 均衡。否则,这种制度安排便不 能成立。
博弈论 完全信息动态博弈(1)
完美信息博弈:N → A →B情形
自然先确定市场需求状态:高需求或低 需求;开发商A在观察到市场需求状态后 决定是否开发;开发商B在观察到市场需 求状态和A的决策后再决定是否开发。 开发 开发 高需求 ○ N 低需求 不开发 A 开发 不开发 B (2,2)
不开发 (4,0) 开发 不开发 (0,4) (0,0)
不开发 开发 不开发 开发 不开发
1-p
不开发
完全信息静态博弈的博弈树
开发 开发 高需求 ○ N 低需求 不开发 A 开发 不开发 B (2,2) 不开发 (4,0) 开发 (0,4) 不开发 (0,0) 开发 (-1,-1) 不开发 (1,0) 开发 (0,1) 不开发 (0,0)
不完全信息静态博弈的博弈树
枝的图示
枝是一个从决策结到它 的直接后续结的连线, 代表参与人的一个行动 选择。 枝:不但完整地描述了 每一个决策结参与人的 行动空间,而且给出了 从一个决策结到下一个 决策结的路径。
1 U z1 L z2 P z3 D 2 R 3 Q z4
(3) 信息集
博弈树上所有决策结分割成不同的信息集(记为 h∈H),它是X的一个子集,满足: (1)每一个决策结都是同一参与人的决策结; (2)该参与人知道博弈进入该集合的某个决策结, 但不知道究竟处于哪一个决策结。 记h(x)是X中包含x的信息集,如果x″∈h(x),则满足: (1)x∉P(x″),且x″ ∉P(x); (2)i(x)=i(x″); (3)A(x)=A(x″)。 在此基础上,即可用A(h)表示给定信息集h下的行动 集合。
要素详解
参与人:博弈中的决策主体,有时包括“自然” 作为“虚拟参与人”。 行动:是参与人在博弈的某个时点的决策变量。 行动组合:参与人的行动的有序集。 行动顺序:静态博弈和动态博弈 信息:是参与人有关博弈的知识,如有关“自然” 的选择、其他参与人的特征和行动的知识等。 完全信息(complete information) 完美信息(perfect information) 对称信息(symmetric information) 确定信息(certain information)
动态博弈分析经典实例
43
2013-7-14
44
工作竞赛
2013-7-14
45
2013-7-14
46
2013-7-14
47
2013-7-14
48
2013-7-14
49
2013-7-14
50
2013-7-14
51
2013-7-14
52
2013-7-14
53
2013-7-14
11
图 2 . 1 . 3 描述了工会的无差异曲线,若令 L 不变, 当 w 提高时工会的福利就会增加,于是较高的无 差异曲线代表了工会较高的效用水平。
2013-7-14
12
2013-7-14
13
表现在图 2 .1.3 的无差异曲线上就是,工 会希望选择一个工资水平w ,由此得到的 结果(w , L *(w))处于可能达到的最高的无差 异线上。 这一最优化问题的解为 w*,这样一个工资 要求将使得工会通过(w*,L*(w*)) 的无差异 曲线与 L*(w)相切于该点,如图 2 . 1 . 4 所 示。 从而, (w*,L*(w*))就是这一工资与就业博 弈的逆向归纳解。
2013-7-14
8
2013-7-14
9
图 2 . 1 . 2 把 L *(w)表示为 w 的函数(但坐标 轴经过旋转,以便于和以后的数据相比较),并表 示出它和企业每条等利润线交于其最高点。
2013-7-14
10
若令L 保持不变, w 降低时企业的利润就会提高, 于是较低的等利润曲线代表了较高的利润水平。
2
2013-7-14
2013-7-14
3
2013-7-14
4
不完全信息动态博弈
但是,这种“打斗”行为尽管可以击退进入者,但由于 一段时间的降价经营可能对垄断者带来较大损失。垄断者为 了避免这种损失,可以向外宣布它是低成本的,别的厂商休 想进来与它竞争。但仅凭口头宣布人家是不会相信的,因为 即使垄断者不是低成本的厂商,它也会如此宣布。 一种方法就是,垄断者向外发送一个信号,向外界传 递它真是低成本的信息。它可以长期在一个较低价格水平上 经营。如果它的价格足够低,高成本厂商不敢模仿,行内厂 商会据此判定它确是低成本的。同时,它的价格也不能太低, 以致于较之与进入者进行降价竞争,其损失为小一些。这样, 垄断者才会采取如此策略。潜在的高成本进入者不敢 进入,垄断者得以保持长期的垄断地位。
N
●
P
●
1-P●ຫໍສະໝຸດ 进入者 进●进入者 进
不进
●
不进
●
在位者 (0,400) 打击
● ●
●
在位者 打击
●
(0,300)
●
(40,50)
(-10,0) (30,80) (-10,100)
海萨尼转换后的市场进入博弈
三、贝叶斯法则
在不完全信息开始之前,“自然”首先行动,选择各参与人 的类型。各参与人除了知道自己的类型以外,对“自然”的 行动都有着一致的信念,称之为先验信念。之后,参与人先 后行动,后行动者能观察到先行动者的行动,但观察不到先 行动者的类型。但是,因为参与人的行动是依赖于其类型的, 每个参与人的行动都传递着有关自己类型的某种信息,后行 动者可以通过观察先行动者的行动来修正对其各种类型判断 的先验信念(概率分布),然后选择自己的最优行动。先行 动者预测到自己的行动将被后行动者所利用,也就会设法传 递对自己有利的信息,避免传递对自己不利的信息。因此, 不完全信息动态博弈不仅是参与人选择行动的过程,更是参 与人不断修正信念的过程。
动态博弈分析
策略式表示
B
策略
一
A
策略
二
策略
三 1 ,0 0 ,1
策略
四 1,0 0,0
开发 不开发
-3,-3 -3,-3 0,1 0,0
• 策略一:无论A是否选择开发,B选择开发。
• 策略二:若A选择开发,B也选择开发;若A选择 不开发,B也选择不开发。
• 策略三:若A选择开发,B就选择不开发;若A选 择不开发,B就选择开发。 • 策略四:无论A是否选择开发,B都选择不开发。
2. 动态博弈的策略式表述
中国 策略1 美 国 不犯 犯 策略2 策略3 策略4
-2 2
-2 2
-2 -2 -3 -5
2 -4 -3 -5
2 -4 2 2
2.动态博弈的策略式表述
• 在动态博弈中,参与人的策略是预先设定 的,在博弈的各个阶段,针对各种情况作 出相应的策略选择。 • 动态博弈的策略式表述,是一套完整的包 含各种可能出现情况的应对策略 ,即“如 果„发生,我将选择„策略”。
1. 策略1:在开发商A先行动的情况下,开发商B可 供选择的策略中,策略一只包括了上述两个纳什 均衡中的后一种均衡,即(A不开发,B开发) ,而没有包括前一种纳什均衡,即(A开发,B 不开发); 2. 策略二:上述两种纳什均衡都没有包括; 3. 策略四只包括了上述两种纳什均衡中的前一种均 衡,即(A开发,B不开发),而未包括后一种 纳什均衡,即(A不开发,B开发); 4. 只有策略三既包括了上述两种纳什均衡中的前一 种均衡,又包括了后一种均衡。
不开发
0,1
0,0
0,1
0,0
• 序贯理性(sequential rationality) 是指:一个参与人在博弈的每
博弈论案例分析 动态博弈 弄巧成拙的防鲨网
如果5名董事各占公司股份20%,在不采取任何策 略的情况下,不会有人提出大幅修改董事资格的 提议(提议通过,提议者将控制董事会,其他董 事都得滚蛋)分析如下: 1.对于最后一个董事来说: (1)如果有4票赞成,提议通过。他投什么都无 所谓,提议都通过,他失去董事资格。 (2)如果有3票赞成,提议通过。他投什么都无 所谓,提议都通过,他失去董事资格。 (3)如果有2票赞成,很显然他会投反对票。因 为投反对票可以得到13.3%股份。而投赞成票,什 么都得不到。 (4)如果有1票赞成,很显然他会投反对票。因 为投反对票可以得到5%股份。如果投赞成票,自 己20%的股份会被夺走。
(4)提议未通过,在他投票前有大于或等于(N+1)/2 人投了反对票。那他肯定会投反对票。
3.对于第i个投票的董事来说:他有2种策略,投反对 票和赞成票。当X>(N-3)/(N+1)时,他肯定会投 赞成票。当X≤(N-3)/(N+1)时,他会投反对票。 因此,提议者要想控制董事会,自己的股份数满足 的条件是X>(N-3)/(N+1)。
如果公司不是5人,而是一个不确定的数N (N为奇数)呢?提议者所占公司股份为X, 其他每名董事占公司(1-X)/(N-1)的公 司股份。有没有可能占公司股份为X的那 个董事像海贝壳先生,采用“降落伞”策 略去控制整个董事会呢?
1. 对于最后一个董事来说: (1) 提议通过,在他投票前有大于或等于(N+1) /2人投了赞成票。那他一定会投赞成票。而投赞成 票至少会得到一点补偿,投反对票什么都没有。 (2) 在他投票之前打成平手,投赞成票和反对票 的人数都是(N-1)/2,他投赞成票还是投反对票, 取决于投赞成票得到的公司股份2X/(N-1)与投反对 票得到公司股份(NX+X+N-3)/(N+1)(N-1)的大小。 当X>(N-3)/(N+1)时,他投赞成票。但X≤(N3)/(N+1)时,他投反对票。 (3) 提议未通过,在他投票之前已经有大于或等 于(N+1)/2人投了反对票。那他一定会投反对票。
经典动态博弈模型
由于囚徒无法信任对方,最终都选择坦白,导致集体利益受损。
斗鸡博弈
描述
两只斗鸡在狭路相逢,每只斗鸡都有前 进和后退两种选择。如果一只斗鸡前进 ,另一只后退,则前进的斗鸡获胜;如 果两只都前进,则两败俱伤;如果两只 都后退,则均无损失。
VS
博弈策略
由于存在两败俱伤的风险,双方更倾向于 选择后退以避免损失。
予相应的奖励。
结论
智猪博弈表明,合理的激励 机制和任务分配可以激发员 工的积极性和创造力。
案例四:猎鹿博弈在国际政治中的影响
猎鹿博弈概述
猎鹿博弈描述了两个猎人合作与不合作对收益的影响,强 调了合作的重要性。
国际政治中的影响
在国际关系中,国家间的合作与竞争往往受到猎鹿博弈的影响。 合作可以带来共同利益,但也需要克服信任和利益冲突的问题。
02
03
公共品供给
在公共品供给中,政府可运用动态博 弈模型分析不同主体之间的互动关系, 提高公共品供给效率。
国际关系
贸易摩擦
在国际贸易中,国家之间可以通过动态博弈模型分析贸易摩擦的起 因和解决方案,促进国际贸易的稳定发展。
地缘政治
在国际政治中,国家可以利用动态博弈模型分析地缘政治格局的变 化趋势,制定合适的国际战略。
结论
斗鸡博弈表明,在竞争激烈的 市场环境中,适当的妥协和沟
通对于避免损失至关重要。
案例三:智猪博弈在企业管理中的运用
智猪博弈概述
智猪博弈描述了大猪和小猪 在同一个猪圈里抢食物的情 况,强调了策略选择的重要
性。
企业管理中的运用
在企业中,智猪博弈可以应 用于激励机制设计、项目管 理等方面。例如,让有能力 的人承担更多责任,同时给
经典动态博弈模型
博弈经典案例解析ppt课件
二、博弈及博弈论的发展
作为游戏的博弈,应该说自从游戏的产生,就有了博弈 的实践活动。如我国战国时代为大家所熟悉的“田忌赛 马”。以后进一步扩展到军事领域,从“三国演义”中可 以找到很多著名的博弈例子。 但将博弈上升到理论阶段,却是在20世纪。20世纪20年 代,法国数学家波雷尔用最佳策略的概念研究了下棋和其 他一些具体的博弈问题,并试图将其作为应用数学的分支 加以系统研究。第二次世界大战期间,博弈的思想及研究 方法被运用到军事领域和战时的其他活动之中。如用博弈 的方法研究盟军在日本空军敢死队(神风突击队)在各种 攻击情况下的应对措施。 1944年,约翰.冯.诺依曼(J.von.Neumann)和摩根斯 特恩(Morgensten)合著的《竞赛论与经济行为》被认
23
5、共同知识
“共同知识”是与信息有关的一个重要概念。 共同知识是指“所有参与人知道,所有参与人知道所有参与 人知道,所有参与人知道所有参与人知道所有参与人知 道. . . . . . ”的知识。 “共同知识”是博弈论中一个非常强的假设。
为是系统研究博弈理Байду номын сангаас的开端。
8
20世纪50至80年代,被认为是博弈论巨人产生的年代。50年 代,纳什(Nash)定义了“囚徒困境”并提出“纳什均衡” , 奠定了非合作博弈的基石。60年代,泽尔腾(Selten)(1965年) 将纳什均衡的概念引入动态博弈,提出“精炼纳什均衡”概念。 海萨尼(Harsanyi)(1967-1968年)则把不完全信息引入博弈 论的研究,提出“贝叶斯纳什均衡”。到80年代,克瑞普斯 (Kreps)和威尔逊(Wilson)等将不完全信息引入动态博弈中, 提出了“精炼贝叶斯纳什均衡”。 但在20世纪70年代中期之前,博弈论主要还是作为数学的一 个分支。博弈论真正得到重视并成为主流经济学的一部分不过是 最近一二十年的事。现在,博弈论正在得到经济学科的接受和运 用,贯穿了几乎整个微观经济学,并且已扩展到宏观经济学,产 业组织理论,在环境,劳动,福利经济学等方面的研究中也占有 重要地位,大有“吞噬”整个西方现代经济理论的趋势。 9