第三章 智猪博弈与严格下策反复消去法

合集下载

博弈论讲义完整版

博弈论讲义完整版


第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”

石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
你 接受 求爱博弈: 品德优良者求爱 求爱者 求爱
100,100
不接受
-50,0 0,0
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱者 接受 求爱 不求爱 0,0 你 不接受
问题:什么叫“完全而不完美信息博弈”?
第二章 完全信息静态博弈

一 博弈的基本概念及战略表述 二 占优战略(上策)均衡


三 重复剔除的占优均衡(严格下策反复消去法)
四 划线法
五 箭头法
六 纳什均衡
完全信息静态博弈

完全信息:每个参与人对所有其他参与人的特 征(包括战略空间、支付函数等)完全了解
同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境

囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的“最优策略”使整个“系统”处于不利 的状态。

思考:为什么会造成囚徒困境 是否由于“通讯”问题造成了囚徒困境? “要害”是否在于“利己主义”即“个人理 性”?

智猪博弈理论

智猪博弈理论

智猪博弈是经济学中一个很典型的博弈理论,在这个理论中会有许多经典的意义所在,现在让我们来了解一下吧。

【问题】假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制猪食的供应。

按一下按钮,将有10个单位的猪食进入猪食槽,供两头猪食用。

两头猪场面临选择的策略有两个:自己去按按钮或等待另一头猪去按按钮。

如果某一头猪作出自己去按按钮的选择,它必须付出如下代价:第一,它需要收益相当于两个单位的成本;第二,由于猪食槽远离猪食,它将比另一头猪后到猪食槽,从而减少吃食的数量。

假定:若大猪先到(小猪按按钮),大猪将吃到9个单位的猪食,小猪只能吃到1个单位的猪食;若小猪先到(大猪场按按钮),大猪和小猪各吃到4个单位的猪食;若两头猪同时到(两头猪都选择等待,实际上两头猪都吃不到猪食),大猪吃到6个单位的猪食,小猪吃到4个单位的猪食。

问:大小猪的最优决策是什么?最后的结果很可能是什么样子的??【答案】用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:从这个矩阵上不难看出,小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)是最佳选择。

原因很简单:在大猪选择行动的前提下,小猪选择等待的话,在大猪返回食槽之前,小猪可得到4个单位的纯收益,大猪到达之后只能得到剩下的6个单位,实得4个单位;而小猪和大猪同时行动的话,则它们同时到达食槽,分别得到1个单位和5个单位的纯收益;在大猪选择等待的前提下,小猪如果行动的话,小猪在返回到达食槽之前,大猪已吃了9个单位,小猪只能吃到剩下的1个单位,则小猪的收入将不抵成本,纯收益为-1单位,如果大猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。

【启示】博弈与制度“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。

在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。

基于“智猪博弈”的若干经济应用和对策

基于“智猪博弈”的若干经济应用和对策

基于“智猪博弈”的若干经济应用和对策09级财政学张晨林I200902050摘要:智猪博弈是微观经济学中的一个非常典型的博弈模型,学习此章后发现博弈在社会领域的应用十分广泛,不同的利益集团相互扮演着大猪和小猪的角色,如市场竞争中的大企业与中小企业、公共服务分配领域中社会全体和社会弱势群体等等。

本文的目的在于以经济生活中的实例印证所学,并在此基础上提出相应的对策。

关键字:智猪博弈;创新;公共服务;博弈制衡智猪博弈的模型框架:假设猪圈里有一头大猪、一头小猪。

猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有少量的猪食进槽,如果小猪按钮的话,大猪刚好可以吃完所有的食物。

如果大猪按钮的话,可以赶在小猪吃完所有的食物前吃点残羹冷炙。

我们用下图把双方不同策略下各个猪的净吃食量表示如下那么两只猪各会采取什么策略?这个2×2矩阵博弈的纳什均衡解是(踩动,等待),即小猪将选择等待,大猪选择踩踏板,主要因为小猪踩踏板将一无所获,不踩踏板反而能吃上食物。

对小猪而言,无论大猪是否踩动踏板,反正自己不踩踏板总是最好的选择,是自己的严格优势策略。

对于大猪,明知小猪是不会去踩踏板的,自己亲自去踩踏板还可以净得4,总比不踩得到0好。

总之,智猪博弈模型可以解释为谁占有更多资源,谁就必须承担更多的义务。

下面我们来看下这方面的具体应用:一、从“智猪博弈”来看企业创新策略不同的企业在博弈中扮演的角色不同,大型企业是小猪,中小企业是大猪。

大型企业创造社会财富的主动性是缺失的,一方面是因为它的垄断性,一方面是因为它多半是国企,在政策信息上占有先机。

大型企业的盈利一般来自于两个方面:一是瓜分中小企业的利润,二是抢占更多消费者剩余。

大型企业的领导通常缺乏改革企业的动力和承担风险的能力。

中小企业是创造社会财富的主力军,虽然它也会剥削劳动者的剩余价值,也会攫取消费者的利益,但是它总有改革和创新的动力。

因为自身薄弱的实力促使它必须面对竞争和追求创新,否则就意味着淘汰和出局,所以它总是冲在最前面,附带着解决社会失业问题。

博弈的基本分析方法

博弈的基本分析方法

三、一个例子:警察与小偷

收益均等化方法:在纳什均衡状态,每个参与人使用某一种策略得到 的收益必须与他使用另一种策略得到的收益相同。

以“警察与小偷”为例,如果小偷使用混合策略,他去银行的收益高
于他去酒馆的收益,那他就会增加去银行的概率,直到去银行和去酒 馆收益相等。
警察 酒馆 小 偷 酒馆 银行 0, 3 2, 1 银行 1, 2 0, 3
时装
夫 妻 妻 时装 之 子 足球 争 2, 1 0, 0 丈夫
足球
0, 0 1, 3
2, 1 0, 0
0, 0 1, 3
3 划线法(自己练习)
D 囚 徒 困 境 猜 硬 币 夫 妻 之 争 D C -5, -5 -8, 0 C 0, -8 -1, -1 囚 徒 困 境 猜 硬 币 夫 妻 之 争 D C D -5, -5 -8, 0 C 0, -8 -1, -1
* ( si* , sn ) 一定是该博弈的唯一的纳什均衡
命题2:在n个博弈方的博弈中 G {S1 ,Sn ; u1 ,un } 中,如果
* ( si* , sn ) 是 G 的一个纳什均衡,那么严格下策反复消去法一定
不会将它消去
上述两个命题保证在进行纳什均衡分析之前先通过严格下策
反复消去法简化博弈是可行的
0, 2
0, 1
2, 0 1, 0 0, 4 1, 3 0, 2 0, 1 2, 0
4 箭头法

其它例子
-5, -5 -8, 0 0, -8 -1, -1 夫 妻 之 争 2, 1 0, 0 0, 0 1, 3
囚 徒 困 境
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
混合策略博弈的纳什均衡

博弈论经典案例《智猪博弈》

博弈论经典案例《智猪博弈》

在经济学中,“在经济学中,“智猪博弈”(Pigs’payoffs)(Boxed Pigs)是一个著名博弈论例子。

这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。

猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。

如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。

当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。

对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。

反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。

规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。

如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。

改变方案一:减量方案。

投食仅原来的一半分量。

结果是小猪大猪都不去踩踏板了。

小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。

谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。

改变方案二:增量方案。

投食为原来的一倍分量。

结果是小猪、大猪都会去踩踏板。

谁想吃,谁就会去踩踏板。

反正对方不会一次把食物吃完。

小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。

对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。

改变方案三:减量加移位方案。

博弈论智猪博弈

博弈论智猪博弈

市场竞争中的“智猪”模型分析学号姓名摘要:随着市场竞争的越来越激烈,运营商之间的竞争也变得越来越激烈。

其本身的实力不容忽视,但其运用的策略也至关重要。

本文运用“智猪”博弈模型来谈谈对其的一点看法。

关键词:智猪博弈市场竞争制度一:什么是博弈论?(一)博弈是指一些个人、团队或其他组织,面对一定的环境条件,在一定的约束条件下,依靠所掌握的信息,同时或先后,一次或多次,从各自可能的行为或策略集合中进行选择并实施,各自从中取得相应结果或收益的过程。

(二)博弈论是一种关于游戏的理论,又叫做对弈论,是一门以数学为基础,研究对抗冲突中最优解问题的学科。

(三)一个标准的博弈应当包括:1.博弈的参与人,又称局中人,是指博弈中独立决策、独立承担后果,一自身利益最大化来选择行动的决策主体,局中人以最终实现自身利益最大化为目标。

2.博弈行为,是指参与人的所有可能的策略或行动的集合。

3.博弈信息,是指参与人在博弈过程中所掌握的对选择策略有帮助的情报知识,特别是有关其他参与人的特征和行动的知识,即该参与人所掌握的其他参与人的对其决策有影响的所有知识。

4.博弈策略,又称战略,是指参与人可选择的全部行为或策略的集合。

5.博弈的次序,即博弈参加者做出策略选择的先后顺序。

6.博弈方的收益,是指参与人从博弈中做出决策选择后的所得和所失。

7.结果,是指博弈分析者感兴趣的要素集合。

8.均衡,是指所有参与人的最优策略或行动的组合。

二、“智猪”博弈模型(一)智猪博弈是经济学中经常讲的一个经典博弈实例。

这个案例讲的是:有一大一小两头猪在同一个食槽进食,在食槽的另一端安装有一个控制猪食供应量的按钮,在每次进食前,至少要有一头猪过去按按钮,他们才能获得食物。

模型还假定:每按一次按钮可出8单位食物,但按按钮要付出2个单位的成本。

若大猪先到食槽,则大猪得到7单位的食物,而小猪仅得到1单位的食物:若小猪先到,则大猪小猪各得到4单位得食物;若两猪同时到,则大猪得到5单位,小猪得到3单位食物。

智猪博弈破解方法

智猪博弈破解方法

智猪博弈破解方法智猪博弈,又称“狼杀”,是一款两人轮流落子的抽象游戏,由日本游戏设计师仲田利三郎于2001年发表。

游戏规则简单,但谁能获胜却非常难解,是一个传统算法研究中的复杂问题。

智猪博弈所使用的棋盘由6行6列共36个格子组成,分成两个半边,每一行三个格子,每一列也有三个格子,其中包括四个角落格子。

每局游戏双方轮流在棋盘上落子,每次只能落一子,棋子可以落到任何没有其他棋子的格子上,谁落子形成6个棋子组成的连珠(即垂直、水平、斜对角的三种),谁就获胜。

解决智猪博弈的破解方法主要有三种:第一种方法是使用搜索树表示和维护游戏状态,其目的是构建给定的游戏状态的搜索树,然后根据其可行走的走子方式进行估值,并根据估值构建最佳下棋方案。

其次是使用全局搜索,通过使用一组全局搜索计算机程序来计算游戏胜负,这些计算机程序将当前棋盘状态表示为一个字符串,然后将其反复传递给评估函数,该函数从全局角度合理地评估当前游戏状态,并生成最优解。

最后是使用进化算法,这种算法引入了一种模拟进化的方式,模拟进化正好比算法更符合真实世界情况,它能有效处理复杂和非凸问题,为游戏找到最优解。

通过以上三种方法,可以很好地破解智猪博弈,使用不同的解决方法可以尽可能地预测和解决智猪博弈的落脚点,优化棋手的落子思路,有效提高游戏获胜的机会。

总的来说,智猪博弈是一种非常有趣的棋盘游戏,它同时也是一个非常困难的传统算法研究问题。

破解这个游戏的破解方法多种多样,不仅可以通过构建搜索树和使用全局搜索计算机程序来计算给定游戏状态的估值,还能够使用进化算法来探究、求解智猪博弈中复杂性与神秘性背后的规律。

破解智猪博弈非常有趣,人类可以通过合理的计算机算法与解决方案来预测、模拟这款游戏,以获取最佳结果。

智猪博弈理论

智猪博弈理论

在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。

假设猪圈里有一头大猪、一头小猪。

猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。

那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。

实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。

用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。

综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。

在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。

在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。

这时候有所不为才能有所为!高明的管理者善于利用各种有利的条件来为自己服务。

“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。

这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。

博弈的基本分析方法

博弈的基本分析方法
时装
夫 妻 妻 时装 之 子 足球 争 2, 1 0, 0 丈夫
足球
0, 0 1, 3
2, 1 0, 0
0, 0 1, 3
3 划线法(自己练习)
D 囚 徒 困 境 猜 硬 币 夫 妻 之 争 D C -5, -5 -8, 0 C 0, -8 -1, -1 囚 徒 困 境 猜 硬 币 夫 妻 之 争 D C D -5, -5 -8, 0 C 0, -8 -1, -1
-1, 1 1, -1
1, -1 -1, 1
-1, 1 1, -1
1, -1 -1, 1
2, 1 0, 0
0, 0 1, 3
2, 1 0, 0
0, 0 1, 3
4 箭头法

方法描述:对每一种策略组合,用箭头标
出其转移的方向, 没有箭头指向外面的策 略组合即为纳什均衡。

例1
1, 0
0, 4
1, 3
1943年,日本海军上将木村受命将日本陆军运抵新几内亚,期间 要穿越俾斯麦海。而美国海军上将肯尼欲对日本船队进行轰 炸。穿越俾斯麦海到新几内亚有两条线路:较短的北线和较 长的南线。木村必须选择一条线路,而肯尼也必须选择一条
纳什均衡与严格下策反复消去法
弱下策能不能消去:俾斯麦海战(续)
线路去搜索日军。如果肯尼将飞机派往错误的线路,召回需 要时间,轰炸时间会少几天。
0, 2
0, 1
2, 0 1, 0 0, 4 1, 3 0, 2 0, 1 2, 0
4 箭头法

其它例子
-5, -5 -8, 0 0, -8 -1, -1 夫 妻 之 争 2, 1 0, 0 0, 0 1, 3
囚 徒 困 境
猜 硬 币
-1, 1 1, -1

智猪博弈

智猪博弈

非合作博弈:参与 者之间不存在合作 的博弈
博弈论应用
1
经济领域:用 于分析市场行为、制定策略

3
军事领域:用 于分析战争形 势、制定作战
计划等
2
政治领域:用 于分析国际关 系、制定外交
政策等
4
社会领域:用 于分析社会现 象、制定社会
政策等
智猪博弈模型
模型介绍
01
智猪博弈模型:一种描述两 个参与者在资源分配中策略 选择的博弈模型
03 社会福利政策:政府在制定社会福利政策时, 可以借鉴智猪博弈的策略,提高社会福利水平。
04 环境保护:在环境保护领域,可以借鉴智猪博 弈的策略,鼓励企业和个人积极参与环境保护。
智猪博弈的启示
合作与竞争
合作与竞争是相互依存的, 需要平衡
合作可以降低成本,提高 效率
竞争可以激发创新,促进 发展
合作与竞争需要根据具体 情况进行选择和调整
03
政策制定:政 府与利益集团 之间的博弈, 需要平衡各方 利益
04
政治改革:改 革派与保守派 之间的博弈, 需要权衡改革 风险与收益
社会领域
01 公共资源分配:政府在分配公共资源时,可 以借鉴智猪博弈的策略,避免资源浪费。
02 企业竞争:企业在市场竞争中,可以借鉴智 猪博弈的策略,避免恶性竞争。
02 参与者:大猪和小猪
03
策略选择:大猪可以选择等待或 行动,小猪可以选择等待或行动
04
收益分析:大猪等待的收益为0, 行动收益为1;小猪等待的收益 为1,行动收益为-1
05
均衡分析:智猪博弈模型的均衡 解为小猪等待,大猪行动
06
启示:在资源分配中,弱者可以通过 等待策略来获取最大收益,而强者则 需要付出一定的代价来获取资源

2 智猪博弈

2 智猪博弈

在神仙宣布“至少有一个男人是不忠的” 之前,每个女人其实都知道这个事实,这个宣 布似乎并没有增加这些女人的知识——关于村 里男人不忠行为的知识。但为什么神仙的宣布 会使得村里的女人产生了对她们的丈夫的屠杀 行为呢? 这是因为,神仙的宣布使得这个群体里的 女人的知识结构发生了变化,本来“至少有一 个男人是不忠”对每个女人都是知识,但不是 公共知识,而神仙的宣布使得这个事实成为公 共知识。
例子 为什么中小企业不会花钱去开发新 产品? 在技术创新市场上,大企业是大猪, 它们投入大量资金进行技术创新,开发 新产品,而中小企业是小猪,不会进行 大规模技术创新,而是等待大企业的新 产品形成新的市场后生产 模仿大企业的新产品的产 品去销售。
例子 为什么只有大企业才会花巨额金 钱打广告?
大企业是大猪,中小企 业是小猪。大企业投入大量 资金为产品打广告,中小企 业等大企业的广告为产品打开销路形成市场后 才生产类似产品进行销售。
山村大屠杀
有一个偏僻的山村,居住着100对夫妻,在这里, 女人掌权,她们会杀掉对自己不忠的丈夫,而且就在 发现的当天执行,但必须证据确凿。当其中一个女人 发现一男人对其妻子不忠时,她会向其他女人散布这 个消息,但从来不对他的妻子说。因此最后,一个男 人不忠,除了其妻子不知道外,其他女人都知道。 实际上,这100个男人都是不忠的。但每个女人 不知道自己的男人不忠。一位无所不知的神仙对这 100个妻子说,”在你们丈夫中间,至少有一个是不忠 的”。 结果,前99天,村里风平浪静,但到了第100天,村 里发生了一场大屠杀,所有女人都杀死了她们的丈夫。 这是为什么?
事实上村里有100个男人不忠那么这样的推理会继续到99天就是说前99天每个女人都没有怀疑到自己的丈夫而当第100天的时候每个女人都确定的推理出她的丈夫不忠于是村子里便发生了一场大屠杀所有的男人都被他们的妻子杀死

博弈论经典模型——智猪博弈

博弈论经典模型——智猪博弈

智猪博弈博弈论里面有个十分卡通化的博弈模型,叫做“智猪博弈”(Pigs' payoffs)。

整个故事是这样的:笼子里面有两只猪,一只大,一只小。

笼子很长,一头有一个踏板,另一头是饲料的出口和食槽。

每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。

如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。

当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

如果定量地来看,踩一下踏板,将有相当于10个单位的猪食流进食槽,但是踩完踏板之后跑到食槽所需要付出的“劳动”,要消耗相当于2个单位的猪食。

如果两只猪同时踩踏板,再一起跑到食槽吃,大猪吃到7个单位,小猪吃到3个单位,减去劳动耗费各自2个单位,大猪净得益5个单位,小猪净得益1个单位。

如果大猪踩踏板,小猪等着先吃,大猪再赶过去吃,大猪吃到6个单位,去掉踩踏板的劳动耗费2个单位净得4个单位,小猪也吃到4个单位。

如果小猪踩踏板,大猪等着先吃,大猪吃到9个单位,小猪吃到1个单位,再减去踩踏板的劳动耗费,小猪是净亏损1个单位。

表:大猪与小猪的策略如果大家都等待,结果是谁都吃不到。

可以得出结论,唯一解是大猪踩踏板,小猪等待。

我们把这个博弈用矩阵的形式表达,见上图:1.在矩阵的左上角,大猪踩踏板,小猪也踩踏板,大猪、小猪各得到5个单位食物和1个单位食物;2.在矩阵的左下角,大猪等待,小猪踩踏板,大猪、小猪各得到9个单位食物和-1个单位食物;3.在矩阵的右上角,大猪踩踏板,小猪等待,大猪、小猪都各得到4个单位食物;4.在矩阵的右下角,大猪、小猪等待,大猪、小猪都得不到食物。

那么,两只猪各会采取什么策略?令人出乎意料的是,答案居然是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在呢?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。

“智猪博弈”

“智猪博弈”
食 槽 边 ; 而 大 猪 则 为 一 点 残 羹 不 知 强 。
三 — — 减 量 加 移 位 的 办 法 , 奖 励 并 非 人 对 于 游 戏 规 则 的 设 计 者 来 说 , 这 个 人 有份 ,而 是直接 针对个 人 ( 如业 务按
疲倦地奔忙于踏 板和食槽之 间。
对 原 因 何 在 ? 因 为 , 小 猪 踩 踏 规 则 的成本相 当高 ( 次提供 双份 的食 比 例 提 成 ) , 既 节 约 了 成 本 ( 公 司 而 每 搭 板将 一无 所获 ,不踩 踏板 反而 能吃 物 );而且 因为竞 争不 强烈 ,想让 猪们 言 ) , 又 消 除 了 “ 便 车 ”现 象 , 能 实
编辑
社 _峰
, ,
对于制 订各种经济管理游戏规则的人 ,必须深谙该理论指标改变 的个中道理 。
: } f :文 若冰
在 so Pp a iy gf f '
是 一个 著 名 博 弈 论 例 子 。
物数量和踏 板与投食 口之 间的距离 。
争 中的弱者 ( 小猪 ) 以等待 为最佳 策 略
去踩 动踏板 的 , 自己亲 自去踩踏 板 踏板 附近 。结 果呢 ,小猪 和大猪 都在 拼 股市 上等 待庄 家抬轿 的散 户 ;等 待产业 总 比不踩 强吧 ,所 以只好 亲力亲 为 命抢 着踩踏 板 。等待 者不 得食 ,而 多劳 市场 中 出现具 有赢利 能力 新产 品、继 而
了。
如果 改变 一下 核心 指标 ,猪 圈里还 的启 发 。但 是对 于社 会而 言, 因为小猪 源 配置 的并 不是最 佳状 态 。为使 资源最
会 出现 同样 的 “ 小猪躺 着 大猪跑 ”的景 未 能 参 与 竞 争 , 小 猪 搭 便 车 时 的 社 会 资 象 吗?试试看 。 改变 方 案 一 : 减 量 方 案 。投 食 仅 有 效 配 置 , 规 则 的 设 计 者 是 不 愿 看 见 有 去 踩踏 板 了。小猪 去踩 ,大 猪将会 把食 是如此 。而 能否完 全杜 绝 “ 搭便车 ”现

第三章 智猪博弈与严格下策反复消去法

第三章 智猪博弈与严格下策反复消去法

3.3 严格下策反复消去法
博弈 上
方1

左 1,0 0,4
博弈方2 中 1,3 0,2
右 0,1
2,0
严格下策反复消去法例子
博弈方2


博弈 上 1,0 方1 下 0,4
1,3 0,
博弈方2 左中 博弈方1 上 1,0 1,3
博弈方2 中
博弈方1 上 1,3
石头-剪刀-布
石头
石头
0,0

剪子
严格下策反复消去法失效的原因:博弈的不同策略 组合之间往往不存在绝对的优劣关系,而只存在相 对的,有条件的优劣关系。
严格下策反复消去法仍然是一种标准的博弈分析工 具之一。
3.4 智猪博弈的启示
多劳者不多得(多人加班) 枪打出头鸟(工人代表) 搭便车是激励失效的典型
3.5 智猪博弈与机制设计
如何避免类似“小猪躺着大猪跑”的搭便车行为呢? 如想达到使猪们争着按安钮,如何改变规则? 有三个方案:
如果在一个博弈中无论其他博弈方策略如何变化一博弈方的某个策略给他带来的收益始终比另一个策略带来的收益要少那么称前一个策略为相对于后一个策略的任何理性的博弈方都不可能采取严格下策所以博弈方总会先排除掉严格下策严格下策反复消去法
第三章 智猪博弈
3.1 智猪博弈 3.2 智猪博弈的分析与求解 3.3 严格下策反复消去法 3.4 智猪博弈的启示 3.5 智猪博弈与机制设计 3.6 类似问题
3.3 严格下策反复消去法
上述智猪博弈的分析方法称为严格下策反复消去法 严格下策(Strictly Dominated):如果在一个博弈中,无
论其他博弈方策略如何变化,一博弈方的某个策略给 他带来的收益始终比另一个策略带来的收益要少,那 么称前一个策略为相对于后一个策略的—— 任何理性的博弈方都不可能采取严格下策,所以博弈 方总会先排除掉严格下策 严格下策反复消去法:反复寻找各个博弈方的“严格 下策”,并消去之,直到找不出任何严格下策为止

智猪博弈”模型

智猪博弈”模型

智猪博弈”模型经济学虽然有时枯燥而复杂,但是,有时经济学也可以很可爱的,它的可爱之处在于,它来源于生活,也可应用于生活。

如果你是MM,结婚后你会不会总是抱怨家里的家务活为什么总是我在干?是啊,为什么呢?难道上天真的对你特别不公吗?难道你真的那么倒霉吗?在回答这些问题前,我悄悄地告诉你,有一个称之为“猪”的动物跟你有同样的遭遇,他也正纳闷着,为啥受伤的总是他呢?当然这个“猪”绝非一般的猪,他们是很聪明的,所以我们喜欢叫他们为“智猪”。

他们到底遇到什么麻烦了呢,让我们先耐心的听他们所发生的故事吧!猪圈里有两只智猪,都能思考,很聪明,不过一头是大猪,一头是小猪。

在这个大大的猪圈里的一边有一个食槽,而在另一边有一个按钮,控制着猪食的供应。

按一下这个按钮,会有10个单位的猪食进入食槽内,但谁按按钮谁自己就需要消耗2个单位的猪食能量。

如果大猪先到食槽,大猪一下子就可以吃掉9个单位的猪食,而后到的可怜小猪只能吃到1个单位的猪食;如果两只猪同时到食槽,大猪会采用霸权主义的手法抢占了7个单位,小猪只能吃到3个单位;如果小猪先到食槽,小猪就可以吃掉6个单位的猪食,大猪可以吃到4个单位。

这两只智猪都想消耗最少的能量,而又吃到更多的猪食,那么,它们会怎样做呢?大猪和小猪的问题就是谁去按那个按钮,因为去按按钮的那个猪要消耗2个单位的猪食的能量,此外,按钮在另一边,他跑过去跑回来的这段时间,另一只猪就有了先吃的机会,而去按按钮的那只猪只能后吃剩下的了,所以两只猪就要想了,到底自己要不要去按那个按钮呢?大猪和小猪都去“按”了,两只猪同时去“按”,同时回来吃,大猪可以吃到7个单位的猪食,但消耗了2个单位的,所以得到净收益是5个单位的猪食;而小猪只能得到3个单位的猪食,又消耗了2个单位,所以得到的净收益只有1个单位的猪食了。

如果大猪选择去“按”,而小猪选择在食槽旁“等待”不去按,然后他们的这个策略选择的净得益就是,大猪得了2个单位的猪食,而小猪得到了6个单位的猪食。

第三章 智猪博弈

第三章 智猪博弈
在大猪与小猪的博弈中我们加人一个法律规定谁付出劳动去踏踏板那么谁就受益获得全部食物并且有一个第三方比如法院来强制实施这条法律那么小猪不劳而获的动机就会得到抑制并且它也有动力去劳动
第三章 智猪博弈
[1]严格下策反复消去法 [2]生活中智猪博弈 [3]权力配置与搭便车
智猪博弈

假设猪圈里有一头大猪、一头小猪。猪圈的 一头有猪食槽,另一头安装着控制猪食供应 的按钮,按一下按钮会有10个单位的猪食进 槽,但是谁按按钮就会首先付出2个单位的 成本,若大猪先到槽边,大小猪吃到食物的 收益比是9∶1;同时到槽边,收益比是7∶3; 小猪先到槽边,收益比是6∶4。那么,在两 头猪都有智慧的前提下,最终结果是怎样一 种情景?

显然,λ2>= λ1,因为如果投资者卖出了他的 股票,收购者收购到足够的股票则其对该公 司控制权的可能性就越高。如果存在大投资 者( 就像大猪),那么只要满足λ2P>= λ1R,或 者 P >=λ1R/λ2,同时 P<R,那么并购将是可 以发生的。但是,如果并购者面临的是小投 资者,那么他们的股权可以忽略不计, 卖股 票对于并购成功的概率影响很小,因此可以 认为 λ2 = λ1,那么要使并购发生就必须满足 P>=R,结果并购的代价超过并购的收益,放 弃并购。
问题解决思路

面对强行搭便车和任人宰割问题,解决 的办法是合理地界定权利。比如,越来 越多的学校已经允许学生自行决定要不 要选购教师指定的教材;保护法律对高 管们滥用股东财富的行为进行了必要的 限制。当然,“AA 制”,的确流行起 来了,毕竟浪费的食物均摊到每个人头 上的并不多,没人愿意去计较,只有餐 厅的老板笑开了嘴。

故事模型

假设某公司的股权为 1,每股市价为 X,即全 部股票的总价也为 X。收购者认为有利可图才 会收购。因此,假设收购者可以使公司业绩改 善,让股票涨到 X+R 元。现在,假设收购者 以 X+P 的价格去收购公司股票。那么,对于 任何一个持有 a股权的投资者,如果要让他保 留股票,则他的预期收益是 a (X+λ1R),其中 λ1 代表该投资者不卖出股权而并购成功的概率。 如果他卖出股票,则预期收益是 a (x +λ2P), 其中 λ2代表该投资者卖出股权而并购成功的概 率。

博弈论第三讲

博弈论第三讲

3.3 权力配置与强行搭便车
图3-4
LOGO
大猪承诺下的智猪博弈 小猪 踏 踏
6 0
不踏
4 4
大猪 不踏
7 1 0 0
3.3 权力配置与强行搭便车
LOGO
图3-4的博弈将有两个均衡:大猪踏而小猪不踏; 或者大猪不踏而小猪踏。一个很可能的结果是, 大猪和小猪轮流去踏。老是大猪去踏它也会觉得 心理不平衡,而故意选择不踏,当大猪故意选择 不踏的时候,小猪最好的做法是去踏。当然,当 我们讲第六章“混合策略”之后,不难发现图3-4 的博弈实际上还有一个混合策略均衡,就是大猪 以0.2的概率选择踏,以0.8的概率选择不踏,小 猪以0.8的概率选择踏,以0.2的概率选择不踏, 也就是说,双方都不踏而互相消耗等待对方去踏 的概率并不太高,为0.8×0.2=0.16,而大猪不踏 小猪去踏的概率为0.8×0.8=0.64。不过,大猪的 承诺还不一定可信。只要大猪以承诺骗得小猪去 踏了踏板,大猪的承诺就可能马上作废了。
3.1 智猪博弈与重复剔除劣势策略
LOGO
在这个例子中,弄堂两旁的居民被称为搭便车者。 这个例子中的现象,实际上蕴含着一种普遍的数 学结构,因此,我们可以用模型来加以刻画。这 个模型就是“智猪博弈”。而在本章,我们将介 绍这一版本的博弈,并基于智猪博弈说明重复剔 除劣势策略求解均衡的方法,然后我们将讨论生 活中的智猪博弈以及一些强行搭便车的例子。
E-mail: haitangchen@
LOGO
第三讲 智猪博弈与搭便车
1.智猪博弈与重复剔除劣势策略 2. 现实生活中的智猪博弈
LOGO
3. 权力配置和强行搭便车
4. 小结
Game Theory & Life

三、智猪博弈

三、智猪博弈

下表给出这个博弈的支持矩阵 用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:
小猪

大猪 按 等待 5,1
等待
4,4
9,-1
0,0
综合来看,无论大猪是选择行动还是等待,小猪的选择都 将是等待,即等待是小猪的占优策略。
智猪博弈的结果
利益分配格局决定两头猪的理性选择:小猪 踩踏板只能吃到一份,不踩踏板反而能吃上4 份。对小猪而言,无论大猪是否踩动踏板,小 猪将选择“搭便车”策略,也就是舒舒服服地 等在食槽边,这是最好的选择。 现在来看大猪。由于小猪有“等待”这个 优势策略,大猪只剩下了两个选择:等待,一 份也得不到;踩踏板得到4份。所以“等待” 就变成了大猪的劣势策略,当大猪知道小猪是 不会去踩动踏板的,自己亲自去踩踏板总比不 踩强吧,只好为一点残羹不知疲倦地奔忙于踏 板和食槽之间。
当然也不要觉得做“小猪”没有发展。 “智猪博弈”是给竞争中的弱者以等待为最 佳策略的启发。
启示:弱者的最佳策略就是等待,而强者与其 期待弱者做出行动,还不如自己先行。
3.6 纳什均衡的原则
纳什均衡的重要性:任何“合理”结果都要 满足的条件——当某一局中人发现他单方面 改变战略可以获取更多时,他会毫不犹豫地 改变自己的战略,博弈自然就没有达到均衡 一种制度安排要发生效力,必须是纳什均衡, 否则,这种制度安排就没有效力

最终结果是小猪而言,无论大猪是 否踩动踏板,不去踩踏板总比踩踏板好。反 观大猪,明知小猪不会去踩踏板,但是去踩 踏板总比不踩强,所以只好亲历亲为了。
以不变应万变
3.4 生活中智猪博弈的例子
例 “智猪博弈”带给企业的启示
在小企业经营中,学会如何“搭便车”是 一个精明的职业经理人最为基本的素质。在某 些时候,如果能够注意等待,让其他大的企业 首先开发市场,是一种明智的选择。这时候有 所不为才能有所为!

纳什均衡

纳什均衡



-1, 1


1, -1
1, -1 -1, 1
2, 1 0, 0
0, 0 1, 3
课堂习题
• 用划线法求出均衡解
C1
C2
C3
R1
0,4 4,0 5,3
R2 4,0 0,4 5,3
R3 3,5 3,5 6,6
箭头法
• 思路:
– 对博弈中的每一个策略组合进行分析,考察在每个策略组合 处各个博弈方能否通过单独改变自己的策略而增加得益
– 与划线法一样都是基于策略之间的相对优劣关系进行分析的, 所得到的结果也是一致的。
– 如果能,则从所分析的策略组合对应的得益数组引一箭头, 到改变策略后策略组合对应的得益数组
– 最后,只有指向,没有离开的策略组合为均衡解--稳定- -没有人愿意单独改变
箭头法
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
经典博弈故事之二--情侣博弈

大海和小丽正在热恋。难得的周末又到了,安排什么节目呢?周末晚上,
中国足球队要在世界杯外围赛中和伊朗队做生死之战。大海是个超级球迷,国
内的甲级联赛都不肯放过,何况是不争气的国家队的生死大战?也正好是这个
周末的晚上,俄罗斯一个著名芭蕾舞团莅临该市演出芭蕾舞剧《胡桃夹子》。
丽娟最崇尚钢琴、芭蕾这样的高雅艺术,对斯拉夫民族的歌唱和芭蕾更是崇拜
– 稳定的和自我强制的,所以是真正可预测的 – 反之,不具有一致预测性的博弈结果,则难以避免预测和行为之间的
矛盾,甚至是自我否定的。
•只有纳什均衡才具有一致预测的性质 •一致预测性是纳什均衡的本质属性 •一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致 的可能
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 智猪博弈
3.1 智猪博弈 3.2 智猪博弈的分析与求解 3.3 严格下策反复消去法 3.4 智猪博弈的启示 3.5 智猪博弈与机制设计 3.6 类似问题
3.1 智猪博弈(Boxed Pigs )
笼子里面有两只猪,一只比较大,一只比较小。笼子 很大,一头有一个按钮,另一头是饲料的出口和食槽。 按一下按钮,将有相当于10份的猪食进槽,但是按按 钮以后跑到食槽所需要付出的"劳动",加起来要消耗 相当于2份的猪食。问题是按钮和食槽分置笼子的两 端,按按钮的猪付出劳动跑到食槽的时候,坐享其成 的另一头猪早已吃了不少。
严格下策反复消去法失效的原因:博弈的不同策略 组合之间往往不存在绝对的优劣关系,而只存在相 对的,有条件的优劣关系。
严格下策反复消去法仍然是一种标准的博弈分析工 具之一。
3.4 智猪博弈的启示
多劳者不多得(多人加班) 枪打出头鸟(工人代表) 搭便车是激励失效的典型
3.5 智猪博弈与机制设计
如何避免类似“小猪躺着大猪跑”的搭便车行为呢? 如想达到使猪们争着按安钮,如何改变规则? 有三个方案:
-1,1

1,-1
甲 剪子 1,-1 0,0 -1,1
布 -1,1 1,-1 0,0
严格下策反复消去法的局限性
严格下策反复消去法比上策均衡适用范围大些。当 同样不能解决所有博弈的分析问题。
在策略数较多的博弈中,严格下策反复消去法只能 消去部分策略,不能消去的策略组合不唯一,仍然 不能完全解决这些博弈问题。
奖励不大,而且见者有份,非常努力的大猪, 也没有动力努力工作;
减量加移位方案;奖励并非人人有份,而是 直接针对个人,既节约成本又消除了“搭便 车”现象。
很多人不自觉地使用“小猪”策略。
3.6 类似的问题
✓股票市场中的智猪博弈 ✓大户——大猪(收集信息,抬高价格) ✓散户——小猪(搭便车)
3.2 分析与求解
能否找上策?大猪不存在上策,上策失效! 换个思路,能否排除法呢? 小猪的推理逻辑:当大猪不按时,我不按(0),
按比“白劳”还亏(-1),按“差些” ;当大猪 按时,我按(1),不按(4),按“差些”,无论 如何,按都比不按差,所以首先排除“按”! 大猪意识到,小猪一定不会“按”,只会等 待,大猪此时不按比按要差,排除之,只剩 下按。
3.3 严格下策反复消去法
上述智猪博弈的分析方法称为严格下策反复消去法 严格下策(Strictly Dominated):如果在一个博弈中,无
论其他博弈方策略如何变化,一博弈方的某个策略给 他带来的收益始终比另一个策略带来的收益要少,那 么称前一个策略为相对于后一个策略的—— 任何理性的博弈方都不可能采取严格下策,所以博弈 方总会先排除掉严格下策 严格下策反复消去法:反复寻找各个博弈方的“严格 下策”,并消去之,直到找不出任何严格下策为止Biblioteka 3.3 严格下策反复消去法
博弈 上
方1

左 1,0 0,4
博弈方2 中 1,3 0,2
右 0,1
2,0
严格下策反复消去法例子
博弈方2


博弈 上 1,0 方1 下 0,4
1,3 0,2
博弈方2 左中 博弈方1 上 1,0 1,3
博弈方2 中
博弈方1 上 1,3
石头-剪刀-布
石头
石头
0,0

剪子
(1)减量方案,减为一半。结果小猪、大猪都不愿意 去按 (2)增量方案,增加为原来的两倍。结果小猪、大猪 都愿意去按,但竞争不激烈。 (3)减量加移位方案,投食量仅为原来的一半,但同 时将投食口移到按钮附近。结果,大猪、小猪都拼 命的抢着按按钮,等待者不得食,多劳多得。
公司的激励制度设计
奖励过大。期权、股票,人人都成富翁,员 工没有积极性工作,而且成本巨大;
假设:若大猪先到,大猪呼啦啦吃到9份,小猪只能 吃到1份;若同时到达,大猪吃到7份,小猪吃到3份; 若小猪先到,小猪可以吃到4份,而大猪吃到6份。
问题:猪门应该怎么办呢?到底是等待呢还是按呢???
智猪博弈的结构
猪们该怎么办?是坐享其成呢?还是…
3.2 分析与求解
假设
(1) 大猪和小猪都知道上述博弈结果矩阵; (2) 大猪和小猪都是个体理性的(以自身 的利益最优(自利)目标,选择策略) ; (3) 有追求自身利益最大化的能力(不会 犯错,计算能力足够)
相关文档
最新文档