智猪博弈论与纳什均衡
博弈论三种均衡的异同
问题:博弈论三种均衡的异同结合工作实践举一个例子,谈以下三种均衡的异同,1、占优策略均衡,2、纳什均衡,3、混合策略纳什均衡。
国企办公室当中的智猪博弈。
“大猪”们辛辛苦苦加班,工资一分也不多拿,“小猪”们一边逍遥自在,工资一分也不少拿,这种情况在国企办公室里比比皆是。
很遗憾,我就是“大猪”们中的一员,因为我们什么都缺,尤其缺能干的人,就是不缺人。
严格占优均衡(DSE)、重复剔除占优均衡(IEDE)、纯策略纳什均衡(PNE)、混合策略纳什均衡(MNE),前一个均衡是后一个均衡的特例,后一个均衡是前一个均衡的扩展,即DSE是IEDE的子集,IEDE是PNE的子集,PNE是MNE的子集。
他们的区别如下:1、占优策略“不管你怎么做,我所做的都是我能做得最好的。
”其他人无论采取什么策略,目前你采取的策略就是最优的,永远不会改变。
2、纳什均衡:在一种策略组合上,其他人不改变策略时,那么你就不会改变策略,因为目前最优。
★“给定你的做法后,我所做的是我能做得最好的。
”★“给定我的做法后,你所做的是你能做得最好的。
”★如果你有占优策略, 你可以使用此策略, 以不变应万变;★如果你没有占优策略, 你必须随机应变。
在达到了纳什均衡之后, 所有参与者都没有动机想再变了。
纳什均衡是常态,帕累托最优几乎不存在。
经典案例:囚徒困境。
3、混合策略纳什均衡由所有参与人的混合策略构成的纳什均衡。
有些博弈不存在纳什均衡,或者纳什均衡不唯一,如猜硬币博弈。
要想为博弈方的选择和博弈结果做明细的预测,就要用到混合策略纳什均衡。
混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。
博弈论——精选推荐
博弈论1.囚徒困境:假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不⼗分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。
警察局将这两名嫌疑犯分别关押以防他们串供。
两名囚徒明⽩,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的妨碍公务罪各判1年;如果⼀⼈交代,另⼀⼈不交代,交代者有可能会被⽴即释放,不交代者则将可能被重判8年。
(1)请写出这两名嫌疑犯博弈的⽀付矩阵;(2)假设这两名嫌疑犯都是极其精明的会打⼩算盘的⾃私⾃利不讲“江湖义⽓”的⼈,同时被分别审查不能够进⾏沟通。
请给出每个嫌疑犯的最佳策略;(3)假设允许这两名嫌疑犯在审讯室⼀起单独呆上10分钟,然后再决定是否坦⽩。
他们能否建⽴⼀个攻守同盟,从⽽双⽅都只被判⼀年?(4)若其中⼀名囚徒不知道对⼿是否理性,则他的最佳策略是什么?(5)说明这两个囚徒的困境在哪⾥?从“囚徒困境”博弈中你得到了什么启⽰?(6)利⽤“囚徒困境”博弈从下⾯两个现象:①恋⼈们在恋爱中海誓⼭盟,最终还是分⼿;②美苏两国经常会晤,甚⾄签订核不扩散条约,但军费⼀年⾼过⼀年。
(7)请试举⼀例“囚徒困境”博弈。
(8)请指出⼀种⾛出“囚徒困境”的⽅法。
2. 商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在⾼位⽽获利,但实际上却是相互杀价,结果都赚不到钱。
请解释这个现象,并站在商家的⽴场上给出⼀些避免“价格⼤战”的⽅法。
3. 智猪博弈猪圈中有⼀头⼤猪和⼀头⼩猪,在猪圈的⼀端设有⼀个按钮,每按⼀下,位于猪圈另⼀端的⾷槽中就会有10单位的猪⾷进槽,但每按⼀下按钮会耗去相当于2单位猪⾷的成本。
如果⼤猪先到⾷槽,则⼤猪吃到9单位⾷物,⼩猪仅能吃到1单位⾷物;如果两猪同时到⾷槽,则⼤猪吃7单位,⼩猪吃3单位⾷物;如果⼩猪先到,⼤猪吃6单位⽽⼩猪吃4单位⾷物。
(1)给出这个博弈的⽀付矩阵;(2)找出这两头理性“智猪”的最佳策略;(3)该“智猪博弈”博弈给你的启发是什么?(4)有些⼴告具有“外部性”,如假设伊利宣传⽜奶能强健国⼈的体质的⼴告就不仅仅增加了⼈们对伊利⽜奶的需求,也增加了对其他品牌⽜奶的需求。
计算方法6纳什均衡
3.判断若
,则 即是根,否则检验:
反复执行步骤2、3,便可得到一系列有根区间:
二分法步骤(续)
4、当 5、则
bk1ak1
xk1 12(ak bk)
时 即为根的近似
优点 缺点
①简单; ② 对f (x) 要求不高(只要连续即可) .
①无法求复根及偶重根 ② 收敛慢
二分法误差估计
y
y f(x)
b
o
a x1
kln(ba) ln21
二分法程序框图
定义f (x)
输入 a,b,
k=0
f (a) f (b)>0
是
否
否
是
f (a) f (b)=0
m=(a+b)/2
否
f(a)f(b)>0 否 b=m
|a-b|< 是
a=m
是 打印m, k
结束
f (a) =0 否
打印b, k
是 打印a,析
例1:求下列方程位于【1,1.5】内的一个根。
f(x)x3x10
k
ak
bk
xk
f (xk)的符号
0
1
1.5
1.25
-
1
1.25
1.5
1.375
+
2
1.25
1.375
1.3125
-
3
1.3125
1.375
1.3438
+
4
1.3125
1.3438
1.3281
+
5
1.3125
1.3281
1.3203
-
6
1.3203
纳什均衡的重要影响
盘点博弈论纳什均衡囚徒困境零和博弈智猪博弈
盘点博弈论&纳什均衡&囚徒困境&零和博弈&智猪博弈1.博弈论是什么博弈论(game theory),又译为对策论,或者赛局理论,经济学的一个分支,1944年冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》,标志着现代系统博弈理论的的初步形成,因此他被称为“博弈论之父”。
博弈论被认为是20世纪经济学最伟大的成果之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
主要研究公式化了的激励结构(游戏或者博弈)间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
具有竞争或对抗性质的行为称为博弈行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。
比如日常生活中的下棋,打牌等。
博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
2.纳什均衡(Nash equilibrium)3.囚徒困境(Prisoner’s Dilemma)纳什平衡的经典例子就是囚徒困境。
囚徒困境(Prisoner’s Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
1950年,由就职于兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔拟定出相关困境的理论,后来由顾问艾伯特·塔克以囚徒方式阐述,并命名为“囚徒困境”。
经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
博弈论纳什均衡
博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。
两个囚徒互相揭发,就是一种纳什均衡。
对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。
也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。
这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。
博弈策略稳定,博弈结果也稳定。
之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。
之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。
2、纳什均衡意义重大。
纳什均衡提出,震动整个经济学界。
诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。
”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。
”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。
”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。
纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。
读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。
但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。
这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。
从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。
更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。
Q2:怎样运用纳什均衡?1、分析囚徒困境。
智猪博弈论与纳什均衡
智猪博弈论与纳什均衡智猪博弈论与纳什均衡智猪博弈理论介绍在博弈论(GameTheory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。
假设猪圈里有一头大猪、一头小猪。
猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。
那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。
实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。
用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。
综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。
在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。
在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。
这时候有所不为才能有所为!高明的管理者善于利用各种有利的条件来为自己服务。
“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。
这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。
智猪博弈的纳什均衡分析---搭便车的合理性
智猪博弈的纳什均衡分析---搭便车的合理性诺贝尔经济学奖得主迈尔森说:发现纳什均衡的意义,可以和生命科学中发现DNA的双螺旋结构相媲美。
纳什均衡简单来说,纳什均衡就是一种博弈的稳定结果,谁单方面改变策略,谁就会损失。
智猪博弈一个很长的猪圈,一头是一个踏板,另一头是一个食槽。
如果踩下踏板,另一头的食槽就会掉下10份食物。
猪圈里有一大一小两头猪,不论谁去踩踏板,自身都会消耗相当于2份食物的能量。
谁会去踩踏板呢?四种情况第一种情况,大猪小猪都守在食槽边,两猪都没得吃。
第二种情况,大猪小猪同时踩踏板,然后同时跑向食槽,同时吃。
大猪吃7份,减消耗的2份,实得5份,小猪则吃3份,实得1份。
第三种情况,大猪守在食槽,小猪去踩踏板。
这时大猪吃9份,实得9份,小猪吃1份,减2份消耗,实得-1份;第四种情况,小猪守食槽,大猪踩踏板。
这时小猪吃4份,实得4份;大猪吃6份,减2份消耗,实得4份。
纳什均衡分析第一种情况,大猪小猪实得都是0份。
如果这时候,大猪单方面改变策略,去踩踏板,大猪实得就从0份上升到4份,显然不符合纳什均衡的所谓稳定结果,这种情况很容易被打破。
第二种情况,大猪5份,小猪1份。
如果小猪单方面改变策略,自己不去踩踏板,只大猪去,小猪实得就从1份上升到4份,也不是稳定结果;第三种情况,大猪9份,小猪-1份。
如果小猪单独改变策略,小猪就从实得-1份上升到0份,仍然不是稳定结果;第四种情况,大猪小猪均为4份。
如果大猪单方面改变策略,变成两个猪都守着食槽,大猪实得从4份降为0份,大猪不改变。
如果小猪单独改变策略,两猪都去踩踏板,小猪实得从4份降为1份,小猪也不会改变。
第四种情况就是所谓的智猪博弈纳什均衡。
这种纳什均衡比较有意思,居然出现了小猪明显占优的现象,小猪公然“搭便车”。
现实中小企业“搭便车”,模仿大企业成熟盈利的产品、服务、管理、甚至商业模式;而大企业则通过网络效应、技术壁垒等建立护城河。
2018.4.10 虚亦真《刘润五分钟商学院学习笔记》。
博弈智能(二)
智猪博弈
按一下按钮会有10个单位的猪食进槽, 但是谁按按钮就会首先付出2个单位的成本, 大小猪吃到食物的收益比是9∶1;同时到 槽边,收益比是7∶3;小猪先到槽边,收 益比是6∶4。
小猪 按 等待
大猪 按 等待
5, 1 9, -1
4, 4 0, 0
1、占优策略与智猪博弈
占优策略: 又一个例子: 两家公司, A和B,在考虑是否通过广告促销。它们的利 润额将依赖于哪一家公司做广告, 或者两家公司都做 广告, 或者两家公司都不做广告。这些可能性和相应 的利润额被总结在旁边的矩阵里。
的纳什均衡设计成优化问题的纳什均衡。
4、如何得到帕累托最优均衡:协调
• 帕累托最优均衡:可以通过协商选择一个 纳什均衡;cheap talking;
• 仅仅自我“理性”是不够的; • 文化与制度 • 行业组织;
锁定效应与路径依赖
3.5’’
5.5’’
3.5’’
8, 8
5.5’’
2, 3
3, 2 6, 6
交通规则的演变
• 在法国大革命以前,贵族的马车习惯上是靠左行的, 穷人在路上看到富人的马车来了,要站在马路的右边。 因此,靠左行与“特权阶级”相联系,而靠右行被认 为更为“民主”。
博弈智能多重均衡与优化
吴建设
多重均衡与优化
1、占优策略与智猪博弈 2、博弈的多重纳什均衡 3、帕累托最优均衡 4、帕累托最优均衡与纳什均衡的关系 5、如何得到帕累托最优均衡
1、占优策略与智猪博弈
• 在博弈论(Game Theory)中,“智猪博弈”是一 个著名的例子。假设猪圈里有一头大猪、一头小 猪。猪圈的一头有猪食槽,另一头安装着控制猪 食供应的按钮,按一下按钮会有10个单位的猪食 进槽,但是谁按按钮就会首先付出2个单位的成本 ,若大猪先到槽边,大小猪吃到食物的收益比是 9∶1;同时到槽边,收益比是7∶3;小猪先到槽 边,收益比是6∶4。那么,在两头猪都有智慧的 前提下,最终结果是怎样的?。
,新的一轮战争就又会出现。直到下一个平衡的出现。
3、帕累托最优均衡
• 帕累托( 1848年7月15日- 1923年8月19日):经济 学家、社会学家。洛桑大学政治经济学教授,论著 有《政治经济学讲义》、 《普遍社会学》、 《社 会主义体制》、 《事实与理论》、 《民主制的变 革》,当过意大利铁路公司的总经理,曾出任(B. 墨索里尼的)意大利政府驻国联代表。
0,0
足球场
0,0
2,1
2、博弈的多重纳什均衡
进门博弈
先进
后进
先进
-1,-1
2,1
后进
1,2
-1,-1
多重纳什均衡:产品标准
• 许多博弈可能有多个纳什均衡
3.5“
3.5“
8, 8
5.5“
2, 3
5.5“
这个博弈被称为
“协调博弈”:有
两个纯战略纳什均衡,
3, 2
一个混合战略均衡。
哪一个将出现呢?
6, 6
博弈论论文2正文
纳什均衡及帕累托改进一、引言纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益①,则此策略组合被称为纳什均衡。
纳什均衡也不意味着博弈双方达到了一个整体的最优状态,就是一个例子。
在纳什均衡下,我们能进行帕累托改进②,即在没有使任何人境况变坏的情况下,使得至少一个人变得更好。
二、消防安全博弈(一)消防安全博弈简述企业的消防安全投入是企业固定生产成本的组成部分,它意味着在为企业和社会带来效益的同时所花费的代价。
作为追求利润最大化的企业,如何确定自身的最优消防投入,也是很值得研究的。
首先从竞争企业消防安全投入决策来进行分析。
假设市场上仅有甲乙两家竞争企业,两个企业的雇主和雇员均乐于建立安全的工作环境,两个企业同样面临两种选择:安全或不安全。
即使企业和职工双方均希望有安全的生产环境,会进行消防安全投入,但是由于市场竞争更为紧迫时,企业鉴于担心经营失败或由于利润的诱惑,则会出现不同的情况。
以下为两企业消防安全投入的支付①即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的。
②是指在某种经济境况下如果可以通过适当的制度安排或交换,至少能提高一部分人的福利或满足程度而不会降低所有其他人的福利或满足程度,即一种制度的改变中没有输家而至少能有一部分人赢。
矩阵:从支付矩阵中看,如果企业1选择投入,其支付为0,此时企业2选择不投入时的支付为1,高于选择投入时的支付;企业1不投入时,企业2也不投入,此时它们支付相当。
所以不论企业1如何选择,不投入是企业2 的占优战略,同样企业1的占优战略也是不投入,此时达到纳什均衡的特殊情况——占优战略均衡,占优战略组合为(不投入,不投入)。
如果两公司独立决策(非合作),则消防安全投入将减少。
因为这会减少生产成本,降低产品价格,提高企业竞争力。
火灾事故发生的不确定性和事故结果的外部性,进一步增加了企业不进行消防投入的可能性。
博弈论笔记1:囚徒困境与纳什均衡
博弈论笔记1:囚徒困境与纳什均衡1 个体最优与社会最优1.1 社会基本问题社会:个体之间有互动行为&相互依赖的群体羊群效应:大家做什么,我就跟着做什么,不管对错和原因协调问题:两人迎面走来,谁左谁右?(核心:人们如何预测他人的行为)合作问题:囚徒困境(核心:个体理性和集体理性的折衷)等边际原理:如果每一种资源都存在着边际收益递减,那么最优的资源配置策略应该满足:最后一单位资源无论用在哪一种用途上,都会产生相同的收益。
【资源在每一种用途上的边际贡献相等】1.2 个体理性行为理性人:有一个明确的偏好+在给定约束条件下,这个人总是追求自我偏好最大化。
输赢的不对称:当人们面临风险决策时,他们更在乎的是成功与失败,赢和输,财富的变化,而不是最终的财富状态;(比如说,100元损失导致的效用的减少远远大于100收益导致的效用的增加)——>人们是损失规避型的(loss aversion);1.3 社会最优1.3.1 帕累托效率标准:帕累托效率:一种社会状态,与该状态相比,不存在任何一种可选择的状态,使得至少一个人的状态更好,同时没有任意一个人的状态变差帕累托改进:改变一种状态,使得没有任何一个人的处境变坏,但是至少有一个人的处境变好了**从非帕累托最优点到帕累托最优点不一定是帕累托改进1.3.2 卡尔多-希克斯标准总量最大化2 囚徒困境2.1 占优策略不管对方使用什么样的战略,只要参与人使用这一战略,都可以给自己带来最大的收益。
理性人做决策的时候,不需要假定对方是理性的。
占优战略均衡:由占优战略组成的战略组合。
2.2 囚徒困境尽管合作能让双方更好,但双方仍然不会合作怎么比较好地去记一个方框里面哪个是甲的收益哪个是乙的收益呢?我们画一条线,斜线上方的就是表格“上方”的乙的收益;斜线左边的就是表格“左边”的甲的收益。
两个假设:R>T>P>ST+T>R+S只要满足这两个条件,一定是个人理性选择不满足集体理性选择。
“智猪博弈”对公司绩效管理的启示
“智猪博弈”对公司绩效管理的启示“智猪博弈”模型是一个博弈论经济学中的著名模型,它给出了有悖效率与公平的“小猪躺着大猪跑”均衡解。
通过分析该模型得出规则是导致“小猪躺着大猪跑”现象的根本原因。
本文通过分析因规则改变而产生的改进“智猪博弈”模型得出了公司只有建立对内体现公平性,对外保持竞争性的绩效管理体制才能提高公司的竞争力,使公司立于不败之地的启示。
标签:智猪博弈绩效管理启示一、“智猪博弈”模型在博弈论经济学中,“智猪博弈”是一个著名的纳什均衡的例子。
“智猪博弈”讲的是猪圈里有两头猪,一头大猪,一头小猪。
猪圈的一头有一个猪食槽,另一头安装着一个按钮,控制着猪食的供应。
按一下按钮会有10个单位的猪食进槽,但按按钮的劳动将消耗相当于2个单位的猪食。
若大猪等待,小猪按,大猪吃9 个单位,小猪只能吃1个单位;若大猪按动按钮,小猪等待,大猪吃6个单位,小猪吃4个单位;若两头猪同时按,大小猪分别吃7个单位和3个单位,若两头猪同时不按,大小猪吃不到任何食物。
由此可以得出如下图所示不同的博弈策略下大猪、小猪的收入和收益矩阵。
如表1。
分析上图矩阵得出:如果大猪按的话,小猪按:收益1个单位,不按:收益4个单位,所以小猪选择不按;如果大猪不按的话,小猪按:收益为-1个单位,不按:收益为0个单位,所以小猪选择不按。
综上所述,不管大猪按还是不按,小猪的最优策略就是选择不按。
如果小猪不按的话,大猪按:收益为4个单位,不按:收益为0,所以大猪选择按。
根据纳什均衡原理,“智猪博弈”的均衡解就是大猪按,小猪不按,于是就出现了“小猪躺着大猪跑”的现象。
“智猪博弈”给了小猪以等待为最佳策略的启示。
小猪未能参与竞争创造价值,也能获得与参与竞争创造价值的大猪一样多的收益。
它反映了社会资源配置无效率和不公平。
二、改进“智猪博弈”的模型是什么导致“小猪躺着大猪跑”的现象?我们不能简单的指责“小猪”而同情“大猪”。
智猪博弈的困境,是对参与博弈的所有主体提出的一个难题。
博弈论案例分析
博弈论案例分析博弈论分析一、经济学中的“智猪博弈”(Pigs’payoffs)这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。
猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。
如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。
当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。
对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。
反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。
规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。
如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。
改变方案一:减量方案。
投食仅原来的一半分量。
结果是小猪大猪都不去踩踏板了。
小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。
谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。
投食为原来的一倍分量。
结果是小猪、大猪都会去踩踏板。
谁想吃,谁就会去踩踏板。
反正对方不会一次把食物吃完。
小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。
投食仅原来的一半分量,但同时将投食口移到踏板附近。
纳什均衡案例
纳什均衡案例奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸,两人均不幸遇难。
纳什在与命运的博弈中找到均衡,纪念大师最好的方式就是尝试了解博弈论。
纳什均衡的应用是多领域的。
而事实上,从日常生活中可以找到很多纳什均衡的经典案例,让我们普通人也可以尝试了解一下这一世界级的发现和理论!首先我们先简单看一下纳什均衡的经济学含义:所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
大家可以现有一个简单的印象,结合下面的案例再回来看这个定义。
案例一、智猪博弈猪圈里有两头猪,一头大猪,一头小猪。
猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。
如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。
当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。
对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。
反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
案例二、囚徒困境(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。
)假设有两个小偷A和B联合犯事、私入民宅被警察抓住。
警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。
纳什均衡及应用举例-博弈论
n 信息集:参与人在特定时刻有关变量的值的 信息
n Common Knowledge 即共同知识(所有参与 人知道,所有参与人知道所有参与人知道,)
Complete and Perfect ——完全信息与完美信息
0 n 需求大, A不开发, B开发, B为8000万元,A
为0 n 需求大, A不开发, B不开发,都为0 n 需求小, A开发, B开发,AB各为-3000万元 n 需求小, A开发, B不开发。A为1000万元B为0 n 需求小, A不开发, B开发A为0,B为1000万元 n 需求小, A不开发, B不开发,都为0
用水平 n 自然人或团体,如企业、国家、OPEC、EU n 重要的是每个决策主体必须有可供选择的行动或策略
和一个很好定义的偏好 n 而不做决策的被动主体只当作环境参数 n 虚拟参与人:“自然”(nature)作为“虚拟参与人”
(pseudo-player)来处理。这里的自然指决定外生 随机变量的概率分布的机制
n 它是指在一个特定的策略组合下player得到 的确定的效用水平,或者指参与人得到的期 望效用水平。
n 这是player真正关心的东西,是player博弈 后所得利益。
n 他的目标就是在自己可以选择的战略集合里, 选择某个战略以最大化自己的期望效用函数 (v-N-M预期效用函数)。
支付
n 如果有n人博弈,令ui为Player i 的支付(效用 水平),u=(u1,…ui…un)为支付组合payoff profile,
n 两者主要区别是在对博弈结果与博弈进程知识的掌 握情况有差别:
智猪博弈”模型
智猪博弈”模型经济学虽然有时枯燥而复杂,但是,有时经济学也可以很可爱的,它的可爱之处在于,它来源于生活,也可应用于生活。
如果你是MM,结婚后你会不会总是抱怨家里的家务活为什么总是我在干?是啊,为什么呢?难道上天真的对你特别不公吗?难道你真的那么倒霉吗?在回答这些问题前,我悄悄地告诉你,有一个称之为“猪”的动物跟你有同样的遭遇,他也正纳闷着,为啥受伤的总是他呢?当然这个“猪”绝非一般的猪,他们是很聪明的,所以我们喜欢叫他们为“智猪”。
他们到底遇到什么麻烦了呢,让我们先耐心的听他们所发生的故事吧!猪圈里有两只智猪,都能思考,很聪明,不过一头是大猪,一头是小猪。
在这个大大的猪圈里的一边有一个食槽,而在另一边有一个按钮,控制着猪食的供应。
按一下这个按钮,会有10个单位的猪食进入食槽内,但谁按按钮谁自己就需要消耗2个单位的猪食能量。
如果大猪先到食槽,大猪一下子就可以吃掉9个单位的猪食,而后到的可怜小猪只能吃到1个单位的猪食;如果两只猪同时到食槽,大猪会采用霸权主义的手法抢占了7个单位,小猪只能吃到3个单位;如果小猪先到食槽,小猪就可以吃掉6个单位的猪食,大猪可以吃到4个单位。
这两只智猪都想消耗最少的能量,而又吃到更多的猪食,那么,它们会怎样做呢?大猪和小猪的问题就是谁去按那个按钮,因为去按按钮的那个猪要消耗2个单位的猪食的能量,此外,按钮在另一边,他跑过去跑回来的这段时间,另一只猪就有了先吃的机会,而去按按钮的那只猪只能后吃剩下的了,所以两只猪就要想了,到底自己要不要去按那个按钮呢?大猪和小猪都去“按”了,两只猪同时去“按”,同时回来吃,大猪可以吃到7个单位的猪食,但消耗了2个单位的,所以得到净收益是5个单位的猪食;而小猪只能得到3个单位的猪食,又消耗了2个单位,所以得到的净收益只有1个单位的猪食了。
如果大猪选择去“按”,而小猪选择在食槽旁“等待”不去按,然后他们的这个策略选择的净得益就是,大猪得了2个单位的猪食,而小猪得到了6个单位的猪食。
博弈论的几个经典模型
• 潘天群著,博弈生存(第二版),中央编 译出版社,2004年10月
• 王春永编著,博弈论的诡计,中国发展出 版社,2007年1月
博弈论的几个经典模型
基本术语
• 博弈论研究的对象:是理性的行动者或参与 者如何选择策略或如何作出行动的决定。理 性的人是对现实的人的基本假定,即假定参 与者努力用自己的推理能力使自己的目标最 大化。“理性的”与“道德的”不是一回事, 理性的与道德的有时会发生冲突,但是理性 的人不一定是不道德的。
合作互动是指既存在协调又存在冲突的博弈协调是因为两个参与同时改变行动可以变得更好冲突是因为尽管其他参与人承诺行动也不一定有利于该参与人支付的增加前者可能引起无效率后者则意意味着无效率状态会成为均衡博弈论的几个经典模型猎鹿类型协调博弈由策略不确定性所引起的均衡结果依赖于参与人之间的行为预期博弈支付与策略风险
小猪
大猪
按
不按(等待)
按
(5,1)
(5,3)
不按(等待)
(9,-1)
(0,0)
大猪和小猪分别该如何选择。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
选择等待是小猪的占优策略。
大猪的最佳选择取决于小猪的行动,如果小猪 去按,大猪最好选择等待;如果小猪不去按, 则最佳选择是大猪亲自去按。
也就是说,在智猪博弈中,大猪没有占优策略, 而小猪有占优策略,它的最佳选择就是耐心 等待大猪去按钮,才能获得最佳结果。
• 不完全信息博弈:参与者所做的是努力使自 己的期望支付或期望效用最大化。
博弈论的几个经典模型
模型一、智猪博弈/完全信息静态博弈
例:猪圈里有两只猪,一只比较大,一只比较 小。猪圈狭长,猪食槽在一头,猪食按钮在 另一头,按一下会有10个单位的猪食落进槽 里。由于按钮和食槽距离较远,按按钮的体 力耗费相当于2个单位的食物。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
智猪博弈理论介绍在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。
假设猪圈里有一头大猪、一头小猪。
猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。
那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。
实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。
用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择:从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。
综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。
在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。
在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。
这时候有所不为才能有所为!高明的管理者善于利用各种有利的条件来为自己服务。
“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。
这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。
博弈与制度由智猪博弈故事得到的启示在这个例子中,对小猪而言,无论大猪是否踩动踏板,不去踩踏板总比踩踏板好。
反观大猪,明知小猪不会去踩踏板,但是去踩踏板总比不踩强,所以只好亲历亲为了。
这个案例令我们不得不思考——【博弈与制度】“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。
在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。
博弈其实是一种斗智的竞争。
作为一门科学,博弈论就是研究不同主体之间相互影响行为的一种学问。
或者准确地说,博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问,因此也有人把它称为“对策论”。
对于企业经营者来说,如何理解博弈论,如何运用博弈论原理指导企业有效管理,这是值得思考的事情。
在价格和产量决策、经济合作和经贸谈判、引进和开发新技术或新产品、参与投标拍卖、处理劳资关系,以及在与政府的关系和合作等多方面,博弈论都是企业经营者十分有效的决策工具,或者至少是比较科学的决策思路。
还有一个经典案例,是说当年英国政府将流放澳洲的犯人交给往来于澳洲之间的商船来完成,由此经常会发生因商船主或水手虐待犯人,致使大批流放人员因此死在途中(葬身大海)的事件发生。
后来大英帝国对运送犯人的办法(制度)稍加改变,流放人员仍然由往来于澳洲的商船来运送,只是运送犯人的费用要等到犯人送到澳洲后才由政府支付给商船。
仅就这样一点小小的“改变”,几乎再也没有犯人于中途死掉的事情发生。
关于这一问题,现任招商局掌门人秦晓先生在最近做客央视《对话》节目时,也谈了他的一些看法。
他认为:企业领导人应该去制定游戏规则,而不应该单纯地去做裁判。
他觉得制度应当比个人的权威和魅力更重要。
小平同志讲过一句话,说一个好的制度可以约束坏人;一个坏的制度呢可以使好人变坏。
回顾历史,我们动不动就说获诺贝尔奖学金会怎么样,爱迪生又发明了什么,但几乎少有人讲保险制度对社会进步的贡献有多大,专利制度对社会进步的贡献有多大。
于是乎,又引出另一个新的问题——【制度与文化】在企业文化研究中,人们对“文化与制度”的认识经常陷入一种误区:或把二者对立起来,或把二者混为一谈,分不清二者在企业管理中的地位与作用。
有人把企业文化概括成三个层次:物质文化、制度文化和精神文化。
这种从广义角度界定的企业文化,无疑把制度包含在内,即制度也是一种文化。
但如果我们从狭义角度去研究企业文化,制度只是文化的一种载体。
制度与文化属于两个不同层次的管理和两种不同的管理方式。
文化管理高于制度管理。
制度更多地强调外在的监督与控制,是企业倡导的“文化底限”,即要求员工必须做到的;文化则更多地强调价值观、理想信念和道德力量,强调内在的自觉与自律,是“文化高境界”。
制度与文化是互动的。
当管理者认为某种文化需要倡导时,他可能通过培养典型的形式,也可能通过开展活动的形式来推动和传播。
但要把倡导的新文化渗透到管理过程之中,变成人们的自觉行动,制度则是最好的载体之一。
文化优劣或主流文化的认同度决定着制度的成本。
当企业倡导的优秀文化且主流文化认同度高时,企业制度成本就低;当企业倡导的文化适应性差且主流文化认同度低时,企业的制度成本则高。
由于制度是外在约束,当制度文化尚未形成时,在没有监督的情况下,员工就可能“越轨”或不能按要求去做,其成本自然就高;当制度文化形成以后,人们自觉从事工作,制度成本就会大大降低,尤其当超越制度的文化形成时,制度成本就会更低。
企业制度文化是企业文化的重要组成部分,制度文化又是精神文化的基础和载体,并对企业精神文化起反作用。
一定的企业机制的建立,又影响人们选择新的价值观念,成为新的精神文化的基础。
企业文化总是沿着精神文化——制度文化——新的精神文化的轨迹不断发展、丰富和提高。
企业的制度文化也是企业行为文化得以贯彻的保证。
同企业职工生产、学习、娱乐、生活等方面直接发生联系的行为文化建设如何,企业经营作风是否具有活力、是否严谨,精神风貌是否高昂,人际关系是否和谐,职工文明程度是否得到提高等,无不与制度文化的保障作用有关。
由此可见,优秀企业文化的管理制度,必须是科学、完善、实用的管理方式的体现。
既然这样,有人就认为,一个企业的管理是否完善,应凭它有多少条制度来衡量,规章制度越多,说明企业管理越完善,企业越有发展潜力。
甚至还有人认为企业管理中最好不要存在管理艺术,只要企业管理制度完善了,企业就会杜绝一切可能出现的错误,这就是企业管理追求的境界。
制度真能解决一切吗?我们先看看两个例子。
美国资本市场作为世界上运作最规范及效率最高的市场之一,其运行模式一直被作为其它市场的学习对象。
可是近年来却频频暴露出一系列丑闻,先有安然事件,再有世界通讯、华尔街中介的作假行为,这不由让我们产生反思,美国有世界上最好的公司制度,有强有力的监督机制,有完善的法治体制,为何制度会失效呢?这时,我们不得不研究——【法治与文化】企业作为市场经济中创造价值的主要实体,它的活动需要博弈,更需要规则。
依法治企是市场经济发展的必然选择。
历史上最早的市场经济的确是完全的自由经济,政府只充当市场的“守夜人”。
然而,西方发达国家在历经“自由竞争”的磨难之后,深感缺乏法治的经济虽然“自由”,但所付出的代价太大,于是不约而同地选择了经济法治,以求借助法治的力量来引导、规范和制约亚当斯密那只“看不见的手”。
作为一种制度方式,法律的存在价值在于介入社会并且调控内在的关系。
然而,就因为这样一门以解决问题为导向的学科,法学吸收了大量的研究方法去观察世界,并以丰富多彩的表现形式反哺于其他学科。
现在从学科的研究成果来看,不管是法学还是经济学,它们的核心主题是制度。
因为,社会科学的问题无外乎描述社会如何存在和运行的实证理论应该如何规范的理论,二者的结合则有种种所谓“改造世界”的政策主张和制度建构。
这样,市场博弈就成了法律和经济的最佳结合点。
一项法律规则会引申出一套博弈规则,签订一个契约也就意味着已经进入一种博弈。
但任何人都知道,没有一项法制是包治百病的,只有对法制的内涵有正确的理解,才不会陷入制度的陷阱之中。
同样,企业管理规章制度作为正式制度之一,是用“他律”来规范员工的行为,它的作用是显而易见的,是一种显性的制度。
但是企业仅仅有规章管理制度还是不够的,在正式制度之外有管理漏洞的空白,这就需要另一种制度来配合,那就是企业文化。
新制度经济学认为,制度包括了正式制度和非正式制度。
正式制度是指人们有意识创造的一系列政策法规,包括了政治、经济制度及由这些规则构成的等级结构。
具体到企业则指企业的产权制度、治理结构、组织结构及规章制度。
非正式制度是指人们在长期交往中形成的、世代相传的一部分文化。
对企业而言,它主要指企业文化。
如果说企业管理制度是让想犯罪的人没有机会犯罪,那么企业文化就是让有机会犯罪的人不愿意犯罪!我们强调依法治企,是没有任何错误的,因为我们的企业还有很多人治的色彩,还没有与真正意义上的市场经济接轨。
但强调的是,如果对其依赖过了头,就等于说有了法律和制度就会有一切,从这个意义上讲恐怕就有失偏颇。
无疑,企业文化是“以人为本”思想在企业管理中成功应用的最新成果。
这里强调企业管理要做到正式制度和非正式制度的有机结合,换而言之,就是在抓法治中推进企业文化建设;同时,通过企业文化建设,进一步实现企业法治。
综上所述,企业文化从某种意义上说是企业家的文化。
但企业党的组织和工作机关作为企业文化建设的实施者,不能仅停留在理论层面谈文化建设,如果能够把制度建设和依法治企作为工作的切入点,不断加大对企业文化的建设力度,这样不但能使企业文化建设产生“吹糠见米”的作用,而且也使企业文化建设有了坚实可靠的保证。
纳什均衡百科名片纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
目录[隐藏]纳什均衡名称来源及简介:纳什均衡定义:纳什均衡经典案例:囚徒困境纳什均衡的重要影响纳什的传记:《普林斯顿的幽灵》纳什均衡名称来源及简介:约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。
其研究成果见于题为《非合作博弈》(1950)的博士论文。
该博士论文导致了《n人博弈中的均衡点》(19 50)和题为《非合作博弈》(1951)两篇论文的发表。
纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。
他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。
该解概念后来被称为纳什均衡。
纳什均衡定义:假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。