第八章博弈论与信息经济学
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 如果目的是想让猪们去多踩踏板,这个游戏规则的 设计显然是失败的。
改变方案二:增量方案。
• 投食为原来的一倍分量。 • 结果是小猪、大猪都会去踩踏板。谁想吃,谁就
会去踩踏板。反正对方不会一次把食物吃完。小 猪和大猪相当于生活在物质相对丰富的“共产主 义”社会,所以竞争意识却不会很强。 • 对于游戏规则的设计者来说,这个规则的成本相 当高(每次提供双份的食物);而且因为竞争不 强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。
• 投食仅原来的一半分量,但同时将投食口 移到踏板附近。
• 结果呢,小猪和大猪都在拼命地抢着踩踏 板。等待者不得食,而多劳者多得。每次 的收获刚好消费完。
• 对于游戏设计者,这是一个最好的方案。 成本不高,但收获最大。
启示:
• 原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启 发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源 配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有 人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车” 现象,就要看游戏规则的核心指标设置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公 司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这 相当于“智猪博弈” 增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳 动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博 弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量 加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提 成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有 效的激励。 许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。 股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继 而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因 此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改 变的个中道理。
这个博弈有两个纳什均衡:一方前进,另一方后退。但关键是谁进谁
退?一博弈,如果有惟一的纳什均衡点,那么这个博弈是可预测的,即 这个纳什均衡点就是事先知道的惟一的博弈结果。但是如果一博弈有两 个或两个以上的纳什均衡点,则任何人无法预测出一个结果来。因此, 我们无法预测斗鸡博弈的结果,即不能知道谁进谁退,谁输谁赢。
极大极小化策略
• 非理性情况下的选择
A
策略1
策略2
B 策略1 -20,-30 900,600
策略2 100,800 50,50
智猪博弈
• 两只猪各会采取什么策略? • 答案是:小猪将选择“搭便车”策略,也就是舒
舒服服地等在食槽边;而大猪则为一点残羹不知 疲倦地奔忙于踏板和食槽之间。
• 原因何在?因为,小猪踩踏板将一无所获,不踩 踏板反而能吃上食物。对小猪而言,无论大猪是 否踩动踏板,不踩踏板总是好的选择。反观大猪, 已明知小猪是不会去踩动踏板的,自己亲自去踩 踏板总比不踩强吧,所以只好亲力亲为了。
爱情的博弈 女
足球
芭蕾
足球
男
芭蕾
2,1 0,0
0,0 1,Biblioteka 2静态博弈与动态博弈• 静态博弈(static games):参与人同时, 或虽然不同时,但后行者并不知道先行者 选择的博弈。
• 动态博弈(dynamic games):参与人有 先后顺序,而且,后行者可以观察到先行 者选择的博弈
动态博弈—博弈树
• 1994年Nash (纳什)、 Harsanyi (海萨 尼)和Selten(塞尔顿)共同获得诺贝尔经 济学奖。
博弈结构[Structure of a Game]
• 博弈参与者[Player]——个人或机构。 • 假定参与者都是机智而理性的。局中人 • 策略[Strategy]——行为的过程。 • 假定博奕参与者知道他自己及其对手伙伴
进入者
进入 不进入
在位者 0,300
150,150 默许
斗争
-10,100
在位者
作斗争势
0,200
市场进入博弈 在位者
默许
斗争
进
进入
入
者 不进入
150,150 0,300
-10,100 0, 200
剔除劣战略的市场进入博弈
在位者 默许 进入 150,150 进入者 不进入 0 ,300
repeated games
斗鸡博弈强调的是,如何在博弈中采用妥协的方式取得利益。如果双方 都换位思考,它们可以就补偿进行谈判,最后造成以补偿换退让的协议, 问题就解决了。博弈中经常有妥协,双方能换位思考就可以较容易地达 成协议。考虑自己得到多少补偿才愿意退,并用自己的想法来理解对方。 只从自己立场出发考虑问题,不愿退,又不想给对方一定的补偿,僵局 就难以打破。
默许 斗争 进入 40,50 -10,0 进入者 不进入 0,100 0,100
无限次重复博弈
• 当博弈是重复无穷多次时,存在着不同于 一次博弈的合理的纳什均衡。例如在囚徒 困境中,如果有足够的耐心,(抵赖,抵 赖)将是一个合理的纳什均衡。
威胁和承诺的可信性
• 承诺行动 • 承诺的可信性 • 承诺成本:如果为1000
的策略选择范围,并了解各种策略之间的 因果关系。 • 支付[Payoff]——策略的结果。收益 • 博弈论用数字表示这类结果,并称之为支 付矩阵[Payoff matrix]。
例:囚犯的困境
囚 徒困境
囚徒 B
坦白
抵赖
囚
坦白
徒
A
抵赖
-5,-5 -7,-1
-1,-7 -2, -2
卡特尔困境
厂商乙
合作
重复博弈
• 重复博弈是指同样的博弈重复许多 次,其中每次博弈称为阶段博弈
• (stage game)。
• 重复次数的重要性来自参与人在短 期利益与长期利益之间的权衡。
影响重复博弈均衡结果的因素
• 博弈重复的次数,次数越多,越考虑长远 利益。
• 信息的完备性
有限次重复博弈——连锁店悖论
进入博弈 在位者
• “小猪躺着大猪跑”的现象是由于故事中的游戏规则 所导致的。规则的核心指标是:每次落下的事物数 量和踏板与投食口之间的距离。
• 如果改变一下核心指标,猪圈里还会出现同样的 “小猪躺着大猪跑”的景象吗?试试看。
• 改变方案一:减量方案。投食仅原来的一半分量。 结果是小猪大猪都不去踩踏板了。小猪去踩,大猪 将会把食物吃完;大猪去踩,小猪将也会把食物吃 完。谁去踩踏板,就意味着为对方贡献食物,所以 谁也不会有踩踏板的动力了。
那么,两只猪各会采取什么策略?
博弈论初步
博弈论[Game Theory] 又名 对策论,游戏论。研究各博 弈参与主体在其行为相互依 存、相互作用时的决策以及 这种决策的均衡问题的理论。
博弈论的产生与发展
• 1944年Neumann (冯 ·诺依曼)和 orgensten(摩根斯坦)合著的《博弈论和 经济行为》标志了这个学科的成形。
• 美国数学家和统计学家纳什(Nash)于 20世纪50年代提出这一概念,所以称 作纳什均衡。
• 占优策略均衡一定是纳什均衡,但纳 什均衡不一定是占优策略均衡。
夫妻博弈
妻
和平
战争
和平
夫
战争
10,10 6,3
3,6 4, 4
斗鸡:
支付矩阵如下:
鸡乙/鸡甲 前进
前进
(-2,-2)
后退
(-1,1)
后退 (1,-1) (-1,-1)
4、弱者对于强者的剥削——智猪
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一 边有个踏板,每踩一下踏板,在远离踏板的猪圈的 另一边的投食口就会落下少量的食物。如果有一只 猪去踩踏板,另一只猪就有机会抢先吃到另一边落 下的食物。当小猪踩动踏板时,大猪会在小猪跑到 食槽之前刚好吃光所有的食物;若是大猪踩动了踏 板,则还有机会在小猪吃完落下的食物之前跑到食 槽,争吃到另一半残羹。
为什么会这样?
3、进退两难的选 -斗鸡
试想有两只公鸡狭路相逢,即将展开一场撕杀。每只公 鸡有两个行动选择:
一是退下来,一是进攻。 如果一方退下来,而对方没有退下来,对方获得胜利,
这个鸡就很丢面子; 如果自己没退下来,而对方退下来,自己则胜利,对方
则失败; 如果双方都退下来,则平手; 如果两个鸡都前进,那么则两败俱伤。 对每个鸡来说,最好的结果是什么?
• 囚徒困境的占优策略均衡是都坦白, 即:(坦白、坦白)。
• 卡特尔困境的占优策略均衡是都不 合作,即:(不合作、不合作)。
2、纳什均衡
乙
L
R
U 甲
D
7 10 68
35 89
纳什均衡[Nash Equilibrium]
• 指一组给定对手行为前提下对各博弈 方存在的最佳选择;在纳什均衡状态 下,只要其它参与者不变换策略选择, 任何单个参与者不可能单方面通过变 换策略来提高他的所获支付。
几个问题:
1、警察与小偷
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入 罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双 方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方), 而对方保持沉默,此人将即时获释,沉默者将重判。
若二人都保持沉默(相关术语称互相“合作”),则二人 同样判监。(但证据不足,轻判)
若二人都互相检举(互相“背叛”),则二人同样判监 (正常判)。
怎么决策?
2、关税战—两个国家,在关税上可以有以
两个选择:
提高关税,以保护自己的商品。(背叛)
与对方达成关税协定,降低关税以利各自商品流通。 (合作)
当一国因某些因素不遵守关税协定,而独自提高关税 (背叛)时,另一国也会作出同样反应(亦背叛), 这就引发了关税战,两国的商品失去了对方的市场, 对本身经济也造成损害(共同背叛的结果)。然后二 国又重新达成关税协定。
不合作
合 厂作 商 甲不
合 作
10 10 12 6
6 12 88
博弈均衡
• 均衡指博弈中所有局中人都不想改变自己 策略的一种相对静止的状态。
• 占有策略(上策): • 不管局中其他人采取什么策略,某一局中
人都会采取认为对自己最有利的策略。
1、占优策略均衡(上策均衡)
•
指博弈中的所有参与者的占优
策略组合所构成的均衡。
改变方案二:增量方案。
• 投食为原来的一倍分量。 • 结果是小猪、大猪都会去踩踏板。谁想吃,谁就
会去踩踏板。反正对方不会一次把食物吃完。小 猪和大猪相当于生活在物质相对丰富的“共产主 义”社会,所以竞争意识却不会很强。 • 对于游戏规则的设计者来说,这个规则的成本相 当高(每次提供双份的食物);而且因为竞争不 强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。
• 投食仅原来的一半分量,但同时将投食口 移到踏板附近。
• 结果呢,小猪和大猪都在拼命地抢着踩踏 板。等待者不得食,而多劳者多得。每次 的收获刚好消费完。
• 对于游戏设计者,这是一个最好的方案。 成本不高,但收获最大。
启示:
• 原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启 发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源 配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有 人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车” 现象,就要看游戏规则的核心指标设置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公 司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这 相当于“智猪博弈” 增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳 动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博 弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量 加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提 成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有 效的激励。 许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。 股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继 而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因 此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改 变的个中道理。
这个博弈有两个纳什均衡:一方前进,另一方后退。但关键是谁进谁
退?一博弈,如果有惟一的纳什均衡点,那么这个博弈是可预测的,即 这个纳什均衡点就是事先知道的惟一的博弈结果。但是如果一博弈有两 个或两个以上的纳什均衡点,则任何人无法预测出一个结果来。因此, 我们无法预测斗鸡博弈的结果,即不能知道谁进谁退,谁输谁赢。
极大极小化策略
• 非理性情况下的选择
A
策略1
策略2
B 策略1 -20,-30 900,600
策略2 100,800 50,50
智猪博弈
• 两只猪各会采取什么策略? • 答案是:小猪将选择“搭便车”策略,也就是舒
舒服服地等在食槽边;而大猪则为一点残羹不知 疲倦地奔忙于踏板和食槽之间。
• 原因何在?因为,小猪踩踏板将一无所获,不踩 踏板反而能吃上食物。对小猪而言,无论大猪是 否踩动踏板,不踩踏板总是好的选择。反观大猪, 已明知小猪是不会去踩动踏板的,自己亲自去踩 踏板总比不踩强吧,所以只好亲力亲为了。
爱情的博弈 女
足球
芭蕾
足球
男
芭蕾
2,1 0,0
0,0 1,Biblioteka 2静态博弈与动态博弈• 静态博弈(static games):参与人同时, 或虽然不同时,但后行者并不知道先行者 选择的博弈。
• 动态博弈(dynamic games):参与人有 先后顺序,而且,后行者可以观察到先行 者选择的博弈
动态博弈—博弈树
• 1994年Nash (纳什)、 Harsanyi (海萨 尼)和Selten(塞尔顿)共同获得诺贝尔经 济学奖。
博弈结构[Structure of a Game]
• 博弈参与者[Player]——个人或机构。 • 假定参与者都是机智而理性的。局中人 • 策略[Strategy]——行为的过程。 • 假定博奕参与者知道他自己及其对手伙伴
进入者
进入 不进入
在位者 0,300
150,150 默许
斗争
-10,100
在位者
作斗争势
0,200
市场进入博弈 在位者
默许
斗争
进
进入
入
者 不进入
150,150 0,300
-10,100 0, 200
剔除劣战略的市场进入博弈
在位者 默许 进入 150,150 进入者 不进入 0 ,300
repeated games
斗鸡博弈强调的是,如何在博弈中采用妥协的方式取得利益。如果双方 都换位思考,它们可以就补偿进行谈判,最后造成以补偿换退让的协议, 问题就解决了。博弈中经常有妥协,双方能换位思考就可以较容易地达 成协议。考虑自己得到多少补偿才愿意退,并用自己的想法来理解对方。 只从自己立场出发考虑问题,不愿退,又不想给对方一定的补偿,僵局 就难以打破。
默许 斗争 进入 40,50 -10,0 进入者 不进入 0,100 0,100
无限次重复博弈
• 当博弈是重复无穷多次时,存在着不同于 一次博弈的合理的纳什均衡。例如在囚徒 困境中,如果有足够的耐心,(抵赖,抵 赖)将是一个合理的纳什均衡。
威胁和承诺的可信性
• 承诺行动 • 承诺的可信性 • 承诺成本:如果为1000
的策略选择范围,并了解各种策略之间的 因果关系。 • 支付[Payoff]——策略的结果。收益 • 博弈论用数字表示这类结果,并称之为支 付矩阵[Payoff matrix]。
例:囚犯的困境
囚 徒困境
囚徒 B
坦白
抵赖
囚
坦白
徒
A
抵赖
-5,-5 -7,-1
-1,-7 -2, -2
卡特尔困境
厂商乙
合作
重复博弈
• 重复博弈是指同样的博弈重复许多 次,其中每次博弈称为阶段博弈
• (stage game)。
• 重复次数的重要性来自参与人在短 期利益与长期利益之间的权衡。
影响重复博弈均衡结果的因素
• 博弈重复的次数,次数越多,越考虑长远 利益。
• 信息的完备性
有限次重复博弈——连锁店悖论
进入博弈 在位者
• “小猪躺着大猪跑”的现象是由于故事中的游戏规则 所导致的。规则的核心指标是:每次落下的事物数 量和踏板与投食口之间的距离。
• 如果改变一下核心指标,猪圈里还会出现同样的 “小猪躺着大猪跑”的景象吗?试试看。
• 改变方案一:减量方案。投食仅原来的一半分量。 结果是小猪大猪都不去踩踏板了。小猪去踩,大猪 将会把食物吃完;大猪去踩,小猪将也会把食物吃 完。谁去踩踏板,就意味着为对方贡献食物,所以 谁也不会有踩踏板的动力了。
那么,两只猪各会采取什么策略?
博弈论初步
博弈论[Game Theory] 又名 对策论,游戏论。研究各博 弈参与主体在其行为相互依 存、相互作用时的决策以及 这种决策的均衡问题的理论。
博弈论的产生与发展
• 1944年Neumann (冯 ·诺依曼)和 orgensten(摩根斯坦)合著的《博弈论和 经济行为》标志了这个学科的成形。
• 美国数学家和统计学家纳什(Nash)于 20世纪50年代提出这一概念,所以称 作纳什均衡。
• 占优策略均衡一定是纳什均衡,但纳 什均衡不一定是占优策略均衡。
夫妻博弈
妻
和平
战争
和平
夫
战争
10,10 6,3
3,6 4, 4
斗鸡:
支付矩阵如下:
鸡乙/鸡甲 前进
前进
(-2,-2)
后退
(-1,1)
后退 (1,-1) (-1,-1)
4、弱者对于强者的剥削——智猪
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一 边有个踏板,每踩一下踏板,在远离踏板的猪圈的 另一边的投食口就会落下少量的食物。如果有一只 猪去踩踏板,另一只猪就有机会抢先吃到另一边落 下的食物。当小猪踩动踏板时,大猪会在小猪跑到 食槽之前刚好吃光所有的食物;若是大猪踩动了踏 板,则还有机会在小猪吃完落下的食物之前跑到食 槽,争吃到另一半残羹。
为什么会这样?
3、进退两难的选 -斗鸡
试想有两只公鸡狭路相逢,即将展开一场撕杀。每只公 鸡有两个行动选择:
一是退下来,一是进攻。 如果一方退下来,而对方没有退下来,对方获得胜利,
这个鸡就很丢面子; 如果自己没退下来,而对方退下来,自己则胜利,对方
则失败; 如果双方都退下来,则平手; 如果两个鸡都前进,那么则两败俱伤。 对每个鸡来说,最好的结果是什么?
• 囚徒困境的占优策略均衡是都坦白, 即:(坦白、坦白)。
• 卡特尔困境的占优策略均衡是都不 合作,即:(不合作、不合作)。
2、纳什均衡
乙
L
R
U 甲
D
7 10 68
35 89
纳什均衡[Nash Equilibrium]
• 指一组给定对手行为前提下对各博弈 方存在的最佳选择;在纳什均衡状态 下,只要其它参与者不变换策略选择, 任何单个参与者不可能单方面通过变 换策略来提高他的所获支付。
几个问题:
1、警察与小偷
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入 罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双 方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方), 而对方保持沉默,此人将即时获释,沉默者将重判。
若二人都保持沉默(相关术语称互相“合作”),则二人 同样判监。(但证据不足,轻判)
若二人都互相检举(互相“背叛”),则二人同样判监 (正常判)。
怎么决策?
2、关税战—两个国家,在关税上可以有以
两个选择:
提高关税,以保护自己的商品。(背叛)
与对方达成关税协定,降低关税以利各自商品流通。 (合作)
当一国因某些因素不遵守关税协定,而独自提高关税 (背叛)时,另一国也会作出同样反应(亦背叛), 这就引发了关税战,两国的商品失去了对方的市场, 对本身经济也造成损害(共同背叛的结果)。然后二 国又重新达成关税协定。
不合作
合 厂作 商 甲不
合 作
10 10 12 6
6 12 88
博弈均衡
• 均衡指博弈中所有局中人都不想改变自己 策略的一种相对静止的状态。
• 占有策略(上策): • 不管局中其他人采取什么策略,某一局中
人都会采取认为对自己最有利的策略。
1、占优策略均衡(上策均衡)
•
指博弈中的所有参与者的占优
策略组合所构成的均衡。