决策理论-第七章-竞争型决策分析-博弈论
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
田忌赛马
古代齐威王与大将田忌赛马,田忌的谋士孙膑 运用计谋帮助田忌以弱胜强。
比赛规则:田忌与齐威王各出三匹马,一对一 比赛三场,每一场的输方要赔1千金给赢方。双 方的马按实力都可以分为上、中、下,但齐威王 的上、中、下均优于田忌的上、中、下。实际上, 田忌的上马、中马要优于齐威王的中马、下马。
泽尔滕
“要想在现代社会做一个有文化的人,你必 须对博弈论有一个大致了解”
——保罗·萨缪尔森
什么是博弈论?
博弈论是研究理性的决策者之间的冲突与合作 的理论,具体讲就是研究当决策主体的行为在 发生直接的相互作用时,人们如何进行决策以 及这种决策的均衡问题。
什么是博弈?
博弈是指代表不同利益主体的决策者,在一定的 环境条件和规则下,根据所掌握的信息,同时或先 后、一次或多次从各自允许选择的行动方案中加以 选择并实施,从而取得各自相应结果的过程。 如下棋,最后的结果就是由下棋双方你来我往轮流 做出决策,决策又相互影响、相互作用而得出的结 果。
2. 生活中的“囚徒困境”例子
例子1:商家价格战
出售同类产品的商家之间本来可以通过共 同将价格维持在高位而获利,但实际上却是 相互杀价,结果都赚不到钱。
当一些商家共谋将价格抬高,消费者实际 上不用着急,因为商家联合维持高价的垄断 行为一般不会持久,可以等待垄断的自身崩 溃,价格就会掉下来。
譬如,2000年我国几家生产彩电的大厂商 合谋将彩电价格维持高位,他们搞了一个 “彩电厂家价格自律联盟”,并在深圳举行 了由多家彩电厂商首脑参加的“彩电厂商自 律联盟高峰会议”。当时,国家有关部门还 未出台相关的反垄断法律,对于这种在发达 国家明显属于违法行为的所谓“自律联盟”, 国家在法律上暂时还是无能为力的。寡头厂 商在光天化日之下进行价格合谋,并且还通 过媒体大肆炒作,这在发达国家是不可思议 的。
基本要素:
参与人 策略集 收益
G S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n
二 纳什均衡
纳什均衡(Nash equilibrium)是指这样一种策略组合,这 种策略组合由所有参与人的最优策略组成,也就是说,在 给定别人策略的情况下,没有任何单个参与人有积极性选 择其他策略,从而没有任何人有积极性打破这种均衡。
例子2: 为什么要加入WTO?
WTO是一个自愿性申请加入的自由贸易联盟,即 WTO成员国之间实现低关税或零关税的相互间自 由贸易。为什么需要一个组织来协调国家之间的 自由贸易呢?这是因为,如果没有一个协调组织, 国与国之间的贸易就不会呈现低关税或零关税的 自由贸易局面,因为这时国与国之间的贸易是一 个“囚徒困境”。给定一个国家对另一个国家的 货物实行低关税,另一个国家反过来对这个国家 的货物实行高关税是占优于实行低关税的战略的。
表1 囚徒困境博弈
乙
招
不招
招 甲
不招
-5,-5 -10,0
0,-10 -1,-1
甲和乙都不会选择劣战略“不招”, 称为“剔除劣战略的占优战略均衡”。 其中“招”是占优于(优于)“不招”的 占优战略。
总结
囚徒困境反映了一个深刻的问题,这就是个 人追求最大自身利益的行为,常常并不能导致 实现社会的最大利益,也常常不能真正实现个 人自身利益的最大化。
策略有纯策略和混合策略之分。 纯策略指参与人在博弈中可以选择采用的行动方案, 混合策略是在纯策略空间上的一种概率分布,表示参与
人实际进行决策时根据这种概率分布在纯策略中随机选择 加以实施。
博弈的要素
3、支付 每个博弈方从各种策略组合中获得的收益或效用,它 是策略组合的函数,所以也称支付函数记为
u i(S ) u i(s 1 ,s2 , ,sn )
博弈的要素
1、参与人 是指博弈中独立决策、独立承担结果的决策主体。他
们可以是自然人或团体或法人,如企业、国家、地区、 社团、欧盟、北约等。
那些不作决策或虽做决策但不直接承担决策后果的被 动主体不是参与人,而只能当做环境参数来处理。如指 手划脚的看牌人、看棋人,企业的顾问等。
博弈的要素
2、策略 指每个博弈方在进行决策时可以选择的方法、做法等,
但是,尽管政府当时无力制止这种事情, 公众也不必担心彩电价格会上涨。这是因为, “彩电厂商自律联盟”只不过是一种“囚徒 困境”,彩电价格不会上涨。在高峰会议之 后不到二周,国内彩电价格不是上涨而是一 路下跌。这是因为厂商们都有这样一种心态: 无论其他厂商是否降价,我自己降价是 有 利于自己的市场份额扩大的。
总结
在寻找智猪博弈的均衡解时,我们的做法可归纳如下: 1、首先找出某一博弈参与人的严格劣战略,将它剔除掉, 从新构造一个不包括已剔除战略的博弈; 2、然后继续剔除这个新的博弈中某一参与人的严格劣战 略; 3、重复进行这一过程,直到剩下唯一的参与人战略组合 为止。
1 第一节 竞争型决策分析与博弈论 2 第二节 完全信息静态博弈 3 第三节 完全信息动态博弈
博弈论的思想溯源—竞争型决策
考虑竞争对手信息下所做的最优决策 市场竞争 政党竞争
美藉匈牙利数学家冯·诺依曼(John Von Neuman ) 和 美 藉 奥 地 利 经 济 学 家 摩 根 斯 顿 (Morgenstern)相识于普林斯顿大学,他们于 1944年出版了经典著作《博弈论与经济行为》, 为现代博弈论的发展奠定了基础。
威 王
中上下
1,-1 -1,1 3,-3 1,-1 1,-1 1,-1
中下上 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1
下上中 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1
下中上 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
田忌赛马-续篇
在上述混合策略下,齐威王的期望得益为1/6 (3+1+1+1+1-1)=1;田忌的期望得益为1/6(13-1-1-1-1)=-1,即多次进行这样的赛马,齐威王 平均每次能赢田忌1千金,这是因为齐威王三匹马的 总体实力略胜田忌三匹马总体实力的缘故.
x S m y S n
y S nx S m
二、智猪博弈:对诸多经济现象的解释
1. 智猪博弈
猪圈中有一头大猪和一头小猪,在猪圈的一端设 有一个按钮,每按一下,位于猪圈另一端的食槽中 就会有10单位的猪食进槽,但每按一下按钮会耗去 相当于2单位猪食的成本。如果大猪先到食槽,则大 猪吃到9单位食物,小猪仅能吃到1单位食物;如果 两猪同时到食槽,则大猪吃7单位,小猪吃3单位食 物;如果小猪先到,大猪吃6单位而小猪吃4单位食 物。下面给出这个博弈的支付矩阵。
局中人所选择的战略构成的组合(招,招) 被称为博弈均衡。这个组合中前后两个战略 分别表示甲和乙所选择的战略。
表1 囚徒困境博弈
乙
招
不招
招 甲
不招
-5,-5 -10,0
0,-10 -1,-1
(问题1:甲、乙如何选择?)
对甲来说 ,尽管他不 知道乙是选择了“招”还是“不 招”,他发现他自己选择“招”都是比选择 “不招”为好的。因此,“不招”是相对于 “招”的劣战略,他不会选择劣战略。所以, 甲会选择“招”。 同样,根据对称性,乙也会选择“招”, 结果是甲乙两人都“招”。
博弈的分类
三、按参加博弈的各个博弈方从博弈中所获得的 利益总和
1、零和博弈 2、常和博弈 3、变和博弈
博弈的分类
四、按参与人行动的先后顺序 1、静态博弈 2、动态博弈
博弈的分类
五、按参与人所掌握的信息 1、完全信息博弈 2、不完全信息博弈
六. 博弈的分类-混合划分
行动顺序
静态
信息
完全信息
完全信息静态博弈 纳什均衡 纳什(1950,1951)
纳什
美国的数学家、经济学家纳什(John Nash),美籍匈牙利经济学家海萨尼 (John C. Harsanyi)和德国经济学家泽尔 滕(R.Selten)因对博弈论的卓越贡献而获 得1994年度的诺贝尔经济学家。
海萨尼
值得一提的是纳什,他发表奠定其 在博弈论中重要地位的学术论文时,年 仅22岁,被人称为“一个天才”。 1959年,纳什被精神病医生诊断为 “妄想性精神分裂”,饱受精神病折磨 40余年。
我们可以利用这个道理来分析日常生活中的 许多不合作现象。
对经典经济学的冲击
“纳什均衡”首先对亚当·斯密的“看不见的手”的原理 提出挑战。按照斯密的理论,在市场经济中,每一个人 都从利己的目的出发,而最终全社会达到利他的效果。 《国富论》:“通过追求(个人的)自身利益,他常常会 比其实际上想做的那样更有效地促进社会利益。” 从“纳什均衡”我们引出了“看不见的手”的原理的一 个悖论:从利己目的出发,结果损人不利己,既不利己 也不利他。两个囚徒的命运就是如此。从这个意义上说, “纳什均衡”提出的悖论实际上动摇了西方经济学的基 石。
u i ( s i * , s i * 1 , s i * , s i * 1 ,s n * . ) u . i ( s i * , . s i * 1 , s i, s j i * 1 ,s n * . )
求解方法:划线法
囚 徒 困 境
-5, -5 -10, 0
0, -10 -1, -1
按 大猪
等待
智猪博弈
小猪 按
等待
5,1
4,4
9, -1
0,0
这个博弈没有“剔除劣战略均衡”,因为大猪没有 劣战略。
但是,小猪有一个劣战略“按”,因为无论大猪 作何选择,小猪选择“等待”是比选择“按”更好 一些的战略。
所以,如果小猪是理性的,小猪会剔除“按”, 而选择“等待”;大猪知道小猪会选择“等待”, 从而自己选择“按”,所以,可以预料博弈的结果 是(按,等待)。这称为“重复剔除劣战略的占优战略 均衡”,其中小猪的战略“等待”占优于战略 “按”,而给定小猪剔除了劣战略“按”后,大猪 的战略“按”又占优于战略“等待”。
动态
完全信息动态博弈 子博弈精炼纳什均衡 泽尔腾(1965)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡 海萨尼(1967-1968)
不完全信息动态博弈 精炼贝叶斯纳什均衡 泽尔腾(1975)
1 第一节 竞争型决策分析与博弈论 2 第二节 完全信息静态博弈 3 第三节 完全信息动态博弈
一.博弈的标准式表达
比赛结果:田忌连输三场;后孙膑建议,以上 对中、以中对下、以下对上,结果以2:1赢得比 赛。
田忌赛马-续篇
这个案例生动地告诉我们,巧妙地运用策略是多 么的重要。
但是,事情并没有结束,齐威王也很聪明,他利 用各种手段,很快明白了自己输掉比赛的原因而及 时地调整了自己的对策。这样,齐威王与田忌的赛 马也就成了一个具有策略依存特征的决策较量,构 成了一个典型的博弈问题
三.两人有限零和博弈
(一)两人有限零和博弈模型
11
A
m1
1n
mn
(二)最优纯策略纳什均衡
m a ix m j inij m j in m a ixij i j v
(三)最优混合策略纳什均衡
m a x m i n E ( x y ) m i n m a x E ( x y ) E ( x y ) v
一、从“囚徒困境”谈起
(一) 囚徒困境
两个小偷甲和乙联手作案,私入民宅被警方逮住但 未获证据。警方将两人分别置于两间房间分开审讯, 政策是若一人招供但另一人未招,则招者立即被释放, 未招者判入狱10年;若二人都招则两人各判刑5年;若 两人都 不招则未获证据但因私入民宅 各拘留1年。
甲和乙是参与博弈的人,称为“局中 人”。表1中每一个小方格内的数字被称为 局中人的支付,其中左边的数字代表甲的支 付,右边的是乙的支付。表1中的双变量矩 阵称为博弈支付矩阵。
博弈的要素
4、博弈方的信息 信息是博弈参与方有关其他博弈方的策略、收益等 知识。
5、博弈的次序 规定一个博弈就必须规定其次序,不同的次序是不同 的博弈。
6、结果和均衡 结果指博弈中博弈方的行动所产生的每一可能情形。
博弈的分类
一、按参与方数目:
1、单人博弈、按各博弈方可选策略数量的多少 1、有限博弈 2、无限博弈
如果把赢一千金记成收益1,输一千金记成收益 为-1,则齐威王和田忌在各种策略组合下的收益 如下表所示:
田忌赛马-续篇
田忌
上中下 上下中 中上下 中下上 下上中 下中上
上中下 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1
齐 上下中 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1