决策理论 第七章 竞争型决策分析--博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈的分类
五、按参与人所掌握的信息
1、完全信息博弈
2、不完全信息博弈
六. 博弈的分类-混合划分
行动顺序 信 息 完全信息静态博弈 纳什均衡 纳什(1950,1951) 完全信息动态博弈 子博弈精炼纳什均衡 泽尔腾(1965) 静态
动态
完全信息
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡 海萨尼(1967-1968)
博弈的要素
3、支付 每个博弈方从各种策略组合中获得的收益或效用,它 是策略组合的函数,所以也称支付函数记为
ui (S ) ui (s1, s2 ,, sn )
博弈的要素
4、博弈方的信息 信息是博弈参与方有关其他博弈方的策略、收益 等知识。 5、博弈的次序 规定一个博弈就必须规定其次序,不同的次序是不 同的博弈。 6、结果和均衡 结果指博弈中博弈方的行动所产生的每一可能情 形。
不完全信息动态博弈 精炼贝叶斯纳什均衡 泽尔腾(1975)
1
第一节 竞争型决策分析与博弈论
2
第二节 完全信息静态博弈
3
第三节 完全信息动态博弈
一.博弈的标准式表达
基本要素: 参与人 策略集 收益
G S1, S2 ,, Sn ; u1, u2 ,, un
二 纳什均衡
纳什均衡(Nash equilibrium)是指这样一种策略组合,这 种策略组合由所有参与人的最优策略组成,也就是说,在 给定别人策略的情况下,没有任何单个参与人有积极性选 择其他策略,从而没有任何人有积极性打破这种均衡。
田忌赛马
古代齐威王与大将田忌赛马,田忌的谋士孙膑 运用计谋帮助田忌以弱胜强。 比赛规则:田忌与齐威王各出三匹马,一对一 比赛三场,每一场的输方要赔1千金给赢方。双 方的马按实力都可以分为上、中、下,但齐威王 的上、中、下均优于田忌的上、中、下。实际上, 田忌的上马、中马要优于齐威王的中马、下马。 比赛结果:田忌连输三场;后孙膑建议,以上 对中、以中对下、以下对上,结果以2:1赢得比 赛。
表1 囚徒困境博弈 乙
招 招 甲 不招 -5,-5 -10,0
不招 0,-10 -1,-1
(问题1:甲、乙如何选择?)
对甲来说 ,尽管他不 知道乙是选择了“招”还是 “不招”,他发现他自己选择“招”都是比 选择“不招”为好的。因此,“不招”是相 对于“招”的劣战略,他不会选择劣战略。 所以,甲会选择“招”。 同样,根据对称性,乙也会选择 “招”,结果是甲乙两人都“招”。
纳什
美国的数学家、经济学家纳什(John Nash),美籍匈牙利经济学家海萨尼 (John C. Harsanyi)和德国经济学家泽尔 滕(R.Selten)因对博弈论的卓越贡献而获 得1994年度的诺贝尔经济学家。
海萨尼
值得一提的是纳什,他发表奠定其 在博弈论中重要地位的学术论文时,年 仅22岁,被人称为“一个天才”。
但是,尽管政府当时无力制止这种事情, 公众也不必担心彩电价格会上涨。这是因为, “彩电厂商自律联盟”只不过是一种“囚徒 困境”,彩电价格不会上涨。在高峰会议之 后不到二周,国内彩电价格不是上涨而是一 路下跌。这是因为厂商们都有这样一种心态: 无论其他厂商是否降价,我自己降价是 有 利于自己的市场份额扩大的。
(一)两人有限零和博弈模型
11 1n A m1 mn
(二)最优纯策略纳什均衡
i j
max min ij min max ij i j v
j i
(三)最优混合策略纳什均衡 max min E ( xy) min max E ( xy) E ( x y ) v
1959年,纳什被精神病医生诊断为
“妄想性精神分裂”,饱受精神病折磨 40余年。
泽尔滕
“要想在现代社会做一个有文化的人,你必 须对博弈论有一个大致了解” ——保罗· 萨缪尔森
什么是博弈论?
博弈论是研究理性的决策者之间的冲突与合作
的理论,具体讲就是研究当决策主体的行为在 发生直接的相互作用时,人们如何进行决策以 及这种决策的均衡问题。
(一) 囚徒困境
两个小偷甲和乙联手作案,私入民宅被警方逮 住但未获证据。警方将两人分别置于两间房间分开审 讯,政策是若一人招供但另一人未招,则招者立即被 释放,未招者判入狱10年;若二人都招则两人各判刑 5年;若两人都 不招则未获证据但因私入民宅 各拘留1年。
甲和乙是参与博弈的人,称为“局中 人”。表1中每一个小方格内的数字被称为 局中人的支付,其中左边的数பைடு நூலகம்代表甲的支 付,右边的是乙的支付。表1中的双变量矩 阵称为博弈支付矩阵。 局中人所选择的战略构成的组合(招,招) 被称为博弈均衡。这个组合中前后两个战略 分别表示甲和乙所选择的战略。
田忌赛马-续篇
田忌
上中下 上下中 中上下 中下上 下上中 下中上
上中下
3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1
齐 威 王
上下中
中上下
中下上 下上中 下中上
1,-1 -1,1 3,-3 1,-1 1,-1 1,-1
-1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
对经典经济学的冲击
“纳什均衡”首先对亚当· 斯密的“看不见的手”的原理 提出挑战。按照斯密的理论,在市场经济中,每一个人 都从利己的目的出发,而最终全社会达到利他的效果。
《国富论》:“通过追求(个人的)自身利益,他常常会 比其实际上想做的那样更有效地促进社会利益。”
从“纳什均衡”我们引出了“看不见的手”的原理的一 个悖论:从利己目的出发,结果损人不利己,既不利己 也不利他。两个囚徒的命运就是如此。从这个意义上说, “纳什均衡”提出的悖论实际上动摇了西方经济学的基 石。
2. 生活中的“囚徒困境”例子
例子1:商家价格战 出售同类产品的商家之间本来可以通过 共同将价格维持在高位而获利,但实际上却 是相互杀价,结果都赚不到钱。 当一些商家共谋将价格抬高,消费者实 际上不用着急,因为商家联合维持高价的垄 断行为一般不会持久,可以等待垄断的自身 崩溃,价格就会掉下来。
田忌赛马-续篇
在上述混合策略下,齐威王的期望得益为1/6 (3+1+1+1+1-1)=1;田忌的期望得益为1/6(1-3-11-1-1)=-1,即多次进行这样的赛马,齐威王平均每 次能赢田忌1千金,这是因为齐威王三匹马的总体实 力略胜田忌三匹马总体实力的缘故.
博弈的要素
1、参与人 是指博弈中独立决策、独立承担结果的决策主体。他 们可以是自然人或团体或法人,如企业、国家、地区、 社团、欧盟、北约等。 那些不作决策或虽做决策但不直接承担决策后果的被
表1 囚徒困境博弈
乙
招
不招
0,-10 -1,-1
招
甲
-5,-5 -10,0
不招
甲和乙都不会选择劣战略“不招”,
称为“剔除劣战略的占优战略均衡”。
其中“招”是占优于(优于)“不招”的
占优战略。
总
结
囚徒困境反映了一个深刻的问题,这就是个 人追求最大自身利益的行为,常常并不能导致 实现社会的最大利益,也常常不能真正实现个 人自身利益的最大化。 我们可以利用这个道理来分析日常生活中的 许多不合作现象。
什么是博弈?
博弈是指代表不同利益主体的决策者,在一定的 环境条件和规则下,根据所掌握的信息,同时或先 后、一次或多次从各自允许选择的行动方案中加以
选择并实施,从而取得各自相应结果的过程。
如下棋,最后的结果就是由下棋双方你来我往轮流 做出决策,决策又相互影响、相互作用而得出的结 果。
一、从“囚徒困境”谈起
例子2:
为什么要加入WTO?
WTO是一个自愿性申请加入的自由贸易联盟,即 WTO成员国之间实现低关税或零关税的相互间自由 贸易。为什么需要一个组织来协调国家之间的自 由贸易呢?这是因为,如果没有一个协调组织, 国与国之间的贸易就不会呈现低关税或零关税的 自由贸易局面,因为这时国与国之间的贸易是一 个“囚徒困境”。给定一个国家对另一个国家的 货物实行低关税,另一个国家反过来对这个国家 的货物实行高关税是占优于实行低关税的战略的。
博弈的分类
一、按参与方数目:
1、单人博弈
2、两人博弈
3、多人博弈
博弈的分类
二、按各博弈方可选策略数量的多少
1、有限博弈
2、无限博弈
博弈的分类
三、按参加博弈的各个博弈方从博弈中所获得的
利益总和 1、零和博弈 2、常和博弈
3、变和博弈
博弈的分类
四、按参与人行动的先后顺序
1、静态博弈
2、动态博弈
第七章
竞争型决策分析
1
第一节 竞争型决策分析与博弈论
2
第二节 完全信息静态博弈
3
第三节 完全信息动态博弈
博弈论的思想溯源—竞争型决策
考虑竞争对手信息下所做的最优决策
市场竞争
政党竞争
美藉匈牙利数学家冯· 诺依曼(John Von Neuman ) 和 美 藉 奥 地 利 经 济 学 家 摩 根 斯 顿 (Morgenstern)相识于普林斯顿大学,他们于 1944年出版了经典著作《博弈论与经济行为》, 为现代博弈论的发展奠定了基础。
智猪博弈
小猪
按 按 5,1 9, -1 等待 4,4 0,0
大猪
等待
这个博弈没有“剔除劣战略均衡”,因为大猪没有 劣战略。 但是,小猪有一个劣战略“按”,因为无论大 猪作何选择,小猪选择“等待”是比选择“按”更 好一些的战略。 所以,如果小猪是理性的,小猪会剔除“按”, 而选择“等待”;大猪知道小猪会选择“等待”, 从而自己选择“按”,所以,可以预料博弈的结果 是(按,等待)。这称为“重复剔除劣战略的占优战 略均衡”,其中小猪的战略“等待”占优于战 略 “按”,而给定小猪剔除了劣战略“按”后,大猪 的战略“按”又占优于战略“等待”。
动主体不是参与人,而只能当做环境参数来处理。如指
手划脚的看牌人、看棋人,企业的顾问等。
博弈的要素
2、策略 指每个博弈方在进行决策时可以选择的方法、做法等,
策略有纯策略和混合策略之分。
纯策略指参与人在博弈中可以选择采用的行动方案, 混合策略是在纯策略空间上的一种概率分布,表示参与 人实际进行决策时根据这种概率分布在纯策略中随机选择 加以实施。
xSm ySn ySn xSm
二、智猪博弈:对诸多经济现象的解释 1. 智猪博弈
猪圈中有一头大猪和一头小猪,在猪圈的一端设 有一个按钮,每按一下,位于猪圈另一端的食槽中 就会有10单位的猪食进槽,但每按一下按钮会耗去 相当于2单位猪食的成本。如果大猪先到食槽,则大 猪吃到9单位食物,小猪仅能吃到1单位食物;如果 两猪同时到食槽,则大猪吃7单位,小猪吃3单位食 物;如果小猪先到,大猪吃6单位而小猪吃4单位食 物。下面给出这个博弈的支付矩阵。
譬如,2000年我国几家生产彩电的大厂商 合谋将彩电价格维持高位,他们搞了一个 “彩电厂家价格自律联盟”,并在深圳举行 了由多家彩电厂商首脑参加的“彩电厂商自 律联盟高峰会议”。当时,国家有关部门还 未出台相关的反垄断法律,对于这种在发达 国家明显属于违法行为的所谓“自律联盟”, 国家在法律上暂时还是无能为力的。寡头厂 商在光天化日之下进行价格合谋,并且还通 过媒体大肆炒作,这在发达国家是不可思议 的。
ui (s ,s , s , s ,...s ) ui (s ,s , sij , s ,...s )
* i * i 1 * i * i 1 * n * i * i 1 * i 1 * n
求解方法:划线法
囚 徒 困 境 -5, -5 -10, 0 0, -10 -1, -1
三.两人有限零和博弈
总
结
在寻找智猪博弈的均衡解时,我们的做法可归纳如下: 1、首先找出某一博弈参与人的严格劣战略,将它剔除掉, 从新构造一个不包括已剔除战略的博弈; 2、然后继续剔除这个新的博弈中某一参与人的严格劣战 略; 3、重复进行这一过程,直到剩下唯一的参与人战略组合 为止。 这唯一的参与人战略组合,就是这个博弈的均衡解,称 为重复剔除的占优战略均衡。
田忌赛马-续篇
这个案例生动地告诉我们,巧妙地运用策略是多 么的重要。 但是,事情并没有结束,齐威王也很聪明,他利 用各种手段,很快明白了自己输掉比赛的原因而及 时地调整了自己的对策。这样,齐威王与田忌的赛 马也就成了一个具有策略依存特征的决策较量,构 成了一个典型的博弈问题 如果把赢一千金记成收益1,输一千金记成收益 为-1,则齐威王和田忌在各种策略组合下的收益 如下表所示: