决策理论7
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例子2: 为什么要加入WTO?
WTO是一个自愿性申请加入的自由贸易联盟, 即WTO成员国之间实现低关税或零关税的相互 间自由贸易。为什么需要一个组织来协调国家 之间的自由贸易呢?这是因为,如果没有一个 协调组织,国与国之间的贸易就不会呈现低关 税或零关税的自由贸易局面,因为这时国与国 之间的贸易是一个“囚徒困境”。给定一个国 家对另一个国家的货物实行低关税,另一个国 家反过来对这个国家的货物实行高关税是占优 于实行低关税的战略的。
“要想在现代社会做一个有文化的人,你必 须对博弈论有一个大致了解” ——保罗· 萨缪尔森
什么是博弈论?
博弈论是研究理性的决策者之间的冲突与 合作的理论,具体讲就是研究当决策主体的 行为在发生直接的相互作用时,人们如何进 行决策以及这种决策的均衡问题。
什么是博弈?
博弈是指代表不同利益主体的决策者, 在一定的环境条件和规则下,根据所掌 握的信息,同时或先后、一次或多次从 各自允许选择的行动方案中加以选择并 实施,从而取得各自相应结果的过程。
田忌赛马-续篇
古代齐威王与大将田忌赛马,田忌的谋士孙 膑运用计谋帮助田忌以弱胜强。 比赛规则:田忌与齐威王各出三匹马,一对 一比赛三场,每一场的输方要赔1千金给赢方。 双方的马按实力都可以分为上、中、下,但 齐威王的上、中、下均优于田忌的上、中、 下。实际上,田忌的上马、中马要优于齐威 王的中马、下马。 比赛结果:田忌连输三场;后孙膑建议,以 上对中、以中对下、以下对上,结果以2:1 赢得比赛。
田忌赛马-续篇
在上述混合策略下,齐威王的期望得益为1/6 (3+1+1+1+1-1)=1;田忌的期望得益为1/6(1-31-1-1-1)=-1,即多次进行这样的赛马,齐威王平 均每次能赢田忌1千金,这是因为齐威王三匹马的总 体实力略胜田忌三匹马总体实力的缘故
博弈的要素
1、参与人: 是指博弈中独立决策、独立承担结果的决策主体。 他们可以是自然人或团体或法人,如企业、国家、 地区、社团、欧盟、北约等。 那些不作决策或虽做决策但不直接承担决策后果 的被动主体不是参与人,而只能当做环境参数来处 理。如指手划脚的看牌人、看棋人,企业的顾问等。
生活中的智猪博弈
例子1: 股市博弈 在股票市场上,大户是大猪,他们要进 行技术分析,收集信息、预测股价走势, 但大量散户就是小猪。 他们不会花成本去进行技术分析,而是 跟着大户的投资战略进行股票买卖,即 所谓“散户跟大户”的现象。
例子2:为何股份公司中的大股东才有投 票权?
在股份公司中,大股东是大猪,他们
譬如,2000年我国几家生产彩电的大厂 商合谋将彩电价格维持高位,他们搞了一 个“彩电厂家价格自律联盟”,并在深圳 举行了由多家彩电厂商首脑参加的“彩电 厂商自律联盟高峰会议”。当时,国家有 关部门还未出台相关的反垄断法律,对于 这种在发达国家明显属于违法行为的所谓 “自律联盟”,国家在法律上暂时还是无 能为力的。寡头厂商在光天化日之下进行 价格合谋,并且还通过媒体大肆炒作,这 在发达国家是不可思议的。
2. 生活中的“囚徒困境”例子
例子1:商家价格战 出售同类产品的商家之间本来可以通 过共同将价格维持在高位而获利,但实 际上却是相互杀价,结果都赚不到钱。 当一些商家共谋将价格抬高,消费者 实际上不用着急,因为商家联合维持高 价的垄断行为一般不会持久,可以等待 垄断的自身崩溃,价格就会掉下来。
表1 囚徒困境博弈
乙
招 招 甲 不招
-5,-5 -10,0
不招
0,-10 -1,-1
甲和乙都不会选择劣战略“不
招”,称为“剔除劣战略的占优战 略均衡”。其中“招”是占优于(优 于)“不招”的占优战略。
总
结
囚徒困境反映了一个深刻的问题,这就是 个人追求最大自身利益的行为,常常并不能 导致实现社会的最大利益,也常常不能真正 实现个人自身利益的最大化。 我们可以利用这个道理来分析日常生活中 的许多不合作现象。
博弈的分类
二、按各博弈方可选策略数量的多少
1、有限博弈 2、无限博弈
博弈的分类
三、按参加博弈的各个博弈方从博弈中所获得 的利益总和 1、零和博弈 2、常和博弈 3、变和博弈
博弈的分类
四、按参与人行动的先后顺序 1、静态博弈 2、动态博弈
博弈的分类
五、按参与人所掌握的信息 1、完全信息博弈 2、不完全信息博弈
第七章
竞争型决策分析
博弈论(game theory)是由美国数学 家冯· 诺依曼(Von. Neumann)和经济学家摩 根斯坦(Morgenstern)于1944年创立的带 有方法论性质的学科,它被广泛应用于经 济学、人工智能、生物学、火箭工程技术、 军事及政治科学等。
博弈论是一门十分有趣但理论上又是 十分艰深的学问,我今天打算用一些大 家能够凭直观或简单分析就能把握的例 子为同学们介绍博弈论的基本概念及应 用。
博弈的要素
4、博弈方的信息 信息是博弈参与方有关其他博弈方的策略、收益 等知识。 5、博弈的次序 规定一个博弈就必须规定其次序,不同的次序是 不同的博弈。 6、结果和均衡 结果指博弈中博弈方的行动所产生的每一可能情 形。
博弈的分类
一、按参与方数目:
1、单人博弈 2、两人博弈 3、多人博弈
第二节
完全信息静态博弈
一、占优战略均衡 二、重复剔除的占优战略均衡 三、纳什均衡
一、占优战略均衡
不论其他参与人选择什么战略,他的最优 战略是唯一的,这样的最优战略被称为“占 优战略”(dominant strategies)。 占优战略均衡只要求所有的参与人是理性 的,而并不要求每个参与人知道其他参与人 也是理性的。因为,不论其他参与人是否理 性,占优战略总是一个理性参与人的最优选 择。
三、纳什均衡
纳什均衡(Nash equilibrium)是指这样 一种策略组合,这种策略组合由所有参与人 的最优策略组成,也就是说,在给定别人策 略的情况下,没有任何单个参与人有积极性 选择其他策略,从而没有任何人有积极性打 破这种均衡。
情侣博弈
大海和美凤正在热恋中,难得的周末又到了,安 排什么节目好呢?大海是个超级球迷,周末晚上, 中国足球队要在世界杯外围赛中和伊朗队做生死之 战。而美凤从小练习芭蕾,对斯拉夫民族的芭蕾艺 术崇拜的五体投地,这周末是正宗俄罗斯芭蕾舞剧 《胡桃夹子》的谢幕演出,怎么办? 我说,一个在家看电视直播的足球,一个去剧院 看芭蕾演出不就得了?问题是他们是热恋中的情侣, 分开各自度过这难得的周末时光,才是他们最不乐 意的事情,于是他们就面临一场温情笼罩下的博弈 (见下图)
表1 囚徒困境博弈
乙
招
不招 0,-10 -1,-1
招
甲 不招
-5,-5 -10,0
(问题1:甲、乙如何选择?)
对甲来说 ,尽管他
不
知道乙是选择了“招”还 是“不招”,他发现他自己选择“招” 都是比选择“不招”为好的。因此, “不招”是相对于“招”的劣战略,他 不会选择劣战略。所以,甲会选择 “招”。 同样,根据对称性,乙也会选择 “招”,结果是甲乙两人都“招”。
但是,尽管政府当时无力制止这种事 情,公众也不必担心彩电价格会上涨。 这是因为,“彩电厂商自律联盟”只不 过是一种“囚徒困境”,彩电价格不会 上涨。在高峰会议之后不到二周,国内 彩电价格不是上涨而是一路下跌。这是 因为厂商们都有这样一种心态:无论其 他厂商是否降价,我自己降价是 有利于 自己的市场份额扩大的。
博弈的要素
2、策略 指每个博弈方在进行决策时可以选择的方法、做 法等,策略有纯策略和混合策略之分。 纯策略指参与人在博弈中可以选择采用的行动方 案, 混合策略是在纯策略空间上的一种概率分布,表 示参与人实际进行决策时根据这种概率分布在纯策 略中随机选择加以实施。
博弈的要素
3、支付: 每个博弈方从各种策略组合中获得的收益或效用, 它是策略组合的函数,所以也称支付函数记为ui(s)。 ui(s)= ui(s1, s2 … ,si ,… sn-1 , sn).
田忌赛马-续篇
这个案例生动地告诉我们,巧妙地运用策略 是多么的重要。 但是,事情并没有结束,齐威王也很聪明, 他利用各种手段,很快明白了自己输掉比赛的 原因而及时地调整了自己的对策。这样,齐威 王与田忌的赛马也就成了一个具有策略依存特 征的决策较量,构成了一个典型的博弈问题 如果把赢一千金记成收益1,输一千金记成收 益为-1,则齐威王和田忌在各种策略组合下的 收益如下表所示:
博弈的分类-综合划分
行动顺序 信 息 静态 动态
完全信息
完全信息静态博弈 纳什均衡 纳什(1950,1951)
完全信息动态博弈 子博弈精炼纳什均衡 泽尔腾(1965)
不完全信息
Baidu Nhomakorabea
不完全信息静态博弈 不完全信息动态博弈 贝叶斯纳什均衡 精炼贝叶斯纳什均衡 海萨尼(1967-1968) 泽尔腾(1975)
要收集信息监督经理,因而拥有决定经 理任免的投票权,而小股东是小猪,不 会直接花精力去监督经理,因而没有投 票权。
例子3: 为什么中小企业不会花钱去开 发新产品? 在技术创新市场上,大企业是大猪, 它们投入大量资金进行技术创新,开发 新产品,而中小企业是小猪,不会进行 大规模技术创新,而是等待大企业的新 产品形成新的市场后生产 模仿大企业的 新产品的产品去销售。
田忌赛马-续篇
田忌
上中下 上下中 中上下 中下上 下上中 下中上
上中下
3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1
齐 威 王
上下中
中上下
中下上 下上中 下中上
1,-1 -1,1 3,-3 1,-1 1,-1 1,-1
-1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
表4 智猪博弈
小猪 按
大猪 等待 按 5,1 9, -1 4,4 0,0 等待
这个博弈没有“剔除劣战略均衡”,因为大 猪没有劣战略。 但是,小猪有一个劣战略“按”,因为无论 大猪作何选择,小猪选择“等待”是比选择 “按”更好一些的战略。 所以,如果小猪是理性的,小猪会剔除 “按”,而选择“等待”;大猪知道小猪会选 择“等待”,从而自己选择“按”,所以,可 以预料博弈的结果是(按,等待)。这称为“重 复剔除劣战略的占优战略均衡”,其中小猪的 战略“等待”占优于战略“按”,而给定小猪 剔除了劣战略“按”后,大猪的战略“按”又 占优于战略“等待”。
二、重复剔除的占优战略均衡
严格劣战略:是指无论其他博弈参与人采取 什么战略,某一参与人的相对不利战略是唯 一的。
二、智猪博弈:对诸多经济现象的解释
1. 智猪博弈
猪圈中有一头大猪和一头小猪,在猪圈的一 端设有一个按钮,每按一下,位于猪圈另一端的 食槽中就会有10单位的猪食进槽,但每按一下按 钮会耗去相当于2单位猪食的成本。如果大猪先 到食槽,则大猪吃到9单位食物,小猪仅能吃到1 单位食物;如果两猪同时到食槽,则大猪吃7单 位,小猪吃3单位食物;如果小猪先到,大猪吃6 单位而小猪吃4单位食物。表4给出这个博弈的支 付矩阵。
总
结
在寻找智猪博弈的均衡解时,我们的做法可归纳 如下: 1、首先找出某一博弈参与人的严格劣战略,将它剔 除掉,从新构造一个不包括已剔除战略的博弈; 2、然后继续剔除这个新的博弈中某一参与人的严格 劣战略; 3、重复进行这一过程,直到剩下唯一的参与人战略 组合为止。 这唯一的参与人战略组合,就是这个博弈的均衡 解,称为重复剔除的占优战略均衡。
一、从“囚徒困境”谈起 1. 囚徒困境
两个小偷甲和乙联手作案,私入民宅被警方 逮住但未获证据。警方将两人分别置于两间房间 分开审讯,政策是若一人招供但另一人未招,则 招者立即被释放,未招者判入狱10年;若二人都 招则两人各判刑5年;若两人都 不招则未获证据但因私入民宅 各拘留1年。
甲和乙是参与博弈的人,称为“局中 人”。表1中每一个小方格内的数字被称 为局中人的支付,其中左边的数字代表 甲的支付,右边的是乙的支付。表1中的 双变量矩阵称为博弈支付矩阵。 局中人所选择的战略构成的组合(招, 招)被称为博弈均衡。这个组合中前后 两个战略分别表示甲和乙所选择的战略。