管理经济学10博弈论详解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这个例子可以看作是非合作博奕现象的一个抽象概括。 它讲的是两个嫌疑犯被隔离审讯。他们面临的处境是:如果 两人都坦白,各判刑8年;如果两人都抵赖,各判刑1年(或许 证据不足);如果一人坦白另一人抵赖,则坦白的放出去,不 坦白的判刑10年,(“坦白从宽、抗拒从严”)。这里,两个囚 徒就是两个局中人,每个局中人都有两个策略可供选择:坦 白或抵赖。表中每一格的一对数字分别表示局中人不同策略 组合的收益,第一个数字是囚徒A的收益,第二个数字是囚徒 B的收益。这种有限对策(局中人是有限个,每个局中人的策 略数也是有限的)往往用矩阵形式表示。
但是,本讲只是介绍博奕论的最基本的内容,且 限于博奕论在经济学中的应用。
博弈论和对策行为
基本概念
本书讨论博奕论模型的最基本表述方式---策略型 表述,它主要用于表现静态对策。这里介绍策略型表 述中的基本概念,明确有关术语的准确含义。
博弈论和对策行为
基本概念
在策略型博奕中,一个对策有以下几种基本要素:
博弈论和对策行为
囚徒困境在经济学上的应用
在军备竞赛中,人们年复一年的谈判,试图签订 一个限制军备的条约。但是这种条约也存在个人理性 与集体理性的冲突。签订条约对世界和平有利,但履 行条约未必是各国行动的“最优反应”:试想,如果 我减少军备开支,而你增加军费支出,我不是受到威 胁了吗?所以,这种条约不构成纳什均衡,各国都有 违约的冲动。纳什均衡是各国都大量增加军费预算, 结果军备竞赛就只好继续下去。冷战时期前苏联和美 国之间的军备竞赛就是典型一例,两国都在导弹上花 了几万亿美元,如果把资源用于民品生产,两国的社 会福利就会变得更好。
博弈论和对策行为
囚徒困境在经济学上的应用
一个非集体理性选择,如纳什均衡 ( 坦白,坦白 ) ,用经济 学术语说,其中存在“帕累托改进”的机会。所谓帕累托改 进就是说,它在不使另一部分人的境况变得更坏的前提下, 至少能改进一部分人的境况。如果不存在帕累托改进的情况 ,便达到“帕累托最优”。这里,如果两人都选择抵赖,两 人的境况都有所改进。所以,(坦白,坦白)不是帕累托最优。 集体的理性选择应该是大家都抵赖。但是这个帕累托改进办 不到。为什么?因为我们已经验证,(坦白,坦白)这个策略组 合正是一个纳什均衡。在一个纳什均衡中,不会有人主动去 打破这种格局的。
博弈论和对策行为
策略型博弈的实例和解(囚徒困境)
例1. 囚徒困境(prisoner’s dilemma)
在对博奕局势进行描述后,博奕论分析就是要求 出局中人进行策略选择的理性结局,或者说找出博奕 问题的解。在非合作博奕中,有两种解的技术:一种 是纳什均衡,一种是优超解。
博弈论和对策行为
纳什均衡
博弈论和对策行为
囚徒困境在经济学上的应用
以上的分析告诉我们,用经济学的观点来看,只有由满足 个人理性选择的策略组成的集合才是均衡的,或者说只有纳 什均衡才是稳定的。
博弈论和对策行为
囚徒困境在经济学上的应用
看两个寡头合谋与价格卡特尔的情形,它也存在 个人理性与集体理性的冲突。
在两个寡头合谋条件下的产量与价格决定,是基 于两个寡头利润总和的最大化目标,而不是每个企业 自己的利润最大化。因此这种最大化目标下的产量分 配符合两家企业的共同利益,却不是使每家企业自己 的利润最大化的产量,换言之,并不是每家企业自己 的“最优反应”。所以,卡特尔产量分配不是一个纳 什均衡。正因为此,卡特尔下一定会有违约冲动,卡 特尔具有不稳定性。
博弈论和对策行为
囚徒困境在经济学上的应用
那么,两个囚徒事先订好攻守同盟,两人都采取抵赖的策 略,不是可以改善两人的境遇吗?但问题是,这个攻守同盟 有没有意义?没有。原因在于(抵赖,抵赖)这个策略组合不是 一个纳什均衡,没有人有积极性去遵守这个协议。一般地, 假设博奕中的每个局中人事先达成一项协议,规定了各自的 行为规则。如果局中人会自觉遵守这个协议,等于说这个协 议构成了一个纳什均衡:给定别人遵守协议的情况下,自己 的最好选择就是也遵守协议。相反,一个协议不构成纳什均 衡时,它就不可能自动实施,因为至少有一个局中人会违背 这个协议。所以,不满足纳什均衡要求的协议是没有意义的 。
定义1: 给定其它局中人的策略s,局中人i的最优反应 记为s,是指能给他带来最大收益的策略,即
ui (s , si ) ui (s , si ) s s
* i ' i ' i
* i
当每个局中人都选择了自己的最优反应策略,并 且这些最优反应形成一个策略组合,便形成了纳什均 衡。
博弈论和对策行为
博弈论和对策行为
纳什均衡
在囚徒困境中,考虑囚徒A对他人的最优反应。如果给定 囚徒B的策略是“坦白”,那么对囚徒A来说,采取“坦白” 策略得到的收益是 -8,采取“抵赖”策略得到的收益是 -10, 显然“坦白”为好;同理,如果给定囚徒B的策略是“抵赖” ,对囚徒A来说,“坦白”也比“抵赖”好。因此,囚徒A对 囚徒B的最优反应是“坦白”。
博弈论和对策行为
囚徒困境在经济学上的应用
纳什均衡概念的局限性在于,在博奕中有可能纳什均衡 不是唯一的。例:两家寡头价格竞争,经理可选择的策略是 价格不变或涨价,收益矩阵如下所示: 企业2 价格不变 涨价 价格不变 10,10 100,-30 企业1 涨价 -20,30 140,35
结果发现纳什均衡有两个: ( 价格不变,价格不变 ) 、 ( 涨 价,涨价)。博奕中的实际结果取决于首先采取什么行动。如 果先前的情况是价格不变,那么这一博奕的预期结果就是价 格不变。另外,对有的博奕来说,也可能不存在纳什均衡。
博弈论和对策行为
概论
博奕论是一门内容广泛且复杂的学科,不仅是经 济学,政治学、军事、外交、国际关系、公共选择, 还有犯罪学等,都涉及到博奕论。 实际上,很多人把博奕论看成数学的一个分支, 博奕论的一个重要代表人物---纳什(Nash,曾获1994 年诺贝尔经济学奖,该年度的诺贝尔经济学奖授与了 三位博奕论专家),在1951年的一篇奠基性的文章就 是发表在数学杂志上,而非在经济学杂志上。
一.局中人 二.策略(strategies):
即指每个局中人在对策中可以选择采用的行动方 案,但这个方案必须是一个完整的行动,而不是行动 的某一步。每个局中人均有可供选择的多种策略。
博弈论和对策行为
基本概念
在策略型博奕中,一个对策有以下几种基本要素:
一.局中人 二.策略 三.支付或收益(payoffs): 是指一局博奕的得失。或者说是局中人从各种策 略组合中获得的效用,它是策略组合的函数。如果 局中人得失的总和为零,则称这种对策为零和对策; 否则,称为非零和博奕。
博弈论和对策行为
策略型博弈的实例和解(性别战)
例2. 性别战(battle of the sexes)
比如,两家工厂生产的产品可能是互补的,一家 为另一家提供零配件,这里有一个标准的选择问题, 由于种种原因,很可能在产品标准的选择上,生产成 品的厂家与生产零配件的厂家之间有冲突。这就需要 相互妥协,但妥协的结果有两种可能,或者是生产零 配件的厂家适应生产成品的厂家,或者是生产成品的 厂家适应于生产零配件的厂家。
博弈论和对策行为
策略型博弈的实例和解(性别战)
例2. 性别战(battle of the sexes)
这个博奕中有两个纳什均衡:(足球,足球)和( 芭蕾,芭蕾)。就是说,一方去足球场,另一方也会 去足球场;类似地,一方去看芭蕾,另一方也会去看 芭蕾。在实际生活中,也许是这一次看足球,下一次 看芭蕾,如此循环,形成一种默契。这在实际生活中 是指,两种互补的活动应该配合,尽管配合的方式可 能有很多种。
一.局中人(players):
即博奕的参与者,他们是博奕的决策主体行为。 根据自己的利益要求决定自己的,记局中人为i,局 中人集合为{1,2,…,I},即共有I个局中人。我们将某 个局中人以外的其它局中人称为“i的对手”,记为-i 。
博弈论和对策行为
基本概念
在策略型博奕中,一个对策有以下几种基本要素:
博弈论和对策行为
囚徒困境在经济学上的应用
让我们再回到囚徒困境本身。纳什均衡 ( 坦白,坦白 ) 表明 两人共同的集体选择,但是这个选择是否是理性的?理性选 择是指使收益最大化的选择。如果两人都抵赖,各判刑1年, 显然比坦白各判刑 8年好。所以,纳什均衡(坦白,坦白) 并不 是一个集体理性选择。但它却是个人理性选择的一个组合。 囚徒困境正是反映了一个深刻的问题,这就是个人理性与集 体理性的矛盾。
回想一下古诺均衡的含义:古诺均衡是指存在这 样一对产量组合 (q1*,q2*), 使得:假定企业 2 的产量为 q2*时,q1*是企业1的最优产量;假定企业1的产量为 q1* 时, q2* 是企业 2 的最优产量。按照纳什均衡的定 义,古诺均衡(q1*,q2*)也就是博奕论中的纳什均衡。 纳什均衡只说明博奕的稳定性结局。
对囚徒B作同样分析:如果囚徒 A的策略是“坦白”,则 他采取“坦白”策略为好;如果囚徒 A 的策略是“抵赖” , 他 还是采取“坦白”策略好,所以囚徒B对囚徒A的最优反应也 是“坦白”。
两个最优反应形成了一个策略组合(坦白,坦白),这就是 一个纳什均衡。
博弈论和对策行为
囚徒困境在经济学上的应用
两个寡头企业选择产量的博奕就是一个囚徒困 境问题。
博弈论和对策行为
策略型博弈的实例和解(囚徒困境)
例1. 囚徒困境(prisoner’s dilemma)
囚徒B 坦白 囚徒A 坦白 抵赖 抵赖
-8,-8 0,-10 -10,0 -1,-1
博弈论和对策行为
策略型博弈的实例和解(囚徒困境)
例1. 囚徒困境(prisoner’s dilemma)
10 讲
博奕论和对策行为
博弈论和对策行为
概论
博奕论(the Game Theory)也就是运筹学中的对策 论。 对策思想最早产生于我国古代。 早在两千多年的春秋时期,孙武在《孙子兵法》 中论述的军事思想和治国策略,就蕴育了丰富和深 刻的对策论思想。孙武的后代孙膑,为田忌谋划, 巧胜齐王,这个著名的“田忌赛马”,就是典型的 对策思想的成功运用。
纳什均衡
定义2: 一个策略组合s*=(s1*,s2*,…,sn*)被称为纳什均 衡是指,对于所有 的 i,
ui (s , s ) ui (s , s * i ' i
纳什均衡的思想就是,博奕的理性结局是这样一 种策略组合,其中每个局中人选择的策略都已是对其 它局中人所选策略的最优反应,所以,谁也没有积极 性去选择其它策略。因为每一个局中人均不能因为单 方面改变自己的策略而获利,于是谁也没有兴趣主动 打破这种均衡。
博弈论和对策行为
囚徒困境在经济学上的应用
企业竞争而产生的广告资源浪费也是典型例子。 如两家寡头竞争,经理们可选择策略是“多做广告” 和“少做广告”,各种策略组合的盈利矩阵如下表,
企业2 少做广告 多做广告 30,30 10,40 40,10 20,20
企业1
少做广告 多做广告
企业1最优反应是多做广告,企业2最优反应也是 多做广告,因此 ( 多做广告,多做广告)是一个纳什均 衡。这个纳什均衡的结果是大量资源消耗在广告上。
博弈论和对策行为
策略型博弈的实例和解(性别战)
例2. 性别战(battle of the sexes)
一男一女恋爱,有些业余活动要安排,或者去看 足球比赛,或者去看芭蕾舞演出。男的偏好足球,女 的则更喜欢芭蕾舞,但他们都宁愿在一起,不愿分开 。下表给出收益矩阵: 女 足球 芭蕾 足球 2,1 0,0 男 芭蕾 0,0 1,2
博弈论和对策行为
概论
对策思想明确地应用于经济领域,始于Cournot (1838), Bertrand (1883), Edgeworth (1925)等人关于寡 头竞争、产量与价格垄断、产品交易行为的研究。 然而,作为一门学科的创立,则是以美国数学 家冯.诺依曼(John Von Neumann)和经济学家奥斯卡. 摩根斯坦(Oskar Morgenstern)合著的《博奕论与经济 行为》(The Game Theory and Economic Behavior) (1944)一书出版为标志,他们奠定和形成了这门学科 的理论与方法论基础。
相关文档
最新文档