第17章 决策与博弈论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第17章决策与博弈论
17.1 复习笔记
1.博弈论的基本概念
(1)博弈及其三个要素
博弈论是在一个简化的体系里描述复杂的决策问题,这些决策问题往往涉及多个行为者,他们之间的决策相互依存,相互作用。
博弈包含三个要素:①参与者;②决策;③报酬。
(2)合作与非合作博弈
如果在博弈参与者之间可形成共同计划的决策这类具有约束性的合同,那么这类博弈被称为合作性的博弈。
如果在参与者之间不能达成或实施有约束性的合同,这类博弈则被称作非合作性的博弈。
(3)主导策略(占优策略均衡)
主导策略是指对某参与者而言,不管其竞争对手的反应如何,这一决策总是最优的策略。
2. 纳什均衡
(1)纳什均衡
纳什均衡是指在给定对方行动的前提下可以给每个参与者都带来最佳结果的某种决策(或行动)。达到纳什均衡时,每一个博弈者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而这个均衡没有人有积极性去打破。
占优策略均衡即是一种纳什均衡。占优策略均衡若存在,只存在惟一均衡,而纳什均衡可能存在多重解。
(2)最大极小决策(囚徒困境)
最大极小决策反映的是,从个人角度出发所选择的占优策略,从整体来看,却是最差的结局,即个人理性与团体理性的冲突。这一决策可以发生在不少的博弈场合,也可以解释卡特尔联盟的不稳定性。
(3)混合策略
在有些博弈中,仅采取一种决策或一种行动的“纯决策”不是最好的决策,即可能不存在纳什均衡。而以某特定的概率P选择一种行为,以1-P的概率选择另一种行为,则有可能是纳什均衡的解。这时的选择被称为混合策略。但反过来需要注意,存在混合策略均衡的博弈也有可能存在非混合策略的均衡。
3. 重复博弈
重复博弈即同一个博弈被重复多次的动态博弈,它是反复不断进行的。
在无限期重复博弈中,对于任何一个参与者的欺骗和违约行为,其他参与者总会有机会给予报复。所以,每一个参与者都不会采取违约或欺骗的行为,囚犯困境合作的均衡解是存在的。但在有限期重复博弈中,在博弈一开始的第1期,每个参与者就会采取欺骗或违约的不合作策略。所以,在有限期重复博弈中,囚犯困境博弈的纳什均衡是参与者的不合作。
4. 顺序博弈
顺序博弈是参与者轮换行动的博弈。分析顺序博弈要比参与者同时决策的博弈简单得多,其关键在于考虑每个参与者可能的行动及其理性的对策。
5. 威胁与承诺
行业的主导企业或者在位企业为了维护自己的地位或阻止新企业进入,往往会采用威胁或承诺的手段。
威胁通常是不付诸实际行动的,即不会改变报酬矩阵,最终往往使得发出威胁一方无法
得到好处,因而是不可信的。承诺通常需要通过实质性的行动来改变报酬矩阵,进而使得双方的决策发生变化,因而往往是可信的,但它具有较大的风险。
6. 进入障碍
在位企业非理性的名声有利于实现阻止新企业进入的目标。如果博弈是无限期重复的,现存企业的降价决策威胁是理性的。
17.2 课后习题详解
1.合作与非合作博弈的差别在哪里?举例说明。
答:在经济学中企业博弈模型可分为两种:合作性博弈与非合作性博弈。如果在博弈参与者之间可形成共同计划的决策这类具有约束性的合同,那么这类博弈被称为合作性的博弈。如果在参与者之间不能达成或实施有约束性的合同,这类博弈则被称作非合作性的博弈。合作与非合作博弈的根本差别在于是否存在合作的可能性,对于合作性博弈来说,约束性合同是可能的,而在非合作性博弈中,约束性合同是不可能的。
例如,假设有一个地毯销售商与一个地毯购买者协商地毯价格。假设地毯的制作成本为100元,而购买者愿付200元购买。那么,合作博弈在这种情况下是可能的,因为只要协商的地毯价格处在101元与199元之间,这类协议会使消费的剩余与销售者的利润同时极大化,从而使双方受益。
又如,两个企业协商共同投资来发展某种新的技术,因为单个企业没有足够的资本。如果这两个企业能够协商达成具有约束力的合同,并合理分配由新技术带来的利润,结果是两个企业都受益。
2.什么是主导策略?为什么主导策略的均衡是稳定的?
答:(1)主导策略是指对某参与者而言,不管其竞争对手的反应如何,这一决策总是最优的策略。例如,企业A与B在同一市场上竞争。现在它们要决定的是,是否进行广告宣传来占有更多的市场份额。当然,每一方都认识到自己产品的销售会受到竞争对方广告宣传的影响。该博弈可能的结果如图17-1所示。有时该表被称为支付矩阵。每格中第一个数字是企业A的报酬,第二个是企业B的报酬。从该矩阵中可看出,如果两个企业都决定广告宣传,企业A的利润为10,企业B的利润为5。如果企业A做广告而企业B不作,企业A赚15,企业B的利润为零。
图17-1 广告宣传博弈的报酬矩阵
对于企业A而言,不管企业B如何运作,企业A应该做广告。具体地说,如果企业B 做广告,企业A做广告时其利润为10,不做广告时其利润为6。如果企业B不做广告,企业A做广告时获得利润15,而不做广告时获利润10。这样,做广告就成为企业A的主导策略。同理,对于企业B而言,做广告也是企业B的主导策略。不管企业A如何运作,企业B因为做广告而获得的利润总是高于不做广告的利润。因此,在企业均为理性的假设条件下,该博弈的结果是这两个企业都会做广告宣传,因为两个企业都有主导策略。
(2)对于主导策略均衡而言,每一个市场参与者所做选择都是最优的,因而市场的任何一方都不愿意改变其行为,所以主导策略的均衡是稳定的。
3.解释纳什均衡的意义。纳什均衡与主导策略均衡的不同之处在哪儿?
答:(1)纳什均衡是指在给定对方行动的前提下可以给每个参与者都带来最佳结果的某
种决策(或行动)。因为没有任何参与者会背离纳什均衡,所以这些决策是稳定的。
(2)纳什均衡与主导策略均衡的不同之处在于:
主导策略:“不管你如何行事,我只力图使自己达到最优;你也不管我如何行事,你只力图使自己达到最优。”
纳什均衡:“在你可能如何行事的条件下,我力图使自己达到最优;在我可能如何行事的条件下,你力图使自己达到最优。”
因此,主导策略均衡是纳什均衡的一个特例。
4.纳什均衡与最大极小的解有何不同?在什么条件下最大极小的解比纳什均衡更为可能?
答:(1)纳什均衡是建立在个人理性这个基础上的。每个参与者在策略选择过程中,不仅自身是理性的,而且假定其对手也同样如此。这可能有局限性。
最大极小是指使可获得的极小收利极大化。最大极小的决策是一种比较保守的策略。有最大极小策略构成的均衡是最大极小均衡。
(2)在个人非完全理性的情况下,最大极小的解比纳什均衡解更为可能。
5.什么是“你做我也做”决策?为什么对无限重复的囚犯两难处境来说它是一种理性的策略?
答:(1)“你做我也做”决策又称“以牙还牙”策略,在价格战博弈中,“你做我也做”是指我从高价开始,如果我的竞争对手“与我合作”,我保持高价。一旦竞争对手降价,我也跟着降价。如果后来竞争对手涨价,那我也跟着涨价。“以牙还牙”策略是所有参赛策略中最简单的,这个策略一开始选择合作,然后在每一个回合选择对手在上一回合采取的策略;也就是说,如果对手在上回合选择合作,“以牙还牙”者就在这一回合也选择合作,如果对手在上一回合背叛了他,“以牙还牙”者就在这一回合以背叛相报复。
(2)在无限重复博弈中,我与我的竞争对手永远地在每月中确定价格。假定我的竞争对手知道我采用你做我也做的决策。合作行为(高价)则是理性的结果。假设某个月竞争对手采用低价决策,并占领全部的市场份额。在那个月中,它获取巨大的利润。但是它知道在下个月中,我也会降价,它的利润因此会下降,而且,由于双方削价而导致的利润下跌将会永久地延续下去。因为我们假定了这一博弈是永久性重复的,由此而引起的累积性利润损失肯定会大于任何一个月由于降价而带来的利润。显然,竞争对手在某个月的降价行为是非理性的。
事实上,在一个无限重复的博弈中,竞争对手无需确定我会采取你做我也做的决策而完全可以采用合作决策。原因是在这种博弈中,预期的合作决策带来的收益会超出由降价而带来的短暂的好处,即使我采用你做我也做这一决策的概率非常之小,其结论还是一样。
6.设一博弈,在其中囚犯两难处境会重复10次,博弈双方是理性的,并且知道所有的信息。试问“你做我也做”在该例中是不是最优策略?在什么条件下这一决策是最优的?
答:如果这一博弈的重复次数不是无限而是有限的。如果竞争对手(企业B)是理性的,并且认定我(企业A)也是理性的,那么它会有以下的判断“因为企业A采用你做我也做的策略,我(企业B)只能在最后一个月削价。这时因为博弈已经结束,企业A来不及进行报复,为此,我可以在最后一个月获得较高的利润”。为此,企业B的决策是维持高价一直到最后第二个月,但在最后一个月减价,从而获取高利润。
但是,企业A同时也会预测到此种情况的发生,所以企业A在最后一个月中采取减价决策。企业B也会推出此结论,即企业A在最后一个月中减价。企业B会决定在最后第二个月减价,因为在最后一个月中不会有任何合作。当然,企业A也会设想到这一步,所以企业A 也会在最后第二个月中减价。我们可以一直这样地推断下去,从中得出的唯一理性的结论就是两个企业在每个月都减价。