第三讲 博弈论战略分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论战略分析:标准式博弈 பைடு நூலகம்非合作均衡
刘会齐
标准式博弈的非合作均衡
第3章占优战略与社会两难 第4章纳什均衡 第5章博弈论中的经典例子 第6章三人博弈 第7章概率与博弈论
第3章 占优战略与社会两难
预备知识 ● 好地理解本章内容,你需要掌握笫1—2 章的知识。 ●本章主要概念:占优战略、占优战略均 衡、合作解、非合作解、社会两难。
继续
假定有两个候选人:参议院布兰克先生和地方官员 格雷先生。虽然他们在政治立场上没什么个人偏 好,但身为民主党的布兰克持左翼立场要比身为共 和党的格雷更加具有信服力。 相反,如果持右翼立场,格雷比布兰克更具有信服 力。持左翼立场还是右翼立场是他们可以选择的两 种战略。 此外,他们还有第三个可供选择的战略:持中立立 场。
继续
博弈论的重点是“理性”行 为,这意味着,每个参与者 都会根据对手的战略选择自 己的最优反应。 首先,我们来看对于琼斯的 战略,史密斯的最优反应是 什么。 表3-2告诉我们,无论琼 斯选择哪种战略,“倾倒垃 圾”总是史密斯的最优反应。 现在,再让我们判断一下, 对于史密斯选定的战略,琼 斯的最优反应是什么。 由于这个博弈是对称的,所 以,琼斯的最优反应与史密 斯相同,详见表3-3。
继续
相反,占优战略均衡是一种非合作解 (noncooperative solution)。在没有可能达成有约束 力的协议,以协调不同参与者的战略时,参与者们 所选的战略及其收益就是一个博弈的非合作解。 在非合作解中,每一位参与者都会根据对方的战略 选择自己的最优战略,假定所有人都这样做,那 么,每一位参与者所选的战略就都是针对他人最优 战略的最优反应。例如,垃圾处理博弈的每一位参 与者都认定对手会选择倒垃圾,他们每一个人都据 此选择自己的最优反应,结果就是两个人都倒垃 圾。
首先看一个来自环境政策和环境经济学的 例子。这是一个很恰当的例子,因为经济 (economics)与环境(ecology)这两个词均来 源于希腊词根oikos,意为“家庭”。意思是 说,在一个家庭中,成员不断进行着互动, 这些互动行为使得家庭得以维持。 我们用“econonucs”和“ecology”来表示经济 和环境,就是说,正如在家庭中一样,经济 和环境事件中的互动行为是不断的,而且是 至关重要的。
继续
通过检验我们发现,该博弈确实存在占优战 略。假设欧姆尼公司的战略是“投入”,微型设 备公司选择“投入”战略就可以赚得50亿的利 润,但是如果他选择“留一手”,就只能获得30 亿。如果欧姆尼公司的战略是“留一手”,那么 微型设备公司选择“投入”可以获得20亿,而选 择“留一手”就只能获得10亿。
继续
因此,“投入”就是微型设备公司的占优战略。 因为对称的原因,“投入”也是欧姆尼公司的占 优战略。因为两家公司都存在占优战略,所以 该博弈就存在占优战略均衡。这个占优战略均 衡就是两家公司都选择“投入”,每家公司均获 利50亿,这是可能的最大的收益。
继续
与其他例子不同,合作研发博弈中的占优战略 均衡恰好是两个公司都希望的结果。即使它们 合并,结果也不可能变得更好。因此,(投 入,投入)不仅是这个博弈的占优战略均衡, 也是合作解;如果两家公司进行合作,他们也 会选择这一战略组合。不过,这种占优战略均 衡与合作解重合的博弈,在博弈论文献中出现 得并不多。
3.2占优战略
当一个博弈存在占优战略时,人们就会理所当然 地选择该战略而不是另一个。读者可能已经注意 到,垃圾处理博弈与囚徒困境非常相似。 在囚徒困境中,“认罪”对埃尔和鲍勃来说都是占优 战略;而且(认罪,认罪)也是一个占优战略均 衡。相似地,第1章的广告博弈和第2章的军力调拨 博弈也都是占优战略均衡的好例子。 所有的这些博弈都属于社会两难( social dilemma)。社会两难是一种存在占优战略均衡的博 弈,并且参与者采用这种均衡战略的收益比采用非 均衡战略的收益要差。
继续
看起来,垃圾处理博弈 中的两个参与者的决策 很容易。这是因为“倾倒” 战略是一个占优战略 (dominant strategy)。占 优战略就是无论对方采 取何种战略,其都是最 优反应的战略。 在垃圾处理博弈中,“倾 倒”对每个参与者来说都 是占优战略。因为每个 参与者都有占优战略, 所以该博弈也是说明占 优战略均衡(dominant strategy equilibrium)的 一个好例子。
3.5再看合作博弈与非合作博弈
我们已经看到,在博弈论的很多重要应用中, 合作解与非合作解的占优战略均衡是不同的, 但并不是说所有存在占优战略均衡的博弈都是 社会两难问题,合作的占优博弈就是如此。 只是,大多数的博弈论学者都认为,合作博弈 的参与者在决定是否合作时,也要进行非合作 博弈,因此,与合作的情形相比,非合作解和 非合作均衡更为基本和重要。
继续
因此,在该例中,出现了三个可供参与者选择的战 略。我们用标准式表示这个有三个战略的博弈,表格 不再是两行两列,而是三行三列。 这个博弈的收益是怎样的呢?假定两个候选人并 不十分在意持哪种立场,他们的目标不是推进某一特 定观点,而仅仅是当选。 一些讲德语的政治经济学家把这种动机称做 “stimmungsmaximieren”,即最大化选票的数量,这 也许有些夸张。候选人并不是要尽可能多地拉选票, 只要超过半数就够了。但是,压倒性的胜利(胜出很 多)对于获胜的候选人来说是很有利的。我们将用选 票的百分比来表示该博弈的收益。
继续
事实上,房主之间订立的这种合约是很 常见的,被称为契约。很多城镇住宅区 都用契约来杜绝乱倒垃圾等惹人厌的事 情。当然,在很多非合作的场合,法规 也能达到同样的目的。 总的来说,不管是通过协议还是其他 形式的强制手段,只要参与者们都能履 行协调后的战略,他们所选的战略及其 收益就是一个博弈的合作解。
继续
再来看一看本章的社会两难问题——垃圾处 理博弈。我们已经知道,对两个房主来说,解 决乱倒垃圾问题的一个方法就是双方签订一份 合约,雇卡车把垃圾运走。合约一旦起草完 毕,每位房主就必须考虑是否接受该合约。如 果他们都接受,会得到合作解的收益: (4500,4500)。 如果其中有一个人拒绝,他们就会回到社会两 难的均衡状态,每个人只能获得4000美元的收 益。
继续
当然,这个主观收益与其他人是否在别墅附近 倒垃圾有关。如果别人不在别墅附近倒垃圾, 别墅带给每位房主的年收益假定为5000美元, 如果有人倒垃圾,则为4000美元。 也就是说,如果没人倒垃圾,琼斯与史密斯都 不会接受低于5000美元的租赁出价;如果有人 倒垃圾,那么他们能够接受的最低租赁出价降 为4000美元。 利用以上信息,我们可以得到该博弈的标准 式,见表3-1。
3.3社会两难与博弈的合作解
从数学的角度来看,占优战略均衡是博弈的一个 解。它告诉我们参与者将会选择哪种战略,以及当 参与者做了“理性”的选择后,其收益将是怎样的。 然而,对于社会两难问题中的参与者来说,占优战 略均衡就不像问题表面那样简单了。再来看垃圾处 理博弈。 有一点我们可以很确定,就是史密斯和琼斯都更喜 欢双方均雇卡车这样一个结果,而不是占优战略均 衡。由于两人都雇卡车会提高大家的收益,所以我 们就把(雇卡车,雇卡车)称做是垃圾处理博弈的 合作解( cooperative solution).
继续
导致此种现象的一个最为重要的原因可能是博弈论的 研究性质。博弈论是一门注重实用的研究,找到并解 决问题是它的主要目的,占优战略均衡与合作解相同 的博弈对个人和社会都不构成问题,自然也就不被作 为研究的重点了。 然而,这类博弈不仅逻辑上成立,也可能是企业司空 见惯的。毕竟,非合作均衡是企业增加利润的障碍, 正如经济学家乔治·斯蒂格勒所发现的那样,“企业”会 动用我们所知道的一切办法,扫除阻止它们增加利润 的障碍。
继续
占优战略的存在以及它与合作解相悖的事实是导致社 会两难的根本原因。例如,在囚徒困境的例子中,两 个罪犯肯定愿意协调他们的战略,拒绝认罪,这样每 人只需服刑一年。警察把他们关在不同的牢房,就是 为了防止他们协调双方的战略。 在广告博弈中,合作解是不做广告。当政府宣称要实 施一项广告禁令时,遵守这一禁令可以让烟草公司获 得利润,因为在政府的强制之下,两家企业都会不做 广告。在军力调拨博弈中,和平是合作解。 然而,由于对重型大炮和铁路运输的依赖性所造成的 时间限制,使得双方不可能协调他们的战略。
在前面两章中,我们讨论了博弈的基本概 念,指出许多战略问题可以当做博弈问题进 行研究,并介绍了战略和博弈的相关描述 方。然而,博弈论的精髓远非这些内容,而 是博弈参与者之间的互动行为,现在,就让 我们集中考察这些互动行为。 我们希望找到稳定、可预测的互动行为 模式。在经济学中,稳定、可预测的互动行 为模式被称做均衡。博弈论学者沿袭了这一 叫法(经济学家沿袭的则是化学工程师的惯 用叫法),因此可以说,我们要做的就是探 寻博弈回合的均衡模式。
继续
假设史密斯和琼斯签订了一个合约。合约要 求二人均雇一辆卡车,不再乱倒垃圾。合约 生效后,他们都必须履行雇卡车的义务。如 果其中任何一人进行“欺骗”,另外一位就会提 起诉讼,以法律手段迫使欺骗者履行合约。 于是,合约就为解决社会两难问题提供了一 个出路。在垃圾处理博弈中,合约使得两个 房主达成了合作解,而不是占优战略均衡。
继续
于是,两个房主正在进行着一个新的博弈,即 接受博弈,如表3-5和表3-6所示。(接受,接 受)是这一新博弈的合作解,同时也是原有博 弈的合作解。签订合约的建议已经把社会两难 性质的垃圾处理博弈,转变成合作占优博弈 了。
3.6一个政治博弈
不仅商业活动、垃圾处理、娱乐游 戏以及战争需要战略选择,和平时 期的政治问题也需要战略选择。下 面我们就来看一个政治领域的例 子。
欧姆尼软件公司( Omnisoft)和微型设备公司 (Microquip)正在考虑一个产品研发的合作项目。每 家公司都有两种战略可以选择:为项目投入足够的资 源,或者留一手,只投最少量的资源。 困难之处在于,谁都无法监视对方投入的努力和资 源,或强制对方做任何事情。假定项目要研发的技术 是一种实用型技术,即便合作项目失败了,两家公司 也能应用这种技术并获得利润。表3-4是该博弈的收 益矩阵(单位为10亿)。
3.1垃圾处理博弈
在探讨这个 博弈之前, 我们先来看 一个故事。 故事的主人 公是两所房 屋的主人, 琼斯先生和 史密斯先 生。两人各 在郊区拥有 一套周末别 墅,该地区 不提供垃圾 日常处理服 务。
他们可以共同雇一 辆卡车处理垃圾,但 收费很高,每人每年 需支付500美元。此 外,他们还有另一个 选择,琼斯可以将垃 圾倒在史密斯房子旁 边的一块属于自己的 空地上,史密斯则可 以将垃圾倒在琼斯房 子旁边的一块属于自 己的空地上。(如图 3.1)
继续
当一个博弈中的每一位 参与者都选择了各自的 占优战略时,相应的博 弈结果就是占优战略均 衡。 我们也可以说,“倾倒”战 略占优于“雇卡车”战略。 如果无论对手选择哪种 战略,一个战略的收益 总是高于另一个战略, 我们就说,第二个战略 被第一个战略占优,第 二个战略被称为劣战略 (dominated strategy)。 在该博弈中,“雇卡车”战 略就是一个劣战略。
继续
我们用标准式表示该博弈。琼斯 和史密斯每个人都面临两个战略 选择:花钱雇垃圾处理车和将垃 圾倒在邻居房屋旁。他们要同时 做出决策,每个人预先都不知道 对方的战略。那么,不同战略的 收益是多少呢?
继续
周末别墅带给两位主人的收益是他们的主观 享受。他们花时间来到这个风景优美的郊区进 行休闲娱乐,从而获得满足感。但是,要想将 收益与处理垃圾的成本进行比较,需要将这些 主观享受换算为货币形式。 我们借用经济学家常用的一个方法来解决这个 问题。我们知道,别墅可以带给两个房主其他 货币形式的收益。比如说,房主可以自己不 住,而是将别墅出租。他们能够接受的最低出 租价格就是别墅带给他们的主观享受的货币价 值。
继续
社会两难是一类非常重要的博弈,但是, 占优战略和劣战略在其他种类的博弈中也是 非常重要的。有的博弈存在占优战略均衡, 有的则没有。 然而,占优战略均衡也不一定是不好的。有 些确实存在占优战略均衡的博弈却不是社会 两难问题。接下来的这个商业例子就说明 了,占优战略均衡有可能不逊于其他战略。
3.4合作产品研发
相关文档
最新文档