当代西方基于博弈论方法的威慑理论综述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《国外社会科学》二oo六年第三期当代西方基于博弈论方法的威慑理论综述

向钢华王永县

提要博弈论方法是威慑理论研究的三种基本方法之一,目前已发展成为西方国家威慑理论研究的

主流方法。本文总结了博弈论方法应用于威慑理论研究的历史,介绍了国外新近研究的进展,简述了应用中

的一些争论。

关键词威慑理论博弈论方法论适用性

中图分类号DO

威慑理论是冷战时期占主导地位的一种国际安全理论,被一些学者誉为20世纪国际关系领域最重大、最深奥的学术创造。罗伯特・杰维斯(RobertJervis)倡导的心理分析方法、亚历山大・乔治(AlexanderGeorge)倡导的个案分析方法和托马斯・谢林(ThomasSchelling)倡导的博弈论方法,是威慑理论研究的三种基本方法。由于威慑情景具有行为者数量有限、行为者之间互动明显以及所涉及的利益重大等特点,有些学者认为博弈论方法特别适合威慑等国际安全问题的研究。如果从决策科学角度来考察,博弈论方法是一种基于理性假设的规定性决策方法,规定理性行为者应该如何决策;而心理分析方法或个案分析方法则是基于有限理性假设的描述性决策方法,它研究现实中有限理性行为者实际上如何决策。由于现实中的威慑问题通常十分复杂,上述研究方法经常被结合起来使用,这里主要对博弈论方法在威慑理论研究中应用的历史、当前一些研究进展及其适用性与局限性进行综述。

一、博弈论方法在威慑理论

研究中应用的历史

威慑理论与博弈论几乎是在同一时期创立的两种理论,国际安全问题特别是核威慑问题是最早采用博弈论方法进行研究的领域之一。博弈论方法在威慑理论研究中应用的历史大致可以划分为三个阶段。

第一个阶段是从20世纪40年代中期到20世纪60年代中期。这一阶段的最大特点是,核威慑研究对博弈论方法的强烈需求推动了早期博弈论的发展,并催生了后来非常有影响的“囚徒困境”和“斗鸡博弈”等经典博弈模型。核威慑研究的先驱者贝尔纳德・布罗迪(BernardBrodie)曾在其早期提出的核威慑思想中试图运用冯・诺伊曼(VonNeumann)的两人零和博弈最小最大准则来强调“理性选择”的重要性:“当面临局势不可推测的紧要关头,决策者不可能完全获取最大限度的所得,因此,理性的选择便要求决策者分析出对对方最有利的策略,并据此作出相应的决策,这种选择尽管不能得到最大的所得,却能避免最大的所失。”由于核战争中没有胜利者的双输结局,无法套用两人零和博弈来解释,兰德公司的两位数学家便设计了后来称为“囚徒困境”的非零和博弈实验。虽然“囚徒困境”模型也适用于解释威慑现象,但严格意义上的第一个标准核威慑模型是“斗鸡博弈”模型。“斗鸡博弈”模型揭示了利益冲突的双方都有极力避免最坏结果的共同利益的一面,这与核战争中没有胜利者的核威慑思想十分吻合。谢林以及赫尔曼・康恩(HermanKahn)、丹尼尔・艾尔斯伯格(DanielEllsberg)等许多学者对“斗鸡博弈”进行了深入研究,并试图用于解释1962年发生的古巴导弹危机。

第二个阶段是从20世纪60年代中期到20世纪80年代中期。这一阶段的最大特点是,在威慑与冲突研究中出现了一些独特的、非主流的博弈分析方法。一方面,研究者对2×2矩阵形式的

71

万方数据

当代西方基于博弈论方法的威慑理论综述

博弈问题进行深入和系统的研究,如阿纳托尔・拉波波特(AnatolRapoport)和迈尔文・盖尔(MelvinGuyer)对78种没有固定支付的2×2矩阵博弈进行了分类研究,格伦・斯奈德(GlennSnyder)和保罗・迪辛(PaulDiesing)在此基础上建立了16种危机情景的2×2矩阵博弈。另一方面,采用2×2矩阵形式的静态博弈模型对古巴导弹危机所作的简单解释受到了普遍质疑,一些研究者提出了自己的博弈分析方法,其中较有影响的有奈杰尔・霍华德(NigelHoward)的元博弈(metagames)方法、尼尔・弗雷泽(NiallFraser)和基思・希佩尔(KeithHipel)的基于超博弈(Hypergames)的冲突分析方法以及史蒂文・布拉姆斯(StevenBrams)的行动理论(theoryofmoves)。霍华德应用元博弈方法研究了古巴导弹危机和越南战争,布拉姆斯用行动理论研究了古巴导弹危机并比较了与元博弈方法的差异,弗雷泽和希佩尔用超博弈和冲突分析方法研究了苏伊士危机和古巴导弹危机。由于元博弈与重复博弈、超博弈与不完全信息博弈、行动理论与动态博弈分别类似,因此巴里・奥尼尔(Barry0’Neill)认为,上述这些分析方法是因错误的原因而反对主流博弈论。

第三个阶段是从20世纪80年代中期至今。这一阶段的最大特点是,威慑理论研究中所采用的博弈分析方法逐渐向主流博弈论回归,不完全信息动态博弈模型开始得到广泛应用。以罗伯特・鲍威尔(RobertPowell)、弗兰克・扎格尔(FrankZagare)、詹姆斯・费伦(JamesFearon)为代表的新一代研究者普遍采用主流博弈论中的均衡概念(如子博弈完美纳什均衡、贝叶斯完美纳什均衡等)来建立威慑理论模型。巴里・纳勒布福(BarryNalebuff)最早采用主流博弈论方法来研究威慑问题,他在1986年建立了战争边缘策略与核威慑之间关系的模型。鲍威尔研究了双方不完全信息条件下的核威慑与战争边缘策略,得出了与传统威慑理论不同的结论。扎格尔和马克・基尔戈(MareKilgour)对威慑可信性进行了研究,认为威慑可信性与博弈论中的子博弈完美纳什均衡同义,此后他们进一步提出了完美威慑理论。20世纪90年代中期,费伦基于信号博弈研究了国内政治等因素对威慑的影响,此后他进一步对昂贵信号(costlysignals)与延伸威慑关系进行了研究。安德72鲁・基德(AndrewKydd)用博弈论研究了威慑升级的螺旋模型,阿维纳什・迪克西特(Dixit)和苏珊・斯克斯(Skeath)运用不完全信息动态博弈模型和完美贝叶斯均衡概念重新对古巴导弹危机进行了诠释。

二、当前基于博弈论方法的

威慑理论研究新进展

20世纪末,保罗・胡思(PaulHuth)对冷战结束后的威慑理论研究进行了全面评述,皮埃尔・阿兰(PierreAllan)等对博弈论方法在威慑及其他国际关系问题研究中的应用从可信性与完整性(robustness)两个维度进行了分析。此后,基于博弈论方法的威慑理论研究取得了一些新的进展,其中赞格尔等人提出的完美威慑理论、安・萨特里(AnneSartori)提出的威慑声誉理论和杰弗里・贝雷吉坎(JeffreyBerejikian)提出的威慑认知理论尤为引人注目。从方法论角度看,完美威慑理论充分发挥了博弈论方法的强大逻辑推理功能,威慑声誉理论注重将博弈论方法与个案研究方法相结合,而威慑认知理论则以独特的认知心理学视角为博弈论方法的应用开辟了新的领域。

1.完美威慑理论

赞格尔提出的完美威慑理论中的“完美”一词来自博弈论中的完美性准则,他力图运用扩展式博弈中的完美理性要求来重新检验经典威慑理论的逻辑基础。建立在核威慑理论基础上的经典威慑理论有两个基本假设:其一,行为者是理性的;其二,冲突是最坏的结局。在经典威慑理论家看来,战争或冲突对博弈双方都是最坏的结局,这一结局与“理性选择”要求不符,因此维持现状就成为博弈双方必然的选择。赞格尔指出,经典威慑理论的两个基本假设之间存在着内在矛盾,因为在理性选择假设下,由于冲突是一种最坏的结局,当先行为者采取“挑战”策略时,后行为者只能采取“合作”策略,否则将引发冲突并导致最坏结局的出现,因此惟一的结局必然是先行为者赢,而后行为者的威慑是不可信的。这一矛盾在经典的“斗鸡博弈”模型中表现为存在着两个各自有利于不同行为者的纳什均衡,即使冲突这一最坏的结局不发生,但博弈双方都有先行优势,从而都有先发制人的动机。

万方数据

相关文档
最新文档