博弈论的哲学意蕴
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论的哲学意蕴
摘要:博弈论是融合哲学社会科学与自然科学的有机理论,是连接方法论与世界观的直接通道。
它既是世界观,也是方法论。
本文从囚徒困境出发,探讨了博弈论在揭示个人理性何以能走向集体不合理性和合理性中的哲学意蕴。
关键字:博弈论,纳什均衡,囚徒困境,理性,哲学,
1什么是博弈论
博弈论又称对策论,它是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,可定义为:一些个人、一些团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后、一次或多次从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
博弈论要回答的是:决策主体的行为在发生直接的相互作用时双方所采取的决策以及这种决策之间的均衡问题。
其核心问题是:决策主体的一方行动后,参与博弈的其他人将会采取什么行动?参与者为取得最佳效果应采取怎样的对策?
博弈主要可以分为合作博弈和非合作博弈。
它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
纳什对博弈论的发展起到了重要的推进作用,他不仅证明了非合作博弈及均衡解,也证明了均衡解的存在性,这就是著名的非合作博弈论的纳什均衡。
纳什均衡可以描述为:如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极去改变这一战略组合,这一战略组合称为该博弈的纳什均衡。
纳什均衡揭示了博弈均衡与经济均衡的内在联系。
博弈论是一个普遍的方法论,尽管它较多的应用在经济学领域,但远远不限于经济学。
到目前为止,博弈论在诸多领域已经取得辉煌成就而成为在数学、经济学、哲学[1]、生物进化[2]和社会分析等领域里极具影响力的理论。
各国对博弈论的研究,促进了人类社会的文明发展。
博弈论对人类的最大贡献则是博弈论的哲学思维方式推动了人类思维模式的向前发展[3]。
2行为规范中的博弈论哲学
2.1博弈论与哲学的关系
从哲学的角度对博弈问题进行分析另有一番意义。
哲学属于理想主义式的研究,它总是试图“全面地”看问题,试图把各种可能性考虑在内,于是就总是发现“任何求解中的困难”。
这种思维虽然苛求,但任何一件事情确与各种可能性复杂地相关——这个事实正是哲学所以必要的理由。
我们不得不在深入思考某个问题时去思考所有问题,这就是“一个问题、所有问题”的思维模式[4]。
博弈问题本来也是哲学中最重要的问题之一,哲学家站在社会认识的角度,把博弈论作为重新审视行为规范和社会制度[5]的工具。
维特根斯坦就是哲学博弈论的代表人。
当代哲学中关于政治、社会、伦理、历史等问题的讨论实际就是关于人类博弈的基本条件和问题的研究,甚至在哲学中最纯粹的、过去一向仅仅研究人与知识对象之间的单纯关系的知识论,在今天也已经不得不把博弈问题看作是它的一个方面。
不过,哲学式的博弈研究不是经济学、数学意义上的标准化研究,而是“广义的”。
后期维特根斯坦就已经明确地以“游戏”(博弈)为研究单位去分析所有哲学问题,无论语言、数学还是生活、日常实践。
哲学化的博弈研究的意义在于它更广阔地意识到任何博弈所牵动的所有条件和所有问题这样一个彻底开放的语境,它与经济学、数学意义上的博弈论可以形成研究性的互补。
比较简单地说,经济学、数学意义上的博弈论的思想语法是:给定如此这般的条件,某个博弈或者存在着形成某种均衡的规律或者不存在确定的博弈方法。
而哲学化的博弈论的思想语法则是:任意一个博弈,它的博弈条件是否是清楚的、可以相信的和可以接受的。
可以看出,哲学化的博弈研究是一种对博弈的反思性研究。
许多学者也注意到了博弈论与哲学之间的相互关系和相互影响[6],美国西北大学凯洛格管理学院的罗格·梅耶森如是说[7]:“在过去几十年里,博弈论的进展对社会哲学的基本问题产生了重大的影响,有必要把两者联系起来。
可以这样说,在西方知识史上,博弈论是霍布斯的杰作的现代续编,正如理论物理之于牛顿的经典物理学一样。
”博弈论提出了一个基础性理论问题,提出了一个新的认识社会历史的范式,将极大地改变和丰富哲学家、社会学家和历史学家的思维方式[8]。
在这一层意义上,它既是方法论,又是世界观。
2.2囚徒困境中的哲学
博弈论反映了马克思主义的矛盾说。
它研究的动态系统之间的关系实质是矛盾关系。
例如,在人对自然的博弈中就存在着这种关系。
虽然自然不能自觉选择最大限度地危害人类的行为方式,但人类必须选择最佳的行为方式。
直接地或间接地对付可能发生的不利环境闪素。
在人与人的相互作用中,这种矛盾关系更为复杂。
用博弈论的眼光来看,哪里有人与人的直接相互作用,哪里就有博弈。
在人类阶级社会中,阶级斗争便是阶级之间的最常见最普遍的一种博弈。
在博弈论中,总是假设最有利害冲突的双方都力求选择最佳的行为方式,在竞争中制胜对方,也就是说,人是理性的[9][10]。
经济学中的理论大多都基于“理性人假设”,理性人假设指出:作为经济决策的主体都是充满理智的,既不会感情用事,也不会盲从,而是精于判断和计算,其行为是理性的,总是追求自身经济利益的最大化。
2005年诺贝尔经济学奖得主托马斯·C·谢林曾经说过:“如果放弃了理性概念,我差不多就一无所有了”。
但理性人并不代表历史唯心主义,它可以与历史唯物主义共存。
唯心主义夸大了理性的作用,把理性的普遍性说成了宇宙世界的根源性,而我们把理性的普遍性限定在人类的行为中,博弈论研究所做的知识限定在支配人类行为过程的决策过程中,这也证实博弈形式的普遍性的存在根据,它确立了博弈论这一以理性选择为前提的人与人之间相互作用形式的普遍性[11]。
越是组织化程度高的策略思维越是需要智慧,需要技巧。
博弈论在说明个人理性、非理性与集体合理性、集体非理性的相互作用和辩证转化方面起着重要作用。
博弈论也是揭示个人理性如何达到集体合理性的桥梁和手段。
在揭示有意志的个人行为之间何以形成了不以人的意志为转移的社会规律的发生机制上,与“合力论”有某种异曲同工的作用,不过更趋细致和更具解释力。
经典的“囚犯困境”模型,揭示出个人之间的理性行为何可能导致集体的不合理性,个人的最优决策并不必然会导致集体行为的最优,相反它能表现那种社会生产中“企业的有组织、有计划的生产与整个社会生产的无政府”之间的矛盾。
囚徒困境的描述如下:
假设有两个小偷A和B联合犯事,私入民宅被警察抓住。
警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如
果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。
如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
表1给出了这个博弈的支付矩阵。
表 1 囚徒困境博弈
对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。
显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。
但是,倘若他们都选择“抵赖”,每人只被判刑1年。
表1中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。
但是,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡,即纳什均衡。
不难看出,此处纳什均衡与帕累托最优存在冲突。
囚徒困境的博弈结果突破了亚当·斯密的“看不见的手”理论,即博弈论似乎证明了个人自私的行为并不一定能够而且在许多情况下显然不能够在“看不见的手”的指引下产生最佳的社会共同结果,或者说,个人理性并不能保证集体理性。
不过博弈论的见解不能被理解为与“看不见的手”是对立的,它只是指出了“看不见的手”是不够的,不是形成集体理性的充分条件。
但这一有限的挑战仍然非常严峻,因为从个人理性到集体理性是在理论上所能够设想的危险最小的社会模式,通常认为这一模式既能够保证个人自由和权利又能够产生合理的利益分配,尤其能够避免极其危险的“奴役之路”。
博弈论的挑战似乎说明了古典自由主义可以是一种优美的政治理想但却是一种坏的哲学。
坏的哲学往往具有这样一个模式:当把现实还原为理想之后却发现由理想无法回归到现实。
2.3重复博弈
在社会历史活动中,存在着大量的长期合作的历史过程。
因为人类的社会历史活动在本质上是长期的,永续性的,不仅在空间上并存,而且在时间上继起。
因此研究长期的前后相继的,包括周期性的人类活动的交互作用是非常有意义的工作。
博弈论在这方面的贡献也是独特而具有成效的。
长期博弈的不同阶段是相互依赖的,博弈参与人的决策不仅受到其过去经验的影响,而且还要预测未来潜在可能性的影响。
现实生活中的大量的行为模式都是多阶段动态博弈,因而重复博弈是非常重要的。
博弈论提的描述这些冲突情况的数学模型,精确地刻画了斗争与同一、冲突与联合、对抗与非对抗、进攻与防御等的关系,丰富和细化了马克思主义的矛盾学说。
博弈理论分析增加了世人对矛盾的斗争性与同一性形成机制的理解[12]。
斗争性何以能产生同一性,是因为重复博弈的存在。
我们知道,在现实世界,长期关系比短期关系更加容易合作,并且具有效率更高的博弈结果。
因此一次性博弈往往有失偏颇。
可重复博弈的“囚徒困境”告诉我们这么一个道理:两个小偷被警察抓住,在一个坦白一个抵赖就减免坦白者重罚抵赖者”的博弈规则下,两个小偷的纳什均衡是(坦白,坦白)。
如果两个小偷是在一个重复的博弈中,即他们反复面临着选择的话,他们会联合起来抵赖,结果共同抵赖会导致无罪释放。
重复博弈导致了信任,导致了长期的关系和合作的可能。
囚徒困境说明如果双方之间的交易是一次性的,结果一定是诚信缺失。
但是如果双方能够预期到交易次数会增加,那么受长期利益的驱动,就会相应增加交易双方诚信的可能性。
集体不理性由于重复博弈的存在而变成集体理性。
3结论
博弈论是融合哲学社会科学与自然科学的有机理论,是连接方法论与世界观的直接通道。
博弈论在经济学中的成功应用和表现出来的巨大成就,可以说是自然科学方法和人的科学理论结合的成功范例。
作为一种社会历史观的博弈论也是这样的理论,它为消解如斯诺《两种文化》所揭示的现在仍然存在两种文化的对立而作出自己的贡献。
这种结合是如此的必然和自然,正预示着马克思预言的正确性。
说它必然,这是自然科学和社会科学发展的走势;说它自然,是因为这种结合不是牵强附会的,而是有机的相互统一。
博弈论既是方法论也是世界观,虽然我们从广义的角度说。
任何世界观同时也是方法论,但博弈论直接地沟通了方法论与世界观,它作为一种社会历史观直接地就是方法论。
博弈论正因为采用了数学模型的实证工具,使它既可以应用于微观领域,也是由微观达至宏观的桥梁。
不管是微观决策,还是宏观策略,在现实的应用能力上,博弈论都是非常强的方法论工具。
社会历史观的博弈论扬弃了近代自然科学方法对社会科学的影响,引进了现代自然科学方法,更符合社会复杂体系的研究。
应用博弈论研究社会历史规律,可以揭示个人理性何以能走向集体不合理性和合理性,在具体的个人行为选择中何以实现社会发展。
若从博弈论所揭示的道理中受到启发,就可以自觉地设计一种机制,在满足个人理性的前提下达到集体合理性,从而实现马克思所说的那种理想社会:“每个人的自由发展是一切人的自由发展的条件”。
参考文献
[1]李婕. 科技哲学发展进程中的博弈论分析[J]. 科学中国人, 2014 (11).
[2]陈浩, 武彬. 进化博弈理论及应用[J]. 商界论坛, 2014 (2): 389.
[3]张建英. 博弈论的发展及其在现实中的应用[J]. 理论探索, 2005 (2): 36-37.
[4]赵汀阳. 博弈问题的哲学分析[J]. 北京行政学院学报, 2005 (3): 72-76.
[5]刘淑芳. 博弈论视域中效率与公平的辩证法[D]. 山西大学, 2007.
[6]魏昕, 郭启贵, 杨艳昆. 哲学——思想的博弈论[J]. 商丘师范学院学报, 2004,
19(6): 22-23.
[7]肯·宾默尔.《博弈论与社会契约》(第一卷)[M]. 上海财经大学出版社, 2003.
[8]希尔贝克.《跨越边界的哲学》[M]. 浙江人民出版社, 1999,222.
[9]刘德海. 理性概念的内涵及其在博弈论学科体系中的地位[J]. 东北财经大学
学报, 2012 (5): 10-15.
[10]何茂昌. 理性的韧性——对博弈论和行为经济学的哲学沉思[J]. 黑河学刊,
2007 (4): 5-6.
[11]张践明.《经济哲学问题探索》[M]. 湘潭大学出版社, 2008.
[12]曹桂华, 陈黎. 重复博弈论的哲学意蕴——从 2005 年诺贝尔经济学奖谈起
[J]. 科技情报开发与经济, 2008, 18(29): 122-124.。