博弈论中的理性问题分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
般静态博弈和动态博弈),或者在运用高度预见 能力基础上的总体规划(重复博弈)的分析框架, 对分析有限理性博弈主体的博弈问题通常是不适 用的。这些博弈分析框架都无法反映博弈主体的 学习过程,也无法讨论博弈主体行为和策略的动 态稳定性。因此,分析有限理性博弈主体的博弈 问题必须发展不同于完全理性博弈分析的专门分 析框架。能够包含博弈主体的学习和策略调整过 程,研究博弈主体行为和策略动态稳定性,从而适 用于分析和预测有限理性博弈的分析框架,是分 析能力很差和没有预见能力的个体组成的特定群 体内成员间的某种反复博弈。例如某个由缺乏足 够预见性的个体组成的小群体,其成员都对当前 局势作出反应,或者相互学习、模仿邻居的优势策 略。也可以是在大量博弈主体组成的群体中成员 之间随机配对的反复博弈,相当于现实经济中对 象或伙伴不固定,多个或大量个体之间的较长期 经济、交易关系,或者小群体中相邻个体的相互学 习和某种形式的相互反应。这些分析框架通常假 设博弈主体有一定的统计分析能力和对不同策略 效果的事后判断能力,但没有事先的预见和预测 能力。这种分析框架与人们在现实决策活动中的 实际行为模式是比较接近的。在这种分析框架 中,博弈分析的核心不是博弈主体的最优策略选 择,而是有限理性博弈主体组成的群体成员的策 略调整过程、趋势和稳定性。
二、有限理性及其对博弈的影响
有限理性的概念是阿罗提出的。用他的话来
50
说,有限理性就是人的行为“是有意识地理性的,
但这种理性又是有限的”。在罗斯看来,人的有
限理性包括两个方面的含义:一是环境是复杂
的,在非个人交换形式中,人们面临的是一个复
杂的、不确定的世界,而且交易越多,不确定性就
越大,信息也就越不完全。二是人对环境的计算
三、有限理性条件下的进化博弈分析
有限理性博弈分析的关键是确定博弈主体学 习和策略调整的模式,或者说机制。由于有限博 弈主体理性层次的多样性,使得博弈主体的学习 和策略调整的方式和速度相差甚远,要对有限理 性博弈作出有效的分析预测,必须发展适合分析 博弈主体的学习和策略调整过程,适合分析这种 学习和动态调整过程中的稳定性,必须用不同的 机制来模拟博弈主体的策略调整过程。目前,较 多的采用两种分析机制:一种是理性层次较高、 学习能力较快的群体,其分析机制是“最优反应 动态”;而对于理性层次较低、学习能力较差的行 为主体,相应的分析机制是“复制动态过程”。后 者这种分析机制是借鉴生物进化中生物性状和行 为特征动态变化的过程来设计的。生物进化理论 具有在动态调整过程中恢复或者达到稳健性均
有理性局限的行为主体(博弈参与人)称为 “有限理性”的博弈主体。有限理性首先意味着 博弈主体往往不能或不会采用完全理性条件下的 最优策略,意味着博弈主体之间的策略均衡往往 是通过学习调整的结果,而不是一次性选择的结 果,而且即使达到了均衡也可能再次偏离。不管 是所有博弈主体有限理性还是部分博弈主体有限 理性这些结论都是成立的,因为博弈问题中相互 依存关系的特征很容易使部分博弈主体的理性缺 陷,甚至只是博弈主体相互对对方理性的怀疑,引 向对完全理性博弈分析预测作用的毁灭性破坏。 完全理性基础上的博弈分析方法和均衡概念,也 就是建立在推理分析基础上的一次性选择(对一
在社会生活中,理性人追求个体利益最大化
收稿日期:2008—09—30 基金项目:国家社科基金项目“经济逻辑研究”(批准号:06BZX050);天津市“十五”社科研究规划课题(批准号:TJQ5 —·zx004) 作者简介:蒋正峰(1970一),男,湖南道县人,华南师范大学政治与行政学院博士研究生,华南农业大学思政部讲师;贺 寿南(1972一),湖南双峰人,南京大学哲学系博士研究生。
\尹\\z
坦白
抵赖
坦白
-5.一5 一10,0
抵赖
0。一Βιβλιοθήκη Baidu0 —1,一1
这个博弈中,两个囚徒的目标都是追求自身 利益最大化。如果对方坦白,自己抵赖将坐10年 牢,而坦白的话只要坐5年牢,坦白比抵赖有利; 如果对方抵赖,自己也抵赖将坐1年牢,而自己坦 白的话,则能无罪释放,还是坦白比抵赖有利。可 见,不管对方采取什么策略,自己坦白总是比较有 利,所以必然的选择是“坦白”。同样的道理,对 方也肯定选择“坦白”。因此,双方均选择“坦白” 的策略(这一策略组合点称为纳什均衡点)。如 果从集体理性的角度出发,两个囚犯都选择“抵 赖”策略,结果是最理想的状态。但这个状态是 达不到的,因为每个理性的囚徒均会主动偏离这 个状态。订立攻守同盟也没有用,因为没有人有 积极性遵守协定。一个稳定的状态是双方均选择 “坦白”。两个囚徒决策时都以自己的最大利益 为目标,结果却无法实现最大利益甚至较大利益, 这是理性的囚徒难以摆脱的困境。它反映了个体 的理性行为产生集体的不合理性的行为,体现了 个体理性与集体理性的冲突,各人追求利己行为 而导致的最终结局是一个“纳什均衡”,也是对集 体不利的结局。与此类似的还有公共地悲剧、价 格战、军奋竞赛等等。
一、理性人假设的困境
博弈论研究的主要问题是人们在互动行为中 的推理问题,就是在人们的利益和行为有直接的 相互影响和作用的情况下个体的理性选择与策 略。理性人的本质是现实人或社会人。在博弈论 中理性人指具有推理、决策能力并通过选择策略 使自己的得益或支付最大的人。理性人假设,即
所有的参与人都是理性的,是博弈论的基本假定。 在理性基础方面采用的是一种“完全理性”的假 设。交互理性、理性的共同知识及其所要求的参 与者之间的相互信任等因素是建立在所有博弈参 与者都有“完全理性”或“充分理性”的基础之上 的。完全理性不仅要求行为主体始终以自身最大 利益为目标,具有在确定和非确定性环境中追求 自身利益最大化的判断和决策能力,还要求他们 具有在存在交互作用的博弈环境中完美的判断和 预测能力;不仅要求人们自身有完美的理性,还要 求人们相互信任对方的理性,有理性的公共知识。 这种完全理性假设的现实性明显存在问题,因为 它不仅意味着博弈主体绝对不会犯错误,绝不会 冲动和不理智,即使在复杂的多层次交互推理中 也不会糊涂,不会相互对对方的理性、能力、信任 和对信任的信任等有任何怀疑和动摇。
关键词:博弈论;理性人;均衡;有限理性;进化博弈论 中图分类号:B815.9 文献标识码:A 文章编号:1000—5455(2009)01—0049—04
博弈论是20世纪80年代以来经济学中发展 最为迅速、影响最为深刻的分支学科。它是以经济 个体决策和行为之间的相互作用和相互影响作为 研究的对象和主要出发点,用约翰.C.豪尔绍尼的 话说,博弈论是关于理性主体间策略互动的理论, 就是说,它是关于社会形势中理性行为的理论。∞目 前,博弈论在理论方面还存在一些不足,其中最大 的、最严重的问题是它的理性基础,也就是它对博 弈主体理性和行为能力基本假设方面的问题。
51
万方数据
衡,因而对分析有限理性条件下的博弈均衡具有 十分重要的意义。事实上,不仅不同博弈的博弈 主体的理性和学习能力有差异,需要多种动态机 制来模拟,甚至同一个博弈中的不同博弈主体在 理性方面也会有较大差异,同样需要不同的动态 机制来描述和分析。
摘要:“博弈参与人是理性的”,这是博弈论的公设,然而理性人假设却导致诸多博弈困境。“有限理 性”的博弈主体往往不能或不会采取完全理性条件下的最优策略。博弈主体问的策略均衡往往是通过学习调 整的结果,而不是一次性选择的结果,而且即使达到了均衡也可能再次偏离。分析有限理性博弈主体的博弈 问题蠲须发展不同于完全理性博弈分析的专门分析框架。进化博弈理论从参与人群体出发,以群体为研究对 象,采用从群体到个体的局部动态法来分析博弈参与人的决策行为,由此得到的结论能够更加准确地描述现 实人的行为。
从有限理性出发,西蒙提出了满意型决策的 概念。他认为,从逻辑上讲,完全理性会导致人们 寻求最优型决策,有限理性则导致人们寻求满意 型决策。以往人们研究决策,总是立足于最优型 决策,在理论上和逻辑上,最优型决策是成立的。 而在现实中,决策者很难对每一备选方案可能产 生的后果进行完全正确的预测,往往都是在不十 分了解的基础上就要做出最后的决策,这也就不 可避免地要在某种主观性很强的情况下做出具有 强烈个人色彩的主观判断。而决策者也很难考虑 到所有可能的决策方案。况且,对于一项决策是 否正确的认知或知觉往往还在很大程度上受到决 策者本人对决策目标的认识程度、有关的知识广 度与深度以及决策资料的了解程度和认知方式等 因素的影响,即决策者的认知偏向也会影响决策 过程信息的处理。那种按照效用函数计算出来的 最佳方案在实际决策过程中有时并不一定就会被 决策者看作是他心目中的最佳方案。人们决策的 标准是寻求令人满意的决策而非最优决策。因 而,西蒙提出用满意型决策代替最优型决策。所 谓满意,是指决策只需要满足两个条件即可:一是 有相应的最低满意标准;二是策略选择能够超过 最低满意标准。如果把决策比作大海捞针,最优 型决策就是要求在海底所有的针中间捞出最尖最 好的那枚针;而满意型决策则只要求在有限的几 枚针中捞出尖得足以缝衣服的那枚针即可,即使 还有更好的针,对决策者来说已经无意义了。
个事实中看出来的,即人脑不可能考虑一项决策
的价值、知识及有关行为的所有方面……人类理
性是在心理环境的限度之内起作用的。”④产生这
种有限理性的具体原因有以下几方面。
(1)行为主体的知识不完备性。完全理性意 味着行为主体必须完全了解并预期每项决策产生
的结果,而这在实际中是不可能达到的。因为每
个人对于自己行动所处的环境条件只有片面的、
局部的了解,从而对其中蕴含的规律和规则也只
能有一个粗浅的管见。做到明察秋毫、全知全能, 不过是理想化的谎言。也就是说,人们力争理性
而又被束缚在其知识的限度之内。
.
(2)对行为结果不确定性预见的困难。完全
理性要求行为主体始终具有完整一致的价值偏好
体系,只有这样,真实体验才能与预期始终保持一
致。然而,从经验上就可以知道,真实体验可能比
能力和认识能力是有限的,人不可能无所不知。
诺贝尔经济学奖得主西蒙认为,经济人效用
最大化行为的假设,是以完全理性为条件的。而
现实的情况却是,由于环境的复杂性、信息的不完
全性、人类认识能力计算能力的有限性等,因而人
的行为理性是有限的而决非完全的。西蒙从更接
近现实的人类理性可能和限度两个基本方面,提
出了有限理性的概念:“理性的限度是从这样一
预期的合意得多。也可能正好相反。西蒙认为,这
种预期和实际差异的原因,在于我们的大脑并非
在某一时间就掌握了所有的结果,而是随着对结
果偏好的转移,注意力也会从某一价值要素转向
了另一种价值要素。因此,就算我们相当完整地
描述了抉择的结果,这种预期所带来的情感波动
也几乎不如真实体验所带来的情感波动效果明
显。所以,要完整地预期价值是不可能的。
万方数据
必然导致人们相互之间的矛盾与冲突,个体的理 性行为往往会产生集体的不合理性的行为,出现 个体理性与集体理性的冲突。⑦囚徒困境就是这 样一个典型例子。
一次严重的纵火案发生后,警察在现场抓到 了两名犯罪嫌疑人。事实上正是他们为了报复而 一起放火,但警察没有掌握足够的证据。于是,警 察把他们隔离囚禁起来以便得到所需的口供。两 个犯罪嫌疑人都明白警方的政策:如果他们都承 认纵火,每人将被判入狱5年;如果他们都不坦 白,由于证据不充分,他们只会被认定为妨碍公务 罪而入狱1年;如果一个抵赖而另一个坦白并愿 意作证,那么抵赖者将被判lO年监禁而坦白者将 无罪释放。④这种博弈格局可用矩阵表示如下:
2009年第1期
No.1,2009
华南师范大学学报(社会科学版) JOURNAL OF SOUTH CmNA NORMAL UNIVERSnn『
(SOCIAL scIENCE EDITION)
2009年2月
Feb.,2009
博弈论中的理性问题分析
蒋正峰1,贺寿南2
(1.华南师范大学政治与行政学院,广东广州510631;2.南京大学哲学系,江苏南京210093)
(3)行为的可行性范围的限制。按照完全理
性的要求,行为主体要在所有可行的备选方案中
进行比较、优化并作出选择。但令人遗憾的是,每
种备选方案都有各自独特的结果,而人们却并不
具备有关每个备选方案所导致后果的所有认知,
万方数据
许多可能方案甚至根本无法进入行为主体的评价 范围。因此,无论在任何时刻,行为主体都只能想 出非常有限的几个可能方案作为备选方案。@