第八讲 有限理性及其对博弈的影响 共55页
有限理性条件下的进化博弈理论
有限理性条件下的进化博弈理论
进化博弈理论在解释生物和人类行为的演化方面具有重要作用。传统进化博弈理论假设行为者完全理性,然而在现实生活中,由于信息不完全、认知限制和情感等因素的影响,行为者的决策往往受到有限理性的约束。近年来,有限理性条件下的进化博弈理论受到广泛,为理解有限理性对行为和策略选择的影响提供了有益框架。本文将回顾有限理性条件下的进化博弈理论的相关研究,总结其研究进展,并提出未来研究方向。
有限理性条件下的进化博弈理论主要有限理性个体在博弈中的行为
和策略选择。现有研究主要集中在以下几个方面:有限理性个体的行为模拟、有限理性条件下的演化稳定策略、以及有限理性对博弈结果的影响等。尽管这些研究取得了显著成果,但仍存在一些不足之处,如对有限理性的刻画不够准确、缺乏对动态演化过程的考虑等。
本研究采用文献综述和理论分析的方法,对有限理性条件下的进化博弈理论进行综合评价和分析。还将结合实验经济学的方法,通过设计有限理性条件下的人类博弈实验,深入探讨有限理性对行为和策略选择的影响。
通过对有限理性条件下的进化博弈理论的文献进行综述,发现有限理
性个体的行为和策略选择受到多种因素的影响,如个体的学习能力和记忆力、群体规模和结构、以及博弈环境和规则等。其中,个体的学习能力和记忆力会影响其策略调整的速度和方向,群体规模和结构会对演化稳定策略产生影响,而博弈环境和规则则会决定策略的相对优势和演化稳定性。
本研究发现,有限理性条件下的进化博弈理论为理解有限理性对行为和策略选择的影响提供了有益框架。未来研究可以进一步探讨以下几个方面:如何更准确地刻画有限理性个体的行为和策略选择,例如考虑个体的不完全理性、偏好和情绪等因素;如何将动态演化过程纳入理论模型,以更好地模拟真实世界的演化过程;如何将有限理性条件下的进化博弈理论应用于更广泛的研究领域,例如社会心理学、经济学和生态学等。
理性与有限理性-从经典博弈理论到进化博弈理论
o4Fra Baidu bibliotek
理性与有限理性一从经典博弈理论到进化博弈理论
文/ 刘醒
摘 要:博弈理论 自 产生起逐渐被广泛地 用于生态学、杜会学、经济学等领城 ,越来越多的经济学家应用该理论来研究经济活动申经 济主体 的群体行为。与经典博弈理论不 同,进化博弈理论并不要求经济主体是完全理性的,也 不要求经济主体的行 为满足预期一致性原则。 因此进化博弈理论 比经典博弈理论 能够更准确地预 测经济主体的行 为。所以在短短的二十几年里进化博弈理论就获得 了迅速 的发展。 关键词 :博弈;模 型
一
.
经典博弈理论的缺陷
经典博弈理论 从完 全理性 的参 与人出发 ,利用 其经典均衡概念—— 纳什均 衡 ,主要 是从微 观层 次上 的 、经济 个体 之间 直接 的相互 作用 出 发,研究经 济个体的行为规律 ,研究经 济个体的行 为之 间静态或动态 、 短期和长期 的交互作用和 它们 的均衡 ,以及 由此表现 出来的经济规律 和 经济 现象 ,反 映出来的经济关 系和效率 意义 ,并 以这些 为依据对经济 活 动 的结果进 行预测 。根据F u d e n b e r g a n d T i r o l e ( 1 9 9 1 ) , “ 当存在 多个 纳什 均衡时 ,说某个纳什均衡 ~定会被采用 ,必须有某种 能够每个博 弈 方都能预期 同一个纳什均衡 出现的机制 或者程序 ”。纳什 均衡分析这 一 缺 陷的主要 原因在 于他的理性基 础。 古典经济学假定参 与人是完全理性 的,即作为 生产 者在给定技术和 资源 条件下 能够 找到一个可 以获得最大利润 的生产方案 ;作为消 费者在 既定的预算约束 下能够找 到一 个可 以获得最 大效用 的消 费方案 。经 典博 弈 理论则在此 基础 上引人 了经 济行为主体之 间的互动作用 ,从而使得 理 论与现 实更接近 ,它作为预测经 济主体行 为的基本工具是 纳什均衡及其 精炼 。在预测 经济 主体行 为时,经典博弈理论存在着三大缺 陷: ( 1 ) 在作 均衡分 析时 ,经 典博弈 理论假 设参与人 是完全理 性 的,并 且每 个参与人对博 弈的结构及对 方的支付有 完全的 了解 ( 完 全信息 时) , 求解 子博弈精炼纳什均衡 时所利 用的后 向归纳 法 ( B a c k w a r d I n d u c t i o n ) 不 但 要求 参 与 人 完全 理 性 ,而 且 还 要求 参 与 人 的行 为 满足 序 贯 理性 ( s e q u e n t i a l R a t i o n a l i t y ) 的要求。我们 以两个参 与人 ( A 、B ) 的博弈情 况为例 ,不仅 要求 参与人A 、B 是理性的 ,而且要求A 知道B 是理性 的,B 也 知道A 是理 性的;A 知道B 知道A 是理性的 ,B 知道A 知道B 是理性 的:A 知道B 知道A 知道B 是理性 的……显然这个 比理性概念 要求更强 的序 贯理性假定 与现实相差太远 。 ( 2 ) 经典 博弈理论 在处理不 完全信 息 问题 时有两种方 法 ,1 . 假定各 参与人知道 “ 真实模 型”的结构,但模型 中的各参数是不可观察 的;2 . 假定各 参与人知道 各种可能状态 客观的概率 分布,给定 一个先 验信念 , 当出现任 何新信息 时,每个参与人 都能够应用 贝叶斯法则修 正 自己的先 验信念 。这两种处理 方法有三大缺 陷:其一 ,必须假定参 与人 知道世界 的各种 可能状态 ;其二,必须假 定参与人知道 在随机抽取状态 上 的客观 概率分 布;其三 ,必须假定参与 人具有很强 的计算 、推理 能力 ,且能够 在一个大的状态空 间上应用 贝叶斯法则解 决相 当复杂的 问 题。 ( 3 ) 经典博 弈理论 作为预测 工具 的理论基础 是纳什均 衡及其 精炼 。 这~ 理论 不但 要求 各参 与人完 全理 性 ,而且 还要 求参 与人 的预期 满足 致 性 原则 所谓 一致 性原 则,就 是要 求每 个参 与人 正确 地知道 其他 参与 人将 会如 何选 择 。然而 ,这些 知识 从何 而来 呢 ?经 典 博弈理 论对 此有过 许多研 究并形成 了几种共 同的观 点,如博 弈前 的交流 ( P r e — p l a y c o m m u n i c a t i o n ) 、 自我实现 的预 期 ( S e l f - f u l f i l 1 i n g P r o p h e c i e s ) 、聚 点( F o c a l P o i n t s ) 等。博弈前交流 的基 本思想是假定参 与人在博弈进行 前讨论如何 行为 。如 果能够达成协议 ,则该协 议必定是一个纳 什均衡 , 否则一定有 参与人会违 背协议;博弈最 终达到 并稳 定于哪~个均 衡是很 难 确定 的( A u m a n n ,1 9 9 0 ,对此进行 过详细 的论述 ) 。自我实现 预期的基 本思想是 ,如果一个预测 参与人行为 的理论被博弈 中各参与人 知道,那 么它就一定能够预测到纳什均衡 ( M y e r s o n ,1 9 9 1 对此有过详细 的讨论) 。 前面这两种观点并不能说 明参与人 的知识 从何 而来,因而缺乏说服力 。 二 .进 化博弈理论的基本内容 进 化博弈理论 以生物进化论和遗 传基 因理 论为基本思想 。从对生物 界中动植物进 化的分析知道 ,动植物 的行为是不经 过思考 的,甚至一些 行 为选择最 多也只是 出于 本能的直觉 ,根本无法 与人类相 比,但 它们 的 行 为却趋于纳什 均衡水平 。也就是说 ,其行为 可以用 纳什均衡概 念来解 释 生物进化遵 循优胜劣汰 的原则决定 它们的行为趋 于纳什均衡 。利用 进 化博弈理论研 究参与人群 体行为时 ,只要求参 与人知道什么 是成功行
博弈论第8次课——不完全信息动态博弈共59页PPT
45、自己的饭量自己知道。——苏联
41、学问是异常珍贵的东西,从任何源泉吸 收都不可耻。——阿卜·日·法拉兹
42、只有在人群中间,才能认识自wk.baidu.com己。——德国
43、重复别人所说的话,只需要教育; 而要挑战别人所说的话,则需要头脑。—— 玛丽·佩蒂博恩·普尔
博弈论第8次课——不完全信息动态博 弈
16、人民应该为法律而战斗,就像为 了城墙 而战斗 一样。 ——赫 拉克利 特 17、人类对于不公正的行为加以指责 ,并非 因为他 们愿意 做出这 种行为 ,而是 惟恐自 己会成 为这种 行为的 牺牲者 。—— 柏拉图 18、制定法律法令,就是为了不让强 者做什 么事都 横行霸 道。— —奥维 德 19、法律是社会的习惯和思想的结晶 。—— 托·伍·威尔逊 20、人们嘴上挂着的法律,其真实含 义是财 富。— —爱献 生
有限理性及其分析框架
3.博弈分析的应用: (1)这种博弈分析既可检验博弈策略在有限理性博弈方的学习和 动态调整过程中的稳定性,因此有一种均衡选择作用 (2)也 可以研究有限理性博弈方学习和策略调整将导致群体意义 上的策略均衡及其效率意义,解释个各种社会经济现象 4.关键:是确定博弈方学习和策略调整的模式,或者说机制。事实 上,不仅不同博弈方的理性和学习能力有差异,需要多种动态机制 来模拟,甚至同一个博弈中的不同博弈方在在理性方面可能会有很 大差异,需要不同的动态机制来描述和分析。
其实,不仅有限理性博弈方的学习和策略调整可以用生物 进化的复制动态机制模拟,而且前面的提出的分析有限理性博弈的 有效均衡概念特征,也与生物进化博弈的“进化稳定策略”概念非 常相似,通常也把研究有限理性博弈理论称为“进化博弈论”
因此,要对有限理性博弈做出有效分析的预测,必须发展适合 分析博弈方的学习和策略调整过程,适合分析这种学习和调整的动 态过程中的稳定性和动态趋势的概念及分析方法。
二、有限理性博弈分析框架
1.适用于分析有限理性博弈的均衡概念基本特征: 在有限理性博弈具有真正稳定性和较强预测能力的均衡,必须是能 通过博弈方模仿、学习的调整过程达到,具有能经受错误偏离的干 扰,在受到少量干扰后仍能“恢复”的稳健的均衡。 2.有限理性博弈有效分析的内容: (1)有限理性博弈的有效分析框架是有有限理性博弈方构成的, 一定规模的特定群体内成员的某种反复博弈。 (2)在这种分析框架中,博弈分析的核心不是博弈方的最优策略 选择,而是有限理性博弈方组成的群体成员的策略调整过程、趋势 和稳定性。
第8章博弈、信息与理性
变假定条件,讨论博弈可以多次进行的重复博弈(Repeated
Game)。这时囚犯同时选择不交代有可能成为纳什均衡点。
• 因为重复性博弈中选择坦白的机会成本太高,可能成为不利的选择。 例如,A有机会与B组成策略联盟,并对B宣布如下方针:我将选择 抵赖,并要求你也如此,来增进各自利益;然而,如果你半途背叛 选择坦白,我从下一阶段游戏开始便一直采取坦白。这一方针与A 利益一致,因而是可信的。从B角度来看,如和A合作,可在每阶段 得到1年监禁的较好结果;如中途变卦,固然当期可得一次0年的更 好结果,但此后便每次面临3年监禁后果,显然是不利的。因而, 重复性博弈中,“抵赖+抵赖”点可能成为对双方最佳选择,因而 成为纳什均衡点。——由于博弈条件由一次性变为重复性,均衡状 态随之发生变化。
厂商B 进入 进入 厂商A 不进入 -20,-20 不进入 50,0 0,0
0,50
三、威胁与承诺
垄断者 进入
潜在进入 者
商战 -200,600 0,3000
默许 900,1100 0,3000
不进入
在这个博弈中,首先要由潜在进入者作出进入或不进入市场的选择, 然后再由垄断者来决定是默许他的进入还是进行商战。潜在者进入的时 候也必须考虑垄断者的反应。所以这个博弈最可能的结果是(进入,默 许)。 对于垄断者来说,他的反应是试图阻止潜在进入者的进入。一种策略是: 发出商战的威胁,如果这样他会面临“鱼死网破”的结局,所以这种威胁是 空头威胁。
有限理性
有限理性(bounded rationality)的概念最初是阿罗提出的,他认为有限理性就是人的行为“即是有意识地理性的,但这种理性又是有限的”。一是环境是复杂的,在非个人交换形式中,人们面临的是一个复杂的、不确定的世界,而且交易越多,不确定性就越大,信息也就越不完全;二是人对环境的计算能力和认识能力是有限的,人不可能无所不知。 20世纪40年代,西蒙详尽而深刻地指出了新古典经济学理论的不现实之处,分析了它的两个致命弱点(1)假定目前状况与未来变化具有必然的一致性;(2)假定全部可供选择的“备选方案”和“策略”的可能结果都是已知的。而事实上这些都是不可能的。西蒙的分析结论使整个新古典经济学理论和管理学理论失去了存在的基础。西蒙指出传统经济理论假定了一种“经济人”。他们具有“经济”特征,具备所处环境的知识即使不是绝对完备,至少也相当丰富和透彻;他们还具有一个很有条理的、稳定的偏好体系,并拥有很强的计算能力,靠此能计算出在他们的备选行动方案中,哪个可以达到尺寸上的最高点。西蒙认为人们在决定过程中寻找的并非是“最大”或“最优”的标准,而只是“满意”的标准。 以稻草堆中寻针为例,西蒙提出以有限理性的管理人代替完全理性的经济人。两者的差别在于:经济人企求找到最锋利的针,即寻求最优,从可为他所用的一切备选方案当中,择其最优者。经济人的堂弟——管理人找到足可以缝衣服的针就满足了,即寻求满意,寻求一个令人满意的或足够好的行动程序。西蒙的有限理性和满意准则这两个命题纠正了传统的理性选择理论的偏激,拉近了理性选择的预设条件与现实生活的距离。[编辑本段]理论 "有限理性"概念的主要提倡者是诺贝尔经济学奖得主西蒙(Simon)。 自从他提出有限理性概念半个世纪以来,经济学家对什么叫有限理性至今没有公认一致的看法。 西蒙当年认为有限理性的理论是 ' 考虑限制决策者信息处理能力的约束的理论 '。他提议将不完全信息,处理信息的费用和一些非传统的决策者目标函数引入经济分析。但是近来不少经济学家认为这三方面的研究并不足以构成有限理性概念的核心。西蒙是个反对主流经济学中的最优决策模型和全部均衡概念的人,但是过去二三十年中,主流经济学却在最优决策和全部均衡的分析框架中将西蒙提到的这三方面研究全部吸收了。首先以Wald 为代表的主流经济学家将不完全信息引入传统的最优 决策模型和全部均衡及对策论模型,使得主流经济学中的最优决策和全部均衡模型可以 用来揭示不 完全信息
演化博弈
二、有限理性及其对博弈的影响
人们在具体问题的理性程度,除了与个体差异 有关以外,与问题的复杂程度与有很大的关系, 在分析相对简单的问题时有完全理性的人在处 理比较复杂的问题是就可能有很大的理性局限 性。如果具体博弈的博弈方不满足完全理性假 设,称为“有限理性博弈方”(Boundedly Rational Player),存在有限理性博弈方的博弈称 为“有限理性博弈”。通常也叫“演化博弈 论”。
1,1
0,0
0,0
0,0
一般地,也以假设整个群体中“同意”类型 的博弈方比例是X,那么“不同意”类型博弈 方的比例当然是1-X。
在上述假设下,一个博弈方的得益一方面取 决于自己的类型,另一方面则取决于随机配对 遇到的对手类型。不难计算出“同意”和“不 同意”两种类型博弈方各自的期望得益u y 和 un分别为: u y= x · + ( 1 – x ) · = x 1 0 u n= x · + ( 1 – x ) · = 0 0 0 因此群体成员的平均得益为:
复制动态(Replicator Dynamics)
复制博弈的分析框架是这种博弈方组成的大群 体成员的随机配对反复博弈。分析框架中的大 群体成员随机配对博弈暗指所有博弈方都是相 似的,也意味着进行的博弈是博弈位置无差异 的两人对称博弈。 博弈方的学习速度较慢表现为向优势策略转变 是一个渐进的过程,不是所有博弈方同时调整, 策略调整速度可以用生物进化的进化动态方 程—复制动态公式表示。
第八讲 有限理性及其对博弈的影响
有限理性及其对博弈的影响
4
8.1.2 有限理性博弈分析框架
进化博弈论 研究有限理性博弈的理论 进化博弈的均衡 能通过博弈方模仿,学习的调整过程达到,能经受 错误偏离的干扰,在受到少量干扰后仍能恢复的稳健的 均衡
分析框架 由有限理性博弈方构成的,一定规模的特定群体内 成员的某种反复博弈
有限理性博弈分析框架
前者帕累托优于后者,在理性层次较低的有限理性 博弈方组成的大群体成员随机配对反复博弈的框架内分 析该博弈
签协议博弈的复制动态和进化稳定策略
19
8.3.1 签协议博弈的复制动态和进化稳定策略
分析过程 博弈方理性较低,不会一开始就找到最佳策略。不 同策略的博弈方可看作不同的类型。假设,整个群体中 为“同意”类型的博弈方占整个群体的比例为 x ,则 “不同意”博弈方比例为 1-x 博弈方的得益不仅取决于自己和随机配对遇到的对手 类型。“同意”与“不同意”两种类型博弈方各自的期
协调博弈的优先博弈方快速学习模型
13
8.2.1 协调博弈的有限博弈方快速学习模型
B B B A A B A A A A A A A
A
A
初次博弈为相邻 2A 的最优反应动态
A A B B A A A A A A A A A
初次博弈为相连 3A 的最优反应动态
协调博弈的优先博弈方快速学习模型
有限理性模型
有限理性模型
有限理性模型是关于人们如何进行选择和做出决策的问题。它源自科斯提出的不完全信息动机。他认为:“理性人能够在不受他人影响的情况下,通过自己独立思考而做出的最大努力去获得的最佳结果。”然而,“当一个人要做出关系到自己未来命运的重大决定时,则必须同时具备更多的信息。”这就是著名的“科斯第一定律”。我们可以把科斯第一定律看成一个假设,即人是不能在没有更多信息的情况下,做出最优的决策。也就是说,信息对于人的行为是至关重要的。所以从20世纪50年代开始,科斯就致力于寻找一种数学模型来描述理性人如何在不完全信息的条件下,作出最优决策。在1961年和1962年,科斯先后给出了两个著名的有限理性决策模型:极大化问题(max-min-max-out problem, MPO)和寻租竞争模型
(rent-seeking-conflict, RHO)之后,很多人又对此进行了深入的研究,建立了多个不同形式的有限理性决策模型。根据科斯的观点,由于存在这样或那样的偏差,人们的理性行为总是无法达到“最优”,只能“接近”,因此,我们的世界永远是不完美的。
根据科斯的观点,企业家正是在利用市场机制这只“看不见的手”时,应该同时充分利用政府机制这只“看得见的手”,既追求效率,又兼顾公平。这就是著名的科斯第二定律。它的内容是:企业家的活动并不是免费的,他付出的代价就是自己的利润最大化;而且企业家追求利润最大化的目标,比社会上绝大多数人追求利润最大化的目标要高,这就使企业家在市场机制作用下面临市场失灵时,以政府干预
第八章博弈论简要课件
例子
乙
策略1
策略2
甲 策略1 -20 , -30 900 ,600
策略2 100 ,800 50 ,50
极大极小化策略均衡解(策略2,策略2)
15
9
第八章 博弈论
例如:纳什均衡的求解
参与者1
参与者2
L
C
R
2, 1 2,2 0 ,1
T
1, 1 1 ,1 1, 1
M
0 ,1 0 ,0 2 ,2
B
10
练习
参与者1
第八章 博弈论
参与者2
L
C
R
T 2 ,0 1 ,1 4 ,2
M 3 ,4 1 ,2 2 ,3
B 1 ,3 0 ,2 3 ,0
纳什均衡:(M, L) , (T, R)
不进入 (0 ,3000)
13
第八章 博弈论
五、极大极小化策略
为了避免最大损失,一些局中人往往 采取比较保守的策略,即不管对方选择何 种策略,我总选择自己所能选择的最坏策 略中最好的策略,即首先找出各策略中自 己能获得的最小收益,然后选择其中最大 者作为自己的策略,这被称为极大极小化 策略。
14
第八章 博弈论
第八章 博弈论
目前,博弈论发展的非常深入,这里只是 介绍一些初步知识。在二十世纪四、五十年代, 由冯 ·诺依曼、摩根斯坦把对策论、运筹学引 入经济学,形成了最早的博弈论。几十年来, 博弈论在经济学中发挥着越来越大的重要作用, 1994年的诺贝尔经济学奖就授予三位博弈论学 家 : 纳 什 ( Nash) 、 泽 尔 腾 ( Selten) 和 海 萨 尼 ( Harsanyi) 。
博弈论-有限理性和进化博弈
第五章
有限理性和进化博弈
本章介绍有限理性基础上的进化博弈分析. 本章介绍有限理性基础上的进化博弈分析. 完全理性在现实中很难满足, 完全理性在现实中很难满足,当社会经济环境 和决策问题较复杂时, 和决策问题较复杂时,人们必须存在很大的理 性局限.有限理性对人们的决策, 性局限.有限理性对人们的决策,行为选择方 式有很大影响, 式有很大影响,有限理性基础上的博弈分析与 完全理性博弈分析也有很大区别. 完全理性博弈分析也有很大区别.进化博弈分 析是有限理性博弈分析的基本框架. 析是有限理性博弈分析的基本框架.本章介绍 以最优反应动态和复制动态为核心, 以最优反应动态和复制动态为核心,以进化稳 定策略为基本均衡概念的进化博弈分析, 定策略为基本均衡概念的进化博弈分析,包括 基本方法,概念和各种经典模型等. 基本方法,概念和各种经典模型等.
uy = 1 ε > 0 x = 1是进化稳定策略ESS
2
u y = (1 ε ) × 0 + ε × 1 = ε u n = (1 ε ) × 0 + ε × 0 = 0 u = (1 ε ) ×u n + ε × u y = ε 2
u y = ε > 0 = un x = 0不是进化稳定策略
= x(1 x)(61x 11)
复制动态进化博弈的结果 常常取决与带有很大偶然 性的初始状态.
第八章博弈论续ppt课件
120
一、精炼贝叶斯均衡的基本思路
在不完全信息动态博弈中,“自然”先选择参与人的类型 (参与人自己知道,其他人不知道)→参与人开始行动,后 行动者能观测到先行动者的行动,但不能观测到其类型。→ 由于行动是类型依存的,后行动者可通过观察先行动者选择 的行动来推断其特征或修正对其类型的先验信念(概率分 布),然后选择自己的最优行动。先行动者预测到自己的行 动将被后行动者所利用,就会设法传递对自己最有利的信息。 因此,博弈过程不仅是参与人选择行动的过程,而且是参与
(二)、贝叶斯均衡的应用举例
例:不完全信息古诺模型
在不完全信息古诺模型里,参与人的类型是成本函数。设
反需求函数为
,每个企业都有不变的单位成本。
令 为企业i的单位成本,则P 它的a利润q1函q数2为:
ci
假定企业1的单位成本 是共同知识;企业2的单位成本是 或 ,且 i q i(a 企 业q 1 2 知q 道2 自c 己i)的• ,成i 1 本,2 ,但企业1只知道
-10,0 0,300
30,80 0,400
-10,100 0,400
进入者有关在位者的成本信息是不完全的,但在位者知道 进入者的成本函数。在完全信息下,若在位者是高成本, 进入者的最优选择是进入;若在位者是低成本,进入者的 最优选择是不进入。但进入者并不知道在位者是高成本还 是低成本,故进入者的最优选择依赖于他在多在程度上认 为在位者是高成本的或低成本的。
第八章 博弈论
博弈论
博弈论关注的是相互依存,即每个个体所做
的选择受到其他个体所做选择的影响,整个群体 的状态也受到群体内每个个体所做选择的影响:
▪ 每一个个体猜测其他个体的选择是什么? ▪ 每个个体将采取什么行动? ▪ 这些行动将产生什么结局? ▪ 如果多次相互作用,将会有什么变化? ▪ 如果每个个体对群体内的其他个体的特性没有把握
那么称策略 是局中人i的弱占优策略。
这里 si 表示除了局中人i以外的局中人选择的策略向量 ❖ 在囚徒困境博弈中,“坦白”就是严格占优策略
严格劣策略
❖ 严格劣策略:如果不管其他的局中人选择什么样的策 略,局中人i的策略 的收益严格的小于他所有其他策 略的收益,那么称策略 是局中人i的严格劣策略。
❖ 在囚徒困境博弈中,“抗拒”就是严格劣策略
-4,-1 1,2
6小时 -1,-4 4,-1 1,-1
9小时 7,-4 4,-4 1,-4
迭代剔除劣策略
❖ 古怪的一对 • 对A:如果B选3小时,-13<-4<1,选9小时; 如果B选6小时,-1<1<4,选6小时; 3小时是严格劣策略,在博弈中不选择
同学A\B 3小时 6小时 9小时
3小时 -13,-8
▪ 每周至少需要12小时的工作才能保持住所的干 净,至少9小时的工作整洁度还过得去,而少 于9小时就肮脏不堪。
▪ 两个人每个人都可以奉献3小时,6小时或9小 时进行打扫
赫伯特 西蒙决策理论之有限理性
赫伯特·西蒙(Herbert Alexander Simon1916- 2001),经济组织决策管理大师。西蒙在管理学上的第一个贡献是提出了管理的决策职能。他倡导的决策理论,是以社会系统理论为基础,吸收古典管理理论、行为科学和计算机科学等的内容而发展起来的一门边缘学科。由于他在决策理论研究方面的突出贡献,他被授于1978年度诺贝尔经济学奖。西蒙之前,法约尔最早对管理的职能作了理论化的划分。此时,决策被包含在计划职能之中,其后的管理学者对此也没有提出疑问,只是到了本世纪四十年代,西蒙提出了决策为管理的首要职能这一论点之后,决策才为管理学家们所重视。今天决策理论枝繁叶茂,与西蒙对这个领域的开创性贡献是分不开的。
西蒙对管理学的第二个贡献是建立了系统的决策理论。并提出了人有限度理性行为的命题和“令人满意的决策”的准则。在西蒙之前,微观经济学家对个人在市场中的行为也进行了深入的研究。西蒙认为,完全理性的经济人模式有两个缺陷,其一,人不可能是完全理性的,人们很难对每个措施将要产生的结果具有完全的了解和正确的预测,相反,人们常常要在缺乏完全了解的情况下,一定程度地根据主观判断进行决策。其二,决策过程中不可能将每一个方案都列出来,一是人们的能力有限,二是决策过程的成本限制,人们所作的决策不是寻找一切方案中最好的,而是寻找已知方案中可满足要求的。
“管理人”
西蒙认为现实生活中作为管理者或决策者的人是介于完全理性与非理性之间的“有限理性”的“管理人”。“管理人”的价值取向和目标往往是多元的,不仅受到多方面因素的制约,而且处于变动之中乃至彼此矛盾状态;“管理人”的知识、信息、经验和能力都是有限的,他不可能也不企望达到绝对的最优解,而只以找到满意解为满足。在实际决策中,“有限理性”表现为:决策者无法寻找到全部备选方案,也无法完全预测全部备选方案的后果,还不具有一套明确的、完全一致的偏好体系,以使它能在多种多样的决策环境中选择最优的决策方案。西蒙的管理理论关注的焦点,正是人的社会行为的理性方面与非理性方面的界限,它是关于意识理性和有限理性的一种独特理论──是关于那些因缺乏寻找最优的才智而转向寻求满意的人类行为的理论。
博弈论第8次课——不完全信息动态博弈共59页文档
谢谢!
36、自己的鞋子,自己知道紧在哪里。——西班牙
37、我们唯一不会改正的缺点是软弱。——拉罗什福科
xiexie! 38、我这个人走Leabharlann Baidu很慢,但是我从不后退。——亚伯拉罕·林肯
博弈论第8次课——不完全信息动态 博弈
36、如果我们国家的法律中只有某种 神灵, 而不是 殚精竭 虑将神 灵揉进 宪法, 总体上 来说, 法律就 会更好 。—— 马克·吐 温 37、纲纪废弃之日,便是暴政兴起之 时。— —威·皮 物特
38、若是没有公众舆论的支持,法律 是丝毫 没有力 量的。 ——菲 力普斯 39、一个判例造出另一个判例,它们 迅速累 聚,进 而变成 法律。 ——朱 尼厄斯
39、勿问成功的秘诀为何,且尽全力做你应该做的事吧。——美华纳
40、学而不思则罔,思而不学则殆。——孔子
博弈论-有限理性和进化博弈
5.3.1 签协议博弈的复制动态和进化稳定策略
签协议博弈:
同意 不同意 博弈方2 同意 不同意 1,1 0,0 0,0 0,0
假设群体中采用“同意”比 例x
则不同策略期望得益和平均 u y x 1 (1 x) 0 得益为:
x
un x 0 (1 x) 0 0 u x u y (1 x) un x 2
复制动态分析
u1 x a (1 x ) b
复制动态的进化规 则是生物学中生物 特征进化规则
u 2 x c (1 x ) d u x u1 (1 x ) u 2
设x为采用策略1的 比例
dx x(u1 u ) x[u1 xu1 (1 x)u2 ] dt x(1 x)(u u ) x(1 x)[x(a c) (1 x)(b d )]
博弈方策略类型比例动态变化是有限理性博弈分 析的核心,其关键是动态变化的速度 以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
dx x(u y u ) x( x x 2 ) x 2 (1 x) x 2 x 3 dt
动态微分方程的相位图
5.1有限理性博弈及其分析框架 5.2最优反应动态 5.3复制动态和进化稳定性: 两人对称博弈
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有限理性博弈分析框架
6
8.2 最优反应动态
分析内容 少数有快速学习能力的有限理性博弈方之间的反复博
弈和策略进化 最优反应动态
博弈方虽然在复杂局面下准确分析判断和运用预见性 的能力稍差,但能对不同策略的结果作出较正确的事后 评估,并相应调整策略。最适合描述这种理性层次博弈 方的策略调整机制,即“最优反应动态”
5
8.1.2 有限理性博弈分析框架
进化博弈分析的关键 确定博弈的分析框架,即博弈方学习和策略调整的模
式或机制以及相互学习、模仿的环境条件。 主要讨论两种动态机制
有快速学习能力的小群体成员的反复博弈。 ——最优反应动态
学习速度很慢的成员组成的大群体随机配对的反复博弈。 ——生物进化的 “复制动态”机制
A
B
B
B
A
A
A
B
B
B
B
B
B
A
A
B
A
A
A
A
A
A
A
A
A
初次博弈为 1A 的最优反应动态
(已包含有相邻 2A ,非相连 3A 和 4A 三种情况)
协调博弈的优先博弈方快速学习模型
13
8.2.1 协调博弈的有限博弈方快速学习模型
B
B
A
A
B
A
A
A
A
B
A
A
A
A
A
初次博弈为相邻 2A 的最优反应动态
A
A
B
A A
5 个博弈方完全相似,除了初次博弈时所有博弈方都采 用 B 的情况外,从其余情况出发,经最优反应动态法 则的调整,最终都会收敛到所有博弈方都采用 A 的稳定 状态。分析过程如下
协调博弈的优先博弈方快速学习模型
12
8.2.1 协调博弈的有限博弈方快速学习模型
全部采用 A 或 B 的情况不需讨论,采用 A 策略博弈方 数量和位置有实质差异的只有 6 种情况
xi(t)5 0 2xi(t) 4 9,采用B的得益为 xi(t)0 2xi(t) 60
根据动态反应机制
当
x i ( t ) 5 0 2 x i ( t ) 4 9 x i ( t ) 0 2 x i ( t ) 6 0 即 xi (t
第八讲 有限理性和进化博弈
苏兵
西安工业大学经济管理学院 2019年
主要内容
有限理性博弈及其分析框架 最优反应动态 复制动态和进化稳定性:两人对称博弈 复制动态和进化稳定性:两人非对称博弈
有限理性及其对博弈的影响
2
8.1.1 有限理性及其对博弈的影响
有限理性:追求最大利益的理性意识,分析推理能力,识 别判断能力,记忆能力和准确行为能力等多方面的要求有 任何一方面的不完美即为有限理性
最优反应动态
7
8.2.1 协调博弈的有限博弈方快速学习模型
5个博弈方,相邻博弈方相互博弈的快速学习动态调整
模型:
博弈方2
A
B
A 博弈方1
B
50 , 50 0 , 49
49 , 0 60 , 60
博弈内容如上图得益矩阵所示的两人对称静态博弈, 称之为“协调博弈”。该博弈有两个纯策略纳什均衡 (A,A) ,(B,B) ,一次性博弈中博弈结果具有不确定性
协调博弈的优先博弈方快速学习模型
8
8.2.1 协调博弈的有限博弈方快速学习模型
确定分析框架 博弈方虽缺乏预见能力但能够对上一阶段博弈结果进 行总结,作出策略调整 设 5 个博弈方分别处于下图所示圆周中的 5个位置上, 每个博弈方都与左右相邻的博弈方反复博弈
1
5
2
4
3
协调博弈的优先博弈方快速学习模型
9
8.2.1 协调博弈的有限博弈方快速学习模型
每个位置的博弈方既可能采用 A 也可能
1
采用 B,总共有 25 32 种可能,包括全
部采用 A,全采用 B 和两种策略都有人 5
2
采用。根据采用 A 博弈方的数量和分布,
总共有 无A,1A、有相邻2A、有不相邻
2A、有3连A、有非3连A、4A、5A共 8 4
3
种有实质差异
博弈方能否在反复博弈过程中出现策略的收敛?
协调博弈的优先博弈方快速学习模型
10
8.2.1 协调博弈的有限博弈方快速学习模型
设 x i ( t )为 t 时期博弈方 i 的邻居中采用 A策略邻居的数
量 xi(t)0,1,2则采用 B 策略邻居的数量相应 2 xi (t )根
据第 t 期的相关情况博弈方 i 采用 A 的得益为
有限理性及其对博弈的影响
4
8.1.2 有限理性博弈分析框架
进化博弈论 研究有限理性博弈的理论
进化博弈的均衡 能通过博弈方模仿,学习的调整过程达到,能经受
错误偏离的干扰,在受到少量干扰后仍能恢复的稳健的 均衡 分析框架
由有限理性博弈方构成的,一定规模的特定群体内 成员的某种反复博弈
有限理性博弈分析框架
有限理性的非唯一性:博弈方有限理性的层次及各方面能 力的侧重存在差异
有限理性博弈:至少有部分博弈方具有有限理性
百度文库
有限理性及其对博弈的影响
3
8.1.1 有限理性及其对博弈的影响
博弈方有限理性对博弈的影响 博弈方不会一开始就找到最优策略,会在博弈过程
中学习博弈,必须通过试错来寻找较好的策略;也意味 着至少有部分博弈方不会采用完全理性博弈的均衡策略, 均衡是不断调整和改进而不是一次性选择的结果,而且 即使达到均衡也有可能再次偏离
)
22 61
时
博弈方 i 在 t 1 时期会采用 A
当 x i ( t ) 5 0 2 x i ( t ) 4 9 x i ( t ) 0 2 x i ( t ) 6 0 即 xi (t) 2261时
博弈方 i 在 t 1 时期会采用 B
A
A
A
A
B
A
A
A
初次博弈为相连 3A 的最优反应动态
协调博弈的优先博弈方快速学习模型
14
8.2.1 协调博弈的有限博弈方快速学习模型
进化稳定策略 在博弈方的动态调整策略中能达到,又对少量偏
离的扰动有稳健性,满足这两种性质的稳定状态称 “进化稳定策略”(ESS) 分析现实问题,必须根据实际情况建立分析框架
协调博弈的优先博弈方快速学习模型
11
8.2.1 协调博弈的有限博弈方快速学习模型
反应规则:如在 t 时期博弈方 i 的两个邻居只要有 1个
采用 A,则在 t 1 时期采用 A,两个邻居都没采用 A,
则在 t 1 时期采用 B。博弈方 i 在 t 时期的策略与自己
在 t 1 时期采用的策略无关