基于有限理性的最优反应动态分析
博弈论中的理性问题分析_蒋正峰
这个博弈中 , 两个囚徒的目标都是追求自身 利益最大化 。 如果对方坦白 , 自己抵赖将坐 10 年 牢 , 而坦白的话只要坐 5 年牢 , 坦白比抵赖有利 ; 如果对方抵赖 , 自己也抵赖将坐 1 年牢 , 而自己坦 白的话 , 则能无罪释放 , 还是坦白比抵赖有利 。 可 见 , 不管对方采取什么策略 , 自己坦白总是比较有 利 , 所以必然的 选择是 “坦白 ” 。 同 样的道理 , 对 方也肯定选择 “坦白 ” 。 因此 , 双方均选择 “坦白 ” 的策略 ( 这一策 略组合点称为 纳什均衡点 ) 。如 果从集体理性的角度出发 , 两 个囚犯都选择 “抵 赖 ”策略 , 结果是最理 想的状态 。 但 这个状态是 达不到的 , 因为每个理性的囚徒均会主动偏离这 个状态 。 订立攻守同盟也没有用 , 因为没有人有 积极性遵守协定 。 一个稳定的状态是双方均选择 “坦白 ” 。 两个囚徒 决策时都以自己 的最大利益 为目标 , 结果却无法实现最大利益甚至较大利益 , 这是理性的囚徒难以摆脱的困境 。 它反映了个体 的理性行为产生集体的不合理性的行为 , 体现了 个体理性与集体理性的冲突 , 各人追求利己行为 而导致的最终结局是一个 “纳什均衡 ”, 也是对集 体不利的结局 。 与此类似的还有公共地悲剧 、价 格战 、军奋竞赛等等 。
博弈论是 20 世纪 80 年代以来经济学中发展 最为迅速 、 影响最为深刻的分支学科 。 它是以经济 个体决策和行为之间的相互作用和相互影响作为 研究的对象和主要出发点 , 用约翰 . C . 豪尔绍尼的 话说 , 博弈论是关于理性主体间策略互动的理论 , 就是说 , 它是关于社会形势中理性行为的理论 。 目 前 , 博弈论在理论方面还存在一些不足 , 其中最大 的、 最严重的问题是它的理性基础 , 也就是它对博 弈主体理性和行为能力基本假设方面的问题 。
《经济博弈论》期末考试复习资料
《经济博弈论》期末考试复习资料第一章导论1.博弈的概念:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。
它包括四个要素:参与者,策略,次序和得益。
2.一个博弈的构成要素:博弈模型有下列要素:(1)博弈方。
即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。
即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。
各博弈方的策略选择范围称策略空间。
每个博弈方各选一个策略构成一个策略组合。
(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。
(4)得益。
各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。
3.合作博弈和非合作博弈的区别:合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。
主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。
假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。
如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。
合作博弈:团体理性(效率高,公正,公平)非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率)4.完全理性和有限理性:完全理性:有完美的分析判断能力和不会犯选择行为的错误。
有限理性:博弈方的判断选择能力有缺陷。
区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。
所以不能简单地假设各博弈方都完全理性。
5.个体理性和集体理性:个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。
第一章课后题:2、4、52.设定一个博弈模型必须确定哪几个方面?设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。
有限理性及其分析框架
3.博弈分析的应用: (1)这种博弈分析既可检验博弈策略在有限理性博弈方的学习和 动态调整过程中的稳定性,因此有一种均衡选择作用 (2)也 可以研究有限理性博弈方学习和策略调整将导致群体意义 上的策略均衡及其效率意义,解释个各种社会经济现象 4.关键:是确定博弈方学习和策略调整的模式,或者说机制。事实 上,不仅不同博弈方的理性和学习能力有差异,需要多种动态机制 来模拟,甚至同一个博弈中的不同博弈方在在理性方面可能会有很 大差异,需要不同的动态机制来描述和分析。
4.典型情况: (1)具有快速学习能力的小群体成员的反复博弈,相应的动态机 制称为“最优反应动态” (2)学习速度很慢的成员组成的大群体随机配对的反复博弈,策 略调整用生物进化的“复制动态”机制模拟 5.进化稳定策略(evolutionarily stable strategy,ESS) 指种群 的大部分成员所采取某种策略,这种策略的好处为其他策略所不及。 动物个体之间常常为各种资源(包括食物、栖息地、配偶等)竞争或 合作,但竞争或合作不是杂乱无章的,而是按一定行为方式(即策 略)进行的。
有限理性及其分析框架
1 2
有限理性及其对博弈的影响
有限理性博弈分析框架
一、有限理性及其对博弈的影响
1.相关概念: (1)有限理性方:指具体的博弈方不满足完全理性假设 (2)有限理性博弈:存在有限理性博弈方的博弈
2.完全理性:包括理性意识、分析推理能力、识别判断能力、记忆 能力、准确行为能力等多方面的完美要求源自任何其中一方不完美就 属于有限理性。
3.有限理性的几种情况: (1)博弈方的理性意识和分析推理能力很强,但会偶尔犯错误 (2)博弈方有很强的理性意识,但分析推理能力、理解复杂交互 关系的能力稍差 (3)理性意识和分析推理能力都有问题,既会冲动不理智也会犯 错误 (4)有些对静态环境的判断分析能力较强,但缺乏预见能力
基于有限理性网格资源分配方法的研究
根据纳什均衡的定义可知, 在纳 ,则达到均衡
:
ao tnm cai B D R M) lc i ehn m,R G A 。网格用户在不需要掌握 l ao s 其他用户信息的情况下 , 并不一定在博弈初始阶段就能找
到最优策 略 , 在博弈过程 中不断地 学习 、 而是 调整与改 进 ,
=
R ∑r 一 ,
通过试错寻找较好的策略, 最终达到最优策略, 并在找到 最优策略后即使发生偏离也能得到及时的纠正, 实现用户 效用最大化下的网格资源分配。 本文下一节分析网格用户 资源分配模型及最优策略, 然后介绍基于有限理性博弈下 用户策略及相应 B D R M算法实现 , RGA 接着对 B D R M R GA 算法的仿真结果进行分析, 最后展望下一步的工作内容。
格资源使用必然会对其他用户造成影响. 匆略用户之间的
相互影响来研究网格资源分配会导致较大的偏差。 实际网 格环境中, 可将用户之间、 用户与资源提供者之间的交互
国 家 自然科 学 基 金 资 助 项 目 ( o 0 50 1 , 育 部 新 世 纪优 秀 N . 7 30 )教 6
人 才计 划项 目和福 建 省 科 技 项 目资 助课 题
是实现网格计算的基础 , 是网格计算研究的重点, 目前有
多种研究方法 , 别从不 同的角度研 究 网格 资源管理 和分 分 配的性能
早期网格资源管理的研究主要从提高网格系统性能
的角度 来研 究 网格资 源 的分 配 . IFs r 平均 响 如 . o e 等【 t l 用
应时间、 资源利用率、 吞吐量等指标来衡量网格资源管理 系统的性能。后来人们认识到网格资源的自治、 动态和分
看作是一个博弈过程, 各个博弈方通过实施一系列的策略
基于有限理性的选择性预期与决策有效性的机理分析
经济学研究江苏社会科学2011年第5期引言决策是人类的基本活动,人类的一切行为都是决策的结果,人类的成功取决于决策质量的高低,而决策质量的高低取决于人们决策技能的高低。
从早期的“博弈”论研究开始,人们经历了从冯·诺伊曼和摩根斯顿(1947)的最大期望效用理论、萨维奇(1954)的主观期望效用理论到赫伯特·西蒙(1955)的有限理性论、卡尼曼和特沃斯基(1979)的预期理论等,一直在不断探索如何使决策更加有效。
对决策方案的选择从最优标准到满意标准的变迁,对决策的研究范式也从规范性研究范式向描述性研究范式转化,但贯穿于这一系列研究中有一个问题任何一个决策研究者都无法回避,那就是决策主体的决策预期问题。
不同的学者,不同的流派对决策主体的决策预期都加以关注,但关注的程度和研究的角度并不一样,特别是决策者的决策预期对决策方案选择的有效性,哪些因素影响着决策者的决策预期,什么样的决策预期才能提高决策的有效性等问题并没有一个系统的研究。
本文试图对这些问题做一探索。
一、研究回顾及评价1.经济学中的预期理论经济学中第一个使预期在经济分析中占主导地位的是约翰·梅纳德·凯恩斯。
预期在凯恩斯的早期著作中有一定的地位,但到1936年《就业、利息和货币通论》中则变成中心地位,他对就业水平、货币需求等的分析都主要取决于预期。
但凯恩斯并没有明确说明预期是如何产生的,而且他的论述也是假设性和零散性的,后来的学者在其基础上进行了一系基于有限理性的选择性预期与决策有效性的机理分析郭新强盛宇华内容提要决策者的决策预期直接影响决策方案的选择,决策质量的高低。
在系统分析了经济学、决策学对决策预期的研究成果后指出其不足之处,进而提出选择性预期的观点,分析了选择性预期的影响因素,选择性预期与理性预期的关系,并提出如何把握选择性预期的度而提高决策的有效性,以期对现实的决策者有一定的借鉴意义。
关键词有限理性理性预期选择性预期决策有效性郭新强,南京工程学院讲师211167盛宇华,南京师范大学商学院教授210097列的研究,并提出了一系列的理论。
农业技术推广的最优反应动态博弈分析
我 国 主要 的 粮食 生 产 区 分 布在 东 北 . 黄淮 海 地 区 以及 长江 中下 游地 区 这 些地 区土地 面积 占全 国 总土 地 面积 的 2 % .0 3年耕 地 面积 和 总人 口分 别 2 20 占全 国 的约 5 % 、 1 % ,粮 食 播 种 面 积 占全 国 的 3 5. 8 5 %, 食 总产 占全 国的约 6 %。 9 粮 1 其他 地 区由于 经济 发展 和 地形 等 制约 因素 。 粮食 种 植 面积 相对 较 小 …。
改 革 开放 以来 . 国农 业 和农 村 经 济 取得 .小 麦 生 产 8 %实 现 了机 械 0 0 化 。水稻 机 械 收割水 平 接 近 3 %(0 5年数 据 ) 但 4 20 ,
快 的 发 展 . 是 由于 农 业 经 济 的发 展 . 我 们 对 如 正 使 何 发 展 农 业 .发 展 怎 样 的农 业 等 发 面有 了 新 的认 知 . 时也 提 出 了发 展 现 代 农 业 的要 求 . 文 主要 同 本 从 农 业 技 术 推 广 的辐 射 效 应 论 述 我 国 现代 农 业 的
G a e Ana y i o he Be t Re po e m l ss f t s s ns Dy m i s i Ag o- e hn c l Po ul r z to na c n r t c i a p a ia i n
W U e LI Jn Zh . i g
( c o lo c n mis S h o f E o o c ,Ya  ̄z nv ri ,J g h u 4 4 2 ,Hu e ,C i a n e U ies y i z o 3 0 5 t n b i hn )
Ab t a t P o t g t e d v l p n f a r u t r l t c n lg n c i a wa o t b t d t mp o e t e sa d r f l i g o sr c : r mo i h e e o me t o g i l a e h oo y i h n s c n r u e o i rv h t n a d o i n f n c u i v p aa t e snr y,t n r a e t e r ic me n o p s h e eo me t o g c l r n o r c u ty h o u a z t n o gi u — o i ce s h i n o s a d t u h t e d v l p n f a r u t e i u o n r .T e p p l r a i f a rc l i u i o u a t c n l g t r u h t e b u d d r t a i e e td g me a p o c n h e t r s o s y a c h o w s a a z d t r e h oo h o g h o n e a in l y r p ae a p r a h a d t e b s - e p n e d n mis t e r a n y e . l y o t y l An t ls o u g sin o h o iy w r i e . d a a t s me s g e t s f r t e p l e e gv n o c Ke r s me h n z t n;r p ae a p r a h;b s— e p n e d n mi s y wo d : c a iai o e e td g me a p o c etr so s y a c
大数据下有限理性决策理论的利弊分析
大数据下有限理性决策理论的利弊分析领导与决策论文第四篇:大数据下有限理性决策理论的利弊分析摘要:有限理性提出因为人的本身属性及所处的繁杂环境,人只能够是有限理性的。
西蒙进一步提出有限理性决策理论,由于人是有限理性的,所以在决策过程当中,不能做出“最佳”决策,只能寻求“满意”结果。
但随着时代发展与科技进步,人类社会已经进入“大数据”的时代,束缚人理性的客观条件正在逐步改变,传统完全理性的人性假设看起来并不是绝对理想化的,新的时代背景下,人们可以利用工具向无限接近完全理性发展。
同样,在决策时也可以有更高的追求。
关键词:“大数据”; 有限理性; 有限理性决策理论;Reconsideration of Bounded Rational Decision Theory under the Background of “Big Data”Liu QiaoZhou Enlai School of Government, Nankai UniversityAbstract:Bounded rationality puts forward that people can only be limited rationality because of their own attributes and complicated environment. Simon further put forward the theory of bounded rationality decision-making, because people are bounded rationality, so in the process of decision-making, can't make the "best" decision, can only seek“satisfactory” results. However, with the development of the times and the progress of science and technology, human society has entered the era of “big data”. The objective conditions that constrain human rationality are gradually changing.The traditional assumption of completely rational human nature does not seem to be absolutely idealized. Under the new era background, people can use tools to develop to infinity and close to completely rational. Similarly, there can also be higher pursuit in decision-making.1 有限理性与有限理性决策理论第二次世界大战后,决策理论逐渐形成并发展起来。
西方行政学说史第八讲有限理性和满意决策[教育]
有限理性和满意决策西蒙认为,长期以来,在关于人类行为的理性方面存在着两个极端。
一个极端是由弗洛伊德开始的,就是试图把所有人类的认知活动都归因于情感的支配。
因此,从情感的角度看,我们可以发现,穷人家孩子眼里看到的硬币,比富人家的孩子看到的更大。
对此,西蒙提出了批评。
他强调,组织成员的行为如果不是完全理智的,至少在很大程度上是符合理性的。
情感的作用并不支配人的全部,哪怕对硬币再有好感,也不会把硬币看作钻石。
因此,如果我们要从心理学的角度来解释人在组织中的行为,理性行为理论就必须在其中占有一席之地。
另一个极端是,经济学家的经济人假设,赋予了人类无所不知的理性。
在经济人的观察角度下,似乎人类能够拥有完整、一致的偏好体系,让他始终可以在各种备选方案之中进行选择;他始终十分清楚到底有哪些备选方案;为了确定最优备选方案,他可以进行无限复杂的运算,概率计算对他来说既不恐怖也不神秘。
对此,西蒙也进行了反驳。
他指出,单一个体的行为不可能达到完全理性的高度,因为他必须考虑的备选方案的数量太大,评价备选方案所需要的信息太多。
西蒙还以调侃的语气评论道:虽然完全理性的假设在目前已经达到了托马斯式的精巧状态,并且也具有巨大的智慧象征和美学魅力,但是与现实中人的真实行为或可能行为之间几乎没有多大关系。
基于此,西蒙认为,人类行为是理性的,但不是完全理性的,一句话:理性有限。
那么,这种理性的限制究竟有哪些?首先,知识的不完备性就横在了我们面前。
完全理性意味着行为主体必须完全了解并预期每项决策产生的结果,而这在实际中是不可能达到的。
西蒙指出,因为每个人对于自己行动所处的环境条件只有片面的、局部的了解,从而对其中蕴含的规律和规则也只能有一个粗浅的洞察。
做到明察秋毫、全知全能,不过是说说而已的神话。
既然人们是在这样的基础上来推导未来的结果,那么行为主体对决策结果的了解必定是不完整的。
举例来说,如果我们要吃一碗面条,如果你打算把涉及到面条的所有知识都掌握了再去吃它,对不起,那你只能等着挨饿。
第八讲 有限理性及其对博弈的影响
协调博弈的优先博弈方快速学习模型
12
8.2.1 协调博弈的有限博弈方快速学习模型
全部采用 A 或 B 的情况不需讨论,采用 A 策略博弈方 数量和位置有实质差异的只有 6 种情况
A B B B A B B A A A A A A A B A B A A B A A A B
B
初次博弈为 1A 的最优反应动态 (已包含有相邻 2A ,非相连 3A 和 4A 三种情况)
核心:博弈方策略类型比例是动态变化的,其变
化速度可用动态复制方程表示:
dx dt x ( u y u)
x 0时,无模拟榜样,博弈方不会有意识地改变策略。 x 0 时,若变化率为正,采用“同意”策略的博弈方
逐渐增多;若变化率为负,采用“不同意”策略的博弈 方逐渐增多。
x( x x 2 ) x 2 (1 x ) x 2 x 3
分析过程如下协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型13策略博弈方数量和位置有实质差异的只有种情况初次博弈为1a的最优反应动态已包含有相邻2a非相连3a4a三种情况协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型14初次博弈为相连3a的最优反应动态初次博弈为相邻2a的最优反应动态协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型15进化稳定策略在博弈方的动态调整策略中能达到又对少量偏离的扰动有稳健性满足这两种性质的稳定状态称进化稳定策略ess分析现实问题必须根据实际情况建立分析框架协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型16博弈方策略连续分布时的最优反应动态分析以古诺模型为例两个寡头的反应函数分别是个单位
农业技术推广的最优反应动态博弈分析
农业技术推广的最优反应动态博弈分析摘要:推动农业技术的发展,有助于进一步提高农民的生活水平,增加农民收入,促进我国农业的发展。从有限理性重复博弈的角度出发,通过最优反应动态,对农业经济技术的推广进行了分析,并提出了政策性建议。关键词:机械化;重复博弈;最优反应动态Game Analysis of the Best Response Dynamics in Agro-technical Popularization Abstract: Promoting the development of agricultural technology in china was contributed to improve the standard of living of peasantry, to increase their incomes and to push the development of agriculture in our country. The popularization of agricultural technology through the bounded rationality repeated game approach and the best-response dynamics theory was analyzed. And at last some suggestions for the policy were given.Key words: mechanization; repeated game approach; best-response dynamics改革开放以来,我国农业和农村经济取得了较快的发展,正是由于农业经济的发展,使我们对如何发展农业,发展怎样的农业等发面有了新的认知,同时也提出了发展现代农业的要求,本文主要从农业技术推广的辐射效应论述我国现代农业的发展。1农业发展现状1.1机械化程度低我国主要的粮食生产区分布在东北,黄淮海地区以及长江中下游地区。这些地区土地面积占全国总土地面积的22%,2003年耕地面积和总人口分别占全国的约53%、51.8%,粮食播种面积占全国的59%,粮食总产占全国的约61%。其他地区由于经济发展和地形等制约因素,粮食种植面积相对较小[1]。据统计测算,到2007年底我国耕、种、收的综合机械化水平已达到41%,农业劳动力占全社会从业人员比重已降至38%左右。当前我国农业机械化整体水平,只相当于韩国20世纪70年代水平。尽管我国机耕水平接近60%,小麦生产80%实现了机械化,水稻机械收割水平接近34%(2005年数据),但大宗农产品生产总体机械化水平较低,玉米机械收获水平仅有8%,水稻机械插秧水平只有11%,花生、马铃薯机械收获发展刚刚起步,油菜、甘蔗、园艺作物等优势农产品机械化基本空白[2]。1.2农村劳动力素质偏低在我国农村转移劳动力中大多数是受教育年限相对较长的中、青年劳动力。据统计,2000年,21~25岁的农村劳动力中有67.2%从事非农业活动,年龄段在26~30岁、31~35岁、36~40岁、41~50岁的农村劳动力从事非农业活动的比例依次为52.5%、47.6%、43.3%、37%。根据《中国农民工问题研究总报告》提供的资料显示,2004年,全国农民工中16~30岁的占61%,31~40岁的占23%,41岁以上的占16%;农民工的平均年龄为28.6岁;初中文化程度的占66%,接受过各种技能培训的占近24%[3]。可以看出,外出农民工平均年龄比较年轻,同时也是农村劳动力中受教育程度比较高的群体。虽然我国农村有大量的剩余劳动力,由于受教育程度较高的中、青年劳动力外出务工,农村只剩下老幼妇孺,必将会对农村经济的发展造成影响。由于留守农民的文化水平不高,致使他们习惯于其所掌握的落后生产方式,对外界的新事物缺乏兴趣,对信息、新技术的认识能力、消化能力都不高。这就使得许多新知识、新成果、新技术难以在农民的生产活动中得到应用和推广,导致农业科技成果转化率低。同时,农民不太了解市场经济运作的规律,不能及时捕捉经济信息从而做出合理的经济决策,造成很多农产品不能通畅销售,达不到提高农民收入的目的。农村留守农民文化素质偏低是农业科学技术推广难的主要因素。农业技术近年来在我国农业发展过程中发展较快,但相对于日益增长的工业化进程,农村技术推广仍然存在障碍。农业技术能否快速有效的扩展直接关系到我国农业的发展和农民的生活水平。2博弈分析最优反应动态(Best-response dynamics)是进化博弈理论中典型的动态机制之一.该机制适用于少数有快速学习能力的有限理性博弈方之间的重复博弈和策略进化[4]。在此机制下,认为博弈方虽然缺乏在复杂局面下准确判断和全面预见的能力,但是具有较快的学习能力。在一次博弈结束之后,博弈方会对本期结果进行分析、总结,对不同策略的结果做出比较正确的事后评估并相应调整策略[5]。2.1基本模型首先,假设我国各地村庄作为行为主体,他们具有相当快的学习和一定的分析能力,同时又是有限理性的,这样的假设与实际情况是比较吻合的。所以,采用具有快速学习能力的有限理性博弈方之间的重复博弈模型。假设图l中得的矩阵为各村庄之间的博弈。每个博弈方都有两种策略选择:采用新技术(设为A策略);不采用新技术(设为B策略)。当博弈双方都采用A策略时,双方的得益都为α;当博弈双方都采用B策略时,双方的得益都为β;当双方采用的策略互不相同时,采用A策略的一方由于采用新技术将付出一定的代价(如资源共享、要素流动等)γ,其得益为β-γ;采用B策略一方由于搭便车等行为则从对方获得了额外好处)γ,其得益为β+γ。其中,α-β>>γ。从得益矩阵可以看出,得益矩阵表示的双方博弈,又称为“协调博弈”,有两个纯策略纳什均衡(A,A)、(B,B),其中(A,A)是帕累托上策均衡。但是,如果考虑了博弈方相互对对方理性的信任问题,或者对风险的敏感性等因素,那么均衡(B,B)则更可能出现。2.2最优反应动态下面开始分析,随着时间的推移,各地村庄采用新技术与否的博弈策略给我国农业带来的不同影响。假设各村庄两两之间进行上述博弈。由于各方都是有限理性的,但又具有快速的学习能力,他们能对上一期的博弈结果进行总结,并立刻做出相应的策略调整,以使当期能够实现收益最大化。同时假设各村庄之间的交往具有重叠交互作用的特征,即同一村庄可以同时与不同的村庄进行博弈。假设我国各村庄都处于一个圆周之上,每个村庄都与各自的左右邻居进行重复博弈。我们下面将按照从特殊到一般的思路,来讨论圆周博弈中的最优反应动态。2.2.1考察5个村庄分布处于圆周上5个不同位置的情况我们假设有5个村庄分别处于圆周上的5个不同位置(图2),每个位置的博弈方可能采取A策略,也可能采取B策略。所以,初次博弈共有32种可能的情况,其中包括一种全部采用A策略,一种全部采用B策略的情况,其他都是两种策略均有人使用。我们假设xi(t)为在t时期,博弈方i的邻居中采用A策略邻居的数量,该数量有0、l 、2可能值。相应地,采用B策略邻居的数量为2-xi(t),也有0、1、2可能值。针对第t 期的xi(t),博弈方采用A策略的得益为α×xi(t)+(β-γ)×[2-xi(t)],采用B策略的得益为(β+γ)xi(t)+β×[2-xi(t)]。根据最优反应动态机制,当α×xi(t)+(β-γ)×[2-xi(t)]>(β+γ)xi(t)+β×[2-xi(t)]即xi(t)>2γ/(α-β)时,博弈方i在t+1时期会采用B策略。已知α-β>>γ,则2γ/(α-β)<1由于xi(t)只能取0、l、2整数,在实际上,如果在t时期博弈方i的两个邻居中只要有1个采用A策略,那么博弈方i在t+1时期就会采用A策略;如果两个邻居都没有采用A策略,那么博弈方i在t+1时期就会采用B策略。由此可以得出,当5个博弈方初次全部采用A策略(B策略)时,最终的稳定状态为所有博弈方都采用A策略(B策略);如果在初次博弈中有1个博弈方采用了A 策略,而其他博弈方都采用B策略的时候,那么这5个博弈方经过4个时期的反复策略调整,最终收敛到了所有博弈方都采用A策略的稳定状态。图2给出了初次博弈只有一方采用A策略的最优反应动态过程。2.2.2考察有6个村庄分布处于圆周上6个不同位置的情况如果在初始博弈中,有1个博弈方采用了A策略,而其他博弈方都采用B策略。按照同样的推理,可以得出,最优反应动态并没有使6个博弈方最终收敛于全部使用A策略的稳定状态,而是在(B,A,B,A,B,A)和(A,B,A,B,A,B)之间周期变动。也就是说明,每个博弈方都会在A策略和B策略中徘徊不定。如果在初次博弈中,有相邻的两个博弈方都使用了A策略,其他博弈方仍然使用B策略。那么,最优反应动态可以使得所有博弈方最终都收敛于全部使用A策略的稳定状态。如果在初始博弈中,有不相邻的两个博弈方采用了A策略(此两方之间存在另一个采用B策略的博弈方),而其他博弈方采用B策略,最优反应动态也不能使所有博弈方都收敛到全部使用A策略的稳定状态,而是又陷入了(B,A,B,A,B,A)和(A,B,A,B,A,B)之间的周期变动,与第一种情形(只有1个博弈方采用了A策略)的结果相同。如果在初始博弈中,有不相邻的两个博弈方采用了A策略(此两方之间存在另外两个采用B策略的博弈方),而其他博弈方采用B策略,各个博弈方通过反复调整策略,其间会出现相邻的两个博弈方同时采用A策略的情形,这种情形与上文的第二种情形本质上是相同的。所以,最优反应动态最终使所有的博弈方收敛于全部采用A策略的稳定状态。通过以上对特定奇偶数量的博弈方的分析,我们不难推广到一般的情况,即存在n个村庄处于圆周上的n个不同位置,可以得出下列命题。命题1:当所有n个博弈方在初次博弈中都采用A策略(B策略)时,最终的稳定状态则为所有的博弈方都采用A策略(B策略)。命题2:当n为奇数时.在初次博弈中,如果有一个博弈方采用了A策略,其他博弈方采用B策略,那么各个博弈方经过多个时期的反复调整政策,最终能够收敛于所有博弈方全部采用A策略的稳定状态。命题3:当n为偶数时.如果在初次博弈中,有一个博弈方采用了A策略,其他博弈方采用B策略,那么,最优反应动态无法使所有博弈方收敛于稳定状态,各博弈方对策略的调整只能陷入周期变动。命题4:当存在n个博弈方时,如果我们通过安排博弈方在初次博弈中的策略,使得在重复博弈到达某一期时,出现相邻的两个博弈方同时采用了A策略。那么,经过之后的有限多次博弈,最优反应动态将最终使得所有博弈方收敛于全部采用A 策略的稳定状态。2.3结果分析通过以上的分析可知,最优反应动态是否能够使得所有博弈方都收敛于采用A 策略的稳定状态,主要取决于各个博弈方在初次博弈中的策略分布,此外,还与博弈方在得益矩阵中得益大小有关。2.3.1关于各个博弈方在初次博弈中的策略分布根据命题4可知,如果某种策略的初始分布使得重复博弈在将来某一期中出现相邻的两个博弈方同时采用A策略,则最优反应动态最终会使所有博弈方达到全部采取A策略稳定状态。因此,要求各村庄在采用新技术的同时提升自身的素质和文化修养。2.3.2关于各个博弈方在得益矩阵中的得益大小根据博弈模型可知,当xi(t)>2γ/(α-β)时,博弈方i在t+1时期会采用B策略。由于我们假设(α-β)>>γ,故2γ/(α-β)<1,即只要在时期博弈方i的两个邻居中只要有1个采用A策略,那么他在t+1时期就会采用A策略。若要保证(α-β)>>γ,必须使得我国农村中各村庄采用新技术的得益远大于不采用新技术的得益。同时,还须使得各村庄采用新技术的成本γ尽可能小[6]。3结论通过以上的博弈分析可知,我国农民是否采用新技术取决于不同的因素,由不同的演化路径,可以产生不同的结果。首先各地政府要根据各自地域的差异,采用不同的技术及推广机制,做到因地制宜。其次,政府应加大在农村的资金投入及农业科技人才的引进。最后,各地方政府应加大对农民的农业技术培训,使其掌握先进的农业技术,增加农民的收入。
演化博弈
Taylor和Jonker提出了演化博弈理论的基本动态概念——复制动态
• 经济学家把演化博弈理论引入到经济学领域,用于分析社会制度变迁、产业演化以及股票 市场等,同时对演化博弈理论的研究也开始由对称博弈向非对称博弈深入,并取得了一定
1980s
的成果
演化博弈的产生与发展
• 演化博弈理论的发展进入了一个新的阶段。Weibull(1995)比较系统、完整地总结了演 1990s 化博弈理论,其中包含了一些最新的理论研究成果。
则竞争者群体的复制动态方程F1(x):
dx/dt dx/dt 1 x y=1/2 y>1/2 1 dx/dt
x 1 x
y<1/2
复制动态中的非对称博弈
对于博弈方2: 博弈方2 打击 博 弈 方 1 容忍
进入
不进
0, 0
1, 5
2, 2
1, 5
则在位者群体的复制动态方程F2(y):dy/dt 1 x演化博弈的基本分析过程
一般的演化博弈模型的建立主要基于两个方面:选择(Selection)和突变 (Mutation)。 选择是指能够获得较高支付的策略在以后将被更多的参与者采用;突变 是指部分个体以随机的方式选择不同于群体的策略(可能是能够获得高支付的 策略,也可能是获得较低支付的策略)。 突变其实也是一种选择,但只有好的策略才能生存下来。突变是一种不 断试错的过程,也是一种学习与模仿的过程,这个过程是适应性且是不断改进 的。
目录页
PART TWO
最优反应动态
协调博弈的有限博弈方快速学习模型
模型: 博 弈 A 方 B 1 博弈方2 A B 50,50 49,0 0,49 60,60 协调博弈
1 5 4 3 2
5个博弈方,相邻者彼此博弈,初始策略组合为32种。
演化博弈论__谢识予答案
dy/dt dy/dt
x=0
1
x
x=0
1
x
两群体复制动态的关系和稳定性
y 1
1/2
0
1
x
5.4.2 非对称鹰鸽博弈的进化分析
博弈方2
鹰
鸽
鹰博 鸽弈 方 1
非对称鹰鸽博弈博弈方1群体复制动态相位图
dx/dt dx/dt
dx/dt
1
x
y>5/6
y=5/6
x 1
y<5/6
1x
非对称鹰鸽博弈博弈方2群体复制动态相位图
第五章 有限理性和进化博弈
本章介绍有限理性基础上的进化博弈分析。 完全理性在现实中很难满足,当社会经济环境 和决策问题较复杂时,人们必须存在很大的理 性局限。有限理性对人们的决策、行为选择方 式有很大影响,有限理性基础上的博弈分析与 完全理性博弈分析也有很大区别。进化博弈分 析是有限理性博弈分析的基本框架。本章介绍 以最优反应动态和复制动态为核心,以进化稳 定策略为基本均衡概念的进化博弈分析,包括 基本方法、概念和各种经典模型等。
x——鸣叫雄蛙比例 复制动态方程
可能的不动点: x*=0 x*=1 x*=(m-z)/(1-p)
蛙鸣博弈复制动态相位图
dx/dt
dx/dt
1
x
dx/dt
(m-z)/(1-P)<0
(m-z)/(1-P)
1x
0<(m-z)/(1-P)<1
(m-z)/(1-P)>1
1x
5.4 复制动态和进化稳定性: 两人非对称博弈
A
B
A
B
BA
AB
B
B
B
B
“完全理性”、“有限理性”和“生态理性”9页word
“完全理性”、“有限理性”和“生态理性”纵观人类决策理论的发展脉络,从规范决策理论到描述决策理论和进化决策理论,人类的决策思维呈现了从“完全理性”、“有限理性”到“生态理性”思想的变迁,它浓缩了人类思维与认识发展过程,深化了人们对客观世界的认识,推动了现代决策理论的融合与发展。
一、三种决策理论模式的演进与脉络1. 规范决策模式――完全理性。
现代决策理论源于1944年诺依曼和摩根斯坦恩在其代表作《Theory of Games and Economic Behavior》中提出的基于期望效用值的对策理论,它假设决策者是理性的,依据这种理性,决策者在不确定情况下,会依据所计算出的最大主观期望效用值来选择方案,该理论模式因而被称为“完全理性模式”。
其理论出发点与微观经济学的理论分析一脉相承,并广泛应用到对人类社会和政治行为的分析。
完全理性模式是一种非常有用的探索和解决决策问题的科学方法,由于其理性行为的研究具有规范性,这种决策理论被称为规范决策理论。
规范决策理论以“理性人”假设和信息完全对称为立论基础,把现实世界中的决策问题抽象和概括为可推理、可量化的数字和模型,代表了人类对决策结果理想化、严密性和可比性的追求。
然而,规范决策理论毕竟是建立在“完全理性”和享有完全信息这一假设基础上的,以假设和公理作为理性推理的依据,存在着演绎抽象和高度形式化的特点,是一种理想化的决策模式,而非现实版本,在实际应用中,其理论缺陷也不断暴露出来。
2. 描述决策模式――有限理性。
从20世纪50年代末开始,理性主义模式遭到了不少学者的批评和怀疑,在对完全理性决策模式的质疑声中,美国学者西蒙和林德布洛姆在规范决策模式的基础上,先后提出了人的“有限理性”的观点,构建了影响深远的描述决策模式。
(1)西蒙的有限理性和满意原则。
西蒙1955年于“A behavioral model of rational choice”一文中最早提出“有限理性”的概念,他通过对传统理论中的理性观念的重新评价,指出了完全理性决策的理性前提的不真实性,他认为:人是有理性的,但理性是有限的,在现实决策中,人们呈现的是一种符合实际的理性行为,这种理性不同于经济人假设的那种完全理性的行为,人们在决策过程中往往遵循的是“满意性”原则,即决策者并不考虑所有可能的选项及计算所有可能的结果,因为现实条件和作为有限理性的人难以完成以上任务,现实的需要使人们仅考虑几个有限的选项,一旦感到满意就会停止选择,并做出最终决策。
适应性学习、宏观经济预期与我国最优货币政策选择
适应性学习、宏观经济预期与我国最优货币政策卞志村高洁超内容提要:传统货币政策框架所定义的最优货币政策是围绕中央银行二次型损失函数展开的。
近年来有研究表明,货币政策是否最优的重要标准是能否使经济趋于理性预期均衡水平。
本文从这一视角出发,进一步探讨中央银行与公众间不同策略互动如何导致实际经济偏离理性预期均衡水平。
首先,在新凯恩斯模型框架内,对理性预期假设进行适当放松,通过引入适应性学习刻画宏观经济预期形成过程。
其次,通过动态数值模拟,计算不同货币政策目标制下实际经济对均衡水平的偏离程度以及相应的均值和波动水平。
最后,分析并甄选我国最优货币政策。
本文研究发现,灵活通货膨胀目标制和混合名义收入目标制均可成为我国最优货币政策的有效实现形式,如此可促进经济平稳、协调发展。
关键词:适应性学习新凯恩斯模型最优货币政策动态模拟一、引言建立在理性预期、名义价格粘性等基础上的新凯恩斯模型从一般均衡理论出发,通过最优化方法推导出各经济主体的跨期最优条件,所得最优行为方程拥有较强微观基础且表现出前瞻性特点,逐步成为近年来货币政策分析的重要框架(Orphanides & Williams, 2004)。
在新凯恩斯模型中,总需求一般用IS曲线表示,总供给通常采用Phillips曲线表示,在描述中央银行政策行为时,依据具体研究需要,可通过设定中央银行目标函数,求出相应约束下的最优一阶条件作为央行的政策方程,也可直接给定表示央行行为的货币政策反应函数。
为较好的克服卢卡斯批判,新凯恩斯主义经济学吸收了理性预期假设,该假设认为公众对现实经济具有完全的认知能力,平均来说,公众能够准确预期到除随机冲击以外的宏观变量基本走势。
虽然理性预期假设为货币政策分析提供了一个理想框架,但其一系列严格假设条件难以在现实中得到有效贯彻,因而脱离了分析现实经济的需要。
更关键的是,理性预期学说并没有对公众的预期形成机制进行具体描述,而只注重对预期结果的一系列规定。
博弈论与信息经济学-教学大纲
《博弈论与信息经济学》教学大纲课程编号:030412B课程类型:□通识教育必修课□通识教育选修课□专业必修课√专业选修课□学科基础课总学时:32讲课学时:32学分:2适用对象:经济学、经济学实验班先修课程:微观经济学、高等数学一、课程的教学目标《博弈论与信息经济学》是研究策略相互影响的局势中,参与人如何选择自己的策略才能使自身的收益最大化的一门课程。
无论是人类社会的发展变化、社会经济制度的变革,还是人们的日常生活,我们都会经常碰到利益相互影响的博弈问题,也会经常使用博弈去选择策略,不管是自觉的还是无意识的。
近年来,博弈论的思想和建模方法已渗透到了几乎所有的经济分析领域,拓宽了经济学的研究领域,加深了经济学的分析,有以博弈论为基础重构经济学大厦的趋势。
萨缪尔森曾说过,“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解”,可见博弈论的重要性。
而作为经济类本科生,尤其需要掌握博弈论的思想和方法。
通过本课程的学习,目标1:要使学生掌握基本的博弈分析方法,目标2:能建立和分析简单的博弈模型,目标3:并能应用博弈思想分析实际经济问题。
二、教学基本要求本课程由两部分组成:第一部分是博弈论,包括完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈等内容;第二部分是信息经济学,信息经济学本质上是非对称信息博弈论在经济学上的应用,包括委托-代理理论、逆向选择模型、信号传递模型等内容。
对完全信息静态博弈和完全信息动态博弈这两类基本博弈模型要讲透,不完全信息静态博弈和不完全信息动态博弈可做简单讲解,信息经济学可以穿插在博弈论的讲解中。
通过各类博弈模型的对比讲解,可以更好的突出重点,掌握难点,并结合实例,加强重点知识的学习和巩固。
为实现教学目标,除了课堂讲授的方式外,也可以采用课堂讨论、案例分析等教学方式,还可以给学生留一些课后思考题,督促学生课后自学。
教学过程中应注意联系实际,尽量多的介绍现实中的例子,并使学生学习将博弈思想应用于现实的方法。
第五经济博弈论 PPT
进化稳定策略得检验
比例的博弈方偏离“同意”策略选择了“不同意” uy (1 )1 0 1 un (1 ) 0 0 0 u (1 )u y un (1 )2
因为 uy 1 0 且接近于1,因此犯错误博弈方得期
望得益远远低于没有犯错误得博弈方,也远低于群体平均得益, 因此犯错误得博弈方会逐步改正错误,最终仍然会趋向于x=1, 即所有博弈方都采用“同意”策略。
签协议博弈:
同意 不同意
博弈方2
同意
不同意
1,1
0,0
0,0
0,0
两个纯策略纳什均衡:(同意,同意),(不同意,不同意), 前一个纳什均衡帕累托优于后一个纳什均衡。假如就是在完全理 性得基础上进行该博弈,可以预期结果就是(同意,同意)。
下面就是在理性层次较低得有限理性博弈方组成得大群体成员 随机配对反复博弈得分析框架内进行分析。
因此x 1是在上述复制状态下的一个进化稳定策略ESS
进化稳定策略得检验
比例的博弈方偏离“不同意”策略选择了“同意”
uy (1 ) 0 1 un (1 ) 0 0 0 u (1 ) un uy 2
uy 0 un
x 0不是进化稳定策略
5、3、2一般两人对称博弈复制动态 与进化稳定策略
5、3、1 签协议博弈得复制动态与进化稳定策略
签协议博弈:
同意 不同意
博弈方2
同意
不同意
1,1
0,0
0,0
0,0
假设群体中采用“同意”博弈方得比例x,则不同策 略期望得益与平均得益为:
uy x 1 (1 x) 0 x un x 0 (1 x) 0 0 u x u y(1 x) un x2
只要博弈方有基本得、包括直觉与经验得判断能力, 早晚会发现上述得益差异,得益较差类型得博弈方或早或 迟会发现改变策略对自己就是有利得,并开始模仿另一种 类型得博弃方。
博弈论与信息经济学-教学大纲全文
可编辑修改精选全文完整版《博弈论与信息经济学》教学大纲课程编号:030412B课程类型:□通识教育必修课□通识教育选修课□专业必修课√专业选修课□学科基础课总学时:32讲课学时:32学分:2适用对象:经济学、经济学实验班先修课程:微观经济学、高等数学一、课程的教学目标《博弈论与信息经济学》是研究策略相互影响的局势中,参与人如何选择自己的策略才能使自身的收益最大化的一门课程。
无论是人类社会的发展变化、社会经济制度的变革,还是人们的日常生活,我们都会经常碰到利益相互影响的博弈问题,也会经常使用博弈去选择策略,不管是自觉的还是无意识的。
近年来,博弈论的思想和建模方法已渗透到了几乎所有的经济分析领域,拓宽了经济学的研究领域,加深了经济学的分析,有以博弈论为基础重构经济学大厦的趋势。
萨缪尔森曾说过,“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解”,可见博弈论的重要性。
而作为经济类本科生,尤其需要掌握博弈论的思想和方法。
通过本课程的学习,目标1:要使学生掌握基本的博弈分析方法,目标2:能建立和分析简单的博弈模型,目标3:并能应用博弈思想分析实际经济问题。
二、教学基本要求本课程由两部分组成:第一部分是博弈论,包括完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈等内容;第二部分是信息经济学,信息经济学本质上是非对称信息博弈论在经济学上的应用,包括委托-代理理论、逆向选择模型、信号传递模型等内容。
对完全信息静态博弈和完全信息动态博弈这两类基本博弈模型要讲透,不完全信息静态博弈和不完全信息动态博弈可做简单讲解,信息经济学可以穿插在博弈论的讲解中。
通过各类博弈模型的对比讲解,可以更好的突出重点,掌握难点,并结合实例,加强重点知识的学习和巩固。
为实现教学目标,除了课堂讲授的方式外,也可以采用课堂讨论、案例分析等教学方式,还可以给学生留一些课后思考题,督促学生课后自学。
教学过程中应注意联系实际,尽量多的介绍现实中的例子,并使学生学习将博弈思想应用于现实的方法。
dsge模型方法 -回复
dsge模型方法-回复DSGE模型(动态随机一般均衡模型)是宏观经济学中经济理论研究的一种方法。
其基本理念是将经济体当做一个理性的最优化问题,并结合时间禀赋、市场机制、均衡条件等因素建立一个动态的一般均衡模型,以分析经济体在不同政策和外部冲击下的行为和均衡结果。
本文将以DSGE模型为主题,分别从模型的基本原理、构建方法、求解技术和模型评估等方面进行详细的解析。
DSGE模型的基本原理:DSGE模型的基本原理源自经济学中的最优化问题。
它假设经济主体是理性的,能够根据自身的效用函数和约束条件进行行为选择,以最大化自身的效用。
同时,这个经济体也是一个有限理性的经济体,其对信息有限性进行了考虑。
基于这些基本假设,DSGE模型通过引入时间禀赋、市场机制和均衡条件等要素,将经济体的行为和均衡结果进行动态系统建模,以更全面地分析经济体的行为动态和政策效果。
DSGE模型的构建方法:构建DSGE模型的第一步是选择经济体的动态优化问题的目标函数和约束条件。
通常情况下,目标函数包括代表经济主体效用的效用函数,约束条件包括预算约束、市场出清约束等。
然后,通过引入一组结构性假设来描述经济系统的运行机制和行为规律。
例如,需求和供给曲线的形式、价格和工资的决定方式等。
最后,根据这些假设,模型可以推导出一组动态方程来描述经济体的均衡行为。
DSGE模型的求解技术:求解DSGE模型是一个复杂的过程,需要运用数值方法来近似解析解。
一种常用的方法是利用泰勒展开将动态方程近似成一组线性差分方程。
然后,可以使用数值方法如迭代法或者矩阵分解法来求解这组差分方程,以获得模型的均衡解。
此外,还可以借助经验贝叶斯方法进行参数估计,以获得模型的经验似然函数,并通过模型选择准则来验证模型拟合效果。
DSGE模型的评估方法:对于构建好的DSGE模型,需要通过一系列的评估方法来验证其拟合效果和经济解释力。
首先,可以使用模型应对历史经济数据的方式来进行模型检验。
经典动态博弈模型
由于囚徒无法信任对方,最终都选择坦白,导致集体利益受损。
斗鸡博弈
描述
两只斗鸡在狭路相逢,每只斗鸡都有前 进和后退两种选择。如果一只斗鸡前进 ,另一只后退,则前进的斗鸡获胜;如 果两只都前进,则两败俱伤;如果两只 都后退,则均无损失。
VS
博弈策略
由于存在两败俱伤的风险,双方更倾向于 选择后退以避免损失。
予相应的奖励。
结论
智猪博弈表明,合理的激励 机制和任务分配可以激发员 工的积极性和创造力。
案例四:猎鹿博弈在国际政治中的影响
猎鹿博弈概述
猎鹿博弈描述了两个猎人合作与不合作对收益的影响,强 调了合作的重要性。
国际政治中的影响
在国际关系中,国家间的合作与竞争往往受到猎鹿博弈的影响。 合作可以带来共同利益,但也需要克服信任和利益冲突的问题。
02
03
公共品供给
在公共品供给中,政府可运用动态博 弈模型分析不同主体之间的互动关系, 提高公共品供给效率。
国际关系
贸易摩擦
在国际贸易中,国家之间可以通过动态博弈模型分析贸易摩擦的起 因和解决方案,促进国际贸易的稳定发展。
地缘政治
在国际政治中,国家可以利用动态博弈模型分析地缘政治格局的变 化趋势,制定合适的国际战略。
结论
斗鸡博弈表明,在竞争激烈的 市场环境中,适当的妥协和沟
通对于避免损失至关重要。
案例三:智猪博弈在企业管理中的运用
智猪博弈概述
智猪博弈描述了大猪和小猪 在同一个猪圈里抢食物的情 况,强调了策略选择的重要
性。
企业管理中的运用
在企业中,智猪博弈可以应 用于激励机制设计、项目管 理等方面。例如,让有能力 的人承担更多责任,同时给
经典动态博弈模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
倒地老人为何不敢扶
—基于有限理性的最优动态反应博弈南京青年彭宇到底有没有撞倒徐老太太,现在成了一笔糊涂账。
彭宇一口咬定自己当初是好心帮助那位徐老太太,将她扶起往医院,反被诬告。
法官的判决未能认定这究竟是否属实,而是以“如果彭宇是见义勇为做好事,应更该抓住撞倒原告的人,而不是去扶”、“如果不是彭宇撞的老太太,他完全不用送她去医院”、“如果不是他撞的,应该不会垫钱”等为理由,责令彭宇对老太进行赔偿。
“彭宇案”对于中国社会的影响令人难以置信,倒地老人该不该扶在网上引发空前争议。
在之后的五年中,扬州小伙怕惹事扶起倒地老太又松手,武汉老人倒于菜市场无人敢扶,佛山幼童小悦悦被车碾压在地,18路人视而不见。
每当这些惨剧发生后,人们就会再次提起并归咎于彭宇一案造成的负面影响。
网友惊叹,一个老太竟剥夺了无数老人的权利。
那么,是什么力量使一件根本称不上大案的民事案件影响如此深远呢?
先从一些假设开始:假定一个由五个有限理性的人组成的小社会,他们具有相当快的学习能力,虽然在复杂局面下缺乏判断能力和预见性,但是每个人都能在本期找到和采用针对前期其他人策略的最佳反应策略。
这种“最优反应动态”的设定是较为符合现实的,因为完全理性对于博弈方的要求太过严苛,而现实中人们往往囿于适应能力、遇见能力、冲动心理、偶然因素而存在理性局限。
假设博弈方的博弈内容是下图中得益矩阵表示的两人对称静态博弈: A B
B
我们这里把A策略视为冷眼相对,相互敌视之意,而B策略则为相互信任和帮助。
通过纳什均衡分析不难发现,该博弈有两个纯策略纳什均衡(A,A)和(B,B),在这两个均衡结果中,后者明显帕累托优于前者。
但是,回到现实中来,如果你面前有一位倒地的老人,你上前搀扶,老人又知恩图报,这样对应上述的(B,B)结果,自然是皆大欢喜(这看起来似乎是一个动态博弈,但如果把这个问题一般化为人与人之间的诚信问题,用这样一个静态化的模型也不难解释)。
但是如果你怀疑老人有可能在你扶起她之后反诬你是肇事者,或者你生怕被反诬的风险(尤其你听说过彭宇案,认为扶起老人是一件高风险零收益的冒险),那么你更有可能出于明哲保身的态度而选择冷眼旁观。
也就是说,由于自身的理性局限,对对方理性的不信任以及对风险的敏感度,风险上策均衡(A,A)显然是更符合实际的结果。
现在,我们将这个博弈扩展到这个五人小社会中,按照上述的假设,博弈方缺乏交互动态关系和预见能力,但能够马上对上一期的博弈结果进行总结,并作出相应的策略调整。
这与现实中人们“一朝被Array蛇咬,十年怕井绳”的心理十分相似。
另外,假设5个博弈方分别处于右图中
圆周上的五个位置上,每个行为人都与各自的左右邻居相互博弈。
现实中我们每个人也正是通过自身的一言一行影响周围的人,进而不断把这种影响辐射到社会上去的,因此也可以看做一个较为符合逻辑的假定。
可以肯定的是,既然博弈方都是有限理性的,那么初次进行博弈时每个位置既可能选择A,也可能选择B。
现在以仅有一个博弈方选择A为例,观察整个社会的策略调整和最终稳定状态。
假设x为在初期某博弈方的邻居中采用A策略的人的个数,显然x有0、1、2个可能值。
那么,在本期中,该博弈方
采用A策略的收益为:x·1+(2-x)·2=4-x;
采用B策略的收益为:x·(-1)+(2-x)·3=6-4x
故当4-x>6-4x,即x>2/3时,该博弈方将会在下一期中选择A 策略。
也就是说,在本期中,只要左右邻居中有一个人选择A,那么下一期此人便会选择A,只有左右邻居在本期全部选择B,那么下一期选择B策略才是最佳选择。
根据这个法则,我们可以推演出整个群体反复策略调整的具体过程:
从上述分析可以看出,除了初始选择是所有人都采取B外,其他所有初始情况都将稳定收敛于全选A的状态,而且这个均衡具有稳健性,即便出现少数博弈方偏离A,最优反应动态也将推动他很快回到均衡上来。
这是一个十分令人沮丧的结果,它意味着我们的社会只要存在哪怕一小部分人道德观念缺失,缺乏信任感和乐于助人的品质,那么这种风气将会如瘟疫般很快弥漫全社会,最终整个社会道德的沦丧。
而且在现实生活中迅速的信息传播速度,违反诚信的高收益和低成本,不合理的制度使得这一趋势不断加快。
以至于出现一桩桩冲破道德底线的悲剧。
当然,这个模型的偏差之处在于,片面的认为所有人都是有限理性的,但在现实中,我们仍然可以看到很多人愿意去相信和帮助别人,他们不管对方如何,自己把信守规则当成自己的道德义务,希望通过自己的努力去影响别人,试图挣脱这个怪圈。
但是根据上面的分析,我们可以看出个人的努力是难以撼动这个模型所固有的稳健型的。
而真正具有可操作且行之有效的方法在于制度。
一、奖励制度,对于助人为乐的现象予以物质和名誉奖励;
二、惩罚措施,包括助人和被助者两方面,可以借鉴国外经验:
例如法国1994年修订的《法国刑法典》就有“怠于给予救助罪”,而新加坡则规定被救者如果事后反诬救助者,则须亲自上门向救助者赔礼道歉,并施以其本人医药费1至3倍的处罚。
正因为有“道歉+赔偿”,新加坡再没有发生过类似的事情,公民在实施见
仍然假设x为某博弈方的邻居中采用A策略的人的个数。
那么此时,在本期中,该博弈方采用A策略的收益为:x·(1-a)+(2-x)·(2-a)=4-2a-x;
采用B策略的收益为:x·(-1)+(2-x)·3=6-4x
故当4-2a-x>6-4x,即x>(2a+2)/3时,该博弈方将会在下一期中选择A策略。
因此,只需令(2a+2)/3>1,即a>0.5,此时的结果令人振奋:在本期中,除非左右邻居全部选择A,下一期此人才会选择A,只有有一个人选择B,那么下一期选择B策略才是更有利的选择。
这样不仅克制住了各个博弈方选择A策略的不理智冲动,而且掐断了原先的最优反应动态中A策略向四周蔓延的路径。
最终的博弈结果将极具稳健性地收敛于博弈方全选择B。
因此,我认为倒地老人不敢扶的惨剧并不仅仅是道德问题,而更
应该是一个制度问题,尤其法律作为社会伦理的最终阵地,一旦失守,将造成整个社会伦理系统的瘫痪。
彭宇案的出现虽属偶然,但是南京法院不合法理的判决却起了推波助澜的作用,做好事的成本如此之高,谁还敢做?因此好的制度要善善恶恶,善善而彰之,恶恶而去之,这样才能引导人们重建道德,社会内部才可能建立最基本的信任,人们才能够节约计算的负担,更加乐意与他人合作。