博弈论与信息经济学-5.演化博弈

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

纳什均衡与演化稳定策略
A A B 1,1 0,0 B 0,0 0,0
博弈的纳什均衡(A,A)和(B,B)。 B是否是一个演化稳定策略? 结论: 1. 纳什均衡并不意味着演化稳定策略; 2. 严格纳什均衡意味着演化稳定策略。
纯策略下演化稳定策略的定义1 (Maynard Smith, 1972)
在二人对称博弈中,纯策略S*是演化稳定策略,如果 存在0 1,对于 , 下式对于所有的纯策略S ' 成立:
路径依赖的例子
有人将5只猴子放在一只笼子里,并在笼子中间吊上一串香蕉,只要 有猴子伸手去拿香蕉,就用高压水教训所有的猴子,直到没有一只猴 子再敢动手。 然后用一只新猴子替换出笼子里的一只猴子,新来的猴子不知这 里的“规矩”,竟又伸出上肢去拿香蕉,结果触怒了原来笼子里的4 只猴子,于是它们代替人执行惩罚任务,把新来的猴子暴打一顿,直 到它服从这里的“规矩”为止。 试验人员如此不断地将最初经历过高压水惩戒的猴子换出来,最 后笼子里的猴子全是新的,但没有一只猴子再敢去碰香蕉。 起初,猴子怕受到“株连”,不允许其他猴子去碰香蕉,这是合 理的。 但后来人和高压水都不再介入,而新来的猴子却固守着“不许拿 香蕉”的制度不变,这就是路径依赖的自我强化效应。
结论:
严格劣策略不可能是演化稳定策略。
例2:
A B
A 2,2 0,0
B 0,0 0,0
C 0,0 1,1
C
0,0
1,1
0,0
问题1:C是否是一个演化稳定策略? 结论:一个策略可以入侵别的策略,并不意味着 它就是演化稳定策略。 问题2:C是否是一个纳什均衡? 结论:如果一个策略组合(S,S)不构成纳什 均衡,则S不是演化稳定策略。
演化稳定策略是 什么呢?
C C D 2,2 3,0
D 0,3 1,1
假定一个群体由背叛者构成,由于基因变异出现 了比例为ε的合作者。 此时背叛者的收益为:(1-ε)*1+ε*3=1+2ε 合作者的收益为:(1-ε)*0+ε*2=2ε 由于合作者的收益低于背叛者的收益,合作者会 逐渐消亡,因此背叛是一个演化稳定策略。
演化博弈的关注内容
演化博弈强调经济变迁过程中以个体多样 性变异机制和偏好选择机制为代表的种群 研究。 它探讨种群选择的策略是否获得最佳的收 益,并消除任何小的突变群体的扰动。
演化博弈的假设条件
首先我们假定群体中的参与人都是完全相 同的,因此以下我们只考虑对称博弈。 其次,我们假定每个参与人只能机械地选 择某种策略(而无法改变自己的策略)。 如果某种策略获得了成功,采用这种策略 的参与人将越来越多,反之如果某种策略 不成功,采用这种策略的参与人就越来越 少。
1 U S *, S * U S *, S ' 1 U S ', S * U S ', S '
纯策略下演化稳定策略的定义2
在二人对称博弈中,纯策略S*是演化稳定策略,如果 以下两式成立:
1U S *, S * U S ', S * 2 若U S*, S * =U S ', S *,则U S *, S ' U S ', S '
分析:
C C D 2,2 3,0
D 0,3 1,1
假定一个群体由合作者构成,由于基因变异出现 了比例为ε的背叛者。 此时合作者的收益为:(1-ε)*2+ε*0=2-2ε 背叛者的收益为:(1-ε)*3+ε*1=3-2ε 由于背叛者的收益高于合作者的收益,背叛者不 仅不会消亡,反而会越来越多。因此,合作不是 一个演化稳定策略。
石头剪刀布
R R S P 1,1 0,V V,0 S V,0 1,1 0,V P 0,V V,0 1,1
1<V<2
易证,博弈中唯一的混合策略纳什均衡是p=(1/3,1/3,1/3) 验证其是否为ESS,设p‘=(p,q,1-p-q) U(p,p')=(1+V)/3 U(p',p')=1 U(p,p')<U(p',p') 因此博弈中不存在ESS
自然界中的博弈
白色念珠菌(Monilia albican 或 canidia Albicans), 是一种真菌,通常存在于正常人口腔和消化道粘膜中, 一般在正常机体中数量少,不引起疾病。当机体免疫 功能或一般防御力下降,则本菌大量繁殖并改变生长 形式(芽生菌丝相)侵入细胞引起疾病。
演化博弈论(evolutionary stable strategy) 整合了理性经济学与演化生物学的思想, 不再将参与人模型化为超级理性的博弈方, 认为参与人通常是通过试错的方法达到博 弈均衡的,与生物演化具有共性。
在演化博弈中,认为参与人的选择行为可以依据 前人的经验、学习与模仿他人行为、受遗传因素 的决定等。因而演化博弈把具有主观选择行为的 参与人扩展为包括动物、植物在内的有机体,动 植物参与者的支付可被理解为为某种适应程度。 把博弈论的分析与应用从研究人类的竞争行为扩 展为研究有机体的策略互动关系。这个领域的开 创性工作是由英国生物学家约翰· 梅纳德· 史密斯 (John Maynard Smith)和G.R.普莱斯 (G.R.Price)1973年进行的。演化博弈现在正 逐渐被广泛应用于社会经济学领域。
找出以下博弈的混合策略ESS
A
A B 0,0 1,2
B
2,1 0,0
(1)找出博弈的混合策略纳什均衡。 由于博弈的对称性,双方的混合策略纳什均衡必然是相同 的,设为(p,1-p) 给定局中人1的策略(p,1-p) 局中人2选择A的收益:p*0+(1-p)*2=2-2p 局中人2选择B的收益:p*1+(1-p)*0=p 根据2-p=p,解出p=2/3 (2)(2/3,1/3)是否是一个严格纳什均衡? (3)(2/3,1/3)是否是ESS?
经济学与生物学
二者研究的都是个体在给定环境下的最优策略。 它们包含的内在逻辑相当一致:所有生命体的 行为看上去总好像设法使其基因的遗传频率最 大化,正如企业最大化其利润一样。
经济学 企业 最优化 策略 利润 扩张 生物学 物种(或个体) 适应 基因 适应性(fitness) 繁殖
倒闭
创新
灭绝
变异
猎鹿博弈
猎鹿博弈源自启蒙思想家卢梭的著作《论人类不平等的起源和基础》 中的一个故事。 古代的村庄有两个猎人。当地的猎物主要有两种:鹿和兔子。如果 一个猎人单兵作战,一天最多只能打到4只兔子。只有两个一起去才 能猎获一只鹿。从填饱肚子的角度来说,4只兔子能保证一个人4天 不挨饿,而一只鹿却能让两个人吃上10天。
蜥蜴的生存策略
动态演化
复制者(replicator)
象海豹的生存策略
鹰鸽博弈
H H D (v-c)/2,(v-c)/2 0,v D v,0 v/2,v/2
博弈的演化稳定策略是什么? 当v>c时,(H,H)是严格纳什均衡,因此H是演化稳定策 略。 当v=c时,(H,H)是弱纳什均衡,因为U(H,D)>U(D,D), 因此H是演化稳定策略 当v<c时,不存在纯策略演化稳定策略。 此时是否存在混合策略ESS? 首先找出混合策略纳什均衡(v/c,1-v/c), 其次验证其是否为ESS。
成功是一种习惯
人们关于习惯的一切理论都可以用“路径 依赖”来解释。它告诉我们,要想路径依 赖的负面效应不发生,那么在最开始的时 候就要找准一个正确的方向。每个人都有 自己的基本思维模式,这种模式很大程度 上会决定你以后的人生道路。而这种模式 的基础,其实是早在童年时期就奠定了的。 做好了你的第一次选择,你就设定了自己 的人生。
路径依赖与制度变革
对组织而言,一种制度形成后,会形成某 个既得利益集团,他们对现在的制度有强 烈的要求,只有巩固和强化现有制度才能 保障他们继续获得利益,哪怕新制度对全 局更有效率。对个人而言,一旦人们做出 选择以后会不断地投入精力、金钱及各种 物资,如果哪天发现自己选择的道路不合 适也不会轻易改变,因为这样会使得自己 在前期的巨大投入变得一文不值,这在经 济学上叫“沉没成本”。沉没成本是路径 依赖的主要原因。
路径依赖的例子
一个广为流传、引人入胜的例证是:现代铁路两条铁轨之间的标准距 离是四英尺又八点五英寸。原来,早期的铁路是由建电车的人所设计 的,而四英尺又八点五英寸正是电车所用的轮距标准。那么,电车的 标准又是从哪里来的呢?最先造电车的人以前是造马车的,所以电车 的标准是沿用马车的轮距标准。马车又为什么要用这个轮距标准呢? 英国马路辙迹的宽度是四英尺又八点五英寸,所以,如果马车用其他 轮距,它的轮子很快会在英国的老路上撞坏。这些辙迹又是从何而来 的呢?从古罗马人那里来的。因为整个欧洲,包括英国的长途老路都 是由罗马人为它的军队所铺设的,而四英尺又八点五英寸正是罗马战 车的宽度。 任何其他轮宽的战车在这些路上行驶的话,轮子的寿命都不会很 长。可以再问,罗马人为什么以四英尺又八点五英寸为战车的轮距宽 度呢?原因很简单,这是牵引一辆战车的两匹马屁股的宽度。故事到 此还没有结束。美国航天飞机燃料箱的两旁有两个火箭推进器,因为 这 路径依赖些推进器造好之后要用火车运送,路上又要通过一些隧 道,而这些隧道的宽度只比火车轨道宽一点,因此火箭助推器的宽度 是由铁轨的宽度所决定的。 所以,最后的结论是:路径依赖导致了美国航天飞机火箭助推器 的宽度,竟然是两千年前便由两匹马屁股的宽度所决定的。
演化稳定策略(ESS)
演化稳定策略,是指如果占群体绝大多数 的个体选择演化稳定策略,那么小的突变 者群体就不可能侵入到这个群体。 或者说,在自然选择压力下,突变者要么 改变策略而选择演化稳定策略,要么退出 系统而在进化过程中消失。
例1:囚徒困境博弈
C C
D
D 0,3
1,1
2,2
3,0
C代表合作,D代表背叛。 合作是否是一种演化稳定策略?

在经典博弈论中,假设参与人具有使自己支付最大化的主 观意识与对于对手策略的最优反应能力,在实际中,这种 假设可能是不现实的。譬如在“象棋”中,棋手不可能在 每一步都能够采取最优的反应行动。
自然界中的博弈
吸血蝙蝠夜间去大型哺乳动物那里吸血,有些个 体偶尔会空腹而归,此时吸饱血的个体就会吐出 胃内的血液喂给饥饿的个体,尽管它们之间并没 有直接血缘关系。吸血蝙蝠更有可能回吐血液给 以前曾经回吐过血液的蝙蝠,而骗子(拒绝分享 的蝙蝠)将被蝙蝠群体记住,并且被排除在这种 协作之外。
第5章 演化博弈
经济学与生物学
经济学和生物学的历史从来就交织在一起。 众所周知,Charles Darwin的一个核心洞 见就来源于Thomas Malthus(1803)。对 于Darwin来说,Malthus的人口的增长率倾 向于超过产量增长率的论证暗示着不可避 免的生存之战,因此暗示着适者生存的自 然选择。
例3:找出ESS
A A B 1,1 1,1 B 1,1 0,0
U(A,A)=U(B,A) U(A,B)>U(B,B) 因此A是演化稳定策略
例4:
A B
A
10,10 0,0
B
0,0 1,1
演化稳定策略:A和C C是一种效率很低的状态,但社会一旦陷入 了这种状态,就很难走出去。 这就是所谓的“路径依赖”
改变收益矩阵的猎鹿博弈
3 3 4
0
4 0 4
4wk.baidu.com
另一个例子 问题1:此博弈对应现实生活中的什么情况 问题2:此博弈是否存在演化稳定策略
A A B 0,0 1,2
B 2,1 0,0
混合策略下演化稳定策略的定义
在二人对称博弈中,混合策略P*是演化稳定策略,如果 以下两式成立:
1U P*, P * U P ', P * 2 若U P*, P * =U P ', P *,则U P*, P ' U P ', P '
路径依赖
路径依赖(Path-Dependence),指人类社 会中的技术演进或制度变迁均有类似于物 理学中的惯性,即一旦进入某一路径(无 论是“好”还是“坏”)就可能对这种路 径产生依赖。一旦人们做了某种选择,就 好比走上了一条不归之路,惯性的力量会 使这一选择不断自我强化,并让你轻易走 不出去。
相关文档
最新文档