博弈论与信息经济学-5.演化博弈

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

纳什均衡与演化稳定策略
A A B 1,1 0,0 B 0,0 0,0
博弈的纳什均衡（A,A）和（B,B）。 B是否是一个演化稳定策略？结论： 1. 纳什均衡并不意味着演化稳定策略； 2. 严格纳什均衡意味着演化稳定策略。
纯策略下演化稳定策略的定义1 （Maynard Smith, 1972）
在二人对称博弈中，纯策略S*是演化稳定策略，如果存在0 1，对于 , 下式对于所有的纯策略S ' 成立：
路径依赖的例子
有人将5只猴子放在一只笼子里，并在笼子中间吊上一串香蕉，只要有猴子伸手去拿香蕉，就用高压水教训所有的猴子，直到没有一只猴子再敢动手。然后用一只新猴子替换出笼子里的一只猴子，新来的猴子不知这里的“规矩”，竟又伸出上肢去拿香蕉，结果触怒了原来笼子里的4 只猴子，于是它们代替人执行惩罚任务，把新来的猴子暴打一顿，直到它服从这里的“规矩”为止。试验人员如此不断地将最初经历过高压水惩戒的猴子换出来，最后笼子里的猴子全是新的，但没有一只猴子再敢去碰香蕉。起初，猴子怕受到“株连”，不允许其他猴子去碰香蕉，这是合理的。但后来人和高压水都不再介入，而新来的猴子却固守着“不许拿香蕉”的制度不变，这就是路径依赖的自我强化效应。
结论：
严格劣策略不可能是演化稳定策略。
例2：
A B
A 2,2 0,0
B 0,0 0,0
C 0,0 1,1
C
0,0
1,1
0,0
问题1：C是否是一个演化稳定策略？结论：一个策略可以入侵别的策略，并不意味着它就是演化稳定策略。问题2：C是否是一个纳什均衡？结论：如果一个策略组合（S，S）不构成纳什均衡，则S不是演化稳定策略。
演化稳定策略是什么呢？
C C D 2,2 3,0
D 0,3 1,1
假定一个群体由背叛者构成，由于基因变异出现了比例为ε的合作者。此时背叛者的收益为：(1-ε)*1+ε*3=1+2ε 合作者的收益为：(1-ε)*0+ε*2=2ε 由于合作者的收益低于背叛者的收益，合作者会逐渐消亡，因此背叛是一个演化稳定策略。
演化博弈的关注内容
演化博弈强调经济变迁过程中以个体多样性变异机制和偏好选择机制为代表的种群研究。它探讨种群选择的策略是否获得最佳的收益，并消除任何小的突变群体的扰动。
演化博弈的假设条件
首先我们假定群体中的参与人都是完全相同的，因此以下我们只考虑对称博弈。其次，我们假定每个参与人只能机械地选择某种策略（而无法改变自己的策略）。如果某种策略获得了成功，采用这种策略的参与人将越来越多，反之如果某种策略不成功，采用这种策略的参与人就越来越少。
1 U S *, S * U S *, S ' 1 U S ', S * U S ', S '
纯策略下演化稳定策略的定义2
在二人对称博弈中，纯策略S*是演化稳定策略，如果以下两式成立：
1U S *, S * U S ', S * 2 若U S*, S * =U S ', S *，则U S *, S ' U S ', S '
分析：
C C D 2,2 3,0
D 0,3 1,1
假定一个群体由合作者构成，由于基因变异出现了比例为ε的背叛者。此时合作者的收益为：(1-ε)*2+ε*0=2-2ε 背叛者的收益为：(1-ε)*3+ε*1=3-2ε 由于背叛者的收益高于合作者的收益，背叛者不仅不会消亡，反而会越来越多。因此，合作不是一个演化稳定策略。
石头剪刀布
R R S P 1,1 0,V V,0 S V,0 1,1 0,V P 0,V V,0 1,1
1<V<2
易证，博弈中唯一的混合策略纳什均衡是p=（1/3,1/3,1/3）验证其是否为ESS，设p‘=（p,q,1-p-q） U(p,p')=(1+V)/3 U(p',p')=1 U(p,p')<U(p',p') 因此博弈中不存在ESS
自然界中的博弈
白色念珠菌（Monilia albican 或 canidia Albicans），是一种真菌，通常存在于正常人口腔和消化道粘膜中，一般在正常机体中数量少，不引起疾病。当机体免疫功能或一般防御力下降，则本菌大量繁殖并改变生长形式（芽生菌丝相）侵入细胞引起疾病。
演化博弈论（evolutionary stable strategy）整合了理性经济学与演化生物学的思想，不再将参与人模型化为超级理性的博弈方，认为参与人通常是通过试错的方法达到博弈均衡的，与生物演化具有共性。
在演化博弈中，认为参与人的选择行为可以依据前人的经验、学习与模仿他人行为、受遗传因素的决定等。因而演化博弈把具有主观选择行为的参与人扩展为包括动物、植物在内的有机体，动植物参与者的支付可被理解为为某种适应程度。把博弈论的分析与应用从研究人类的竞争行为扩展为研究有机体的策略互动关系。这个领域的开创性工作是由英国生物学家约翰· 梅纳德· 史密斯（John Maynard Smith）和G.R.普莱斯（G.R.Price）1973年进行的。演化博弈现在正逐渐被广泛应用于社会经济学领域。
找出以下博弈的混合策略ESS
A
A B 0,0 1,2
B
2,1 0,0
（1）找出博弈的混合策略纳什均衡。由于博弈的对称性，双方的混合策略纳什均衡必然是相同的，设为（p，1-p）给定局中人1的策略（p，1-p）局中人2选择A的收益：p*0+(1-p)*2=2-2p 局中人2选择B的收益：p*1+(1-p)*0=p 根据2-p=p，解出p=2/3 （2）（2/3,1/3）是否是一个严格纳什均衡？（3）（2/3,1/3）是否是ESS？
经济学与生物学
二者研究的都是个体在给定环境下的最优策略。它们包含的内在逻辑相当一致：所有生命体的行为看上去总好像设法使其基因的遗传频率最大化，正如企业最大化其利润一样。
经济学企业最优化策略利润扩张生物学物种（或个体）适应基因适应性（fitness）繁殖
倒闭
创新
灭绝
变异
猎鹿博弈
猎鹿博弈源自启蒙思想家卢梭的著作《论人类不平等的起源和基础》中的一个故事。古代的村庄有两个猎人。当地的猎物主要有两种：鹿和兔子。如果一个猎人单兵作战，一天最多只能打到4只兔子。只有两个一起去才能猎获一只鹿。从填饱肚子的角度来说，4只兔子能保证一个人4天不挨饿，而一只鹿却能让两个人吃上10天。
蜥蜴的生存策略
动态演化
复制者（replicator）
象海豹的生存策略
鹰鸽博弈
H H D (v-c)/2,(v-c)/2 0,v D v,0 v/2,v/2
博弈的演化稳定策略是什么？当v>c时，(H,H)是严格纳什均衡，因此H是演化稳定策略。当v=c时，(H,H)是弱纳什均衡，因为U(H,D)>U(D,D)，因此H是演化稳定策略当v<c时，不存在纯策略演化稳定策略。此时是否存在混合策略ESS？首先找出混合策略纳什均衡(v/c,1-v/c)，其次验证其是否为ESS。
成功是一种习惯
人们关于习惯的一切理论都可以用“路径依赖”来解释。它告诉我们，要想路径依赖的负面效应不发生，那么在最开始的时候就要找准一个正确的方向。每个人都有自己的基本思维模式，这种模式很大程度上会决定你以后的人生道路。而这种模式的基础，其实是早在童年时期就奠定了的。做好了你的第一次选择，你就设定了自己的人生。
路径依赖与制度变革
对组织而言，一种制度形成后，会形成某个既得利益集团，他们对现在的制度有强烈的要求，只有巩固和强化现有制度才能保障他们继续获得利益，哪怕新制度对全局更有效率。对个人而言，一旦人们做出选择以后会不断地投入精力、金钱及各种物资，如果哪天发现自己选择的道路不合适也不会轻易改变，因为这样会使得自己在前期的巨大投入变得一文不值，这在经济学上叫“沉没成本”。沉没成本是路径依赖的主要原因。
路径依赖的例子
一个广为流传、引人入胜的例证是：现代铁路两条铁轨之间的标准距离是四英尺又八点五英寸。原来，早期的铁路是由建电车的人所设计的，而四英尺又八点五英寸正是电车所用的轮距标准。那么，电车的标准又是从哪里来的呢？最先造电车的人以前是造马车的，所以电车的标准是沿用马车的轮距标准。马车又为什么要用这个轮距标准呢？英国马路辙迹的宽度是四英尺又八点五英寸，所以，如果马车用其他轮距，它的轮子很快会在英国的老路上撞坏。这些辙迹又是从何而来的呢？从古罗马人那里来的。因为整个欧洲，包括英国的长途老路都是由罗马人为它的军队所铺设的，而四英尺又八点五英寸正是罗马战车的宽度。任何其他轮宽的战车在这些路上行驶的话，轮子的寿命都不会很长。可以再问，罗马人为什么以四英尺又八点五英寸为战车的轮距宽度呢？原因很简单，这是牵引一辆战车的两匹马屁股的宽度。故事到此还没有结束。美国航天飞机燃料箱的两旁有两个火箭推进器，因为这路径依赖些推进器造好之后要用火车运送，路上又要通过一些隧道，而这些隧道的宽度只比火车轨道宽一点，因此火箭助推器的宽度是由铁轨的宽度所决定的。所以，最后的结论是：路径依赖导致了美国航天飞机火箭助推器的宽度，竟然是两千年前便由两匹马屁股的宽度所决定的。
演化稳定策略（ESS）
演化稳定策略，是指如果占群体绝大多数的个体选择演化稳定策略，那么小的突变者群体就不可能侵入到这个群体。或者说，在自然选择压力下，突变者要么改变策略而选择演化稳定策略，要么退出系统而在进化过程中消失。
例1：囚徒困境博弈
C C
D
D 0,3
1,1
2,2
3,0
C代表合作，D代表背叛。合作是否是一种演化稳定策略？

在经典博弈论中，假设参与人具有使自己支付最大化的主观意识与对于对手策略的最优反应能力，在实际中，这种假设可能是不现实的。譬如在“象棋”中，棋手不可能在每一步都能够采取最优的反应行动。
自然界中的博弈
吸血蝙蝠夜间去大型哺乳动物那里吸血，有些个体偶尔会空腹而归，此时吸饱血的个体就会吐出胃内的血液喂给饥饿的个体，尽管它们之间并没有直接血缘关系。吸血蝙蝠更有可能回吐血液给以前曾经回吐过血液的蝙蝠，而骗子（拒绝分享的蝙蝠）将被蝙蝠群体记住，并且被排除在这种协作之外。
第5章演化博弈
经济学与生物学
经济学和生物学的历史从来就交织在一起。众所周知，Charles Darwin的一个核心洞见就来源于Thomas Malthus（1803）。对于Darwin来说，Malthus的人口的增长率倾向于超过产量增长率的论证暗示着不可避免的生存之战，因此暗示着适者生存的自然选择。
例3：找出ESS
A A B 1,1 1,1 B 1,1 0,0
U(A,A)=U(B,A) U(A,B)>U(B,B) 因此A是演化稳定策略
例4：
A B
A
10,10 0,0
B
0,0 1,1
演化稳定策略：A和C C是一种效率很低的状态，但社会一旦陷入了这种状态，就很难走出去。这就是所谓的“路径依赖”
改变收益矩阵的猎鹿博弈
3 3 4
0
4 0 4
4wk.baidu.com
另一个例子问题1：此博弈对应现实生活中的什么情况问题2：此博弈是否存在演化稳定策略
A A B 0,0 1,2
B 2,1 0,0
混合策略下演化稳定策略的定义
在二人对称博弈中，混合策略P*是演化稳定策略，如果以下两式成立：
1U P*, P * U P ', P * 2 若U P*, P * =U P ', P *，则U P*, P ' U P ', P '
路径依赖
路径依赖(Path－Dependence)，指人类社会中的技术演进或制度变迁均有类似于物理学中的惯性，即一旦进入某一路径（无论是“好”还是“坏”）就可能对这种路径产生依赖。一旦人们做了某种选择，就好比走上了一条不归之路，惯性的力量会使这一选择不断自我强化，并让你轻易走不出去。