博弈论5 有限理性和进化博弈75页PPT
博弈论完整版PPT课件
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
第五章有限理性和进化博弈ppt课件
在整堂课的教学中,刘教师总是让学 生带着 问题来 学习, 而问题 的设置 具有一 定的梯 度,由 浅入深 ,所提 出的问 题也很 明确
演化博弈的关注内容
❖ 演化博弈强调经济变迁过程中以个体多样 性变异机制和偏好选择机制为代表的种群 研究。
❖ 它探讨种群选择的策略是否获得最佳的收 益,并消除任何小的突变群体的扰动。
5.3 复制动态和进化稳定性: 两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定
策略 5.3.3 协调博弈的复制动态和进化稳定博弈
在整堂课的教学中,刘教师总是让学 生带着 问题来 学习, 而问题 的设置 具有一 定的梯 度,由 浅入深 ,所提 出的问 题也很 明确
在整堂课的教学中,刘教师总是让学 生带着 问题来 学习, 而问题 的设置 具有一 定的梯 度,由 浅入深 ,所提 出的问 题也很 明确
❖ 在演化博弈中,认为参与人的选择行为可以 依据前人的经验、学习与模仿他人行为、受 遗传因素的决定等。
❖ 因而演化博弈把具有主观选择行为的参与人 扩展为包括动物、植物在内的有机体,动植 物参与者的支付可被理解为为某种适应程度。
经济学与生物学
经济学 企业 最优化 策略 利润 扩张 倒闭 创新
生物学 物种(或个体)
适应 基因 适应性(fitness) 繁殖 灭绝 变异
在整堂课的教学中,刘教师总是让学 生带着 问题来 学习, 而问题 的设置 具有一 定的梯 度,由 浅入深 ,所提 出的问 题也很 明确
自然界中的博弈
❖ 吸血蝙蝠夜间去大型哺乳动物那里吸血,有些个 体偶尔会空腹而归,此时吸饱血的个体就会吐出 胃内的血液喂给饥饿的个体,尽管它们之间并没 有直接血缘关系。
博弈论——理性与非理性精品PPT课件
不过,2号推知到3号的方案,就会提出(98,0,l,1)的方案,即放弃3号,而给 予4号和5号各1枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利, 他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。不过, 2号的方案会被l号所洞悉,l号并将提出(97,0,1,2,0)或(97,0,1,0,2)的 方案,即放弃2号,而给3号1枚金币,同时给4号或5号2枚金币。由于l号的这一 方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投l号的赞成票,再 加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入腰包。
想不到甲还要更聪明一个层次,估计到乙要写98元来坑他,于是他准 备写97元……大家知道,下象棋的时候,不是说要多“看”几步吗, “看”得越远,胜算越大。
你多看两步,我比你更强多看三步,你多看四步,我比你更老谋深算 多看五步。在花瓶索赔的例子中,如果两个人都“彻底理性”,都能 看透十几步甚至几十步上百步,那么上面那样“精明比赛”的结果, 最后落到每个人都只写一两元的地步。事实上,在彻底理性的假设之 下,这个博弈唯一的纳什均衡,是两人都写0.
理性的困境
彩票问题
理性的人是力图使自己的效益最大,如果在信息 不完全的情况下则是使自己的期望效益最大。但 是这难以解释现实中人们购买彩票的现象。
人们愿意掏少量的钱去买彩票,如福利彩票、体育彩票等,以博取 高额的回报。人们自己的选择理性发挥不出来,而惟有靠运气。在 这个博弈中,人们要在决定购买彩票还是不买彩票之间进行选择。
彩票问题
博弈论最全完整-讲解PPT课件
王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
.
32
导论
四、主要参考文献
.
33
张维迎著,《博弈论与信息经济学》,上海三联书店、 上海人民出版社,1996年版。
Roger B. Myerson著:Game Theory(原文版、译文 版),中国经济出版社,2001年版。
是关于动态博弈进行过程之中面临决策 或者行动的参与人对于博弈进行迄今的 历史是否清楚的一种刻划。
如果在博弈进行过程中的每一时刻,面 临决策或者行动的参与人,对于博弈进 行到这个时刻为止所有参与人曾经采取 的决策或者行动完全清楚,则称为完美 信息博弈;否则位不完美信息。
.
30
零和博弈与非零和博弈
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
.
4
如何在博弈中获胜?
…… 真的能在博弈中(总是)获 胜吗?
对手和你一样聪明! 许多博弈相当复杂,博弈论并不
施锡铨编著,《博弈论》上海财大出版社,2000年版。
谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。
谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。
博弈论最全完整ppt讲解
人们在日常生活中进行着博弈,与配偶,朋友,陌 生人,老板/员工,教授等。
类似的博弈也在商业活动、政治和外交事务、战争 中进行着——在任何一种情况下,人们相互影响以 达成彼此有利的协议或者解决争端。
博弈论为众多学科提供了分析的概念和方法:经济 学和商学,政治科学,生物学, 心理学和哲学。
案例1:囚犯困境
支付 嫌疑人A
嫌疑人 B
抵赖
坦白
抵赖 -1,-1 0,-9
坦白 -9,0 -6,-6
均衡与均衡结果
均衡战略(坦白,坦白) 均衡支付(-6,-6)
第二节 纳什均衡
占优战略均衡 重复剔除的占优战略均衡
纳什均衡
完全信息静态博弈的几点特性
同时出招,出招一次; 知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的
如何在博弈中获胜?
…… 真的能在博弈中(总是)获胜吗? 对手和你一样聪明! 许多博弈相当复杂,博弈论并不能提供
万无一失的应对办法。
例1:无谓竞争(The GPA Rat Race)
你所注册的一门课程按照比例来给分:无论卷面分数是 多少,只有40%的人能够得优秀,40%的人能得良好。
所有学生达成一个协议,大家都不要太用功,如何?想 法不错,但无法实施!稍加努力即可胜过他人,诱惑大矣。
与战略式表述
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行为发生直 接相互作用时候的决策以及这种决策的均衡问题。
博弈的战略式表述:G={N,(Si)iN,(Ui)iN} 有三个基本要素: (1)参与人(players)iN={1,2,…,n} ; (2)战略(strategies),siSi(战略空间); (3)支付(payoffs),ui=ui(s-i,si)。
精品课程《博弈论》PPT课件(全)
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
博弈论PPT资料整理
博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。
1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。
2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。
博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。
于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。
中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。
博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。
生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。
而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。
特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。
由此可见,博弈论是适合所有人的科学。
在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。
博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。
可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。
从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损如果势均力敌,则应考虑到对手的反击手段。
《博弈论的基本概念》课件
智猪博弈
• 总结词:描述大猪和小猪在食槽附近争夺食物的策略博弈。
• 详细描述:在智猪博弈中,一个大猪和一个小猪共同生活在一个猪圈里,食槽位于猪圈的一端。每次食物被放入食槽时 ,大猪和小猪都有两种选择:冲向食槽或继续等待。如果大猪选择冲向食槽,小猪的最佳策略是等待,因为大猪吃掉大 部分食物后,小猪可以享用剩余的食物。相反,如果小猪选择冲向食槽,大猪的最佳策略也是等待,因为小猪可能无法 抢到任何食物。因此,无论大猪如何选择,小猪的最佳策略都是等待;同样地,无论小猪如何选择,大猪的最佳策略也 是等待。
合作博弈
特征
强调合作、协议和联盟,目标是实现共同利益。
应用领域
国际关系、商业合作、团队协作等。
非合作博弈
特征
强调竞争、自利和策略互动,目标是实现个人利益。
应用领域
市场竞争、个人决策、政治选举等。
动态博弈
特征
强调行动的顺序和信息传递,策略和 行动需考虑时间因素。
应用领域
商业竞争、投资决策、谈判策略等。
《博弈论的基本概念》ppt课件
目录
• 博弈论简介 • 博弈论的基本类型 • 博弈论的基本概念 • 博弈论的经典案例 • 博弈论的未来发展
01
博弈论简介
博弈论的定义
01
博弈论:研究决策主体在相互影 响、相互作用的环境中如何进行 决策,以及这种决策的均衡结果 的学科。
02
博弈论强调参与者之间的互动关 系,通过数学模型和理论分析来 研究策略选择和均衡结果。
应用领域:拍卖机制设计、保险市场 分析、医疗资源分配等。
03
博弈论的基本概念
参与者
01
02
03
参与者
在博弈中,参与者是决策 的主体,可以是个人或组 织。
博弈论ppt课件
精选课件ppt
7
囚徒B 坦白
不坦白
囚徒A
坦白 -8,-8 0,-10
不坦白 -10,0 -1,-1
精选课件ppt
8
博弈的分类
ห้องสมุดไป่ตู้
1、从行动的先后次序来分,博弈可以分为 静态博弈 和 动态博弈。 静态博弈指在博弈中,参与人同时选择行动,或虽非同 时但后行动者并不知道前行动者采取了什么具体行动;
动态博弈指的是参与人的行动有先后顺序,且后行 动者能够观察到先行动者所选择的行动的博弈。
21世纪,应站在博弈论的前沿。尽管博弈经济学家很少,但其获诺贝尔
奖的比例最高。最能震动人类情感的是博弈,对未来最有影响力的还是
博弈。
精选课件ppt
6
著名的“囚徒困境”的例子
警察抓住了两个罪犯,但是警察局却缺乏足够的证据 指证他们所犯的罪行。如果罪犯中至少有一人供认犯 罪,就能确认罪名成立。为了得到所需的口供,警察 将这两名罪犯分别关押防止他们串供或结成攻守同盟, 并分别跟他们讲清了他们的处境和面临的选择:如果 他们两人都拒不认罪,则他们会被以较轻的妨碍公务 罪各判一年徒刑;如果两人中有一人坦白认罪,则坦 白者立即释放而另一人将重判10年徒刑;果两人都坦 白认罪,则他们将被各判8年监禁。问:两个罪犯会 如何选择(即是坦白还是抵赖)?
不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放 弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说 比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分 配。这样,2号将拿走98枚金币。
同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0) 或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时 给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号) 来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己 的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号 能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分 给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2, 0)或(97,0,1,0,2)。
博弈论课件
扩展一:不完全信息博弈
不完全信息博弈的定义
01
在博弈中,参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度,可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略,研究候选人如何 制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调,分析政策 制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作,分析国家如何通过 外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡 。
特点
纳什均衡是一种稳定的状态,任何参 与者单方面改变自己的策略都不会获 得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略, 该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略,该 策略都能为参与者带来更低的收益 。
特点
在优势策略下,参与者没有理由改 变自己的策略;在劣势策略下,参 与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降,还可能引发市场恶性竞争,破坏市场秩序。此外,价格战还可能导致产品质量 下降,损害消费者利益。
案例二:国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中,各国之间往往存在着复杂的博弈关系。为了维护自身利益,各 国会采取不同的博弈策略,如通过外交手段、经济制裁、军事威胁等方式来达 到自己的目的。
第五经济博弈论 PPT
进化稳定策略得检验
比例的博弈方偏离“同意”策略选择了“不同意” uy (1 )1 0 1 un (1 ) 0 0 0 u (1 )u y un (1 )2
因为 uy 1 0 且接近于1,因此犯错误博弈方得期
望得益远远低于没有犯错误得博弈方,也远低于群体平均得益, 因此犯错误得博弈方会逐步改正错误,最终仍然会趋向于x=1, 即所有博弈方都采用“同意”策略。
签协议博弈:
同意 不同意
博弈方2
同意
不同意
1,1
0,0
0,0
0,0
两个纯策略纳什均衡:(同意,同意),(不同意,不同意), 前一个纳什均衡帕累托优于后一个纳什均衡。假如就是在完全理 性得基础上进行该博弈,可以预期结果就是(同意,同意)。
下面就是在理性层次较低得有限理性博弈方组成得大群体成员 随机配对反复博弈得分析框架内进行分析。
因此x 1是在上述复制状态下的一个进化稳定策略ESS
进化稳定策略得检验
比例的博弈方偏离“不同意”策略选择了“同意”
uy (1 ) 0 1 un (1 ) 0 0 0 u (1 ) un uy 2
uy 0 un
x 0不是进化稳定策略
5、3、2一般两人对称博弈复制动态 与进化稳定策略
5、3、1 签协议博弈得复制动态与进化稳定策略
签协议博弈:
同意 不同意
博弈方2
同意
不同意
1,1
0,0
0,0
0,0
假设群体中采用“同意”博弈方得比例x,则不同策 略期望得益与平均得益为:
uy x 1 (1 x) 0 x un x 0 (1 x) 0 0 u x u y(1 x) un x2
只要博弈方有基本得、包括直觉与经验得判断能力, 早晚会发现上述得益差异,得益较差类型得博弈方或早或 迟会发现改变策略对自己就是有利得,并开始模仿另一种 类型得博弃方。
第三章-第五节-演化博弈模型ppt课件
dx/dt
③ 假设v=8,c=4(表示种群间和平共
处所得到的收益大于两者冲突导致的损失)
dx/dt
0
ESS: x*=1
1
x
0
1
x
ESS: x*=1
当c≤v时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因
在于当一方忍让时,另一方可获得更多收益。
完整版PPT课件
这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。
13
(四)蛙鸣博弈的复制动态和ESS
蛙鸣 A 不鸣
蛙B
鸣
不鸣
P-z ,P-z
m-z ,1-m
1-m,m-z
0 ,0
➢ m、P为求偶成功的概率 ➢ z为机会成本(体力消耗、危险性等)
满足:m ∈ (0.5,1],m<P≤1
令x为采用“鸣”策略的群体比例,1-x为采用“不鸣”策略的群体 比例 则复制动态方程F(x):
则: dx x2 x3
dx dt
xUY
U
dt
当x=0时,稳定;
复制完动整版态P方PT课程件
当x>0时,最终稳定于x*=6 1
dx/dt
dx x2 x3
dt
甲Y
N
乙
Y
N
1,1
0 ,0
0, 0
0,0
0
1x
图1 签协议博弈的复制动态相位图
x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y
进化博弈演讲ppt
0
0.5
1
X
• 鹰鸽博弈是研究动物世界和人类社会中普 遍存在的竞争和冲突现象的经典博弈,鹰 鸽博弈的进化分析则可以揭示人类社会或 动物世界发生战争或激烈冲突的可能性及 其频率,国际关系中霸道和软弱,侵略与 反抗,威胁与妥协等共存的原因等。
例3 稳定的性比
在进行有性繁殖的二倍体种群中,费希尔 (Fisher)指出,如果以子二代的数目变化作 为适合度,进化上稳定的性比将是1:1,这里 性比是指后代(子一代)的平均性别比例。如 果种群的性比发生了偏离,比如子一代中雄性 多于雌性,对于子二代来讲,每个个体都有一 对父母,在随机交配的前提下,子一代中雌性 个体能够得到比雄性更多的繁殖机会。能够产 生较多雌性后代的个体会受到自然选择青睐, 从而种群的平均性比将重新回到1:1
B B B A
A A A
A
A
A B A
B B
B
A
B B A
B A A B A
B
A
B
B
B
B
A
B
B
A
• 以上8种可能情况中,除了都是B这种情况 外,其余最终都会改变到全是A。 • A称为“进化稳定”策略,而B不是进化稳 定策略。
例:开始时,4B1A,最后调整为稳定的5A。
A B B A
B
A B
A
B
B
进化稳定策略(evolutionarily stable strategy)
•
Maynard Smith(1982)创造性地提出了一 个全新概念––进化稳定对策,或称ESS。当种群 内所有个体都采取了某个对策后,其它对策者都 不能侵入该种群,那么这个对策就是进化上稳定 的。
进化博弈的特点