第五章 经济博弈论

合集下载

经济博弈论

经济博弈论

经济博弈论
经济博弈论是经济学的一个重要分支,主要研究人们在博弈中对策略进行选择和应对的行为问题。

它使用博弈理论来研究参与者之间在竞争、合作、个人利益和公共利益之间如何权衡的问题,以及这种权衡如何影响最终的结果。

此外,经济博弈论还可以用来研究多个参与者之间的关系,包括市场竞争、产业结构和政治博弈等。

经济博弈论的基本原则是以多方参与者的利益为核心,从而使博够用来描述和分析市场竞争的结构。

因此,经济博弈的重要性就在于其能够为研究行为者之间的关系提供一个统一的理论框架,并使用该框架揭示协作和竞争的内容。

经济博弈论的主要研究方向包括对影响博弈结果的因素进行研究,特别是参与者之间的合作,如何改变博弈结果,以及参与者之间的关系如何改变博弈结果。

此外,研究者还可以考虑以下问题:博弈中的因素可能会为参与者创造什么样的合作机会;如何有效的利用这些机会;参与者通过不同策略的应用可能会有什么样的收益;博弈中参与者之间的关系如何影响其行为;参与者如何确定自己的最佳策略;参与者如何利用博弈理论来进行有效谈判;参与者如何在博弈中发挥影响力。

经济博弈论的结果可以用于许多不同的领域,如垄断组织和协议博弈,企业组织和政府政策,市场竞争,以及国际事务等。

它还可以有效地用于分析市场格局、市场结构和企业行为的影响,从而改善竞争环境,制定更好的市场结构,并防止市场滥用。

总而言之,经济博弈论的重要性在于它可以帮助我们更好地理解市场结构和企业行为之间的内在联系,进而改善社会经济环境,实现更加有效地公平竞争。

经济博弈论

经济博弈论

经济博弈论
经济博弈论是近代经济理论发展中重要的分支,它将经济学与博弈论相结合,
以揭示多人约定下各自更利选择的机制、利益调和机制、穿越謬误机制等。

高校与高等教育是受经济博弈论影响最为突出的行业,因此有必要充分从理论上用经济博弈论加以研究。

首先,高校与高等教育是一种多人博弈产业,而学生、考生、社会、考试团体、学校都是其中最直观的玩家。

借助经济博弈论,不同玩家之间的合作关系和竞争关系能够有效地映射出来,也就是说,当每个玩家根据自身的利益情况及其他玩家的行动而采取的行动,将会产生波及整个产业的结果。

其次,高校与高等教育领域内存在诸多不同的主体,这些主体有着不同的利益,他们可以通过经济博弈论达到自身利益最大化的目的。

比如,学校可以根据自身的能力水平,采取一些策略来动态调整自身的发展方向;学生则可以根据自己的实力来选择更符合自己能力的学习环境;考生则可以根据考试难度、考试内容结合其他考生的行动来择优考试学习信息。

此外,经济博弈论还可以帮助高等教育领域内的资源进行有效配置。

在个体角
度上,各玩家能够根据自身利益情况进行调整,在社会角度上,则可以通过合理调整资源配置、课程设置、教学管理等,使得高校与高等教育得到最大的收益,构成互利共赢的局面。

最后要指出的是,经济博弈论给了高校与高等教育领域一个全新的发展视角,
这个视角不仅能够有效统筹和调节高等教育的发展,还能及时发现市场中的穿越謬误,从而提高竞争力,促进高校与高等教育可持续发展。

《经济博弈论》课件

《经济博弈论》课件

常见博弈形式
合作博弈
指博弈者之间相互合作,以达到共同利益最大 化的博弈形式。
非合作博弈
指博弈者在无法达成合作的情况下,各自进行 决策,追求自身利益的博弈形式。
零和博弈
又称为固定和博弈,指博弈者的利益互为相反, 一方得到的利益与另一方失去的利益பைடு நூலகம்和为零。
零和博弈的例子
经典的零和博弈例子是两个囚犯的囚徒困境, 其中一方的得益必定意味着另一方的损失。
引言
博弈论是一门研究理性个体在决策过程中相互影响与相互制约的科学。它研究的是决策者如何在不确定环境中 做出选择,以及这些选择如何影响他人。
博弈论概述
- 什么是博弈论?博弈论是研究决策者之间相互作用和互动的数学模型框架。 - 博弈论的基本概念包括:博弈者、策略、支付、纳什均衡等。 - 博弈论的应用领域广泛,包括经济学、政治学、生物学、社会学等。
博弈论中的重要概念
1 纳什均衡
指博弈中的一组策略,每个博弈者都在这些策略下选择自己的最佳反应。没有进一步改 变策略的动机。
2 支配策略
指在任何情况下,选择该策略所带来的利益总是大于或等于其他策略的策略。
3 动态博弈
指博弈中的决策是基于时间顺序进行的,后续决策往往会受到前期决策的影响。
博弈论的实际应用
《经济博弈论》PPT课件
This presentation will introduce the key concepts of economic game theory, its applications, and highlight important strategies and examples. Get ready to delve into the fascinating world of strategic decision-making.

经济博弈论

经济博弈论

1、纳什均衡的概念。

对于任一个博弈游戏来讲,一定存在这么一组策略,使得其对于任一个局中人而言都是最好的,如果其它的所有局中人不改变他们的策略的话。

2、非合作博弈与合作博弈的区别。

形成合作博弈的两个条件:(1)对联盟来说,整体收益大于其每个成员单独经营时的收益之和。

(2)对联盟内部而言,应存在具有帕累托改进性质的分配规则,即每个成员都能获得比不加入联盟时多一些的收益。

如何保证实现和满足这些条件,这是由合作博弈的本质特点决定的。

也就是说,联盟内部成员之问的信息是可以互相交换的,所达成的协议必须强制执行。

这些与非合作的策略型博弈中的每个局中人独立决策、没有义务去执行某种共同协议等特点形成了鲜明的对比。

因此可以说:形成合作博弈的原因是在某种制度约束下的集体理性战胜了个人理性。

3、解释下列概念:纯策略、混合策略、策略组合、纳什均衡、贝叶斯均衡、反应函数在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略。

纯策略是混合策略的特例。

按照一定的概率,从一套“纯策略”中随机选取实际的对策,称为混合策略。

混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例。

策略组合指参与者可能采取的所有行动方案的集合。

策略集合必须有两个以上元素,否则,无所谓对策,只是独自决策。

所谓贝叶斯纳什均衡是指这样一组策略组合:在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略反应函数,在无限策略的古诺博弈模型中,博弈方的策略有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数的关系,把这个连续函数称为反应函数。

4、解释下列概念:博弈、静态博弈和动态博弈、完全信息博弈和不完全信息博弈、完美信息动态博弈和不完美信息动态博弈博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化的过程。

《产业经济学》第五章--(博弈1)讲解

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。

经济博弈论

经济博弈论
发展是生活的必然,博弈是更好生活的手段。从小事我们不经意间就会用到这种手段,如果我们刻意使用这些手段,又会有怎样的结果呢??
博弈是一门很深的学科,跨越生活各个领域,下面我们从经济博弈方面来以点概面,展示博弈的风采。
总所周知,经济指的是整个社会的物质资料的生产和再生产,指社会物质生产、流通、交换等活动。经济是人类社会的物质基础,与政治是人类社会的上层建筑一样,是构建人类社会并维系人类社会运行的必要条件。其具Байду номын сангаас含义随语言
人之一生,路很长也很短,会经历许许多多,有太多的机遇,有太多的抉择;随着我们越来越多的经历,与各种各样的人交往,我们需要学习的很多,我们总会面临各种各样的选择,博弈,成了生活中不可或缺的一部分。
‘博弈’一词,或许我们并不熟悉,但是我们生活中却时常进行博弈。小的来说,我们小时候,经常会不想做作业,寻找各种借口,与老师、与家长周旋,或者说当我们遇到很喜欢的玩具,想方设法让爸妈一定要给自己买到手,再或者,小时候犯点错,要怎样认错才能减少受到的惩罚等等。可以说,我们生活中时时刻刻都在进行着博弈,虽然我们并不清楚我们用的是博弈的手段,但实实在在我们都是在博弈。
矛盾是博弈发展的首要条件。
生活中,很多事情之间是存在着必然的矛盾关系的,我们想要解决这些矛盾,那么,需要怎么解决呢?这时候,博弈是一门很重要的手段,在解决各种各样矛盾的过程中,博弈论悄然成型。
博弈已成为一门学科供我们学习,我们应该清楚,小到个人,大到集体、公司、国家、民族之间的交际,无不与博弈相关。怎样博弈?如何博弈?
我们稍微长大了,有自己喜欢的事,有自己喜欢的人,有自己不喜欢的事,有自己不喜欢的人,我们面临越来越多的选择,面临着各种各样的机遇,我们需要怎么抉择,如何让能更好的顺着自己的意愿,如何能让自己得到更多的利益,等等。或许我们都没意识到,我们应该用博弈的手段,但是我们是实在的在使用。 有人说,人是最复杂的动物。人有七情六欲,人有喜怒哀乐,有有各种各样的情绪,与人相处,遇到心情好的时候,或许这个人会很好相处,心情不好的时候,这个人或许会难以接近、容易发怒,等等,有人说:与人相处,是需要艺术的。我认为这里所谓的艺术,其实无非就是博弈。在人与人之间的交往中,很容易因为一点小错误得罪人,这个时候若果你会一点博弈的手段,很容易就消解误会,冰释前嫌。

经济博弈论概述

经济博弈论概述

经济博弈论概述引言经济博弈论是研究经济参与者在有限理性条件下进行决策的一门学科。

它主要研究经济参与者之间的互动和策略选择,以及这些互动和策略选择对经济系统的影响。

博弈论广泛应用于经济学、政治学、社会学、生物学等学科中,被认为是解决复杂社会问题和分析个体行为的重要工具之一。

博弈论基本概念参与者在博弈论中,参与者是指在一个特定博弈中进行决策的个体或组织。

参与者可以是个人、企业、国家等等。

每个参与者根据自身的利益和目标来制定策略。

策略策略是参与者为了达到自身目标而采取的行动。

在博弈论中,每个参与者可以选择不同的策略,这些策略可能直接或间接地影响其他参与者的决策。

支付支付是参与者根据自己的策略选择和博弈的结果而获得或损失的利益或成本。

支付可以是金钱或其他形式的效用。

每个参与者都希望通过制定有效的策略来最大化自己的支付。

博弈形式博弈形式是指博弈过程中参与者选择策略的规则和限制。

常见的博弈形式包括完全信息博弈和不完全信息博弈。

在完全信息博弈中,每个参与者都了解其他参与者的策略和支付函数,而在不完全信息博弈中,参与者可能只了解部分信息。

不同的博弈形式会对参与者的策略选择和结果产生不同的影响。

均衡概念在博弈论中,均衡是指在一组给定的策略下,参与者没有动机改变他们的决策,因为任何单个个体的策略改变都不会提高他们的支付。

常见的均衡概念包括纳什均衡、帕累托最优、占优策略和等身份均衡等。

经济博弈论的应用市场竞争经济博弈论在市场竞争的分析中起着重要的作用。

在一个市场中,不同的企业之间会进行价格竞争和市场份额争夺等博弈策略。

通过博弈论的分析,我们可以理解不同策略对企业利润和市场格局的影响,从而指导企业制定最优的竞争策略。

合作与冲突博弈论也可以应用于合作与冲突的研究中。

在合作关系中,参与者可以通过博弈论的分析来确定最优的合作策略,以实现共同的利益。

而在冲突情境中,博弈论可以帮助我们理解参与者之间的战略选择和策略优化,从而指导冲突的解决和决策的制定。

经济博弈论讲解

经济博弈论讲解
完全且完美信息动态博弈
游戏
两人参与游戏。首先参与人1可以向盒子里放1元钱或3元钱或 不放钱,然后盒子传到参与人2那里。参与人2看到盒子里的钱 后,他可以选择做相同的投资,即参与人1放1元钱他放1元钱, 参与人1放3元钱他放3元钱,他也可以把参与人1放的钱拿走。
参与人1不放钱,参与人2不放钱,双方受益为0。
在该博弈中企业1只有一个信息集I1({x1}) 在该信息集上的行动为“开发”和“不开发”所以企业1的策略为 “开发”和“不开发”两个。(开发,不开发) 企业2有两个信息集 I2({x2})和 I2({x3}) 每个信息集有两个行动“开发”和“不开发” 所以企业2有4个策略(开发,开发),(开发,不开发) (不开发,开发),(不开发,不开发)(可以把它们表示成矩阵形式)
动态博弈的结果: 动态博弈的得益:
首先是指各博弈方策略构成的策略组合,其次,动态博弈 的结果是各博弈方策略组合形成的一条联接各个阶段的“路 径”;最后,实施各种策略组合的最终结果,落实到给博 弈方带来的得益。因此在动态博弈中,博弈的结果包括各 博弈方采用的策略组合,实现的博弈路径和各博弈方的得 益。 动态博弈的非对称性
所以参与人1的策略集为A, BE, F,即( A, E),(A, F),(B, E),(B, F)
博弈人的策略组合:每条策略组合都存在一条与之对应的路径, 但在许多情况下每条路径所对应的策略组合并不唯一。
企业1与企业2的策略
开发
○x1 企业1
不开发
企业1的策略集合为: S1={x|x=开发或不开发}
0,
800
300,300 0, 0
800,0 0, 800
800,0 0, 0
根据纳什均衡的定义得(开发,(开发,开发)和

复旦大学经济博弈论课件--经济博弈论536页

复旦大学经济博弈论课件--经济博弈论536页
以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
d d x tx ( u y u ) x (x x 2 ) x 2 ( 1 x ) x 2 x 3
22.03.2020
课件
14
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
22.03.2020
其中abcd可以是任何得益,根据问题设定。
22.03.2020
课件
17
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
d d x tx(u 1 u )x[u 1x1u (1x)u 2] x(1x)u (u) x(1x)x[(ac)(1x)b (d)]
复制动态 相位图
22.03.2020
x 课件
1
x
18
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
d x F (x ) x (1 x )x [ (a c ) (1 x )b ( d )] dt
22.03.2020
课件
3
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群0
课件
4
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型

经济博弈论5

经济博弈论5

一个策略组合和相应的判断满足下列4个要求, 称为一个“完美贝叶斯均衡”:
要求1:在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到 该信息集中每个节点可能性的“判断”。对非单节点信息集,一个“判 断”就是博弈达到该信息集中各个节点可能性的概率分布,对单节点信 息集,则可理解为“判断达到该节点的概率为1” 要求2:给定各博弈方的“判断”,他们的策略必须是“序列理性”的。 即在各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续策 略”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的得益 或期望得益最大。此处所谓“后续策略”即相应的博弈方在所讨论信息 集以后的阶段中,针对所有可能情况如何行为的完整计划 要求3:在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方 的均衡策略决定 要求4:在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各 博弈方在此处可能有的均衡策略决定
i 1
P( Bk | A)
P( Bk ) P( A | Bk )
P( B ) P( A | B )
i 1 i i
n
k 1,2,, n
5.2.1 完美贝叶斯均衡定义


在不完美信息动态博弈中纳什均衡和子 博弈完美纳什均衡都不能解决问题,需 要引进新的均衡概念 纳什均衡和子博弈完美纳什均衡分析方 法,反应函数和逆推归纳法等同样也要 改进、变化
市场类型归纳
pg (V P) pb (W P)
市场 部分 成功 0
市场 完全 成功 P
市场接 近失败 或 完全失败
市场 完全 成功
C
单一价格二手车交易的解
5.4 双价二手车交易
5.4.1 双价二手车交易博弈模型 5.4.2 模型的均衡

经济博弈论潘

经济博弈论潘


1.1.2 定义
博弈-----个人、队组或其他组织,面对一定的环境条件,在一定的 规则下,同时或先后,一次或多次,从各自允许选择的行为或策 略中进行选择并加以买施,并从中各自取得相应结果的过程。
一个博弈需要设定下列4个方面: (1)博弈的参加者 (2)各博弈方各自可选择的全部策略或行为的集合。 (3)进行博弈的次序。 (4)博弈方的得益。
而“非合作博弈”则是指在各博弈方之间不能存在任何有约束力的协 议,也就是说各博弈方不能公然“串通”、“共谋”的博弈问题。
1.1.3 博弈论研究的历史和发展述评
产量决策的古诺(Cournot)模型
价格决策的伯特兰德(Bertrand)模型
本世纪20年代,法国数学家波雷尔(Borel)用最佳策略的概念研究了下 棋和其他许多具体的决策问题,并试图把它们作为应用数学的分支加 以系统研究 1944年诺依曼(Neumann)和摩根斯坦(Morgensten)合著的《博弈论和 经济行为》一书的出版标志着系统的博弈理论的初步形成。

1.2.2齐威王与田忌赛马
传说齐威王经常要大将田忌与他赛马,赛马的规则是这样的:每次双 方各出三匹马,一对一比赛三场,每一场的输方要赔一千斤铜给赢方。 齐威王的三匹马和田忌的三匹马按实力都可分为上、中、下三等。由 于齐威王的上、中、下三匹马都分别比田忌的上、中、下三匹马略胜
一筹,因此田忌每次都是连输三场,要输掉三千斤铜。实际上,田忌 的上马虽不如齐威王的上马,却比齐威王的中马和下马都要好,同样, 田忌的中马则比齐威王的下马要好一些,田忌每次都连输三场是有些 冤枉的。后来田忌的谋士孙膑给田忌出了个主意,即让田忌不要用自 己的上马去对抗齐威王的上马,而是用下马去对抗齐威王的上马,上 马则去对抗齐威王的中马,中马去对抗齐威王的下马。 田忌的谋士孙膑给田忌出了个主意,即让田忌不要用自己的上马去对 抗齐威王的上马,而是用下马去对抗齐威王的上马,上马则去对抗齐 威王的中马,中马去对抗齐威王的下马。这样,虽然第一场田忌必输 无疑,但后两场田忌却都能赢,二胜一负,田忌反而能赢齐威王一千 斤铜。 这个著名的故事生动地告诉我们巧用策略是多么的重要,在实力、条 件一定的情况下,对已方力量和有利条件的巧妙调度和运用常会起到 意想不到的效果。

《经济博弈论》PPT课件

《经济博弈论》PPT课件
13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈

方 1

博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2




弈 方

1, 0
1, 3

经济博弈论

经济博弈论
3
非合作博弈强调个体理性
(individual rationality),就是
从个体的角度考虑策略选择,使得
个体收益最大。所以非合作博弈研
究的是参与者在利益相互影响的情
况下如何选策略使自己的收益最大,
即策略选择问题。
约翰·纳什 (J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。
1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体(可以是个人,也可以是团体);
2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策;
3、策略是指参与人选择行动的规则,即在博弈 进程中,什么情况下选择什么行动的预先安排;
第一节 引言
1
博弈理论简介
博弈论(Game Theory):研究具有斗争或竞争性质现象的理 论和方法。
三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集
分类: 合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈;
研究博弈论的意义:理解人类的经济行为;理解社会和生态 物种系统中的合作行为以及自自组织斑图。
13
从游戏到博弈
游戏的特点:下棋,打牌,赌博,田径, 球类等等,共同的特点是策略
策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略和 利益的依存性
14
想一想
假如你正跟恋人用手机通电话,突 然信号断了。这时,你会立即拨电话 过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,取 决于你的恋人是否会拨过来。如果你 们其中一方要拨,那么另一方最好是 等待;如果一方等待,那么另一方就 最好是拨过去。因为如果双方都拨, 那么就会出现线路忙;如果双方都等 待,那么时间就会在等待中流逝。

第五章经济博弈论

第五章经济博弈论

复制动态的进化规则是生物学中生物特征进化规则 设x为采用策略1的比例
进化稳定策略的检验
比例的博弈方偏离“同意”策略选择了“不同意” uy (1 )1 0 1 un (1 ) 0 0 0 u (1 )u y un (1 )2
因为 uy 1 0 且接近于1,因此犯错误博弈方的期
望得益远远低于没有犯错误的博弈方,也远低于群体平均得 益,因此犯错误的博弈方会逐步改正错误,最终仍然会趋向 于x=1,即所有博弈方都采用“同意”策略。
博弈方2
A
B
A 50,50 49,0 B 0,49 60,60
1
2 5
协调博弈
4
3
采用A的得益:xi (t) 50 [2 xi (t)] 49 采用B的得益:xi (t) 0 [2 xi (t)] 60 当xi (t) 22 / 61时,采用A;当xi (t) 22 / 61时,采用B
一般模型
策略1 策略2
博弈方2 策略1 策略2 a, a b, c c, b d, d
一般2X2对称博弈
• 进化博弈设定是在一个大群体的成员中进行随机配对的 反复博弈。
• 基本模型是两个博弈方之间的对称博弈。含义是两个博 弈位置是无差异的。
• 其中a、b、c、d可以是任何得益,根据问题设定。
复制动态分析
5.2.2 古诺调整过程
古诺模型反应函数
q1
3
q2 2
q2
3
q1 2
假设:这两个博弈方都是有限理性的,但都属于知道自己的反应
函数(意味着知道自己的利润函数),只是不知道对方的利润、
反应函数,也没有预见能力。
最优反应动态模拟: 博弈方1
1 2.5博弈方2 3 Nhomakorabea2

经济博弈论基第五章动态贝叶斯博弈

经济博弈论基第五章动态贝叶斯博弈

s i
i
(B)Pi ( i
a
h i
)
是局中人
i观测到
a
h
和最优策略
i
s
*
i
(

)
后,使
用贝叶斯法则从先验概P率i (i i ) 得到的。
六、不完美信息博弈的完美贝叶斯纳什均衡
例1:完美贝叶斯纳什均衡是{M, U; p=1}
1
L (1, 3)
U
M [p] R [1-p]
2
1、Milgrom-Roberts (1982)垄断限价模型
传统解释的问题:价格作为一种承诺是不可置信的,因 为无论垄断者现在索取什么价格,一旦其他企业进入,垄断者 就会改变价格,因此,靠低价格是不可阻止进入的。
Milgrom-Roberts (1982)提出的解释:垄断限价可能反映 了这样一个事实,即其他企业不知道垄断者的生产成本,垄断 者试图用低价格来告诉其他企业自己是低成本,进入是无利可 图的。
一、KMRW声誉模型
如果下列条件满足,囚徒2将选择X=不坦白: 11p-14≥5p-12 p ≥1/3
即如果囚徒1属于非理性的概率不小于1/3,囚 徒2将在第一阶段选择“不坦白”(合作)。
一、KMRW声誉模型
下面考虑博弈重复三次(T=3)的情况:
给定p≥1/3,如果理性囚徒1和囚徒2在第一阶段都选择 “不坦白”(合作),那么第二、三阶段的均衡路径与前表相 同(X=不坦白),总的均衡路径如下表:
2、博弈顺序
(1)自然首先选择囚徒1的类型,囚徒1知道自己的类型, 囚徒2只知道囚徒1属于理性的概率是1-p,非理性的概率是p;
(2)2个囚徒进行第一阶段的博弈;
(3)观察到第一阶段博弈结果后,进行第二阶段博弈; 观察到第二阶段博弈结果后,进行第三阶段博弈;如此等等。

经济博弈论_Chapter05

经济博弈论_Chapter05
连续纯策略同时博弈:例子 Simultaneous Move Games with Simultaneous-Move Continuous Pure-Strategies: Examples 纳什均衡的经验证据与理论批判 Empirical Evidence and Theoretical Critique of the Nash Equilibrium 理性化 Ratinalizability
10
Slide 12
价格竞争 Price Competition
两条最优反应曲线的交点就是该定价博弈的纳什均衡点 两条最优反应曲线的交点就是该定价博弈的纳什均衡点。 The point of intersection of the two best-response curve is i the th Nash N h equilibrium ilib i of f th the pricing i i game.
Qx = 44 - 2Px + Py Qy = 44 - 2Py + PX
Slide 7
价格竞争 Price Competition
泽维尔的利润(用Bx 表示)为: Xavier’s profit, called it Bx , is given by:
Bx = (Px - 8) Qx
= (PX – 8) (44 – 2Px + Py ) 问:写出伊万的利润( 问 写出伊万的利润( By )的表达式。 )的表达式 Q: How about Yvonne’s profit By ?
Px = Py = 20
Slide 13
价格竞争 Price Competition
每个餐馆为其菜单收20美元,从每个顾客身上 赚得20 20-8=12 8=12美元,顾客数量为44 442*20+20=24(百),因此每月总利润为 12*2400=28,800 , 。 Each restaurant charges $20 for its menu and makes a profit of $(20-8)=12 on each of the (44-2*20+20)=24 (hundred) customers, for a total profit of $12*2400=28,800 $12*2400 28 800 per month. month
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
50,50 0,49 49,0 60,60
假设 xi t 为在t时期博弈方i的邻 居中采用A策略邻居的数量,该数 量有0、1、2三个可能的值。采用 B策略邻居的数量相应为2- xi t , 也有0、1、2三个可能值。
协调博弈 1 2 3
5 4
采用A的得益:xi (t ) 50 [2 xi (t )] 49 采用B的得益:xi (t ) 0 [2 xi (t )] 60 当xi (t ) 22 / 61 时,采用A;当xi (t ) 22 / 61 时,采用B
u y x 1 (1 x) 0 x un x 0 (1 x) 0 0 u x u y (1 x) un x 2
根据上述结果可以看出,除非x=0(即所有博弈方 都是“不同意”类型),否则两类博弈方的得益就有明 显差异,“同意”类型博弈方的得益高于“不同意”类 型的,也高于平均得益(因为0<x<1),“不同意”类 型的则低于“同意”类型的得益和平均得益。
由于 xi t 取0、1、2三个整数。因此上述反应规则实际就 是。如果在t时期博弈方i的两个邻居中只要有1个采用A,那 么博弈方在在t+1时期采用A.如果两个邻居都没有采用A。 那么博弈方i在t+1时期采用B 。 特点:博弈方i在t+1时期的策略与自己在第t期采取策略 反而没有直接关系;
最优反应动态模拟:初次博弈1个A
5.2.1 协调博弈的有限博弈方快速学习模型
博弈方2 A B A B 50,50 0,49 49,0 60,60
协调博弈
通过纳什均衡分析不难发现,该博弈有两个纯策略纳什均衡A,A) 和(B,B)。这两个纳什均衡中,后者明显帕累托优于前者。前者是相对 于后名的风险上策均衡。 因此、如果是在完全理性博弈方之间进行这个博弃,通常的预测结 果应该是(B, B),但如果我们考虑博弈方相互对对方理性的信任问题, 或者对风险的敏感性等因素,那么风险上策均衡(A,A)可能是更好的预 测:也就是说,由于该博弈是一个有多重纳什均衡的博弈,因此在一次 性博弈中,博弈结果也有不确定性,很难作出完全保险的预测。这种协 调博弈正是人们在决策方面经常遇到的难题。
5.3.1 签协议博弈的复制动态和进化稳定策略
签协议博弈:
同意
同意 不同意 1,1 0,0
博弈方2
不同意
0,0 0ቤተ መጻሕፍቲ ባይዱ0
假设群体中采用“同意”博弈方的比例x,则不同策 略期望得益和平均得益为:
u y x 1 (1 x) 0 x un x 0 (1 x) 0 0 u x u y (1 x) un x 2
在上述协调博弈最优反应动态的两种稳定状态中, 只有所有博弈方都采用A的一种同时具有在博弈方的 动态策略调整中会达到,又对少量偏离的扰动有稳 健性两个性质。同时具有这两种性质的稳定状态, 在进化博弈论中被称为“进化稳定策略”
A称为进化稳定策略,B则不是进化稳定策略。因 为一旦某个博弈方偏离B,那么最优反应动态会使博弈 方的策略离该状态越来越远,因此该均衡并不是真正 稳定的。
签协议博弈:
同意
同意 不同意 1,1 0,0 博弈方2
不同意
0,0 0,0
两个纯策略纳什均衡:(同意,同意),(不同意,不同意), 前一个纳什均衡帕累托优于后一个纳什均衡。假如是在完全理 性的基础上进行该博弈,可以预期结果是(同意,同意)。 下面是在理性层次较低的有限理性博弈方组成的大群体成员 随机配对反复博弈的分析框架内进行分析。
有限理性博弈分析的关键是确定博弈方学习和调 整的模式(机 制),进化博弈主要采用的是生物进化 的“模仿者动态”机制模拟博弈方 的学习和动态调 整,但由于博弈方的学习能力的差异,需要多种机 制来模拟。



最优反应动态:有快速学习能力的小群体成员的反 复博弈 复制动态:学习速度很慢的成员组成的大群体随机 配对的反复博弈 进化稳定策略(ESS)
3 2.215 2.25
4 1.875 1.9375
……
不难看出,上述动态调整过程趋向收敛于两寡头各生产 2单位产量,也就是完全理性博弈的古诺产量,也就是惟一的 纯策略纳什均衡。 这正是这个有限理性博弈的稳定状态,由于这个稳定状 态也具有对微小扰动的稳健性,因此它是这个博弈在上述最 优反应动态下的进化稳定策略(ESS)。
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方快速学习模型 5.2.2 古诺调整过程
5.2.1 协调博弈的有限博弈方快速学习模型 前提:少数有快速学习能力的有限理性的博弈方之间
的反复博弈和策略进化这种分析框架对博弈方的理 性假设为相当快的学习能力,虽然在复杂局面下准确 判断分析和运用预见性的能力较差,但它们能对不同 策略的结果作出比较正确的事后评估并相应地调整 策略。
博弈方2 A B
1
A B
50,50
0,49
49,0
60,60
5 4
3
2
协调博弈
采用A的得益:xi (t ) 50 [2 xi (t )] 49 采用B的得益:xi (t ) 0 [2 xi (t )] 60 当xi (t ) 22 / 61 时,采用A;当xi (t ) 22 / 61 时,采用B
5.3 复制动态和进化稳定性: 两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定策略 5.3.3 协调博弈的复制动态和进化稳定博弈 5.3.4 鹰鸽博弈的复制动态和进化稳定策略 5.3.5 蛙鸣博弈的复制动态和进化稳定策略
5.3.1 签协议博弈的复制动态和进化稳定策略
5.2.2 古诺调整过程
q1 3
古诺模型反应函数
q2
q2 2 q 3 1 2
假设:这两个博弈方都是有限理性的,但都属于知道自己的反应 函数(意味着知道自己的利润函数),只是不知道对方的利润、 反应函数,也没有预见能力。
最优反应动态模拟:
博弈方1 博弈方2
1 2.5 3
2 1.5 1.75
博弈论分析研究的是参与人在特定的问题中的 行为和策 略,因此重要的不是人们始终一贯 的理性,而是在具体问题上 的理性,因此在具体问题中完全理性的假定仍有可能成立,但 理性的局限的情况也很普遍。在分析复杂问题时就可能具有很 大的理性局限性。 如果具体的博弈中博弈方不满足完全理性的假设,称为有 限理性博弈方(boundedly rational player),相应地有有限理 性博弈。 完全理性包括理性知识、分析推理能力、识别判断能力和 准确行为能力等多方面完美性要求,其中任何一方不完美就不 是完全理性。但有限理性有多种情况和层次:较高的层次和较 低的层次。 有限理性意味着博弈方往往不会一开始就找到 最优策略而 是会“在战争中学习战争”,必须通过“试错”来寻找较好的 策略。
5.1.2 有限理性博弈分析框架
在有限理性博弈中具有真正稳定性和较强预测 能力的均衡,必须是能够通过博弈方的模仿、 学习 的调整过程达到的,具有能经受错误偏离的干扰 的 均衡,是在受到少量干扰后仍然能够“恢复”的均 衡。这时博弈分析的核心不是博弈方的最优策略的 选择,而是有限理性的博弈方组成的群体成员的策 略调整过程、趋势和稳定性,这里的稳定性是指采 用特定策略的成员的比例不变,而非某个博弈方的 策略不变
第五章 有限理性和进化博弈
本章介绍有限理性基础上的进化博弈分析。 完全理性在现实中很难满足,当社会经济环境和 决策问题较复杂时,人们必须存在很大的理性局 限。有限理性对人们的决策、行为选择方式有很 大影响,有限理性基础上的博弈分析与完全理性 博弈分析也有很大区别。进化博弈分析是有限理 性博弈分析的基本框架。本章介绍以最优反应动 态和复制动态为核心,以进化稳定策略为基本均 衡概念的进化博弈分析,包括基本方法、概念和 各种经典模型等。
A B B B A A A A A A A A B A B B B B A B A A A B
A
5个博弈方经过4个时期的调整,最终收敛到了所有博弈方 都采用A的稳定状态。
初次博弈相邻2个A
B
A
A A A A A A
B
B A
A
B A A
初次博弈相连3个A
A
B B A A A A
A
A A
结论:除了初次博弈时所有博弈方都采用B的一种情况以 外,从其余所有的情况出发,经过或多或少时期的最优 反应动态法则的调整,最终都会收敛到所有博弈方都采 用A的稳定状态。 上述分析证明了在上述设定下,所有32种可能种初次博 弈情况中,只有一种是稳定于所有博弈方采用B的状态,其余 31种都会收敛到采用A的状态。这说明所有博弈方都采用A策 略和所有博弈方都采用B策略都是有限理性博弈方进行协调博 弈的稳定状态。 所有博弈方都采用A的稳定状态是具有稳健性的,相反, 所有博弈方都采用B的均衡状态却不是稳健的。
5.2.1 协调博弈的有限博弈方快速学习模型
博弈方2 A B A B 50,50 0,49 49,0 60,60
• 假设共有5个博弈方分别 处于如图中圆周上的5个 位置上(可理解为5户居 民环山而居),每户居民 都与各白的左右邻居反复 博弈。
协调博弈 1
5 4 3
2
反应、策略调整规则推导
A B
博弈方2 A B
进化稳定策略的检验
比例的博弈方偏离“同 意”策略选择了“不同 意”
u y (1 ) 1 0 1 un (1 ) 0 0 0 u (1 ) u y un (1 ) 2
只要博弈方有基本的、包括直觉和经验的判断能力, 早晚会发现上述得益差异,得益较差类型的博弈方或早 或迟会发现改变策略对自己是有利的,并开始模仿另一 种类型的博弃方。 这意味着两种类型博弈方的比例x和1-x不是固定 不变的,而是随时间变化的,可以写成时间的函数。
相关文档
最新文档