经济学第五章博弈论
博弈论完整版PPT课件
![博弈论完整版PPT课件](https://img.taocdn.com/s3/m/c8e69341591b6bd97f192279168884868762b804.png)
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
第五章有限理性和进化博弈ppt课件
![第五章有限理性和进化博弈ppt课件](https://img.taocdn.com/s3/m/0674a61b326c1eb91a37f111f18583d049640f31.png)
在整堂课的教学中,刘教师总是让学 生带着 问题来 学习, 而问题 的设置 具有一 定的梯 度,由 浅入深 ,所提 出的问 题也很 明确
演化博弈的关注内容
❖ 演化博弈强调经济变迁过程中以个体多样 性变异机制和偏好选择机制为代表的种群 研究。
❖ 它探讨种群选择的策略是否获得最佳的收 益,并消除任何小的突变群体的扰动。
5.3 复制动态和进化稳定性: 两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定
策略 5.3.3 协调博弈的复制动态和进化稳定博弈
在整堂课的教学中,刘教师总是让学 生带着 问题来 学习, 而问题 的设置 具有一 定的梯 度,由 浅入深 ,所提 出的问 题也很 明确
在整堂课的教学中,刘教师总是让学 生带着 问题来 学习, 而问题 的设置 具有一 定的梯 度,由 浅入深 ,所提 出的问 题也很 明确
❖ 在演化博弈中,认为参与人的选择行为可以 依据前人的经验、学习与模仿他人行为、受 遗传因素的决定等。
❖ 因而演化博弈把具有主观选择行为的参与人 扩展为包括动物、植物在内的有机体,动植 物参与者的支付可被理解为为某种适应程度。
经济学与生物学
经济学 企业 最优化 策略 利润 扩张 倒闭 创新
生物学 物种(或个体)
适应 基因 适应性(fitness) 繁殖 灭绝 变异
在整堂课的教学中,刘教师总是让学 生带着 问题来 学习, 而问题 的设置 具有一 定的梯 度,由 浅入深 ,所提 出的问 题也很 明确
自然界中的博弈
❖ 吸血蝙蝠夜间去大型哺乳动物那里吸血,有些个 体偶尔会空腹而归,此时吸饱血的个体就会吐出 胃内的血液喂给饥饿的个体,尽管它们之间并没 有直接血缘关系。
博弈论知识点总结完整版
![博弈论知识点总结完整版](https://img.taocdn.com/s3/m/dc2004506fdb6f1aff00bed5b9f3f90f76c64d05.png)
博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。
它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。
下面是博弈论中的一些重要知识点的总结。
1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。
-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。
-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。
2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。
-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。
3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。
-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。
-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。
4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。
-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。
-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。
5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。
-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。
-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。
6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。
-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。
-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。
7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。
-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。
《产业经济学》第五章--(博弈1)讲解
![《产业经济学》第五章--(博弈1)讲解](https://img.taocdn.com/s3/m/948b5fe1294ac850ad02de80d4d8d15abe2300dd.png)
在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。
经济学中的博弈论分析
![经济学中的博弈论分析](https://img.taocdn.com/s3/m/45b907cc4793daef5ef7ba0d4a7302768e996f02.png)
经济学中的博弈论分析引言:经济学中的博弈论是一种研究决策者之间相互作用的理论框架。
它通过分析不同决策者的策略选择和可能的结果,揭示了在不同情境下决策者之间的相互影响和决策结果。
本文将探讨博弈论在经济学中的应用,并通过几个具体案例来说明其分析的重要性和实用性。
一、博弈论的基本概念博弈论是研究决策者之间相互作用的理论框架,它主要包括博弈的参与者、策略选择和结果等基本概念。
在博弈论中,参与者可以是个人、公司、国家等,他们根据自身的利益和目标选择不同的策略,而结果则取决于各个参与者的策略选择。
二、博弈论在市场竞争中的应用1. 零和博弈:零和博弈是一种参与者利益完全相反的博弈情境。
在市场竞争中,企业之间的价格战可以被看作是一种零和博弈。
企业在制定价格策略时,需要考虑对手的反应,以及自身的利润最大化。
通过博弈论的分析,企业可以更好地理解竞争对手的行为,从而制定出更有效的策略。
2. 合作博弈:合作博弈是一种参与者通过合作达成共同利益的博弈情境。
在市场中,企业之间可以通过合作来实现资源共享、降低成本等目标。
例如,多家电信公司联合建设基础设施,共享网络资源,既能降低成本,又能提高服务质量。
博弈论的分析可以帮助企业确定最优的合作策略,实现资源的最大化利用。
三、博弈论在战略决策中的应用1. 囚徒困境:囚徒困境是博弈论中的一个经典案例。
在囚徒困境中,两名囚犯面临合作与背叛的选择。
如果两名囚犯都选择合作,则可以得到较轻的刑期;如果两名囚犯都选择背叛,则会得到较重的刑期;如果一方选择合作,而另一方选择背叛,则合作方会得到最重的刑期。
这个案例揭示了在某些情境下,个体追求自身利益可能导致最不理想的结果。
在实际生活中,囚徒困境的思考可以引导我们在战略决策中更好地平衡个体和集体利益。
2. 竞争与合作:在国际关系中,各国之间的竞争与合作也可以用博弈论的理论框架来解释。
例如,两个国家之间的贸易争端可以被看作是一种博弈。
各国在制定贸易政策时,需要权衡自身的利益和对手的反应。
经济学博弈论
![经济学博弈论](https://img.taocdn.com/s3/m/a72de12f03020740be1e650e52ea551810a6c96f.png)
经济学博弈论一、什么是博弈论?博弈论是一门研究决策者进行互动决策的数学理论。
其中的决策者称之为玩家,他们之间的互动称之为博弈。
博弈模型通常包括参与人数、规则、目标、信息等方面。
二、博弈论的应用领域博弈论有广泛的应用领域,如经济学、政治学、心理学、生物学等。
其中,经济学是博弈论的主要应用领域之一。
在经济学中,博弈论通常用于研究市场竞争、合作与冲突等问题。
三、博弈的分类博弈可以按参与者数目、信息量、回合数等多种不同方式进行分类。
按参与者数目,博弈分为两人博弈和多人博弈;按信息量,博弈分为完全信息博弈和不完全信息博弈;按回合数,博弈分为一次性博弈和多次博弈。
四、博弈论的基本元素博弈论是建立在一系列基本元素之上的。
其中,玩家、策略、收益是博弈论的重要组成部分。
玩家是指参与博弈的个体或集合体,策略是指玩家为获取最大收益而做出的行动选择,收益则是指在博弈中各个决策方案的结果对各玩家的实际利益。
五、博弈的解博弈的解是指在博弈过程中,对博弈中各方所采取的策略的一种合理性的结论。
博弈论的解通常分为纳什均衡、占优策略均衡、演化稳定策略等多种形式。
其中,纳什均衡是最常见的博弈解决方法。
六、经典案例:囚徒困境囚徒困境是博弈论中最经典的博弈之一。
它是两个囚犯招供还是保持沉默的选择问题。
如果两人都招供,各自将面临3年的刑期;如果两人都保持沉默,各自将面临1年的刑期;如果一个人招供,而另一个人保持沉默,则招供者将面临1年的刑期,而另一个人则将面临10年的刑期。
七、结语博弈论的应用领域越来越广泛,以经济学为例,它为我们提供了在市场竞争中作出更优决策的理论依据。
通过博弈论的理论研究,我们可以更深入地理解人类博弈行为的规律性和本质,也可以借助博弈的模型为人类社会做出更好的改变。
经济学 博弈论
![经济学 博弈论](https://img.taocdn.com/s3/m/699f4b28cd7931b765ce0508763231126fdb774e.png)
经济学博弈论
经济学是研究资源分配和决策制定的学科。
博弈论是经济学中的一个重要分支,研究人们在决策过程中的相互关系和策略选择。
博弈论以一种类似游戏的方式描述人们之间的决策行为。
在博弈论中,参与者根据其他参与者的行为和可能的结果来制定自己的策略。
博弈论通过数学模型和分析来研究参与者的最佳决策策略以及可能的结果。
在博弈论中,常见的博弈模型包括零和博弈、合作博弈和非合作博弈。
零和博弈是一种互相对抗的模型,参与者之间的利益完全相反。
在零和博弈中,一方的收益就是另一方的损失。
合作博弈是一种参与者之间可以合作的模型,参与者可以通过合作来实现共同的利益。
非合作博弈是一种参与者之间不能合作的模型,每个参与者都追求自己的最大利益。
博弈论在经济学中的应用广泛。
在价格竞争中,企业之间会进行非合作博弈,每个企业都会制定自己的定价策略以追求市场份额和利润最大化。
在拍卖市场中,卖方和买方之间也会进行博弈,卖方希望以最高的价格卖出商品,而买方则希望以最低的价格购买商品。
博弈论还可以应用于战略决策、合作关系、资源分配等领域。
通过对参与者行为和策略的建模和分析,可以帮助人们更好地理解经济行为和市场运作。
博弈论的研究成果也可以为决策者提供指导,帮助他们做出最佳的决策。
经济学博弈论是一门重要的学科,它研究人们在决策过程中的相互关系和策略选择。
通过建立数学模型和分析,博弈论可以帮助我们更好地理解经济行为和市场运作,并为决策者提供决策支持。
经济博弈论5
![经济博弈论5](https://img.taocdn.com/s3/m/7d88ef4c767f5acfa1c7cda4.png)
一个策略组合和相应的判断满足下列4个要求, 称为一个“完美贝叶斯均衡”:
要求1:在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到 该信息集中每个节点可能性的“判断”。对非单节点信息集,一个“判 断”就是博弈达到该信息集中各个节点可能性的概率分布,对单节点信 息集,则可理解为“判断达到该节点的概率为1” 要求2:给定各博弈方的“判断”,他们的策略必须是“序列理性”的。 即在各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续策 略”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的得益 或期望得益最大。此处所谓“后续策略”即相应的博弈方在所讨论信息 集以后的阶段中,针对所有可能情况如何行为的完整计划 要求3:在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方 的均衡策略决定 要求4:在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各 博弈方在此处可能有的均衡策略决定
i 1
P( Bk | A)
P( Bk ) P( A | Bk )
P( B ) P( A | B )
i 1 i i
n
k 1,2,, n
5.2.1 完美贝叶斯均衡定义
在不完美信息动态博弈中纳什均衡和子 博弈完美纳什均衡都不能解决问题,需 要引进新的均衡概念 纳什均衡和子博弈完美纳什均衡分析方 法,反应函数和逆推归纳法等同样也要 改进、变化
市场类型归纳
pg (V P) pb (W P)
市场 部分 成功 0
市场 完全 成功 P
市场接 近失败 或 完全失败
市场 完全 成功
C
单一价格二手车交易的解
5.4 双价二手车交易
5.4.1 双价二手车交易博弈模型 5.4.2 模型的均衡
经济学 博弈论
![经济学 博弈论](https://img.taocdn.com/s3/m/064e6d517f21af45b307e87101f69e314332fa12.png)
经济学博弈论
经济学中的博弈论是一个重要的分支领域,它研究的是在多个参与者之间互动决策的情境下,他们可能采取的不同策略以及相应的结果。
博弈论在经济学中有广泛的应用。
下面是一些博弈论的基本概念和常见的博弈类型:
1. 策略(Strategies):参与者在博弈中可选择的行动或决策。
2. 支配策略(Dominant Strategies):一种策略在所有情况下都会产生更好的结果,无论其他参与者选择什么策略。
3. 纳什均衡(Nash Equilibrium):在博弈中,当每个参与者都选择了对自己最有利的策略,并且没有动机单独改变策略时,达到的状态就是纳什均衡。
4. 合作与背叛(Cooperation and Betrayal):博弈中参与者可以选择合作或背叛其他参与者,涉及到合作博弈和非合作博弈的概念。
5. 零和博弈(Zero-sum Game):参与者的利益总和为零,一个人的收益增加意味着其他人的收益减少。
6. 非零和博弈(Non-zero-sum Game):参与者的利益总和不一定为零,可以存在合作使得所有参与者都获益的可能性。
7. 重复博弈(Repeated Games):博弈过程会重复进行多次,参与者的策略可能受到之前行动的影响。
这些只是博弈论的基本概念,实际应用中还有更多复杂的情况和模型。
博弈论在经济学中可以用来分析市场竞争、企业战略、拍卖、资源分配等众多领域。
它对于理解和预测人类行为决策的影响具有重要意义。
经济博弈论
![经济博弈论](https://img.taocdn.com/s3/m/72abf1ef294ac850ad02de80d4d8d15abe2300ea.png)
非合作博弈强调个体理性
(individual rationality),就是
从个体的角度考虑策略选择,使得
个体收益最大。所以非合作博弈研
究的是参与者在利益相互影响的情
况下如何选策略使自己的收益最大,
即策略选择问题。
约翰·纳什 (J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。
1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体(可以是个人,也可以是团体);
2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策;
3、策略是指参与人选择行动的规则,即在博弈 进程中,什么情况下选择什么行动的预先安排;
第一节 引言
1
博弈理论简介
博弈论(Game Theory):研究具有斗争或竞争性质现象的理 论和方法。
三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集
分类: 合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈;
研究博弈论的意义:理解人类的经济行为;理解社会和生态 物种系统中的合作行为以及自自组织斑图。
13
从游戏到博弈
游戏的特点:下棋,打牌,赌博,田径, 球类等等,共同的特点是策略
策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略和 利益的依存性
14
想一想
假如你正跟恋人用手机通电话,突 然信号断了。这时,你会立即拨电话 过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,取 决于你的恋人是否会拨过来。如果你 们其中一方要拨,那么另一方最好是 等待;如果一方等待,那么另一方就 最好是拨过去。因为如果双方都拨, 那么就会出现线路忙;如果双方都等 待,那么时间就会在等待中流逝。
博弈论 经济学
![博弈论 经济学](https://img.taocdn.com/s3/m/486f49d8afaad1f34693daef5ef7ba0d4a736da3.png)
博弈论经济学
博弈论是现代经济学中重要的分支之一,主要研究人们在互相作
用的场景中所做的决策,这些场景中包括市场竞争、战略合作和纳什
均衡等。
博弈论对于深入理解市场运作、战略合作以及政府政策制定
起着至关重要的作用。
在市场竞争场景中,博弈论告诉我们,每个参与者都会基于自身
的利益来做出决策,并在不断的博弈中最终寻求达成最优解。
比如,
在一个两家公司之间的市场中,如果两家公司都以降价来争取顾客,
那么他们最终可能在价格战中损失惨重。
但是,如果他们能够通过谈
判或者合并来达成协议,那么双方都可以获得更好的投资回报,这就
是博弈论的合作战略所能带来的动力。
在战略合作场景中,博弈论告诉我们,通过深思熟虑并不断调整
既可实现理想目标。
比如,在军队领导者的战争中,策略方案一般是
经过博弈论的思考而确定的,同时在完善策略过程中还会不断地修正,以适应不断变化的战争环境。
又如,在企业合作或合作投资中,博弈
论的思想也是非常重要的,只有在强调企业共赢和良好合作基础上,
企业才可能获得更大收益。
在政府政策制定场景中,博弈论告诉我们,如何在不同利益方之
间制定协调点才是最关键的。
比如,在制定税收政策的过程中,政府
需考虑公民和企业的利益,以及公共财政预算的平衡等因素。
这种复
杂的应用场景中,博弈论的策略思维和模型方法很好地应用了进来。
总之,博弈论对于现代经济学的发展起到了重要的作用,它不仅让我们更好地理解市场、战略、政策等方面问题的本质,更是为我们提供了一种有效的决策方法,使我们更具有创造力和竞争力,更好地适应不同的环境。
经济博弈论基第五章动态贝叶斯博弈
![经济博弈论基第五章动态贝叶斯博弈](https://img.taocdn.com/s3/m/2f81f5964028915f814dc215.png)
s i
i
(B)Pi ( i
a
h i
)
是局中人
i观测到
a
h
和最优策略
i
s
*
i
(
)
后,使
用贝叶斯法则从先验概P率i (i i ) 得到的。
六、不完美信息博弈的完美贝叶斯纳什均衡
例1:完美贝叶斯纳什均衡是{M, U; p=1}
1
L (1, 3)
U
M [p] R [1-p]
2
1、Milgrom-Roberts (1982)垄断限价模型
传统解释的问题:价格作为一种承诺是不可置信的,因 为无论垄断者现在索取什么价格,一旦其他企业进入,垄断者 就会改变价格,因此,靠低价格是不可阻止进入的。
Milgrom-Roberts (1982)提出的解释:垄断限价可能反映 了这样一个事实,即其他企业不知道垄断者的生产成本,垄断 者试图用低价格来告诉其他企业自己是低成本,进入是无利可 图的。
一、KMRW声誉模型
如果下列条件满足,囚徒2将选择X=不坦白: 11p-14≥5p-12 p ≥1/3
即如果囚徒1属于非理性的概率不小于1/3,囚 徒2将在第一阶段选择“不坦白”(合作)。
一、KMRW声誉模型
下面考虑博弈重复三次(T=3)的情况:
给定p≥1/3,如果理性囚徒1和囚徒2在第一阶段都选择 “不坦白”(合作),那么第二、三阶段的均衡路径与前表相 同(X=不坦白),总的均衡路径如下表:
2、博弈顺序
(1)自然首先选择囚徒1的类型,囚徒1知道自己的类型, 囚徒2只知道囚徒1属于理性的概率是1-p,非理性的概率是p;
(2)2个囚徒进行第一阶段的博弈;
(3)观察到第一阶段博弈结果后,进行第二阶段博弈; 观察到第二阶段博弈结果后,进行第三阶段博弈;如此等等。
博弈论(第五章)
![博弈论(第五章)](https://img.taocdn.com/s3/m/bd249ae55fbfc77da269b1e8.png)
3.复制动态和进化稳定性:两人对称博弈
鹰鸽博弈的复制动态和进化稳定策略:揭示人类社会或动 物世界发生战争或冲突的可能性及频率,国际关系中霸道 和软弱,侵略与反抗等共存的原因。
鹰
博 弈 鹰 方 1 鸽
博弈方2
鸽
(v-c)/2, (v- c)/2
v ,0 v/2,v/2
0,v
谢富纪 2008年4月 18
3.复制动态和进化稳定性:两人对称博弈
dx/dt
0
0.5
1
x
签协议博弈复制动态相位图
谢富纪 2008年4月
19
3.复制动态和进化稳定性:两人对称博弈
x*=0,x*=1是上述复制动态的两个稳定状态,其中 x*=1是对应大多数初始状态的稳定状态 。 有限理性的博弈方通过学习最终找到了本博弈比较有效 率的纳什均衡。 x*=1是进化稳定策略,而x*=0则不是。
B B
B
B A
B
A
A
A A
A A
A A
A A
初次博弈为1A的最优反应动态
谢富纪 2008年4月 11
2.最优反应动态
B
A
A
B
A
B
A
A
A
B
A
A
A
A
A
初次博弈为相邻2A的最优反应动态
谢富纪 2008年4月 12
2.最优反应动态
A B A A
A A
B
A
A
A
初次博弈为相邻3A的最优反应动态
谢富纪 2008年4月 13
第五章 有限理性和进化博弈
前面分析基本是假定博弈方具有完全的理性,但对 于现实中的决策者来说往往外很难满足这一要求,
第五章博弈论的思想方法及其应用
![第五章博弈论的思想方法及其应用](https://img.taocdn.com/s3/m/7f825b6aed630b1c59eeb5b4.png)
到3,然后又由3下降到2.中间这个
Operational Research
对策论(博弈论)
要想在现代社会做一个有文化的人, 你必须对博弈论有一个大致了解.
——诺贝尔经济学奖获得者
Paul Samuelson
❖ 博弈论(The Games Theory)是运筹学学科的一个重 要分支。具有竞争或对抗性质的行为称为博弈行为, 在这类行为中,参与斗争或竞争的各方各自具有不同 的目标和利益,为了达到各自的目的,各方必须考虑 对手的各种可能的行动方案,并力图选取对自己最为 有利或最合理的方案。
仅失去1。然而,当局中人Ⅱ选择 2时,局中
人Ⅰ就会选择2,这样做比选择 1有利,可使
收益由1增加到3。这时,局中人Ⅰ、Ⅱ都不 愿再改变选择,因为如果局中人Ⅱ改变选择, 失去的不是3,而是5或4,如果局中人Ⅰ改变 选择,其得到的不是3,而是1或2。显然,这 种状态是一种平衡状态。
10.2 矩阵博弈的纯策略
10.1 博弈论的基本概念
❖ 二人有限零和博弈 在众多博弈模型中,占有重要地位的是二人有限零 和博弈,即在博弈只有两个局中人,各自的策略集 只含有限个策略,每局中两个局中人的得失总和为 零(即一个局中人的赢得恰为另一个局中人所输掉 的值),这类博弈又称为矩阵博弈.
10.1 博弈论的基本概念
❖ 【例10.1】田忌赛马 ❖ 战国时期(自公元前475周元王元年起,至公元前221
10.1 博弈论的基本概念
10.1 博弈论的基本概念
❖ 1944年,数学家冯·诺伊曼(J.von-Neumann) 和经济学家摩根施特恩(O.Morgenstern)写 成了《博弈论与经济行为》一书,这是博弈 论这一分支的经典之作.
复旦大学-谢识予-经济博弈论5(不讲,自学)
![复旦大学-谢识予-经济博弈论5(不讲,自学)](https://img.taocdn.com/s3/m/18ab960ceff9aef8941e06a3.png)
1
不进
2
不打
(1,5)
u 2 s x 0 (1 x ) 5 5 5 x u 2 n x 2 (1 x ) 5 5 3 x u 2 y u 2 s (1 y )u 2 n 5 2 xy 3 x
(0,0) (2,2)
博弈方1位置博弈群体复制动态相位图
dx dt
F ( x ) x (1 x )[ x ( a c ) (1 x )( b d )]
x (1 x )( 61 x 11)
一般2*2对称博弈
dx/dt
复制动态进化博弈的结果 常常取决与带有很大偶然 性的初始状态。
1 x
11/16
5.3.4 鹰鸽博弈的复制动态 和进化稳定策略
dy/dt 1 y 1 y
y[u 2 e u 2 ] y (1 y )(1 6 x )
dy/dt
x<1/6
x>1/6
dy/dt 1 y
x=1/6
两群体复制动态关系和稳定性
A
B
Y 1
5/6
C
1/6
D
1
x
5 3
2
协调博弈
反应、策略调整规则推导
采用 A 的得益: xi (t ) 50 [ 2 xi (t )] 49 采用 B 的得益: xi (t ) 0 [ 2 xi (t )] 60 当 xi (t ) 22 / 61时,采用 A ;当 xi (t ) 22 / 61时,采用 B
博弈方2 鹰
vc 2
鸽 v, 0
v 2
鹰 鸽
, vc
2
0, v
,
经济学中的博弈论
![经济学中的博弈论](https://img.taocdn.com/s3/m/a5b9b30e842458fb770bf78a6529647d272834fc.png)
经济学中的博弈论博弈论是一门研究决策制定者之间相互作用的学科,它在经济学中扮演着重要的角色。
博弈论的理论框架帮助我们解释和预测各种经济现象,从市场竞争到政府政策制定,都离不开博弈论的基本原理。
本文将对经济学中的博弈论进行探讨,并从博弈论的模型和策略入手,解析其在经济学中的应用。
一、博弈论的基本概念博弈论是研究决策制定者在相互作用中的策略选择和结果分析的学科。
在博弈论中,参与者通常会根据其他参与者的行为来制定最优策略。
博弈论研究的核心问题是如何预测和解释参与者的选择,以及他们选择的最终结果。
博弈论的基本概念包括参与者、策略、收益和信息。
在博弈论中,参与者是决策制定者,他们可以是个人、企业、国家等。
策略是参与者作出的行动选择,包括合作与非合作、竞争与妥协等不同策略。
收益是参与者根据选择的策略所获得的结果,可以是经济效益、社会声誉等。
信息是参与者在决策过程中了解其他参与者和环境的信息,信息的不对称性常常是博弈论中的一个关键问题。
二、博弈论的基本模型博弈论的基本模型有正常形式博弈和扩展形式博弈两种。
正常形式博弈是指参与者同时做出一次性的策略选择,并根据选择的策略得到相应的收益。
正常形式博弈通常用博弈矩阵来表示,其中每个参与者的策略选择和相应的收益都被列出。
常见的正常形式博弈包括囚徒困境和博弈中的均衡。
扩展形式博弈是指参与者在一系列决策节点上做出选择,并获得相应的收益。
扩展形式博弈通常用博弈树来表示,并通过反向归纳的方式求解博弈的结果。
扩展形式博弈可以描述诸如博弈中的完美平衡和子博弈均衡等概念。
三、博弈论的应用博弈论在经济学中有广泛的应用,可以从市场竞争、政府政策制定等多个方面进行分析。
在市场竞争中,博弈论可以帮助我们理解企业之间的策略选择和竞争结果。
例如,双头垄断模型可以用来分析OL市场上的搜索引擎竞争;互惠博弈模型可以用来解释企业之间的战略合作和分裂等行为。
在政府政策制定中,博弈论可以帮助我们预测政府间的策略选择和政策结果。
经济学中的博弈论和博弈策略
![经济学中的博弈论和博弈策略](https://img.taocdn.com/s3/m/0518bf842dc58bd63186bceb19e8b8f67c1cefe2.png)
经济学中的博弈论和博弈策略博弈论是经济学中的一个重要分支领域,研究的是人们在互动中做出决策的过程和结果。
博弈论的一个基本前提是,个体的决策是与其他个体的决策相互作用的结果。
因此,博弈论的研究的是人们在不同的情境中如何通过自身的决策来达成最优结果。
博弈策略则是在博弈论基础上的应用,通过采取不同的策略来获得最优的结果。
博弈论的基本概念和定义博弈论的基本概念是博弈,它由参与者、策略和收益三个要素组成,参与者指的是各自做出决策的个体,策略指的是个体可取的各种行动方式,收益则是个体做出某种策略后能够获得的效益或利润。
在博弈论中,最常用的模型是囚徒困境模型,它是一个包含两个参与者的博弈模型。
在这个模型中,每个参与者必须决定是合作还是背叛另一个参与者。
如果两个参与者都合作,他们将获得较高的奖励;如果两个参与者都背叛,则将获得较低的奖励。
然而,如果一个参与者合作而另一个参与者背叛,那么合作的参与者将遭受惩罚,背叛的参与者将获得最大利润。
博弈策略的基本思路博弈策略的基本思路是采取不同的策略来达到最有利的结果,也就是说,在面对博弈过程时,个体可能会根据不同的方式来作出决策。
博弈策略分为纳什均衡、占优策略和混合策略三类。
纳什均衡是指当所有参与者都做出最优决策的情况下产生的结果,这个结果应该是博弈中出现频率最高的结果。
占优策略是指在博弈中,参与者通过分析对方的策略和自己的策略,找到一种策略最优的方式。
混合策略则是在纳什均衡和占优策略的基础上,将某些策略进行混合,以获得最优的结果。
博弈策略的应用博弈策略在经济学中有着广泛的应用,例如市场竞争、投标竞标、战略出售、政治投票等等。
在市场竞争中,企业可以采取不同的价格,生产量和产品质量等策略以达到市场最优位置。
在投标竞标中,企业可以采取竞价和参与不同的招标方式。
在战略出售中,企业可以采取不同的销售决策,如是否采取竞价、价格和销售规模的等等决策。
在政治投票中,候选人可以根据民意调查结果制定不同的竞选策略,例如目标选民,口号和导向等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈的扩展形式
• 用收益矩阵表达博弈时,容易掩盖这样一个事 实:其中一个参与人在做出自己的选择以前, 必须先要揣测另一个人的选择。因此,我们用 扩展形式来表达博弈。它可以显示选择的次序 A,B 。 因为A一开始只会选择 参与人B的选 “下”,因为他知道自己 • 1,8 左 择
同学B
左
上 同学A 下 0 ,0 1,0
右
0,-1 -1,3
三、混合策略
• 纯策略:每个人只选择一种策略并一直坚持这个选 择。前面我们所讲到的博弈是一种纯策略。 • 混合策略:参与人选择策略是随机的。即参与人一 定的概率来选择策略。例如:A可能以50%的概率选 择“上” , 50%的概率选择“下” ,B以50%的概 率选择“左” ,以50%的概率选择“右”,此时, A的平均收益为0,B的平均收益为1/2。 • 混合策略纳什均衡:给定其他人参与人的策略选择 概率,每个参与人都为自己确定了选择每一种策略 的最优概率。
一、博弈的收益矩阵
• 策略互动可以涉及许多参与人和许多策 略,但我们的分析却只限于策略数量有 限的双人博弈。 • 我们用收益矩阵来表示博弈。
• 收益矩阵可以描述策略参与人在选择策 略时各自的收益。它可以帮助参与人做 出策略选择。
收益矩阵
• 假如有两位同学A和B玩一个游戏, A在纸上单独 写“上和下”,B在纸上单独写“左和右” 。 • 如果A写了“上”,B写了“左”,则A得1块钱奖 励,B得2块钱奖励。 • 如果A写了“上”,B写了“右”,则A得0块钱奖 励,B得1块钱奖励。 • 如果A写了“下”,B写了“左”,则A得2块钱奖 励,B得1块钱奖励。 • 如果A写了“下”,B写了“右”,则A得1块钱奖 励,B得0块钱奖励。
左 上 同学A 下 2 ,1 0,0 右 0,0 1,2
• B选“左”时,A选“上”好;B选“右”时,A选 “下”好。A的最优选择取决于他对B的选择的预 期。 • 因此,每个人都有动机去了解对方的最优选择。
纳什均衡
• 如果给定B的选择,A的选择是最优的,并且给定 A的选择,B的选择也是最优的,那么,这样一组 策略就是一个纳什均衡。 • 注意:每个人在做选择时,都不知道另一个人的 策略,但每个人都会对另一个人将要选择的策略 作出预期。 • 一个纳什均衡可以看作是关于每个参与人的策略 选择的一组预期,这些预期使得当任何一个人的 选择被揭示后,没有人愿意改变自己的行为。
你如果是A,你该写什么,如果是B,该写什么?
画收益矩阵
• 首先描述参与人,一个左,一个上; • 再描述每个参与人各自可选的策略; • 再写出每个策略下参与人的收益,左边的数字代 表写在左边的参与人的收益,右边的数字代表写 1
下
2,1
1,0
存在多个纳什均衡的博弈
• 在以下收益矩阵中,策略(上,左)是一个纳 什均衡。因为如果A的最优选择是“上”,B的 最优选择是“左”;如果B的最优选择是“左 ”,A的最优选择是“上”。即给定期他人的 选择,每个参与人都做出了最优的选择。 • 同时,(下,右)也是一个纳什均衡。 同学B • 古诺均衡也是纳什均衡。
5.1、有限次重复博弈
• 如果参与人事先都知道,博弈将进行某个固定的次 数,如10次。则每个参与人会在每一局选择背信。 因为如果参与人无法在最后一局实行合作,那么, 在倒数第2局也将无法实行合作。 • 假如参与人处在第10局(最后一局),因为这是最 后一次博弈,每个参与人都会选择背信(这是占优 策略均衡),即最后一次博弈如一次性博弈。那么 在第9局,参与人也就都会采取背信。因为如果你选 择合作,另一个人将利用你的善良获利,背信仍是 他的占优策略。以此类推,在每一局中,参与人都 会不守信。
无限次重复博弈和卡特尔
• 实行卡特尔是指两家垄断厂商共同索要高价从而获取 巨额利润。如果有一家厂商索要高价,则另一家厂商 稍微降价就能夺取对方的市场,获得比合作更高的利 润。如果两家厂商都选择降价,他们只能获得比合作 更低的利润。无论对手索要什么价格,你降价总是有 利。因此,纳什均衡是双方都降价。 • 但是如果博弈重复无限次,则每家厂商会采取针锋相 对的策略,即你降价我也降价,并且每个参与人都知 道对方会采取针锋相对的策略,则每个人就会担心因 自己的降价而触发价格战。 • 因此,针锋相对所隐含的威胁将维持卡特尔。(例如 :机票定价)
5.2、无限次重复博弈
• 参与人之所以合作,是因为他们希望合作会引致 将来的进一步合作,在有限次重复博弈中,由于 最后一局不再有将来博弈的可能,没有人愿意合 作。
• 而如果是无限次重复博弈,你就有办法影响对手 的行为:如果这次他拒绝合作,那么下一次,你 也可以拒绝合作。只要双方都关心将来的收益, 那么,将来不合作的威胁就足以使他们采取帕累 托有效率的策略——合作。
五、重复博弈
• 如果参与人仅“相遇”一次,博弈的结果是使 他们陷入囚徒困境。但是,如果相同的参与人 重复地进行这个博弈,每个参与人将面对新的 可选择策略。因为如果某参与人在某局博弈中 被背信,那么,其他参与人在下一局中也选择 背信。因此,背信人将“受到惩罚”。从而激 励参与人“守信”。 • 但这种策略可行,要取决于这种博弈是有限次 重复博弈还是无限次重复博弈。
博弈的结果
• 如果你是A,选择“下”总是要好一些,因为他选“ 下”的收益(2或1)大于他选择“上”的收益(1或0 )。 • 如果是B,选择“左”的结果总是要好一些,因为他 选“左”的收益(2或1)大于他选择“右”的收益( 1或0)。 • 在这种情况下,出现了占优策略。它指无论其他参与 人如何选择,每个参与人都有一个最有选择。即无论 B选什么,A选“下”都要好一些,无论A选什么,B选 “左”要好一些。
囚徒困境的收益矩阵
• 从囚徒A的角度来看,不管囚徒B是否坦白,A坦 白要好。同样的情形适用于B。因此,两个囚徒 都坦白,是占优策略均衡,也是纳什均衡。 • 但这个均衡是低效率的。如果双方都选择抵赖, 其境况要好一些。(抵赖,抵赖)是怕累托低效 率的策略组合——没有其他策略选择能够使他们 囚徒B 的境况变得更好。
占优策略
• 如果在某个博弈中,每人参与人都有一个 占优策略,那么,这个占优策略组合(即A 选“下”B选“左”)是该博弈的均衡结果 。因为无论其他参与人如何选择,占优策 略都是该参与人最优的策略。
二、纳什均衡
• 在上一个例子中,我们发现无论B选什么,A选“ 下”都要好,但有时这种情况不能满足。 • 例如: 同学B
坦白 坦白 囚徒A -3,-3 抵赖 0,-6
抵赖
-6,0
-1,-1
• 囚徒困境在经济和政治生活中有着广泛的应用。 • 例如,军备竞赛问题,我们把策略“坦白”改为“ 部署导弹”,把抵赖改为“不部署导弹”。纳什均 衡是双方都会部署导弹。这是低效率的。 • 例如,卡特尔中的欺骗问题。假如当初约定好安限 额生产,即“抵赖”,但每家厂商只要超额生产( “坦白”)是有利可图的,则每家企业都将超额生 产——“坦白”。 • 在上述例子中,双方约定“抵赖”是没用的。如果 要实现这一策略,就必须有惩罚机制。——重复博 弈。
四、囚徒困境
• 该问题要说明:博弈的纳什均衡并不一定导致帕 累托有效率。 • 有两个囚徒被单独关在两个房间里接受审讯。每 个囚徒都可选择坦白或抵赖。如果两个都坦白, 他们将被拘留3个月;如果只有一个人坦白,那么 坦白的可以免予刑事处分,而抵赖的那一位将入 狱6个月。如果两个都抵赖,根据法律,两位都只 能被拘留1个月。 • 请问:两个囚徒的最优选择是什么?有没有纳什 均衡?
左 上 同学A 2 ,1 右 0,0
下
0,0
1,2
海滩售货博弈
0
200
甲 乙
A
甲乙二人在长200米的海滩上卖饮料,海滩上的游客均匀散布。二人 以相同的价格卖同样的饮料,所以买主会向最近的卖主购买。此时惟一的 纳什均衡是什么?为什么?
不存在纳什均衡的博弈
• 如果A选择“上”,B会选择“左”,而B选择 “左”,A又选择“下”。同样,如果A选择“ 下” ,B会选择“右”,但如果B会选择“右 ”, A又会选择“上”。此时,不存在纳什均 衡。
第五章:博弈论
• 博弈论关注的是对 策略互动的一般性分 析,它可以应用于企 业运营博弈、政治谈 判和经济行为。
著名经济学家保罗· 萨缪尔森甚至说:“要想在现代社会做一个有文 化的人,就必须对博弈有一个大致的了解。” 从1994年诺贝尔经济学奖授予3位博弈论专家开始,共有5届的诺贝尔经济学奖与 博弈论的研究有关,分别为: • 1994年,授予美国伯克利加利福尼亚大学的约翰· 海萨尼(J.Narsanyi)、 普林斯顿大学约翰· 纳什(J.Nash)和德国波恩大学的赖因哈德· 泽尔滕( Reinhard Selten)。 • 1996年,授予英国剑桥大学的詹姆斯· 莫里斯 (James A. Mirrlees)与美国 哥伦比亚大学的威廉· 维克瑞(William Vickrey)。 • 2001年,授予美国加州大学伯克莱分校的乔治· 阿克尔洛夫(George A. Akerlof )生于1940年、美国斯坦福大学的迈克尔· 斯宾塞(A. Michael Spence )和美国纽约哥伦比亚大学的约瑟夫· 斯蒂格利茨(Joseph E. Stiglitz)。 • 2005年,授予美国马里兰大的托马斯· 克罗姆比· 谢林(Thomas Crombie Schelling)和耶路撒冷希伯来大学的罗伯特· 约翰· 奥曼(Robert John Aumann)。 • 2007年,授予美国明尼苏达大学的里奥尼德· 赫维茨(Leonid Hurwicz)、美 国普林斯顿大学的埃里克· 马斯金(Eric S. Maskin)以及美国芝加哥大学的罗杰· 迈 尔森(Roger B. Myerson)。 • 作为一门工具学科能够在经济学中如此广泛运用并得到学界垂青实为罕见。
约翰· 冯· 诺依曼(JohnVonNouma,1903-1957),美藉匈牙利人,1903年12月 28日生于匈牙利的布达佩斯,父亲是一个银行家,家境富裕,十分注意对孩子的 教育.冯· 诺依曼从小聪颖过人,兴趣广泛,读书过目不忘.据说他6岁时就能用 古希腊语同父亲闲谈,一生掌握了七种语言.最擅德语,可在他用德语思考种种 设想时,又能以阅读的速度译成英语.他对读过的书籍和论文.能很快一句不差 地将内容复述出来,而且若干年之后,仍可如此.1911年一1921年,冯· 诺依曼 在布达佩斯的卢瑟伦中学读书期间,就崭露头角而深受老师的器重.在费克特老 师的个别指导下并合作发表了第一篇数学论文,此时冯· 诺依曼还不到18 岁.1921年一1923年在苏黎世大学学习.很快又在1926年以优异的成绩获得了布 达佩斯大学数学博士学位,此时冯· 诺依曼年仅22岁.1944年与摩根斯坦因 (Morgensten)合著的《对策论与经济行为》已成为博弈论的奠基之作。