经济博弈论第三讲

合集下载

经济博弈论3——完全且完美信息动态博弈

经济博弈论3——完全且完美信息动态博弈
第三章 完全且完美信息动态博弈
本章讨论动态博弈(Dynamic Games),所 有博弈方都对博弈过程和得益完全了解的完全 且完美信息动态博弈。这类博弈也是现实中常 见的基本博弈类型。由于动态博弈中博弈方的 选择、行为有先后次序,因此在表示方法、利 益关系、分析方法和均衡概念等方面,都与静 态博弈有很大区别。本章对动态博弈的概念和 分析方法,特别是子博弈完美均衡和逆推归纳 法作系统介绍,并介绍各种经典的动态博弈模 型。


逆推归纳法事实上就是把多阶段动态博弈化为一系列的 单人博弈,通过对一系列单人博弈的分析,确定各博弈 方在各自选择阶段的选择,最终对动态博弈结果,包括 博弈的路径和各博弈方的得益作出判断,归纳各个博弈 方各阶段的选择则可得到各个博弈方在整个动态博弈中 的策略。 由于逆推归纳法确定的各个博弈方在各阶段的选择,都 是建立在后续阶段各个博弈方理性选择基础上的,因此 自然排除了包含不可信的威胁或承诺的可能性,因此它 得出的结论是比较可靠的,确定的各个博弈方的策略组 合是有稳定性的。




最上方的圆圈表示乙的选择信息集 或称选择节点(node)。 如果乙选择“不借”则博弈结束, 他能保住1万元本钱而甲得不到开矿 的利润;如乙选择“借”则到达甲 的选择信息集,轮到甲进行选择。 三个终端黑点处的数组,表示由各 博弈方各阶段行为依次构成的,到 达这些终端的“路径”所实现的各 博弈方得益。 乙决策的关键是要判断甲的许诺是 否可信。


结论:在一个由都有私心、都更重视自身利益的成员 组成的社会中,完善公正的法律制度不但能保障社会 的公平,而且还能提高社会经济活动的效率,是实现 最有效率的社会分工合作的重要保障。

但是要充分保障社会公平和经济活动的效率,法律制 度必须要满足两方面的要求:一是对人们正当权益的 保护力度足够大;二是对侵害他人利益者有足够的威 慑作用。否则,法律制度的作用就是很有限的甚至完 全无效。

经济博弈论03(Game Theory)重点

经济博弈论03(Game Theory)重点
si 表示第i个参与人的特定战略 Si si 代表第i个参与人所有可选择的 战略集合 如果n个参与人每人选择一个 战略, n维向量s (s1,s2, ,si, ,sn)称为一个战略组合 si 表示第i个人选择的战略
在静态博弈中,战略和行动是相同的。
作为一种行动规则,战略必须是完备的。
(0,0)
开发商B
{开发,不开发} {不开发, 开发} {不开发,不开发}
开发商A
开发
不开发
-3, -3
0, 1
-3, -3
0, 0
1, 0
0, 1
战略式
1, 0
0, 0
{开发,(开发,不开发)}
完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965)

考虑下列问题:
一个博弈可能有多个(甚至无穷多个)纳什均衡,究 竟哪个更合理? 纳什均衡假定每一个参与人在选择自己的最优战略时 假定所有其他参与人的战略是给定的,但是如果参与 人的行动有先有后,后行动者的选择空间依赖于前行 动者的选择,前行动者在选择时不可能不考虑自己的 行动对后行动者的影响。 子博弈完美纳什均衡的一个重要改进是将“合理纳什 均衡”与“不合理纳什均衡”分开。
扩展式 A
开发
不开发

路径
在扩展式博弈中,所有n个参与人 的一个纯战略组合决定了博弈树 上的一个路径。 (开发,{不开发,开发})决定 了博弈的路径为A—开发—B—不 开发--(1,0) (不开发,{开发,开发})决定 了路径:?
B
开发
x
不开发
B
开发
x’
不开发
(-3,-3)
(1,0) (0,1)
{开发,开发}
完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965)

经济博弈论Chapter03_331007283

经济博弈论Chapter03_331007283

描求扩证序境。

of play.参无论何时采取行动,参与者都需要考虑他们当前的行动会如何影响未来的行动,包括对手和博它动,指出了博弈的所有可能结果。

决所有的连续决策点。

decision maker in a 博策树。

博节分每一分支都从博弈树上的一个决策点指向另一个决策点或终结点。

terminal node.在一个分支;不过,仅允许有一个分支指向任何一个决将引收益。

终结点并不是所有博弈必需的;一些博弈理论上可以永远进行下去on forever我参Anode is called a 参安均会发生什么?一个名叫卡门的少女正在决定是否要吸烟。

A teenager named Carmen is deciding whether to smoke.首如不一带给她不同的感受和收益。

taste, as well as different payoffs.单门分析一开始,考虑与终结点直接相连的那些行动点。

Start analysis by considering those action nodes that lead directly to terminal nodes.在利在通沿着贯穿整个博弈树的标出的唯一路径,就知道了当所有参与者在正确预测了所有的未来后果下做出最优选择时,这当由The outcome that arises from playing these在在会,甚至根本就没出现!但是,它的可能的出现和潜在的策略在决定今日卡门的招术时发挥了作用。

三每捐但为的所有结果进行赋值(排序)。

可3不多少种?如我均参不However, the equilibrium path of play is complete specification of the rollback equilibrium.它反略得到的。

艾尼塔根在街道花园博弈的反转均衡中,艾米丽得到了最好的结果(the opportunity to make the first move.先不后当这些操纵的招术就是Tactics for such manipulation are第第第第第第第三步:反转求解Step 3: Rollback第一它Slide 47一但一国然对实考有人拿出下。

博弈论第三讲

博弈论第三讲

x1
x2
x4
x3
x5
x6
x7
an edge connecting nodes x1 and x5
x8
7
Game tree
A path is a sequence of distinct
nodes y1, y2, y3, ..., yn-1, yn such that yi and yi+1 are adjacent, for i=1, 2, ..., n-1. We say that this path is from y1 to yn. We can also use the sequence of edges induced by these nodes to denote the path.
13
Entry game
Challenger’s strategies
In Out Incumbent’s strategies Accommodate (if challenger plays In) Fight (if challenger plays In) Payoffs Normal-form representation
Dynamic Games of Complete Information
Entry game
An incumbent monopolist faces the possibility of entry by a
challenger. The challenger may choose to enter or stay out. If the challenger enters, the incumbent can choose either to accommodate or to fight. The payoffs are common knowledge.

经济博弈论第三章

经济博弈论第三章
第三章 完全且完美信息动态博弈
本章讨论完全且完美信息动态博弈。
本章对动态博弈分析的概念和方法, 特别是子博弈完美均衡和逆推归纳法作系 统介绍,并介绍各种经典的动态博弈模型。
本章分六节
3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5有同时选择的动态博弈模型 3.6动态博弈分析的问题和扩展讨论
斯塔克博 格模型 先后
> < < 厂商1 >;厂商2 <
古诺模型
同时
选择次序 总产量 价格 总利润 各自利润
3.4.2 劳资博弈
先由工会决定工资率,再由厂商决定雇用多少劳动力。 工会效用:u(W,L),厂商得意:∏(W,L)=R(L)- W×L
max (W , L) max [ R ( L) WL]
不制止 (5,5)
(10,4)
3.1.2 动态博弈的基本特点

策略是在整个博弈中所有选择、行为 得益对应一条路径
动态博弈的非对称性——先后次序决定动 态博弈必然是非对称的。 先选择、行为的博弈方常常更有利,有 “先行优势”。


3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
3.4.1 寡占的斯塔克博格模型


先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而非同 时选择即可。
Q q1 q2 , P P(Q) 8 Q
c1 c2 2
2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12 u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2 6q2 q1q2 q2

经济博弈论_Chapter03

经济博弈论_Chapter03
Slide 6
博弈树:一个例子 Game Trees: An Example
ANN Branches BOB Stop ANN Go 1 2 3 Up Down DEB High Low (10,7,1,1) (2,7,4,1) ( , , , ) (1,-2,3,0) (1.3,2,-11,3) (0,-2.718,0,0) (0, 8,0,0) Terminal nodes (6,3,4,0) (2,8,-1,2) node节点 branch分支
证据 Evidences de ces
Slide 2
序贯博弈 Sequential-move Games
序贯博弈要求一个有严格博弈顺序的策略环境。 Sequential-move Sequential move games entail strategic situations in which there is a strict order of play. p y 参与者按顺序出招,并且知道在他们之前的那 些参与者都干了什么。 参与者都干了什么 Players take turns making their moves, and they know what players who have gone before them have done.
Slide 9
博弈树 Game Trees
分支代表从任一决策点出发的可能采取的行动。 分支代表从任 决策点出发的可能采取的行动 The branches represent the possible actions that t at can ca be taken ta e from o any a y decision dec s o node. ode 每一分支都从博弈树上的一个决策点指向另一个决策 点或终结点。 E hb Each branch hl leads d f from a d decision i i node d on th the tree either to another decision node, or to a terminal node. 在任何一个博弈中,从每一个决策点出发,至少要有 一个分支;不过,仅允许有一个分支指向任何一个决 策点。 策点 In any game, there must be at least one branch leading from each decision node. However, every decision node can have only Slide 10 one branch leading to it.

经济博弈论ppt课件

经济博弈论ppt课件
• 例二:黔馿之技
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling

经济博弈论(第三章)

经济博弈论(第三章)

第三章完全信息动态博弈上一章介绍了完全信息静态博弈,本章在前面的基础上探讨完全信息动态博弈。

现实社会经济活动的决策大多数是有先后顺序的行为而不是同时选择的行为,而且后行者能够看到先行者的决策内容,在先行者的决策结果之后再定夺自己的策略。

这样的经济行为比比皆是,如商业活动中的讨价还价,拍卖活动中的轮流竞价,资本市场上的收购兼并和反收购兼并都是如此。

依次选择与一次性同时选择有很大的差异,因此这种决策问题构成的博弈也是从时间序列上有别于静态博弈的,我们称之为“动态博弈”(Dynamic Games)。

例如下象棋通常需要两个参与人,我们定义为红方和黑方,红方先走,黑方后走,这是一个典型的完全信息动态博弈。

动态博弈由于添加了时间因素,因而更加贴近现实。

根据博弈方是否相互了解得益情况,可分为“完全信息动态博弈”和“不完全信息动态博弈”,根据是否所有博弈方都对自己选择前的博弈过程完全了解,可分为“完美信息动态博弈”和“不完美信息动态博弈”。

在本章中,我们首先对博弈的扩展式表达给出完整的定义,为动态博弈的分析奠定基础;其次,我们从扩展式表述博弈的纳什均衡分析逐步深入到子博弈精炼纳什均衡,为动态博弈的分析提供可行的方法,接下来介绍两种完全信息动态博弈经典模型;最后,分析具有无穷次的重复博弈,推导出无名氏定理。

3.1 博弈的扩展式表述在动态博弈中,博弈方的行动是有先后次序的,且后行动者在自己行动之前能够观测到先行动者的行动,每个博弈方的一次选择行为常称为一个“阶段”(Stage )。

动态博弈中也可能存在几个博弈方同时选择的情况,这时博弈方的同时选择构成一个阶段。

一个动态博弈至少有两个阶段,因此动态博弈有时也称为“多阶段博弈”(Multistage Games )。

此外,也有把动态博弈称为“序列博弈”(Sequential Games )的,这也是由动态博弈中的次序特征引出来的。

设有一个商人要从A 地向B 地运输一批货物。

《经济博弈论》PPT课件

《经济博弈论》PPT课件
13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈

方 1

博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2




弈 方

1, 0
1, 3

经济博弈论

经济博弈论
3
非合作博弈强调个体理性
(individual rationality),就是
从个体的角度考虑策略选择,使得
个体收益最大。所以非合作博弈研
究的是参与者在利益相互影响的情
况下如何选策略使自己的收益最大,
即策略选择问题。
约翰·纳什 (J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。
1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体(可以是个人,也可以是团体);
2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策;
3、策略是指参与人选择行动的规则,即在博弈 进程中,什么情况下选择什么行动的预先安排;
第一节 引言
1
博弈理论简介
博弈论(Game Theory):研究具有斗争或竞争性质现象的理 论和方法。
三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集
分类: 合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈;
研究博弈论的意义:理解人类的经济行为;理解社会和生态 物种系统中的合作行为以及自自组织斑图。
13
从游戏到博弈
游戏的特点:下棋,打牌,赌博,田径, 球类等等,共同的特点是策略
策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略和 利益的依存性
14
想一想
假如你正跟恋人用手机通电话,突 然信号断了。这时,你会立即拨电话 过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,取 决于你的恋人是否会拨过来。如果你 们其中一方要拨,那么另一方最好是 等待;如果一方等待,那么另一方就 最好是拨过去。因为如果双方都拨, 那么就会出现线路忙;如果双方都等 待,那么时间就会在等待中流逝。

第三讲 博弈论战略分析

第三讲 博弈论战略分析

继续
看起来,垃圾处理博弈 中的两个参与者的决策 很容易。这是因为“倾倒” 战略是一个占优战略 (dominant strategy)。占 优战略就是无论对方采 取何种战略,其都是最 优反应的战略。 在垃圾处理博弈中,“倾 倒”对每个参与者来说都 是占优战略。因为每个 参与者都有占优战略, 所以该博弈也是说明占 优战略均衡(dominant strategy equilibrium)的 一个好例子。
3.1垃圾处理博弈
在探讨这个 博弈之前, 我们先来看 一个故事。 故事的主人 公是两所房 屋的主人, 琼斯先生和 史密斯先 生。两人各 在郊区拥有 一套周末别 墅,该地区 不提供垃圾 日常处理服 务。
他们可以共同雇一 辆卡车处理垃圾,但 收费很高,每人每年 需支付500美元。此 外,他们还有另一个 选择,琼斯可以将垃 圾倒在史密斯房子旁 边的一块属于自己的 空地上,史密斯则可 以将垃圾倒在琼斯房 子旁边的一块属于自 己的空地上。(如图 3.1)
继续
假定有两个候选人:参议院布兰克先生和地方官员 格雷先生。虽然他们在政治立场上没什么个人偏 好,但身为民主党的布兰克持左翼立场要比身为共 和党的格雷更加具有信服力。 相反,如果持右翼立场,格雷比布兰克更具有信服 力。持左翼立场还是右翼立场是他们可以选择的两 种战略。 此外,他们还有第三个可供选择的战略:持中立立 场。
继续
事实上,房主之间订立的这种合约是很 常见的,被称为契约。很多城镇住宅区 都用契约来杜绝乱倒垃圾等惹人厌的事 情。当然,在很多非合作的场合,法规 也能达到同样的目的。 总的来说,不管是通过协议还是其他 形式的强制手段,只要参与者们都能履 行协调后的战略,他们所选的战略及其 收益就是一个博弈的合作解。
博弈论战略分析:标准式博弈 的非合作均衡

经济博弈论基础教材课件汇总完整版ppt全套课件最全教学教程整本书电子教案全书教案课件合集

经济博弈论基础教材课件汇总完整版ppt全套课件最全教学教程整本书电子教案全书教案课件合集
1. 从经济学的研究对象来看 传统观点:经济学是研究有限资源的最优配置的 一门学科。物尽其用 现代观点:经济学是研究理性人行为的一门学科。 人尽其才 理性人 合作与冲突 博弈论 从“物尽其用” 到“人尽其才”
1. 重视微观基础 2. 重视人与人之间关系的研究 3. 重视信息在经济中的作用
二、博弈论对经济学发展的影响
1、Von Neumann体系 标准型 扩展型 合作型
第三节、经济博弈论内容体系
2、合作博弈与非合作博弈 局中人之间是否有具有约束力的协议,博弈可分为: 合作博弈:有。强调团体理性,效率、公平和公正 非合作博弈:没有。强调个人理性、个人最优选择,其结果可能是有效率的,也可能是无效率的。
非合作博弈可以从两个角度进行分类
.
四种不同类型的博弈
信息 行动顺序
完全信息
不完全信息
静态
完全信息静态博弈 纳什均衡 Nash (1950,1951)
不完全信息静态博弈 贝叶斯纳什均衡 Harsanyi (1967-1968)
动态
完全信息动态博弈 子博弈完美纳什均衡 Selten (1965)
第一节 博弈论与经济学 第二节 经济博弈论的产生与发展 第三节 经济博弈论内容体系
主要内容
一、博弈论的研究对象 博弈论是研究在利益相互影响的局势中,局中人如何选择自己的策略才能使自身的收益最大化的均衡问题,是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。
第一节、博弈论与经济学
2001年Nobel经济学奖
通过博弈论分析而增进我们对冲突和合作的理解 Robert J. Aumann 以色列耶路撒冷希伯来大学理性研究中心 Thomas C. Schelling 美国哈佛大学肯尼迪政府学院和马里兰大学经济学系暨公共政策学院

《经济博弈论》教材教学课件

《经济博弈论》教材教学课件
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖
寡头市场厂商的产量决策;市场开发竞争中策略较量和策 略依存;投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦 政治、军事和社会的决策较量 博弈论不能称作游戏理论,也不完全称作对策论
1.1.2 一个非技术性定义
企业之间相互沟通信誓旦旦,价格战仍然会爆发;美 苏两国经常会晤,甚至签订核不扩散条约,但军费一年 高过一年。这些现象都反映了上面所说明的问题。
囚徒困境说明了什么?
在(坦白、坦白)这个组合中,囚徒1和囚徒2都不 能通过单方面的改变行动增加自己的收益,于是谁 也没有动力游离这个组合,因此这个组合是纳什均 衡。
《经济博弈论》教材 教学课件
第一章 导论
本章介绍博弈论的基本概念,包括什么 是博弈和博弈论,给出一些经典博弈例子。 对博弈分类和博弈理论的结构作一些讨论, 对博弈论的发展历史等作简单介绍。目标是 让读者对博弈论的内容和博弈模型有更直观 的概念和印象,本教材的基本内容,以及博 弈分析的基本思想方法等形成初步的认识, 为后面各章展开详细分析作好铺垫和准备。
定义:博弈就是一些个人、队组或其他组织,面对一 定的环境条件,在一定的规则下,同时或先后,一次 或多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
四个核心方面
博弈的参加者(Player)——博弈方(单人、两人和多人)
各博弈方的策略(Strategies)或行为(Actions) (有 限策略、无限策略)
有人提出:利用囚徒困境解决反腐败 问题。个体理性与团体理性的矛盾。
囚徒 2
坦白
不坦白
囚坦白 徒 1
不坦白

最新[经管营销]经济博弈论博士第三章051114下午使用稿ppt课件

最新[经管营销]经济博弈论博士第三章051114下午使用稿ppt课件

纳 注意:

纳什均衡有强弱之分,上述定义给出的是弱纳什均

衡的概念。一个纳什均衡是强的(strict or
衡 strong),如果给定其他参与人的战略,每一个参
的 与人的最优选择是唯一的。

如果一个纳什均衡是强的,没有任何参与人在均衡
义 战略与某些其他战略之间是无差异的;对比之下,
在弱纳什均衡的情况下,有些参与人可能在均衡战
3.2.1 占优战略均衡
一般地,s
i
称为参与人
i
的(严格)占优战略,如果

对应所有的s
i
,s
i

i严格最优选择,即:
战 略
u i(si* ,s i) u i(si',s i) s i, si' si*
的 定 义
对str应at地eg,ie所s)有。的其si中' ,ss i* 被i 称(s 为1 ,“ 劣,s i战 1 ,略s i ”1 , (,ds on ) m,in是ateid
上述两个一阶条件分别定义了两个反应函数(reaction function): q1 R1(q2)
q2 R2(q1) 反应函数意味着每个企业的最优战略(产量)是另一个 企业产量的函数。
库诺特寡头竞争模型
两个反映函数的交叉点就是纳什均衡
如下图所示:q 2
q (q1,q2)
R 1(q2)
q2*
NE
R 2(q1)
q2 R2(q1)
1(q 1 ,q 2 )2(q 1 ,q 2 )9 1(ac)2
库诺特寡头竞争模型
用重复剔除严格劣战略的方法找出均衡解
q2
可用此解法求解的条件:
q

经济博弈论第三讲混合博弈

经济博弈论第三讲混合博弈


• • • •
救济 政府 不救济
Байду номын сангаас
流浪汉
找工作 3,2
-1,1
游荡 -1,3
0,0
• 设想政府以1/2的概率选择救济,1/2的概率选择不救济。对流浪汉来 说,选择寻找工作的期望效用是1/2×2+ 1/2×1=1.5,选择游荡带来 的期望效用为1/2×3+ 1/2×0=1.5。所以流浪者的任何一种策略(纯 的或混合)都是对政府所选择的混合策略的最优反应。 • 如果流浪汉以0.2的概率选择找工作,以0.8的概率选择游荡,政府的 任何一种策略(纯的或混合)都是对流浪汉所选择的混合策略的最优 反应。每一个参与人的混合策略都是给定对方混合策略时的最佳选择, 这一混合策略组合就是一个纳什均衡
• 混合策略纳什均衡的求法,可以通过计算各方的 期望得益,寻求使自己期望得益最大化的最佳反 应函数,求各博弈方的最佳反应函数的公共解。 可以用求最佳反应函数交点的方法,也可以用解 方程组得方法。还可以应用下面的原则来计算: 任何博弈方的在混合策略纳什均衡中的所选策略, 都必须使其他博弈方选择其任何策略的期望得益 相同。即自己的选择要使对方无机可乘,不能通 过有针对性的倾向是某一策略成为优势策略。再 举一个例子。
• 同样,设乙的混合策略为(q,1-q) ,则乙的纳什 均衡策略也必须使甲无论选A还是选B的期望收益 相等。即: • q×2+(1-q) ×5=q×3+(1-q) ×1 • 解得 q=0.8 即乙的混合策略也是(0.8,0.2) • 容易算出在这个混合策略纳什均衡下,甲乙各自 的得益都是2.6.它的意义是说,虽然在一次博弈 中,其结果只能是得益矩阵中四个得益的一种, 但多次独立重复进行,平均结果是双方各得2.6.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.2.2 纳什均衡的一致预测性质
一致预测性: 一致预测性:如果所有博弈方都预测一个特定 的博弈结果会出现, 的博弈结果会出现,那么所有的博弈方都不会 利用该预测或者这种预测能力选择与预测结果 不一致的策略, 不一致的策略,既没有哪个博弈方有偏离这个 预测结果的愿望, 预测结果的愿望,因此这个预测结果会成为博 弈的最终结果 只有纳什均衡才具有一致预测的性质 一致预测性是纳什均衡的本质属性 纳什均衡分析不能对所有的博弈结果作出准确 的预测
多人博弈中的共谋问题
R
L U D 0,0,10 -5,-5,0
-5,-5,0 1,1,-5
博弈方3——A 博弈方 博弈方2 博弈方 博 弈 方 1
本博弈的纯策略纳什均衡: (U,L,A)、(D,R,B) U L A D R B 前者帕累托由于后者 博弈的结果会是什么呢? 博弈的结果会是什么呢? 共谋问题(Coalition)
2.2.3 纳什均衡与严格下策反复消去法
上策均衡肯定是纳什均衡, 上策均衡肯定是纳什均衡,但纳什均衡不一定是 上策均衡 命题2.1:在n个博弈方的博弈 G = {S1 ,L S n ; u1 ,Lun } 中, 命题2.1: n个博弈方的博弈 * ( s i* , L s n ) 如果严格下策反复消去法排除了除 之外 * ( s i* , L s n ) 的所有策略组合, 的所有策略组合,那么 一定是该博弈的 唯一的纳什均衡 命题2.2:在n个博弈方的博弈中 G = {S1 ,LSn ; u1 ,Lun } 命题 : 个博弈方的博弈中 的一个纳什均衡, 中,如果 ( s , L s ) 是 G 的一个纳什均衡,那么严格 下策反复消去法一定不会将它消去
根据定义, 根据定义,前面所述各博弈方都不愿意 单独改变策略的策略组合是纳什均衡 如囚徒困境中的(坦白,坦白)是纳什 如囚徒困境中的(坦白,坦白) 均衡, 均衡,在夫妻之争博弈中有两个纳什均 歌剧,歌剧) 足球、足球) 衡(歌剧,歌剧)和(足球、足球) 在猜硬币博弈中则不存在纳什均衡 在可以用得益矩阵表示的博弈中寻找纳 什均衡,可以用划线法 箭头法。 划线法和 什均衡,可以用划线法和箭头法。
猎人2 猎人 兔子 0, 3 3, 3
风险上策均衡
猎鹿博弈
聚点均衡
1、城市博弈 2、时间博弈 3、地点博弈
相关均衡
博弈方2 博弈方 博 弈 U 方 D 1 L 5, 1 4, 4 4 R 0, 0 1, 1 5 可利用聚点均衡,但仍不理想: 可利用聚点均衡,但仍不理想: 天气, 天气,抛硬币 相关装置: 相关装置: 1、各1/3概率 、B、C 、 概率A、 、 概率 2、博弈方1看到是否 ,博弈方 看到是否 、博弈方 看到是否 看到是否A,博弈方2看到是否 看到是否C 3、博弈方1见A采用 ,否则 ;博弈方 见C 、博弈方 见 采用 采用U,否则D;博弈方2见 采用R,否则L。 采用 ,否则 。 相关均衡要点: 相关均衡要点: 1、构成纳什均衡 、 2、有人忽略不造成问题 、
* i * n
2.2.4 纳什均衡的存在性
纳什定理:
在一个由n个博弈方的 G = {S1 ,L S n ; u1 ,Lun }中, 在一个由 个博弈方的 如果n是有限的 是有限的, 都是有限集(对 ), 如果 是有限的,且 Si 都是有限集 对 , i = 1,Ln 则该博弈至少存在一个纳什均衡, 则该博弈至少存在一个纳什均衡,但可能包含 混合策略 证明:布鲁威尔和角谷的不动点定点定理。 证明:布鲁威尔和角谷的不动点定点定理。 意义:一般分析概念的依据。 意义:一般分析概念的依据。
相关均衡 三个纳什均衡: 三个纳什均衡 )、(D, ) (U,L)、( ,R) , )、( 和混合策略均衡[( 和混合策略均衡 (1/2,1/2), , ), (1/2,1/2)] , ) 结果都不理想,不如(D,L)。 结果都不理想,不如( , )。
2.2.6 共谋和防共谋均衡
博弈方2 博弈方 博 弈 方 1
2.2.5 纳什均衡的选择和分析方法扩展
多重纳什均衡博弈的分析
帕累托上策均衡 风险上策均衡 聚点均衡 相关均衡
帕累托上策均衡
(鹰鸽博弈)
国家2 国家 战争 国 家 战争 1 和平 -5, -5 -10, 8 和平 8, -10 10, 10
战争与和平
风险上策均衡
博弈方2 博弈方 博 弈 U 方 D 1 L 9, 9 8, 0 R 0, 8 7, 7 猎 人 鹿 1 兔子 鹿 5, 5 3, 0
定义: 定义:在博弈G = {S1 , L S n ; u1 , L u n }中,如果由各个博弈方的 * * 各一个策略组成的某个策略组合( si ,L sn )中,任一博弈方 i * * * * 的策略, 的策略,都是对其余博弈方策略的组合 ( s i , L s i −1 , s +1 ,... s n ) * * * ui ( si* , L si*−1 , si* , si*+1 ,...sn ) ≥ ui ( si* , L si*−1 , sij , si*+1 ,...sn ) 的最佳对策, 的最佳对策,也即 * * s i j ∈ S 都成立,则称 ( s i , L s n ) G 的一个纳什均衡 i 都成立, 对任意 为
L U D -2,-2,0 -5,-5,0
R -5,-5,0 -1,-1,5
博弈方3——B 博弈方
防共谋均衡 如果一个博弈的某个策略组合满足下列要求: 如果一个博弈的某个策略组合满足下列要求: (1)没有任何单个博弈方的“串通”会改变博 )没有任何单个博弈方的“串通” 弈的结果, 单独改变策略无利可图; 弈的结果,即单独改变策略无利可图; (2)给定选择偏离的博弈方有再次偏离的自由 ) 时,没有任何两个博弈方的串通会改变博弈的 结果; 结果; (3)依此类推,直到所有博弈方都参加的串通 )依此类推, 也不会改变博弈的结果。 也不会改变博弈的结果。 满足上述要求的均衡策略组合称为“防共谋均衡” 满足上述要求的均衡策略组合称为“防共谋均衡”
第三讲
纳什均衡
2.2.1 纳什均衡的定义
因为纳什均衡在非合作博弈分析中具有十分关键的作用和地位, 因为纳什均衡在非合作博弈分析中具有十分关键的作用和地位,所以 有必要给它的一个较正式的定义。 有必要给它的一个较正式的定义。 策略空间: 策略空间: S1 ,L S n si j ∈ S i 个策略: 博弈方 i 的第 j个策略: ui 的得益: 博弈方i 的得益: 博弈: 博弈: G = {S1 ,LSn ; u1 ,Lun }
相关文档
最新文档