复旦大学经济博弈论课件--经济博弈论(5)
合集下载
复旦大学经济博弈论课件--经济博弈论242页PPT

30.11.2019
课件
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低 价”。
上策均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,必然是该博弈 比较稳定的结果
课件
17
竞争:个体利益最大化
q1R 1(q2,q3)4 81 2q21 2q3
11 q2R 2(q 1,q3)4 82q 12q3 q 3R 3(q 1,q2)4 81 2q 11 2q2
q1 *q2 *q3 *24 u1*u2 *u3 *576
Q*72
u*1728
21
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈G {S1, Sn;u1, un中},博弈方 i的策略
空间为 Si {si1, sik},则博弈方 i以概率分布 pi (pi1, pik)
随机在其 k个可选策略中选择的“策略”,称为一个“混合策
略”,0其p中ij 1 j1, 对,k
u 1 u 1 ( P 1 ,P 2 ) P 1 q 1 c 1 q 1 ( P 1 c 1 ) q 1 (P 1 c 1 )a 1 ( b 1 P 1 d 1 P 2 )
u 2 u 2 ( P 1 ,P 2 ) P 2 q 2 c 2 q 2 ( P 2 c 2 ) q 2 (P 2 c 2 )a 2 ( b 2 P 2 d 2 P 1 )
上策均衡不是普遍存在的
30.11.2019
课件
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
《经济博弈论》课件

常见博弈形式
合作博弈
指博弈者之间相互合作,以达到共同利益最大 化的博弈形式。
非合作博弈
指博弈者在无法达成合作的情况下,各自进行 决策,追求自身利益的博弈形式。
零和博弈
又称为固定和博弈,指博弈者的利益互为相反, 一方得到的利益与另一方失去的利益பைடு நூலகம்和为零。
零和博弈的例子
经典的零和博弈例子是两个囚犯的囚徒困境, 其中一方的得益必定意味着另一方的损失。
引言
博弈论是一门研究理性个体在决策过程中相互影响与相互制约的科学。它研究的是决策者如何在不确定环境中 做出选择,以及这些选择如何影响他人。
博弈论概述
- 什么是博弈论?博弈论是研究决策者之间相互作用和互动的数学模型框架。 - 博弈论的基本概念包括:博弈者、策略、支付、纳什均衡等。 - 博弈论的应用领域广泛,包括经济学、政治学、生物学、社会学等。
博弈论中的重要概念
1 纳什均衡
指博弈中的一组策略,每个博弈者都在这些策略下选择自己的最佳反应。没有进一步改 变策略的动机。
2 支配策略
指在任何情况下,选择该策略所带来的利益总是大于或等于其他策略的策略。
3 动态博弈
指博弈中的决策是基于时间顺序进行的,后续决策往往会受到前期决策的影响。
博弈论的实际应用
《经济博弈论》PPT课件
This presentation will introduce the key concepts of economic game theory, its applications, and highlight important strategies and examples. Get ready to delve into the fascinating world of strategic decision-making.
经济博弈论ppt课件

• 例二:黔馿之技
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
经济博弈论5

一个策略组合和相应的判断满足下列4个要求, 称为一个“完美贝叶斯均衡”:
要求1:在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到 该信息集中每个节点可能性的“判断”。对非单节点信息集,一个“判 断”就是博弈达到该信息集中各个节点可能性的概率分布,对单节点信 息集,则可理解为“判断达到该节点的概率为1” 要求2:给定各博弈方的“判断”,他们的策略必须是“序列理性”的。 即在各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续策 略”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的得益 或期望得益最大。此处所谓“后续策略”即相应的博弈方在所讨论信息 集以后的阶段中,针对所有可能情况如何行为的完整计划 要求3:在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方 的均衡策略决定 要求4:在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各 博弈方在此处可能有的均衡策略决定
i 1
P( Bk | A)
P( Bk ) P( A | Bk )
P( B ) P( A | B )
i 1 i i
n
k 1,2,, n
5.2.1 完美贝叶斯均衡定义
在不完美信息动态博弈中纳什均衡和子 博弈完美纳什均衡都不能解决问题,需 要引进新的均衡概念 纳什均衡和子博弈完美纳什均衡分析方 法,反应函数和逆推归纳法等同样也要 改进、变化
市场类型归纳
pg (V P) pb (W P)
市场 部分 成功 0
市场 完全 成功 P
市场接 近失败 或 完全失败
市场 完全 成功
C
单一价格二手车交易的解
5.4 双价二手车交易
5.4.1 双价二手车交易博弈模型 5.4.2 模型的均衡
《复旦大学--经济博弈论》-公开课件

n 克劳鳆和索贝尔采用的一种随机选择的混合策 略可以克服这种问题。
1/26/2020
复旦大学经济博弈论课件
部分合并完美贝叶斯均衡的区间划分和数量
n两区间部分合并均衡区间长度不等长, =0.5-2b,前一 个区间的长度是 -0 = 0.5-2b,后一个区间的长度为1- = 0.5+2b,后一个区间长4b。 n结论对更多区间的部分合并均衡也成立。n区间,[ , ) 是之一,长度为c,行为方对该区间类型最优行为( + )/2 ,对后一区间[ , )类型的最佳行为( + )/2。两个区间 交界处类型声明方偏好的行为,须在( + )/2和( + )/2 间无差异:
1/26/2020
复旦大学经济博弈论课件
8.1.1 不完全信息动态博弈问题
n 古玩市场等各种议价博弈 n 不完全信息先后选择产量的寡头市场产量博弈 n 彩礼问题 n 广告对消费者的影响 n 学历、成绩在招聘人才、员工中的作用 n 投保人寿保险前的体检 n 学生考试前和毕业论文中的诚信承诺
1/26/2020
声明方 类型
2,0 1,1 1,1 2,0
不能传递信息(声明方 与行为方偏好相反)
1/26/2020
1. 不同类型的声明方必须偏好行为方不同行为 2. 对应声明方不同类型行为方必须偏好不同行为 3. 行为方的偏好必须与声明方具有一致性
复旦大学经济博弈论课件
离散型声明博弈模型
1/26/2020
复旦大学经济博弈论课件
第八章 不完全信息动态博弈
本章讨论不完全信息动态博弈,也就是动 态贝叶斯博弈。动态贝叶斯博弈与静态贝叶斯 博弈在许多方面是相似的,差别只是动态贝叶 斯博弈转化成的不是两阶段有同时选择的特殊 不完美信息动态博弈,而是更一般的不完美信 息动态博弈,因此可以直接利用不完美信息动 态博弈的均衡概念进行分析。本章主要介绍信 息传递条件、机制和效率方面的模型。
《经济博弈论》PPT课件

13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
第五经济博弈论 PPT

进化稳定策略得检验
比例的博弈方偏离“同意”策略选择了“不同意” uy (1 )1 0 1 un (1 ) 0 0 0 u (1 )u y un (1 )2
因为 uy 1 0 且接近于1,因此犯错误博弈方得期
望得益远远低于没有犯错误得博弈方,也远低于群体平均得益, 因此犯错误得博弈方会逐步改正错误,最终仍然会趋向于x=1, 即所有博弈方都采用“同意”策略。
签协议博弈:
同意 不同意
博弈方2
同意
不同意
1,1
0,0
0,0
0,0
两个纯策略纳什均衡:(同意,同意),(不同意,不同意), 前一个纳什均衡帕累托优于后一个纳什均衡。假如就是在完全理 性得基础上进行该博弈,可以预期结果就是(同意,同意)。
下面就是在理性层次较低得有限理性博弈方组成得大群体成员 随机配对反复博弈得分析框架内进行分析。
因此x 1是在上述复制状态下的一个进化稳定策略ESS
进化稳定策略得检验
比例的博弈方偏离“不同意”策略选择了“同意”
uy (1 ) 0 1 un (1 ) 0 0 0 u (1 ) un uy 2
uy 0 un
x 0不是进化稳定策略
5、3、2一般两人对称博弈复制动态 与进化稳定策略
5、3、1 签协议博弈得复制动态与进化稳定策略
签协议博弈:
同意 不同意
博弈方2
同意
不同意
1,1
0,0
0,0
0,0
假设群体中采用“同意”博弈方得比例x,则不同策 略期望得益与平均得益为:
uy x 1 (1 x) 0 x un x 0 (1 x) 0 0 u x u y(1 x) un x2
只要博弈方有基本得、包括直觉与经验得判断能力, 早晚会发现上述得益差异,得益较差类型得博弈方或早或 迟会发现改变策略对自己就是有利得,并开始模仿另一种 类型得博弃方。
《经济博弈论》教材教学课件

略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖
寡头市场厂商的产量决策;市场开发竞争中策略较量和策 略依存;投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦 政治、军事和社会的决策较量 博弈论不能称作游戏理论,也不完全称作对策论
1.1.2 一个非技术性定义
企业之间相互沟通信誓旦旦,价格战仍然会爆发;美 苏两国经常会晤,甚至签订核不扩散条约,但军费一年 高过一年。这些现象都反映了上面所说明的问题。
囚徒困境说明了什么?
在(坦白、坦白)这个组合中,囚徒1和囚徒2都不 能通过单方面的改变行动增加自己的收益,于是谁 也没有动力游离这个组合,因此这个组合是纳什均 衡。
《经济博弈论》教材 教学课件
第一章 导论
本章介绍博弈论的基本概念,包括什么 是博弈和博弈论,给出一些经典博弈例子。 对博弈分类和博弈理论的结构作一些讨论, 对博弈论的发展历史等作简单介绍。目标是 让读者对博弈论的内容和博弈模型有更直观 的概念和印象,本教材的基本内容,以及博 弈分析的基本思想方法等形成初步的认识, 为后面各章展开详细分析作好铺垫和准备。
定义:博弈就是一些个人、队组或其他组织,面对一 定的环境条件,在一定的规则下,同时或先后,一次 或多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
四个核心方面
博弈的参加者(Player)——博弈方(单人、两人和多人)
各博弈方的策略(Strategies)或行为(Actions) (有 限策略、无限策略)
有人提出:利用囚徒困境解决反腐败 问题。个体理性与团体理性的矛盾。
囚徒 2
坦白
不坦白
囚坦白 徒 1
不坦白
寡头市场厂商的产量决策;市场开发竞争中策略较量和策 略依存;投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦 政治、军事和社会的决策较量 博弈论不能称作游戏理论,也不完全称作对策论
1.1.2 一个非技术性定义
企业之间相互沟通信誓旦旦,价格战仍然会爆发;美 苏两国经常会晤,甚至签订核不扩散条约,但军费一年 高过一年。这些现象都反映了上面所说明的问题。
囚徒困境说明了什么?
在(坦白、坦白)这个组合中,囚徒1和囚徒2都不 能通过单方面的改变行动增加自己的收益,于是谁 也没有动力游离这个组合,因此这个组合是纳什均 衡。
《经济博弈论》教材 教学课件
第一章 导论
本章介绍博弈论的基本概念,包括什么 是博弈和博弈论,给出一些经典博弈例子。 对博弈分类和博弈理论的结构作一些讨论, 对博弈论的发展历史等作简单介绍。目标是 让读者对博弈论的内容和博弈模型有更直观 的概念和印象,本教材的基本内容,以及博 弈分析的基本思想方法等形成初步的认识, 为后面各章展开详细分析作好铺垫和准备。
定义:博弈就是一些个人、队组或其他组织,面对一 定的环境条件,在一定的规则下,同时或先后,一次 或多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
四个核心方面
博弈的参加者(Player)——博弈方(单人、两人和多人)
各博弈方的策略(Strategies)或行为(Actions) (有 限策略、无限策略)
有人提出:利用囚徒困境解决反腐败 问题。个体理性与团体理性的矛盾。
囚徒 2
坦白
不坦白
囚坦白 徒 1
不坦白
复旦大学经济博弈论课件--经济博弈论5

dt
22
x(1x)1 (6x)
dx/dt 1/6
1
x
2019/9/10
课件
22
5.3.5 蛙鸣博弈的复制动态 和进化稳定策略
动物进化竞争是生物多样性、复杂性的基本机制
蛙鸣博弈:
雄蛙2
鸣叫
不鸣
鸣叫 P-z, P-z m-z, 1-m 不鸣 1-m, m-z 0, 0
2019/9/10
课件
23
博
弈鹰
u2e x(5)(1x)227x
方鸽
u2d x0(1x)51x
1
u2yu2e(1y)u2d 1xy6xy
博弈方2
鹰
鸽
v1 c, v2 c 22
0, v2
v1 ,0
v1 , v2 22
2019/9/10
课件
32
非对称鹰鸽博弈博弈方1群体复制动态相位图
2019/9/10
课件
6
5.2.1 协调博弈的有限博弈方快速学习模型
模型:
博弈方2
A
B
A 50,50 49,0 B 0,49 60,60
协调博弈
1
2 5
4
3
2019/9/10
课件
7
反应、策略调整规则推导
采A 用 的得x益 i(t): 50[2xi(t)]49 采B 用 的得x益 i(t): 0[2xi(t)]60 当 xi(t)22/6时 1 ,A 采 ;用 x当 i(t)22/6时 1 ,B 采用
2019/9/10
课件
8
最优反应动态模拟:初次博弈1个A
A
B
BA
B
B
B
A
A
经济博弈论的

n 人类自私的天性,使他们陷入“囚徒困境”,难以自 拔。如何走出“囚徒困境”?
PPT文档演模板
经济博弈论的
1.2.2 赌胜博弈
n 赌博、竞技等构成的博弈问题,在经济中 也有许多应用,赌胜博弈也是一类重要的 博弈问题,对经济竞争和合作也有很大启 示
n 赌胜博弈的特点是一方得等于另一方失, 不可能双赢,属于“零和博弈”
PPT文档演模板
经济博弈论的
1.1.1 从游戏到博弈
n 人生处处皆博弈,人生是永不停歇的博弈过程。 n 作为博弈者,最佳策略是最大限度地利用游戏规则,
最大化自己的利益; n 作为社会最佳策略,是通过规则使社会整体福利增加。
PPT文档演模板
经济博弈论的
1.1.2 一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定 的环境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。
济和博弈分析本身都有重要价值
PPT文档演模板
经济博弈论的
一、三厂商离散产量
PPT文档演模板
•{
•0
•P
•4
•8
•6
•2
•8
•16
•12
•4
•5
•6
•5
•20
•25
•30
•5
•5
•6
•4
•20
•20
•24
•5
•5
•5
•5
•25
•25
•25
•3
•43
•3
•11
•33
•33
•33
•7
•3
•3
•7
•49
PPT文档演模板
经济博弈论的
1.2.2 赌胜博弈
n 赌博、竞技等构成的博弈问题,在经济中 也有许多应用,赌胜博弈也是一类重要的 博弈问题,对经济竞争和合作也有很大启 示
n 赌胜博弈的特点是一方得等于另一方失, 不可能双赢,属于“零和博弈”
PPT文档演模板
经济博弈论的
1.1.1 从游戏到博弈
n 人生处处皆博弈,人生是永不停歇的博弈过程。 n 作为博弈者,最佳策略是最大限度地利用游戏规则,
最大化自己的利益; n 作为社会最佳策略,是通过规则使社会整体福利增加。
PPT文档演模板
经济博弈论的
1.1.2 一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定 的环境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。
济和博弈分析本身都有重要价值
PPT文档演模板
经济博弈论的
一、三厂商离散产量
PPT文档演模板
•{
•0
•P
•4
•8
•6
•2
•8
•16
•12
•4
•5
•6
•5
•20
•25
•30
•5
•5
•6
•4
•20
•20
•24
•5
•5
•5
•5
•25
•25
•25
•3
•43
•3
•11
•33
•33
•33
•7
•3
•3
•7
•49
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
参与约束:A B(4e ) e2 1
当店员风险中性时 e* 2符B合其最大利益
店主选择下限 A B(4e ) 代e2 入1得益公式得:
4e e,2 期1 望得益为 4e, e易2 求1 得
e** 2
令e* 得e** B , 1再代入参与约束得 A B(8,) 5
求数学期望得 A 8B 解5 得 B, 1 A 3 则店主的最优激励工资计算公式是 w 3 R
因为可监督,因此代理人报酬与成 果无关,只与努力情况有关。不确 定性风险由委托人承担。代理人选 择同无不确定性情况。
2
接受
[0,0]
拒绝
努力
委托:
2
努力
偷懒 [0,0]
0.9*[20-w(E)]+0.1*[10-w(E)]>0
不委托:
0 低产
高产
(0.1)
(0.9)
高产 (0.1)
[10-w(E), w(E)-E]
2021/3/11
17
无限回合讨价还价
S1 10000 10000 2S
S S1 10000 10000 2S
S* 10000 10000 S* 10000
1
1
2021/3/11
18
3.4.4 委托人—代理人理论
一、委托人——代理人关系
经济活动和社会活动中有很多委托人——代理人关 系,有明显的,也有隐蔽的。工厂和工人、店主和 店员、客户和律师、市民和政府、基金购买者和基 金管理人等都是。
第三章 完全且完美信息动态博弈
本章讨论动态博弈,所有博弈方都对博弈过
程和得益完全了解的完全且完美信息动态博弈。 这类博弈也是现实中常见的基本博弈类型。由 于动态博弈中博弈方的选择、行为有先后次序, 因此在表示方法、利益关系、分析方法和均衡 概念等方面,都与静态博弈有很大区别。本章 对动态博弈分析的概念和方法,特别是子博弈 完美均衡和逆推归纳法作系统介绍,并介绍各 种经典的动态博弈模型。
(-1,0) (0,4) 法律保障不足的开金矿博弈
——分钱打官司都可信
——分钱打官司都不可信
2021/3/11
7
3.2.2 纳什均衡的问题
第三种开金矿博弈中, (不借-不打,不分)和 (借-打,分)都是纳什均衡。但后者不可信,不 可能实现或稳定。
结论:纳什均衡在动态博弈可能缺乏稳定性,也就 是说,在完全信息静态博弈中稳定的纳什均衡,在 动态博弈中可能是不稳定的,不能作为预测的基础。
低产 (0.9)
[10-w(S), w(10)-S]
[20-w(20), w(20)-E][20-w(20), w(20)-S]
2021/3/11
26
促使代理人努力的激励相容约束、参与约束,以及 委托人选择委托的条件
努力: 0.9*[w(20)-E]+0.1*[w(10)-E] >0.1*[w(20)-S]+0.9*[w(10-S)]
2021/3/11
25
四、有不确定性且不可监督的 委托人—代理人博弈
1
委托
不委托
只能根据成果付酬,w是成果函数, 而非努力程度函数。不确定性对 代理人利益、选择有影响。
2
接受
[0,0]
拒绝
高产 (0.9)
2
努力
偷懒
0
低产 高产 (0.1) (0.1)
[10-w(10), w(10)-E]
[0,0]
2021/3/11
1
本章分六节
3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5有同时选择的动态博弈模型 3.6动态博弈分析的问题和扩展讨论
2021/3/11
2
3.1 动态博弈的表示法和特点
3.1.1 阶段和扩展性表示 3.1.2 动态博弈的基本特点
接受:w(S)-S>0
参与约束
2021/3/11
21
委托人的选择
1
1
委托
不委托
委托
不委托
[R(E)-w(E), w(E)-E]
[R(0),0]
委托: R(E)-w(E) > R(0) 不委托: R(E)-w(E) < R(0)
[R(S)-w(S), w(S)-S] [R(0),0]
委托: R(S)-w(S) > R(0) 不委托: R(S)-w(S) < R(0)
委托人——代理人关系的关键特征:不能直接控制, 监督不完全,信息不完全,利益的相关性
委托人——代理人涉及问题:激励机制设计、机制 设计理论,委托合同设计问题等
2021/3/11
19
二、无不确定性的委托人—代理人模型
1
委托
不委托
2
接受
[R(0),0] 拒绝
2
努力
[R(0),0] 偷懒
[R(E)-w(E), w(E)-E]
不分 (1,0)
逆推归纳法是动态博弈 分析最重要、基本的方 法。
(2,2)
(0,4)
2021/3/11
9
3.3 子博弈和子博弈完美纳什均衡
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
2021/3/11
10
3.3.1 子博弈
定义:由一个动态博弈 第一阶段以外的某阶段 开始的后续博弈阶段构 成的,有初始信息集和 进行博弈所需要的全部 信息,能够自成一个博 弈的原博弈的一部分, 称为原动态博弈的一个 “子博弈”。
乙 借
甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
2021/3/11
11Βιβλιοθήκη 3.3.2 子博弈完美纳什均衡
定义:如果一个完美信息的动态博弈中,各博弈方的 策略构成的一个策略组合满足,在整个动态博弈及 它的所有子博弈中都构成纳什均衡,那么这个策略 组合称为该动态博弈的一个“子博弈完美纳什均 衡”。
条路径 得益对应每条路径,而不是对应每步选择、行为
动态博弈的非对称性——先后次序决定动态博弈 必然是非对称的。
先选择、行为的博弈方常常更有利,有“先行优 势”。
2021/3/11
5
3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
27
五、选择报酬和连续努力水平的 委托人—代理人博弈
参与约束:
w[R(e)] C(e) U
R, C
激励相容约束:
w[R((e*)] C(e*) w[R(e)] C(e)
U
C(e) + U R(e)
2021/3/11
e*
e
委托人希望的代理人努力水平 (满足参与约束)
28
店主和店员的问题
商店的利润 R 4e , 是均值为0的随机变量
L0
L0
R
斜率为W
R(L)
WL
0
L*(W )
L
厂商的反应函数
2021/3/11
maxu[W , L*(W )]
W 0
W
W*
0
L*(W ) L*(W *)
工会的误差异曲线
u3 u2 u1 u0
L
15
3.4.3 讨价还价博弈
三回合讨价还价
S1 10000 10000 2S
1
出S1
S2 S 2
2021/3/11
22
么么么么方面
Sds绝对是假的
数值例子
R(E) 10 E E 2
E=2, S=1, W(E)=4, w(S)=2
1
委托
不委托
2
接受
[0,0] 拒绝
2
努力
[0,0] 偷懒
[12, 2]
[7,1]
2021/3/11
24
三、有不确定性但可监督的 委托人—代理人博弈
1
委托
不委托
接受: 0.9*[w(20)-E]+0.1*[w(10)-E]>0
委托: 0.9*[20-w(20)]+0.1*[10-w(10)]>0
2021/3/11
激励相容约束
参与约束
对于委托人来说,就是要根据上 述两个条件,以及 E、S的值,选 择最佳的工资水平w(20)和w(10),
或者它们的差额w(20) -w(10)
店员的负效用 C e,2 是e 店员的努力
机会成本为1 店主采用的报酬计算公式 S A BR A B(4e ) 店员的得益 A B(4e ) e2 店员期望得益为 A 4Be e2 店主的得益为 4e A B(4e ) 4(1 B)e (1 B) A
2021/3/11
29
2021/3/11
6
3.2.1 相机选择和策略中的可信性问题
不同版本的开金矿博弈——分钱和打官司的可信性
乙
借
不借
乙
借
不借
借
乙 不借
分
甲 不分 (1,0) 分
甲
(2,2)
(0,4)
(2,2) 打
(1,0)
甲
不分
分
乙
(2,2)
不打
打
(1,0) 不分
乙 不打
开金矿博弈
(1,0)
(0,4)
有法律保障的开金矿博弈
2021/3/11
13
3.4.1 寡占的斯塔克博格模型
先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而非同
时选择即可。
Q q1 q2, P P(Q) 8 Q c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2)] 2q1 6q1 q1q2 q12