13第十三章 博弈论(北大第2版)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
24
例子
Player B L R
U Player A D
(3,9) (1,8)
(0,0) (2,1)
25
(U,R)是最优选择吗?
Player B L R
U Player A
(3,9) (1,8)
(0,0) (2,1)
D
如果B选择R,A的最优选择是D; 如果A选择U,B的最优选择是L。 26 所以, (U,R) 不是一个可能的最优选择。
第十章
博弈论与厂商的 策略性行为
本章内容:
• • • • 第一节 博弈论概述 第二节 纳什均衡 第三节 子博弈精炼纳什均衡 第四节 重复博弈
2
本章内容:
• • • • 第一节 博弈论概述 第二节 纳什均衡 第三节 子博弈精炼纳什均衡 第四节 重复博弈
3
简单经济学说史 – 1950’s-- era of general equilibrium – 1960’s-- era of growth – 1970’s—era of economics of information – 1980’s – era of game theory – 1990’s—era of new institutional economics
rock
0,0
1,-1 -1,1
-1,1
0,0 1,-1
1,-1
-1,1 0,0
Person A
paper scissors
11
(3)The Battle of the Sexes(性别之战或恋爱博弈)
• 两个恋人:小丽和小勇 • 策略:看歌剧和看足球赛 • 得益:若小勇同意陪小丽看歌剧,小 丽得益(或效用)为2,小勇得益为1; 若小丽同意陪小勇去看足球赛则小勇 得益为2,小丽得益为1;否则双方得 益都为0。
完全信息博弈:是指每一参与者都拥有所 有其他参与者的特征、策略集及得益函数 等方面的准确信息的博弈。 不完全信息博弈:是指参与者只了解上述 信息中的一部分的博弈。
17
小结
• 博弈的分类及其对应的均衡概念
静态 完全 信息 动态
完全信息的静态博弈 完全信息的动态博弈 纳什均衡 子博弈精炼纳什均衡
不完全信息的动态博弈 不完全信息的静态博弈 不完全 信息 精炼贝叶斯纳什均衡 贝叶斯纳什均衡
3r d 1s t
2n d
4 t
40
2.划线法求解NE B
Left Top 3,2 3,6 1,1 Center 5,4 4,2 6,3 Right 4,3 2,5 5,4
41
A
Middle Bottom
Game B
B
L
T 3, 5
R
1, 4
A
C
2, 6
4, 5
B
1, 2
0, 3
42
―猜硬币博弈‖是否有纳什均衡?如何求解?
• 这个唯一剩下的策略组合被称为重复剔 除劣策略的占优策略均衡
37
Repeated elimination can find the NE
B
Left Top 3,2 1,6 1,1
2n d
Center 5,4 4,2 6,3
4th
Right 4,3 2,5 5,4
3 r 1 d st
A
Middle Bottom
23
进一步对占优策略均衡的理解:
• 1.占优策略的实施并不依赖于其他博弈 参与人的策略选择,就是说,不管其他 人选择什么策略,他的占优策略均衡都 是唯一的。 • 2.占优策略均衡反映了所有博弈方的绝 对偏好,因此非常稳定。 • 3.根据占优策略均衡可以对博弈结果作 出最肯定的一致预测,有明确的结果。 且结果是唯一的。
Player B(猜硬币方) Heads Tails
Heads Player A (盖硬币方) Tails
-1, 1
1, -1
1, -1
-1, 1
43
Nash Equilibrium: Battle of the Sexes
Woman Football Football Man Ballet 2, 1 0, 0 Ballet 0, 0 1, 2
• 博弈分析的关键步骤是找出在别人选择既定 的情况下自己的最优反应策略(即给自己带 来最大收益的策略)
7
1.如何来描述一种博弈状态
(1)搞清楚有哪些博弈参与人; (2)明白各参与人在博弈中所能够 采取的策略、行动或选择; (3)了解从博弈中获取的得益 (payoff)
8
2.一些简单的博弈例子
• (1)Matching pennies(猜硬币博弈)
32
四、如何求解纳什均衡?
• 第一种方法:占劣策略剔除法 • 第二种方法:划线法
33
Game A
B Playe Black Red r A Play er
Red Black 2,2 0,5 5,0 3,3
34
Game B
L
T 3, 5
R
1, 4
C
2, 6
4, 5
B
1, 2
0, 3
35
Solution: Iterated Elimination
2.双方都退缩,双方都不获取任何效用。 3.双方都前进,两司机都会被撞得头破血 流,各自回损失效用3。
14
Driver II
Not Swerve Not Swerve Swerve (前进) (-3, -3) (-2, 2) Swerve (退缩) (2, -2) (0 , 0)
Driver I
Neither player has a dominating strategy. There doesn’t exist an equilibrium point.
一、博弈论定义
• 博弈论就是指研究多个个体 在平等的对局中各自利用对 方的策略变换自己的对抗策 略,以实现自己利益最大化 的学科。
6
二、如何表达一个博弈现象
在研究中任何博弈要考虑到
博弈参与者有哪些?数量如何? 博弈的规则或制约条件如何? 对手策略与自身的对应策略? 各种策略下自己的收益如何?
• 此时实现占优策略均衡:
– 双方都采取“招供”
20
一、占优策略及占优策略均衡
• 1.占优策略(Dominant strategy) – 在某个博弈中,如果不管其他博弈方选择 什么样策略,一博弈方的某个策略给他带 来的得益始终高于其他策略,至少不低于 其他策略,则该策略就是该博弈方的占优 策略。
21
• 公共知识(Common Knowledge): Everybody knows everybody knows everybody knows ...
39
• 下列博弈是否可以使用占劣策略?
Left Top Middle Bottom 3,2 3,6 1,1 Center 5,4 4,2 6,3 Right 4,3 2,5 5,4
• 2.占优策略均衡(Dominant strategy Equilibrium) – 如果一个博弈的某个策略组合中的所有 策略都是各个博弈方各自的占优策略, 那么这个策略组合肯定是所有博弈方都 愿意选择的,必然是该博弈比较稳定的 结果。此时,这个策略组合就是占优策 略均衡.
22
想一想?
• 为什么囚徒困境的两个人不能事先约 定好都‖不招供‖作为其最优选择? • 古诺寡头垄断均衡解是不是占优策略 均衡?
12
The Battle of the Sexes(性别之战或恋爱博弈)
小丽
Football Opera
Football
2,1
0,0
小勇
Opera
0,0
1,2
13
(4)The Game of Chicken(斗鸡博弈)
博弈参与人:司机A和司机B
策略:前进和退缩
得益:
1.双方中一方退缩,退缩一方丢失脸面损 失效用2,另一方以胜利者自居获取效用2。
38
This is called Iterated Elimination of Dominated Strategies.
• 使用重复剔除劣策略法的前提:
– 1.确信任何理性博弈参与人都不会使用严格 占劣策略。 – 2.上述理性条件是一种公共知识(This rationality requirement is common knowledge).
B
L
T 3, 5
R
1, 4
2nd
3rd
A
C
2, 6
来自百度文库
4, 5
B
1, 2
0, 3
1st
36
2.占劣策略重复剔除法 Elimination of Dominated Strategies
• 基本思路:
– 基于完全信息和理性的假定,首先找出某个 参与人的劣策略(若存在),剔除这个劣策 略后,重新构造一个不包含剔除劣策略的新 博弈,然后再剔除某个参与人的劣策略;重 复这一过程,一直到只剩下一个唯一的策略 组合为止。
二、纳什均衡及其含义
• “纳什均衡”
– 指这样一种策略组合,在给定别人策 略选择的情况下,没有任何单个参与 人有积极性选择其他策略。 – 或者说,没有人可以通过单方面改变 自己的策略而提高自己的得益的状态。
31
纳什均衡的进一步理解
– 第一,在该策略组合中,每个参与人的策略都是 给定其他参与人的策略情况下的最佳反应。 – 第二,该策略具有自我实施(self-enforcing)的功 能。 – 第三、一旦实现了纳什均衡,任何博弈方都没有 积极性偏离该均衡状态。 – 第四、占优策略均衡一定是纳什均衡,但纳什均 衡不一定就是占优策略均衡。
(D,R)是不是可能的最优选择?
Player B L R U
Player A
(3,9) (1,8)
D
(0,0) (2,1)
如果B选择R,A的最优反应是D; 如果A选择D,而B的最优反应是R. 所以, (D,R)是一个可能的最优组合
27
(D,L)是不是一个可能的最优组合
Player B L R U
– 2 players: Player A, B – actions: Heads(正面) or Tails(反面) – payoffs: player B gets $1 (and player A loses $1) if pennies match. Player B loses a dollar and player A gains $1 if pennies don’t match. – zero sum game(零和博弈).
– 2000’s—Now: Micro-foundation of Macroeconomics………
4
何谓博弈
• 本义:下棋 • 下棋的特点是什么? • 下棋和企业的市场竞争 有何共同点?
– 有规矩,讲策略,争输 赢
• 西方:game
– 含义比下棋更全面 – 竞争、合作
5 2016/10/15
5
15
三、博弈的分类
1.静态博弈和动态博弈
静态博弈:是指所有博弈方同时或可看作同 时选择策略、采取行动的博弈。 动态博弈:是指博弈方的选择、行动有先有 后,而且后选择、后行动的博弈方在自己进 行选择、行动之前可以看到在他之前选择、 行动的博弈方的选择、行动的博弈。
16
2.完全信息博弈和不完全信息博弈
18
本章内容:
• • • • 第一节 博弈论概述 第二节 纳什均衡 第三节 子博弈精炼纳什均衡 第四节 重复博弈
19
Prisoners’ Dilemma
• Prisoners’ Dilemma 结果:
– Player A – 占优策略:招供(confess) – Player B – 占优策略:招供( confess)
如果B选择L,则A的最优反映肯定是U; 如果A选择U,则B的最优反映肯定是L。 所以, (U,L)是一个可能最优选择组合。 29
Nash Equilibrium: Matrix
Player B L R
U Player A D
(3,9) (1,8)
(0,0) (2,1)
(U,L) 和(D,R)是该博弈的两个最优策略组合,即在 每个组合中,每个人的策略都是给定其他参与人策略 情况下的最优反应。 一旦实现了有这两个组合所表示的均衡时,没有一个 人愿意偏离该均衡。这样的均衡被称为纳什均衡。 30
Player A
(3,9) (1,8) (0,0) (2,1)
D
如果B选择L,则A的最优反应是U, 如果A选择D,则B的最优反应是R, 28 所以 (D,L)不是一个可能的最优组合。
(U,L)是不是一个最优组合? Player B L R
U
Player A D
(3,9) (1,8) (0,0) (2,1)
9
Matching Pennies (猜硬币博弈) 的表达 Player B
Heads Tails
Heads Player A
-1, 1
1, -1
Tails
1, -1
-1, 1
A手握硬币让B猜测手中硬币的正反面
10
(2)Rock-scissors-paper Game
Person B
rock paper scissors
例子
Player B L R
U Player A D
(3,9) (1,8)
(0,0) (2,1)
25
(U,R)是最优选择吗?
Player B L R
U Player A
(3,9) (1,8)
(0,0) (2,1)
D
如果B选择R,A的最优选择是D; 如果A选择U,B的最优选择是L。 26 所以, (U,R) 不是一个可能的最优选择。
第十章
博弈论与厂商的 策略性行为
本章内容:
• • • • 第一节 博弈论概述 第二节 纳什均衡 第三节 子博弈精炼纳什均衡 第四节 重复博弈
2
本章内容:
• • • • 第一节 博弈论概述 第二节 纳什均衡 第三节 子博弈精炼纳什均衡 第四节 重复博弈
3
简单经济学说史 – 1950’s-- era of general equilibrium – 1960’s-- era of growth – 1970’s—era of economics of information – 1980’s – era of game theory – 1990’s—era of new institutional economics
rock
0,0
1,-1 -1,1
-1,1
0,0 1,-1
1,-1
-1,1 0,0
Person A
paper scissors
11
(3)The Battle of the Sexes(性别之战或恋爱博弈)
• 两个恋人:小丽和小勇 • 策略:看歌剧和看足球赛 • 得益:若小勇同意陪小丽看歌剧,小 丽得益(或效用)为2,小勇得益为1; 若小丽同意陪小勇去看足球赛则小勇 得益为2,小丽得益为1;否则双方得 益都为0。
完全信息博弈:是指每一参与者都拥有所 有其他参与者的特征、策略集及得益函数 等方面的准确信息的博弈。 不完全信息博弈:是指参与者只了解上述 信息中的一部分的博弈。
17
小结
• 博弈的分类及其对应的均衡概念
静态 完全 信息 动态
完全信息的静态博弈 完全信息的动态博弈 纳什均衡 子博弈精炼纳什均衡
不完全信息的动态博弈 不完全信息的静态博弈 不完全 信息 精炼贝叶斯纳什均衡 贝叶斯纳什均衡
3r d 1s t
2n d
4 t
40
2.划线法求解NE B
Left Top 3,2 3,6 1,1 Center 5,4 4,2 6,3 Right 4,3 2,5 5,4
41
A
Middle Bottom
Game B
B
L
T 3, 5
R
1, 4
A
C
2, 6
4, 5
B
1, 2
0, 3
42
―猜硬币博弈‖是否有纳什均衡?如何求解?
• 这个唯一剩下的策略组合被称为重复剔 除劣策略的占优策略均衡
37
Repeated elimination can find the NE
B
Left Top 3,2 1,6 1,1
2n d
Center 5,4 4,2 6,3
4th
Right 4,3 2,5 5,4
3 r 1 d st
A
Middle Bottom
23
进一步对占优策略均衡的理解:
• 1.占优策略的实施并不依赖于其他博弈 参与人的策略选择,就是说,不管其他 人选择什么策略,他的占优策略均衡都 是唯一的。 • 2.占优策略均衡反映了所有博弈方的绝 对偏好,因此非常稳定。 • 3.根据占优策略均衡可以对博弈结果作 出最肯定的一致预测,有明确的结果。 且结果是唯一的。
Player B(猜硬币方) Heads Tails
Heads Player A (盖硬币方) Tails
-1, 1
1, -1
1, -1
-1, 1
43
Nash Equilibrium: Battle of the Sexes
Woman Football Football Man Ballet 2, 1 0, 0 Ballet 0, 0 1, 2
• 博弈分析的关键步骤是找出在别人选择既定 的情况下自己的最优反应策略(即给自己带 来最大收益的策略)
7
1.如何来描述一种博弈状态
(1)搞清楚有哪些博弈参与人; (2)明白各参与人在博弈中所能够 采取的策略、行动或选择; (3)了解从博弈中获取的得益 (payoff)
8
2.一些简单的博弈例子
• (1)Matching pennies(猜硬币博弈)
32
四、如何求解纳什均衡?
• 第一种方法:占劣策略剔除法 • 第二种方法:划线法
33
Game A
B Playe Black Red r A Play er
Red Black 2,2 0,5 5,0 3,3
34
Game B
L
T 3, 5
R
1, 4
C
2, 6
4, 5
B
1, 2
0, 3
35
Solution: Iterated Elimination
2.双方都退缩,双方都不获取任何效用。 3.双方都前进,两司机都会被撞得头破血 流,各自回损失效用3。
14
Driver II
Not Swerve Not Swerve Swerve (前进) (-3, -3) (-2, 2) Swerve (退缩) (2, -2) (0 , 0)
Driver I
Neither player has a dominating strategy. There doesn’t exist an equilibrium point.
一、博弈论定义
• 博弈论就是指研究多个个体 在平等的对局中各自利用对 方的策略变换自己的对抗策 略,以实现自己利益最大化 的学科。
6
二、如何表达一个博弈现象
在研究中任何博弈要考虑到
博弈参与者有哪些?数量如何? 博弈的规则或制约条件如何? 对手策略与自身的对应策略? 各种策略下自己的收益如何?
• 此时实现占优策略均衡:
– 双方都采取“招供”
20
一、占优策略及占优策略均衡
• 1.占优策略(Dominant strategy) – 在某个博弈中,如果不管其他博弈方选择 什么样策略,一博弈方的某个策略给他带 来的得益始终高于其他策略,至少不低于 其他策略,则该策略就是该博弈方的占优 策略。
21
• 公共知识(Common Knowledge): Everybody knows everybody knows everybody knows ...
39
• 下列博弈是否可以使用占劣策略?
Left Top Middle Bottom 3,2 3,6 1,1 Center 5,4 4,2 6,3 Right 4,3 2,5 5,4
• 2.占优策略均衡(Dominant strategy Equilibrium) – 如果一个博弈的某个策略组合中的所有 策略都是各个博弈方各自的占优策略, 那么这个策略组合肯定是所有博弈方都 愿意选择的,必然是该博弈比较稳定的 结果。此时,这个策略组合就是占优策 略均衡.
22
想一想?
• 为什么囚徒困境的两个人不能事先约 定好都‖不招供‖作为其最优选择? • 古诺寡头垄断均衡解是不是占优策略 均衡?
12
The Battle of the Sexes(性别之战或恋爱博弈)
小丽
Football Opera
Football
2,1
0,0
小勇
Opera
0,0
1,2
13
(4)The Game of Chicken(斗鸡博弈)
博弈参与人:司机A和司机B
策略:前进和退缩
得益:
1.双方中一方退缩,退缩一方丢失脸面损 失效用2,另一方以胜利者自居获取效用2。
38
This is called Iterated Elimination of Dominated Strategies.
• 使用重复剔除劣策略法的前提:
– 1.确信任何理性博弈参与人都不会使用严格 占劣策略。 – 2.上述理性条件是一种公共知识(This rationality requirement is common knowledge).
B
L
T 3, 5
R
1, 4
2nd
3rd
A
C
2, 6
来自百度文库
4, 5
B
1, 2
0, 3
1st
36
2.占劣策略重复剔除法 Elimination of Dominated Strategies
• 基本思路:
– 基于完全信息和理性的假定,首先找出某个 参与人的劣策略(若存在),剔除这个劣策 略后,重新构造一个不包含剔除劣策略的新 博弈,然后再剔除某个参与人的劣策略;重 复这一过程,一直到只剩下一个唯一的策略 组合为止。
二、纳什均衡及其含义
• “纳什均衡”
– 指这样一种策略组合,在给定别人策 略选择的情况下,没有任何单个参与 人有积极性选择其他策略。 – 或者说,没有人可以通过单方面改变 自己的策略而提高自己的得益的状态。
31
纳什均衡的进一步理解
– 第一,在该策略组合中,每个参与人的策略都是 给定其他参与人的策略情况下的最佳反应。 – 第二,该策略具有自我实施(self-enforcing)的功 能。 – 第三、一旦实现了纳什均衡,任何博弈方都没有 积极性偏离该均衡状态。 – 第四、占优策略均衡一定是纳什均衡,但纳什均 衡不一定就是占优策略均衡。
(D,R)是不是可能的最优选择?
Player B L R U
Player A
(3,9) (1,8)
D
(0,0) (2,1)
如果B选择R,A的最优反应是D; 如果A选择D,而B的最优反应是R. 所以, (D,R)是一个可能的最优组合
27
(D,L)是不是一个可能的最优组合
Player B L R U
– 2 players: Player A, B – actions: Heads(正面) or Tails(反面) – payoffs: player B gets $1 (and player A loses $1) if pennies match. Player B loses a dollar and player A gains $1 if pennies don’t match. – zero sum game(零和博弈).
– 2000’s—Now: Micro-foundation of Macroeconomics………
4
何谓博弈
• 本义:下棋 • 下棋的特点是什么? • 下棋和企业的市场竞争 有何共同点?
– 有规矩,讲策略,争输 赢
• 西方:game
– 含义比下棋更全面 – 竞争、合作
5 2016/10/15
5
15
三、博弈的分类
1.静态博弈和动态博弈
静态博弈:是指所有博弈方同时或可看作同 时选择策略、采取行动的博弈。 动态博弈:是指博弈方的选择、行动有先有 后,而且后选择、后行动的博弈方在自己进 行选择、行动之前可以看到在他之前选择、 行动的博弈方的选择、行动的博弈。
16
2.完全信息博弈和不完全信息博弈
18
本章内容:
• • • • 第一节 博弈论概述 第二节 纳什均衡 第三节 子博弈精炼纳什均衡 第四节 重复博弈
19
Prisoners’ Dilemma
• Prisoners’ Dilemma 结果:
– Player A – 占优策略:招供(confess) – Player B – 占优策略:招供( confess)
如果B选择L,则A的最优反映肯定是U; 如果A选择U,则B的最优反映肯定是L。 所以, (U,L)是一个可能最优选择组合。 29
Nash Equilibrium: Matrix
Player B L R
U Player A D
(3,9) (1,8)
(0,0) (2,1)
(U,L) 和(D,R)是该博弈的两个最优策略组合,即在 每个组合中,每个人的策略都是给定其他参与人策略 情况下的最优反应。 一旦实现了有这两个组合所表示的均衡时,没有一个 人愿意偏离该均衡。这样的均衡被称为纳什均衡。 30
Player A
(3,9) (1,8) (0,0) (2,1)
D
如果B选择L,则A的最优反应是U, 如果A选择D,则B的最优反应是R, 28 所以 (D,L)不是一个可能的最优组合。
(U,L)是不是一个最优组合? Player B L R
U
Player A D
(3,9) (1,8) (0,0) (2,1)
9
Matching Pennies (猜硬币博弈) 的表达 Player B
Heads Tails
Heads Player A
-1, 1
1, -1
Tails
1, -1
-1, 1
A手握硬币让B猜测手中硬币的正反面
10
(2)Rock-scissors-paper Game
Person B
rock paper scissors