第二讲(占优均衡、纳什均衡)
合集下载
第二章 战略式博弈 静态博弈与纳什均衡
• 用 si (s1, , si1, si1, , sn )表示除参与人i以 外其他参与人的战略组合,则
s (s1 , s2 , , sn ) (si , si )
• 因此,参与人 i(i 1, 2, 示为:
, n) 的支付就可表
ui ui (si , si )
新产品开发中参与人支付的标记
G {;(Si );(ui )} 来表示战略式博弈。
例1 完全信息静态博弈的战略式描述
考察“新产品开发博弈”。试用战 略式博弈对两个企业都知道市场需求且 企业同时决策的博弈情形,即完全信息 静态的“新产品开发博弈”进行建模。
“新产品开发博弈”的战略式博弈(需求大 时)
企业2
开发
开发
300, 300Leabharlann Baidu0, 800
a (a1 , a2 , , an ) 是n个参与人的行动组合(action profile)。 • 它表示博弈中每个参与人 i(i 1, 2, , n) 采取一 个行动的一种博弈情形,其中 ai 表示参与人i所 采取的行动。
在“新产品开发博弈”中: • 行动组合(开发,开发) (即( a, a ) )表示博弈中企 业1和2都采取行动“开发”; • 行动组合(不开发,开发) ( 即 (b, a ) )表示博弈中 企业1采取行动“不开发”,而企业2采取行动 “开发”。 • 用A表示所有行动组合的集合。在“新产品开 发博弈”中,存在四个行动组合,即
第二讲多重纳什均衡.ppt
• 博弈论第三章
3,2 6,6
5
情侣博弈?
关键:博弈方之间的协调
先动优势。 女士优先?
•
博弈论第三章
6
第三节多重纳什均衡的选择标准
二、风险优势标准:风险更小
(一)案例:串通作弊博弈
弊
逆天的帕 累托优势 标准 作弊
不作弊
学生乙 作弊 不作
学生甲
9,9 8,0
0,8 7,7
7
9,9 8,0
• 博弈论第三章 10
第三节多重纳什均衡的选择标准
二、风险优势标准:风险更小
(二)分析:偏离损失比较法
4.结论 (1)偏离(不作弊,不作弊)的损失更大:49
(2)不偏离(不作弊,不作弊)
9,9 8,0
• 博弈论第三章
0,8 7,7
11
第三节多重纳什均衡的选择标准
现的均衡。 2.标准 根据社会文化习惯、博弈历史等信息达到均衡
3.实质
规律性 强调文化与环境的作用 新婚夫妻的家务分担博弈 ; 教室中的座位分配博弈。 14 博弈论第三章
•
第三节多重纳什均衡的选择标准
四、相关均衡 (一)案例:“地域连坐”下的产品质量博弈 企业乙 好产品 差产 品 好产品 企业甲 差产品
3,2 6,6
5
情侣博弈?
关键:博弈方之间的协调
先动优势。 女士优先?
•
博弈论第三章
6
第三节多重纳什均衡的选择标准
二、风险优势标准:风险更小
(一)案例:串通作弊博弈
弊
逆天的帕 累托优势 标准 作弊
不作弊
学生乙 作弊 不作
学生甲
9,9 8,0
0,8 7,7
7
9,9 8,0
• 博弈论第三章 10
第三节多重纳什均衡的选择标准
二、风险优势标准:风险更小
(二)分析:偏离损失比较法
4.结论 (1)偏离(不作弊,不作弊)的损失更大:49
(2)不偏离(不作弊,不作弊)
9,9 8,0
• 博弈论第三章
0,8 7,7
11
第三节多重纳什均衡的选择标准
现的均衡。 2.标准 根据社会文化习惯、博弈历史等信息达到均衡
3.实质
规律性 强调文化与环境的作用 新婚夫妻的家务分担博弈 ; 教室中的座位分配博弈。 14 博弈论第三章
•
第三节多重纳什均衡的选择标准
四、相关均衡 (一)案例:“地域连坐”下的产品质量博弈 企业乙 好产品 差产 品 好产品 企业甲 差产品
第二讲纳什均衡
ac p1 p2 2b
案例讨论1
我们可以发现,旅游区、火车站的商品 价格往往会定得很高,而且这些地方也 充斥着大量的假货。本来游客来到旅游 区主要是为了放松心情,顺便买些纪念 品回去。然而我们也可以发现旅游区的 现象是:游客匆匆从商户门前走过,商 户拼命的吆喝,没有做成多少生意。
案例讨论1
纳什均衡
纳什均衡:(被动增税,被动增税) 巨额赤字
试一试:劣势策略反复消去法
上 参与人1 下 参与人2 左 中 右
1,0
0,4
1,3
0,2
0,1
2,0
第二节
纳什均衡
三、寻找纳什均衡的方法 2000:军费支出 (二)相对优势策略划线法 -∞:丧失主权 8000:掠夺者赢利 0:军费支出为零,和平 原苏联 共处 扩军 裁军 -2000,-2000 8000,-∞ 扩军 美国 -∞,8000 0, 0 裁军
三、寻找纳什均衡的方法 (三)箭头指向法 1.(适度放牧,适度放牧) (1)给定乙不变,甲改变:20→30 (箭头向上) (2)给定甲不变,乙改变:20→30 (箭头向左)
第二节
纳什均衡
要点:(1)箭 头指向的支付 大;(2)只有 一方单独改变 策略
三、寻找纳什均衡的方法 (三)箭头指向法 2.(适度放牧,过度放牧) (1)给定乙不变,甲改变:0→10 (箭头向上) (2)给定甲不变,乙也不变
第二节 纳什均衡
反过来,如果乙选择继续开而甲选择等待,乙收 益为1,甲收益为0。如果两车都选择等待,甲乙收益 都为 -1。这时的均衡有两个,如果甲选择继续开,乙 就会选择等待;如果乙选择继续开,甲就会选择等待。
双方的收益矩阵如下图所示:
甲车
乙车
开
等
开
-10,-10 1,0
等
0,1
-1,-1
图8-8 最终均衡在哪一种情况,取决于交通规则。
1.定义 设有n个参与者(n≥2),如果第i个参与者选择Si* 时比选择Si时的收益都要好或至少不差。换句话讲,就 是在别人都没有变化策略的情况下,i如果变化策略,i 就要吃亏。这样Si*就是i的最优策略。即给定别人策略, 自己选择最优策略。决策做出Hale Waihona Puke Baidu,每一个参与者都不会 变化,至少是别人不变化,自己就不变化。 概言之,纳什均衡指的是:在一个纳什均衡里,任 何一个参与者都不会改变自己的策略,如果其他参与者 不改变策略(245页)。
图8-9
假设罚球者罚球时可以选择三个方向:左中右; 守门员也可选择三个方向扑球,左中右。
当罚球者选择了左的情况下,如果守门员也选择 了左,罚球者将得 -1,守门员将得 +1;如果守门员 选择了右或者中,罚球者将得 +1,守门员将得 -1。
当罚球者选择了中的情况下,如果守门员也选择 了中,罚球者将得 -1,守门员将得 +1;如果守门员 选择了右或者左,罚球者将得 +1,守门员将得 -1。
完全信息静态博弈
二 重复剔除的占优均衡
举例: 剔除顺序:R3、C3、C2、R2,战略组合(R1,C1)
C1
R1
2,12
R2
0,12
R3
0,12
C2
1,10 0,10 0,10Fra Baidu bibliotek
C3
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
故一般使用严格劣战略剔除,可以看到,(R1,C3) (R1,C1)都是纳什均衡,但在这里是不可解的。
6,2
R2
2,1
R3
3,0
8,4 9,6
3,6 2,8
二 重复剔除的占优均衡
注意:
✓ 1、重复剔除的占优均衡结果与劣战略的剔除 顺序是否有关取决于剔除的是否是严格劣战略。
✓ 2、重复剔除的占优均衡要求每个参与人是理 性的,而且要求“理性”是参与人的共同知识。 即:所有参与人知道所有参与是理性的,所有 参与人知道所有参与人知道所有参与是理性的
为了找出这些博弈的均衡解,需要引入纳什均衡。
第二章 完全信息静态信息博弈-纳什均衡
一 占优战略均衡 二 重复剔除的占优均衡 三 纳什均衡 四 混合战略纳什均衡 五 纳什均衡存在性及相关讨论 六 纳什均衡应用举例
三 纳什均衡
假设n个参与人在博弈之前达成一个协 议,规定每一个参与人选择一个特定的 战略,另 s* (s1*, 代, si*表,这, s个n* ) 协议,在没 有外在强制力的情况下,如果没有任何 人有积极性破坏这个协议,则这个协议 是自动实施的。这个协议就构成了一个 纳什均衡。
第二讲纳什均衡
习题:齐威王田忌赛马矩阵
上中下 上中下
田忌
上下中 中上下 中下上 下中上 下上中
+3,-3 +1,-1 +1,-1 -1,+1 +1,-1
+1,-1 +3,-3 -1,+1 +1,-1 +1,-1
+1,-1 +1,-1 +3,-3 +1,-1 -1,+1
+1,-1 +1,-1 +1,-1 +3,-3 +1,-1
要点:(1)箭 头指向的支付 大;(2)只有 一方单独改变 策略
三、寻找纳什均衡的方法 (三)箭头指向法 1.分析:(适度放牧,适度放牧) (1)给定乙不变,甲改变:20→30 (箭头向上) (2)给定甲不变,乙改变:20→30 (箭头向左)
2015年12月6日
博弈论第二章 第二讲纳什均衡
2015年12月6日
博弈论第二章 第二讲纳什均衡
3
第三节 纳来自百度文库均衡
一、案例:情侣博弈 自告奋勇: 寻找优势策略均衡 (一)矩阵 夏娃 足球 芭蕾 足球 2,1 0,0 亚当 -1,-1 1,2 芭蕾
2015年12月6日
博弈论第二章 第二讲纳什均衡
4
第三节
纳什均衡
一、案例:情侣博弈 (二)优势策略均衡 (足球,足球),(芭蕾,芭蕾)
博弈论(二)—讲义
9.2 完全信息静态博弈
9.2.1 博弈的战略式表述
Definition A normal (strategic) form game G consists of: (1) a finite set of agent s . {1,2,,}D n = (2) strategy sets .
12,,,n S S S (3) payoff functions . 12:(1,2,,)i n u S S S R i n ⨯⨯⨯→=
囚徒B
囚徒A
完全信息静态博弈是一种最简单的博弈,在这种博弈中,战略和行动是一回事。 博弈分析的目的是预测博弈的均衡结果,即给定每个参与人都是理性的,什么是每个参与人的最优战略?什么是所有参与人的最优战略组合?
纳什均衡是完全信息静态博弈解的一般概念,也是所有其他类型博弈解的基本要求。
下面,我们先讨论纳什均衡的特殊情况,然后讨论其一般概念。
9.2.2 占优战略(Dominated Strategies )均衡
一般说来,由于每个参与人的效用(支付)是博弈中所有参与人的战略的函数,因此,
每个参与人的最优战略选择依赖于所有其他参与人的战略选择。但是在一些特殊的博弈中,一个参与人的最优战略可能并不依赖于其他参与人的战略选择。也就是说,不管其他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”。
Definition Strategy s i is strictly dominated for player i if there is some such that i i s S '∈ for al .
第二讲纳什均衡
博弈论故事之五--高薪养廉
• 我们把数据改变一下,变成薪水只有2, 两个串谋,同时受贿还是得9;一方受贿, 一方不受贿,则分别为2,3。 • 得益矩阵?
高薪养廉的得益矩阵
乙
受贿 受 贿 不受贿
9 9 0 8 7 0
8 7
受贿 受 贿
甲
不 受 贿
乙
不受贿
9 9 0 3 2 0
3 2
甲
不 受 贿
完全信息静态博弈
百万裁军的论证
B
扩军 扩军
-2000 -2000
有限军备
-1500 -1600
不设防
-∞ 8000 -∞ 9500
A
有限 军备 不设防
-1600 -1500
-500 -500 9500
8000
-∞
-∞
0 0
经典博弈故事之二--情侣博弈 经典博弈故事之二--情侣博弈 --
• 大海和小丽正在热恋。难得的周末又到了,安排什么节目呢?周末晚上, 大海和小丽正在热恋。难得的周末又到了,安排什么节目呢?周末晚上, 中国足球队要在世界杯外围赛中和伊朗队做生死之战。大海是个超级球迷, 中国足球队要在世界杯外围赛中和伊朗队做生死之战。大海是个超级球迷,国 内的甲级联赛都不肯放过,何况是不争气的国家队的生死大战? 内的甲级联赛都不肯放过,何况是不争气的国家队的生死大战?也正好是这个 周末的晚上,俄罗斯一个著名芭蕾舞团莅临该市演出芭蕾舞剧《胡桃夹子》 周末的晚上,俄罗斯一个著名芭蕾舞团莅临该市演出芭蕾舞剧《胡桃夹子》。 丽娟最崇尚钢琴、芭蕾这样的高雅艺术, 丽娟最崇尚钢琴、芭蕾这样的高雅艺术,对斯拉夫民族的歌唱和芭蕾更是崇拜 得五体投地,她怎么肯放过正宗俄罗斯的芭蕾舞剧《胡桃夹子》 这么说, 得五体投地,她怎么肯放过正宗俄罗斯的芭蕾舞剧《胡桃夹子》?这么说,一 个在家里看电视直播的足球,一个去剧院看芭蕾舞演出不就得了? 个在家里看电视直播的足球,一个去剧院看芭蕾舞演出不就得了?问题在于他 们是热恋中的情侣,分开各自度过这难得的周末时光,才是最不乐意的事情。 们是热恋中的情侣,分开各自度过这难得的周末时光,才是最不乐意的事情。 这样一来,他们就面临一场温情笼罩下的“博弈” 这样一来,他们就面临一场温情笼罩下的“博弈” 在情侣博弈中, 我们不妨这样给大海和小丽的“满意程度”赋值: 在情侣博弈中, 我们不妨这样给大海和小丽的“满意程度”赋值:如果 大海看球让小丽一个人去看芭蕾,双方的满意程度都为0 两人一起去看足球, 大海看球让小丽一个人去看芭蕾,双方的满意程度都为0;两人一起去看足球, 大海的满意程度为2 小丽的满意程度为1 两人一起去看芭蕾, 大海的满意程度为2,小丽的满意程度为1;两人一起去看芭蕾,大海的满意 程度为1 小丽的满意程度为2 程度为1,小丽的满意程度为2。应该不会有小丽独自看球而大海独自去看芭 蕾的可能,不过人们还是把它写出来,设想因此双方的满意程度都是- 蕾的可能,不过人们还是把它写出来,设想因此双方的满意程度都是-1。 试着用一个得益矩阵来描述大海和丽娟的情侣博弈
第2章 纳什均衡
i∈N及
si
s .令 u i' ( s ) = u i ( s ) + C i , s i = , i u i ( s ), s i ≠ s i
' G与 G ' = N, S1,, Sn , u1,, u 'n
有相同的纳什均衡.
重复剔除被严格占优策略均衡与纳什均衡的关系
* * 命题2.2 若 s* = ( s1 , , sn ) 命题
ຫໍສະໝຸດ Baidu
2.1 纳什均衡的定义
纳什均衡是博弈论中最重要的概念, 纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概 最重要的概念 念都是建立在纳什均衡基础之上的. 念都是建立在纳什均衡基础之上的
* 纳什均衡是个策略组合 s* = ( si* , si ) ,它满足两个要求. * 1.对每个局中人 i ∈ N ,能够预期到对手采用策略组合 s i .
PA UA = PB δ A类消费者购买商品A A类消费者购买商品 B
PA δ UB = PB
B类消费者购买商品A B类消费者购买商品B
q 用 q A 表示消费者对于产品A的需求量; B 表 示消费者对于产品B的需求量.则 0 PA > PB +δ qA = nA PB δ ≤ PA ≤ PB +δ n +n PA < P δ A B B
si
s .令 u i' ( s ) = u i ( s ) + C i , s i = , i u i ( s ), s i ≠ s i
' G与 G ' = N, S1,, Sn , u1,, u 'n
有相同的纳什均衡.
重复剔除被严格占优策略均衡与纳什均衡的关系
* * 命题2.2 若 s* = ( s1 , , sn ) 命题
ຫໍສະໝຸດ Baidu
2.1 纳什均衡的定义
纳什均衡是博弈论中最重要的概念, 纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概 最重要的概念 念都是建立在纳什均衡基础之上的. 念都是建立在纳什均衡基础之上的
* 纳什均衡是个策略组合 s* = ( si* , si ) ,它满足两个要求. * 1.对每个局中人 i ∈ N ,能够预期到对手采用策略组合 s i .
PA UA = PB δ A类消费者购买商品A A类消费者购买商品 B
PA δ UB = PB
B类消费者购买商品A B类消费者购买商品B
q 用 q A 表示消费者对于产品A的需求量; B 表 示消费者对于产品B的需求量.则 0 PA > PB +δ qA = nA PB δ ≤ PA ≤ PB +δ n +n PA < P δ A B B
《博弈论与信息经济学》纳什均衡
2020/6/11
如果战略组合s* s1*,..., si*,..., sn*
是由每个参与人的严格占优战略si*组成, 则称s*为该博弈的严格占优战略均衡。
如果不等式ui
si*, si
ui
si
,
si
成立,
则称s*
s1*,..., si*,..., sn*
为G的严格占优
战略均衡。
b2 U L
b1 C U b2 M C
b1 R D
b2 D R
b1 b2
R D D R
双方都满意的均衡为 D, R。
2020/6/11
21
博弈论与信息经济学
▪ (2)纳什均衡
在博弈G S1,..., Sn;u1,..., un中,如果战略组合s s1,..., si,..., sn 中的任一战略,都符合bi si si,即:ui si, si ui si , si ,i 1,..., n,
2020/6/11
16
博弈论与信息经济学
❖ 2.相对占优战略均衡
▪ (1)相对占优战略
• 在爱情博弈中,既没有严格优势战略也没有(弱)占优战略,只有相对占优战 略。例如,当张媛选择“英语”时,李明的占优战略为“英语” ,即:对于 张媛的“英语”李明的相对占优战略为“英语”。
2020/6/11
李明/ 张媛
博弈论2纳什均衡及应用举例
Outcome & Equilibrium ——结果与均衡
博弈的结果是所有博弈方所关心的,如均 衡策略组合,均衡行动组合,均衡支付组 合。 在房地产开发博弈中,可能的结果是
(高需求,开发,开发),(uA,uB)=(4000,4000)
(低需求,开发,不开发),(uA,uB)=(1000,0)
厂商3—老技术
厂商2 新技术
老技术
(A)
厂 新技术 5,5,0 10,1,1 商 1 老技术 1,10,1 2,2,2
(B)
有限策略和无限策略
不同的博弈问题中各博弈方可选策略的多少不同, 一般分为:有限策略博弈和无限策略博弈
有限策略(所有博弈方都只有有限种可选策略)的博弈只有 有限种结果(一种结果就是每个博弈方各一种可选策略构成 的一个组合,全部可能的结果的数量因而就等于各博弈方可 选策略数的连乘积) 有限策略博弈往往用支付矩阵、扩展形法将所有策略、结果 及支付罗列出来。 无限策略博弈其策略数种往往是一个连续数,只能用数集或 函数式加以表示。
进入
(0,300)
B
合作
在位者
斗争
(0,400)
B
合作
在位者
斗争
(40,50) (-10,0)
(30,80) (-10,100)
行动action
第四章第二讲子博弈精炼纳什均衡
24
第四节 延伸分析
三、子博弈精炼纳什均衡存在的问题 (二)旅行者困境
3.理论分析:参与人的“理性”心理状态 纳什均衡:(索低价,索低价) (0,0)
4.现实 参与人事先订立协议,索高价
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
25
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
8
第三节
子博弈精炼纳什均衡
二、子博弈精炼纳什均衡 (二)分析 1. (入驻,{容忍,容忍})
子博弈:指向(0, 10)的策略组合— —在位者无单独偏 子博弈:指向( 离激励 1, 5)的策略组合— —在位者无单独偏 离激励
2015年12月6日
第二讲子博弈精炼纳什均衡
21
第四节 延伸分析
三、子博弈精炼纳什均衡存在的问题 (一)残酷的蜈蚣博弈
3.现实 结果:参与人事先订立协议, 博弈9999次,奖金平分。
2015年12月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
22
第四节 延伸分析
三、子博弈精炼纳什均衡存在的问题 (二)旅行者困境
1.案例 旅行者甲、乙托运的花瓶被损坏, 向航空公司索赔
F
F 夏娃 B 亚当 × 亚当 B × × F (1,2) (-1,-1)
(0,0)
B (2,1)
博弈论 第二章
A
Á B
1
1/4
1/2 3/4
现在,因为商品一样,价格也一样,居民到哪个杂 货铺买东西,就看哪一个杂货铺离自己比较近。
如果把这条路四等分,杂货铺A设在1/4的位置,杂 货铺B设在3/4的位置,问题就解决了。好象这是一种 不错的配置, 按照这种配置, 每个杂货铺的势力范围都 是1/4。
可是,如果杂货铺只以自己赢利为目的,是不会 满足于这样的位置安排的。因为如果A向右移动一点儿 到达Á的位置,那么A的地盘,就扩张到Á和B的中点, A的地盘就会比B持有的地盘大。所以,原来位于左边 的A,有向右边移动来扩大自己的地盘的动力。在这个 定位博弈中,杂货铺的地盘就是市场份额,就是经济 利益。同样,原来位于右边的B,有向左边移动扩大自 己地盘的激励。可见上述A在1/4处, B在3/4处的位置配 置方式,不是稳定的配置。
••••••••ui(si*,s *i)ui(si,s *i),••si Si,i
纳什均衡——通俗的表达:给定你的策略,我 的策略是最好的策略;给定我的策略,你的策 略也是你最好的策略。
显然占优策略均衡是一种纳什均衡,但是 纳什均衡不一定是占优均衡。占优策略均衡是 比纳什均衡更强的博弈均衡,它要求任何一方对 于其他博弈方的任何策略选择来说,其最优策 略选择都是唯一的。而纳什均衡只要求任何一 个博弈方在其他博弈方的策略选择给定的条件 下,其选择的策略是最优的。
纳什均衡与一致预期
• (2)1st-order CKR:R not choose R4 for R(b)C • (3)2nd-order CKR:C not choose C1 for C(b)R(b)C • (4)3rd-order CKR: R not choose R1 for R(b)C(b)R(b)C • (5)4th-order CKR:C not choose C3 for
• 混合战略:博弈方以一定的概率分别在可选策略中随机选 择形成的战略,(老虎,鸡,虫,杠子)=(1/4,1/4, 1/4,1/4)
35
例1 监督博弈
老板 监督
不监督
工人
偷懒
不偷懒
1,-1 -1,2
-2,3
2,2
36
监督博弈
那么老板以多大概率监督,
工人以多大的概率偷懒呢?
p 工人1-p
偷懒 不偷懒
纳什均衡是一致性预测并不意味着 纳什均衡一定是一个好的预测
23
3.1 哲学思考
如果参与人事前达成一个协议,在不存在外部强制 的条件下,每个人都有积极性遵守这个协议,这个协议 就是纳什均衡。
•有些制度使人们自觉遵守,是因为NASH 均衡。一个制度要流行,首先必须是理性下 的NASH均衡。人民公社之所以不成功,是 假设人都好好干,不理性,不是NASH均衡。
不合作 S,R-X
P,P
合同法
• 混合战略:博弈方以一定的概率分别在可选策略中随机选 择形成的战略,(老虎,鸡,虫,杠子)=(1/4,1/4, 1/4,1/4)
35
例1 监督博弈
老板 监督
不监督
工人
偷懒
不偷懒
1,-1 -1,2
-2,3
2,2
36
监督博弈
那么老板以多大概率监督,
工人以多大的概率偷懒呢?
p 工人1-p
偷懒 不偷懒
纳什均衡是一致性预测并不意味着 纳什均衡一定是一个好的预测
23
3.1 哲学思考
如果参与人事前达成一个协议,在不存在外部强制 的条件下,每个人都有积极性遵守这个协议,这个协议 就是纳什均衡。
•有些制度使人们自觉遵守,是因为NASH 均衡。一个制度要流行,首先必须是理性下 的NASH均衡。人民公社之所以不成功,是 假设人都好好干,不理性,不是NASH均衡。
不合作 S,R-X
P,P
合同法
《博弈论与信息经济学讲义》第2章 纳什均衡与一致预期
2为企业2的产量
• 假定成本函数为: C(qi ) ciqi
• 那么,利润函数为:
1 q1P(Q) cq1 q1(a q1 q2 c) 2 q2P(Q) cq2 q2 (a q1 q2 c)
双寡头竞争(续)
• 企业最大化利润的一阶条件为:
q1
R1(q2 )
a
2
c
q2 2
风险与均衡
• 由于纳什均衡要求理性共识和一致预期,当人 们可能犯小小的错误时,纳什均衡不一定被选
择。如下面这个博弈中,多数人将选择“下” 而不是“上”。
左
右
只要B有千分之一的 概念错误地选择右,
上
8, 10
-1000,9
A将选择下;如果B怀疑
A怀疑自己可能犯错误,
下
7, 6
6, 5
B将选择右。所以,出现 的不是纳什均衡
• CAB:每个人对别人行为的预期(信念)是正 确的;
• Harsanyi doctrine: 如果两个理性的人具有相同 的信息,他们一定会得出相同的推断和相同的 结论;
• Robert Aumann: rational agents cannot agree to disagree.
纳什均衡与一致预期
• 占优战略均衡的出现只要求所有人都是理性的,但不 要求每个参与人知道其他参与人是否理性。
• 囚徒困境博弈有占优均衡,所以其结果很容易预测。
• 假定成本函数为: C(qi ) ciqi
• 那么,利润函数为:
1 q1P(Q) cq1 q1(a q1 q2 c) 2 q2P(Q) cq2 q2 (a q1 q2 c)
双寡头竞争(续)
• 企业最大化利润的一阶条件为:
q1
R1(q2 )
a
2
c
q2 2
风险与均衡
• 由于纳什均衡要求理性共识和一致预期,当人 们可能犯小小的错误时,纳什均衡不一定被选
择。如下面这个博弈中,多数人将选择“下” 而不是“上”。
左
右
只要B有千分之一的 概念错误地选择右,
上
8, 10
-1000,9
A将选择下;如果B怀疑
A怀疑自己可能犯错误,
下
7, 6
6, 5
B将选择右。所以,出现 的不是纳什均衡
• CAB:每个人对别人行为的预期(信念)是正 确的;
• Harsanyi doctrine: 如果两个理性的人具有相同 的信息,他们一定会得出相同的推断和相同的 结论;
• Robert Aumann: rational agents cannot agree to disagree.
纳什均衡与一致预期
• 占优战略均衡的出现只要求所有人都是理性的,但不 要求每个参与人知道其他参与人是否理性。
• 囚徒困境博弈有占优均衡,所以其结果很容易预测。
第二讲(占优均衡、纳什均衡)
• 有两家电台 – 维德和库克。 选择电台节目博弈收益矩阵
它们可以在三种节目形式 中选择:摇滚乐,乡村音 乐和谈话节目。收益用它
们所获得听众的百分比表 示。听众中有70%喜欢的 是摇滚乐;其次是乡村音
维德
摇滚乐 乡村 谈话 音乐 节目
库 摇滚 35,35 50,40 80,10 克乐
乐,有40%;然后谈话节
– 假设赢得收益是1,而输的收益是-1,平局的收益是各 为0。
A 石头 剪刀 布 B 石头 0, 0 1, -1 -1, 1 剪刀 -1, 1 0, 0 1,-1 布 1,-1 -1, 1 0, 0
零和博弈和非零和博弈
• 零和博弈 (zero-sum game):
– 是一种完全对抗,强烈竞争 的对局。
• 因此纳什均衡具有“非唯一性”。
– 事实上,一方只有在明确知道另一方选择的情况下才能做出自己 的选择,因此当面临同时选择时,就可能产生了问题。结果到底 是哪个纳什均衡呢?
– 假设库克多年来成功的播放了摇滚乐节目,那么维德就有理由相 信库克会继续选择摇滚乐而采用乡村音乐的节目形式。
• 从历史中得到线索,进而判断出各个均衡发生的概率。把 这种以线索为基础选择的均衡称为“谢林点”(Schelling point)或“焦点”。
买方
周周周周周周 一二三四五六
卖 周 3, -1, -1, -1, -1, -1, 方 一 3 -1 -1 -1 -1 -1
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非合作和合作均衡
• 对抗博弈 (rivalry game):
– 又称“非合作性均衡” (non-cooperative equilibrium) 。 – 每一方选择战略时都没有共谋,他们只是选择对自身
最有利的战略。(虽然合谋的共同利益将达到最大。) – 占优均衡是一种非合作解。 – 如果两者进行合作,则会出现“合作性均衡”
买方
周周周周周周 一二三四五六
卖 周 3, -1, -1, -1, -1, -1, 方 一 3 -1 -1 -1 -1 -1
周 -1, 3, -1, -1, -1, -1, 二 -1 3 -1 -1 -1 -1
周 -1, -1, 3, -1, -1, -1, 三 -1 -1 3 -1 -1 -1
周 -1, -1, -1, 3, -1, -1. 四 -1 -1 -1 3 -1 -1
非合作和合作均衡
• 然而对于契约,往往 每个参与者都有强大 的动机去欺骗协议转 向非合作性均衡。
– 这是为什么呢?
– 在双寡头博弈中,无 论是A寡头还是B寡头 都可以通过违约获取 更多的收益“40”。
B 寡 联合并 头 限制生
产
竞争
A寡头 联合并 限制生
产 A 30 B 30
A 10 B 40
竞争
可能出现负和或正和的结果?
非零和博弈
• 在市场经济下,要想获得利益就要跟别人合作,才能使双 方都获得好处。
• 只要是双方同意的任何一个买卖,买方和卖方都会获得利 益。
• 事实上,那些看似零和或者负和的问题如果转换一下视 角,也可能转变为正和博弈。
3 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.cn
协调博弈 (Coordination game)
• 在协调博弈中,只有协调 彼此的战略选择,参与者 才能得到最优的收益。
– 推与不推博弈就是一个协调 博弈。
• 案例:赶集日博弈
– 如果买方和卖方同一天去集 市,交易成功,他们双方都 可获利。但如果不在同一天 去,则交易没法进行,且还 要支付交通费用。
乡村 40,50 20,20 40,10
目,只有10%。如果两个
音乐
电台同时选择一种节目形
谈话 10,80 10,40 5,5
式,它们将平分听众。
节目
• 该博弈中,有无占优战略 和占优均衡?纳什均衡?
纳什均衡 – 谢林点
• 在选择电台节目博弈中存在两个纳什均衡。 – 维德-摇滚乐和库克-乡村音乐,或者维德-乡村音乐和 库克-摇滚乐。
A 40 B 10 A 15 B 15
存在两个以上战略的博弈
• 教科书博弈:
– H和K两位教授都在编写经济教科书。两本书质量相同,但篇 幅长短不同。一般情况下,如果质量一样,教师会选择篇幅 长一点的教科书。当然,每个人都想获得更多的读者,但增 加篇幅需要付出更多的努力。两位作者不想写得太长,只要 能战胜对方就可以了。
周 -1, -1, -1, -1. 3, 1, 五 -1 -1 -1 -1 3 -1
周 -1, -1, -1, -1, -1, 3, 六 -1 -1 -1 -1 -1 3
协调博弈
• 赶集日博弈的逻辑推理并没有给出谢林点。 • 提供谢林点的可能是城镇的习俗。该城镇
可能总是周二举行集市。 • 由此可见:
垃圾处理博弈收益矩阵
甲先生
倾倒
雇卡车
乙先生 倾倒 4000, 4000 5000, 3500 雇卡车 3500,5000 4500,4500
• 在该博弈中,对于甲先生和乙先生,他们最优的战略就是“倾倒垃 圾”,因此即为他们的占优战略。
• 劣战略:如果第二个战略被第一个战略占优,那么第二个战略被 称为劣战略。显然,雇卡车是该博弈的劣战略。
• 因此纳什均衡具有“非唯一性”。
– 事实上,一方只有在明确知道另一方选择的情况下才能做出自己 的选择,因此当面临同时选择时,就可能产生了问题。结果到底 是哪个纳什均衡呢?
– 假设库克多年来成功的播放了摇滚乐节目,那么维德就有理由相 信库克会继续选择摇滚乐而采用乡村音乐的节目形式。
• 从历史中得到线索,进而判断出各个均衡发生的概率。把 这种以线索为基础选择的均衡称为“谢林点”(Schelling point)或“焦点”。
– 请问这两家寡头企业有没有占优战略和占优均衡? – 该博弈的合作解是什么? – 两家企业达成了协议进行联合。 – 这对社会效率会有怎样的影响? – 寡头联合形成垄断(托拉斯),并降低社会效率。在
完全竞争的状态下,非合作性均衡造成了社会的最大 效率。
1 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.cn
• 占优均衡:当一个博弈中的每一位参与者都选择了自己的占优战 略时,相应的博弈结果就是占优均衡。
• 垃圾处理博弈的占优均衡是双方都倾倒垃圾。
社会两难 (social dilemma)
• 有两家渔民依靠在附近的 公共池塘捕鱼为生。他们 可以充分使用自身的生产 力尽可能捕多的鱼,也可 以联合限制捕鱼的数量。 下表显示了这两家的各种 可能的收益。
• 请问这两家渔民有没有占 优战略和占优均衡?
• 该博弈可以给我们什么启 示?
渔民B
限制捕 尽全力 鱼量 捕鱼
渔 限制捕 民 鱼量
A 尽全力 捕鱼
A 20 B 20 A 30 B2
A2 B 30 A4 B4
社会两难:是一种存在占优均衡的博弈,但是参与者采用这 种均衡战略的收益比采用非均衡战略的收益要差。
wk.baidu.com
– 参与者的收益总和是零(或 是某个常数-常数和博弈 constant-sum game),也 就意味着一个参与者的所得 既是另一个参与者所失去的。
– 案例:狐狸和狼
狼 相信 狐狸
不相 信狐 狸
• 画出该博弈的收益矩阵。
狐狸 欺骗 不欺 狼 骗狼 -100, 0, 100 -100
0, 0, -100 -100
– 该博弈有无占优战略和占优均衡?
K教授
教科书博弈收益矩阵 H教授
400页 600页 800页 400页 45,45 15,50 10,40 600页 50,15 40,40 15,45 800页 40,10 45,15 35,35
纳什均衡
• 在教科书博弈中,没有占优战略,而只有针对对 方战略的最优反映。当对方改变战略后,另一方 的战略也需要相应的改变,否则就会处于劣势。
第二讲 占优均衡、纳什均衡
占优战略
• 占优战略 (dominant strategy):
– 无论其他博弈者采用何种战略,该博弈者的战略总是 最好。
案例:垃圾处理博弈 甲先生和乙先生是邻居,他们 的房子格局如右图。他们可以 选择把垃圾倾倒在离自己房子 较远的一块属于自己的空地 上,但如此倾倒垃圾会影响到 邻居。他们也可以共同雇佣一 辆卡车处理垃圾,但每人需支 付¥500。 他们会如何做出决策呢?
– 在特定情况下,管理和传统能够提供多纳什均 衡博弈的解。
– 协调博弈中的纳什均衡可以解释为什么习俗和 惯例看似很随意, 实际却很稳定,因为他们都 是纳什均衡,能够自我强化。
不存在纳什均衡的博弈
• “石头,剪刀,布”是一个猜拳游戏。 • 假定该博弈为非合作均衡,参与者都想获胜,那
么其存在占优均衡吗?纳什均衡? • 画出该博弈的收益矩阵。
• 纳什均衡 (Nash equilibrium):
– 是全部参与者所选战略的一个组合,在这个战略组合 中,每个人的战略都是针对其他人战略的最优反映。
– 纳什战略也是非合作均衡。 – 占优均衡属于纳什均衡,而纳什均衡不属于占优均衡。 – 请寻找一下教科书博弈中的纳什均衡。
• 案例:选择电台节目
纳什均衡
纳什均衡 – 收益占优均衡
• 案例:推与不推博弈
– 吉姆和卡尔开车驶在同一条路上,有棵大树挡住了道路。 两人可以选择都去推树,树会被成功的挪走(每人收益 5)。如果一人推,一人不推,则推的人会受伤(收益 是-10),另一个人要需要将伤者送到医院(收益是0)。 如果两人都不推,就必须掉头驶回(两人收益都为1)。
• 该博弈的纳什均衡是什么? (推推,与推不)推和博(弈不收推益,矩不阵推)
吉姆
• 该博弈的谢林点是哪个?你
推 不推
是如何判断的? 收风益险最占大优这个特卡尔征似乎推能够使5使(,5(不推-,10推不,0 )
均推衡)称为该谢博林弈点的,谢因林为不点这推个。0均,衡-1规0 避1了,1
最大的损失。
2 PDF 文件使用 "pdfFactory Pro" 试用版本创建 www.fineprint.cn
– 假设赢得收益是1,而输的收益是-1,平局的收益是各 为0。
A 石头 剪刀 布 B 石头 0, 0 1, -1 -1, 1 剪刀 -1, 1 0, 0 1,-1 布 1,-1 -1, 1 0, 0
零和博弈和非零和博弈
• 零和博弈 (zero-sum game):
– 是一种完全对抗,强烈竞争 的对局。
非零和博弈
• 非零和博弈:
– 既有对抗,又有合作。参与者的目标不完全对立。
• 非常数和博弈 (non-constant-sum game):
– 总收益取决于参与者所选择的战略。 – 其结局的收益总和是可变的。 – 负和博弈 – 两败俱伤的结果。 – 正和博弈 – 双赢的结果。 – 请你思考一下在狐狸和狼的博弈中,采用怎样的战略
• 有两家电台 – 维德和库克。 选择电台节目博弈收益矩阵
它们可以在三种节目形式 中选择:摇滚乐,乡村音 乐和谈话节目。收益用它
们所获得听众的百分比表 示。听众中有70%喜欢的 是摇滚乐;其次是乡村音
维德
摇滚乐 乡村 谈话 音乐 节目
库 摇滚 35,35 50,40 80,10 克乐
乐,有40%;然后谈话节
(cooperative equilibrium)。
• 合约为解决社会两难问题提供了一个出路。
– E.g.垃圾处理博弈中共同雇佣卡车就是一个合作解,双 方可以通过签订合约规定必须履行雇卡车的义务。
– 在很多非合作的场合,法规也能达到同样的目的。
非合作和合作均衡
• 案例:双寡头市场。
– 市场上有两个寡头企业。他们可以组成企业联合并限 制生产以抬高产品市场价格。或者他们可以竞争。右 表显示了这两个企业的各种可能的收益。