13 完全信息动态博弈(子博弈完美的纳什均衡)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完全信息动态博弈
完全信息动态博弈 序贯博弈 Sequential Games 重复博弈 Repeated Games 逆推方法
Backward induction
博弈的扩展式 ——
博弈树
game tree
子博弈精炼的纳什均衡
SPNE
子博弈
子博弈 subgame
给定“历史” 给定“历史”,每一个行动选择开始至博弈结束 构成了一个博弈,称为“子博弈” 构成了一个博弈,称为“子博弈”。 扩展式博弈的子博弈G是由一个单结信息集x 扩展式博弈的子博弈G是由一个单结信息集x开始 的与所有该决策结的后续结(包括终点结)组成的, 的与所有该决策结的后续结(包括终点结)组成的, 能自成一个博弈。 能自成一个博弈。
例:要挟诉讼
起诉
威胁不可 信
(TX(TX-P-C, -TX-D) TXA
拒绝 (要求赔偿S) B 要求赔偿S 指控 放弃
( -C , 0
)
A
接受 不指控
( 0 ,0 )
( S-C, -S )
若 TX<P 则 A将选择放弃 SPNE: SPNE:A不指控
例:要挟诉讼
起诉
威胁可信
(TX(TX-P-C, -TX-D) TX-
Fra Baidu bibliotek
子博弈 Sub-game
原博弈中的一部分(次级博弈) 原博弈中的一部分(次级博弈)
L
( 2, 9 )
B1
U R L
( 2, 1 ) ( 1, 0 )
A
D
B2
R
( 3, 1 )
不是子博弈
L
( 2, 9 )
B1
U R L
( 2, 1 ) ( 1, 0 )
A
D
B2
R
( 3, 1 )
不是子博弈
A B A
1:委托人
2:律师
0
努力
赢 0.5
(225, (225,20)
2
接受 输 0.5
2
委托
(0,-5) (225,24.5) 225,24.5)
0 不努力
不接受 输
赢 0.15
1
不委托
(0,5)
(0,5)
0.85
(0,-0.5)
v2 (努力) = 20 × 0.5 − 5 × 0.5 = 7.5 v2 (不努力) = 24.5 × 0.15 − 0.5 × 0.85 = 3.25 v1 (委托) = 225 × 0.5 = 112.5 v1 (不委托) = 0
例:四阶段博弈
e c a
( 4 , 3 )
h
1 ( 3 , 6 )
f
2 2
1
b
d
g
( 5 ,3 )
(2 , 4)
( 8 , 5 )
思考:找出全部子博弈 思考: 可信性问题 SPNE
子博弈
e c
( 4 , 3 )
1
h f
2
a
( 3 , 6 )
2 1
b d g
( 8 , 5 )
(2 , 4) ( 5 ,3 )
(300 , 0) 300,
stage 1: 50>300 不可能! 不可能!
M 2 L N 1 R
(200, (200,200) S (a,b)
1 T
(50,300) 50,300)
L-N-T不可能是 SPNE
(300 , 0)
2不可能通过 L-N-T 获得300 获得300 唯一能够获得300或更多支付的可能是 唯一能够获得300或更多支付的可能是L-N-S 或更多支付的可能是L 必须满足 a > 300, b≥ 300
(1,-1,1) 软弱 0 行动 (0,-2,-2) 乙 对抗 强硬 丙 甲 (-2,1,-1) 不行动
不对抗 (-1,1,0)
什么情况下会使甲方选择对抗,乙方选择强硬,丙方 甲方选择对抗,乙方选择强硬,
选择行动? 选择行动?
(1, 3 (1,-1,1) 软弱 0 行动 (0,-2,-2) 乙 对抗 强硬 丙 甲 (-2,1,-1) 不行动
不对抗 (-1,1,0)
例:
2 L
M
(200, (200,200) S (a,b)
N 1 R (300,0) 300, 1 T (50,300) 50,300)
若 a=100,b=150,SPNE是什么? a=100,b=150,SPNE是什么 是什么? 若改变a b的数值 能否使L 若改变a b的数值,能否使L-N-T成为SPNE? 的数值, 成为SPNE? 什么情况下, 会获得300或更高的支付 或更高的支付? 什么情况下,2会获得300或更高的支付?
例:是否请律师? 是否请律师?
• 某人在打一场官司,不请律师肯定会输,请律师后的结 某人在打一场官司,不请律师肯定会输, 果与律师的努力程度有关。 果与律师的努力程度有关。 • 假设律师努力工作(100小时)时有50%的概率能赢,不 假设律师努力工作(100小时 小时) 的概率能赢, 小时) 15%的概率能赢 努力工作(10小时 只有15%的概率能赢。 努力工作(10小时)只有15%的概率能赢。 • 如果诉讼获胜可得到250万元的赔偿,失败则没有赔偿。 如果诉讼获胜可得到250万元的赔偿 失败则没有赔偿。 250万元的赔偿, • 委托方与律师约定根据结果向律师付费,赢官司律师可 委托方与律师约定根据结果向律师付费, 得赔偿金的10% 失败则不付费。 10%, 得赔偿金的10%,失败则不付费。 • 如果律师的效用函数为m-0.05e,m为报酬,e为付出时间, 如果律师的效用函数为m 0.05e,m为报酬, 为付出时间, ,m为报酬 律师的机会成本为5万元。 律师的机会成本为5万元。
威胁不 可信
行动 (0,-2,-2)
(-2,1,-1) 不行动
不对抗
( -1,1,0)
什么情况会使甲方选择对抗,乙方选择软弱? 什么情况会使甲方选择对抗,乙方选择软弱? 什么情况会使甲方选择对抗,乙方选择强硬,丙方 什么情况会使甲方选择对抗,乙方选择强硬, 选择行动? 选择行动?
什么情况下会使甲方选择对抗,乙方选择软弱? 什么情况下会使甲方选择对抗,乙方选择软弱? 威胁可信
M 2 L N
(200,200) (200,200) S (100,150) 100,150)
1 1 R (300 , 0) 300, T
(50,300) 50,300)
M 2 L N 1 R
(200, (200,200) S (a,b)
1 T
(50,300) 50,300)
若 SPNE 为 L-N-T stage 3: stage 2: a<50 OK!
例:分冰欺凌博弈
• 两个兄弟分一个冰欺凌。 两个兄弟分一个冰欺凌。 • 哥哥先提出一个分割比例,弟 哥哥先提出一个分割比例, 弟接受则按哥哥的提议分割, 弟接受则按哥哥的提议分割,若 拒绝则自己再提出一个比例。 拒绝则自己再提出一个比例。但 此时冰欺凌已化掉一半。 此时冰欺凌已化掉一半。 • 弟弟的提议,哥哥接受则按弟弟的提议分割,若拒绝冰 弟弟的提议,哥哥接受则按弟弟的提议分割, 欺凌将全部化掉。 欺凌将全部化掉。 • 假设接受和拒绝利益相同时,两个人都会接受。 假设接受和拒绝利益相同时,两个人都会接受。 • 兄弟俩会怎样分割冰欺凌? 兄弟俩会怎样分割冰欺凌?
设:哥哥的方案是 S1:1- S1 弟弟的方案是 S2:1- S2
不接受 哥 不接受 出S2 出 S1 哥 弟 接受 (½S2, ½(1-S2) ) ½(1(0, (0,0)
接受
(S1, (1-S1) ) (1-
不接受 哥 不接受 出S2 出 S1 哥 弟 接受
(0,0) (0,
½(1(½S2, ½(1-S2) )
可信性问题
不可信
e
( 4 , 3 )
不可信
c
1
不可信
h f
2
a
( 3 , 6 )
2 1
b d g
( 8 , 5 )
(2 , 4) ( 5 ,3 )
不可信
例:
甲方 是某国的一股企图对抗中央的地方势力 乙方 是该国中央政府 丙方 是支持甲方的某国际势力
(1, (1,-1,1) 软弱 乙 对抗 强硬 丙 甲
A
拒绝 (要求赔偿S) B 要求赔偿S 指控 放弃
( -P- C , 0
)
A
接受 不指控
( 0 ,0 )
(S(S-P-C,-S)
例:要挟诉讼
如果原告将P提前支付,TX- P>如果原告将P提前支付,TX-C-P>-C-P, 只要胜诉的可能大于0 原告将起诉。 只要胜诉的可能大于0,原告将起诉。 如果S<TX+D, 被告将接受原告的赔偿请求。 如果S<TX+D, 被告将接受原告的赔偿请求。 如果TX 如果TX >P+C , 原告会指控。 原告会指控。
A
B
子博弈精炼纳什均衡 SPNE
子博弈精炼纳什均衡 SPNE
扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* ) 是一个子博弈精炼纳什均衡 如果: 是一个子博弈精炼纳什均衡, 如果: 子博弈精炼纳什均衡, 它是原博弈的纳什均衡; 它是原博弈的纳什均衡; 原博弈的纳什均衡 它在每一个子博弈上也都构成纳什均衡。 它在每一个子博弈上也都构成纳什均衡。 子博弈上也都构成纳什均衡
接受
(1(S1 , (1-S1) )
Stage3 : 哥哥接受的条件为½S2≥0 ,哥哥会接受弟弟的任何方案 哥哥接受的条件为½S Stage2: 弟弟知道哥哥会同意自己的方案,弟弟能获得的最多的冰 弟弟知道哥哥会同意自己的方案, 欺凌是1/2 欺凌是1/2 Stage1: 哥哥的方案若能使弟弟获得至少一半冰欺凌,则方案通过; 哥哥的方案若能使弟弟获得至少一半冰欺凌,则方案通过; 若不能使弟弟获得至少一半冰欺凌,则弟弟不会接受,而哥哥最 若不能使弟弟获得至少一半冰欺凌,则弟弟不会接受, 终将一无所获。 终将一无所获。 均衡路径: 哥哥提出方案为1/2:1/2, 均衡路径: 哥哥提出方案为1/2:1/2, 弟弟接受
相关文档
最新文档