08 完全信息动态博弈(子博弈完美的纳什均衡)PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
U\
A
D
均衡路径
equilibrium path
L B1
R L B2 R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
SPNE:(D , R)
子博弈精炼纳什均衡 SPNE
子博弈精炼纳什均衡 (Selten,1965)
Subgame Perfect Nash Equilibrium
兵法云:“归师莫掩, 穷寇莫追。”
例:房地产开发竞争
✓ 有 A B 两家公司, ✓ 各有两种选择 开发/放弃 ✓ A公司资金充足—— 先行 ✓ B公司需要筹措资金—— 后行 ✓ 只一家开发,获利2000万 ✓ 两家都开发,各损失1000万
例:房地产开发竞争
B
开发,开发 开发,放弃 放弃,放弃 放弃,开发
子博弈精炼纳什均衡 SPNE
扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* ) 是一个子博弈精炼纳什均衡, 如果: ➢ 它是原博弈的纳什均衡; ➢ 它在每一个子博弈上也都构成纳什均衡。
SPNE:(D , R)
L
B1 U
R
A
D
L B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
开发 -1,-1 -1,-1 2,0
A
Biblioteka Baidu
放弃
0,2
0,0
0,0
2,0 0,2
如何使威胁可信?
开发
开发 B1
放弃
(-1,-1) ( 2, 0)
( 2,-1.5)
A
开发 ( 0, 2)
放弃
B2
放弃 ( 0, 0) (0,-1.5)
SPNE(开发,放弃) 威胁可信,SPNE(放弃,开发)
例:开金矿博弈 —— 两阶段博弈
泽尔腾1965年发表《需求减少条件下寡头 垄断模型的对策论描述》一文,提出了“子 博弈精炼纳什均衡”的概念,又称“子对策 完美纳什均衡”。
• 莱茵哈德·泽尔腾 Reinhard Selten ,子博弈精 炼纳什均均衡的创立者。
• 1994年因在“非合作博
弈理论中开创性的均衡分 析”方面的杰出贡献而荣 获诺贝尔经济学奖。
承诺和威胁都是不可信的!
思考:
如何能使承诺和威胁变得可信?
增加撤销承诺或威胁所要受到的损失 让对方知道 “破釜沉舟” “穷寇莫追”
“破釜沉舟”
《孙子兵法·九地》:“焚舟破釜,若驱群羊而往, 驱而来,莫知所之。”
《史记·项羽本纪》: “项羽乃悉引兵渡河, 皆沉船,破釜甑,烧 庐舍,持三日粮,以 示士卒必死,无一还 心。”
Burn one's boats
➢ 色诺芬 Xenophon, Ξενοφών, 约前427年-前355年。雅典人。军 事家,文史学家。
➢ 主要作品有:《长征记》 《居 鲁士的教育》《希腊史》 《回忆 苏格拉底》以及《经济论》。
“穷寇莫追”
《孙子·军争》:“穷寇勿迫,此用兵之法也。”
明·罗贯中《三国演义》 第九十五回:
例:动态游戏 - 博弈树
假设:A 先行动,B 后行动
L
B1
U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
博弈树 game tree
结点 node 枝 branch 信息集 information set
博弈树 game tree
L
B1
U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
Reinhard Selten ,1930-
子博弈精炼纳什均衡 SPNE
子博弈 subgame
➢ 给定“历史”,每一个行动选择开始至博弈结 束构成了一个博弈,称为“子博弈”。
➢ 扩展式博弈的子博弈G是由一个单结信息集x开 始的与所有该决策结的后续结(包括终点结)组 成的,能自成一个博弈。
子博弈精炼纳什均衡 SPNE
• B在开采价值为4万元的金矿 时缺1万元资金 • A恰好有1万元资金可以投 资 • B向A将1万元,承诺开采到 金子后,与A对半分成 • A是否应该将钱借给B?
承诺不 可信
借
B1
分
(2,2)
不分 ( 0, 4)
A
不借
(1,0)
例:开金矿博弈 —— 三阶段博弈
有法律保障
威胁可信
B1 借
分 (2,2) 打
博弈树 game tree
例:静态游戏 - 支付矩阵
假设:A B 两人同时行动
up
A
down
B
left
right
2, 9 1, 0
2, 1 3, 1
例:动态游戏 - 支付矩阵
假设:A 先行动,B 后行动
U A
D
B (L,L) (L,R) (R,R) (R,L) 2,9 2,9 2,1 2,1 1,0 3,1 3,1 1,0
❖ 1号提方案,5人表决,超过半数同意方案被通过, 否则被扔入大海;
❖ 2号提方案,4人表决,超过半数同意方案通过, 否则同样被扔入大海;依次类推 ……
❖ 第一个人应怎样提方案?
完全信息序贯博弈 Sequential game
行动有先后 后行者在行动前已经观测到先行者的行动
描述方法:扩展式 extensive form
完全信息动态博弈
Subgame Perfect Nash Equilibrium
完全信息动态博弈
序贯博弈问题 动态博弈经典模型 重复博弈与合作问题
§3.1 序贯博弈问题
Sequential Games
强盗分金 答案是:
五个强盗抢得1010号枚强金盗币分,给他们3号决1定枚:金币, ❖ 抽签决定各人的4号号码或(51号,强2,盗32,枚4,独5)得;97枚。
子博弈 Sub-game
原博弈中的一部分(次级博弈)
L
B1
U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
如何寻找均衡?
L
B1 U
R
A
D
L B2
R
( 22,99 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
NE:(U , L)&(D , R)
逆推
backward induction
思考: B如何能使A选上?
☺ 许诺 ---- 事前:B向A承诺,若A选上,给A补偿 2
• A照做,事后B履行诺言
(U,L)(4,7)
• A照做,事后B赖帐
(U,L)(2,9)
威胁 ---- 事后:B威胁,若A选下,自己选左
• A相信 • A不信
(U,L) (2,9) (D,R) (3,1)
问题:可信性 Credibility
不分
(1,0)
A
A
不打 (0,4)
不借
(1,0)
提问与解答环节
Questions And Answers
A
D
均衡路径
equilibrium path
L B1
R L B2 R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
SPNE:(D , R)
子博弈精炼纳什均衡 SPNE
子博弈精炼纳什均衡 (Selten,1965)
Subgame Perfect Nash Equilibrium
兵法云:“归师莫掩, 穷寇莫追。”
例:房地产开发竞争
✓ 有 A B 两家公司, ✓ 各有两种选择 开发/放弃 ✓ A公司资金充足—— 先行 ✓ B公司需要筹措资金—— 后行 ✓ 只一家开发,获利2000万 ✓ 两家都开发,各损失1000万
例:房地产开发竞争
B
开发,开发 开发,放弃 放弃,放弃 放弃,开发
子博弈精炼纳什均衡 SPNE
扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* ) 是一个子博弈精炼纳什均衡, 如果: ➢ 它是原博弈的纳什均衡; ➢ 它在每一个子博弈上也都构成纳什均衡。
SPNE:(D , R)
L
B1 U
R
A
D
L B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
开发 -1,-1 -1,-1 2,0
A
Biblioteka Baidu
放弃
0,2
0,0
0,0
2,0 0,2
如何使威胁可信?
开发
开发 B1
放弃
(-1,-1) ( 2, 0)
( 2,-1.5)
A
开发 ( 0, 2)
放弃
B2
放弃 ( 0, 0) (0,-1.5)
SPNE(开发,放弃) 威胁可信,SPNE(放弃,开发)
例:开金矿博弈 —— 两阶段博弈
泽尔腾1965年发表《需求减少条件下寡头 垄断模型的对策论描述》一文,提出了“子 博弈精炼纳什均衡”的概念,又称“子对策 完美纳什均衡”。
• 莱茵哈德·泽尔腾 Reinhard Selten ,子博弈精 炼纳什均均衡的创立者。
• 1994年因在“非合作博
弈理论中开创性的均衡分 析”方面的杰出贡献而荣 获诺贝尔经济学奖。
承诺和威胁都是不可信的!
思考:
如何能使承诺和威胁变得可信?
增加撤销承诺或威胁所要受到的损失 让对方知道 “破釜沉舟” “穷寇莫追”
“破釜沉舟”
《孙子兵法·九地》:“焚舟破釜,若驱群羊而往, 驱而来,莫知所之。”
《史记·项羽本纪》: “项羽乃悉引兵渡河, 皆沉船,破釜甑,烧 庐舍,持三日粮,以 示士卒必死,无一还 心。”
Burn one's boats
➢ 色诺芬 Xenophon, Ξενοφών, 约前427年-前355年。雅典人。军 事家,文史学家。
➢ 主要作品有:《长征记》 《居 鲁士的教育》《希腊史》 《回忆 苏格拉底》以及《经济论》。
“穷寇莫追”
《孙子·军争》:“穷寇勿迫,此用兵之法也。”
明·罗贯中《三国演义》 第九十五回:
例:动态游戏 - 博弈树
假设:A 先行动,B 后行动
L
B1
U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
博弈树 game tree
结点 node 枝 branch 信息集 information set
博弈树 game tree
L
B1
U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
Reinhard Selten ,1930-
子博弈精炼纳什均衡 SPNE
子博弈 subgame
➢ 给定“历史”,每一个行动选择开始至博弈结 束构成了一个博弈,称为“子博弈”。
➢ 扩展式博弈的子博弈G是由一个单结信息集x开 始的与所有该决策结的后续结(包括终点结)组 成的,能自成一个博弈。
子博弈精炼纳什均衡 SPNE
• B在开采价值为4万元的金矿 时缺1万元资金 • A恰好有1万元资金可以投 资 • B向A将1万元,承诺开采到 金子后,与A对半分成 • A是否应该将钱借给B?
承诺不 可信
借
B1
分
(2,2)
不分 ( 0, 4)
A
不借
(1,0)
例:开金矿博弈 —— 三阶段博弈
有法律保障
威胁可信
B1 借
分 (2,2) 打
博弈树 game tree
例:静态游戏 - 支付矩阵
假设:A B 两人同时行动
up
A
down
B
left
right
2, 9 1, 0
2, 1 3, 1
例:动态游戏 - 支付矩阵
假设:A 先行动,B 后行动
U A
D
B (L,L) (L,R) (R,R) (R,L) 2,9 2,9 2,1 2,1 1,0 3,1 3,1 1,0
❖ 1号提方案,5人表决,超过半数同意方案被通过, 否则被扔入大海;
❖ 2号提方案,4人表决,超过半数同意方案通过, 否则同样被扔入大海;依次类推 ……
❖ 第一个人应怎样提方案?
完全信息序贯博弈 Sequential game
行动有先后 后行者在行动前已经观测到先行者的行动
描述方法:扩展式 extensive form
完全信息动态博弈
Subgame Perfect Nash Equilibrium
完全信息动态博弈
序贯博弈问题 动态博弈经典模型 重复博弈与合作问题
§3.1 序贯博弈问题
Sequential Games
强盗分金 答案是:
五个强盗抢得1010号枚强金盗币分,给他们3号决1定枚:金币, ❖ 抽签决定各人的4号号码或(51号,强2,盗32,枚4,独5)得;97枚。
子博弈 Sub-game
原博弈中的一部分(次级博弈)
L
B1
U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
如何寻找均衡?
L
B1 U
R
A
D
L B2
R
( 22,99 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
NE:(U , L)&(D , R)
逆推
backward induction
思考: B如何能使A选上?
☺ 许诺 ---- 事前:B向A承诺,若A选上,给A补偿 2
• A照做,事后B履行诺言
(U,L)(4,7)
• A照做,事后B赖帐
(U,L)(2,9)
威胁 ---- 事后:B威胁,若A选下,自己选左
• A相信 • A不信
(U,L) (2,9) (D,R) (3,1)
问题:可信性 Credibility
不分
(1,0)
A
A
不打 (0,4)
不借
(1,0)
提问与解答环节
Questions And Answers