第五章 重复博弈完全且非完美信息动态博弈(博弈论张醒洲)PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 参与人1和2同时从各自的可行集A1和A2中选择a1和a2;
2. 收益情况为ui(a1,a2,a3*(a1,a2),a4*(a1,a2)),i=1,2;
假定(a1*,a2*)为以上同时行动博弈唯一的纳什均衡,我们称 (a1*,a2*,a3*(a1*,a2*),a4*(a1*,a2*))为这一两阶段博弈的子博弈完 美结果。
ui(a1,a2,a1*'(a1,a2 ),a*2'(a1,a2 )) =ui(a1,a2 ,a1*' ,a*2' ) =ui(a1,a2 )+ui(a1*' ,a*2' )
2009-03-16
张醒洲,大连
8
两阶段囚徒困境
• 第二阶段博弈的结果为纳什均衡 (L1 , L2) ,两人收益为(1, 1);参与 人在两阶段囚徒困境博弈中第一阶
Subgameperfect Nash equilibrium 子博弈完美NE
张醒洲,大连
2
第3章和第4章要点
表述
解的概念
Central Issue 中心问题 Theme 主题思想
完全信息动态博弈
Normal-form / Strategic- Extensive-form
form 标准式/策略式
2009-03-16
张醒洲,大连
9
ห้องสมุดไป่ตู้限重复博弈:重复独立
• 令 G = {A1, ...,An; u1, ..., un} 表示一个完全信息博弈,其中参与人1
到n同时从各自的行动空间A1到An中分别选择行动a1到an ,得到的
收益分别为u1(a1, ..., an) , ..., un(a1, ..., an),我们称博弈G为重复博弈 中的阶段博弈。 • 定义1 对给定的阶段博弈G,令 G(T)表示G重复进行T次的有限 博弈,并且在下一次博弈开始前,所有以前博弈的进行都可以被 观察到。G(T)的收益为T次阶段博弈收益的简单相加。 • 定理1 如果阶段博弈G有唯一的纳什均衡,则对任意有限的T, 重复博弈G(T)有唯一的子博弈完美结果:即G的纳什均衡结果在 每一阶段重复进行。
扩展式
Nash Equilibrium (NE) Nash均衡
Subgame-perfect Nash equilibrium (SPNE) 子博弈完美Nash均衡
credibility threats or promise (self-enforcement) 可信性威胁或承诺
一个完全信息动态博弈可能会有很多个纳什均衡,但 是有些均衡包含了不可置信的威胁和承诺。子博弈完 美纳什均衡就是通过了可信任检测的均衡。
• 我们在本节先作简要介绍,以便后面的展开。
2009-03-16
张醒洲,大连
4
两阶段重复博弈
• 两阶段囚徒困境 • 两阶段博弈的阶段博弈有多个纳什均衡
– 预测第二阶段的行动 – 重复博弈的子博弈完美结果
2009-03-16
张醒洲,大连
5
两阶段囚徒困境
考虑囚徒困境 给定如图2.3.1的标准式 – 纳什均衡为(L1 , L2) – 同时行动博弈
参与人 1
参与人 2
L2
L1
1, 1
R1
0, 5
R2 5, 0 4, 4
图 2.3.1
• 让两个参与人进行两次囚徒困境博弈,观察第二次博弈 开始之前第一次博弈的结果,并假设整个过程博弈的总 收益等于两阶段博弈收益的简单相加 (即不考虑贴现因 素) 。
2009-03-16
张醒洲,大连
6
“2 × 2 ×2” 博弈和子博弈完美结果
重复博弈 完全且非完美信息动态博弈
Unit 5
2009-03-16
张醒洲,大连
1
第3章和第4章要点
博弈类型
简单的完全且完美信息 动态博弈
2人两阶段重复博弈 (“同时行动” 意味着 “不完美信息”)
下一次博弈开始前的所 有博弈的结果都能被观 察到的重复博弈
2009-03-16
举例
解的概念
Stackelberg (1934) 双寡
2009-03-16
张醒洲,大连
3
重复博弈
• 要点
– 在(参与者)重复关系中,关于将来行动的威胁或承诺能否影响 到当前的行动。
• 直观
– 大部分直观的结论是由两阶段的例子给出的 – 一些观点需要讨论无限次的情况
• 子博弈完美纳什均衡 – 我们还将定义重复博弈中子博弈完美纳什均衡的概念
• 这一定义在重复博弈的条件下表述比较容易理解,而在2.4.B. 节分析一般完全信息动态博弈中则要复杂一些;
头垄断模型 鲁宾斯坦 (1982) 讨价还价 模型
Backwards Induction Outcome (BIO) 后向归纳结果
Lazear&Rosen Tournaments (1981 ) 工作 竞赛模型
Subgame Perfect Outcome (SPO) 子博弈完美结果
动态博弈主题: 可信威胁与 承诺会影响现在的行为
段的交互行动如图2.3.2所示; • 这个一次性博弈有唯一的纳什均衡
(L1 ,L2) 。
参与人 1 L1 R1
参与人 2
L2 2, 2
R2 6, 1
1, 6
5, 5
图 2.3.2
• 两阶段囚徒困境唯一的子博弈完美结果就是第一阶段的 (L1,L2) 和第二阶段的 (L1,L2)。
• 在子博弈完美结果中,任意阶段都不能达成相互合作 (R1,R2)。
2009-03-16
张醒洲,大连
7
两阶段囚徒困境
• 得到 a3*(a1,a2),a4*(a1,a2)
– 根据第一阶段的行动a1和 a2 ,预测第二阶段参与人的反应; – 请注意,在囚徒困境博弈中存在唯一的纳什均衡,因此参与人
的反应独立于其在第一阶段的行动。
• 计算 ui(a1,a2,a3*(a1,a2),a4*(a1,a2)),i=1,2
• 两阶段囚徒困境博弈是“2×2 两人同时行动”博弈的一 个特殊例子。在这个博弈中,我们在上一节利用后向归纳 法的思路分析了“子博弈完美结果”,具体见2.2.1。
• 子博弈完美结果
如果参与人1和2预测到参与人3和4在第二阶段的行动将由 (a3*(a1,a2),a4*(a1,a2))给出,则参与人1和2在第一阶段的问题就可 以用以下的同时行动博弈表示:
2009-03-16
张醒洲,大连
10
两阶段重复博弈: 阶段博弈有多个纳什均衡
参与人 2
•
L2
M2
R2
L1 1, 1 5, 0 参与人 1 M1 0, 5 4, 4
0, 0 0, 0
2. 收益情况为ui(a1,a2,a3*(a1,a2),a4*(a1,a2)),i=1,2;
假定(a1*,a2*)为以上同时行动博弈唯一的纳什均衡,我们称 (a1*,a2*,a3*(a1*,a2*),a4*(a1*,a2*))为这一两阶段博弈的子博弈完 美结果。
ui(a1,a2,a1*'(a1,a2 ),a*2'(a1,a2 )) =ui(a1,a2 ,a1*' ,a*2' ) =ui(a1,a2 )+ui(a1*' ,a*2' )
2009-03-16
张醒洲,大连
8
两阶段囚徒困境
• 第二阶段博弈的结果为纳什均衡 (L1 , L2) ,两人收益为(1, 1);参与 人在两阶段囚徒困境博弈中第一阶
Subgameperfect Nash equilibrium 子博弈完美NE
张醒洲,大连
2
第3章和第4章要点
表述
解的概念
Central Issue 中心问题 Theme 主题思想
完全信息动态博弈
Normal-form / Strategic- Extensive-form
form 标准式/策略式
2009-03-16
张醒洲,大连
9
ห้องสมุดไป่ตู้限重复博弈:重复独立
• 令 G = {A1, ...,An; u1, ..., un} 表示一个完全信息博弈,其中参与人1
到n同时从各自的行动空间A1到An中分别选择行动a1到an ,得到的
收益分别为u1(a1, ..., an) , ..., un(a1, ..., an),我们称博弈G为重复博弈 中的阶段博弈。 • 定义1 对给定的阶段博弈G,令 G(T)表示G重复进行T次的有限 博弈,并且在下一次博弈开始前,所有以前博弈的进行都可以被 观察到。G(T)的收益为T次阶段博弈收益的简单相加。 • 定理1 如果阶段博弈G有唯一的纳什均衡,则对任意有限的T, 重复博弈G(T)有唯一的子博弈完美结果:即G的纳什均衡结果在 每一阶段重复进行。
扩展式
Nash Equilibrium (NE) Nash均衡
Subgame-perfect Nash equilibrium (SPNE) 子博弈完美Nash均衡
credibility threats or promise (self-enforcement) 可信性威胁或承诺
一个完全信息动态博弈可能会有很多个纳什均衡,但 是有些均衡包含了不可置信的威胁和承诺。子博弈完 美纳什均衡就是通过了可信任检测的均衡。
• 我们在本节先作简要介绍,以便后面的展开。
2009-03-16
张醒洲,大连
4
两阶段重复博弈
• 两阶段囚徒困境 • 两阶段博弈的阶段博弈有多个纳什均衡
– 预测第二阶段的行动 – 重复博弈的子博弈完美结果
2009-03-16
张醒洲,大连
5
两阶段囚徒困境
考虑囚徒困境 给定如图2.3.1的标准式 – 纳什均衡为(L1 , L2) – 同时行动博弈
参与人 1
参与人 2
L2
L1
1, 1
R1
0, 5
R2 5, 0 4, 4
图 2.3.1
• 让两个参与人进行两次囚徒困境博弈,观察第二次博弈 开始之前第一次博弈的结果,并假设整个过程博弈的总 收益等于两阶段博弈收益的简单相加 (即不考虑贴现因 素) 。
2009-03-16
张醒洲,大连
6
“2 × 2 ×2” 博弈和子博弈完美结果
重复博弈 完全且非完美信息动态博弈
Unit 5
2009-03-16
张醒洲,大连
1
第3章和第4章要点
博弈类型
简单的完全且完美信息 动态博弈
2人两阶段重复博弈 (“同时行动” 意味着 “不完美信息”)
下一次博弈开始前的所 有博弈的结果都能被观 察到的重复博弈
2009-03-16
举例
解的概念
Stackelberg (1934) 双寡
2009-03-16
张醒洲,大连
3
重复博弈
• 要点
– 在(参与者)重复关系中,关于将来行动的威胁或承诺能否影响 到当前的行动。
• 直观
– 大部分直观的结论是由两阶段的例子给出的 – 一些观点需要讨论无限次的情况
• 子博弈完美纳什均衡 – 我们还将定义重复博弈中子博弈完美纳什均衡的概念
• 这一定义在重复博弈的条件下表述比较容易理解,而在2.4.B. 节分析一般完全信息动态博弈中则要复杂一些;
头垄断模型 鲁宾斯坦 (1982) 讨价还价 模型
Backwards Induction Outcome (BIO) 后向归纳结果
Lazear&Rosen Tournaments (1981 ) 工作 竞赛模型
Subgame Perfect Outcome (SPO) 子博弈完美结果
动态博弈主题: 可信威胁与 承诺会影响现在的行为
段的交互行动如图2.3.2所示; • 这个一次性博弈有唯一的纳什均衡
(L1 ,L2) 。
参与人 1 L1 R1
参与人 2
L2 2, 2
R2 6, 1
1, 6
5, 5
图 2.3.2
• 两阶段囚徒困境唯一的子博弈完美结果就是第一阶段的 (L1,L2) 和第二阶段的 (L1,L2)。
• 在子博弈完美结果中,任意阶段都不能达成相互合作 (R1,R2)。
2009-03-16
张醒洲,大连
7
两阶段囚徒困境
• 得到 a3*(a1,a2),a4*(a1,a2)
– 根据第一阶段的行动a1和 a2 ,预测第二阶段参与人的反应; – 请注意,在囚徒困境博弈中存在唯一的纳什均衡,因此参与人
的反应独立于其在第一阶段的行动。
• 计算 ui(a1,a2,a3*(a1,a2),a4*(a1,a2)),i=1,2
• 两阶段囚徒困境博弈是“2×2 两人同时行动”博弈的一 个特殊例子。在这个博弈中,我们在上一节利用后向归纳 法的思路分析了“子博弈完美结果”,具体见2.2.1。
• 子博弈完美结果
如果参与人1和2预测到参与人3和4在第二阶段的行动将由 (a3*(a1,a2),a4*(a1,a2))给出,则参与人1和2在第一阶段的问题就可 以用以下的同时行动博弈表示:
2009-03-16
张醒洲,大连
10
两阶段重复博弈: 阶段博弈有多个纳什均衡
参与人 2
•
L2
M2
R2
L1 1, 1 5, 0 参与人 1 M1 0, 5 4, 4
0, 0 0, 0