第9讲-重复博弈

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

无限重复博弈
• 在无限重复囚徒困境的触发战略纳什均衡 中,子博弈可以分为两类(1)以前的结果 都是(R1 , R2)的子博弈(2)至少有一个前 面的阶段不是(R1 , R2)的子博弈 • 显然,触发战略纳什均衡是子博弈完美均 衡
两阶段重复博弈
• 下面考虑多纳什均衡情况。 L2 M2 L1 1,1 5,0 M1 0,5 4,4
R2 0,0
0,0
R1 0,0
0,0
3,3
两阶段重复博弈
• 博弈有两个纯策略纳什均衡: (L1 , L2)和 (R1 , R2) • 假设这个博弈进行两次,这个博弈有一个 均衡为(M1 , M2) (R1 , R2)
第9讲 重复博弈
两阶段重复博弈
• 考虑下面的囚徒困境。假设参与人要重复 进行这个博弈两次,第二次可以看见第一 次的结果。博弈的总收益是两次收益之和。 参与人2 L2 R2 L1 1,1 5,0 参与人1 R1 0,5 4,4
两阶段重复博弈
• 此博弈第二阶段均衡为(L1 , L2) • 假如第一阶段,那么博弈变为 参与人2 L2 R2 L1 2,2 6,1 参与人1 R1 1,6 5,5
两阶段重复博弈
• 此时,博弈不再惩罚惩罚者
无限重复博弈
• 问题的中心是将来行动的可信威胁可以影 响到当前的行动。 • 在无限重复博弈中,即使阶段博弈有唯一 的纳什均衡,无限重复博弈中也可以存在 子博弈完美均衡,其中没有一个阶段的结 果是阶段博弈的纳什均衡。
无限重复博弈
• 考虑下面的博弈进行无限次 参与人2 L2 R2 L1 1,1 5,0 参与人1 R1 0,5 4,4
无限重复博弈
• 为了证明是纳什均衡,我们仅仅需要说明 如果以前一直选择(R1 , R2),那么接下来也 需要选择(R1 , R2)。 • 如果不是,那么收益为
5 1 1 ... 5
2

1
无限重复博弈
• 如果合作,那么收益为 4 V 1
无限重复博弈
• 为了使得(R1 , R2)是均衡,那么需要
无限重复博弈
• 给定贴现因子,无限的收益序列π1, π2,… 的现值为
1 2 2 3 ... t 1 t
t 1
无限重复博弈
• 我Fra Baidu bibliotek要证明,这个博弈有一个子博弈完美 均衡为每阶段都选择(R1 , R2)。 • 策略:在第一阶段选择R,且在t阶段,如 果前面t-1阶段的结果都是(R1 , R2),则选择 R,否则选择L。 • 我们需要证明,如果贴现因子足够接近于1, 那么这个策略是纳什均衡,同时也是子博 弈完美均衡。
两阶段重复博弈
• 此时博弈的均衡还是(L1 , L2) • 这一结论可以推广到有限次重复 • G={A1 ,…,An ;u1,…,un }表示一个完全信息 博弈,其中参与人同时从行动空间中分别 选择行动a1 到an,得到的收益分别为u1 (a1,…,an),…, un (a1,…,an),这个博弈G称为 重复博弈中的阶段博弈
4 5 1 1 1 4
无限重复博弈
• 无限重复博弈:给定一个阶段博弈G,令 G(∞,δ)表示相应的无限重复博弈,其中G将 无限次的重复进行,且参与者的贴现因子 都为δ。对每一个t,之前t-1次阶段博弈的 结果在t阶段开始进行前都可以观测到,每 个参与者在G(∞,δ)中的收益都是该参与者 在无限次的阶段博弈中所得收益的现值。
两阶段重复博弈
L1
L2 2,2 M2 6,1 7,7 1,1 R2 1,1 1,1 4,4
M1 1,6 R1 1,1
两阶段重复博弈
• 这里有三个均衡(L1 , L2), (M1 , M2), (R1 , R 2) • 如果G={A1 ,…,An ;u1,…,un }是一个有多个 纳什均衡的完全信息静态博弈,那么重复 博弈G(T)可以存在子博弈精炼解,其中对 每一t<T,t阶段的结果都不是G的纳什均衡 • 这个结论说明,对将来行动所做的可信威 胁可以影响到当前行动。
– 策略:历史到行动的函数 – 子博弈
无限重复博弈
• 策略:历史到行动的函数 在有限重复博弈G(T)或无限重复博弈G(∞,δ) 中,参与人的一个策略指的是,在每一阶 段,针对前面阶段所有可能结果(进行过 程),参与者将会选择的行动。
无限重复博弈
• 子博弈:在有限重复博弈G(T)中,由第t+1 阶段开始的一个子博弈为G进行T-t次的重 复博弈,可表示为G(T-t)。由第t+1阶段开 始有许多子博弈,到t阶段为止的每一可能 的进行过程之后都是不同的子博弈。在无 限重复博弈G(∞,δ)中,由t+1阶段开始的每 个子博弈都等同于初始博弈G(∞,δ),和有 限情况下类似,博弈G(∞,δ)到t阶段为止有 多少不同的可能进行过程,就有多少从t+1 阶段开始的子博弈。
两阶段重复博弈
• 纯策略均衡(L1 , L2),(R1 , R2),(P1 , P2)和 (Q1 , Q2) • 后面三个纳什均衡处于一个帕累托边界上 • 如果博弈进行两个阶段 • 策略:如果第一阶段(M1 , M2),那么(R1 , R2);如果(M1 ,Z),那么(P1 , P2);如果(x , M2), 那么(Q1 , Q2);如果(y , h),那么(R1 , R2)
两阶段重复博弈
• 定义:对给定的阶段博弈G,令G(T)表示G 重复T次的有限重复博弈,并且在下一次博 弈开始前,所有以前博弈的进行都可以被 观测到。G(T)的收益为T次阶段博弈收益的 简单相加。
两阶段重复博弈
• 定理:如果阶段博弈有唯一的纳什均衡, 则对任意有限的T,重复博弈G(T)有唯一的 子博弈完美均衡:即G的纳什均衡结果在每 一阶段重复进行。
两阶段重复博弈
• 不过也说明子博弈完美对于可信性的要求 并不严格。 • 人们可以在第二阶段经过重新谈判都选择 帕累托占优的(R1 , R2),此时(M1 , M2)就不 是最优的 • 为了解决重新谈判这个问题,可以考虑下 面的博弈
两阶段重复博弈
L1 M1 R1 P1 Q1
L2 1,1 0,5 0,0 0,0 0,0 M2 5,0 4,4 0,0 0,0 0,0 R2 P2 Q2 0,0 0,0 0,0 0,0 0,0 0,0 3,3 0,0 0,0 0,0 4,1/2 0,0 0,0 0,0 ½,4
相关文档
最新文档