博弈论及应用4

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二、重复博弈的分类(Cont..)
2、无限次重复博弈:一个基本博弈G一直重复博 弈下去的博弈,记为G( ). 注:1、无法验证某个重复博弈会一直重复下去。
2、如果主观上认为博弈会不断进行下去, 那么博弈就可无限次重复下去。 3、随机结束的重复博弈:重复的次数和结束的 时间不确定的重复博弈。
三、策略、子博弈和均衡路径
得益的总和。 计算有限次重复博弈的总体得益方法之二: 计算各阶段的平均得益
四、重复博弈的得益(Cont…)
如果重复的时间很长,就应考虑资金的时间价 值,此时考虑贴现系数 1
1 r
重复T期的重复博弈总得益为:
T
1223T 1 T
t 1 t
t 1
重复无限期的重复博弈总得益为:
1223
t1 t
本章分三节
4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈
4.1 重复博弈引论
一、为何研究重复博弈
经济中的长期关系
例如
(1)两家企业在一个市场上的长期竞争, (2)市场营销中的回头客问题, (3) 买卖问题。 (4)信任、信誉、声誉问题 人们的预见性。
由于人的思维的限制,在短期行为中缺乏默 契或合作的关系,但在长期中这样的机会就大 得多。即是未来利益对当前行为的制约
囚徒2
坦 白 不坦白
囚 坦白 -10,-10 -5,-13
徒 1
不坦白
-13,-5
-6,-6
(-10,-10)
二、一般结论
定理:设原博弈G有唯一的纯策略纳什均 衡,则对任意整数T,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方 每个阶段都采用G的纳什均衡策略。各博 弈方在G(T)中的总得益为在G中得益的T 倍,平均得益的与原博弈G中的得益。
t1
四、重复博弈的得益(Cont…)
平 均 得 益 : 如 果 一 常 数 作 为 重 复 博 弈 ( 有 限 次 重 复 博 弈 或
无 限 次 重 复 博 弈 ) 各 个 阶 段 的 得 益 , 能 产 生 与 得 益 序 列
1 , 2, 相 同 的 现 在 值 , 则 称 为 1 , 2, 的 平 均 得 益
4.2.2唯一纯策略纳什均衡博弈的 有限次重复博弈
唯一的Nash均衡有两种: 一是:本身是帕雷托最优的。它都符合双方的利益, 重复不会改变 二是:本身不是帕雷托最优的。重复能否改变得益? 一、有限次重复囚徒的困境博弈
囚徒2
坦 白 不坦白
囚 徒
坦白
-5,-5
0,-8
1 不坦白 -8,0 -1,-1
(-5,-5)
1978年,塞尔顿提出的“连锁店悖论” 在n个市场(例如n个城市)都开设有连锁店的企业, 对各个市场的竞争者是否应该打击的策略选择?
“连锁店悖论”
由于竞争者不会同时进入,于是和每一个城市 的竞争者博弈,就可看成n次重复博弈。而每一 次博弈就是“先来后到”博弈,则竞争者进入,
在 位者不打击是唯一的Nash均衡。于是重复博弈
有 限 次 重 复 博 弈 不 一 定 考 虑 贴 现 因 素
无 限 次 重 复 博 弈 必 须 考 虑 贴 现 问 题 (1)
t1 t
t1
注 意 上 式 的 来 历
4.2 有限次重复博弈
4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈
的有限次重复博弈 4.2.3多个纯策略纳什均衡博弈
第四章 重复博弈
重复博弈:基本博弈(完全信息静态博弈, 完全信息动态博弈)重复进行构成的博弈过程。虽 然形式上是基本博弈的重复进行,但重复博弈中博 弈方的行为和博弈结果却不一定是基本博弈的简单 重复,因为博弈方对于博弈会重复进行的意识,会 使他们对利益的判断发生变化,从而使他们在重复 博弈过程中的行为选择受到影响。这意味着不能把 重复博弈当作基本博弈的简单叠加,必须把整个重 复博弈过程作为整体进行研究。
三、有限次重复寡头削价竞争博弈
寡 高价 头 1 低价
寡头2
高价
低价
100,100 20,150
150,20
70,70
削价竞争博弈
有唯一纯策略纳什均衡 (70,70) 有限次重复的结果仍然是 (低价,低价)
四、重复囚徒困境悖论和连锁店悖论
有惟一纯策略Nash均衡的有限次重复博弈的分 析和定理是强烈的,但这与人们的直觉经验有矛 盾,大量的实验研究表明,其结果与理论结果也 不一样。
的 子博弈Nash均衡就是……
但只要………….. 囚徒困境重复博弈的症结是在较多阶段的动态博 弈中逆推归纳法的适用性。
4.2.3多个纯策略纳什均衡博弈的 有限次重复博弈
一、三价博弈的重复博弈
显然(M,M)(L,L)是纯策略
厂商2
Nash均衡,但双方最
厂H
H 5,5
M 0,6
L 0,2
理想的策略(H,H)却不
商M 1L
6,0 2,0
3,3 2,0
0,2 1,1
二、重复博弈的分类
1、有限次重复博弈:给定一个基本博弈G(可以 是静态博弈,也可以是动态博弈),重复进行T 次G,并且在每次重复G之前各博弈方都能观察到 以前博弈的结果,这样的博弈过程称为“G的T次 重复博弈”,记为G(T)。而G则称为G(T)的“原 博弈”。G(T)中的每次重复称为G(T)的一个“阶 段”。
的有限次重复博弈 4.2.4 有限次重复博弈的民间定理
4.2.1 两人零和博弈的有限次重复博弈
零和博弈和严格竞争博弈,每次重复博弈并不改变这 一点。也就是说每次博弈得益都是对立的,于是重复博 弈不回创造新的利益。
例如:猜硬币博弈。 零和博弈采用逆向归纳法分析有如下结论: 以零和博弈为原博弈的有限次重复博弈中,所有博弈 方的唯一选择策略是重复一次性博弈中的纳什均衡策略 (混合策略纳什均衡)。 原因:重复不会改变博弈效率是利益是对立的不可调 和的。
策略:博弈方在每个阶段针对每种情况如何行 为的计划。 子博弈:从某个阶段(不包括第一阶段)开始, 包括此后所有的重复博弈部分。 因此:动态博弈的分析方法都可用于重复博弈。 均衡路径:由每个阶段博弈方的行为组合串联 而成。
四、重复博弈的得益ຫໍສະໝຸດ Baidu
重复博弈的博一方的行为、策略选择不能只 考虑本阶段的得益,必须兼顾其它阶段的得益、 或考虑整个重复博弈过程得益的总体情况。 计算有限次重复博弈的总体得益方法之一: 计算重复博弈的“总得益”——博弈方各次重复
相关文档
最新文档