博弈论(重复博弈)
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H
L
4,4
5,0
0,5
1,1
可以证明,当贴现因子 较大时,上述 策略组合构成了SPNE:
1)TS 是 NE 2)这个NE是SPNE
2.无限次重复博弈的民间定理 (p133,定理5.1)
一个n人有限博弈G中,设(x1, x2,… xn)是G的任意可 实现收益,那么无限次重复博弈G(∞, δ) 中必存在一个 SPNE,各局中人的平均收益即为(x1, x2,… xn),只要 满足如下条件: 1) 时间偏好率 r =0 或是充分小的正数; 2)博弈在任意阶段结束的概率为0或是充分小的正数; 3)支付组合的元素是n维的,且严格帕累托优于G的最 小最大收益组合。
第四章 重复博弈 (p129~)
§4.1 基本概念
一、什么是重复博弈 二、重复博弈的分类 三、重复博弈的策略 四、重复博弈的收益
§4.2 有限次重复博弈
一、2人零和博弈的重复 二、有唯一纯策略NE的有限次重复博弈 三、连锁店悖论(Chainstore Paradox)
马尔可夫过程 寻求马尔可夫策略(Markov st.)
0,2 1,1 0,0 0,0
0,0 0,0
0,0 0,0
4,1/2 0,0 0,0 ½,4
例:两市场博弈的重复博弈
B1(开发A)
a1(开发A) 3,3
B2 (开发B)
1,4
a2 (开发B)
4,1
0,0
五、有限次重复博弈的民间定理 1.合作收益集(Cooperative payoff set) 2.安全值(security value) 最小最大值(Minimax V.) 3.民间定理(Folk Theorem) 设原博弈的一次性博弈有均衡收益数 组优于(u0,v0), 则在该博弈的多次重复中,所有不小于个 体理性收益的可实现收益至少有一个子博 弈精炼NE的极限平均收益来实现它。
合作收益集
例
B1 (开发A) B2 (开发B) a1 (开发A) 3,3 a2 (开发B) 4,1 1,4 0,0
4.5 4 3.5 3 2.5 2 1.5 1 0.5 0 0 1 2 3 4 5
例
§4.3 无限次重复博弈
一、二人零和博弈的重复 二、非零和博弈的无限次重复博弈 1、囚徒困境--寡头削价竞争博弈 NE: (L,L) 无限次重复的触发策略 P1: (1) H H (2)若上次是(H,H)则H, L 否则L P2:同P1
若干无限次充分博弈的例
1.“单边”的囚徒困境 博弈(p139)
抵赖 抵赖 坦白 5,5
10,-5
坦白
-5,10
购买 高质 低质 5,5
10,-5
抵制 0,0 0,0
0,0
2.产品质量博弈(p143)
均衡成立应满足的条件: 激励相容 竞争 市场出清
3.消费者转换成本博弈(p146)
•连锁店悖论(Chainstore Paradox)
1.进入威慑(p104)
进入 容忍 (40,50) (-10,-10)
斗争
不进入
(0,300)
2.理论与实际的差别
四、多个纯策略NE的重复博弈 1。三价博弈
H
H(高价) 5,5 M(中价) 6,0 L(低价) 2,0
M
0,6 3,3 2,0
L
0,2 0,2 1,1
H
H(高价) 8,8 M(中价) 7,1 L(低价) 3,1
M
1,7 4,4 3,1
L
1,3 1,3 2,2
2.关于触发策略(Trigger S.)的讨论
报复是否可信--很复杂 **可信的报复
H
H 源自文库,5
M 0,6
L 0,2
P 0,0
Q 0,0
M L P Q
6,0 2,0 0,0 0,0
3,3 2,0 0,0 0,0