经济博弈论重复博弈.PPT
合集下载
经济博弈论_Chapter11
Slide 7
解之一:重复 Solutions I: Repetition
在一个囚徒困境的重复博弈中,每个参与者担心一次性的 在一个囚徒困境的重复博弈中 每个参与者担心一次性的 背叛会导致未来合作的崩溃。 In a repeated play of the prisoners’ dilemma, each player fears that one instance of defecting will lead to a collapse of cooperation for the future. 如果未来合作的价值很大,超过了短期内通过背叛所获得 价 的,那么参与者的长期个人利益自动地消除了背叛,并不 需要任何额外惩罚或第三方强制。 If the value of future cooperation is large and exceeds what can be gained in the short term by defecting, then the long-run individual interests of the players can automatically and tacitly keep them from defecting, without the need for any additional punishments or enforcement by third parties parties.
Slide 10
有限次重复 Finite Repetition
只要两个参与者之间关系持续时间的长度固定和已知,在 最后阶段的博弈中,优势策略均衡(背叛)就会出现。 As long as the relationship between the two players lasts a fixed and known length of time, the dominant-strategy equilibrium with defecting should prevail in the last period of play. play 参与者到达博弈终点时,继续合作就毫无价值,于是他们 选择背叛。 Wh th l i at t the th end d of f the th game, When the players arrive there is never any value to continued cooperation, and so they defect. 按照反转的预测,相互背叛就会一直倒推到最开始的博弈。 Then rollback predicts mutual defecting all the way back to the very first play.
解之一:重复 Solutions I: Repetition
在一个囚徒困境的重复博弈中,每个参与者担心一次性的 在一个囚徒困境的重复博弈中 每个参与者担心一次性的 背叛会导致未来合作的崩溃。 In a repeated play of the prisoners’ dilemma, each player fears that one instance of defecting will lead to a collapse of cooperation for the future. 如果未来合作的价值很大,超过了短期内通过背叛所获得 价 的,那么参与者的长期个人利益自动地消除了背叛,并不 需要任何额外惩罚或第三方强制。 If the value of future cooperation is large and exceeds what can be gained in the short term by defecting, then the long-run individual interests of the players can automatically and tacitly keep them from defecting, without the need for any additional punishments or enforcement by third parties parties.
Slide 10
有限次重复 Finite Repetition
只要两个参与者之间关系持续时间的长度固定和已知,在 最后阶段的博弈中,优势策略均衡(背叛)就会出现。 As long as the relationship between the two players lasts a fixed and known length of time, the dominant-strategy equilibrium with defecting should prevail in the last period of play. play 参与者到达博弈终点时,继续合作就毫无价值,于是他们 选择背叛。 Wh th l i at t the th end d of f the th game, When the players arrive there is never any value to continued cooperation, and so they defect. 按照反转的预测,相互背叛就会一直倒推到最开始的博弈。 Then rollback predicts mutual defecting all the way back to the very first play.
博弈论ppt完整版
不能用重复剔除求解的博弈
许多博弈没有占优均衡,也没有重复剔除的占优 均衡。
左中右 上 1, 0 1, 3 0, 1 下 0, 4 0, 2 2, 3
实用性较强的博弈分析方法,必然是以策略之间的 相对优劣关系,而不是绝对优劣关系为基础的,根据 这样的思路,很容易导出博弈分析的“划线法”。
划线法
价格制度
——人类为达到合作和解决冲突所发明的重要制度之一
传统的新古典经济学就是以价格为研究对象的,故 又称为价格理论。其基本假设:
市场参与者的数量足够多,从而市场是竞争性的 参与者之间不存在信息不对称问题
- 传统经济学的假设及其局限性
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格” 参数之中
因此,以上五个 策略都不可能被 双方接受!
五、纳什均衡与一致性预期
纳什均衡:所有参与人的最优战略的组合, 即给定战略中别人的选择,没有人有积极性 改变自己的选择。
构成纳什均衡的策略一定是重复剔除严格劣 策略过程中不能被剔除的策略,当然,逆定 理是不存在的。
许多不存在占优策略均衡或重复剔除的占 优策略均衡的博弈,也存在纳什均衡。
企业利润最大化的条件为:
Π1 q1
a 2q1
q2
c
0
Π 2 q2
a q1
2q2
c
0
q1
R(q2
)
a
2
c
q2 2
q2
R(q1 )
a
2
c
q1 2
纳什均衡产量为:
q1NE
q2NE
ac 3
纳什均衡利润为:
微观经济学 第17讲-重复博弈
两阶段重复博弈
• 不过也说明子博弈完美对于可信性的要求 并不严格。 • 人们可以在第二阶段经过重新谈判都选择 帕累托占优的(R1 , R2),此时(M1 , M2)就不 是最优的 • 为了解决重新谈判这个问题,可以考虑下 面的博弈
两阶段重复博弈
L1 M1 R1 P1 Q1
L2 1,1 0,5 0,0 0,0 0,0 M2 5,0 4,4 0,0 0,0 0,0 R2 P2 Q2 0,0 0,0 0,0 0,0 0,0 0,0 3,3 0,0 0,0 0,0 4,1/2 0,0 0,0 0,0 ½,4
两阶段重复博弈
L1
L2 2,2 M2 6,1 7,7 1,1 R2 1,1 1,1 4,4
M1 1,6 R1 1,1
两阶段重复博弈
• 这里有三个均衡(L1 , L2), (M1 , M2), (R1 , R 2) • 如果G={A1 ,…,An ;u1,…,un }是一个有多个 纳什均衡的完全信息静态博弈,那么重复 博弈G(T)可以存在子博弈精炼解,其中对 每一t<T,t阶段的结果都不是G的纳什均衡 • 这个结论说明,对将来行动所做的可信威 胁可以影响到当前行动。
两阶段重复博弈
• 纯策略均衡(L1 , L2),(R1 , R2),(P1 , P2)和 (Q1 , Q2) • 后面三个纳什均衡处于一个帕累托边界上 • 如果博弈进行两个阶段 • 策略:如果第一阶段(M1 , M2),那么(R1 , R2);如果(M1 ,Z),那么(P1 , P2);如果(x , M2), 那么(Q1 , Q2);如果(y , h),那么(R1 , R2)
两阶段重复博弈
• 此博弈第二阶段均衡为(L1 , L2) • 假如第一阶段,那么博弈变为 参与人2 L2 R2 L1 2,2 6,1 参与人1 R1 1,6 5,5
经济博弈论之重复博弈
9
三、重复博弈的得益
重复博弈的得益,必须兼顾其他阶段的得益,或者考虑整个重复博弈过程得益 的总体情况。
1.计算重复博弈的“总得益”,即博弈方各次重复得益的总和 2.计算各阶段的“平均得益”,即总得益除以重复次数
10
三、重复博弈的得益
考虑到重复博弈额次数和时间的先后次数,不同时间获得的利益对人们的价值是 有差别的,考虑到这个因素,引进将后一段的得益折算成当前阶段得益(现在值) 的贴现系数δ 。
连锁店悖论
是指一个在n个市场都开设连锁店的企业,对于各个市场的竞争者是否打击排斥的策略选择。
“先来后到”博弈,竞争者选择进入,先占领市场的连锁店不打击, A 打进 B 不进 (1,10) 是原博弈的唯一的子博弈完美纳什均衡,是两个理性的博弈方之间 博弈的唯一结果。 根据上诉的定理和一般结论,以这个博弈为原博弈的有限次重复博弈, 唯一的子博弈完美纳什均衡就是原博弈的纳什均衡,也就是每个竞争者 可以进入,连锁店不打击。 (-2,3) (5,5) 现实中类似问题的直觉经验与该理论结论明显不符。
三价博弈
厂商2 H H 厂商1 M
M
L
5,5 6,0 2,0
0,6 3,3
0,6 0,2
L
2,0
1,1
两个纯纳什均衡(M,M),(L,L);符合博弈方总利益最大(H,H)
26
4.2.3多个纯策略纳什均衡博弈的有限次重复博弈
一、三价博弈的重复博弈
三价博弈
厂商2 H H 厂商1 M
M
L
5,5 6,0 2,0
31
4.2.3多个纯策略纳什均衡博弈的有限次重复博弈
三、两市场博弈的重复博弈 厂商2 A 3,3 4,1 B 1,4 0,0 三次重复博弈的均衡路径是(A,A),(A,B),(B,A), 得益是(3+1+4)/3=2.67.
经济博弈论课件4
第四章 重复博弈
本章介绍基本博弈重复进行构成的重复博弈。 虽然形式上是基本博弈的重复进行,但重复博弈中 博弈方的行为和博弈结果却不一定是基本博弈的简 单重复,因为博弈方对于博弈会重复进行的意识, 会使他们对利益的判断发生变化,从而使他们在重 复博弈过程中的行为选择受到影响。这意味着不能 把重复博弈当作基本博弈的简单叠加,必须把整个 重复博弈过程作为整体进行研究。
t =1
∞
4.2 有限次重复博弈
4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈 的有限次重复博弈 4.2.3多个纯策略纳什均衡博弈 的有限次重复博弈 4.2.4 有限次重复博弈的民间定理
4.2.1 两人零和博弈的有限次重复博弈
零和博弈是严格竞争的,重复博弈并不改变这 一点。 以零和博弈为原博弈的有限次重复博弈与猜硬 币博弈的有限次重复博弈一样,博弈方的正确 策略是重复一次性博弈中的纳什均衡策略。
本章分三节
4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈
4.1 重复博弈引论
4.1.1 为何研究重复博弈 4.1.2 基本概念
4.1.1 为何研究重复博弈
经济中的长期关系 人们的预见性 未来利益对当前行为的制约 长期合同、回头客、长客和一次性买卖的区别 有无确定的结束时间
V = 4 + δV
因此当 δ > 1 / 4 时,此触发策略纳什均衡策略
-1,-1
ห้องสมุดไป่ตู้
(-5,-5) 囚徒2 囚徒 坦 白 不坦白 囚 坦白 -10,-10 -5,-13 徒 -13,-5 -6,-6 1 不坦白 (-10,-10)
有限次重复削价竞争博弈
寡头2 寡头 高 价 寡 高价 头 1 低价 100,100 150,20 低 价 20,150 70,70
本章介绍基本博弈重复进行构成的重复博弈。 虽然形式上是基本博弈的重复进行,但重复博弈中 博弈方的行为和博弈结果却不一定是基本博弈的简 单重复,因为博弈方对于博弈会重复进行的意识, 会使他们对利益的判断发生变化,从而使他们在重 复博弈过程中的行为选择受到影响。这意味着不能 把重复博弈当作基本博弈的简单叠加,必须把整个 重复博弈过程作为整体进行研究。
t =1
∞
4.2 有限次重复博弈
4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈 的有限次重复博弈 4.2.3多个纯策略纳什均衡博弈 的有限次重复博弈 4.2.4 有限次重复博弈的民间定理
4.2.1 两人零和博弈的有限次重复博弈
零和博弈是严格竞争的,重复博弈并不改变这 一点。 以零和博弈为原博弈的有限次重复博弈与猜硬 币博弈的有限次重复博弈一样,博弈方的正确 策略是重复一次性博弈中的纳什均衡策略。
本章分三节
4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈
4.1 重复博弈引论
4.1.1 为何研究重复博弈 4.1.2 基本概念
4.1.1 为何研究重复博弈
经济中的长期关系 人们的预见性 未来利益对当前行为的制约 长期合同、回头客、长客和一次性买卖的区别 有无确定的结束时间
V = 4 + δV
因此当 δ > 1 / 4 时,此触发策略纳什均衡策略
-1,-1
ห้องสมุดไป่ตู้
(-5,-5) 囚徒2 囚徒 坦 白 不坦白 囚 坦白 -10,-10 -5,-13 徒 -13,-5 -6,-6 1 不坦白 (-10,-10)
有限次重复削价竞争博弈
寡头2 寡头 高 价 寡 高价 头 1 低价 100,100 150,20 低 价 20,150 70,70
博弈论课件4重复博弈
5 1 1 2 5
如果博弈方2采用H,总得益现值为:
1
V 4 V
因此当 1/ 4时,此触发策略纳什均衡策略。
4.3.2 惟一纯策略纳什均衡的无限次重复博弈
无限次重复博弈民间定理(弗里德曼,1971)
设G是一个完全信息的静态博弈,用(e1, , en )记G的纳什均衡得益,
用(x , 1
重复囚徒困境悖论和连锁 店悖论
☻理论和实践的直觉矛盾,现实 中寡头之间的价格战问题并 不十分普遍,重复次数较大 的实验研究的结果(重复200 次的囚徒困境)
☻泽尔腾(1978),“连锁店悖论” (导论中的先来后到博弈), 实际中对开头几个市场的进 入者不计代价的打击
☻问题的症结与蜈蚣博弈类似, 在于在较多阶段的动态博弈 中逆推归纳法的适用性T t1t 1t1 2 23
t1
t 1
t
4.1.2 基本概念
平均得益:如果一常数作为重复博弈(有限次重复博弈或
无限次重复博弈)各个阶段的得益,能产生与得益序列
1, 2,相同的现在值,则称为1, 2,的平均得益
无限次重复博弈时
2 (1 )
1 2 23
4.2.3 多个纯策略纳什均衡的有限次重复博弈
三价博弈的两次重复博弈
+1
厂H 商M
1L
H
5,5 6,0 2,0
厂商2
M 0,6 3,3 2,0
L
0,2 0,2 1,1
+3
厂H 商M 1L
H
8,8 7,1 3,1
厂商2 M
1,7 4,4 3,1
L
1,3 1,3 2,2
三价博弈
两次重复三价博弈的等价博弈
有限次重复博弈民间定理
经济博弈论ppt课件
• 例二:黔馿之技
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
重复博弈博弈论课件.ppt
重 复 博 弈
重复博弈
动态博弈的类型
序贯博弈sequential game
每一个阶段的博弈结构是不同的,即从后一个决策结开 始的子博弈不同于从前一个决策结开始的子博弈。或者 说,同样结构的博弈只出现一次。 是指同样结构的博弈重复多次,其中的每次博弈称为 “阶段博弈”。如“囚徒困境”中小偷每次作案后判刑 释放后又作案。 分为有限次重复博弈与无限次重复博弈
H H 厂商1 M L 5, 5 6, 0 2,0
厂商2 M
L 0,2 0,2 1,1
0,6 3,3 2,0
触发策略可信的情况
博弈方1:第一次选H,如 果第一次结果为 (H,H),则第二次选择 M;否则采用P 博弈方2:第一次选H,如 果第一次结果为 (H,H),则第二次选择 M;否则采用Q
博弈方1 H M L P Q
5,5 6,0 2,0
重复两阶段三价博弈的等价博弈:如果 认为触发策略不可信,即不可信报复, 最佳选择为(M,M)
触发策略可信性问题
实际上,触发策略中的报复机制的可信性是一个很复 杂的问题,会受到相互预期等很多复杂因素的影响。 例如,未偏离的一方并不想报复偏离的一方,而偏离 的一方却因为害怕报复而采用L,结果心慈手软的未偏 离一方再次遭受损失,这种可能性的存在会使得报复 机制实施的可能性增加。 此外,考虑策略的制定者和执行者分离的情况,执行 者会严格执行决策者指令的情况等等。
在有限次重复博弈中,如果原博弈存在唯一的纯策略NE, 则有限次重复博弈的唯一的均衡解就是各博弈方在每阶段 中都采用原博弈的NE。 因为每个阶段NE都是SPNE,即不存在不可信的威胁和许 诺,因此重复博弈的解也是SPNE。
重复博弈
动态博弈的类型
序贯博弈sequential game
每一个阶段的博弈结构是不同的,即从后一个决策结开 始的子博弈不同于从前一个决策结开始的子博弈。或者 说,同样结构的博弈只出现一次。 是指同样结构的博弈重复多次,其中的每次博弈称为 “阶段博弈”。如“囚徒困境”中小偷每次作案后判刑 释放后又作案。 分为有限次重复博弈与无限次重复博弈
H H 厂商1 M L 5, 5 6, 0 2,0
厂商2 M
L 0,2 0,2 1,1
0,6 3,3 2,0
触发策略可信的情况
博弈方1:第一次选H,如 果第一次结果为 (H,H),则第二次选择 M;否则采用P 博弈方2:第一次选H,如 果第一次结果为 (H,H),则第二次选择 M;否则采用Q
博弈方1 H M L P Q
5,5 6,0 2,0
重复两阶段三价博弈的等价博弈:如果 认为触发策略不可信,即不可信报复, 最佳选择为(M,M)
触发策略可信性问题
实际上,触发策略中的报复机制的可信性是一个很复 杂的问题,会受到相互预期等很多复杂因素的影响。 例如,未偏离的一方并不想报复偏离的一方,而偏离 的一方却因为害怕报复而采用L,结果心慈手软的未偏 离一方再次遭受损失,这种可能性的存在会使得报复 机制实施的可能性增加。 此外,考虑策略的制定者和执行者分离的情况,执行 者会严格执行决策者指令的情况等等。
在有限次重复博弈中,如果原博弈存在唯一的纯策略NE, 则有限次重复博弈的唯一的均衡解就是各博弈方在每阶段 中都采用原博弈的NE。 因为每个阶段NE都是SPNE,即不存在不可信的威胁和许 诺,因此重复博弈的解也是SPNE。
《经济博弈论》PPT课件
13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
经济博弈论概述(ppt 242页)
著名经济学家泰勒尔(Jean Tirole)说: “正 如理性预期使宏观经济学发生革命一 样,博弈论广泛而深远地改变了经济学 家的思维方式”
如果情况确实如此,对今天的经济学家来说 ,不懂得博弈论显然是不行了。
博弈论为何如此热门?
诺贝尔经济学奖偏爱博弈论研究
1994年诺贝尔经济学授予 约翰·纳什 约翰·海萨尼 莱因哈德·泽尔腾
如个体厂商为了获得更高利润,期待通过集团形成卖方 垄断;
消费者为了寻求更低的价格,期待通过集团形成买方垄 断;
工人们为了得到更高的工资待遇,期待通过工会形成讨 价还价的势力等等。
以夏普利值为例来看合作问题
例题1
假定某议会共有100个席位,议员分属4个党派 :红党43席,蓝党33席,绿党16席,白党8席;
2012年:诺贝尔经济学奖授予 埃尔文·罗斯(Alvin Roth) 罗伊德·夏普利(Lloyd Shapley)。
埃尔文·罗斯(Alvin E.Roth) 罗伊德·夏普利(Lloyd S.Shapley)
他们的贡献:
稳定的匹配理论与市场设计的实践
经济学是研究资源最优配置问题的,而真实世界 里配置资源的方式多种多样,市场、价格机制是 经济学研究最多的。
一般观点认为合作博弈理论要比非合作博弈理论更为重要, 因为,如果人们的合作是有利可图的,参与博弈的理性人怎 么会放弃合作而采取非合作态度呢?
我们知道,在任何真实的博弈局势中,无论合 作博弈还是非合作博弈,如果我们仔细地考察 人们为达成一个协议而能做什么的话,那么原 则上我们就应该有可能把它模型化,然后通过 分析这个博弈的均衡(解)来预测其结果。
1996年诺贝尔经济学授予
威廉·维克瑞 詹姆斯·莫里斯
2001年诺贝尔经济学授予
《博弈论与信息经济学讲义》第6章 重复博弈与信誉
重复博弈的三个特征
• 阶段博弈之间没有物质上的联系,也就 是说,前一阶段的博弈不改变后一阶段 的结构;
• 所有参与人观察到博弈过去的历史; • 参与人的总支付(报酬)是所有阶段博
弈支付的贴现值之和;
重复博弈和信誉问题
• 如果博弈不是一次的,而是重复进行的,参与 人过去行动的历史是可以观察到的,参与人就 可以将自己的选择依赖于其他人之前的行动, 因而有了更多的战略可以选择,均衡结果可能 与一次博弈大不相同。
RT RT
RP RP
含义
• 欺骗行为越难以被发现,欺骗发生的可 能性越大;或者说,合作越困难;
• 在前面的例子,R=4, T=3, P=0. 如果欺骗 一次就被发现,只要 4 3 0.25 合作就 会出现;而如果欺骗两次4 才0 被发现,只
有当 0.5 时,合作才可能出现;
• 一般地,欺骗行为越不容易被发现,合 作越困难。
商业社会的问题
• 现在社会被称为“匿名社会”(anonymous society), 与乡村社会不同,居民的流动性大,交易双方通常并 不认识,相互之间也缺少如乡村社会中存在的其他制 约关系,使得受害人的惩罚措施受到很大限制;开放 的社会也使得人们较不在乎闲言碎语的议论。凡此种 种,使得传统的以个人为基础的信誉机制失灵,这也 是都市社会犯罪率高的一个重要原因。但是,西方市 场经济只所以能发达到今天的程度,除了较完善的司 法制度之外,是因为他们在更高的形态上复制出了前 面讲的四个条件。
社团内的博弈
B
A
C
H
D
G
E
F
社团内的博弈
B
A
C
H
D
G
E
F
Third-party enforcement problem
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12.10.2020
4.2.3 有两个纳什均衡的重复博弈
例 两个厂商1和2,同时
A
B
面临两个市场机会A和B。假 A 3,3 1, 4
设每个厂商都只有能力选择 B 4,1 0,0
一市场发展,即他们的可选 图4-2 两厂商差别市场博弈
择策略都是A或B,其得益矩
阵如图所示。
此博弈具有2个纯策略纳什均衡(1,4)、
几个概念: 1 子博弈:从某一阶段(不包括第一阶段)开始,
包含以后所有阶段的原重复博弈的一部分。 2 策略:博弈方在每个阶段针对每种情况如何行
动的计划(注:在每一阶段之前,博弈方是可 以观察到以前博弈的结果的)。
5
12.10.2020
4.1.2 有限次重复博弈的概念
3 路径: 是每个阶段博弈结果(原博弈的一个 策略组合)连接而成。对于具有n个策略组合 的原博弈,重复T次的路径数为nT,重复博弈 的求解即找出具有稳定性的均衡路径。
2.触发策略,博弈方首先采取合作行为,如果 发现对方没有进行合作,那么在后续阶段的博弈中 采取不合作策略进行惩罚。
15
12.10.2020
4.2.3 有两个纳什均衡的重复博弈
在图4-2中,触发策略的设计为: (1)博弈方1的策略是第一阶段合作A,如果发现对方
采取B不合作,则第二阶段采取不合作的B策略惩罚, 否则第二阶段继续合作;第三阶段无条件采取B策略。 (2)博弈方2的策略是第一阶段合作A,如果发现对方 采取B不合作,则后续两个阶段一直采取不合作的B 策略;如果发现对方采取合作A,则第二阶段采取不 合作B,第三阶段采取合作A。
(4,1)和混合策略纳什均衡概率(0.5,0.5)。
14
12.10.2020
4.2.3 有两个纳什均衡的重复博弈
考虑三次重复博弈各策略组合子博弈纳什均衡
路径: 1.由原博弈的纳什均衡组合而成的路径,如采
取轮换策略(在上述的协调博弈中,双方轮换采取 纯纳什均衡策略,路径为(A,B),(B,A),(A,B)….. 不考虑时间的价值(贴现系数),每阶段的平均得 益为(4+1)/2 =2.5,高于混合策略的得益2。
12
12.10.2020
4.2.2 有限次重复的囚徒困境博弈
定理 设原博弈G有唯一的纯策略纳什均衡,则 对任意正整数T,重复博弈G(T)有唯一的子 博弈完美的解,即各博弈方每个阶段都采用G 的纳什均衡策略。各博弈方在G(T)中的总得 益为在G中得益的T倍,平均每阶段得益等于原 博弈G中的得益。
13
3
12.10.2020
4.1.2 有限次重复博弈的概念
定义:给定一个博弈G,重复进行T次G,并且在 每次重复之前各博弈方都能观察到以前博弈的结 果,称为G的一个“T次重复博弈”,记为G(T)。 其中,G成为G(T)的原博弈。每次重复称为G(T) 的一个阶段。
4
12.10.2020
4.1.2 有限次重复博弈的概念
9
12.10.2020
4.2.2 有限次重复的囚徒困境博弈
以两阶段(以该博弈作为原博弈G重复两次)为
例:分析最后一阶段,子博弈即为原博弈,唯一的
均衡为(-5,-5);分析第一阶段,将最后阶段
的收益(-5)添加到第一阶段的矩阵中,即:
坦白
不坦白
坦白 -10,-10 不坦白 -13, -5
-5, -13 -6,-6
策略 有多个纳什均衡重复博弈的得益范围——民间定
理
7
12.10.2020
4.2.1 有限次重复的猜硬币博弈
在零和博弈中,双方不存在合作的可能性, 因此在长期进行的重复博弈中,子博弈完美纳什 均衡由各个阶段原博弈的纳什均衡构成(例,在 猜硬币博弈中以0.5的概率选择正面或者反面, 即采取混合策略)。
11
12.10.2020
4.2.2 有限次重复的囚徒困境博弈
如果原博弈存在唯一的纯策略纳什均衡组合,则 有限次重复博弈的唯一的均衡解即各博弈方在每 阶段(即每次重复)中都采用原博弈的纳什均衡 策略。由于在这样的双方策略下,均衡路径中的 每个阶段都不存在不可信的威胁或许诺,因此这 种均衡是子博弈完美纳什均衡。
第四章 重复博弈
本章主要内容:
1 重复博弈的概念;
2 作为一种特殊的动态博弈,有限次和无限次重复
博弈的子博弈完美纳什均衡的求解方法;
3 无限次重复博弈古诺模型和效率工资模型。
本章主要结论(民间定理):
由于参与者在重复博弈中具有了长期利益,
可以通过在后面阶段中采取的报复策略使得威胁
变得可信,从而摆脱静态博弈中“追求自身利益
最大化”导致的囚徒困境,实现长期合作的结局。
1
12.10.2020
第一节 几个概念
重复博弈的概念 有限次重复博弈的概念
2
12.10.2020
4.1.1 重复博弈的概念
1 由简单的静态博弈(或动态博弈)的有限次 (或无限次)重复进行构成的。 2 每一阶段博弈方、策略集合、规则和得益都相 同。 3 包括:有限次重复博弈和无限次重复博弈 4 例子: 多场决胜负的体育比赛(有限次) 两寡头市场上两个厂商之间的竞争(无限次) 商场与顾客交易
此时,博弈的纳什均衡仍是(坦白,坦白)。
10
12.10.2020
4.2.2 有限次重复的囚徒困境博弈
结论: 在有限次重复博弈G(T)中,如果原博 弈G存在唯一的纯策略纳什均衡组合,则重复 博弈的唯一的子博弈完美纳什均衡解为各博弈 方在每阶段都采取的原博弈纳什均衡策略。
含义:在原博弈具有唯一均衡的有限次重复博 弈中,由于完全理性的博弈方具有“共同知识” 的分析推理能力,因此在从最后阶段开始的逆 推过程中,仍然无法摆脱囚徒困境。
实际上,所有以零和博弈为原博弈所构成的 重复博弈与猜硬币博弈构成的重复博弈一样,各 博弈方的正确策略就是在每次重复中都采用一次 性博弈中的纳什均衡策略境博弈
坦白 不坦白
坦白
不坦白
-5,-5
0, -8
-8, 0 -1,-1
图4-1 囚徒困境
求解思路:对于有限次重复囚徒困境博弈,根 据动态博弈的逆推归纳法可以求解。
4 得益:不同于一般的动态博弈,重复博弈的得 益为各个阶段得益的加总。考虑到时间的价值, 需要引进“贴现系数”将未来的得益折算成当 期得益的价值。
6
12.10.2020
第二节 有限次重复博弈
有限次重复的猜硬币博弈——原博弈为零和博弈 有限次重复的囚徒困境博弈——原博弈有唯一的
纯策略纳什均衡 有多个纳什均衡的重复博弈的策略设计——触发