第十二讲重复博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
他有可能有积极性,建立一个“好” 的声誉以换取长远利益。
4
二、有限次重复博弈
例1,企业定价策略
高价 高价 低价 100,100 150,-10
低价 -10,150 50,50
5
设贴现因子0<δ<1,重复T次 企业i的最优策略为低价,总收益为
ui 50 50 1 50 1
1 6
13
1 大多数情况下 1 i
i为银行利率或投资收益率
即i
1
1
1 时 i 5 500% 6
14
这就说,i≤500%时,双方一定会坚持冷 酷策略,
从而(抵赖,抵赖)为每一个阶段的 均衡结果,且是帕累托最优的 。 其原因:如果博弈重复无穷次,且双 方有足够的耐心(对未来价值的估量 较大),任何短期的机会主义行为的 所得都是微不足道的,参与人有积极 性为自己建立一个乐于合作的声誉和 惩罚对方的机会主义行为。
(2)如果有一方选择“坦 白”,则然后永远选择“坦 白”。 设δ为贴现因子,坚持冷酷策 略条件: 一旦坦白的总收益u0≤坚持冷 酷策略的总收益u*
12
u 0 6
0
*
2
6
1
u 1 1
2
6 1 即 1 1
1 j
企业i没有积极性偏离合作均 衡的条件为
一直坚持合作的总收益≥背叛的 总收益,即
21
a c
8
Biblioteka Baidu
2
a c 8
2
2
a c
2
8
9a c 1 2 a c 64 9
1 2 a c 9
2
22
1 1 即 8 1
企业越多企业一次性机会主义不合作 行为中的净收益相对于长远利益的比 率越大,机会主义行为 的诱惑越大。 一般说来,小团体的合作靠非正式的 规则就可以维持, 而大团体则必须依赖于正式的规则和 合约。
26
无名氏定理:有一个一次博弈G可作为某无 穷博弈的一个阶段,G有纳什均衡及其结果, 对于无限博弈,肯定存在一个贴现因子,使 无限博弈的结果不劣(弱优)于G的纳什均衡 结果
9 17
9 1 64 9 1
23
因此,当
9 8 即i 17 9
合谋就会是一个精炼纳什均衡。
24
如果有n个寡头企业,合作均衡要求
4n 1 n 12 v 当n 1
1
25
即企业越多,合作越困难
1 g g a c 3
1 2
1 2 a c 9
1 2
17
②1,2合作时(即各生产垄断产量的一半) 的最优产量为
g1 g 2
最大利润
1
1
1 a c 4
1 2
1
1
1 2 a c 8
18
③i背叛,j合作时,i的最优生产量为
15
例4,无限重复的古诺特寡头竞争模型。
i g1 , g 2 g i a g1 g 2 cgi
16
例4,无限重复的古诺特寡头竞争模 型。 成本函数分别为C1(g1)=cg1 C2(g2)=cg2 反需求函数P=a-(g 1+g 2) 利润函数
①1,2不合作时的最优产量
实验证明,它的确为最优的策略
9
第二节
例3,无限次重复囚徒 困境博弈。
无限次重复博弈
坦白
抵赖
坦白
抵赖
-6,-6
-9,0
0,-9
-1,-1
10
第二节 无限次重复博弈
例3,无限次重复囚徒困境博弈。
坦白
坦白 抵赖 -6,-6 -9,0
抵赖
0,-9 -1,-1
11
冷酷策略:(1)开始选择“抵赖”
27
第三节无穷次重复博弈中的产品质量问题
假设:n家企业生产同一种产品,有优质与 劣质之分,其边际成本分别为c、0,固定成 本圴为F。问题: 1.企业提供优质品的条件 2.竞争性条件 3.市场出清条件
28
一、企业提供优质品的条件
生产劣质品的一次性得利是pq 生产优质品的无穷次性得利是
T T 1
50
6
定理1.设G是价格博弈,G(T)是 G重复博弈T,
如果G有唯一的纳什均衡, 则G(T)的唯一子博弈精 炼纳什均衡是G的纳什均衡 重复T次。
7
例2,掷硬币游戏
正
正 反 -1,1 1,-1
反
1,-1 -1,1
8
此博弈有唯一的混合策略纳什均衡
1 1 1 1 2 , 2 , 2 , 2 ,
( p c)q(1 ...)
2 3
29
企业提供优质品的充分必要条件
qp ( p c)q(1 ...)
2 3
1 即p (1 r )c (r ) 1
30
c
二、竞争性条件
当期利润=固定资本折旧 q(p-c)=rF 当价格p=(1+r)c时 Q=F/c
(三)参与人的总收益是每一阶段 博弈收益的贴现之和。
设贴现值为δ的, 参与人i在第t阶段的收益为uti,
博弈重复次数为T则总收益为
ui u u u
1 i 2 i 2 3 i
T 1 T i
u
1
如果u u 则
t i 0 i
ui u 1
3 g a c 8
2 i
i的最优利润为
2 i
9 2 a c 64
19
j 的冷酷策略:
(1)首先选择 合作即生产量为 (2)如果i选择 2 背叛即生产量为, i 则j将永远选择 不合作。
3 g a c 8
20
1 g a c 4
0 i T 0 i
T 1
1时
1 ui u 1 1时 u i Tu
0 i
2
(四)影响均衡结果的主要因 素是重复次数及信息的完备。
1、重复次数:当博弈重复多次 时,参与人可能为了长远利益而 牺牲眼前利益而选择不同的均衡 策略。
3
2、信息的完备性.
当某个参与人的特征不为其他参与人 所知时,
4
二、有限次重复博弈
例1,企业定价策略
高价 高价 低价 100,100 150,-10
低价 -10,150 50,50
5
设贴现因子0<δ<1,重复T次 企业i的最优策略为低价,总收益为
ui 50 50 1 50 1
1 6
13
1 大多数情况下 1 i
i为银行利率或投资收益率
即i
1
1
1 时 i 5 500% 6
14
这就说,i≤500%时,双方一定会坚持冷 酷策略,
从而(抵赖,抵赖)为每一个阶段的 均衡结果,且是帕累托最优的 。 其原因:如果博弈重复无穷次,且双 方有足够的耐心(对未来价值的估量 较大),任何短期的机会主义行为的 所得都是微不足道的,参与人有积极 性为自己建立一个乐于合作的声誉和 惩罚对方的机会主义行为。
(2)如果有一方选择“坦 白”,则然后永远选择“坦 白”。 设δ为贴现因子,坚持冷酷策 略条件: 一旦坦白的总收益u0≤坚持冷 酷策略的总收益u*
12
u 0 6
0
*
2
6
1
u 1 1
2
6 1 即 1 1
1 j
企业i没有积极性偏离合作均 衡的条件为
一直坚持合作的总收益≥背叛的 总收益,即
21
a c
8
Biblioteka Baidu
2
a c 8
2
2
a c
2
8
9a c 1 2 a c 64 9
1 2 a c 9
2
22
1 1 即 8 1
企业越多企业一次性机会主义不合作 行为中的净收益相对于长远利益的比 率越大,机会主义行为 的诱惑越大。 一般说来,小团体的合作靠非正式的 规则就可以维持, 而大团体则必须依赖于正式的规则和 合约。
26
无名氏定理:有一个一次博弈G可作为某无 穷博弈的一个阶段,G有纳什均衡及其结果, 对于无限博弈,肯定存在一个贴现因子,使 无限博弈的结果不劣(弱优)于G的纳什均衡 结果
9 17
9 1 64 9 1
23
因此,当
9 8 即i 17 9
合谋就会是一个精炼纳什均衡。
24
如果有n个寡头企业,合作均衡要求
4n 1 n 12 v 当n 1
1
25
即企业越多,合作越困难
1 g g a c 3
1 2
1 2 a c 9
1 2
17
②1,2合作时(即各生产垄断产量的一半) 的最优产量为
g1 g 2
最大利润
1
1
1 a c 4
1 2
1
1
1 2 a c 8
18
③i背叛,j合作时,i的最优生产量为
15
例4,无限重复的古诺特寡头竞争模型。
i g1 , g 2 g i a g1 g 2 cgi
16
例4,无限重复的古诺特寡头竞争模 型。 成本函数分别为C1(g1)=cg1 C2(g2)=cg2 反需求函数P=a-(g 1+g 2) 利润函数
①1,2不合作时的最优产量
实验证明,它的确为最优的策略
9
第二节
例3,无限次重复囚徒 困境博弈。
无限次重复博弈
坦白
抵赖
坦白
抵赖
-6,-6
-9,0
0,-9
-1,-1
10
第二节 无限次重复博弈
例3,无限次重复囚徒困境博弈。
坦白
坦白 抵赖 -6,-6 -9,0
抵赖
0,-9 -1,-1
11
冷酷策略:(1)开始选择“抵赖”
27
第三节无穷次重复博弈中的产品质量问题
假设:n家企业生产同一种产品,有优质与 劣质之分,其边际成本分别为c、0,固定成 本圴为F。问题: 1.企业提供优质品的条件 2.竞争性条件 3.市场出清条件
28
一、企业提供优质品的条件
生产劣质品的一次性得利是pq 生产优质品的无穷次性得利是
T T 1
50
6
定理1.设G是价格博弈,G(T)是 G重复博弈T,
如果G有唯一的纳什均衡, 则G(T)的唯一子博弈精 炼纳什均衡是G的纳什均衡 重复T次。
7
例2,掷硬币游戏
正
正 反 -1,1 1,-1
反
1,-1 -1,1
8
此博弈有唯一的混合策略纳什均衡
1 1 1 1 2 , 2 , 2 , 2 ,
( p c)q(1 ...)
2 3
29
企业提供优质品的充分必要条件
qp ( p c)q(1 ...)
2 3
1 即p (1 r )c (r ) 1
30
c
二、竞争性条件
当期利润=固定资本折旧 q(p-c)=rF 当价格p=(1+r)c时 Q=F/c
(三)参与人的总收益是每一阶段 博弈收益的贴现之和。
设贴现值为δ的, 参与人i在第t阶段的收益为uti,
博弈重复次数为T则总收益为
ui u u u
1 i 2 i 2 3 i
T 1 T i
u
1
如果u u 则
t i 0 i
ui u 1
3 g a c 8
2 i
i的最优利润为
2 i
9 2 a c 64
19
j 的冷酷策略:
(1)首先选择 合作即生产量为 (2)如果i选择 2 背叛即生产量为, i 则j将永远选择 不合作。
3 g a c 8
20
1 g a c 4
0 i T 0 i
T 1
1时
1 ui u 1 1时 u i Tu
0 i
2
(四)影响均衡结果的主要因 素是重复次数及信息的完备。
1、重复次数:当博弈重复多次 时,参与人可能为了长远利益而 牺牲眼前利益而选择不同的均衡 策略。
3
2、信息的完备性.
当某个参与人的特征不为其他参与人 所知时,