《经济学博弈》PPT课件
合集下载
第四章、贝叶斯博弈 《经济博弈论基础》PPT课件

b)
(v
b)n1(b)
最优化的一阶条件:
n1(b) (v b)(n 1)n2 (b) d(b) 0 db
vn1db (v b)(n 1)vn2dv 0
(vn1db bdvn1) n 1 dvn 0 n
b*(v) n 1 v n
二、拍卖与招第n价格密封招标
第一价格密封拍卖博弈分析 (1)考虑两个投标人 i=1, 2的情况:
vi——拍卖物品对投标人 i的价值
vi ∈[0,1] 均匀分布 bi≥0 ——投标人 i的出价
bi= bi(vi)严格递增可微函数
第一价格密封拍卖博弈分析
投标人1的期望支付为:
Eu1 (v1 b1) Pr ob(b2 b1) (v b) Pr ob(b2 b)
最优化的一阶条件:
[1 (b)]n1 (b c)(n 1)[1 (b)]n2 d(b) 0 db
均衡情况下, (b) c
(1 c)n1db (b c)(n 1)(1 c)n2 dc 0
第一价格密封招标博弈分析
(1 c)n1db (b c)(n 1)(1 c)n2 d (1 c) 0 (1 c)n1db [b 1 (1 c)](n 1)(1 c)n2 d (1 c) 0
1、拍卖制度与资源配置效率 2、收入等价定理
第四节 混合策略纳什均衡的重新解释
一、混合策略纳什均衡的不完全信息解释 Harsanyi (1973) 证明:完全信息静态博弈中的
混合策略纳什均衡可以解释为不完全信息静态博弈 中贝叶斯纳什均衡的极限。
第四节 混合策略纳什均衡的重新解释
二、混合策略纳什均衡的本质特征不在于局中 人j随机地选择行动,而在于局中人i不能确定局中人j 将选择什么纯策略,这种不确定性可能来自局中人i 不知道局中人j的类型。
复旦大学经济博弈论课件--经济博弈论242页PPT

30.11.2019
课件
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低 价”。
上策均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,必然是该博弈 比较稳定的结果
课件
17
竞争:个体利益最大化
q1R 1(q2,q3)4 81 2q21 2q3
11 q2R 2(q 1,q3)4 82q 12q3 q 3R 3(q 1,q2)4 81 2q 11 2q2
q1 *q2 *q3 *24 u1*u2 *u3 *576
Q*72
u*1728
21
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈G {S1, Sn;u1, un中},博弈方 i的策略
空间为 Si {si1, sik},则博弈方 i以概率分布 pi (pi1, pik)
随机在其 k个可选策略中选择的“策略”,称为一个“混合策
略”,0其p中ij 1 j1, 对,k
u 1 u 1 ( P 1 ,P 2 ) P 1 q 1 c 1 q 1 ( P 1 c 1 ) q 1 (P 1 c 1 )a 1 ( b 1 P 1 d 1 P 2 )
u 2 u 2 ( P 1 ,P 2 ) P 2 q 2 c 2 q 2 ( P 2 c 2 ) q 2 (P 2 c 2 )a 2 ( b 2 P 2 d 2 P 1 )
上策均衡不是普遍存在的
30.11.2019
课件
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
导论:博弈论与经济学42页PPT文档

杰克·赫什莱弗、约翰·G·赖利(著),《不确定性与信 息分析》,北京:中国社会科学出版社,2000
26.04.2020
博弈论(陈艳)
导论:博弈论与经济学
26.04.2020
博弈论(陈艳)
本章主要内容
博弈论的经典案例 博弈ຫໍສະໝຸດ 与主流经济学 博弈论与诺贝尔经济学奖 博弈论的基本类型
26.04.2020
26.04.2020
博弈论(陈艳)
智猪博弈
小猪
按
等待
大猪
按
5,1
4,4
等待
9,-1
0,0
26.04.2020
博弈论(陈艳)
在这种情况下,不论大猪采取何种策略,小猪的 最佳策略是等待,即在食槽边等待大猪去揿按钮, 然后坐享其成。而由于小猪总是会选择等待,大 猪无奈之下只好去揿按钮。这种策略组合就是名 闻遐迩的“纳什均衡”。它指的是,在给定一方 采取某种策略的条件下,另一方所采取的最佳策 略(此处为大猪揿按钮), 多劳者不多得。
26.04.2020
博弈论(陈艳)
推理过程是这样的:从后向前推,如果1-3号海盗都喂了鲨鱼,只剩4 号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所 以,4号惟有支持3号才能保命。3号知道这一点,就会提(100,0, 0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为 他知道4号一无所获但还是会投赞成票,再加上自己一票他的方案即 可通过。不过,2号推知到3号的方案,就会提出(98,0,1,1)的 方案,即放弃3号,而给予4号和5号各一枚金币。由于该方案对于4 号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局 而由3号来分配。这样,2号将拿走98枚金币。不过, 2号的方案会被 1号所洞悉,1号并将提出(97 ,0,1,2,0)或(97,0,1,0, 2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2 枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号 分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方 案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大 收益的方案了!
《经济学博弈》PPT课件

• 假设n个人参与博弈,给定其他博弈方策略的
条件下,每个博弈方选择自己的最优策略.纳
什均衡指的是"由所有博弈方的最优策略组成
的一个组合"
• n个人制订了一个协议,这n个人是否能自愿遵
守?他们会自觉遵守,这个协议就构成一个纳
什均衡.
• 如果一个协议不构成纳什均衡,它就不可能自
动实施,而需要外力胁迫,这就是无所谓的"协
通过单独改变自己的策略而增加盈利,如能,则
从所分析的策略组合对应的盈利数组引一箭
头,到改变策略后策略组合对应的盈利数组,最
后综合对每个策略组合的分析情况,只有指向、
无指离的策略组合形成对博弈的结果.
2024/2/20
26
具体方法——考察在每个策略组合处各
个博弈方能否通过单独改变自己的策略
而增加得益.如能,则从所分析的策略组合
基本思想——博弈方先找出自己针
对其他博弈方每种策略或策略组合的
最佳对策,即自己的可选策略中与其
他博弈方的策略或策略组合配合,给
自己带来最大得益的策略,然后在此
基础上,通过对其他博弈方策略选择
的判断,包括对其他博弈方对自己策
略判断的判断等,预测博弈的可能结
2024/2/20
14
• 具体方法——对其他博弈方的任一策略组合,
当双方的相对优势策略确定后,哪个格子里面两个
数字都被被划线,那么这个格中所对应的相对
优势策略组合就是一个纳什均衡.
2024/2/20
17
例2、囚徒困境博弈
乙
招
不招
-8,-8
-15,0
0,-15
招
甲
-1,-1
不招
经济博弈论ppt课件

• 例二:黔馿之技
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
《经济学博弈》课件

《经济学博弈》PPT课件
博弈论是研究决策者在互动中的最优策略的数学模型。通过剖析博弈行为和 策略选择,可以在经济、政治和生物领域提供深刻的洞察力。
什么是博弈论?
博弈论是一门研究决策者如何在互动中做出最优决策的数学模型。它的定义、历史和应用广泛影响着经济学、 政治学和生物学等领域。
囚徒困境
囚徒困境是博弈论中的经典案例。两个囚徒面临合作和背叛的选择,通过策略的制定和Nash均衡的理论,揭 示了最优决策背后的博弈机制。
Байду номын сангаас
零和博弈
零和博弈是一种经典博弈形式,其中参与者的利益完全相反。通过极小化极 大原理和最优策略的分析,探讨了如何在零和博弈中进行最优决策。
博弈树
博弈树是博弈论中的工具,可以帮助我们系统地分析和展示博弈的各种可能 情况和决策路径。了解博弈树的定义、构建和遍历过程,对博弈决策具有重 要意义。
经典博弈
经典博弈案例包括石头剪刀布、拍卖游戏和拐点游戏等,通过分析这些博弈的策略和结果,可以更深入地理解 博弈论的应用和影响。
应用场景
博弈论在经济领域、政治领域和生物领域都有广泛的应用。从市场竞争到决 策制定,博弈论提供了一种理论框架来分析和解决各种实际问题。
总结
经济学博弈是一门强大的工具,可以帮助我们理解决策者行为和策略选择背后的机制。通过对博弈论的评价和 展望,可以进一步推动该领域的研究和应用。
博弈论是研究决策者在互动中的最优策略的数学模型。通过剖析博弈行为和 策略选择,可以在经济、政治和生物领域提供深刻的洞察力。
什么是博弈论?
博弈论是一门研究决策者如何在互动中做出最优决策的数学模型。它的定义、历史和应用广泛影响着经济学、 政治学和生物学等领域。
囚徒困境
囚徒困境是博弈论中的经典案例。两个囚徒面临合作和背叛的选择,通过策略的制定和Nash均衡的理论,揭 示了最优决策背后的博弈机制。
Байду номын сангаас
零和博弈
零和博弈是一种经典博弈形式,其中参与者的利益完全相反。通过极小化极 大原理和最优策略的分析,探讨了如何在零和博弈中进行最优决策。
博弈树
博弈树是博弈论中的工具,可以帮助我们系统地分析和展示博弈的各种可能 情况和决策路径。了解博弈树的定义、构建和遍历过程,对博弈决策具有重 要意义。
经典博弈
经典博弈案例包括石头剪刀布、拍卖游戏和拐点游戏等,通过分析这些博弈的策略和结果,可以更深入地理解 博弈论的应用和影响。
应用场景
博弈论在经济领域、政治领域和生物领域都有广泛的应用。从市场竞争到决 策制定,博弈论提供了一种理论框架来分析和解决各种实际问题。
总结
经济学博弈是一门强大的工具,可以帮助我们理解决策者行为和策略选择背后的机制。通过对博弈论的评价和 展望,可以进一步推动该领域的研究和应用。
第六章、合作博弈 《经济博弈论基础》PPT课件

与摩根斯特恩提出来的概念,有时被 记为VN-M解。记所有可能分配组成的集合为E(V),则稳定 集定义如下:
• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。
• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。
《经济博弈论》PPT课件

13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
复旦大学经济博弈论课件--经济博弈论6-32页PPT资料

2020/3/22
课件
4
6.1.3 不完美信息动态博弈的子博弈
因为原博弈本身不会成为原博
弈的后续阶段,因此子博弈不 能从原博弈的第一个节点开始,
Ll包含所有在初始节点和终点, 但不包含不跟在此初始节点之 后的节点
2R 2
L
L
R
3
不分割任何的信息集。
LR
LR
2020/3/22
课件
2
6.1.1 概念和例子
完美信息:博弈中后面阶段的博弈方有关于前面阶段 博弈进程的充分信息
完美信息动态博弈:动态博弈中的所有博弈方都有完 美信息的博弈
完全信息:各博弈方对博弈结束时每个博弈方的得益 是完全清楚的
不完美信息动态博弈的基本特征之一是博弈方之间在 信息方面是不对称的,如二手车市场
2020/3/22
课件
3
6.1.2 不完美信息动态博弈的表示
多节点信息集扩展形表示
0 1
(-7000) (-10000) (-16000) (-10000)
好1差
1 不卖 1
卖
卖
不卖
2
(0,0) (0,0)
买 不买 买 不买
运输路线扩展形
(2,1) (0,0) (1,-1) (-1,0)
二手车交易扩展形
2020/3/22
课件
15
6.3.1 单一价格二手车交易博弈模型
基本假设:P c V P W
2020/3/22
好1差
1 不卖 1
卖
卖
不卖
2
(0,0) (0,0) 买 不买 买 不买
(P, V-P) (0, 0) (P-C, W-P) (-C, 0)
《经济博弈论(第三版)》 谢识予 PPT课件

24
5
5
5
5
25
25
25
3
43
3
11
33
33
33
7
3
3
7
49
21
21
二、n个厂商连续产量
n
Q qi i 1
n
P P(Q) P( qi ) i 1
n
qi P qi P( qi ) i 1
n
n
qi P( qi ) cqi qi[P( qi ) c]
i 1
i 1
1.3 博弈结构和博弈分类
1.4 博弈论历史和发展简述
1.4.1博弈论的早期研究 1.4.2博弈论的形成 1.4.3博弈论的成长和发展 1.4.4博弈论的成熟及与主流经济
学的融合
1.4.1博弈论的早期研究
博弈论历史没有公认答案 对具有策略依存特点决策问题的研究可上溯
到18世纪初甚至更早 博弈论真正的发展在本世纪 博弈论总体上仍然是发展中的学科
1.3.6 博弈方的能力和理性
完全理性和有限理性
完全理性:有完美的分析判断能力和不会犯选择行为 的错误
有限理性:博弈方的判断选择能力有缺陷
个体理性和集体理性
个体理性:一个体利益最大为目标 集体理性:追求集体利益最大化 合作博弈:允许存在有约束力协议的博弈 非合作博弈:不允许存在有约束力协议的博弈
2000年前我国古代的“齐威王田忌赛马” 1500年前巴比伦犹太教法典“婚姻合同问题”
等。
1838年古诺寡头模型。 1883年伯特兰德寡头竞争模型。 1913年齐默罗象棋博弈定理 、“逆推归纳法” 1921-1927年波雷尔混合策略的第一个现代表述,
有数种策略两人博弈的极小化极大解
西方经济学博弈论全解ppt课件.ppt

小猪的最优策略:等待 大猪无最优策略:即大猪的最优策略是依赖于 小猪的策略
此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按
这是一个“多劳不多得,少劳不少得”的均衡
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论与主流经济学的发展
传统经济学的假设及其局限性
两个基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机
博弈论与主流经济学的发展
博弈论研究的是:在策略性环境中如何进 行策略性决策和采取策略性行动的科学。 当成果无法由个体完全掌握,而结局须视 群体共同决策而定时,个人为了取胜,应 该采取什么策略
博弈论成为通用方法论,经济学、政治学、 管理、军事、外交、国际关系、公共选择、 犯罪学
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论:专门研究博弈如何出现均衡的规 律的学问
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论要点
博弈论的基本概念包括:参与人、参与人的策 略、参与人的支付(效用)
博弈有不同的种类:
从行动顺序角度:
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按
这是一个“多劳不多得,少劳不少得”的均衡
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论与主流经济学的发展
传统经济学的假设及其局限性
两个基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机
博弈论与主流经济学的发展
博弈论研究的是:在策略性环境中如何进 行策略性决策和采取策略性行动的科学。 当成果无法由个体完全掌握,而结局须视 群体共同决策而定时,个人为了取胜,应 该采取什么策略
博弈论成为通用方法论,经济学、政治学、 管理、军事、外交、国际关系、公共选择、 犯罪学
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论:专门研究博弈如何出现均衡的规 律的学问
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论要点
博弈论的基本概念包括:参与人、参与人的策 略、参与人的支付(效用)
博弈有不同的种类:
从行动顺序角度:
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
德语 3 ,2
法语 1,1
法语
2018/11/23
0,0
中南财经政法大学信息学院
2,3
4
例2、性别博弈 Battle of sexes
girl
足球 芭蕾
足球
2,1
0 ,0
boy
芭蕾
2018/11/23
-1,-1
1,2
中南财经政法大学信息学院 5
纳什均衡____哲学思考
•
如果一个博弈问题的所有博弈方事前 能达成一个“协议”,并在没有外部强 制的情况下,每个博弈方都有积极性遵 守这个“协议”。那么,这个协议就是 纳什均衡。
例4、性别博弈
小莉
大海
足球 (2,1) (-1,-1)
中南财经政法大学信息学院
芭蕾 (0,0) (1,2)
31
足球 芭蕾
2018/11/23
(二)纳什均衡与重复剔除的占优均衡
占优均衡肯定是纳什均衡,但反过来纳什均 衡不一定是占优均衡,因此占优均衡是比纳 什均衡更强、稳定性更高的均衡概念。只是, 占优均衡在博弈问题中的普遍性比纳什均衡要
2018/11/23
中南财经政法大学信息学院
8
五、纳什均衡
定义:在博弈G={s1,…,sn;u1,…,un}中,如果各博弈方 i的某策略si*与其他博弈方的策略s-i*组成策略组合 (si*, s-i*),且任一博弈方i的策略si*都是对其余博 弈方策略s-i*的最佳反应。
* * 即:ui (si* , s ) u ( s , s i i i i )
例1、性别博弈
小莉 大海 足球 足球 (2,1) 芭蕾 (0,0)
芭蕾
(-1,-1)
(1,2)
分析: A.如果大海选足球,小莉的“相对优势策略”也是足 球,这比她选芭蕾好,这是在小莉的盈利值1下划 线。
2018/11/23 中南财经政法大学信息学院 16
如果大海选芭蕾,小莉的“相对优势策略” 也一定是芭蕾,这时将右下方格中盈利值2下 划线。 B. 如果小莉选足球,大海的“相对优势策略” 是足球,这时,在大海的盈利矩阵左上格中 盈利值2下划线。 如果小莉选芭蕾,大海的“相对优势策略” 也是芭蕾,因而在右下格其盈利值2下划线。 当双方的相对优势策略确定后,哪个格子里面两 个数字都被被划线,那么这个格中所对应的 相对优势策略组合就是一个纳什均衡。
0,0
1,1 0,0
R2
R3
2018/11/23
中南财经政法大学信息学院
24
纳什均衡(Nash Equilibrium)的理解
•纳什均衡-是一种“僵局”,给定别人不改变策 略的情况下,没有人有兴趣改变。 •囚徒困境是西方经济学中个人理性与集体理性冲 突的一个例证。
2018/11/23
中南财经政法大学信息学院
按 按 等待 5,1 9,-1 等待 4,4 0,0
这个博弈中,大猪的最优选择依赖 于小猪的选择,但小猪的最优选择 与大猪的选择无关。如果大猪知道 小猪的理性的,大猪将选择“按”。 均衡是“大猪按,小猪等待”。 “劣”策略:无论对方选择什么,如果 自己选择A得到的总是收益小于选择 B得到的收益,A就是相对于B的劣 策略。
2018/11/23 中南财经政法大学信息学院 27
例1:博弈G如右
博弈方Ⅱ 左 中 右
博弈方 Ⅰ
上 下
1,0
0,4
1,3
0,2
0,1
0,0
纳什均衡为(上,中)
2018/11/23 中南财经政法大学信息学院 28
例2、囚徒困境
乙 甲 坦白
坦白 (-8,-8)
抵赖 (0,-15)
抵赖
(-15,0)
2018/11/23 中南财经政法大学信息学院 10
纳什均衡举例
• 例如——广告博弈
战略 做广告
企业2
做广告 不做广告 4,4 15,1 10,10
企业1
不做广告 1,15
• 纳什均衡:(做广告,做广告)
2018/11/23 中南财经政法大学信息学院 11
经典案例三——斗鸡博弈
B
进 A 独木桥
小莉
大海
足球 芭蕾
2018/11/23
足球
(2,1) (-1,-1)
芭蕾
(0,0) (1,2)
13
中南财经政法大学信息学院
(一)Nash均衡的基本求解法
1、划线法 基本思想——博弈方先找出自己针对其
他博弈方每种策略或策略组合的最佳对策,即 自己的可选策略中与其他博弈方的策略或策略 组合配合,给自己带来最大得益的策略,然后 在此基础上,通过对其他博弈方策略选择的判 断,包括对其他博弈方对自己策略判断的判断 等,预测博弈的可能结果和确定自己的最优策 略。
25
2、箭头法
• 基本思路——对博弈中的每个策略组合进行 分析,考察在每个策略组合处各个博弈方能 否通过单独改变自己的策略而增加盈利,如 能,则从所分析的策略组合对应的盈利数组 引一箭头,到改变策略后策略组合对应的盈 利数组,最后综合对每个策略组合的分析情 况,只有指向、无指离的策略组合形成对博 弈的结果。
2018/11/23
中南财经政法大学信息学院
19
例4:博弈G如右图: 博弈方Ⅱ 左 1,0 0,4 中 1,3 0,2 右 0,1 0,0
解:该博弈的纳什均衡为(中,上)。
2018/11/23
中南财经政法大学信息学院
20
例5:博弈G如下图: L 博弈方Ⅱ M 1,6 R 1,8
U 博弈方Ⅰ S D
2018/11/23
中南财经政法大学信息学院
6
• 假设n个人参与博弈,给定其他博弈方策略的 条件下,每个博弈方选择自己的最优策略。 纳什均衡指的是“由所有博弈方的最优策略 组成的一个组合” • n个人制订了一个协议,这n个人是否能自愿 遵守?他们会自觉遵守,这个协议就构成一 个纳什均衡。 • 如果一个协议不构成纳什均衡,它就不可能 自动实施,而需要外力胁迫,这就是无所谓 的“协议”
纳什均衡与一致预期
• 纳什均衡:所有博弈方的最优策略的组合:给定 该策略中别人的选择,没有人有积极性改变自己 的选择。 • 一致预期:基于信念的选择是合理的;支持选择 的信念是正确的; • 预期的自我实现:如果所有人认为这个结果会出 现,这个结果就一定会出现。预期是自我实现的, 预期不会错误。如果你认为我预期你将选择X, 你就真的会选择X。
2018/11/23 中南财经政法大学信息学院 22
军备考虑为扩军、有限军备、不设防,那么G为:
B A
扩军 (-2000,-2000)
有限 (-1600,-1500)
裁军 (8000,-∞)
扩军
有限
裁军
(-1500,-1600)
(-∞,8000)
(-500,-500)
(-∞,9500)
(9500,-∞)
• 纳什均衡 ������ 构成纳什均衡的策略一定是重复剔除严格 劣策略过程中不会被剔除的策略。 ������ 许多不存在占优策略均衡或重复剔除的占 优均衡的博弈却存在纳什均衡。 • 小结与思考: ������ 三种均衡的概念:占优均衡——重复剔除 的占优均衡——纳什均衡 三种均衡是什么关系
差得多。
重复剔除的占有均衡和纳什均衡之间的关 系要复杂一些,关键是这两者之间是否存在相 容性,即严格劣策略反复消去法是否会消去纳 什均衡,对于纳什均衡和重复剔出的占优均衡 的关系,下面的两个命题基本上给出了我们所 希望的答案。
2018/11/23 中南财经政法大学信息学院 32
Nash均衡的特质
1)一致预测性 “一致”——各博弈方的实际行为选择 与他们的预测一致。 2)与重复剔出的占优均衡的关系 ① 若G={s1,…,sn;u1,…,un},通过严格劣策 反复消去法排除了除(s1*,…,sn*)之外的 所有策略组合,那么(s1*,…,sn*)一定是 该博弈唯一的Nash均衡。 ② 若G={s1,…,sn;u1,…,un},如果 (s1*,…,s2*)是G的一个Nash均衡,那么 2018/11/23 33 中南财经政法大学信息学院 严格劣策反复消去法 一定不会将它剔除。
2018/11/23 中南财经政法大学信息学院 14
• 具体方法——对其他博弈方的任一策略组合, 找出博弈方i的最佳策略,并在其得益值下划 一小横线;若存在一个这样的策略组合,所 有博弈方的得益值下都划了线,则该组策略 组合就是该博弈的一个纳什均衡。
2018/11/23
中南财经政法大学信息学院
15
经典案例三——斗鸡博弈
B
进 A 独木桥 进 退
退
-3,-3
2, 0
0, 2
0, 0
对于相当多的博弈,我们无法运用重复剔除劣战略的方 法找出均衡解。
显然为了找出这些博弈的均衡解,需要引入纳什均衡。
2018/11/23 中南财经政法大学信息学院 3
斗鸡博弈:对诸多现象的解释
• 例1、选课博弈
钟信 陈明 德语
2018/11/23 中南财经政法大学信息学院 17
例2、囚徒困境博弈
乙
招
Байду номын сангаас
不招
0,-15 -1,-1
招
甲 不招
-8,-8 -15,0
(问题1:甲、乙如何选择?)
2018/11/23 中南财经政法大学信息学院 18
例3—“智猪博弈”(boxed pigs)
• 有些博弈没有占优均衡,但通过剔除“劣”策略,我 们可以预测博弈的结果;还可以通过“纳什均衡”预 测博弈的结果。如“智猪博弈”
(si* si )
则称(si*, s-i*)为该博弈的一个Nash均衡
特别,当且仅当(si*, s-i*)是Nash均衡,且对所 有纯策略si(si≠si*)有ui (si*, s-i*)> ui(si, s-i*), 又称(si*, s-i*)是严格(强)Nash均衡。