《经济博弈论》PPT课件
合集下载
复旦大学经济博弈论课件--经济博弈论242页PPT

30.11.2019
课件
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低 价”。
上策均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,必然是该博弈 比较稳定的结果
课件
17
竞争:个体利益最大化
q1R 1(q2,q3)4 81 2q21 2q3
11 q2R 2(q 1,q3)4 82q 12q3 q 3R 3(q 1,q2)4 81 2q 11 2q2
q1 *q2 *q3 *24 u1*u2 *u3 *576
Q*72
u*1728
21
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈G {S1, Sn;u1, un中},博弈方 i的策略
空间为 Si {si1, sik},则博弈方 i以概率分布 pi (pi1, pik)
随机在其 k个可选策略中选择的“策略”,称为一个“混合策
略”,0其p中ij 1 j1, 对,k
u 1 u 1 ( P 1 ,P 2 ) P 1 q 1 c 1 q 1 ( P 1 c 1 ) q 1 (P 1 c 1 )a 1 ( b 1 P 1 d 1 P 2 )
u 2 u 2 ( P 1 ,P 2 ) P 2 q 2 c 2 q 2 ( P 2 c 2 ) q 2 (P 2 c 2 )a 2 ( b 2 P 2 d 2 P 1 )
上策均衡不是普遍存在的
30.11.2019
课件
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
经济博弈论.PPT谢识予46页PPT

26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。——卢梭
▪
27、只有把抱怨环境的心情,化为上进的力量,才是成功的保证。——罗曼·罗兰
▪
28、知之者不如好之者,好之者不如乐之者。——孔子
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇
▪
30、意志是一个强壮的盲人,倚靠在明眼的跛子复何如。 42、夏日长抱饥,寒夜无被眠。 43、不戚戚于贫贱,不汲汲于富贵。 44、欲言无予和,挥杯劝孤影。 45、盛年不重来,一日难再晨。及时 当勉励 ,岁月 不待人 。
▪
谢谢!
46
经济博弈论168页PPT

位博弈论专 家纳什、泽尔腾和海萨尼。 2019年诺奖授予两位博弈论与信息经济学研究 专家莫里斯、维克瑞; 2019年诺奖授予阿克洛夫、斯彭斯、斯蒂格利 茨,表彰他们在柠檬市场、信号传递和信号 甄别等非对称信息理论研究中的开创性贡献。 2019年诺奖授予有以色列和美国双重国籍的罗 伯特·奥曼和美国人托马斯·谢林,以表彰他们 在博弈论领域作出的贡献。
2
经典博弈论
合作博弈强调群体理性(group rationality),就是从群体的角度 考虑策略的选择,使得整体收益 最大。所以合作博弈研究的是参 与者在达成合作时如何分配合作 得到的收益,即收益分配问题。
约翰·冯·诺依曼 (J. von Neumann )
《Theory of games and economic behavior》 (1944)
争当少数者博弈
6
智猪博弈
小猪和大猪住在猪圈的一边(食槽在这里),开启食物的 开关在另一头,谁去踩,谁丧失先机。如何小猪去踩开关, 等小猪回来的时候大猪已经把大部分食物吃完。如果大猪 去踩开关,等大猪回来的时候小猪已经把一半的食物吃完。
对于小猪来说,最佳策略是等待大猪去踩开关,然后“搭 便车”获得小部分食物。然而,当大猪不去踩开关的时候, 小猪也要冒风险去踩开关。例如腾讯毫无顾忌地跟风,做 QQ旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技 术研发的前期搞定了,大猪们只需要悄悄跟随,适当的时 候踢开挡路的,就可以了。
组合。此时,每一个理性的参与者都不会有单独改变策略,因为
当其他人不改变策略时如果他改变策略他的收益将会降低 。
例如:在两人合作博弈中,当参与者A采取其最优策略a*,参与者B也采取其 最优策略b*,如果B仍采取b*,而A却采取另一种策略a,那么A的收益不会超 过他采取原来的策略a*的收益。这一结果对B亦是如此。
2
经典博弈论
合作博弈强调群体理性(group rationality),就是从群体的角度 考虑策略的选择,使得整体收益 最大。所以合作博弈研究的是参 与者在达成合作时如何分配合作 得到的收益,即收益分配问题。
约翰·冯·诺依曼 (J. von Neumann )
《Theory of games and economic behavior》 (1944)
争当少数者博弈
6
智猪博弈
小猪和大猪住在猪圈的一边(食槽在这里),开启食物的 开关在另一头,谁去踩,谁丧失先机。如何小猪去踩开关, 等小猪回来的时候大猪已经把大部分食物吃完。如果大猪 去踩开关,等大猪回来的时候小猪已经把一半的食物吃完。
对于小猪来说,最佳策略是等待大猪去踩开关,然后“搭 便车”获得小部分食物。然而,当大猪不去踩开关的时候, 小猪也要冒风险去踩开关。例如腾讯毫无顾忌地跟风,做 QQ旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技 术研发的前期搞定了,大猪们只需要悄悄跟随,适当的时 候踢开挡路的,就可以了。
组合。此时,每一个理性的参与者都不会有单独改变策略,因为
当其他人不改变策略时如果他改变策略他的收益将会降低 。
例如:在两人合作博弈中,当参与者A采取其最优策略a*,参与者B也采取其 最优策略b*,如果B仍采取b*,而A却采取另一种策略a,那么A的收益不会超 过他采取原来的策略a*的收益。这一结果对B亦是如此。
复旦大学经济博弈论课件--经济博弈论536页

以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
d d x tx ( u y u ) x (x x 2 ) x 2 ( 1 x ) x 2 x 3
22.03.2020
课件
14
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
22.03.2020
其中abcd可以是任何得益,根据问题设定。
22.03.2020
课件
17
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
d d x tx(u 1 u )x[u 1x1u (1x)u 2] x(1x)u (u) x(1x)x[(ac)(1x)b (d)]
复制动态 相位图
22.03.2020
x 课件
1
x
18
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
d x F (x ) x (1 x )x [ (a c ) (1 x )b ( d )] dt
22.03.2020
课件
3
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群0
课件
4
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型
d d x tx ( u y u ) x (x x 2 ) x 2 ( 1 x ) x 2 x 3
22.03.2020
课件
14
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
22.03.2020
其中abcd可以是任何得益,根据问题设定。
22.03.2020
课件
17
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
d d x tx(u 1 u )x[u 1x1u (1x)u 2] x(1x)u (u) x(1x)x[(ac)(1x)b (d)]
复制动态 相位图
22.03.2020
x 课件
1
x
18
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
d x F (x ) x (1 x )x [ (a c ) (1 x )b ( d )] dt
22.03.2020
课件
3
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群0
课件
4
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型
经济博弈论ppt课件

• 例二:黔馿之技
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
第六章、合作博弈 《经济博弈论基础》PPT课件

与摩根斯特恩提出来的概念,有时被 记为VN-M解。记所有可能分配组成的集合为E(V),则稳定 集定义如下:
• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。
• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。
《经济博弈论》PPT课件

13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
经济博弈论概述(ppt 242页)

著名经济学家泰勒尔(Jean Tirole)说: “正 如理性预期使宏观经济学发生革命一 样,博弈论广泛而深远地改变了经济学 家的思维方式”
如果情况确实如此,对今天的经济学家来说 ,不懂得博弈论显然是不行了。
博弈论为何如此热门?
诺贝尔经济学奖偏爱博弈论研究
1994年诺贝尔经济学授予 约翰·纳什 约翰·海萨尼 莱因哈德·泽尔腾
如个体厂商为了获得更高利润,期待通过集团形成卖方 垄断;
消费者为了寻求更低的价格,期待通过集团形成买方垄 断;
工人们为了得到更高的工资待遇,期待通过工会形成讨 价还价的势力等等。
以夏普利值为例来看合作问题
例题1
假定某议会共有100个席位,议员分属4个党派 :红党43席,蓝党33席,绿党16席,白党8席;
2012年:诺贝尔经济学奖授予 埃尔文·罗斯(Alvin Roth) 罗伊德·夏普利(Lloyd Shapley)。
埃尔文·罗斯(Alvin E.Roth) 罗伊德·夏普利(Lloyd S.Shapley)
他们的贡献:
稳定的匹配理论与市场设计的实践
经济学是研究资源最优配置问题的,而真实世界 里配置资源的方式多种多样,市场、价格机制是 经济学研究最多的。
一般观点认为合作博弈理论要比非合作博弈理论更为重要, 因为,如果人们的合作是有利可图的,参与博弈的理性人怎 么会放弃合作而采取非合作态度呢?
我们知道,在任何真实的博弈局势中,无论合 作博弈还是非合作博弈,如果我们仔细地考察 人们为达成一个协议而能做什么的话,那么原 则上我们就应该有可能把它模型化,然后通过 分析这个博弈的均衡(解)来预测其结果。
1996年诺贝尔经济学授予
威廉·维克瑞 詹姆斯·莫里斯
2001年诺贝尔经济学授予
第五经济博弈论 PPT

进化稳定策略得检验
比例的博弈方偏离“同意”策略选择了“不同意” uy (1 )1 0 1 un (1 ) 0 0 0 u (1 )u y un (1 )2
因为 uy 1 0 且接近于1,因此犯错误博弈方得期
望得益远远低于没有犯错误得博弈方,也远低于群体平均得益, 因此犯错误得博弈方会逐步改正错误,最终仍然会趋向于x=1, 即所有博弈方都采用“同意”策略。
签协议博弈:
同意 不同意
博弈方2
同意
不同意
1,1
0,0
0,0
0,0
两个纯策略纳什均衡:(同意,同意),(不同意,不同意), 前一个纳什均衡帕累托优于后一个纳什均衡。假如就是在完全理 性得基础上进行该博弈,可以预期结果就是(同意,同意)。
下面就是在理性层次较低得有限理性博弈方组成得大群体成员 随机配对反复博弈得分析框架内进行分析。
因此x 1是在上述复制状态下的一个进化稳定策略ESS
进化稳定策略得检验
比例的博弈方偏离“不同意”策略选择了“同意”
uy (1 ) 0 1 un (1 ) 0 0 0 u (1 ) un uy 2
uy 0 un
x 0不是进化稳定策略
5、3、2一般两人对称博弈复制动态 与进化稳定策略
5、3、1 签协议博弈得复制动态与进化稳定策略
签协议博弈:
同意 不同意
博弈方2
同意
不同意
1,1
0,0
0,0
0,0
假设群体中采用“同意”博弈方得比例x,则不同策 略期望得益与平均得益为:
uy x 1 (1 x) 0 x un x 0 (1 x) 0 0 u x u y(1 x) un x2
只要博弈方有基本得、包括直觉与经验得判断能力, 早晚会发现上述得益差异,得益较差类型得博弈方或早或 迟会发现改变策略对自己就是有利得,并开始模仿另一种 类型得博弃方。
西方经济学博弈论全解ppt课件.ppt

小猪的最优策略:等待 大猪无最优策略:即大猪的最优策略是依赖于 小猪的策略
此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按
这是一个“多劳不多得,少劳不少得”的均衡
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论与主流经济学的发展
传统经济学的假设及其局限性
两个基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机
博弈论与主流经济学的发展
博弈论研究的是:在策略性环境中如何进 行策略性决策和采取策略性行动的科学。 当成果无法由个体完全掌握,而结局须视 群体共同决策而定时,个人为了取胜,应 该采取什么策略
博弈论成为通用方法论,经济学、政治学、 管理、军事、外交、国际关系、公共选择、 犯罪学
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论:专门研究博弈如何出现均衡的规 律的学问
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论要点
博弈论的基本概念包括:参与人、参与人的策 略、参与人的支付(效用)
博弈有不同的种类:
从行动顺序角度:
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按
这是一个“多劳不多得,少劳不少得”的均衡
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论与主流经济学的发展
传统经济学的假设及其局限性
两个基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机
博弈论与主流经济学的发展
博弈论研究的是:在策略性环境中如何进 行策略性决策和采取策略性行动的科学。 当成果无法由个体完全掌握,而结局须视 群体共同决策而定时,个人为了取胜,应 该采取什么策略
博弈论成为通用方法论,经济学、政治学、 管理、军事、外交、国际关系、公共选择、 犯罪学
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论:专门研究博弈如何出现均衡的规 律的学问
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论要点
博弈论的基本概念包括:参与人、参与人的策 略、参与人的支付(效用)
博弈有不同的种类:
从行动顺序角度:
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
《经济博弈论》教材教学课件

略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖
寡头市场厂商的产量决策;市场开发竞争中策略较量和策 略依存;投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦 政治、军事和社会的决策较量 博弈论不能称作游戏理论,也不完全称作对策论
1.1.2 一个非技术性定义
企业之间相互沟通信誓旦旦,价格战仍然会爆发;美 苏两国经常会晤,甚至签订核不扩散条约,但军费一年 高过一年。这些现象都反映了上面所说明的问题。
囚徒困境说明了什么?
在(坦白、坦白)这个组合中,囚徒1和囚徒2都不 能通过单方面的改变行动增加自己的收益,于是谁 也没有动力游离这个组合,因此这个组合是纳什均 衡。
《经济博弈论》教材 教学课件
第一章 导论
本章介绍博弈论的基本概念,包括什么 是博弈和博弈论,给出一些经典博弈例子。 对博弈分类和博弈理论的结构作一些讨论, 对博弈论的发展历史等作简单介绍。目标是 让读者对博弈论的内容和博弈模型有更直观 的概念和印象,本教材的基本内容,以及博 弈分析的基本思想方法等形成初步的认识, 为后面各章展开详细分析作好铺垫和准备。
定义:博弈就是一些个人、队组或其他组织,面对一 定的环境条件,在一定的规则下,同时或先后,一次 或多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
四个核心方面
博弈的参加者(Player)——博弈方(单人、两人和多人)
各博弈方的策略(Strategies)或行为(Actions) (有 限策略、无限策略)
有人提出:利用囚徒困境解决反腐败 问题。个体理性与团体理性的矛盾。
囚徒 2
坦白
不坦白
囚坦白 徒 1
不坦白
寡头市场厂商的产量决策;市场开发竞争中策略较量和策 略依存;投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦 政治、军事和社会的决策较量 博弈论不能称作游戏理论,也不完全称作对策论
1.1.2 一个非技术性定义
企业之间相互沟通信誓旦旦,价格战仍然会爆发;美 苏两国经常会晤,甚至签订核不扩散条约,但军费一年 高过一年。这些现象都反映了上面所说明的问题。
囚徒困境说明了什么?
在(坦白、坦白)这个组合中,囚徒1和囚徒2都不 能通过单方面的改变行动增加自己的收益,于是谁 也没有动力游离这个组合,因此这个组合是纳什均 衡。
《经济博弈论》教材 教学课件
第一章 导论
本章介绍博弈论的基本概念,包括什么 是博弈和博弈论,给出一些经典博弈例子。 对博弈分类和博弈理论的结构作一些讨论, 对博弈论的发展历史等作简单介绍。目标是 让读者对博弈论的内容和博弈模型有更直观 的概念和印象,本教材的基本内容,以及博 弈分析的基本思想方法等形成初步的认识, 为后面各章展开详细分析作好铺垫和准备。
定义:博弈就是一些个人、队组或其他组织,面对一 定的环境条件,在一定的规则下,同时或先后,一次 或多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
四个核心方面
博弈的参加者(Player)——博弈方(单人、两人和多人)
各博弈方的策略(Strategies)或行为(Actions) (有 限策略、无限策略)
有人提出:利用囚徒困境解决反腐败 问题。个体理性与团体理性的矛盾。
囚徒 2
坦白
不坦白
囚坦白 徒 1
不坦白
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法
h
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方的某 个策略给他带来的得益始终高于其它的策略, 至少不低于其他策略
不难理解,上述“某个策略”必然是该博弈方愿意选 择的策略。
例如囚徒困境博弈中的“坦白”、双寡头削价中“低 价”,就是这样的策略(对两个博弈方都成立)。
博 弈 方上 1
博弈方2 左中
1,0 1,3
h
15
严格下策反复消去法在分析许多博弈时都能应用,特 别是有些博弈不存在上策均衡,但却存在某些严格下 策,所以一般来讲,严格下策反复消去法的适用范围 要比上策均衡分析大一些。
但是严格下策反复消去法不能解决所有的博弈分析问 题,存在一定缺陷: (1)有些博弈无严格下策;如抛硬币博弈。 (2)即使有严格下策,也只可能消去一部分。
➢ 排除的思路,也就是所谓的排除法,就是其中最常运用的一种。排除法 与选择法在形式上正好相反,它是通过对可选策略的相互比较,把不可 能采用的较差策略排除掉,从而筛选出较好的策略,或者至少缩小候选 策略的范围。
➢ 由此导出了博弈分析中的严格下策反复消去法。
h
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各 自两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
h
12
❖严格下策:不管其他博弈方的策略如何变化,一个
博弈方的某种策略给他带来的得益,总是比另一种策略
给他带来的得益要小,那么我们称前一种策略为相对于 后一种策略的一个“严格下策”。
寡 高价 头 1 低价
寡头2
高价
低价
100,100
20,105
150,20
70,70
双寡头的得益矩阵
h
6
上策均衡:一个博弈的某个策略组合中的所有策略 都是各个博弈方各自的上策,那么这个策略组合 肯定是所有博弈方都愿意选择的,必然是该博弈 比较稳定的结果,称这样的策略组合为该博弈的 一个“上策均衡”。
h
17
根据这种思想,科学的决策思路应该是:
先找出自己针对其他博弈方每种策略或策略组合配 合,给自己带来最大得益的策略(这种相对最佳对 策总是存在的,不过不一定惟一);
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
h
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博
弈方的得益既取决于自己选择的策略,还与其他博弈 方选择的策略有关,因此,博弈方在决策时必须考虑 其他博弈方的存在和策略选择。
第二章 完全信息静态博弈
2.1 基本分析思路和方法 2.2 纳什均衡 2.3 无限策略博弈分析和反应函数 2.4 混合策略和混合策略纳什均衡 2.5 纳什均衡的存在性
h
1
完全信息静态博弈
各博弈方同时决策,且所有博弈方对各方 得益都了解。
属于非合作博弈中最基本的类型。
h
2
2.1 基本分析思路和方法
➢ 上策均衡并不是普遍存在,不能解决所有的博弈 问题,是博弈论的价值所在
h
8
例:齐威王田忌赛马——不存在上策均衡
田忌
上中下
齐 上下中 威 中上下 王 中下上
下上中 下中上
上 中 下
3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
上 下 中
1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
绝对偏好的上策。
h
9
例:智猪博弈
大猪
踩踏 等待
小猪 踩踏 等待
5,1 9,-1
4,4 0,0
h
10
2.1.2 严格下策反复消去法
一、思路和原理
➢ 上策均衡分析的思路采用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种的思路。
➢ 实际上,选择是指人们在决策活动所运用的一种策略思路而不是全部的 决策思路,人们在决策活动中还会采用另外的决策思路。
h
13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
h
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博
弈上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
h
4
例:囚徒困境中的“坦白”
上策:不管其他博弈方选择什么策略,一博弈方的某个策略给他带来 的得益始终高于其他的策略,至少不低于其他策略。
囚徒 乙
坦白Leabharlann 不坦白囚 坦白 徒 甲不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
h
5
例:双寡头削价中“低价”
上策:不管其他博弈方选择什么策略,一博弈方的某个策略给他带来 的得益始终高于其他的策略,至少不低于其他策略。
例如:囚徒困境博弈中的(坦白,坦白)就是一 个上策均衡。
h
7
➢ 注意:
➢ 上策均衡是博弈分析最基本的均衡概念之一,是 博弈分析最基本的分析方法
➢ 上策均衡反映了所有博弈方的绝对偏好,因此非 常稳定,根据上策均衡可以对博弈结果做出最肯 定的预测
➢ 博弈分析时首先判断各博弈方是否都有上策,是 否存在上策均衡
中 上 下
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
中 下 上
1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
下 上 中
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
下 中 上
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
得益矩阵
因为各个博弈方的任何策略都不是绝对最优的,每个博弈方没有
❖严格下策反复消去法步骤:
找出某博弈方的某策略是相对于他的其他某些策略 的严格下策,将它从该博弈方的策略空间中去掉
在该博弈方余下的策略空间和其他博弈方的策略构 成的策略组合中,检查是否还存在严格下策,如有, 则再将其从相应博弈方的策略空间中去掉,如此反复, 直到找不出任何严格下策
如果最后只有唯一的一个策略组合幸存下来,则它 一定就是该博弈的解
h
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方的某 个策略给他带来的得益始终高于其它的策略, 至少不低于其他策略
不难理解,上述“某个策略”必然是该博弈方愿意选 择的策略。
例如囚徒困境博弈中的“坦白”、双寡头削价中“低 价”,就是这样的策略(对两个博弈方都成立)。
博 弈 方上 1
博弈方2 左中
1,0 1,3
h
15
严格下策反复消去法在分析许多博弈时都能应用,特 别是有些博弈不存在上策均衡,但却存在某些严格下 策,所以一般来讲,严格下策反复消去法的适用范围 要比上策均衡分析大一些。
但是严格下策反复消去法不能解决所有的博弈分析问 题,存在一定缺陷: (1)有些博弈无严格下策;如抛硬币博弈。 (2)即使有严格下策,也只可能消去一部分。
➢ 排除的思路,也就是所谓的排除法,就是其中最常运用的一种。排除法 与选择法在形式上正好相反,它是通过对可选策略的相互比较,把不可 能采用的较差策略排除掉,从而筛选出较好的策略,或者至少缩小候选 策略的范围。
➢ 由此导出了博弈分析中的严格下策反复消去法。
h
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各 自两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
h
12
❖严格下策:不管其他博弈方的策略如何变化,一个
博弈方的某种策略给他带来的得益,总是比另一种策略
给他带来的得益要小,那么我们称前一种策略为相对于 后一种策略的一个“严格下策”。
寡 高价 头 1 低价
寡头2
高价
低价
100,100
20,105
150,20
70,70
双寡头的得益矩阵
h
6
上策均衡:一个博弈的某个策略组合中的所有策略 都是各个博弈方各自的上策,那么这个策略组合 肯定是所有博弈方都愿意选择的,必然是该博弈 比较稳定的结果,称这样的策略组合为该博弈的 一个“上策均衡”。
h
17
根据这种思想,科学的决策思路应该是:
先找出自己针对其他博弈方每种策略或策略组合配 合,给自己带来最大得益的策略(这种相对最佳对 策总是存在的,不过不一定惟一);
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
h
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博
弈方的得益既取决于自己选择的策略,还与其他博弈 方选择的策略有关,因此,博弈方在决策时必须考虑 其他博弈方的存在和策略选择。
第二章 完全信息静态博弈
2.1 基本分析思路和方法 2.2 纳什均衡 2.3 无限策略博弈分析和反应函数 2.4 混合策略和混合策略纳什均衡 2.5 纳什均衡的存在性
h
1
完全信息静态博弈
各博弈方同时决策,且所有博弈方对各方 得益都了解。
属于非合作博弈中最基本的类型。
h
2
2.1 基本分析思路和方法
➢ 上策均衡并不是普遍存在,不能解决所有的博弈 问题,是博弈论的价值所在
h
8
例:齐威王田忌赛马——不存在上策均衡
田忌
上中下
齐 上下中 威 中上下 王 中下上
下上中 下中上
上 中 下
3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
上 下 中
1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
绝对偏好的上策。
h
9
例:智猪博弈
大猪
踩踏 等待
小猪 踩踏 等待
5,1 9,-1
4,4 0,0
h
10
2.1.2 严格下策反复消去法
一、思路和原理
➢ 上策均衡分析的思路采用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种的思路。
➢ 实际上,选择是指人们在决策活动所运用的一种策略思路而不是全部的 决策思路,人们在决策活动中还会采用另外的决策思路。
h
13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
h
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博
弈上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
h
4
例:囚徒困境中的“坦白”
上策:不管其他博弈方选择什么策略,一博弈方的某个策略给他带来 的得益始终高于其他的策略,至少不低于其他策略。
囚徒 乙
坦白Leabharlann 不坦白囚 坦白 徒 甲不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
h
5
例:双寡头削价中“低价”
上策:不管其他博弈方选择什么策略,一博弈方的某个策略给他带来 的得益始终高于其他的策略,至少不低于其他策略。
例如:囚徒困境博弈中的(坦白,坦白)就是一 个上策均衡。
h
7
➢ 注意:
➢ 上策均衡是博弈分析最基本的均衡概念之一,是 博弈分析最基本的分析方法
➢ 上策均衡反映了所有博弈方的绝对偏好,因此非 常稳定,根据上策均衡可以对博弈结果做出最肯 定的预测
➢ 博弈分析时首先判断各博弈方是否都有上策,是 否存在上策均衡
中 上 下
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
中 下 上
1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
下 上 中
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
下 中 上
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
得益矩阵
因为各个博弈方的任何策略都不是绝对最优的,每个博弈方没有
❖严格下策反复消去法步骤:
找出某博弈方的某策略是相对于他的其他某些策略 的严格下策,将它从该博弈方的策略空间中去掉
在该博弈方余下的策略空间和其他博弈方的策略构 成的策略组合中,检查是否还存在严格下策,如有, 则再将其从相应博弈方的策略空间中去掉,如此反复, 直到找不出任何严格下策
如果最后只有唯一的一个策略组合幸存下来,则它 一定就是该博弈的解