经济博弈论.ppt
合集下载
第四章、贝叶斯博弈 《经济博弈论基础》PPT课件
b)
(v
b)n1(b)
最优化的一阶条件:
n1(b) (v b)(n 1)n2 (b) d(b) 0 db
vn1db (v b)(n 1)vn2dv 0
(vn1db bdvn1) n 1 dvn 0 n
b*(v) n 1 v n
二、拍卖与招第n价格密封招标
第一价格密封拍卖博弈分析 (1)考虑两个投标人 i=1, 2的情况:
vi——拍卖物品对投标人 i的价值
vi ∈[0,1] 均匀分布 bi≥0 ——投标人 i的出价
bi= bi(vi)严格递增可微函数
第一价格密封拍卖博弈分析
投标人1的期望支付为:
Eu1 (v1 b1) Pr ob(b2 b1) (v b) Pr ob(b2 b)
最优化的一阶条件:
[1 (b)]n1 (b c)(n 1)[1 (b)]n2 d(b) 0 db
均衡情况下, (b) c
(1 c)n1db (b c)(n 1)(1 c)n2 dc 0
第一价格密封招标博弈分析
(1 c)n1db (b c)(n 1)(1 c)n2 d (1 c) 0 (1 c)n1db [b 1 (1 c)](n 1)(1 c)n2 d (1 c) 0
1、拍卖制度与资源配置效率 2、收入等价定理
第四节 混合策略纳什均衡的重新解释
一、混合策略纳什均衡的不完全信息解释 Harsanyi (1973) 证明:完全信息静态博弈中的
混合策略纳什均衡可以解释为不完全信息静态博弈 中贝叶斯纳什均衡的极限。
第四节 混合策略纳什均衡的重新解释
二、混合策略纳什均衡的本质特征不在于局中 人j随机地选择行动,而在于局中人i不能确定局中人j 将选择什么纯策略,这种不确定性可能来自局中人i 不知道局中人j的类型。
经济博弈论168页PPT
位博弈论专 家纳什、泽尔腾和海萨尼。 2019年诺奖授予两位博弈论与信息经济学研究 专家莫里斯、维克瑞; 2019年诺奖授予阿克洛夫、斯彭斯、斯蒂格利 茨,表彰他们在柠檬市场、信号传递和信号 甄别等非对称信息理论研究中的开创性贡献。 2019年诺奖授予有以色列和美国双重国籍的罗 伯特·奥曼和美国人托马斯·谢林,以表彰他们 在博弈论领域作出的贡献。
2
经典博弈论
合作博弈强调群体理性(group rationality),就是从群体的角度 考虑策略的选择,使得整体收益 最大。所以合作博弈研究的是参 与者在达成合作时如何分配合作 得到的收益,即收益分配问题。
约翰·冯·诺依曼 (J. von Neumann )
《Theory of games and economic behavior》 (1944)
争当少数者博弈
6
智猪博弈
小猪和大猪住在猪圈的一边(食槽在这里),开启食物的 开关在另一头,谁去踩,谁丧失先机。如何小猪去踩开关, 等小猪回来的时候大猪已经把大部分食物吃完。如果大猪 去踩开关,等大猪回来的时候小猪已经把一半的食物吃完。
对于小猪来说,最佳策略是等待大猪去踩开关,然后“搭 便车”获得小部分食物。然而,当大猪不去踩开关的时候, 小猪也要冒风险去踩开关。例如腾讯毫无顾忌地跟风,做 QQ旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技 术研发的前期搞定了,大猪们只需要悄悄跟随,适当的时 候踢开挡路的,就可以了。
组合。此时,每一个理性的参与者都不会有单独改变策略,因为
当其他人不改变策略时如果他改变策略他的收益将会降低 。
例如:在两人合作博弈中,当参与者A采取其最优策略a*,参与者B也采取其 最优策略b*,如果B仍采取b*,而A却采取另一种策略a,那么A的收益不会超 过他采取原来的策略a*的收益。这一结果对B亦是如此。
2
经典博弈论
合作博弈强调群体理性(group rationality),就是从群体的角度 考虑策略的选择,使得整体收益 最大。所以合作博弈研究的是参 与者在达成合作时如何分配合作 得到的收益,即收益分配问题。
约翰·冯·诺依曼 (J. von Neumann )
《Theory of games and economic behavior》 (1944)
争当少数者博弈
6
智猪博弈
小猪和大猪住在猪圈的一边(食槽在这里),开启食物的 开关在另一头,谁去踩,谁丧失先机。如何小猪去踩开关, 等小猪回来的时候大猪已经把大部分食物吃完。如果大猪 去踩开关,等大猪回来的时候小猪已经把一半的食物吃完。
对于小猪来说,最佳策略是等待大猪去踩开关,然后“搭 便车”获得小部分食物。然而,当大猪不去踩开关的时候, 小猪也要冒风险去踩开关。例如腾讯毫无顾忌地跟风,做 QQ旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技 术研发的前期搞定了,大猪们只需要悄悄跟随,适当的时 候踢开挡路的,就可以了。
组合。此时,每一个理性的参与者都不会有单独改变策略,因为
当其他人不改变策略时如果他改变策略他的收益将会降低 。
例如:在两人合作博弈中,当参与者A采取其最优策略a*,参与者B也采取其 最优策略b*,如果B仍采取b*,而A却采取另一种策略a,那么A的收益不会超 过他采取原来的策略a*的收益。这一结果对B亦是如此。
经济博弈论第2章(23) ppt课件
4 1
如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
uG 1, 4 1 uG 0,
0.2
PPT课件
18
• 解二: 支付等值法
如果一个混合策略是政府的最优选择,那一定意
味着流浪汉在寻找工作与游闲之间是无差异的,
即:
流浪汉
找工作
游荡
政府 救济 不救济
3,2 -1 , 1
-1 , 3 0,0
uL 1, 1 3 uL 0,
0.5
PPT课件
19
五、混合战略纳什均衡
• 对 * 0.2 的解释: • 如果流浪汉找工作的概率小于0.2, 则政府选择不
救济,如果大于0.2,政府选择救济 ,只有当概率等 于0.2时,政府才会选择混合战略或任何纯战略. • 对 * 0.5 的解释 • 如果政府救济的概率大于0.5,流浪汉的最优选择 是流浪,如果政府救济的概率小于0.5,流浪汉的最 优选择是寻找工作.
1 , -1 -1 , 1
假设A出红牌的概率为 p;B出红牌的概率为 q ;则
U A( p, q) 2 p(1 2q) (2q 1)
因此A的最佳反应函数为
p 1
0, 当q 1/ 2
p [0,1],当q 1/ 2
1, 当q 1/ 2
PPT课件
0
1/2
1 q 27
第二章 完全信息静态信息博弈-纳什均衡
一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡 五 混合战略纳什均衡 六 纳什均衡存在性及相关讨论
PPT课件
经济博弈论ppt课件
• 例二:黔馿之技
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
《复旦大学--经济博弈论》-公开课件
n 克劳鳆和索贝尔采用的一种随机选择的混合策 略可以克服这种问题。
1/26/2020
复旦大学经济博弈论课件
部分合并完美贝叶斯均衡的区间划分和数量
n两区间部分合并均衡区间长度不等长, =0.5-2b,前一 个区间的长度是 -0 = 0.5-2b,后一个区间的长度为1- = 0.5+2b,后一个区间长4b。 n结论对更多区间的部分合并均衡也成立。n区间,[ , ) 是之一,长度为c,行为方对该区间类型最优行为( + )/2 ,对后一区间[ , )类型的最佳行为( + )/2。两个区间 交界处类型声明方偏好的行为,须在( + )/2和( + )/2 间无差异:
1/26/2020
复旦大学经济博弈论课件
8.1.1 不完全信息动态博弈问题
n 古玩市场等各种议价博弈 n 不完全信息先后选择产量的寡头市场产量博弈 n 彩礼问题 n 广告对消费者的影响 n 学历、成绩在招聘人才、员工中的作用 n 投保人寿保险前的体检 n 学生考试前和毕业论文中的诚信承诺
1/26/2020
声明方 类型
2,0 1,1 1,1 2,0
不能传递信息(声明方 与行为方偏好相反)
1/26/2020
1. 不同类型的声明方必须偏好行为方不同行为 2. 对应声明方不同类型行为方必须偏好不同行为 3. 行为方的偏好必须与声明方具有一致性
复旦大学经济博弈论课件
离散型声明博弈模型
1/26/2020
复旦大学经济博弈论课件
第八章 不完全信息动态博弈
本章讨论不完全信息动态博弈,也就是动 态贝叶斯博弈。动态贝叶斯博弈与静态贝叶斯 博弈在许多方面是相似的,差别只是动态贝叶 斯博弈转化成的不是两阶段有同时选择的特殊 不完美信息动态博弈,而是更一般的不完美信 息动态博弈,因此可以直接利用不完美信息动 态博弈的均衡概念进行分析。本章主要介绍信 息传递条件、机制和效率方面的模型。
第六章、合作博弈 《经济博弈论基础》PPT课件
与摩根斯特恩提出来的概念,有时被 记为VN-M解。记所有可能分配组成的集合为E(V),则稳定 集定义如下:
• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。
• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。
《经济博弈论》PPT课件
13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
经济博弈论
3
非合作博弈强调个体理性
(individual rationality),就是
从个体的角度考虑策略选择,使得
个体收益最大。所以非合作博弈研
究的是参与者在利益相互影响的情
况下如何选策略使自己的收益最大,
即策略选择问题。
约翰·纳什 (J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。
1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体(可以是个人,也可以是团体);
2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策;
3、策略是指参与人选择行动的规则,即在博弈 进程中,什么情况下选择什么行动的预先安排;
第一节 引言
1
博弈理论简介
博弈论(Game Theory):研究具有斗争或竞争性质现象的理 论和方法。
三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集
分类: 合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈;
研究博弈论的意义:理解人类的经济行为;理解社会和生态 物种系统中的合作行为以及自自组织斑图。
13
从游戏到博弈
游戏的特点:下棋,打牌,赌博,田径, 球类等等,共同的特点是策略
策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略和 利益的依存性
14
想一想
假如你正跟恋人用手机通电话,突 然信号断了。这时,你会立即拨电话 过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,取 决于你的恋人是否会拨过来。如果你 们其中一方要拨,那么另一方最好是 等待;如果一方等待,那么另一方就 最好是拨过去。因为如果双方都拨, 那么就会出现线路忙;如果双方都等 待,那么时间就会在等待中流逝。
非合作博弈强调个体理性
(individual rationality),就是
从个体的角度考虑策略选择,使得
个体收益最大。所以非合作博弈研
究的是参与者在利益相互影响的情
况下如何选策略使自己的收益最大,
即策略选择问题。
约翰·纳什 (J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。
1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体(可以是个人,也可以是团体);
2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策;
3、策略是指参与人选择行动的规则,即在博弈 进程中,什么情况下选择什么行动的预先安排;
第一节 引言
1
博弈理论简介
博弈论(Game Theory):研究具有斗争或竞争性质现象的理 论和方法。
三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集
分类: 合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈;
研究博弈论的意义:理解人类的经济行为;理解社会和生态 物种系统中的合作行为以及自自组织斑图。
13
从游戏到博弈
游戏的特点:下棋,打牌,赌博,田径, 球类等等,共同的特点是策略
策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略和 利益的依存性
14
想一想
假如你正跟恋人用手机通电话,突 然信号断了。这时,你会立即拨电话 过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,取 决于你的恋人是否会拨过来。如果你 们其中一方要拨,那么另一方最好是 等待;如果一方等待,那么另一方就 最好是拨过去。因为如果双方都拨, 那么就会出现线路忙;如果双方都等 待,那么时间就会在等待中流逝。
第五经济博弈论 PPT
进化稳定策略得检验
比例的博弈方偏离“同意”策略选择了“不同意” uy (1 )1 0 1 un (1 ) 0 0 0 u (1 )u y un (1 )2
因为 uy 1 0 且接近于1,因此犯错误博弈方得期
望得益远远低于没有犯错误得博弈方,也远低于群体平均得益, 因此犯错误得博弈方会逐步改正错误,最终仍然会趋向于x=1, 即所有博弈方都采用“同意”策略。
签协议博弈:
同意 不同意
博弈方2
同意
不同意
1,1
0,0
0,0
0,0
两个纯策略纳什均衡:(同意,同意),(不同意,不同意), 前一个纳什均衡帕累托优于后一个纳什均衡。假如就是在完全理 性得基础上进行该博弈,可以预期结果就是(同意,同意)。
下面就是在理性层次较低得有限理性博弈方组成得大群体成员 随机配对反复博弈得分析框架内进行分析。
因此x 1是在上述复制状态下的一个进化稳定策略ESS
进化稳定策略得检验
比例的博弈方偏离“不同意”策略选择了“同意”
uy (1 ) 0 1 un (1 ) 0 0 0 u (1 ) un uy 2
uy 0 un
x 0不是进化稳定策略
5、3、2一般两人对称博弈复制动态 与进化稳定策略
5、3、1 签协议博弈得复制动态与进化稳定策略
签协议博弈:
同意 不同意
博弈方2
同意
不同意
1,1
0,0
0,0
0,0
假设群体中采用“同意”博弈方得比例x,则不同策 略期望得益与平均得益为:
uy x 1 (1 x) 0 x un x 0 (1 x) 0 0 u x u y(1 x) un x2
只要博弈方有基本得、包括直觉与经验得判断能力, 早晚会发现上述得益差异,得益较差类型得博弈方或早或 迟会发现改变策略对自己就是有利得,并开始模仿另一种 类型得博弃方。
微观经济学-博弈论PPT课件
博弈主要可以分为合作博弈和非合作博弈。合作博弈和非 合作博弈的区别在于相互发生作用的当事人之间有没有一 个具有约束力的协议,如果有,就是合作博弈,如果没有, 就是非合作博弈。
2020/3/28
4
囚徒困境
两个嫌疑犯作案后被警察抓住,分别关在不同 的屋子里接受审讯。警察知道两人有罪,但缺 乏足够的证据。警察告诉每个人:如果两人都 抵赖,各判刑一年;如果两人都坦白,各判八 年;如果两人中一个坦白而另一个抵赖,坦白 的放出去,抵赖的判十年。于是,每个囚徒都 面临两种选择:坦白或抵赖。
2020/3/28
9
2020/3/28
10
帕累托最优
帕累托最优(Pareto Optimality)是指资源分配 的一种理想状态,假定固有的一群人和可分配 的资源,从一种分配状态到另一种状态的变化 中,在没有使任何人境况变坏的前提下,使得 至少一个人变得更好。帕累托最优是公平与效 率的“理想王国”。经济学理论认为,在一个自由 选择的体制中,社会的各类人群在不断追求自 身利益最大化的过程中,可以使整个社会的经 济资源得到最合理的配置。
2020/3/28
1
《美丽心灵》(A Beautiful Mind)是
一部关于一个真实 天才的极富人性的 剧情片。影片讲述 一位患有精神分裂 症但却在博弈论和 微分几何学领域潜 心研究,最终获得 诺贝尔经济学奖的 数学家约翰·福布
斯·纳什。
2020/3/28
2
约翰纳什 John Forbes
Nash
2020/3/28
11
蜈蚣博弈悖论
两个参与者A、B轮流进行策略选择,可供选择的策 略有“合作”和“背叛”(“不合作”)两种。
2020/3/28
12
2020/3/28
4
囚徒困境
两个嫌疑犯作案后被警察抓住,分别关在不同 的屋子里接受审讯。警察知道两人有罪,但缺 乏足够的证据。警察告诉每个人:如果两人都 抵赖,各判刑一年;如果两人都坦白,各判八 年;如果两人中一个坦白而另一个抵赖,坦白 的放出去,抵赖的判十年。于是,每个囚徒都 面临两种选择:坦白或抵赖。
2020/3/28
9
2020/3/28
10
帕累托最优
帕累托最优(Pareto Optimality)是指资源分配 的一种理想状态,假定固有的一群人和可分配 的资源,从一种分配状态到另一种状态的变化 中,在没有使任何人境况变坏的前提下,使得 至少一个人变得更好。帕累托最优是公平与效 率的“理想王国”。经济学理论认为,在一个自由 选择的体制中,社会的各类人群在不断追求自 身利益最大化的过程中,可以使整个社会的经 济资源得到最合理的配置。
2020/3/28
1
《美丽心灵》(A Beautiful Mind)是
一部关于一个真实 天才的极富人性的 剧情片。影片讲述 一位患有精神分裂 症但却在博弈论和 微分几何学领域潜 心研究,最终获得 诺贝尔经济学奖的 数学家约翰·福布
斯·纳什。
2020/3/28
2
约翰纳什 John Forbes
Nash
2020/3/28
11
蜈蚣博弈悖论
两个参与者A、B轮流进行策略选择,可供选择的策 略有“合作”和“背叛”(“不合作”)两种。
2020/3/28
12
第八章 演化博弈 《博弈论与经济》 PPT课件
。
j
j
▪ 因Y 为ESS,又 E(X ,Y ) E(Y,Y ) ,因而 E(Y, X ) E(X , X ,) 这与 X 为
纳什均衡相矛盾。
▪ 由性质2立即可得以下命题。
▪ 命题8.3 若 X 为单总体演化博弈 G 的内点ESS,即 X 的分量均为正 数,则 X 为 G 的惟一的ESS。
▪ 我们可用以下两个命题确定纯策略意义下的ESS。
▪ 此时,该博弈有2个纯策略纳什均衡 (e1,e1), (e2, e2) 为 e1 。
。该博弈的ESS
▪ 8. a1 0, a2 0
▪ 表2.1的第6种情况中, 0 。 y(x), x(y) 图形退化为图8-3。图
8-3种两条粗线上每点都是纳什均衡,但惟一的ESS为 e2
y 1
0
图8-3
(a1
a2 ) y12
2a2 y1
a2
▪令
f
( y1)
E(Y ,Y )
E(X
,Y)
(a1
a2 ) y12
2a2 y1
a22 a1 a2
。
▪ f (y) 为开口向下的抛物线,且判别式 0 ,故对
▪ x1 y1 , f ( y1) 0 ,从而 E(Y,Y ) E(X ,Y ) 。
▪ 对于例2.21给出的斗鸡博弈,支付矩阵 ▪ 仅有惟一的ESS X (2 , 3) 。
则 E(ei , X ) E(X , X )
。
▪ 证明 因
m
m
E(X , X ) XAX xi Ai X xiE(ei , X )
(*),
i 1
i 1
▪ Ai 为A 的第 i 行. 因 X为ESS,故有 E(X , X ) E(ei , X ),对 i 1,2,, m
《经济博弈论(第三版)》 谢识予 PPT课件
24
5
5
5
5
25
25
25
3
43
3
11
33
33
33
7
3
3
7
49
21
21
二、n个厂商连续产量
n
Q qi i 1
n
P P(Q) P( qi ) i 1
n
qi P qi P( qi ) i 1
n
n
qi P( qi ) cqi qi[P( qi ) c]
i 1
i 1
1.3 博弈结构和博弈分类
1.4 博弈论历史和发展简述
1.4.1博弈论的早期研究 1.4.2博弈论的形成 1.4.3博弈论的成长和发展 1.4.4博弈论的成熟及与主流经济
学的融合
1.4.1博弈论的早期研究
博弈论历史没有公认答案 对具有策略依存特点决策问题的研究可上溯
到18世纪初甚至更早 博弈论真正的发展在本世纪 博弈论总体上仍然是发展中的学科
1.3.6 博弈方的能力和理性
完全理性和有限理性
完全理性:有完美的分析判断能力和不会犯选择行为 的错误
有限理性:博弈方的判断选择能力有缺陷
个体理性和集体理性
个体理性:一个体利益最大为目标 集体理性:追求集体利益最大化 合作博弈:允许存在有约束力协议的博弈 非合作博弈:不允许存在有约束力协议的博弈
2000年前我国古代的“齐威王田忌赛马” 1500年前巴比伦犹太教法典“婚姻合同问题”
等。
1838年古诺寡头模型。 1883年伯特兰德寡头竞争模型。 1913年齐默罗象棋博弈定理 、“逆推归纳法” 1921-1927年波雷尔混合策略的第一个现代表述,
有数种策略两人博弈的极小化极大解
经济博弈论课件4
第四章 重复博弈
本章介绍基本博弈重复进行构成的重复博弈。 虽然形式上是基本博弈的重复进行,但重复博弈中 博弈方的行为和博弈结果却不一定是基本博弈的简 单重复,因为博弈方对于博弈会重复进行的意识, 会使他们对利益的判断发生变化,从而使他们在重 复博弈过程中的行为选择受到影响。这意味着不能 把重复博弈当作基本博弈的简单叠加,必须把整个 重复博弈过程作为整体进行研究。
t =1
∞
4.2 有限次重复博弈
4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈 的有限次重复博弈 4.2.3多个纯策略纳什均衡博弈 的有限次重复博弈 4.2.4 有限次重复博弈的民间定理
4.2.1 两人零和博弈的有限次重复博弈
零和博弈是严格竞争的,重复博弈并不改变这 一点。 以零和博弈为原博弈的有限次重复博弈与猜硬 币博弈的有限次重复博弈一样,博弈方的正确 策略是重复一次性博弈中的纳什均衡策略。
本章分三节
4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈
4.1 重复博弈引论
4.1.1 为何研究重复博弈 4.1.2 基本概念
4.1.1 为何研究重复博弈
经济中的长期关系 人们的预见性 未来利益对当前行为的制约 长期合同、回头客、长客和一次性买卖的区别 有无确定的结束时间
V = 4 + δV
因此当 δ > 1 / 4 时,此触发策略纳什均衡策略
-1,-1
ห้องสมุดไป่ตู้
(-5,-5) 囚徒2 囚徒 坦 白 不坦白 囚 坦白 -10,-10 -5,-13 徒 -13,-5 -6,-6 1 不坦白 (-10,-10)
有限次重复削价竞争博弈
寡头2 寡头 高 价 寡 高价 头 1 低价 100,100 150,20 低 价 20,150 70,70
本章介绍基本博弈重复进行构成的重复博弈。 虽然形式上是基本博弈的重复进行,但重复博弈中 博弈方的行为和博弈结果却不一定是基本博弈的简 单重复,因为博弈方对于博弈会重复进行的意识, 会使他们对利益的判断发生变化,从而使他们在重 复博弈过程中的行为选择受到影响。这意味着不能 把重复博弈当作基本博弈的简单叠加,必须把整个 重复博弈过程作为整体进行研究。
t =1
∞
4.2 有限次重复博弈
4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈 的有限次重复博弈 4.2.3多个纯策略纳什均衡博弈 的有限次重复博弈 4.2.4 有限次重复博弈的民间定理
4.2.1 两人零和博弈的有限次重复博弈
零和博弈是严格竞争的,重复博弈并不改变这 一点。 以零和博弈为原博弈的有限次重复博弈与猜硬 币博弈的有限次重复博弈一样,博弈方的正确 策略是重复一次性博弈中的纳什均衡策略。
本章分三节
4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈
4.1 重复博弈引论
4.1.1 为何研究重复博弈 4.1.2 基本概念
4.1.1 为何研究重复博弈
经济中的长期关系 人们的预见性 未来利益对当前行为的制约 长期合同、回头客、长客和一次性买卖的区别 有无确定的结束时间
V = 4 + δV
因此当 δ > 1 / 4 时,此触发策略纳什均衡策略
-1,-1
ห้องสมุดไป่ตู้
(-5,-5) 囚徒2 囚徒 坦 白 不坦白 囚 坦白 -10,-10 -5,-13 徒 -13,-5 -6,-6 1 不坦白 (-10,-10)
有限次重复削价竞争博弈
寡头2 寡头 高 价 寡 高价 头 1 低价 100,100 150,20 低 价 20,150 70,70
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
33
设盖硬币方出正面的概率为p,则出反面 的概率为1-p.出正面多于出反面,即 p>1-p或p>1/2。在这种情况下,如
猜硬币方全猜正面,则他的期望得益:
p 1 (1 p) (1) 2 p 1 2( p 1) 0 2
即平均来讲,猜硬币方一定是赢多输少。
34
双方都按照上述概率随机选择策略,即 在本博弈中,博弈方的决策内容不是确 定性的具体的策略,而是在一些策略中 随机选择的概率分布,这样的决策我们 称为“混合策略”。
pD[ pAu2 ( A, D) pBu2 (B, D)] 0.8[0.8 3 0.21] 0.2[0.8 2 0.2 5]
严格讲,博弈论不是经济学的一个分支, 它是一种方法,涉及到很多领域:
实际上,博弈论是数学的一个分支。
4
策略故事
妙手传奇 给猫拴个铃铛 多管齐下 三思而后行
5
引言
博弈论 诺贝尔经济学奖 纳什(Nash) (1950-1951) 泽尔腾(selten) (1965,1975) 海萨尼(Harsanyi) (1967-1968) 共同获得1994年诺贝尔经济学奖
G S1, , Sn;u1, ,un
19
定义
在博弈 G S1, , SnБайду номын сангаасu1, ,un 中,如果
由各个博弈方的各一个策略组成的某个策略组
合是对(s其1*,余,博sn*弈) 中方,策任略一的博组弈合方i的策略
s
* i
,都
(s1*, , si*1, si*1, sn* ) 的最佳策略,即
ui (s1*, , si*1, si*, si*1, sn*) ui (s1*, , si*1, sij , si*1, sn*)
16
纳什均衡
纳什均衡的定义 纳什均衡的一致预测性 纳什均衡与严格下策反复消去法
17
纳什均衡的定义
各博弈方都不愿或不会单独改变自己 策略的策略组合,只要这种策略组合 存在且是唯一的,博弈就有绝对确定 的解。这种各博弈方都不愿单独改变 策略的策略组合就是博弈论中最重要 的一个概念——“纳什均衡”。
对任意 sij Si 都成立,则称 (s1*, , sn* ) 为G 的一个“纳什均衡”。
20
纳什均衡的一致预测性
如果所有博弈方预测到一个特定的纳什 均衡将会出现,那么,没有人有兴趣作 不同的选择。 纳什均衡的特征:博弈方预测到均衡, 博弈方预测到其他博弈方预测到均衡, 等等。 一致性预测,并不意味着纳什均衡一定 是一个好的预测。
6
数学界的梵高——“疯子天才”纳什
7
三位大师主要的贡献
1950年和1951年纳什的两篇关于非合作 博弈论的重要论文,彻底改变了人们对 竞争和市场的看法。他证明了非合作博 弈及其均衡解,并证明了均衡解的存在 性,即著名的纳什均衡。从而揭示了博 弈均衡与经济均衡的内在联系。因为在 现实世界中,非合作博弈要比合作博弈 普遍得多。
39
猜硬币博弈中两博弈方都以(1/2,1/2)的概 率分布随机选择正面和反面的混合策略组合, 就是一个混合策略纳什均衡。 期望得益:
1 1 1 1 1 (1) 2 2 2 2 1 1 1 1 1 (1) 0 2 2 2 2
零和博弈!
40
应用例子
41
本博弈中两博弈方决策的第一个原则是不 能让对方知道或猜到自己的选择,因而 必须在决策时利用随机性。第二个原则 是他们选择每种策略的概率一定要恰好 使对方无机可乘。
9
诺贝尔经济学奖
1968年,瑞典中央银行成立300周年, 是为了纪念诺贝尔奖奖金提供者,设 立诺贝尔经济学奖。
1969年开始颁发。
10
从游戏到博弈
游戏的特点:下棋,打牌,赌胜,田径, 球类等等,共同的特点是 策略 策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略 和利益的依存性
29
混合策略纳什均衡
混合策略 混合策略博弈 混合策略纳什均衡 混合策略和严格下策反复消去法
30
许多现实中决策问题构成的博弈中根本 不存在具有稳定性的各博弈方都接受的 纳什均衡策略组合如猜硬币博弈和齐威 王田忌赛马,而另一些博弈却有多于一 个的纳什均衡策略组合,如夫妻之争博 弈。这两类博弈如果只进行一次,实际 结果如何确实取决于机会和运气,如果 多次独立反复进行这些博弈,这样博弈
44
该混合策略纳什均衡的期望结果(即双方的 期望得益)分别为:
u1e pA[ pCu1( A, C) pDu1( A, D)] pB[ pCu1(B, C) pDu1(B, D)]
0.8[0.8 2 0.2 5] 0.2[0.8 3 0.21]
2.6 u2e pC[ pAu2 ( A, C) pBu2 (B, C)]
18
我们常用G表示一个博弈; 如G有n个博
弈方,每个博弈方的全部可选策略的集
合我们称策略空间,分别用
S1,
,
S
表示;
n
用 s表ij 示Si 博弈方i的第j个策略,其中j可
取有限个值(有限策略博弈),也可取无限
个值(无限策略博弈);博弈方i的得益则
用 u表i 示,ui是各博弈方策略的多元函数。
n个博弈方的博弈G常写成
27
从“纳什均衡”我们引出了“看不见的 手”的原理的一个悖论:从利己目的出 发,结果损人不利己,既不利己也不利 他。两个囚徒的命运就是如此。从这个 意义上说,“纳什均衡”提出的悖论实 际上动摇了西方经济学的基石。
28
研究囚徒困境问题的目的
利用这种困境达到有利于社会的目的 政府在经济活动中的组织协调工作的 必要性 避免囚徒困境
8
Selten and Harsanyi
泽尔腾(1965)将纳什均衡的概念引入了动 态分析,提出了“精炼纳什均衡”概念;以 及进一步刻画不完全信息动态博弈的“完备 贝叶斯纳什均衡”。
而海萨尼则发展了刻画不完全信息静态博弈 的“贝叶斯纳什均衡”(1967-1968)。总 之,他俩进一步将纳什均衡动态化,加入了 接近实际的不完全信息条件。他们的工作为 后人继续发展博弈论,提供了基本思路和模 型。
35
定义
在博弈 G S1, , Sn;u1, ,un 中;博弈 方i的策略空间为 Si si1, , sik ,则博弃
方i以概率分布 pi ( pi1, , pik ) 随机在 其k个可选策略中选择的“策略”,称为
一个“混合策略”,其0 中pij 1 对 j 1, , k 都成立,
且
pi1 pik 1
36
相对于这种以一定概率分布在一些策略 中随机选择的混合策略,确定性的具体 的策略我们称为“纯策略”,而我们原 来意义上的纳什均衡,即任何博弈方都 不愿单独改变策略的纯策略组成的策略 组合现在可称为“纯策略纳什均衡”。 当然,纯策略也可以看作混合策略的特 例。
37
纯策略可以看作,选择相应纯策略 的概率为1,选择其余纯策略的概率 为0的混合策略。混合策略可以看作 纯策略的扩展。
42
设博弈方1选A的概率为pA,选B的概率为pB, 博根弃据方上2述选第C二的个概原率则为,pC博,弈选方D的1选概A率和为Bp的D。 概 率,一定要使博弈方2选C的期望得益和选D的
期望得益相等,即: u2C pA 3 pB 1 pA 2 pB 5 u2D 因为 pA pB 1 所以 pA 0.8, pB 0.2
12
博弈三要素
博弈方(局中人)----参与博弈但利益不完 全一致者。有二人博弈与多人博弈之分。
策略集----每个局中人都会有一系列的策略 可选,称为对应于每个局中人的策略集。 有限和无限个对策。
得益----在每策略组合下每一局中人的得益 情况,是选择策略的标准,称为得益函数 或支付函数。
13
博弈的分类及对应的均衡
完全 信息
静态
完全信息静态博弈; 纳什均衡; Nash(1950)
动态
完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾(1965)
不完 全信 息
不完全信息静态博弈; 贝叶斯纳什均衡;
海萨尼(1967-1968)
不完全信息动态博弈, 精炼贝叶斯纳什均衡; 泽尔腾(1975) Kreps,Wilson(1982), Fudenberg,Tirole(1991)
24
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意 义。个人理性与集体理性的冲突,各人 追求利己行为而导致的最终结局是一个 “纳什均衡”,也是对所有人都不利的 结局。他们两人都是在坦白与不坦白策 略上首先想到自己,这样他们必然要服 长的刑期。只有当他们都首先替对方着 想时,或者相互合谋(串供)时,才可以得 到最短时间的监禁的结果。
38
引进了混合策略的概念以后,我们可将 纳什均衡的概念扩大到包括混合策略的 情况。对各博弈方的一个策略组合,不 管它是纯策略组成的还是混合策略组成 的,只要满足各博弈方都不会想要单独 偏离它,我们就称之为一个纳什均衡。 如果确实是一个严格意义上的混合策略
组合构成的纳什均衡,称为“混合策略 纳什均衡”。
11
什么是博弈论?
博弈论:就是关于包含相互依存情况中理性 行为的研究。 相互依存 :通常是指博弈中的任何一个局中 人受到其他局中人的行为的影响,反过来, 他的行为也影响到其他局中人。 相互依存的另一个方面是局中人可以有某些 共同的兴趣或利益所在。 “理性行为”的说明:博弈论中的所谓理性, 一般不是指道德标准。
坦白
0,-8 -5,-5
23
囚徒困境说明了什么
在(坦白、坦白)这个组合中,A和B都不能 通过单方面的改变行动增加自己的收益,于是 谁也没有动力游离这个组合,因此这个组合是 纳什均衡,也叫非合作均衡。
囚徒困境反映了个人理性和集体理性的矛盾。 如果A和B都选择不坦白,各判刑1年,显然 比都选择坦白各判刑8年好得多。当然,A和 B可以在被警察抓到之前订立一个“攻守同 盟”,但是这可能不会有用,因为它不构成纳 什均衡,没有人有积极性遵守这个协定,显然最 好的策略是双方都不坦白。
设盖硬币方出正面的概率为p,则出反面 的概率为1-p.出正面多于出反面,即 p>1-p或p>1/2。在这种情况下,如
猜硬币方全猜正面,则他的期望得益:
p 1 (1 p) (1) 2 p 1 2( p 1) 0 2
即平均来讲,猜硬币方一定是赢多输少。
34
双方都按照上述概率随机选择策略,即 在本博弈中,博弈方的决策内容不是确 定性的具体的策略,而是在一些策略中 随机选择的概率分布,这样的决策我们 称为“混合策略”。
pD[ pAu2 ( A, D) pBu2 (B, D)] 0.8[0.8 3 0.21] 0.2[0.8 2 0.2 5]
严格讲,博弈论不是经济学的一个分支, 它是一种方法,涉及到很多领域:
实际上,博弈论是数学的一个分支。
4
策略故事
妙手传奇 给猫拴个铃铛 多管齐下 三思而后行
5
引言
博弈论 诺贝尔经济学奖 纳什(Nash) (1950-1951) 泽尔腾(selten) (1965,1975) 海萨尼(Harsanyi) (1967-1968) 共同获得1994年诺贝尔经济学奖
G S1, , Sn;u1, ,un
19
定义
在博弈 G S1, , SnБайду номын сангаасu1, ,un 中,如果
由各个博弈方的各一个策略组成的某个策略组
合是对(s其1*,余,博sn*弈) 中方,策任略一的博组弈合方i的策略
s
* i
,都
(s1*, , si*1, si*1, sn* ) 的最佳策略,即
ui (s1*, , si*1, si*, si*1, sn*) ui (s1*, , si*1, sij , si*1, sn*)
16
纳什均衡
纳什均衡的定义 纳什均衡的一致预测性 纳什均衡与严格下策反复消去法
17
纳什均衡的定义
各博弈方都不愿或不会单独改变自己 策略的策略组合,只要这种策略组合 存在且是唯一的,博弈就有绝对确定 的解。这种各博弈方都不愿单独改变 策略的策略组合就是博弈论中最重要 的一个概念——“纳什均衡”。
对任意 sij Si 都成立,则称 (s1*, , sn* ) 为G 的一个“纳什均衡”。
20
纳什均衡的一致预测性
如果所有博弈方预测到一个特定的纳什 均衡将会出现,那么,没有人有兴趣作 不同的选择。 纳什均衡的特征:博弈方预测到均衡, 博弈方预测到其他博弈方预测到均衡, 等等。 一致性预测,并不意味着纳什均衡一定 是一个好的预测。
6
数学界的梵高——“疯子天才”纳什
7
三位大师主要的贡献
1950年和1951年纳什的两篇关于非合作 博弈论的重要论文,彻底改变了人们对 竞争和市场的看法。他证明了非合作博 弈及其均衡解,并证明了均衡解的存在 性,即著名的纳什均衡。从而揭示了博 弈均衡与经济均衡的内在联系。因为在 现实世界中,非合作博弈要比合作博弈 普遍得多。
39
猜硬币博弈中两博弈方都以(1/2,1/2)的概 率分布随机选择正面和反面的混合策略组合, 就是一个混合策略纳什均衡。 期望得益:
1 1 1 1 1 (1) 2 2 2 2 1 1 1 1 1 (1) 0 2 2 2 2
零和博弈!
40
应用例子
41
本博弈中两博弈方决策的第一个原则是不 能让对方知道或猜到自己的选择,因而 必须在决策时利用随机性。第二个原则 是他们选择每种策略的概率一定要恰好 使对方无机可乘。
9
诺贝尔经济学奖
1968年,瑞典中央银行成立300周年, 是为了纪念诺贝尔奖奖金提供者,设 立诺贝尔经济学奖。
1969年开始颁发。
10
从游戏到博弈
游戏的特点:下棋,打牌,赌胜,田径, 球类等等,共同的特点是 策略 策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略 和利益的依存性
29
混合策略纳什均衡
混合策略 混合策略博弈 混合策略纳什均衡 混合策略和严格下策反复消去法
30
许多现实中决策问题构成的博弈中根本 不存在具有稳定性的各博弈方都接受的 纳什均衡策略组合如猜硬币博弈和齐威 王田忌赛马,而另一些博弈却有多于一 个的纳什均衡策略组合,如夫妻之争博 弈。这两类博弈如果只进行一次,实际 结果如何确实取决于机会和运气,如果 多次独立反复进行这些博弈,这样博弈
44
该混合策略纳什均衡的期望结果(即双方的 期望得益)分别为:
u1e pA[ pCu1( A, C) pDu1( A, D)] pB[ pCu1(B, C) pDu1(B, D)]
0.8[0.8 2 0.2 5] 0.2[0.8 3 0.21]
2.6 u2e pC[ pAu2 ( A, C) pBu2 (B, C)]
18
我们常用G表示一个博弈; 如G有n个博
弈方,每个博弈方的全部可选策略的集
合我们称策略空间,分别用
S1,
,
S
表示;
n
用 s表ij 示Si 博弈方i的第j个策略,其中j可
取有限个值(有限策略博弈),也可取无限
个值(无限策略博弈);博弈方i的得益则
用 u表i 示,ui是各博弈方策略的多元函数。
n个博弈方的博弈G常写成
27
从“纳什均衡”我们引出了“看不见的 手”的原理的一个悖论:从利己目的出 发,结果损人不利己,既不利己也不利 他。两个囚徒的命运就是如此。从这个 意义上说,“纳什均衡”提出的悖论实 际上动摇了西方经济学的基石。
28
研究囚徒困境问题的目的
利用这种困境达到有利于社会的目的 政府在经济活动中的组织协调工作的 必要性 避免囚徒困境
8
Selten and Harsanyi
泽尔腾(1965)将纳什均衡的概念引入了动 态分析,提出了“精炼纳什均衡”概念;以 及进一步刻画不完全信息动态博弈的“完备 贝叶斯纳什均衡”。
而海萨尼则发展了刻画不完全信息静态博弈 的“贝叶斯纳什均衡”(1967-1968)。总 之,他俩进一步将纳什均衡动态化,加入了 接近实际的不完全信息条件。他们的工作为 后人继续发展博弈论,提供了基本思路和模 型。
35
定义
在博弈 G S1, , Sn;u1, ,un 中;博弈 方i的策略空间为 Si si1, , sik ,则博弃
方i以概率分布 pi ( pi1, , pik ) 随机在 其k个可选策略中选择的“策略”,称为
一个“混合策略”,其0 中pij 1 对 j 1, , k 都成立,
且
pi1 pik 1
36
相对于这种以一定概率分布在一些策略 中随机选择的混合策略,确定性的具体 的策略我们称为“纯策略”,而我们原 来意义上的纳什均衡,即任何博弈方都 不愿单独改变策略的纯策略组成的策略 组合现在可称为“纯策略纳什均衡”。 当然,纯策略也可以看作混合策略的特 例。
37
纯策略可以看作,选择相应纯策略 的概率为1,选择其余纯策略的概率 为0的混合策略。混合策略可以看作 纯策略的扩展。
42
设博弈方1选A的概率为pA,选B的概率为pB, 博根弃据方上2述选第C二的个概原率则为,pC博,弈选方D的1选概A率和为Bp的D。 概 率,一定要使博弈方2选C的期望得益和选D的
期望得益相等,即: u2C pA 3 pB 1 pA 2 pB 5 u2D 因为 pA pB 1 所以 pA 0.8, pB 0.2
12
博弈三要素
博弈方(局中人)----参与博弈但利益不完 全一致者。有二人博弈与多人博弈之分。
策略集----每个局中人都会有一系列的策略 可选,称为对应于每个局中人的策略集。 有限和无限个对策。
得益----在每策略组合下每一局中人的得益 情况,是选择策略的标准,称为得益函数 或支付函数。
13
博弈的分类及对应的均衡
完全 信息
静态
完全信息静态博弈; 纳什均衡; Nash(1950)
动态
完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾(1965)
不完 全信 息
不完全信息静态博弈; 贝叶斯纳什均衡;
海萨尼(1967-1968)
不完全信息动态博弈, 精炼贝叶斯纳什均衡; 泽尔腾(1975) Kreps,Wilson(1982), Fudenberg,Tirole(1991)
24
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意 义。个人理性与集体理性的冲突,各人 追求利己行为而导致的最终结局是一个 “纳什均衡”,也是对所有人都不利的 结局。他们两人都是在坦白与不坦白策 略上首先想到自己,这样他们必然要服 长的刑期。只有当他们都首先替对方着 想时,或者相互合谋(串供)时,才可以得 到最短时间的监禁的结果。
38
引进了混合策略的概念以后,我们可将 纳什均衡的概念扩大到包括混合策略的 情况。对各博弈方的一个策略组合,不 管它是纯策略组成的还是混合策略组成 的,只要满足各博弈方都不会想要单独 偏离它,我们就称之为一个纳什均衡。 如果确实是一个严格意义上的混合策略
组合构成的纳什均衡,称为“混合策略 纳什均衡”。
11
什么是博弈论?
博弈论:就是关于包含相互依存情况中理性 行为的研究。 相互依存 :通常是指博弈中的任何一个局中 人受到其他局中人的行为的影响,反过来, 他的行为也影响到其他局中人。 相互依存的另一个方面是局中人可以有某些 共同的兴趣或利益所在。 “理性行为”的说明:博弈论中的所谓理性, 一般不是指道德标准。
坦白
0,-8 -5,-5
23
囚徒困境说明了什么
在(坦白、坦白)这个组合中,A和B都不能 通过单方面的改变行动增加自己的收益,于是 谁也没有动力游离这个组合,因此这个组合是 纳什均衡,也叫非合作均衡。
囚徒困境反映了个人理性和集体理性的矛盾。 如果A和B都选择不坦白,各判刑1年,显然 比都选择坦白各判刑8年好得多。当然,A和 B可以在被警察抓到之前订立一个“攻守同 盟”,但是这可能不会有用,因为它不构成纳 什均衡,没有人有积极性遵守这个协定,显然最 好的策略是双方都不坦白。