第二章 策略型博弈

合集下载

博弈论(第二章)讲义

博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2



上 博弈方1

1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0

3 求解策略式博弈-博弈求解

3 求解策略式博弈-博弈求解

3.1 博弈求解: 参与者是理性的 3.2 博弈求解:
参与者是理性的和参与者知道参与者是理性的
3.3 博弈求解:理性成为共同知识
第3章 剔除不可能:理性是共同知识下的博弈求解
3.1 博弈求解: 参与者是理性的 这里假定的参与者是理性的是指,参与者根据 对其他参与者会采取何种行为的信念(对其他参与者 可能做出选择的信念),会采取使自己收益最大化的 策略。 这一假定在博弈求解的情境下意味着
这种情况下,如果托选择屈服,斯选择真弹收益增加 如果托选择刺杀,他选择真弹收益不会受损(2) 所以对于斯来说,选择真弹就是弱占优于空弹的策略。
第3章 剔除不可能:理性是共同知识下的博弈求解
3.1 博弈求解: 参与者是理性的 很多案例中仅仅是参与者是理性的设想,并不足 以让我们求出博弈的解。 书呆子喜欢读书故其收益随努力程度增加而递增。 社团男生满足B的成绩并愿意为此适度学习,但不会 为提升至A而非常努力。成绩由所有成员共同决定。 社团男生没有占优策略。 也就是说,仅仅假设社 团男生有理性并不能帮助 我们预测他的行为选择。
3.1 博弈求解: 参与者是理性的
我们假设两位参与人都是理性的看能否预测他们的行为。
歌剧博弈中,假如斯卡比亚选择真子弹,托斯卡选择 刺杀的收益2ቤተ መጻሕፍቲ ባይዱ选择屈服的收益1,所以当托认为斯用 真子弹时(信念),将选择刺杀。 同理,如果她认为斯用空弹也将选择刺杀。 所以不论托认为斯会怎么做,选择刺杀策略的收益> 选择屈服策略的收益。 同理,我们将看到斯 卡比亚的理性会促使 他选择真子弹的策略。
兴奋剂博弈:运动员服用类固醇是否理性 现在我们不仅假设这些运动员是理性的,而且 每个人都相信其他两名与动员是理性的。 这就意味着卡尔和莫里斯都相信本会使用类固醇, 因为这是他的占优策略。这样对于莫和卡来说,博 弈变成去掉本放弃类固醇的策略。 这种情况下,卡尔拥有服用类固醇的占优策略。

策略与博弈

策略与博弈

思考1
在博弈对策中,一个局中人如果存在强优策略,是否存在两个或 者两个以上的强优策略?(利用定义判别)
思考2
分析案例2,布什上校和萨达姆上校是否分别存在强优策略?
如果局中人i存在强优策略si’,那么他的其他策略si都称为强劣 策略。对于局中人i来说,没有理由选择强劣策略。
对于局中人i来说,并不是强优策略都存在,比如:
局中人1
左右
顶 7,3 5,3 底 7,0 3,1
局中人2
弱 优
如果不管其他局中人选择怎样的策略,局中人i的策略si’盈利不小于他 的其他任何其他策略的盈利,即
在一场战斗中,布什上校有两个步兵团可以自由分派到一对地点(1,2 1,3 1,4 2,3 2,4 3,4);而萨达姆上校只有一个步兵团派往四个地点(1,2,3,4) 的任何一处。如果一个团到达无人争夺的地点,那么它就赢得这一处;如果 敌方一个团也来到同一地点,那么它们将进行战斗而陷入困境。赢可以获得 一个单元效用;陷入困境则产生零效用。
认罪(b1)
5,5
0,15
不认罪(b2)
15,0
1,1
如果Calvin是个理性的个体,他的策略有“认罪”和“不认罪”两种,如 果他选择不认罪,Klein不管认罪不认罪,他的判刑都比Calvin年限少,故对 Calvin不利。所以Calvin认为他的两个策略中,“认罪”策略比“不认罪”策 略好。同样的分析,Klein也会认为“认罪”比“不认罪”策略好。所以,最后, 两个囚徒的合理的博弈结果应该是“认罪”,“认罪”,各判5年。这里我们 记:
于是,得到如下定义
不管其他局中人选择怎样的策略,局中人i的策略si’盈利严格大于他的

其他任何其他策略的盈利,即

第2章 基本概念及战略式博弈

第2章 基本概念及战略式博弈

Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
不完全信息博弈
决策是否存在时序上的差异分为:
• 不完全信息静态博弈 不完全信息静态博弈:两个企业同时决 策,即不存在决策时序上的差异; • 不完全信息动态博弈 不完全信息动态博弈:两个企业先后决 策,即存在决策时序上的差异
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
关于战略的标记
• 在n 人博弈中,用 si 表示参与人 i (i = 1, 2, … , n) 的战略; • X i 表示参与人 i (i = 1, 2, … , n)在博弈中可能 面临的所有决策情形的集合,称为观测 集。
Control Science and Engineering, HUST
All Rights Reserved, 2007, Luo Yunfeng
新产品开发中参与人战略的标记
• • • • • • • • 企业2的战略集 S 2 就包含以下四个战略: 战略 s1 : 1 ( x1 ) = a , s1 ( x2 ) = a s2 2 2 其 a={开 } 中 发 2 2 战略 s2 : 22 ( x1 ) = a , s2 ( x2 ) = b s b={不 发 } 开 3 3 3 战略 s2 :s2 ( x1 ) = b , s2 ( x2 ) = a 4 4 4 战略 s2 : 2 ( x1 ) = b , s2 ( x2 ) = b s 企业1的战略集 S1 就包含以下两个战略: 1 1 战略 s1 :s1 = a 企业1的战略集和 战略 s12 :s12 = b

博弈论转化策略式

博弈论转化策略式

博弈论转化策略式
博弈论中有两种形式的博弈模型:策略式博弈和扩展式博弈。

策略式博弈构成包括参与者集、参与者的策略集和参与者的支付函数(收益)。

这种形式的博弈论的优势在于为求解纳什均衡提供方便,简单明了,便于表示与书写。

然而,策略式博弈也有其劣势,例如不能描述参与者行动顺序,不能描述参与者在各个决策节点时掌握的信息,以及不能适用于动态博弈模型的表述。

如果需要将扩展式博弈转化为策略式,可以按照以下步骤进行:
1. 找出每个参与者的策略集合,并分别列出(一个按行列出,一个按列列出)。

2. 在扩展式中找出每个策略组合所对应的行动路径(行动组合)。

3. 将终端节点旁的支付情况填入相应的策略组合所对应的位置。

以上信息仅供参考,如需了解更多信息,建议查阅专业书籍或咨询专业人士。

广延型博弈与策略型博弈

广延型博弈与策略型博弈

可微分性
无限制策略空间
每个参与者的策略空间是无限的,可以微 分,以便在博弈过程中进行精确的调整。
每个参与者拥有无限的策略空间,可以选 择任何可能的策略。
例子与场景
例子
在股票市场中,投资者可以根据 市场走势选择买入或卖出的时间 点,其行动和策略是连续的、可 微分的。
场景
广延型博弈适用于金融市场、经 济系统等连续变化的领域。
策略与均衡
策略
在策略型博弈中,每个参与者都有一系列可选择的策略,每个策略都有对应的收益。参与者会选择收益最大的策 略。
均衡
在策略型博弈中,如果每个参与者的最优策略都是相对于其他参与者的策略选择的,那么这种状态就被称为均衡 。均衡是策略型博弈的核心概念,它描述了博弈的稳定状态。
04
广延型与策略型的比较
策略与均衡
策略
在广延型博弈中,每个参与者需要选择一个连续的、可微分的策略,以最大化 自己的收益。
均衡
由于每个参与者的策略空间是无限的,均衡状态可能存在于某个特定的子集中 ,这个子集通常是一个闭集。在均衡状态下,每个参与者的策略是最优的,并 且所有参与者的最优策略构成一个纳什均衡。
03
策略型博弈
定义与特点
博弈的分类
根据参与者的行为和信息结构,博弈论可以分为合作博弈和 非合作博弈。
非合作博弈又可以根据博弈过程的不同,分为广延型博弈和 策略型博弈。
02
广延型博弈
定义与特点
定义
连续性
广延型博弈是一种博弈类型,其中参与者 的行动和策略是连续的、可微分的,并且 每个参与者的策略空间是无限的。
参与者的行动和策略是连续的,可以在一 定范围内任意选择。
定义
策略型博弈是指在博弈中,参与者的 决策是同时进行的,每个参与者都根 据对手可能的策略选择自己的最优策 略。

战略管理-策略式博弈:混合策略

战略管理-策略式博弈:混合策略

3.策略式博弈:混合策略3.1混合动机博弈在第2章,我们发现有些博弈存在多个纯策略纳什均衡(比如“懦夫博弈”),有些博弈不存在纯策略纳什均衡。

这使我们考虑:人们会不会在他的纯策略之间进行随机选择呢,即,将其多个纯策略以一定的选取概率组合进其一个行动计划呢?回答是肯定的!人们的确会可能将其多个纯策略以一定的选取概率组合进入其特定的行动计划,这特定的行动计划的就称为“混合策略”。

懦夫博弈中的策略混合动机考虑第2章表2.11的懦夫博弈。

当时我们得到了两个纯策略纳什均衡:(向前,转向)和(转向,向前)。

为方便,我们将这个博弈的赢利在这里再画一遍(表3.1)。

表3.1 懦夫博弈司机乙转向向前转向1,1 -2,2司机甲(你) 向前2,-2-4,-4但问题可以想得更复杂些。

假如你是司机甲,你究竟会转向还是继续向前?这很可能取决于你对司机乙的判断:司机乙选择转向还是选择向前决定着你的选择。

但是你无法肯定司机乙是否会确定地转向,因为他的行为取决于他对你的揣摩。

所以,最终你也许只能认为司机乙有多少可能转向、有多少可能向前。

假如,你认为司机乙转向的可能性为50%,向前的可能性也为50%,那么你应该选择转向还是向前?这取决于你采取不同策略的预期赢利,它们可以计算如下:你选择转向的预期赢利:1×50%+(-2)×50%=-0.5;你选择向前的预期赢利:2×50%+(-4)×50%=-1。

你将发现,当司机乙转向、向前的可能性各为50%的时候,你选择转向是最合适,因为转向的预期赢利(-0.5)比向前的预期赢利(-1)要大一些。

但是,司机乙当然知道你在猜测他选择各策略的概率,他会不会真如你所想那样以各自50%的概率来选择转向或向前呢?如果他确实以各50%的概率在两个策略间选择,那么他知道你就会一定选择转向(这是对你最适合的策略);但是既然你选择转向,那么他又何必以各自50%的概率来选择其两个策略呢,他完全可以选择向前。

第二章 纳什均衡 《博弈论与经济》 PPT课件

第二章  纳什均衡 《博弈论与经济》 PPT课件

▪ G的纳什均衡可由以下划线法求得。
▪ 1.对局中人1的每个策略i (i 1,2,, m) ,寻找局中人2的最
优反应。若最优反应为
j
,即 bij
max
k 1,2,,n
bik
,则在支付矩
阵元素 bij 下划一短线。
▪ 2.对局中人2的每个策略 j ( j 1,2,, n) ,寻找局中人1的
最优反应,若最优反应为 i
▪ 考虑由商店A, B构成的市场,A与B分别销售不同品牌的商 品,进行价格竞争。假设生产的单位成本为零。消费者 分为两类, n A ( 0)个消费者偏好于产品A,nB ( 0)个消费者 偏好于产品B。A,B两种品牌价格分别为 PA , PB 。设消费 者可从A或B处购买单位商品。
▪ 用 0表示由于购买不喜欢的产品所付出的厌恶成本,假 设消费者具有如下的效用函数
按 等待
等按待
(5,1) (9,1)
4,4
(0, 0)
▪ 严格纳什均衡为大猪“按”,小猪“等待”。
▪ 例2.7 在例1.8中的大堤维护博弈中,支付矩阵为
维护
不维护
不维维护护 ((1
4,4) 0,1 4)
((1140,,1100))
▪ 利用划线法可得纳什均衡(维护,维护),(不维护, 不维护)。
▪ 为了保护生命财产的安全,政府可以立法,如果参与人
第2章 纳什均衡
2.1 纳什均衡的定义
▪ 纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概念都是建 立在纳什均衡基础之上的。
▪ 纳什均衡是个策略组合 s* (si*, s*i ) ,它满足两个要求。

1.对每个局中人 i N
,能够预期到对手采用策略组合s

策略性博弈与纳什均衡

策略性博弈与纳什均衡

K
1 ik 1.
第21页/共28页
用 代表i的混合策略空间( i ), (1,,i ,,
i
i
n )代表混合策略组合 ,其中,i为i的一个混合策略 ,而
i 代表混合策略组合空间 ••( ). i
用vi ( ) vi ( i , i )表示参与人 i的期望效用函数 [ i (1,, i1, i1,, n)是除i之外所有其他参与人的 混合
第11页/共28页
小猪

等待
大 按 3,1 2, 4

等待 7, 1 0, 0
智猪游戏
第12页/共28页
2、纳什均衡及其存在性
每个人的选择战略是其他参与人战略选择的最优反映,它是在一个博弈中给定其他个博弈方选定的条件下没个 博弈方所选择的最优的策略。这是各方都得到最大的收益,没有一个博弈方会选择另外一个策略以试图改 善自己的状况,从自己的角度来说达到了帕累托最优的状态。
第4页/共28页
4、博弈的表示
(1)得益矩阵
囚徒2
坦白
不坦白
囚 徒
坦白 5, 5
不坦白 8, 0
0, 8
1, 1
第5页/共28页
1


正方

方 反方
猜硬币方
正方
1,1
反方
1, 1
1, 1 1,1
第6页/共28页
博弈方2
石头
剪刀

博 石头 0, 0
1, 1

方 剪刀 1,1 0, 0
1,1
1, 1
表示为:
ui (si,
,
s i 1
)
ui
(si
,
第13页/共28页

博弈论第二章 (1)

博弈论第二章 (1)
囚徒2 坦 白 囚 坦 白 徒 1 不坦白 -5, -5 -8, 0 不坦白 0, -8 -1, -1
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3

3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略

二、重复剔除严格劣战略


(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5

扩展型博弈和策略型博弈

扩展型博弈和策略型博弈

混合策略Nash均衡
• 当一个博弈没有纯策略Nash均衡时,人们考虑计 算所谓混合策略Nash均衡。 • 局中人的一个混合策略是指他按照某个概率分布 随机地选用各个纯策略;如果他有K个纯策略,那 么他的一个混合策略可以表示为i=(pi1,…,piK),其 中pik是他选用第k个纯策略的概率。 • 当局中人使用混合策略时,各人的期望赢得等于 他在每一个纯策略横断面上的赢得与该策略横断 面出现的概率的乘积之总和。为简便计,i的期望 赢得函数仍然用pi表示。
混合策略Nash均衡
• 无区别原则:如果*=(*i,*-i)是个混合策略Nash 均衡并且pi(*i,*-i) =M,那么对*i中局中人i以正 概率选用的每一个纯策略si都有pi(si,*-i) =M。换 句话说, *-i使得局中人i对于他实际采用的每个 纯策略无区别。 • 根据无区别原则,通常可以求解一个利用优劣关 系简化后得到的KK双矩阵博弈。
混合策略Nash均衡
• 局中人i的全体混合策略的集合记为i;注意一 个纯策略也可以看作一个特殊的混合策略。 • 如果每个局中人都选用一个混合策略,就得到一 个混合策略横断面。全体混合策略横断面的集合 记为。 • 一个混合策略横断面*=(*1,…, *n)叫做混合策略 Nash均衡,如果如果对每个局中人i, 他选定的混 合策略*i都是对所有其它局中人选定的混合策略 *-i的最优回应:pi(*)pi(*|i), *ii, iI。
二人策略型博弈Nash均衡的计算
• 可以按照定义找出所有的纯策略Nash均衡; • 如果策略型博弈比较复杂,可以用策略间的 “优”, “劣”关系化简,然后再寻找均衡。称i 的一个策略si劣于si (或si优于si),如果不管其他 人选定什么策略,si都比si使i得到更小的赢得。 如果存在一个si,它优于i的任何其他策略,就 称si为i的最优策略。显然,劣策略不可能构成 Nash均衡。所以,寻找Nash均衡时可以把劣 策略划掉以简化策略型博弈。

策略式博弈:纯策略

策略式博弈:纯策略

策略式博弈:纯策略2.策略式博弈:纯策略① 2.1 策略有好坏在一场博弈中,参与人有多个备选的策略。

假如我们将一个参与人的任意两个策略——姑且称“策略A”和“策略B”——拿出来比较,如果在任何情况下(即不管对手如何出招)他选择策略A总是比选择策略B更合适,那么他就会认为策略A相对于策略B来说是一个更“好”的策略,而策略B就是相对于策略A的一个更“坏”的策略。

在博弈论术语中,我们将他这个更好的策略(策略A)称优势策略,把这个更坏的策略(策略B)称劣势策略。

在优势策略与劣势策略之间,参与人的理性选择是显而易见的,他将选择优势策略。

虽然并不是每一场博弈都有优势策略,但是在现实中的确存在大量的优势策略博弈的例子。

让我们逐一来看一看这些例子。

囚徒的困境②“囚徒困境”讲述的是这样一个故事③:两个惯偷,在最近一次的作案中被警察捕获;然后他们被警方隔离审查,并说明警方的政策是“坦白从宽,抗拒从严”。

如果一个小偷坦白而另一个小偷抗拒,则坦白者因立功表现被释放(即入狱0个月),抗拒者因顽抗将重惩(入狱9个月);如果双方都坦白,则历次犯罪证据确凿,双方均被判入狱6个月;如果双方都抗拒,那么警察将无法得到他们过去的犯罪证据,只能以此次偷盗轻判(入狱1个月)。

上述信息的文字说明可能太烦琐了,我们尝试用一种简洁的方式来表达上述信息。

比如,我们把双方的利害关系制作成一张表(即赢利表,payoffs table)。

由于每个人有两个策略选择,两个人就有四种策略组合(即四个单元格);每个单元格中左边的数字表示左边的局中人(小偷甲)在该策略组合下的赢利,每个单元格中右边的数字表示上边的局中人(小偷乙)在该策略组合下的赢利④。

由于入狱是一件倒霉事,所以赢利以负月数计(见表2.1)。

表2.1 囚徒的困境小偷乙抗拒坦白小偷甲抗拒 -1,-1 -9,0 坦白 0,-9 -6,-6 现在我来问你,这样的一个博弈中,最可能的结果将是什么呢?也许有一些读者会说,当然两个小偷都应选“抗拒”了。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


甲 坦白 不坦白
坦白 -6,-6 -8,-1
不坦白 -1,-8 -2,-2
甲:“不坦白”相对于“坦白”是严格劣策略
乙:“不坦白”相对于“坦白”是严格劣策略
乙 甲
坦白 -6,-6
不坦白 -1,-8
坦白

甲 坦白
坦白 -6,-6
例2.5 利用重复剔除严格劣策略求解
·

乙 左 中 右
上 下
1,0 0,3
乙 甲 石头 剪刀 布
石头 0,0 -1,1 1,-1
剪刀 1,-1 0, 0 -1,1
布 -1,1 1,-1 0,0
利用重复剔除严格劣策略无法求解
例2.6 利用重复剔除严格劣策略无法求解



左 0 ,4
中 4 ,0
右 5 ,3


4 ,0
3 ,5
0 ,4
3 ,5
5 ,3
6 ,6
六、注意
大多数的博弈局势中使用剔除严格劣策略的
2 (q1 , q2 ) q2 [a (q1 q2 ) c]
Cournot 模型求解
max 1 ( q1 , q2 ) q1[ a (q1 q2 ) c]
max 2 ( q1 , q2 ) q2 [a (q1 q2 ) c ]
q2
q1
1 (q1 , q2 ) * * * [a (q1 q2 ) c] q1 (1) a 2q1 q2 c 0 q1
1 ,2
重复剔除严格劣策略均衡是(上,中)
·

乙 中

1 ,2
五、重复剔除严格劣策略有两个缺陷
1、每一步剔除需要局中人间相互了解的更进一步假定,
如果我们把这一过程应用到任意多步,需要假定“局中人
是理性的”是共同知识。 2、这一方法对博弈结果的预测经常是不准确的.
例2.2 石头、剪刀、布的支付矩阵
3、支付函数 (Payoff functions) 表示为: G {S1 ,..., S n ; u1 ,..., un }
三、两种特殊博弈类型 1、有限博弈: (1) 博弈中局中人人数有限;
(2) 每个局中人只有有限个策略。
2、零和博弈:
博弈中局中人所获支付之和为零,即一方
所得为另一方所失。
例2.1 囚徒困境及其策略型表示 (Tucker,1950)
1、局中人:甲,乙 2、策 略:S甲 S乙 {坦白,不坦白}
3、支付函数——支付矩阵(双人有限博弈) 每个位臵上第一个数字表示局中人1在对应的策略组合 中得到的支付,第二个数字表示局中人2的相应所获支付。
囚徒困境的支付矩阵


坦白
si ( s1 ,...si 1 , si 1 ,..., sn ) S i ( S1 ,...Si 1 , Si 1 ,..., S n )
都有 ui ( si, si ) ui ( si, si ) 且其中至少有一个为严格不等式 ,则称 si 是第i个 局中人的一个严格劣策略。
ui ( si , s ) u ( s , s i i i i ), si S i

si arg max ui ( si , s i ), i 1, 2,..., n si S i
( s ,..., s 则称策略组合 1 n )是此博弈G的一个纳什均衡。

设: 两寡头固定成本都为0,边际成本为常数c,
消费者对厂商1和2生产产品的需求量分别为:
q1 ( p1 , p2 ) a p ;1 bp2
四、纳什均衡的求法
1、双人有限博弈:双划线法
首先对局中人 2 的每一个策略,局中人 1 寻找支付最大 的策略,在其对应支付下划线; 然后对局中人1进行相应的步骤; 最后,凡是两个局中人支付下均被划线的结局就是纳 什均衡。
例2.1 囚徒困境的纳什均衡
用双划线法可以求出纳什均衡:
(坦白,坦白),(-6,-6) 意义:揭示个人理性与集体理性之间的矛盾。
三、重复剔除严格劣策略
1 、根据理性的局中人不会选择严格劣策略这一原则,可
以通过重复剔除严格劣策略的方法对博弈进行求解。
2 、其方法是:对每个局中人寻找严格劣策略,由于它不
会被局中人选择实施,所以找到一种后就可以将其从博弈
局势中剔除,从而得到一种新的缩减后的博弈局势,对这 种新局势重复上述过程,直到无法找到新的严格劣策略为 止。
1 ,2 0 ,1
0 ,1 2 ,0
乙:“右”相对于“中”是严格劣策略
·

乙 左 中 右
上 下
1 ,0 0 ,3
1 ,2 0 ,1
0 ,1 2 ,0
甲:“下”相对于“上”是严格劣策略
·

乙 左 中
上 下
1 ,0 0 ,3
1 ,2 0 ,1
乙:“左”相对于“中”是严格劣策略
·

乙 左 中

1 ,0
1 1 (q , q ) (a c), (a c) 3 3
1 2
1 2 (a c) 9
1 2
两寡头产量串谋模型
假设两寡头可以串谋,共同确定产量Q使总利润最大化, 利润函数为:(Q)=Q(a-Q-c)
1 总利润最大的产量为: Qm (a c) 2 1 Q1 Q2 Qm (a c) ——称为契约曲线 2 1 2 总利润为: m (a c) 4 2 Q q q2 ( a c ) 比较及含义: m 1 3 2 m 1 2 (a c) 2 9
女 男 足球 芭蕾
足球 3 ,2 -1,-1
芭蕾 1,1 2,3
女 男 足球 芭蕾
足球 3 ,2 -1,-1
芭蕾 1,1 2,3
例2.8
猜左右手游戏
局中人:甲,乙 策 略:甲:放左手,放右手
乙:猜左手,猜右手
支付矩阵:见下一页 没有纳什均衡
乙 甲 放左手 放右手
猜左手 -1,1 1,-1
猜右手 1,-1 -1,1

甲 坦白 不坦白
坦白 -6,-6 -8,-1
不坦白 -1,-8 -2,-2

甲 坦白 不坦白
坦白 -6,-6 -8,-1
不坦白 -1,-8 -2,-2

甲 坦白 不坦白
坦白 -6,-6 -8,-1
不坦白 -1,-8 -2,-2
例2.7 智猪博弈(boxed pigs) 局中人:大猪,小猪
策 略:大猪:按,等待 小猪:按,等待 支付矩阵:见下一页 纳什均衡:(按,等待)
下中上
1,-1
1,-1
-1,1
1,-1
1,-1
3,-3
例2.4 性别大战(battle of the sexes) 局中人:男,女

略:男:看足球,看芭蕾
女:看足球,看芭蕾
支付矩阵:见下一页
性别大战的支付矩阵
女 男 足球 芭蕾
足球
3,2 -1,-1
芭蕾
1,1 2,3
第二节 重复剔除严格劣策略均衡
三、纳什均衡的定义 1、博弈的纳什均衡是这样一种最优策略组合, 是一种你好、我好大家都好的理性结局,其中每一 个局中人均不能也不想单方面改变自己的策略而增 加收益,每个局中人选择的策略是对其他局中人所 选策略的最佳反应。
三、纳什均衡的定义
2、数学定义: 在策略型博弈 G {S1 ,..., S n ; u1 ,..., un } 中,如果对于每个局中 人i,存在 si Si ,都有
博弈论与信息经济学
Game Theory and Information Economics
第二部分 非合作博弈理论
主要内容
第二章 策略型博弈 第三章 扩展型博弈 第四章 贝叶斯博弈 第五章 动态贝叶斯博弈
第二章 策略型博弈
——同时行动,如何决策
第一节
第二节 第三节
策略型博弈的表示
重复剔除严格劣策略均衡 纳什均衡
四、囚徒困境的解
对局中人甲而言,无论局中人乙采取何种策略,采用 “不坦白”策略得到的支付都小于采用“坦白”策略。 局中人甲的“不坦白”策略严格劣于“坦白”策略. “不坦白”策略都是一种严格劣策略,从而可以剔除。 博弈中局中人各自从自身利益出发的理性选择(博弈均 衡解)就是(坦白,坦白)。
例2.1 囚徒困境的支付矩阵
不坦白
坦白
不坦白
-6,-6
-8,-1
-1,-8
-2,-2
例2.2 石头、剪刀、布的支付矩阵
乙 甲 石头 剪刀
石头 0,0 -1,1
剪刀 1,-1 0,0
布 -1,1 1,-1

1,-1
-1,1
0,1
例2.3 田忌赛马的支付矩阵
田忌 齐王 上中下 上下中 中上下 中下上 下上中 上中下 上下中 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 3,-3 -1,1 -1,1 1,-1 1,-1 1,-1 3,-3 1,-1 -1,1 1,-1 1,-1 1,-1
第四节
第五节
混合策略纳什均衡
纳什均衡的存在性
博弈有两种表述方法
策略型(标准型)表述
——适合表示静态博弈 扩展型表述
——适合表示动态博弈
第一节
策略型博弈的表示
一、策略型博弈的含义
完全信息静态博弈又称为策略型博弈。完全信息是指
局中人对自己与其他局中人的所有与博弈有关的事前信息
相关文档
最新文档