博弈论与信息经济学混合战略纳什均衡
博弈论与信息经济学-2-2混合均衡

混合战略
• 定义: 在n个参与人博弈的战略式表述G = {S1, ..., Sn;u1, ..., un}中,假定参与人i有K个纯 战略: Si = {si1, ..., siK},那么,概率分布σ i = (σ i1,..., σ iK)称为i的一个混合战略,这里σ ik =σ (sik)是i选择Sik的概率,对于所有的k = 1,..., K,0≤σ ik ≤ 1,∑1Kσ ik = 1。 • 纯战略可以理解为混合战略的特例,比如说, 纯战略si1等价于混合战略σ i = (1,0,...,0), 即选择纯战略si1的概率为1,选择任何其他纯 战略的概率为0。
混合战略纳什均衡
• 根据上述道理,纳什均衡也可以表述如下: • 定义: σ * = (σ 1*,...,σ i* ...,σ n*)是一个 纳什均衡,如果对于所有的参与人i,
sik∈Si • 若σik等于0,则上式严格不等式成立, sik不进入混合战略;若σik不等于0,则 上式的等式成立,sik进入混合战略。
博弈论与信息经济学
第2章 完全但不完美信息静态博弈-2 ——混合战略纳什均衡
主要内容
• • • • • • 占优战略均衡、重复剔除的占优均衡 纳什均衡 库诺特寡头竞争模型 混合战略纳什均衡 纳什均衡的存在性和多重性 聚点均衡和相关均衡
纯战略纳什均衡
• 纳什均衡定义为一个满足所有参与人的 效用最大化要求的战略组合,即 (s1*,...,si*, ...,sn*)是一个纳什 均衡,当且仅当对于所有的i,si* ∈argmax ui(si,s-i*)。 • 根据这一定义,有些博弈不存在纳什均 衡。
支付最大化法
• 对上述效用函数求微分,得到政府最优化的一 阶条件为: • dυ G/dθ = 5γ – 1 = 0 • 因此, • γ * = 0.2 • 就是说,在混合战略均衡下,流浪汉以0.2的 概率选择寻找工作,以0.8的概率选择游荡。
混合策略纳什均衡

02
混合策略纳什均衡的基本理论
纳什均衡的定义与性质
纳什均衡的定义
在博弈中,如果每个玩家都采取自己的最优策略,那么整个博弈会达到一种均 衡状态,即所有参与者的利益达到最大化。
纳什均衡的性质
纳什均衡是一种自我稳定的状态,即使受到外部干扰,也会迅速恢复到原始状 态。此外,纳什均衡也是最优的,因为它使得每个参与者的利益都达到最大化 。
其次,现有的研究往往只关注特定的博弈模型, 对于更一般化的博弈模型,尤其是对于连续型博 弈和多阶段博弈的研究还比较缺乏。
首先,混合策略纳什均衡的概念和性质仍需进一 步深化和研究。例如,对于非完全信息博弈,如 何准确地刻画混合策略纳什均衡点的数量和分布 等问题仍需探索。
最后,现有的研究主要集中在理论层面,对于如 何将混合策略纳什均衡应用到实际问题中,如何 设计和制定有效的混合策略等问题还需要进一步 探讨。
未来研究方向与挑战
未来研究可以进一步拓展混合策略纳什均衡的应用领域,例如在经济学、政治学、社会学等领域的应 用。
另外,针对现有的研究不足,未来研究可以深入探索混合策略纳什均衡的性质和计算方法,以及如何设 计和制定有效的混合策略等问题。
此外,未来的研究还可以进一步拓展混合策略纳什均衡的理论框架,例如在多阶段博弈、不完全信息博 弈、非线性博弈等领域的研究。
略纳什均衡来分析。
在生物学领域的应用
在生物学中,混合策略纳什均衡可以用来研究生物种 群的进化稳定性和生态平衡。
在生态系统中,生物种群可以通过选择不同的繁殖、 迁徙、捕食等策略来适应环境变化,这种博弈关系可 以通过混合策略纳什均衡来分析。
在其他领域的应用
在社会学中,混合策略纳什均衡可以用来研究社会群 体中的合作与竞争关系。
混合策略纳什均衡例子

混合策略纳什均衡例子混合策略纳什均衡是博弈论中的一个重要概念,指的是各参与者选择一个概率分布作为他们的策略,从而达到一个稳定的状态。
在混合策略纳什均衡中,没有任何参与者可以通过单独改变自己的策略来获得更好的结果。
一个经典的混合策略纳什均衡的例子是“岩石-剪刀-布”游戏。
在这个游戏中,两个参与者(称为玩家1和玩家2)可以选择出岩石、剪刀或布中的任意一种。
每一种选择都有一定的胜负规则:岩石胜剪刀,剪刀胜布,布胜岩石。
假设玩家1选择出岩石、剪刀和布的概率分别为p1、q1和r1,玩家2选择出岩石、剪刀和布的概率分别为p2、q2和r2。
两个玩家的利益可以用一个支付矩阵表示如下:| 岩石 | 剪刀 | 布-----------------------------岩石 | 0 | -1 | 1-----------------------------剪刀 | 1 | 0 | -1-----------------------------布 | -1 | 1 | 0在混合策略纳什均衡中,每个玩家选择的概率分布必须使得对于每一种选择,玩家都不希望改变自己的概率分布。
在这个例子中,我们可以通过计算来找到混合策略纳什均衡。
假设玩家1选择出岩石的概率为p1,则选择剪刀的概率为q1=1-p1-0=1-p1,选择布的概率为r1=0-0=0。
同样地,玩家2选择出岩石的概率为p2,则选择剪刀的概率为q2=1-p2-0=1-p2,选择布的概率为r2=0-0=0。
为了找到混合策略纳什均衡,我们需要检查每一种选择,并确保玩家对于每一种选择都不希望改变自己的概率分布。
在这个例子中,无论玩家1选择什么概率分布,玩家2都可以通过选择相应的概率分布来获得更好的结果。
所以,不存在一个混合策略纳什均衡。
总结起来,混合策略纳什均衡是博弈论中一种稳定的策略选择状态,即不存在任何参与者可以通过单独改变自己的策略来获得更好的结果。
岩石-剪刀-布游戏是一个经典的混合策略纳什均衡的例子,其中玩家的选择概率分布是关键因素。
博弈论-混合策略纳什均衡

政治学的案例分析
总结词:国际关系
详细描述:在国际关系中,混合策略纳什均衡可以用来解释 国家之间的竞争和合作。例如,两个国家可能会以一定的概 率选择不同的外交政策,例如结盟、中立或对抗,以达到各 自的利益最大化。
生物学的案例分析
总结词
捕食者-猎物博弈
详细描述
在生物学中,混合策略纳什均衡可以用来解释捕食者与猎物之间的博弈。例如,捕食者 可能会采用追逐和放弃两种策略来捕猎猎物,而猎物也可能会采用逃跑和装死两种策略 来避免被捕食。最终,捕食者和猎物都以一定的概率随机选择不同的策略,以达到均衡
非合作博弈论
研究个体如何在不知道其 他个体如何行动的情况下 做出最优决策。
博弈论的基本概念
参与者
参与博弈的决策主体, 可以是个人、组织或国
家。
行动
参与者根据给定的信息 所做出的决策。
信息
参与者在进行决策时所 拥有的数据、情报或知
识。
策略
参与者为达到最优结果 而采取的一系列行动的
方案。
博弈论的应用场景
状态。
生物学的案例分析
总结词:繁殖竞争
VS
详细描述:在生物种群中,不同个体 之间会存在繁殖竞争。为了最大化自 己的遗传贡献,个体可能会采用不同 的交配策略,例如追求高繁殖成功率 的策略或避免过度竞争的策略。混合 策略纳什均衡可以用来描述这种竞争 状态下的交配行为。
THANKS FOR WATCHING
繁殖博弈
在繁殖博弈中,生物个体通过选择不同的繁殖和竞争策略来繁衍后代。混合策略纳什均衡可以用来分 析繁殖过程的均衡结果,解释生物多样性的形成机制。
05 混合策略纳什均衡的案例 分析
经济学的案例分析
博弈论混合策略纳什均衡名词解释

博弈论混合策略纳什均衡名词解释博弈论混合策略纳什均衡是指在博弈论中,当参与者不能确定选
择某一个策略时,采取混合策略的情况下达到的均衡状态。
具体来说,混合策略是指在一个博弈中,参与者以一定的概率选
择不同的纯策略。
而纳什均衡是指在一个博弈中,参与者无法通过单
独改变自己的选择来获得更好的结果,即不存在任何参与者可以通过
改变自己的策略来让其他参与者不再选择当前策略。
混合策略纳什均衡是指游戏中所有参与者以一定的概率选择不同
的纯策略,并且这种概率分配对于所有参与者都是最优的。
也就是说,在混合策略纳什均衡下,参与者没有更好的选择可供其采取,而其他
参与者也没有更好的概率分配可供其选择。
拓展:
在博弈论中,还有许多其他类型的均衡概念,例如纯策略纳什均衡、帕累托均衡、部分均衡等等。
纯策略纳什均衡是指游戏中参与者
以确定性的纯策略进行选择,使得没有参与者可以通过改变其策略来
获得更好的结果。
帕累托均衡是指在一个博弈中,不存在可以改善任
何一个参与者的情况。
部分均衡是指只有某些参与者达到均衡状态,而其他参与者未达到均衡状态。
博弈论是研究决策制定者在相互影响下进行决策的数学工具。
通过分析不同的博弈策略和可能的结果,博弈论可以帮助我们理解冲突和合作的情况,并提供一些决策建议。
博弈论与信息经济学-2-1纳什均衡

没有占优战略均衡
(1):多劳不多得
Baldwin & Meese (1979)
新产品研发与模仿
智猪博弈(2):多劳反而少得 小猪 按 等待
大猪
按
3, 1
2, 4
等待
7, -1
0, 0
理性与剔除劣战略
最优反应
参与人i对其他参与人选择的战略s−i的最 优反应或最优应对是为其产生最大支付 的战略s*i,即 i(s*i , s−i) i(s’i, s−i),s’i s*i 如果没有其他战略同样地好,就是严格 最优反应,否则,就是弱最优反应。
弱占优战略
一般地,si*Si 称为参与人i的占优战略, 如果对应所有的si’Si 和所有的s-iS-i, si*是i的弱占优选择,即 ui(si*,s-i)≥ui(si’,s-i),s-iS-i, si’≠si* 对应地,所有的si’≠si*被称为si*的劣战 略。
占优战略
Sherlock Holmes said, whenever you have eliminated the impossible, whatever remains – no matter how improbable – must be the truth.
占优战略
一般来说,由于每个参与人的效用(支付)是博 弈中所有参与人的战略的函数,因此每个参与 人的最优战略选择依赖于所有其他参与人的战 略选择。 在一些特殊的博弈中,一个参与人的最优战略 可能并不依赖于其他参与人的战略选择,就是 说,不论其他参与人选择什么战略,他的最优 战略是唯一的,这样的最优战略被称为占优战 略(dominant strategy)。——上策 对应地,其他战略称为 “劣战略”( dominated strategy )——下策。
《博弈论与信息经济学》纳什均衡的应用-PPT精选全文完整版

pi 2 ln Y ln N 2 ln N 1 ln n 1 ln y 1
p
N
n
2 ln Y
N
n
1 ln
N
N
n
2 ln
N
1
N n 1 ln n 1 N n 1 ln y 1
si
2 ln Y
2 ln
N
2 ln
n
2
ln
y
1
s
N
n
2 ln Y
N
n
2 ln
N
N
n
2 ln
n
2
p 2 ln y 3 ln y 6 2 ln y 3 y 6 4 ln y 4 ln 3 2 ln 2
s
4 ln y
4 4 ln y 8ln 2
s p 8ln 2 4 ln 3 2 ln 2 4 ln 3 6 ln 2 ln 81 ln 64 2 ln 9 8 0
y ,
6
2
ln
y 3
ln
y 6
每一期的消费量y1
2 3
y,y2
1 3
y
10
博弈论与信息经济学
2024/10/15
b.社会效益最大化模式 假定以整个村庄的人对公地消费的总体效用达到最大化为目标,即公地问
题的社会最优问题。
ln c1
ln c2
2 ln
y
c1 c2
2
最优条件为:
c1
pi s
p
2024/10/15
16
博弈论与信息经济学
比较的结果说明:
1 从社会整体上看,以社会利益最大化为目的的消费管理
方式优于以个人利益最大化的消费管理方式;
《博弈论与信息经济学》混合战略纳什均衡

-1
2019/1/6
1
博弈论与信息经济学
假定父母选择支助的概率为p1,选择不支助的概率为p2 1- p1 ; 儿子选择立志的概率为q1,选择不立志的概率为q2 1- q1 。那么 对两个参与人,各自的盈利函数为: v1 3 p1q1 1 p1q2 1 p2 q1 5 p1q1 p1 q1 v2 2 p1q1 p2 q1 3 p1q2 2 p1q1 q1 3 p1 v1 p 5q1 1 0 p1 p2 0.5 1 v2 1 2 p 0 q1 0.2,q2 0.8 1 q 1
p 1 甲
1/2
乙
O
2019/1/6
1/2
10
1
q
博弈论与信息经济学
解法2:代数法
* v甲 p, q 2 p 1 2q 2q 1 v甲 p 1 2q 0 p 1 2 * v乙 p, q 2q 2 p 1 2 p 1 v乙 q 2 p 1 0 q 1 2
乙 甲/乙 红(p) 黑(1-p) -1 1 红(q) 1 -1 黑(1-q) 1 -1 -1 1
例1.
甲
v甲 p, q 2 p 1 2q 2q 1 期望盈利为: v乙 p, q 2q 2 p 1 2 p 1
14
博弈论与信息经济学
A/B/C (sc=1) 1 A 2 3 A/B/C (sc=2) 1 A 2 3 A/B/C (sc=3) 1 A 2
B 1 3,3,3 2,3,3 1,3,3 2 3,2,3 2,2,3 1,2,3 B 3 3,1,3 2,1,3 1,1,3
混合策略纳什均衡

03 混合策略纳什均衡的证明 方法
反证法
总结词
通过假设不成立来证明均衡的存在。
详细描述
反证法是一种常用的证明方法,它首先假设与结论相反的命题成立,然后通过逻辑推理和数学推导,得出矛盾的 结论,从而证明原命题的正确性。在证明混合策略纳什均衡的存在时,反证法可以用来证明当其他玩家采取了最 优策略时,某个玩家采取混合策略能够达到最优结果。
唯一性意味着在给定对手策略的情况下,每个参与者都只有一个最优反应,从而 避免了复杂的策略互动和不确定性。
存在性
混合策略纳什均衡的存在性是指在某 些博弈中,至少存在一个策略组合, 使得每个参与者在给定其他参与者策 略的情况下,采用混合策略是最优的 。
存在性通常通过数学证明和计算机搜 索等方法来证明,但并不是所有博弈 都有混合策略纳什均衡。
混合策略纳什均衡
目录
CONTENTS
• 混合策略纳什均衡的定义 • 混合策略纳什均衡的特性 • 混合策略纳什均衡的证明方法 • 混合策略纳什均衡的应用场景 • 混合策略纳什均衡的局限性 • 混合策略纳什均衡的发展前景
01 混合策略纳什均衡的定义
定义
混合策略纳什均衡是一种博弈论中的均衡概念,它描述了在 给定对手策略的情况下,参与者如何选择最优策略以最大化 自己的期望收益。
代数法是一种通过数学符号和公式进行推 理和证明的方法。在证明混合策略纳什均 衡的存在时,代数法可以用来推导和证明 纳什均衡的条件和性质,利用代数性质和 技巧来证明均衡的存在。
04 混合策略纳什均衡的应用 场景
经济学
竞争策略分析
混合策略纳什均衡在经济学中被用于分析竞 争策略,特别是在不完全竞争市场和寡头垄 断市场中。通过混合策略纳什均衡,可以研 究企业在不确定环境下的最优反应,以及企 业如何通过调整其策略来应对竞争对手的行 为。
张维迎《博弈论与信息经济学》讲义-第02章-纳什均衡与一致预期

最优选择
这个博弈只要求一阶理性共识就可以预测均衡 结果: 如果R相信C是理性的,R就知道C不会选择C3, 所以R的最优选择是R1; R R1 如果C相信R是理性的,C就知道R不会选择R2, 所以C的最优选择是C2. 但要C预期R不会选择R3,需要二阶理性共识; 要R不预期C会选择C1,需要三阶理性共识.
– – – – 如果R(b)C 选择C2, 如果R(b)C(b)R会选择R2; 如果R(b)C(b)R(b)C会选择C1; 如果R(b)C(b)R(b)C(b)R会选择R1
Consistently aligned beliefs (CAB)
考虑(R3,C3):对方不会犯预期错误:R选 择R3,如果他认为C会选择C3;C会选择C3, 如果他认为R会选择R3. CAB CAB:每个人对别人行为的预期(信念)是正 确的; Harsanyi doctrine: 如果两个理性的人具有相同 的信息,他们一定会得出相同的推断和相同的 结论; Robert Aumann: rational agents cannot agree to disagree.
重复剔除与理性共识
重复剔除不仅要求每个人是理性的,而且要求每个人 知道其他人是理性的,每个人知道每个人知道每个人 是理性的,如此等等,即理性是"共同知识"(共识) C1 R1 R2 R3 10,4 9, 9 1,98 C2 1, 5 0, 3 0,100 C3 98,4 99,8 100,98 这个博弈只要求 一阶理性共识就 可以预测均衡结 果. 如果把(下-左) 的第一个数字改为 11呢?
纳什均衡与一致预期
张维迎 教授 北京大学光华管理学院
博弈的基本概念(1)
参与人(players):博弈中决策主体的集合:什 么人参与博弈?每个人是什么角色? 行动(actions): 每个人有些什么样行动可以选 择?在什么时候行动? 信息(information):在博弈中的知识;每个人 知道些什么(包括特征,行动等)? 战略(strategies):行动计划;每个人有什么战 略可供选择?战略的完备性;
混合策略纳什均衡

混合策略纳什均衡混合策略纳什均衡是博弈论中一个重要的概念。
纳什均衡是指在一个博弈中,每个参与者都选择了最优的策略,而且即使其他参与者知道其他参与者的策略,他们也无法从自己的策略中获得更大的利益。
而混合策略则是指参与者通过随机化选择不同策略的概率来达到最优策略。
本文将深入探讨混合策略纳什均衡的概念、特点以及计算方法。
首先,混合策略纳什均衡是指参与者通过一定概率选择不同策略的方式达到最优策略。
在混合策略中,每个参与者都拥有一个策略概率分布,表示他们在不同策略下的选择概率。
这样,在博弈中,每个参与者将根据其策略概率分布中的概率随机选择其中一种策略。
对于每个参与者而言,他们的目标是通过选择最优的策略概率分布来最大化自己的期望收益或最小化自己的期望损失。
其次,混合策略纳什均衡与纳什均衡相比具有以下特点。
首先,混合策略纳什均衡可以推翻完全信息博弈中的固定策略均衡结果。
在完全信息博弈中,参与者可以根据对其他参与者策略的了解来做出精确决策,因此均衡状态是唯一确定的。
而在混合策略博弈中,由于参与者通过概率选择不同策略,他们无法准确地预测其他参与者的策略,因此均衡状态不再是唯一确定的。
其次,混合策略纳什均衡可以引入不确定性,增加博弈的复杂性。
参与者无法准确地预测其他参与者的策略,因此他们需要通过一定的概率选择策略来平衡风险与收益。
最后,混合策略纳什均衡可以通过均衡态的共同选择来实现长期的稳定状态。
在混合策略纳什均衡中,参与者通过随机化选择策略,从而消除了其他参与者可以预测自己策略的可能性,增加了稳定性。
最后,计算混合策略纳什均衡的方法主要有以下两种。
一种是通过计算参与者的最优策略概率分布来确定混合策略纳什均衡。
这种方法主要基于线性规划技术,通过最大化或最小化参与者的期望收益或损失来确定最优的策略概率分布。
另一种方法是通过迭代算法来求解混合策略纳什均衡。
这种方法主要是通过反复更新参与者的策略概率分布,直到达到均衡状态。
《博弈论与信息经济学》纳什均衡

14
博弈论与信息经济学
1 2
D
pm
n
1
pm
n
1
0
• 是明确的,但是下式是否成立,有待于证明:
D
pm
n
1
pm
n
1
1 2
D
pm
n
pm
n
Q D p 1 D p
D pm n 1 D pm n
Q pm 2
pm
n
1
1 2
pm
n
1 2
pm
1
0
D
pm
n
1
pm
n
1
1 2
D
pm
n
pm
n
2020/6/11
如果参与人i战略si*与其它的战
略si相比,存在:ui si, si ui si, si 且ui si, sˆi ui si, sˆi ,
则称si是si的(弱)占优策略, si是si的(弱)劣策略。
李四/
张三
♠
李 ♥ 10 四 ♦ 10
张三
♣
55
0
0
0
1
2020/6/11
3
博弈论与信息经济学
R2
公司2
C1
C2
2,12 1,10
0,12 0,10
10
1
1
公司1/公 司2
R1 公 司 R2
R3
公司1/公 司2
公 R1 司
R3
公司2
C1
C3
2,12 1,12
0,12 0,11
0,12 0,13
公司2
C1
C3
2,12 1,12
《博弈论与信息经济学》纳什均衡

情侣博弈中,如果双方都预见到对方的策略,并选择相同的策略 ,形成完美纳什均衡。
04
信息经济学与纳什均衡
信息经济学的基本概念
信息经济学是一门研究信息不对称条件下市场交易行为的学科。 它探讨了信息不对称如何影响市场交易,以及如何通过制度安排 来减少信息不对称对市场交易的影响。
信息经济学主要关注信息获取、信息传递、信息披露和信息甄别 的成本和效益,以及这些因素如何影响市场交易和资源配置。
纳什均衡的未来研究方向
放宽假设条件
未来的研究可以尝试放宽纳什均衡的假设条 件,使其更接近现实情况,提高理论的适用 性。
探索混合策略
混合策略是纳什均衡中的一个重要概念,但目前对 其研究还不够深入,未来可以进一步探索混合策略 的性质和应用。
博弈论与其他学科的交叉 研究
可以尝试将博弈论与其他学科(如心理学、 社会学等)进行交叉研究,以更全面地理解 人类行为和市场现象。
信息经济学还涉及到公共品、外部性、垄断等其他市场失灵问题,旨在通过合理的制度安排来解决这些 问题,促进市场的有效运行和社会福利的最大化。
05
纳什均衡的实例分析
囚徒困境的纳什均衡
总结词
在囚徒困境中,两个囚犯都有坦白和抵赖两种选择,最终的纳什均衡是两个囚犯都选择 坦白,即(坦白,坦白)。
详细描述
在囚徒困境中,两个囚犯都有坦白和抵赖两种选择。如果一个囚犯选择抵赖,而另一个 选择坦白,那么选择抵赖的囚犯将会被判刑更长时间。然而,如果两个囚犯都选择抵赖 ,他们都将被判刑较短时间。但由于囚犯之间无法建立信任,最终的纳什均衡是两个囚
纳什均衡在经济学中的影响与贡献
01
丰富了经济学理论
纳什均衡为经济学提供了一种重 要的分析工具,丰富了经济学理 论体系。
博弈论第三章混合策略纳什均衡.

如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
vG 1,
4
1 vG 0,
0.2
• 解二:支付等值法
如果一个混合策略是政府的最优选择,那一定意 味着流浪汉在寻找工作与游闲之间是无差异的, 即:
vL 1, 1 3 vL 0, 0.5
游闲
(3,2) (-1,3)
(-1,1) (0,0)
政府和流浪汉的博弈
• 思考:政府会采用纯策略吗?流浪汉呢?这 个博弈有没有纯策略的纳什均衡? • ——跟你玩剪子石头布游戏一样,你会一直 采用纯策略吗? • 那么政府和流浪汉最有可能采用什么策略? • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略,就可以采用针 对性的策略,使自己的支付增加。
L 2 1 0
0.5
解二:支付等值法
• 政府选择救济策略 • 政府选择不救济策略
0 1 期望效用 期望效用 vG 1, 3 11 vG 0, 1 01 4 1
EUA p1 X 1 p 2 X 2 ... pnXn
政府和流浪汉的博弈
• 政府想帮助流浪汉,但前提是后者必须试图寻 找工作,否则,不予帮助;而流浪汉若知道政 府采用救济策略的话,他就不会寻找工作。他 们只有在得不到政府救济时才会寻找工作。他 们获得的支付如图所示:
流浪汉
寻找工作
救济 政府 不救济
乙 红q 红p 甲 黑1-p -1, 1 1, -1 黑1-q 1, -1 -1, 1
§ 反应函数
• A的目标是期望支付越大越好。我们之所以把A的 期望支付整理成不含p的一项和含p的一项这个样 子,是因为A只能选择p而不能q,因此,A能通过 选择p来影响第一项,而不能直接影响第二项。 (1-2q)>0即q<1/2时,A把p选择等于1最好;当 (1-2q)<0即q>1/2时,A把p选择等于0最好;当 (1-2q)=0即q=1/2时,A可以在[0,1]之间随便 选择一个p。这样我们可以得到A的反应函数是, 同样道理我们可以得到B的反应函数。 • 0, 如果q>1/2 1, 如果p>1/2 • p [0,1], 如果q=1/2 q [0,1], 如果p=1/2 • 1, 如果q<1/2 0, 如果p<1/2
博弈论与信息经济学部分课后习题答案

解:(1)成为先行者意味着 3 点:1.企业可以赚取比古诺状态下更多的利润,否则没有动机成为先行者;2.追随企业没有办法威胁 先行企业,即选取产量使己方产量为正,它方产量为负 3.如果另一企业成为先行者,该企业可以成功威胁另一企业max 1q1, q2 100 0.5q1 0.5q2 q1 5q1 q1先求古诺均衡:q195 0.5q2max 2 q1, q2 100 0.5q1 0.5q2 q2 0.5q22q2q1 80, q2 30,因此为满足条件 1,对于任何先行动者来说,必须有 q1 80, q2 30 (否则追随者可以选取产量,使价格等于古诺价格,此时先行者利润低于古诺均衡时情况)a.如果企业 2 成为领导者,观察企业 1 能否采取威胁战略使己方利益为正,对方利益为负: 1 q1, q2 100 0.5q1 0.5q2 q1 5q1 0即: 2 q1, q2 100 0.5q10.5q2 q20.5q2 20 200 2q2 q1 190 q2对于企业 2 的任何产量先行决策 q2 10 ,只要企业 1 威胁其产量 q1 将满足上式,则企业 2 将不敢先行动若 q2 10 ,与先行动者的 q2 30 矛盾。
因此企业 2 不会是先行者b.考虑企业 1 能否成为先行者,由 a 已经知道企业 1 可以成功在企业 1 先行时成功威胁企业 2。
故只需考虑如果企业 1 先行,企业 2 能否威胁企业 1当企业 1 先行动时,企业 2 决策max 2 q1, q2 100 0.5q1 0.5q2 q2 0.5q22 q2 q2 50 0.25q1企业 1 决策:max 1q1, q2 100 0.5q1 0.5q2 q1 5q1 q1 max 70 0.375q1 q1 q1 q1 380 93.33 3因此企业 1 的产量决策范围为 80 q1 93.33而企业 2 要惩罚企业 1 为领导者必须满足2 q1, q2 1 q1, q2 100 0.5q1100 0.5q1 0.5q2 0.5q2q2q1 0.5q22 5q1 00 190 q1 q2 100 0.5q1 q1 180这与 80 q1 93.33 矛盾。
博弈论与信息经济学-2-3纳什均衡存在性

纳什均衡的存在性
• 是不是所有的博弈都存在纳什均衡呢? 不一定。 但是,纳什(Nash,1950)证明,任何有限博弈 都存在至少一个纳什均衡。 • 纳什均衡的存在性定理-I (Nash,I950):每一 个有限博弈至少存在一个纳什均衡(纯战略的或 混合战略的)。 • 这里,有限博弈指的是有有限个参与人且每个 参与人有有限个纯战略的博弈。
在紧定义域上的非连续函数 没有最大化自变量值
应用Kakutani不动点定理 证明纳什均衡的存在性
• 进一步,期望效用函数的线性意味着, 如果σ ’∈r(σ ),σ ’’∈r(σ ), 那么λ σ ’ + (1 - λ )σ ’’ ∈r(σ ),λ ∈(0, 1),即如果 σ i’和σ i’’是对应于σ -i的最优选择,那么 它们的加权平均也是对应于σ -i的最优选 择,因此,ri(σ ) 从而r(σ )是凸的。
连接函数f(.)图像上任意两点的直线完全在图像之下;
函数f:AR的图像是集合{(x, y) AR: y=f(x)}
ห้องสมุดไป่ตู้
>
一个自变量的严格凹函数
连接两点x和x’的直线在图像上。
不严格的凹函数
连续性和紧性假设对于使函数最大化的 自变量值的存在性的必要性
在非紧定义域上的连续函数 没有最大化自变量值
∑→∑
γ =1
∑1 =1
=0 ∑2
γ =0
应用Kakutani不动点定理 证明纳什均衡的存在性
• 首先,因为每一个∑i都是一个概率空间,因而 是(J - 1)维的单纯形(这里J是第i个参与人的纯 战略数量),这意味着∑i(从而∑)是闭的、有界 的、凸的和非空的。 • 设a1, …, ak是Rn中的一组线性无关的点,在 1+…+ k=1以及10,…, k 0时,一切点x= 1a1+…+ kak的集合,称为k-1维单纯形,记为 (a1, …, ak)。 • k=2时的1维单纯形就是线段;k=3时的2维单纯 形就是三角形;k=4时的3维单纯形就是三棱锥, 各有K个顶点。
混合策略纳什均衡计算方法

混合策略纳什均衡计算方法
混合策略纳什均衡是博弈论中的一种解决方法,它指的是在博弈中每个玩家都使用多种策略的概率分布,使得任何一个玩家单独改变自己的策略都不会导致自己的收益增加。
计算混合策略纳什均衡需要使用到线性规划的方法。
具体来说,可以通过列出每个玩家的收益矩阵和概率分布向量的线性规划问题,然后求解这些线性规划问题的最优解从而得到混合策略纳什均衡。
在求解线性规划时,通常使用单纯形法或内点法等算法。
这些算法的基本思想是从某个初始解开始,逐步移动到更优的解,直到不能找到更优解为止。
需要注意的是,在实际应用中,混合策略纳什均衡的计算可能比较复杂,特别是当博弈参与者数量较多或者策略空间较大时。
此外,即使得到了混合策略纳什均衡,也不一定能保证博弈的稳定性,因此需要对结果进行进一步的分析和评估。
总之,混合策略纳什均衡是博弈论中的一种重要解决方法,对于理解和分析博弈问题具有重要的意义。
混合策略纳什均衡

混合策略纳什均衡简介混合策略纳什均衡是博弈论中的一个重要概念,用于描述多方参与的博弈情境中,每个参与者按照一定的概率分布选择不同的策略,使得任何人无法通过改变自己的策略来获得更好的结果。
在这种均衡状态下,每个参与者的预期收益最大化。
混合策略在传统的博弈理论中,参与者通常会选择一个确定性的策略来对抗其他参与者。
然而,在现实生活中,我们经常遇到的情况是,每个参与者都存在一定的不确定性和随机性,犹豫在不同的策略之间选择。
这时,混合策略就应运而生了。
混合策略是指参与者以一定的概率分布选择不同的策略来进行博弈。
例如,在一个石头剪刀布的游戏中,参与者可以以1/3的概率选择石头,1/3的概率选择剪刀,1/3的概率选择布。
这样的不确定性选择使得博弈更具有变数和策略性。
纳什均衡纳什均衡是由约翰·福布斯·纳什在20世纪50年代提出的一个概念,用于描述博弈理论中的均衡状态。
在纳什均衡中,每个参与者选择的策略都是最优的,即在其他参与者选择的策略下,自己无法通过改变策略来获得更好的收益。
通常情况下,纳什均衡是以确定性策略为基础进行定义的。
但是当参与者选择混合策略时,纳什均衡也可以被定义为每个参与者选择混合策略的概率分布,使得任何人都无法通过改变自己的概率分布来获得更高的收益。
混合策略纳什均衡的计算方法计算混合策略纳什均衡的方法主要是通过解析求解和数值求解两种方式。
解析求解解析求解是一种通过代数和数学推导的方式来找到混合策略纳什均衡的方法。
通过建立参与者的效用函数和概率分布函数等数学模型,应用最优化理论和微积分等数学工具,可以得到参与者的最优混合策略。
然而,解析求解的方法通常只适用于简单的博弈情境,并且求解过程繁琐复杂。
数值求解数值求解是一种通过计算机模拟和迭代计算的方式来找到混合策略纳什均衡的方法。
通过构建博弈模型,设定参与者的初始混合策略,然后通过迭代计算,逐渐优化参与者的混合策略,直到收敛到纳什均衡。
信息经济学部分习题解答

解:分企业1第一阶段未引进和引进投资两种情
况,每种情况都用逆推归纳法进行分析。
假设企业1第一阶段未投资引进新技术。此
时两个企业的边际成本都为2,利润函数为:
1 1 q 4 1 q 2 q 1 2 q 1
2 1 q 4 1 q 2 q 2 2 q 2
一阶最优条件为
一阶最优条件为
1
q1
142q1q210
求 故解当可1得9q 6 1 q 221 3144 q2 q11 3 2q1 25122 时10,99 引6 f进新技术
(-3,-2.5)(-5,-5)
信息经济学部分习题解答
战略式表述:(麻烦,自己写)
下雨
丈夫
带伞 不带伞
妻子
带伞
不带伞
-2,-2 -2.5,-3
-3,-2.5 -5,-5
不下雨
丈夫
带伞 不带伞
妻子
带伞 不带伞
-1,-1 -1,0
0,-1
1,1
信息经济学部分习题解答
3.下面的两人博弈可以解释为两个寡头企业的价格竞
u1(A)=u2(B)=u3(C)=2 u1(B)=u2(C)=u3(A)=1 u1(C)=u2(A)=u3(B)=0 找出这个博弈的所有的纳什均衡。
信息经济学部分习题解答
解:所有战略组合的支付函数如下
参与人3选择A
A
参与人 1
B
C
A 2,0,1 2,0,1 2,0,1
参与人2 B
2,0,1 1,2,0 2,0,1
2 p 1 ,p 2 a p 2 p 1 p 2
求各自价格的一阶偏导数,令其等于0,得:
1
p1
ap22p10
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完全信息静态博弈。)
甲/乙
乙 红(q) 黑(1-q)
红(p) -1
11
-1
甲
黑(1-p) 1
-1 -1
1
2020/8/13
期望盈利为:v甲 v乙
p, p,
q q
2p 2q
1 2p
2q 1
2q 1 2 p 1
8
博弈论与信息经济学
2020/8/13
对于甲来说,为使盈利达到最大,只有调整p。如果1 2q 0, 即q 1 ,则p越大越好,而p的最大值只能取1;如果1 2q 0,
v1
p1
v2
q1
5q1 1 0 1 2 p1 0
p1 q1
p2 0.5 0.2,q2
0.8
2020/8/13
2
博弈论与信息经济学
2020/8/13
▪ 进一步浪子博弈还可以作出如下解释:
期望盈利:v1 v2
3 p1q1 2q1 p1
p1q2 q1 p2
p2q1 3q2 p1
参与人i的期望盈利为:vi pi , pi
n
pj
sj
ui
பைடு நூலகம்
s
。
sS j1
6
博弈论与信息经济学
2020/8/13
父母/儿子
支助 父 (p1) 母 不助
(p2)
儿子
立志(q1)
不立志(q2)
32
-1 3
-1 1
00
期望盈利:
1 3 p1q1 p1q2 p2q1 0 2 2q1 p1 q1 p2 3q2 p1 0
B 2 3,2,2 6,6,6 5,6,6
B 2 3,2,1 6,6,5 5,6,5
3 3,1,3 2,1,3 1,1,3
3 3,1,3 6,5,6 5,5,6
3 3,1,1 6,5,5 9,9,9
15
博弈论与信息经济学
解:
矩阵1
A1 A2
r1 2 p1 p2 1 r2 4q1 2 p1
甲
1
1/2
乙
O
1/2
1q
10
博弈论与信息经济学
2020/8/13
▪ 解法2:代数法
v甲 p, q 2 p 1 2q 2q 1 v甲
v乙
p,
q
2q
2
p
1
2
p
1
v乙
p q
1 2q 2p 1
0 0
p* q*
1 1
2 2
▪ 例2.
甲/乙
乙 德(q) 法(1-q)
德(p) 3
21
1
甲
法(1-p) 0
K
pik 1,pik p sik 是i选择战略sik的概率,pi称为参与人i的混合战略。
k 1
i 代表i的混合战略空间,pi i 。
▪ (2)期望盈利
对于博弈G S1,..., Si ,..., Sn;u1,..., ui ,..., un,对应于s s1,..., si,..., sn 有p p1,..., pi ,..., pn ,pi i ,p表示局中人i的混合战略组合,那么,
4q1 2 2 p1 p2 4q2 1 p1 p2 8 p1 4 p2 6 0
4q1 q2 11 p1 p2 1 0
p1*
1 2
,
p2*
0,
p3*
1 2
q1*
1 2
, q2*
0, q3*
1 2
r1*
1 2
,
r2*
0, r3*
1 2
17
博弈论与信息经济学
q2
C
r1
C
r2
4r1 2 2q1 q2 4r2 1 q1 q2 8q1 4q2 6 0
4r1 r2 11 q1 q2 1 0
4r1 2 2 p1 p2 4r2 1 p1 p2 8 p1 4 p2 6 0
4r1 r2 11 p2 p2 1 0
不助 3
3 ,2 -1,1
-1,3 0 ,0
博弈论与信息经济学
▪ 父母的最佳选择p*=0.5,儿子的最佳选择q*=0.2,解释如下:
• (1)当父母选择支助的概率p>0.5时,儿子的最佳选择就是放荡;当父母选择 支助的概率p<0.5时,儿子的最佳选择就是立志。
• (2)当儿子选择立志的概率q>0.2时,父母的最佳选择就是支助;当儿子选择 立志的概率q<0.2时,父母的最佳选择就是不支助。
p*
q*
1, 1,
3,0 4 1 ,0 4
有两个纯战略均衡:(德语,德语)、(法语,法语);
一个混合战略均衡:p*, q* 3 4,1 4。
p
甲
1
3/4 乙
O 1/4
12
1q
博弈论与信息经济学
▪ 解法2:代数法
甲和乙的期望盈利:v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
2
即p 1 ,则q能取任意值,即q 0,1。
2
9
博弈论与信息经济学
2020/8/13
0 如果q 1 2
1 如果q 1 2
反应函数:p 0,1如果q 1 2,q 0,1如果q 1 2
1 如果q 1 2
0 如果q 1 2
由此可知,这个博弈的纳什均衡为p* 1 2,q* 1 2。
p
2020/8/13
14
博弈论与信息经济学
2020/8/13
A/B/C (sc=1)
1 A2
3
A/B/C (sc=2)
1 A2
3
A/B/C (sc=3)
1 A2
3
1 3,3,3 2,3,3 1,3,3
1 3,3,2 2,3,2 1,3,2
1 3,3,1 2,3,1 1,3,1
B 2 3,2,3 2,2,3 1,2,3
❖ 1.混合策略与期望盈利
▪ 例:浪子博弈
• 在这一博弈中,两个参与人都不知道对方选择是否确定地选择某个策略,因此, 按照以前所学的知识无法得出均衡解。但是,如果知道对方将以某一概率对某 一策略进行选择的话,就可以得出反应函数,就可以按照纳什均衡的方法求得 解。
2020/8/13
父母/儿子 父 支助 母 不助
7
博弈论与信息经济学
❖ 2.混合战略纳什均衡
▪ 例1.
对于n人混合博弈G S1, , Sn;u1, ,un,pi si i ,如果
p* p1*, , pn* 满足vi pi*, p*i vi pi , p*i ,则称p*为该博弈
的混合战略纳什均衡。(海萨尼认为,混合战略博弈就是不
2
即q 1 ,则p越小越好,而p的最小值只能取0;如果1 2q 0,
2
即q 1 ,则p能取任意值,即p 0,1。
2
对于乙来说,为使盈利达到最大,只有调整q。如果2 p 1 0, 即p 1 ,则q越大越好,而q的最大值只能取1;如果2 p 1 0,
2
即p 1 ,则q越小越好,而q的最小值只能取0;如果2 p 1 0,
儿子
立志
放荡
32
-1 3
-1 1 0 0
1
博弈论与信息经济学
假定父母选择支助的概率为p1,选择不支助的概率为p2 1- p1 ; 儿子选择立志的概率为q1,选择不立志的概率为q2 1- q1 。那么
对两个参与人,各自的盈利函数为:
v1
3 p1q1
1
p1q2
1
p2q1
5
p1q1
p1
q1
v2 2 p1q1 p2q1 3 p1q2 2 p1q1 q1 3 p1
b.对于儿子的期望盈利v2,如果1 2 p1 0,即父母的混合战略p1 0.5,则
儿子的混合战略取最大值q1 1时,v2最大;相反,如果1 2 p1 0,父母的
混合战略p1 0.5,则儿子的混合战略取最大值q1 0时,v2最大。
儿子 父母/儿子
立志(q1) 放荡(q2)
支助 父 (p1) 母
p2
5
4q1
A3 1 r1 r2 p1 8q1 4q2 6 p2 4q1 4q2 3 9 8q1 4q2
矩阵2
BB21
r1 2q1 r2 4 p1
q2 1 2 q1
q2
5
4
p1
B3
1
r1
r2
q1
8 p1
4
p2
6
q2
4
p1
4
p2
3
9
8 p1
4 p2
矩阵3
C1 C2
0
0
p1 5q1 1 q1 1 2 p1
q1 3
p1
a.对于父母的期望盈利v1,如果5q1 1 0,即儿子的混合战略q1 0.2,则
父母的混合战略取最大值p1 1时,v1最大;相反,如果5q1 1 0,即儿子
的混合战略q1 0.2,则父母的混合战略取最小值p1 0时,v1最大。
2020/8/13
父母/儿子 父 支助 母 不助
儿子
立志
放荡
32
-1 3
-1 1 0 0
4
博弈论与信息经济学
• 从上例中可以看出,当参与人在选择战略具有不确定性, 考虑纳什均衡时,具体战略的盈利已经显得不很重要, 重要的是某个战略的概率分布,因此,纳什均衡的解也 就必须包含概率,这样的支付或盈利就称为期望盈利。
02
3
甲和乙的期望盈利:v甲 v乙
p 4q q4p
1 2q 1 3 3 2 p
11
博弈论与信息经济学
2020/8/13
▪ 解法1:反应函数法