寻找三个纳什均衡

合集下载

纳什均衡

1.纳什均衡：给出对方的策略，你所选的是最优的（至少不比其它策略差），如果每个局中人都是这样，那么所构成的策略组合（对局），就称为纳什均衡。

2.效用：消费者偏好与收入之间的相互作用导致人们做出消费选择，效用则是人们从这种消费选择中所获得的愉悦或满足。

3.边际产量：当其他要素不变时，可变要素增加一个单位所带来的总产量的增加量。

4.生产成本：经营一个企业，为达到利润最大化，必须支付一些资金来维持运营，如建造厂房，采购机器及原料，雇用员工等支出都可视为厂家的生产成本。

5.帕累托标准：如果一种变化可以改善某些人的处境，同时对其他人都没有伤害。

则这种变化是好事，应该给予实行。

6.恩格尔系数：是食品支出总额占个人消费支出总额的比重。

一个家庭收入越少，家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大，随着家庭收入的增加，家庭收入中或者家庭支出中用来购买食物的支出将会下降。

恩格尔系数是用来衡量家庭富足程度的重要指标。

7.效用：消费者偏好与收入之间的相互作用导致人们做出消费选择，效用则是人们从这种消费选择中所获得的愉悦或满足。

8.价格管制：是指政府对新药定价以及上市药品价格上涨实施严格的管制，企业不能自由定价，而是由政府和制药企业谈判决定新药的价格。

9.软着陆：当一个国家经过强劲的经济增长后，仍维持缓和的增长，并未因此转入衰退，即使“软着陆”。

10.硬着陆：一个国家的经济在高速增长的同时伴随着高度通货膨胀，使得经济迅速从增高长直接走入低增长甚至衰退。

11.通货膨胀：平均物价水平持续上扬的状态，通货膨胀率通常是以消费者物价指数（CPI）的变化率来表示。

指数上升→物价上升，货币购买力下降。

12.再贴现率：一般商业银行可以直接向中央银行借贷的利率。

所谓“贴现”：通过一定的方式把发生在未来（或不同时间）的费用和效益转化为现值的方式就叫贴现。

13.机会成本：在资源一定的情况下，多生产一个单位的某种产品，就要以少生产若干单位的另一种产品为代价。

博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡在纳什均衡中，你不一定满意其他的策略，但你的策略是回馈对手招数的最佳策略。

从囚徒困境中我们会发现，作为博弈各方的行动就是针对对方行动而确定的最佳对策，而一旦知道对方在做什么，就没人愿意改变自己的做法。

博弈论学把这么一个结果称为均衡。

这个概念是有普林斯顿大学数学家约翰·纳什提出的，因此被称为纳什均衡。

诺贝尔经济学奖获得者萨缪尔森有句名言，你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只有两个词，供给与需求。

博弈论专家坎多瑞引申说：“要成为现代经济学家，这只鹦鹉必须再多学一个词，这个词就是纳什均衡”。

1950年，还是一名研究生的纳什写了一篇论文，题为《n人博弈的均衡问题》，该文只有短短一页纸，可就这短短一页纸成了博弈论的经典文献。

纳什的贡献是，他证明了在这一类的竞争中，在很广泛的条件下是有稳定解存在的，只要是别人的行为确定下来，竞争者就可以有最佳的策略。

那么，什么纳什均衡呢？简单说，就是一策略组合中，所有的参与者面临这样的一种情况：给定你的策略，我的策略是我最好的策略。

给定我的策略，你的策略也是你最好的策略，即双方在对方给定的策略下不愿意调整自己的策略。

纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具，所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展，甚至说是一场革命。

纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战，按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果，从纳什均衡引出一个悖论：从利己的目的触发，结果损人不利己。

“囚徒困境”就是如此，从这个意义说，纳什均衡提出的悖论实际上动摇了西方经济学的基石。

纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。

这个法则如下：走完寻找优势策略和剔除劣势策略的捷径之后，下一步就是寻找这个博弈的均衡。

所谓博弈均衡，它是一稳定的博弈结果。

均衡是博弈的一结果，但不是说博弈的结果都能成为均衡。

3 混合纳什均衡

13
混合Nash均衡的解释（2）
纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最优选择。因此在社会福利博弈中，* 0 . 2 ， *=0.5是唯一的混合战略纳什均衡。从反面来说，如果政府认为流浪汉选择寻找工作的概率严格小于0.2，那么政府的唯一最优选择是纯战略：不救济；
如果政府以1的概率选择不救济，流浪汉的最优选择是寻找工作，这又将导致政府选择救济的战略，流浪汉则选择游荡。如此等等。
14
混合Nash均衡的解释（3）
流浪汉
政府
流浪汉
寻找工作的概率小于0.2
概率为1：不救济
寻找工作
政府救济
15
猜谜游戏
求该猜谜游戏的混合战略纳什均衡
正面
1 -1， -1
5
社会福利博弈
寻找工作
2
流浪
3 -1，
救济
3， 1
0 0，
不救济
-1，
设：政府救济的概率：1/2 ；不救济的概率：1/2。
流浪汉：寻找工作的期望效用：1/2×2+1/2 ×1=1.5 流浪的期望效用： 1/2×3+1/2 ×0=1.5
因此，流浪汉的任何一种策略都是都是对政府混合战略的最优反应
6
社会福利博弈（2）
寻找工作
2 3， 1
流浪
3 -1， 0 0，
3r+（-1）（1-r）=4r-1
选择纯战略不救济的效用为：
-1r+0（1-r）=-r
如果一个混合战略（而不是纯战略）是政府的最优选择，一定意味着政府在救济与不救济之间是无差异的。
救济
不救济
-1，
4r-1=-r

第二讲纳什均衡

旅游区商户
诚实游客游客收益10 商户收益5 不购买游客收益0 商户收益-5 购买
欺诈游客收益5 商户受收益10 游客收益0 商户收益0
案例讨论
2008年的美国总统大选让我们看到一幕大戏。这场大戏的精彩部分并不是迷住当与共和党的总统选举对决，而是民主党总统候选人的提名选举。民主党的提名竞选，最终只在希拉里和奥巴马之间进行。在2008年之前，奥巴马只是一个默默无闻的小角色，他那年才46岁，只有3年的国会参议员和伊利诺伊州参议员的工作经历，但他是当时国会中唯一一位黑人参议员，也是
2、纳什均衡一定是在重复剔除严格劣战略过程中没有被剔除掉的战略组合，但没有被剔除的战略组合不一定是纳什均衡，除非它是唯一的。（这句话并不适用于弱劣战略剔除的情况）
第二节
纳什均衡
三、寻找纳什均衡的方法（一）劣势策略反复消去法民主党主动增税被动增税 2，2 1，4 主动增税共和党 4，1 3，3 被动增税
纳什均衡
纳什均衡：（被动增税，被动增税）巨额赤字
试一试：劣势策略反复消去法
上参与人1 下参与人2 左中右
1，0
0，4
1，3
0，2
0，1
2，0
第二节
纳什均衡
三、寻找纳什均衡的方法 2000：军费支出（二）相对优势策略划线法－∞：丧失主权 8000：掠夺者赢利 0：军费支出为零，和平原苏联共处扩军裁军 -2000，-2000 8000，-∞ 扩军美国 -∞，8000 0， 0 裁军
2 TR TC p2 (a p2 bp1 ) (a p2 bp1 )c
伯川德模型
通过令一阶导数为零，得到：

纳什均衡3

• 如果潜在进入者选择不进入，在位者选择斗争，那么潜在进入者的收益为 0，在位者的收益为 20。
• 如果潜在进入者选择不进入，在位者选择默许，那么潜在进入者的收益为 0，在位者的收益为 15
知己知彼百战不殆 27
• 采用“划横线法”寻找“市场争夺战”博弈的纳什均衡
在位者斗争进入（-10，-10）默许（ 5， 5 ）
3,0
33
1 纳什均衡与占优策略均衡的关系？ 2 举出纳什均衡的问题，建立模型进行分析。
知己知彼百战不殆
34
Thank you!
LOO

知己知彼，百战不殆
LOO
知己知彼，百战不殆
LOO
主要内容
1. 什么是纳什均衡 2. 如何寻找纳什均衡 3. 纳什均衡怎么应用 4. 小结与思考
LOO
1、什么是纳什均衡
乙 B1 A1 甲 A2 A3 （500，150）（400，200）（400，400）（450，150） (150, 450) （350，350）（450，450） B2 （150，500） B3 (200, 400)
知己知彼，百战不殆
LOO
• 假设在市场中有两个竞争对手。一个是已经在市场中的“在位者”，另一个是企图进入市场的“潜在进入者”。
• 潜在进入者有两个可以选择的策略：进入、不进入。在位者也有两个可以选择的策略：斗争、默许。
• 如果潜在进入者选择进入，在位者选择斗争，那么激烈的市场竞争会使得双方均亏损，双方收益均为 -10。 • 如果潜在进入者选择进入，在位者选择默许，那么双方在市场中均可获得收益 5。
R2
R3
4，0
3，5
0，4
3，5

纳什均衡的数学定义

纳什均衡的数学定义哎呀呀，啥是纳什均衡呀？对于我这个小学生（初中生）来说，一开始听到这四个字，简直就像听到了外星语言一样，完全摸不着头脑！咱们先来说说啥叫均衡。

就好比玩跷跷板，两边重量差不多，谁也压不下去谁，这就叫均衡。

那纳什均衡又是啥呢？假设咱们班组织了一场拔河比赛，分成两队，每队都想赢。

如果我们队使足了劲儿，对方没使多大劲儿，那我们可能一下子就把对方拉过来了，这就不均衡。

可要是我们两队都使出了差不多的力气，谁也拉不过谁，这是不是就有点像均衡啦？这其实就有点像纳什均衡的意思。

再打个比方，就像两个商家在卖同样的东西。

如果一家拼命降价，另一家不降价，那降价的那家可能生意就特别好，这不均衡。

但要是两家价格都差不多，谁也没法通过降价或者涨价来获得更多的顾客，这是不是就均衡啦？想象一下，在一个小镇上有两家超市，一家叫小红超市，一家叫小蓝超市。

小红超市的老板想：“我要是把价格降得特别低，那大家不都来我这买东西啦？”可他又一想：“不行呀，如果我降价，小蓝超市也跟着降价，那最后大家都赚不到钱，这可咋办？”小蓝超市的老板也在琢磨呢：“我要是涨价，会不会大家都去小红超市买东西啦？”这时候，纳什均衡就出现啦！两家超市的价格都差不多，服务也差不多，谁也不敢轻易变动，因为一旦变动，可能自己的利益就受损啦。

这就好像两个人在走钢丝，谁要是乱动，就可能掉下去。

所以他们都小心翼翼地保持着平衡，不敢轻易打破这个状态。

你说这纳什均衡神奇不神奇？它好像无处不在，影响着我们的生活。

比如说交通，大家都遵守交通规则，不抢行，这不就是一种纳什均衡嘛。

反正我觉得吧，纳什均衡虽然听起来挺复杂，但仔细想想，在我们身边到处都能看到它的影子。

它让这个世界变得好像有规律可循，大家都在一种平衡的状态里寻找着自己的利益。

我觉得吧，了解纳什均衡能让我们更明白这个世界是怎么运转的，能让我们在做决定的时候多想想，可太有用啦！。

纳什均衡

弈
猜
-1， 1
硬
币
1， -1
1， -1 -1， 1
2， 1 0， 0
0， 0 1， 3
课堂习题
• 用划线法求出均衡解
C1
C2
C3
R1
0，4 4，0 5，3
R2 4，0 0，4 5，3
R3 3，5 3，5 6，6
箭头法
• 思路：
– 对博弈中的每一个策略组合进行分析，考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益
– 与划线法一样都是基于策略之间的相对优劣关系进行分析的，所得到的结果也是一致的。
– 如果能，则从所分析的策略组合对应的得益数组引一箭头，到改变策略后策略组合对应的得益数组
– 最后，只有指向，没有离开的策略组合为均衡解－－稳定－－没有人愿意单独改变
箭头法
1， 0 0， 4
1， 3 0， 2
0， 1 2， 0
经典博弈故事之二－－情侣博弈
•
大海和小丽正在热恋。难得的周末又到了，安排什么节目呢？周末晚上，
中国足球队要在世界杯外围赛中和伊朗队做生死之战。大海是个超级球迷，国
内的甲级联赛都不肯放过，何况是不争气的国家队的生死大战？也正好是这个
周末的晚上，俄罗斯一个著名芭蕾舞团莅临该市演出芭蕾舞剧《胡桃夹子》。
丽娟最崇尚钢琴、芭蕾这样的高雅艺术，对斯拉夫民族的歌唱和芭蕾更是崇拜
– 稳定的和自我强制的，所以是真正可预测的 – 反之，不具有一致预测性的博弈结果，则难以避免预测和行为之间的
矛盾，甚至是自我否定的。
•只有纳什均衡才具有一致预测的性质 •一致预测性是纳什均衡的本质属性 •一致预测并不意味着一定能准确预测，因为有多重均衡，预测不一致的可能

第二讲纳什均衡

习题：齐威王田忌赛马矩阵

上中下上中下
田忌
上下中中上下中下上下中上下上中
+3，-3 +1，-1 +1，-1 -1，+1 +1，-1
+1，-1 +3，-3 -1，+1 +1，-1 +1，-1
+1，-1 +1，-1 +3，-3 +1，-1 -1，+1
+1，-1 +1，-1 +1，-1 +3，-3 +1，-1
在第二行1 下划线
2015年12月6日
博弈论第二章第二讲纳什均衡
20
第三节纳什均衡
三、寻找纳什均衡的方法（二）相对优势策略划线法 3.设定甲靠左行（第一行）乙： 1>-1 乙相对优势策略：靠左行
在第一列 1下划线
2015年12月6日
博弈论第二章第二讲纳什均衡
21
第三节纳什均衡
四、古诺模型 max i 2.企业i的目标： π1=？，π2=？ 3.企业利润最大化的一阶、二阶条件
1 0 q1 2 0 q2
2015年12月6日
2 1 2 0 2 q1 2 2 2 0 2 q 2
博弈论第二章第二讲纳什均衡
35
第三节纳什均衡
27
第三节
纳什均衡
要点：（1）箭头指向的支付大；（2）只有一方单独改变策略
三、寻找纳什均衡的方法（三）箭头指向法 2.分析：（适度放牧，过度放牧）（1）给定乙不变，甲改变：0→10 （箭头向上）（2）给定甲不变，乙也不变
2015年12月6日
博弈论第二章第二讲纳什均衡

混合策略纳什均衡

(红 ) r 1 1/2 0 1/2 1 q （红）
博弈论第三章混合策略纳什均衡
r*=R(q)
反应对应曲线
第二节混合策略纳什均衡的求解方法
二、反应对应法
例：扑克牌对色游戏(p77)
再看乙的最优反应，记为q*=R(r)：观察π乙(p甲, p乙)= 2q(2r-1)-(2r-1)
若r 1 / 2 2r 1 0, q越大越好 1, q* R( r ) [0,1], 若r 1 / 2 2r 1 0，无论q选什么都无影响 0, 若r 1 / 2 2r 1 0, q越小越好
博弈论第三章混合策略纳什均衡
第二节混合策略纳什均衡的求解方法
二、反应对应法
例：扑克牌对色游戏(p77)
先看甲的最优反应，记为r*=R(q)：观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0，无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
解：Max π甲(p甲, p乙) r Max π乙(p甲, p乙) q
f.o.c. 2r-1=0
r*=1/2
混合策略纳什均衡是甲在策略空间{红，黑}上以概率分布 p甲*= （1/2，1/2）进行选择，乙也在策略空间{红，黑}上以概率p乙*= （1/2，1/2）进行选择
博弈论第三章混合策略纳什均衡
第二节混合策略纳什均衡的求解方法
二、支付最大化法
例：扑克牌对色游戏(p77)
无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q(-1)+(1-q) 1]+ (1-r)[q1+(1-q)(-1)] = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r1+(1-r)(-1)]+ (1-q)[r(-1)+(1-r)1] =2q(2r-1)-(2r-1) f.o.c. 1-2q=0 q*=1/2

博弈论---混合战略纳什均衡

义为：
n
vi ( i , i ) ( j (s j ))ui (s) sS j1
n个参与人的混合战略纳什均衡
让我们以两人博弈为例说明这一点。假定S1 (s11, , s1K ) ，
即参S2与人(s12有1 ,K 个, s2纯J )战略，参与人2有J个纯战略。若参与人1相
1k
2 j u1 ( s1k , s2 j )
1k 2 j u1 ( s1k , s2 j )
K 1
j 1
K 1 j1
这里，1k 2 j 是参与人1选择 s1k 且参与人2选择 s2 j 的概率，即纯战略组合 (s1k , s2 j )发生的概率。
n个参与人的混合战略纳什均衡
混合战略纳什均衡
用上述方法：求该猜谜游戏的混合战略纳什均衡
正面反面
正面
1 -1，
-1 1，
反面
-1 1，
1 -1，
如何理解混合战略 ——虚张声势
一个参与人选择混合战略的目的是给其他参与人造成不确定性，这样尽管其他参与人知道他选择某个特定纯战略的概率是多少，但不知道实际上对手会采用哪个战略。正是因为它在几个战略之间的无差异性，他的行为才难以预测，混合战略均衡才会出现。
小猪
大猪
按等待
按 5，1 9，-1
等待 4，4 0，0
正面
1
正面 -1，
反面
-1 1，
-1
反面 1，
1 -1，
混合战略纳什均衡
在n个参与人博弈的战略式表述 G S1,, Sn;u1,,un
中，假定参与人 i 有K个纯战略：Si Si1, , Sik ，那么，
与人关心的是其期望效用。最优混合战略：是指使期望效用函数最大的混合

混合策略纳什均衡

博弈论第三章混合策略纳什均衡
第二节混合策略纳什均衡的求解方法
二、反应对应法
例：扑克牌对色游戏(p77)
先看甲的最优反应，记为r*=R(q)：观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0，无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
纯策略（确定性）
q*=R(r)
(陈明德语) r 1 3/4
r*=R(q)
0 1/4 1 q （钟信德语）
博弈论第三章混合策略纳什均衡
第三节寻找多重纳什均衡
二、反应对应法：情侣博弈
支付的帕累托优势：初步印象 π陈明=r(4q-1)+2(1-q)，π钟信=q(4r-3)+(3-2r) r*=0, q*=0 纯策略（确定性）
第三节寻找多重纳什均衡
例：情侣博弈
两个（多个）纯策略纳什均衡问题：纳什均衡找完了吗？有无混合策略纳什均衡？
一、支付最大化法
给定混合策略p陈明=(r,1-r); p钟信=(q,1-q) Max π陈明(p陈明, p钟信)=r[3q+(1-q) ]+ (1-r)[0+2(1-q)] =r(4q-1)+2(1-q) r Max π钟信(p陈明, p钟信)=q (2r+0)+ (1-q)[r+3(1-r)] =q(4r-3)+(3-2二节混合策略纳什均衡的求解方法
二、反应对应法
例：扑克牌对色游戏(p77) 无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q)

囚徒困境和纳什均衡

囚徒困境和纳什均衡当对手知道了你的决定之后，就能做出对自己最有利的决定------普林斯顿大学数学家约翰·纳什囚徒困境著名的“囚徒困境”，是纳什均衡理论的经典案例。

警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。

于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供一下相同的选择：若有一人认罪并作证检控对方（背叛对方）而对方保持沉默，此人将立即获释，沉默者将判监禁十年。

若两人都保持沉默(互相合作）则两人同时被判监禁半年。

若两人都互相检举（互相背叛）则两人同时监禁两年。

如同博弈论的其他论证，囚徒困境假设每个囚徒都是利己的，激斗寻求自己的最大利益。

囚徒到底应该选择哪一项策略，才能将自己的刑期缩至最短？两名囚徒由于相互隔离监禁，并不知道对方的选择。

试想困境中两名理性的囚徒会如何选择：若对方沉默，背叛会让我获释，所以对方会选择背叛。

若对方背叛我，我也要指控对方才能得到较低的刑期，所以也是这样会选择背叛。

二人面对的情况一样，所以二人的理想思考会得到相同的答案----选择背叛。

背叛是两种策略之间的支配性策略。

因此这场博弈中唯一可能达到的纳什均衡就是两人选择同时背叛对方，结果两人同时服刑两年。

这场博弈的纳什均衡，显然不是最优的解决方案。

如果两人都选择沉默，两人都只会被判刑半年。

但根据以上假设，两人均为理性的个人，均衡状况回事两个囚徒都选择背叛。

这就是“困境”所在。

寻找“纳什均衡点”在现实生活中，纳什均衡理论影响着人们的行为。

比如，在有些国家，报亭既无管理人员也不上锁，买报纸的人在自行放下前后拿走报纸。

当然某些人可能取走报纸却不付钱（背叛）但由于大家意识到如果每个人都偷窃报纸（共同背叛）会造成以后不方便的有害结果，这种情形很少发生。

在商业活动中，也会出现各种各样的囚徒困境的例子。

两个公司相互竞争，他们的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。

但若二者同时期发出质量类似的广告，收入增加很少但成本增加。

纳什均衡纯策略求解算法

纳什均衡纯策略求解算法
纳什均衡是博弈论中非常重要的一个概念，在许多领域都有广泛的应用。

纳什均衡指的是博弈中每个参与者的策略都是最优的，即在其他参与者的策略下，自己的策略是最好的选择。

在博弈中，有时会出现多个纳什均衡，这时需要找到其中一个最好的纳什均衡，这个最好的纳什均衡被称为最优纳什均衡。

纳什均衡纯策略求解算法是一种求解博弈中纳什均衡的方法。

该算法主要分为以下几个步骤：
1.列出参与者的策略空间：首先需要列出每个参与者的所有可能策略，这些策略构成了参与者的策略空间。

2.列出每个参与者的收益函数：接下来需要列出每个参与者在每种策略下的收益函数，收益函数可以根据实际问题进行定义。

3.构建博弈矩阵：将每个参与者的策略空间组合起来，得到一个博弈矩阵，矩阵中每个元素表示每个参与者在对应策略组合下的收益。

4.寻找纳什均衡：通过对博弈矩阵进行分析，可以找到博弈中的纳什均衡。

其中，纳什均衡是指没有参与者可以通过单方面改变自己的策略来获得更好的收益的策略组合。

5.确定最优纳什均衡：在找到多个纳什均衡的情况下，需要通过一定的方法来确定最优纳什均衡。

纳什均衡纯策略求解算法是一种比较常用的博弈求解方法，在实际问题中也有广泛的应用。

- 1 -。

纳什均衡概念

纳什均衡概念嘿，朋友！咱今天来聊聊纳什均衡这个有点神秘又超级有趣的概念。

你知道吗，纳什均衡就好像是一场拔河比赛。

两边的队伍都使足了劲儿，谁也没法一下子把对方拉过来，就这么僵持着，形成了一种稳定的状态。

这就跟纳什均衡很像，在某个局面里，参与的各方都选了对自己最优的策略，谁也不愿意单独改变，因为一旦改变可能就会吃亏。

比如说，在市场竞争中，两家公司都在考虑要不要降价来吸引更多的顾客。

如果一家降了，另一家不降，那降价的那家可能会抢走很多生意；可要是两家都降，虽然能吸引更多顾客，但利润可能都降低了。

最后，他们都选择了一个价格，谁也不再变动，这就是一种纳什均衡。

再想象一下，两个学生在考试前商量要不要一起作弊。

如果一个作弊一个不作弊，作弊的那个可能会拿到高分；但要是都作弊，被抓到的风险就大大增加；如果都不作弊，那就公平竞争。

最后他们达成了一个共识，都不作弊，这也是一种纳什均衡。

纳什均衡可不只是在商业和学校里出现哦。

在恋爱关系中也有它的影子。

比如情侣之间商量周末怎么度过，一方想去看电影，一方想去逛街。

要是都坚持自己的想法，可能会闹得不愉快；要是能找到一个双方都能接受的活动，比如先逛街再看电影，或者反过来，这就形成了一种平衡，也是纳什均衡。

还有啊，在国际政治中也能看到纳什均衡。

两个国家在贸易上互相设置关税，你加我也加，大家都不好过；你不加我也不加，大家都受益。

最后找到一个双方都能接受的关税水平，这就是纳什均衡在发挥作用。

你看，纳什均衡在我们的生活中无处不在，它影响着我们的决策和行为。

它让我们明白，在很多情况下，我们的选择不仅仅取决于自己，还受到其他人选择的影响。

所以啊，了解纳什均衡能让我们更聪明地做出决策，在各种复杂的局面中找到那个稳定的平衡点。

朋友，你是不是也觉得纳什均衡很有意思呢？是不是开始在自己的生活中寻找它的踪迹啦？。

127数学博弈中的纳什均衡：寻找最优策略的迷宫探险

数学博弈中的纳什均衡：寻找最优策略的迷宫探险在数学这座神秘的殿堂中，有一个充满智慧与策略的角落，那便是博弈论。

而在这个领域中，一个闪耀着耀眼光芒的明珠，便是纳什均衡。

它似乎拥有一种神奇的力量，能够指引我们在复杂的博弈中找到那条通往最优策略的道路。

那么，纳什均衡究竟隐藏在哪里呢？让我们踏上这场寻找最优策略的迷宫探险之旅吧！一、初识纳什均衡：一场心智的较量在博弈论的世界里，参与者们总是在不断地进行策略选择，试图在这场心智的较量中占据上风。

而纳什均衡，就是这样一种策略组合，使得每个参与者在其他参与者策略不变的情况下，都无法通过改变自身策略而获得更大的利益。

换句话说，纳什均衡就是一种稳定的策略状态，任何人都没有动机去打破它。

想象一下，在一个迷宫中，你和对手都在寻找出口。

你们可以选择合作，共同寻找出口；也可以选择竞争，试图抢先找到出口。

而纳什均衡，就是这样一个策略点，让你们在选择合作与竞争之间达到了一种平衡状态，既不会因过度竞争而两败俱伤，也不会因缺乏合作而错失良机。

二、寻找纳什均衡：探索最优策略的迷宫要找到纳什均衡，首先需要了解博弈的基本结构。

在一个博弈中，参与者、策略、收益是三个核心要素。

参与者是博弈的决策主体；策略是参与者在博弈中可以选择的行动方案；收益则是参与者在不同策略组合下获得的利益。

在了解了博弈的基本结构后，我们就可以开始探索最优策略的迷宫了。

这个过程需要运用数学工具和逻辑思维，对博弈进行深入分析。

我们需要考虑每个参与者的可能策略以及这些策略组合下的收益情况。

通过对比不同策略组合下的收益，我们可以逐步缩小搜索范围，最终找到那个让所有人都无法通过改变策略而获得更大收益的纳什均衡点。

当然，这个过程并不总是一帆风顺的。

有时候，我们可能会遇到多个纳什均衡点的情况，这时就需要根据具体情况进行判断和选择。

有时候，我们甚至可能会陷入一种看似无解的死循环中，这时就需要运用一些高级的数学方法或者调整博弈规则来打破僵局。

博弈论第三章混合策略纳什均衡.

如果一个混合策略是流浪汉的最优选择，那一定意味着政府在救济与不救济之间是无差异的，即：
vG 1,

4
1 vG 0,

0.2
• 解二:支付等值法
如果一个混合策略是政府的最优选择，那一定意味着流浪汉在寻找工作与游闲之间是无差异的，即：
vL 1, 1 3 vL 0, 0.5
游闲
（3，2）（-1，3）
（-1，1）（0，0）
政府和流浪汉的博弈
• 思考：政府会采用纯策略吗？流浪汉呢？这个博弈有没有纯策略的纳什均衡？ • ——跟你玩剪子石头布游戏一样，你会一直采用纯策略吗？ • 那么政府和流浪汉最有可能采用什么策略？ • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略，就可以采用针对性的策略，使自己的支付增加。
L 2 1 0

0.5
解二:支付等值法
• 政府选择救济策略 • 政府选择不救济策略
0 1 期望效用期望效用 vG 1, 3 11 vG 0, 1 01 4 1
EUA p1 X 1 p 2 X 2 ... pnXn
政府和流浪汉的博弈
• 政府想帮助流浪汉，但前提是后者必须试图寻找工作，否则，不予帮助；而流浪汉若知道政府采用救济策略的话，他就不会寻找工作。他们只有在得不到政府救济时才会寻找工作。他们获得的支付如图所示：
流浪汉
寻找工作
救济政府不救济
乙红q 红p 甲黑1-p -1， 1 1， -1 黑1-q 1， -1 -1， 1
§ 反应函数
• A的目标是期望支付越大越好。我们之所以把A的期望支付整理成不含p的一项和含p的一项这个样子，是因为A只能选择p而不能q，因此，A能通过选择p来影响第一项，而不能直接影响第二项。（1-2q）>0即q<1/2时，A把p选择等于1最好；当（1-2q）<0即q>1/2时，A把p选择等于0最好；当（1-2q）=0即q=1/2时，A可以在[0，1]之间随便选择一个p。这样我们可以得到A的反应函数是，同样道理我们可以得到B的反应函数。 • 0，如果q>1/2 1，如果p>1/2 • p [0,1], 如果q=1/2 q [0,1], 如果p=1/2 • 1, 如果q<1/2 0, 如果p<1/2

微观经济学纳什均衡

微观经济学纳什均衡微观经济学纳什均衡是一种重要的博弈论方法，以解决多个参与者在竞争中达成最优策略的问题。

纳什均衡在经济学、政治学和社会学等领域广泛应用，为决策者提供了优化交互的理论基础。

在这篇文章中，我们将探讨纳什均衡的基本概念、应用范围和实际案例。

什么是纳什均衡？纳什均衡是指一个博弈中所有参与者做出最优策略的状态。

博弈表示多个参与者面临不同的选项，根据其他参与者的行为做出决策，并在最终结果中获得利益或损失。

纳什均衡是在假设所有参与者都知道其他人的战略和最终结果的情况下得出的，通过寻找参与者最大化利益的策略来确定最终状态。

纳什均衡的概念描述了一个节点，称为均衡点。

在均衡点上，每个参与者的策略形成了一种稳定的状态，使得任何人采取不同策略都会使其利益有所减少。

纳什均衡不一定是最优策略或最优结果，但对于所有参与者来说，选择这个策略就是最合理的。

纳什均衡的应用范围纳什均衡可以用于解决一系列经济和社会问题，例如市场竞争、资本博弈、国际贸易和环境政策等。

在市场竞争中，企业、供应商和消费者都会对价格和数量做出决策，纳什均衡可以帮助我们预测市场价格和数量的稳定状态。

在资本博弈中，银行、交易商和投资者参与多重游戏，纳什均衡可以测量资本流动方向与趋势。

在国际贸易中，不同国家参与进出口贸易会影响市场价值和公平分配，纳什均衡可以帮助我们确定进出口关税和贸易协议的最优方案。

在环境政策中，制定人员需要考虑经济效益和环境保护之间的平衡，纳什均衡可以帮助我们制定环保监管和税收政策。

实际应用案例在经济学中，纳什均衡在实际应用中具有重要的作用。

以下是几个应用案例：1. OPEC石油产量协调。

在20世纪70年代，石油输出国组织（OPEC）协调其成员国的石油产量，以提高全球价格。

使用纳什均衡模型，我们可以预测OPEC成员国的产量分配和全球石油价格的愈合点。

2. 拍卖策略的分析。

在拍卖过程中，竞拍者必须根据所有其他竞拍者的行为做出决策。

纯策略纳什均衡和混合策略纳什均衡

纯策略纳什均衡和混合策略纳什均衡简单来说，纯策略纳什均衡指的是，参与人选择的策略是确定的。

比如，在性别之战中，我们通过每个参与人的最优反应确定了该博弈的两种纯策略，即（拳击，拳击）和（芭蕾，芭蕾）。

在纯策略纳什均衡的情况下，我们只能知道具体的纳什均衡下每个参与人的收益，并无法求得参与人进行该博弈的整个的期望收益。

（暂且称为期望收益吧），因为在参与人做选择时，并不知道对方会做出什么样的选择。

假设我们自己为参与人1，我们就会开始想，现在我也不知道对方（参与人2）会做什么样的选择，我先假设他选择芭蕾的概率为p 吧，那么他选择拳击的概率就是1-p，那么这个时候，我们自己在两种策略下的收益为，我们就会选择芭蕾，如果我们就会选择拳击。

我们可以画出参与人1的最优反应曲线E1是双方都百分百选择拳击，E2是双方都百分百选择芭蕾，也就是我们之前求出的纯策略纳什均衡，而E3就是我们要算的混合策略纳什均衡。

在该点U1=4/3由于博弈是对称的，U2=4/3由于参与人1在（拳击，拳击）时的收益1比选择（芭蕾，芭蕾）时的E3的收益4/3低，所以参与人1是肯定不会百分百选择E1作为均衡点的，同理，参与人2也不会百分百选择E2作为均衡点。

既然参与人都可以自主选择自己的概率，那么只有在混合策略纳什均衡点E3这一个均衡。

即参与人1分别以2/3和1/3的概率选择芭蕾和拳击，参与人2以1/3和2/3的概率选择芭蕾和拳击。

所以在这个博弈里，只有一个混合策略纳什均衡，也就是E3点所代表的均衡。

只要偏离这个点的概率，那么博弈的结果就会变为E1或者E2，这时总会有一个参与人不愿选择这样的结果，博弈无法达到均衡。

所以最终寻找这个严格混合策略纳什均衡点的过程可以陈述为，给定其他参与人的混合策略，目标参与人在可行行动中的任意随机选择都是无差异的。

即令2p=1-p，q=2（1-q），这就是寻找混合策略纳什均衡的解题方式。

也可以通过同时假设两个参与人的概率，写出每个参与人在假设概率下的效用，通过让双方同时效用最大化求解。

纳什均衡的划线法口诀

纳什均衡的划线法口诀
纳什均衡是博弈论中的重要概念，指的是在一个博弈中，每个参与者都选择了最佳策略，无法通过改变自己的策略来获得更大的收益。

在寻找纳什均衡时，可以使用划线法来辅助求解。

划线法是一种用于解决二人零和博弈的方法，其中的零和表示两个参与者的利益完全相反，即一个人的获得是另一个人的损失。

划线法通过画线标记来找到纳什均衡。

以下是一个简单的划线法口诀，有助于我们更好地理解和应用纳什均衡的概念：
1. 画出博弈矩阵：首先，绘制一个表格，将参与者的可选策略列在
左侧，将对应的收益写在矩阵中的相应位置。

2. 找出最大值：对于每个参与者，在其选择的策略下找到获得最高
收益的结果，并在该结果上方或左侧画一条线。

3. 找出最小值：对于每个参与者，找到获得最低收益的结果，在该
结果所在的行或列上画一条线。

4. 交叉点：在博弈矩阵中找到所有线的交叉点。

5. 确定纳什均衡：如果交叉点处只有一条线，则该点为纳什均衡点，表示两个参与者选择了最佳策略。

如果有多个交叉点，则所有交叉点都是潜在的纳什均衡点。

划线法的口诀可以帮助我们在求解纳什均衡时，更加系统和有条理地进行分析。

通过确定纳什均衡，参与者可以在博弈中做出最优决策，最大化自己的利益。

然而，需要注意的是，划线法是一种简化的方法，可能无法涵盖复杂博弈中的所有情况，因此在实际应用中需要结合其他方法进行综合分析。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1.首先将原始数据带入博弈计算程序，可以得到如下的答案：可以看到其中一个是纯策略，两个是混合策略。

2.首先用划线法找出可以找到第一个纯策略。

纯策略下张三和李四的收益组合为：（60，76），张三和李四的策略分别为（0，1，0）和（0，0，1）3.用消去法消去划线的两行
这样得到一个新的组合，
P
1-P
假设新的组合是符合混合纳什均衡策略那么张三选上下的策略为P ，1-P ；李四选左中的策略为S,1-S.
根据纳什均衡的条件：李四的策略概率S ，1-S ，使得张三选择上下策略收益相同：得到一个等式：12S+42(1-S)=72S+36(1-S). S=1/11 1-S=10/11; 此时张三的收益为：=12×1/11+42×10/11 = 432/11 = 39.27；
同样张三的概率P,1-P,使得李四选择左中的收益相等: 得等式：83P+47(1-P)=56P+95(1-P) P=16/25；1-P=9/25; 此时李四的收益：=83×16/25+47×9/25=53.12+16.92=70.04
综上为第二个混合策略纳什均衡张三和李四的策略分别为：（16/25，0，9/25）和（1/11，10/11，0），张三和李四的收益为（39.27，70.04）第三步：一般的混合纳什均衡
设张三选择上中下的策略概率分别为p,q,1-p-q ；李四选择左中右的策略概率分别为s,t,1-s-t ；李四的策略要使张三的策略收益相同：
12s + 42t + 42(1-s-t)=24s + 12t + 60(1-s-t)=72s + 36t + 42(1-s-t) s=1/27, t=10/27, 1-s-t= 16/27
此时张三的收益张三收益 = 12*1/27+42*10/27+42*16/27=(12+420+672)/27=1104/27=40.89
同上可知张三需要确定一个行动概率，以使李四的选择在其收益上没有差异，得等式： 83p + 12q +47(1-p-q) = 56p + 42q + 95(1-p-q)=45p + 76q + 59(1-p-q) p=113/200, q=5/16, 1-p-q=49/400
此时李四的收益为李四收益 =83*113/200+12*5/16+47*49/400=46.895+3.755.7575=56.40
综上，此混合策略纳什均衡相对于张三和李四的策略选择用概率分别表述为（113/200，5/16， 49/400）和（1/27，10/27，16/27），收益分别为（40.89，56.40）
第四步：最后策略
三个策略的收益为：（60，76）（39.27，70.04）和40.89，56.40）
通过帕累托上策为（60，76）对双方来说收益最大，所以张三（0，1，0），李四（0，0，1）的纳什均衡点应是实际行为最可能的结果。

1-S
S。