MBA必修课程《博弈论》第二部分:穷途困境与纳什均衡

合集下载

博弈论纳什均衡

博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡?1、纳什均衡(Nash equilibrium ),又称非合作博弈均衡,是博弈论概念,指的是:一种博弈稳定结果,谁单方改变策略,谁就会损失。

两个囚徒互相揭发,就是一种纳什均衡。

对于每个囚徒来说,如果打破纳什均衡,在对方实施揭发策略时,改变揭发策略,保持沉默,自己就会由判刑2年,变成判刑5年。

也就是说,两个囚徒互相揭发是稳定博弈结果,谁单方改变策略,就会受到损失。

这也就是均衡涵义所在,两个囚徒从利己角度,都不会单方改变策略。

博弈策略稳定,博弈结果也稳定。

之所以命名为纳什均衡,是因为提出者是经济学家、博弈论创始人约翰.纳什。

之所以称为非合作博弈均衡,原因就是:两个囚徒如果合作,互相保持沉默,各自只要坐牢1年;但最终博弈结果,也就是纳什均衡显著特征,是不合作。

2、纳什均衡意义重大。

纳什均衡提出,震动整个经济学界。

诺贝尔经济学奖得主萨缪尔森曾说:“你只要教会鹦鹉说‘需求和供给’,它也是经济学家。

”博弈论专家坎多瑞则说:“这只鹦鹉现在必须多学一个词了,那就是‘纳什均衡’。

”诺贝尔经济学奖得主迈尔森也说:“发现纳什均衡意义,可以和生命科学中发现DNA 双螺旋结构相媲美。

”纳什也因为提出纳什均衡,创立博弈论,而获得1994年诺贝尔经济学家奖。

纳值均衡意义重大,简单来说,就是它对于经济学具有重大意义。

读友们如果了解经济学看不见的手原理,就知道,古典经济学认为,通过市场这只‘看不见的手’调节,个体追求私利行为,会促进集体利益最大化。

但纳什均衡却违反上述原理:两个囚徒分别追求私利行为,并没有促进集体(囚徒整体)利益最大化,反而是损人不利己。

这正是市场失灵软肋之处,通过博弈论视角可以得到合乎逻辑解释,更有条件找到合适解决方案。

从上述这点,读友们可以“一斑窥全豹”,感受到博弈论重要性。

更重要的是,纳什均衡非常普遍,小至个人沟通,中到公司竞争,大到国家往来,都可以观察到。

Q2:怎样运用纳什均衡?1、分析囚徒困境。

博弈论中的纳什均衡

博弈论中的纳什均衡

博弈论中的纳什均衡纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。

其研究成果见于题为《非合作博弈》(1950)的博士论文。

该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。

纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。

他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。

该解概念后来被称为纳什均衡。

定义:纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

也就是说,此时如果他改变策略他的支付将会降低。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。

这一结果对局中人B亦是如此。

纳什均衡的经典范例就是囚徒博弈,但是研究博弈论常常会使人陷入一种只追求个人利益的误区,事实上我们应该明白所谓的博弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设,并不总能说明事实。

只是假定他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。

也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。

没有人会主动改变自己的策略以便使自己获得更大利益。

“囚徒的两难选择”有着广泛而深刻的意义。

个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。

大学课程《博弈论及其应用》PPT课件:第二章(1234节)

大学课程《博弈论及其应用》PPT课件:第二章(1234节)

博弈方2



上 博弈方1

1,0 0,4
1,3 0,2
0,1 2,0
图 2-7 划线法
博弈的相对优势策略位置在图2-7标出,策略组合{上,中}格 子中的两个数字下面都划了短线,这个格子对应的策略组合 就是由划线法得到的纳什均衡。
第四节 箭头方法
还有一种寻找纳什均衡的方法,和划线法的分析理念的出发 点不同,这种方法的思路是对博弈中的每个策略组合进行分 析,判断各博弈方是否能够通过单独改变自己的策略而改善 自己的得益,如果可以,则从所考察的策略组合的得益引一 个箭头到改变策略后的策略组合对应的得益。这样对每个可 能的策略组合都分析考察过以后,根据箭头反映的情况来判 断博弈的结果。
博弈方2
Hale Waihona Puke 左中上 博弈方1

1,0 0,4
1,3 0,2

0,1 2,0
图 2-8 箭头法
观察图2-8,在策略组合{上,中}中只有指向的箭头,没有指 出的格子所代表的就是纳什均衡。
略“上”改变的倾向,用一个竖着的箭头表示这个倾向;横 着比较后面的得益,4比2大,4比0大,博弈方2没有改变的 动力。在策略组合{上,左}中,横着比较后面,分析博弈方2 的得益,3比0大,1比0大,所以博弈方2有从策略“左”向
策略“中”和策略“右”改变的倾向,用两个横向的箭头表 示这两个改变的倾向。
在策略组合{上,中}中,竖着比较前面的得益,还是横着比较后 面的得益,博弈方1和博弈方2都没有改变的倾向。在策略组合 {上,右}中,竖着比较前面,2比0大,博弈方1有从策略“上”
向策略“下”改变的倾向,用一个竖向的箭头表示这个倾向; 横着比较后面,3比1大,博弈方2有从策略“右”向策略“中” 改变的倾向,用一个横向的箭头表示这个倾向。

第二讲纳什均衡

第二讲纳什均衡

猎人博弈得益矩阵

猎鹿 打兔
10
4 0

猎鹿
10 0
4 4
打兔
4
博弈论故事之五--高薪养廉
• “高薪养廉”是公务员制度方面的一种理论,我们分 高薪养廉”是公务员制度方面的一种理论, 析一下“高薪”为什么能养廉? 析一下“高薪”为什么能养廉? • 假设甲乙为一家单位的主任和书记关系密切的国家公 务员, 代表现在政府给他们的高薪 如果两人受贿, 代表现在政府给他们的高薪。 务员,7代表现在政府给他们的高薪。如果两人受贿, 因为串谋而一时不被人发现,他们可以达到9的位置 的位置; 因为串谋而一时不被人发现,他们可以达到 的位置; 而一旦“东窗事发” 他就要被撤职查办, 而一旦“东窗事发”,他就要被撤职查办, 不受贿一 方得8 方得 • 画出得益矩阵
美苏争霸的囚徒困境
• 军备竞赛的博弈:从军事上看,二三十年前美国和前苏联是世界 军备竞赛的博弈:从军事上看, 上的两个超级大国,他们相互对垒。 上的两个超级大国,他们相互对垒。假定每一方都有两种策略选 一个是扩军,发展核武器,实施“星球大战”计划等; 择:一个是扩军,发展核武器,实施“星球大战”计划等;另一 个是彻底裁军,直至不设军备。 个是彻底裁军,直至不设军备。 • 如果双方都扩军,则各花费2000亿美元用于军费。彻底裁军,则 如果双方都扩军,则各花费 亿美元用于军费。 亿美元用于军费 彻底裁军, 军费为0。 军费为 。 • 如果美军不设防,但前苏联扩军,前苏联就可以任意欺负和损害 如果美军不设防,但前苏联扩军, 美国,这样,美国会受到很大损失,直至丧失主权。我们记得益 美国,这样,美国会受到很大损失,直至丧失主权。 ?,假定为 亿美元。 为-∞;而苏联又会是多少呢 ?为+∞?,假定为 ; ?,假定为10000亿美元。 亿美元 反之也成立。 反之也成立。

博弈论课件 第二章

博弈论课件 第二章

2.3 无限策略博弈分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性
2.3.1 古诺的寡头模型
假设条件:
市场总产量Q q1 q2 市场出清价格 P P(Q) 8Q 边际成本c1 c2 2,无固定成本 两厂商同时决定各自产的量
2.2.1 纳什均衡的定义
博弈、博弈方的策略空间和得益的一般表示法 G 表示一个博弈; n个博弈方;
S1,S2, ,Sn表示每个博 策弈 略方 集的 合可 , 空 选 称 间为 ”“ ; sijSi表示博 i的 弈第 j个 方策略; 博弈i的 方得益 ui表 用示ui, 是各博弈方策 函略 数的 ;多元
★★★学习博弈论,大家一定要记忆一些基本的模型。因为很多
时候,我们总是基于已有的模型,对其做出修订来考察一些新的 问题。完全创新的模型是很少见的,当我们记忆的模型多了,就 很容易在分析问题时套用模型,并修订模型的条件来考察自己研 究的问题。
其实大家学习西方经济学理论的时候,会发现它与大家曾接触 的马克思主义经济学理论,以及国内一些逻辑思辩型的经济学研 究范式一个很大不同就在于,它采取的是一种模型化的思维。我 们学习西方经济学的时候,会发现始终在学习一些模型,因为模 型是帮助我们简单地理解现实世界的有用工具。经济学中的数学 模型,其实与生物课教学的塑料人体模型等在本质上并无不同。



博弈的解:(上,中)
博上 弈 方 一

1,0 0,4
1,3 0,2
0,1 2,0
2.1.3 划线法
囚徒困境
囚 坦白 徒 1 不坦白
囚徒 2 坦白

浅析囚徒困境与纳什均衡

浅析囚徒困境与纳什均衡

浅析囚徒困境欧阳学文囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。

囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。

囚徒困境在生活中最常见的表现就是挤公共汽车。

从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。

学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。

但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。

可见“减负令”难以见效,中小学生课业负担不减反增。

又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。

可是,我错了吗?没有。

当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。

人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。

可是,我对了吗?没有。

”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。

含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。

再看中国的法治之路。

虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。

绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。

不过,任何事物都有两面性,“理性”过了头也就成了非理性。

这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。

我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法治。

但囚徒困境一定是坏事吗?就以囚徒困境的经典案例来说,作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。

第二讲 纳什均衡 PPT课件

第二讲 纳什均衡 PPT课件
二、情侣博弈的结论:纳什均衡 (三)分类 2.普通纳什均衡 (1)均衡战略与非均衡战略无差异 (2)参与人单独改变策略后,支付可
能不变
2020年1月5日
博弈论第二章
12
第二讲纳什均衡
第三节 纳什均衡
三、寻找纳什均衡的方法
团队合作
(一)严格劣势策略反复消去法


工作 偷懒
工作
6,6
+1,-1
+1,-1 +1,-1
博弈论第二章 第二讲纳什均衡
-1,+1
+1,-1 +3,-3
37
博弈论第二章
33
第二讲纳什均衡
第三节 纳什均衡
四、纳什均衡在微观经济学中的应用: 古诺模型
1.博弈三要素 (3)支付
i (q1, q2 ) (a q1 q2 ) qi ciqi
2020年1月5日
博弈论第二章
34
第二讲纳什均衡
第三节 纳什均衡
四、古诺模型
2.企业i的目标: max i
二、情侣博弈结论:纳什均衡 (一)表述 若存在一个策略组合(足球,足球),
当参与人单独改变策略后,支付下降, 此策略组合为纳什均衡。 ——博弈各方相互作用的稳定结局
2020年1月5日
博弈论第二章
9
第二讲纳什均衡
第三节 纳什均衡
二、情侣博弈的结论:纳什均衡 (二)定义
给定G={S1,…,Sn;u1,…,un}, s*=(s*1,…,sn*) 对于所有i和si∈Si,有: ui(si*,s-i*)≥ ui(si’,s-i*)
2020年1月5日
博弈论第二章
23
第二讲纳什均衡

纳什均衡与囚徒困境

纳什均衡与囚徒困境

交通拥堵中的纳什均衡
在交通拥堵中,如果所有驾驶员都选择走某一 条路,那么这条路就会变得非常拥堵。
如果一个驾驶员选择走另一条路,那么他可能 会更快地到达目的地,但其他驾驶员也可能会 效仿,导致另一条路也变得拥堵。
纳什均衡在交通拥堵中的表现为:所有驾驶员 都选择走同一条路,形成一种稳定的交通状态。
公共资源中的纳什均衡
建立信任
通过建立信任机制,让囚犯相 信对方不会出卖自己,从而都
选择抵赖。
引入第三方监管
由第三方监管机构介入,制定 规则并监督执行,确保双方都 遵守规则。
改变奖励机制
改变奖励机制,使得双方都选 择抵赖成为最优解,例如将坦 白惩罚变得更重。
增加沟通机会
让囚犯有更多的沟通机会,了 解对方的想法和处境,从而更
企业竞争中的囚徒困境
价格战
01
企业为了争夺市场份额,可能会采取降价策略,但这种策略可
能导致整个行业的利润下降。
技术研发
02
企业在研发新技术时面临投入不足或过度投入的困境,如何平
衡研发投入与市场收益是一大挑战。
广告策略
03
企业在广告投放上可能存在囚徒困境,过多的广告投入可能增
加品牌知名度,但也可能导致广告费用过高而降低利润。
01
02
03
公共资源是指那些不属于任何个 人或组织的资源,如海洋、森林、 空气等。
在公共资源的使用中,如果每个 人或组织都过度使用资源,那么 资源将会被耗尽或使用 资源,导致资源的过度消耗和破 坏,形成一种稳定的竞争状态。
05 囚徒困境的实例分析
促进学科发展
纳什均衡与囚徒困境的研究推动了博弈论和其他相关学科的发展,促进了学术交流和知识创新。

纳什均衡与囚徒困境

纳什均衡与囚徒困境

纳什均衡纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名,是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。

首先我们先简单看一下纳什均衡的经济学含义:所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。

换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

纳什均衡(Nash equilibrium),无一参与者可以通过独自行动而增加收益的策略组合。

纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。

纳什均衡可以分成两类:"纯战略纳什均衡"和"混合战略纳什均衡"。

纯战略是提供给玩家要如何进行赛局的一个完整的定义。

特别地是,纯战略决定在任何一种情况下要做的移动。

战略集合是由玩家能够施行的纯战略所组成的集合。

混合战略是对每个纯战略分配一个机率而形成的战略。

混合战略允许玩家随机选择一个纯战略。

混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。

因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。

案例:智猪博弈、囚徒困境、普通范式博弈(公司合作背叛)、饿狮博弈、硬币正反。

这里有一个理想化假设,那就是假设双方都知道博弈次数是无限的话,也就是说双方的商业往来是无止尽的,那么二者的策略都将持续选择合作,最终的博弈收益将定格在(3,3),这就是一个纳什均衡。

既然博弈次数是无限的,那么任何一方都没有理由选择背叛策略去冒险追求5点短暂收益,而招致对方在下一轮博弈中的报复(这种报复在博弈论里称作“以牙还牙”策略)。

还有另一种假设情况是,假使双方都知道博弈次数是有限的,也许下一次博弈就是最后一次,那么为了避免对方在最后一轮博弈中选择背叛策略而使我方遭受-3的收益损失,于是双方都重新采取了背叛的策略选择,最后的博弈结果又回到了(-1,-1),这就形成了第二个纳什均衡。

《博弈入门》第二章:纳什均衡:理论

《博弈入门》第二章:纳什均衡:理论

努⼒⼯作游⼿好闲努⼒⼯作2,23,0游⼿好闲0,31,1《博弈⼊门》第⼆章:纳什均衡:理论1 策略型博弈策略型博弈是决策者之间相互作⽤的模型。

正是因为相互作⽤,我们称决策者为局中⼈。

每个局中⼈有⼀个可选⾏动的集合。

模型中的每个局中⼈受到所有局中⼈⾏动的影响,⽽不仅是受到她⾃⼰⾏动的影响,从⽽获得局中⼈之间的相互作⽤。

尤其是,每个局中⼈对于⾏动剖⾯⼀-所有局中⼈⾏动的列表(参见17.4节中关于剖⾯的讨论)---都有⾃⼰的偏好。

定义2.1(具有序数偏好的策略型博弈)(具有序数偏好的)策略型博弈由如下要素组成:局中⼈集合对于每个局中⼈,有⼀个⾏动集合对于每⼀个局中⼈,有关于⾏动剖⾯集合的偏好2.2 囚徒困境2.2.1 合作项⽬你和朋友合作-⼀个项⽬。

你们每个⼈可以要么努⼒⼯作要么游⼿好闲。

如果你的朋友努⼒⼯作,⽽你乐意游⼿好闲(如果你也努⼒⼯作的话,项⽬的结局将会好--些,可是其价值的增量对你来讲不值得付出额外的努⼒)。

你喜欢你们俩都努⼒⼯作的结局甚于你们俩都游⼿好闲(在这种情况下,什么都没有完成),对于你,最差的结局是你⼯作很努⼒⽽你的朋友却游⼿好闲(你痛恨被“剥削")。

如果你的朋友有相同的偏好,那么模拟你所⾯对情形的博弈将在图2.2中给出,如你所看到,这个博弈与“囚徒困境”的不同仅在于⾏动的名称。

我们并没有断⾔,两个⼈从事⼀个合作项⽬的情况必定具有“囚徒困境”的结构,只有当局中⼈的偏好与“囚徒困境”中⼀样时才是!例如,如果在其他⼈努⼒⼯作时每个⼈都喜欢努⼒⼯作甚于游⼿好闲,那么“囚徒困境”就不模拟这种情况:局中⼈的偏好与图2.2中给出的偏好不同。

2.2.2 双寡头垄断左图的博弈与“囚徒困境”的不同之处不仅在于局中⼈⾏动的名称,还在于其中两个局中⼈的偏好上有所不同。

右图的博弈与“囚徒困境”的不同之处仅在于局中⼈⾏动的名称。

随机坚持随机1/2(H+L),1/2(H+L)L,H坚持H,L S,SS>L2.4例证:匹配硬币(⽆冲突博弈)我们研究的求解理论有两个部分。

第2章 纳什均衡与囚徒困境

第2章 纳什均衡与囚徒困境

最优选择
• 这个博弈只要求一阶理性共识就可以预测均衡 结果: • 如果R相信C是理性的,R就知道C不会选择C3, 所以R的最优选择是R1; • 如果C相信R是理性的,C就知道R不会选择R2, 所以C的最优选择是C2。 • 但要C预期R不会选择R3,需要二阶理性共识; 要R不预期C会选择C1,需要三阶理性共识。
无论对方如何选择,每个人的最优选择:不提供。 所以,我们可以预测,结果将是(不提供,不提供)
公共产品与税收制度
• 比较私人产品与公共产品的不同:使用 上排他性; • 私人产品是志愿购买的,但公共产品可 能需要强制购买; • 税收制度就是保证公共产品的生产,解 决公共产品生产上的“囚徒困境”
“囚徒困境”的一般表示
战略 做广告
企业2
做广告 不做广告 4, 4 15 , 1 10 , 10
企业1
不 做 广 告 1 , 15
• 纳什均衡:(做广告,做广告)
利用纳什均衡寻租
• 考虑股票市场融资的例子:设想企业价值是 100,现在发行的流通股为100股,每股价值1 元。现在假定经理想筹集100元,投资价值只 有50元。有人买新股吗? • 假定每一股配4股,价格为0.25元。如果股东不 接受配股:原来一股1元的价值就变成0.3元 (=150/500);如果接受配股,他持有的股票 的价值是1.5元;因为配股的成本是1元,所以 他的最优选择是接受配股。
重复剔除占优均衡
• “重复剔除严格劣战略”(iterated elimination of strictly dominated strategy)的思路:首先找出博弈参与人的劣 战略(dominated strategy)(假定存在的话),把这个劣 战略剔除后,剩下的是一个不包含已剔除劣战略的新 的博弈;然后在剔除这个新的博弈中的劣战略;继续 这个过程,直到没有劣战略存在。如果剩下的战略组 合是唯一的,这个唯一的战略组合就是“重复剔除占 优均衡”(iterated dominance equilibrium)。 • 如果这样的解存在,我们说该博弈是“重复剔除占优 可解的”(iterated dominance solvable).

第二章 纳什均衡 《博弈论与经济》 PPT课件

第二章  纳什均衡 《博弈论与经济》 PPT课件

▪ G的纳什均衡可由以下划线法求得。
▪ 1.对局中人1的每个策略i (i 1,2,, m) ,寻找局中人2的最
优反应。若最优反应为
j
,即 bij
max
k 1,2,,n
bik
,则在支付矩
阵元素 bij 下划一短线。
▪ 2.对局中人2的每个策略 j ( j 1,2,, n) ,寻找局中人1的
最优反应,若最优反应为 i
▪ 考虑由商店A, B构成的市场,A与B分别销售不同品牌的商 品,进行价格竞争。假设生产的单位成本为零。消费者 分为两类, n A ( 0)个消费者偏好于产品A,nB ( 0)个消费者 偏好于产品B。A,B两种品牌价格分别为 PA , PB 。设消费 者可从A或B处购买单位商品。
▪ 用 0表示由于购买不喜欢的产品所付出的厌恶成本,假 设消费者具有如下的效用函数
按 等待
等按待
(5,1) (9,1)
4,4
(0, 0)
▪ 严格纳什均衡为大猪“按”,小猪“等待”。
▪ 例2.7 在例1.8中的大堤维护博弈中,支付矩阵为
维护
不维护
不维维护护 ((1
4,4) 0,1 4)
((1140,,1100))
▪ 利用划线法可得纳什均衡(维护,维护),(不维护, 不维护)。
▪ 为了保护生命财产的安全,政府可以立法,如果参与人
第2章 纳什均衡
2.1 纳什均衡的定义
▪ 纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概念都是建 立在纳什均衡基础之上的。
▪ 纳什均衡是个策略组合 s* (si*, s*i ) ,它满足两个要求。

1.对每个局中人 i N
,能够预期到对手采用策略组合s

第2章 纳什均衡

第2章  纳什均衡
PA UA = PB δ A类消费者购买商品A A类消费者购买商品 B
PA δ UB = PB
B类消费者购买商品A B类消费者购买商品B
q 用 q A 表示消费者对于产品A的需求量; B 表 示消费者对于产品B的需求量.则 0 PA > PB +δ qA = nA PB δ ≤ PA ≤ PB +δ n +n PA < P δ A B B
为纳什均
衡的充要条件是对任何局中人,支付差为
* * u i ( s i* , s i ) u i ( s i , s i ) ≥ 0
,而与这个差
值是多少无关,由此可导出纳什均衡的一个性质: 纳什均衡的不变性
命题2.1 设 命题
G = N, S1 , , Sn , u1 , , u n
为已知策略型博弈.下不变. 正仿射变换 对 ,令 i∈N
ui' ( s) = δ iui ( s) + Ci ,其中
δ i > 0 ,则G与
' G' = N,S1,,Sn , u1,, u'n 有相同的纳什均衡.
(2)纳什均衡在支付函数的局部变换 局部变换下不变. 局部变换 给定
si ∈S i
定义2.2表明,局中人i的最优化反应映射 ri (s) 仅与 s i 有关. 反应函数 当 ri (s) 为单点集时,称 ri (s ) 为局中人i的最优反应函数 最优反应函数,简称 最优反应函数 反应函数.这时将 ri (s ) 记为 BRi (s i ) . 反应函数
定义2.3 最优反应映射 定义
G的纳什均衡可由以下划线法 划线法求得. 划线法 例2.4在囚徒困境问题中,其支付矩阵为
C C ( 5, 5 ) D ( 8, 0 )

纳什均衡囚徒困境帕雷托最优-最通俗的解答

纳什均衡囚徒困境帕雷托最优-最通俗的解答

纳什均衡囚徒困境帕雷托最优-最通俗的解答在知乎的纳什均衡回答里看到这么一个观点:1. 三个火枪手中那句名言:All for one,one for all (人人为我,我为人人),我的理解是,贵族武士之间,通过自利和利他的行为实现共同目的2. 亚当斯密提出invisible hand理论时候的基本前提:当市场中每个人都进行自利行为的时候,在客观上说,市场(或社会)整体的福利会被提升而纳什均衡恰好否定了前面的观点,我认为这也是这一理论如此著名的原因:当市场中每个人都进行自利行为的时候,在客观上说,市场(或社会)整体的福利是无法达到最优的。

纳什均衡(Nash equilibrium),无一参与者可以通过独自行动而增加收益的策略组合。

其经典的例子就是囚徒困境(Prisoner's Dilemma)。

囚徒困境是一个非零和博弈,反映个人最佳选择并非团体最佳选择。

或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。

大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。

如果两人均不招供,将最有利,只被判刑半年。

于是,两人同时陷入招供还是不招供的两难处境。

但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳什均衡。

这时,个体的理性利益选择是与整体的理性利益选择不一致的。

囚犯的博弈矩阵囚犯甲招供不招供囚犯乙招供各判刑两年甲判刑十年,乙立即释放不招供甲立即释放,乙判刑十年各判刑半年基于经济学中“理性经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。

事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。

博弈论纳什均衡与穷途困境概念

博弈论纳什均衡与穷途困境概念
从股东利益来讲,这100元是不应该筹集的。
经理的策略:配股
假定每一股配4股(100股,共配400股),价格为 0.25元(400×0.25=100)。假定100个股东,持股 分散。
博弈论纳什均衡和穷途困境概念
如果股东不接受配股:原来一股1元的价值 就变成0.3元(=150/500);
如果接受配股,他持有的股票的价值是1.5 (5股×0.3)元;因为配股的成本是1( 4×0.25)元,他多花1元,比不配股多得到 1.2=1.5-0.3的总价值。
博弈论纳什均衡和穷途困境概念
“智猪博弈”(boxed pigs)
按 等待

等待
3,1
2,4
7,-1
0,0
这个博弈中,大猪的最优选择依赖 于小猪的选择,但小猪的最优选择 与大猪的选择无关。如果大猪知道 小猪的理性的,大猪将选择“按”。 均衡是“大猪按,小猪等待”。 “劣”战略:无论对方选择什么,如果 自己选择A得到的总是收益小于选择 B得到的收益,A就是相对于B的劣 战略。
提供 不提供
提供 4,4 5,-1
不提供 -1,5
0,0
税收制度就是保证公共产品的生产, 解决公共产品生产上的“囚徒困境”
博弈论纳什均衡和穷途困境概念
例子
3、军备竞赛 谁都知道大量扩军是劳民伤财,问题是,
我不扩军,你扩军,我不是要受到军事威 胁么? 4、经济体制改革 改革者要付出成本,甚至牺牲,而改革的 成果大家共享,结果是,人人都知道改革 好,但是却没有人真正的去改革。
例子
1、囚徒困境 2、公共产品的供给 大家出钱兴办公用事业,所有人的福利都
会增加,问题是,如果我出钱,你不出钱 ,我得不偿失;反之,你出钱,我不出钱 ,就可以占你的便宜。结果,大家都不出 钱。

《博弈论》-课程教学大纲

《博弈论》-课程教学大纲

《经济博弈论》课程教学大纲一、课程基本信息课程代码:16046305课程名称:经济博弈论英文名称:Economy Game课程类型:专业基础课总学时:32学分:2适用对象:经管类专业大二、大三年级学生先修课程:微观经济学、微积分。

二、课程简介中文简介:本课程是经济学的标准分析工具之一,着重研究个体之间的相互依存性,是日常生活中一种极重要的思维方式,在经济学课程建设中占有核心地位。

产业组织理论中的新产业组织学派,信息经济学中的海萨尼转化,宏观经济学中的博弈方法,区域经济学中的空间博弈问题,制度变迁理论中的演化博弈分析、公共经济学中的委托代理问题和公共选择问题等都与本课程有关。

英文简介:This course is one of the standard analysis tools of economics. It focuses on the interdependence of individuals. It is an extremely important way of thinking in daily life and occupies a core position in the construction of economics courses. The new industrial organization school in the theory of industrial organization, the Hesanian transfo rmation in information economics, the game method in macroeconomics, the spatial game problem in regional economics, the evolutionary game analysis in the theory of institutional change, and the public economics The principal-agent issues and public choice issues are all related to this course.三、课程性质与目的在掌握微、宏观经济学的基础上,同学通过本课程的学习,掌握经济博弈论的主要理论知识,培养学生正确分析问题做出决策的能力,并能从博弈的角度理解消费者、企业、政府以及各个行为主体的决策,以及相应的社会福利结果。

《管理经济学》(二)-囚徒困境与纳什均衡的含义与应用(2)

《管理经济学》(二)-囚徒困境与纳什均衡的含义与应用(2)

《管理经济学》(二)-囚徒困境与纳什均衡的含义与应用(2)南开大学现代远程教育学院考试卷2020年度春季学期期末(2019.9) 《管理经济学》(二)主讲教师:卿志琼一、请同学们在下列(20)题目中任选一题,写成期末论文。

1、完全竞争市场、垄断竞争市场、寡头垄断市场和完全垄断市场特点比较分析2、完全竞争市场的特点与评价3、完全竞争市场厂商短期关门点决策4、完全竞争市场厂商长期均衡的利润状况分析5、完全垄断市场的特点分析6、完全垄断市场厂商的长期均衡条件分析7、论价格歧视及其条件8、论一级差别定价、二级差别定价和三级差别定价的含义与适用条件9、论垄断竞争市场的条件与企业决策10、垄断竞争市场厂商的价格竞争与非价格竞争11、寡头市场结构的特点分析12、比较完全竞争、完全垄断和垄断竞争市场结构的长期均衡条件与效率分析13、卡特尔定价与价格领导的含义与应用14、论博弈论对企业决策的启示15、运用某一市场结构分析企业的定价与产量决策16、成本加成定价法的含义及其应用17、企业不同的定价实践与应用18、市场进入障碍与市场结构——以某市场为例19、长期投资决策原则与应用20、囚徒困境与纳什均衡的含义与应用二、论文写作要求1、论文题目应为授课教师指定题目,论文要层次清晰、论点清楚、论据准确;2、论文写作要理论联系实际,同学们应结合课堂讲授内容,广泛收集与论文有关资料,含有一定案例,参考一定文献资料。

3、第13题——20题,可以加副标题。

如第20题,囚徒困境与纳什均衡的含义与应用——以可口可乐与百事可乐广告战为例三、论文写作格式要求:论文题目要求为宋体三号字,加粗居中;正文部分要求为宋体小四号字,标题加粗,行间距为1.5倍行距;论文字数要控制在2000-2500字;论文标题书写顺序依次为一、(一)1. ……四、论文提交注意事项:1、论文一律以此文件为封面,写明学习中心、专业、姓名、学号等信息。

论文保存为word文件,以“课程名+学号+姓名”命名。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Page 32
如果其他牧民约束放牧规模,我单独一家人过度放 牧不会破坏广褒的牧场,但自己却获得了高额的收益。 因此,任何一位牧民的结论都会是:无论其他牧民是否 过度放牧,我选择“约束自己的放牧规模”都是劣战略, 从而被剔除。大家最终都会选择过度放牧,结果导致草 地消失,生态破坏。
内蒙古草原的沙漠化
三、囚徒困境详解和延伸
1、囚徒困境详解
Page 17
囚徒乙
S i 称为占优策略,或占优于其他策略 坦白
抵赖
囚徒甲 坦白 -8,-8 0,-10
抵赖 -10,0 -1,-1
占优策略均衡 囚徒甲
坦白 抵赖
囚徒乙
坦白
抵赖
-8,-8
0,-10
-10,0
-1,-1
Page 18
每个参与人组成的优势策略称为占优策略均衡。 甲和乙都不会选择劣战略“抵赖”,称为“剔除劣战略的占优战 略均衡”。其中“坦白”是占优于(优于)“抵赖”的占优战略。
2、囚徒困境特点
Page 19
•利己、理性
•非合作
•存在严格劣策略
囚徒困境假定每个参与者(即“囚徒”)都是利己的, 即都寻求最大自身利益,而不关心另一参与者的利益。
参与者某一策略所得利益,如果在任何情况下都比其他 策略要低的话,此策略称为“严格劣势”,理性的参与者绝 不会选择。另外,没有任何其他力量干预个人决策,参与者 可完全按照自己意愿选择策略。
解决方案
Page 7
这么一直迭代下去,理论上如果所有学生都是 理性人。平均数应当是1。应该说选择了1的学生都 看出了这个博弈的窍门。但是他们的选择不是最接 近平均数的。因为在现实中不可能所有人都是理性 人。
最终12是最接近平均数2/3的数。
案例——囚徒困境
Page 8
两个嫌疑犯甲和乙作案后被警察抓住,分别关在不同的 屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。
这就是我们看到的为什么大多数路、桥等公共设施 都是由政府出资修建的原因。同样的道理,国防、教育、 社会保障,环境卫生等都由政府承担资金投入,私人一 般没有积极性承担这方面服务的积极性和能力。
案例(2)苏格兰的草地消失了
Page 30
在18世纪以前,英国苏格兰地区有大量的草地,其 产权没有界定,属公共资源,大家都可以自由地在那里 放牧。草地属于“可再生资源”,如果草场, 但如果不限制放牧规模,过多的牛羊将草吃得一光二净, 则今后不会再有新草生长出来,草场就会消失。
“囚徒的两难选择”有着广泛而深刻的意义。个人理 性与集体理性的冲突,是对所有人都不利的结局。他们 两人都是在坦白与抵赖策略上首先想到自己,这样他们 必然要服长的刑期。只有当他们都首先替对方着想时, 或者相互合谋(串供)时,才可以得到最短时间的监禁的 结果。
Page 38
“纳什均衡”对亚当·斯密的“看不见的手”的原理 提出挑战。按照斯密的理论,在市场经济中,每一个 人都从利己的目的出发,而最终全社会达到利他的效 果。《国富论》中有这样一句名言:“通过追求(个人 的)自身利益,他常常会比其实际上想做的那样更有效 地促进社会利益”。从“纳什均衡”我们引出了“看 不见的手”的原理的一个悖论:从利己目的出发,结 果损人不利己,既不利己也不利他。两个囚徒的命运 就是如此。
在一个特定的战略组合下参与人得到的确定效用水平, 或是指参与人得到的期望效用水平。
均衡equilibrium:指所有参与人的最优战略的组合。
囚徒甲
坦白 抵赖
囚徒乙
坦白
抵赖
-8,-8
0,-10
-10,0
-1,-1
二、分类
•合作与非合作 •信息、动态
完全信息静态、动态 不完全信息静态、动态
Page 14
不顾及团体利益。“囚徒的困境”问题都是个体理性和 集体理性的矛盾引起的。
以全体利益而言,如果两个参与者都合作保持沉默,两
人都只会被判刑1年,总体利益更高,结果也比两人背叛对
方、判刑8年的情况较佳。
囚徒乙
坦白
抵赖
囚徒甲
坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
囚徒困境的启示
Page 37
解决方案
Page 5
假设每个人都选择100,平均数100×2/3=66.66。 所以不能选择67-100之间的数(严格劣势策略)。现 实中有两名学生选择了。 剔除了step1中的严格劣势策略后,重复迭代, 66×2/3=44。所以不能选择44-67之间的数(弱劣势 策略)。现实中有四名学生选择了。
3、囚徒困境结论
Page 20
结论1 不要选择严格劣势策略,因为选择优势策略,我们每次
都能得到更好的收益. 结论2
汝欲得之,必先知之。 结论3
站在别人的立场上去分析他们会怎么做。
思考1
Page 21
如果你是个“恶魔饭桶”,你的对手是个“愤怒天使”,这种情 况下我们该怎么办?
博弈论信息整理表格如下
5、如何走出囚徒困境?
Page 35
从以上例子我们可以看出:生活中存在着大量的“囚徒 困境”事例,有很多对我们的生活与合作不利。那么怎样才 能有效避免囚徒困境的出现,从而改善我们的生活呢?
囚徒困境延伸——合作:团体理性
Page 36
若要不是经济学,理性的选择,反而是选择优势策略
(次优的结果),即帕累托效率。
Page 31
由于草地的产权没有界定,政府也没有对放牧作出 规模限制,每家牧民都会如此盘算:如果其他牧民不约 束自己的放牧规模,让自己的牛羊过多地到草地上吃草, 那么,我自己一家约束自己的放牧规模规模对保护草场 的贡献是微乎其微的,不会使草场免于破坏;相反,我 也加入过度放牧的行列,至少在草场消失之前还会获得 一部分短期的收益。
如果其他国家拥有这个鱼群,假设这个鱼群在大西洋,如果其 他国家打算正常捕捞,你应该也会正常捕捞。如果其他国家不打算 减少捕捞量,那么你现在就想把鱼捞出来,因为没准明天就会没鱼 可捞了。
思考5
Page 26
全球变暖和碳排放问题 大家能理解碳排放也是一种囚徒困境吗?
4、囚徒困境案例
Page 27
(1)政府要负责修建公共设施
恶魔饭桶
α
β
愤怒天使 α 0,0 -1,1
β 3,-3 1,1
21
Page 22
大揭秘
正确答案选 ,因为 是优势策略, 是
劣势策略。
22
思考2 市场进入阻挠(静态)
Page 23
在位者
默许
斗争
进入 进入者
不进入
40,50 0,300
-10,0 0,300
思考3
Page 24
价格竞争
两家互相打价格战的企业,可能会陷入囚徒困 境。为什么?
设想有两户相居为邻的农家,十分需要有一 条好路从居住地通往公路。修一条路的成本为4, 每个农家从修好的好路上获得的好处为3。如果 两户居民共同出资联合修路,并平均分摊修路成 本 , 则 每 户 居 民 获 得 净 的 好 处 ( 支 付 ) 为 34/2=1;当只有一户人家单独出资修路时,修路 的居民获得的支付为3-4=-1(亏损)
Page 12
参与人在给定信息集的情况下的行动规则,它规定参与 人在什么时候选择什么行动。
战略与行动:战略是行动的规则而不是行动本身。 在静态博弈中,战略和行动是相同的。 战略必须是完备的,要给出参与人在每一种可想象得到 的情况下的行动选择。
5、支付payoff(效用utility)
Page 13
Page 11
参与人有关博弈的知识,特别是有关自然的选择,其他 参与人的特征和行动的知识。
表中每一个小方格内的数字被称为局中人的支付,其中 左边的数字代表甲的支付,右边的是乙的支付。表1中的双变 量矩阵称为博弈支付矩阵。 囚徒乙
坦白
抵赖
囚徒甲
坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
4、战略strategies
警察将两人分别置于两间房间分开审讯:如果两人都抵 赖,各判刑一年;如果两人都坦白,各判八年;如果两人中 一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。
如何选择?
一、博弈的要素
Page 9
1、参与人 players
一个博弈中的决策主体,他的目的是通过选择行动 (或战略)以最大化自己的支付(效用水平)。参与人可能 是自然人,也可能是团体,如企业,国家等。囚徒困境中甲 和乙是参与博弈的人,称为“局中人”。
信息和动态分类
Page 16
完全 信息
静态
完全信息静态博弈; 纳什均衡; Nash(1950)
动态
完全信息动态博弈; 子博弈精炼纳什均衡;泽尔腾 (1965)
不完全 信息
不完全信息静态博弈;贝叶斯纳 什均衡; 海萨尼(1967-1968)
不完全信息动态博弈, 精炼贝叶斯纳什均衡; 泽尔腾(1975) Kreps,Wilson(1982), Fudenberg,Tirole(1991)
MBA必修课
Page 1
博弈论
(Game Theory)
目录
第Ⅰ部分 博弈论导论 案例 诺贝尔经济学奖与博弈论
第Ⅱ部分 博弈论与纳什均衡 基本概念(策略、局中人)与 分类 囚徒困境及延伸(合作博弈、口头承诺) 智猪博弈及延伸 纳什均衡、零和博弈
第Ⅲ部分 博弈论与其他三类博弈 第Ⅳ部分 博弈论与信息(与机制设计)
非合作与合作
Page 15
博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈 理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束 力的协议。倘若不能,则称非合作博弈Non-Cooperative Game。
Collective Rationality, 是效率、公平、公正。
相关文档
最新文档