管理经济学5第五讲 博弈论

合集下载

博弈论PPT课件

博弈论PPT课件
有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)

博弈论完整版PPT课件

博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。

管理经济学5第五讲 博弈论

管理经济学5第五讲 博弈论

(三)从静态博弈到动态博弈

静态博弈是指双方同时决策,或者在决 策时不知道对方决策的结果
动态博弈是指一方先决策,另一方后决 策

(三)从静态博弈到动态博弈

先发优势与后发优势
乙 a 0 A 甲 100 B 10 5 0 10 5 b 4
(三)从静态博弈到动态博弈
乙 a b c 10 3 12 B 3 2 10 1
12
A 甲
12 2
11
4
(三)从静态博弈到动态博弈

到后推理的基本思想 防鲨网的突破 避免恶意收购的防鲨网:董事会共有5位成员, 按目前选举办法,一年只能更换一位。要改变 选举程序,可以提交建议,按规定,投票以顺 时针次序沿着董事会圆桌进行,一份提议必须 获得50%以上支持(缺席算反对),且任何人 若是提交一份建议而未获得通过,他及其赞同 者都将失去自己的董事席位和股份,由其他人 平分
如果某一信息是所有参与人都知道的 如果每个参与人都知道所有参与人知道这一信息 如果每个参与人都知道所有参与人都知道所有参 与人知道这一信息 如此这般以至无穷 这一信息就成为共同知识
(二)纳什均衡及其判断方法

一个博弈的纳什均衡不一定只有一个, 可能有两个,也可能更多
(二)纳什均衡及其判断方法

情侣博弈
女 拳击 拳 击 芭 蕾 1 2 0 0 1 0 2 芭蕾 0

(二)纳什均衡及其判断方法

如果出现两个以上的均衡应该如何选择
乙 a 2 A 甲 -1 B -1 1 1 2 -1 b -1
(一)基本概念

以囚徒困境为例
囚徒 A
坦白 不坦白 -1,-10 -2,-2
囚徒 B

《产业经济学》第五章--(博弈1)讲解

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。

管理经济学讲义之博弈论篇

管理经济学讲义之博弈论篇

PPT文档演模板
管理经济学讲义之博弈论篇
基本概念
博弈论和对策行为
•在策略型博奕中,一个对策有以下几种基本要素:
•一.局中人 •二.策略 •三.支付或收益(payoffs):
• 是指一局博奕的得失。或者说是局中人从各种策 略组合中获得的效用,它是策略组合的函数。如果 局中人得失的总和为零,则称这种对策为零和对策; 否则,称为非零和博奕。
PPT文档演模板
管理经济学讲义之博弈论篇
博弈论和对策行为
囚徒困境在经济学上的应用
• 那么,两个囚徒事先订好攻守同盟,两人都采取抵赖的策 略,不是可以改善两人的境遇吗?但问题是,这个攻守同盟 有没有意义?没有。原因在于(抵赖,抵赖)这个策略组合不是 一个纳什均衡,没有人有积极性去遵守这个协议。一般地, 假设博奕中的每个局中人事先达成一项协议,规定了各自的 行为规则。如果局中人会自觉遵守这个协议,等于说这个协 议构成了一个纳什均衡:给定别人遵守协议的情况下,自己 的最好选择就是也遵守协议。相反,一个协议不构成纳什均 衡时,它就不可能自动实施,因为至少有一个局中人会违背 这个协议。所以,不满足纳什均衡要求的协议是没有意义的 。
是多做广告,因此 (多做广告,多做广告)是一个纳什
均衡。这个纳什均衡的结果是大量资源消耗在广告上
。 PPT文档演模板
管理经济学讲义之博弈论篇
博弈纳什均衡概念的局限性在于,在博奕中有可能纳什均衡
不是唯一的。例:两家寡头价格竞争,经理可选择的策略是 价格不变或涨价,收益矩阵如下所示: 企业2
基本概念
博弈论和对策行为
•在策略型博奕中,一个对策有以下几种基本要素: •一.局中人(players):
• 即博奕的参与者,他们是博奕的决策主体行为 。根据自己的利益要求决定自己的,记局中人为i, 局中人集合为{1,2,…,I},即共有I个局中人。我们将 某个局中人以外的其它局中人称为“i的对手”,记 为-i。

管理经济学中的精华-博弈论

管理经济学中的精华-博弈论

三、纳什均衡 现实中大量存在没有上策的情况,此时是否还存在对 局的均衡状态呢? 性别之战。两个谈恋爱的人准备在周末晚上一起出去 男的喜欢听音乐会,但女比较喜欢看电影。当然,两个人 都不愿意分开活动。不同的选择给他们带来的满足由表9.3 表示。表9.3 性别之战 女
音乐会
男 音乐会 电影 2, 1 0, 0
成功的市场进入的策略。沃尔马的创业者山姆· 华尔顿在这方 面有着独到的见解。大多数的经营者都认为,大型折扣店依 靠较低的价格、较低的装修与库存成本经营,要赚钱就必须 要有足够大的市场容量,因此,这类商店无法在一个10万人 口以下的城镇上须要有足够大的市场容量,因此,这类商店 无法在一个10万人口以下的城镇上开始他的实践,到1970
现实中的企业没有一个会明确地预期什么时期会结束 经营,因此企业的竞争格局就可能近似于无限次重复博弈, 企业也就可能选择“以牙还牙”的策略,并导致相互合作 的结局。近年来,我国在许多行业发生的价格竞争多少带 有“恶性竞争”的意味。近来部分商业企业开始推行“实 价销售”,这是对恶性价格竞争进行反思的结果。 二、序列博弈
目录
日本企业已经有了他们的标准,这种标准被称为 MUSE,而欧洲企业也在开发他们自己的技术标准。假定 这两类企业的技术标准的策略选择将使他们得到如表9.4 所示的得益矩阵。
欧洲企业 日本标准 日本企业 日本标准 欧洲标准 100, 50 0, 0 欧洲标准 30,20 60,90
目录
由上述得益矩阵可见,对日本企业来说,如果日本企业的 欧洲企业都采用日本标准,他们获得最大得益;同样地,
囚犯的困境。两个犯罪嫌疑人A和B因作案被逮捕,检察 官将他们分别关在两间牢房里进行审读。检察官对A说, “我们实行的是‘坦白从宽,抗拒从严’的政策,如果你们 两个人都不坦白,你们都将被判刑2年;如果你坦白了而他不 坦白,那么你将只被1年,他将判8年;如果他坦白了而你不 坦白,那么你判8年他判1年;如果你们两个都坦白,你们就 将被从轻宣判。”当然,检察官对B说的话也是完全一样的。 但实际上,如果两个人都坦白,却会因涉及更多的罪案而都 被判刑5年。

博弈论课件

博弈论课件

脚的看牌人、看棋人,企业的顾问等。
对参与人的决策来说,最重要的是
必须有可供选择的行动集(策略集)和
一个很好定义 的支付函数。
自然被当作虚拟参与人。
清华诚志
10
(2)策略(strategies ):博弈中有两种策略
概念,一种为纯策略(pure strategy ), 简称策略, 指参与人在博弈中可以选择采用的行动(actions or moves)方案,是参与人在给定信息结构的情况 下的行动规则,它规定参与人在什么时候的什么情
囚徒困境反映了个人理性和集体理性的矛盾。如果 A和B都选择抵赖,各判刑1年,显然比都选择坦 白各判刑8年好得多。当然,A和B可以在被警察 抓到之前订立一个"攻守同盟",但是这可能不会有 用,因为它不构成纳什均衡,没有人有积极性遵守 这个协定,显然最好的策略是双方都抵赖.
清华诚志
5
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到自己,这样他 们必然要服长的刑期。只有当他们都首先替 对方着想时,或者相互合谋(串供)时,才可 以得到最短时间的监禁的结果。
清华诚志
26
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的思想, 每个个体都是理性的,所以必须了解竞争对手的思 想。商业关系被认为是一种相互作用。但博弈论并 不是疗法,并不是处方,它并不告诉你该付多少钱 买东西,这是计算机或者字典的任务。博弈论只是 提供一些关系的例证,一些有用的解决问题的方法。 这种思维方法也许是企业家应该学习的。对于经济 学家,也许需要学习它的理论模型,它的实验方式 。

管理经济学第五章-资料

管理经济学第五章-资料

市场结构与企业经营决策
管理经济学 西安电子科技大学 2020/2/26 P20
Managerial Economics
市场结构与企业经营决策
三、完全垄断条件下企业的短期决策 1 垄断企业面临的需求曲线和边际收入曲线
P
D=AR MR
Q
管理经济学 西安电子科技大学 2020/2/26 P21
Managerial Economics
Managerial Economics
“每人都在力图应用它的资本,来使其产品能得 到最大的价值。一般地说:他并不企图增进公共福利, 也不知道他所增进的公共福利为多少。他所追求的仅 仅是他个人的安乐,仅仅是他个人的利益。在这样做 时,有一只看不见的手引导他去促进一种目标,而这 种目标决不是他所追求的的东西。由于追逐自己的利 益,他经常促进了社会利益,其效果要比他真正想促 进社会利益时所得到的效果为大。”
管理经济学 西—安电—子亚科当技.大斯学 密2《020国/2/富26论》P15
Managerial Economics
• 人的欲望(需求)是无限的
清人胡澹庵编辑的《解人颐》一书中收录 了一首《不知足》诗:
终日奔波只为饥,方才一饱便思衣。 衣食两般比具足,又想娇容美貌妻。 娶得美妻生下子,恨无田地少根基。 买得田园多广阔,出入无船少马骑。 槽头拴了骡和马,叹无官职被人欺。 县丞主薄还嫌小,又要朝中挂紫衣。 若要世人心里足,除是南柯一梦西。
管理经济学 西安电子科技大学 2020/2/26 P30
Managerial Economics
市场结构与企业经营决策
P A
消费者剩余
P
生产者剩余
S
P0
B
A P0

管理经济学知识课件资料 (5)

管理经济学知识课件资料 (5)

博弈论与竞争策略第一节 简单博弈与博弈均衡一、案犯的困境 [例]案犯的困境。

在市场竞争中,有许多情况与案犯的困境是完全类似的,其中十分典型的是价格竞争的策略选择。

[例]假设一个市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15 元,我们可用下面的得益矩阵来说明每种策略组合的结果。

2、性别之战[例]性别之战。

一对恋人准备在周末晚上一起出去,男的喜欢听音乐会,但女的比较喜欢看电影。

当然,两个人都不愿意分开活动。

不同的选择给他们带来的满足由表表示。

[例]公共标准的争夺。

表高清晰度电视技术标准的争夺第二节重复博弈与序列博弈一、重复博弈1、无限次重复博弈策略:“以牙还牙”。

在价格竞争中,这一策略意味着什么呢?在第一次对局中,企业应选择高价策略。

然后,如果对方在第一次选择低价竞争,你就在第二次也削价竞争;如果对方在第一次选择高价,你也就维持高价策略。

只要对方在某一次降价竞争,你就马上选择降价作为报复;反之,如果对方保持“合作”的态度,你也就一直合作下去。

二、序列博弈序列博弈 :对局者选择策略有时间先后的顺序,某些对局者可能率先采取行动。

先行者优势:在序列博弈中,先行者可能占据一定的有利地位,。

[例1沃尔马的成功之道。

在大型连锁折扣店中,沃尔马一个相当著名的、经营成功的公司。

沃尔马创立于1969年,到1976年它已拥有153家分店,1986年发展到1009家,而到1993年又进一步发展到1800家分店;其经营的利润1986年达4.5亿美元,1993年则已超过15亿美元。

沃尔马的成功固然有各方面的因素,但关键在于其采取了成功的市场进入的策略。

沃尔马的创业者山姆·华尔顿在这方面有着独到的见解。

大多数的经营者都认为,大型折扣店依靠较低的价格、较低的装修与库存成本经营,要赚钱就必须要有足够大的市场容量,因此,这类商店无法在一个10万人口以下的城镇上经营并获得利润。

但山姆·华尔顿并不相信这种说法,他从美国西南部的小镇上开始他的实践,到1970年就开出了30家“小镇上的折扣店”,并获得了巨大的成功。

博弈论在管理经济学中的应用研究

博弈论在管理经济学中的应用研究

博弈论在管理经济学中的应用研究博弈论是一种研究人类决策行为的数学工具,它可以用来分析各种对抗情境下的策略选择。

在现代经济学中,博弈论被广泛运用于企业竞争、市场战略等领域。

本文将探讨博弈论在管理经济学中的应用研究。

博弈论的基本概念博弈论的基本概念包括博弈者、策略、收益等。

博弈者指参与博弈的每个人或机构,策略是博弈者在面对某种情况时所做的决策,收益是每个博弈者在某种情境下获得的利益。

博弈论中最常用的模型是博弈矩阵,它可以用来描述各种策略组合下每个博弈者的收益。

博弈论在企业竞争中的应用博弈论在企业竞争中的应用主要包括纳什均衡、博弈树等模型。

其中纳什均衡是博弈论中的一个最基本概念,指的是每个博弈者都采取最优策略的一种平衡状态。

在企业竞争中,博弈者通常是企业,策略包括价格、产品质量、广告宣传等方面。

纳什均衡模型可以帮助企业找到最优战略,避免陷入竞争激烈的价格战。

博弈树是用来描述博弈者在面临多阶段决策问题中的策略选择过程的一种模型。

在企业竞争中,博弈树可以用来分析企业在面对不同决策时所做的选择。

例如,在投资决策中,企业要考虑在短期和长期中投入的资金量以及取得的回报。

博弈树可以帮助企业分析不同决策对收益的影响,制定最优的投资策略。

博弈论在市场战略中的应用在市场竞争中,博弈论的应用可以帮助企业识别对手的战略、改善自身的策略,从而提高市场份额和利润。

博弈论在市场战略中的主要应用包括博弈均衡理论、僵局理论等。

博弈均衡理论指的是博弈双方之间达成的一种理性平衡状态,在这种状态下,每一方都不能通过修改自己的策略来获得更多的收益。

在市场中,企业需要通过博弈均衡理论来找到自己的最优策略,避免陷入一场无法取胜的市场竞争。

僵局理论则是用来解释博弈者无法达成协议的情况,而且每一个博弈者的策略选择都会导致最终的失败。

在市场竞争中,僵局理论可以用来解释为什么市场上会存在一些产业维持不了多个参与者的竞争,而只能由一个或几个企业垄断。

结论博弈论是一种重要的分析工具,它可以帮助企业识别竞争对手的策略,制定最优的市场战略,从而提高企业的盈利能力。

《经济博弈论》PPT课件

《经济博弈论》PPT课件
13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈

方 1

博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2




弈 方

1, 0
1, 3

第五经济博弈论 PPT

第五经济博弈论 PPT

进化稳定策略得检验
比例的博弈方偏离“同意”策略选择了“不同意” uy (1 )1 0 1 un (1 ) 0 0 0 u (1 )u y un (1 )2
因为 uy 1 0 且接近于1,因此犯错误博弈方得期
望得益远远低于没有犯错误得博弈方,也远低于群体平均得益, 因此犯错误得博弈方会逐步改正错误,最终仍然会趋向于x=1, 即所有博弈方都采用“同意”策略。
签协议博弈:
同意 不同意
博弈方2
同意
不同意
1,1
0,0
0,0
0,0
两个纯策略纳什均衡:(同意,同意),(不同意,不同意), 前一个纳什均衡帕累托优于后一个纳什均衡。假如就是在完全理 性得基础上进行该博弈,可以预期结果就是(同意,同意)。
下面就是在理性层次较低得有限理性博弈方组成得大群体成员 随机配对反复博弈得分析框架内进行分析。
因此x 1是在上述复制状态下的一个进化稳定策略ESS
进化稳定策略得检验
比例的博弈方偏离“不同意”策略选择了“同意”
uy (1 ) 0 1 un (1 ) 0 0 0 u (1 ) un uy 2
uy 0 un
x 0不是进化稳定策略
5、3、2一般两人对称博弈复制动态 与进化稳定策略
5、3、1 签协议博弈得复制动态与进化稳定策略
签协议博弈:
同意 不同意
博弈方2
同意
不同意
1,1
0,0
0,0
0,0
假设群体中采用“同意”博弈方得比例x,则不同策 略期望得益与平均得益为:
uy x 1 (1 x) 0 x un x 0 (1 x) 0 0 u x u y(1 x) un x2
只要博弈方有基本得、包括直觉与经验得判断能力, 早晚会发现上述得益差异,得益较差类型得博弈方或早或 迟会发现改变策略对自己就是有利得,并开始模仿另一种 类型得博弃方。

《博弈论及其在经济管理中的应用》教学课件59页PPT

《博弈论及其在经济管理中的应用》教学课件59页PPT

2020/5/3
1
博弈是经济行为主体在“策略相互依存”局势下相互作用状 态的抽象表达。博弈论是研究博弈局势下经济行为主体的理 性行为选择的理论,或者说是研究多人决策问题的理论,这 类问题在经济学和管理学研究中经常遇到。例如,在经济研 究中,微观领域的讨价还价、拍卖机制的设计,特别是产业 组织领域,就涉及博弈论;宏观领域中,国家之间的竞争与 合作、宏观经济政策制定者和企业等微观单位之间的相互作 用等,用博弈论能够得到很好的理解。在企业管理中,博弈 论就更是大有用武之地。企业的投资决策、融资决策、市场 营销决策、人力资源管理等都涉及到多方的互动关系,而这 正是博弈论的优势所在。实际上,企业本身上就是一个博弈 网。总之,无论是宏观层次还是微观层次的决策问题都可以 运用博弈论的理论和方法进行分析。正如诺贝尔经济学奖获 得者萨缪尔森所说:“要想在现代社会做一个有文化的人, 你必须对博弈论有一个大致的了解”。
2020/5/3
10
嫌疑人1:坦白 嫌疑人2:坦白
嫌 坦白 疑 人 1 不坦白
嫌疑人 2
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
两个罪犯的得益矩阵
2020/5/3
11
例3:能否双嬴
➢ 产量竞争:考虑两家企业垄断了某一产品市场的情况。每 一企业在生产决策时考虑的都是产量变化,即决定生产多 少该种产品才能使企业利润最大?因为这两家企业在市场 上的主宰地位,他们两家的产量之和就等于市场对该产品 的需求总量。于是,每一厂家的生产决策就会直接影响到 另一厂家的生产决策,他们之间必然要展开激烈的竞争。 每一家企业都要对另一家企业的产量决策做出反应并采取 相应的产量决策,也就是说,每一家企业的产量决策都是 要根据对竞争对手的预期,在估计出对手可能选定的产量 的基础上再做出自己的最佳产量决策。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(二)纳什均衡及其判断方法

练习 情侣博弈,如果男方处心积虑要和女方 在一起,而女方想方设法躲避他 a构造一个博弈矩阵反映上述情况; b是否存在纳什均衡
(二)纳什均衡及其判断方法



如果A国有两个师的兵力而B国有三个师 的兵力,任务是攻克B国一座城市。 规则是:双方兵力只能整师调动,通往 城市道路只有甲乙两条,如果A攻击时, 兵力超过对方就获胜,相等或少就失败。 A国的策略是什么
(二)纳什均衡及其判断方法

优势策略均衡 如果无论其他参与人选择什么策略,某 个策略都是参与人i 的强最佳应对,那么 该策略就是参与人i 的优势策略,每个人 参与人的优势策略的组合就是优势策略 均衡
(二)纳什均衡及其判断方法
囚徒 A 坦白 坦 白 不 坦 白 5 -5 -1 -10 -2 -1 -2 不坦白 -10
A 开发 B 开发 (-3,-3) 不开发 开发 不开发 B 不开发 (0,0)
(1,0)
(0,1)
(三)从静态博弈到动态博弈
B {开发,开发} 开发 A 不开发 0 -3 {开发, 不开发} {不开发,开发} {不开发, 不开发} -3 0 1 0 0 0 1 0 1 0 0
-3
1
-3
(三)从静态博弈到动态博弈
(三)从静态博弈到动态博弈

静态博弈是指双方同时决策,或者在决 策时不知道对方决策的结果
动态博弈是指一方先决策,另一方后决 策

(三)从静态博弈到动态博弈

先发优势与后发优势
乙 a 0 A 甲 100 B 10 5 0 10 5 b 4
(三)从静态博弈到动态博弈
乙 a b c 10 3 12 B 3 2 10 1
(三)从静态博弈到动态博弈
A 开发 N 大0.5 B 开发 不开发 开发 B 不开发 小0.5 大0.5 B 开发 不开发 不开发 N 小0.5 B 开发 不开发 (0,0)
(4,4) (8,0)(-3,-3) (1,0) (0,8) (0,0) (0,1)
(三)从静态博弈到动态博弈

如果已知需求小
(三)从静态博弈到动态博弈

强盗分金 有5个强盗掘出了100块金币。经协商,分配金 币的规则为:老大先提出分配方案,经5人表 决,如多数人同意,方案就被通过,否则老大 将被扔入大海喂鲨鱼。如果老大被扔入大海, 则由老二提出分配方案,如多数人同意方案就 被通过,否则老二也要被扔入大海。以下类推。 金币会怎样分配
博弈论
(一)基本概念 (二)纳什均衡及其判断方法 (三)从静态博弈到动态博弈 (四)从完全信息博弈到不完全信息博弈
(一)基本概念


参与人(players): 决策的个体,其目标都是自身效用的最大化 行动(actions)与策略(strategies) 行动:某个参与人所能做的某一选择,它所能 做的全部行动的集合称为行动集。一个行动组 合(action profile)是一个由博弈中的n个参与 人每人选取一个行动所组成的一个集; 策略:是决定参与人在博弈中每一个不同情况 下如何选择行动的规则(策略集、策略组合)
(二)纳什均衡及其判断方法
乙 a 2 A 甲 3 B 1 0 C 2 2 2 3 2 2 3 2 2 2 3 b 1 0 c 2
(二)纳什均衡及其判断方法

监督博弈 税收机关的纯策略是检查或不检查 纳税人的纯策略是逃税或不逃税
a:应纳税款 C:检查成本 F:罚款 假定C<a+F
(二)纳什均衡及其判断方法
(三)从静态博弈到动态博弈

博弈的扩展式表述
A 开发 N 大0.5 B 开发 不开发 开发 B 不开发 小0.5 大0.5 B 开发 不开发 不开发 N 小0.5 B 开发 不开发 (0,0)
(4,4) (8,0)(-3,-3) (1,0) (0,8) (0,0) (0,1)
(三)从静态博弈到动态博弈

智猪博弈
小猪 按键 按 键 等 待 1 5 -1 9 0 4 0 等待 4
大猪
(二)纳什均衡及其判断方法

判断的方法可以有两种
劣势策略消去法 相对优势策略划线法
(二)纳什均衡及其判断方法
囚徒 A 坦白 坦 白 不 坦 白 5 -5 -1 -10 -2 -1 -2 不坦白 -10
囚徒 B
(二)纳什均衡及其判断方法
(二)纳什均衡及其判断方法

石头、剪刀、布游戏 赢者得1、输者-1、平局得0
(二)纳什均衡及其判断方法


如果允许混合策略,每个有限博弈都有 至少一个纳什均衡 在n人策略式博弈中,如果每个参与人的 纯策略空间Si是欧式空间上的一个非空的、 闭的、有界的凸集,支付函数ui(s)是连续 的且对si是拟凹的,那么存在一个纯策略 纳什均衡
(三)从静态博弈到动态博弈

A先生成为新董事,他提出提议,内容是: 如果该提议全票5通过,A可以选择一个全新的 董事会,其余董事可获得不多的补偿 如果4:1通过,投反对票的董事就要离开,没 有任何补偿 如果3:2通过,A将会把他的51%股份平分给 另两位投赞成票的董事,投反对票的董事就要 离开,没有任何补偿

相对优势策略划线法
小猪 按键 按 键 等 待 1 5 -1 9 0 4 0 等待 4
大猪
(二)纳什均衡及其判断方法

纳什均衡是谁都没有激励去改变现状,改 变就会不如现在(严格纳什均衡)或者至 少不会比现在好,它是一个稳定的结果。
(二)纳什均衡及其判断方法
乙 a 2 A 甲 3 B 1 0 C 2 2 2 3 2 2 3 2 2 2 3 b 1 0 c 2
(二)纳什均衡及其判断方法
重复剔除优势均衡
北 -2 北 肯尼 -1 南 1 3 -3 2 2 木村 南 -2
(二)纳什均衡及其判断方法

纳什均衡 在一个策略组合中,在其他参与人都不 会改变已有策略的条件下,如果没有参 与人有改变自己策略的激励,则称此种 策略组合为纳什均衡
Hale Waihona Puke (二)纳什均衡及其判断方法
(一)基本概念

以囚徒困境为例
囚徒 A
坦白 不坦白 -1,-10 -2,-2
囚徒 B
坦白 不坦白
-5,-5 -10,-1
(二)纳什均衡及其判断方法

常见的均衡概念有三种: 优势策略均衡 (dominant strategy equilibrium) 重复剔除优势均衡 (iterated dominance equilibrium ) 纳什均衡 (Nash equilibrium )
(一)基本概念

支付(payoffs) 第i个人的支付表示在所有的参与人和自 然都选择了各自行动且博弈已经完成后, 他所获得的效用 支付矩阵
(一)基本概念

结果(outcome)与均衡(equilibrium) 结果:是指在博弈结束后,建模者从行 动、支付和其他变量的取值中所挑选出 来的他所感兴趣的要素的集合 均衡:指由博弈中的n个参与人每人选取 的最佳策略所组成的一个策略组合

在罚点球前几天的晚餐上,需要扑救点球的守门员加 托· 迪亚兹思考主罚的那位球员会怎么做: “康斯坦总是朝右边踢。” “不错,一直如此。”俱乐部主席说。 “但是他知道我知道这个。” “那样的话我们就要丢球了。” “没错,不过我知道他知道我知道。”加托又说。 “那你就准备好朝右边扑救。”餐桌上有一个人插 嘴说。 “不,他知道我知道他知道的。”加托· 迪亚兹说, 他离开餐桌,躺在床上开始了无尽的思考。
(二)纳什均衡及其判断方法
乙 a 2 A 甲 -1 B -1 1 1 2 -1000 b -1
(二)纳什均衡及其判断方法

路径依赖问题
乙 a b c 10 3 12 B 0 12 C 3 1 2 8 11 1
12
A 甲
12 2
11
4
13 2
(二)纳什均衡及其判断方法
乙 a b c 10 3 12 B 0 12 C 3 1 2 8 11 1
坦白 坦 白 不 坦 白 5 -5 -2 -10 -2 -2 -2 囚徒 A 不坦白 -10
囚徒 B
(二)纳什均衡及其判断方法

俾斯麦海之战 1943年,日本海军上将木村受命将日本 陆军运抵新几内亚,其间必须穿越俾斯 麦海,美国海军上将肯尼计划进行轰炸。 穿越俾斯麦海有两条路线:较短的北线 和较长的南线,木村需要从中选择一条, 肯尼也需要决定如何派飞机,如果选错 了,轰炸天数就会减少。
12
A 甲
12 2
11
4
(三)从静态博弈到动态博弈

到后推理的基本思想 防鲨网的突破 避免恶意收购的防鲨网:董事会共有5位成员, 按目前选举办法,一年只能更换一位。要改变 选举程序,可以提交建议,按规定,投票以顺 时针次序沿着董事会圆桌进行,一份提议必须 获得50%以上支持(缺席算反对),且任何人 若是提交一份建议而未获得通过,他及其赞同 者都将失去自己的董事席位和股份,由其他人 平分
12
A 甲
12 2
11
4
13 2
(二)纳什均衡及其判断方法
乙 a b c 10 3 12 B 0 12 C 3 1 2 8 11 1
12
A 甲
12 2
11
4
13 2
(二)纳什均衡及其判断方法

对每一个参与者而言,对不同的均衡结 果是有不同的偏好的,不同的结果有时 取决于不同的路径,所以为获得自己想 要的结果,要想办法使对方相信,某些 路径你是决不会采取的,以将此种路径 排除。 破釜沉舟
税收机关不检查的期望 收益 G 0, a 1 税收机关的期望收益: G 1, 1 G 0,
相关文档
最新文档