第十章博弈论
博弈论PPT课件
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
博弈论
效用(英文:Utility),是经济学中最常用的概念之一。
一般而言,效用是指对于消费者通过消费或者享受闲暇等使自己的需求、欲望等得到的满足的一个度量。
正和博弈亦称为合作博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。
负和博弈,是指双方冲突和斗争的结果,是所得小于所失,就是我们通常所说的其结果的总和为负数,也是一种两败俱伤的博弈,结果双方都有不同程度的损失那是定理在一个有n个博弈方的博弈G=﹛S1,…,Sn:u1,…,un}中,如果n是有限的,且Si 都是有限集(对i=1,…,n),则该博弈至少存在一个纳什均衡,但可能包含混合策略。
是由纳什发现的。
美苏争霸的囚徒困境军备竞赛是囚徒困境的又一个典型例子。
下面讲的,源自30年前美国的博弈论课本,本书不敢掠美。
从军事上看,30多年前,美国和苏联是世界上的两个超级大国,它们相互对垒。
假定每一方都有两种策略选择,一个是扩军,发展战略核武器,甚至实施“星球大战”计划等;另一个是彻底裁军,直至不设军备。
如果双方都扩军,则各花费2 000亿美元用于军费。
彻底裁军,则军费为0。
在一个弱肉强食的世界上,如果美国裁军不设防,但是苏联扩军,苏联就可以任意欺侮和损害美国。
这样,美国会受到很大损失。
损失之大,直至丧失主权。
这使我们可以非正式地把这种情况下美国的赢利记做–∞,即负无穷大。
这时候,欺侮人的一方的赢利是多少呢?你可能想象应该是+∞,即正无穷大。
其实不然。
你想想,砍伐一片森林所造成的损失,难道可以用所得到的木材的价值来补偿吗?更不必说占领甚至炸毁对方一座城市,你所得到的远远低于对方的损失。
被欺侮一方的损失,并不会等量地转化为欺侮人的一方的利益,这常常是对抗的规律。
所以,在一方扩军欺侮别人而另一方裁军任人欺侮的情况下,我们假定欺侮人的一方将只掠夺到一个有限数额的财富,比方说10 000亿美元。
这10 000亿美元的掠夺成本是上面讲的2 000亿美元。
《西方经济学》讲义 第十章 博弈论初步
第十章博弈论初步一、教学目的使学生具备博弈论的思维,会使用博弈的方法来分析经济问题,掌握博弈论的基本概念和应用。
二、教学重点博弈论的基本概念、参与人、行动、信息,纯策略均衡,混合策略均衡。
三、教学难点纳什均衡的概念、策略选择。
四、教学方法讲授和讨论五、教学安排本章计划安排6学时六、教学步骤(一)课程导入传统博弈论纳什均衡解的概念是以博弈规则、参与者的理性以及参与者的收益函数都是共同知识为前提的。
现实生活中的人们并不是理性的,行为主体很难在短时间内准确地寻找到自己的最优决策,同时对其他主体的行为预测也同样不可能准确无误。
列举“囚徒困境”、“智猪博弈”的例子,引发学生对博弈的思考,理解策略的意义和应用性。
(二)课堂教学设计以寡头市场为例引入教学内容:我们知道,在寡头市场上(寡头市场又成为垄断市场。
它是指几家厂商控制整个市场的产品的生产和销售的这样一种市场组织),厂商们之间的行为是相互影响的,每个厂商都需要首先推测或者了解其他厂商对自己所要采取的某一行动的反应,然后在考虑到其他厂商这些反应方式的前提下,再采取对自己最有利的行动。
在寡头市场上的每一个厂商都是这样思考和行动的,因此,厂商之间行为的相互影响和相互作用的关系如同博弈。
(三)教案内容第一节博弈论和策略行为一、博弈论的含义博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。
策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动是指,每个人要根据其他人的可能反应来决定自己的决策和行动。
二、博弈的三个基本要素三个基本要素,即参与人、参与人的策略和参与人的支付。
所谓参与人(或称局中人),就是在博弈中进行决策的个体;所谓参与人的策略,指的是一项规则,根据该规则,参与人在博弈的每一时点上选择如何行动;所谓参与人的支付则是指,在所有参与人都选择了各自的策略且博弈已经完成之后,参与人获得的效用(或期望效用)。
博弈论贝叶斯博弈与贝叶斯均衡ppt课件
given
by
Ha
rsanyi, consider the following prob
abilities of occurrence for the fou
rDepaprtmoenst sofiMabthlemeaticsmatch-ups:
Bayesian Nash Equilibrium
Department of Mathematics
不完全信息博弈问题
将博弈开始时就存在事前不确 定性的博弈问题称为不完全信息博弈问 题。
Department of Mathematics
例子:斗鸡博弈
两个所谓的勇士举着长枪,准备从独木桥 的两端冲上桥中央进行决斗。每位勇士都有
两种选择:冲上去(用U表示),或退下来(用D
Department of Mathematics
Example: Scalping Tickets
• For example, consider a scenario in which you and the Cavalier are each scalping tickets for beer money bef ore the UVa-Miami football game
This yields the following payoff matrix an d a single pure strategy Nash equilibriu m:
BS b1, BW b1 BS b1, BW b2 BS b2, BW b1 BS b2, BW b2
AS a1, AW a1 AS a1, AW a2 AS a2, AW a1 AS a2, AW a2
Department of Mathematics
西方经济学微观部分第十章博弈论初步
策略1 策略2
b p 1 ( b 1 1 b 1 ) 2 ( 1 p 1 )b 2 ( 1 b 2 )2
b11
策
参 p1 略
A的p1 条件010,1混 合aaa策 000略为与人A p:2 策略12
a11 b21
a21
b12 a12
b22 a22
[习题] 博弈论初步
[习题] 博弈论 初步
p1
单击添加副标题
第十章 博弈论初 步
西方经济学 (微观部分)
*自嘲* 一介学究,惶惶似狗。 东拼西凑,闲来插柳。 或存疏漏,等着挨揍。 钱财无有,知识半斗。 交流携手,相逢美酒。 余望何求?潮起云收。
第十章 博弈论初步 目录
目 录 /CONTENTS
1
第一节 ○
博弈论和
○
策略行为
2
第二节
3
0 q10.7 1 p10.5 7
1
9– 8–
2
第三节 混合策略均衡 二、混合策略的纳什均衡
第三节 混合策 略均衡
二 混合策略的纳什均衡
❖ 即使纯策略的纳什均衡不存在,相应的混合策
略纳什均衡总会存在。
❖ 纯策略纳什均衡作为 ·q1 1 特例被包括在混合策 略纳什均衡之中。 0.7·
❖ 混合策略博弈的均衡
[案例] “华容 道”里的纳什
均衡(1)
小 道
孔 明
大 路
[案例]“华容道”里的纳什均衡(1)
[案例] “华容道”里的纳什均衡(1)
曹操 小道 大路
被擒
逃脱
擒住 逃脱
空等 被擒
空等
擒住
❖ 孔明曰:“亮夜观乾象,操贼未合身亡。 留这人情, 教云长做了,亦是美事。” 玄德曰:“先生神算,世所罕及!”
微观经济学第十章博弈论
博弈论的基本概念
策略
参与者为达到最优目标而采取的 行动方案。
信息
参与者对其他参与者的行动或策 略的了解程度。
01
02
参与者
参与博弈的决策主体,可以是个 人、组织或国家。
03
04
收益
参与者在博弈中获得的利益或损 失。
博弈论的应用场景
01
02
03
04
商业竞争
企业间竞争策略、市场份额争 夺等。
政治外交
05
博弈论的实际应用
商业竞争中的博弈策略
竞争策略
企业可以利用博弈论来制定竞争 策略,例如通过分析竞争对手的
可能行动来制定最优反应。
合作博弈
企业也可以通过合作博弈来寻求共 赢,例如通过建立战略联盟或进行 合作研发来共同开拓市场或降低成 本。
市场进入与退出
博弈论可以帮助企业分析市场进入 和退出的可能性,以及制定相应的 策略。
感谢您的观看
THANKS
政策制定中的博弈论应用
政策制定
政府可以利用博弈论来制定政策, 例如通过分析利益相关方的博弈
行为来制定最优政策。
政策执行
政府也可以利用博弈论来分析政 策的执行效果,例如通过分析利 益相关方的反应来评估政策的可
行性。
政策调整
博弈论可以帮助政府根据利益相 关方的反应来调整政策,以实现
更好的政策效果。
国际关系中的博弈策略
纳什均衡的应用实例
囚徒困境
两个囚犯选择坦白或沉默,在给定对 方选择的情况下,自己选择坦白是最 优策略,最终导致两个囚犯都坦白, 实现了纳什均衡。
寡头竞争
公共资源过度使用
在公共资源的使用中,每个个体都追 求自身利益最大化,最终导致公共资 源过度使用,这也是一种纳什均衡的 现象。
《博弈论》
博弈论在大数据分析中的应用
数据挖掘
博弈论可以应用于数据挖掘中的关联规则挖掘、分类和聚类等问 题,如基于博弈论的关联规则挖掘算法等。
异常检测
博弈论可以应用于异常检测中的异常值识别和分类等问题,如基 于博弈论的异常检测算法等。
推荐系统
博弈论可以应用于推荐系统中的用户行为预测和个性化推荐等问 题,如基于博弈论的推荐算法等。
04
博弈论的应用领域
经济领域
价格竞争
博弈论可以用来分析企业之间的价格竞争,研究竞争对手的反应 和策略,以制定更有效的定价策略。
寡头市场
博弈论可以用来研究寡头市场的均衡和稳定性,分析不同寡头企业 的策略和相互影响。
拍卖理论
博弈论可以用来研究拍卖机制的设计和优化,以提高拍卖的效率和 公平性。
政治领域
线性方程组
02
求解博弈中的均衡策略通常需要解线性方程组。
特征值与特征向量
03
一些博弈问题可以通过分析矩阵的特征值和特征向量来得到解
决。
概率论与数理统计基础
概率分布
在博弈中,支付通常被假 设为随机变量,其分布可 以通过概率分布来描述。
期望与方差
支付的期望和方差是博弈 论中常用的概念,它们可 以用来衡量支付的不确定 性。
弈。
特点
混合博弈既强调参与者的合作与协 商,又强调参与者的竞争与对抗, 通过综合运用两种策略实现自身利 益最大化。
应用领域
混合博弈在经济学、政治学、社会 学等领域都有广泛的应用,尤其是 在现实世界中,很多博弈都可以被 视为混合博弈。
03
博弈论的数学基础
线性代数基础
向量与矩阵
01
博弈论中经常使用向量和矩阵来表示策略和支付。
博弈论教程(第四版)课件第十章 不完全信息序贯博弈
合(s大海,s丽娟)由逆推法得到。
• 要求2:p大海和p丽娟都是可行的信念,而且对于处
在博弈路径上的信息集,相关推断由策略组合(s
大海,s丽娟)和贝叶斯法则给出。
验证:
策略及信念组合(s大海,s丽娟;p大海,p丽娟)=({芭蕾,
足球},{足球,芭蕾,芭蕾,芭蕾};{0.4,0.6;0.6;
到。
• 要求2:局中人的信念都是可行的,而且对于处在
博弈路径上的信息集,相关信念由策略组合和贝
叶斯推断给出。
情侣博弈的贝叶斯子博弈精炼纳什均衡的要求:
我们称策略及信念组合(s大海,s丽娟;p大海,p丽
娟)是不完全信息序贯情侣博弈的一个贝叶斯子博
弈精炼纳什均衡,如果它满足以下两个要求:
• 要求1:在给定信念组合(p大海,p丽娟)的情况下,
(六)局中人的支付函数:u大海(a大海,a丽娟;t大海),u丽娟
(a大海,a丽娟;t丽娟),行动组合(a大海,a丽娟) 由博弈路径
给出,t大海∈T大海,t丽娟∈T丽娟。
通过加入虚拟局中人的方式,进一步展开
表达不完全信息序贯情侣博弈。
• 大海的类型和丽娟的类型都是外生给定的,服从
一个预先确定的联合概率分布。
例子:均衡可以表达为(s大海,s丽娟;p大海,p丽娟)
贝叶斯子博弈精炼纳什均衡的要求
在一个不完全信息序贯博弈里,如果局中人的
策略组合和信念组合满足下述两个要求,我们就称
它们构成了博弈的贝叶斯子博弈精炼纳什均衡:
• 要求1:在给定局中人的信念的情况下,局中人的
策略组合满足序贯理性,即策略组合由逆推法得
(receiver),以后简记为 “R”。
第十章_博弈论的理论与方法 (1)
MICROECONOMICS | 微观经济学
2. 博弈论的发展
① 博弈论产生于30-50年代 A、1944年,冯· 诺依曼、摩根斯坦恩合作发表 《博弈论与经济行为》,将博弈论引入关于 经济不确定性分析(预期效用概念),是博 弈论正式诞生的标志; B、1950年代初,普林斯顿大学数学系在塔克教 授指导下,形成了一个博弈论研究的博士生 小组,从“囚徒困境”分析中创立了“纳什 均衡”,奠定了现代博弈论基础。
§2 两人常数和博弈模型(Two-person Constant-sum Game)
利用博弈论来分析寡头垄断厂商行为的基本 方法是先构造出一个支付表或者支付矩阵,以表 明寡头垄断厂商可能采用的各种不同的策略以及 这些策略的组合和相应的结果。假设A和B为两家 寡头垄断的厂商,它们各自的总收益不仅是自己 的产品价格的函数,同样也是对方的产品价格的 函数。
厂商A的支付表
B A
B1 a11=50
B2 a12=100
A1 A2
a21=80
a22=120
浙江大学经济学院
MICROECONOMICS | 微观经济学
厂商B的支付表 B A A1 A2 B1 b11=50 b21=20 B2 b12=0 b22=-20
浙江大学经济学院
MICROECONOMICS | 微观经济学
浙江大学经济学院
MICROECONOMICS | 微观经济学
这种厂商的策略选择行为,在博弈论中 称为“从最小收益中选择最大收益 ( Maximize the Minimun Payoffs )” , 其 数学表达式形式为:
min a1j=a11=50 j min a2j=a21=80 j max min aij=a21=80 i j
博弈论课件
扩展一:不完全信息博弈
不完全信息博弈的定义
01
在博弈中,参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度,可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略,研究候选人如何 制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调,分析政策 制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作,分析国家如何通过 外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡 。
特点
纳什均衡是一种稳定的状态,任何参 与者单方面改变自己的策略都不会获 得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略, 该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略,该 策略都能为参与者带来更低的收益 。
特点
在优势策略下,参与者没有理由改 变自己的策略;在劣势策略下,参 与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降,还可能引发市场恶性竞争,破坏市场秩序。此外,价格战还可能导致产品质量 下降,损害消费者利益。
案例二:国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中,各国之间往往存在着复杂的博弈关系。为了维护自身利益,各 国会采取不同的博弈策略,如通过外交手段、经济制裁、军事威胁等方式来达 到自己的目的。
高鸿业《西方经济学(微观部分)》(第2版)名校考研真题详解-第十章 博弈论初步【圣才出品】
第十章 博弈论初步一、名词解释1.占优策略均衡(中央财经大学2011研;兰州大学2014研)答:在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。
也就是说,无论其他参与人采取什么策略,该参与人的最优策略是唯一的,这样的策略称之为占优策略。
如表10-1所示,通过对支付矩阵的分析可以看出,如果A 、B 两厂商都是理性的,则这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个厂商都会选择做广告。
这种策略均衡称之为占优策略均衡。
表10-1 广告博弈的支付矩阵2.纳什均衡(华中科技大学2002研;中国海洋大学2002研;东北大学2003研;武汉大学2003、2007研;北京大学2004研;北京师范大学2005研;中南大学2005研;东华大学2006研;东北财经大学2007研;中南财经政法大学2007、2009研;中央财经大学2007研;财政部财政科学研究所2008研;华南师范大学2011研)答:纳什均衡又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰·纳什的名字命名。
纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略的情况下,他选择了最好的策略。
纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而没有人有积极性去打破这个均衡。
3.混合策略(东北大学2007研;华中科技大学2008研)答:混合策略是指在博弈中,博弈方的决策内容不是确定性的具体的策略,而是在一些策略中随机选择的概率分别的策略。
混合策略情况下的决策原则有以下两个:(1)博弈参与者互相不让对方知道或猜到自己的选择,因而必须在决策时利用随机性来选择策略,避免任何有规律性的选择。
(2)博弈参与者选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性倾向的某一种策略而在博弈中占上风。
4.以牙还牙策略(东北财经大学2012研)答:以牙还牙策略的内容是:所有的成员一开始是合作的。
第十章 博弈论
第十章 博弈论
第一节 基本概念
(三)联合式博弈 策略式表述就无法全面地估价参与者之间的合作所 得。这正是合作博弈的“联合式”的目的所在。 在可转换效用的合作博弈里,一个联合S的合作 概率可通过赋予函数b(特征函数)一个实数值V(S) 来描述。V(S)代表了联合S给它的成员所能带来的全 部可转换效用;根据博弈中具体的效用含义,它被 称为联合S的“财富”或者“价值”或者“力量
10000,0
5000,5000
第十章 博弈论
第三节 重复博弈
先假定这场博弈是无限重复的,这时,两位店主会采取什么样的策略呢?
1.触发策略 2.针锋相对策略
3.合作均衡
第十章 博弈论
第四节 序列博弈
一、序列博弈
博弈的每个博弈的每个参与者依次 行动的博弈,就叫做序列行动博弈 (sequential-move game)。一般来 说,序列行动博弈比同时行动博弈更 容易分析。在序列博弈中,关键是要 通过各参与者可能的行为和理性的反 应来考虑。
第十章 博弈论
【学习目标】通过对本章的学习,重点掌握博弈论的一些基本概念;掌握
纳什均衡、重复博弈、序列博弈和讨价还价策略的主要内容。
第一节 基本概念 第二节 纳什均衡 第三节 重复博弈 第四节 序列博弈 第五节 讨价还价策略
第十章 博弈论
第一节 基本概念
一、博弈的含义
(一)含义 博弈就是指两个及两个以上的个人或组织都在追求各 自的利益,却没有人能够支配结果的一种竞争态势。
第十章 博弈论
第一节 基本概念
三、博弈论的定义
博弈论(game theory)又称对策论、游戏理论 或策略运筹论,是指一些个人、队组或其他组 织,面对一定的环境条件,在一定的规则下, 同时或先后,一次或多次,从各自允许选择的 行动或策略中进行选择并加以实施,从中各自 取得相应的结果的过程。
第十章 博弈论 试题
3、下列有关精炼贝叶斯均衡的叙述正确的有():
A.精炼贝叶斯均衡是完全信息动态博弈的子博弈精练纳什均衡与不完全信息静态博弈的贝叶斯(纳什)均衡的结合;
B.精炼贝叶斯均衡需满足的条件之一是,在给定每个局中人有关其他人类型的信念的情况下,他的策略选择是最优的;
广告的博弈 单位:百万元
企业 B
做广告
不做广告
企业 A
做广告
150,150
300,0
不做广告
0,300
200,200
(1)这是不是一个“囚犯的困境”?
(2)如果该对局只进行一次,其纳什均衡是什么?
(3)如果博弈是重复的,但我们不考虑无限次的情形,假设只进行10次对局。再假定企业A采取的是“以牙还牙”的策略,并在第一次对局中不做广告,企业B也将采取“以牙还牙”的策略。对企业B,考虑两种不同的情况:在第一次做广告或第一次不做广告,分别计算这两种情况下企业B的累计利润,试问企业 B将如何行动?
10、动态博弈中后行动者可以掌握先行动人的信息,所以后行动者可以得到更多的支付。()
四、辨析
1、“田忌赛马”是一场动态博弈。()
2、占优均衡比纳什均衡更稳定。()
3、在“囚徒博弈”中,如把博弈次数换成无限次博弈,则最终结果将发生改变。()
4、招标行为属于不完全信息的动态博弈。()
5、所有市场行为均属博弈行为。()
C.在精炼贝叶斯均衡中,每个局中人有关其他人类型的信念都是使用贝叶斯规则从所观察到的行为中获得的;
D.精炼贝叶斯均衡中的最优概念是指战略最优。
E.精练贝叶斯的是由海萨尼定义的。
4、在动态博弈战略行动中():
A.首先作出选择并采取相应行动的局中人往往可以获得更多的收益;
第十章---博弈论初步精选全文完整版
甲 (式乙)
p.61
p.42
A B
混合策略组合及其支付也就有无限多的可能。
q.31 C 4,6 7,3
乙
.q72 D 9,1 2,8 9
不存在纯策略均衡时的混合策略均衡3
• 条件混合策略:参与人在假定其他参与人按某一概率选择某一策略
的条件下设计的对自己而言具有相对优势的(即期望支付最大的)混合 策略,称为“条件混合策略”。
• 对乙而言,如果假定甲合作,那么乙合作的支付为6,比不合作的支付 多1,因此合作是甲合作条件下乙的条件策略;假定甲不合作,那么乙的 条件策略是也不合作,乙若合作支付只有1,不合作则可得到3。
• 条件策略组合:参与人以其他参与人选择某一策略为条件的条件策略与
作为它的条件的对方策略之间的组合,称为“条件优势策略组合”或
• 假q2=定1-(q1p代1,入p甲2)与、乙(各q自1,的q2期)望的支取付值表从达0到式1有无,限经多整可理能可,得把:p2=1-p1和 E甲= p1(7-10q1)+5q1+2(式1); E乙= 5q1(2p1-1)-7p1+8(式2)
• 每个参与人需要确定,在另一参与人为其混合策略选择某个概率值时, 己方混合策略的概率向量应怎样取值,才能使自己的期望支付最大。
e点的坐标是p1=0.5,q1=0.7,则纳什均衡 时p2=0.5,q2=0.3 。
q1 1
本题中混合策略的纳什均衡还可表示为:
((p1 , p2),(q1 ,q2) )= ((0.5 , 0.5),(0.7 , 0.3) )。 0.7 本题中,只有唯一的这个纳什均衡点。
1
q1<0.7
p1= [0,1] q1 = 0.7
《微观经济学》第十章博弈论与信息不对称.
2.博弈的扩展式
脆 -3,-3 8,10 10,8 -3,-3
脆
厂商1 (1) 甜
厂商2 (2)
厂商2 (3)
甜 脆 甜
图10-1: 产品选择的博弈扩展形式
第四节 威胁、承诺与可信性
一、空头威胁
表10-9:承诺后的市场进入博弈 垄断者 商战 默许 潜在 进入 进入 不进入 者 —5,10 5,9 0,24 0,24 垄断者 商战 默许
厂商B 厂商B
做广告不做广告 做广告不做广告
厂 做广告 商 不做广告 A
10,8 18, 3 2,17 15,12
厂 做广告 商 不做广告 A
10,8 18, 3 2,17 20,12
三、纳什均衡
表10-4:性 别 之 战 女
足球赛 音乐会 男 足球赛 2,1 0,0 音乐会 0,0 1,2 厂商 1 脆 甜 脆 甜
本章复习思考题
1.说明上策均衡与纳什均衡之间的联系? 2.假定企业A和B都是服装制造商,它们都可以选择生产高档或 中档产品,其支付矩阵如下(利润单位:万元): 企业B 中档 企业A 中档 高档 高档 100,80
(1)这两个企业有没有上策? (2)该博弈中有几个纳什均衡?有几个?请指出。 (3)若企业A可以先决定生产其产品,试用博弈的扩展形式来分 析该博弈中的纳什均衡。
表10-8:市场进入博弈
潜在 进入 者
进入 不进 入
—5,10 5,15 0,30 0,30
二、承诺与可信的威胁
第五节 信息不对称
一、信息不完全与信息不对称 二、逆向选择与市场信号 1.逆向选择 2.市场信号 三、道德风险与激励机制 1.道德风险 2.委托代理问题 3.激励机制的设计
高鸿业第五版微观讲义-郑炳-10第十章 博弈论初步(最终版,11.03.08)
第10章博弈论初步10.1本章框架结构图博弈论在20世纪50年代由数学家约翰·冯·诺依曼(Von Neumann)和经济学家奥斯卡·摩根斯坦(Morgenstern)引入经济学,目前已经成为主流经济分析的主要工具,对寡头理论、信息经济学等经济理论的发展作出了重要贡献。
一、博弈论的几个基本概念博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。
在策略性环境中,每一个人进行的决策和采取的行动都会对其他人产生影响。
因此,每个人在进行策略性决策和采取策略性行动时,要根据其他人的可能反应来决定自己的决策和行动。
1.博弈参与人参与人或称局中人,是指博弈中的决策主体,即在博弈中进行决策的个体。
参与人既可以是个人,也可以是团体(企业或国家)。
每个参与人的目标是通过选择行动使自己的效用最大化。
2.策略策略是指参与人选择行为的规则,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。
3.支付函数支付函数也称为效用函数,表明了博弈的参与人采取的每种策略组合的结果或收益,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。
4.支付矩阵参与博弈的多个参与人的收益可以用一个矩阵或框图表示,这样的矩阵或框图称之为支付矩阵,也称之为博弈矩阵或收益矩阵。
其中,博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个基本要素。
表10-1即为一个支付矩阵。
表10-1支付矩阵二、同时博弈:纯策略均衡“同时博弈”是参与人同时进行决策或行动的博弈。
在同时博弈中,在给定其他参与人的策略时,某个参与人的最优策略称之为该参与人的条件优势策略(简称条件策略),而包括该参与人的条件策略以及这些条件在内的所有参与人的策略组合称之为该参与人的条件优势策略组合(简称条件策略组合)。
1.占优策略在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。
也就是说,无论其他参与人采取什么策略,该参与人的最优策略是惟一的,这样的策略称之为占优策略。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
囚徒B 坦白 囚徒A 坦白 抵赖 -8,-8 抵赖 -1,-10
-10, -1 -2 ,-2
在博弈中,如果所有的参与人都有占优战略存 在博弈中, 在,因而博弈将在所有参与人的占优战略的基础 上达到均衡。这种均衡称为占优战略均衡 占优战略均衡。 上达到均衡。这种均衡称为占优战略均衡。在上 表中的“ 坦白,B也坦白” ,B也坦白 表中的“A坦白,B也坦白”就是占优战略均衡 条件: ( 2 ) 条件 : 占优策略虽然要求每个参与人是理 性的, 性的,但并不要求每个参与人知道其他参与人也 是理性的。 是理性的。
2、博弈论的基本要素 、
(1)参与人:又称局中人,是指博弈中选择行动以最大化自身 )参与人:又称局中人, 利益的决策主体(个人或团体) 利益的决策主体(个人或团体)。 (2)行为:是指参与人的决策变量,如消费者效用最大化决策 )行为:是指参与人的决策变量, 中的各种商品购买量,厂商利润最大化决策中的产量、价格等。 中的各种商品购买量 ,厂商利润最大化决策中的产量、 价格等 。 (3)策略:是指参与人选择其行为的规则,即参与人应该在什 )策略:是指参与人选择其行为的规则, 么条件下选择什么样的行动,以保证自身利益最大化。 么条件下选择什么样的行动,以保证自身利益最大化。 (4)信息:是指参与人在博弈过程中所掌握的知识,特别是有 )信息:是指参与人在博弈过程中所掌握的知识, 关其他参与人(对手)的特征和行动的知识。 关其他参与人(对手)的特征和行动的知识。 (5)收益:是指参与人从博弈中获得的利益水平,它是策略或 )收益:是指参与人从博弈中获得的利益水平, 行动的函数,是参与人真正关心的东西。 行动的函数,是参与人真正关心的东西。 (6)均衡:是所有参与人的最优策略或行动组合,一般称之为 )均衡:是所有参与人的最优策略或行动组合, 纳什均衡( 纳什均衡(Nash equilibrium)。 )
在非合作博弈中,按照参与人的先后 2、在非合作博弈中,按照参与人的先后 顺序进行分类 又可分为静态博弈和动 进行分类, 顺序 进行分类 , 又可分为 静态博弈和动 态博弈。 态博弈。
静态博弈是指 , 博弈中参与人同时选择行动; 静态博弈 是指, 博弈中参与人同时选择行动 ; 是指 或者虽非同时行动, 或者虽非同时行动 , 但行动在后者并不知道 行动在先者采取了什么具体行动。 行动在先者采取了什么具体行动。 动态博弈是指参与人的行动有先后顺序 , 动态博弈 是指参与人的行动有先后顺序, 而 是指参与人的行动有先后顺序 且行动在后者可以观察到行动在先者的选择, 且行动在后者可以观察到行动在先者的选择 , 并据此作出相应的选择。 并据此作出相应的选择。
二、博弈的分类
按照参与人之间是否合作进行分类, 参与人之间是否合作进行分类 1、按照参与人之间是否合作进行分类,博 弈可分为合作博弈和非合作博弈 合作博弈和非合作博弈。 弈可分为合作博弈和非合作博弈。
合作博弈是指参与人之间有着一个对各方具有 合作博弈 是指参与人之间有着一个对各方具有 约束力的协议, 约束力的协议 , 参与人在协议范围内进行的博 反之,就是非合作博弈 非合作博弈。 弈。反之,就是非合作博弈。 前者主要强调的是团体理性 ; 而后者主要研究 前者 主要强调的是团体理性; 而后者 主要研究 主要强调的是团体理性 人们在利益相互影响的局势中如何选择策略使 得自己的收益最大, 即策略选择问题, 得自己的收益最大 , 即策略选择问题 , 强调的 是个人理性。 是个人理性。
博弈的分类及对应的均衡概念
行动顺序 信 息 完全信息静态博弈 纳什均衡 完全信息动态博弈 子博弈精炼纳什均衡 静 态 动 态
完全信息
不完全信息静态博弈 不完全信息动态博弈 不完全信息 贝叶斯纳什均衡 精炼贝叶斯纳什均衡
完全信息博弈 第二节 完全信息博弈
一、完全信息静态博弈 二、完全信息动态博弈
一、完全信息静态博弈:纳什博弈论的原理与应用 完全信息静态博弈: 占优策略均衡——无论其他参与人如 1 、 占优策略均衡 无论其他参与人如 何选择自己的策略, 何选择自己的策略 , 该参与人的最优策略 选择是惟一的。 选择是惟一的。 (1)经典案例:囚徒困境 经典案例: 囚犯困境” “囚犯困境”讲的是两个同案犯罪嫌疑犯 囚徒) 被警方拘捕后, ( 囚徒 ) 被警方拘捕后 , 为防其相互间串 而分别拘捕、 隔离审问时, 供 , 而分别拘捕 、 隔离审问时 , 两疑犯所 面临的认罪策略选择的问题。 面临的认罪策略选择的问题。
完全信息博弈 第二节 完全信息博弈
2、重复博弈
(1)定义:是指同样结构的博弈重复许多次, 定义:是指同样结构的博弈重复许多次, 其中每次博弈称为阶段博弈。 其中每次博弈称为阶段博弈。 影响重复博弈均衡结果的主要因素: (2)影响重复博弈均衡结果的主要因素:博弈 重复的次数和信息的完备性。 重复的次数和信息的完备性。 博弈重复次数为无限次与冷酷策略 (3)博弈重复次数为无限次与冷酷策略 博弈重复次数为有限次时每个阶段博弈的均 博弈重复次数为有限次时每个阶段博弈的均 衡解都是一次性博弈的纳什均衡解。 衡解都是一次性博弈的纳什均衡解。
性 别 战
女方 看足球 男方 看足球 逛商场 3,1 0,0 逛商场 0,0 1,3
完全信息动态博弈: 二、完全信息动态博弈:
1、子博弈精练纳什均衡 房地产开发博弈(静态) 房地产开发博弈(静态)
B 开发 A 开发 不开发 -3,-3 0, 1 不开发 1,0 0,0
完全信息博弈 第二节 完全信息博弈
第九章 博弈论
第一节 博弈论的基本概念与分类 第二节 完全信息博弈 第三节 不完全信息博弈
博弈论的基本概念与分类 第一节 博弈论的基本概念与分类
一、博弈论的基本概念
定义:博弈论( theory) 又称对策论, 1 、 定义 : 博弈论 ( game theory ) , 又称对策论 , 是 研究相互依赖、相互影响的决策主体的理性决策行为 研究相互依赖、 以及这些决策的均衡结果的理论。通俗地讲, 以及这些决策的均衡结果的理论 。 通俗地讲 , 博弈论 是一种“游戏理论” 其准确的定义是:一些个人、 是一种 “ 游戏理论 ” 。 其准确的定义是 : 一些个人 、 团队或其他组织,面对一定的环境条件, 团队或其他组织 , 面对一定的环境条件 , 在一定的规 则约束下,依靠所掌握的信息,同时或先后, 则约束下 , 依靠所掌握的信息 , 同时或先后 , 一次或 多次,从各自允许选择的行为或策略进行选择并加以 多次, 实施,并从中各自取得相应结果或收益的过程。 实施,并从中各自取得相应结果或收益的过程。
智猪博弈
小猪 按按钮 大猪 按按钮 等待 3, 1 7,-1 等待 2,4 0,0
3.纳什均衡 ——在这一均衡中 , 每个参与人都确信 , 在这一均衡中, 每个参与人都确信, 在这一均衡中 在给定其他参与人战略决定的情况下, 在给定其他参与人战略决定的情况下 , 他选择了最优战略以回应对手的战略。 他选择了最优战略以回应对手的战略 。 纳什均衡是完全信息静态博弈解的一般 情况。 情况。
在行动开始前的A看来,如果不计得失, 在行动开始前的A看来,如果不计得失,B有 四种战略可选择。 四种战略可选择。 • 第一,无论A是否开发,B都要开发。 第一,无论A是否开发, 都要开发。 • 第二,如果A开发,B也开发;如果A不 第二,如果A开发, 也开发;如果A 开发, 也不开发。 开发,B也不开发。 • 第三,如果A开发,B就不开发;如果A 第三,如果A开发, 就不开发;如果A 就开发。 不开发 ,B就开发。 • 第四,无论A是否开发,B必定开发。 第四,无论A是否开发, 必定开发。
完全信息博弈 第二节 完全信息博弈
先行动者A 先行动者A对B预测结果的收益矩阵
B
开发,开发 开 发 开发,不开发 不开发,开发 不开发,不开发
-3,-3
-3, -3
1, 0
1,0
A
不开发
0, 1
0, 0
0, 1
0,0
完全信息博弈 第二节 完全信息博弈
只有当某一战略组合在每一个子博弈上都 构成一个纳什均衡,这一战略组合才是子 构成一个纳什均衡,这一战略组合才是子 博弈精练纳什均衡。 博弈精练纳什均衡。
2、重复剔除的占优策Βιβλιοθήκη 均衡——首先找出某参 首先找出某参
与人的严格劣策略,将它剔除, 与人的严格劣策略 , 将它剔除 , 重新构造一个不包 括已剔除策略的新博弈;然后,继续剔除这个新的 括已剔除策略的新博弈; 然后, 博弈中某一参与人的严格劣策略; 博弈中某一参与人的严格劣策略 ; 重复进行这一过 直到剩下惟一的参与人策略组合为止。 程 , 直到剩下惟一的参与人策略组合为止 。 剩下的 这个惟一的参与人组合,就是这个博弈的均衡解。 这个惟一的参与人组合,就是这个博弈的均衡解。 严格劣策略:是指在博弈中, 严格劣策略 : 是指在博弈中 , 不论其他参与人采取 什么策略,某一参与人可能采取的策略中, 什么策略 , 某一参与人可能采取的策略中 , 对自己 严格不利的策略。 严格不利的策略。
完全信息博弈 第二节 完全信息博弈
3、 动态博弈战略行动
在动态博弈中, 在动态博弈中,参与人为了使得其他参与人的 选择对自己有利, 选择对自己有利,往往采取一些行动来影响其 他参与人对于自己行为的预期。 他参与人对于自己行为的预期。这些行为称为 战略行动。它主要包括: 战略行动。它主要包括: (1)先行优势 确信威胁(承诺行动) (2)确信威胁(承诺行动) 它是指博弈的参与人通过某种行动改变自己的 支付函数,从而使自己的威胁显得可信。 支付函数,从而使自己的威胁显得可信。参与 人为改变博弈结果而采取的措施称为承诺。 人为改变博弈结果而采取的措施称为承诺。
按照参与人对其他参与人的了解程度 3、按照参与人对其他参与人的了解程度 进行分类, 博弈可分为完全信息博弈和 进行分类 , 博弈可分为 完全信息博弈和 不完全信息博弈。 不完全信息博弈。
完全信息博弈是指:在每个参与人对所有其 完全信息博弈是指: 是指 他参与人的特征、 他参与人的特征、战略和收益函数都有精确 了解的情况下,所进行的博弈。 了解的情况下,所进行的博弈。 如果了解得不够精确, 如果了解得不够精确,或者不是对所有的参 与人都有精确的了解, 与人都有精确的了解,在这种情况下进行的 不完全博弈。 博弈就是不完全博弈 博弈就是不完全博弈。