经济博弈论_1__完全信息静态博弈0.1

合集下载

信息经济学部分习题解答

信息经济学部分习题解答

解:设金钱总数为M。
对赌徒i,战略空间Si=[0,M],si∈Si,支付
函数ui为
ui
si 0
if if
si M
i
si M
i
所有满足∑isi≤M的选择都是纳什均衡。纳什均 衡有无穷多个。
5.(库诺特博弈)假定有n个库诺特寡头企业,每 个企业具有相同的不变单位成本c,市场逆需求 函数是p = a - Q,其中p是市场价格,Q = ∑jqj是 总供给量,a是大于零的常数。企业i的战略是 选择产量qi最大化利润 πi=qi(a-Q-c),给定其他 企业的产量q-i,求库诺特-纳什均衡。
2
q2
14q12q220
求解可得 q 14q24 116
假设企业1第一阶段投资引进新技术。此时
两个企业的边际成本下降到1,利润函数为:
1 1 q 1 4 q 2 q 1 q 1 f
2 1 q 4 1 q 2 q 2 2 q 2
一阶最优条件为
1
q1
142q1q210
求 故解当可1得9q 6 1 fq 22 1 1 31644 q2 q11 f3 2 q1 25122 时10,99 引6 f进新技术
解:根据问题的假设可知各企业的利润函数为
i piq ciqaqijn iqjqiciq
其中i=1,…,n。
将利润函数对qi求导并令其为0得:
i
qi
n
a
ji
qj
c2qi 0
解得各企业对其他企业产量的反应函数为:
n
qi aji qj c/2
根据n个企业之间的对称性,可知 q1 *q2 *qn * 必然成立。代入上述反应函数可解得:
q
2
再代入企业1的反应函数,得

第一章 完全信息静态博弈(博弈论与信息经济学-山西财经大学 景普秋)

第一章 完全信息静态博弈(博弈论与信息经济学-山西财经大学 景普秋)

导论
四、主要参考文献







张维迎著,《博弈论与信息经济学》,上海三联书店、 上海人民出版社,1996年版。 Roger B. Myerson 著: Game Theory(原文版、译文 版),中国经济出版社,2001年版。 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。 艾里克 .拉斯缪森( Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。 因内思· 马可-斯达德勒,J.大卫· 佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。 施锡铨编著,《博弈论》上海财大出版社,2000年版。 谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。 谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。

零和博弈与非零和博弈
(zero-sum game and non-zero-sum game)
如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为零,这个博 弈就叫零和博弈; 相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为零, 这个博弈就叫非零和博弈。 零和博弈是利益对抗程度最高的博弈。
迈克尔· 斯彭斯 1948年生于美国的 新泽西,1972年获 美国哈佛大学博士 头衔,现兼任美国 哈佛和斯坦福两所 大学的教授。
约瑟夫· 斯蒂格利茨, 1943年生于美国的 印第安纳州,1967 年获美国麻省理工 学院博士头衔,曾 担任世界银行的首 席经济学家,现任 美国哥伦比亚大学 经济学教授
乔治· 阿克尔洛夫 1940年生于美国的 纽黑文,1966年获 美国麻省理工学院 博士头衔,现为美 国加利福尼亚州大 学经济学教授。

经济博弈论之完全信息静态博弈培训

经济博弈论之完全信息静态博弈培训

2023
PART 04
完全信息静态博弈的策略 分析
REPORTING
优势策略
优势策略是指参与者在给定信息下, 选择对自己最有利的策略,而不考虑 其他参与者的反应。
优势策略是博弈分析中的重要概念, 它可以帮助参与者找到最优的策略选 择。
在完全信息静态博弈中,如果某个参 与者有一个优势策略,那么无论其他 参与者选择什么策略,该参与者都应 该坚持这个优势策略。
收益
每个参与者在博弈中获得的效用或收益,是衡量参与者利益的标准。
在完全信息静态博弈中,每个参与者的收益函数是共同知识,即所有参与者都知 道其他参与者的收益函数。
纳什均衡
纳什均衡是指在一个博弈中,每个参 与者的最优策略选择在其他参与者最 优策略选择给定的情况下是最优的。
在完全信息静态博弈中,纳什均衡是 所有参与者的最优策略组合,满足每 个参与者的最优策略选择在其他参与 者最优策略选择给定的情况下是最优 的。
2023
PART 02
完全信息静态博弈的基本 概念
REPORTING
参与者
博弈中的决策主体,通常称为局中人 或参与人。
在完全信息静态博弈中,每个参与者 都了解其他参与者的身份及其所有可 能的策略和收益。
策略
参与者在博弈中可以选择的行动方案,是参与者在给定信 息集下的决策变量。
在完全信息静态博弈中,每个参与者的策略空间是共同知 识,即所有参与者都知道其他参与者的所有可能策略。
2023
PART 03
完全信息静态博弈的经典 案例
REPORTING
囚徒困境
总结词
描述两个囚犯因被捕而面临供述与否的决策,揭示个 体理性与集体理性的矛盾。
详细描述
在囚徒困境中,两个囚犯因共同犯罪被捕,并分别被 关押在独立的房间。每个囚犯都有供述和保持沉默两 种选择。如果两个囚犯都保持沉默,则他们都不会受 到严重惩罚;但如果一个囚犯供述,另一个保持沉默 ,则供述者会得到较轻的惩罚,而沉默者会受到更严 厉的惩罚。由于囚犯之间无法进行沟通,他们往往会 基于自身利益而选择供述,从而导致双方都受到较重 的惩罚。

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈

囚徒困境在经济学上有着广泛的应用。 例1:两个寡头企业选择产量的博弈。如果两个企业联合起来形成卡特尔,选择垄 断利润最大化的产量,每个企业都可以得到更多的利润。但卡特尔不是一个稳定 的均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果是,每 个企业都只得到小于最大利润的产量,利润严格小于卡特尔产量下的利润。 在有些情况下,个人理性和集体理性的冲突对社会来说也许是一件好事,尽管对 集体而言是一件坏事。
第2讲 完全信息静态博弈
下继续生活下去。 从囚徒困境中,我们可以引出一个很重要的结论:一种制度(体制)安排,要发 生效力,必须是一种均衡。否则,这种制度安排不能成立。
第2讲 完全信息静态博弈

3.重复剔除的占优均衡 在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在 绝大数博弈中,占优战略均衡是不存在的。
第2讲 完全信息静态博弈

在“智猪博弈”中,我们先剔除掉小猪的劣战略“按”,在剔除掉这个战略后的 新的博弈中,小猪只有一个战略“等待”,大猪仍有两个战略,但此时,“等待” 已成为大猪的劣战略,提出这个战略,剩下的唯一战略组合是(按,等待)。
第2讲 完全信息静态博弈

我们需要对“占优战略”和“劣战略”的概念进行重新定义。


都是(相对于si*的)劣战略。 在应用重复剔除方法寻找均衡时,一个战略是占优战略或劣 战略可能是相对于另一个特定的战略而言的。
第2讲 完全信息静态博弈
' ' ' 定义:令si 和s? 是参与人 i 可选择的两个战略(即 s i i Si, ' s’ i Si)。如果对于任意的其他参与人的战略组合s -i,参与人 ' ' i的选择si 得到的支付严格小于从选择s? i 得到的支付,即:

一完全静态博弈 ppt课件

一完全静态博弈 ppt课件

2020/12/27
33
公共牧场的比喻
• 哈丁所讲的公共牧场则是研究具有同一行为动机结构 的一种特殊的多人情况。
• 那些在会议上高谈阔论却又言之无物的人们,可能看 上去就像牧场上的牛一样,他们一边吃一边践踏,而 另一头牛正在眼巴巴地看着草。
• 现在这个词已经被广泛地应用于研究在公共水域倾倒 污水的行为,在公共石油层开采石油行为,在公海猎 捕鲸鱼的行为,甚至于将地球和地球上的资源比喻成 一个公共养殖场,人类在其中过度繁衍后代。还有中 国的小煤窑的开发以及高校科研经费的申请等。
31
解释
• 寡头竞争的总产量大于垄断产量的原因 在于每个企业在选择自己的最优产量时, 只考虑对本企业利润的影响,而忽视对 另一个企业的外部负效应。这是典型的 囚徒困境问题。
• 这个模型使用重复剔除严格劣战略的方 法找出均衡解。
2020/12/27
32
(2)公共地的悲剧
• 公共地的悲剧(tragedy of the commons)是制度经济 学家非常熟悉的例子。
需求函数取如下线性形式
paq1q2
那么,最优化的一阶条件分别是:
1
q1
a q1 q2 q1
c 0
2020/12/27
2
q2
a q1 q2 q2 c 0
29
反应函数为
q1
R1q2
1 2
a
q2
c
q2
R2 q1
1 2
a
q1
c
解两个反应函数,我们得纳什均衡为
q1
q2
1ac
3
每个企业的纳什利润分别是
2020/12/27
12
关于行动顺序
• 同样的参与人,同样的行动集合,行动 顺序不同,每个参与人的最优选择就不 同,博弈的结果就不同。

博弈论_完全信息静态博弈

博弈论_完全信息静态博弈

p 1
p * (q )
2 3
q * ( p)
1 3
q 0
1 3
2 3
1
¹ 1.1. ³ ¾ ¤ À ¨ ¼ Ï Ì AÏ ³ ç Æ
博弈 =(N, (Si) iN , (Ui) iN ) 的策略式包含三要素: (1) 参赛者(players): i N={ 1, 2, 3,…….n} (2) 策略(strategies): s i Si=set of feasible (pure) strategies for player i, i N 策略组合(strategy profile) s=( s1,……,sn)=(s i, s-i ), s-i= X Sj 对手的
不完全信息
贝叶斯纳什均衡(BNE) 完美贝叶斯纳什均衡 (PBNE)或序列均衡 (SE ))
完全信息静态博弈 (Static games with Complete Information)的表示与求解

常见的几个博弈型态:

(1)
Duopoly双占

(2)
囚犯困境(Prisoner’s Dilemma):同时出招
重复优势解法(Iterated Dominance)

:逐次删去劣势策略(dominant strategy),但对两性 战争、飚车族与钱币配对等问题就无法解出。
纳什均衡(Nash Equilibrium)

定义:纳什均衡指一策略组合有以下特性:当参赛者 采此策略组合后,任一参赛者均无诱因偏离此一均衡 ; s*=(s1*,s2*,…..sn*)=(si*,s-i*)是一纳什均衡若且唯若 对所有参赛者i而言,ui(si*,s-i*)≧ui(si’,s-i*)对所有si’,Si 均成立。

《产业经济学》第五章--(博弈1)讲解

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。

完全信息静态博弈教学课件

完全信息静态博弈教学课件

完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。

博弈论与信息经济学课件2—完全信息静态博弈1

博弈论与信息经济学课件2—完全信息静态博弈1

定义一:
完全信息静态博弈(策略型博弈)是指在博弈
中局中人的信息是完全的,并且局中人同时采取行 动或局中人的行动有先有后,但后行动者不知道先 行动者的行动选择的一种博弈。
§1 完全信息静态博弈的表示—支付矩阵
1.2 策略型博弈的表示
1、局中人(Players):i , 1, 2,..., n ; 2、策略空间(Strategies): Si si , i 1, 2,..., n; 3、支付函数(Payoff Functions): ui ui (s1 , , si , , sn );
现实中的囚徒困境——公共资源过度使用
哈丁,1968年,《科学》杂志, 《公共地悲剧》
牧民乙
1只
牧 民 甲
2只
60, 120 80, 80
1只 2只
100, 100 120, 60
现实中的囚徒困境
应试教育与素质教育的两难选择
为什么路越来堵?
为什么成绩越来越高?
团队生产中的偷懒
„„„
现实中的囚徒困境
齐 威 王
上中下 上下中 中上下 中下上 下上中 下中上
性别大战博弈
女生 足球 足球 男生 歌剧 3,2 -1,-1 歌剧 1, 1 2, 3
§2 占优策略(上策)及占优策略(上策)均衡
例:囚徒困境
坦白 坦白 甲 不坦白
乙 不坦白
-5,-5
-8,0
0,-8
-1,-1
“坦白”是甲的优势策略 (坦白,坦白) “坦白”也是乙的优势策略 囚徒困境模型反应了个体理性与集体理性的冲突
完全信息静态博弈
四种博弈类型
完全信息动态博弈
不完全信息静态博弈 不完全信息动态博弈

博弈论与信息经济学-1完全信息静态博弈

博弈论与信息经济学-1完全信息静态博弈
其次,剔除新博弈中某个参与人的严格劣 策略;
重复上述过程,直到只剩下唯一的策略组 合。
4. 策略(strategies ):又称策略,是参与人在给 定信息集的情况下的行动规则,它规定参与人在 什么时候的什么情况下采取什么行动。因而一个 策略是参与人的一个“相机行动方案”(contingent action plan)。
记参与人i的一个策略为si,参与人i在一个博弈中 的全部可供选择的策略记为Si(策略集strategy set ),即si ∈ Si , Si ={s1 ,s2 ,… si ,…, sn},表示参与 人i 在该博弈中共有n个可行的策略。
ui(s1, s2,… ,si,…,sn-1,sn).
注意
1. 博弈的一个基本特征是一个参与 人的支付不仅取决于自己的策略选择, 而且取决于所有其他参与人的策略选择 ;是策略组合的函数。
2. 支付是参与人真正关心的东西, 参与人在博弈中的目标就是选择自己的 策略以最大化自己的支付函数。
6. 均衡(equilibrium) 均衡是所有参与人的最优策略组合。 一般记为s*=( s1*,s2*,…,si*,…, sn*)
行动的顺序(the order of play)
博弈中参与人实施决策活动的顺序。同 时或有先有后。其他因素不变,但顺序 不同,参与人的最优选择就不同,博弈 的结果也不同。事实上,不同的顺序安 排意味着不同的博弈。静态博弈和动态 博弈。
3. 信息(information)
参与人有关该博弈的知识,如关于N的选 择、其他参与人的策略集、支付函数、行 动时间等。
概念 1967—1968年海萨尼(Harsanyi)提出了贝叶斯纳什均
衡的概念
博弈论概述:发展历程
1975—1991年泽尔腾(1975)、Kreps和Wilson( 1982)、Fudenberg和Tirole(1991)提出了精炼贝 叶斯纳什均衡的概念. 1994年纳什、海萨尼和泽尔腾 获诺贝尔经济学奖。

1.1完全信息静态博弈:基础理论

1.1完全信息静态博弈:基础理论

纳什均衡与协议的理念
和纳什均衡推导密切相关的是协议的理念:对给定 的博弈,如果参与者之间要商定一个协议决定博弈 如何进行,那么一个有效的协议中的战略组合必须 是纳什均衡的战略组合,否则,至少有一个参与人 会不遵守该协议。 为更准确地理解纳什均衡这一概念,下面求解几个 例题。

寻找纳什均衡的方法:划线法
纳什均衡和重复剔除严格劣战略均衡的关系
如果用重复剔除严格劣战略把除战略组合{s*1,…,s*n} 外所有的战略组合都剔除掉,则该所存战略组合就是 此博弈惟一的纳什均衡。 不过,由于重复剔除严格劣战略并不经常会只剩下惟 一的战略组合,纳什均衡作为比重复剔除严格劣战略 更强的解的概念,自然受到更多关注,理由如下: 如果战略组合{s*1,…,s*n}是一个纳什均衡,它一定不 会被重复剔除严格劣战略所剔除,但也可能有重复剔 除严格劣战略无法剔除的战略组合,其本身却和纳什 均衡一点儿关系都没有。

博弈的要素:
现在我们回到一般情况。 博弈的标准式表述包括: (1)博弈的参与者; (2)每一参与者可供选择的战略集; (3)针对所有参与者可能选择的战略组合,每 一个参与者获得的收益。

考虑n个参与者的博弈: (1)参与者从1到n排序; (2)设其中任一参与者的序号为i,令Si代表参 与者i可以选择的战略集合(称为i的战略空间),其 中任意一个特定的战略用si表示(有时我们写成, si∈Si表示战略si是战略集Si中的要素); (3)令(s1,...,sn)表示每个参与者选定一个战略形 成的战略组合,ui表示第i个参与者的收益函数, ui (si,...,sn)即为参与者选择战略(s1,...,sn)时第i个 参与者的收益。
0
0
智猪博弈3:劳而不得!

经济博弈论完全信息静态博弈

经济博弈论完全信息静态博弈

19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。

经济博弈论02完全信息静态博弈(Park)

经济博弈论02完全信息静态博弈(Park)

合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。

博弈论_完全信息静态博弈

博弈论_完全信息静态博弈

讲 义
的最优策略分别为M, U, D
——


参与人B
信 息

L CR

与 U 0, 4 4, 0 5, 3
态 博
人 M 4, 0 0, 4 5, 3

A D 3, 5 3, 5 6, 6
图1-8
纳什均衡(Nash Equilibrium)



同理,当A分别采用U, M, D时,B的最优策略分别



讲 义
均衡分析
——
完 全
在该博弈中,每个农民的问题是选择gi 以最大化自己的利润。假定购买一只羊

羔的价格为c,那么利润函数为



博 弈
i (g1,...,gi,...,gn) giv ( g j ) gic, i 1,2,...,n
公共地悲剧


论 讲
最优化一阶条件为
讲 义
略均衡的关系
——
完 全
定理a 每一个占优均衡、重复剔除严劣策 略均衡一定是纳什均衡,但反过来不一定

成立;

静 态 博
定理b 纳什均衡一定不能通过重复剔除严 劣策略方法剔除。

纳什均衡(Nash Equilibrium)


论 纳什均衡的一致预测性质


一致预测性:如果所有参与人都预测一个

NE


R2

静 态
q1

图1-9 古诺模型的纳什均衡

纳什均衡应用举例:古诺模型


论 实际验证

《经济博弈论》复习题参考答案

《经济博弈论》复习题参考答案

《经济博弈论》复习题及参考答案一、名词解释1、混合战略纳什均衡如果在博弈的利益表中,无法找到任何一方都可以接受(不一定利益最大化)的方案,也就是没有哪一种组合是在给定对手策略下没有动机改变自己策略的情况。

这时博弈没有纯策略均衡,需要一个“概率表”指导博弈结果。

在博弈G={S1,S2……Sn;U1,U2……Un}中第i个博弈方策略空间为Si={Si1……Sik}则博弈方以概率分布Pi=(Pi……Pik)随机在k个可选策略中选的的策略称为一个混合策略纳什均衡。

2、子博弈精炼纳什均衡对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。

子博弈精练纳什均衡所要求的是参与人应该是序惯理性的。

对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。

3、完全信息动态博弈完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息。

4、不完全信息动态博弈指在动态博弈中,行动有先后次序,博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率,即知道“自然”参与人的不同类型与相应选择之间的关系,但是,参与人并不知道其他的参与人具体属于哪一种类型。

由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。

5、完全信息静态博弈完全信息静态博弈指的是信息对于博弈双方来说是完全公开的情况下,双方在博弈中所决定的决策是同时的或者不同时但在对方做决策前不为对方所知的。

6、囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。

虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

博弈论日记(2)完全信息静态博弈基础理论

博弈论日记(2)完全信息静态博弈基础理论

博弈论⽇记(2)完全信息静态博弈基础理论1.1.博弈的标准式和纳什均衡1.1A.博弈的标准式表述⾸先我们来说明⼀下什么是完全信息静态博弈,静态博弈指开始时由参与者同时选择⾏动,然后根据所有参与者的选择,每个参与者得到各⾃的结果。

完全信息博弈即每⼀个参与者的收益函数(根据所有参与者选择⾏动的不同组合决定某⼀参与者收益的函数)在所有参与者之间是共同知识。

之所以称为基础理论,是因为本⼩结要解决两个基本问题:如何描述⼀个博弈以及如何求博弈的解。

定义:在⼀个n⼈博弈的标准式的表述中,参与者的战略空间为S1,S2,……,Sn,收益函数为u1,u2,……,un,我们⽤G={S1,S2,……,Sn;u1,u2,……,un}表⽰此博弈。

1.2B.重复剔除严格劣策略上⾯是博弈论的表述⽅法,下⾯是⼀个关于博弈论的解的⽅法(虽然不常⽤)。

定义:在标准式的博弈G={S1,S2,……,S3;u1,u2,……,un}中,令Si′和Si″代表参与者i的两个可⾏战略(即Si′和Si″是Si中的元素)。

如果对其他参与者每⼀个可能的战略组合,i选择Si′的收益都⼩于其选择Si″的收益,则称战略Si′相对于Si″是严格劣战略。

ui(S1,S2,…,Si′,…,Sn;u1,u2,…,ui′,…un}<ui{S1,S2,…,Si″,…,Sn;u1,u2,…,ui″,…un}1/2 L2 R2 M2L1 1,0 1,2 0,1R1 0,3 0,1 2,0参与⼈1有两个可选策略,S1={L1,R1},参与⼈2有三个可选策略S2={L2,R2,M2}。

在这个博弈中,对参与⼈1来说L1和R1都不是严格占优的。

因为如果参与⼈2选择L2,参与⼈1L1优于R1;参与⼈2选择R2,参与⼈1L1优于R1;参与⼈2选择R2,参与⼈1R1优于L1;但对参与⼈2来讲,M2是严格劣于R2的,因此理性的参与⼈2是不可能选择M2的,就可以把M2在战略空间中剔除,如果参与⼈1知道参与⼈2是理性的,那么他就可以将这个博弈视为下图:1/2 L2 R2L1 1,0 1,2R1 0,3 0,1此时⼜产⽣了⼀个新的情况,对于参与⼈1来讲,R1⼜是严格劣与L1的,因此就可以将R1在参与⼈1的战略空间中剔除,博弈⼜变成了如下情况:1/2 L2 R2L1 1,0 1,2此时双产⽣了⼀个新的情况,对于参与⼈2来讲,L2⼜是严格劣与R2的,因此就可以将L2在参与⼈2的战略空间中剔除,博弈双变成了如下情况:1/2 R2L1 1,2上述的过程就可以称为“重复剔除严格劣策略”。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

无论其他局中人如何行动,总是(严格地)优于其他战略 的战略,称为(严格)占优战略。而被(严格地)占优的战 略称为(严格)劣战略。
1 囚徒困境与占优战略均衡

参与人是理性的 囚徒A应选择坦白,同样的逻辑适用于囚徒B的选择—— 他也应选择坦白。 因而,(坦白,坦白)就是该博弈可预测的结果,也是 一个均衡(甚至是唯一的)。

囚犯两人都从利己目的出发,最终导致结果损人不利己, 合作没有产生。 "囚徒困境"是典型的非合作博弈的范例
反之,彼此达成合作是最好的“利己策略”,但合作必须 符合黄金定律:“己所不欲,勿施于人”(前提是“人所不 欲,勿施于我”)。

1 囚徒困境与占优战略均衡

现实生活中诸多的问题和现象,都是囚徒困境问 题的翻版。 实际上,“囚徒困境”是现实生活中许多现象的一 抽象概括,有着广泛而深刻的意义。

离散型策略静态博弈通常用支付表来表示 ——博弈的战略式表述
1 囚徒困境与占优战略均衡

从一方的角度看,选择“坦白”比选择“抵赖”好,无论他 关 于对方的选择持有何等信念。 我们就说,对于囚徒而言,“坦白”的策略是一个占优策略, 以不变应万变 或者说“抵赖”的策略是一个劣策略。
占优战略/优势策略/上策(dominant strategy)
囚徒 A
坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
囚徒 A 的支付
囚徒 B 的支付
1 囚徒困境与占优战略均衡

博弈中参与人只拥有有限个离散型的纯战略供其选择。 如篮球比赛中的运球、过人和投篮 离散型策略 另一些博弈中,在其他博弈中,每个参与者的纯策略可以是 来自一个连续范围的一个数。如厂商定价 连续策略

所以,无论其他人是否努力地工作,我自己的最 优选择都是偷懒。——偷懒是每个人的占优战略
1 囚徒困境与占优战略均衡
小学生减负

政府“减负”政策:减少小学生的某些课时内容和家
“减负”之后,家长们恐怕孩子学业荒废,纷纷请家
庭 作业。但“减负”后学生反而更累了!

教。给定其他孩子“减负”好耍,我家孩子在家苦读,将 来考 上个北大清华什么的,那些“减负”好耍的孩子只能垫底 了! 给定其他孩子也在家苦读,我家孩子则更需要加倍苦学 了,否则不就会在将来的高考中为别人垫底了吗!
2 智猪博弈与重复剔除劣战略均衡
“重复剔除严格劣战略”的思路
首先找出博弈参与人的劣战略(dominated strategy)(假定 存在的话),把这个劣战略剔除后,剩下的是一个不包含已 剔除劣战略的新的博弈;然后再剔除这个新的博弈中的劣战 略;继续这个过程,直到没有劣战略存在。 如果剩下唯一的策略组合,那么该策略组合称为“重复剔除 的占优均衡”
审计师 隐瞒 实报 A
5,5 6,-1
-1,6 0,0
如一个诚实一个谎报,则诚 实者奖励0.6万,对谎报者罚 款1.1万,但谎报者得到1万贿 金
1 囚徒困境与占优战略均衡
利用囚徒困境压低供应商价格

假设:两供应商成本都为6元/件,报价都为10元/件。 策略:如果二者报价都为10元/件或8.5元/件,则从每家订 购50件;若一家报价10元/件而另一家报价8.5元/件,则从 价低者订购100件。 供应商 B 10 8.5 供应商 A 8.5 10 125,125 250,0
0,250
200,200
2 智猪博弈与重复剔除劣战略均衡
智猪博弈(Boxed Pigs)

一头大猪和一只小猪生活在同一猪圈里,共用一食槽。 食槽的一端有一个开关,猪用嘴一拱,食槽的另一端会掉 下包子。假定按一下会掉下8个包子,而跑去按开关的猪会 耗费2个包子的能量。

如果小猪按开关,大猪先吃,等小猪按完跑过来时,大猪
2 智猪博弈与重复剔除劣战略均衡
重复剔除严格劣战略
严格劣战略:不管其他参与人如何选择,参与人从选择战 略A得到的支付,严格小于选择策略B给得到的支付 称策略A是相对于B的“严格劣战略”,或者称策略A 严格劣于策略B

称策略B是相对于策略A的“严格占优战略”,或者称 策略B严格占优于策略A

在求解均衡过程中,可以剔除局中人的严格劣战略以简 化博弈,因为严格劣战略肯定不会被实施。
ቤተ መጻሕፍቲ ባይዱ
在位者 默许 斗争 进入
30,80 -10,100

在位者低成本
进入者
不进入 0,400
0,400
1 完全信息静态博弈



囚徒困境与占优均衡 智猪博弈与重复剔除的占优均衡 纳什均衡 多重均衡与协调 纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性
1 囚徒困境与占优战略均衡
囚徒困境(Prisoners’ Dilemma)(塔克,1950)

两个小偷行窃未果被抓,隔离审讯。 “坦白从宽,抗拒从严”:如果两人都 坦白则各判8年;如果一人坦白另一人 不坦白,坦白的放出去,不坦白的判10 年;如果都不坦白则因证据不足各判1 年。

坦白否?
1 囚徒困境与占优战略均衡

基于收益矩阵的模型描述: 参与人
囚徒 B 坦白 抵赖
囚徒B的可 选策略

“按”是小猪的劣战略,理性的小猪是不会选择按。 大猪知道小猪是理性的,意即知道小猪不会选择“按”
2 智猪博弈与重复剔除劣战略均衡
小猪
按 按
大猪 等 3,1
等 2,4 0,0
按为小猪 劣战略
小猪 等
大猪


2,4 0,0
7,-1
等为大猪劣 战略
排除劣策略减少了博弈的规模,得到的“新”博弈有可能又 有了其他的(对自己或对手的)劣势策略,又可以被排除。
1 囚徒困境与占优战略均衡


现实生活中其他囚徒困境的例子
曾经威胁世界整个甚至人类的军备竞赛


公共资源过度开采/公共品供给短缺
大学扩招、研究生扩招、大学贷款基建 年年都有的评优评先活动 各种资格考试广泛盛行 备受批评却日益严重的应试教育
1 囚徒困境与占优战略均衡

如何走出囚徒困境?
1 囚徒困境与占优战略均衡
预防审计合谋—双头审计

经理与审计师之间可能合谋,隐瞒不良信息

股东解决这一问题的一种做法是双头审计,请两位审计师 进行审计,扣发给隐瞒者的部分报酬,而给坚持如实报告 问题的审计师以更多的报酬。
审计师 B 隐瞒 实报
如果都谎报,得奖金0, 但分享贿金1万

如果都诚实,则得到0
完全信息静态博弈
信息
决策需要信息,但是几乎所有需要决策的场合,我们都只 掌握着有限信息,这使得现实中往往是有限信息博弈。 完全信息:每个参与人对其他参与人的支付函数有完全的 了解。 不完全信息:每个参与人对其他参与人的支付函数不完全 的了解。
市场进入博弈
进入者决定是否进入一个新的产业,在 位者选择斗争或默许,但不知道在位企 在位者 业的成本函数是高还是低,也不知道各 默许 斗争 种战略组合下的利润水平。 40,50 -10,0 进入 进入者 在位者高成本 0,300 不进入 0,300 若进入者知道在位者是高成本还是低成本——完全信息 若进入者不知道在位者是高成 本还是低成本——不完全信息


当我们面临需要加以解析的经济现象时,首先要做的事就 是看该现象的发生机制是否可归于某种已知的博弈模型。如 可以,就可立即知道现象的本质和发生机制,并预测结果。 如不能,则很可能为博弈论经济学做出创造性贡献。
1 囚徒困境与占优战略均衡
公共品(public goods)的供给
B 公共品的理解?
提供
博弈论与信息经济学
(Game Theory and Information Economics)
第2章:完全信息静态博弈
Chapter 2: Static Game of Complete Information
完全信息静态博弈

静态博弈(同时行动博弈)
所有参与人同时选择行动,而且只选择一次 如,罚点球时,守门员和对方射手必须同时决策 “同时”是一个信息概念,而不一定与日历上的时间一致 在博弈中,如果参与者在不知道对手如何选择的情况下行 动,该博弈就是静态的。
1 囚徒困境与占优战略均衡
委托-代理关系中被设计的囚徒困境
囚徒困境对于人们来说是糟糕的,是应当竭力避免的? 在一些委托-代理关系中,故意创造出代理人之间的囚徒困 境有时对委托人有好处。这样的囚徒困境反而促进效率。 委托-代理关系:通常指委托人请代理人代理某件事情。其中 的关键问题是二者利益不一致,并且委托人与代理人之间存 在信息不对称。为此,需要设计一种制度(system)或机制 (mechanism) ,使代理人追求自己利益的同时也最大化委托 人的利益,如何设计这样的制度就是信息经济学研究的问题。
2 智猪博弈与重复剔除劣战略均衡
A 提供 不提供

不提供
-1,3 0,0
1,1 3,-1
NE: (不提供,不提供)
集体行动的障碍:个人最优选择从社会整体的角度看并不 是最优的。社会最优结果是(提供,提供)——“大家的事 情反而无人管”(英国历史学家麦考莱)
1 囚徒困境与占优战略均衡
价格战

市场中常见现象,如旅游、机票、家电。
中国的几个生产彩电的寡头厂商于2000年合谋成立“彩电厂 家自律联盟”以求将彩电价格维持高位。 双方合作制定较高的价格, 彩电价格能维持高位吗? 那么都可获得较高利润。 B 但是这些联盟处于利益驱 降价 不降价 动的“囚徒困境”中,双 不降价 0,0 -100,80 赢成为泡影。企业之间五 A -50,-50 花八门的价格联盟总是非 降价 80,-100 常短命,道理也就在于此
相关文档
最新文档