完全信息的静态博弈讲义

合集下载

博弈论(第二章)讲义

博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2



上 博弈方1

1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0

西经第八讲.完全信息静态博弈.ppt

西经第八讲.完全信息静态博弈.ppt

重复剔除劣策略
• 在海战博弈中,将军K认为将军I会选择北, 因为这是弱占优策略,因此,将军K在考虑 中就放弃了I会选择南这个想法。从而博弈 成为:
将军I

K将军

2,-2

1,-1
重复剔除劣策略
• 此时,将军K就有了一个强占优策略-北。 • 因此,策略组合(北,北)就是重复占优
均衡。
重复剔除劣策略
• 剔除严格劣策略与剔除弱被占优策略之间 存在两个区别。
– 其次,剔除弱被占优策略存在多均衡问题。如 果存在占优策略均衡,那么就一定是唯一的。 如果是重复剔除严格劣策略,均衡存在的时候 也一定是唯一的。剔除弱被占优策略就可能存 在多均衡,因为剔除的顺序就很重要。考虑下 面的博弈:
重复剔除劣策略

c1
博弈规则
• 参与人 • 行动 • 支付 • 信息
– 知道对手的支付,但是不知道对手的行动
博弈的标准型表示
• 例如双变量矩阵
囚徒2
沉默 招认
囚徒1 沉默 -1,-1 -9,0
招认 0,-9 -6,-6
求解博弈
• 策略
– 策略与行动不可区分
• 均衡概念
– 占优策略 – 重复剔除严格劣策略 – 纳什均衡
纳什均衡
建模者困境

抵赖
坦白
抵赖 0,0
-10,0

坦白 0,-10
-8,-8
纳什均衡
• (坦白、坦白)是弱占优均衡,也是重复 剔除均衡,也是强纳什均衡。
• 不过,(抵赖、抵赖)是另一个纳什均衡。 这个结果没有上面的均衡强,但是是帕累 托最优。
• 均衡精炼:向基本的均衡概念增加限制, 直到仅仅剩下一个均衡为止。Fra bibliotek纳什均衡

应用博弈论第二讲完全信息静态博弈

应用博弈论第二讲完全信息静态博弈
生活中其实有很多相关的例子。

生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。

例2
为什么中小企业不会花钱去开发新产品 ?

完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。

生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。

例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。

经济博弈论之完全信息静态博弈培训

经济博弈论之完全信息静态博弈培训

2023
PART 04
完全信息静态博弈的策略 分析
REPORTING
优势策略
优势策略是指参与者在给定信息下, 选择对自己最有利的策略,而不考虑 其他参与者的反应。
优势策略是博弈分析中的重要概念, 它可以帮助参与者找到最优的策略选 择。
在完全信息静态博弈中,如果某个参 与者有一个优势策略,那么无论其他 参与者选择什么策略,该参与者都应 该坚持这个优势策略。
收益
每个参与者在博弈中获得的效用或收益,是衡量参与者利益的标准。
在完全信息静态博弈中,每个参与者的收益函数是共同知识,即所有参与者都知 道其他参与者的收益函数。
纳什均衡
纳什均衡是指在一个博弈中,每个参 与者的最优策略选择在其他参与者最 优策略选择给定的情况下是最优的。
在完全信息静态博弈中,纳什均衡是 所有参与者的最优策略组合,满足每 个参与者的最优策略选择在其他参与 者最优策略选择给定的情况下是最优 的。
2023
PART 02
完全信息静态博弈的基本 概念
REPORTING
参与者
博弈中的决策主体,通常称为局中人 或参与人。
在完全信息静态博弈中,每个参与者 都了解其他参与者的身份及其所有可 能的策略和收益。
策略
参与者在博弈中可以选择的行动方案,是参与者在给定信 息集下的决策变量。
在完全信息静态博弈中,每个参与者的策略空间是共同知 识,即所有参与者都知道其他参与者的所有可能策略。
2023
PART 03
完全信息静态博弈的经典 案例
REPORTING
囚徒困境
总结词
描述两个囚犯因被捕而面临供述与否的决策,揭示个 体理性与集体理性的矛盾。
详细描述
在囚徒困境中,两个囚犯因共同犯罪被捕,并分别被 关押在独立的房间。每个囚犯都有供述和保持沉默两 种选择。如果两个囚犯都保持沉默,则他们都不会受 到严重惩罚;但如果一个囚犯供述,另一个保持沉默 ,则供述者会得到较轻的惩罚,而沉默者会受到更严 厉的惩罚。由于囚犯之间无法进行沟通,他们往往会 基于自身利益而选择供述,从而导致双方都受到较重 的惩罚。

博弈论讲义2

博弈论讲义2
13
尽管许多博弈中重复剔除的占优均衡是一个合理 的预测,但并不总是如此,尤其是大概支付是某 些极端值的时候。
参与人B
L
参与人A
R -1000,9
U
8,10
D
7, 6
6, 5
U是A的最优选择,但是,只要有1/1000的概率B选R, A就会选D
14
斗鸡博弈
进 A 独木桥 纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
1、Cournot Model of Duopoly
按竞争程度划分的市场类型(就卖方来说):
A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场
29
市场类型不同,厂商之间行为特征不同,A与C 类型中,厂商的决策都是个体优化决策,而B类 型中寡头垄断竞争的本质就构成博弈,他们都 是理性的决策者,他们的行为既影响自身,又 影响对方。尽管两寡头由于垄断能给他们带来 一些共同的利益,但是他们的根本利益并不是 完全一致的。如果两寡头之间可以签定有约束 力的协议,彼此之间达成合作,形成完全垄断, 此时的博弈是一种合作博弈。然而在大多数情 况下,彼此之间很难达成有约束力的协议,这 样就是非合作博弈。
7
注意:
与占优战略均衡中的占优战略和劣战略不同,
这里的占优战略或劣战略可能只是相对于另一个
特定战略而言。
8
案例1-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 4大于1
0,0
0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
9
案例2
U 行先生
s * 是一个纳什均衡: 或者用另一种表达方式: 当且仅当 si* 是下述最大化问题的解时,

第二讲 完全信息静态博弈

第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。


在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法

完全信息静态博弈

完全信息静态博弈

• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。

R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)

F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。

完全信息静态博弈教学课件

完全信息静态博弈教学课件

完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈
• 例2:公共产品的供给也是一个囚徒困境问题。 如果大家都出钱兴办公共事业,所有人的福利都会增加。问题是,如果我出钱你 不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以,每 个人的最优战略是“不出钱”,这种情况下,使得所有人的福利都得不到提高。
例3:“军备竞赛”。 例4:经济改革本身也可能是这样,在许多改革中,改革要付出成本(包括风险), 而改革的成果大家共享,结果是:尽管人人都认为改革好,却没有人真正去改革, 大家只好在都不满意的体
第们集中讨论完全信息静态博弈。 • “完全信息”指的是每个参与人对所有其他参与人的特征(包括战略空间、支付
函数等)有完全的了解。 • “静态”指的是所有参与人同时选择行动且只选择一次。“同时行动”是一个信
息概念而非日历上的时间概念:只要每个参与人在选择自己的行动时不知道其他 参与人的选择,我们就说他们在同时行动。
的组合。 定义:在博弈的战略式表述中,如果对于所有的i,si*是i的占优
战略,那么,战略组合s* = s1*,...,s*n 称为占优战略均衡(do min ant
strategy equilibrium)
第2讲 完全信息静态博弈
• 在一个博弈里,如果所有参与人都有占优战略存在,那么,占优战略均衡是可以 预测的到惟一的均衡,因为没有一个理性的参与人会选择劣战略。
• 纳什均衡是完全信息博弈解的一般概念,也是所有其他类型博弈解的基本要求。
第2讲 完全信息静态博弈
• 1.纳什均衡 纳什对博弈论的贡献有两个方面:一是合作博弈理论中的讨价还价模型,称为纳什 讨价还价解(Nash bargaining solution); 二是非合作博弈论方面,这是他的 主要贡献所在。 纳什对非合作博弈的主要贡献是他在1950年和1951年的两篇论文中在非常一般意义 上定义了非合作博弈及其均衡解,并证明了均衡解的存在。这样就奠定了非合作 博弈论的基础。纳什所定义的均衡称为“纳什均衡”,它如同瓦尔拉斯均衡一样, 已成为经济学中的专家术语。

第二章(完全信息静态博弈)PPT课件

第二章(完全信息静态博弈)PPT课件

q2 R2(q1)
(3,0) (6,0)
q1
图2.9 古诺模型的反应函数几何描述
2021
27
三、伯特兰德寡头模型——价格博弈
当厂商1和厂商2价格分别是 P1 和 P2 时,它们各 自的需求函数为 :
q 1 q 1 ( P 1 ,P 2 ) a 1 b 1 P 1 d 1 P 2 q 2 q 2 ( P 1 ,P 2 ) a 2 b 2 P 2 d 2 P 1
一、纳什均衡的定义
n个参与人的策略式表达博弈:G {S1, ,Sn;u1, un},
策略组合 S*{S1 *, ,Si*, Sn *}是一个纳什均衡,如果
对于每一个
i,s
* i
是给定其他所有参与人选择
S * 1 { S 1 * , ,S i* 1 ,S i* 1 S n * }的情况下第 i个参与人的
2021
17
三、纳什均衡与上述分析方法的关系
(一)纳什均衡与上策均衡的关系 上策均衡是比纳什均衡更强、稳定性更高的均衡 概念
纳什 均衡
上策均衡
图2.8 纳什均衡与上策均衡的关系
2021
18
G { S 1, ,S n;u 1, u n}
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G {S1, ,Sn;u1, un}中,
2021
16
正是由于纳什均衡是一致性预测,因此才进一 步有下列性质:首先,各博弈方可以预测它,可以 预测他们的对手会预测它,还可以预测他们的对手 会预测自己会预测它,……;其次,预测任何非纳 什均衡策略组合将是博弈的最终结果,意味着要么 各博弈方的预测其实并不相同(预测不同的纳什均 衡会出现等),要么预期至少一个博弈方要“犯错 误”,包括对博弈结构理解的错误,对其他博弈方 的策略预测错误,其理性和计算能力有问题,或者 是实施策略时会出现差错等。

经济博弈论之完全信息静态博弈培训讲义(PPT 57页)

经济博弈论之完全信息静态博弈培训讲义(PPT 57页)

2.2.3 纳什均衡与严格下策反复消去法
❖ 上策均衡肯定是纳什均衡,但纳什均衡不一定是上 策均衡
❖ 命题2.1:在n个博弈方的博弈G={S1, …,Sn,u1, …,un}中,如果严格下策反复消去法排除了除 (s1*,…,sn*) 之外的所有策略组合,那么 (s1*, …,sn*) 一定是该博弈的唯一的纳什均衡.
“斗鸡博弈”
❖ 两个所谓的勇士举着长枪,准备从独木桥的两端上桥中央进
行决斗。每位勇士都有两种选择:冲上去(用U表示)或退下
来(用D)表示。若两人都冲上去,则两败俱伤;若一方上去
而另一方退下来,冲上去者获得胜利,退下来的丢了面子;
若两人都退下来,两人都丢面子。 两个Nash(U,D)和(D,U)
参与人2
解方程得:策略组合(2,2)是本博弈唯一的纳什均衡。
最终市场总产量为:2+2=4
市场价格为:8-4=4
反应函数即一博弈方对另
双方各自得利润为:2×(8-4)-2×2=4 一博弈方每种可能的决策
两厂商的利润总和为4+4=8
内容的最佳反应决策构成
的函数。
q2 6
R1(q2)
3 NE
2 1.5
1.5
3 2
❖ 命题2.2:在n个博弈方的博弈中 G={S1,…Sn;u1, …,un)}中,如果 (s1*, …,sn*) 是G 的一个纳 什均衡,那么严格下策反复消去法一定不会将它消 去.
举例
❖ 有两个候选人,在10个立场中进行选择,选 民立场均匀分布,每个立场都得到10%的选 票,选民会投给离自己最近的候选人,出现 平局票数平分。
从两厂商总体利益最大化的角度作一次产量选择。首先根据 市场条件求总体利益最大化的产量。设总产量为Q,则总得 益为 U=P(Q)-cQ=Q(8-Q)-2Q=6Q-Q2 使总得益最大的总产量Q=3 总得益u=9

经济博弈论完全信息静态博弈

经济博弈论完全信息静态博弈

19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。

完全信息静态博弈ppt课件演示文稿

完全信息静态博弈ppt课件演示文稿

招认
囚徒2 招认 沉默 –5, -5 0, -8
-8, 0 -1 , -1
囚徒1
沉默
囚徒的困境
We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game;(2)the strategies available to each player;(3)the payoff received by each player for each combination of strategies that could be chosen by the players.
Definition: The normal-form representation of an-n-player game specifies the players‘ strategy spaces S1 , … , Sn and their payoff functions u1 ,…, un. We denote this game by G={S1, … ,Sn;u1, … , un}. 教材 P22
≥ ui( s1*…, sn-1* , si , sn+1* ,…, sn* ) ……………………………………….(NE)
for every feasible strategy si in Si; That is , si*solves max ui( s1*…, sn-1* , si, sn+1* ,…, sn* ). si∈Si
参与人2 左 中 右 上 1, 0 1, 2 0, 1
参与人1 下 0, 3 0,1 2,0 第二

2010课件2—完全信息静态博弈

2010课件2—完全信息静态博弈

§3 纳什均衡
囚徒困境
囚徒 2 坦 白 囚 徒 1 坦 白 不坦白 不坦白
-5, -5
0, -8
-8, 0
-1, -1
§3 纳什均衡
猜硬币博弈
1、局中人:猜硬币方,盖硬币方 2、策 略:猜硬币方:猜正面,猜反面 盖硬币方:盖正面,盖反面 3、支付函数:见下页
§3 纳什均衡
猜硬币博弈
猜硬币方 正 面 盖 硬 币 方 正 面 反 面 -1, 1 1, -1 反 面 1, -1 -1, 1
每个策略组合中各个博弈方能否通过单独改变自己的策略而增加 得益。如能,则从所分析的策略组合对应的得益数组引一箭头, 到改变策略后的组合对应的得益数组。最后综合为每个策略组合 的分析情况,形成对博弈结果的判断。 利用策略组合的稳定性为思路,对博弈模型的结果进行分析和预 测。 箭头法与划线法效果相同

——如果重复剔除严格劣策略剔除掉除策略组合s以外的所有策略,
则这一策略组合s为该博弈的唯一的纳什均衡。 ——如果策略组合s是一个纳什均衡,那么它就不会被重复剔除严 格劣策略所剔除。

纳什均衡是一个比重复剔除严格劣策略适用性更强的解概念。
§3 纳什均衡
3.4 纳什均衡解法

——双人有限博弈:划线法和箭头法 ——连续性策略博弈纳什均衡与反应函数
§3 纳什均衡
猜硬币博弈
猜硬币方 正 面 盖 硬 币 方 正 面 反 面 -1, 1 1, -1 反 面 1, -1 -1, 1
§3 纳什均衡
公共地悲剧
牧民乙 1只 牧 民 甲 1只 2只 100, 100 120, 60 2只 60, 120 80, 80
§4 连续策略纳什均衡解法
首先求出每个局中人对其他局中人策略组合的反应函 数——即在其他局中人策略组合给定时极大化自己的支付, 得到的最佳反应策略表现为其他局中人策略组合的函数; 然后将这些反应函数联立求解即得到博弈的纳什均衡解。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
函数等)有完全的了解。 静态:指所有参与人同时选择行动且只选择一次。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
完全信息的静态博弈
占优战略均衡
重复剔除劣战略 纳什均衡
占优战略均衡、重复剔除的占优均衡及纳 什均衡的关系
纳什均衡举例
2.每个参与人可选择的战略是有限的。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
完全信息th complete information 完全信息:每个参与人对所有其他参与人的特征(包括战略空间、支付
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
博弈论的基本概念
2.行动(Actions):参与人在博弈的某个时点的决策变量。 ai— 第i个参与人的一个特定行动 Ai={ai}— 可供i选择的所有行动的集合 a=(a1,…,ai,…,an)— 行动组合
1. 参与人(Players):参与人指的是一个博弈中的决策主 体,它的目的是通过选择行动(或战略)以最大化自己的支 付(效用)水平。 自然(Nature)——虚拟参与人:决定外生的随机变量的 概 率 分 布 的 机 制 。 (the probability distribution of exogenous random variable)
混合战略纳什均衡
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
占优战略均衡
占优战略(Dominant-strategy):一个参与人的最优战略并不依赖于 其他参与人的战略选择,也就是说,不论其他参与人选择什么战略,他 的最优战略是唯一的(sole),这样的最优战略被称为“占优战略”。 例:囚徒困境(Prisoner's Dilemma) “囚徒困境”:两个嫌疑犯作案后被警察抓住,被分别关在不同的房间
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
组内学习汇报
博弈论(Game Theory)
---完全信息的静态博弈
博弈论的基本概念
博弈论的基本概念包括参与人、行动、信息、战略、支付( 效用)、结果和均衡。其中,参与人、战略和支付是描述一 个博弈所需要的最少的要素。
5.支付(Payoffs):指在一个特定的战略组合下参与人得到的确定效用水 平;或指参与人得到的期望效用水平。
ui— 第i个参与人的支付(效用水平) u=(u1,…,ui,…,un)为n个参与人的支付组合
博弈的一个基本特征是一个参与人的支付不仅取决于自己的战略选择 ,而且取决于所有其他参与人的战略选择。 ui是所有参与人的战略选择的函数:ui=ui(s1,…,si,…,sn)
ui或Eui最大化的战略。 为了把一个特定的参与人与其他参与人相区别,用s-i=(s1,…,si1,si+1,…,sn)表示除i之外的所有参与人的战略组成的向量。 si*是给定s-i情况下第i个参与人的最优战略,意味着ui(si*,s-i)≥ui( si’,s-i)
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
战略与行动是两种不同的概念,战略是行动的规则而不是行动本身。 例:人不犯我,我不犯人;人若犯我,我必犯人。—— 战略
犯、不犯—— 行动 特例:在静态博弈中,战略和行动是相同的。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
博弈论的基本概念
3.信息(Information):参与人有关博弈的知识,特别是有关“自然”的 选择,其他参与人的特征和行动的知识。
完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然”)的 行动选择有准确了解的情况,即每一个信息集只包含一个值。
完全信息:指自然不首先行动或自然地初始行动被所有参与人准确观察 到的情况,即没有事前的不确定性。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
博弈论的基本概念
4.战略(Strategies):参与人在给定信息集的情况下的行动规则,它规定 参与人在什么时候选择什么行动。
si— 第i个参与人的一个特定战略 Si={si}— 第i个参与人的所有可选择的战略集合 s=(s1,…,si,…,sn)— 战略组合
6.结果(Result)
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
博弈论的基本概念
7.均衡(equilibrium):所有参与人的最优战略的组合。 si*=(s1*,…,si*,…,sn*) si*— 第i个参与人在均衡情况下的最优战略,是i的所有可能的战略中使
里受审讯。警察知道两人有罪,但缺乏足够的证据定罪,除非两人当 中至少有一个人坦白。警察告诉每个人:如果两人都不承认,每个人 都以轻微的犯罪判刑1年;如果两人都坦白,各判刑8年;如果两人中 一个人坦白另一个人抵赖,坦白的释放出去,抵赖的判刑10年。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
战略表达式
战略表达式(The expression form of strategy):所有参与人同时选 择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。 战略式表达给出: 博弈的参与人集合(Set):i∈Γ,Γ=(1,2,…,n) 每个参与人的战略空间:Si,i=1,2,…,n 每个参与人的支付函数:ui(s1,…,si,…,sn),i=1,2,…,n G={S1,…,Sn;u1,…,un}— 战略式表达博弈 有限博弈:1.参与人的个数是有限的;
相关文档
最新文档