第二讲 完全信息静态博弈

合集下载

第二讲:完全信息静态博弈

第二讲:完全信息静态博弈

囚徒困境博弈的标准式表述
B
抵赖 抵赖
A
坦白 -10,0 -8,-8
-1,-1 0,-10
坦白
参与人:A和B A和B各自的战略空间:(抵赖,坦白) A和B选择不同的战略组合所对应的支付 组合:(-1,-1),(-10,0), (0,-10)和(-8,-8) 其中,支付组合(和战略组合)中,前 一个元素表示A的支付,后一个元素表示 B的支付
重复剔除严格劣战略的程序: 找出并剔除某个参与人对于其他参与人选 择的任何战略的劣战略 重新构造一个不包含已剔除战略的新博弈 在新博弈中重复上述过程,直到只剩下唯 一的一组战略组合
唯一剩下的一组战略组合构成“重复剔除 的占优均衡” 重复剔除的占优均衡(iterated dominance equilibrium,IDE): 通过重复剔除严格劣战略的方式所确定 的博弈的均衡概念 完全信息静态博弈的解概念之一
博弈分析的前提:一致信念 (consistently aligned belief,CAB) 每一位犯罪嫌疑人对其他犯罪嫌疑人的 信念是一致的 每一位会对其他行为感到惊讶 一致信念的基础:理性共识
“将计就计” “将错就错” A以为B不知道A已经知道B的计划或计谋 不满足“共同知识”的假设
博弈论的基本假设之二: 犯罪嫌疑人A和B都将知道博弈的规则 (the rules of games) 或者说,博弈规则是共同知识 例如,每位犯罪嫌疑人将了解给定对方 的策略,采取不同策略可能受到的不同 惩罚
理性共识(CKR)(Aumann,1976) “囚徒困境”博弈 每个犯罪嫌疑人是理性的,每个犯罪嫌 疑人知道每个(其他)犯罪嫌疑人是理 性的,每个犯罪嫌疑人知道每个犯罪嫌 疑人知道每个犯罪嫌疑人是理性的,…
“犯罪嫌疑人A知道B是理性的” “B知道A是理性的” “A知道B知道A是理性的” “B知道A知道B是理性的” “……..”

第2章_完全信息静态博弈

第2章_完全信息静态博弈


前行
退让
前行
(-10,-10) (20,-2)

退让
(-2,20) (0,0)
❖ (甲前行、乙退让)和(甲退让、乙前行)都是“斗鸡博弈” 的纳什均衡。
3.“市场争夺战”博弈
❖ 假设在市场中有两个竞争对手。一个是已经在市场中的“在位者”, 另一个是企图进入市场的“潜在进入者”。
❖ 潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个 可以选择的策略:斗争、默许。
(10,1) (2,2)
❖ 如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择? ❖ 理性的嫌疑人甲会选择坦白。 ❖ 在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。 ❖ 类似可分析其他情况
❖ 2.通过“划横线法”求解“智猪博弈”的均衡
大猪
按开关 等待
小猪
按开关
等待
(5,-1)
(4,2)
(10,-2) (0,0)
❖ 如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈 另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会 比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按 压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为 -1。
❖ 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下 开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花 一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强 力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况 下,大猪得到的收益是 4,小猪得到的收益是 2。
❖ 将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付 矩阵上方 。
❖ 嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人 甲可能的策略纵向排列在博弈支付矩阵左侧。

第二章 完全信息静态博弈

第二章 完全信息静态博弈

两寡头间的囚徒困境博弈
厂商2
不突破
厂 不突破 商 1 突破
突破
4.5,4.5
5,3.75
3.75,5
4,4
以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
2.3.2 反应函数(划线法)
古诺模型的反应函数
(0,6) R1(q2)
Cont…

反应函数: *
P
* 2
P 1
1 * ( a1 d1 P 2 ) 2b 1
2.3 无限策略分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 豪泰琳模型
2.3.1 古诺的寡头模型
企业Cournot模型 (无限策略博弈) 古诺( Cournot ,1838)比纳什(1950)定义早100年 假设条件: 1. 在一个寡头市场上两企业生产销售同质产品,市场 总产量Q = q1+q2 (两寡头企业就是指这两家企业 垄断了某一行业的市场) 2. 市场出清价格 P = 8 - Q 3. 生产无固定成本,边际成本 c=c1=c2=2 4. 两企业同时独立地决定各自的生产产量(q1, q2) 问题:两家企业应如何决策?
2.2.2

纳什均衡与一致预期
一致预期:基于信念的选择是合理的;支持选择的 信念是正确的; 预期的自我实现:如何所有人认为这个结果会出现, 这个结果就会出现。预期是自我实现的,预期不会 错误。如果你认为我预期你将选择X,你就真的会 选择X。

2.2.3 纳什均衡与严格下策反复消去法
上策均衡定是纳什均衡,但纳什均衡不一定是上策均衡 命题2.1:在n个博弈方的博弈 G {S1 ,Sn ; u1 ,un } 中,如 * * 果严格下策反复消去法排除了除 (s1 , sn ) 之外的所有策 * * 略组合,那么 (s1 , sn ) 一定是该博弈的唯一的纳什均衡 命题2.2:在n个博弈方的博弈中G {S1,Sn ; u1,un } 中,如 * * , sn )是 果 (s1 G 的 一个纳什均衡,那么严格下策 反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严 格下策反复消去法简化博弈是可行的

第二章完全信息静态博弈

第二章完全信息静态博弈

第二章完全信息静态博弈2在完全信息静态博弈中,各博弈方同时决策,且所有博弈方对各方得益都完全了解。

完全信息静态博弈属于非合作博弈最基本类型。

本章介绍该类博弈的一般分析方法、纳什均衡概念及分析方法的扩展。

2.1 基本分析方法3上策均衡严格下策反复消去法划线法箭头法上策均衡4 (Dominant-strategy Equilibrium)上策(Dominant-strategy) :不管其它博弈方选择什么策略,一个博弈方的某个策略给他带来的得益至少不低于其他策略。

例:囚徒困境Idea..?5上策均衡与均衡结果:上策均衡(坦白,坦白)均衡得益(-5,-5)“坦白”相对于“抵赖”是每个囚徒的上策(优势策略)-5,-50,-8-8,0-1,-1坦白抵赖坦白抵赖囚徒B囚徒A上策均衡6 (Dominant-strategy Equilibrium)上策均衡:由每个博弈方的上策所组成的策略组合。

一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果。

博弈方2博弈方1A B C a3,22,35,4 b2,11,23,3 c1,61,44,5例寻找上策(优势策略)检查一下你是否存在上策,如果有,就选择它。

站在其他方的位置上思考问题如果你没有上策,那么从其他博弈方角度考虑。

如果其他博弈方有上策,预期他将选择自己的上策。

严格下策:不管其它博弈方的策略如何变化,某种策略给一个博弈方带来的得益总比另一种策略小,称前一种策略为相对于后一种策略的“严格下策”。

1,01,30,40,2左中1,01,3左中1,01,30,10,40,22,0左中右上下211,3中上例:巡逻6,24,48,00,0巡逻不巡逻穷人不巡逻富人WELCOME富人与穷人1112处于强势的博弈方为维护自己利益采取某种决策时,为其他弱势博弈方提供了搭便车的机会公司里的大股东与小股东每一个博弈方针对其他方的每一种策略,在自己的最大可能得益下划线2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争划线法13划线法:通过在最佳对策得益下划线分析博弈的方法。

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈

囚徒困境在经济学上有着广泛的应用。 例1:两个寡头企业选择产量的博弈。如果两个企业联合起来形成卡特尔,选择垄 断利润最大化的产量,每个企业都可以得到更多的利润。但卡特尔不是一个稳定 的均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果是,每 个企业都只得到小于最大利润的产量,利润严格小于卡特尔产量下的利润。 在有些情况下,个人理性和集体理性的冲突对社会来说也许是一件好事,尽管对 集体而言是一件坏事。
第2讲 完全信息静态博弈
下继续生活下去。 从囚徒困境中,我们可以引出一个很重要的结论:一种制度(体制)安排,要发 生效力,必须是一种均衡。否则,这种制度安排不能成立。
第2讲 完全信息静态博弈

3.重复剔除的占优均衡 在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在 绝大数博弈中,占优战略均衡是不存在的。
第2讲 完全信息静态博弈

在“智猪博弈”中,我们先剔除掉小猪的劣战略“按”,在剔除掉这个战略后的 新的博弈中,小猪只有一个战略“等待”,大猪仍有两个战略,但此时,“等待” 已成为大猪的劣战略,提出这个战略,剩下的唯一战略组合是(按,等待)。
第2讲 完全信息静态博弈

我们需要对“占优战略”和“劣战略”的概念进行重新定义。


都是(相对于si*的)劣战略。 在应用重复剔除方法寻找均衡时,一个战略是占优战略或劣 战略可能是相对于另一个特定的战略而言的。
第2讲 完全信息静态博弈
' ' ' 定义:令si 和s? 是参与人 i 可选择的两个战略(即 s i i Si, ' s’ i Si)。如果对于任意的其他参与人的战略组合s -i,参与人 ' ' i的选择si 得到的支付严格小于从选择s? i 得到的支付,即:

第二讲完全信息静

第二讲完全信息静

第一个重要的均衡概念就是优势策略均衡 (dominant strategy equilibrium)。如果 如果 无论其他参与人选择什么策略,策略s 无论其他参与人选择什么策略,策略 i*都 是参与人i的强最佳应对 那么s 的强最佳应对, 是参与人 的强最佳应对,那么 i*就称为优 势策略。这意味着无论别人选择什么策略, 势策略。这意味着无论别人选择什么策略, si*都使参与人 的支付最大化。从数学上讲 都使参与人i的支付最大化 的支付最大化。 ui(si*, s-i) ≥ ui(si′, s-i) 对于任何 i′≠ si* 对于任何s
斗鸡博弈
妻子 进 丈夫 退 0,2 0,0 进 -3,-3 退 2,0
市场进入阻挠
在位者 默许 斗争 40,50 -10,0 0,300 0,300
进入 进入者 不进入
恩爱夫妻博弈
妻子 活着 丈夫 死了 0,-6 0,0 活着 2,2 死了 -6,0
仇恨夫妻博弈
上 甲 中 下

乙 中

0,4 4,0 3,5
4,0 0,4 3,5
5,3 5,3 6,6
性别大战
妻子 韩剧 球赛 2,1 0,0 0,0 1,2
韩剧 丈夫 球赛
不存在重复剔除优势均衡。看球赛和看韩 剧都是纳什均衡,但分别是针对不同均衡 而言。若这对恋人事先不通气,则可能出 现误会。性别战中,任一纳什均衡都是帕 累托有效的,其他任一策略都不可能在不 降低其他参与人支付的条件下提高另一参 与人的支付,即不存在帕累托改进。 但囚徒困境博弈中纳什均衡并不是帕累托 最优的。
优势策略均衡和重复剔除策略均衡对参与者的理 性要求是不同的。前者只要每个参与者自己是理 性的就可以了,而后者要求理性是参与者的共同 知识,即,参与者不仅自己是理性的,还需要其 他参与者也是理性的,并且还假定所有参与者都 知道其他参与者是理性的。 重复剔除策略均衡是建立在理性参与者不会选择 严格劣策略这一合情推理之上的,但这一方法和 严格占优策略均衡一样,有时候找不到严格劣策 略。所以,这两种解法虽然简单,但有时不奏效。

完全信息静态博弈

完全信息静态博弈

• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。

R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)

F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。

第二讲 完全信息静态博弈

第二讲 完全信息静态博弈

第二讲完全信息静态博弈一、博弈的战略式表述strategic form representation(一)战略式表述又称为标准式表述normal form representation,在这种表述中,所有参与人同时选择自己的战略,所有参与人选择的战略一起决定每个参与人的支付。

注意:参与人“同时选择”的是战略,是参与人行动的全面计划和准则,而不是行动。

因此,战略式表述也可以用来描述动态博弈。

(二)战略式表述的组成及表示1.博弈的参与人集合:i∈Ø;Ø=(1,2,…,n)2.每个参与人的战略空间:Si,i=1,2,…,n;3.每个参与人的支付函数:ui (s1,…,si,…,sn),i=1,2,…,n。

所以,G={S1,…,Sn;u1,…,un}代表战略式表述博弈。

(三)两人有限博弈的战略式表述的矩阵表述例:囚犯困境prisoners’ dilemma囚犯B坦白抵赖囚犯A 坦白抵赖二、占优战略均衡(一)占优战略dominant strategy1.占优战略的含义:无论其他参与人选择什么战略,该参与人的最优战略是唯一的,这样的最优战略被称为“占优战略”。

2.例子:在上例“囚犯困境”中,“坦白”是囚犯A的占优战略,“坦白”也是囚犯B的占优战略。

(二)占优战略均衡dominant-strategy equilibrium1.占优战略均衡的含义:在一个博弈里,如果所有参与人都有占优战略存在,则所有参与人占优战略所组成的战略组合称为“占优战略均衡”。

2.例子:在上例“囚犯困境”中,(坦白,坦白)就是占优战略均衡。

这时,个人理性与集体理性产生了冲突。

3.注意:占优战略均衡只要求每个参与人是理性的,不要求“每个参与人是理性的”是共同知识。

三、重复剔除的占优均衡(一)例子:“智猪博弈”在绝大多数博弈中,占优战略均衡是不存在的。

在“智猪博弈”中,按下按钮可有8个单位食物,但要支付2单位成本。

若大猪先到,大猪吃7个单位,小猪吃1个单位;小猪先到,各吃4个单位;同时到,大猪吃5个单位,小猪吃3个单位。

第2章完全信息静态博弈

第2章完全信息静态博弈

存在问题
▪ 伯特兰德模型之所以会得出这样的结论,与它的前提假 定有关。从模型的假定看至少在以下两方面的问题:
▪ ①假定企业没有生产能力的限制。如果企业的生产能力 是有限的,它就无法供应整个市场,价格也不会降到边 际成本的水平上。
▪ ②假定企业生产的产品是完全替代品。如果企业生产的 产品不完全相同,就可以避免直接的价格竞争。
演唱会
李 亚
足球
2,1

演唱会 -1,-1
0,0 1,2
某策略组合只有指向的箭头,没有 指离的箭头,则为稳定性的策略组合
猜硬币方

硬 币
正面
方 反面
正面
方面
-1,1 1,-1
1,-1 -1,1

弈上 方
1

博弈方2



1,0 1,3 0,1
0,4 0,2 2,0
1.3 画线法
由于决策的原则是使自己的得益尽可能的 大。同时由于一方的得益取决于其他方的策 略。
s
令p 为商店i的价格,D (p ,p ) 为需求函数, i=1,2。
i
i 12
如果住在x左边的将都在商店1购买,而住在xs右边的将在商店 s 2购买,需求分别为:
D =x,D =1-x,
1
2
这里x满足 p1+tx=p2+t(1-x)
解上式,得需求函数分别为: D1(p1,p2)=x=(p2-p1+t)/2t D2(p1,p2)=1-x=(p1-p2+t)/2t
第二章
博弈论——完全信息静态博弈
static games of complete formation
完全信息静态博弈

第二章(完全信息静态博弈)PPT课件

第二章(完全信息静态博弈)PPT课件

q2 R2(q1)
(3,0) (6,0)
q1
图2.9 古诺模型的反应函数几何描述
2021
27
三、伯特兰德寡头模型——价格博弈
当厂商1和厂商2价格分别是 P1 和 P2 时,它们各 自的需求函数为 :
q 1 q 1 ( P 1 ,P 2 ) a 1 b 1 P 1 d 1 P 2 q 2 q 2 ( P 1 ,P 2 ) a 2 b 2 P 2 d 2 P 1
一、纳什均衡的定义
n个参与人的策略式表达博弈:G {S1, ,Sn;u1, un},
策略组合 S*{S1 *, ,Si*, Sn *}是一个纳什均衡,如果
对于每一个
i,s
* i
是给定其他所有参与人选择
S * 1 { S 1 * , ,S i* 1 ,S i* 1 S n * }的情况下第 i个参与人的
2021
17
三、纳什均衡与上述分析方法的关系
(一)纳什均衡与上策均衡的关系 上策均衡是比纳什均衡更强、稳定性更高的均衡 概念
纳什 均衡
上策均衡
图2.8 纳什均衡与上策均衡的关系
2021
18
G { S 1, ,S n;u 1, u n}
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G {S1, ,Sn;u1, un}中,
2021
16
正是由于纳什均衡是一致性预测,因此才进一 步有下列性质:首先,各博弈方可以预测它,可以 预测他们的对手会预测它,还可以预测他们的对手 会预测自己会预测它,……;其次,预测任何非纳 什均衡策略组合将是博弈的最终结果,意味着要么 各博弈方的预测其实并不相同(预测不同的纳什均 衡会出现等),要么预期至少一个博弈方要“犯错 误”,包括对博弈结构理解的错误,对其他博弈方 的策略预测错误,其理性和计算能力有问题,或者 是实施策略时会出现差错等。

第二讲、完全信息静态博弈

第二讲、完全信息静态博弈

由表2-2可以看出,无论大猪选择什么策略, 小猪选择按按钮,对小猪是一个严格劣策略, 我们首先加以剔除。在剔除小猪按按钮这一 选择后的新博弈中,小猪只有等待一个选择, 而大猪则有两个可供选择的策略。在大猪这 两个可供选择的策略中,选择等待对大猪是 一个严格劣策略,我们再剔除新博弈中大猪 的严格劣策略等待。剩下的新博弈中只有小 猪等待、大猪按按钮这一个可供选择的策略, 就是智猪博弈的最后均衡解,从而达到重复 剔除的占优策略均衡。
一、占优策略均衡
占优策略(dominant strategies)是指这 样一种特殊的博弈:某一参与人的策略可 能并不依赖于其他参与人的策略选择。换 句话说,无论其他参与人如何选择自己的 策略,该参与人的最优策略选择是惟一的。 (一)囚徒困境
以博弈论中最为著名的囚犯困境(prisoner’s dilemma)为例,说明占优策略均衡原理。两个合伙 作案的犯罪嫌疑人被警方抓获。警方怀疑他们作案, 但警方手中并没有掌握他们作案的确凿证据。因而, 对两个犯罪嫌疑人犯罪事实的认定及相应的量刑完 全取决于他们自己的供认。假定警方对两名犯罪嫌 疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都 无法观察到对方的选择。同时,警方明确地分别告 知两名犯罪嫌疑人,他们面临着以下几种后果可以 用表2-1表示。该表又称为“收益矩阵或得益矩 阵”。从表2-1中可以看出,每个犯罪嫌疑人都有 两种可供选择的策略:供认或不供认。而且,每个 犯罪嫌疑人选择的最优策略不依赖于其同伙的策略 选择,
第二种情况也不会发生,就像囚徒不能指望 别人不坦白而自己坦白一样。没有人天真到 会相信别人能替自己赔钱。在金融信息快到 几分钟甚至几秒钟就可以从世界一端传递到 另一端的情况下,各国中央银行不可能悄悄 地将他们的美元储备抛出又不惊动他人。国 际间的货币兑换其实都是透明的,一个国家 的外汇储备从一种货币换作另一种货币的交 易不可能隐藏到不被披露出来。

经济博弈论完全信息静态博弈

经济博弈论完全信息静态博弈

19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。

经济博弈论02完全信息静态博弈(Park)

经济博弈论02完全信息静态博弈(Park)

合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。

第二讲完全信息静态博弈讲义

第二讲完全信息静态博弈讲义
10
这就是我们看到的为什么大多数 路、桥等公共设施都是由政府出资修建 的原因。
同样的道理,国防、教育、社会 保障,环境卫生等都由政府承担资金投 入,私人一般没有积极性承担这方面服 务的积极性和能力。
11
上策均衡分析存在的问题
这里的问题是并非每个博弈方都有这种绝 对偏好的上策,而且常常是所有博弈方都没有 上策,因为博弈方的最优策略随其他博弈方的 策略而变化正是博弈问题的根本特征,是博弈 关系相互依存性的主要表现形式。因此上策均 衡不是普遍存在的。
第二章 完全信息静术味浓厚一些),译自英文Game theory,直译应该是游戏理论。一般来讲,日常 生活中,下棋打牌、赌胜博彩,以及田径、球类 等各种体育比赛,都是游戏。
2
博弈的通俗理解
游戏有以下特征(打牌为例):(1)都 有一定的规则,几副牌,几个打,可以做什 么,不可以做什么,按什么次序出牌,犯规 了怎样处置等等。(2)都有一个结果。是输 还是赢,升几级等。(3)策略至关重要,先 出什么再出什么都蕴涵着策略,不同的策略 选择带来不同的结果。(4)策略和利益有相 互依存性,即每一个游戏者所得结果的好坏, 不仅取决于自身的策略选择,也取决于其他 参加者的策略选择。
12
2.1.2 严格下策反复消去法
如同寻找每个博弈方最优的策略思路一样, 如果找到每一个博弈方的最差策略,则可以将 其消去。一般地,如果在一个博弈中,不管其 他博弈方的策略如何变化,一个博弈方的某种 策略给他带来的得益,总是比另一种策略给他 带来的得益要小,那么我们称前一种策略为相 对于后一种策略的一个“严格下策”。很显然, 任何理性的博弈方都不可能采用严格下策,因 此可以将其消去。
们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。

第2章_完全信息静态博弈

第2章_完全信息静态博弈
* q2 R2 ( q1 )
2.3.1 古诺的寡头模型
反应函数:是指每个博弈方针对其他博弈方所有战略的最佳反应构成 的函数。 纳什均衡就是各个博弈方的一组互为最佳反应对策的战略。
2.1.1 占优战略均衡(上策均衡)
开发商B 需求大的情况 开发商A 不开发 开发 开发 4000,4000 0,8000 不开发 8000,0 0,0 开发商B B严格劣 战略
A严格劣 战略
需求小的情况
开发
开发 开发商A 不开发 0,1000 -3000,-3000
不开发
1000,0 0,0
2.1.1 占优战略均衡(上策均衡)
-8, -8 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
-1, 1 1, -1
1, -1 -1, 1
2.1.4 箭头法
基本思路
对博弈中每个策略组合进行分析,考察在每个策略组合
处各个博弈方能否通过单独改变自己的策略而增加得益。
如能,则从所分析的策略组合对应的得益数组引一箭头, 到改变策略后策略组合对应的得益数组。最后综合分析 对每个策略组合的分析情况,形成对博弈结构的判断。
有任何人有积极性破坏这个协议,则这个协议是自动
实施的。这个协议就构成了一个纳什均衡。
2.2 纳什均衡
通俗地说,纳什均衡的含义就是:
给定你的策略,我的策略是最好的策略;给定我的策略,
你的策略也是你的最好的策略。即双方在给定的策略下
不愿意调整自己的策略。
2.2 纳什均衡
寻找纳什均衡
参与人B
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)

02 完全信息静态博弈

02 完全信息静态博弈
p p 1 a b 1 D2 ( p1 , p2) 1 x b 2 2t (1 a 2b)
假设C为单位成本,则两商店的利润分别为
( p , p ) ( p c) D ( p , p ) ( p , p ) ( p c) D ( p , p )
当a=1-b时,即两商店位于同一位置,完全无差异,则
p
*
1

p
* 2
c
如果企业的竞争战略是价格,则Bertrand证明,即使只 有两个企业,在均衡情况下,价格等于边际成本,企业的 利润为零,与完全竞争市场均衡一样。这就是“伯川德悖 论(Bertrand Paradox)”。 解开这个悖论的办法之一就是引入产品的差异性。
* * ,sn ) 的各一个策略组成的某个策略组合 (s1 中,任一参与人
* * 的策略,都是对其余参与人策略的组合 (s1 ,si*1 , si*1 ,...sn )
* * * * ,si*1, si* , si*1,...sn ) ui (s1 ,si*1, si , si*1,...s, 的最佳对策,即 ui (s1 n)
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1
6q1 q1q2 q12
u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2
6q2 q1q2 q22
古诺模型的反应函数
maxu1 max(6q1 q1q2 q12 )
* * ( ui (si* , s )对任意 s S i 都成立,则称 ) u ( s , s i i i i )
i
s
*
* * ( s1 , sn ) 为 G 的一个纳什均衡

Lecture 2 完全信息静态博弈

Lecture 2 完全信息静态博弈

* * q1* arg max 1 (q1, q2 ) arg max q1P(q1 q2 ) C1 (q1 )
* q2 arg max 2 (q1* , q2 ) arg max q2 P(q1* q2 ) C2 (q2 )
纳什均衡是完全信息博弈解的一般概念,构成纳什均衡的策
每一个占优策略均衡、重复剔除的占优均衡一定是纳什均衡
,但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优 均衡。
略一定是重复剔除严格劣过程 中不能被剔除的策略。也就是说 ,没有任何一个策略严格优于纳什均衡策略。
纳什均衡一定是在重复剔除严格劣策略过程中没有被剔除掉
如果这样的解存在,我们说该博弈是“重复剔除占优可解的
2.3 可理性化策略
L
参与人A U D 0,3 参与人B M
R
1,0
1,2 0,1
参与人B
0,1 2,0
M
L
参与人A U D
1, 0 0, 3
1, 2 0, 1
参与人B L M
1, 0
1, 2
2.3 可理性化策略
参ቤተ መጻሕፍቲ ባይዱ人关于彼此理性和博弈结构的共同知识,可以使我们剔
我们同样可以通过重复剔除决不是最优反应的方式来减少策 可理性化策略的集合不会比通过了重复剔除严格劣策略的策
略集合更大。
略的范围。通过了这样重复剔除的策略,被称为参与人������ 的“可 理性化”策略。
2.3 可理性化策略
“可理性化策略”
策略������������ 是参与人������对竞争对手策略������−������ 的一个最优反应,如果
10000之间的整数。定义所有参与人所写数字最大值的9/10作 为目标数字(如果不是整数则向下取整)。所写数字正好为该 目标数字的参与人平分5000元。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

得每个参与人的策略是对其他
参与人策略的最优反应。


在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法
12
2.2 基本分析思路和方法
博弈的解和纳什均衡
21



2.3 博弈的解和纳什均衡

严格下策反复消去法与纳什均衡
严格下策:对于某一策略 (s1,...si ,..., sn ),若
* u ( s ,... s u ( s ,... s ,..., s ) ,则称 为 ui (s1,...si ,..., sn ) ui (s1,...s ,..., sn ) i 1 i ,..., sn ) i 1 i n 的严格下策。
完全信息静态博弈——基本分析思路和方法
8
2.2 基本分析思路和方法
严格下策反复消去法应用
左 上 中 右 左 1 ,0 0 ,4 中 1 ,3 0 ,2 左 1 ,0 中 1 ,3
1 ,0
0 ,4
1 ,3
0 ,2
0 ,1
2 ,0

完全信息静态博弈——基本分析思路和方法
9
2.2 基本分析思路和方法

古诺的寡头模型
28
2.4.1 古诺的寡头模型

Cournot通过模型研究得出:两寡头市场产量比垄断市 场高、价格比垄断市场价格低、利润比垄断市场低。这 是典型的囚徒困境问题,导致个人理性和集体理性的冲 突。
古诺的寡头模型
29
2.4.1 古诺的寡头模型

思考:多博弈方的古诺模型。
古诺的寡头模型
30
博弈的解和纳什均衡
22

2.4 无限策略博弈

当博弈方存在无限多种的可选策略时,这样的博弈 为无限策略博弈。不能用划线法和箭头法来找这种 博弈的纳什均衡。 但是纳什均衡的有效性不会因为策略数量的增加而 受到影响。

无限策略博弈
23
2.4.1 古诺的寡头模型
古诺的寡头模型

古诺模型是早期的寡头模型。它是由法国经济学家古 诺于1838年提出的。纳什均衡应用的最早版本,古诺 模型通常被作为寡头理论分析的出发点

改变规则
改变方案一:投食量减半,两者都不去按钮,结果
该游戏规则设计失败
改变方案二:投食量增倍,两者都会去按钮,该游
戏规则成本过高,竞争不激烈
改变方案三:改量加移位,食量减半,
按钮与食槽同侧,多劳者多得,不劳
者不得
完全信息静态博弈——智猪博弈
16
2.2 基本分析思路和方法

智猪博弈的启示

谁应该去按按钮呢?
完全信息静态博弈——智猪博弈
14
2.2 基本分析思路和方法
按钮 同时按钮 大猪按钮 小猪按钮 大猪收益 份数 7 6 9 得益 5 4 9 份数 3 4 1 小猪收益 得益 1 4 -1
不按钮
0
0
0
0
策略:“小猪躺着大猪跑”
完全信息静态博弈——智猪博弈
15
2.2 基本分析思路和方法
划线法 在每个博弈方对其他博弈方每个策略或策略组合 的最佳对策对应的得益下划线,这种分析博弈的方法 称为“划线法”。 思路 比较策略之间的相对优劣关系 先找出自己针对其他博弈方每种策略或策略组合 (对多人博弈)的最佳对策,通过对其他博弈方策略 选择的原则的判断等,预测博弈的可能结果,确定自 己的最优策略

并非每个博弈方都有绝对偏好的上策,甚至都没有上 策 博弈方的最优策略随其他博弈方的策略而变化是博弈 的本质特征

完全信息静态博弈——基本分析思路和方法
6
2.2 基本分析思路和方法

严格下策反复消去法

严格下策 如果一个博弈中,不管其他博弈方的策略如何变化,一 个博弈方的某种策略给他带来的得益,总是比另一种策 略给他带来的得益要小,称前一种策略为相对于后一种 策略的一个“严格下策”
智猪博弈 笼子里有两头猪,一头大猪,一头小猪。笼子 很长,一头有一个按钮,另一头是饲料的出口和食 槽。按一下按钮,将有相当于10份的猪食进槽,但 按钮后跑到食槽要消耗2份猪食并花费时间,而坐
享其成的另一头猪早已吃掉不少。
如果大猪先到,大猪吃到9份,小猪吃到1份 如果同时到达,大猪吃到7份,小猪吃到3份 如果小猪先到,大猪吃到6份,小猪吃到4份
2
2.1 博弈的标准式表述
(1)博弈的参与人集合:
i , (1, 2,..., n)
(2)每个参与人的策略选择空间: (3)每个参与人的得益函数; (4)博弈 G 博弈(G)分析的目的:
Si , i 1, 2,..., n
ui (s1 ,..., si ..., sn ), i 1, 2,..., n
完全信息静态博弈——基本分析思路和方法
10
2.2 基本分析思路和方法
划线法应用
1, 0
1, 3
0, 1
0, 4
囚 徒 困 境 猜 硬 币
0, 2
2, 0
夫 妻 之 争
-1, -1
-8, 0
2, 1
0, 0
0, -8
-5, -5
0, 0
1, 3
-1, 1 1, -1
1, -1 -1, 1
完全信息静态博弈——基本分析思路和方法
古诺的寡头模型
24
2.4.1 古诺的寡头模型

古诺模型的假定是:

市场上只有1、2两个厂商生产和销售相同的产品, 厂商1的产量为q1,厂商2的产量为q2,Q= q1 + q2
生产成本为零,且边际成本c1 = c2 = 2;

市场出清价格(可以将产品全部卖出的价格)是市 场总产量的函数 P=P(Q)=8-Q;
17
2.2 基本分析思路和方法

囚徒困境的启示
你的选择和决定会影响别人
的决策结果,同样别人的选
择和决定也直接影响着你的
决策结果
博弈方都以自己的最大利益为目标,结果是无法实
现最大利益甚至是较大利益
完全信息静态博弈——囚徒困境
18
2.3 博弈的解和纳什均衡


在一组策略组合中,所有参与 者都面临这样一种情况:当其 他人不改变策略时,他此时的 策略是最好的 纳什均衡是一种策略组合,使
箭头法应用
1, 0 0, 4 囚 徒 困 境 猜 硬 币
1, 3 0, 2
0, 1 2, 0 夫 妻 之 争
-1, -1 0 ,-8
-8 ,0 -5, -5 1, -1 -1, 1
2, 1 0, 0
0, 0 1, 3
-1, 1 1, -1
完全信息静态博弈——基本分析思路和方法
13
2.2 基本分析思路和方法
2.4.1 古诺的寡头模型

已知在某个市场有n个厂商销售完全相同的商品。
“市场出清价格”是投放到该市场上的该种商品总量的 函数,而商品总量为n个厂商各自产量之和。假设这n 个厂商的产量决策是各自独立的,且在同一时间决定 各自的产量。
预测博弈的均衡结果,即给定“每个参与人都是理性的” 是共同知识,什么是每个参与人的最优策略?什么是所有参 与人的最优策略组合?
博弈的标准式表达
3
2.2 基本分析思路和方法

上策均衡

上策:在某个博弈中,如果不管其他博弈方选择什么 策略,一博弈方的某个策略给他带来的得益始终高于 或不低于其他策略,则这个策略为上策 上策均衡:如果一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,那么这个策略组合必 然是该博弈比较稳定的结果,称之为上策均衡。
完全信息静态博弈——基本分析思路和方法
7
2.2 基本分析思路和方法
Hale Waihona Puke 严格下策反复消去法 思路: 排除法:把不可能采用的较差策略排除掉
1)找出某个参与人的严格劣策略,并把它从他的策 略空间中剔除,重新构造一个已不包含该严格劣策 略的博弈; 2)剔除新博弈中某个参与人的严格劣策略; 3)重复上述过程,直到只剩下唯一的策略组合。
* * , q2 ) 是纳什均衡的充分必要条件 在本博弈中,(q1 * * 是 q2 和 的最大值问题: q1
相关文档
最新文档