2 完全信息静态博弈
第2章_完全信息静态博弈
乙
前行
退让
前行
(-10,-10) (20,-2)
甲
退让
(-2,20) (0,0)
❖ (甲前行、乙退让)和(甲退让、乙前行)都是“斗鸡博弈” 的纳什均衡。
3.“市场争夺战”博弈
❖ 假设在市场中有两个竞争对手。一个是已经在市场中的“在位者”, 另一个是企图进入市场的“潜在进入者”。
❖ 潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个 可以选择的策略:斗争、默许。
(10,1) (2,2)
❖ 如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择? ❖ 理性的嫌疑人甲会选择坦白。 ❖ 在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。 ❖ 类似可分析其他情况
❖ 2.通过“划横线法”求解“智猪博弈”的均衡
大猪
按开关 等待
小猪
按开关
等待
(5,-1)
(4,2)
(10,-2) (0,0)
❖ 如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈 另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会 比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按 压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为 -1。
❖ 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下 开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花 一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强 力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况 下,大猪得到的收益是 4,小猪得到的收益是 2。
❖ 将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付 矩阵上方 。
❖ 嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人 甲可能的策略纵向排列在博弈支付矩阵左侧。
第二章完全信息静态博弈
第二章完全信息静态博弈2在完全信息静态博弈中,各博弈方同时决策,且所有博弈方对各方得益都完全了解。
完全信息静态博弈属于非合作博弈最基本类型。
本章介绍该类博弈的一般分析方法、纳什均衡概念及分析方法的扩展。
2.1 基本分析方法3上策均衡严格下策反复消去法划线法箭头法上策均衡4 (Dominant-strategy Equilibrium)上策(Dominant-strategy) :不管其它博弈方选择什么策略,一个博弈方的某个策略给他带来的得益至少不低于其他策略。
例:囚徒困境Idea..?5上策均衡与均衡结果:上策均衡(坦白,坦白)均衡得益(-5,-5)“坦白”相对于“抵赖”是每个囚徒的上策(优势策略)-5,-50,-8-8,0-1,-1坦白抵赖坦白抵赖囚徒B囚徒A上策均衡6 (Dominant-strategy Equilibrium)上策均衡:由每个博弈方的上策所组成的策略组合。
一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果。
博弈方2博弈方1A B C a3,22,35,4 b2,11,23,3 c1,61,44,5例寻找上策(优势策略)检查一下你是否存在上策,如果有,就选择它。
站在其他方的位置上思考问题如果你没有上策,那么从其他博弈方角度考虑。
如果其他博弈方有上策,预期他将选择自己的上策。
严格下策:不管其它博弈方的策略如何变化,某种策略给一个博弈方带来的得益总比另一种策略小,称前一种策略为相对于后一种策略的“严格下策”。
1,01,30,40,2左中1,01,3左中1,01,30,10,40,22,0左中右上下211,3中上例:巡逻6,24,48,00,0巡逻不巡逻穷人不巡逻富人WELCOME富人与穷人1112处于强势的博弈方为维护自己利益采取某种决策时,为其他弱势博弈方提供了搭便车的机会公司里的大股东与小股东每一个博弈方针对其他方的每一种策略,在自己的最大可能得益下划线2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争划线法13划线法:通过在最佳对策得益下划线分析博弈的方法。
应用博弈论第二讲完全信息静态博弈
2.2.1 纳什均衡的定义
策略空间:S1 , S n
博弈方 i的第 j 个策略:si j Si 博弈方 i的得益:u i
博弈:G {S1,Sn;u1,un}
纳什均衡:在博弈G {S1,Sn;u1,un}中,如果由各个博弈方i
的各一个策略组成的某个策略组合(si*,sn* ) 中,任一博弈方 的策略,都是对其余博弈方策略的组合 (si*,si*1, si*1,...sn* ) 的最佳对策,也即ui (si*,si*1, si*, si*1,...sn*) ui (si*,si*1, sij , si*1,...sn*)
岗位职责三工作总结项目运维项目实施银青高速视频监控东毛隧道停车场项目全面实施ip设置贵州独平高速项目全面实施监控室机柜布线四心得体会在这段时间的学习过程中我对部门很多产品从零学起刚到公司的时候感觉压力很大经过这些时间的认真学习和实际操作调整心态现已完全能融入公司的各项岗位职责和管理制度中
第二章 完全信息静态博弈
25
表1 划线法分析囚徒困境
囚徒 2
招
不招
囚 招 -8,-8 0,-10
徒 1
不 招
-10,0
-1,-1
26
习题3:划线法(一)
矩阵1
妻子
丈 活着 夫 死了
活着
1,1 0,-1
死了
-1,0 0,0
27
矩阵1的含义
矩阵1的纳什均衡为(活着,活 着)和(死了,死了)。这两个纳什均 衡的含义是这对夫妻要么同时活着,要 么同时死,如果有一个死了,则另一个 也宁愿选择死,而不愿单独活着。这说 明这对夫妻的感情极度恩爱,以至于单 独活着只有痛苦,甚至生不如死。
经开始对日本和德国这两个法西斯轴心国展开大反 攻。
第2讲 完全信息静态博弈【博弈论经典】
第2讲 完全信息静态博弈
•
囚徒困境在经济学上有着广泛的应用。 例1:两个寡头企业选择产量的博弈。如果两个企业联合起来形成卡特尔,选择垄 断利润最大化的产量,每个企业都可以得到更多的利润。但卡特尔不是一个稳定 的均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果是,每 个企业都只得到小于最大利润的产量,利润严格小于卡特尔产量下的利润。 在有些情况下,个人理性和集体理性的冲突对社会来说也许是一件好事,尽管对 集体而言是一件坏事。
第2讲 完全信息静态博弈
下继续生活下去。 从囚徒困境中,我们可以引出一个很重要的结论:一种制度(体制)安排,要发 生效力,必须是一种均衡。否则,这种制度安排不能成立。
第2讲 完全信息静态博弈
•
3.重复剔除的占优均衡 在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在 绝大数博弈中,占优战略均衡是不存在的。
第2讲 完全信息静态博弈
•
在“智猪博弈”中,我们先剔除掉小猪的劣战略“按”,在剔除掉这个战略后的 新的博弈中,小猪只有一个战略“等待”,大猪仍有两个战略,但此时,“等待” 已成为大猪的劣战略,提出这个战略,剩下的唯一战略组合是(按,等待)。
第2讲 完全信息静态博弈
•
我们需要对“占优战略”和“劣战略”的概念进行重新定义。
都是(相对于si*的)劣战略。 在应用重复剔除方法寻找均衡时,一个战略是占优战略或劣 战略可能是相对于另一个特定的战略而言的。
第2讲 完全信息静态博弈
' ' ' 定义:令si 和s? 是参与人 i 可选择的两个战略(即 s i i Si, ' s’ i Si)。如果对于任意的其他参与人的战略组合s -i,参与人 ' ' i的选择si 得到的支付严格小于从选择s? i 得到的支付,即:
第二讲 完全信息静态博弈
得每个参与人的策略是对其他
参与人策略的最优反应。
在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法
箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法
2 完全信息静态博弈--博弈论
Then 1 should choose “a”.
– Player 1’s best response to “B” is “a”.
Strategy a b c
A
12,11 11,10 10,15
Player 2
B
11,12 10,11 10,13
C
14,13 12,12 13,14
Player 1
2.1.3 上策均衡
上策
– 在某个博弈中,不管其他博弈方选择什么策 略,一博弈方的某个策略给他带来的得益始 终高于其它策略,至少不低于其它策略。
上策均衡
– 一个博弈的某个组和策略中的所有策略都是 各个博弈方各自的上策。这样的策略组合为 该博弈的一个“上策均衡”。
智猪博弈(boxed pig game)
Exercise: 田忌赛马
每次双方各出三匹马,一对一比赛三场,每一 场的输方要赔一千斤铜给赢方。
齐王的上、中、下三匹马分别比田忌的上、中、 下马略胜一筹。但田忌的上马比齐王的中马和 下马好,中马比齐王的下马好。
扩展成一个博弈问题,写出支付矩阵。
田忌
上中下 上下中 中上下 中下上 下上中 下中上 上中下 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1
Scenario Analysis
Similarly, if 1 thinks 2 will choose C…
– Player 1’s best response to “C” is “a”.
Player 2
Player 1
Strategy a b c
A
12,11 11,10 10,15
B
11,12 10,11 10,13
1博弈论概述2完全信息静态博弈3完全信息动态博弈4
②从局中人行动的先后顺序可划分为静 态博弈(Static game)和动态博弈 (dynamic game)。静态博弈是指在博弈中, 局中人同时选择行动或虽非同时行动但后行 动者并不知道先行动者采取了什么具体行动。 动态博弈是指局中人的行动有先后顺序,且 后行动者能够观察到先行动者所选择的行动。
③从局中人是否具有有关其他参与人 (对手)的特征、策略空间及支付函数方面 的知识的角度,可划分为完全信息博弈
合作博弈和非合作博弈的区别在于人们的行动为相互 作用时,当事人能否达成一个具有约束力(binding agreement)的协议。若有,就是合作博弈;否则就是非合 作博弈。例如,两个寡头企业,如果他们之间达成一个协议, 联合最大化垄断利润,且各自按该协议生产,即是合作博弈。 其面临的问题是如何分享合作带来的剩余。但若两个企业间 的协议不具有约束力,即没有哪一方能强制另一方遵守该协 议,每个企业都只选择自己的最优产量(或价格),则是非 合作博弈。另外,合作博弈强调的是团体理性、效率、公正 和公平。非合作博弈强调的是个人理性、个人最优决策,其 结果可能是有效率的,也可能是无效率的。
一、占优策略均衡
通常情况下,每个局中人的支付是博弈中所有参与 人策略的函数,故每个局中人的最优策略选择依赖于所 有其他参与人的策略选择。但在一些特殊博弈中,一个 参与人的最优策略选择可能并不依赖于其他参与人的策 略选择,即无论其他参与人选择什么策略,他的最优策 略是唯一的,这种最优策略被称为“占优策略” (dominant strategy)。 例:“囚徒困境” 囚徒困境是博弈论中的经典案例。该故事讲的是,两 个嫌疑犯作案后被警察抓住,分别被关在不同的房间里 进行审讯。警察知道两人有罪,但缺乏有力的证据,除 非两人之中有一个坦白。警察告诉每个人,他们的可选 择的策略与支付如下表:
经济博弈论 02 完全信息静态博弈(Park)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
第2章完全信息静态博弈
存在问题
▪ 伯特兰德模型之所以会得出这样的结论,与它的前提假 定有关。从模型的假定看至少在以下两方面的问题:
▪ ①假定企业没有生产能力的限制。如果企业的生产能力 是有限的,它就无法供应整个市场,价格也不会降到边 际成本的水平上。
▪ ②假定企业生产的产品是完全替代品。如果企业生产的 产品不完全相同,就可以避免直接的价格竞争。
演唱会
李 亚
足球
2,1
鹏
演唱会 -1,-1
0,0 1,2
某策略组合只有指向的箭头,没有 指离的箭头,则为稳定性的策略组合
猜硬币方
盖
硬 币
正面
方 反面
正面
方面
-1,1 1,-1
1,-1 -1,1
博
弈上 方
1
下
博弈方2
左
中
右
1,0 1,3 0,1
0,4 0,2 2,0
1.3 画线法
由于决策的原则是使自己的得益尽可能的 大。同时由于一方的得益取决于其他方的策 略。
s
令p 为商店i的价格,D (p ,p ) 为需求函数, i=1,2。
i
i 12
如果住在x左边的将都在商店1购买,而住在xs右边的将在商店 s 2购买,需求分别为:
D =x,D =1-x,
1
2
这里x满足 p1+tx=p2+t(1-x)
解上式,得需求函数分别为: D1(p1,p2)=x=(p2-p1+t)/2t D2(p1,p2)=1-x=(p1-p2+t)/2t
第二章
博弈论——完全信息静态博弈
static games of complete formation
完全信息静态博弈
2 完全信息静态博弈
2 政府
救济 3,
3
-1,
1 0 0,
1 )( ( )) ( 01
不救济 -1,
求微分,得到政府最优化的一阶条件:
同样,可以根据流浪汉 的期望效用函数找到政 府的最优混合策略。??
即:流浪汉以0.2的概率选择寻 找工作,0.8的概率选择游荡
四. 混合策略纳什均衡
社会福利博弈
四. 混合策略纳什均衡
社会福利博弈
救济 政府
流浪汉
寻找工作 2 3, 1 不救济 -1, 0, -1, 0 流浪 3
设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的策略都是给定对方混合策略时的最优策略
四. 混合策略纳什均衡
四. 混合策略纳什均衡
策略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
纯策略:如果一个策略规定参与人在每一个给定的信 息情况下只选择一种特定的行动,该策略为 纯策略。 混合策略:如果一个策略规定参与人在给定信息情况 下以某种概率分布随机地选择不同的行动, 则该策略为混合策略。
由于混合策略伴随的是支付的不确定性,因此参与 人关心的是其期望效用。
最优混合策略:是指使期望效用函数最大的混合策 略(给定对方的混合策略) 在两人博弈里,混合策略纳什均衡是两个参与人的 最优混合策略的组合。
支付最大 化法
四. 混合策略纳什均衡
流浪汉
寻找工作 流浪
假定政府的混合战略是 G , ); ( 1 流浪汉的混合战略是 L , )。 ( 1 政府的期望效用函数为: v( G, L) (3 1 ( )( )) 1 (5 1 ) vG 5 1 0 故 * 0.2
经济博弈论完全信息静态博弈
19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
博弈的四种基本类型
博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。
例如,囚徒困境。
2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争。
3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈。
4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。
例如,信号传递博弈。
每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。
例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。
完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。
不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。
不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。
例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。
博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。
举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。
你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。
二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。
举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。
经济博弈论02完全信息静态博弈(Park)
合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。
02 完全信息静态博弈
假设C为单位成本,则两商店的利润分别为
( p , p ) ( p c) D ( p , p ) ( p , p ) ( p c) D ( p , p )
当a=1-b时,即两商店位于同一位置,完全无差异,则
p
*
1
p
* 2
c
如果企业的竞争战略是价格,则Bertrand证明,即使只 有两个企业,在均衡情况下,价格等于边际成本,企业的 利润为零,与完全竞争市场均衡一样。这就是“伯川德悖 论(Bertrand Paradox)”。 解开这个悖论的办法之一就是引入产品的差异性。
* * ,sn ) 的各一个策略组成的某个策略组合 (s1 中,任一参与人
* * 的策略,都是对其余参与人策略的组合 (s1 ,si*1 , si*1 ,...sn )
* * * * ,si*1, si* , si*1,...sn ) ui (s1 ,si*1, si , si*1,...s, 的最佳对策,即 ui (s1 n)
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1
6q1 q1q2 q12
u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2
6q2 q1q2 q22
古诺模型的反应函数
maxu1 max(6q1 q1q2 q12 )
* * ( ui (si* , s )对任意 s S i 都成立,则称 ) u ( s , s i i i i )
i
s
*
* * ( s1 , sn ) 为 G 的一个纳什均衡
2完全信息静态博弈
4/7/2020
魏光兴——重庆交通大学
5
1、囚徒困境与占优均衡V
如何走出囚徒困境?
可信的(由第三方实施的、据说黑社会中存在的)报复 历史上的 “人质”或“通婚”方案 军队中的(有些企业试图培养的)“忠诚”文化 长期重复关系
4/7/2020
魏光兴——重庆交通大学
6
1、囚徒困境与占优均衡VI
4/7/2020
魏光兴——重庆交通大学
7
1、囚徒困境与占优均衡VII
委托-代理(principal-agent)关系中被设计的囚徒困境
预防审计合谋—双头审计
经理与注册会计师之间可能合谋,隐瞒不良信息。
股东解决这一问题的一种做法是双头审计,请两位会计师进 行审计,扣发给隐瞒者的部分报酬,而给坚持如实报告问题 的注册会计师以更多的报酬。
4/7/2020
魏光兴——重庆交通大学
22
6、混合战略均衡I
猜硬币博弈
两人玩游戏,一人A盖住硬币,另一人B猜哪一面朝上,输 赢一块钱。
类似的例子还有划拳、敲棒棒、剪刀·石头·布、田忌赛马、 乒乓球团体赛、战争。
模型描述
麦琪
剪发
不剪
卖表 吉姆
不卖
0,0 1,2
2,1 0,0
4/7/2020
魏光兴——重庆交通大学
16
3、最优反应与画线法II
最优反应
给定对方的战略选择,我方的最优战略
画线法
在最优反应战略对应的数字上画线 如果某战略组合都画上了线,那就是纳什均衡。此时,各
方的行为选择都是给定对方战略下的最优选择,每一方都 不能通过单方面的改变行为选择来提高自己的收益。
(s1*
,
s
02完全信息静态博弈-纳什均衡
局中人都存在强优策略,那么,这种由强优策略组成的策 略向量是不是纳什均衡?
* * 纳什均衡 ( s1 ,..., sn )
2.2.3纳什均衡的补充说明
理性自省
每个局中人可能自问他期望的博弈结局将是什 么,某些候选的结局似乎不合理,因为有些局中人可 以比他们正在做的获益更好,也就是说,可能有局中 人没有采用最优反应.当处在纳什均衡的时候,没有 一个人愿意在其他人都选择最优反应的时候犯错误.
2009-6-29 经济与博弈思维 11
1, 3 0, 2 夫 妻 之 争
经济与博弈思维
0, 1 2, 0 2, 1 0, 0 0, 0 1, 3
2009-6-29
12
2.2 纳什均衡
思考
2.2 纳什均衡
纳什均衡的一致预测性质
我们可以从另一个等价的角度定义纳什均衡:它是一个策 略组合以及预测系统,其中每个参与者有一个策略和一个 预测,满足: 给定每个参与者对于其他人策略的预测,她的策略对于自 己是最好的. 每个参与者关于其他人策略的预测是正确的.
' ' '
u i ( s1 ,..., si ..., s n ), i = 1, 2,..., n
博弈(G)分析的目的: 预测博弈的均衡结果,即给定"每个参与人都是理性的" 是共同知识,什么是每个参与人的最优策略(决策)? 什么是所有参与人的最优策略组合(对策)?
囚徒1 囚徒1
坦白 不坦白
-5,-5 -8,0
思考
2009-6-29 经济与博弈思维 13 2009-6-29 经济与博弈思维 14 2009-6-29
-----多重纳什均衡选择 存在:预测不一致 允许博弈方犯错误 -----有限理性博弈
第二章完全信息静态博弈
二、反应函数
前面讨论的两寡头古诺模型中,根据两厂商的 利润最大化条件可以得到两厂商的反应函数 (Reaction Function) :
q
1
R1 (q2 )
1 2
(6 q2 )
q
2
R2 (q1 )
1 2 (6 q1 )
第二十六页,编辑于星期三:十五点 五十五分。
q2 (0,6)
(0,3)
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G { S 1 , ,S n ;u 1 , u n } 中, 如果严格下策反复消去法排除了除 之外 (s1 *,,sn *) 的所有策略组合,那么 (s1 *, ,sn *)一定是该博弈唯一 的纳什均衡。
命题2.2 在n个博弈方的博弈 G { S 1 , ,S n ;u 1 , u n 中},如 果 (s1 *, ,s是n *)G的一个纳什均衡,那么严格下策反 复消去法一定不会将它消去。
古诺寡头模型——产量博弈分析(1)
两厂商的利润函数分别为:
u 1q 1P (Q ) c1 q 1q 1 [8 (q 1 q 2) ]2 q 1 6 q 1 q 1 q 2 q 1 2
u 2 q 2P (Q ) c2 q 2 q 2 [8 (q 1 q 2) ]2 q 2 6 q 2 q 1 q 2 q 2 2
第二章 完全信息静态博弈
基本分析思路和方法 纳什均衡 无限策略博弈分析和反应函数 混合策略和混合策略纳什均衡
第一页,编辑于星期三:十五点 五十五分。
第一节 基本分析思路和方法
上策均衡 ; 严格下策反复消去法; 划线法;
剪头法。
第二页,编辑于星期三:十五点 五十五分。
一、上策均衡
第二章完全信息静态博弈.
a、每一个决策结都是同一参与人i的决策结; b、i知道博弈进入该集合的某个决策结,但不知道自己究竟 处于哪一个决策结(见教材,P141)。如房地产开发博弈I(见 图2.1):A信息集为{大,小},B的信息集为{大}或{小}。 ②完美信息(perfect information):i对任一对手及N的行 动有准确了解,每个信息集都是单结的。(完美信息博弈:博弈 中没有任何两个参与人同时行动并且所有后行动者确切地知道前 行动者选择了什么行动,所有参与人观察到自然的行动)。
③在自然作选择的结上,有自然选择不同枝 的概率。
④有划分每个参与人的结的信息集。
⑤在每一个终点结上都有对每一个参与人的 支付。
博弈树(game tree)
博弈树(game tree)除⑤以外与扩展式都一样。在博弈树中, 扩展式中的⑤点变为:5’在每一个终点结上都有结果。
“博弈树”是一个比“扩展式”更为灵活的术语,如果结果 被定义为支付组合,则两者并无差别。
不开发
(4,4)
(8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1)
(0,0)
图2.1 房地产开发博弈I
(3)信息(information)
结(node):i或N采取行动的时点(决策结),或者 博弈结束的时点。
结x的后续结(successor):已经到达x之后才有可能 在随后的博弈中到达的结,并定义T(x)为x之后的所有结 的集合,t(x)为x的直接后续结。
许多不完全信息博弈都是不对称信息博弈,但这两个概念并 不等价。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2012-11-7
2、智猪博弈III
练习:用重复剔除严格劣战略求以下博弈的纳什均衡
上 下 左 中 右 1,0 1,3 0,1 0,4 0,2 2,0
智猪博弈背后的哲理
小猪角度:自己不能努力,即使努力劳动成果也会被大猪 侵占,所以最优选择是等待,坐享大猪的劳动成果,这称 为搭便车(free-riding)。但是,因为如此,小猪没有权利, 很多时候处于任人宰割的地位。 大猪角度:自己必须努力工作,不得不让小猪分享部分劳 动成果。但也正因为如此,大猪拥有主导权,而这种权利 可以使大猪在利益分配中获得更多的利益。
卖表
不卖
0,0 1,2
魏光兴——重庆交通大学
2,1 0,0
16
2012-11-7
3、最优反应与画线法II
最优反应
给定对方的战略选择,我方的最优战略 在最优反应战略对应的数字上画线 如果某战略组合都画上了线,那就是纳什均衡。此时,各 方的行为选择都是给定对方战略下的最优选择,每一方都 不能通过单方面的改变行为选择来提高自己的收益。 麦琪 剪发 吉姆 不剪 2,1 0,0
2012-11-7
魏光兴——重庆交通大学
20
4、多重均衡与协调II
多重均衡的协调
权威方,比如性别战博弈中,许多家庭习惯于听从某一方 的安排,形成了事实上的权威方。 树立非理性形象,比如在斗鸡博弈或性别战博弈中,以非 理性闻名的一方往往会获得胜利。 协商,比如吉姆可以事先给麦琪发条短信,告诉她卖了表 给她买了梳子。 相关均衡,比如性别战博弈中双方可以通过抛硬币来决定, 现实中交通管制还广泛实施的单双号通行。 聚点均衡,人们会选择习惯的行为,习惯就是聚点。 帕累托占优均衡,如协调博弈。 风险占优均衡,如鹿-兔博弈。
注册会计师 B 隐瞒 实报 注册会计师 A 隐瞒 实报 5,5 -1,6
6,-1
0,0
2012-11-7
魏光兴——重庆交通大学
8
1、囚徒困境与占优均衡VIII
委托-代理(principal-agent)关系中被设计的囚徒困境
压低供应商价格
假设:两供应商成本都为6元/件,报价都为10元/件。 策略:如果二者报价都为10元/件或8.5元/件,则从每家订购 50件;若一家报价10元/件而另一家报价8.5元/件,则从价低 者订购100件。
委托-代理(principal-agent)关系中被设计的囚徒困境
委托-代理关系
通常的含义是委托人请代理人代理某件事情。其中的关键问 题是二者利益不一致,并且委托人不知道代理人是否努力工 作(称为信息不对称),甚至委托人没有办法监督代理人的 工作。为此,需要设计一种制度(system),使代理人在追求自 己利益的同时也最大化委托人的利益,如何设计这样的制度 就是信息经济学(information economics)研究的问题。由于在 经济学中,制度与合同/合约/契约(contract)、机制(mechanism) 等词具有相同含义,信息经济学又称为机制设计理论、合同/ 合约/契约理论。又由于是研究委托代理关系,也称为委托代 理理论。其实质是激励代理人按照委托人的利益行事,还称 为激励理论(Incentive Theory),注意与管理学中激励理论差异。
魏光兴——重庆交通大学 3
纳什均衡
占优均衡
2012-11-7
1、囚徒困境与占优均衡III
思考
攻守同盟是否可行? 个体理性与集体理性之间的矛盾:实现集体利益时才能实 现个人利益,单纯追逐个人利益往往不能实现。 亚当斯密《国富论》中无形之手就是自利的个体理性:我 们的晚餐不是来自屠夫、酿酒的商人或面包师傅的仁慈之 心,而是因为他们对自己的利益特别关注„„每个人都会 尽其所能,运用自己的资本争取最大的利益,一般而言, 他不会有意图为公众服务,也不自知对社会有什么贡献, 他关心的仅仅是自己的安全、自己的利益,但如此一来, 他就好象被一只无形的手引领,在不知不觉中对社会改进 尽力而为„„
一头大猪和一只小猪生活在同一猪圈里,共用一食槽。食 槽的一端有一个开关,猪用嘴一拱,食槽的另一端会掉下 包子。假定按一下会掉下10个包子,而跑去按开关的猪会 耗费3个包子的能量。如果小猪按开关,大猪先吃,等小猪 按完跑过来时,大猪会吃掉8个包子,小猪只能吃到2个; 如果大猪先按开关,按完后跑过来,小猪会吃掉4个包子, 大猪可以吃到6个;如果都不去按开关,就会被一起饿死。 小猪
公鸡2
2012-11-7
魏光兴——重庆交通大学
18
3、最优反应与画线法IV
练习:用画线法求解下列博弈的纳什均衡
复杂例子
C1
R1 4,3
C2 5,1
C3 6,2
R2
R3
2,1
3,0 左 左 右 20,20 0,0
8,4
9,6 右 0,0 5,5
3,6
2,8
协调博弈
2012-11-7
魏光兴——重庆交通大学
供应商 B 8.5 10 供应商 A 8.5 10
2012-11-7
125,125
250,0
0,250
200,200
9
魏光兴——重庆交通大学
1、囚徒困境与占优均衡IX
回顾:博弈论、互动局势与名人名言
博弈论
研究互动局势下的最优行为决策,必须考虑自己的行为对他 人利益的影响,以及他人对自己行为的反应。
17
画线法
卖表
不卖
0,0 1,2
魏光兴——重庆交通大学
2012-11-7
3、最优反应与画线法III
练习:用画线法求解下列博弈的纳什均衡
性别战博弈 韩剧 妻子 韩剧 足球 2,1 0,0
丈夫 足球 0,0 1,2
斗鸡博弈
公鸡1 进攻 后退 后退 进攻 1,1 2,-2 -2,2 -4,-4
如果对任意 i,均有 s * * * * * 称战略组合 ( s 1 , s 2 , , s i 1 , s i , s i 1 , s n* )为博弈G的一个纳什均衡。 也就是说,给定其他人的战略选择,任意局中人都实现了最 大收益,或者不能通过改变自己的战略提高收益。 即,在纳什均衡中,每一个局中人都不能单方面改变自己的 战略来提高收益,从而每一个人都不会再改变战略,是一个 相对静止的状态——因此称为均衡。
19
4、多重均衡与协调I
多重均衡的协调
很多博弈具有多个纳什均衡,比如以上讲到的麦琪的礼物、 性别战、斗鸡博弈与协调博弈等,称为多重均衡。 在某些具有多重均衡的博弈中,各个博弈方偏好于不同的 均衡结果,如麦琪的礼物、性别战和斗鸡博弈;而在另一 些具有多重均衡的博弈中,各个博弈方偏好于同一个均衡 结果,如协调博弈。 那么,博弈方如何使自己偏好的均衡称为实际的均衡结果 呢?这就是多重均衡的协调问题。
2012-11-7
魏光兴——重庆交通大学
7
1、囚徒困境与占优均衡VII
委托-代理(principal-agent)关系中被设计的囚徒困境
预防审计合谋—双头审计
经理与注册会计师之间可能合谋,隐瞒不良信息。 股东解决这一问题的一种做法是双头审计,请两位会计师进 行审计,扣发给隐瞒者的部分报酬,而给坚持如实报告问题 的注册会计师以更多的报酬。
博弈与决策
Game Theory and Decisions
第二章:完全信息静态博弈
Chapter II: Static Game of Complete Information
魏光兴 重庆交通大学管理学院 wgx777@
1、囚徒困境与占优均衡I
囚徒困境(Prisoners’ Dilemma)
2012-11-7
魏光兴——重庆交通大学
5
1、囚徒困境与占优均衡V
如何走出囚徒困境?
可信的(由第三方实施的、据说黑社会中存在的)报复 历史上的 “人质”或“通婚”方案 军队中的(有些企业试图培养的)“忠诚”文化 长期重复关系
2012-11-7
魏光兴——重庆交通大学
6
1、囚徒困境与占优均衡VI
模型描述
按
等 按 4,0 等 3,4
大猪
2012-11-7
8,-1
魏光兴——重庆交通大学
0,0
11
2、智猪博弈II
重复剔除严格劣战略
Iterated Elimination of Strictly Dominated Strategies 在求解纳什均衡过程中,可以剔除局中人的严格劣战略以 简化博弈,因为严格劣战略肯定不会被实施。 注意:一定是剔除“严格”劣战略,因为如果剔除的劣战 略不是严格的,那么有可能剔除纳什均衡。 如果重复剔除严格劣战略之后的战略组合是唯一的,那就 是纳什均衡。 但是,并不是所有纳什均衡都可以通过重复剔除严格劣战 略得到。 小猪 按 等 按 4,0 4,4 大猪 等 8,-1 0,0
魏光兴——重庆交通大学 4
背后哲理
看不见的手
2012-11-7
1、囚徒困境与占优均衡IV
现实中的囚徒困境
屡见不鲜的价格战 铺天盖地的广告战 曾经威胁世界甚至整个人类的军备竞赛 公共资源过度开采/公共品供给短缺 大学扩招、研究生扩招、大学贷款基建 备受批评却日益严重的应试教育 微妙的三角关系 年年都有的评优评先活动 各种资格考试广泛盛行