博弈决策

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

( -1, -1)
演奏家 坦白
囚徒困境(Prisoner’s Dilemma)
坦白
Tchaikovsky
抵赖
( -8, -8)
( 0, -10)
抵赖
( -10, 0)
( -1, -1)
演奏家 坦白
囚徒困境(Prisoner’s Dilemma)
承认
Tchaikovsky
抵赖
( -8, -8)
( 0, -10)
占优战略均衡
含义:一般的,每个参与人的最优 战略选择依赖于所有参与人的战略 选择,但在一些特殊的博弈中,一 个参与人的最优战略可能并不依赖 于其他参与人的战略选择,就是说, 不论其他参与人选择什么战略,他 的最优战略是唯一的,这样的最优 战略被称为“占优战略”,或者 “优势战略”(dominant strategy)
通往城市的道路有甲乙两条 发起攻击的时候,你的兵力超过敌人,你
就获胜;你的兵力比敌人守备兵力少或者 相等,你就失败 请对这场战争的形势进行分析
重复剔除的占优均衡
在存在弱劣战略的情况下,剔除的 顺序会对结果产生影响,这也是重 复剔除占优均衡的缺点之一
并非所有的博弈都存在重复剔除的 占优均衡
请思考:怎么才能避免囚徒困境?即怎么才能达到两个人都抵赖的结 果?
囚徒困境(Prisoner’s Dilemma)
在商业竞争中,经常会遇到囚徒困境,例如垄 断企业的价格选择,或者产量选择,就如实验 1的情况
公共产品的供给也会面临囚徒困境 冷战期间的军备竞赛
占优战略均衡
囚徒困境中,不论同伙选择什么战 略(坦白或者抵赖),坦白对每个 囚徒来说都是最优选择,因此,坦 白无论对哪个囚徒来说都是占优战 略。因此, (坦白,坦白)是囚徒困境博弈中 的占优战略均衡。
市场进入阻挠
此博弈的战略式表述
在位者 默许
重复剔除的占优均衡
定义:战略组合s*称为重复剔除的 占优均衡,如果它是重复剔除劣战 略后剩下的唯一的战略组合。如果 这种唯一的战略组合是存在的,我 们说该博弈是重复剔除占优可解的 (dominated solvable)。
举例:智猪博弈
重复剔除的占优均衡
对如下的博弈:
Column
a
b
抵赖
( -10, 0)
( -1, -1)
囚徒困境(Prisoner’s Dilemma)
结论:
演奏家将会承认
Tchaikovsky呢?
演奏家 坦白
囚徒困境(Prisoner’s Dilemma)
坦白
Tchaikovsky 抵赖
( -8, -8)
( 0, -10)
抵赖
( -10, 0)
( -1, -1)
博弈论及其应用
——完全信息静态博弈
内容提纲
博弈论的战略式表述 囚徒困境与占优战略均衡 智猪博弈与重复剔除的占优均衡 其他博弈与纳什均衡 混合战略纳什均衡 纳什均衡在经济学中的应用 纳什均衡的存在性和多重性
博弈的战略式表述
Normal form representation 战略式表述给出:
重复剔除的占优均衡
智猪博弈中,小猪有一个绝对不能 选的差策略,分析时剔除
问题变得简单
重复剔除的占优均衡
定义:令si’和si”是参与人i可选择的两个战略,即
s' i

Si
,
s" i

Si
,
如果对任意的其他参与人的战略组合s-i,参与人i选择 si‘得到的支付严格小于选择si”得到的支付,即
是0
情侣博弈
此博弈的战略式表述
女孩 足球
男孩
足球
2,1
芭蕾
0,0
芭蕾 0,0 1,2
情侣博弈
分析
男孩
足球 芭蕾
女孩 足球
2,1 0,0
芭蕾 0,0 1,2
情侣博弈
如果男孩选择了足球,则女孩会选择足球 如果女孩选择了芭蕾,则男孩会选择芭蕾 这个例子中有两个纳什均衡 应用:例如产品的供给和需求,企业甲供
a
b
c
a 73,25 57,42
66,32
Row b 80,26 35,12 32,54
c
28,27 63,31
54,29
对横向(row)参与人,b劣于a和c
Column
a
b
c
a 73,25 57,42
66,32
Row b 80,26 35,12 32,54
c
28,27 63,31
54,29
这时,对列向参与人,c劣于b;列向只剩下b战略
54,29
We verify that (c,b) is a Nash Equilibrium by observation: If row plays c, b is the best response for column. If column plays b, c is the best response by row.
应某种产品,作为企业乙的主要原料,有 两种型号A,B,甲倾向于生产A,乙倾向于 使用B,此时就是一个“情侣博弈”
斗鸡博弈
参与者:两个小孩,东尼和吉米 面临的情况:两个孩子被伙伴们鼓动要做一场勇气的
博弈,两人分别从一个独木桥的两端冲向对方,谁先 胆怯退下让路,谁就是小鸡。小鸡代表胆小鬼 行动(策略):退怯,勇进 收益函数
博弈的参与人集合:i , (1,2,, n)
每个参与人的战略空间: Si,i 1,2,, n
每个参与人的支付函数:
ui (s1,,si,,sn ), i 1,2,, n
战略式表述:
G S1,,Sn; u1,, un
博弈的战略式表述
举例:在两寡头的产量博弈里,企业 是参与人,产量是战略空间,利润是 支付;其战略式表述为
equilibrium)
智猪博弈与重复剔除 的占优均衡
智猪博弈 重复剔除的占优均衡
智猪博弈
参与者:一头大猪&一头小猪 面临的状况:食槽在一端,开关按钮在另一
端。每按一次按钮有10个单位猪食进槽,但 按钮者需要付两单位成本。 行动(策略):按,等待 收益函数
若大猪先到,大猪吃9单位,小猪1单位 若同时到,大猪7单位,小猪3单位 若小猪先到,大猪吃6单位,小猪4单位
ui (s'i ,si ) ui (s"i , si ), si
则我们说战略si‘严格劣于战略si”( si‘ is strictly dominated by si”)
重复剔除的占优均衡
定义:战略si’弱劣于战略si”( si’ is weakly d人o的mi战na略te组d b合yss-ii,”),如果对任意的其他参与
两人都坦白,各判刑8年 若演奏家坦白, Tchaikovsky抵赖,则演奏家释
放, Tchaikovsky被判刑10年;反之亦然 两人都抵赖,各判刑1年
演奏家 坦白
囚徒困境(Prisoner’s Dilemma)
坦白
Tchaikovsky
抵赖
( -8, -8)
( 0, -10)
抵赖
( -10, 0)
C1 C2
C3
C4
R1 5,10 0,11 1,20 10,10
R2 4,0 1,1 2,0 20,0 R3 3,2 0,4 4,3 50,1 R4 2,93 0,92 0,91 100, 90
重复剔除的占优均衡
注意:如果是弱劣战略剔除,则均 衡结果会与剔除的顺序有关系,严 格劣战略剔除则不存在这个问题
抵赖
( -10, 0)
( -1, -1)
不管演奏家什么策略, Tchaikovsky 都要坦白
囚徒困境(Prisoner’s Dilemma)
结论:
Tchaikovsky也会承认
二人同时被判刑 8年。承认对两个人来讲都是优势策略,所谓优势策 略,就是不论别人怎么选择,这个策略都会给你带来较好的结果。
c
A 73,25 57,42
66,32
Row B 80,26 35,12 32,54
C 28,27 63,31
54,29
Column
a
b
c
a 73,25 57,42
66,32
Row b 80,26 35,12 32,54
c
28,27 63,31
54,29
对列向(column)参与人,a劣于c
Column
占优战略均衡
定义:si*称为参与人i的严格占优战略,如果对所 有的s-i, si*是i的严格最优选择,即
ui (s*i , si )

ui (s'i ,si ),
s'i

s* i
如果对所有的i, si*是i的占优战略,那么,
s*

(s1*
,,
s* n
)
称为占优战略均衡(dominant-strategy
ui (s'i ,si ) ui (s"i ,si ), si
且存在s-i,严格不等式成立。
重复剔除的占优均衡
重复剔除劣战略的思路:找出某个 参与人的劣战略,把这个劣战略剔 除,构造一个新的博弈(不包含已 剔除的战略);对新的博弈重复上 述过程,直到只剩下唯一的一个战 略组合为止,这个唯一剩下的战略 组合就是这个博弈的均衡解,称为 “重复剔除的占优均衡”。
斗鸡博弈
应用:公共产品的供给; 两军对抗; 商业竞争:占领市场
市场进入阻挠
参与者:垄断企业(在位者),进入者 面临的情况:在位者垄断着某个市场,进入者想要打进
这个市场分一杯羹 行动(策略):在位者:默许,斗争;进入者:进入,
不进入 收益函数
进入者进入,在位者默许,则进入者40,在位者50 进入者不进入,在位者默许,进入者0,在位者300 进入者进入,在位者斗争,则进入者-10,在位者0 进入者不进入,在位者斗争,则进入者0,在位者300
Column
a
b
c
a 73,25 57,42
66,32
Row b 80,26 35,12 32,54
c
28,27 63,31
54,29
列向参与人选b,则对横向参与人,战略c优于a
Column
a
b
c
a 73,25 57,42
66,32
Row b 80,26 35,12 32,54
c
28,27 63,31
要求“理性”是参与人的共同知识
其他博弈与纳什均衡
情侣博弈 斗鸡博弈 市场进入阻挠 纳什均衡
情侣博弈
参与者:一对恋人 面临的情况:安排本周末的活动,两人的
爱好不同,男孩喜欢看足球比赛,女孩想 去看芭蕾舞 行动(策略):足球,芭蕾 收益函数
两人一起看足球赛,则男孩效用2,女孩1 两人一起看芭蕾舞,则男孩效用1,女孩2 如果两人各自去做自己喜欢的事,则效用都
演奏家 坦白
囚徒困境(Prisoner’s Dilemma)
坦白
Tchaikovsky 抵赖
( -8, -8)
( 0, -10)
抵赖
( -10, 0)
( -1, -1)
演奏家 坦白
囚徒困境(Prisoner’s Dilemma)
坦白
Tchaikovsky 抵赖
( -8, -8)
( 0, -10)
重复剔除的占优均衡
弱劣剔除的顺序问题
参与人B
C1
C2
C3
R1 2,12
1,10
1,12
参与人A
R2 0,12
0,10
0,11
R3 0,12
0,10
0,13
重复剔除的占优均衡
诺曼底登陆模拟
分小组讨论 题目:
给你两个师的兵力,任务是攻克敌人占拒 的一座城市;敌军的守备力量是三个师, 双方的兵力只能整师调动
G q1 0, q2 0;1(q1,q2 ),2 (q1,q2 )
囚徒困境与占优战略 均衡
囚徒困境 占优战略均衡
囚徒困境(Prisoner’s Dilemma)
参与者:演奏家和“Tchaikovsky” 面临的情况:被抓,被审讯 行动(策略):坦白,抵赖 Leabharlann Baidu益函数
吉米退,东尼进,则吉米得益2,东尼4 吉米进,东尼退,则吉米得益4,东尼2 二人同时进,则二人得益都为0 二人同时退,则二人得益都为3
斗鸡博弈
此博弈的战略式表述
东尼 退怯
吉米
退怯
3,3
勇进
4,2
勇进 2,4 0,0
斗鸡博弈
分析
吉米
退怯 勇进
东尼 退怯
3,3 4,2
勇进 2,4 0,0
智猪博弈
此博弈的战略式表述(不管大猪采用什么行动, 小猪都该等待)
小猪

等待
大猪 按
5,1
4,4
等待
9,-1
0,0
智猪博弈
应用:公共产品的供给;新技术、新产品 的研发等
重复剔除的占优均衡
如果无法一下看出均衡在哪里,怎 么办?
在某些情况下,我们可以用重复剔 除劣战略的方法寻找,类似于我们 做选择题时的排除法。我不知道哪 个对,但是我知道哪个一定不对, 剔除不对的,剩下的就是对的。不 过,这个排除法有特别之处,其特 别之处在于它是两两相比的。
相关文档
最新文档