4 博弈分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈的扩展式
也称博弈的展开式 把一个有n个参与者的博弈用一株有根的树来 表示,根表示选择的始点,是最初的决策结点, 从根出发,参与者顺次做出决定,每一个选择 形成一个方案枝,直到博弈结束。每一条从根 出发到达终结点的路线都是一个参与者方案的 排列组合,对应一个含各参与者的收益集合。 扩展式表达形成了一个有始点、定向无循环的 树型图,因而也被称为博弈树。
C
收益:(囚徒甲,囚徒 乙)
-5 -5
0 -8
-8 0
-1 -1
1 L R
c1c2
2
参与者2 c1d d 1 c2 (2,1) (3,3)
2
d1d2 (4,2) (3,3)
2
c1 2 1 d1 4 2 c2 5 2
d2 3 3
参与者 L 1 R
(2,1) (5,2)
(4,2) (5,2)
例:A、B玩游戏报数,从1至10,每次报1个 或2个数,报30的输。试试看,写出其扩展型。
小蜈蚣博弈
假设有两个参与者1,2。可选行动为C-进行 游戏,D-终止游戏。扩展式博弈如下。
1
D
(1,0)
C D
2 C
1
D C 2 C D D 1 C 2 C
(1,0) C D √ ∥2(-1,3)
1 (1,0) D C
(-1,3)
(2,1)
√ ∥(2,1) 1 D C (3,2) D √ ∥2(0,4) (-1,3) C (1,5) D 1 (2,1) √ ∥ (3,2) C D √ ∥2 (1,5) (0,4) C D √ ∥ (4,3) (3,2)
(0,4) (1,5)
(
小蜈蚣博弈有唯一的完美均衡:参与者1一开始就选择D结束 游戏。否则,是参与者2选择D结束游戏···。即每一个参与者 ··· 都选择D结束游戏。
试分析下图扩展式博弈的子博弈完美均衡。
1 C 2 F
(4,0)
D 2
E 2 J
K
G
H
L
(1,3)
(1,0)(1,1) (2,1) (2,2)
纳什均衡
对于一个策略组合,如果保持其他参与者的策略不变, 而任意一个参与者的策略都是最优的,那么该策略组 合就是纳什均衡。 纳什均衡是判断一个策略组合是否为均衡的充要条件。 严格优策略均衡一定是纳什均衡,重复剔除严格劣策 略所得到的均衡解也一定是纳什均衡,但纳什均衡不 一定是严格优策略均衡和重复剔除严格劣策略的均衡 解。因而,一个可以用策略式表达的完全信息静态博 弈可以用求严格优策略均衡解或重复剔除严格劣策略、 划线法、箭头法等方法进行求解。
重复剔除严格劣策略均衡解(IEDS)
在博弈中,如果参与者i有两个可行策略si',si",对 于任意其他参与者的策略组合,有 ui(s1,·· ·,si‘,·· >ui(s1,·· si“,·· ·,sn) ·, ·,sn)成立,则si” 就称为相对于策略si’的严格劣策略。即参与者i的策 略si“的收益总是劣于策略 si‘的收益,则称si”为参 与者i的严格劣策略。 性的博弈参与者绝不会选择严格劣策略,因而,可以 通过不断剔除博弈参与者的严格劣策略得到博弈的均 衡解。这种方法称为重复剔除严格劣策略均衡解 (Iterative Elimination of Dominated Strategy)的方 法。
例,囚徒困境可以表达为: G={S1,S2;U1,U2},
– –
–
(1)参与者集合。N={1,2};表示有两个参与者:囚徒1和 2; (2)行动集合。S1={s11,s12},S2={s21,s22};分别表示囚徒 1有两个可选行动:坦白,抵赖;囚徒2有两个可选行动:坦 白,抵赖; (3)收益函数。U1(s11,s21)=-5,u1(s11,s22)=0, u1(s12,s21)=-8,u1(s12,s22)=-1;u2(s11,s21)=-5,u2 (s11,s22)=-8,u2 (s12,s21)=0,u2(s12,s22)=-1。故U1= (-5,0,-8,-1),U2=(-5,0,-8,-1)。
简单博弈分析方法
严格占优策略均衡解 重复剔除严格劣策略均衡解 划线法 箭头法
严格占优策略均衡解(Dominant-strategy Equilibrium)
在博弈中,如果在其他参与者任意的策略组合 下,参与者i存在一个策略si*,使得对于任意 的si∈Si,si*≠si,均有i的收益 ui(s1,·· ·,sn)>ui(s1,·· ·,sn)成立, ·,si*,·· ·,si,·· 则称为si*参与者i的严格占优策略。严格优策 略是在其他参与者任意策略组合下,参与者i 优于其它策略收益的策略。
上 参与者A 下
参与者B 左 中 右 (1,0) (1,2) (0,1) (0,3) (0,1) (2,1)
左 中 右
收益:(参与者A,参与者B)
上 (1 ,0) (1,2) (0,1) 下 (0,3) (0,1) (2,0)
箭头法
箭头法是以博弈各参与者在追求个人收益最大化过程中不断调整 行动、最终达到一个相对稳定状态的过程为基础提出的求解博弈 均衡的方法。 选取博弈中的任一个策略组合、任一参与者作为始点进行分析, 考察在该策略组合处参与者能否通过单独改变自己的策略而增加 收益。如能,则从所分析的策略组合对应的收益组合引一箭头到 改变策略后策略组合对应的得益组合;在此收益组合下,分析其 他参与者能否通过改变策略增加收益,如能,则以箭头导向新的 组合,·· ·,直至各个参与者不能通过单方改变策略获得更多收益 为止。此时,只有指向的箭头而没有指离的箭头的收益组合对应 的策略组合即为博弈的均衡解。
囚徒乙 坦白 抵赖
囚 坦白 徒 甲 抵赖
-5,-5 -8,0
0,-8 -1,-1
收益:(囚徒Baidu Nhomakorabea,囚徒乙)
当博弈有两个以上的参与者时,博弈的策略式可以用 参与者、策略、收益来表达:
– – –
–
G={S1,S2,· ,Sn:U1,U2,· Un},或简写为G={S,U},其中, · · · · (1)参与者集合。用N={1,2,· ,n}来表示有n个参与者; · · (2)行动集合。用Si={sij}来表示第i个参与者的行动集合, 其中sij表示第i个参与者的第j个行动; (3)收益函数。用Ui={sij,spm},i=1,2,·· ·,n,j=1,2,·· ·m, 表示对应于博弈参与者i的某一行动sij与其它参与者p的m个可 选行动组合下参与者i的收益。
后退归纳法的求解步骤
第一步,从扩展式博弈的终点开始,找到该博弈的每一个最后子 博弈,然后求出每个子博弈的纳什均衡,并计算出相应的收益; 第二步,将每一个最后子博弈的起点变成结束点,将计算出的每 一个最后子博弈在纳什均衡下的收益写在其下方,得到的新的扩 展式博弈。这个新的扩展式博弈被称为压缩的扩展式博弈。经过 一次压缩,就剔除了最后子博弈; 第三步,重复第一步和第二步,则会得到一个无法再压缩的博弈, 求出相应的纳什均衡。则在逆推过程中找到的一系列子博弈的纳 什均衡组合就是该动态扩展式博弈的一个完美均衡。 第四步,如果在逆推过程中没有遇到多重均衡,那么这个策略组 合就是唯一的完美均衡;如果遇到了多重均衡,就需要对子博弈 中的每一个可能的均衡重复以上步骤,从而得出所有的完美均衡
复杂博弈的分析
严格占优策略均衡解、重复剔除严格劣策略均 衡解、划线法、箭头法以及后退归纳法用于分 析一些简单的博弈。对于复杂的博弈,需要进 行转化后再分析博弈的均衡。
完全信息静态博弈
完全信息静态博弈是博弈论中最简单的博弈类 型,也是博弈论最早研究的一种模型,是博弈 论产生和发展的基础。1950年约翰· 纳什基于 二人零和博弈,用数学的方法证明了非合作博 弈中均衡解的存在,即纳什均衡。纳什均衡是 完全信息静态博弈的均衡解。
逐步剔除严格劣策略均衡(IEDS)
严格劣策略:如果参与者i的策略si’所带来的收益 总少于其他任何策略,则称si’为严格劣策略。 IEDS过程:参与者1知道参与者2是理性的,将不 选择严格劣策略,故先划去对2来说的严格劣策略; 再分析并找出自己的严格劣策略,划去;…直至 找出逐步剔除严格劣策略均衡解。 重复剔除严格劣策略求均衡解的方法不能运用到 弱劣策略中
第四章 博弈分析方法
博弈分析的目的
找出博弈的均衡解,以促使博弈各方导向更优 的决策 博弈分析包括:
– –
–
一,博弈的表达 二,基本的博弈分析方法 三,复杂博弈的转化及分析
博弈的表达
策略式:常用于表示静态博弈 扩展式:常用于表示动态博弈 两种表达方式具有等价性
博弈的策略式
博弈的“标准式”,也称正则式或矩阵式 例,
假设投票成本为0,自己喜欢的候选人获胜收 益为v>0,自己不喜欢的候选人获胜收益为0。 则:博弈的基本式G={S,u}为:
– – –
参与者集合:N={1,2,·· ·,k},k=2n+1,n为自然 数; 行动集合:Si={A,B},i∈N; 收益函数:自己喜欢的人获胜,ui=v>0;自己不喜 欢的人获胜,ui=0。
在完全信息静态博弈中,如果参与者的策略选 择是离散的,则称为离散型策略博弈;如果参 与者的策略是连续的,则称为连续型策略博弈。
离散型策略的博弈分析
在完全信息静态博弈中,参与者的策略选择是 离散的、并且不能用策略式表达的多人博弈或 复杂博弈,可以通过穷举法,穷举策略组合, 并用纳什均衡的定义来判定其均衡 例,在某个人数为奇数的乡村,村民要投票选 举该村的村长,每人一票,获得多数选票的候 选人获得村长职务。村长候选人有两位:A和 B。分析该博弈的均衡。
如果我们通过这样的过程求得惟一的策略组合, 则这个策略组合为逐步剔除严格劣策略均衡, 并称博弈是逐步剔除严格劣策略可解的。 试分析: 参与者2
左
上 1,0 0,3
中
1,2 0,1
右
0,1 2,0
参与者1
下
收益:(参与者1,参与者2)
左 上 参与者1 下
上 参与者1 下
参与者2 中
右
1,0 0,3
1
L 2
c1 2 1 d1 4 2 c2 5 2
R 2
d2 3 3
策略式与扩展式描述的等价性
每一个扩展式博弈都可以用策略式来表达,而 每一个策略式博弈也可以表达成扩展式
囚徒乙 坦白 抵赖 囚 坦白 徒 甲 抵赖 -5,-5 -8,0 0,-8 -1,-1 囚徒2 C
C
囚徒1 S 囚徒2 S
S
在一个博弈中,如果每个参与者都有严格占优策略, 则由严格占优策略组成的策略组合一定是该博弈的唯 一均衡解,称为该博弈的严格占优策略均衡解 囚徒乙 坦白 抵赖 例,
囚 坦白 徒 甲 抵赖 -5,-5 -8,0 0,-8 -1,-1 收益:(囚徒甲,囚徒乙)
对于囚徒甲,对应于囚徒乙的坦白与抵赖选择,坦白 时的收益为-5,0,抵赖时的收益为-8,-1。因而 无论对方的选择是什么,坦白总是优于抵赖,坦白是 囚徒甲的严格占优策略。对囚徒乙也是如此。因而, (坦白,坦白)就是囚徒困境的严格占优策略解。
左
1,2 0,1
参与者2
0,1 2,0
中
1,0 0,3
1,2 0,1
参与者2中 参与者1上 中
左 参与者1上
参与者2
1,2
1,0
1,2
划线法
博弈参与者之间的策略具有相互依存性,但策 略之间不一定会出现严格优或严格劣策略,可 能只是相对优劣关系。而划线法是一种通过分 析博弈中的相对较优策略,找出对各博弈参与 方来说均相对较优的策略组合的方法。
囚徒乙 坦白 囚 坦白 徒 甲 抵赖 (-5 ,-5) (-8,0) 抵赖 (0,-8) (-1,-1)
收益:(囚徒甲,囚徒乙)
后退归纳法
后退归纳法(backward induction),又称逆 推法,是求解用扩展式表达的有限多次动态博 弈均衡的方法
子历史与子博弈
历史:动态博弈中,所有从开始到结束的行动 序列称为全历史,全历史的子集构成子历史, 博弈开始前的历史定义为一个空历史 子博弈:从一个行动选择开始至给定的“历史” 构成的博弈。子博弈是原博弈的一部分,但子 博弈本身又是一个完整的博弈
囚徒1 招供
囚徒2 招供 沉默
沉默
囚徒2 沉默
招供
该博弈存在着四个全历史:(招供,招供) (招供,沉默)(沉默,招供)(沉默,沉 默)。而(招供,招供)这个全历史有三个子 历史:空历史,(招供),(招供,招供)。
1 L R
2
c1 2 1 d1 4 2 c2 5 2
2
d2 3 3
博弈有三个子博弈:历史L后为一个子博弈, 历史R后为一个子博弈,整个博弈(即空历史 后)为一个子博弈