互动博弈论——博弈论平话 2

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

小猪
等待
3x+6(1-x)
E [7x+4(1-x)]y + [3x+6(1-x)](1-y) E
E x
6-3x-2y+6xy
令 E x
E y
3 6 y
3 6 y 0 则得到 y 1 / 2
E y
2 6 x

2 6 x 0 则得到 x 1 / 3
求解方法: 1 占优策略均衡; 2 严格劣策略的重复剔除; 对比 3 纳什均衡(划线法); 4 箭头法。
两人有限零和对策问题的求解方法 1)安全第一方法 2)优超法 3)2×2对策的公式法 4)2×m或n×2对策的图解法 5)迭代法 6)线性规划法(基本方法)
囚徒2
智猪博弈
抵赖 按
小猪
等待
4,4 0,0
局中人II的策略
e
f
g a b c d
A
6 3 9 -3
1 -8 2 4 -1 -10 0 6
局 中 人 I 的 策 略
14
矩阵对策的均衡局势(f,b)
局中人II的策略
e
f
g a b c d
A
6 3 9 -3
1 -8 2 4 -1 -10 0 6
局 中 人 I 的 策 略
15
规律:如有
max min a ij min max a ij a i
1 2
11
案例:
乙企业战略 1 甲企 战略 1 2 3 10 12 6 2 -1 10 8 3 3 -5 5
甲乙企业生产同一种电子产品,两企业均线通过改进管理获取更多的市 场销售份额。其中:
甲企业中的战略1代表降低产品价格;2 提高产品质量;3 推出新产品 乙企业中的战略1代表增加广告费用;2 增加位球王点;3 改进产品性能。
1 1 3 1 -1 1
1 1 1 3 1 -1
1 -1 1 1 3 1
-1 1 1 1 1 3
A没有鞍点,只有最优混合策略: X*=(1/6,1/6,1/6,1/6,1/6,1/6) y*=(1/6,1/6, 1/6,1/6,1/6,1/6) 对策的值(对齐王而言):1
意义:当矩阵对策不存在鞍点时,竞争双方在开局前 均应对自己的策略加以保密,否则不保密的一方要吃亏。
假设市场份额一定,由于策略措施不同,通过预测,两企业市场占有分 析变动情况如上表所示。
12
求解方法之一:最小最大法——安全第一法
乙企业战略 1 甲企 战略 1 2 3 10 12 6 12 2 -1 10 8 10 3 3 -5 5 5 -1 -5 5 5
最小值
最大值
13
设有一矩阵对策,求均衡局势(对策)
求解方法: 1 占优策略均衡; 2 严格劣策略的重复剔除;
对比:
两人有限零和对策问题的求解方法
3 纳什均衡(基本方法);
4 箭头法。
1)安全第一方法 2)优超法 3)2×2对策的公式法 4)2×m或n×2对策的图解法 5)迭代法 6)线性规划法(基本方法)
几个经典模型:
囚徒困境
坦白
囚徒1 坦白 -5,-5 -8,0
0,-8 -1,-1
大 猪
按 等待
5,-1 9,-1
抵赖
性别战
足球 男 足球 芭蕾 2,1 0,0
女 芭蕾
斗鸡博弈
进 0,0 1,2 A 进 退 -3,-3
B 退 2,0
0,2
0,0
29
纳什均衡
1、占优策略均衡。一般来说,由于每个参 与人的得益是博弈中所有参与人的策略的函数, 因此每个参与人的最优策略选择依赖于所有其他 参与人的策略选择。但在一些特殊的博弈中,一 个参与人的最优策略可能可以不依赖于其他参与 人的策略选择,就是说,不论其他参与人选择什 么策略,他的最优策略是 唯一的,这样的最优 策略被称为“占优策略”。 如果一个博弈中,某个参与人有占优策略, 那么该参与人的其他可选择策略就被称为“劣策 略”。
A
18
案例:
乙企业战略 1 甲 企 战 略
最大 值
最小值
乙企业战略 1 2 -1 10 8 10 3 3 -5 11 11
最小值
2 -1 10 8 10
3 3 -5 5 5 -1 -5 5 5 甲企 战略 1 2 3
1 2 3
10 12 6 12
10 12 6 12
-1 -5 6 无鞍点
最大 值
S S 1 S 2 ... S n
Hi(s),如齐王与田纪赛马H齐王(s )=3; H田纪(s )=-3
11 11
***局中人、策略与赢得函数(支付函数)确定后,一个对策模型即确定。 对于两人有限零和对策,局中人I的赢得矩阵与局中人II的赢得矩阵相反。 矩阵对策常被记为:G={I,II;S ,S ;A}
max* min * E ( x , y ) min *x max* E ( x , y )
x S 1 y S 2
y S 2
x S 1
使上式成立的(x*,y*)为G在混合策略意义下的解。 x*与y*为局中 人的最优混合策略。
20
(鞍点不存在时) 求解两人有限零和对策问题的方法之二——优超法
4 0 3 6 0
0 2 9 8 8
3 0来自百度文库5 9 5 9 7 6 8 3
25
解:用优超法化简
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
X 1-X
3 0 5 9 5 9 7 6 8 3
A
7 3 4 6
y
1-y
26
E
X
1-x
7 4
3 6
y 1-y y 1-y
E
7x+4(1-x)
23
求解矩阵对策的其他方法
——2×2对策的公式法 ——2×m或n×2对策的图解法 ——迭代法 ——线性规划法(基本方法)
总思路: 首先判断是否存在鞍点,当鞍点不存在时,利用优超原则 与方法将原对策的赢得矩阵尽量简化,然后再利用其他方法进 行求解。
24
作业2:
利用优超法求解下列矩阵对策
A
3 5 7 4 6
解得X3*=1/3,X4*=2/3 y1*=1/2,y2*=1/2 则原对策矩阵的一个解是: X*=(0,0,1/3,2/3,0) y*=(1/2,1/2,0,0,0) 期望赢得值为5
22
思考:混合战略的现实意义?
齐王与田纪赛马博弈的混合均衡
齐王的赢得矩阵:
3 1 1 3 A 1 -1 -1 1 1 1 1 1
30
在一个博弈里,如果所有参与人都有占优策略
存在,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。
31
完全信息静态博弈
例1:囚徒困境 (prisoner’s dilemma)
囚徒2
坦白 -5,-5 -8,0 抵赖 0,-8 -1,-1
囚徒1
坦白 抵赖
思考求解方法的差异:
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
3 0 5 9 5 9 7 5.5 8 3
A
7 3 4 6
21
E
X 1-x 7x+4(1-x)
7 4
3 6
y 1-y y 1-y
E
3x+6(1-x)
E [7x+4(1-x)]y + [3x+6(1-x)](1-y) E
E x
互动决策论---博弈论平话 马小琪
黑龙江大学信息管理学院
1
博弈分析前要明确的几个问题
1 博弈视角?
(局中人还是局外人)
2 如何进行博弈分析?
(除了确定博弈要素之外还需要博弈分析方法)
3 博弈分析的难点? (对现实的贴近描述→分析的框架的作用) 4 均衡的现实含义?
(均衡与均衡结果的差异)
5 博弈分析是否能够完全预测博弈结果?
进 不进 (0,400) 在位者 在位者 (0,300) 打击 打击 (40,50) (30,80) (-10,100) (-10,0) 7
[1-P] 进
策(战)略式的表述:
1 、 博 弈 的 参 与 人 集 合 : i∈Γ , Γ=(1,2,…, n); 2、每个参与人的战略空间:Si i = 1,2,3,…,n; 3、每个参与人的得益函数:ui(s1, …, si…,sn),i=1,2,3, …,n。 用G={S1,…,Sn;u1, …,un}代表战 略式表述博弈。
原因:局中人乙选择了策略2,使局中人甲得到了更多的赢得(8-(-1)(11-6)=4),所以对乙来说,策略2不是最优策略。 此时,双方的策略是局中人甲与乙策略集中的一个概率分布,即混和策略 (纯策略是混合策略的特例)。混合策略的采用是使双方得到的期望效用相同。
19
称G*={S1*,S2*,E}为对策G的混合扩充。E(x,y)=xTAy,此时的 博弈均衡局势是使
6-3x-2y+6xy
令 E x 3 6 y 0 则得到 y 1 / 2
3 6 y
E y
2 6 x

E y
2 6 x 0 则得到 x 1 / 3
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
3 0 5 9 5 9 7 5.5 8 3
i j i j * * j
则称使之成立的纯局势(ai*, bi* )为纯策略下的平衡 局势(或解), ai*与 bi*分别为局中人I与II的纯策略。
含义:既是所在行的最小值,又是所在列的最大值。且 (ai*, bi* )为鞍点。
16
案例:
A
6 1 8 0 5 4 5 2 6 5 2 -1 7 5 6 2
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
3 5 5 7 8
0 9 9 6 3
解得X3*=1/3,X4*=2/3 y1*=1/2,y2*=1/2
则原对策矩阵的一个解是: X*=(0,0,1/3,2/3,0) y*=(1/2,1/2,0,0,0) 期望赢得值为5
27
二 两人有限变和对策问题的求解
5
策略式表达又称为标准式表达,在这种表 达中,所有参人同时选择自己的策略,所有参 与人选择的策略一起决定每个参与人的得益。 值得强调的是,这里参与人同时选择的是 “策略”,而不是“行动”。 在静态博弈中,由于参与人只选择一次,所 以策略就等同于行动。而在动态博弈中,策略 是参与人在各个阶段的行动的全面计划。
(安全第一方法、优超法及其他解法)
两人有限零和对策——矩阵对策
1)局中人i,i∈I,I={1,2,…,n} S 1 1 , 2 ,..., m 2)策略S,Si 如(上中下),(上下中),(中上下)等 S 2 1 , 2 ,..., n … 3)赢得函数局势:局势 s s1 , s 2 ,..., s n 如s11= 1 , 1 ,s12 = 1 , 2 等 全部集合局势:
最小最大法(安全第一法)与优超法在有限非零和博弈中的适用性?
32
对比:鞍点不存在时,求解两人有限零和对策问 题的方法之二—优超法
A
3 5 7 4 6
2 0 3 6 0
0 2 9 8 8
3 0 5 9 5 9 7 5.5 8 3
A
7 3 4 6
33
无占优策略均衡 的经典博弈模型
智猪博弈

大 猪 按 等待
6
2 博弈的策略式表达
在博弈论中,一个博弈可以用两种不同的方式来表达: 一种是策略式表达:另一种是扩展式表达.策略式表达更适 合于静态博弈,而扩展式表达更适合于讨论动态博弈。
策略式表达 的矩阵形式 男 足球 芭蕾 女 足球 2,1 0,0 芭蕾 0,0 1,2 [P] 不进 N 扩展式表达 的决策树形式
8
3
博弈的得益矩阵表示
一个博弈被称为有限博弈,如果:
第一,参与人的个数是有限的;
第二,每个参人可选择的策略个数是有限的。
有限博弈的策略式表达及其求解可以用得益矩阵直观地给出。
9
第二讲 完全信息静态博弈
序 一 二 基本概念简介 两人有限零和对策问题的解法 两人有限变和对策问题的解法
10
一 两人有限零和对策问题的求解
2
第二部分 完全信息静态博弈
序 一 二 基本概念简介 两人有限零和对策问题的解法 两人有限变和对策问题的解法
3
序 基本概念:
1 完全信息静态博弈的定义? 2 博弈的策略式表达 ? 3 博弈的得益矩阵表示 ?
(博弈现象、博弈思想、博弈理论、博弈模型、博弈应用)
4
1
完全信息静态博弈
定义 所谓完全信息静态博弈指的是各博弈方同 时决策,或者决策行动虽有先后,但后行动者 不知道先行动者的具体行动是什么且各博弈方 对博弈中各种策略组合情况下所有参与人相应 的得益都完全了解的博弈。
当解不唯一时,解之间的关系有两个性质: 1)无差别性; 2)可交换性。
此时,局中人可以不依赖于其他人的纯策略,而 选择构成解的最优策略。
17
作业1:求解下列矩阵对策
9 6 2 5 3 9 3 5 4 6 2 6 1 4 3 2 3 4 8 0 6 7 3 8 2 1 5 4 8 8 0 4 2 1 2 4
相关文档
最新文档