2019-2020年人教统编《运筹学教程》胡云权第五版运筹学--6对策论--矩阵对策幻灯片
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如
果
max i
min j
Baidu Nhomakorabea
aij
min j
max i
aij
ai* j*
成立,记 VG
ai* j*
,则
称VG ai* j* 为矩阵对策 G 的值.
相应的纯局势 (i* , j* ) 为 G 在纯策略下的解,i* 与 j*
分别称为局中人Ⅰ与Ⅱ的最优纯策略。 从上例看出,矩阵A中平衡局势(α2 ,β2)对应
矩阵对策的策略
纯策略:确定的选择某策略 混合策略:以某一概率分布选择各策略。
矩阵对策的纯策略
1、矩阵对策的一般表达
设用Ⅰ、Ⅱ分别表示两局中人,Ⅰ有 m 个纯策略
1,2 ,,m ,Ⅱ有 n 个纯策略 1, 2 ,, n ,则
Ⅰ的策略集为: S1 {1,2 , i , ,m},
a11 a12 a1n
记
A
a21
a22
a2n
am1
am2
amn
Ⅰ的赢得矩阵 或Ⅱ的支付矩阵
Ⅱ的赢得矩阵为-A 。
矩阵对策的纯策略
1、矩阵对策的一般表达
如果局中人Ⅰ、Ⅱ的策略集为 S1, S2 ,局中人Ⅰ的赢得矩阵
为 A,则矩阵对策的模型为
G {, ; S1, S2; A} 或 G {S1, S2; A}
1 1 1 1 1 3
矩阵对策的纯策略
2、矩阵对策解的引例
例: 设 G {S1, S2; A} ,
其中 S1 {1,2,3,4} , S2 {1, 2, 3},
6
A
3
9
3
1 2 1 0
8 -8
4
2
10 -
6
10
Ⅱ的策略集为: S2 {1, 2 , j , , n} 。
当Ⅰ、Ⅱ分别选择纯策略i , j 时,形成了一个纯局势
(i , j ) S S1 S2 ,则对任一 (i , j ) S ,记Ⅰ的赢得 值为 ai j ,即Ⅱ赢得值为 ai j (i 1,2,, m; j 1,2,, n) .
9 2 6 -3
理智行为:从各自最不利情形中选择最有利 I:最大最小原则 II:最小最大原则
平衡局势:双方均可接受,且对双方都是最稳妥的结果。 (α2 ,β2),局中人I和II的最优纯策略。
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定义 1:设 G {S1, S2; A}为矩阵对策,其中
S1 {1,2 ,,m} , S2 {1, 2 ,, n}, A {aij }mn ,
为3, 1分别是局中人Ⅰ、Ⅱ的最优纯策略。
事实:对策 G 的值VG ai* j* 是 A a 中 i* j* 所在的行的最小
元素,又是所在列的最大元素,即
a ij
*
ai* j*
ai* j 。
矩阵对策的纯策略
4、矩阵对策的鞍点与解
对于一个对策G={S1, S2, A}, 若
有
max i
j
1,2,, n
均有
a ij
*
ai* j*
ai* j
2 7 2 1 1
例: G {S1, S2; A},其中 A 2
3
2 5
3 4
4 2 4 3
2 2 1 6 1
3746
由
max i
min j
aij
min j
max i
aij
a31
3 则VG
3 ,G 的解
6 5 6 5
A 1 4 2 1 8 5 7 5
0 2 6
2
局势(α1, β2),(α1, β4),(α3, β2)(α3, β4) 均构成鞍点,此对策有多个解。
矩阵对策的纯策略
5、矩阵对策纯策略的性质 性质1:无差别性
若(αi1 ,βj1)和(αi2,βj2)是对策G的两个 解,则
ai1j1 = ai2j2
性质2:可交换性
若(αi1 ,βj1)和(αi2,βj2)是对策G的两个解,则 (αi1 ,βj2)和(αi2,βj1)也是对策G的两个解。
min j
aij
min j
max i
aij
ai* j*
则称局势(αi*, βj*)为对策G的
鞍点,V = a i*j*为对策G的值。
注:在矩阵中,一个数在所在行中是最大值,在所 在列中是最小值,则被称为鞍点。
矩阵对策的纯策略
4、矩阵对策的鞍点与解 多鞍点与无鞍点对策 例: 设有一矩阵对策如下,求它的解。
矩阵对策的基本理论
对策/博弈分类
局中人个数:二个,多个 策略集中的个数:有限,无限 支付/赢得代数和:零和,非零和 局中人是否合作:非合作,合作 局中人行动时间:静态,动态 局中人对他者信息了解程度:完全信息,非完全信息 对策次数:单次,重复
课程目标
理解并掌握矩阵对策的纯策略 理解并掌握矩阵对策的混合策略 掌握矩阵对策的求解方法
第六章 对策论
基本概念
对策论又称博弈论,研究冲突对抗条件下最优决策问题
的理论。
策略形势:不完全竞争条件下的对抗行为,各方收益由
自身行为和其他方行为共同决定。
基本要素
局中人(I ):有权决定自己行动方案的对策参加者,理性人
策略集(S ):供局中人选择的实际可行完整行动方案的集合,
略的集合,称局势
例:田忌赛马
局中人:田忌(I)、齐王(II)
S1 ={(上、中、下),(上、下、中),(中、上、下),
(中、下、上),(下、中、上),(下、上、中)}=
S2 3 1 1 1 1 1
1
3
1
1
1
1
1 1 3 1 1 1
A 1 1
1
3
1
1
1 1 1 1 3 1
的元素a22既是其所在行的最小元素,也是其所在列的最大
元素,即有 ai2≤a22 ≤ a2j i=1,2,3,4 j=1,2,3
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定理 1: 矩阵对策 G {S1, S2; A}在纯策略意义下有解的充要条
件是:存在纯局势
( i
*
,
j*
)
使得对一切
i
1,2,, m;
一局对策中,各局中人选定策
严 格赢数 得占函优数策(略H/(严s)格)劣:对势于策任一略局势,局中人的赢得值。支付函
上策均衡/纳什均衡
典型案例和重要结论
囚徒困境 智猪博弈 结论1:不要选择严格劣势策略。 结论2:个人理性选择导致非最优。 结论3:学会换位思考。 求解方法:删除严格劣势策略