2019-2020年人教统编《运筹学教程》胡云权第五版运筹学--6对策论--矩阵对策幻灯片

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

如
果
max i
min j
Baidu Nhomakorabea
aij

min j
max i
aij

ai* j*
成立，记 VG
ai* j*
，则
称VG ai* j* 为矩阵对策 G 的值.
相应的纯局势 (i* , j* ) 为 G 在纯策略下的解，i* 与 j*
分别称为局中人Ⅰ与Ⅱ的最优纯策略。从上例看出，矩阵A中平衡局势（α2 ，β2）对应
矩阵对策的策略
纯策略：确定的选择某策略混合策略：以某一概率分布选择各策略。
矩阵对策的纯策略
1、矩阵对策的一般表达
设用Ⅰ、Ⅱ分别表示两局中人，Ⅰ有 m 个纯策略
1,2 ,,m ，Ⅱ有 n 个纯策略 1, 2 ,, n ，则
Ⅰ的策略集为： S1 {1,2 , i , ,m}，
a11 a12 a1n
记
A

a21
a22

a2n

am1
am2

amn

Ⅰ的赢得矩阵或Ⅱ的支付矩阵
Ⅱ的赢得矩阵为-A 。
矩阵对策的纯策略
1、矩阵对策的一般表达
如果局中人Ⅰ、Ⅱ的策略集为 S1, S2 ，局中人Ⅰ的赢得矩阵
为 A，则矩阵对策的模型为
G {, ; S1, S2; A} 或 G {S1, S2; A}

1 1 1 1 1 3
矩阵对策的纯策略
2、矩阵对策解的引例
例：设 G {S1, S2; A} ，
其中 S1 {1,2,3,4} ， S2 {1, 2, 3}，
6
A

3
9
3
1 2 1 0
8 -8
4

2
10 -
6

10
Ⅱ的策略集为： S2 {1, 2 , j , , n} 。
当Ⅰ、Ⅱ分别选择纯策略i , j 时，形成了一个纯局势
(i , j ) S S1 S2 ，则对任一 (i , j ) S ，记Ⅰ的赢得值为 ai j ，即Ⅱ赢得值为 ai j (i 1,2,, m; j 1,2,, n) .
9 2 6 -3
理智行为：从各自最不利情形中选择最有利 I：最大最小原则 II：最小最大原则
平衡局势：双方均可接受，且对双方都是最稳妥的结果。（α2 ，β2），局中人I和II的最优纯策略。
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定义 1：设 G {S1, S2; A}为矩阵对策，其中
S1 {1,2 ,,m} ， S2 {1, 2 ,, n}, A {aij }mn ，
为3, 1分别是局中人Ⅰ、Ⅱ的最优纯策略。
事实：对策 G 的值VG ai* j* 是 A a 中 i* j* 所在的行的最小
元素，又是所在列的最大元素，即
a ij
*
ai* j*
ai* j 。
矩阵对策的纯策略
4、矩阵对策的鞍点与解
对于一个对策G={S1, S2, A}, 若
有
max i
j

1,2,, n
均有
a ij
*
ai* j*
ai* j
2 7 2 1 1
例： G {S1, S2; A}，其中 A 2
3
2 5
3 4
4 2 4 3
2 2 1 6 1
3746
由
max i
min j
aij

min j
max i
aij
a31
3 则VG

3 ，G 的解
6 5 6 5
A 1 4 2 1 8 5 7 5
0 2 6
2

局势（α1, β2），（α1, β4），（α3, β2）（α3, β4）均构成鞍点，此对策有多个解。
矩阵对策的纯策略
5、矩阵对策纯策略的性质性质1：无差别性
若（αi1 ，βj1）和（αi2，βj2）是对策G的两个解，则
ai1j1 = ai2j2
性质2：可交换性
若（αi1 ，βj1）和（αi2，βj2）是对策G的两个解，则（αi1 ，βj2）和（αi2，βj1）也是对策G的两个解。
min j
aij

min j
max i
aij
ai* j*
则称局势（αi*, βj*）为对策G的
鞍点，V = a i*j*为对策G的值。
注：在矩阵中，一个数在所在行中是最大值，在所在列中是最小值，则被称为鞍点。
矩阵对策的纯策略
4、矩阵对策的鞍点与解多鞍点与无鞍点对策例: 设有一矩阵对策如下，求它的解。
矩阵对策的基本理论
对策/博弈分类
局中人个数：二个，多个策略集中的个数：有限，无限支付/赢得代数和：零和，非零和局中人是否合作：非合作，合作局中人行动时间：静态，动态局中人对他者信息了解程度：完全信息，非完全信息对策次数：单次，重复
课程目标
理解并掌握矩阵对策的纯策略理解并掌握矩阵对策的混合策略掌握矩阵对策的求解方法
第六章对策论
基本概念
对策论又称博弈论，研究冲突对抗条件下最优决策问题
的理论。
策略形势：不完全竞争条件下的对抗行为，各方收益由
自身行为和其他方行为共同决定。
基本要素
局中人（I ）：有权决定自己行动方案的对策参加者，理性人
策略集（S ）：供局中人选择的实际可行完整行动方案的集合，
略的集合，称局势
例：田忌赛马
局中人：田忌（I）、齐王（II）
S1 =｛（上、中、下），（上、下、中），（中、上、下），
（中、下、上），（下、中、上），（下、上、中）｝=
S2 3 1 1 1 1 1

1
3
1
1
1
1

1 1 3 1 1 1
A 1 1
1
3
1
1

1 1 1 1 3 1
的元素a22既是其所在行的最小元素，也是其所在列的最大
元素，即有 ai2≤a22 ≤ a2j i=1,2,3,4 j=1,2,3
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定理 1: 矩阵对策 G {S1, S2; A}在纯策略意义下有解的充要条
件是：存在纯局势
( i
*
,

j*
)
使得对一切
i

1,2,, m;
一局对策中，各局中人选定策
严格赢数得占函优数策（略H/(严s)格）劣:对势于策任一略局势，局中人的赢得值。支付函
上策均衡/纳什均衡
典型案例和重要结论
囚徒困境智猪博弈结论1：不要选择严格劣势策略。结论2：个人理性选择导致非最优。结论3：学会换位思考。求解方法：删除严格劣势策略