运筹学-第15章--对策论

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1 8 5 8 5 5*
2 2 3 2 1 1
3 4
9 0
5 2
6 3
5 5*
3
0
max 9 5* 8 5*
可知 ai* j* =5，i*=1,3，j*=2,4．故（α1，β2）（α1，β4）（α2，
β2）（α2，β4）为对策的纳管什理均运衡，筹 V学G=5．
15
• 最优纯策略求解步骤：
• 1、行中取小，小中取大得最大化最小收益值；
• 2、列中取大，大中取小得最小化最大支付值；
• 3、比较两值是否相等。若相等便存在最优纯策略。若不等，则不存在最优纯策略。
管理运筹学
16
§3 矩阵对策的混合策略
设矩阵对策 G = { S1, S2, A }。当
max
i
min
j
aij
min
j
max
i
aij
时，不存在最优纯策略。
例：设一个赢得矩阵如下:
一个局势，一个局势决定了各局中人的对策结果（量化）称为该局势对策的益损值。
管理运筹学
3
§1 对策论的基本概念
出赛的次序是一个策略 “齐王赛马”齐王在各局势中的益损值表（单位：千金）
管理运筹学
4
§1 对策论的基本概念
其中：齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }，田忌的策略集：S2={ 1, 2, 3, 4, 5, 6 }。
A=[aij]m×n i 行代表甲方策略 i=1, 2, …, m；j 列代表乙方策略 j=1, 2, …, n；aij 代表甲方取策略 i，乙方取策略 j，这一局势下甲方的益损值。此时乙方的益损值为 -aij（零和性质）。
在考虑各方采用的策略时，必须注意一个前提，就是双方都是理智的，即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据。
max
1im
min
1 jn
aij
管理运筹学
8
• 同样，如果局中人2采用他的第j个策略，由于局中人1希望自己的收益值（局中人2的支付）越大越好，即局中人1会选择策略使局中人2的支付最大，m1iamx aij
• 由于局中人2希望自己的支付越小越好，因此，他会从支付最大中选择最小。
• 这就是说，局中人2可以选择j，保证他失去
管理运筹学
26
2 1 0 A 0 2 3
1 1 2
发现不存在鞍点，也无法化简。说明每个策略选取的概率均不为0。
设局中人1的混合策略为(x1,x2,x3)，局中人2的混合策略为(y1,y2,y3)。这时的期望值为：
•
择策略使局中人1的收益最小，即
min
这就是支付矩阵第i行元素中的最小元素。1 jn
aij
• 局中人1不存在侥幸心理，不冒险，而又追求收益越大越好，因此，他会从各行的最小元素中选择最大的，从而确定自己的策略。
• 这就是说，局中人1可以选择i，使他得到的支付不少于（能够稳妥地保证得到该收益）
v1
【例】设赢得矩阵A为: 化简赢得矩阵．
2 1 0 2 0
3
0
1
4
8
A 6 4 9 5 9
3
6
8
7
5
5 0 7 9 3
【解】第4行优于第1行，第3行优于第2行，故可划去第1行和第 2行，得到新的赢得矩阵，x1=x2=0
6 4 9 5 9
A1 3
6
8
7
5
5 0 7 9 3
管理运筹学
20
对于A1第1列优于第3列，第2列优于第4列，(1/2)×（第1列） +(1/2) ×（第2列）优超于第5列，因此去掉第3列，第4列和第5
管理运筹学
1
第十五章对策论
由“齐王赛马”引入
管理运筹学
2
§1 对策论的基本概念
对策模型的三个基本要素： 1.局中人：参与对抗的各方，可以是一个人，也可以是一个
集团，可以是两方，也可以是多方； 2.策略集：局中人选择对付其它局中人的行动方案称为策略；
某局中人的所有可能策略全体称为策略集； 3.一局势对策的益损值：局中人各自使用一个对策就形成了
• 对x1、x2、y1、y2求偏导数，并让它们等于 0。
管理运筹学
23
• 对x1求偏导得，10y1-5y2+λ=0 • 对x2求偏导得，-5y1+λ=0 • 对y1求偏导得，10x1-5x2+μ=0 • 对y2求偏导得，-5x1+μ=0 • 再与x1+x2=1,y1+y2=1二式一起联立求解，
得： • x1=1/4,x2=3/4,y1=1/4,y2=3/4. λ=μ=5/4 • 带入v中解得局中人1的预期赢得。
管理运筹学
7
• 在矩阵博弈A中，aij表示局中人1的收益，因此，局中人1希望收益值aij越大越好；同时aij表示局中人2的支付或付出（局中人2的收益为- aij ），因此局中人2则希望付出的aij越小越好。因此，矩阵博弈完全是对抗的。
• 一般地，如果局中人1采用他的第i个策略，则局中人2会选
解：局中人I为采购员，局中人II为大自然，采购员有三个策略，买10吨、15吨、20吨。分别记为1，2，3。大自然也有三个策略：暖、正常、冷，分别记为1，2，3。
管理运筹学
13
§2 矩阵对策的最优纯策略
赢得矩阵如下：
1
2
3
1(10吨） -100
-175
-300
2(15吨） -150
-150
-250
管理运筹学
24
例：设解:
2×2对策的公式法
如果A有鞍点，则易求出各局中人的最优纯策略；如果没有鞍点，则各局中人的最优混合策略中的xi*, yj*均大于零。于是可求下列方程组：
管理运筹学
• 2、均衡法
2 1 0 A 0 2 3
1 1 2
首先分析是否存在鞍点，另外是否可以用优超原理化简。
纯策略可以看成是混合策略的特殊情况。即某一个策略的概率为1，其他策略的概率为0。优超原理化简，留下的策略概率取值大于0，删去的策略概率取值为0。
min -300 -250 -200*
管理运筹学
14
【例】设有矩阵对策G={ S1，S2；A }，赢得矩阵为
8 5 8 5
A 2 3 2 1 9 5 6 5
0 2 3
3
求纳什均衡
【解】直接在赢得表上计算，有
max i
min j
ai*
j
min j
max i
aij*
ai* j*
1 2 3 4 min
1和2分别称为局中人甲队、乙队的最优策略。由于双方必然选择这一种策略，所以，这种策略又称为最优纯策略。
这种最优纯策略只有当赢得矩阵A=（aij）中等式
max i
min j
aij
min j
max i
aij
成立时，双方才有最优纯策略，并把（1,2）称为对策G在纯策略下的解，
又称（1,2）为对策G的鞍点。把其值V称之为对策G={S1，S2，A}的值。
各选一种策略参赛。比赛共赛三局，规定每局胜者得1分，输者得-
1分，可知三赛三胜得3分，三赛二胜得1分，三赛一胜得-1分，三
赛三负得-3分。甲队的策略集为S1={1，2，3}，乙队的策略集
为S2={1，2，3}。根据以往比赛的资料，有甲队的赢得矩阵为A，
如下所示，
1 1 1 A 1 1 3
3 1 3
• 两个局中人分别选取纯策略αi 和βj的事件是独立的，所以局势（αi，βj）出现的概率是xi和yj，这时局中人1的赢得是aij。
• 于是局中人1赢得的期望值是
mn
E(x, y)=
a ij xi y j
i=1 j=1
管理运筹学
19
优超原理——赢得矩阵的化简
“严格下策反复消去法”(Iterated Elimination of Strictly Dominated Strategies)
3(20吨） -200
-200
-200
在此表上计算，有
1
2
3
1(10吨） -100
-175
-300
2(15吨） -150
-150
-250
3(20吨） -200
-200
-200
max
-100
-150
-200*
得
max min
i
j
aij
min j
200
故（3，3）为对策G的解，VG=-200。
是有限的；每一局势的对策均有确定的损益值，并且对同一局势的两个局中人的益损值之和为零。
通常将矩阵对策记为: G = {S1, S2, A} S1：甲的策略集； S2：乙的策略集； A：甲的赢得矩阵。 “齐王赛马”是一个矩阵策略。
管理运筹学
6
§§22 矩矩阵阵对对策策的的最最优优纯纯策策略略
在甲方的赢得矩阵中：
管理运筹学
21
• 求解混合策略问题的方法：均衡法、极值法、线性规划法。
• 1、极值法
10 5
A 5
0
设局中人1选择策略1和策略2的概率分别为x1和x2，局中人2选择策略1和策略2的概率分别为y1和y2，概率均大于等于0。这样局中人1的赢得就成为一个随机变量，若设其期望值为v，则有：
V=10x1y1-5x1y2-5x2y1+0x2y2=10x1y1-5x1y2-5x2y1
下面矩阵称齐王的赢得矩阵：
3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3
管理运筹学
5
§1 对策论的基本概念
二人有限零和对策（又称矩阵对策）：局中人为2；每个局中人的策略集的策略数目都
min
59 5 A=
86 6
max 6
i
策略2
max 8 9
min 8
j
策略1
管理运筹学
17
§3 矩阵对策的混合策略
当甲取策略2 ，乙取策略1时，甲实际赢得8比预期的多2，
乙当然不满意。考虑到甲可能取策略2这一点，乙采取策略2。若甲也分析到乙可能采取策略2这一点，取策略1，则赢得更多为 9 … 。此时，对两个局中人甲、乙来说，没有一个双方均可接受
列， y3=y4=y5=0，得到A2：
6 4
A2 3
6
5 0
又由于第1行优超于第3行，所以从A2中划去第3行，x5=0，得到 A3 ，
6 4
A3 3
6
优超：行比较取大者留下，列比较取小者留下
若α1不是为纯策略α2，…,αm中之一所优超，而是为α2，…,αm的某个凸线性组合所优超，仍然可以化简。
的平衡局势，其主要原因是甲和乙没有执行上述原则的共同基础，
即 max min aij min max aij 。
ij
ji
一个自然的想法：对甲（乙）给出一个选取不同策略的概率分布，以使甲（乙）在各种情况下的平均赢得（损失）最多（最少） -----即混合策略。
管理运筹学
18
• 如局中人1分别以概率x1和x2随机地采用策略α1 和α2，局中人2也分别以概率y1和y2随机地采用策略β1和β2。
• 在竞争过程的各方为了达到自己的目标和利益，必须考虑对手的各种可能的行动方案，并力图选取对自己最为有利或最为合理的方案，也就是说要研究采取对抗其他竞争者的策略，这就是对策问题，对策就是决策者在竞争场合下作出的决策。
• 对策论是研究对策的理论与方法，也叫博弈论。
• 所谓博弈是指局中人按一定规则，在充分考虑其他局中人可能采取的策略的基础上，从自己的策略集中选取相应策略，并从中得到回报的过程。
管理运筹学
12
§2 矩阵对策的最优纯策略
例某单位采购员在秋天决定冬季取暖用煤的储量问题，已知在正常的冬季气温条件下要消耗15吨煤，在较暖和较冷的天气下要消耗10吨和20吨。假定冬天的煤价随天气寒冷程度而有所变化，在较暖和、正常、较冷的气候条件下每吨煤价分别为10元、15元、20 元。又设冬季时煤炭价格为每吨10元。在没有关于当年冬季准确的气象预报的条件下，秋天储煤多少吨能使得单位的支出最少？
x1+x2=1,y1+y2=1
管理运筹学
22
• 局中人1为了使此值达到最大，就调整x1和 x2的值；而局中人2为了使此值达到最小，也要调整y1和y2的值。
• 此时，上述问题变为条件极值问题，可用拉格朗日乘数法求解，令λ、μ为待定系数，将式
• W=10x1y1-5x1y2-5x2y1+ λ(x1+x2-1)+ μ(y1+y2-1)
请问这次比赛各队采用哪种阵容上场最为稳妥?
管理运筹学
11
§2 矩阵对策的最优纯策略
矩阵A中每行的最小元素分别为1，-3，-1。
在这些最少赢得中最好的结果是1，故甲队会采取策略1，无论对手采取何策略，甲队至少得1分。对于乙队，{1，2，3}可能带来的最少赢得，即A中每列的最大元素，分别为3，1，3。乙队会采取2策略，确保甲队不会超过1分。
的不大于
v2
min
1 jn
max
1im
aij
管理运筹学
9
• 在矩阵博弈中，纯策略纳什均衡点存在的充分必要条件为：
v1
max
1im
min
1 jn
aij
min
1 jn
max
1im
aij
v2
管理运筹学
10
§2 矩阵对策的最优纯策略
例：甲乙乒乓球队进行团体对抗赛，每队由三名球员组成，双
方都可排成三种不同的阵容，每一种阵容可以看作一种策略，双方