运筹学-第15章--对策论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 8 5 8 5 5*
2 2 3 2 1 1
3 4
9 0
5 2
6 3
5 5*
3
0
max 9 5* 8 5*
可知 ai* j* =5,i*=1,3,j*=2,4.故(α1,β2)(α1,β4)(α2,
β2)(α2,β4)为对策的纳管 什理均运衡,筹 V学G=5.
15
• 最优纯策略求解步骤:
• 1、行中取小,小中取大得最大化最小收益 值;
• 2、列中取大,大中取小得最小化最大支付 值;
• 3、比较两值是否相等。若相等便存在最优 纯策略。若不等,则不存在最优纯策略。
管理运筹学
16
§3 矩阵对策的混合策略
设矩阵对策 G = { S1, S2, A }。当
max
i
min
j
aij
min
j
max
i
aij
时,不存在最优纯策略。
例:设一个赢得矩阵如下:
一个局势,一个局势决定了各局中人的对策结果(量化) 称为该局势对策的益损值。
管理运筹学
3
§1 对策论的基本概念
出赛的次序是一个策略 “齐王赛马”齐王在各局势中的益损值表(单位:千金)
管理运筹学
4
§1 对策论的基本概念
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。
A=[aij]m×n i 行代表甲方策略 i=1, 2, …, m;j 列代表乙方策略 j=1, 2, …, n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下甲方的 益损值。此时乙方的益损值为 -aij(零和性质)。
在考虑各方采用的策略时,必须注意一个前提,就是双 方都是理智的,即双方都是从各自可能出现的最不利的情形 选择一种最为有利的情况作为决策的依据。
max
1im
min
1 jn
aij
管理运筹学
8
• 同样,如果局中人2采用他的第j个策略,由 于局中人1希望自己的收益值(局中人2的支 付)越大越好,即局中人1会选择策略使局 中人2的支付最大,m1iamx aij
• 由于局中人2希望自己的支付越小越好,因 此,他会从支付最大中选择最小。
• 这就是说,局中人2可以选择j,保证他失去
管理运筹学
26
2 1 0 A 0 2 3
1 1 2
发现不存在鞍点,也无法化简。说明每个策略选取的概率 均不为0。
设局中人1的混合策略为(x1,x2,x3),局中人2的混合策略 为(y1,y2,y3)。这时的期望值为:

择策略使局中人1的收益最小,即
min
这就是支付矩阵第i行元素中的最小元素。1 jn
aij
• 局中人1不存在侥幸心理,不冒险,而又追求收益越大越好, 因此,他会从各行的最小元素中选择最大的,从而确定自 己的策略。
• 这就是说,局中人1可以选择i,使他得到的支付不少于 (能够稳妥地保证得到该收益)
v1
【例】 设赢得矩阵A为: 化简赢得矩阵.
2 1 0 2 0
3
0
1
4
8
A 6 4 9 5 9
3
6
8
7
5
5 0 7 9 3
【解】第4行优于第1行,第3行优于第2行,故可划去第1行和第 2行,得到新的赢得矩阵,x1=x2=0
6 4 9 5 9
A1 3
6
8
7
5
5 0 7 9 3
管理运筹学
20
对于A1第1列优于第3列,第2列优于第4列,(1/2)×(第1列) +(1/2) ×(第2列)优超于第5列,因此去掉第3列,第4列和第5
管理运筹学
1
第十五章 对策论
由“齐王赛马”引入
管理运筹学
2
§1 对策论的基本概念
对策模型的三个基本要素: 1.局中人:参与对抗的各方,可以是一个人,也可以是一个
集团,可以是两方,也可以是多方; 2.策略集:局中人选择对付其它局中人的行动方案称为策略;
某局中人的所有可能策略全体称为策略集; 3.一局势对策的益损值:局中人各自使用一个对策就形成了
• 对x1、x2、y1、y2求偏导数,并让它们等于 0。
管理运筹学
23
• 对x1求偏导得,10y1-5y2+λ=0 • 对x2求偏导得,-5y1+λ=0 • 对y1求偏导得,10x1-5x2+μ=0 • 对y2求偏导得,-5x1+μ=0 • 再与x1+x2=1,y1+y2=1二式一起联立求解,
得: • x1=1/4,x2=3/4,y1=1/4,y2=3/4. λ=μ=5/4 • 带入v中解得局中人1的预期赢得。
管理运筹学
7
• 在矩阵博弈A中,aij表示局中人1的收益,因此,局中人1希 望收益值aij越大越好;同时aij表示局中人2的支付或付出 (局中人2的收益为- aij ),因此局中人2则希望付出的aij越 小越好。因此,矩阵博弈完全是对抗的。
• 一般地,如果局中人1采用他的第i个策略,则局中人2会选
解:局中人I为采购员,局中人II为大自然,采购员有三个策 略,买10吨、15吨、20吨。分别记为1,2,3。大自然也有三个 策略:暖、正常、冷,分别记为1,2,3。
管理运筹学
13
§2 矩阵对策的最优纯策略
赢得矩阵如下:
1
2
3
1(10吨) -100
-175
-300
2(15吨) -150
-150
-250
管理运筹学
24
例:设 解:
2×2对策的公式法
如果A有鞍点,则易求出各局中人的最优纯 策略;如果没有鞍点,则各局中人的最优混 合策略中的xi*, yj*均大于零。于是可求下列 方程组:
管理运筹学
• 2、均衡法
2 1 0 A 0 2 3
1 1 2
首先分析是否存在鞍点,另外是否可以用优超原理化简。
纯策略可以看成是混合策略的特殊情况。即某一个策略的 概率为1,其他策略的概率为0。优超原理化简,留下的策 略概率取值大于0,删去的策略概率取值为0。
min -300 -250 -200*
管理运筹学
14
【例】 设有矩阵对策G={ S1,S2;A },赢得矩阵为
8 5 8 5
A 2 3 2 1 9 5 6 5
0 2 3
3
求纳什均衡
【解】 直接在赢得表上计算,有
max i
min j
ai*
j
min j
max i
aij*
ai* j*
1 2 3 4 min
1和2分别称为局中人甲队、乙队的最优策略。由于双方必然选择这 一种策略,所以,这种策略又称为最优纯策略。
这种最优纯策略只有当赢得矩阵A=(aij)中等式
max i
min j
aij
min j
max i
aij
成立时,双方才有最优纯策略,并把(1,2)称为对策G在纯策略下的解,
又称(1,2)为对策G的鞍点。把其值V称之为对策G={S1,S2,A}的值。
各选一种策略参赛。比赛共赛三局,规定每局胜者得1分,输者得-
1分,可知三赛三胜得3分,三赛二胜得1分,三赛一胜得-1分,三
赛三负得-3分。甲队的策略集为S1={1,2,3},乙队的策略集
为S2={1,2,3}。根据以往比赛的资料,有甲队的赢得矩阵为A,
如下所示,
1 1 1 A 1 1 3
3 1 3
• 两个局中人分别选取纯策略αi 和βj的事件是独 立的,所以局势(αi,βj)出现的概率是xi和yj, 这时局中人1的赢得是aij。
• 于是局中人1赢得的期望值是
mn
E(x, y)=
a ij xi y j
i=1 j=1
管理运筹学
19
优超原理——赢得矩阵的化简
“严格下策反复消去法”(Iterated Elimination of Strictly Dominated Strategies)
3(20吨) -200
-200
-200
在此表上计算,有
1
2
3
1(10吨) -100
-175
-300
2(15吨) -150
-150
-250
3(20吨) -200
-200
-200
max
-100
-150
-200*

max min
i
j
aij
min j
200
故(3,3)为对策G的解,VG=-200。
是有限的;每一局势的对策均有确定的损益值,并 且对同一局势的两个局中人的益损值之和为零。
通常将矩阵对策记为: G = {S1, S2, A} S1:甲的策略集; S2:乙的策略集; A:甲的赢得矩阵。 “齐王赛马”是一个矩阵策略。
管理运筹学
6
§§22 矩矩阵阵对对策策的的最最优优纯纯策策略略
在甲方的赢得矩阵中:
管理运筹学
21
• 求解混合策略问题的方法:均衡法、极值法、线 性规划法。
• 1、极值法
10 5
A 5
0
设局中人1选择策略1和策略2的概率分别为x1和x2,局中 人2选择策略1和策略2的概率分别为y1和y2,概率均大于 等于0。这样局中人1的赢得就成为一个随机变量,若设其 期望值为v,则有:
V=10x1y1-5x1y2-5x2y1+0x2y2=10x1y1-5x1y2-5x2y1
下面矩阵称齐王的赢得矩阵:
3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3
管理运筹学
5
§1 对策论的基本概念
二人有限零和对策(又称矩阵对策): 局中人为2;每个局中人的策略集的策略数目都
min
59 5 A=
86 6
max 6
i
策略2
max 8 9
min 8
j
策略1
管理运筹学
17
§3 矩阵对策的混合策略
当甲取策略2 ,乙取策略1时,甲实际赢得8比预期的多2,
乙当然不满意。考虑到甲可能取策略2这一点,乙采取策略2。若 甲也分析到乙可能采取策略2这一点,取策略1,则赢得更多为 9 … 。此时,对两个局中人甲、乙来说,没有一个双方均可接受
列, y3=y4=y5=0,得到A2:
6 4
A2 3
6
5 0
又由于第1行优超于第3行,所以从A2中划去第3行,x5=0,得到 A3 ,
6 4
A3 3
6
优超:行比较取大者留下,列比较取小者留下
若α1不是为纯策略α2,…,αm中之一所优超,而 是为α2,…,αm的某个凸线性组合所优超,仍然 可以化简。
的平衡局势,其主要原因是甲和乙没有执行上述原则的共同基础,
即 max min aij min max aij 。
ij
ji
一个自然的想法:对甲(乙)给出一个选取不同策略的概率分 布,以使甲(乙)在各种情况下的平均赢得(损失)最多(最少) -----即混合策略。
管理运筹学
18
• 如局中人1分别以概率x1和x2随机地采用策略α1 和α2,局中人2也分别以概率y1和y2随机地采用 策略β1和β2。
• 在竞争过程的各方为了达到自己的目标和利 益,必须考虑对手的各种可能的行动方案, 并力图选取对自己最为有利或最为合理的方 案,也就是说要研究采取对抗其他竞争者的 策略,这就是对策问题,对策就是决策者在 竞争场合下作出的决策。
• 对策论是研究对策的理论与方法,也叫博弈 论。
• 所谓博弈是指局中人按一定规则,在充分考 虑其他局中人可能采取的策略的基础上,从 自己的策略集中选取相应策略,并从中得到 回报的过程。
管理运筹学
12
§2 矩阵对策的最优纯策略
例 某单位采购员在秋天决定冬季取暖用煤的储量问题,已知 在正常的冬季气温条件下要消耗15吨煤,在较暖和较冷的天气下要 消耗10吨和20吨。假定冬天的煤价随天气寒冷程度而有所变化,在 较暖和、正常、较冷的气候条件下每吨煤价分别为10元、15元、20 元。又设冬季时煤炭价格为每吨10元。在没有关于当年冬季准确的 气象预报的条件下,秋天储煤多少吨能使得单位的支出最少?
x1+x2=1,y1+y2=1
管理运筹学
22
• 局中人1为了使此值达到最大,就调整x1和 x2的值;而局中人2为了使此值达到最小, 也要调整y1和y2的值。
• 此时,上述问题变为条件极值问题,可用拉 格朗日乘数法求解,令λ、μ为待定系数, 将式
• W=10x1y1-5x1y2-5x2y1+ λ(x1+x2-1)+ μ(y1+y2-1)
请问这次比赛各队采用哪种阵容上场最为稳妥?
管理运筹学
11
§2 矩阵对策的最优纯策略
矩阵A中每行的最小元素分别为1,-3,-1。
在这些最少赢得中最好的结果是1,故甲队会采取策略1,无论对手 采取何策略,甲队至少得1分。对于乙队,{1,2,3}可能带来的最少 赢得,即A中每列的最大元素,分别为3,1,3。乙队会采取2策略,确保 甲队不会超过1分。
的不大于
v2
min
1 jn
max
1im
aij
管理运筹学
9
• 在矩阵博弈中,纯策略纳什均衡点存在的充 分必要条件为:
v1
max
1im
min
1 jn
aij
min
1 jn
max
1im
aij
v2
管理运筹学
10
§2 矩阵对策的最优纯策略
例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双
方都可排成三种不同的阵容,每一种阵容可以看作一种策略,双方
相关文档
最新文档