运筹学对策论解析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

消耗10吨和20吨。假定冬天的煤价随天气寒冷程度而有所变化,在
较暖和、正常、较冷的气候条件下每吨煤价分别为10元、15元、20 元。又设冬季时煤炭价格为每吨10元。在没有关于当年冬季准确的 气象预报的条件下,秋天储煤多少吨能使得单位的支出最少? 解:局中人I为采购员,局中人II为大自然,采购员有三个策 略,买10吨、15吨、20吨。分别记为1,2,3。大自然也有三个 策略:暖、正常、冷,分别记为1,2,3。





18
§3
矩阵对策的混合策略
当甲取策略2 ,乙取策略1时,甲实际赢得8比预期的多2, 乙当然不满意。考虑到甲可能取策略2这一点,乙采取策略2。若 甲也分析到乙可能采取策略2这一点,取策略1,则赢得更多为 9 … 。此时,对两个局中人甲、乙来说,没有一个双方均可接受
的平衡局势,其主要原因是甲和乙没有执行上述原则的共同基础,
通常将矩阵对策记为:
S1:甲的策略集;
G = {S1, S2, A}
S2:乙的策略集;
A:甲的赢得矩阵。
“齐王赛马”是一个矩阵策略。
7





§ § 2 2 矩阵对策的最优纯策略 矩阵对策的最优纯策略
在甲方的赢得矩阵中: A=[aij]m×n i 行代表甲方策略 i=1, 2, …, m;j 列代表乙方策略 j=1, 2, …, n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下甲方的
8 2 A 9 0 5 3 5 2 8 5 2 1 6 5 3 3
求纳什均衡
1 2 3 4 min
【解】 直接在赢得表上计算,有
max min ai* j min max aij* ai* j*
i j j i
1 8 2 2 3 9 4 0
益损值。此时乙方的益损值为 -aij(零和性质)。
在考虑各方采用的策略时,必须注意一个前提,就是双 方都是理智的,即双方都是从各自可能出现的最不利的情形 选择一种最为有利的情况作为决策的依据。





8
• 在矩阵博弈A中,aij表示局中人1的收益,因此,局中人1希 望收益值aij越大越好;同时aij表示局中人2的支付或付出 (局中人2的收益为- aij ),因此局中人2则希望付出的aij越 小越好。因此,矩阵博弈完全是对抗的。 • 一般地,如果局中人1采用他的第i个策略,则局中人2会选 择策略使局中人1的收益最小,即 min aij 1 j n • 这就是支付矩阵第i行元素中的最小元素。 • 局中人1不存在侥幸心理,不冒险,而又追求收益越大越好, 因此,他会从各行的最小元素中选择最大的,从而确定自 己的策略。 • 这就是说,局中人1可以选择i,使他得到的支付不少于 (能够稳妥地保证得到该收益)
1 1 1
1 3 3
请问这次比赛各队采用哪种阵容上场最为稳妥?





12
§2
矩阵对策的最优纯策略
矩阵A中每行的最小元素分别为1,-3,-1。 在这些最少赢得中最好的结果是1,故甲队会采取策略1,无论对手
采取何策略,甲队至少得1分。对于乙队,{1,2,3}可能带来的最少
赢得,即A中每列的最大元素,分别为3,1,3。乙队会采取2策略,确保 甲队不会超过1分。
1和2分别称为局中人甲队、乙队的最优策略。由于双方必然选择这
一种策略,所以,这种策略又称为最优纯策略。 这种最优纯策略只有当赢得矩阵A=(aij)中等式
max min aij min max aij
i j j i
管 理 运 筹 学
2
第十五章 对策论
由“齐王赛马”引入





3
§1
对策论的基本概念
对策模型的三个基本要素: 1.局中人:参与对抗的各方,可以是一个人,也可以是一个 集团,可以是两方,也可以是多方; 2.策略集:局中人选择对付其它局中人的行动方案称为策略;
某局中人的所有可能策略全体称为策略集;
3.一局势对策的益损值:局中人各自使用一个对策就形成了 一个局势,一个局势决定了各局中人的对策结果(量化) 称为该局势对策的益损值。





4
§1
对策论的基本概念
出赛的次序是一个策略 “齐王赛马”齐王在各局势中的益损值表(单位:千金)





5
§1
对策论的基本概念
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。
成立时,双方才有最优纯策略,并把(1,2)称为对策G在纯策略下的解, 又称(1,2)为对策G的鞍点。把其值V称之为对策G={S1,S2,A}的值。





13
§2

矩阵对策的最优纯策略
某单位采购员在秋天决定冬季取暖用煤的储量问题,已知
在正常的冬季气温条件下要消耗15吨煤,在较暖和较冷的天气下要
A2 3 5 6 0
又由于第1行优超于第3行,所以从A2中划去第3行,x5=0,得到 A3 ,
6 A3 3 4 6
优超:行比较取大者留下,列比较取小者留下 若α 1不是为纯策略α 2,…,α m中之一所优超,而 是为α 2,…,α m的某个凸线性组合所优超,仍然 可以化简。
下面矩阵称齐王的赢得矩阵:
3 1 1 -1 1 1 1 1 1 3 1 1 -1 3 1 1 1 3 1 1 -1 1 -1 1 -1 1 1 1 3 1 1 -1 1 1 1 3
A=





6
§1
对策论的基本概念
二人有限零和对策(又称矩阵对策): 局中人为2;每个局中人的策略集的策略数目都 是有限的;每一局势的对策均有确定的损益值,并 且对同一局势的两个局中人的益损值之和为零。
【解】第4行优于第1行,第3行优于第2行,故可划去第1行和第 2行,得到新的赢得矩阵,x1=x2=0
6 A1 3 5
管 理
4 6 0

9 8 7
筹 学
5 7 9
9 5 3
21
对于A1第1列优于第3列,第2列优于第4列,(1/2)×(第1列) +(1/2) ×(第2列)优超于第5列,因此去掉第3列,第4列和第5 列, y3=y4=y5=0,得到A2: 6 4
各选一种策略参赛。比赛共赛三局,规定每局胜者得1分,输者得1分,可知三赛三胜得3分,三赛二胜得1分,三赛一胜得-1分,三 赛三负得-3分。甲队的策略集为S1={1,2,3},乙队的策略集
为S2={1,2,3}。根据以往比赛的资料,有甲队的赢得矩阵为 A,
如下所示,
1 A 1 3
管 理 运 筹 学
23
• 局中人1为了使此值达到最大,就调整x1和 x2的值;而局中人2为了使此值达到最小, 也要调整y1和y2的值。 • 此时,上述问题变为条件极值问题,可用拉 格朗日乘数法求解,令λ 、μ为待定系数, 将式 • W=10x1y1-5x1y2-5x2y1+ λ (x1+x2-1)+ μ(y1+y2-1) • 对x1、x2、y1、y2求偏导数,并让它们等于 0。
即 max min aij min max aij 。
i j j i
一个自然的想法:对甲(乙)给出一个选取不同策略的概率分
布,以使甲(乙)在各种情况下的平均赢得(损失)最多(最少) -----即混合策略。
管 理 运 筹 学
19
• 如局中人1分别以概率x1和x2随机地采用策略α 1 和α 2,局中人2也分别以概率y1和y2随机地采用 策略β 1和β 2。 • 两个局中人分别选取纯策略α i 和β j的事件是独 立的,所以局势(α i,β j)出现的概率是xi和yj, 这时局中人1的赢得是aij。 • 于是局中人1赢得的期望值是
5 5* 3 2 1 1 5 6 5 5* 2 3 3 0 5 8
max 9 5* 8 5*
可知 ai* j* =5,i*=1,3,j*=2,4.故(α1,β2)(α1,β4)(α2, β2)(α2,β4)为对策的纳什均衡, VG=5. 16 管 理 运 筹 学
• 最优纯策略求解步骤: • 1、行中取小,小中取大得最大化最小收益 值; • 2、列中取大,大中取小得最小化最大支付 值; • 3、比较两值是否相等。若相等便存在最优 纯策略。若不等,则不存在最优纯策略。





17
§3
矩阵对策的混合策略
i j j i
设矩阵对策 G = { S1, S2, A }。当 max min aij min max aij
时,不存在最优纯策略。 例:设一个赢得矩阵如下: min 5 9 5 A = max 6 i 8 6 6
策略2
max 8
9 min 8
j
策略1
v1 max min aij
1i m 1 j n
运 筹 管 理 学
9
• 同样,如果局中人2采用他的第j个策略,由 于局中人1希望自己的收益值(局中人2的支 付)越大越好,即局中人1会选择策略使局 aij 中人2的支付最大,max 1 i m • 由于局中人2希望自己的支付越小越好,因 此,他会从支付最大中选择最小。 • 这就是说,局中人2可以选择j,保证他失去 min max aij 的不大于 v2 1 j n 1i m
3(20吨)
max
i j
-200
-100
j i
-200
-150
-200
-200*
-200*
得 max min aij min max aij a32 200 故(3,3)为对策G的解,VG=-200。
管 理 运 筹 学
15
【例】 设有矩阵对策G={ S1,S2;A },赢得矩阵为
管 理 运 筹 学
22
• 求解混合策略问题的方法:均衡法、极值法、线 性规划法。 • 1、极值法
10 5 A 5 0
设局中人1选择策略1和策略2的概率分别为x1和x2,局中 人2选择策略1和策略2的概率分别为y1和y2,概率均大于 等于0。这样局中人1的赢得就成为一个随机变量,若设其 期望值为v,则有: V=10x1y1-5x1y2-5x2y1+0x2y2=10x1y1-5x1y2-5x2y1 x1+x2=1,y1+y2=1
第十五章 对策论
§1 对策论的基本概念
§2 §3 §4 矩阵对策的最优纯策略 矩阵对策的混合策略 其他类型的对策论简介
管 理 运 筹 学
1
• 在竞争过程的各方为了达到自己的目标和利 益,必须考虑对手的各种可能的行动方案, 并力图选取对自己最为有利或最为合理的方 案,也就是说要研究采取对抗其他竞争者的 策略,这就是对策问题,对策就是决策者在 竞争场合下作出的决策。 • 对策论是研究对策的理论与方法,也叫博弈 论。 • 所谓博弈是指局中人按一定规则,在充分考 虑其他局中人可能采取的策略的基础上,从 自己的策略集中选取相应策略,并从中得到 回报的过程。
E(x, y)= a ij xi y j
i=1 j=1 m n

Βιβλιοθήκη Baidu




20
优超原理——赢得矩阵的化简
“严格下策反复消去法”(Iterated Elimination of Strictly Dominated Strategies)
【例】 设赢得矩阵A为:
化简赢得矩阵.
2 1 0 2 0 3 0 1 4 8 A 6 4 9 5 9 3 6 8 7 5 5 0 7 9 3





14
§2
赢得矩阵如下:
矩阵对策的最优纯策略
1 2
-175 -150 -200
3
-300 -250 -200
1(10吨) 2(15吨) 3(20吨)
-100 -150 -200
在此表上计算,有
1 1(10吨) 2(15吨) -100 -150 2 -175 -150 3 -300 -250 min -300 -250





10
• 在矩阵博弈中,纯策略纳什均衡点存在的充 分必要条件为:
v1 max min aij min max aij v2
1i m 1 j n 1 j n 1i m





11
§2
矩阵对策的最优纯策略
例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双 方都可排成三种不同的阵容,每一种阵容可以看作一种策略,双方
相关文档
最新文档