精心整理的运筹学重点10.对策论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
v1 = max min(3 − 2 x, 2 + 2 x) , v1 = max min(3 − 2 x, 2 + 2 x) 就是折线 ABC,它是局 0≤ x ≤1 0≤ x ≤1
中人 I 的最小赢得线,B 就是折线 ABC 的最高点,所以 B 点所对应的值就是混合策略意 义下的最大最小值。
E ( x , β1 ), E ( x, β2 ) 的表达式是两条直线方程, x ∈ [0,1] E ( x, β1 ) 的值随 x 的增大而减小, E ( x, β2 ) 的值随 x 的增大而增大。两条直线的交点 B
对应 X 轴上的 x 0 点。局中人 I 按最大最小原则选择策略,即他的选择为
y* = (1/2,1/2), v2 = 5 / 2
由此可得,混合策略意义下的解为( x *, y * ),对策值 vG = 5 / 2 方法 3:线性规划法(求解 m*n 型) 数学模型
0≤ y ≤1
max W = y1 + y2+ ...+ yn
P:
∑a y
ij
min V = x1 + x2+ ...+ xm
方法 2:图解法 (求解 2*n 或 m*2 型) 图解法求每个局中人只有两个策略的矩阵对策: 1)绘制局中人 I 的混合策略图。
a.以局中人 I 选取策略 a1 的概率 x 为横坐标,以局中人 I 的期望赢得 v 为纵坐标建立 坐标系。 b.画出局中人 II 选取纯策略 β1 时,局中人 I 的期望赢得线。 c.画出局中人 II 选取纯策略 β2 时,局中人 I 的期望赢得线。 d.找出局中人 I 的最小赢得线, 其最高点的横坐标 x0 给出了局中人 I 的最优混合策略
v2 = min max(4 − 3 y, 2 + y ) 0≤ y ≤1
图中折线 CDE 表示 v2 = min max(4 − 3 y, 2 + y ) ,即局中人 II 的最大损失线,D 是 CDE
的最低点,即最小最大值。D 点对应的 y0 = 1/2, v2 = 5 / 2 ,因而 II 得最优混合策略为
当 E ( x, β1 ) = E( x, β 2 ) 时,解得: x0 = 1/4, v1 = 5 / 2 ,局中人 I 的解为
x* = (1/4,3/4), v1 = 5 / 2
同理,用同样的方法分析局中人 II 的最优混合策略,若局中人 II 以概率 y 选择 β1 ,以 (1-y)选取 β2 去对付局中人 I 的策略 a1 时,他的期望损失值
T(G)为矩阵对策的解集。
此方法可以求解任何矩阵对策问题(尤其是矩阵中赢得函数有负数的情况)。 方法 4:优超法则 行大列小为优。 4.其他对策模型 1)两人无限零和对策
2)两人无限非零和对策 3)合作对策:例如产品定价问题 参加对策的局中人可以进行充分的合作,可以事先商定好,把各自策略协调起来;合作 的形式是所有局中人可以形成若干联盟,每个局中人仅参加一个联盟,联盟的所得要在 联盟的所有成员中进行重新分配。 合作对策的关键问题是:如何形成联盟,联盟的所得如何被合理分配。其核心问题是, 如何定义“最优的”分配?是否存在最优的分配?怎样去求解最优的分配? 构成合作对策的两个基本要素:局中人集合 I 和特征函数 v(S),其中 I={1,2,…,n},S 为 I 的任一子集,也就是任何一个可能形成的联盟,v(S)表示的是联盟 S 在对策中的所 得。合作对策的可行解是一个满足下列条件的 n 维向量 x = ( x1 , x2 ,... xn )
解:不存在最优纯策略,I 选择混合策略(x,1-x),当局中人 II 选择 β1 时,局中人 I 的期望赢得为 E ( x, β1) = 1 x + 3(1− x ) = 3 − 2 x 。 当局中人 II 选择 β2 时,局中人 I 的期望赢得为 E ( x, β2 ) = 4 x + 2(1− x ) = 2 + 2 x 。
型法求解,VG* =V G − L 。
∑a
1 * , x = V G ⋅ xi , y * = VG ⋅ y j Z
ij
< 0 ,则需要对矩阵进行变换,同时加上一个 L,再用单纯
VG2 = VG1 + L T ( G1 ) = T (G2 )
VG2 = a ⋅VG1 T ( G1 ) = T (G2 )
x = ( x0 ,1 − x0 ) ,其纵坐标给出该矩阵对策的值 v* 。 2)类似绘制局中人 II 的混合策略图。 对于 2*3 矩阵来讲,局中人 I 可以从图 1 中找到 x,折线 ABCD 的最大点 C 就是 I 的最优 策略。 对于 3*2 矩阵来讲, 局中人 II 可以从图 2 中找到 y, 折线 ABCD 的最小点 B 就是 II 的最 优策略。
D:
j
≤1
在问题 P-D 中,不妨设 v > 0, w > 0(否则,对对策的赢得矩阵的每一个元素均加上一个 正常数,使得所有矩阵中的元素均大于等于零),作变换
yi ≥ 0
∑a x
xi ≥ 0
ij i
≥1
VG =
1 1 = V W
x' =
P' : ∑ aij y 'j ≤ 1
x1 a11 x2 a21
矩阵对策求解方法
有
a12 a22
有无鞍点?
无 是
获得
2*n 或 m*2 矩阵
否
图解
是否优超
代数
LP
? ?
方法 1:线性方程组(求解 2*2 型)
a11 x1 + a21 x2 = v a11 y1 + a12 y 2 = v a11a22 − a12 a21 a12 x1 + a22 x2 = v 和 a12 y1 + a22 y2 = v vG = ( a + a ) − ( a + a ) 11 22 12 21 x + x =1 y + y =1 1 2 1 2
i j j i
3.无鞍点的两人有限零和对策求解 X = ( x1 , x2 ,..., xm )T 为局中人 I 的混合策略,
Y = ( y1 , y 2 ,..., yn )
T
∑ x = 1 为局中人 II 的混合策略, ∑ y = 1 , ( X , Y ) 称为混合局势。
i i
最优混合策略求解方法 y1 y2
*
v
v A B C D B C
D
A
X=0
x X=1
y=0
y=1
y
例 1:用图解法求 2*3 的矩阵求 X,用图 1,求下方最高点的值;3*2 的矩阵求 Y,用图 2,求上方最低点 的值。 例 2: II y1 I y
2
x1 1 4 A= x2 3 2
xi ' yi , y = , 则问题 P-D 等价于问题 P' , D' w v max Z = ∑ y 'j min W = ∑ xi'
D' : ∑ aij xi' ≥ 1
y 'j ≥ 0
xi' ≥ 0
用单纯型法求得 Z , xi , y j 的值后,对策值VG = 如果矩阵中所有的元素
ຫໍສະໝຸດ Baidu
E (a1 , y ) = 1y + 4(1− y) = 4 − 3 y
当局中人 II 以以同样的混合策略对付 I 的 a2 策略时,他的期望损失值
E (a2 , y ) = 3 y + 2(1− y ) = 2 + y
局中人 II 按最小最大原则选择自己的策略,即按下式决定自己的最优混合策略:
xi ≥ v({}), i i = 1,2,..., n
∑x
i =1
n
i
= v (I )
4)多人非合作对策:例如囚徒困境 指局中人之间互不合作,局中人之间没有达成任何具有约束力的协议。矩阵对策就是一 种非合作对策,一般非合作对策模型可以用所谓的策略式来表达,需给出 1)局中人的 集合;2)每个局中人的策略集;3)每个局中人的赢得函数。 如果对策 G 中局势 s 对所有人都有利,则称局势 s 为对策 G 的一个均衡局势或均衡解, 又称纳什均衡。 纳什均衡的含义:当局势 s 对每一个局中人都有利时,没有人愿意单独改变策略选择, 因为它无法从这种改变中获利, 因此每个局中人所选择的策略都是针对其他局中人选择 策略的最佳反应,或者说均衡局势 s 中的策略互为最佳反应对策。 例如矩阵对策的最优局势,囚徒困境。
第十章 对策论 1.对策论类型 1)根据局中人个数:二人对策、多人对策 2)根据局中人间是否允许合作:合作对策、非合作对策 3)根据局中人的策略集中的策略个数:有限对策、无限对策 4)根据各局中人的赢得函数的代数和是否为零:零和对策、非零和对策 5)根据策略的选择是否与时间推移有关:静态对策、动态对策 6)根据对策中各局中人所拥有的有关决策信息:完全信息对策、不完全信息对策 7)根据对策模型的数学特征:矩阵对策、连续对策、微分对策、随机对策 矩阵对策:又称为二人有限零和对策。 2.有鞍点的两人有限零和对策求解 G = {S1, S2 , A} 求解: maxmin{aij } = V1,minmax{aij } = V2