第十一章_物流运筹学__对策论
《管理运筹学-对策论》
博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。
运筹学_对策论
混合策略
• 混合扩充
矩阵对策扩充 N人有限对策
• 混合平衡解
矩阵对策 N人有限对策
• 均衡解的存在性
第18页
混 合 扩 充—矩阵对策
策略集
m
S * 1
{X
( x1 , x2 ,..., xm )
xi 1, xi 0, i 1,2,..., m}
i 1
nS* 2{Y( y1 ,y2 ,...,
yn )
y j 1, y j 0, j 1,2,..., n}
j 1
支付函数
mn
E( X ,Y )
aij xi y j
i1 j1
混合扩充: *
{
S1*
,
S
* 2
,
E
(
x
,
y),
x
S1* ,
y
S
* 2
}
第19页
混 合 扩 充—N人有限对策
N 人有限对策 I {1,2,..., N }, Si , i I , H i (s), i I
• 定理1 N人有限对策的混合扩充存在平衡局势. • 定理2 矩阵对策的混合扩充存在平衡局势.
第23页
矩阵对策的解法
• 问题的简化
优超 算例
• 线性规划方法
基本思想 算例
第24页
优超
给定矩阵对策 {S1 , S2 , A} , A 是 m n 的矩阵,如果
akj alj , j 1,2,..., n
则称局中人 1 的策略 k 优超于策略 l。如果
aik ail , i 1,2,..., m
则称局中人 2 的策略 k 优超于策略 l。
注:局中人 1 的策略 k 优超于策略 l 则说明对局中人 1
物流运筹
5
2
4
A
I
5
3
1 0
C3 E 4 H 6 O0
7
B
6
3F
7
J 5
6
2. 图、网络与网络技术
2D 4 G 5
5
2
4
A
I
5
3
1 0
C3 E 4 H 6 O0
7
B
6
3F
8
7
J 5
6
2. 图、网络与网络技术
2D 4 G 5
5
2 12
4
A
I
5
3
1 0
C3 E 4 H 6 O0
7
B
6
3F
8
7
J 5
6
2. 图、网络与网络技术
2D 4 G 5
5
2 12
4 16
A
I
5
3
1 0
C3 E 4 H 6 O0
7 23
B
J
6
3F
5
6
8
7
18
2. 图、网络与网络技术
2D 4 G 5
5
2 12
4 16
A
I
5
3
1 0
C3 E 4 H 6 O0
7 23 23
B
J
6
3F
5
6
8
7
18
2. 图、网络与网络技术
2D 4 G 5
5
2 12
4 16
(5)虚活动画成虚箭头,只表 示活动之间的衔接关系,活动时间 等于零。通常用O来表示。
2. 图、网络与网络技术
A
1
物流运筹学讲义
定理4 (基本定理): 任何一个矩阵对策 ,一定存在混合策略解 ,。
路漫漫其悠远
• 图解法
矩阵对策的求解
【例11-7】用图解法求解矩阵对策
其中
• 线性方程组法 【例11-9】给定一个矩阵对策
对策G的值与解。其中
, ,求
路漫漫其悠远
• 线性规划法 线性规划法可以求解任一矩阵对策。 【例11-10】给定一个矩阵对策
路漫漫其悠远
最优纯策略
对策的值——一个矩阵对策G,如果其支付矩阵A 的元素满足:
则称这个值V为矩阵对策G的值。
矩阵对策G的鞍点——如果纯局势
使
纯
策略中的解,此时 与 分别为局中人Ⅰ和局中人
Ⅱ的最优纯策略。
路漫漫其悠远
【例11-3】对于一个矩阵对策G ={Ⅰ,Ⅱ;S1,
G ={Ⅰ,Ⅱ;S1;S2;A }或G = {S1,S2;A }
路漫漫其悠远
【例11-2】(“石头、剪刀、布”游戏)每个人都 可能玩过这种游戏。石头击败剪刀,剪刀战胜布,而 布又胜过石头。这里也是两个局中人:局中人Ⅰ、Ⅱ ,双方各有3个策略,策略1代表出石头,策略2代表 出剪刀,策略3代表出布。假定胜者得1分,负者得-1 分。策略一样,就算“平局”,双方都不得分。取 S1={石头、剪刀、布},S2={石头、剪刀、布},则局 中人Ⅰ的支付矩阵A为
物流运筹学讲义
路漫漫其悠远 2020/4/5
知识目标
了解对策论模型的三要素,掌握矩阵对策的模型 、基本定理及解法;
了解其他类型对策,能够用所学对策论知识解决 一些简单的实际问题.
技能目标
根据实际问题建立支付矩阵(建模); 根据最小最大原则、最大最小原则、优超原则等
,利用图解法和线性规划法求出矩阵对策的最优 策略和对策值.
第十一章物流运筹学对策论
第一节 矩阵对策及其解法
本节的主要内容
• 对策现象的三要素及其分类 • 矩阵对策的数学模型 • 最优纯策略 • 混合策略和混合扩充 • 矩阵对策基本定理 • 矩阵对策的求解
对策现象的三要素及其分类
对策现象三个基本要素:局中人(players) 、 策略集(strategies)和支付函数(赢得函数) (payoff function)。
70
80
20
30
50
0
0*
m
ax
2 .解决方案 Rhenania的营销主管在运筹学建模方面具有很强 的背景。他意识到,邮购公司最大化单个邮购订单 的传统做法实际上是一个次优选择,因为它削弱了 活跃客户(在最近12个月内下过定单的客户)的基 础,从长远来看会减少公司的利润。他说服公司新 任CEO转而采用与传统做法背道而驰的运筹学优化 方法。 他领导的运筹团队开发了一个动态多层建模方法 (DMLM),以此来确定邮寄邮购目录的最佳频 率,根据顾客细分来优化邮购产品组合,并确定客 户何时接到“重新激活包”而不是目录。
0 1 1
A
1
0
1
1 1 0
最优纯策略
对策的值——一个矩阵对策G,如果其支付矩阵A 的元素满足:
m 1ia m xm 1ji n naij m 1ji n nm 1ia m xaij
则称这个值V为矩阵对策G的值。
矩阵对策G的鞍点——如果纯局势 使 ( i* , j* ) ai* j* G 的值V
1m jinnai*j m 1iam xaij*
定理2:
若 ( i , j ) 和( k , t ) 都是矩阵对策G的鞍点, 则 ( i , t ) 和 ( k , j ) 也都是G的鞍点(称为鞍点的可 交换性),且在鞍点处的值都相等(称为鞍点的 无差别性)。
运筹学-对策论
3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路:对甲(乙)给出一个选取不同策 略的概率分布,以使甲(乙)在各种情 况下的平均赢得(损失)最多(最少)。 -----即混合策略
重要定理
定理 任一矩阵对策G {S1,S2;A}, 任一矩阵对策G={S1,S2;A},一定存在混 合策略意义下的解。 合策略意义下的解。 • 定理 设有两个矩阵对策 • G1= G2= G1={S1,S2;A1} G2={S1,S2;A2} • 其中A1=(aij),A2=(aij+L),L为任一常数。 A1= 其中A1 (aij),A2=(aij+L), 为任一常数。 则 • (1)G1 G2同解 G1与 同解; (1)G1与G2同解; • (2)VG2 VG2= (2)VG2=VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的,即 矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人 阶的, A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解,则很容易求解; 如果此对策有纯策略意义下的解,则很容易求解;如果没有 纯策略意义下的解, 纯策略意义下的解,则为求出各局中人的最优混合策略可求解下 列方程组: 列方程组: • a11x1+a21x2= a11y1+a12y2= a11x1+a21x2=v a11y1+a12y2=v • a12x1+a22x2= a21y1+a22y2= a12x1+a22x2=v a21y1+a22y2=v • y1+y2= x1+x2= y1+y2=1 x1+x2=1 • 当没有纯策略意义下的解时,方程组一定有严格非负解 x*= 当没有纯策略意义下的解时, x1* x2* y*=(y1*,y2*), (x1*,x2*)和y*=(y1*,y2*), 即为各局中人的最优混合策 略。
对策论模型
9 7 y E ( X , Y ) ( x,1 x) 2 8 1 y
=8xy-6y-x+8 3 1 1 8( x )( y ) 7 = 4 8 4
3 1 这就是说,局中人分别以概率 X * ( , ) 选用1,2 时,至少 4 4 1 1 7 * 赢得 7 ,同理,局中人Ⅱ分别以概率Y ( , ) 选用策略1,2, 4 8 8 1 3 1 1 7 7 。但当 X * ( , ) 或 Y * ( , ) 时,则会受到更大的 至多损失 4 4 4 8 8 损失。
1.混合策略和混合局势
一般地, 设给定 S1 , S2 ; A, 令 X ( x1 , x 2 , , x m), Y ( y1 , y2 , , yn )
m m
S {X | x i 0; x i 1}, S {Y | y j 0; y j 1}
1
1 1 3 1
-1
1 1 1 3
A=
1 -1 1 1
-1 1
这是一个两人有限零和对策。
二、在纯策略下有解的矩阵对策的解法
1.解法的思想:双方都立足在不利的情况下争取最好的结果 ──最大最小原则。 例 求解矩阵对策 ={S1,S2;A},其中:
7 3 A 16 3 1 8 2 4 4 3 0 5
解:
1
1 7 2 3 3 16 4 3
i
2
1
3
min a ij
j
max aij
8 2 4 4 3 0 5 16 2 5
8 2 max ai j 2 i 3 3
*
min aij* 2
运筹学教学-对策论公开课获奖课件百校联赛一等奖课件
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1
布
1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}
运筹学--对策论
max min E(X,Y)= min max E(X,Y)
X S1* Y S2*
Y S2* X S1*
则称这个公共值为对策G在混合意义 下的值,记为V*G,而达到V*G 的混 合局势(X*,Y*)称为对策G在混合 策略意义下的解,而X*和Y*分别称 为局中人I,II的最优混合策略。
定理14-2:矩阵对策 G = S1,S2;A
0 2 3 0
赢得矩阵为 A 2 0 3 0
0
3
0 4
0
3
4
0
14.2 矩阵对策的混合策略
定义:对给定的矩阵对策
G = Ⅰ,Ⅱ;S1,S2;A
其中 S1= 1, 2…m
S2= 1 , 2… n
A=(aij)mn
把纯策略集合对应的概率向量
X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
分别称为局中人I和局中人II的混合策略。
如果局中人I选取的策略为
X=(x1, x2 … xm) 局中人II选取的策略为
Y=(y1 , y2 … yn ),则期望值 E(X,Y)= xi aij yj=XAYT 称为局中人I期望赢得,而局势(X,Y) 称为“混合局势”,局中人I,II的混合 策略集合记为S1*, S2*。
S1= 1、 2…… m
同样,局中人II有n个策略:1、 2。。。 n ;用S2表示这些策略的集合: S2= 1、 2… n 局中人I的赢得矩阵是:
a11 a12 …… a1n a21 a22 …… a2n A= …… …… …… a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对策记为G: G= S1,S2;A
运筹学—对策论(一)
3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。
对
二人
动 策无
态
限
对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵
运筹学-10、对策论
对策论
第一节 引言
一、对策行为与对策论
对策论又称博弈论,是运筹学的一个重要分 支。对策论所研究的主要对象是带有斗争或竞争性 质的现象。由于对策论研究的对象与政治、军事、 工业、农业、交通、运输等领域有密切关系,处理 问题的方法又有着明显的特色,所以越来越受到人 们的重视。
1
在日常生活中,我们经常看到一些相互之间的 竞争、比赛性质的现象,如下棋、打扑克、体育竞 赛等。
所以:min max aij
j i
max min aij (1)
i j
i
j
另一方面,对任意i,j均有:
min aij aij max aij j i max min aij max aij
i j i
j j
max min aij min max aij (2)
i
所以: max min aij
7
例1:设有矩阵对策,局中人Ⅱ的支付矩阵如下:
7 3 A 16 3
1 8 2 4 1 9 0 5
解: α3 → β3 → α4 → β1 → α 3
如果各局中人都不想冒险,必须考虑对方会 选择策略使他得到最差的收入。因此各局中人都 选择理智的决策行为。
对策的值为VG= 5。
17
二、矩阵对策的混合策略
矩阵对策G有鞍点时,就存在最优解(最优纯策 略),但是否一切矩阵对策问题中,各局中人都有 上述意义的最优纯策略呢?答案是否定的。
1 1 0 A 1 0 1 例1:石头、剪刀、布 1 1 0
max min aij 1 min max aij 1
i j j i
不存在上述纯策略意义下的解。
物流运筹学
物流运筹学在物流系统中,物流设施地址的选择是物流系统优化的一个具有战略意义的问题。
物流设施是整个物流网络系统的关键节点,是连接上游和下游的重要环节,起着承上启下的作用,并且这些大型设施的建设与运营需要耗费大量的资源。
因此,这些设施的选址非常重要,科学合理的设施选择可以有效的节省资源,降低物流成本,优化物流网络结构和空间布局,提高物流经济效益和社会效益,确保供应优质服务,是实现集约化经营,建立资源节省型物流至关重要的一步。
国内外学者在设施选址讨论方面已形成了多种方法,大致可以分为定性讨论法, 定量讨论法及定性与定量相结合的讨论方法。
1.设施选址问题的定性讨论:定性讨论是以影响设施选址合理性的因素分析基础,如影响物流设施选址的因素很多,包括土地采用,环境爱护,资源分布,产业布局,交通区位,公共设施,市场经营等各各个方面的因素,通过综合的定性分析,建立设施选址的评价指标体系,并且常常采纳层次分析法,模糊综合评判法对各个备选方案进行指标评价,最终寻求最优地址。
可见,定性讨论从较全面的角度,将较多的因素考哦率在内,对设施选址进行决策,通过将定性指标进行评判,可以有效的吸纳决策者的阅历,偏好,意愿等来进行方案的评价,但由于定性方法在讨论过程中主观性比较强,大量的主观推断易造成评价偏差。
2.设施选址问题的定量讨论:设施选址问题的定量讨论主要是依据物流费用或物流成本最低的原则,建立数学模型,通过模型求解获得最佳选址方案,依据考虑的影响费用因素的简易与简单程度,形成多种类型的选址模型,但总体上可以概括为连续模型与离散模型两类。
对现有设施选址讨论的评述有关设施选址问题,国内外学者都进行了大量的讨论,由简洁的选址因素分析、选址原则的制定到多层次、模糊的综合指标评判与决策,由重心法到多元离散选址模型,最终定性分析与定量模型相结合,各种讨论方法从不同的角度和层次为设施选址的规划决策供应理论依据。
但上述讨论或多或少地存在着一些欠缺与问题。
管理运筹学11对策论
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
局中人甲应选择2 ,此时不管局中人乙采取什么策略,甲的
赢得均不小于3。
2024/3/29
2. 矩阵对策解的问题
设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,3,4}, S2 = {1 ,2 , 3}
Min
-4 2 -6 -6
对策矩阵G={S1,S2,A}在混合策略意义下有 解的充分必要条件是存在着
x * S1* , y * S2*使(x *,y *) 为E (x,y) 的 一个鞍点,即对于一切x S1* , y S2* 有
E (x,y *) E (x *,y *) E (x *,y)
2024/3/29
3. 矩阵对策的混合策略
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
Max
8 36
Min 3
局中人甲应选择2 ,乙应采取2策略;结果甲赢得3,乙付
出3。
2024/3/29
2. 矩阵对策解的问题
定义1:设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,…,m}, S2 = {1 ,2 , …, n}
6 5 7 5 5 0 1 -1 2 -1
Max 7 5 9 5
Min = 5
i = 1, 3 ,j = 2, 4,ai*j* = 5,四个局势均为矩 阵对策的解。
2024/3/29
3. 矩阵对策的混合策略
对矩阵对策G={S1,S2,A}来说,局中人甲 有把握的最小赢得是:
v1 = max min aij
x S1* y S2*
运筹学教 程对策论共49页PPT
11、不为五斗米折腰。 12、芳菊开林耀,青松冠岩列。怀此 贞秀姿 ,卓为 霜下杰 。
13、归去来兮,田蜀将芜胡不归。 14、酒能祛百虑,菊为制颓龄。 15、春蚕收长丝,秋熟靡王税。
Hale Waihona Puke 41、学问是异常珍贵的东西,从任何源泉吸 收都不可耻。——阿卜·日·法拉兹
42、只有在人群中间,才能认识自 己。——德国
43、重复别人所说的话,只需要教育; 而要挑战别人所说的话,则需要头脑。—— 玛丽·佩蒂博恩·普尔
44、卓越的人一大优点是:在不利与艰 难的遭遇里百折不饶。——贝多芬
45、自己的饭量自己知道。——苏联
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【例11-6】某单位采购员在秋天时要决定冬季取暖 用煤的采购量。已知在正常气温条件下需要煤15吨, 在较暖和较冷气温条件下分别需要煤10吨和20吨。 假定冬季的煤价随天气寒冷程度而变化,在较暖、 正常、较冷气温条件下,每吨煤的价格分别为500元、 750元和1000元。又设秋季时每吨煤的价格为500元, 在没有关于当年冬季气温情况准确预报的条件下, 秋季时应采购多少吨煤能使总支出最少?
0 1 1
A 1 0
1
1 1 0
最优纯策略
对策的值——一个矩阵对策G,如果其支付矩阵A
的元素满足:
max
1i m
min
1 j n
aij
min
1 j n
max
1i m
aij
则称这个值V为矩阵对策G的值。
矩阵对策G的鞍点——如果纯局势 使 (i* , j* ) ai* j* G 的值V
则称 (i* , j* ) 为对策G的鞍点,也称它是对策G在纯 策略中的解,此时 i* 与 j* 分别为局中人Ⅰ和局中人
性质:ai* j*是第j*列的最大元素,是第i*行的最小元
素。也就是说,对于纯局势(i* , j* ) ,有下式成立:
min
1 jn
ai*
j
max
1im
aij*
定理2:
若 (i, j ) 和(k , t ) 都是矩阵对策G的鞍点, 则 (i, t ) 和 (k , j ) 也都是G的鞍点(称为鞍点的可 交换性),且在鞍点处的值都相等(称为鞍点的 无差别性)。
第一节 矩阵对策及其解法
本节的主要内容
• 对策现象的三要素及其分类 • 矩阵对策的数学模型 • 最优纯策略 • 混合策略和混合扩充 • 矩阵对策基本定理 • 矩阵对策的求解
对策现象的三要素及其分类
对策现象三个基本要素:局中人(players) 、 策略集(strategies)和支付函数(赢得函数) (payoff function)。
Ⅱ的最优纯策略。
【例11-3】对于一个矩阵对策G ={Ⅰ,Ⅱ;S1,
S2;A},其中 S1 {1,2,3,4}, S2 {1, 2, 3}
5 1 7
A
3
2
5
16 1 9
4 0 4
求双方的最优策略。
定理1:
(i* , j* ) 为对策G的鞍点的充要条件是对于任意的
i,j,有aij* ai* j* ai* j ,即鞍点 (i* , j* ) 具有这样的
对策现象的分类:根据局中人的数量分为 “两人对策”和“多人对策”;根据局中人之间 是否允许合作分为“合作对策”和“非合作对 策” ;根据局中人的策略集中的策略个数可分为 “有限对策”和“无限对策” ;根据局中人的支 付函数的代数和是否为零可分为“零和对策”和 “非零和对策”等。
矩阵对策的数学模型
矩阵对策就是有限两人零和对策。即参加对策的 局中人只有两个,双方的利益是完全对抗的;每个局 中人都有有限个可供选择的策略;且在任一局势(在 对策论中,从每个局中人的策略集中各取一个策略组 成的策略组)中,一个局中人的所得即为另一个局中 人的所失,两个局中人的得失之和总等于零。
第十一章 对策论
➢矩阵对策及其解法 ➢其他类型对策问题 ➢对策论在物流企业竞争策略分析中的应用
知识目标
了解对策论模型的三要素,掌握矩阵对策的模型、 基本定理及解法;
了解其他类型对策,能够用所学对策论知识解决 一些简单的实际问题.
技能目标
根据实际问题建立支付矩阵(建模);
根据最小最大原则、最大最小原则、优超原则等, 利用图解法和线性规划法求出矩阵对策的最优策 略和对策值.
,n,
j 1
E
E(X
,Y
)
|
X
S1* , Y
S
* 2
,
称 G* {S1*, S2*; E} 为 G 的混合扩充。
矩阵对策基本定理
定理 3 对于给定的矩阵对策 G {S1, S2; A},G* {S1*, S2*; E} 为
其混合扩充。设 X * S1* ,Y * S2* ,则 X*,Y * 为 G 的最优解的充 要条件是下列三个条件中的任一个成立:
V E(X *,Y*):
m
m
aij xi V ( j 1, 2, , n); xi 0, xi 1
i 1
i 1
(11-6)
n
n
aij y j V (i 1, 2, , m); y j 0,
•混合扩充——给定一个矩阵对策 G {S1, S2; A}。设
S*1是S1上一切混合策略的集合,S*2是S2上一切混合
策略的集合:
S1*
( x1 ,
x2
,
m
, xm | xi 1且xi 0, i 1, 2,
, m,
n
, yn | y j 1且y j 0, j 1, 2,
对于一个矩阵对策,当其3个基本要素确定后,这 个对策的数学模型也就给定了。如果给定了局中人Ⅰ、 Ⅱ的纯策略集合分别为S1、S2,局中人的支付矩阵为A, 则把这个矩阵对策的数学模型记为
G ={Ⅰ,Ⅱ;S1;S2;A }或G = {S1,S2;A }
【例11-2】(“石头、剪刀、布”游戏)每个人都 可能玩过这种游戏。石头击败剪刀,剪刀战胜布, 而布又胜过石头。这里也是两个局中人:局中人Ⅰ、 Ⅱ,双方各有3个策略,策略1代表出石头,策略2代 表出剪刀,策略3代表出布。假定胜者得1分,负者 得-1分。策略一样,就算“平局”,双方都不得分。 取S1={石头、剪刀、布},S2={石头、剪刀、布},则 局中人Ⅰ的支付矩阵A为
混合策略和混合扩充
•混合策略——对于矩阵对策 G {S1, S2; A}
m
, X (x1, x2 ,
, xm )
是 S1上的一个概率分布 (xi 0, xi 1) ,局中人Ⅰ分别以
i 1
概率 x1, x2 , , xm 采用策略1,2, ,m ,则称X (x1, x2, , xm )
是局中人Ⅰ的一个混合策略。
(1)对任 X S1* ,Y S2* ,有 E(X ,Y *) E(X *,Y *) E( X *,Y ) ;
(2)对任 i 1, 2, , m , j 1, 2, , n ,有
n
m
aij y*j E( X *,Y * ) aij xi*
j 1
i 1
(11-5)
(3)存在数 V,使得 X *,Y* 是下列两组不等式的解,且