10-矩阵对策

合集下载

矩阵对策

矩阵对策
i j
max aij 对局中人 II,求 min j i
若 max min aij min max aij a i
i j j i

*
j*
策略 i , j 为I,II 的最优策略
这一对策 的值为 V a i

j
几个术语
局势 对策的解
最优纯策略
对策的值 鞍点 e. g. 2 (续)求解取暖购煤问题
两人零和对策
对抗对策(antagonistic game)
矩阵对策(matrix game)
二.实际问题中的矩阵对策模型
e. g. 1 扩大销售模型
公司I,公司II 的同一产品竞争市场份额,各有三种办 法扩大销售额(由于市场需求一定,一家扩大,意味 另一家缩减),三种方法比如:①改进包装;②广告; ③降价.公司I 的三种策略表示为 1 , 2 , 3 ,公司II 的三种策略为 1 , 2 , 3 ,在不同策略下销售量增长百 分比不同.下表中表示公司I 的增长率,而公司II 的即 为相反数
e. g. 6 (续)求最优策略与值
作业
P206,
Ex 6. 3:1,2
1=急转 2 =不转
1
给急转弯者以1 分,不转弯者以5 分 局中人II 局中人I 局 =急转 1 中 人 2=不转 II
3 5
1 =急转 2=不转
1 0
0
II 的支付矩阵
此对策中,若两者都想得5 分,则发生惨祸, 全部玩完.实际上两人最好的做法是同时停车 或转弯,各得3 分. Remark 此例已不是 2 人有限零和对策问题(因为在 每个对局中,双方支付的代数和不为零), 称为双矩阵对策.
e. g. 2 取暖购煤问题 某公司在秋末需决定冬季取暖用煤问题.根据气温 情况,用煤量和煤价均不同,可用下表表示: 正常气温 较冷气温 较暖气温 需求量15 吨 需求量20 吨 需求量10 吨 200元/吨 250元/吨 150元/吨

矩阵对策的最优纯策略

矩阵对策的最优纯策略

,m α,
,
,n β;则分别为
},m α和},n β。

当局中人Ⅰ选定纯策略i α和局中人Ⅱ选定纯策略后,就形成了一个纯局)j ,这样的纯局势共有m n ⨯个。

对任一纯局势赢得值为ij a ,称
12122
212n n m m mn a a a a a ⎤⎥⎥⎥⎥⎦
为局中人Ⅰ的赢得矩阵。

局中人Ⅱ的赢得矩阵就是当局中人Ⅰ,Ⅱ的策略集12,S S 及局中人Ⅰ的赢得矩阵对策也就给定了,记为{}12,,G S S A =。

在齐王赛马的例子中,齐王的赢得矩阵
},
,m α,
},n β,max )
成立,记其值为)成立的纯局势()
,i j αβ**
在纯策略意义下的解(或鞍点)
},m α,},n S β,
1,2,
,,m x ∑1,2,
,,n y ∑分别称为局中人Ⅰ和Ⅱ的混合策略集分别称为局中人Ⅰ和Ⅱ的混合策略(或策略),对
),m x 可设想成当两个局中人多次重复进行对策
12,,
,m ααα的频率。

若只进行一次时对策,混合
对策可设想成局中人Ⅰ对各纯策略的偏爱程度。

求解混合策略的问题有图解法,迭代法、线性方程组法和线性规划法,在。

第1章 矩阵对策

第1章  矩阵对策
策被称为矩阵对策).对策按如下方式进行,局中人 1 选择行 i ∈ M ,局中人 2 选择列 j ∈ N ,
此时局中人 1 和 2 是同时并且独立地进行选择.因此局中人 1 获得支付 aij ,局中人 2 获得支
( ) 付 −aij .如果支付是一个负数, 那么可以认为是局中人的实际损失.
记具有支付矩阵 A 的对策 Γ 为 ΓA ,并且根据矩阵的维数,称之为 (m × n) 对策.如果
果它被隐藏在那里)的概率为 0 < βi ≤ 1 ,i = 1, 2, , n .如果找到目标,局中人 1 获得收益 为α .在其中隐藏和搜索物体的坑的编号是局中人的策略,局中人 1 的支付等于期望收益与
寻找目标时所付出的努力之差.隐藏和搜索目标的问题可以转化为矩阵对策,其支付矩阵为
⎡αβ1 −τ1 −τ1 −τ1
选择进行攻击的目标(局中人 1)和防卫目标(局中人 2)的问题可以转化为矩阵对策,
其支付矩阵为
⎡β1τ1 τ1
A
=
⎢ ⎢
τ2
β2τ 2

⎢ ⎣
τn
τn
τ1 ⎤
τ2
⎥ ⎥

β

n
⎥ ⎦
例 1.1.5 (离散型搜索对策)有 n 个坑,局中人 2 在 n 个坑中之一隐藏物体,局中人
1 希望找到它.在寻找第 i 个坑时局中人 1 付出的努力为τi > 0 ,在第 i 个坑中找到目标(如
m −1 > n ,则 a10 = n +1+1 = n + 2 , a11 = n −1+1 = n , a1 j = n − j +1−1−1 = n − j −1,
2 ≤ j ≤ n .一般情况下(对任意的 m 和 n )元素 aij , i = 0, m , j = 0, n 以及支付矩阵可以

矩阵对策问题及其解法

矩阵对策问题及其解法

矩阵对策问题及其解法背景对策论研究具有竞争性质的现象。

有权决定⾃⾝⾏为的对策参加者称为局中⼈,所有局中⼈构成集合I,在⼀局对策中可供剧中⼈选择的⼀个实际可⾏的完整的⾏动⽅案成为策略,对于任意剧中⼈i∈I,都有⾃⼰的策略集S i。

⼀局对策中由各剧中⼈选定的策略构成的策略组称为局势s=(s1,...,s n),⽽全体局势集合S=S1×...×S n。

局势决定了对策的结果,对局势s∈S,局中⼈i可以得到收益H i(s),也称为局中⼈i的赢得函数。

矩阵对策即⼆⼈有限零和对策,是⼀类较为简单的对策模型。

矩阵对策基础我们假设,局中⼈ I 有纯策略α1,...,αm,局中⼈ II 有纯策略β1,...,βn,⼆者各选择⼀个纯策略则构成m×n个纯局势 (αi,βj),将 (αi,βj)下 I 的赢得值记为a i,j,设矩阵A=[a i,j],称为 I 的赢得矩阵或 II 的⽀付矩阵。

局中⼈ II 的赢得矩阵就是 −A T。

最优纯策略若纯局势 (a i∗,b j∗) 满⾜max i minj a i,j=minjmaxi a i,j=a i∗,j∗则称为矩阵对策 {S1,S2;A} 的最优纯策略。

显然,最有纯策略在赢得矩阵中对应的元素⼀定满⾜,其是所在⾏的最⼩元素,也是所在列的最⼤元素,即矩阵的鞍点。

混合策略当纯策略不存在时,我们希望给出⼀个选取不同策略的概率分布。

我们记 I,II 的概率分布向量分别为x,y,所有概率分布向量构成的集合为S1,S2,则局中⼈ I 的赢得函数为E(x,y)=x T Ay。

纯策略是混合策略的特例。

若混合局势 (x∗,y∗) 满⾜max x miny E(x,y)=minymaxx E(x,y)=E(x∗,y∗)则称为矩阵对策 {S1,S2;A} 的最优混合策略。

同样,混合策略 (x∗,y∗) 是最有混合策略的充要条件也是 (x∗,y∗) 是函数E(x,y) 的鞍点。

引论第二矩阵对策第三矩阵对策的求解

引论第二矩阵对策第三矩阵对策的求解

5.矩阵对策解的性质
*
性质5:设一矩阵对策G={S1,S2,A} ,若在S1(或、和S2)中出现被优超的策略,那么去掉被优超的策略所形成的新的矩阵对策与原矩阵对策同解。
A =
4 0 2 3 -2 -2 1 4 -4 3 7 3 8 4 5 4 6 5 6 6 5 2 7 4 3
02
田忌:上、 中、 下
2.对策行为的基本要素
*
3.对策行为的基本假设
*
对策行为总是假定每一个局中人都是“理智的”决策者,不存在利用其他局中人的决策失误来扩大自身利益的可能性或相反。
4.对策行为的分类
*
对策
动态对策
静态对策
结盟对策
不结盟对策
联合对策
合作对策
无限对策
有限对策
二人
多人
零 和
A =
-4 2 -6 -6 4 3 5 3 8 -1 -10 -10 -3 0 6 -3
Min
Max 3
局中人甲应选择2 ,此时不管局中人乙采取什么策略,甲的赢得均不小于3。
3
6
5
4
3.矩阵对策的混合策略
*
2
4.矩阵对策的基本定理
*
定理1:设矩阵对策G={S1,S2,A}在策略意义下有解的充分必要条件是存在着局势( i* ,j* )使得对于一切i与j都有aij* ai*j* ai*j成立。 定理2:对策矩阵G={S1,S2,A}在混合策略意义下有解的充分必要条件是存在着 x * S1* , y * S2*使(x *,y *) 为E (x,y) 的一个鞍点,即对于一切x S1* , y S2* 有 E (x,y *) E (x *,y *) E (x *,y)

《运筹学教程》胡云权第五版运筹学-6对策论-矩阵对策

《运筹学教程》胡云权第五版运筹学-6对策论-矩阵对策

矩阵对策的基本原理
矩阵对策的基本原理是将决策问题抽象为一个决策矩阵,其中行表示决策方 案,列表示决策因素。通过对矩阵进行分析和计算,找到最优的决策方案。
矩阵对策的应用领域
矩阵对策可以应用于各种决策问题,包括但不限于供应链管理、投资组合优化、资源分配、人力资源管理等领 域。
矩阵对策的解决方法
矩阵对策可以通过数学方法和算法来求解,例如线性规划、整数规划、动态规划等。不同的决策问题可能需要 不同的解决方法。
案例分析:矩阵对策在实际问题中的应用
本节将通过案例分析展示矩阵对策在实际问题中的应用。我们将介绍一个具体的决策问题,并演示如何使用矩 阵对学习,你已经了解了矩阵对策的基本原理、应用领域和解决方法。希望本节内容对你在运筹学领域 的学习和应用有所帮助。
《运筹学教程》胡云权第 五版运筹学-6对策论-矩 阵对策
本节将介绍运筹学中的矩阵对策,包括其概述、基本原理、应用领域、解决 方法以及在实际问题中的应用。
运筹学简介
运筹学是一门研究在资源有限的情况下如何做出最佳决策的学科。它应用数学方法和模型来协助管理者进行决 策和优化。
矩阵对策概述
矩阵对策是一种运筹学方法,通过构建决策矩阵来帮助管理者进行决策。它 可以同时考虑多个决策因素和多种决策方案,从而找到最佳决策。

第10章 第3节 矩阵对策的解法

第10章 第3节 矩阵对策的解法



(10 49 )


(10 52 )
11
例18 利用线性规划方法求解赢得矩阵为A的矩 阵对策。
7 2 9 A 2 9 0 9 0 11
12
3
Hale Waihona Puke a11a 22 a12 a 21 VG (a11 a 22 ) (a12 a 21 )
例12 求解矩阵对策G={S1,S2;A},其中
1 3 A 4 2
2. 2 n 或 m 2 对策的图解法 例13 考虑矩阵对策G={S1,S2;A},其中
2 3 11 A 7 5 2
由定理5已知,任一矩阵对策G={S1,S2;A}的求 解均等价于一对互为对偶的线性规划问题,而定理4 * 表明,对策G的解 x *和 y 等价于下面两个不等式 组的解。
8
aij xi v, i (I) xi 1 i xi 0, aij y j v, j (II) yj 1 j y j 0,
(10 40)
就是对策的值VG 。
定理11 设矩阵对策G={S1,S2;A}的值为VG , 则
VG max min E ( x, j ) min* max E (i, y ) *
xS1 1 j n yS 2 1i m
(10 41)
10
min z xi' i ' (P) a x j 1,, n ij i 1, i x ' 0, i 1,, m i max w y 'j j ( D) aij y 'j 1, i 1,, m j y ' 0, j 1,, n j

《运筹学》胡运权清华版-12-02矩阵对策基本定理

《运筹学》胡运权清华版-12-02矩阵对策基本定理
《运筹学》胡运权清华版 -12-02矩阵对策基本定理
运筹学中,矩阵对策是重要的决策分析工具。通过这个矩阵对策基本定理, 我们能够更好地理解并应用它在实际问题中。
Байду номын сангаас
矩阵对策的背景和定义
矩阵对策是一种决策分析方法,通过建立决策者与对手之间的策略矩阵,来 寻求最佳决策方案。它在解决有限决策问题中具有广泛的应用。
矩阵对策在实际问题中有广泛的应用,如在市场竞争、资源分配、风险管理 等领域。通过矩阵对策的应用,我们能够做出更明智和有效的决策。
矩阵对策在经济领域的案例分 析
矩阵对策在经济领域有着丰富的案例分析。通过深入研究这些案例,我们可 以更好地理解和应用矩阵对策的方法和技巧。
矩阵对策的优势和局限性
矩阵对策具有许多优势,如能够考虑多个因素和决策变量,以及能够量化和 比较各种策略。然而,它也存在一些局限性,如对信息和参数的需求较高。
矩阵对策的基本定理
矩阵对策的基本定理可以帮助我们确定最佳对策和策略组合。通过对矩阵对 策进行精确分析,我们能够得到优化的决策结果。
矩阵对策的解决方法
矩阵对策有多种解决方法,如通过优化算法和约束条件来求解最优解。同时, 可以利用计算机模拟和博弈理论等工具来辅助分析和决策。
矩阵对策在实际问题中的应用
结论和总结
矩阵对策是一种强大的决策分析工具,能够帮助我们做出更明智和优化的决 策。通过学习和应用矩阵对策,我们能够提高决策的准确性和效果,从而更 好地解决现实生活和工作中的问题。

对策论矩阵求解

对策论矩阵求解
故令A中每个元素减1再乘以½ ,得到
• 目前讨论 A 为支付矩阵旳对策 旳解。为此先 解方程组
•和
• 上述不等式组无解,根据计算下面两个不 等式组
二、线性规划措施
• 例2.6.3 用线性规划措施求解例
• 解:先将A旳每个元素加3,得到每个元素都是整 数旳支付矩阵
6 1 4
A1
局中人Ⅰ在这三局中合计赢得至少。后来各局均照此方 式对策下去,直到迭代旳成果到达一定旳满意程度为止。
近似解: 若设在N局对策中局中人Ⅰ出α1,α2, …,αm旳次数 为k1,k2, …,km ,局中人Ⅱ出β 1, β 2, …, β n旳次数 为l 1, l 2, …, l n ,xN=(k1 /N ,k2 /N, …,km /N), yN=(l1/N ,l2/N, …,lm /N), 则(xN, yN )就是所求近似解。
2
7
5
5 5 6
• 转而讨论以A1为支付矩阵旳矩阵对策 ,为此求
解两个互为对偶旳线性规划问题
1
1
三、迭代法
迭代法是求矩阵对策旳一种近似措施。
基本思想:
假设两个局中人反复进行对策屡次,在每 一局中各局中人都从自己旳策略集中选用 一种使对方取得最不利成果旳策略,即第t 局对策纯策略旳选择欲使对手在前t-1局中 合计所得(或合计所失)至少(或最多)
• 注:假如上述两个方程组旳分别存在非负解
x*,y*,则求得了 旳一种解(x*,y*)和对策值;

假如x*,y*中有负旳分量,则将方程组
(2.6.1),(2.6.2)中旳某些等式改为不等式试算。
例2.6.1 求解矩阵对策----田忌赛马问题。 解:已知田忌赛马问题中旳支付矩阵
• 对策 没有鞍点。为了使A中元素尽量多旳变为0,

第节矩阵对策的解法总结

第节矩阵对策的解法总结

2019/1/8
23
2019/1/8 6
例13
考虑矩阵对策 G = { S1 , S2 ; A}, 其中
2 3 11 A 7 5 2
2019/1/8
7
2019/1/8
8
如上图,由最小最大原则确定 B 点所对应的横坐标为所求, 故联立经过该点的两条直线方程: 3x 5(1 x) v x 3 , v 49 11 11 11x 2(1 x) v 即得 x1* = 3/11, x2* = 8/11,又因它们均大于零,故由定理6 * * * 又有: 2 y1 3 y2 11y3 v * * * 7 y 5 y 2 y 1 2 3 v * * * y y y 2 3 1 1
2019/1/8
16
例17
某厂用三种不同的设备 1 、 2 、 3 加工三种不同的产品 1 、 2 、 3 , 已知三种设备分别加工三种产品时, 单位时间 内创造的价值由下表给出。 被加工产品 使用设备
1
3 -1 2
2
-2 4 2
3
4 2 6
17
1 2 3
2019/1/8
2019/1/8 10
例14
用图解法求解矩阵对策 G = { S1 , S2 ; A} , 其中 2 7 A 6 6 11 2
2019/1/8
11
2019/1/8
12
例 15
求解赢得矩阵A 的矩阵对策
8 4 4 2 A 3 1 5 5 7
3. 2 线性规划方法
由定理5知, 任一矩阵对策 G = { S1 , S2 ; A}的求解均 等价于一对互为对偶的线性规划问题, 而定理4 表明, 对策 G 的解 x* 和 y* 等价于下面两个不等式组的解。

矩阵对策纯策略意义下的解

矩阵对策纯策略意义下的解

此而来。通常把矩阵对策记为
G={Ⅰ,Ⅱ;S1,S2;A} 或
G={S1,S2;A}
例:G={S1,S2,A} S1={α1,α2,α3,α4} S2={β1,β2, β3}
-6 1 -8 A= 3 2 4
9 -1 -10 -3 0 6
对于G={S1,S2;A}, 若有等式
max min aij=min max aij=ai*j*
aij*≤ai*j*≤ai*j
例如
65 15 A= 8 5 02
65 2 -1 55 62
7.3 矩阵对策混合策略意义下的解
先看一个简单的例子: A= 3 6 54
一般地,设矩阵对策G={S1,S2;A},其中 S1={α1,α2,…,αm},S2={β1,β2,…,βn}, A=(aij)m×n
为各局中人的最优混合策略。例
(2)线性规划法
当对策的值大于0时,可利用
线性规划法求解矩阵对策。构造
两个线性规划问题
min z=∑xi i
∑i aijxi≥1 (j=1,2,…,n)
xi≥0
(i=1,2,…,m)
max w=∑j yj
∑j aijyj≤1 (i=1,2,…,m)
பைடு நூலகம்
yj≥0
(j=1,2,…,n)
7.2 矩阵对策纯策略意义下的解
矩阵对策就是二人有限零和对策。设两个局中人为Ⅰ、
Ⅱ,它们各自的策略集为
S1={α1,α2,…,αm} S2={β1,β2,…,βn} 当局中人Ⅰ选定纯策略αi,局中人Ⅱ选定纯策略βj后,就 形成了一个纯局势(αi,βj),这样的纯局势共有m·n个。
对任一纯局势(αi,βj),记局中人Ⅰ的赢得值为aij,则得 矩阵 A=(aij),称为矩阵人Ⅰ的赢得矩阵。由于是零和对 策,则矩阵人Ⅱ的赢得矩阵为-A。矩阵对策的名称正是由

(优选)矩阵对策的解法详解.

(优选)矩阵对策的解法详解.
矩阵对策的解法
3.1 公式法、图解法和方程组法
1. 2×2 对策的公式法
2×2 对策是指局中人Ⅰ的赢得矩阵为2×2 阶的, 即
A
a11 a21
a12
a22
如果 A 有鞍点, 则很快可求出各局中人的最优纯策略; 如果
A 没有鞍点,则可证明各局中人最优混合策略中的 xi* , yj* 均 大于零。于是, 由定理 6 可知, 为求最优混合策略可求下列
(5)确定经过点 P 的两相交直线,根据两相交直线列出对应方程 组,求出 y*.
(6)根据定理6的结论计算 x* 的值。
2020/7/19
10
例14
用图解法求解矩阵对策 G = { S1 , S2 ; A} , 其中
2 7
A
6
6
11 2
2020/7/19
11
2020/7/19
12
例 15
求解赢得矩阵A 的矩阵对策
A 4 1
8
3 5
4 5
2 7
2020/7/19
13
2020/7/19
14
3. 线性方程组方法
根据定理4 , 求解矩阵对策解( x*, y* ) 的问题等价于求解不 等式组,又根据定理5 和定理6 , 如果假设最优策略中的 xi* 和 yj* 均不为零, 即可将上述两个不等式组的求解问题转化 成求解下面两个方程组的问题:
(1) i
i
aij xi v, j 1,2,...,n
xi 1
(2)
j j
aij y j v,i 1,2,...,m yj 1
2020/7/19
15
3. 线性方程组方法
例16
求解矩阵对策——“齐王赛马”

十对策分析PPT课件

十对策分析PPT课件
把(1,2)称为对策G在纯策略下的解, 又称(1,2)为对策G的鞍点。把其值V称 之为对策G={S1,S2,A}的值。
例2:
猜拳游戏:
没有
鞍点
乙 甲
石头 布
剪刀
max
石头 布 剪刀 min
0 -1 1 -1
1
0 -1 -1
-1
1 0 -1
1
11
P351例 某单位采购员在秋天决定冬季取暖用煤的储量 问题,已知在正常的冬季气温条件下要消耗15吨煤,在较暖 和较冷的天气下要消耗10吨和20吨。假定冬天的煤价随天气 寒冷程度而有所变化,在较暖和、正常、较冷的气候条件下 每吨煤价分别为10元、15元、20元。又设冬季时煤炭价格为 每吨10元。在没有关于当年冬季准确的气象预报的条件下, 秋天储煤多少吨能使得单位的支出最少?
二人有限零和对策(two-person zero score game)
❖对策中存在有2个局中人; ❖每个局中人的策略集的策略数是有限
的; ❖每一局势的对策都有确定的损益值,
且对同一局势的两个局中人的损益值 之和为零。 ❖例:齐王赛马
赢得矩阵:
❖将二人有限零和对策双方的得失用矩阵表示, 称为赢得矩阵,又叫支付矩阵。
在非零和对策中存在着总得益较大的策略组合和总得益较小的策略组合之间的区别这也就意味着在对策方之间存在着互相配合争取较大的总得益和个人得益的可能两人零和对策是完全对抗性的总得益为0其解法可能性根据矩阵对策予以求解但在非零和对策下矩阵对策求解法已经不适用了下面用例子予以说明
对策论
对策论
§1 对策论的基本概念(掌握) §2 矩阵对策的最优纯策略(掌握) §3 矩阵对策的混合策略(掌握)
❖在竞争过程的各方为了达到自己的 目标和利益,必须考虑对手的各种 可能的行动方案,并力图选取对自 己最为有利可最为合理的方案,

第三节矩阵对策

第三节矩阵对策

(8.3.17)
y
j
0
精品课程《运筹学》
第三节 矩阵对策
此处不证明的介绍矩阵对策的基本定理:
定理8.3.5 任一矩阵对策G S1, S2 ; A ,一定
存在混合意义下的解。
下面是矩阵对策及其纳什均衡的若干性质.
定理8.3.6 设(x* , y* )是矩阵对策G 的纳什
均衡,V VG ,则
(1)若 (2)若
第三节 矩阵对策
§3.5 优超及矩阵对策的求解
定义8.3.5设有矩阵对策G S1, S2; A ,其中
A S1 ={ 1,2,,m },S2={1, 2 ,, n},
=
(aij
)

mn
若对
j 1,2,n
有 ai1 j ai2 j
则称局中人I的纯策略 i2 优于纯策略 i1 ;同样
地,若对 i 1,2,m 有 aij1 aij2
精品课程《运筹学》
第三节 矩阵对策
或等于1/2倍的2、3列之和,划去第一列,又将
第一行划去得2
x*
(0,0,
4 5
,
1 5
),
y*
2矩阵
(0,0,
3 5
,
2 5
4
)0
2 8
,即求最优解 。
2. 2 n

e
m2
矩阵对策的图解法
Q
1a
f
B'
c
3
d
o
A' P 2 b
x
1 x
图8.3.1
精品课程《运筹学》
对策的两个解,则( 为最优解。
i1
,
j2
)与(
i2

矩阵对策的基本理论

矩阵对策的基本理论
解:采购员为局中人Ⅰ,他有三个策略:在秋季购煤 100 吨,150 吨和 200 吨,分别记 为α1、α2、α3;大自然为局中人Ⅱ,它也有三个策略,“选择”冬季气候较暖、正常、较冷, 分别记为 β1、β2 和 β3。以冬季取暖购煤的实际费用作为局中人Ⅰ的赢得,它等于秋季购煤 费用和冬季用煤不够时再补购的费用之和,赢得矩阵为
A
a21
a22
a2n
am1 am2 amn
(12-3)
为局中人Ⅰ的赢得 矩阵。由于对策为零和的,故局中人 Ⅱ的赢得矩阵为-A。
当局中人Ⅰ、Ⅱ的策略集 S1, S2 及局中人Ⅰ的赢得矩阵 A 确定后,一个矩阵对策就给定
了。因此将矩阵对策表示为 G S1,S2;A.
矩阵对策的最优纯策略
x E m
x
x , x ,, x
12
m
T
,
x i
0, i
1,,
m,
m
x i
i 1
1
S 2
y
E
n
y
y , y ,, y
12
n
T,
y j
0,
j
1,
n,
n
j 1
y j
1
S 和S 1
2
分别称为局中人Ⅰ和Ⅱ的混合策略集;
x
S
1
和y
S
2
分别称为局中人Ⅰ和Ⅱ
的混合策略;当
x
S 1
和y
S
2
其中, T G1
和T G 2
分别为局中人 I 和 II 的策略集。
运筹学
使自己的赢得尽可能的小,理性的选择就应该是从各自可能出现的最不利的情形中争取尽可
能好的结果。

第10章 第2节 矩阵对策的基本原理

第10章 第2节 矩阵对策的基本原理

v 2 min max E(x, y) * *
yS2 xS1
20

max min E(x, y) min E(x , y) E(x , y ) * * *
xS1 yS2 yS2 * * * min max E(x, y) max E(x, y ) E(x , y ) * * * yS2 xS1 xS1 * * *
实际中出现的更多情形是v1< v2,根据定义1, 对策不存在纯策略意义下的解。例如:赢得 矩阵为
3 A 5
6 4
16
v1 max min aij 4,
i j
i 2
*
v 2 min max aij 5,
j i
j 1
*
v 2 5 4 v1
想法:是否可以给出一个选取不同策略的 概率分布?
a12 a22 amቤተ መጻሕፍቲ ባይዱ2
a1n a2 n amn
2
为局中人I的赢得矩阵(或局中人II的支付矩阵)。由 于假定对策为零和的,故局中人II的赢得矩阵就是 -A。通常,将一个矩阵对策记成 G={I,II;S1,S2;A} 或 G={S1,S2;A}
例:齐王赛马
赢得矩阵为:
3 1 1 1 1 1 1 3 1 1 1 1 1 1 3 1 1 1 A 1 1 1 3 1 1 1 1 1 1 3 1 1 1 1 1 1 3
5
当矩阵对策模型给定后,各局中人面临的问题便是 如何选取对自己最有利的纯策略,以谋取最大的赢 得(或最少损失)。

1
S1 1 , 2 ,, m
S2 1 , 2 ,, n

10-矩阵对策

10-矩阵对策

(X*,Y*) —— 对策G在混合策略意义下的解 E(X*,Y*) —— 对策G的值,记为 v* ,即 v*= max min E(X,Y) = min max E(X,Y) = E(X*,Y*)
X Y Y X
这样,对策在纯策略意义下的解(α* , β*)就成为(X*, Y*) 的一种特殊情况。
20
24
第10章
矩阵对策
6
第10章
矩阵对策
10.1 基本概念
则 S1 与 S2 构成 m×n 个局势 令 (αi , βj ) ,
i = 1, 2, · · · , m; j = 1, 2, · · ·, n
aij ——甲方关于局势 (αi , βj ) 的赢得 则所有 aij 构成一个矩阵 A = ( aij )m×n 称为甲方的赢得矩阵。 由于甲、乙双方得失总和恒为零,所以A还可称为 乙方的损失矩阵,而 –A 即乙方的赢得矩阵。
19
第10章
矩阵对策
10.1 基本概念
(4) 若有X*∈S1*, Y*∈S2*, 使 E(X*,Y*) = max min E(X, Y) = min max E(X, Y)
X Y Y X

X* —— 甲方的最优混合策略 Y* —— 乙方的最优混合策略 简称最优策略;而
如例2 : X*= (0, 1, 0)T α 2 Y*= (0, 0, 1, 0)Tβ 3
5
第10章
矩阵对策
10.1 基本概念
三、矩阵对策的基本模型
在二人有限零和对策中,设以甲方、乙方表示两个
局中人, 以 S1 = {α1,α2 , · · · , αm } S2 = {β1,β2 , · · · , βn } 分别表示甲方、乙方的策略集,

第 11.2 节 矩阵对策的基本定理

第 11.2 节 矩阵对策的基本定理

2014-5-24
2
当局中人Ⅰ选定纯策略 i 和局中人Ⅱ选定纯策略 j 后, 就 形成了一个纯局势(i , j )。这样的纯局势可构成 m× n 矩 阵。对任一纯局势(i , j ) , 记局中人Ⅰ的赢得值为 aij , 则称 矩阵 A = ( aij )mn 为局中人 I 的赢得矩阵(或为局中人 II 的支 付矩阵),这样,局中人 II 的赢得矩阵即为 –A。 矩阵对策常记为:G = {I, II; S1, S2; A}或 G = { S1, S2; A}
j
综上可得

2014-5-24
aij* max aij* ai* j* min ai* j ai* j
i j
aij* ai* j* ai* j
11
定义2 设 f ( x, y)为一个定义在 x∈ A 及 y ∈ B 上的实 值函数, 如果存在 x* A, y* B, 使得对一切 x A 和 y B, 有 f ( x, y* )≤ f ( x* , y* )≤ f ( x* , y) 则称 ( x* , y* ) 为函数 f 的一个鞍点。 矩阵对策的解与鞍点
第11 章 对策论基础
第 2 节 矩阵对策的基本定理
2. 1 矩阵对策的数学模型
二人有限零和对策
二人零和对策就是矩阵对策, 是指只有两个参加对策的局中 人, 每个局中人都只有有限个策略可供选择。在任一局势下, 两个局中人的赢得之和总是等于零, 即双方的利益是激烈对 抗的。
矩阵对策的表示
设局中人Ⅰ有 m 个纯策略 1 , 2 , ⋯ , m , 局中人Ⅱ有 n 个 纯策略 1 , 2 , ⋯ , n , 则局中人Ⅰ、Ⅱ的策略集分别为 S1 = {1 , 2 , ⋯ , m} S2 = {1 , 2 , ⋯ , n}
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

19
第10章
矩阵对策
10.1 基本概念
(4) 若有X*∈S1*, Y*∈S2*, 使 E(X*,Y*) = max min E(X, Y) = min max E(X, Y)
X Y Y X

X* —— 甲方的最优混合策略 Y* —— 乙方的最优混合策略 简称最优策略;而
如例2 : X*= (0, 1, 0)T α 2 Y*= (0, 0, 1, 0)Tβ 3
ark = max min aij = min max aij j i i j 则把 ark 所对应的局势 (αr , βk ) 称为对策G的解或鞍点, 分别称 αr —— 甲方的最优纯策略,记为α* =αr
βk —— 乙方的最优纯策略,记为β* =βk
ark —— 对策G的值,记为v 即
12
v = max min aij = min max aij = ark
第10章 矩阵对策
7
10.1 基本概念
由此可见,在二人有限零和对策中,给定一个局中人的
赢得矩阵,则另一个局中人的赢得矩阵也就唯一确定了,而
且双方的策略数目也就唯一确定了。这意味着二人有限零和 对策总可以由一个局中人的赢得矩阵来刻画,故称这种对策 为矩阵对策。 其基本模型记为
G = { S1, S2, A }
事先公开这一点,甲方也无法利用这一信息使乙方的损失
比 v 更多。
14
第10章
矩阵对策
10.1 基本概念
例3 求解对策G = { S1, S2, A }, 其中: 4 3 6 3
A = -2
5
2
3 β2 β3
0
4 β4
-6
3 min aij
j
解 α1
β1
4
3 3
2 3 3 (min)
6
0 4 6
3 3
(11-3)
上式意味着:ark 是它所在行的诸元素中的最小者,
同时又是它所在列的诸元素中的最大者。
13
第10章
矩阵对策
10.1 基本概念
最优纯策略具有下述性质:
(1) 若甲方采用α* =αr ,则他的赢得至少是v, 即便 事先公开这一点, 乙方也无法利用这一信息使甲方的赢得 比 v 更少。
(2) 若乙方采用β* =βk ,则他的损失至多是v,即便
β1 = (上、中、下), β2 = (上、下、中) β3 = (中、下、上), β4 = (中、上、下) β5 = (下、上、中), β6 = (下、中、上)
9
第10章
矩阵对策
10.1 基本概念
则田忌的赢得矩阵为:
β1
α1 α2 α3 A= α4 α5 α6
10
β2
-1 -3 -1
β3 β4
1 -1 -3 -1 1 -1
21
第10章
矩阵对策
10.1 基本概念
推论 设v* 是对策 G = { S1, S2, A }的值,则方程组 m
∑a ij xi ≥ v*, i=1 ∑ x =1 j=1 i xi ≥ 0,
m
j=1, 2, …, n
(Ⅰ )
n
的解 X* = ( x1*, x2*, … ,
i=1, 2, …, m xm* )T 是甲方的最优策略; i=1, 2, …, m
二、 对策的分类
局中人数: 二人对策 策略数: 有限对策 得失总和: 零和对策
4
多人对策 无限对策 非零和对策 矩阵对策
第10章
10.1 基本概念
二、 对策的分类(续) • 按相互关系:
协商对策
• 平等对策 • 主从对策 对抗对策
联合对策
• 多人对策 结 盟对策 不结盟对策 合作对策
• 按数学模型:矩阵对策、树图对策、微分对策。
17
y = 1/3 1 - y = 2/3
第10章
矩阵对策
10.1 基本概念
(1) 把S1上的概率分布 X = ( x1, x2, · · ·, xm )T 称为甲方的混合策略, 把S2上的概率分布 Y = ( y 1, y 2, · · ·, yn )T 称为乙方的混合策略, 称 ( X, Y ) 为对策G的一个混合局势。 (2) 称数学期望
16
第10章
矩阵对策
10.1 基本概念
αi
aij βj
α1 α2
β1
7 3
β2
4 6
P(αi) x
1-x
P(βj)
y 1-y
局中人甲的期望赢得为:
X = ( x1, x2 )T = ( x, 1-x )T Y = ( y1 , y 2 ) T = ( y, 1-y)T X* = (1/2, 1/2)T Y* = (1/3, 2/3)T E ( X* , Y* ) = 5
(3)得失:一局对策的结果,诸如胜负、名次、损益、效用,等等,
统称为得失。
3
第10章
矩阵对策
10.1 基本概念
例1 田忌赛马
(1)局中人:田忌、齐王;
(2)策
略: 3 匹马参赛的顺序: (上,中,下), (上,下,中) (中,下,上), (中,上,下) (下,上,中), (下,中,上) 策略集:每个局中人所有策略构成的集合。 局势: ((下,上,中), (上,中,下)) (3)得 失:一局千金。
-6 3 3 (min)
3 (max) -6 3 (max)
A = α2 - 2 5 α3 max aij 5
i
15
第10章
矩阵对策
10.1 基本概念 10.1.3 混合策略
一、矩阵对策的解
如前所述, 有些矩阵对策在纯策略下无解。那么在这种
情况下,双方应如何决策呢? 例4 已知对策G = { S1, S2, A }, 其中: S1 = {α1,α2 }, A= 7 3 S2 = {β1, β2 } 4 6
i j j i 第10章 矩阵对策
(11-2)
10.1 基本概念
二、鞍点属性
定理1 对策G = { S1, S2, A }在纯策略意义下有解的
充要条件是:矩阵A中存在一个元素 ark ,它对一切 i 、j 都满足:
aik≤ark≤arj ,
i =1, 2, · · ·, m; j = 1, 2, · · ·, n
Games Theory
第 10 章 矩 阵 对 策
——对策论的第一扇大殊方法 10.3 线性规划法
2
第10章
矩阵对策
10.1 基本概念
10.1.1 引言 一、对策现象及其三个要素
对策:就是竞争或斗争中的决策。 对策现象的三个要素:局中人、策略、得失。 (1)局中人:参与对策并有切身利益关系与决策权的个人或集体。 假设:局中人都是聪明的。 (2)策略:每个局中人为了自身利益所能采取的对付其他局中人的 办法或措施,称为该局中人的策略。 一个策略应是在一局对策中,从始至终采取的所有行动的 一套完整方案。
其中 A = (aij)m×n 规定为甲方的赢得矩阵。
8
第10章
矩阵对策
10.1 基本概念
例1 田忌赛马 设以 S1 = {α1,α2 , α3 , α4, α5, α6 }表示田忌的策略集, 其中: α1 = (上、中、下), α2 = (上、下、中) α3 = (中、下、上), α4 = (中、上、下) α5 = (下、上、中), α6 = (下、中、上) 以 S2 = {β1 ,β2 , β3 , β4 , β5 , β6 }表示齐王的策略集, 其中:
(X*,Y*) —— 对策G在混合策略意义下的解 E(X*,Y*) —— 对策G的值,记为 v* ,即 v*= max min E(X,Y) = min max E(X,Y) = E(X*,Y*)
X Y Y X
这样,对策在纯策略意义下的解(α* , β*)就成为(X*, Y*) 的一种特殊情况。
20
E(x, y) =∑aijP(αiβj ) = ∑∑aijP(αi ) P(βj ) = 7xy + 4x(1-y) + 3(1-x)y + 6(1-x)(1-y) = 6 xy -3y -2 x +6 = 6y(x -1/2) -2(x -1/2) +5 = 6(x -1/2 )(y -1/3 ) + 5 x = 1/2 1 - x = 1/2
24
第10章
矩阵对策
10.2 特殊方法
6
第10章
矩阵对策
10.1 基本概念
则 S1 与 S2 构成 m×n 个局势 令 (αi , βj ) ,
i = 1, 2, · · · , m; j = 1, 2, · · ·, n
aij ——甲方关于局势 (αi , βj ) 的赢得 则所有 aij 构成一个矩阵 A = ( aij )m×n 称为甲方的赢得矩阵。 由于甲、乙双方得失总和恒为零,所以A还可称为 乙方的损失矩阵,而 –A 即乙方的赢得矩阵。

∑a ij yj ≤ v*, i=1
(Ⅱ )
∑ y =1 j=1 j yj ≥ 0,
第10章
j=1, 2, …, n
n
的解 Y* = ( y1*, y2*, … , yn* )T 是乙方的最优策略;
22
矩阵对策
10.1 基本概念
定理4 若 ( X*, Y* ) 是矩阵对策G的解, v*是G的值,
A = α2
α3 max aij
3
(min)
(α2 , β3 )为最优纯局势。
11
坏中求好
第10章
矩阵对策
10.1 基本概念
设有对策G = { S1, S2, A }, 其中 S1 = {α1,α2 , … , αm }, A = (aij)m×n S2 = {β1 ,β2 , … , βn }
相关文档
最新文档