第一引论第二矩阵对策第三矩阵对策的求解-资料

合集下载

对策问题的提出对策论模型矩阵对策的解法◎知识归纳

8.2.1 对策模型的基本要素
（1）局中人在一个对策行为中，有权决定自己行动方案的对策参加者被称为局中人。局中人除了理解为个人外还可以理解为集体，如球队、交战国、企业公司等，也可以把大自然理解为局中人（因为人类经常处于和大自然斗争的状态中）；另外，还假定局中人都是聪明的，有理智的和利己的。同时，为使所研究的问题更加清晰，把那些利益完全一致的参加者们看做一个局中人，因为他们利害一致，必使他们齐心合力，相互配合行动如一个人。例如，桥牌游戏中，东西双方利益一致，南北两方得失相当，所以虽有四人参加，只能算有两个局中人。一个对策中一般要求至少有两个局中人。每个局中人用i表示，局中人的集合用字母I表示，则I＝｛1，2，…，n｝。我们称只有两个局中人的对策现象为“两人对策”，如象棋、桥牌等，显然上述齐王赛马中局中人也是两人，即I＝｛1，2｝。而多于两个局中人的对策称为“多人对策”。另外根据局中人之间是否允许进行合作，还可有“结盟对策”和“不结盟对策”，或称为“合作博弈”和“非合作博弈”。
（2）物流仓储优化策略【例8.2】一仓储供应中心为其下游的一家生产企业供应某种原料。生产企业根据产品订单情况对原料的需求进行分析，分别有淡季、旺季和正常三种情况，在正常情况下需要原料15吨，在淡季和旺季情况下分别需要原料10吨和20吨；而原料的价格与原料市场的需求有关，在淡季、正常、旺季三种情况下，每吨原料的价格分别为100元、150元和200元，已知此时每吨原料的价格为100元。问在生产企业对原料的需求没有确定预知的条件下，此时应采购多少吨原料才能使仓储供应中心的总成本最少（不计存储费用）？这个问题可看成一个博弈问题。即仓储供应中心针对可能出现的三种不同的原
8.1.2 对策论在现代物流管理中的运用
在现代物流管理实践中，决策者们为了谋求自身的不断发展，保持自身的竞争优势，必须不断地审时度势、不停地进行选择和作出决定，以保证最大限度地降低物流成本、提高物流效率及服务水平。他们的选择和决定会影响到竞争对手的决策结果，同样竞争对手的选择和决定也直接影响着他们的决策结果。也就是说，决策者在决策时必须要考虑到对手的策略，因此，博弈论的思想已完全融入到现代物流管理的每一个环节中。博弈论在现代物流管理中的运用主要有物流项目投资、物流市场竞争对策、物流服务价格策略、物流中心选址、物流运输规划、物流仓储优化等内容。以下仅就本书涉及到的有关博弈论中矩阵对策的例子作简要介绍。

矩阵对策问题及其解法

矩阵对策问题及其解法背景对策论研究具有竞争性质的现象。

有权决定⾃⾝⾏为的对策参加者称为局中⼈，所有局中⼈构成集合I，在⼀局对策中可供剧中⼈选择的⼀个实际可⾏的完整的⾏动⽅案成为策略，对于任意剧中⼈i∈I，都有⾃⼰的策略集S i。

⼀局对策中由各剧中⼈选定的策略构成的策略组称为局势s=(s1,...,s n)，⽽全体局势集合S=S1×...×S n。

局势决定了对策的结果，对局势s∈S，局中⼈i可以得到收益H i(s)，也称为局中⼈i的赢得函数。

矩阵对策即⼆⼈有限零和对策，是⼀类较为简单的对策模型。

矩阵对策基础我们假设，局中⼈ I 有纯策略α1,...,αm，局中⼈ II 有纯策略β1,...,βn，⼆者各选择⼀个纯策略则构成m×n个纯局势 (αi,βj)，将 (αi,βj)下 I 的赢得值记为a i,j，设矩阵A=[a i,j]，称为 I 的赢得矩阵或 II 的⽀付矩阵。

局中⼈ II 的赢得矩阵就是 −A T。

最优纯策略若纯局势 (a i∗,b j∗) 满⾜max i minj a i,j=minjmaxi a i,j=a i∗,j∗则称为矩阵对策 {S1,S2;A} 的最优纯策略。

显然，最有纯策略在赢得矩阵中对应的元素⼀定满⾜，其是所在⾏的最⼩元素，也是所在列的最⼤元素，即矩阵的鞍点。

混合策略当纯策略不存在时，我们希望给出⼀个选取不同策略的概率分布。

我们记 I,II 的概率分布向量分别为x,y，所有概率分布向量构成的集合为S1,S2，则局中⼈ I 的赢得函数为E(x,y)=x T Ay。

纯策略是混合策略的特例。

若混合局势 (x∗,y∗) 满⾜max x miny E(x,y)=minymaxx E(x,y)=E(x∗,y∗)则称为矩阵对策 {S1,S2;A} 的最优混合策略。

同样，混合策略 (x∗,y∗) 是最有混合策略的充要条件也是 (x∗,y∗) 是函数E(x,y) 的鞍点。

运筹学第15章对策论

管理运筹学
23
• 局中人1为了使此值达到最大，就调整x1和 x2的值；而局中人2为了使此值达到最小，也要调整y1和y2的值。 • 此时，上述问题变为条件极值问题，可用拉格朗日乘数法求解，令λ 、μ为待定系数，将式 • W=10x1y1-5x1y2-5x2y1+ λ (x1+x2-1)+ μ(y1+y2-1) • 对x1、x2、y1、y2求偏导数，并让它们等于 0。
下面矩阵称齐王的赢得矩阵：
3 1 1 -1 1 1 1 1 1 3 1 1 -1 3 1 1 1 3 1 1 -1 1 -1 1 -1 1 1 1 3 1 1 -1 1 1 1 3
A=
管
理
运
筹
学
6
§1 对策论的基本概念
二人有限零和对策（又称矩阵对策）：局中人为2；每个局中人的策略集的策略数目都是有限的；每一局势的对策均有确定的损益值，并且对同一局势的两个局中人的益损值之和为零。
消耗10吨和20吨。假定冬天的煤价随天气寒冷程度而有所变化，在
较暖和、正常、较冷的气候条件下每吨煤价分别为10元、15元、20 元。又设冬季时煤炭价格为每吨10元。在没有关于当年冬季准确的气象预报的条件下，秋天储煤多少吨能使得单位的支出最少？解：局中人I为采购员，局中人II为大自然，采购员有三个策略，买10吨、15吨、20吨。分别记为1，2，3。大自然也有三个策略：暖、正常、冷，分别记为1，2，3。
8 2 A 9 0 5 3 5 2 8 5 2 1 6 5 3 3
求纳什均衡
1 2 3 4 min
【解】直接在赢得表上计算，有
max min ai* j min max aij* ai* j*

矩阵对策的最优纯策略

,m α，
,
,n β；则分别为
},m α和},n β。

当局中人Ⅰ选定纯策略i α和局中人Ⅱ选定纯策略后，就形成了一个纯局)j ，这样的纯局势共有m n ⨯个。

对任一纯局势赢得值为ij a ，称
12122
212n n m m mn a a a a a ⎤⎥⎥⎥⎥⎦
为局中人Ⅰ的赢得矩阵。

局中人Ⅱ的赢得矩阵就是当局中人Ⅰ，Ⅱ的策略集12,S S 及局中人Ⅰ的赢得矩阵对策也就给定了，记为{}12,,G S S A =。

在齐王赛马的例子中，齐王的赢得矩阵
},
,m α，
},n β，max ）
成立，记其值为）成立的纯局势()
,i j αβ**
在纯策略意义下的解（或鞍点）
},m α，},n S β，
1,2,
,,m x ∑1,2,
,,n y ∑分别称为局中人Ⅰ和Ⅱ的混合策略集分别称为局中人Ⅰ和Ⅱ的混合策略（或策略），对
),m x 可设想成当两个局中人多次重复进行对策
12,,
,m ααα的频率。

若只进行一次时对策，混合
对策可设想成局中人Ⅰ对各纯策略的偏爱程度。

求解混合策略的问题有图解法，迭代法、线性方程组法和线性规划法，在。

对策论矩阵求解

故令A中每个元素减1再乘以½ ，得到
• 目前讨论 A 为支付矩阵旳对策旳解。为此先解方程组
•和
• 上述不等式组无解，根据计算下面两个不等式组
二、线性规划措施
• 例2.6.3 用线性规划措施求解例
• 解：先将A旳每个元素加3，得到每个元素都是整数旳支付矩阵
6 1 4
A1
局中人Ⅰ在这三局中合计赢得至少。后来各局均照此方式对策下去，直到迭代旳成果到达一定旳满意程度为止。
近似解：若设在N局对策中局中人Ⅰ出α1,α2, …,αm旳次数为k1,k2, …,km ,局中人Ⅱ出β 1, β 2, …, β n旳次数为l 1, l 2, …, l n ，xN=(k1 /N ,k2 /N, …,km /N), yN=(l1/N ,l2/N, …,lm /N)，则（xN， yN ）就是所求近似解。
2
7
5
5 5 6
• 转而讨论以A1为支付矩阵旳矩阵对策，为此求
解两个互为对偶旳线性规划问题
1
1
三、迭代法
迭代法是求矩阵对策旳一种近似措施。
基本思想：
假设两个局中人反复进行对策屡次，在每一局中各局中人都从自己旳策略集中选用一种使对方取得最不利成果旳策略，即第t 局对策纯策略旳选择欲使对手在前t-1局中合计所得（或合计所失）至少（或最多）
• 注：假如上述两个方程组旳分别存在非负解
x*,y*，则求得了旳一种解(x*,y*)和对策值；
•
假如x*,y*中有负旳分量，则将方程组
(2.6.1),(2.6.2)中旳某些等式改为不等式试算。
例2.6.1 求解矩阵对策----田忌赛马问题。解：已知田忌赛马问题中旳支付矩阵
• 对策没有鞍点。为了使A中元素尽量多旳变为0，

矩阵对策纯策略意义下的解

此而来。通常把矩阵对策记为
G＝{Ⅰ,Ⅱ;S1,S2;A} 或
G＝{S1,S2;A}
例：G={S1,S2,A} S1={α1,α2,α3,α4} S2={β1,β2, β3}
-6 1 -8 A= 3 2 4
9 -1 -10 -3 0 6
对于G＝{S1,S2;A}，若有等式
max min aij＝min max aij＝ai*j*
aij*≤ai*j*≤ai*j
例如
65 15 A= 8 5 02
65 2 -1 55 62
7.3 矩阵对策混合策略意义下的解
先看一个简单的例子: A= 3 6 54
一般地，设矩阵对策G＝{S1,S2;A}，其中 S1＝{α1,α2,…,αm}，S2＝{β1,β2,…,βn}， A＝（aij）m×n
为各局中人的最优混合策略。例
(2)线性规划法
当对策的值大于0时,可利用
线性规划法求解矩阵对策。构造
两个线性规划问题
min z＝∑xi i
∑i aijxi≥1 (j=1,2,…,n)
xi≥0
(i=1,2,…,m)
max w＝∑j yj
∑j aijyj≤1 (i=1,2,…,m)
பைடு நூலகம்
yj≥0
(j=1,2,…,n)
7.2 矩阵对策纯策略意义下的解
矩阵对策就是二人有限零和对策。设两个局中人为Ⅰ、
Ⅱ，它们各自的策略集为
S1＝{α1,α2,…,αm} S2＝{β1,β2,…,βn} 当局中人Ⅰ选定纯策略αi，局中人Ⅱ选定纯策略βj后，就形成了一个纯局势(αi,βj)，这样的纯局势共有m·n个。
对任一纯局势(αi,βj)，记局中人Ⅰ的赢得值为aij，则得矩阵 A=（aij），称为矩阵人Ⅰ的赢得矩阵。由于是零和对策，则矩阵人Ⅱ的赢得矩阵为-A。矩阵对策的名称正是由

对策论

对策论
在日常生活中，经常可以看到一些具有相互斗争或竞争性质的行为，
如下棋、打牌、体育比赛等还有企业间的竞争、军队或国家间的战争、政治斗争等，都具有对抗的性质。
这种具有竞争或对抗性质的行为称为对策行为。
在这类行为中，各方具有不同的目标和利益。为实现自己的目标和利益，各方必须考虑对手可能采取的行动方案，并力图选择对自己最为有利或最为合理的行动方案。
在田忌赛马中
局中人集合I={1，2}
齐王和田忌的策略集合可分别用S1={α1,…,α6}, S2={β1,…,β6}
齐王的任一策略αi和田忌的任一策略βj就构成了一个局势sij
如果α1 =（上，中，下）， β1 =（上，中，下），则在局势s11下，齐王的赢得为H1(s11)=3,田忌的赢得为H2(s11)=-3
6 1 8 3 2 4 A 9 1 10 3 0 6
局中人Ⅰ当然也会猜到局中人Ⅱ的这种心理，转而出α4来对付，使局中人Ⅱ得不到10，反而失掉6； …… 如果双方都不想冒险，都不存在侥幸心理，而是考虑到对方必然会设法使自己所得最少这一点，就应该从各自可能出现的最不利情形中选择一个最有利的情形作为决策一句。这就是所谓的“理智行为”，也是对策双方实际上可以接收并采取的一种稳妥的方法。
对策问题举例：市场购买力争夺问题
据预测，某乡镇下一年的饮食品购买力将有4000万元。乡镇企业和中心城市企业饮食品的生产情况是：乡镇企业有特色饮食品和一般饮食品两类，中心城市企业有高档饮食品和低档饮食品两类产品。他们购买这一部分购买力的结局表如下。
乡镇企业所得（万元）
乡镇企业的策略出售特色饮食品
即局中人Ⅰ、Ⅱ的策略集分别为

运筹学—对策论(四)

运筹学—对策论(四)
补充定理:
定理9 设(x*,y*)是矩阵对策G的解， υ =VG，则
=υ ⑴若xi*>0, 则 ∑ aijyj* j =υ ⑵若yj*>0, 则 ∑ aijxi* i ⑶若 ∑ aijyj* < υ 则xi*=0 j 则yj*=0 ⑷若 ∑ aijxi* >υ i
§3矩阵对策的解法
A
1 Ⅱ
Ⅰ
V=2x+7(1-x)
7 5 2
0
· β2 · β3 · B
1
β1
B
B2
Ⅰ
方程组：
折线B1 B B2 B3上的点的 · 11 纵坐标就是对应x的最小赢得值。按最大最小原则应选择x=OA， · 3 AB即为对策值。为求 B3 · 2 出x和对策值VG，可 1 Ⅱ 求 x=3/11, VG=49/11。所以
过数轴上O和1的两点作两条垂线Ⅰ–Ⅰ ,Ⅱ –Ⅱ,在垂线上把局中人Ⅰ采取纯策略α1和α2时，局中人Ⅱ分别采取纯策略β 1, β 2, β 3 时的赢得值标出。如图 Ⅰ Ⅱ 折线B1 B B2 B3上的点的 V=2x+7(1-x) · 11 纵坐标就是对应x的最 β1 小赢得值。按最大最 7 · β 小原则应选择x=OA， 5 ·2 β3 · 3 AB即为对策值。为求 B B2 2 · B1 B3 · 2 出x和对策值VG，可 0 Ⅰ
A
1 Ⅱ
Ⅰ
V=2y+7(1-y) B
B2 Ⅱ
B1 α 1
1 Ⅱ
折线B1 B B2 上的点的纵 · 11 坐标就是对应y的最大损失值。按最小最大原则应选择y=OA，AB即 · 3 为对策值。为求出y和 ·2 对策值VG，可求
方程组：

运筹学(2)复习重点

运筹学(2)复习重点2021年运筹学（2）期末复习重点提醒：同学们要真正理解并掌握以下内容，不要死记硬背！第一部分对策论1. 对策行为的三个基本要素：局中人、策略集和赢得函数（支付函数）（掌握局中人、策略集、局势和赢得函数（支付函数）的含义；对实际问题能根据某一局中人、策略集及赢得矩阵建模求解。

） 2. 对策的分类3. 矩阵对策的研究对象：二人有限零和对策4. 平衡局势的定义，最优纯策略的定义，及求解方法。

5. 纯策略意义下有解的充要条件 6. 矩阵的鞍点、对策的鞍点7. 当矩阵对策的解不唯一时，解之间的关系所具有的性质：无差别性；可交换性。

（要理解这两个性质）8. 理解矩阵对策的混合策略、混合局势、各局中人的赢得函数、混合扩充以及矩阵对策在混合策略意义下的解的定义。

10. 矩阵对策在混合策略意义下有解的充要条件 11. 矩阵对策的求解（重点掌握矩阵对策的几个基本定理，如定理4、6、7、8、10，理解定理所揭示的内容）（1）灵活运用定理7和8（课后习题15）；（2）熟练运用定理4和6，在后续矩阵对策的诸多求解方法中，经常会结合这两个定理，通过对例题的复习掌握这两个定理；（3）理解优超的含义，能运用优超原则（定理10是优超原则求解矩阵对策的依据）求解矩阵对策（例题11及课后习题13）；（4）掌握其他求解方法：公式法、图解法（例题13、14）、方程组法（例题16、17）。

第二部分存储论（库存论）1.备货时间、提前时间及存储策略的概念。

2.费用结构：存储费、订货费、生产费及缺货费及相关概念。

3.存储策略概念及常见的存储策略类型 4.确定性存储模型（1）模型1、2、3的最优订货批量(E.O.Q)，对应的最佳费用及存储策略。

（2）掌握上述模型的费用结构，能够写出费用函数。

5.两种价格折扣的类型：全单位量折扣和增量折扣理解两种价格折扣的定义。

全单位量价格折扣情况下的最优订购批量的计算。

（结合例题6理解书上的求解步骤） 6.随机性存储模型（1）模型5（报童问题）掌握最佳报纸份数的判断条件（结合例7和8）（2）模型7（（s,S）型存储策略）掌握例题9-11第三部分排队论1. 排队系统的组成部分：输入过程、排队规则、服务机构。

第十二章对策论(运筹学讲义)

因 min aij 在i = i* 时达到最大，即
j
v
max min aij min ai* j ai* j
i j j
j
aij 在 j = j * 时达到最小，即同样 max j
min max aij max aij* aij*
j i i
ai j* ai* j* ai* j
在如此反复对策的过程中，各局中人如果不想冒险，就应该考虑从自身可能出现的最坏情况下着眼，去选择一种尽可能好的结果，即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据。这就是所谓“理智行为”。称为最小最大准则，按照这个各方均避免冒险的观念，就形成如下的推演过程。
§2
出1指 5
－5
出2指－5 5
局中人1从局中人2该如何选择策略，已获得利益？
例2 囚徒困境。两个嫌疑犯作案后被警察抓住，分别被关在不同的屋子里审讯。警察告诉他们：如果两人都坦白，各判刑8年；如果两人都抵赖，由于证据不充分，两人将各判刑2年；如果其中一人坦白，，另一人抵赖，则坦白者立即释放，抵赖者判刑10年。在这个例子中两人嫌疑犯都有两种策略：坦白或抵赖。可以用一个矩阵表示两个嫌疑犯的策略的损益
max min aij min max aij
i j j i
i
j
j
i
不符合鞍点条件，故G的鞍点不存在。例6 求解矩阵对策，其中：解容易得到
1 0 A 1 1
*
1 1
v ai* j* 1
i
1, 2 ; j * 3
由此可见，G的解可以不唯一，但G的值必是唯一的。
j j i
故
max min aij min max aij

对策论的基本概念

对策论的基本概念引言对策论是一种重要的决策理论，它在多个领域，包括经济学、政治学、管理学等方面都有广泛的应用。

本文将介绍对策论的基本概念，包括对策、对策矩阵、纳什均衡等内容。

对策的定义对策是指在决策过程中，一方的行动将受到另一方行动的影响，从而引发一系列后续行动的反应。

对策是一种针对不确定性情况下的最佳决策方法，通过预测对手的可能行动并制定相应的应对策略来实现最优效果。

对策通常涉及两个或多个决策者之间的互动。

在对策中，每个决策者都试图通过选择最优的行动来达到自己的目标，同时也要考虑到对手的行动。

对策矩阵是对策论分析的基本工具之一，用于描述对策者在不同行动下的收益情况。

对策矩阵通常以表格形式呈现，横轴代表一个决策者的行动，纵轴代表另一个决策者的行动，每个单元格中的数值表示在特定行动组合下各方的收益。

例如，考虑两个决策者A和B在某个游戏中的对策矩阵如下：行动1 行动2 行动3行动1 2, 2 0, 3 1, 1行动2 1, 0 3, 2 2, 1行动3 1, 1 2, 2 0, 3在这个对策矩阵中，每个单元格表示A和B在特定行动组合下的收益情况。

例如，当A选择行动1，B选择行动2时，A的收益为0，B 的收益为3。

纳什均衡是对策论中的一个重要概念，指的是在对策矩阵中，各方在给定对手行动的情况下，选择能够最大化自己收益的行动组合。

在对策矩阵中，如果不存在更好的选择来取代当前的行动组合，那么该组合就是一个纳什均衡。

在纳什均衡下，每个决策者都无法通过改变自己的行动来获得更好的结果。

以前面的对策矩阵为例，在该矩阵中，行动组合(行动1, 行动2)是一个纳什均衡，因为在这种情况下，A选择行动1，B选择行动2时，双方的收益已经达到最大化。

结论对策论是一种重要的决策理论，可以应用于各种领域，帮助我们理解和分析决策者之间的互动和冲突。

本文介绍了对策的基本概念，包括对策、对策矩阵和纳什均衡。

了解对策论的基本概念将有助于我们更好地理解和解决复杂的决策问题。

矩阵对策的基本原理

3 6 A 5 4
1166
第16页，共34页。
v1
max i
min j
aij
4,
v2
min j
max i
aij
5,
v2 5 4 v1
i* 2 j* 1
想法：是否可以给出一个选取不同策略的概率分布？
17 17
第17页，共34页。
定义3 设有矩阵对策G={S1，S2；A}，其中
S1 1,2 ,,m ，S2 1, 2 ,, n ，
(1) VG2 VG1
(2) T(G1) T(G 2 )
30 30
第30页，共34页。
定理
且A
9
-A设T为G 斜={对S1称，S矩2；阵A(亦}为称矩这阵种对对策策，为对称
对策)。则有
(1) VG 0
(2) T1(G) T2 (G)，其中 T1(和G) T2 (G) 分别为局中人I和II的最优策略集。
6 1 8
A
3
2
4
9 1 10
3 0
6
6
第6页，共34页。
“理智行为”：双方都不想冒险，都不存在侥幸心理，而是考虑到对方必然会设法使自己的所得最少这一点，就应该从各自可能出现的最不利的情形中选择最有利的情形作为决策的依据。
7
第7页，共34页。
定义1 设 G={S1，S2；A}为矩阵对策，其中
v1
min
yS*2
E(x * ,
y)
E(x * ,
y* )
max
xS1*
E(x,
y* )
v2
21 21
第21页，共34页。
定义 4 设G*={S1*，S2* ；A}是矩阵对策G={S1，

第三节矩阵对策

(8.3.17)
y
j
0
精品课程《运筹学》
第三节矩阵对策
此处不证明的介绍矩阵对策的基本定理:
定理8.3.5 任一矩阵对策G S1, S2 ; A ，一定
存在混合意义下的解。
下面是矩阵对策及其纳什均衡的若干性质．
定理8.3.6 设（x* , y* ）是矩阵对策G 的纳什
均衡，V VG ，则
（1）若（2）若
第三节矩阵对策
§3.5 优超及矩阵对策的求解
定义8.3.5设有矩阵对策G S1, S2; A ，其中
A S1 ={ 1,2,,m }，S2={1, 2 ,, n}，
=
(aij
)
。
mn
若对
j 1,2,n
有 ai1 j ai2 j
则称局中人I的纯策略 i2 优于纯策略 i1 ；同样
地，若对 i 1,2,m 有 aij1 aij2
精品课程《运筹学》
第三节矩阵对策
或等于1/2倍的2、3列之和，划去第一列，又将
第一行划去得2
x*
(0,0,
4 5
,
1 5
),
y*
2矩阵
(0,0,
3 5
,
2 5
4
)0
2 8
，即求最优解。
2. 2 n
和
e
m2
矩阵对策的图解法
Q
1a
f
B'
c
3
d
o
A' P 2 b
x
1 x
图8.3.1
精品课程《运筹学》
对策的两个解，则（为最优解。
i1
,
j2
）与（
i2

第 11.3 节矩阵对策的解法

2014-5-24
4
例12
求解矩阵对策 G = { S1 , S2 ; A} , 其中
1 3 A 4 2
2014-5-24
5
2. 2× n 或m×2 对策的图解法
2× n 对策的解题步骤：
（1）在直角坐标系中作直线 I：x = 0；II：x = 1；（2）在直线I处按矩阵第2行的值标纵坐标，在直线II处按矩阵第1行的值标纵坐标；其意义是指当局中人一采用其中一个纯策略时，局中人二各策略相对应的赢得值；（3）按列的方向将各对应纵坐标值连成直线；（4）令 0 < x < 1，即局中人一采用混合策略，按最小最大原则，在图中找出局中人一的最优策略；具体方法是：让 x 在(0, 1)内变动，找出经过点(x, 0)的垂线与上述直线交点中纵坐标最小的点集(某些线段)，然后再从中找出纵坐标最大的点 P 所对应的横坐标即为所求；（5）确定经过点 P 的两相交直线，根据两相交直线列出对应方程组，求出 x*. （6）根据定理6的结论计算 y* 的值。
2014-5-24 10
例14
用图解法求解矩阵对策 G = { S1 , S2 ; A} , 其中 2 7 A 6 6 11 2
2014-5-24
ห้องสมุดไป่ตู้11
2014-5-24
12
例 15
求解赢得矩阵A 的矩阵对策
8 4 4 2 A 3 1 5 5 7
2014-5-24
16
例17
某厂用三种不同的设备 1 、 2 、 3 加工三种不同的产品 1 、 2 、 3 , 已知三种设备分别加工三种产品时, 单位时间内创造的价值由下表给出。被加工产品使用设备

矩阵对策的基本理论

解：采购员为局中人Ⅰ，他有三个策略：在秋季购煤 100 吨，150 吨和 200 吨，分别记为α1、α2、α3；大自然为局中人Ⅱ，它也有三个策略，“选择”冬季气候较暖、正常、较冷，分别记为 β1、β2 和 β3。以冬季取暖购煤的实际费用作为局中人Ⅰ的赢得，它等于秋季购煤费用和冬季用煤不够时再补购的费用之和，赢得矩阵为
A
a21
a22
a2n
am1 am2 amn
（12-3）
为局中人Ⅰ的赢得矩阵。由于对策为零和的，故局中人 Ⅱ的赢得矩阵为-A。
当局中人Ⅰ、Ⅱ的策略集 S1, S2 及局中人Ⅰ的赢得矩阵 A 确定后，一个矩阵对策就给定
了。因此将矩阵对策表示为 G S1，S2；A.
矩阵对策的最优纯策略
x E m
x
x , x ,, x
12
m
T
,
x i
0, i
1,,
m,
m
x i
i 1
1
S 2
y
E
n
y
y , y ,, y
12
n
T,
y j
0,
j
1,
n,
n
j 1
y j
1
S 和S 1
2
分别称为局中人Ⅰ和Ⅱ的混合策略集；
x
S
1
和y
S
2
分别称为局中人Ⅰ和Ⅱ
的混合策略；当
x
S 1
和y
S
2
其中， T G1
和T G 2
分别为局中人 I 和 II 的策略集。
运筹学
使自己的赢得尽可能的小，理性的选择就应该是从各自可能出现的最不利的情形中争取尽可
能好的结果。

对策论第2,3节矩阵对策的基本定理与解法

存在前提：
max min aij = min max aij= v
i
j
ji
ห้องสมุดไป่ตู้
又称（ 2 ，3 ）为对策G={s1,s2,A}的鞍点。值 V为G的值。
定义9-1：对给定的矩阵对策
G = S1，S2；A 若等式
max min aij= min max aij
i
j
j
i
成立，则称这个公共值为对策G的值，记为VG，而达到的局势（ i， j ）称为对策G在纯策略意义下的解，记为（ I*， j *）而I*和 j *分别称为局中人I和局中人II的最优纯策略。
第2,3节矩阵对策理论与求解方法
一、矩阵对策的最优纯策略
•在甲方赢得矩阵A=[aij]m*n中： aij代表甲方取策略i,乙方取策略j, 这一局势
下甲方的益损值，此时乙方的益损值为-aij（零和性质）。 •在讨论各方采用的策略是必须注意一个前提就是对方是理智的。这就是要从最有把握取得的益损值情况考虑。
显然 ai2 a12 a1j ai2 a32 a3j 对 I=1,2,3 j=1,2,3 都成立： a12 = a32 =5 由定理5-1，对策值=5，对策的解：（ 1 , 2 ）和（ 3 , 2 ）
例3：某单位采购员在秋天时要决定冬天取暖用煤的采购量。已知在正常气温条件下需要用煤15吨，在较暖和较冷气温条件下需要用煤10 吨和20吨。假定冬季的煤价随着天气寒冷的程度而变化，在较暖、正常、较冷气温条件下每吨煤价为100元、150元、200元。又秋季每吨煤价为100元。在没有关于当年冬季气温情况下，秋季应购多少吨煤，能使总支出最少？
E（X，Y）= xi aij yj=XAYT 称为局中人I期望赢得，而局势（X，Y）称为“混合局势”，局中人I，II的混合策略集合记为S1*， S2*。

矩阵论课后参考答案(第一二三四

矩阵为 A

1 1
18 22
15 20

，
求
T
在基 1 (1,2,1) ， 2 (3,1,2)，

1
21,2)下的矩阵。
解：由题可知1,2,3 与1,2,3 时空间 L(F 3) 的两组基，则存在一个
过渡矩阵 C 使得
3 -1 2
2 1 2
1 0 0
0 1 0
0 r 2(2)r1 1
0 r3(1)r10
1
0
3 5 -1
2 5 0
1 2 -1
0 1 0
0 0 1
1r2

5 (1)r 3
1 3 2 1 0
0
1 3 2 1 0 0
r2r30 1 0 1 0 1 r3(1)r20 1 0 1 0 1
2
1 0 0 0 0 1 0 0
0 0 0 0
0
0
0
0
，
1
0
0
0
，

0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 1
（3）解：同上理，对 AT A 分析可知其为一个上下成负对称的矩阵，
且对角元全为 0，则其维数为
dim(V ) (n 1) (n 2) 1 (n 1)((n 1) 1) n(n 1)
2
2
其基为 n(n 1) 个 n n 阶的矩阵，故基可写为
2
0 1 0 0 0 0 1 0
1 0
0 0
0 0
所以V1 V2 {0} 。
2）明显V1 V2 Fn

第 11.2 节矩阵对策的基本定理

2014-5-24
2
当局中人Ⅰ选定纯策略 i 和局中人Ⅱ选定纯策略 j 后, 就形成了一个纯局势(i , j )。这样的纯局势可构成 m× n 矩阵。对任一纯局势(i , j ) , 记局中人Ⅰ的赢得值为 aij , 则称矩阵 A = ( aij )mn 为局中人 I 的赢得矩阵(或为局中人 II 的支付矩阵)，这样，局中人 II 的赢得矩阵即为 –A。矩阵对策常记为：G = {I, II; S1, S2; A}或 G = { S1, S2; A}
j
综上可得
即
2014-5-24
aij* max aij* ai* j* min ai* j ai* j
i j
aij* ai* j* ai* j
11
定义2 设 f ( x, y)为一个定义在 x∈ A 及 y ∈ B 上的实值函数, 如果存在 x* A, y* B, 使得对一切 x A 和 y B, 有 f ( x, y* )≤ f ( x* , y* )≤ f ( x* , y) 则称 ( x* , y* ) 为函数 f 的一个鞍点。矩阵对策的解与鞍点
第11 章对策论基础
第 2 节矩阵对策的基本定理
2. 1 矩阵对策的数学模型
二人有限零和对策
二人零和对策就是矩阵对策, 是指只有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择。在任一局势下, 两个局中人的赢得之和总是等于零, 即双方的利益是激烈对抗的。
矩阵对策的表示
设局中人Ⅰ有 m 个纯策略 1 , 2 , ⋯ , m , 局中人Ⅱ有 n 个纯策略 1 , 2 , ⋯ , n , 则局中人Ⅰ、Ⅱ的策略集分别为 S1 = {1 , 2 , ⋯ , m} S2 = {1 , 2 , ⋯ , n}

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

零和
盟
多人
对
策
无
非零和
限
对同有限对策
策
第二节：矩阵对策
1.矩阵对策的数学模型 2.矩阵对策解的问题 3.矩阵对策的混合策略 4.矩阵对策的基本定理 5.矩阵对策解的性质
2019/10/7
1.矩阵对策的数学模型
（1）矩阵对策的内涵：二人有限零和对策，即对策双方的利益是激烈对抗的。
（2）矩阵对策的数学模型：
2019/10/7

3. 矩阵对策的混合策略
例：对策矩阵G={S1，S2，A}，其中： A= 3 6
54
显然G在策略意义下的解不存在，于是设x=(x1,x2) 为局中人甲的混合策略， y=(y1,y2)为局中人乙的混合策略，则
S1* = {xi 0，i=1,2; x1+ x2 = 1} S2* = {yj 0，j=1,2; y1+ y2 = 1} 局中人甲的赢得期望值是：E (x,y) =xT A y
Min
7 5 6 5 5 A= 2 -3 9 -4 -4 Max = 5
6 5 7 5 5 0 1 -1 2 -1
Max 7 5 9 5
Min = 5
i = 1, 3 ，j = 2, 4，ai*j* = 5，四个局势均为矩阵对策的解。
2019/10/7
3. 矩阵对策的混合策略
对矩阵对策G={S1，S2，A}来说，局中人甲有把握的最小赢得是：
v1 = max min aij
ij
局中人乙有把握的最大损失是： v2= min max aij
ji
当v1 = v2时，对矩阵对策有策略意义下的解；
然而并非总是如此，经常是 v1 < v2 （总有v1
v2 ），此时没有策略意义下的解。 2019/10/7
Min
-4 2 -6 -6
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
Max
8 36
Min 3
局中人甲应选择2 ，乙应采取2策略；结果甲赢得3，乙付
出3。
2019/10/7

2. 矩阵对策解的问题
定义1：设矩阵对策G={S1，S2，A}，其中：
S1 ={1，2，…，m}， S2 = {1 ，2 ， …， n}
抽到红牌1/2
掷硬币
让乙猜
抽到黑牌1/2 让乙猜
正面 1/2
反面 1/2
p
-q
2019/10/7
猜红 -r
猜黑
猜红
s
t
猜黑 -u

1. 矩阵对策的示例2
抽到红牌1/2
掷硬币
让乙猜
抽到黑牌1/2 让乙猜
正面 1/2
p
反面 1/2
-q
猜红 -r
猜黑
猜红
s
t
猜黑 -u
若甲决定掷硬币这个策略，则乙的猜红或猜黑已无意
2019/10/7

5.矩阵对策解的性质
性质2：矩阵对策G1={S1，S2，A1}、 G2={S1， S2，A2}，解集分别为T（ G1 ）和 T（ G2 ），若其中有A1=（aij）、 A2=（aij+L ），L为任一常数，则：（1） V G2= V G1+L；
Am×n={aij}。因为对策是零和的，所以乙的赢得矩阵为 -Am×n。
2019/10/7

1. 矩阵对策的数学模型
建立二人零和对策的模型就是要根据对实际问题的叙述，确定甲、乙两个局中人的策略集合以及相应的赢得矩阵。不难看出在“齐王赛马”的例子中，齐王的赢得矩阵为：
3 1 1 1 1 -1
1 3 3 3 -1 1
max min E (x,y) = min max E (x,y)
x S1* y S2*
y S2* x S1*
记其值为VG，则VG为对策G *的值，使上式成立的混合局势（x *，y *）为G 在混合策略意义下的解， x *，y * 分别称为局中人甲和乙的最优混合策略。
注：策略意义下的解不存在时，自动转向混合策略意义下的解。
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
局中人甲应选择2 ，此时不管局中人乙采取什么策略，甲的
赢得均不小于3。
2019/10/7

2. 矩阵对策解的问题
设矩阵对策G={S1，S2，A}，其中：
S1 ={1，2，3，4}， S2 = {1 ，2 ， 3}
aij* ai*j* ai*j 定理1：设矩阵对策G={S1，S2，A}在策略意义下
有解的充分必要条件是存在着局势（ i* ，j* ）
使得对于一切i与j都有aij* ai*j* ai*j成立。
2019/10/7

2. 矩阵对策解的问题
例：设矩阵对策G={S1，S2，A}，赢得矩阵为：
定理4：设 x * S1* ， y * S2*则（x *，y *）是矩阵对策G的解的充分必要条件是存在数v使得x * 和y *
分别是不等式组
aijxi v (j=1,2,…,n)
i
aijyj v (i=1,2,…,m)
j
xi = 1
xi 0 (i=1,2,…,m)
的解，且v=VG。
2019/10/7

3. 矩阵对策的混合策略
例：E (x,y) =xT A y =3x1y1+6x1y2+5x2y1+4x2y2 = -4(x1-1/4)(y1-1/2)+9/2
取x *=（1/4，3/4），y *=（1/2，1/2），则
E (x,y *)= E (x *,y *) = E (x *,y) = 9/2
齐王：上、中、下田忌：上、中、下
2019/10/7

1.引例：齐王赛马
齐王：上、中、下田忌：上、中、下
2019/10/7
2.对策行为的基本要素
1. 局中人（Player）：在一个对策行为中，有权决定自己行动方案的参加者称为局中人。 2. 策略（Strategy）：一局对策中，可供局中人选择的完整的行动方案称为策略。 3. 赢得函数（Score）：一局对策中，局中人使用每一策略都会有所得失，这种得失是全体局中人所采取的一组策略的函数，称为赢得函数。 4. 局势：一局对策中，各局中人选定的策略所形成的策略组称为一个局势。
2019/10/7

3. 矩阵对策的混合策略
对 x S1*, y S2* 称(x, y)为一个混合局势，局
中人的赢得函数记成：
E (x, y) =xT A y 这样便得到一个新的对策
G* = {S1*, S2*, E} G*称为G的混合扩充。
2019/10/7

3. 矩阵对策的混合策略
G * = {S1*, S2*, E} 是G={S1，S2，A}的混合扩充，如果
猜红
猜黑
p
-q
-r
s
t
-u
乙
甲
猜红
猜黑
掷硬币 1/4（p-q+2t） 1/4（p-q-2u）
让乙猜
1/2（-r+t） 1/2（s-u）
2019/10/7
2. 矩阵对策解的问题
设矩阵对策G={S1，S2，A}，其中：
S1 ={1，2，3，4}， S2 = {1 ，2 ，3} ，
Min
-4 2 -6 -6
即有
E (x,y *) E (x *,y *) E (x *,y)
故x *和y *分别为局中人甲和乙的最优（混合）策略。
2019/10/7
4.矩阵对策的基本定理
定理1：设矩阵对策G={S1，S2，A}在策略意义下有解的充分必要条件是存在着局势（ i* ，j* ）使得对于一切i与j都有aij* ai*j* ai*j成立。
A = {aij}mn ；若
Max min aij = Min max aij = ai*j*
i
j
j
i
则称ai*j*为对策G的值，局势（ i* ，j* ）为G的解，i*和j*分别称为局中人的最优策略。
2019/10/7

2. 矩阵对策解的问题
由于ai*j*既是其所在行的最小值，又是其所在列的最大值，于是有：
甲：有m个策略，表示为S1=（ 1, 2, 3,……, m) 乙：有n个策略，表示为S2=（ 1, 2, 3,……, n) 当甲选定策略i 、乙选定策略j 时，就形成了一个局势（ i , j ）。可见这样的局势总共有m n个，对任意局势（ i , j ）甲的赢得值为aij，即甲的赢得矩阵为

4.矩阵对策的基本定理
定理3：设 x * S1* ， y * S2*则（x *，y *）
是矩阵对策G的解的充分必要条件是对任意的i(1,2,…,m)和 j(1,2, …,n)有
E (x,y *) E (x *,y *) E (x *,y)
2019/10/7

4.矩阵对策的基本定理
1 -1 3 1 1 1 A=
-1 1 1 3 1 1
2019/10/7
1 1 -1 1 3 1
1 1 1 -1 1 3

1. 矩阵对策的示例1
例1 ：甲的赢得矩阵
乙
甲
石头剪子
布
石头
0
1
-1
剪子
-1
0
1
布
1
-1
0
2019/10/7

1. 矩阵对策的示例2
例2 ：从一张红牌和一张黑牌中随机抽取一张，在对乙保密的情况下拿给甲看。若甲看到的是红牌，他可以选择掷硬币或让乙猜；若甲选择掷硬币，出现正面甲赢 p 元，出现反面甲输 q 元；若让乙猜，当乙猜中是红牌时甲输 r 元，否则甲赢 s 元。若甲看到的是黑牌，他只能让乙猜，当乙猜中是黑牌时甲输 u 元，否则甲赢 t 元。试确定甲、乙各自的策略并建立赢得矩阵。