对策论_矩阵求解

合集下载

第1章 矩阵对策

第1章  矩阵对策
策被称为矩阵对策).对策按如下方式进行,局中人 1 选择行 i ∈ M ,局中人 2 选择列 j ∈ N ,
此时局中人 1 和 2 是同时并且独立地进行选择.因此局中人 1 获得支付 aij ,局中人 2 获得支
( ) 付 −aij .如果支付是一个负数, 那么可以认为是局中人的实际损失.
记具有支付矩阵 A 的对策 Γ 为 ΓA ,并且根据矩阵的维数,称之为 (m × n) 对策.如果
果它被隐藏在那里)的概率为 0 < βi ≤ 1 ,i = 1, 2, , n .如果找到目标,局中人 1 获得收益 为α .在其中隐藏和搜索物体的坑的编号是局中人的策略,局中人 1 的支付等于期望收益与
寻找目标时所付出的努力之差.隐藏和搜索目标的问题可以转化为矩阵对策,其支付矩阵为
⎡αβ1 −τ1 −τ1 −τ1
选择进行攻击的目标(局中人 1)和防卫目标(局中人 2)的问题可以转化为矩阵对策,
其支付矩阵为
⎡β1τ1 τ1
A
=
⎢ ⎢
τ2
β2τ 2

⎢ ⎣
τn
τn
τ1 ⎤
τ2
⎥ ⎥

β

n
⎥ ⎦
例 1.1.5 (离散型搜索对策)有 n 个坑,局中人 2 在 n 个坑中之一隐藏物体,局中人
1 希望找到它.在寻找第 i 个坑时局中人 1 付出的努力为τi > 0 ,在第 i 个坑中找到目标(如
m −1 > n ,则 a10 = n +1+1 = n + 2 , a11 = n −1+1 = n , a1 j = n − j +1−1−1 = n − j −1,
2 ≤ j ≤ n .一般情况下(对任意的 m 和 n )元素 aij , i = 0, m , j = 0, n 以及支付矩阵可以

第十三讲 对策矩阵解法

第十三讲 对策矩阵解法

4
矩阵对策解法
• 矩阵对策模型给定后,各局中人面临的问 题:如何选取对自己最为有利的纯对策略, 以谋取最大的赢得?
5
矩阵对策的纯策略
例1:设有一矩阵对策G={S1, S2; A},其中
6 3 A 9 3 1 2 1 0 8 4 10 6
求最优纯策略?
取大则取2 max min aij= 2
i j
取小则取2 min max aij= 2
j
i
7
矩阵对策的纯策略
定义1 设G={S1, S2; A}为一矩阵对策,其中 S1={α1, …,αm},S2={β1, …,βn}, A=(aij)m×n。若
max min aij min max aij
7 1 8 3 2 4 A 16 1 3 3 0 5
9
答案
1
2
3
min ai j
j
α1 α2 α3
max ai j
i
-7 3 16 -3 16
1 2 -1 0 2*
-8 4 -3 5 5
-8 2* -3 -3
7 1 8 3 2 4 A 16 1 3 3 0 5
16
矩阵对策实例
这一储量问题可以看成是一个对策问题,把采购员当作局中人Ⅰ,他 有三个策略:在秋天时买10吨、15吨与20吨,分别记为 1 , 2 ,3 把大自然看作局中人Ⅱ(可以当作理智的局中人来处理),大自然(冬季 气温)有三种策略:出现较暖的、正常的与较冷的冬季,分别记为 1 , 2 ,3 把该单位冬季取暖用煤实际费用(即秋季购煤时的用费与冬季不够时 再补购的费用总和)作为局中人Ⅰ的赢得,得矩阵如下:

对策问题的提出对策论模型矩阵对策的解法◎知识归纳

对策问题的提出对策论模型矩阵对策的解法◎知识归纳
现代博弈论起源于19世纪末20世纪初,二战后发展成为一门完整而丰富的理论 学科。学术界一般将其发展历程分为以下几个阶段:
(1)萌芽阶段 从19世纪末到20世纪30年代可以说是博弈论的萌芽期,表现为学者们对社会经
济理论和现实的一些思考,研究者以数学家为主。 (2)产生阶段 20世纪四五十年代可说是博弈论的体系建立时期。1944年诺依曼和摩根斯坦的
(2)物流仓储优化策略 【例8.2】一仓储供应中心为其下游的一家生产企业供应某种原料。生产企业根 据产品订单情况对原料的需求进行分析,分别有淡季、旺季和正常三种情况,在正 常情况下需要原料15吨,在淡季和旺季情况下分别需要原料10吨和20吨;而原料的 价格与原料市场的需求有关,在淡季、正常、旺季三种情况下,每吨原料的价格分 别为100元、150元和200元,已知此时每吨原料的价格为100元。问在生产企业对原 料的需求没有确定预知的条件下,此时应采购多少吨原料才能使仓储供应中心的总 成本最少(不计存储费用)? 这个问题可看成一个博弈问题。即仓储供应中心针对可能出现的三种不同的原
巨著《博弈论和经济行为》的出版,标志着博弈论作为一门学科的建立,也被视为 数理经济学学科建立的里程碑。巨著出版前后的若干年中,合作博弈理论的研究得 到了迅速的发展,提出了各种概念,并在20世纪50年代达到了研究的高峰。不久, 库克于1950年定义了“囚徒的困境”,纳什在1950年和1951年发表了两篇关于非合 作博弈的重要文章,这两位学者的研究工作,特别是纳什的研究工作奠定了非合作 博弈论的基础,所提出的纳什均衡概念,在非合作博弈论中起着核心作用。
8 对策论
8.1 对策问题的提出 8.2 对策论模型 8.3 矩阵对策的解法 ◎ 知识归纳 ◎ 习题与思考题
8.1 对策问题的提出

引论第二矩阵对策第三矩阵对策的求解

引论第二矩阵对策第三矩阵对策的求解

5.矩阵对策解的性质
*
性质5:设一矩阵对策G={S1,S2,A} ,若在S1(或、和S2)中出现被优超的策略,那么去掉被优超的策略所形成的新的矩阵对策与原矩阵对策同解。
A =
4 0 2 3 -2 -2 1 4 -4 3 7 3 8 4 5 4 6 5 6 6 5 2 7 4 3
02
田忌:上、 中、 下
2.对策行为的基本要素
*
3.对策行为的基本假设
*
对策行为总是假定每一个局中人都是“理智的”决策者,不存在利用其他局中人的决策失误来扩大自身利益的可能性或相反。
4.对策行为的分类
*
对策
动态对策
静态对策
结盟对策
不结盟对策
联合对策
合作对策
无限对策
有限对策
二人
多人
零 和
A =
-4 2 -6 -6 4 3 5 3 8 -1 -10 -10 -3 0 6 -3
Min
Max 3
局中人甲应选择2 ,此时不管局中人乙采取什么策略,甲的赢得均不小于3。
3
6
5
4
3.矩阵对策的混合策略
*
2
4.矩阵对策的基本定理
*
定理1:设矩阵对策G={S1,S2,A}在策略意义下有解的充分必要条件是存在着局势( i* ,j* )使得对于一切i与j都有aij* ai*j* ai*j成立。 定理2:对策矩阵G={S1,S2,A}在混合策略意义下有解的充分必要条件是存在着 x * S1* , y * S2*使(x *,y *) 为E (x,y) 的一个鞍点,即对于一切x S1* , y S2* 有 E (x,y *) E (x *,y *) E (x *,y)

对策论矩阵求解

对策论矩阵求解
故令A中每个元素减1再乘以½ ,得到
• 目前讨论 A 为支付矩阵旳对策 旳解。为此先 解方程组
•和
• 上述不等式组无解,根据计算下面两个不 等式组
二、线性规划措施
• 例2.6.3 用线性规划措施求解例
• 解:先将A旳每个元素加3,得到每个元素都是整 数旳支付矩阵
6 1 4
A1
局中人Ⅰ在这三局中合计赢得至少。后来各局均照此方 式对策下去,直到迭代旳成果到达一定旳满意程度为止。
近似解: 若设在N局对策中局中人Ⅰ出α1,α2, …,αm旳次数 为k1,k2, …,km ,局中人Ⅱ出β 1, β 2, …, β n旳次数 为l 1, l 2, …, l n ,xN=(k1 /N ,k2 /N, …,km /N), yN=(l1/N ,l2/N, …,lm /N), 则(xN, yN )就是所求近似解。
2
7
5
5 5 6
• 转而讨论以A1为支付矩阵旳矩阵对策 ,为此求
解两个互为对偶旳线性规划问题
1
1
三、迭代法
迭代法是求矩阵对策旳一种近似措施。
基本思想:
假设两个局中人反复进行对策屡次,在每 一局中各局中人都从自己旳策略集中选用 一种使对方取得最不利成果旳策略,即第t 局对策纯策略旳选择欲使对手在前t-1局中 合计所得(或合计所失)至少(或最多)
• 注:假如上述两个方程组旳分别存在非负解
x*,y*,则求得了 旳一种解(x*,y*)和对策值;

假如x*,y*中有负旳分量,则将方程组
(2.6.1),(2.6.2)中旳某些等式改为不等式试算。
例2.6.1 求解矩阵对策----田忌赛马问题。 解:已知田忌赛马问题中旳支付矩阵
• 对策 没有鞍点。为了使A中元素尽量多旳变为0,

对策论证明

对策论证明

********1111111111min minnjj j n j i ij in ij j i i j i j i n m mjmn mj a a a a a a a a a a a a a a a a a =⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦**21111111111111min max max min min min max max max maxnm ij j i nij m nij j i ni j j n mj j mmmmi ijin ij i i i i a v a a v a a a a a a ============⎫⎪⎪⎪⎪⎪⎪⎪=⎬⎪⎪⎪⎪⎪⎪⎪⎭则下面结论成立:1)211111minmax max min nmmnij ij j j i i v a a v =====≥=。

2)若211111min max max min n m m nij ij j j i i v a a v =======,则存在最优纯策略,且最优纯策略为 **1111arg min max ;arg max min n m m nij ij j j i i j a i a ======3)若211111min max max min n m m nij ij j j i i v a a v =====>=,则存在混合策略,且最优混合策略利用线性规划求解。

证明 因为对任意1,2,,,1,2,,i m j n ==有,1)就列而言,ij a 小于等于第j 列的最大元素,即1max mij ij i a a =≤;2)就行而言,ij a 大于等于第i 行的最小元素,即1minn ij ij j a a =≥。

1max mij ij i a a =≤说明第j 列的各元素满足关系 *11111max max max max mj iji m ij iji miji j i mmj iji a a a a a a a a ====≤≤≤≤ (1)。

运筹学—对策论(四)

运筹学—对策论(四)
运筹学—对策论(四)
补充定理:
定理9 设(x*,y*)是矩阵对策G的解, υ =VG,则
=υ ⑴若xi*>0, 则 ∑ aijyj* j =υ ⑵若yj*>0, 则 ∑ aijxi* i ⑶若 ∑ aijyj* < υ 则xi*=0 j 则yj*=0 ⑷若 ∑ aijxi* >υ i
§3矩阵对策的解法
A
1 Ⅱ

V=2x+7(1-x)
7 5 2
0
· β2 · β3 · B
1
β1
B
B2

方程组:
折线B1 B B2 B3上的点的 · 11 纵坐标就是对应x的最 小赢得值。按最大最 小原则应选择x=OA, · 3 AB即为对策值。为求 B3 · 2 出x和对策值VG,可 1 Ⅱ 求 x=3/11, VG=49/11。所以
过数轴上O和1的两点作两条垂线Ⅰ–Ⅰ ,Ⅱ –Ⅱ,在垂线 上把局中人Ⅰ采取纯策略α1和α2时,局中人Ⅱ分别采取 纯策略β 1, β 2, β 3 时的赢得值标出。如图 Ⅰ Ⅱ 折线B1 B B2 B3上的点的 V=2x+7(1-x) · 11 纵坐标就是对应x的最 β1 小赢得值。按最大最 7 · β 小原则应选择x=OA, 5 ·2 β3 · 3 AB即为对策值。为求 B B2 2 · B1 B3 · 2 出x和对策值VG,可 0 Ⅰ
A
1 Ⅱ

V=2y+7(1-y) B
B2 Ⅱ
B1 α 1
1 Ⅱ
折线B1 B B2 上的点的纵 · 11 坐标就是对应y的最大 损失值。按最小最大原 则应选择y=OA,AB即 · 3 为对策值。为求出y和 ·2 对策值VG,可求
方程组:

8运筹学基础第四章对策论2

8运筹学基础第四章对策论2

通常,将矩阵对策记成G={Ⅰ,Ⅱ;S1 , S2;A}或G=数学模型
4﹒局中人如何选取对自己最有利的纯策略? ①局中人的“理智行为”: 双方都不想冒险,都不存在侥 幸心理,而是考虑到对方必然会设法使自己的所得最小, 从各自可能出现的最不利的情形中选择一种最为有利的情 形作为决策的依据。
第四章 对策论
矩阵对策的数学模型 矩阵对策的解 矩阵对策的混合策略
矩阵对策的基本定理
1
运筹学基础
第四章 对策论
矩阵对策的数学模型 矩阵对策的解 矩阵对策的混合策略
矩阵对策的基本定理
2
运筹学基础
4.1 矩阵对策的数学模型
1﹒二人有限零和对策:是指有两个参加对策的局中人,每个 局中人都只有有限个策略可供选择,在任一局势下,两个局中 人的赢得之和总等于零。 2﹒矩阵对策: 就是二人有限零和对策。 3﹒矩阵对策模型:
②选择原则: 局中人Ⅰ按最大最小原则,局中人Ⅱ按最小 最大原则。即局中人Ⅰ从所有最小的赢得中选择最大的赢 得的策略,局中人Ⅱ从所有最大的损失中选择最小的损失 的策略。
5
运筹学基础
例1 设有一矩阵G={S1 , S2;A},其中S1={α1,α2, α2, α4}和S2={ β1, β2, β3} 局中人Ⅰ的赢得矩阵为
8 运筹学基础
定理1 矩阵对策G={S1 ,S2;A}在纯策略意义下有解的充要条件是: 存在纯局势( αi* , βj* )使得对一切i=1,2, …, m, j=1,2, …,n, 均有 aij*≤ ai*j* ≤ ai*j 。 证: 充分条件 因为对任意 i,j 均有aij*≤ ai*j* ≤ ai*j 所以 max aij* ai* j* min ai* j 又因

对策论例题

对策论例题
第九章
对策论
9.1 主要解题方法和典型例题分析 1。 有鞍点的最优纯策略问题 其解题步骤是: 第一步,确定赢的矩阵A各行中的最小值,并在该 数字上加圈 第二步,确定A各列中的最大值并在该数字上加框 第三步,若A中的某元素同时被圈和框住,则该元素 即为对策的值,该元素即为对策的值,该元素内所在 的行和列相应的策略则为局中人Ⅰ和Ⅱ为最优策略。
则B规划的线性规划模型为表5。1 初始表
m W = y1 + y2 + y3, ax
3y1 2y2 st. . 2y1 −y2 y1, y2 , +2y3 ≤1 ≤1 +4y3 ≤1 y3 ≥ 0
相应的单纯型表5。1所示
表 5。1 初 始 表 。
YB
b 1 1 1 0 1/3 1 1/3 1/3
B 2 0 2 -1 3 2 0 4
把此对策问题表示成一个线性规划模型,并用单纯 形法求解此对策。
ax in in ax 解 由 m m aij = 0, m m aij = 2, 知v>0 j j i i ' ' ' 先求B的最优策略,设B的策略为 ( y1, y2 , y3 ), 对策值
' ' ' y1 y2 y3 为v,并令 y1 = , y2 = , y3 = , v v v
Γ
= 5.
注: 此例说明,对策的解可以不惟一,但值是唯一的. 2。无鞍点的混合策划问题 (1)线性规划法求解 例 2 某小城市有两家超级市场相互竞争,超级市场
A有三个广告策略,超级高级B也有三个广告策略, 已经算出当双方采取不同的广告策略时,A方所占市场 份额增加的百分数如下:
策略 1 1 A 2 3 3 0 2

对策论_运筹学

对策论_运筹学

习题解答1. 已知矩阵博弈局中人I 的赢得矩阵如下,求最优纯策略及博弈值。

(1) ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡8354667565443494 (2) ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡------------21221405126331222210 解: (1) ()8695 35438354667565443494⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡ 所以),(13βα,V=5(2) 2- 3 2- 2 2 2562)2(1)2(214051263312)2(2)2(10----⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡------------所以 ),(31βα,),(51βα,),(33βα,),(53βα,V=-22. 甲乙两国进行乒乓球团体赛,每国由三个人组成一个队参加比赛。

甲国的人员根据不同的组合可组成4个队,乙国的人员可组成3个队,根据以往的比赛记解:62828276128184)2(3715---⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡------ 所以),(22βα,V=2 答: 双方应均派第2队出场3. 对任意一个m 行n 列的实数矩阵A=(a ij ),试证有下式成立ij mi n j ij nj m i a a ≤≤≤≤≤≤≤≤≤1111max min min max证:ijmi n j ij nj m i ijmi ij nj m i ijij nj a a a a j a a n j m i j i ≤≤≤≤≤≤≤≤≤≤≤≤≤≤≤≤≤∴≤∀∴≤≤≤≤≤∀11111111max min min max max min max ,min : 1,1,,有有4. 某城区有A 、B 、C 三个居民小区,分别居住着40%,30%,30%的居民,有两个公司甲和乙都计划在区内建造超市,公司甲计划建两个,公司乙计划建一个,每个公司都知道,如果在某个小区内设有两个超市,那么这两个超市将平分该区的消费,如果在某个小区只有一个超市,则该超市将独揽这个小区的消费。

(优选)矩阵对策的解法详解.

(优选)矩阵对策的解法详解.
矩阵对策的解法
3.1 公式法、图解法和方程组法
1. 2×2 对策的公式法
2×2 对策是指局中人Ⅰ的赢得矩阵为2×2 阶的, 即
A
a11 a21
a12
a22
如果 A 有鞍点, 则很快可求出各局中人的最优纯策略; 如果
A 没有鞍点,则可证明各局中人最优混合策略中的 xi* , yj* 均 大于零。于是, 由定理 6 可知, 为求最优混合策略可求下列
(5)确定经过点 P 的两相交直线,根据两相交直线列出对应方程 组,求出 y*.
(6)根据定理6的结论计算 x* 的值。
2020/7/19
10
例14
用图解法求解矩阵对策 G = { S1 , S2 ; A} , 其中
2 7
A
6
6
11 2
2020/7/19
11
2020/7/19
12
例 15
求解赢得矩阵A 的矩阵对策
A 4 1
8
3 5
4 5
2 7
2020/7/19
13
2020/7/19
14
3. 线性方程组方法
根据定理4 , 求解矩阵对策解( x*, y* ) 的问题等价于求解不 等式组,又根据定理5 和定理6 , 如果假设最优策略中的 xi* 和 yj* 均不为零, 即可将上述两个不等式组的求解问题转化 成求解下面两个方程组的问题:
(1) i
i
aij xi v, j 1,2,...,n
xi 1
(2)
j j
aij y j v,i 1,2,...,m yj 1
2020/7/19
15
3. 线性方程组方法
例16
求解矩阵对策——“齐王赛马”

运筹学—对策论(四)

运筹学—对策论(四)

将第一个方程组第3式取为不等式,第二个方程组第1
式取为不等式,转而求
x1- 3x2= υ′
y1- 4y2+2y3<υ′
-4x1+ 2x2= υ′ 和 -3y1+ 2y2 = υ′
2x1+ 4x3> υ′
4y3= υ′
x1 + x2 + x3=1
y1 + y2 + y3=1
由定理9,可知x1*=0,y3*=0 代入两不等式组得到
补充定理:
运筹学—对策论(四)
定理9 设(x*,y*)是矩阵对策G的解, υ =VG,则
⑴若xi*>0, 则
∑ j
aijyj*

⑵若yj*>0, 则
∑ i
aijxi*

⑶若
∑ j
aijyj*

⑷若
∑ i
aijxi*

则xi*=0 则yj*=0
§3矩阵对策的解法
一﹑2×2对策的公式法
所谓2×2对策是指局中人Ⅰ的赢得矩阵为2×2阶的,即
求得y2*=9/11, 所以局中人Ⅱ最优策略 y3*=2/11。 为y*=(0,9/11,2/11)。
27
例3 求解矩阵对策G={S1,S2;A},其中 A= 3 5
S1={α1,α2 ,α3}和S2={ β 1, β 2} 。
11 2
解: 设局中人Ⅱ的混合策略为( y, 1-y),y∈ [0,1]
例1 求解矩阵对策G={S1,S2;A},其中
A=
1 4
3 2
解: 易知,A无鞍点。由上述公式可得最优解为
x*=(1/2,1/2) ,y*=(1/4,3/4) VG=5/2

第三节矩阵对策

第三节矩阵对策

(8.3.17)
y
j
0
精品课程《运筹学》
第三节 矩阵对策
此处不证明的介绍矩阵对策的基本定理:
定理8.3.5 任一矩阵对策G S1, S2 ; A ,一定
存在混合意义下的解。
下面是矩阵对策及其纳什均衡的若干性质.
定理8.3.6 设(x* , y* )是矩阵对策G 的纳什
均衡,V VG ,则
(1)若 (2)若
第三节 矩阵对策
§3.5 优超及矩阵对策的求解
定义8.3.5设有矩阵对策G S1, S2; A ,其中
A S1 ={ 1,2,,m },S2={1, 2 ,, n},
=
(aij
)

mn
若对
j 1,2,n
有 ai1 j ai2 j
则称局中人I的纯策略 i2 优于纯策略 i1 ;同样
地,若对 i 1,2,m 有 aij1 aij2
精品课程《运筹学》
第三节 矩阵对策
或等于1/2倍的2、3列之和,划去第一列,又将
第一行划去得2
x*
(0,0,
4 5
,
1 5
),
y*
2矩阵
(0,0,
3 5
,
2 5
4
)0
2 8
,即求最优解 。
2. 2 n

e
m2
矩阵对策的图解法
Q
1a
f
B'
c
3
d
o
A' P 2 b
x
1 x
图8.3.1
精品课程《运筹学》
对策的两个解,则( 为最优解。
i1
,
j2
)与(
i2

第 11.3 节 矩阵对策的解法

第 11.3 节 矩阵对策的解法

2014-5-24
4
例12
求解矩阵对策 G = { S1 , S2 ; A} , 其中
1 3 A 4 2
2014-5-24
5
2. 2× n 或m×2 对策的图解法
2× n 对策的解题步骤:
(1)在直角坐标系中作直线 I:x = 0;II:x = 1; (2)在直线I处按矩阵第2行的值标纵坐标,在直线II处按矩阵第1行 的值标纵坐标;其意义是指当局中人一采用其中一个纯策略时,局 中人二各策略相对应的赢得值; (3)按列的方向将各对应纵坐标值连成直线; (4)令 0 < x < 1,即局中人一采用混合策略,按最小最大原则,在 图中找出局中人一的最优策略;具体方法是:让 x 在(0, 1)内变动, 找出经过点(x, 0)的垂线与上述直线交点中纵坐标最小的点集(某些线 段),然后再从中找出纵坐标最大的点 P 所对应的横坐标即为所求; (5)确定经过点 P 的两相交直线,根据两相交直线列出对应方程 组,求出 x*. (6)根据定理6的结论计算 y* 的值。
2014-5-24 10
例14
用图解法求解矩阵对策 G = { S1 , S2 ; A} , 其中 2 7 A 6 6 11 2
2014-5-24
ห้องสมุดไป่ตู้11
2014-5-24
12
例 15
求解赢得矩阵A 的矩阵对策
8 4 4 2 A 3 1 5 5 7
2014-5-24
16
例17
某厂用三种不同的设备 1 、 2 、 3 加工三种不同的产品 1 、 2 、 3 , 已知三种设备分别加工三种产品时, 单位时间 内创造的价值由下表给出。 被加工产品 使用设备

对策论

对策论

§4.2 矩阵对策的基本理论(续)三 混合策略与混合扩充 1. 基本概念在上面的最优纯策略中,能够有最优纯策略的决策问题中存在一个鞍点,也就是必须有max(min )ij jia =)(max min iij ja如果 max(min )ij jia ≠)(max min iij ja那末,对策中双方没有最优纯策略,也就是没有在纯策略中的解,我们把这种对策称为无鞍点的对策。

比如:给定矩阵对策G :G={S 1,S 2,A},其中S 1={a 1, a 2 },S 2={β1,β2},1342A ⎛⎫= ⎪⎝⎭可知 )min (max ij jia =2 )(max min iij ja =3所以 )min (max ij jia ≠)(max min iij ja注:在齐王塞马的例子中也是没有鞍点。

在这种情况下,局中人应如何选择纯策略参加对策呢?这就需要估计选取各个策略可能性的大小来进行对策,或者说,用多大概率选取各个纯策略。

我们把每一个局中人用一定的概率选取纯策略来参加的对策称为混合策略。

例如上面的例子:假定:局中人甲以概率x 选取纯策略a 1;以概率1—x 选取纯策略a 2 局中人乙以概率y 选取纯策略β1;以概率1—y 选取纯策略β2⎪⎪⎭⎫⎝⎛--2431)1()()1()(2121x a x a y y ββ于是对局中人甲来说,他的期望赢得便是E (x , y ) =)1)(1(2)1(4)1(3y x y x y x xy --+-+-+ =224+++-y x xy=2/5)4/1)(2/1(4+---y x由此可见:当x =1/2时,即局中人甲以50% 的概率选纯策略a 1参加对策,他的赢得期望至少是5/2,但它不能保证超过5/2,因为当局中人乙取y =1/4时,会控制局中人甲不超过5/2。

因此5/2是局中人甲赢得的期望值。

同样,局中人乙取y =1/4时,才能保证他的支出不多于5/2.。

[管理学]93第十五章 对策论_OK

[管理学]93第十五章 对策论_OK

20
差价
4 21
A=
3 22
甲25 2 23
1 24
乙20
1 23 4 21 22 23 24 21 21 21 22.5 22 22 22.5 24 23 22.5 23 24 22.5 22 23 24
21
二、矩阵对策在纯策略下有解的解法 解法的基本思想是:
双方都立足在最不利的情况下争取 最好的结果
am1 y`1 + am2 y`2 +….+ amn y`n ≤3v7 y`1,y`2 ,… , y`n ≥0
作如下变换 令xi = xi` / V
yj = yj` / V 则:
minZ= x1 + x2 +….+ xm
最大最小原则
22
例题一

甲、乙双方谈判签订一项合同,甲方的最后要价是25万元,而乙方的出价是20万元,
谈判陷于僵局,为了打破僵局,双方约定,再各报一个价(必须报整数价格),以下
述价格成交:谁让步多,取谁出的价,如果双方让步相同,则取双方报价的中间值,
问甲、乙双方应如何报价?最后的成交价是多少?
① 写出此对策问题的三要素或者说建立
Ⅱ方
例如
β1 β2
Ⅰ方
α1 9 7 x1`
α2 2 8 x2 `
y1 ` y2 `
假设x1` ,x2`分别表示Ⅰ方选取α1,α2纯策略的概率,y301 ` y2 `分别表示Ⅱ方选取β1,β2纯策略的概率,即为混合策略
求解最优混合策略的思路
∵局中人Ⅰ使用α1的概率为x1` ,使用α2的概率为x2 ` ,则
第十五章 对策论
• 15.1 对策论的基本概念 • 15.2 矩阵对策的最优纯策略 • 15.3 矩阵对策的混合策略 • 15.4 求解矩阵对策中的计算技巧(自

10-矩阵对策

10-矩阵对策

(X*,Y*) —— 对策G在混合策略意义下的解 E(X*,Y*) —— 对策G的值,记为 v* ,即 v*= max min E(X,Y) = min max E(X,Y) = E(X*,Y*)
X Y Y X
这样,对策在纯策略意义下的解(α* , β*)就成为(X*, Y*) 的一种特殊情况。
20
24
第10章
矩阵对策
6
第10章
矩阵对策
10.1 基本概念
则 S1 与 S2 构成 m×n 个局势 令 (αi , βj ) ,
i = 1, 2, · · · , m; j = 1, 2, · · ·, n
aij ——甲方关于局势 (αi , βj ) 的赢得 则所有 aij 构成一个矩阵 A = ( aij )m×n 称为甲方的赢得矩阵。 由于甲、乙双方得失总和恒为零,所以A还可称为 乙方的损失矩阵,而 –A 即乙方的赢得矩阵。
19
第10章
矩阵对策
10.1 基本概念
(4) 若有X*∈S1*, Y*∈S2*, 使 E(X*,Y*) = max min E(X, Y) = min max E(X, Y)
X Y Y X

X* —— 甲方的最优混合策略 Y* —— 乙方的最优混合策略 简称最优策略;而
如例2 : X*= (0, 1, 0)T α 2 Y*= (0, 0, 1, 0)Tβ 3
5
第10章
矩阵对策
10.1 基本概念
三、矩阵对策的基本模型
在二人有限零和对策中,设以甲方、乙方表示两个
局中人, 以 S1 = {α1,α2 , · · · , αm } S2 = {β1,β2 , · · · , βn } 分别表示甲方、乙方的策略集,

第 11.2 节 矩阵对策的基本定理

第 11.2 节 矩阵对策的基本定理

2014-5-24
2
当局中人Ⅰ选定纯策略 i 和局中人Ⅱ选定纯策略 j 后, 就 形成了一个纯局势(i , j )。这样的纯局势可构成 m× n 矩 阵。对任一纯局势(i , j ) , 记局中人Ⅰ的赢得值为 aij , 则称 矩阵 A = ( aij )mn 为局中人 I 的赢得矩阵(或为局中人 II 的支 付矩阵),这样,局中人 II 的赢得矩阵即为 –A。 矩阵对策常记为:G = {I, II; S1, S2; A}或 G = { S1, S2; A}
j
综上可得

2014-5-24
aij* max aij* ai* j* min ai* j ai* j
i j
aij* ai* j* ai* j
11
定义2 设 f ( x, y)为一个定义在 x∈ A 及 y ∈ B 上的实 值函数, 如果存在 x* A, y* B, 使得对一切 x A 和 y B, 有 f ( x, y* )≤ f ( x* , y* )≤ f ( x* , y) 则称 ( x* , y* ) 为函数 f 的一个鞍点。 矩阵对策的解与鞍点
第11 章 对策论基础
第 2 节 矩阵对策的基本定理
2. 1 矩阵对策的数学模型
二人有限零和对策
二人零和对策就是矩阵对策, 是指只有两个参加对策的局中 人, 每个局中人都只有有限个策略可供选择。在任一局势下, 两个局中人的赢得之和总是等于零, 即双方的利益是激烈对 抗的。
矩阵对策的表示
设局中人Ⅰ有 m 个纯策略 1 , 2 , ⋯ , m , 局中人Ⅱ有 n 个 纯策略 1 , 2 , ⋯ , n , 则局中人Ⅰ、Ⅱ的策略集分别为 S1 = {1 , 2 , ⋯ , m} S2 = {1 , 2 , ⋯ , n}
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 转而讨论以A1为支付矩阵的矩阵对策 解两个互为对偶的线性规划问题 ,为此求
1
1
三、迭代法
迭代法是求矩阵对策的一种近似方法。
基本思想:
假设两个局中人反复进行对策多次,在每 一局中各局中人都从自己的策略集中选取 一个使对方获得最不利结果的策略,即第t 局对策纯策略的选择欲使对手在前t-1局中 累计所得(或累计所失)最少(或最多)
局中人Ⅰ在这三局中累计赢得最少。以后各局均照此方 式对策下去,直到迭代的结果达到一定的满意程度为止。
近似解:
若设在N局对策中局中人Ⅰ出α1,α2, …,αm的次数 为k1,k2, …,km ,局中人Ⅱ出β 1, β 2, …, β n的次数 为l 1, l 2, …, l n ,xN=(k1 /N ,k2 /N, …,km /N), yN=(l1/N ,l2/N, …,lm /N), 则(xN, yN )就是所求近似解。
• • • •
迭代算法的终止准则: 1、给定迭代次k 2、给定允许误差 (0 1) ,当迭代次数k满足 vt vt 时,迭代结束。
• 例2.6.4 用迭代法求解例2.6.2,允许误差 0.04
在前 30 局中,甲选纯策略 1 , 2 , 3 的次数依次为 5,4,21,故甲的策略为
具体做法:
在第1局中,从两个局中人中任选一个,如局中人 Ⅰ,让他先采取任意一个策略,如αi 。然后,局中 人Ⅱ随之采取策略β j ,使采取αi的局中人Ⅰ的所得 最少。在第2局中,局中人Ⅰ还认为局中人Ⅱ采取 策略β j ,故采取某策略αi使局中人Ⅱ的所失最多, 局中人Ⅱ又采取策略,使采取局中人Ⅰ在这两局中 累计赢得最少。在第3局中,局中人Ⅰ又采取某策 略使局中人Ⅱ在前两局的累计所失最多,然后局中 人Ⅱ又采取某策略,
• 注:如果上述两个方程组的分别存在非负解 x*,y*,则求得了 的一个解(x*,y*)和对策值; • 如果x*,y*中有负的分量,则将方程组 (2.6.1),(2.6.2)中的某些等式改为不等式试算。
例2.6.1 求解矩阵对策----田忌赛马问题。 解:已知田忌赛马问题中的支付矩阵
• 对策 没有鞍点。为了使A中元素尽可能多的变为 0,故令A中每个元素减1再乘以½,得到
• 现在讨论 解方程组
A
为支付矩阵的对策 的解。为此先
• 和
例2.6.2
• 上述不等式组无解,根据计算下面两个不 等式组
二、线性规划方法
• 例2.6.3 用线性规划方法求解例2.6.2 • 解:先将A的每个元素加3,得到每个元素都是整 数的支付矩阵
6 1 4 A1 2 7 5 5 5 6
x30 (
5 4 21 , , ); 30 30 30
乙选纯策略 1 , 2 , 3 的次数依次为 18,12,0,故乙的近似最优策略为
y30 (
18 12 , , 0) ; 30 30
对策值 v 的近似值为 vt
vt vt 9 2 5
• 令:
m min ∑ aijki ) /N V _N =( 1≤ j≤n i=1 n max ∑ aijlj ) /N V  ̄N =( 1≤ i≤m j=1
VN=( _N +  ̄N ) /2 V V
则VN是对策值VG的近似值。
{xN}的每一个收敛子列收敛于局中人Ⅰ的最优策略, {yN}的每一个收敛 子列收敛于局中人Ⅱ的最优策略。{VN}收敛于VG 。
2.6 矩阵对策的求解
• 矩阵求解的四种方法: 1、线性方程组法 2、线性规划方法 3、迭代法 4、图解法
一、线性方程组方法
根据定理 2.2.5, 求解矩阵对策 (S1 , S2 ; A) 等价于求解不等式组
• 又根据定理2.4.3,如果甲和乙的最优策略 中所有分量都大于0,那么上面的不等式组 可化成下ቤተ መጻሕፍቲ ባይዱ两个线性方程组。
相关文档
最新文档