矩阵对策的基本定理优秀课件
合集下载
第1章 矩阵对策
策被称为矩阵对策).对策按如下方式进行,局中人 1 选择行 i ∈ M ,局中人 2 选择列 j ∈ N ,
此时局中人 1 和 2 是同时并且独立地进行选择.因此局中人 1 获得支付 aij ,局中人 2 获得支
( ) 付 −aij .如果支付是一个负数, 那么可以认为是局中人的实际损失.
记具有支付矩阵 A 的对策 Γ 为 ΓA ,并且根据矩阵的维数,称之为 (m × n) 对策.如果
果它被隐藏在那里)的概率为 0 < βi ≤ 1 ,i = 1, 2, , n .如果找到目标,局中人 1 获得收益 为α .在其中隐藏和搜索物体的坑的编号是局中人的策略,局中人 1 的支付等于期望收益与
寻找目标时所付出的努力之差.隐藏和搜索目标的问题可以转化为矩阵对策,其支付矩阵为
⎡αβ1 −τ1 −τ1 −τ1
选择进行攻击的目标(局中人 1)和防卫目标(局中人 2)的问题可以转化为矩阵对策,
其支付矩阵为
⎡β1τ1 τ1
A
=
⎢ ⎢
τ2
β2τ 2
⎢
⎢ ⎣
τn
τn
τ1 ⎤
τ2
⎥ ⎥
⎥
β
nτ
n
⎥ ⎦
例 1.1.5 (离散型搜索对策)有 n 个坑,局中人 2 在 n 个坑中之一隐藏物体,局中人
1 希望找到它.在寻找第 i 个坑时局中人 1 付出的努力为τi > 0 ,在第 i 个坑中找到目标(如
m −1 > n ,则 a10 = n +1+1 = n + 2 , a11 = n −1+1 = n , a1 j = n − j +1−1−1 = n − j −1,
2 ≤ j ≤ n .一般情况下(对任意的 m 和 n )元素 aij , i = 0, m , j = 0, n 以及支付矩阵可以
此时局中人 1 和 2 是同时并且独立地进行选择.因此局中人 1 获得支付 aij ,局中人 2 获得支
( ) 付 −aij .如果支付是一个负数, 那么可以认为是局中人的实际损失.
记具有支付矩阵 A 的对策 Γ 为 ΓA ,并且根据矩阵的维数,称之为 (m × n) 对策.如果
果它被隐藏在那里)的概率为 0 < βi ≤ 1 ,i = 1, 2, , n .如果找到目标,局中人 1 获得收益 为α .在其中隐藏和搜索物体的坑的编号是局中人的策略,局中人 1 的支付等于期望收益与
寻找目标时所付出的努力之差.隐藏和搜索目标的问题可以转化为矩阵对策,其支付矩阵为
⎡αβ1 −τ1 −τ1 −τ1
选择进行攻击的目标(局中人 1)和防卫目标(局中人 2)的问题可以转化为矩阵对策,
其支付矩阵为
⎡β1τ1 τ1
A
=
⎢ ⎢
τ2
β2τ 2
⎢
⎢ ⎣
τn
τn
τ1 ⎤
τ2
⎥ ⎥
⎥
β
nτ
n
⎥ ⎦
例 1.1.5 (离散型搜索对策)有 n 个坑,局中人 2 在 n 个坑中之一隐藏物体,局中人
1 希望找到它.在寻找第 i 个坑时局中人 1 付出的努力为τi > 0 ,在第 i 个坑中找到目标(如
m −1 > n ,则 a10 = n +1+1 = n + 2 , a11 = n −1+1 = n , a1 j = n − j +1−1−1 = n − j −1,
2 ≤ j ≤ n .一般情况下(对任意的 m 和 n )元素 aij , i = 0, m , j = 0, n 以及支付矩阵可以
第八讲 矩阵对策概要
矩阵G的一般解法
1)取每行的最小值:
min gij i 1, 2, , m
j
i
maxmin gij i 1, 2, , m 2)从上述值中选最大值: j
j
3)取每列的最大值: max gij j 1,
i
2, , n
max gij j 1, 2, , n 4)从3)项中选最大值:min j
E X ,Y E X ,Y
那么: X
x和y EX ,Y
都成立时
局中人P1的最优策略; 局中人P2的最优策略; 对策的值; 对策的解;
Y
E X ,Y
X
,Y
最优策略的解法
假设策略的值是V,最优策略及策略的解可 通过下式求得。
m
E X , j g ij xi V
Y , , 5) 13 13 13 25 V 13
E 1, Y 3 y1 y2 y3 V E 2, Y y1 y2 5 y3 V E 3, Y y1 4 y2 y3 V y1 y2 y3 1
i
min gij min max gij gi* j* 时, 5)若 max j j i i
ai* →P1的最优纯策略; b * →P2的最优纯策略; j
a , b 对策的解; V
i* j*
g i* j* 对策 a * , b * 的值。 i j
例3
某耕地根据种植划以及自然条件,规划 与收益存在如下表所示的关系。 试求出最佳规划方案。
运筹学课件 第六章对策论基础
• 博弈论是研究博弈现象的规律的数学理论 和方法 • 博弈现象的要素
– 局中人(参与人) —二人或多人 – 行动与策略—有限或无限 – 信息—完全或不完全 – 支付函数—可正可负
一、基本概念与名词
• 局中人 • 策略与策略集 • 局势 • 赢得函数 • 零和对策 • 矩阵对策:二人有限零和对策
二、对策分类
矩阵混合对策问题的解
X (0,0,1 / 3,2 / 3,0) Y (1 / 2,1 / 2,0,0,0) V 5
T
T
相关定理
记T(G)为矩阵对策G的解集
定理1 设有两个矩阵对策 G1={S1,S2,A1}, G2={S1,S2,A2}, 其中A1=(aij), A2=(aij+L), L为一任意常数,则
– 支付函数—赢了得一千金,输了付一千金。
齐王赛马赢得函数
田 忌 (上中下) 1 (上下中) 2
齐 (中上下) 3 王 (中下上) 4 (下中上) 5 (下上中) 6
1 2 3 4 5 6
3 1 1 -1 1 1 1 3 -1 1 1 1 1 1 3 1 -1 1 1 1 1 3 1 -1 1 -1 1 1 3 1 -1 1 1 1 1 3
• 划去普遍较大的列,例如第3、4、5三列, 结果如上。
进一步化简
• 上述结果的第一行比第三行普遍更优,因 此再划去第三行,得 1 2
3 7 3 A 4 4 6
• 若混合策略均不为零,由上述定理知混合 对策问题数学模型的不等式应为等式。因 此有
第二步 用方程组求解
分析上述例子
• 因为 max min{aij } 2, min max{aij } 3 j j i i • 所以 max min{aij } min max{aij }
– 局中人(参与人) —二人或多人 – 行动与策略—有限或无限 – 信息—完全或不完全 – 支付函数—可正可负
一、基本概念与名词
• 局中人 • 策略与策略集 • 局势 • 赢得函数 • 零和对策 • 矩阵对策:二人有限零和对策
二、对策分类
矩阵混合对策问题的解
X (0,0,1 / 3,2 / 3,0) Y (1 / 2,1 / 2,0,0,0) V 5
T
T
相关定理
记T(G)为矩阵对策G的解集
定理1 设有两个矩阵对策 G1={S1,S2,A1}, G2={S1,S2,A2}, 其中A1=(aij), A2=(aij+L), L为一任意常数,则
– 支付函数—赢了得一千金,输了付一千金。
齐王赛马赢得函数
田 忌 (上中下) 1 (上下中) 2
齐 (中上下) 3 王 (中下上) 4 (下中上) 5 (下上中) 6
1 2 3 4 5 6
3 1 1 -1 1 1 1 3 -1 1 1 1 1 1 3 1 -1 1 1 1 1 3 1 -1 1 -1 1 1 3 1 -1 1 1 1 1 3
• 划去普遍较大的列,例如第3、4、5三列, 结果如上。
进一步化简
• 上述结果的第一行比第三行普遍更优,因 此再划去第三行,得 1 2
3 7 3 A 4 4 6
• 若混合策略均不为零,由上述定理知混合 对策问题数学模型的不等式应为等式。因 此有
第二步 用方程组求解
分析上述例子
• 因为 max min{aij } 2, min max{aij } 3 j j i i • 所以 max min{aij } min max{aij }
《运筹学》胡运权清华版-12-02矩阵对策基本定理
《运筹学》胡运权清华版 -12-02矩阵对策基本定理
运筹学中,矩阵对策是重要的决策分析工具。通过这个矩阵对策基本定理, 我们能够更好地理解并应用它在实际问题中。
Байду номын сангаас
矩阵对策的背景和定义
矩阵对策是一种决策分析方法,通过建立决策者与对手之间的策略矩阵,来 寻求最佳决策方案。它在解决有限决策问题中具有广泛的应用。
矩阵对策在实际问题中有广泛的应用,如在市场竞争、资源分配、风险管理 等领域。通过矩阵对策的应用,我们能够做出更明智和有效的决策。
矩阵对策在经济领域的案例分 析
矩阵对策在经济领域有着丰富的案例分析。通过深入研究这些案例,我们可 以更好地理解和应用矩阵对策的方法和技巧。
矩阵对策的优势和局限性
矩阵对策具有许多优势,如能够考虑多个因素和决策变量,以及能够量化和 比较各种策略。然而,它也存在一些局限性,如对信息和参数的需求较高。
矩阵对策的基本定理
矩阵对策的基本定理可以帮助我们确定最佳对策和策略组合。通过对矩阵对 策进行精确分析,我们能够得到优化的决策结果。
矩阵对策的解决方法
矩阵对策有多种解决方法,如通过优化算法和约束条件来求解最优解。同时, 可以利用计算机模拟和博弈理论等工具来辅助分析和决策。
矩阵对策在实际问题中的应用
结论和总结
矩阵对策是一种强大的决策分析工具,能够帮助我们做出更明智和优化的决 策。通过学习和应用矩阵对策,我们能够提高决策的准确性和效果,从而更 好地解决现实生活和工作中的问题。
运筹学中,矩阵对策是重要的决策分析工具。通过这个矩阵对策基本定理, 我们能够更好地理解并应用它在实际问题中。
Байду номын сангаас
矩阵对策的背景和定义
矩阵对策是一种决策分析方法,通过建立决策者与对手之间的策略矩阵,来 寻求最佳决策方案。它在解决有限决策问题中具有广泛的应用。
矩阵对策在实际问题中有广泛的应用,如在市场竞争、资源分配、风险管理 等领域。通过矩阵对策的应用,我们能够做出更明智和有效的决策。
矩阵对策在经济领域的案例分 析
矩阵对策在经济领域有着丰富的案例分析。通过深入研究这些案例,我们可 以更好地理解和应用矩阵对策的方法和技巧。
矩阵对策的优势和局限性
矩阵对策具有许多优势,如能够考虑多个因素和决策变量,以及能够量化和 比较各种策略。然而,它也存在一些局限性,如对信息和参数的需求较高。
矩阵对策的基本定理
矩阵对策的基本定理可以帮助我们确定最佳对策和策略组合。通过对矩阵对 策进行精确分析,我们能够得到优化的决策结果。
矩阵对策的解决方法
矩阵对策有多种解决方法,如通过优化算法和约束条件来求解最优解。同时, 可以利用计算机模拟和博弈理论等工具来辅助分析和决策。
矩阵对策在实际问题中的应用
结论和总结
矩阵对策是一种强大的决策分析工具,能够帮助我们做出更明智和优化的决 策。通过学习和应用矩阵对策,我们能够提高决策的准确性和效果,从而更 好地解决现实生活和工作中的问题。
矩阵对策定理
a
j
ij
y j * v*
a
i
ij i
x *
(4)
或 E(i,y*) v* E ( x*, j ) 又由 E ( x*, y*) E (i, y*)xi * v * xi * v * E ( x*, y*) E ( x*, j ) y j * v * y j * v *
E (i, y*) E ( x*, y*) E ( x*, j ) 其中,E (i, y) a y E( x, j ) aij xi ij j
j i
Hale Waihona Puke (3)证明:设(x*,y*)是G的解,则由引理2可知
E ( x, y*) E ( x*, y*) E ( x*, y)
E ( x, y*) E (i, y*)xi E ( x*, y*) xi E ( x*, y*)
定理2 对任一矩阵对策G={S1,S2; A},一定存在混合策略意义下的解。 证明:由引理3,只要证明存在x*S1*,y*S2*,使得(3)式成立。为此, 考虑如下线性规划问题:
min v max w aij y j v i 1,2,...,m aij xi w j 1,2,...,n i j ( P) 和( D ) xi 1 y j 1 i j xi 0, i 1,2,...,m y j 0, j 1,2,...,n
j i j
ai* j* m ax aij* m in m ax aij
i j i
则由
i
m ax m in aij m in m ax aij ai* j*
i j j i j
电子课件第七章
7.3.1 矩阵对策(两人有限零和对策)的表示
一般地:用Ⅰ、Ⅱ表示两个局中人,局中 人Ⅰ有m个策略,即α1,α2,…,αm;局中人Ⅱ有n 个策略,即β1,β2,…,βn。
当Ⅰ选取策略αi,Ⅱ选取策略βj,就形成 一个局势(αi,βj),这时局中人Ⅰ的收益为 aij,局中人Ⅱ的收益为aij(共有mn个局势)。 矩阵A (a ij)称为局中人Ⅰ的收益矩阵,即
7.1 引言
在实际生活中,许多游戏都反映了对策论 的思想。例如,在人们非常熟悉的“石头、剪 刀、布”的游戏中,我们的问题是:对方如何 行动,而我又将如何应对才能取得胜利?这实 际上就涉及到了对策论的核心问题,即对策论 以对方的行为作为自己决策的依据,并寻求最 佳。但对策论不仅仅是指游戏,它研究的是当 人们的行为存在相互作用时的策略行为及其后 果。社会生活中的许多现象,都带有相互竞争 与合作的特征,可以说,一切都在博弈或对策 之中。
7.3.2 矩阵对策 (两人有限零和对策)的纯策略
同样,局中人Ⅱ采取策略β1、β2、β3时,他 的损失分别为(对应列的最大元素)9、2、6。 因此,他的最优策略(按min max准则)是β2, 可保证损失不超过2。
结果,局中人Ⅰ按max min准则选取策略α2, 局中人Ⅱ按min max准则选取β2,双方都得到 了他们预想的收益,这是一种最稳妥的行为。 我们把称(α2, β2)称为对策G的最优局势。
10
3 0 6
试研究双方策略。
7.3.2 矩阵对策 (两人有限零和对策)的纯策略
解 由A可以看出,局中人Ⅰ的最大收益值是9, 要想达到这个目的,他就得选策略α3。然而局 中人Ⅱ也在考虑,因为局中人Ⅰ有出α3的心理 状态,要想使自己有较大的赢得,就想选β3作 为对策。这样不仅不能使局中人Ⅰ得到9,反 而会失去10(即得10)。同样,局中人Ⅰ也 会想Ⅱ有出β3的可能,于是Ⅰ想出α4来对付Ⅱ, 使他不但得不到10反而输掉6,等等。
[经济学]第五章对策论ppt课件
maxminijminmaxij一般矩阵对策的解可以是不唯一的当解不唯一时解之间的关系具有下面两条性1无差别性对策值的唯一性2可交换性例讨论pq的取值范围使下面的矩阵对策存在鞍点10max由于该矩阵对策存在鞍点所以需满足max2min7min10max混合策略的概念通过上节的讨论可知求矩阵对策应先判断是否存在鞍点但有些矩阵对策不存在鞍点亦即对策没有平衡局势例如田忌赛马中按照最大最小原则可得
第五章 博弈论〔Game Theory〕
博弈论的几个常见模型
囚徒困境 智猪博弈 顶牛博弈
囚徒困境
警察抓住了两个罪犯,但是警察局却缺乏足够的 证据指证他们所犯下的罪行,假如罪犯中至少有 一人供认犯罪就能确定罪名成立。为了得到所需 的口供,警察将这两名罪犯分别关押以防止他们 串通或者结成攻守联盟,并分别跟他们将清楚了 他们的处境和面对的选择:假如他们两人中有一 人坦白认罪那么坦白者立即得到释放而另一人将 重判8年徒刑。假如两人都坦白认罪,那么他们将 各判5年徒刑。当然两人都拒不认罪,那么警察手 上缺乏证据,那么他们会以较轻的阻碍公事各判1 年徒刑。
A
1
1
1
3
1
1
1 1 1 1 3 1
1 1 1 1 1 3
局中人1齐王的赢得矩阵
合作对策
对 策 论
非合作对策
零和对策
二人对策
静态对策
多人对策
常和对策 变和对策
动态对策
对策论的分类
二人有限零和对策〔矩阵对策〕
对策分类中,研究最早、占有重要地位的是二人有限零和 对策。二人有限零和对策需具备以下三个条件:
§ 1 矩阵对策的最优纯策略
纯策略和混合策略的概念
有些对策问题双方会分别采取中的策略,这样的 策略我们称为纯策略。
第五章 博弈论〔Game Theory〕
博弈论的几个常见模型
囚徒困境 智猪博弈 顶牛博弈
囚徒困境
警察抓住了两个罪犯,但是警察局却缺乏足够的 证据指证他们所犯下的罪行,假如罪犯中至少有 一人供认犯罪就能确定罪名成立。为了得到所需 的口供,警察将这两名罪犯分别关押以防止他们 串通或者结成攻守联盟,并分别跟他们将清楚了 他们的处境和面对的选择:假如他们两人中有一 人坦白认罪那么坦白者立即得到释放而另一人将 重判8年徒刑。假如两人都坦白认罪,那么他们将 各判5年徒刑。当然两人都拒不认罪,那么警察手 上缺乏证据,那么他们会以较轻的阻碍公事各判1 年徒刑。
A
1
1
1
3
1
1
1 1 1 1 3 1
1 1 1 1 1 3
局中人1齐王的赢得矩阵
合作对策
对 策 论
非合作对策
零和对策
二人对策
静态对策
多人对策
常和对策 变和对策
动态对策
对策论的分类
二人有限零和对策〔矩阵对策〕
对策分类中,研究最早、占有重要地位的是二人有限零和 对策。二人有限零和对策需具备以下三个条件:
§ 1 矩阵对策的最优纯策略
纯策略和混合策略的概念
有些对策问题双方会分别采取中的策略,这样的 策略我们称为纯策略。
矩阵对策的基本理论
解:采购员为局中人Ⅰ,他有三个策略:在秋季购煤 100 吨,150 吨和 200 吨,分别记 为α1、α2、α3;大自然为局中人Ⅱ,它也有三个策略,“选择”冬季气候较暖、正常、较冷, 分别记为 β1、β2 和 β3。以冬季取暖购煤的实际费用作为局中人Ⅰ的赢得,它等于秋季购煤 费用和冬季用煤不够时再补购的费用之和,赢得矩阵为
A
a21
a22
a2n
am1 am2 amn
(12-3)
为局中人Ⅰ的赢得 矩阵。由于对策为零和的,故局中人 Ⅱ的赢得矩阵为-A。
当局中人Ⅰ、Ⅱ的策略集 S1, S2 及局中人Ⅰ的赢得矩阵 A 确定后,一个矩阵对策就给定
了。因此将矩阵对策表示为 G S1,S2;A.
矩阵对策的最优纯策略
x E m
x
x , x ,, x
12
m
T
,
x i
0, i
1,,
m,
m
x i
i 1
1
S 2
y
E
n
y
y , y ,, y
12
n
T,
y j
0,
j
1,
n,
n
j 1
y j
1
S 和S 1
2
分别称为局中人Ⅰ和Ⅱ的混合策略集;
x
S
1
和y
S
2
分别称为局中人Ⅰ和Ⅱ
的混合策略;当
x
S 1
和y
S
2
其中, T G1
和T G 2
分别为局中人 I 和 II 的策略集。
运筹学
使自己的赢得尽可能的小,理性的选择就应该是从各自可能出现的最不利的情形中争取尽可
能好的结果。
A
a21
a22
a2n
am1 am2 amn
(12-3)
为局中人Ⅰ的赢得 矩阵。由于对策为零和的,故局中人 Ⅱ的赢得矩阵为-A。
当局中人Ⅰ、Ⅱ的策略集 S1, S2 及局中人Ⅰ的赢得矩阵 A 确定后,一个矩阵对策就给定
了。因此将矩阵对策表示为 G S1,S2;A.
矩阵对策的最优纯策略
x E m
x
x , x ,, x
12
m
T
,
x i
0, i
1,,
m,
m
x i
i 1
1
S 2
y
E
n
y
y , y ,, y
12
n
T,
y j
0,
j
1,
n,
n
j 1
y j
1
S 和S 1
2
分别称为局中人Ⅰ和Ⅱ的混合策略集;
x
S
1
和y
S
2
分别称为局中人Ⅰ和Ⅱ
的混合策略;当
x
S 1
和y
S
2
其中, T G1
和T G 2
分别为局中人 I 和 II 的策略集。
运筹学
使自己的赢得尽可能的小,理性的选择就应该是从各自可能出现的最不利的情形中争取尽可
能好的结果。
矩阵对策的基本原理
f ( x, y ) f ( x , y ) f ( x , y)
* * * *
(10 5)
则称(x*, y*)为函数f 的一个鞍点。
10
例8 求对策的解。设矩阵对策 G={S1,S2;A} 为矩阵对策,其中 S1 1 , 2 ,, m , S2 1 , 2 ,, n ,赢 得矩阵为
* * ( , (10-1)式成立的纯局势 i j )为G在纯策略 * * 的解(或平衡局势), i 与 j 分别称为局中 人 I、II的最优纯策略。
成立,记VG=ai*j*。则称VG为对策G的值,称使
7
例7 求解矩阵对策 G={S1,S2;A},其中
7 1 8 3 2 4 A 16 1 3 5 3 0
a12 a22 am 2
a1n a2 n amn
1
为局中人I的赢得矩阵(或局中人II的支付矩阵)。由 于假定对策为零和的,故局中人II的赢得矩阵就是 -A。通常,将一个矩阵对策记成 G={I,II;S1,S2;A} 或 G={S1,S2;A}
例:齐王赛马
1 1
2
2
1
2
2
1
12
例9 某单位采购员在秋天要决定冬季取暖用 煤的储量问题。已知在正常的冬季气温条件下 要消耗15吨煤,在较暖与较冷的气温条件下要 消耗10吨和20吨。假定冬季时的煤价随天气寒 冷程度而有所变化,在较暖、正常、较冷的气 候条件下每吨煤价分别为100元,150元和200 元,又设秋季时煤价为每吨100元。在没有关 于当年秋季准确的气象预报的条件下,秋季储 煤多少吨能使单位的支出最少?
6 1 A 8 0
5 4 5 2
第十二章-对策论(运筹学讲义)课件
局中人2 出1指
5 -5
出2指 -5 5
局中人1从局中人2该如何选择策略,已获得利益?
-
3
例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在 不同的屋子里审讯。警察告诉他们: 如果两人都坦白,各 判刑8年;如果两人都抵赖,由于证据不充分,两人将各 判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者 立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯 都有两种策略: 坦白或抵赖。可以用一个矩阵表示两个嫌 疑犯的策略的损益
3.一局势对策的益损值: 局中人各自使用一个对策就形成了一 个局势,一个局势决定了各局中人的对策结果(量化)称 为该局势对策的益损值。
赢得函数(payoff function): 定义在局势上,取值为相应益 损值的函数
4. 纳什均衡: 纳什均衡指所有局中人最优策略组成的一种局势,
既在给定其他局中人策略的情况下,没有任何局中人有积
A
1
4
3
2
解因
m i a x m j in a ij 2 , m j in m i a x a ij 3
m a ixm jina ij m jinm a ixa ij
不符合鞍点条件, 故G的鞍点不存在。
例6 求解矩阵对策,其中: 解 容易得到
A 11
0 1
1 1
v a i * j * 1i * 1 ,2 ;j * 3
A
a
2
1
a22
a1m
a2
m
a
m
1
am2
amn
aij为局中人甲在局势
( i , j )下的赢得 -
9
“齐王赛马”是一个矩阵策略。
其中: 齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 },
对策论第2,3节 矩阵对策的基本定理与解法
存在前提:
max min aij = min max aij= v
i
j
ji
ห้องสมุดไป่ตู้
又称( 2 ,3 )为对策G={s1,s2,A}的鞍点。值 V为G的值。
定义9-1:对给定的矩阵对策
G = S1,S2;A 若等式
max min aij= min max aij
i
j
j
i
成立,则称这个公共值为对策G的值,记 为VG,而达到的局势( i, j )称为对 策G在纯策略意义下的解,记为( I*, j *)而I*和 j *分别称为局中人I和局中 人II的最优纯策略。
第2,3节 矩阵对策理论与求解方法
一、矩阵对策的最优纯策略
•在甲方赢得矩阵A=[aij]m*n中: aij代表甲方取策略i,乙方取策略j, 这一局势
下甲方的益损值,此时乙方的益损值为-aij(零 和性质)。 •在讨论各方采用的策略是必须注意一个前提就 是对方是理智的。这就是要从最有把握取得的 益损值情况考虑。
显然 ai2 a12 a1j ai2 a32 a3j 对 I=1,2,3 j=1,2,3 都成立: a12 = a32 =5 由定理5-1,对策值=5,对策的解:( 1 , 2 ) 和( 3 , 2 )
例3:某单位采购员在秋天时要决定冬天取暖 用煤的采购量。已知在正常气温条件下需要用 煤15吨,在较暖和较冷气温条件下需要用煤10 吨和20吨。假定冬季的煤价随着天气寒冷的程 度而变化,在较暖、正常、较冷气温条件下每 吨煤价为100元、150元、200元。又秋季每 吨煤价为100元。在没有关于当年冬季气温情 况下,秋季应购多少吨煤,能使总支出最少?
E(X,Y)= xi aij yj=XAYT 称为局中人I期望赢得,而局势(X,Y)称为“混合 局势”,局中人I,II的混合策略集合记为S1*, S2*。
第 11.2 节 矩阵对策的基本定理
2014-5-24
2
当局中人Ⅰ选定纯策略 i 和局中人Ⅱ选定纯策略 j 后, 就 形成了一个纯局势(i , j )。这样的纯局势可构成 m× n 矩 阵。对任一纯局势(i , j ) , 记局中人Ⅰ的赢得值为 aij , 则称 矩阵 A = ( aij )mn 为局中人 I 的赢得矩阵(或为局中人 II 的支 付矩阵),这样,局中人 II 的赢得矩阵即为 –A。 矩阵对策常记为:G = {I, II; S1, S2; A}或 G = { S1, S2; A}
j
综上可得
即
2014-5-24
aij* max aij* ai* j* min ai* j ai* j
i j
aij* ai* j* ai* j
11
定义2 设 f ( x, y)为一个定义在 x∈ A 及 y ∈ B 上的实 值函数, 如果存在 x* A, y* B, 使得对一切 x A 和 y B, 有 f ( x, y* )≤ f ( x* , y* )≤ f ( x* , y) 则称 ( x* , y* ) 为函数 f 的一个鞍点。 矩阵对策的解与鞍点
第11 章 对策论基础
第 2 节 矩阵对策的基本定理
2. 1 矩阵对策的数学模型
二人有限零和对策
二人零和对策就是矩阵对策, 是指只有两个参加对策的局中 人, 每个局中人都只有有限个策略可供选择。在任一局势下, 两个局中人的赢得之和总是等于零, 即双方的利益是激烈对 抗的。
矩阵对策的表示
设局中人Ⅰ有 m 个纯策略 1 , 2 , ⋯ , m , 局中人Ⅱ有 n 个 纯策略 1 , 2 , ⋯ , n , 则局中人Ⅰ、Ⅱ的策略集分别为 S1 = {1 , 2 , ⋯ , m} S2 = {1 , 2 , ⋯ , n}
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6 1 8
A
3
2
4
9 1 10
3
0
6
试分析局中人 I 和 II 分别使用什么策略最有利?又在什么 局势下对双方都有利?
2020/11/24
5
定义1 设 G = { S1 , S2 ; A}为矩阵对策。其中 S1 = {1 , 2 , ⋯ , m } , S2 = {1 , 2 , ⋯ , n } , A = ( aij )m×n 若成
1
3
1
1
1
1
即
1 A 1
1 1
3 1
1 3
1 1
1
1
1 1 1 1 3 1
1 1 1 1 1 3
2020/11/24
4
例6
设有一矩阵对策 G = { S1, S2 ; A} , 其中 S1 ={1, 2, 3, 4 } ,
S2 = {β1 ,β2 ,β3 },局中人 I 的赢得矩阵为
12
例8
求对策的解。设矩阵对策 G = { S1 , S2 ; A} , 其中 S1 = {1 , 2 , 3 , 4 } , S2 = {1 , 2 , 3 , 4 } , 赢得矩阵为
6 5 6 5
A 1 4 2 1 8 5 7 5
0 2 6
2
2020/11/24
13
一般矩阵对策的解可以是不唯一的。当解不唯一时, 解之间 的关系具有下面两条性质。
10
必要性
假设有 i*, j* 使
m i m aj x a ii jn ai*j*m j m iina ai jx 上式右边说明 ai*j* 是第 j* 列中最大元,即 mi aaxij* ai*j* 同理左边说明 ai*j* 是第 i* 行中最小元,即 mj inai*j ai*j* 而对任意 i 应有
f ( x, y* )≤ f ( x* , y* )≤ f ( x* , y) 则称 ( x* , y* ) 为函数 f 的一个鞍点。
矩阵对策的解与鞍点
若将局势矩阵视为二元函数 f ( x, y) 的定义域,则赢得矩阵 即为其值域;从而,若矩阵对策有解的充要条件是 ai*j* 是赢 得矩阵的鞍点。
2020/11/24
立以下等式
max i
min j
aij
min j
max i
aij
ai* j*
VG
则称 VG 为对策 G 的值, 并称使上述等式成立的纯局势
(i* , j* )为 G 在纯策略下的解(或平衡局势), i* 与 j*
分别称为局中人Ⅰ , Ⅱ的最优纯策略。
2020/11/24
6
例7
求解矩阵对策 G= { S1, S2 ; A} , 其中
7 1 8
A
3
2
4
16 1 3
3
0
5
2020/11/24
7
定理1 矩阵对策 G = { S1 , S2 ; A} 在纯策略意义下有
解的充分必要条件是: 存在纯局势(i* ,j* )使得对一切
i = 1, ⋯, m, j = 1, ⋯, n, 均有
证明:
aij* ≤ ai*j* ≤ ai*j
纯策略 1 , 2 , ⋯ , n , 则局中人Ⅰ、Ⅱ的策略集分别为
S1 = {1 , 2 , ⋯ , m}
S2 = {1 , 2 , ⋯ , n}
2020/11/24
2
当局中人Ⅰ选定纯策略 i 和局中人Ⅱ选定纯策略 j 后, 就 形成了一个纯局势(i , j )。这样的纯局势可构成 m× n 矩 阵。对任一纯局势(i , j ) , 记局中人Ⅰ的赢得值为 aij , 则称
矩阵对策的基本定理优秀课件
2. 1 矩阵对策的数学模型
二人有限零和对策
二人零和对策就是矩阵对策, 是指只有两个参加对策的局中 人, 每个局中人都只有有限个策略可供选择。在任一局势下, 两个局中人的赢得之和总是等于零, 即双方的利益是激烈对 抗的。
矩阵对策的表示
设局中人Ⅰ有 m 个纯策略 1 , 2 , ⋯ , m , 局中人Ⅱ有 n 个
aij* mi aaxij*
同理对任意 j 应有
mj inai*j ai*j
综上可得
a i* j m i a i* a j a x i* j* m j a i* ji n a i* j
即
ai* j ai*j*ai*j
2020/11/24
11
定义2 设 f ( x, y)为一个定义在 x∈ A 及 y ∈ B 上的实 值函数, 如果存在 x* A, y* B, 使得对一切 x A 和 y B, 有
ai*j* 不超过 i* 行的最小元素,即有
因此可得
ai*j* mj inai*j m i aai* jxai*j*m j a ii* nj
而对每列的最大元中的最小者及每行的最小元中的最大者
有
m j m iia in a jm x a i* a j a i* x j* m j a i* ji m n i m ja a i j i x n
2020/11/24
8
充分性(前提:对任意 i, j 有 aij* ai*j* ai*j )
由不等式左边知,j* 列的任一元素不超过 j* 列的的素任最一大元元也不超过 ai*j* .即:
ai*j*,从而
j*
列
mi aaxij* ai*j*
i* 行的任一元 素
同理对不等式右边, ai*j* 不超过 i* 行的任一元素,从而
mi am xj ianij aij 同理,由不等式的右边也可得
从而有
aij mj inmi aaxij m i m ja a ix j ia n ij m j m iia n ia j x (2 )
结合(1),(2)即可得
m i am jxa iinjm j m in i aaijx
2020/11/24
矩阵 A = ( aij )mn 为局中人 I 的赢得矩阵(或为局中人 II 的支 付矩阵),这样,局中人 II 的赢得矩阵即为 –A。
矩阵对策常记为:G = {I, II; S1, S2; A}或 G = { S1, S2; A}
2020/11/24
3
例 齐王赛马的赢得矩阵
3 1 1 1 1 1
即:
m j m iin a ia j m x i m a j a ix ij n (1 )
2020/11/24
9
另外,对任意 i, j 有,任意元素 aij 不小于其所在行的最小元, 也不大于其所在列的最大元,即
mj ianijaijmi aaixj
不等式左边又说明,矩阵中每一行的最小元都不超过 aij , 从而每一行的最小元中的最大者也不超过 aij ,即