对策论_矩阵求解经典.ppt
合集下载
对策论矩阵求解
故令A中每个元素减1再乘以½ ,得到
• 目前讨论 A 为支付矩阵旳对策 旳解。为此先 解方程组
•和
• 上述不等式组无解,根据计算下面两个不 等式组
二、线性规划措施
• 例2.6.3 用线性规划措施求解例
• 解:先将A旳每个元素加3,得到每个元素都是整 数旳支付矩阵
6 1 4
A1
局中人Ⅰ在这三局中合计赢得至少。后来各局均照此方 式对策下去,直到迭代旳成果到达一定旳满意程度为止。
近似解: 若设在N局对策中局中人Ⅰ出α1,α2, …,αm旳次数 为k1,k2, …,km ,局中人Ⅱ出β 1, β 2, …, β n旳次数 为l 1, l 2, …, l n ,xN=(k1 /N ,k2 /N, …,km /N), yN=(l1/N ,l2/N, …,lm /N), 则(xN, yN )就是所求近似解。
2
7
5
5 5 6
• 转而讨论以A1为支付矩阵旳矩阵对策 ,为此求
解两个互为对偶旳线性规划问题
1
1
三、迭代法
迭代法是求矩阵对策旳一种近似措施。
基本思想:
假设两个局中人反复进行对策屡次,在每 一局中各局中人都从自己旳策略集中选用 一种使对方取得最不利成果旳策略,即第t 局对策纯策略旳选择欲使对手在前t-1局中 合计所得(或合计所失)至少(或最多)
• 注:假如上述两个方程组旳分别存在非负解
x*,y*,则求得了 旳一种解(x*,y*)和对策值;
•
假如x*,y*中有负旳分量,则将方程组
(2.6.1),(2.6.2)中旳某些等式改为不等式试算。
例2.6.1 求解矩阵对策----田忌赛马问题。 解:已知田忌赛马问题中旳支付矩阵
• 对策 没有鞍点。为了使A中元素尽量多旳变为0,
• 目前讨论 A 为支付矩阵旳对策 旳解。为此先 解方程组
•和
• 上述不等式组无解,根据计算下面两个不 等式组
二、线性规划措施
• 例2.6.3 用线性规划措施求解例
• 解:先将A旳每个元素加3,得到每个元素都是整 数旳支付矩阵
6 1 4
A1
局中人Ⅰ在这三局中合计赢得至少。后来各局均照此方 式对策下去,直到迭代旳成果到达一定旳满意程度为止。
近似解: 若设在N局对策中局中人Ⅰ出α1,α2, …,αm旳次数 为k1,k2, …,km ,局中人Ⅱ出β 1, β 2, …, β n旳次数 为l 1, l 2, …, l n ,xN=(k1 /N ,k2 /N, …,km /N), yN=(l1/N ,l2/N, …,lm /N), 则(xN, yN )就是所求近似解。
2
7
5
5 5 6
• 转而讨论以A1为支付矩阵旳矩阵对策 ,为此求
解两个互为对偶旳线性规划问题
1
1
三、迭代法
迭代法是求矩阵对策旳一种近似措施。
基本思想:
假设两个局中人反复进行对策屡次,在每 一局中各局中人都从自己旳策略集中选用 一种使对方取得最不利成果旳策略,即第t 局对策纯策略旳选择欲使对手在前t-1局中 合计所得(或合计所失)至少(或最多)
• 注:假如上述两个方程组旳分别存在非负解
x*,y*,则求得了 旳一种解(x*,y*)和对策值;
•
假如x*,y*中有负旳分量,则将方程组
(2.6.1),(2.6.2)中旳某些等式改为不等式试算。
例2.6.1 求解矩阵对策----田忌赛马问题。 解:已知田忌赛马问题中旳支付矩阵
• 对策 没有鞍点。为了使A中元素尽量多旳变为0,
求解矩阵对策ppt
线1 ,3 ,4 在任意一点 y 0,1 处的纵坐标分别是局中人
Ⅱ采取混合策略(y,1 y)T 时的支付。根据最不利当中选择
最有利原则,局中人Ⅱ的最优选择就是如何确定y,以使三 个纵坐标中的最大值尽可能的小。求过B点的两条直线 1 , 3 所确定的方程。
2 y 4(1 y) VG 3y 2(1 y) VG
解得 y= 2 ,VG
3
8 3
所以局中人Ⅱ的最优策略为:
y* ( 2 , 1 )T 33
3
得到
B= (23 , 83)
6 4
策略3
4 1
策略1
2
3
0
局中人I策略1
策略2
B(2
3
,
8 3
)
3 2
A
策略2
-2
4
此外,由图可看出,局中人 的最优混合策略只由 1 , 3
组成,求
2
x 1
3x3
8 3
4x1
2 x3
8 3
x1 x3 1
得x x
1 3 2 3
所以,局中人 的最优混合策略为: x* (1 ,0, 2 ,0)T
33
5
第十一章 对策论
图解法求解:
14.14利用图解法求解下列矩阵对策
2 4
A 2
3
3 2
- 26
由于第1行优超于第2行,故可划去第2行
1
y 1 y
得到
2 4
A
3
ห้องสมุดไป่ตู้
2
- 2
6 6 4
策略3
4 1
策略1
由此作出求解图
2
3
0
局中人I策略1
策略2
Ⅱ采取混合策略(y,1 y)T 时的支付。根据最不利当中选择
最有利原则,局中人Ⅱ的最优选择就是如何确定y,以使三 个纵坐标中的最大值尽可能的小。求过B点的两条直线 1 , 3 所确定的方程。
2 y 4(1 y) VG 3y 2(1 y) VG
解得 y= 2 ,VG
3
8 3
所以局中人Ⅱ的最优策略为:
y* ( 2 , 1 )T 33
3
得到
B= (23 , 83)
6 4
策略3
4 1
策略1
2
3
0
局中人I策略1
策略2
B(2
3
,
8 3
)
3 2
A
策略2
-2
4
此外,由图可看出,局中人 的最优混合策略只由 1 , 3
组成,求
2
x 1
3x3
8 3
4x1
2 x3
8 3
x1 x3 1
得x x
1 3 2 3
所以,局中人 的最优混合策略为: x* (1 ,0, 2 ,0)T
33
5
第十一章 对策论
图解法求解:
14.14利用图解法求解下列矩阵对策
2 4
A 2
3
3 2
- 26
由于第1行优超于第2行,故可划去第2行
1
y 1 y
得到
2 4
A
3
ห้องสมุดไป่ตู้
2
- 2
6 6 4
策略3
4 1
策略1
由此作出求解图
2
3
0
局中人I策略1
策略2
电子课件第七章
7.3.1 矩阵对策(两人有限零和对策)的表示
一般地:用Ⅰ、Ⅱ表示两个局中人,局中 人Ⅰ有m个策略,即α1,α2,…,αm;局中人Ⅱ有n 个策略,即β1,β2,…,βn。
当Ⅰ选取策略αi,Ⅱ选取策略βj,就形成 一个局势(αi,βj),这时局中人Ⅰ的收益为 aij,局中人Ⅱ的收益为aij(共有mn个局势)。 矩阵A (a ij)称为局中人Ⅰ的收益矩阵,即
7.1 引言
在实际生活中,许多游戏都反映了对策论 的思想。例如,在人们非常熟悉的“石头、剪 刀、布”的游戏中,我们的问题是:对方如何 行动,而我又将如何应对才能取得胜利?这实 际上就涉及到了对策论的核心问题,即对策论 以对方的行为作为自己决策的依据,并寻求最 佳。但对策论不仅仅是指游戏,它研究的是当 人们的行为存在相互作用时的策略行为及其后 果。社会生活中的许多现象,都带有相互竞争 与合作的特征,可以说,一切都在博弈或对策 之中。
7.3.2 矩阵对策 (两人有限零和对策)的纯策略
同样,局中人Ⅱ采取策略β1、β2、β3时,他 的损失分别为(对应列的最大元素)9、2、6。 因此,他的最优策略(按min max准则)是β2, 可保证损失不超过2。
结果,局中人Ⅰ按max min准则选取策略α2, 局中人Ⅱ按min max准则选取β2,双方都得到 了他们预想的收益,这是一种最稳妥的行为。 我们把称(α2, β2)称为对策G的最优局势。
10
3 0 6
试研究双方策略。
7.3.2 矩阵对策 (两人有限零和对策)的纯策略
解 由A可以看出,局中人Ⅰ的最大收益值是9, 要想达到这个目的,他就得选策略α3。然而局 中人Ⅱ也在考虑,因为局中人Ⅰ有出α3的心理 状态,要想使自己有较大的赢得,就想选β3作 为对策。这样不仅不能使局中人Ⅰ得到9,反 而会失去10(即得10)。同样,局中人Ⅰ也 会想Ⅱ有出β3的可能,于是Ⅰ想出α4来对付Ⅱ, 使他不但得不到10反而输掉6,等等。
运筹学教材课件(第九章 对策论)
j
ai* j
a a i* j*
i* j
同理有
因此 max i
aij*
ai* j
a a i* j*
ij*
由式(9-6)和式(9-7)得
aij* ai* j* ai* j i=1,2, ,m ;j=1,2, ,n
证得 (i* , j* )是G的纯策略解。
(9-6) (9-7)
9.2.1 最优纯策略和鞍点
4
2*
3
-3
8
1
4
-3
4
0
1
-5
3
-5
max
2*
8
i
2*
5
2
(1, 1), (1, 3), (2, 1), (2, 3) 都是G的鞍点,因而它们也都是最优纯策略
解,对策值VG=2 ,Ⅰ的最优纯策略解是1,2,Ⅱ的最优纯策略解 是 1, 3。
9.2.1 最优纯策略和鞍点
纯策略解有下述两条性质: (1)无差别性
定义9-4 设G* {X ,Y ; E},是矩阵对策 G {s1, s2; A}的混和扩充, 如果存在混合局势(x*, y*)使得对所有x∈X,y∈Y,有
E(x, y*) E(x*, y*) E(x*, y)
(9-10)
则称(x*, y*)是对策G的混合策略解,简称对策G的解,或称最优
混合局势,简称最优局势。称 x*, y*分别是局中人Ⅰ和Ⅱ的最
ai*
j
又因为
min j
max i
aij
max i
aij*
;
min j
ai*
j
max min
i
j
aij
所以
min j
[经济学]第五章对策论ppt课件
maxminijminmaxij一般矩阵对策的解可以是不唯一的当解不唯一时解之间的关系具有下面两条性1无差别性对策值的唯一性2可交换性例讨论pq的取值范围使下面的矩阵对策存在鞍点10max由于该矩阵对策存在鞍点所以需满足max2min7min10max混合策略的概念通过上节的讨论可知求矩阵对策应先判断是否存在鞍点但有些矩阵对策不存在鞍点亦即对策没有平衡局势例如田忌赛马中按照最大最小原则可得
第五章 博弈论〔Game Theory〕
博弈论的几个常见模型
囚徒困境 智猪博弈 顶牛博弈
囚徒困境
警察抓住了两个罪犯,但是警察局却缺乏足够的 证据指证他们所犯下的罪行,假如罪犯中至少有 一人供认犯罪就能确定罪名成立。为了得到所需 的口供,警察将这两名罪犯分别关押以防止他们 串通或者结成攻守联盟,并分别跟他们将清楚了 他们的处境和面对的选择:假如他们两人中有一 人坦白认罪那么坦白者立即得到释放而另一人将 重判8年徒刑。假如两人都坦白认罪,那么他们将 各判5年徒刑。当然两人都拒不认罪,那么警察手 上缺乏证据,那么他们会以较轻的阻碍公事各判1 年徒刑。
A
1
1
1
3
1
1
1 1 1 1 3 1
1 1 1 1 1 3
局中人1齐王的赢得矩阵
合作对策
对 策 论
非合作对策
零和对策
二人对策
静态对策
多人对策
常和对策 变和对策
动态对策
对策论的分类
二人有限零和对策〔矩阵对策〕
对策分类中,研究最早、占有重要地位的是二人有限零和 对策。二人有限零和对策需具备以下三个条件:
§ 1 矩阵对策的最优纯策略
纯策略和混合策略的概念
有些对策问题双方会分别采取中的策略,这样的 策略我们称为纯策略。
第五章 博弈论〔Game Theory〕
博弈论的几个常见模型
囚徒困境 智猪博弈 顶牛博弈
囚徒困境
警察抓住了两个罪犯,但是警察局却缺乏足够的 证据指证他们所犯下的罪行,假如罪犯中至少有 一人供认犯罪就能确定罪名成立。为了得到所需 的口供,警察将这两名罪犯分别关押以防止他们 串通或者结成攻守联盟,并分别跟他们将清楚了 他们的处境和面对的选择:假如他们两人中有一 人坦白认罪那么坦白者立即得到释放而另一人将 重判8年徒刑。假如两人都坦白认罪,那么他们将 各判5年徒刑。当然两人都拒不认罪,那么警察手 上缺乏证据,那么他们会以较轻的阻碍公事各判1 年徒刑。
A
1
1
1
3
1
1
1 1 1 1 3 1
1 1 1 1 1 3
局中人1齐王的赢得矩阵
合作对策
对 策 论
非合作对策
零和对策
二人对策
静态对策
多人对策
常和对策 变和对策
动态对策
对策论的分类
二人有限零和对策〔矩阵对策〕
对策分类中,研究最早、占有重要地位的是二人有限零和 对策。二人有限零和对策需具备以下三个条件:
§ 1 矩阵对策的最优纯策略
纯策略和混合策略的概念
有些对策问题双方会分别采取中的策略,这样的 策略我们称为纯策略。
第 11.3 节 矩阵对策的解法
2014-5-24
4
例12
求解矩阵对策 G = { S1 , S2 ; A} , 其中
1 3 A 4 2
2014-5-24
5
2. 2× n 或m×2 对策的图解法
2× n 对策的解题步骤:
(1)在直角坐标系中作直线 I:x = 0;II:x = 1; (2)在直线I处按矩阵第2行的值标纵坐标,在直线II处按矩阵第1行 的值标纵坐标;其意义是指当局中人一采用其中一个纯策略时,局 中人二各策略相对应的赢得值; (3)按列的方向将各对应纵坐标值连成直线; (4)令 0 < x < 1,即局中人一采用混合策略,按最小最大原则,在 图中找出局中人一的最优策略;具体方法是:让 x 在(0, 1)内变动, 找出经过点(x, 0)的垂线与上述直线交点中纵坐标最小的点集(某些线 段),然后再从中找出纵坐标最大的点 P 所对应的横坐标即为所求; (5)确定经过点 P 的两相交直线,根据两相交直线列出对应方程 组,求出 x*. (6)根据定理6的结论计算 y* 的值。
2014-5-24 10
例14
用图解法求解矩阵对策 G = { S1 , S2 ; A} , 其中 2 7 A 6 6 11 2
2014-5-24
ห้องสมุดไป่ตู้11
2014-5-24
12
例 15
求解赢得矩阵A 的矩阵对策
8 4 4 2 A 3 1 5 5 7
2014-5-24
16
例17
某厂用三种不同的设备 1 、 2 、 3 加工三种不同的产品 1 、 2 、 3 , 已知三种设备分别加工三种产品时, 单位时间 内创造的价值由下表给出。 被加工产品 使用设备
第十二章-对策论(运筹学讲义)课件
局中人2 出1指
5 -5
出2指 -5 5
局中人1从局中人2该如何选择策略,已获得利益?
-
3
例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在 不同的屋子里审讯。警察告诉他们: 如果两人都坦白,各 判刑8年;如果两人都抵赖,由于证据不充分,两人将各 判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者 立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯 都有两种策略: 坦白或抵赖。可以用一个矩阵表示两个嫌 疑犯的策略的损益
3.一局势对策的益损值: 局中人各自使用一个对策就形成了一 个局势,一个局势决定了各局中人的对策结果(量化)称 为该局势对策的益损值。
赢得函数(payoff function): 定义在局势上,取值为相应益 损值的函数
4. 纳什均衡: 纳什均衡指所有局中人最优策略组成的一种局势,
既在给定其他局中人策略的情况下,没有任何局中人有积
A
1
4
3
2
解因
m i a x m j in a ij 2 , m j in m i a x a ij 3
m a ixm jina ij m jinm a ixa ij
不符合鞍点条件, 故G的鞍点不存在。
例6 求解矩阵对策,其中: 解 容易得到
A 11
0 1
1 1
v a i * j * 1i * 1 ,2 ;j * 3
A
a
2
1
a22
a1m
a2
m
a
m
1
am2
amn
aij为局中人甲在局势
( i , j )下的赢得 -
9
“齐王赛马”是一个矩阵策略。
其中: 齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 },
管理运筹学11对策论
Am×n={aij}。因为对策是零和的,所以乙的赢得矩阵为 -Am×n。
2019/10/28
1. 矩阵对策的数学模型
建立二人零和对策的模型就是要根据对实际问 题的叙述,确定甲、乙两个局中人的策略集合以 及相应的赢得矩阵。不难看出在“齐王赛马”的 例子中,齐王的赢得矩阵为:
3 1 1 1 1 -1
义;若抽到黑牌,甲的掷硬币已无意义,只与乙的猜红 或猜黑有关。所以,对于局势“掷硬币,猜红”甲的期 望赢得为:1/2(1/2p-1/2q)+1/2t = 1/4(p-q+2t )
2019/10/28
1. 矩阵对策的示例2
抽到红牌1/2
掷硬币
让乙猜
抽到黑牌1/2 让乙猜
正面 1/2
反面 1/2
猜红
定理1:设矩阵对策G={S1,S2,A}在策略意 义下有解的充分必要条件是存在着局势( i* ,j* ) 使得对于一切i与j都有aij* ai*j* ai*j成立。
定理2:对策矩阵G={S1,S2,A}在混合策略 意义下有解的充分必要条件是存在着
x * S1* , y * S2*使(x *,y *) 为E (x,y) 的 一个鞍点,即对于一切x S1* , y S2* 有
对 策
零和
盟
多人
对
策
无
非零和
限
对 同有限对策
策
第二节:矩阵对策
1.矩阵对策的数学模型 2.矩阵对策解的问题 3.矩阵对策的混合策略 4.矩阵对策的基本定理 5.矩阵对策解的性质
2019/10/28
1.矩阵对策的数学模型
(1)矩阵对策的内涵:二人有限零和对策,即对策双方 的利益是激烈对抗的。
2019/10/28
1. 矩阵对策的数学模型
建立二人零和对策的模型就是要根据对实际问 题的叙述,确定甲、乙两个局中人的策略集合以 及相应的赢得矩阵。不难看出在“齐王赛马”的 例子中,齐王的赢得矩阵为:
3 1 1 1 1 -1
义;若抽到黑牌,甲的掷硬币已无意义,只与乙的猜红 或猜黑有关。所以,对于局势“掷硬币,猜红”甲的期 望赢得为:1/2(1/2p-1/2q)+1/2t = 1/4(p-q+2t )
2019/10/28
1. 矩阵对策的示例2
抽到红牌1/2
掷硬币
让乙猜
抽到黑牌1/2 让乙猜
正面 1/2
反面 1/2
猜红
定理1:设矩阵对策G={S1,S2,A}在策略意 义下有解的充分必要条件是存在着局势( i* ,j* ) 使得对于一切i与j都有aij* ai*j* ai*j成立。
定理2:对策矩阵G={S1,S2,A}在混合策略 意义下有解的充分必要条件是存在着
x * S1* , y * S2*使(x *,y *) 为E (x,y) 的 一个鞍点,即对于一切x S1* , y S2* 有
对 策
零和
盟
多人
对
策
无
非零和
限
对 同有限对策
策
第二节:矩阵对策
1.矩阵对策的数学模型 2.矩阵对策解的问题 3.矩阵对策的混合策略 4.矩阵对策的基本定理 5.矩阵对策解的性质
2019/10/28
1.矩阵对策的数学模型
(1)矩阵对策的内涵:二人有限零和对策,即对策双方 的利益是激烈对抗的。
《运筹学教程》胡云权第五版运筹学6对策论矩阵对策 34页
9 2 6 -3
理智行为:从各自最不利情形中选择最有利 I:最大最小原则 II:最小最大原则
平衡局势:双方均可接受,且对双方都是最稳妥的结果。 (α2 ,β2),局中人I和II的最优纯策略。
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定义 1:设 G {S1, S2; A}为矩阵对策,其中
S1 {1,2 ,,m} , S2 {1, 2 ,, n}, A {aij }mn ,
a22既是其所在行的最小元素,也是其所在列的最大元素,
即有 ai2≤a22 ≤ a2j i=1,2,3,4 j=1,2,3
矩阵对策的纯策略
3、矩阵对策的最优纯策略
定理 1: 矩阵对策 G {S1, S2; A}在纯策略意义下有解的充要条
件是:存在纯局势
( i
*
,
j*
)
使得对一切
i
1,2,, m;
44
22
对策的值(局中人
I
的赢得期望值)VG
9 2
。
矩阵对策的解法
图解法
仅适用于赢得矩阵为2×n或m×2阶的矩阵对策问题。
例:求解矩阵对策G={S1 , S2 ; A} ,其中
A
解:(1)不存在鞍点,为混合策略求解问题。
2 7
3 5
11
2
(2)图解法求解
设局中人I的混合策略为(x, 1-x)T,x [0,1] 。
据定义 1,不存在纯策略意义下的解。 无鞍点
例:
G
{S1,
S2;
A} ,其中
A
3 5
63 44
56
局中人Ⅰ和Ⅱ在策略集 S1 和 S 2 中采取每一策略都有一
《运筹学教程》胡云权 第五版 运筹学--6对策论--矩阵对策PPT35页
《运筹学教程》胡云权 第 五版 运筹学--6对策论--矩阵
对策
26、机遇对于有准备的头脑有特别的 亲和力 。 27、自信是人格的核心。
28、目标的坚定是性格中最必要的力 量泉源 之一, 也是成 功的利 器之一 。没有 它,天 才也会 在矛盾 无定的 迷径中 ,徒劳 无功。- -查士 德斐尔 爵士。 29、困难就是机遇。--温斯顿.丘吉 尔。 30、我奋斗,所以我快乐。--格林斯 潘。
21、要知道对好事的称颂过于夸大,也会招来人们的反感轻蔑和嫉妒。——培根 22、业精于勤,荒于嬉;行成于思,毁于随。——韩愈
23、一切节省,归根到底都归结为时间的节省。——马克思 24、意志命运往往背道而驰,决心到最后会全部倒。——莎士比亚
25、学习是劳动,是充满思想的劳动。——乌申斯基
谢谢!
对策
26、机遇对于有准备的头脑有特别的 亲和力 。 27、自信是人格的核心。
28、目标的坚定是性格中最必要的力 量泉源 之一, 也是成 功的利 器之一 。没有 它,天 才也会 在矛盾 无定的 迷径中 ,徒劳 无功。- -查士 德斐尔 爵士。 29、困难就是机遇。--温斯顿.丘吉 尔。 30、我奋斗,所以我快乐。--格林斯 潘。
21、要知道对好事的称颂过于夸大,也会招来人们的反感轻蔑和嫉妒。——培根 22、业精于勤,荒于嬉;行成于思,毁于随。——韩愈
23、一切节省,归根到底都归结为时间的节省。——马克思 24、意志命运往往背道而驰,决心到最后会全部倒。——莎士比亚
25、学习是劳动,是充满思想的劳动。——乌申斯基
谢谢!
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0,故令A中每个元素减1再乘以½ ,得到
精选
• 现在讨论 A 为支付矩阵的对策 的解。为此先 解方程组
精选
•和
精选
精选
例2.6.2
精选
精选
精选
• 上述不等式组无解,根据计算下面两个不 等式组
精选
精选
二、线性规划方法
精选
精选
• 例2.6.3 用线性规划方法求解例2.6.2
• 解:先将A的每个元素加3,得到每个元素都是整 数的支付矩阵
精选
具体做法:
在第1局中,从两个局中人中任选一个,如局中人 Ⅰ人最,Ⅱ少让随。之他在采先第取采2局策取中略任,β意局j一,中个使人策采Ⅰ略取还,α认i如的为α局局i 。中中然人人后ⅠⅡ,的采局所取中得 策局略中人β jⅡ,又故采采取取策某略策,略使αi使采局取中局人中Ⅱ人的Ⅰ所在失这最两多局,中 累计赢得最少。在第3局中,局中人Ⅰ又采取某策 略使局中人Ⅱ在前两局的累计所失最多,然后局中 人Ⅱ又采取某策略, 局中人Ⅰ在这三局中累计赢得最少。以后各局均照此方 式对策下去,直到迭代的结果达到一定的满意程度为止。
精选
• 迭代算法的终止准则: • 1、给定迭代次k • 2、给定允许误差 (0 1) ,当迭代次数k满足
• vt vt 时,迭代结束。
精选
• 例2.6.4 用迭代法求解例2.6.2,允许误差
0.04
精选
精选
在前 30 局中,甲选纯策略1,2 ,3 的次数依次为 5,4,21,故甲的策略为
精选
• 令:
_VN =(
min
1≤ j≤n
 ̄VN
=(
max
1≤ i≤m
m
i=∑1naijki ) /N
∑ j=1
aijlj
) /N
VN=( _VN +  ̄VN ) /2
则VN是对策值VG的近似值。 {xN}的每一个收敛子列收敛于局中人Ⅰ的最优策略, {yN}的每一个收敛
子列收敛于局中人Ⅱ的最优策略。{VN}收敛于VG 。
精选
近似解: 若设在N局对策中局中人Ⅰ出α1,α2, …,αm的次数 为k1,k2, …,km ,局中人Ⅱ出β 1, β 2, …, β n的次数 为l 1, l 2, …, l n ,xN=(k1 /N ,k2 /N, …,km /N), yN=(l1/N ,l2/N, …,lm /N), 则(xN, yN )就是所求近似解。
2.6 矩阵对策的求解
精选
• 矩阵求解的四种方法: 1、线性方程组法 2、线性规划方法 3、迭代法 4、图解法
精选
一、线性方程组方法
根据定理 2.2.5,
求解矩阵对策 (S1, S2; A) 等价于求解不等式组
精选
• 又根据定理2.4.3,如果甲和乙的最优策略 中所有分量都大于0,那么上面的不等式组 可化成下面两个线性方程组。
精选
• 注:如果上述两个方程组的分别存在非负解
x*,y*,则求得了 的一个解(x*,y*)和对策值;
•
如果x*,y*中有负的分量,则将方程组
(2.6.1),(2.6.2)中的某些等式改为不等式试算。
精选
例2.6.1 求解矩阵对策----田忌赛马问题。 解:已知田忌赛马问题中的支付矩阵
精选
• 对策 没有鞍点。为了使A中元素尽可能多的变为
6 1 4
A1
2
7
5
5 5 6
• 转而讨论以A1为支付矩阵的矩阵对策 ,为此求
解两个互为对偶的线性规划问题
1
精选精选Biblioteka 1精选三、迭代法
迭代法是求矩阵对策的一种近似方法。
基本思想:
假设两个局中人反复进行对策多次,在每 一局中各局中人都从自己的策略集中选取 一个使对方获得最不利结果的策略,即第t 局对策纯策略的选择欲使对手在前t-1局中 累计所得(或累计所失)最少(或最多)
x30
(5 , 30
4 30
,
21) 30
;
乙选纯策略 1, 2 , 3 的次数依次为 18,12,0,故乙的近似最优策略为
y30
(18 , 12 30 30
, 0) ;
对策值 v 的近似值为 vt
vt
vt 2
9 5
精选
精选
• 现在讨论 A 为支付矩阵的对策 的解。为此先 解方程组
精选
•和
精选
精选
例2.6.2
精选
精选
精选
• 上述不等式组无解,根据计算下面两个不 等式组
精选
精选
二、线性规划方法
精选
精选
• 例2.6.3 用线性规划方法求解例2.6.2
• 解:先将A的每个元素加3,得到每个元素都是整 数的支付矩阵
精选
具体做法:
在第1局中,从两个局中人中任选一个,如局中人 Ⅰ人最,Ⅱ少让随。之他在采先第取采2局策取中略任,β意局j一,中个使人策采Ⅰ略取还,α认i如的为α局局i 。中中然人人后ⅠⅡ,的采局所取中得 策局略中人β jⅡ,又故采采取取策某略策,略使αi使采局取中局人中Ⅱ人的Ⅰ所在失这最两多局,中 累计赢得最少。在第3局中,局中人Ⅰ又采取某策 略使局中人Ⅱ在前两局的累计所失最多,然后局中 人Ⅱ又采取某策略, 局中人Ⅰ在这三局中累计赢得最少。以后各局均照此方 式对策下去,直到迭代的结果达到一定的满意程度为止。
精选
• 迭代算法的终止准则: • 1、给定迭代次k • 2、给定允许误差 (0 1) ,当迭代次数k满足
• vt vt 时,迭代结束。
精选
• 例2.6.4 用迭代法求解例2.6.2,允许误差
0.04
精选
精选
在前 30 局中,甲选纯策略1,2 ,3 的次数依次为 5,4,21,故甲的策略为
精选
• 令:
_VN =(
min
1≤ j≤n
 ̄VN
=(
max
1≤ i≤m
m
i=∑1naijki ) /N
∑ j=1
aijlj
) /N
VN=( _VN +  ̄VN ) /2
则VN是对策值VG的近似值。 {xN}的每一个收敛子列收敛于局中人Ⅰ的最优策略, {yN}的每一个收敛
子列收敛于局中人Ⅱ的最优策略。{VN}收敛于VG 。
精选
近似解: 若设在N局对策中局中人Ⅰ出α1,α2, …,αm的次数 为k1,k2, …,km ,局中人Ⅱ出β 1, β 2, …, β n的次数 为l 1, l 2, …, l n ,xN=(k1 /N ,k2 /N, …,km /N), yN=(l1/N ,l2/N, …,lm /N), 则(xN, yN )就是所求近似解。
2.6 矩阵对策的求解
精选
• 矩阵求解的四种方法: 1、线性方程组法 2、线性规划方法 3、迭代法 4、图解法
精选
一、线性方程组方法
根据定理 2.2.5,
求解矩阵对策 (S1, S2; A) 等价于求解不等式组
精选
• 又根据定理2.4.3,如果甲和乙的最优策略 中所有分量都大于0,那么上面的不等式组 可化成下面两个线性方程组。
精选
• 注:如果上述两个方程组的分别存在非负解
x*,y*,则求得了 的一个解(x*,y*)和对策值;
•
如果x*,y*中有负的分量,则将方程组
(2.6.1),(2.6.2)中的某些等式改为不等式试算。
精选
例2.6.1 求解矩阵对策----田忌赛马问题。 解:已知田忌赛马问题中的支付矩阵
精选
• 对策 没有鞍点。为了使A中元素尽可能多的变为
6 1 4
A1
2
7
5
5 5 6
• 转而讨论以A1为支付矩阵的矩阵对策 ,为此求
解两个互为对偶的线性规划问题
1
精选精选Biblioteka 1精选三、迭代法
迭代法是求矩阵对策的一种近似方法。
基本思想:
假设两个局中人反复进行对策多次,在每 一局中各局中人都从自己的策略集中选取 一个使对方获得最不利结果的策略,即第t 局对策纯策略的选择欲使对手在前t-1局中 累计所得(或累计所失)最少(或最多)
x30
(5 , 30
4 30
,
21) 30
;
乙选纯策略 1, 2 , 3 的次数依次为 18,12,0,故乙的近似最优策略为
y30
(18 , 12 30 30
, 0) ;
对策值 v 的近似值为 vt
vt
vt 2
9 5
精选