算法大全第07章 对策论

合集下载

《管理运筹学-对策论》

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

对策论讲义

对策论讲义

对策论讲义对策论【教学内容】对策论的基本概念,纳什均衡,矩阵对策,二人的无限零和对策,有限的二人非零和对策,n人合作型对策与n人合作型对策。

【教学要求】要求学生理解对策论的基本概念,掌握矩阵对策的求解方法;理解纳什均衡的概念及相应的求解方法、理解二人的无限零和对策及有限的二人非零和对策问题,了解n人合作型对策与n人合作型对策。

【教学重点】对策论的基本概念、矩阵对策及求解、纳什均衡与求解、二人的无限零和对策,有限的二人非零和对策。

【教学难点】建立对策的模型求解。

【教材内容及教学过程】对策论来自于生活。

简单的问题如游戏,决策者的策略对最终结果有着举足轻重的影响,但决策者的策略选择也要考虑其它策略者的策略选择,现实生活中一个坏的策略选择未必带来坏的结果(原因是他方选择了对自己不利,对前者有利的策略),对策论的研究中排除了对方犯错误的可能性,每个决策者都在考虑到他方的各种策略后,选择对自己最有利的策略。

对策论解决的问题大的象经济生活中的经营决策、市场竞争,政治、军事活动中的竞选、谈判、联合和战争等,从这点来说对策论大有用武之地。

本章先介绍了对策论的基本概念,然后通过例子介绍了纳什均衡的概念及求解方法,重点介绍了二人零和对策(矩阵对策)与求解,接着介绍二人的无限零和对策、有限的二人非零和对策。

最后介绍n人合作型对策与n人合作型对策,目的是让学生通过本章学习,对其基本方法有所掌握与了解,为以后的实际应用打好基础。

i.§1.1 对策的三要素第一节引言从前述可看出对策论是研究具有斗争或竞争性质现象的数学理论和方法。

根据不同性质的问题,可建立不同的对策模型。

尽管对策模型的种类可以千差万别,但本质上都必须包含3个基本要素:1.局中人局中人即在一个对策行为中,有权决定自己行动方案的对策参加者。

通常用I表示局中- 1 -人的集合,如果有n个局中人,则I=?1,2,3,…n两个局中人。

?。

一般要求一个对策中至少要有对策中关于局中人的概念是广义的。

对策论矩阵求解

对策论矩阵求解
故令A中每个元素减1再乘以½ ,得到
• 目前讨论 A 为支付矩阵旳对策 旳解。为此先 解方程组
•和
• 上述不等式组无解,根据计算下面两个不 等式组
二、线性规划措施
• 例2.6.3 用线性规划措施求解例
• 解:先将A旳每个元素加3,得到每个元素都是整 数旳支付矩阵
6 1 4
A1
局中人Ⅰ在这三局中合计赢得至少。后来各局均照此方 式对策下去,直到迭代旳成果到达一定旳满意程度为止。
近似解: 若设在N局对策中局中人Ⅰ出α1,α2, …,αm旳次数 为k1,k2, …,km ,局中人Ⅱ出β 1, β 2, …, β n旳次数 为l 1, l 2, …, l n ,xN=(k1 /N ,k2 /N, …,km /N), yN=(l1/N ,l2/N, …,lm /N), 则(xN, yN )就是所求近似解。
2
7
5
5 5 6
• 转而讨论以A1为支付矩阵旳矩阵对策 ,为此求
解两个互为对偶旳线性规划问题
1
1
三、迭代法
迭代法是求矩阵对策旳一种近似措施。
基本思想:
假设两个局中人反复进行对策屡次,在每 一局中各局中人都从自己旳策略集中选用 一种使对方取得最不利成果旳策略,即第t 局对策纯策略旳选择欲使对手在前t-1局中 合计所得(或合计所失)至少(或最多)
• 注:假如上述两个方程组旳分别存在非负解
x*,y*,则求得了 旳一种解(x*,y*)和对策值;

假如x*,y*中有负旳分量,则将方程组
(2.6.1),(2.6.2)中旳某些等式改为不等式试算。
例2.6.1 求解矩阵对策----田忌赛马问题。 解:已知田忌赛马问题中旳支付矩阵
• 对策 没有鞍点。为了使A中元素尽量多旳变为0,

第七章 对策论

第七章 对策论
表 7.1
赢B
石头
剪子

A
石头
0
1
-1
剪子
-1
0
1

1
-1
0
3.对策论的产生
1944 年,纽曼与曼彻斯特发表了题为《对策论和经济行为》。二次大战前后,由于军事
需要,抽象成数学模型。
50 年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的
“核”的概念。同时,非合作对策也开始创立。纳什于 1950 和 1951 年发表了两篇关于非合作
Ⅰ,Ⅱ的最优纯策略, ai* j* 称为 G 的值,记为VG 。
( ) ( ) (2)
鞍点:若局势 αi* , β j*
对应的 ai* j*
=
max i
min j
aij
=
min j
max i
aij
,则称
αi* , β
j*

鞍点。
分析上例中 a23 ,它就满足 ai3 ≤ a23 ≤ a2 j
( ) ( ) 定理 1: G 在纯策略中有解 αi* , β j* ⇔ αi* , β j* 是鞍点
7.1 基本概念
7.1.1 对策现象与对策论
1.对策和对策论 在日常生活中及各种领域内,经常可以看到一些充满着竞争、对抗、冲突的现象。对策 论是研究上述现象的数学理论和方法。它是一种理论模型,其中包括参加者所掌握的全部信 息及可能采取的行动等。 对策论把各式各样的冲突现象抽象成一种数学模型,然后给出分析这些问题的方法和 解。应该说明的是,所谓解是指对策中的所有参与者都按最佳策略行动而得到的结果。对策 论的研究中一般都假设:在对策中所有参与者都是“完全理智”的,在采取的策略上没有任 何失误。 2.对策现象 (1)下棋:围棋源于我国殷代。 (2)齐王赛马:齐王与大将田忌赛马,各自的马都分为三等,但齐王的同等马均强于 田忌。孙膑给田忌出主意,用下----上,上----中,中----下,结果田忌胜出。 (3)猜手:小孩 A 与 B 猜手,若规定赢得 1 分,平得 0 分,输得 -1 分,则 A 的赢得可 用下表来表示

对策论

对策论
对策论
在日常生活中,经常可以看到一些具有相互斗 争或竞争性质的行为,
如下棋、打牌、体育比赛等 还有企业间的竞争、军队或国家间的战争、政治斗 争等,都具有对抗的性质。
这种具有竞争或对抗性质的行为称为对策行为。
在这类行为中,各方具有不同的目标和利益。为实 现自己的目标和利益,各方必须考虑对手可能采取 的行动方案,并力图选择对自己最为有利或最为合 理的行动方案。
在田忌赛马中
局中人集合I={1,2}
齐王和田忌的策略集合可分别用S1={α1,…,α6}, S2={β1,…,β6}
齐王的任一策略αi和田忌的任一策略βj就构成了一个 局势sij
如果α1 =(上,中,下), β1 =(上,中,下), 则在局势s11下,齐王的赢得为H1(s11)=3,田忌的赢 得为H2(s11)=-3
6 1 8 3 2 4 A 9 1 10 3 0 6
局中人Ⅰ当然也会猜到局中人Ⅱ的这种心理,转而出α4来对 付,使局中人Ⅱ得不到10,反而失掉6; …… 如果双方都不想冒险,都不存在侥幸心理,而是考虑到对方 必然会设法使自己所得最少这一点,就应该从各自可能出现 的最不利情形中选择一个最有利的情形作为决策一句。 这就是所谓的“理智行为”,也是对策双方实际上可以接收 并采取的一种稳妥的方法。
对策问题举例:市场购买力争夺问题
据预测,某乡镇下一年的饮食品购买力将有4000万元。乡镇企 业和中心城市企业饮食品的生产情况是:乡镇企业有特色饮食品 和一般饮食品两类,中心城市企业有高档饮食品和低档饮食品两 类产品。他们购买这一部分购买力的结局表如下。
乡镇企业所得(万元)
乡镇企业 的策略 出售特色饮食品
即局中人Ⅰ、Ⅱ的策略集分别为

对策论(Theory of Games)

对策论(Theory of Games)
中,局中人是齐王与田忌。 对策中关于局中人的概念是具有广义 性的,局中人除了可以理解为个人外, 还可以理解为某一集体,如引例1的球
队。
在对策中总是假定每一个局中人都是理智 的,聪明的决策者或竞争者,即对任一局 中人来讲,不存在利用其它局中人决策的 失误,来扩大自身利益的可能性。 通常用I表示局中人的集合,如果有n个局 中人,则I={1,2……n},一般要求一个对
齐得分 齐 上中 下

上中下 3
上下中 1 中上下 1
中下上 1
下中上 1
下上中 -1
上下 中上 中下
11 3 -1 13 11 -1 1 11
中下 上
-1 1 1 3 1 1
下中 上
1 1 -1 1 3 1
下上 中
1 1 1 -1 1 3
下面为齐王在各种局势下赢得千金的数值
3 1 1 1 1 -1 1 3 1 1 -1 1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 -1 1 3 1 1 1 1 -1 1 3
注意
• 当各局中人选定了自己的策略后,竞争 的结果就确定了,而且该结果是量化的。 对每一方而言可能是得也可能是失。我 们用支付来描述量化的得失。
• 支付又可称为赢得。这赢得应从广义上 去理解,可能为正也可能为负。
• 一个局中人得到的赢得或支付不一定就 是从对方来,即不一定是你赢我就输。 可能是双方都有利,即其赢得可能双方 都为正。如,进行贸易谈判的双方其结 局往往是对双方都有利。
这个问题是两人有限零和对策,即矩阵对 策。我们可以列出甲、乙两人在一局比 赛中的各种局势下的赢输分数。因为这 是零和对策,故只需知道甲、乙任何一 方在各种局势下的分数,就能够知道对 分的情况了。甲、乙两人在各种局势下 的得分情况如表所示

运筹学-对策论

运筹学-对策论

3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路:对甲(乙)给出一个选取不同策 略的概率分布,以使甲(乙)在各种情 况下的平均赢得(损失)最多(最少)。 -----即混合策略
重要定理
定理 任一矩阵对策G {S1,S2;A}, 任一矩阵对策G={S1,S2;A},一定存在混 合策略意义下的解。 合策略意义下的解。 • 定理 设有两个矩阵对策 • G1= G2= G1={S1,S2;A1} G2={S1,S2;A2} • 其中A1=(aij),A2=(aij+L),L为任一常数。 A1= 其中A1 (aij),A2=(aij+L), 为任一常数。 则 • (1)G1 G2同解 G1与 同解; (1)G1与G2同解; • (2)VG2 VG2= (2)VG2=VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的,即 矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人 阶的, A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解,则很容易求解; 如果此对策有纯策略意义下的解,则很容易求解;如果没有 纯策略意义下的解, 纯策略意义下的解,则为求出各局中人的最优混合策略可求解下 列方程组: 列方程组: • a11x1+a21x2= a11y1+a12y2= a11x1+a21x2=v a11y1+a12y2=v • a12x1+a22x2= a21y1+a22y2= a12x1+a22x2=v a21y1+a22y2=v • y1+y2= x1+x2= y1+y2=1 x1+x2=1 • 当没有纯策略意义下的解时,方程组一定有严格非负解 x*= 当没有纯策略意义下的解时, x1* x2* y*=(y1*,y2*), (x1*,x2*)和y*=(y1*,y2*), 即为各局中人的最优混合策 略。

运筹学--对策论

运筹学--对策论

max min E(X,Y)= min max E(X,Y)
X S1* Y S2*
Y S2* X S1*
则称这个公共值为对策G在混合意义 下的值,记为V*G,而达到V*G 的混 合局势(X*,Y*)称为对策G在混合 策略意义下的解,而X*和Y*分别称 为局中人I,II的最优混合策略。
定理14-2:矩阵对策 G = S1,S2;A
0 2 3 0
赢得矩阵为 A 2 0 3 0
0
3
0 4
0
3
4
0
14.2 矩阵对策的混合策略
定义:对给定的矩阵对策
G = Ⅰ,Ⅱ;S1,S2;A
其中 S1= 1, 2…m
S2= 1 , 2… n
A=(aij)mn
把纯策略集合对应的概率向量
X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
分别称为局中人I和局中人II的混合策略。
如果局中人I选取的策略为
X=(x1, x2 … xm) 局中人II选取的策略为
Y=(y1 , y2 … yn ),则期望值 E(X,Y)= xi aij yj=XAYT 称为局中人I期望赢得,而局势(X,Y) 称为“混合局势”,局中人I,II的混合 策略集合记为S1*, S2*。
S1= 1、 2…… m
同样,局中人II有n个策略:1、 2。。。 n ;用S2表示这些策略的集合: S2= 1、 2… n 局中人I的赢得矩阵是:
a11 a12 …… a1n a21 a22 …… a2n A= …… …… …… a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对策记为G: G= S1,S2;A

对策问题的提出对策论模型矩阵对策的解法◎知识归纳

对策问题的提出对策论模型矩阵对策的解法◎知识归纳
现代博弈论起源于19世纪末20世纪初,二战后发展成为一门完整而丰富的理论 学科。学术界一般将其发展历程分为以下几个阶段:
(1)萌芽阶段 从19世纪末到20世纪30年代可以说是博弈论的萌芽期,表现为学者们对社会经
济理论和现实的一些思考,研究者以数学家为主。 (2)产生阶段 20世纪四五十年代可说是博弈论的体系建立时期。1944年诺依曼和摩根斯坦的
(2)物流仓储优化策略 【例8.2】一仓储供应中心为其下游的一家生产企业供应某种原料。生产企业根 据产品订单情况对原料的需求进行分析,分别有淡季、旺季和正常三种情况,在正 常情况下需要原料15吨,在淡季和旺季情况下分别需要原料10吨和20吨;而原料的 价格与原料市场的需求有关,在淡季、正常、旺季三种情况下,每吨原料的价格分 别为100元、150元和200元,已知此时每吨原料的价格为100元。问在生产企业对原 料的需求没有确定预知的条件下,此时应采购多少吨原料才能使仓储供应中心的总 成本最少(不计存储费用)? 这个问题可看成一个博弈问题。即仓储供应中心针对可能出现的三种不同的原
巨著《博弈论和经济行为》的出版,标志着博弈论作为一门学科的建立,也被视为 数理经济学学科建立的里程碑。巨著出版前后的若干年中,合作博弈理论的研究得 到了迅速的发展,提出了各种概念,并在20世纪50年代达到了研究的高峰。不久, 库克于1950年定义了“囚徒的困境”,纳什在1950年和1951年发表了两篇关于非合 作博弈的重要文章,这两位学者的研究工作,特别是纳什的研究工作奠定了非合作 博弈论的基础,所提出的纳什均衡概念,在非合作博弈论中起着核心作用。
8 对策论
8.1 对策问题的提出 8.2 对策论模型 8.3 矩阵对策的解法 ◎ 知识归纳 ◎ 习题与思考题
8.1 对策问题的提出

第07章对策论模型

第07章对策论模型

2021/2/22
3
对策模型的种类可以千差万别,但本质上都必须包括以下三个基本要素:
局中人,是指参与对抗的各方,可以是一个人,也可以是一个集团。
在例7.1中的齐王和田忌就是局中人。
策略,是指局中人所拥有的对付其他局中人的手段、方案的集合。
如例7.1中田忌共有(上、中、下)、(上、下、中)、(中、上、 下)、(中、下、上)、(下、中、上)和(下、上、中)六种策 略。
四个局势都是对策的解,且 vG=5。
2021/2/22
12
7.1.2 无鞍点的对策策略—混合对策
如果支付矩阵有鞍点,选择鞍点对策是最优的对策策略,如果支付矩
阵无鞍点,则需要选择混合对策。再看例7.1,对于支付矩阵(见表 7-1),有m a ixm jina ij 1 , m jinm a ixa ij 3。没有纯最优策略,因此 无法用定理7.1来确定最优策略。在此情况下,只能求相应的混合策 略。类似于纯策略,混合策略有如下定义和定理。
n j
1
aij
y
j
v
(i 1, 2,
α1
-7
2
-9
α2
4
3
5
α3
15
-2
-4
α4
-4
0
6
maxiaij
15
3*
6
m a ix m jin a ij m jin m a ix a ij a 2 2 3
minjaij
-9 3* -4 -4
2v0G21/23/2,2 G的解为(α2,β2),α2和β2分别是局中人I和II的最优纯策略。 9
从例7.3可以看出,矩阵A的元素a22既是其所在行的最小元素又是其所

第7章-对策论

第7章-对策论

例 设一对策 G S, D, A,其中 S s1, s2 , s3 ,
D d1, d2 , d3 ,其赢得矩阵为:
d1 d2 d3
A
s1 s2
3 6
1 0
2 - 3
前提: 对策双方均理智 结论:
s3 - 5 - 1 4 最不利中选最有利
问:双方局中人采用何策略最佳。
囚犯困境问题在经济、政治、军事等领域的应用举例
例:寡头垄断企业定价的博弈
卡特尔价格不是纳什均衡, 最终结果:每个企业按照纳什均衡的价格进行定价, 其利润小于卡特尔价格条件下的利润。
例:公共产品的供给博弈
如果大家都出钱兴办公用事业,所有人的福 利都会增加。问题是,如果我出钱你不出钱, 我得不偿失;而如果你出钱我不出钱,我就可 以占便宜。
赢 B 石头 剪子 布 A
石头 0 1 -1
剪子 -1
0
1
布 1 -1 0
分析:无确定最优解,可用“混合策略”求 解。
4.齐王赛马
战国时期,齐国国王有一天提出要与大将军田忌赛马。田 忌答应后,双方约定: 1)每人从上中下三个等级中各出一匹马,共出三匹; 2) 一共比赛三次,每一次比赛各出一匹马; 3) 每匹被选中的马都得参加比赛,而且只能参加一次; 4) 每次比赛后输者要付给胜者一千金。
解:可用下述表格表示上述寻找最优纯策略过程:
d1
d2
d3
min j
aij
s1
3
1
2
1
s2
6
0
-3
-3
s3
-5 -14-5源自max iaij6
1
4
故若双方都采取理智行为,局势 (s1 , d2 )为最优纯策略.

对策论

对策论
第19页 页
第20页 页
第21页 页
第22页 页
第23页 页
第24页 页
第25页 页
NE与重复剔出严格劣策略的关系
1
2
3
第26页 页
第27页 页
古诺双头垄断模型
第28页 页
第29页 页
第30页 页
第31页 页
第32页 页
贝特兰德双头垄断模型
第33页 页
第34页 页
第35页 页
i j
β2 -175 -150 -200 -150
i
β3 -300 -250 -200 -200*
min -300 -250 -200*
-100 -150 -200 -100
j
得 max min a ij = min max a ij = a 32 = − 200 200。 为对策G的解, 故(α3,β3)为对策G的解,VG=-200。
第13页 页
5X1’+ 8X2’ ≥V 9X1’+ 6X2’ ≥V
STEP 2 X2= X2’/V
(V愈大愈好) (V愈大愈好)待定 愈大愈好
建立线性模型: 建立线性模型: min X1+X2 X1= 1/21 X2= 2/21 1/V= X1+X2=1/7 所以, 所以,V=7 返回原问题: 返回原问题: X1’= X1V= 1/3 X2’= X2V= 2/3 于是甲的最优混合策略为: 于是甲的最优混合策略为: 2/3的概率选 的概率选α 最优值V=7 V=7。 以1/3的概率选α1, 以2/3的概率选α2,最优值V=7。 1/3的概率选α 的概率选
第48页 页
第49页 页
第50页 页
贯序谈判

第七章 对策论

第七章 对策论

设 局 中 人 Ⅰ 用 概 率 xi 选 用 策 略 αi , 局 中 人 Ⅱ 用 概 率 y j 选 用 策 略 β j ,
m
n
∑ ∑ xi = y j = 1 ,记 x = (x1,L, xm )T , y = ( y1,L, yn )T ,则局中人Ⅰ的期望赢得为
i =1
j =1
E(x, y) = xT Ay 。
方都供认伪造了钱币,将各被判刑 3 年;如果一方供认另一方不供认,则供认方将被从
宽处理而免刑,但另一方面将被判刑 7 年。将嫌疑犯 A 、 B 被判刑的几种可能情况列
于表 1。
表1
嫌疑犯 B
供认
不供认
嫌疑犯 A
供认 不供认
(3,3) (7,0)
(0,7) (1.5,1.5)
表 1 中每对数字表示嫌疑犯 A、B 被判刑的年数。如果两名疑犯均担心对方供认并希
望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。 从这一简单实例中可以看出对策现象中包含有的几个基本要素。 2.1 对策的基本要素 (i)局中人 在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局
中人。通常用 I 表示局中人的集合.ቤተ መጻሕፍቲ ባይዱ果有 n 个局中人,则 I = {1,2,L, n} 。一般要求 一个对策中至少要有两个局中人。在例 1 中,局中人是 A、B 两名疑犯。
炸机飞至 B 方上空,受到 B 方战斗机的阻击。若战斗机阻击后面的轰炸机Ⅱ,它仅受
Ⅱ的射击,被击中的概率为 0.3(Ⅰ来不及返回攻击它)。若战斗机阻击Ⅰ,它将同时受
到两架轰炸机的射击,被击中的概率为 0.7。一旦战斗机未被击中,它将以 0.6 的概率
击毁其选中的轰炸机。请为 A、B 双方各选择一个最优策略,即:对于 A 方应选择哪

对策论模型

对策论模型

9 7 y E ( X , Y ) ( x,1 x) 2 8 1 y
=8xy-6y-x+8 3 1 1 8( x )( y ) 7 = 4 8 4
3 1 这就是说,局中人分别以概率 X * ( , ) 选用1,2 时,至少 4 4 1 1 7 * 赢得 7 ,同理,局中人Ⅱ分别以概率Y ( , ) 选用策略1,2, 4 8 8 1 3 1 1 7 7 。但当 X * ( , ) 或 Y * ( , ) 时,则会受到更大的 至多损失 4 4 4 8 8 损失。
1.混合策略和混合局势
一般地, 设给定 S1 , S2 ; A, 令 X ( x1 , x 2 , , x m), Y ( y1 , y2 , , yn )
m m
S {X | x i 0; x i 1}, S {Y | y j 0; y j 1}
1
1 1 3 1
-1
1 1 1 3
A=
1 -1 1 1
-1 1
这是一个两人有限零和对策。
二、在纯策略下有解的矩阵对策的解法
1.解法的思想:双方都立足在不利的情况下争取最好的结果 ──最大最小原则。 例 求解矩阵对策 ={S1,S2;A},其中:
7 3 A 16 3 1 8 2 4 4 3 0 5
解:
1
1 7 2 3 3 16 4 3
i
2
1
3
min a ij
j
max aij
8 2 4 4 3 0 5 16 2 5
8 2 max ai j 2 i 3 3
*
min aij* 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
得函数。这样,就得到一个向量赢得函数 H (s) = (H1(s),L, H n (s)) 。
本节我们只讨论有两名局中人的对策问题,其结果可以推广到一般的对策模型中
去。
2.2 零和对策(矩阵对策) 零和对策是一类特殊的对策问题。在这类对策中,只有两名局中人,每个局中人都
只有有限个策略可供选择。在任一纯局势下,两个局中人的赢得之和总是等于零,即双
点,αi* 与 β j* 分别称为局中人Ⅰ与Ⅱ的最优纯策略。
给定一个对策 G ,如何判断它是否具有鞍点呢?为了回答这一问题,先引入下面
的极大极小原理。
定理 1
设G
= {S1, S2; A}
,记
μ
=
max i
min j
aij
,ν
=

min j
max i
aij
,则必有
μ +ν ≤ 0 。
证明
ν
=
max j
对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。 一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展 的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常 生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。
(ii)策略集 一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参
加对策的每一局中人 i , i ∈ I ,都有自己的策略集 Si 。一般,每一局中人的策略集中
至少应包括两个策略。
-154-
(iii)赢得函数(支付函数)
在一局对策中,各局中人所选定的策略形成的策略组称为一个局势,即若 si 是第 i 个局中人的一个策略,则 n 个局中人的策略组
设 局 中 人 Ⅰ 用 概 率 xi 选 用 策 略 αi , 局 中 人 Ⅱ 用 概 率 y j 选 用 策 略 β j ,
m
n
∑ ∑ xi = y j = 1 ,记 x = (x1,L, xm )T , y = ( y1,L, yn )T ,则局中人Ⅰ的期望赢得为
i =1
j =1
E(x, y) = xT Ay 。
∑ ⎧
⎪⎪ ⎨
n
aij y j
j=1

xT
Ay,
∑ ⎪ m
⎪⎩ i=1
aij xi

xT
Ay,
i = 1,2,L, m j = 1,2,L, n
定理 4 任意混合策略对策问题必存在鞍点,即必存在概率向量 x 和 y ,使得:
-157-
xT Ay = max min xT Ay = min max xT Ay 。
一架轰炸机装载炸弹?对于 B 方战斗机应阻击哪一架轰炸机?
max{30,18,−10} = 30 ,和 max{−22,10,16} = 16 。当局中人Ⅱ采取策略 β2 时,其损
失不会超过 2。注意到在赢得矩阵中,2 既是所在行中的最小元素又是所在列中的最大 元素。此时,只要对方不改变策略,任一局中人都不可能通过变换策略来增大赢得或减
少损失,称这样的局势为对策的一个稳定点或稳定解。
定义 1 设 f ( x, y) 为一个定义在 x ∈ A 及 y ∈ B 上的实值函数,如果存在 x*∈ A ,
y*∈ B ,使得对一切 x ∈ A 和 y ∈ B ,有
f (x, y*) ≤ f (x*, y*) ≤ f (x*, y)
则称 (x*, y*) 为函数 f 的一个鞍点。
定 义 2 设 G = {S1, S2 ; A} 为 矩 阵 对 策 , 其 中 S1 = {α1,α2 ,L,αm} , S2 = {β1, β2 ,L, βn }, A = (aij )m×n 。若等式
第七章 对策论
§1 引言 社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来
解决这样的问题开始于 17 世纪的科学家,如 C.,Huygens 和 W.,Leibnitz 等。现代对 策论起源于 1944 年 J.,Von Neumann 和 O.,Morgenstern 的著作《Theory of Games and Economic Behavior》。
炸机飞至 B 方上空,受到 B 方战斗机的阻击。若战斗机阻击后面的轰炸机Ⅱ,它仅受
Ⅱ的射击,被击中的概率为 0.3(Ⅰ来不及返回攻击它)。若战斗机阻击Ⅰ,它将同时受
到两架轰炸机的射击,被击中的概率为 0.7。一旦战斗机未被击中,它将以 0.6 的概率
击毁其选中的轰炸机。请为 A、B 双方各选择一个最优策略,即:对于 A 方应选择哪
yn )T
|
yj

0,
j
= 1,L, n;
y j = 1}
j =1
定义 4 若存在 m 维概率向量 x 和 n 维概率向量 y ,使得对一切 m 维概率向量 x 和
n 维概率向量 y 有
xT Ay = max xT Ay = min xT Ay
x
y
则称 (x, y) 为混合策略对策问题的鞍点。
定理 3 设 x ∈ S1* , y ∈ S2* ,则 (x, y) 为 G = {S1, S2; A} 的解的充要条件是:
10
⎥ ⎥
⎢⎣− 6 0 − 10 16 ⎥⎦
从 A 中可以看出,若局中人Ⅰ希望获得最大赢利 30,需采取策略α1 ,但此时若局 中人Ⅱ采取策略 β4 ,局中人Ⅰ非但得不到 30,反而会失去 22。为了稳妥,双方都应考
虑到对方有使自己损失最大的动机,在最坏的可能中争取最好的结果,局中人Ⅰ采取策
略α1、α2、α3 时,最坏的赢得结果分别为
(αi2 , β j1 ) 也是解。
§3 零和对策的混合策略 具有稳定解的零和问题是一类特别简单的对策问题,它所对应的赢得矩阵存在鞍
点,任一局中人都不可能通过自己单方面的努力来改进结果。然而,在实际遇到的零和
对策中更典型的是 μ +ν ≠ 0 的情况。由于赢得矩阵中不存在鞍点,此时在只使用纯策
略的范围内,对策问题无解。下面我们引进零和对策的混合策略。

S1* :策略 α1,L,αm
概率 x1,L, xm
分别称
S1*

S
* 2
ቤተ መጻሕፍቲ ባይዱ
为局中人Ⅰ和Ⅱ的混合策略。
下面简单地记
S2* :策略
概率
β1,L, βn y1,L, yn
m
∑ S1* = {(x1,L, xm )T | xi ≥ 0, i = 1,L, m; xi = 1} , i=1
n
∑ S
* 2
=
{( y1,L,
a pq ≥ μ 且 a pq ≤ −ν
又因 μ +ν = 0 ,所以 μ = −ν ,从而得出 a pq = μ , apq 为赢得矩阵的鞍点, (α p , βq )
为 G 的稳定解。
(必要性)若 G 具有稳定解 (α p , βq ) ,则 a pq 为赢得矩阵的鞍点。故有
μ
=
max i
min j
x
y
y
x
使用纯策略的对策问题(具有稳定解的对策问题)可以看成使用混合策略的对策问
题的特殊情况,相当于以概率 1 选取其中某一策略,以概率 0 选取其余策略。
例 3 A、B 为作战双方, A 方拟派两架轰炸机Ⅰ和Ⅱ去轰炸 B 方的指挥部,轰
炸机Ⅰ在前面飞行,Ⅱ随后。两架轰炸机中只有一架带有炸弹,而另一架仅为护航。轰
⎡ a11 a12 L a1n ⎤
A
=
⎢ ⎢
a21
a22
L
a
2n
⎥ ⎥
⎢L L L L⎥
⎢⎣am1
am2
L
amn
⎥ ⎦
为局中人Ⅰ的赢得矩阵(或为局中人Ⅱ的支付矩阵)。由于假定对策为零和的,故局中
人Ⅱ的赢得矩阵就是 − A 。
当局中人Ⅰ、Ⅱ和策略集 S1 、 S2 及局中人Ⅰ的赢得矩阵 A 确定后,一个零和对策
性 质 1 无 差 别 性 。 即 若 (αi1 , β j1 ) 与 (αi2 , β j2 ) 是 对 策 G 的 两 个 解 , 则 必 有
a =a 。
i1 j1
i2 j2
性质 2 可交换性。即若 (αi1 , β j1 ) 和 (αi2 , β j2 ) 是对策 G 的两个解,则 (αi1 , β j2 ) 和
方的利益是激烈对抗的。
设局中人Ⅰ、Ⅱ的策略集分别为
S1 = {α1,L,αm} , S2 = {β1,L, βn } 当局中人Ⅰ选定策略αi 和局中人Ⅱ选定策略 β j 后,就形成了一个局势 (αi , β j ) ,可见
这样的局势共有 mn 个。对任一局势 (αi , β j ) ,记局中人Ⅰ的赢得值为 aij ,并称
aij

min j
a
pj
=
a pq
−ν
=
min j
max i
aij

max i
aiq
= a pq
-156-
从而可得 μ +ν ≥ 0 ,但根据定理 1, μ +ν ≤ 0 必成立,故必有 μ +ν = 0 。
上述定理给出了对策问题有稳定解(简称为解)的充要条件。当对策问题有解时,
其解可以不唯一,当解不唯一时,解之间的关系具有下面两条性质:
就给定了,零和对策又可称为矩阵对策并可简记成
G = {S1, S2 ; A} 。 例 2 设 有 一 矩 阵 对 策 G = {S1, S2 ; A} , 其 中 S1 = {α1,α2 ,α3} ,
S2 = {β1, β2 , β3 , β4} ,
⎡12 − 6 30 − 22⎤
相关文档
最新文档