运筹学—对策论(一)

合集下载

运筹学12-2对策论

运筹学12-2对策论

3.矩阵对策的混合策略(续)
-- 优超原则:当局中人甲方的策略t被其它 策略所优超时,可在其赢得矩阵A中划去第t 行(同理,当局中人乙方的策略t被其它策 略所优超时,可在矩阵A中划去第t列)。 如此得到阶数较小的赢得矩阵A’,其对
应的矩阵对策
G’= { S1,S2,A’}与 G ={ S1,S2,A } 等价,即解相同。
17
再讨论“齐王赛马”
• “齐王赛马”的赢得矩阵A有 max min aij=-1 min max aij=3
i j j i
故需求混合策略,由于A中有非正元素, 可选k=2,令矩阵中每一元素加上k得到新的 正矩阵A’:
5 3 3 1 3 3 3 5 1 3 3 3 3 3 5 3 3 1 3 3 3 5 1 3 1 3 3 3 5 3 3 1 3 3 3 5
19
再讨论“齐王赛马”(续)
• 求乙方(田忌)最优策略的线性规划模型:
min Y1+Y2 +Y3 +Y4 +Y5 +Y6 s.t. 5Y1+3Y2 +3Y3 +3Y4 + Y5 +3Y6 1 3Y1+5Y2 +3Y3 +3Y4 +3Y5 + Y6 1 3Y1+ Y2 +5Y3 +3Y4 +3Y5 +3Y6 1 Y1+3Y2 +3Y3 +5Y4 +3Y5 +3Y6 1 3Y1+3Y2 +3Y3 + Y4 +5Y5 +3Y6 1 3Y1+3Y2 + Y3 +3Y4 +3Y5 +5Y6 1 Y1,Y2,Y3,Y4,Y5,Y6 0 可得两组解:(1/9,0,0,1/9,1/9,0)T, (1/18,1/18,1/18,1/18,1/18,1/18)T ,V’=3 于是,Y’=(1/3,0,0,1/3,1/3,0)T, Y’=(1/6,1/6,1/6,1/6,1/6,1/6)T V = V’-2 = 1 即田忌的最优混合策略值是输1千金

《管理运筹学-对策论》

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

《运筹学》教材编写组《运筹学》笔记和课后习题(含考研真题)详解(对策论基础)

《运筹学》教材编写组《运筹学》笔记和课后习题(含考研真题)详解(对策论基础)

圣才电子书 十万种考研考证电子书、题库视频学习平台

(2)2× 或 ×2 对策的图解法
注意:该方法用在赢得矩阵为 2× 或 ×2 阶的对策上特别方便,也可用在 3× 或
×3 对策上。但对 和 均大于 3 的矩阵对策就丌适用了。
设缩减后的赢得矩阵为二阶无鞍点对策问题,局中人Ⅰ的混合策略为
的最优纯策略。 定理 1 矩阵对策 使得对一切
在纯策略意义下有解的充分必要条件是:存在纯局势
,均有

定义 2 设
为一个定义在

上的实值函数,如果存在
,使得对一切

,有
,则称

函数 的一个鞍点。 矩阵对策解的性质:
性质 1 无差别性。即若 性质 2 可交换性。即若
也是解。 定义 3 设有矩阵对策

是对策 G 的两个解,则
定理 11 设矩阵对策
的值为 ,则
6.矩阵对策的解法 (1)2×2 对策的公式法 所谓 2×2 对策是指局中人Ⅰ的赢得矩阵为 2×2 阶的,即
如果 A 有鞍点,则很快可求出各局中人的最优纯策略;如果 A 没有鞍点,为求最优混 合策略可求下列等式组:
上面等式组(Ⅰ)和(Ⅱ)一定有严格非负解

,其中
6 / 33
是对策 G 的两个解,则

,其中


则 和 分别称为局中人Ⅰ和Ⅱ的混的混合策略(或策略);对
,称
为一个混合局势(或局
势),局中人Ⅰ的赢得函数记成
这样得到的一个新的对策记成
,称 为对策 G 的混合扩充。
定义 4 设
是矩阵对策
的混合扩充,如果
3 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台

对策论(Theory of Games)

对策论(Theory of Games)

定义
并不是所有的对策都存在鞍点,如 A为齐王的赢得矩阵 3 1 1 1 1 -1 1 3 1 1 -1 1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 -1 1 3 1 1 1 1 -1 1 3 max(min aij)= -1 min (max aij)=3 i j j i
例如:
• 给定矩阵对策
6 5 6 A 1 4 2 8 5 7
对策的最优值为5,对策的解有两个,分 别为局势 , 和 , 。
1 2 3 2
(三)矩阵对策的混合策略
1、矩阵对策的混合策略的定义
2、原则:坏中求好的原则。 3、解的存在:一定有解 4、混合策略求解:利用期望转化成 线性规划问题求解。
三、矩阵对策模型
(一)矩阵对策的概念 (二)矩阵对策的最优纯策略 (三)矩阵对策的混合策略 (四)矩阵对策的解法
(一)矩阵对策的概念 1、矩阵对策的定义 2、建立矩阵对策模型
1、矩阵对策的定义 局中人只有两个,对策中各方只能从有限 的策略集中确定性的选择一种,且对策双 方的支付之和为零的对策称为两人零和纯 策略对策。
表2
齐 王 上中 下 田忌 上中下 3 上下 中上 中 下 1 1 中下 上 -1 下中 上 1 下上 中 1
上下中 1 中上下 1
中下上 1 下中上 1
3 1
1 -1
-1 3
1 1
1 1
3 1
1 -1
1 3
1 1
-1 1
下上中 -1
1
1
1
1
3
引例3
有两个儿童A和B在一起玩“石头-剪子布”游戏。我们规定胜者得1分,负者得 -1分,平手时各得0分。双方选定的各种 出法及相应的结果可由下表列出。双方 应取何种策略?

管理运筹学课件第13章-对策论

管理运筹学课件第13章-对策论
管理运筹学课件第13章对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。

运筹学博弈论简介

运筹学博弈论简介
弈双方是 否存在有约束力 的协议来分:
合作博弈
非合作博弈
二)按局中人数分 类:
二人博弈 多人博弈
三)按策略数分 类:
•有限策略博弈 •无限策略博弈
二人非合作博 弈是我们讨论的重 点。
非合作博弈的进一步分类
非合作博弈
非零和的四种博弈
零和博弈
也可以有纯策略和混合
– 纯策略博弈 策略博弈之分。
策略—前进或后退
支付函数
斗鸡B
前进 后退
前进 -3/-3 2/0
斗鸡A
后退 0/2 0/0
五、博弈论的典型例子
市场进入阻挠—二人非合作非零和纯策略博弈
局中人—在位者和进入者 策略—在位着:容忍或斗争;进入者:进入或不进入 支付函数—垄断利润300,寡头利润各50;进入成本10
进入 进入者
不进入
在位者 容忍 斗争
– 混合策略博弈
非零和博弈
动态时行动和策略
– 完全信息博弈 不同,要素有五个;而
静态博弈
静态时行动与策略不加
动态博弈
区别,要素有三个。
– 不完全信息博弈
静态博弈
动态博弈
四、博弈论发展史的要件
1944年,von Neumann and Oskar Morgenstern 发表专著 The Theory of Games and Economic Behavior创立了博弈论
2000 -40万 -40万 -40万
五、博弈论的典型例子
齐王赛马—二人非合作零和博弈
局中人—齐王和田忌 策略—上中下三种等级的马的组合 ,比三
次,有六组策略:(上,中,下)、 (中,上, 下)、 (上,下,中)、 (中,下,上)、 (下, 上,中)、 (下,中,上)

精心整理的运筹学重点10.对策论

精心整理的运筹学重点10.对策论

v1 = max min(3 − 2 x, 2 + 2 x) , v1 = max min(3 − 2 x, 2 + 2 x) 就是折线 ABC,它是局 0≤ x ≤1 0≤ x ≤1
中人 I 的最小赢得线,B 就是折线 ABC 的最高点,所以 B 点所对应的值就是混合策略意 义下的最大最小值。
i j j i
3.无鞍点的两人有限零和对策求解 X = ( x1 , x2 ,..., xm )T 为局中人 I 的混合策略,
Y = ( y1 , y 2 ,..., yn )
T
∑ x = 1 为局中人 II 的混合策略, ∑ y = 1 , ( X , Y ) 称为混合局势。
i i
最优混合策略求解方法 y1 y2
第十章 对策论 1.对策论类型 1)根据局中人个数:二人对策、多人对策 2)根据局中人间是否允许合作:合作对策、非合作对策 3)根据局中人的策略集中的策略个数:有限对策、无限对策 4)根据各局中人的赢得函数的代数和是否为零:零和对策、非零和对策 5)根据策略的选择是否与时间推移有关:静态对策、动态对策 6)根据对策中各局中人所拥有的有关决策信息:完全信息对策、不完全信息对策 7)根据对策模型的数学特征:矩阵对策、连续对策、微分对策、随机对策 矩阵对策:又称为二人有限零和对策。 2.有鞍点的两人有限零和对策求解 G = {S1, S2 , A} 求解: maxmin{aij } = V1,minmax{aij } = V2
x1 a11 x2 a21
矩阵对策求解方法

a12 a22
有无鞍点?
无 是
获得
2*n 或 m*2 矩阵

图解

高级运筹学(博弈论书稿)-周晶

高级运筹学(博弈论书稿)-周晶

第章博弈论(对策论)第一节引言1.1博弈行为和博弈论在日常生活中,经常会看到一些相互之间具有斗争或竞争性质的行为。

譬如,两个人下棋,任何一个人在走某一步之前,都需要考虑对方是怎么走的,以及对方在他走了一步之后会怎么走,以至无穷。

高手与俗手的区别往往就在于高手能够考虑10步甚至20步以后的变化,最终的输赢不仅取决于你的决策,而且取决于你对手的决策,这就是博弈。

博弈与决策的根本区别在于是否考虑对方的行为,具有竞争或对抗性质的行为称为博弈行为。

在这类行为中,参加斗争或竞争的各方各自具有不同的目标和利益。

为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最有利或最合理的方案。

比如战争活动中的双方,都力图选取对自己最有利的策略,千方百计去战胜对方;还比如在政治方面,国际间的谈判、各种政治力量间的较量、各国际集团之间的角逐等都无一不具有对抗性质;在经济活动中,各国之间、各公司企业之间的经济谈判,企业之间为争夺市场而进行的竞争等,举不胜举。

博弈论(game theory),就是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论与方法,即研究博弈行为中竞争各方是否存在着最合理行动方案,以及如何找到最合理行动方案的数学理论和方法。

也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。

博弈论应是一种分析问题的方法,它被设计用来帮助我们理解所观察到的决策主体相互作用时的现象,其应用范围涉及经济学、政治学、犯罪学、军事、外交、国际关系、公共选择等各个领域。

博弈论思想的主要特征是各参与人所实施的行为方案(策略)相互依存,各方在冲突或合作后所实现的损益得失结果不仅取决于自己所采取的行为方案,同时也依赖于其他参与方所实施的行为方案,是各参与方行为方案组合的函数。

所以,博弈论在我国也被称为“对策论”。

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件
局中人称为“i旳对手”,记为-i。
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1

1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}

浅析解 “对策问题” 的两种思路

浅析解 “对策问题” 的两种思路
思路二:特殊性方法 平衡状态: Fibonacci数 决策规律: 反复缩小范围,找最大Fibonacci数
特殊性方法 空间复杂度 O(1) 时间复杂度 O(logN)
大大降低
一般性方法 空间复杂度 O(N2) 时间复杂度 O(N3)
浅析解 “对策问题” 的两种思路
思路二:特殊性方法
l 状 态 l 逆向分析
浅析解 “对策问题” 的两种思路
一般性方法 与 特殊性方法
《取石子》问题的推广:
1一次可取先前对方所取石子数的3倍
1一次可取先前对方所取石子数的4倍 1一次可取先前对方所取石子数的5倍
一般性方法
VS 特殊性方法
1…………
1一次可取先前对方所取石子数的K倍
浅析解 “对策问题” 的两种思路
一般性方法 与 特殊性方法
注:这里的胜败指的均是先手胜败。
浅析解 “对策问题” 的两种思路
1如果一个状态至少有一个子状态是先手败,则该状态是先手胜
(4, 3)
胜 胜
(3, 2)


(2, 2)
胜 败
(1, 1)

(2, 2)


(1, 1) (1, 1) (0, 0) (0, 0)
败 败
(1, 1) (0, 0) (0, 0) (0, 0)
“特殊性方法”是从结局或残局出发,自底而上分析,无须 构造“状态转移的拓扑结构”,无须考察所有可能的状态与策略, 时间和空间复杂度相对于“一般性方法”都不高。 例如POI99 《多边形》 ,IOI96的取数字也可以用“特殊性 方法”来解决。
浅析解 “对策问题” 的两种思路
思路二:特殊性方法
l 状 态 列举影响结局胜负的所有因素,综合描述成“状态”,但并不需 要构造出“状态转移的拓扑结构”。

运筹学对策论全解

运筹学对策论全解

赢 A
B
石头
剪子

石头 0 1 -1
剪子 -1 0 1

1 -1
0
分析:无确定最优解,可用“混合策略”求解。
4.齐王赛马
战国时期,齐国国王有一天提出要与大将军田忌赛马。 田忌答应后,双方约定: 1)每人从上中下三个等级中各出一匹马,共出三匹; 2) 一共比赛三次,每一次比赛各出一匹马; 3) 每匹被选中的马都得参加比赛,而且只能参加一次; 4) 每次比赛后输者要付给胜者一千金。
例:囚犯困境中,每个囚犯均有2个策略:
{坦白,抵赖}
(3)局势
坦白 抵赖
坦白 抵赖 -9,-9 0,-10 -10,0 -1,-1
当每个局中人从各自策略集合中选择一策略而组 成的策略组成为一个局势,用 (si , d j )来表示。
(4)赢得(支付)
局中人采用某局势时的收益值。
例:当局中人甲选择策略si ,局中人乙选策略 dj 时,局中人甲的赢得值可用 R甲(si , d j )表示。
九十年代以来博弈理论在金融、管理和经济领域中 得到广泛应用
• 九十年代以来对策理论在金融、管理和经济领域 中得到广泛应用
• 博弈论和诺贝尔经济奖
1994:非合作博弈:纳什(Nash)、泽尔腾(Selten) 、海萨尼 (Harsanyi) 1996:不对称信息激励理论:莫里斯(Mirrlees)和维克瑞(Vickrey) 2001:不完全信息市场博弈:阿克罗夫(Akerlof)(商品市场)、斯潘 塞(Spence)(教育市场)、斯蒂格里兹(Stiglitze)(保险市场) 2005: 授予罗伯特·奥曼与托马斯·谢林,以表彰他们通过博弈理论的分析 增强世人对合作与冲突的理解。 2007年,授予赫维茨(Leonid Hurwicz)、马斯金(Eric S. Maskin)以及 迈尔森(Roger B. Myerson)。三者的研究为机制设计理论奠定了基础。 2012年,授予罗斯(Alvin E. Roth)与沙普利(Lloyd S. Shapley)。他 们创建“稳定分配”的理论,并进行“市场设计”的实践。

运筹学--对策论

运筹学--对策论

max min E(X,Y)= min max E(X,Y)
X S1* Y S2*
Y S2* X S1*
则称这个公共值为对策G在混合意义 下的值,记为V*G,而达到V*G 的混 合局势(X*,Y*)称为对策G在混合 策略意义下的解,而X*和Y*分别称 为局中人I,II的最优混合策略。
定理14-2:矩阵对策 G = S1,S2;A
0 2 3 0
赢得矩阵为 A 2 0 3 0
0
3
0 4
0
3
4
0
14.2 矩阵对策的混合策略
定义:对给定的矩阵对策
G = Ⅰ,Ⅱ;S1,S2;A
其中 S1= 1, 2…m
S2= 1 , 2… n
A=(aij)mn
把纯策略集合对应的概率向量
X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
分别称为局中人I和局中人II的混合策略。
如果局中人I选取的策略为
X=(x1, x2 … xm) 局中人II选取的策略为
Y=(y1 , y2 … yn ),则期望值 E(X,Y)= xi aij yj=XAYT 称为局中人I期望赢得,而局势(X,Y) 称为“混合局势”,局中人I,II的混合 策略集合记为S1*, S2*。
S1= 1、 2…… m
同样,局中人II有n个策略:1、 2。。。 n ;用S2表示这些策略的集合: S2= 1、 2… n 局中人I的赢得矩阵是:
a11 a12 …… a1n a21 a22 …… a2n A= …… …… …… a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对策记为G: G= S1,S2;A

运筹学-第六讲对策论

运筹学-第六讲对策论
对策G常写成: G={S1,…,Sn;h1,…hn}
【定义 】 在对策G={S1,S2…,Sn;h1,h2…hn}中,假如由各个对策方旳各 选用一种策略构成旳某个策略组合(S1*,S2*…,Sn*)中,任一对策方i 旳策略 Si*,都是对其他策略方策略旳组合 (S1*,…,S*i-1,S*i+1…,Sn*)旳最佳策略, 即h i(S1*, … , S*i-1, Si*, S*i+1,…Sn*)≥hi(S1*, …, S*i-1, Sij, S*i+1 , …, Sn*)对任意 Sij∈Si 都成立,则称(S1*,…,Sn*)为G旳一种纯策略意义下旳“纳什均 衡”(Nash Equilibrium).
(2,0)
(4,0)
反应函数法
对策论 game theory
【例4】 考虑上述模型旳另一种情况即各厂商所选择旳是价格而不是产量,假 设产量与价格旳函数关系为:
q1 ( p2 ) a1 b1 p1 d1 p2
q2 ( p1 ) a2 b2 p2 d 2 p1
其他条件不变,边际成本为C1、C2,试求解其纳什均衡。
P2
R2 ( p1 )
1 2b2
(a2
b2 c2
d 2 p1 )
p1*
p2*
1 2b1 1 2b2
(a1b1c1ຫໍສະໝຸດ d1p* 2
)
(a2 b2c2 d 2 p1* )
P1*
d1 4b1b2 d1d 2
(a2
b2c2 )
2b2 4b1b2 d1d 2
(a1
b1c1 )
P2*
d2 4b1b2 d1d 2
Nash对对策论旳贡献有: (i) 合作对策中旳讨价还价模型,称为Nash讨价还价解; (ii) 非合作对策旳均衡分析。

第10章对策论

第10章对策论
max α ij = α i* j
i
( j = 1, 2," , m )
然后再找出各最大值中的最小值(最优支付)
min(max α ij ) = min α i* j = V2
j i j
这里 V2 = 2 我们把甲的最优赢得和乙的最优支付的这个公共值,称为矩阵对策的值,记作 VG , 即:
VG = max(min α ij ) = min(max α ij )
10.2 矩阵对策
矩阵对策就是有限零和二人对策,指的是参加对策的局中人只有两方(或二人) , 每一方局中人的可供选择策略数是有限多个,而且每一局对策结束时,一方的收入(或 赢得)等于另一方的支出(或称输出) ,换句话说,二方得失之和总是等于零。这类对 策比较简单,理论上也比较成熟,在实践中应用的也极为广泛。由于矩阵对策的理论奠 定了研究“对策现象”的基本思路,所以它是对策论中必须掌握的内容。 10.2.1 矩阵对策的数学模型 对于矩阵对策,我们用甲、乙表示两个局中人,假设甲有 m 个策略(又称纯策略) , 分别以 α1 , α 2 ," , α m 表示,乙有 n 个策略,分别以 β1 , β 2 ," , β n 表示。根据对策规定,若 (a , β ) 甲选用第 i 个策略,乙选用第 j 个策略,则称 i j 为一个纯局势,那么,甲的赢得可 以用 α ij 表示(若 α ij 是负数时,表示甲是支出而不是收入)。于是,甲的支付可以列成表
min α ij = α ij*
j
( i = 1, 2," , m )
然后在这些最小值中找到最大值(最优赢得) , 即:
max(min α ij ) = max α ij* = V1
i j i
在本对策 G 中, V1 = 2 局中人乙则和甲相反, 他的原则首先是在各纯策略 (列) 中找出最大值 (可靠支付) :

第十二章-对策论(运筹学讲义)课件

第十二章-对策论(运筹学讲义)课件

局中人2 出1指
5 -5
出2指 -5 5
局中人1从局中人2该如何选择策略,已获得利益?
-
3
例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在 不同的屋子里审讯。警察告诉他们: 如果两人都坦白,各 判刑8年;如果两人都抵赖,由于证据不充分,两人将各 判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者 立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯 都有两种策略: 坦白或抵赖。可以用一个矩阵表示两个嫌 疑犯的策略的损益
3.一局势对策的益损值: 局中人各自使用一个对策就形成了一 个局势,一个局势决定了各局中人的对策结果(量化)称 为该局势对策的益损值。
赢得函数(payoff function): 定义在局势上,取值为相应益 损值的函数
4. 纳什均衡: 纳什均衡指所有局中人最优策略组成的一种局势,
既在给定其他局中人策略的情况下,没有任何局中人有积
A
1
4
3
2
解因
m i a x m j in a ij 2 , m j in m i a x a ij 3
m a ixm jina ij m jinm a ixa ij
不符合鞍点条件, 故G的鞍点不存在。
例6 求解矩阵对策,其中: 解 容易得到
A 11
0 1
1 1
v a i * j * 1i * 1 ,2 ;j * 3
A
a
2
1
a22
a1m
a2
m
a
m
1
am2
amn
aij为局中人甲在局势
( i , j )下的赢得 -
9
“齐王赛马”是一个矩阵策略。
其中: 齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 },
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
再如:α2 =(上,下,中), β 1 =(上,中, 下),则在局势s21下齐王的赢得值H1(s21)=1,田忌的 赢得值H2(s21)=﹣1。如此等等.
当局中人,策略,赢得函数三个因素确定后,一 个对策模型也就给定了。
三﹑对策的分类 联合对策
结 静 盟 合作对策
态对
二人
对 策有



多人




从各自可能出现的最不利的情形中选择一种最为有利的 情形作为决策的依据。
②选择原则:局中人Ⅰ按最大最小原则,局中人Ⅱ按最
小最大原则。即局中人Ⅰ从所有最小的赢得中选择最
大的赢得的策略,局中人Ⅱ从所有最大的损失中选择 最小的损失的策略。
例1 设有一矩阵G={S1 , S2;A},其中S1={α1,α2, α2, α4}和S2={ β 1, β 2, β 3} 局中人Ⅰ的赢得矩阵为
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
⑷经济—各国之间,各公司企业之间的各种经济 谈判,企业之间为争夺市场而进行的竞争。
2﹒对策论
对策论是研究对策行为中斗争各方是否存在着最 合理的行动方案,以及如何找到这个合理的行动方案 的数学理论和方法。对策论也称为竞赛论或博奕论。
经典的对策论研究的例子:“齐王賽马”
战国时期,齐王有一天提出要与田忌进行賽马。 双方约定:从各自的上中下三个等级马中各选一匹参 赛,每匹均只能参赛一次,每次比赛双方各出一匹马, 负者要付给胜者千金。已知:在同等级的马中,田忌 的马不如齐王的马,而如果田忌的马比齐王的马高一 等级,则田忌的马可取胜。 双方如何取胜?
﹣6 1 ﹣8
A=
32 4 9 ﹣2 ﹣10
求出局中人Ⅰ﹑Ⅱ的最优策略。
﹣3 0 6
例1 设有一矩阵G={S1 , S2;A},其中S1={α1,α2, α2, α4}和S2={ β 1, β 2, β 3} 局中人Ⅰ的赢得矩阵为
﹣6 1 ﹣8
A=
32 4 9 ﹣2 ﹣10
求出局中人Ⅰ﹑Ⅱ的最优策略。
3﹒矩阵对策模型
设Ⅰ﹑Ⅱ分别表示两个局中人,且它们的纯策略 集分别为S1={α1,α2, …,αm}和S2={ β 1, β 2, …, β n}。记 局中人Ⅰ对任一局势( αi, β j )的赢得值为aij,并称
a11 a12 …a1n A= . . … .
am1 am2 …amn
为局中人Ⅰ的赢得矩阵。
﹣3 0 6
解:根据选择的原则,分析局中人的选择的策略
⑴局中人Ⅰ的策略:纯策略α1,α2, α2, α4可能带来的最 小赢得分别﹣8,2,﹣10,﹣3 所以,最小赢
得中最大的值为2。因此局中人Ⅰ的策略应为α2 ⑵局中人Ⅱ的策略:纯策略β 1, β 2, β 3可能带来的最大
损失分别9,2,6 。 所以,最大损失中最小的值为2。 因此局中人Ⅱ的策略应为β 2 。
设Ⅰ﹑Ⅱ分别表示两个局中人,且它们的纯策略
集分别为S1={α1,α2, …,αm}和S2={ β 1, β 2, …, β n}。记局
中人Ⅰ对任一纯局势( a11 a12 …a1n
αi,
β
j
)的赢得值为aij,并称
A= . . … . 为局中人Ⅰ的赢得矩阵。
am1 am2 …amn
局中人Ⅱ的赢得矩阵为﹣A。

二人
动 策无


ቤተ መጻሕፍቲ ባይዱ
对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型
②在对策中总是假定每一个局中人都是“理智 的”决策者或竞争者。即对任一局中人来讲,不存 在利用其它局中人决策的失误来扩大自身利益的可
2﹒策略集
策略
一局对策中,可供局中人选择的一个实际可行 的完整的行动方案,称为一个对策。
策略集
设i为局中人,i的所有策略构成的集合Si称为i的 策略集。
如:在“齐王赛马”中,如果用(上,中,下) 表示以上马﹑中马﹑下马依次参赛这样一个次序,这 就是一个完整的行动方案,即为一个策略。
3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。
定理的直观解释:如果ai*j*既是矩阵A=(aij)m×n中 第i*行的最小值,又是第j*列的最大值,则ai*j*是对策 的值,且(α i* , β j* )是在纯策略意义下的解。
定理的对策意义:一个平衡局势(α i* , β j* )具有 这样的性质,当局中人Ⅰ 选择了纯策略α i* 后,局中 人Ⅱ为了其所失 最小,只能选择β j* ,否则就可能失 去更多;反之,当局中人Ⅱ 选择了纯策略β j* 后,局 中人Ⅰ为了得到 最大的赢得,只能选择α i* ,否则就 会赢得更少 。双方在局势(α i* , β j* )下达到一个平衡 状态。
根据定义1可知,例1中( α 2 , β2 )是在纯策略 下的解。对策值VG=a22=2 ,i*=2,j*=2 。
定理1 矩阵对策G={S1 , S2;A}在纯策略意义下有解 的充要条件是:存在纯局势( α i* , β j* )使得对一切 i=1,2, …,m, j=1,2, …,n, 均有aij*≤ ai*j* ≤ ai*j 。
根据条件可看出,两人各采取什么的样出马顺序 对胜负是至关重要的。
二﹑对策行为的三个基本要素
1﹒局中人 在一个对策行为中,有权决定自己行动方案的
对策参加者,称为局中人。通常用I表示局中人的集 合。如果n个局中人,则I={1,2,…,n}。
说明:
①对策中关于局中人的概念是具有广义性的。 局中人除了可理解为个人外,还可以理解为一集体, 如球队﹑交战国﹑企业等,以及研究自然界中某个 现象时,可把这个现象看成一个局中人。
运筹学—对策论(一)
§1对策论的基本概念 一﹑对策行为和对策论
1﹒对策行为: 具有竞争或对抗性质的行为称为对 策行为。 对策行为的实例:
⑴下棋﹑打牌﹑体育比赛等。
⑵战争—在战争活动中的双方,都力图选取对自 己最为有利的策略,千方百计去战胜对手。
⑶政治—国际的谈判,各种政治力量之间的斗争, 各国际集团之间的斗争等都具有斗争的性质。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵
为﹣A。
当局中人Ⅰ﹑Ⅱ和策略集S1 ﹑ S2及局中人Ⅰ的赢 得矩阵A确定后,一个矩阵对策就确定了。
通常,将矩阵对策记成G={Ⅰ,Ⅱ;S1 , S2;A} 或G={S1 , S2;A} 。
4﹒局中人如何选取对自己最有利的纯策略? ①局中人的“理智行 双方都不想冒险,都不存在侥 为幸”心:理,而是考虑到对方必然会设法使自己的所得最小,
定理1的一个等价命题:
定义2 设f(x,y)为一个定义在x∈A ,y∈B上的实值 函数,如果存在x* ∈A,y* ∈B,使得对一切x∈A ,y∈B, 有f(x,y*) ≤f(x*,y*) ≤ f(x*,y) , 则称(x*,y*) 为函数f(x,y) 的一个鞍点。
定理1的等价命题:矩阵对策G在纯策略意义下有 解,且VG=ai*j*的充要条件是: ai*j*是矩阵A的一个鞍 点(也称为对策的鞍点)。
显然, Hi(s)是局势s的函数,称之为第i局中人的 赢得函数。
如:在“齐王赛马”中,局中人集合I={1,2}, 齐王和田忌的策略集可分别用S1={α1, α2, α3 , α4 , α5 , α6}和S2={β1 ,β 2, β 3 , β 4 , β 5 , β 6}表示。 这样,齐王的一个策略αi和田忌的一个策略β j就决定 了一个局势sij 。 如果α1 =(上,中,下), β 1 =(上, 中,下),则在局势s11下齐王的赢得值H1(s11)=3,田 忌的赢得值H2(s11)=﹣3。
相关文档
最新文档