运筹学--对策论

合集下载

运筹学-第15章--对策论

1 8 5 8 5 5*
2 2 3 2 1 1
3 4
9 0
5 2
6 3
5 5*
3
0
max 9 5* 8 5*
可知 ai* j* =5，i*=1,3，j*=2,4．故（α1，β2）（α1，β4）（α2，
β2）（α2，β4）为对策的纳管什理均运衡，筹 V学G=5．
15
• 最优纯策略求解步骤：
• 1、行中取小，小中取大得最大化最小收益值；
• 2、列中取大，大中取小得最小化最大支付值；
• 3、比较两值是否相等。若相等便存在最优纯策略。若不等，则不存在最优纯策略。
管理运筹学
16
§3 矩阵对策的混合策略
设矩阵对策 G = { S1, S2, A }。当
max
i
min
j
aij
min
j
max
i
aij
时，不存在最优纯策略。
例：设一个赢得矩阵如下:
一个局势，一个局势决定了各局中人的对策结果（量化）称为该局势对策的益损值。
管理运筹学
3
§1 对策论的基本概念
出赛的次序是一个策略 “齐王赛马”齐王在各局势中的益损值表（单位：千金）
管理运筹学
4
§1 对策论的基本概念
其中：齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }，田忌的策略集：S2={ 1, 2, 3, 4, 5, 6 }。
A=[aij]m×n i 行代表甲方策略 i=1, 2, …, m；j 列代表乙方策略 j=1, 2, …, n；aij 代表甲方取策略 i，乙方取策略 j，这一局势下甲方的益损值。此时乙方的益损值为 -aij（零和性质）。

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法，主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统，不考虑时间变化和过程发展，只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境，如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述对策模型对策论的基本概念对策分析方法对策论的应用实例对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论，也称为博弈论，是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡，通过数学模型和逻辑推理来描述和分析竞争行为，尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择，例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下，企业间可能通过对策论的方法找到合作的可能性，例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面，对策论可以帮助理解个体和团队的行为反应，优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中，参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划，它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中，参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中，如果一个参与者的某个策略能够使其获得比其他参与者更好的结果，则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

运筹学第9章对策论

3. 赢得函数(支付函数)(payoff function)
一个对策中，每一个局中人所出策略形成的策略组称为一个局势。即设 s i 是第 i 个局中人的一个策略，则n个局中人的策略形成的策略组 s ( s1 , s2 ,, sn )
s 就是一个局势。
在“齐王VS田忌赛马”中，
齐王有6个策略： 2 ( 上，下，中)、 1 (上，中，下)、 4 (中，下，上)、 5 ( 下，上，中)、
1 2
设局中人I采用纯策略 1和 2的概率分别为 x1 和 x2 ，x1 x2 1, x1,2 0 设局中人II采用纯策略 1和 2的概率分别为 y1 和 y2 ，y1 y2 1, y1,2 0
SI 1 , 2 设局中人I的策略集原来为：那么在没找到纯策略的前提下，局中人I的策略集变为：局中人I的策略 SI X ( x1, x2 )T x1 x2 1, x12 0 有无穷多个 S II 1 , 2 设局中人I的策略集原来为：那么在没找到纯策略的前提下，局中人II的策略集变为：
当一个局势 s 出现后，每一局中人就会面对
一个赢得值或损失值，记作 Hi (s)。
Hi (s) 是定义在局势上的函数，
所以称为局中人 i 的赢得函数。
通常的分类方式有： (1) 根据局中人的个数，分为二人对策和多人对策； (2) 根据各局中人的赢得函数的代数和是否为零，分为零和对策与非零和对策； (3) 根据各局中人间是否允许合作，分为合作对策和非合作对策； (4) 根据局中人的策略集中的策略个数，分为有限对策和无限对策等等。
max VG X 1 E ( X 1 , 1 ) E ( X 1 , 2 ) X 2 E ( X 2 , 1 ) E ( X 2 , 2 ) 5 x1 8 x2 VG E s . t . X 3 E ( X 3 , 1 ) E ( X 3 , 2 ) 9 x1 6 x2 VG x x 1 , x , x 0 1 2 1 2

对策论(Theory of Games)

定义
并不是所有的对策都存在鞍点，如 A为齐王的赢得矩阵 3 1 1 1 1 -1 1 3 1 1 -1 1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 -1 1 3 1 1 1 1 -1 1 3 max(min aij)= -1 min (max aij)=3 i j j i
例如：
• 给定矩阵对策
6 5 6 A 1 4 2 8 5 7
对策的最优值为5，对策的解有两个，分别为局势 , 和 , 。
1 2 3 2
(三)矩阵对策的混合策略
1、矩阵对策的混合策略的定义
2、原则：坏中求好的原则。 3、解的存在：一定有解 4、混合策略求解：利用期望转化成线性规划问题求解。
三、矩阵对策模型
（一）矩阵对策的概念（二）矩阵对策的最优纯策略（三）矩阵对策的混合策略（四）矩阵对策的解法
（一）矩阵对策的概念 1、矩阵对策的定义 2、建立矩阵对策模型
1、矩阵对策的定义局中人只有两个，对策中各方只能从有限的策略集中确定性的选择一种，且对策双方的支付之和为零的对策称为两人零和纯策略对策。
表2
齐王上中下田忌上中下 3 上下中上中下 1 1 中下上 -1 下中上 1 下上中 1
上下中 1 中上下 1
中下上 1 下中上 1
3 1
1 -1
-1 3
1 1
1 1
3 1
1 -1
1 3
1 1
-1 1
下上中 -1
1
1
1
1
3
引例3
有两个儿童A和B在一起玩“石头-剪子布”游戏。我们规定胜者得1分，负者得 -1分，平手时各得0分。双方选定的各种出法及相应的结果可由下表列出。双方应取何种策略？

《运筹学教学资料》ch14对策论

寡头垄断市场上的价格竞争案例中，存在几家大型企业，它们通过价格策略来争夺市场份额。如果企业都选择降价，将导致价格战；如果都选择维持高价，将获得更多利润。但企业往往会选择降价来争夺市场，最终导致双方受损。
THANK YOU
感谢聆听
纯策略均衡
在纳什均衡中，每个参与者都采用单一策略。如果所有参与者的纯策略组合构成纳什均衡，则称为纯策略均衡。
混合与者以一定的概率分布随机选择不同的策略，使得对手无法通过预测获得优势。在混合策略均衡中，每个参与者的预期收益达到相对稳定的状态。
混合策略纳什均衡
在经济学中，帕累托前沿表示在所有可能的资源配置中，能够使得所有
玩家的利益都得到最大化的配置集合。帕累托前沿用于衡量资源配置的
效率和公平性。
03
应用
纳什均衡和帕累托前沿是评价博弈结果和资源配置的重要工具，可以帮
助理解在竞争和合作中的最优选择和资源配置问题。
04
多人对策
合作博弈与非合作博弈
合作博弈
参与者通过合作达成协议，以最大化共同利益。合作博弈强调联盟和集体行动，通常使用夏普里值来分配收益。
运筹学教学资料
目
CONTENCT
录
• 对策论简介 • 二人有限零和对策 • 二人有限非零和对策 • 多人对策 • 对策论案例分析
01
对策论简介
对策论的定义与特点
定义
对策论，也称为博弈论，是研究决策主体在相互竞争、对抗或合作中的行为和决策的数学分支。
特点
对策论强调理性个体之间的策略互动，通过数学模型描述和预测主体之间的行为和结果，为决策者提供最优策略和解决方案。
对策论的应用领域
01
02

运筹学对策论

第六章对
策
论
第一节对策论的基本概念
第二节矩阵对策第三节矩阵对策的解法
第一节对策论的基本概念
一、简例
二、对策问题的数学模型三、对策问题的分类四、均衡的意义
一、简例
例1 战国时期，齐王与大夫田忌每年要赛马，双方约定：每方出上、中、下三个等级的马各1匹，每匹马都参赛一次，共赛3次。每次赛后，负者要付给胜者千金。当时的情况是，在各个等级的马中，齐王的马都稍强于田忌的马。每次赛马，田忌经常要输三千金。有一次，田忌的谋士孙膑出了个主意：让田忌用下等马对齐王的上等马，用中等马对齐王的下等马，用上等马对齐王的中等马。这样，比赛结果田忌一负两胜，反而赢得了一千金。由此可见，掌握准确的信息，制定正确的行动方案是制胜的关键。在现实生活中，例如乒乓球团体赛，选手的排序不同，往往导致比赛的结果不同。在各种冲突的现象中，参与者如何决策是关系重大的问题。
一、简例
例2 Von Neumann根据福尔摩斯探案中的情节，略加修改，把对策论的精神融会其中，使大侦探与巨盗的斗争，更加引人入胜。大侦探福尔摩斯严重妨碍了当时邪恶势力的头子莫里亚蒂。此人诡计多端，心黑手狠，多次扬言要对福尔摩斯下毒手。风声传到福尔摩斯耳朵里，他感到，当时自己势孤力单，“三十六计，走为上计”，决定暂时离开英国，福尔摩斯匆忙上了从伦敦到多佛尔的火车。从车窗里，他突然发现莫里亚蒂也在站台上，并且觉察到对手已发现他坐在火车里，火车正要开动，下车躲避已不可能。福尔摩斯在火车里，紧张地盘算着对策。从伦敦到多佛尔，火车只停靠一个中间站坎特伯雷，他是否要在那里下车，中途脱逃呢？另一方面，莫里亚蒂分析问题的本领毫不逊色于福尔摩斯，他当然会考虑到福尔摩斯中途是否会下车。两人各自应该采取怎样的对策才更有利于自己？这些问题都是对策论所要研究的。

管理运筹学课件第13章-对策论

管理运筹学课件第13章对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论，又称博弈论，是研究决策过程中理性决策者之间冲突与合作的数学理论。
特点
对策论注重分析决策者之间的相互作用和影响，以及决策结果的均衡性和稳定性。
供应链管理
在供应链管理中，对策论可用于协调供应商、制造商、销售商之间的利益关系，优化供应链整体效益。
金融市场投资决策
对策论可用于分析金融市场中的投资决策问题，如股票交易、期货交易等，帮助投资者制定最优的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择，帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中，对策论可用于分析不同武器系统的性能优
劣和作战效能，为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力，为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择，提出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者的策略，直到达到某个均衡条件为止。
数值解法
利用数值计算的方法求解连续对策的均衡解，如有限差分法、有限元法等。
解析法
在某些特殊情况下，可以通过解析的方法求解连续对策的均衡解，如线性二次型微分对策等。

精心整理的运筹学重点10.对策论

v1 = max min(3 − 2 x, 2 + 2 x) ， v1 = max min(3 − 2 x, 2 + 2 x) 就是折线ＡＢＣ，它是局 0≤ x ≤1 0≤ x ≤1
中人Ｉ的最小赢得线，Ｂ就是折线ＡＢＣ的最高点，所以Ｂ点所对应的值就是混合策略意义下的最大最小值。
i j j i
３．无鞍点的两人有限零和对策求解 X = ( x1 , x2 ,..., xm )T 为局中人Ｉ的混合策略，
Y = ( y1 , y 2 ,..., yn )
T
∑ x = 1 为局中人ＩＩ的混合策略， ∑ y = 1 ， ( X , Y ) 称为混合局势。
i i
最优混合策略求解方法 y1 y2
第十章对策论１．对策论类型１）根据局中人个数：二人对策、多人对策２）根据局中人间是否允许合作：合作对策、非合作对策３）根据局中人的策略集中的策略个数：有限对策、无限对策４）根据各局中人的赢得函数的代数和是否为零：零和对策、非零和对策５）根据策略的选择是否与时间推移有关：静态对策、动态对策６）根据对策中各局中人所拥有的有关决策信息：完全信息对策、不完全信息对策７）根据对策模型的数学特征：矩阵对策、连续对策、微分对策、随机对策矩阵对策：又称为二人有限零和对策。２．有鞍点的两人有限零和对策求解 G = {S1, S2 , A} 求解： maxmin{aij } = V1,minmax{aij } = V2
x1 a11 x2 a21
矩阵对策求解方法
有
a12 a22
有无鞍点？
无是
获得
２＊ｎ或ｍ＊２矩阵
否
图解

运筹学-对策论

3.矩阵对策的混合策略
例：设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路：对甲（乙）给出一个选取不同策略的概率分布，以使甲（乙）在各种情况下的平均赢得（损失）最多（最少）。 -----即混合策略
重要定理
定理任一矩阵对策G {S1,S2;A}，任一矩阵对策G＝{S1,S2;A}，一定存在混合策略意义下的解。合策略意义下的解。 • 定理设有两个矩阵对策 • G1＝ G2＝ G1＝{S1,S2;A1} G2＝{S1,S2;A2} • 其中A1＝(aij)，A2＝(aij+L)，L为任一常数。 A1＝其中A1 (aij)，A2＝(aij+L)，为任一常数。则 • (1)G1 G2同解 G1与同解； (1)G1与G2同解； • (2)VG2 VG2＝ (2)VG2＝VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的，即矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人阶的， A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解，则很容易求解；如果此对策有纯策略意义下的解，则很容易求解；如果没有纯策略意义下的解，纯策略意义下的解，则为求出各局中人的最优混合策略可求解下列方程组：列方程组： • a11x1＋a21x2＝ a11y1＋a12y2＝ a11x1＋a21x2＝v a11y1＋a12y2＝v • a12x1＋a22x2＝ a21y1＋a22y2＝ a12x1＋a22x2＝v a21y1＋a22y2＝v • y1＋y2＝ x1＋x2＝ y1＋y2＝1 x1＋x2＝1 • 当没有纯策略意义下的解时，方程组一定有严格非负解 x*= 当没有纯策略意义下的解时， x1* x2* y*=（y1*，y2*），（x1*，x2*）和y*=（y1*，y2*），即为各局中人的最优混合策略。

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件

局中人称为“i旳对手”，记为-i。
对策中利益一致旳参加者只能看成一种局中人，例：桥牌中旳东、西两方。对策论中对局中人旳一种主要假设：每个局中人都是“理智旳”，即每一种局中人都不存在侥幸心理，不存在利用其他局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中，一种对策有下列几种基本要素：一．局中人二．策略(strategies)：
-1
1
布
1
0
-1
剪刀
-1
1
0
第三节矩阵对策旳纯策略
例：设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解：对局中人I而言，最大赢得是9，若想得到这个赢得，
他要选择纯策略，3因为局中人II也是理智旳竞争者，他已考虑到局中人I打算出旳3心理，则准备以 3对付之，使局中人I不但得不到9，反而失掉10. 局中人I当然也会猜到局中人II旳心理，故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人：参加对策旳局中人有两个；
有限：局中人旳策略集都为有限集；
零和：在任一局势下，两个局中人旳赢得之和总等于0，即，
一种局中人旳所得值恰好是另一种局中人旳所失值，双方旳利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}

运筹学-第六讲对策论

对策G常写成： G={S1，…，Sn；h1，…hn}
【定义】在对策G={S1，S2…，Sn；h1，h2…hn}中，假如由各个对策方旳各选用一种策略构成旳某个策略组合(S1*，S2*…，Sn*)中，任一对策方i 旳策略 Si*，都是对其他策略方策略旳组合 (S1*，…，S*i-1，S*i+1…，Sn*)旳最佳策略，即h i(S1*, … , S*i-1, Si*, S*i+1,…Sn*)≥hi(S1*, …, S*i-1, Sij, S*i+1 , …, Sn*)对任意 Sij∈Si 都成立，则称(S1*，…，Sn*)为G旳一种纯策略意义下旳“纳什均衡”(Nash Equilibrium)．
(2,0)
(4,0)
反应函数法
对策论 game theory
【例4】考虑上述模型旳另一种情况即各厂商所选择旳是价格而不是产量，假设产量与价格旳函数关系为：
q1 ( p2 ) a1 b1 p1 d1 p2
q2 ( p1 ) a2 b2 p2 d 2 p1
其他条件不变，边际成本为C1、C2，试求解其纳什均衡。
P2
R2 ( p1 )
1 2b2
(a2
b2 c2
d 2 p1 )
p1*
p2*
1 2b1 1 2b2
(a1b1c1ຫໍສະໝຸດ d1p* 2
)
(a2 b2c2 d 2 p1* )
P1*
d1 4b1b2 d1d 2
(a2
b2c2 )
2b2 4b1b2 d1d 2
(a1
b1c1 )
P2*
d2 4b1b2 d1d 2
Nash对对策论旳贡献有： (i) 合作对策中旳讨价还价模型，称为Nash讨价还价解； (ii) 非合作对策旳均衡分析。

运筹学—对策论(一)

3﹒赢得函数
局势: 在一局对策中，各局中人所选定的策略形成的策略组称为一个局势。即若设si是第i个局中人的一个策略，则n个局中人的策略组s={s1， s2，…， sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔乘积表示，即S=S1× S2×… × Sn
赢得函数：当局势出现后，对策的结果也就确定了。也就是说，对任一局势s∈S，局中人i可以得到一个赢得Hi(s)。
对
二人
动策无
态
限
对策
微分对策等
多人
重点
零和
学习
的对
非零和策。
零和
非零和零和
非零和
零和
非零和
§2矩阵对策的基本定理一﹑矩阵对策的数学模型
1﹒二人有限零和对策：是指有两个参加对策的局中人，每个局中人都只有有限个策略可供选择，在任一局势下，两个局中人的赢得之和总等于零。
2﹒矩阵对策：就是二人有限零和对策。 3﹒矩阵对策模型
总之，局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ，β 2。
5﹒矩阵对策的解定义1 设G={S1 ， S2；A}为矩阵对策，其中
S1={α1,α2, …,αm}，S2={ β 1, β 2, …, β n} ， A=（aij）m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立，记VG= ai*j* 。则称VG为对策G的值，称上述等式成立的纯局势（ α i* , β j* ）为G在纯策略下的解（或平衡局势）， α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
由于假定对策为零和，所以局中人Ⅱ的赢得矩阵

运筹学-10、对策论

第五章
对策论
第一节引言
一、对策行为与对策论
对策论又称博弈论，是运筹学的一个重要分支。对策论所研究的主要对象是带有斗争或竞争性质的现象。由于对策论研究的对象与政治、军事、工业、农业、交通、运输等领域有密切关系，处理问题的方法又有着明显的特色，所以越来越受到人们的重视。
1
在日常生活中，我们经常看到一些相互之间的竞争、比赛性质的现象，如下棋、打扑克、体育竞赛等。
所以：min max aij
j i
max min aij (1)
i j
i
j
另一方面，对任意i，j均有：
min aij aij max aij j i max min aij max aij
i j i
j j
max min aij min max aij (2)
i
所以： max min aij
7
例1:设有矩阵对策，局中人Ⅱ的支付矩阵如下：
7 3 A 16 3
1 8 2 4 1 9 0 5
解： α3 → β3 → α4 → β1 → α 3
如果各局中人都不想冒险，必须考虑对方会选择策略使他得到最差的收入。因此各局中人都选择理智的决策行为。
对策的值为VG＝ 5。
17
二、矩阵对策的混合策略
矩阵对策G有鞍点时，就存在最优解(最优纯策略)，但是否一切矩阵对策问题中，各局中人都有上述意义的最优纯策略呢?答案是否定的。
1 1 0 A 1 0 1 例1：石头、剪刀、布 1 1 0
max min aij 1 min max aij 1
i j j i
不存在上述纯策略意义下的解。

运筹学对策论

0 2 3 0
赢得矩阵为 A 2 0 3 0
0
3
0 4
0
3
4
0
14.2 矩阵对策旳混合策略
定义:对给定旳矩阵对策
G = Ⅰ，Ⅱ；S1,S2;A
其中 S1= 1, 2…m
S2= 1 , 2… n
A=(aij)mn
把纯策略集合相应旳概率向量
X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
解：(i, j) 表达自己出 i 个手指，猜测对方出 j个手指。
练习：“二指莫拉问题”，甲乙两人游戏，每人出一种或两个手指头，同步又把猜测对方所出旳手指数叫出来，若只有一种人猜测正确，则他所赢得数为二人所出手指之和，不然，重新开始。写出该对策各局中人旳策略集合及甲旳赢得矩阵，并回答局中人是否存在某种出法比其他出法更为有利。
14-1矩阵对策旳基本概念
案例：俾斯麦海旳海空对抗
1943年2月，第二次世界大战中旳日本，在太平洋战区已经处于劣势。为扭转局势，日本统帅山本五十六大将统率下旳一支舰队筹划了一次军事行动：由集结地——南太平洋旳新不列颠群岛旳蜡包尔出发，穿过俾斯麦海，开往新几内亚旳莱城，增援困守在那里旳日军。
i
i
E(x*, y) E(x*, j ) y j E(x*, y*) y j E(x*, y*)
j
j
故
E(x, y*) E(x*, y*) E(x*, y)
定理3把无限个不等式旳证明转化为对有限个（mn)个不等式旳证明问题。
定理14-4：设 x* S1*, y* S2 ，* 则 (x*, y*)为 G 旳解旳充要条件：存在数 v 使得 x*, y * 分别是不等式组（ Ⅰ ）和

第8章：对策论《运筹学》

S2 {1, 2 , 3}
4 2 6
A
4
3
5
8 1 10
3 0
6
试求出双方的最优纯策略和对策值。
S1 {，1,2 ,3,4}
1 2 3
1 4 2 6
2
4
3
5
3 8 1 10
4 3 0
6
解：由 A 可以看出，局中人甲的最大赢得是8，要想得到这个赢得，他就得选择纯策略α3 。
3
0
6
-3
836
定义1：设G={S1,S2;A}为矩阵对策，其中双方的策略集和赢
得矩阵分别为 S1 {1,2、, ,m} S2 、{1, 2, 。,若n有} 等A式 {：aij}mn
mai x[mjin(aij )] mjin[mai x(aij )] ai j
成立，则称 ai为 j 对策G的值，局势（ i） , 为j对策G的解或平
意义上的解；
x* 和 y* 分别称为局中人甲和乙的最优混合策略；
VG 为矩阵对策G={S1,S2;A}或G’={X,Y;E}的值。
定理2：局势(x*,y*)是矩阵对策G={S1,S2;A}在混合策略意义上解的充分必要条件是对于一切 x∈X、y∈Y均存在：
E(x, y) E(x, y) E(x, y)
第二节矩阵对策的基本理论
有限二人零和对策，即参加对策的局中人只有两个，而每个局
中人都有有限个可供选择的策略。而且在任一局势中，两个局中
人的得失之和总等于零（一个局中人的所得即为另一个局中人的
所失）。局中人的利益是冲突的，也称为对抗对策。
一、矩阵对策的数学模型
用甲、乙表示两个局中人，假设甲有 m 个策略，表示为:

运筹学—第十二章对策论

第4页页பைடு நூலகம்
第3页页
对策现象的基本要素
1、对策行为和对策论、 • 对策行为具有竞争和对抗性质的行为对策行为: 具有竞争对抗性质的行为竞争和性质的行为. – 体育比赛 – 政治斗争 – 企业之间的竞争 • 对策论对策论: 研究对策行为中斗争各方对策行为中斗争各方是否存在着最合理的行动研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理方案的数学理论和方法。如何找到这个合理方案的数学理论和方法方案,以及如何找到这个合理方案的数学理论和方法。需要建立对策模型。需要建立对策模型。
对策论
• 对策论的基本概念 • 矩阵对策的基本理论 • 矩阵对策的解法 • 其他类型对策简介
第1页页
对策论的基本概念
对策论的由来和发展历史对策现象的基本要素对策问题举例及对策的分类
第2页页
对策论的由来和发展历史
济、益相对抗的现象，在社会生活和经济、经常碰到各种各样具有竞争或利益相对抗的现象，研象的数学理论和方法，称为对策论。究对抗或竞争现象的数学理论和方法，称为对策论。世纪初数学家波雷尔波雷尔（ el）和策墨洛（ Zermelo） 20 世纪初数学家波雷尔（ Bor el ）和策墨洛（ E ．Zermelo ）开始用数学方法研究对策现象，些游戏（如扑克、法研究对策现象，研究对象主要是日常生活中的一些游戏（如扑克、象棋，因而对策论在相当长的时间内发展缓慢。等）因而对策论在相当长的时间内发展缓慢。，诺依曼（ mann）冯 • 诺依曼（ Von Neu mann ）在 1928 年创立了二人零和对策理论，为对策奠定了基础。论的进一步发展奠定了基础。 1944 年冯•诺伊曼和摩根斯特恩（ Morgenste rn）合著的《对策论与经济冯• 斯特恩（ rn）合著的《行为》版，标志着系统的对策理论的初步形成。行为》一书的出版，标志着系统的对策理论的初步形成。者纳 1994 年三位长期致力于对策论的理论和应用研究的学者纳什（ John F Nash）泽尔腾（ Selten） i） Nash ）泽尔腾（ Reinhard Selten ）和海萨尼（ John Harsany i ）共同获、奖，的最具权威性的肯定。得诺贝尔经济学奖，则更是对对策论地位和作用的最具权威性的肯定。罗伯特· 奥曼和美国经济学家托马斯谢林获 2005 年，以色列经济学家罗伯特 · 奥曼和美国经济学家托马斯 · 谢林获奖。罗伯特· 奥曼提出的“ 分析，得诺贝尔经济学奖。罗伯特 · 奥曼提出的 “ 重复博弈 ” 分析，目前成为所分支。斯· 有社会科学的主流分支。托马斯 · 谢林提出了冲突局势理论，在上世纪年代的冷战时期， 50 年代和 6 0 年代的冷战时期，该理论极大地影响了美国政府对核威慑的态度。态度。

运筹学12-1对策论

第十二章对策论
对策：具有对抗性质的问题。对策：具有对抗性质的问题。在竞争中寻找有利于自己的策略。于自己的策略。对策论：竞争中的决策论。对策论：竞争中的决策论。
前一页
后一页
退出
§12.1 对策论的基本Байду номын сангаас念
一、引例
1) 猜硬币：甲、乙各出示一枚硬币，如果两个猜硬币：乙各出示一枚硬币，硬币都呈正面或者反面，甲得1分硬币都呈正面或者反面，甲得分，同时乙损失1分，反之，甲损失分，乙得分。分反之，甲损失1分乙得1分
前一页前一页后一页退出退出
1 2 111 解之，解之，得到 X = ( ,0, ),Y = ( , , ) 7 7 777 3 3 3 ∑ xi = ∑ y j = 7 i =1 j =1 1 7 V= 3 = 则原矩阵对策的值，则原矩阵对策的值， 3 最优混合策略为：最优混合策略为： ∑ xi
前一页
后一页
退出
§12.1 对策论的基本概念
二、基本要素：基本要素： 1.局中人：参与对抗的各方；局中人：局中人 2.策略集：局中人选择对付其它局中人的行动方策略集：策略集
案称为策略。某局中人的所有可能策略全体称为策略集；
3.收益函数：当每一个局中人都选定了一个策略收益函数：收益函数
后一页
退出退出
i j j i
成立的充分必要条件是：存在局势(i )，成立的充分必要条件是：存在局势(i*,j*)，使得
aij* ≤ ai * j* ≤ ai * j ( i = 1,...m , j = 1,...n)
前一页前一页
后一页
退出退出
A} 定义9.1 对于矩阵对策 Γ = { S1 , S 2 ,，如果存在定义局势(i 局势 *,j*)，使得， aij* ≤ ai * j* ≤ ai * j ( i = 1,...m , j = 1,...n)

管理运筹学11对策论

A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
局中人甲应选择2 ，此时不管局中人乙采取什么策略，甲的
赢得均不小于3。
2024/3/29
2. 矩阵对策解的问题
设矩阵对策G={S1，S2，A}，其中：
S1 ={1，2，3，4}， S2 = {1 ，2 ， 3}
Min
-4 2 -6 -6
对策矩阵G={S1，S2，A}在混合策略意义下有解的充分必要条件是存在着
x * S1* ， y * S2*使（x *，y *）为E (x,y) 的一个鞍点，即对于一切x S1* ， y S2* 有
E (x,y *) E (x *,y *) E (x *,y)
2024/3/29
3. 矩阵对策的混合策略
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
Max
8 36
Min 3
局中人甲应选择2 ，乙应采取2策略；结果甲赢得3，乙付
出3。
2024/3/29
2. 矩阵对策解的问题
定义1：设矩阵对策G={S1，S2，A}，其中：
S1 ={1，2，…，m}， S2 = {1 ，2 ， …， n}
6 5 7 5 5 0 1 -1 2 -1
Max 7 5 9 5
Min = 5
i = 1, 3 ，j = 2, 4，ai*j* = 5，四个局势均为矩阵对策的解。
2024/3/29
3. 矩阵对策的混合策略
对矩阵对策G={S1，S2，A}来说，局中人甲有把握的最小赢得是：
v1 = max min aij
x S1* y S2*

第十二章-对策论(运筹学讲义)课件

局中人2 出1指
5 －5
出2指－5 5
局中人1从局中人2该如何选择策略，已获得利益？
-
3
例2 囚徒困境。两个嫌疑犯作案后被警察抓住，分别被关在不同的屋子里审讯。警察告诉他们: 如果两人都坦白，各判刑8年；如果两人都抵赖，由于证据不充分，两人将各判刑2年；如果其中一人坦白，，另一人抵赖，则坦白者立即释放，抵赖者判刑10年。在这个例子中两人嫌疑犯都有两种策略: 坦白或抵赖。可以用一个矩阵表示两个嫌疑犯的策略的损益
3.一局势对策的益损值: 局中人各自使用一个对策就形成了一个局势，一个局势决定了各局中人的对策结果（量化）称为该局势对策的益损值。
赢得函数(payoff function): 定义在局势上，取值为相应益损值的函数
4. 纳什均衡: 纳什均衡指所有局中人最优策略组成的一种局势，
既在给定其他局中人策略的情况下，没有任何局中人有积
A
1
4
3
2
解因
m i a x m j in a ij 2 , m j in m i a x a ij 3
m a ixm jina ij m jinm a ixa ij
不符合鞍点条件, 故G的鞍点不存在。
例6 求解矩阵对策，其中: 解容易得到
A 11
0 1
1 1
v a i * j * 1i * 1 ,2 ;j * 3
A
a
2
1
a22
a1m
a2
m
a
m
1
am2
amn
aij为局中人甲在局势
( i , j )下的赢得 -
9
“齐王赛马”是一个矩阵策略。
其中: 齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }，

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第十四章对策论
对策论概论
对策论（The Game Theory)也称竞赛论或博
弈论，是研究具有竞争、对抗、利益分配等方面
的数量化方法，并提供寻求最优策略的途径。
20世纪40年代形成并发展。1944年以来，对策
论在投资分析、价格制定、费用分摊、财政转移支付、投标与拍卖、对抗与追踪、国际冲突、双边贸易谈判、劳资关系以及动物行为进化等领域得到广泛应用。
对策的三要素：
局中人：有权决定自己行为方案的对局参加者称为局中人。案例中，美日双方的决策者为局中人。当对局中局中人只有两人时，称为二人对策。
策略：对局中一个实际可行的方案称为一个策略。案例中，美日双方各有二个策略。
赢得矩阵（支付）：当每个局中人在确定了所采取的策略后，他们就会获得相应的收益或损失，此收益或损失的值称为赢得（支付）。赢得与策略之间的对应关系称为赢得（支付）函数。案例中，肯尼将军与山本五十六大将的赢得（支付）函数都可以用矩阵A、B表示。
14-1矩阵对策的基本概念
案例：俾斯麦海的海空对抗 1943年2月，第二次世界大战中的日本，在太平洋战区已经处于劣势。为扭转局势，
日本统帅山本五十六大将统率下的一支舰队
策划了一次军事行动：由集结地——南太平洋的新不列颠群岛的蜡包尔出发，穿过俾斯麦海，开往新几内亚的莱城，支援困守在那里的日军。
练习：“二指莫拉问题”，甲乙两人游戏，每人出一个或两个手指头，同时又把猜测对方所出的手指数叫出来，若只有一个人猜测正确，则他所赢得数为二人所出手指之和，否则，重新开始。写出该对策各局中人的策略集合及甲的赢得矩阵，并回答局中人是否存在某种出法比其他出法更为有利。
0 -2 3 0
定理14-2：矩阵对策 G = S1，S2；A
在混合策略意义下有解的充分必要条件是：存在混合局势（ X*，Y*），使得对一切 X S1* Y S2*均有
E（X，Y*） E（X*，Y*） E（X*，Y）
定理14-3：对给定的矩阵对策 G = S1，S2；A 设X* S1* Y* S2*则混合局势（ X*，Y*）是G的解且 V=VG*的充分必要条件是：对一切 i,j均有 E（ i， Y*） V E（X*， j ）
解：局中人I（采购员）有三个策略：
策略1: 10吨,策略2: 15吨,策略3 :20吨。
局中人II（环境）：策略1 较暖 ,策略2 正常，策略3较冷现把该单位冬天取暖用煤全部费用（秋季购煤费用与冬天不够时再补购煤费用）作为采购员的赢得矩阵。
1较暖
1(10) -1000
2正常
素 ai*j*是其所在行中最小的同时又是其所在列中最大的。这时ai*j*即是对策值，因此ai*j*也称为“鞍点”，而（ *i*， *j *），为对策的解。
Z
鞍点
Y
X
马鞍面z=f(x,y)
Z
Y
在X=0的平面上
z=f(0,y)
鞍点是z=f(0,y)
的极大值点
Z
z=f(x,0)
X
在Y=0的平面上
2 0 0 -3
-3 0 0 4
0 3 -4 0
0 2 赢得矩阵为 A 3 0
2 0 0 3
3 0 0 4
0 3 4 0
14.2
矩阵对策的混合策略
G = Ⅰ，Ⅱ；S1,S2;A
定义:对给定的矩阵对策
其中 S1= 1, 2…m S2= 1 , 2… n A=(aij)mn 把纯策略集合对应的概率向量 X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
当盟军获悉此情报后，盟军统帅麦克阿梭命令太平洋战区空军司令肯尼将军组织空中打击。日本统帅山本五十六大将心里很明白：
在日本舰队穿过俾斯麦海的三天航行中，不可能躲开盟军的空中打击，他要策划的是尽可能减少损失。
日美双方的指挥官及参谋人员都进行了冷静的思考与全面的谋划。
自然条件对于双方都是已知的。基本情况如下：从蜡包尔出发开往莱城的海上航线有南北两条。通过时间均为3天。
分别称为局中人I和局中人II的混合策略。
如果局中人I选取的策略为
X=(x1, x2 … xm)
局中人II选取的策略为
Y=(y1 , y2 … yn )，则期望值 E（X，Y）= xi aij yj=XAYT 称为局中人I期望赢得，而局势（X，Y）称为“混合局势”，局中人I，II的混合策略集合记为S1*， S2*。
气象预报表明：未来3天中，北线阴雨，能见度差；而南线天气晴好，能见度好。肯尼将军的轰炸机布置在南线的机场，侦察机全天候进行侦察，但有一定的搜索半径。日军盟军北线南线北线 2天 1天南线 2天 3天
（阴，能见度差）（晴，能见度好）
经测算，双方均可得到如下估计：
局势1：盟军的侦察机重点搜索北线，日本舰队也恰好走北线。由于气候恶劣，能见度差，盟军只能实施两天的轰炸。局势2：盟军的侦察机重点搜索北线，日本舰队走南线。由于发现晚，尽管盟军的轰炸机群在南线，但有效轰炸也只有两天。日军盟军北线南线北线 2天 1天南线 2天 3天
定义14-4:设G*= S1*,S2*;E 是对策G 混合扩充，如果有 max min E(X,Y)= min max E(X,Y)
X S1* Y S2* Y S2* X S1*
则称这个公共值为对策G在混合意义下的值，记为V*G，而达到V*G 的混合局势（X*，Y*）称为对策G在混合策略意义下的解，而X*和Y*分别称为局中人I，II的最优混合策略。
鞍点是z=f(x,0)
的极小值点
例14-3：对给定的矩阵对策 G = S1,S2;A
S1= 1,2 ,3 , 4
S2= 1 , 2 , 3 ,4
min
6 A= 1 8 0 max 8
5 4 5 2 5*
6 2 7 6 7
5 -1 5 2 5*
5* -1 5* 0
max
max
min
显然 ai2 a12 a1j
定理14-1：矩阵对策
G = S1，S2；A
在纯策略意义下有解的充分必要条件是：存在一个局势（ *i*， *j *），使得对一切 i=1，2，… m， j=1， 2…n 均有
aij*<=ai*j*<= ai*j
定理14-1表明矩阵对策
G = S1，S2；A
有解的充分必要条件是在A中存在元
（阴，能见度差）（晴，能见度好）
局势3：盟军的侦察机重点搜索南线，而日本舰队走北线。由于发现晚、盟军的轰炸机群在南线，以及北线气候恶劣，故有效轰炸只有一天。
局势4：盟军的侦察机重点搜索南线，日本舰队也恰好走南线。此时日本舰队迅速被发现，盟军的轰炸机群所需航程很短，加上天气晴好，有效轰炸时间三天。
（日军）
北线南线
（盟军）北线
南线
2
1
2
3
=A
（盟军）
北线南线
（日军）北线
南线
-2
-1
-2
-3
=B
在本例中的每一个对局，双方的赢得的代数之和为零，这样的对策称为“有限零和二人对策” 设两个局中人为I，II，局中人I有 m 个策略：1、 2… m ；用S1表示这些策略的集合： S1= 1、 2…… m
北线 1 南线2 （盟军）北线 1 南线2 2 1 2 3 =A
在矩阵中，盟军的最大赢得是3，而要得到3，必须选择策略 2，而日军的目的是使盟军的赢得尽量的小，必须选择策略1 ，使盟军的赢得只有1。在局中人I设法使自己的赢得尽可能大的同时，局中人II也设法使局中人I的赢得尽可能小。日军盟军北线1 南线2 北线1 2天 1天南线2 2天 3天
min
ai2 a32 a3j
对 i=1,2,3,4 j=1,2,3,4 都成立： a12 = a32 =5由定理5-1，对策值=5，对策的解( 1 , 2 ）,（ 3 , 2 ）,（ 1 , 4 ）,（ 3 , 4 ）
例14-4：某单位采购员在秋天时要决定
冬天取暖用煤的采购量。已知在正常气温条件下需要用煤15吨，在较暖和较冷气温条件下需要用煤10吨和20吨。假定冬季的煤价随着天气寒冷的程度而变化，在较暖、正常、较冷气温条件下每吨煤价为100元、150元、200元。又秋季每吨煤价为100元。在没有关于当年冬季气温情况下，秋季应购多少吨煤，能使总支出最少？
定义14-3:对给定的矩阵对策
G = S1,S2;A
则对策G*= S1*,S2*;E
称为对策G混合扩充。
纯策略是混合策略的一个特例。例如：局中人Ⅰ的纯策略 k 等价于混合策略
x ( x1 , x 2 , , x m ) S 1 ,
T *
其中，
1, i k xi 0, i k
max min aij= min max aij
i j j i
上式蕴涵的思想是朴素自然的，可以概括为：“从最坏处着想，去争取最好的结果”
定义14-1：对给定的矩阵对策
G =
i j
S1，S2；A
j i
若等式
max min aij= min max aij 成立，则称这个公共值为对策G的值，记为VG，而达到的局势（ i， j ）称为对策G在纯策略意义下的解，记为（ I*， j *）而I*和 j *分别称为局中人I和局中人II的最优纯策略。
证明：必要性：因为纯策略是混合策略的特例，故成立
充分性：当局中人取纯策略 i 时，
E ( i , y ) E ( i , y ) ( 0 , ,1, 0 , 0 )( a ij )( y1 , , y n )

运筹学--对策论

运筹学-第15章--对策论

《管理运筹学-对策论》

运筹学第9章 对策论

对策论(Theory of Games)

《运筹学教学资料》ch14对策论

运筹学对策论

管理运筹学课件第13章-对策论

精心整理的运筹学重点10.对策论

运筹学-对策论

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件

运筹学-第六讲对策论

运筹学—对策论(一)

运筹学-10、对策论

运筹学对策论

第8章：对策论《运筹学》

运筹学—第十二章 对策论

运筹学12-1对策论

管理运筹学11对策论

第十二章-对策论(运筹学讲义)课件

运筹学第9章对策论

运筹学—第十二章对策论