运筹学--对策论

合集下载

运筹学-第15章--对策论

1 8 5 8 5 5*
2 2 3 2 1 1
3 4
9 0
5 2
6 3
5 5*
3
0
max 9 5* 8 5*
可知 ai* j* =5，i*=1,3，j*=2,4．故（α1，β2）（α1，β4）（α2，
β2）（α2，β4）为对策的纳管什理均运衡，筹 V学G=5．
15
• 最优纯策略求解步骤：
• 1、行中取小，小中取大得最大化最小收益值；
• 2、列中取大，大中取小得最小化最大支付值；
• 3、比较两值是否相等。若相等便存在最优纯策略。若不等，则不存在最优纯策略。
管理运筹学
16
§3 矩阵对策的混合策略
设矩阵对策 G = { S1, S2, A }。当
max
i
min
j
aij
min
j
max
i
aij
时，不存在最优纯策略。
例：设一个赢得矩阵如下:
一个局势，一个局势决定了各局中人的对策结果（量化）称为该局势对策的益损值。
管理运筹学
3
§1 对策论的基本概念
出赛的次序是一个策略 “齐王赛马”齐王在各局势中的益损值表（单位：千金）
管理运筹学
4
§1 对策论的基本概念
其中：齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }，田忌的策略集：S2={ 1, 2, 3, 4, 5, 6 }。
A=[aij]m×n i 行代表甲方策略 i=1, 2, …, m；j 列代表乙方策略 j=1, 2, …, n；aij 代表甲方取策略 i，乙方取策略 j，这一局势下甲方的益损值。此时乙方的益损值为 -aij（零和性质）。

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法，主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统，不考虑时间变化和过程发展，只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境，如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述对策模型对策论的基本概念对策分析方法对策论的应用实例对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论，也称为博弈论，是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡，通过数学模型和逻辑推理来描述和分析竞争行为，尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择，例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下，企业间可能通过对策论的方法找到合作的可能性，例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面，对策论可以帮助理解个体和团队的行为反应，优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中，参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划，它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中，参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中，如果一个参与者的某个策略能够使其获得比其他参与者更好的结果，则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

运筹学第9章对策论

3. 赢得函数(支付函数)(payoff function)
一个对策中，每一个局中人所出策略形成的策略组称为一个局势。即设 s i 是第 i 个局中人的一个策略，则n个局中人的策略形成的策略组 s ( s1 , s2 ,, sn )
s 就是一个局势。
在“齐王VS田忌赛马”中，
齐王有6个策略： 2 ( 上，下，中)、 1 (上，中，下)、 4 (中，下，上)、 5 ( 下，上，中)、
1 2
设局中人I采用纯策略 1和 2的概率分别为 x1 和 x2 ，x1 x2 1, x1,2 0 设局中人II采用纯策略 1和 2的概率分别为 y1 和 y2 ，y1 y2 1, y1,2 0
SI 1 , 2 设局中人I的策略集原来为：那么在没找到纯策略的前提下，局中人I的策略集变为：局中人I的策略 SI X ( x1, x2 )T x1 x2 1, x12 0 有无穷多个 S II 1 , 2 设局中人I的策略集原来为：那么在没找到纯策略的前提下，局中人II的策略集变为：
当一个局势 s 出现后，每一局中人就会面对
一个赢得值或损失值，记作 Hi (s)。
Hi (s) 是定义在局势上的函数，
所以称为局中人 i 的赢得函数。
通常的分类方式有： (1) 根据局中人的个数，分为二人对策和多人对策； (2) 根据各局中人的赢得函数的代数和是否为零，分为零和对策与非零和对策； (3) 根据各局中人间是否允许合作，分为合作对策和非合作对策； (4) 根据局中人的策略集中的策略个数，分为有限对策和无限对策等等。
max VG X 1 E ( X 1 , 1 ) E ( X 1 , 2 ) X 2 E ( X 2 , 1 ) E ( X 2 , 2 ) 5 x1 8 x2 VG E s . t . X 3 E ( X 3 , 1 ) E ( X 3 , 2 ) 9 x1 6 x2 VG x x 1 , x , x 0 1 2 1 2

《运筹学教学资料》ch14对策论

寡头垄断市场上的价格竞争案例中，存在几家大型企业，它们通过价格策略来争夺市场份额。如果企业都选择降价，将导致价格战；如果都选择维持高价，将获得更多利润。但企业往往会选择降价来争夺市场，最终导致双方受损。
THANK YOU
感谢聆听
纯策略均衡
在纳什均衡中，每个参与者都采用单一策略。如果所有参与者的纯策略组合构成纳什均衡，则称为纯策略均衡。
混合与者以一定的概率分布随机选择不同的策略，使得对手无法通过预测获得优势。在混合策略均衡中，每个参与者的预期收益达到相对稳定的状态。
混合策略纳什均衡
在经济学中，帕累托前沿表示在所有可能的资源配置中，能够使得所有
玩家的利益都得到最大化的配置集合。帕累托前沿用于衡量资源配置的
效率和公平性。
03
应用
纳什均衡和帕累托前沿是评价博弈结果和资源配置的重要工具，可以帮
助理解在竞争和合作中的最优选择和资源配置问题。
04
多人对策
合作博弈与非合作博弈
合作博弈
参与者通过合作达成协议，以最大化共同利益。合作博弈强调联盟和集体行动，通常使用夏普里值来分配收益。
运筹学教学资料
目
CONTENCT
录
• 对策论简介 • 二人有限零和对策 • 二人有限非零和对策 • 多人对策 • 对策论案例分析
01
对策论简介
对策论的定义与特点
定义
对策论，也称为博弈论，是研究决策主体在相互竞争、对抗或合作中的行为和决策的数学分支。
特点
对策论强调理性个体之间的策略互动，通过数学模型描述和预测主体之间的行为和结果，为决策者提供最优策略和解决方案。
对策论的应用领域
01
02

运筹学_对策论

第17页
混合策略
• 混合扩充
矩阵对策扩充 N人有限对策
• 混合平衡解
矩阵对策 N人有限对策
• 均衡解的存在性
第18页
混合扩充—矩阵对策
策略集
m
S * 1
{X
( x1 , x2 ,..., xm )
xi 1, xi 0, i 1,2,..., m}
i 1
nS* 2{Y( y1 ,y2 ,...,
yn )
y j 1, y j 0, j 1,2,..., n}
j 1
支付函数
mn
E( X ,Y )
aij xi y j
i1 j1
混合扩充： *
{
S1*
,
S
* 2
,
E
(
x
,
y),
x
S1* ,
y
S
* 2
}
第19页
混合扩充—N人有限对策
N 人有限对策 I {1,2,..., N }, Si , i I , H i (s), i I
• 定理1 N人有限对策的混合扩充存在平衡局势. • 定理2 矩阵对策的混合扩充存在平衡局势.
第23页
矩阵对策的解法
• 问题的简化
优超算例
• 线性规划方法
基本思想算例
第24页
优超
给定矩阵对策 {S1 , S2 , A} ， A 是 m n 的矩阵，如果
akj alj , j 1,2,..., n
则称局中人 1 的策略 k 优超于策略 l。如果
aik ail , i 1,2,..., m
则称局中人 2 的策略 k 优超于策略 l。
注：局中人 1 的策略 k 优超于策略 l 则说明对局中人 1

运筹学对策论

第六章对
策
论
第一节对策论的基本概念
第二节矩阵对策第三节矩阵对策的解法
第一节对策论的基本概念
一、简例
二、对策问题的数学模型三、对策问题的分类四、均衡的意义
一、简例
例1 战国时期，齐王与大夫田忌每年要赛马，双方约定：每方出上、中、下三个等级的马各1匹，每匹马都参赛一次，共赛3次。每次赛后，负者要付给胜者千金。当时的情况是，在各个等级的马中，齐王的马都稍强于田忌的马。每次赛马，田忌经常要输三千金。有一次，田忌的谋士孙膑出了个主意：让田忌用下等马对齐王的上等马，用中等马对齐王的下等马，用上等马对齐王的中等马。这样，比赛结果田忌一负两胜，反而赢得了一千金。由此可见，掌握准确的信息，制定正确的行动方案是制胜的关键。在现实生活中，例如乒乓球团体赛，选手的排序不同，往往导致比赛的结果不同。在各种冲突的现象中，参与者如何决策是关系重大的问题。
一、简例
例2 Von Neumann根据福尔摩斯探案中的情节，略加修改，把对策论的精神融会其中，使大侦探与巨盗的斗争，更加引人入胜。大侦探福尔摩斯严重妨碍了当时邪恶势力的头子莫里亚蒂。此人诡计多端，心黑手狠，多次扬言要对福尔摩斯下毒手。风声传到福尔摩斯耳朵里，他感到，当时自己势孤力单，“三十六计，走为上计”，决定暂时离开英国，福尔摩斯匆忙上了从伦敦到多佛尔的火车。从车窗里，他突然发现莫里亚蒂也在站台上，并且觉察到对手已发现他坐在火车里，火车正要开动，下车躲避已不可能。福尔摩斯在火车里，紧张地盘算着对策。从伦敦到多佛尔，火车只停靠一个中间站坎特伯雷，他是否要在那里下车，中途脱逃呢？另一方面，莫里亚蒂分析问题的本领毫不逊色于福尔摩斯，他当然会考虑到福尔摩斯中途是否会下车。两人各自应该采取怎样的对策才更有利于自己？这些问题都是对策论所要研究的。

管理运筹学课件第13章-对策论

管理运筹学课件第13章对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论，又称博弈论，是研究决策过程中理性决策者之间冲突与合作的数学理论。
特点
对策论注重分析决策者之间的相互作用和影响，以及决策结果的均衡性和稳定性。
供应链管理
在供应链管理中，对策论可用于协调供应商、制造商、销售商之间的利益关系，优化供应链整体效益。
金融市场投资决策
对策论可用于分析金融市场中的投资决策问题，如股票交易、期货交易等，帮助投资者制定最优的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择，帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中，对策论可用于分析不同武器系统的性能优
劣和作战效能，为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力，为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择，提出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者的策略，直到达到某个均衡条件为止。
数值解法
利用数值计算的方法求解连续对策的均衡解，如有限差分法、有限元法等。
解析法
在某些特殊情况下，可以通过解析的方法求解连续对策的均衡解，如线性二次型微分对策等。

运筹学--对策论 PPT

当盟军获悉此情报后，盟军统帅麦克阿梭命令太平洋战区空军司令肯尼将军组织空中打击。
日本统帅山本五十六大将心里很明白：在日本舰队穿过俾斯麦海的三天航行中，不可能躲开盟军的空中打击，他要策划的是尽可能减少损失。
日美双方的指挥官及参谋人员都进行了冷静的思考与全面的谋划。
自然条件对于双方都是已知的。基本情况如下：从蜡包尔出发开往莱城的海上航线有南北两条。通过时间均为3天。
案例中，肯尼将军与山本五十六大将的赢得（支付）函数都可以用矩阵A、B表示。
（盟军）北线南线
（日军）北线南线
（日军）
北线
南线
22 =A1源自3（盟军）北线
南线
-2
-2 =B
-1
-3
在本例中的每一个对局，双方的赢得的代数之和为零，这样的对策称为“有限零和二人对策”
设两个局中人为I，II，局中人I有 m 个策略：1、 2… m ；用S1表示这些策略的集合：
max min aij
i
j
同样，局中人II可以保证局中人I的赢得不超过
min max aij
j
i
案例中局中人I（盟军）应当选择（北线）策略1，这样能保证赢得2。局中人II（日军）应当选择（北线）策略1 使盟军赢得不超过2。实际上，在（ 1， 1）局势下，有
max min aij= min max aij
局势3：盟军的侦察机重点搜索南线，而日本舰队走北线。由于发现晚、盟军的轰炸机群在南线，以及北线气候恶劣，故有效轰炸只有一天。
局势4：盟军的侦察机重点搜索南线，日本舰队也恰好走南线。此时日本舰队迅速被发现，盟军的轰炸机群所需航程很短，加上天气晴好，有效轰炸时间三天。

运筹学-对策论

3.矩阵对策的混合策略
例：设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路：对甲（乙）给出一个选取不同策略的概率分布，以使甲（乙）在各种情况下的平均赢得（损失）最多（最少）。 -----即混合策略
重要定理
定理任一矩阵对策G {S1,S2;A}，任一矩阵对策G＝{S1,S2;A}，一定存在混合策略意义下的解。合策略意义下的解。 • 定理设有两个矩阵对策 • G1＝ G2＝ G1＝{S1,S2;A1} G2＝{S1,S2;A2} • 其中A1＝(aij)，A2＝(aij+L)，L为任一常数。 A1＝其中A1 (aij)，A2＝(aij+L)，为任一常数。则 • (1)G1 G2同解 G1与同解； (1)G1与G2同解； • (2)VG2 VG2＝ (2)VG2＝VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的，即矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人阶的， A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解，则很容易求解；如果此对策有纯策略意义下的解，则很容易求解；如果没有纯策略意义下的解，纯策略意义下的解，则为求出各局中人的最优混合策略可求解下列方程组：列方程组： • a11x1＋a21x2＝ a11y1＋a12y2＝ a11x1＋a21x2＝v a11y1＋a12y2＝v • a12x1＋a22x2＝ a21y1＋a22y2＝ a12x1＋a22x2＝v a21y1＋a22y2＝v • y1＋y2＝ x1＋x2＝ y1＋y2＝1 x1＋x2＝1 • 当没有纯策略意义下的解时，方程组一定有严格非负解 x*= 当没有纯策略意义下的解时， x1* x2* y*=（y1*，y2*），（x1*，x2*）和y*=（y1*，y2*），即为各局中人的最优混合策略。

运筹学对策论全解

赢 A
B
石头
剪子
布
石头 0 1 -1
剪子 -1 0 1
布
1 -1
0
分析：无确定最优解，可用“混合策略”求解。
4.齐王赛马
战国时期，齐国国王有一天提出要与大将军田忌赛马。田忌答应后，双方约定： 1)每人从上中下三个等级中各出一匹马，共出三匹； 2) 一共比赛三次，每一次比赛各出一匹马； 3) 每匹被选中的马都得参加比赛，而且只能参加一次； 4) 每次比赛后输者要付给胜者一千金。
例：囚犯困境中，每个囚犯均有2个策略：
{坦白，抵赖}
（3）局势
坦白抵赖
坦白抵赖 -9，-9 0，-10 -10，0 -1，-1
当每个局中人从各自策略集合中选择一策略而组成的策略组成为一个局势，用 (si , d j )来表示。
（4）赢得（支付）
局中人采用某局势时的收益值。
例:当局中人甲选择策略si ，局中人乙选策略 dj 时，局中人甲的赢得值可用 R甲（si , d j )表示。
九十年代以来博弈理论在金融、管理和经济领域中得到广泛应用
• 九十年代以来对策理论在金融、管理和经济领域中得到广泛应用
• 博弈论和诺贝尔经济奖
1994：非合作博弈：纳什(Nash)、泽尔腾（Selten）、海萨尼（Harsanyi） 1996：不对称信息激励理论：莫里斯（Mirrlees）和维克瑞（Vickrey） 2001：不完全信息市场博弈：阿克罗夫（Akerlof）（商品市场）、斯潘塞（Spence）（教育市场）、斯蒂格里兹（Stiglitze）（保险市场） 2005: 授予罗伯特·奥曼与托马斯·谢林，以表彰他们通过博弈理论的分析增强世人对合作与冲突的理解。 2007年，授予赫维茨（Leonid Hurwicz）、马斯金(Eric S. Maskin）以及迈尔森(Roger B. Myerson）。三者的研究为机制设计理论奠定了基础。 2012年，授予罗斯（Alvin E. Roth）与沙普利（Lloyd S. Shapley）。他们创建“稳定分配”的理论，并进行“市场设计”的实践。

运筹学-第六讲对策论

对策G常写成： G={S1，…，Sn；h1，…hn}
【定义】在对策G={S1，S2…，Sn；h1，h2…hn}中，假如由各个对策方旳各选用一种策略构成旳某个策略组合(S1*，S2*…，Sn*)中，任一对策方i 旳策略 Si*，都是对其他策略方策略旳组合 (S1*，…，S*i-1，S*i+1…，Sn*)旳最佳策略，即h i(S1*, … , S*i-1, Si*, S*i+1,…Sn*)≥hi(S1*, …, S*i-1, Sij, S*i+1 , …, Sn*)对任意 Sij∈Si 都成立，则称(S1*，…，Sn*)为G旳一种纯策略意义下旳“纳什均衡”(Nash Equilibrium)．
(2,0)
(4,0)
反应函数法
对策论 game theory
【例4】考虑上述模型旳另一种情况即各厂商所选择旳是价格而不是产量，假设产量与价格旳函数关系为：
q1 ( p2 ) a1 b1 p1 d1 p2
q2 ( p1 ) a2 b2 p2 d 2 p1
其他条件不变，边际成本为C1、C2，试求解其纳什均衡。
P2
R2 ( p1 )
1 2b2
(a2
b2 c2
d 2 p1 )
p1*
p2*
1 2b1 1 2b2
(a1b1c1ຫໍສະໝຸດ d1p* 2
)
(a2 b2c2 d 2 p1* )
P1*
d1 4b1b2 d1d 2
(a2
b2c2 )
2b2 4b1b2 d1d 2
(a1
b1c1 )
P2*
d2 4b1b2 d1d 2
Nash对对策论旳贡献有： (i) 合作对策中旳讨价还价模型，称为Nash讨价还价解； (ii) 非合作对策旳均衡分析。

运筹学—对策论(一)

3﹒赢得函数
局势: 在一局对策中，各局中人所选定的策略形成的策略组称为一个局势。即若设si是第i个局中人的一个策略，则n个局中人的策略组s={s1， s2，…， sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔乘积表示，即S=S1× S2×… × Sn
赢得函数：当局势出现后，对策的结果也就确定了。也就是说，对任一局势s∈S，局中人i可以得到一个赢得Hi(s)。
对
二人
动策无
态
限
对策
微分对策等
多人
重点
零和
学习
的对
非零和策。
零和
非零和零和
非零和
零和
非零和
§2矩阵对策的基本定理一﹑矩阵对策的数学模型
1﹒二人有限零和对策：是指有两个参加对策的局中人，每个局中人都只有有限个策略可供选择，在任一局势下，两个局中人的赢得之和总等于零。
2﹒矩阵对策：就是二人有限零和对策。 3﹒矩阵对策模型
总之，局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ，β 2。
5﹒矩阵对策的解定义1 设G={S1 ， S2；A}为矩阵对策，其中
S1={α1,α2, …,αm}，S2={ β 1, β 2, …, β n} ， A=（aij）m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立，记VG= ai*j* 。则称VG为对策G的值，称上述等式成立的纯局势（ α i* , β j* ）为G在纯策略下的解（或平衡局势）， α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
由于假定对策为零和，所以局中人Ⅱ的赢得矩阵

运筹学-10、对策论

第五章
对策论
第一节引言
一、对策行为与对策论
对策论又称博弈论，是运筹学的一个重要分支。对策论所研究的主要对象是带有斗争或竞争性质的现象。由于对策论研究的对象与政治、军事、工业、农业、交通、运输等领域有密切关系，处理问题的方法又有着明显的特色，所以越来越受到人们的重视。
1
在日常生活中，我们经常看到一些相互之间的竞争、比赛性质的现象，如下棋、打扑克、体育竞赛等。
所以：min max aij
j i
max min aij (1)
i j
i
j
另一方面，对任意i，j均有：
min aij aij max aij j i max min aij max aij
i j i
j j
max min aij min max aij (2)
i
所以： max min aij
7
例1:设有矩阵对策，局中人Ⅱ的支付矩阵如下：
7 3 A 16 3
1 8 2 4 1 9 0 5
解： α3 → β3 → α4 → β1 → α 3
如果各局中人都不想冒险，必须考虑对方会选择策略使他得到最差的收入。因此各局中人都选择理智的决策行为。
对策的值为VG＝ 5。
17
二、矩阵对策的混合策略
矩阵对策G有鞍点时，就存在最优解(最优纯策略)，但是否一切矩阵对策问题中，各局中人都有上述意义的最优纯策略呢?答案是否定的。
1 1 0 A 1 0 1 例1：石头、剪刀、布 1 1 0
max min aij 1 min max aij 1
i j j i
不存在上述纯策略意义下的解。

管理运筹学11对策论

A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
局中人甲应选择2 ，此时不管局中人乙采取什么策略，甲的
赢得均不小于3。
2024/3/29
2. 矩阵对策解的问题
设矩阵对策G={S1，S2，A}，其中：
S1 ={1，2，3，4}， S2 = {1 ，2 ， 3}
Min
-4 2 -6 -6
对策矩阵G={S1，S2，A}在混合策略意义下有解的充分必要条件是存在着
x * S1* ， y * S2*使（x *，y *）为E (x,y) 的一个鞍点，即对于一切x S1* ， y S2* 有
E (x,y *) E (x *,y *) E (x *,y)
2024/3/29
3. 矩阵对策的混合策略
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
Max
8 36
Min 3
局中人甲应选择2 ，乙应采取2策略；结果甲赢得3，乙付
出3。
2024/3/29
2. 矩阵对策解的问题
定义1：设矩阵对策G={S1，S2，A}，其中：
S1 ={1，2，…，m}， S2 = {1 ，2 ， …， n}
6 5 7 5 5 0 1 -1 2 -1
Max 7 5 9 5
Min = 5
i = 1, 3 ，j = 2, 4，ai*j* = 5，四个局势均为矩阵对策的解。
2024/3/29
3. 矩阵对策的混合策略
对矩阵对策G={S1，S2，A}来说，局中人甲有把握的最小赢得是：
v1 = max min aij
x S1* y S2*

运筹学--对策论

定理14-1：矩阵对策 G = S1，S2；A
在纯策略意义下有解的充分必要条件是：
存在一个局势（ *i*， *j *），使得对一切 i=1，2，… m， j=1， 2…n 均有
aij*<=ai*j*<= ai*j
定理14-1表明矩阵对策
G = S1，S2；A
有解的充分必要条件是在A中存在元
素 ai*j*是其所在行中最小的同时又是其所在列中最大的。这时ai*j*即是对策值，因此ai*j*也称为“鞍
I
j
ji
该最优策略为（3， 3），即秋季购煤20 吨。
练习：“二指莫拉问题”，甲乙两人游戏，每人出一个或两个手指头，同时又把猜测对方所出的手指数叫出来，若只有一个人猜测正确，则他所赢得数为二人所出手指之和，否则，重新开始。写出该对策各局中人的策略集合及甲的赢得矩阵，并回答局中人是否存在某种出法比其他出法更为有利。
S2= 1 , 2 , 3 ,4
min
6 5 6 5 5* max
A= 1 4 2 -1 -1
8 5 7 5 5* max
0 2 620
max 8 5* 7 5*
min
min
显然 ai2 a12 a1j ai2 a32 a3j 对 i=1,2,3,4 j=1,2,3,4 都成立： a12 = a32 =5由定理5-1，对策值=5，对策的解( 1 , 2 ）,（ 3 , 2 ）,（ 1 , 4 ）,（ 3 , 4 ）
（阴，能见度差）（晴，能见度好）
2天
2天
1天
3天
这场海空遭遇与对抗一定会发生，双方的统帅如何决策呢？历史的实际情况是：局势1成为现实。肯尼将军命令盟军的侦察机重点搜索北线；而山本五十六大将命令日本舰队取道北线航行。由于气候恶劣，能见度差，盟军飞机在一天后发现了日本舰队，基地在南线的盟军轰炸机群远程航行，实施了两天的有效轰炸，重创了日本舰队，但未能全歼。

运筹学-第六讲对策论

S S1 S2 Sn
引言
对策论 game theory
对策的结构和分类

按对策方式非合合作作对对策策有完限全理理性性
对策分类按对策人数二人对策二二人人非零零和和对对策策

多人对策
按对策状态动静态态对对策策不完不完完全完全全信全信信息信息息动息静动态静态态对态对对策对策策策
Nash对对策论的贡献有： (i) 合作对策中的讨价还价模型，称为Nash讨价还价解； (ii) 非合作对策的均衡分析。
(6) 目前，博弈论在定价、招投标、谈判、拍卖、委托—代理以及很多的经营决策中得到应用，它已成为现代经济学的重要基础。现代对策论总体上是一门新兴的发展中的学科。
对策论 game theory
数服从(0-1)分布．
【定义】如果一个策略G={S1, …, Sn; h1, … , hn}中，参予者i 的策略集为
Si={Si1, … , Sik}，如果由各个对策方的策略组成策略集合G*={S1*, S2*, …, Sn*}，
其中
Si*

xi

E mi
| xi
0,i 1,2,, mi ,
纳什均衡
Nash Equilibrium
对于对策中的每一个局中人，真正成功的措施应该是针对于其他局中人所采取的每次行动，相应地采取有利于自己地反应策略，于是每一个局中人应采取的必定是他对其他局中人策略的预测的最佳反应。
纳什均衡
对策论 game theory
纳什均衡定义
用G 表示一个对策，若一个对策中有 n 个局中人，则每个局中人可选策略的集合称为策略集，分别用 S1，S2，…，Sn 表示；Sij 表示局中人i 的第 j 个策略，其中 j 可取有限个值(有限策略对策)，也可取无限个值(无限策略对策)；对策方 i 的得益则用 hi 表示；hi 是各对策方策略的多元函数，n个局中人的

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

当盟军获悉此情报后，盟军统帅麦克阿梭命令太平洋战区空军司令肯尼将军组织空中打击。
日本统帅山本五十六大将心里很明白：在日本舰队穿过俾斯麦海的三天航行中，不可能躲开盟军的空中打击，他要策划的是尽可能减少损失。
日美双方的指挥官及参谋人员都进行了冷静的思考与全面的谋划。
自然条件对于双方都是已知的。基本情况如下：从蜡包尔出发开往莱城的海上航线有南北两条。通过时间均为3天。
S2= 1 , 2 , 3 ,4
min
6 5 6 5 5* max
A= 1 4 2 -1 -1
8 5 7 5 5* max
0 2 620
max 8 5* 7 5*
min
min
显然 ai2 a12 a1j ai2 a32 a3j 对 i=1,2,3,4 j=1,2,3,4 都成立： a12 = a32 =5由定理5-1，对策值=5，对策的解( 1 , 2 ）,（ 3 , 2 ）,（ 1 , 4 ）,（ 3 , 4 ）
案例中，肯尼将军与山本五十六大将的赢得（支付）函数都可以用矩阵A、B表示。
（盟军）北线南线
（日军）北线南线
（日军）
北线
南线
2
2 =A
1
3
（盟军）
北线
南线
-2
-2 =B
-1
-3
在本例中的每一个对局，双方的赢得的代数之和为零，这样的对策称为“有限零和二人对策”
设两个局中人为I，II，局中人I有 m 个策略：1、 2… m ；用S1表示这些策略的集合：
I
j
ji
该最优策略为（3， 3），即秋季购煤20 吨。
练习：“二指莫拉问题”，甲乙两人游戏，每人出一个或两个手指头，同时又把猜测对方所出的手指数叫出来，若只有一个人猜测正确，则他所赢得数为二人所出手指之和，否则，重新开始。写出该对策各局中人的策略集合及甲的赢得矩阵，并回答局中人是否存在某种出法比其他出法更为有利。
max min aij
i
j
同样，局中人II可以保证局中人I的赢得不超过
min max aij
j
i
案例中局中人I（盟军）应当选择（北线）策略1，这样能保证赢得2。局中人II（日军）应当选择（北线）策略1 使盟军赢得不超过2。实际上，在（ 1， 1）局势下，有
max min aij= min max aij
气象预报表明：未来3天中，北线阴雨，能见度差；而南线天气晴好，能见度好。
肯尼将军的轰炸机布置在南线的机场，侦察机全天
候进行侦察，但有一定的搜索半径。
经测算，双方均可得到如下估计：
局势1：盟军的侦察机重点搜索北线，日本舰队也恰好走北线。由于气候恶劣，能见度差，盟军只能实施两天的轰炸。
局势2：盟军的侦察机重点搜索北线，日本舰队走南线。由于发现晚，尽管盟军的轰炸机群在南线，但有效轰炸也只有两天。
A
28
解：(i, j) 表示自己出 i个手指，猜测对方出 j个手指。
练习：“二指莫拉问题”，甲乙两人游戏，每人出一个或两个手指头，同时又把猜测对方所出的手指数叫出来，若只有一个人猜测正确，则他所赢得数为二人所出手指之和，否则，重新开始。写出该对策各局中人的策略集合及甲的赢得矩阵，并回答局中人是否存在某种出法比其他出法更为有利。
i
j
j
i
上式蕴涵的思想是朴素自然的，可以概括为：“从最坏处着想，去争取最好的结果”
定义14-1：对给定的矩阵对策
G = S1，S2；A 若等式
max min aij= min max aij
i
j
j
i
成立，则称这个公共值为对策G的值，记为VG，而达到的局势（ i， j ）称为对策G在纯策略意义下的解，记为（ i*， j *）而i*和 j *分别称为局中人I和局中人II的最优纯策略。
对策的三要素：
局中人：有权决定自己行为方案的对局参加者称为局中人。案例中，美日双方的决策者为局中人。当对局中局中人只有两人时，称为二人对策。
策略：对局中一个实际可行的方案称为一个策略。案例中，美日双方各有二个策略。
赢得矩阵（支付）：当每个局中人在确定了所采取的策略后，他们就会获得相应的收益或损失，此收益或损失的值称为赢得（支付）。赢得与策略之间的对应关系称为赢得（支付）函数。
北线 1 南线2
（盟军）北线 1 2
2 =A
南线2 1
3
在矩阵中，盟军的最大赢得是3，而要得到3，必须选择策略 2，而日军的目的是使盟军的赢得尽量的小，必须选择策略1 ，使盟军的赢得只有1。
在局中人I设法使自己的赢得尽可能大的同时，局中人II也设法使局中人I的赢得尽可能小。
所以局中人I应首先考虑用所能赢得的最小，然后在这些最小赢得中选择最大。局中人I可以保证赢得
ij
ji
j
已知 E（ i， Y*） V E（X*， j ）
所以
E ( x ,y * )E (i,y * x i ) E ( x * y * ,x ) i E ( x * y * , )
i
i
E ( x * y ) , E ( x *j) , y j E ( x * y * ,y ) j E ( x * y * , )
第十四章对策论
对策论概论
对策论（The Game Theory)也称竞赛论或博
弈论，是研究具有竞争、对抗、利益分配等方面的数量化方法，并提供寻求最优策略的途径。
20世纪40年代形成并发展。1944年以来，对策论在投资分析、价格制定、费用分摊、财政转移支付、投标与拍卖、对抗与追踪、国际冲突、双边贸易谈判、劳资关系以及动物行为进化等领域得到广泛应用。
解：
局中人I（采购员）有三个策略：
策略1: 10吨,策略2: 15吨,策略3 :20吨。局中人II（环境）：
策略1 较暖 ,策略2 正常，策略3较冷现把该单位冬天取暖用煤全部费
用（秋季购煤费用与冬天不够时再补购煤费用）作为采购员的赢得矩阵。
1(10) 2 (15) 3 (20)
1较暖
2正常
E ( x ,j) E ( x ,j ) ( x 1 , ,x m ) a i) ( j 0 , ( , 1 , 0 ) T a ix i j
i
则 E ( x ,y ) a ix j iy j ( a iy jj) x iE (i,y ) x i
ij
ij
i
E ( x ,y ) a ix j iy j( a ix j i) y jE ( x ,j)
14-1矩阵对策的基本概念
案例：俾斯麦海的海空对抗
1943年2月，第二次世界大战中的日本，在太平洋战区已经处于劣势。为扭转局势，日本统帅山本五十六大将统率下的一支舰队策划了一次军事行动：由集结地——南太平洋的新不列颠群岛的蜡包尔出发，穿过俾斯麦海，开往新几内亚的莱城，支援困守在那里的日军。
S1= 1、 2…… m
同样，局中人II有n个策略：1、 2。。。 n ；用S2表示这些策略的集合： S2= 1、 2… n 局中人I的赢得矩阵是：
a11 a12 …… a1n a21 a22 …… a2n A= …… …… …… a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对策记为G： G= S1，S2；A
在混合策略意义下有解的充分必要条件是：
存在混合局势（ X*，Y*），使得对一切 X S1* Y S2*均有 E（X，Y*） E（X*，Y*） E（X*，Y）
定理14-3：对给定的矩阵对策
G = S1，S2；A 设X* S1* Y* S2*则混合局势（ X*，Y*）是G的解且 V=VG*的充分必要条件是：对一切 i,j均有
j
j
故
E (x ,y * E )(x * y * , E )(x * y ),
定理3把无限个不等式的证明转化为对有限个（mn)个不等式
的证明问题。
定理14-1：矩阵对策 G = S1，S2；A
在纯策略意义下有解的充分必要条件是：
存在一个局势（ *i*， *j *），使得对一切 i=1，2，… m， j=1， 2…n 均有
aij*<=ai*j*<= ai*j
定理14-1表明矩阵对策
G = S1，S2；A
有解的充分必要条件是在A中存在元
素 ai*j*是其所在行中最小的同时又是其所在列中最大的。这时ai*j*即是对策值，因此ai*j*也称为“鞍
0 2 3 0
赢得矩阵为 A 2 0 3 0
0
3
0 4
0
3
4
0
A
29
14.2 矩阵对策的混合策略
定义:对给定的矩阵对策
G = Ⅰ，Ⅱ；S1,S2;A
其中 S1= 1, 2…m
S2= 1 , 2… n
A=(aij)mn
把纯策略集合对应的概率向量
X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
例14-4：某单位采购员在秋天时要决定
冬天取暖用煤的采购量。已知在正常气温条件下需要用煤15吨，在较暖和较冷气温条件下需要用煤10吨和20吨。假定冬季的煤价随着天气寒冷的程度而变化，
在较暖、正常、较冷气温条件下每吨煤价为100元、150元、200元。又秋季每吨煤价为100元。在没有关于当年冬季气温情况下，秋季应购多少吨煤，能使总支出最少？
分别称为局中人I和局中人II的混合策略。
如果局中人I选取的策略为
X=(x1, x2 … xm) 局中人II选取的策略为
Y=(y1 , y2 … yn )，则期望值 E（X，Y）= xi aij yj=XAYT 称为局中人I期望赢得，而局势（X，Y）称为“混合局势”，局中人I，II的混合策略集合记为S1*， S2*。

运筹学--对策论

运筹学-第15章--对策论

《管理运筹学-对策论》

运筹学第9章 对策论

《运筹学教学资料》ch14对策论

运筹学_对策论

运筹学对策论

管理运筹学课件第13章-对策论

运筹学--对策论 PPT

运筹学-对策论

运筹学对策论全解

运筹学-第六讲对策论

运筹学—对策论(一)

运筹学-10、对策论

管理运筹学11对策论

运筹学--对策论

运筹学-第六讲对策论

运筹学第9章对策论