运筹学--对策论

合集下载

运筹学-第15章--对策论

运筹学-第15章--对策论

1 8 5 8 5 5*
2 2 3 2 1 1
3 4
9 0
5 2
6 3
5 5*
3
0
max 9 5* 8 5*
可知 ai* j* =5,i*=1,3,j*=2,4.故(α1,β2)(α1,β4)(α2,
β2)(α2,β4)为对策的纳管 什理均运衡,筹 V学G=5.
15
• 最优纯策略求解步骤:
• 1、行中取小,小中取大得最大化最小收益 值;
• 2、列中取大,大中取小得最小化最大支付 值;
• 3、比较两值是否相等。若相等便存在最优 纯策略。若不等,则不存在最优纯策略。
管理运筹学
16
§3 矩阵对策的混合策略
设矩阵对策 G = { S1, S2, A }。当
max
i
min
j
aij
min
j
max
i
aij
时,不存在最优纯策略。
例:设一个赢得矩阵如下:
一个局势,一个局势决定了各局中人的对策结果(量化) 称为该局势对策的益损值。
管理运筹学
3
§1 对策论的基本概念
出赛的次序是一个策略 “齐王赛马”齐王在各局势中的益损值表(单位:千金)
管理运筹学
4
§1 对策论的基本概念
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。
A=[aij]m×n i 行代表甲方策略 i=1, 2, …, m;j 列代表乙方策略 j=1, 2, …, n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下甲方的 益损值。此时乙方的益损值为 -aij(零和性质)。

《管理运筹学-对策论》

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

运筹学第9章 对策论

运筹学第9章 对策论

3. 赢得函数(支付函数)(payoff function)
一个对策中,每一个局中人所出策略形成的策略 组称为一个局势。 即设 s i 是第 i 个局中人的一个策略, 则n个局中人的策略形成的策略组 s ( s1 , s2 ,, sn )
s 就是一个局势。
在“齐王VS田忌赛马”中,
齐王有6个策略: 2 ( 上,下,中)、 1 (上,中,下)、 4 (中,下,上)、 5 ( 下,上,中)、
1 2
设局中人I采用纯策略 1和 2的概率 分别为 x1 和 x2 ,x1 x2 1, x1,2 0 设局中人II采用纯策略 1和 2的概率 分别为 y1 和 y2 ,y1 y2 1, y1,2 0
SI 1 , 2 设局中人I的策略集原来为: 那么在没找到纯策略的前提下,局中人I的策略集变为: 局中人I的策略 SI X ( x1, x2 )T x1 x2 1, x12 0 有无穷多个 S II 1 , 2 设局中人I的策略集原来为: 那么在没找到纯策略的前提下,局中人II的策略集变为:
当一个局势 s 出现后,每一局中人就会面对
一个赢得值或损失值,记作 Hi (s)。
Hi (s) 是定义在局势上的函数,
所以称为局中人 i 的赢得函数。
通常的分类方式有: (1) 根据局中人的个数,分为二人对策和多人对策; (2) 根据各局中人的赢得函数的代数和是否为零,分 为零和对策与非零和对策; (3) 根据各局中人间是否允许合作,分为合作对策和 非合作对策; (4) 根据局中人的策略集中的策略个数,分为有限对 策和无限对策等等。
max VG X 1 E ( X 1 , 1 ) E ( X 1 , 2 ) X 2 E ( X 2 , 1 ) E ( X 2 , 2 ) 5 x1 8 x2 VG E s . t . X 3 E ( X 3 , 1 ) E ( X 3 , 2 ) 9 x1 6 x2 VG x x 1 , x , x 0 1 2 1 2

《运筹学教学资料》ch14对策论

《运筹学教学资料》ch14对策论

寡头垄断市场上的价格竞争案例中,存在几 家大型企业,它们通过价格策略来争夺市场 份额。如果企业都选择降价,将导致价格战; 如果都选择维持高价,将获得更多利润。但 企业往往会选择降价来争夺市场,最终导致 双方受损。
THANK YOU
感谢聆听
纯策略均衡
在纳什均衡中,每个参与者都采用单 一策略。如果所有参与者的纯策略组 合构成纳什均衡,则称为纯策略均衡。
混合与者以一定的概率分布随机选择不同的策略,使得对手无法通过预测获 得优势。在混合策略均衡中,每个参与者的预期收益达到相对稳定的状态。
混合策略纳什均衡
在经济学中,帕累托前沿表示在所有可能的资源配置中,能够使得所有
玩家的利益都得到最大化的配置集合。帕累托前沿用于衡量资源配置的
效率和公平性。
03
应用
纳什均衡和帕累托前沿是评价博弈结果和资源配置的重要工具,可以帮
助理解在竞争和合作中的最优选择和资源配置问题。
04
多人对策
合作博弈与非合作博弈
合作博弈
参与者通过合作达成协议,以最 大化共同利益。合作博弈强调联 盟和集体行动,通常使用夏普里 值来分配收益。
运筹学教学资料

CONTENCT

• 对策论简介 • 二人有限零和对策 • 二人有限非零和对策 • 多人对策 • 对策论案例分析
01
对策论简介
对策论的定义与特点
定义
对策论,也称为博弈论,是研究决策主体在相互竞争、对抗或合 作中的行为和决策的数学分支。
特点
对策论强调理性个体之间的策略互动,通过数学模型描述和预测 主体之间的行为和结果,为决策者提供最优策略和解决方案。
对策论的应用领域
01
02

运筹学_对策论

运筹学_对策论
第17页
混合策略
• 混合扩充
矩阵对策扩充 N人有限对策
• 混合平衡解
矩阵对策 N人有限对策
• 均衡解的存在性
第18页
混 合 扩 充—矩阵对策
策略集
m
S * 1
{X
( x1 , x2 ,..., xm )
xi 1, xi 0, i 1,2,..., m}
i 1
nS* 2{Y( y1 ,y2 ,...,
yn )
y j 1, y j 0, j 1,2,..., n}
j 1
支付函数
mn
E( X ,Y )
aij xi y j
i1 j1
混合扩充: *
{
S1*
,
S
* 2
,
E
(
x
,
y),
x
S1* ,
y
S
* 2
}
第19页
混 合 扩 充—N人有限对策
N 人有限对策 I {1,2,..., N }, Si , i I , H i (s), i I
• 定理1 N人有限对策的混合扩充存在平衡局势. • 定理2 矩阵对策的混合扩充存在平衡局势.
第23页
矩阵对策的解法
• 问题的简化
优超 算例
• 线性规划方法
基本思想 算例
第24页
优超
给定矩阵对策 {S1 , S2 , A} , A 是 m n 的矩阵,如果
akj alj , j 1,2,..., n
则称局中人 1 的策略 k 优超于策略 l。如果
aik ail , i 1,2,..., m
则称局中人 2 的策略 k 优超于策略 l。
注:局中人 1 的策略 k 优超于策略 l 则说明对局中人 1

运筹学-第六讲对策论

运筹学-第六讲对策论
S S1 S2 Sn
引言
对策论 game theory
对策的结构和分类

按对策方式非 合合 作作 对对 策策有 完限 全理 理性 性
对策分类按对策人数二人对策二 二人 人非 零零 和和 对对 策策

多人对策
按对策状态动 静态 态对 对策 策不 完 不 完完 全 完 全全 信 全 信信 息 信 息息 动 息 静动 态 静 态态 对 态 对对 策 对 策策 策
Nash对对策论的贡献有: (i) 合作对策中的讨价还价模型,称为Nash讨价还价解; (ii) 非合作对策的均衡分析。
(6) 目前,博弈论在定价、招投标、谈判、拍卖、委托—代理以及很多的经营 决策中得到应用,它已成为现代经济学的重要基础。现代对策论总体上是一门 新兴的发展中的学科。
对策论 game theory
数服从(0-1)分布.
【定义】 如果一个策略G={S1, …, Sn; h1, … , hn}中,参予者i 的策略集为
Si={Si1, … , Sik},如果由各个对策方的策略组成策略集合G*={S1*, S2*, …, Sn*},
其中
Si*

xi

E mi
| xi
0,i 1,2,, mi ,
纳什均衡
Nash Equilibrium
对于对策中的每一个局中人,真正成功的措施应该是针对于其他局中 人所采取的每次行动,相应地采取有利于自己地反应策略,于是每一 个局中人应采取的必定是他对其他局中人策略的预测的最佳反应。
纳什均衡
对策论 game theory
纳什均衡定义
用G 表示一个对策,若一个对策中有 n 个局中人,则每个局中人可选策略的 集合称为策略集,分别用 S1,S2,…,Sn 表示;Sij 表示局中人i 的第 j 个策 略,其中 j 可取有限个值(有限策略对策),也可取无限个值(无限策略对策); 对策方 i 的得益则用 hi 表示;hi 是各对策方策略的多元函数,n个局中人的

运筹学对策论

运筹学对策论
第六章 对


第一节 对策论的基本概念
第二节 矩阵对策 第三节 矩阵对策的解法
第一节 对策论的基本概念
一、简例
二、对策问题的数学模型 三、对策问题的分类 四、均衡的意义
一、简例
例1 战国时期,齐王与大夫田忌每年要赛马,双方约定:每方出上、中、 下三个等级的马各1匹,每匹马都参赛一次,共赛3次。每次赛后,负者要 付给胜者千金。当时的情况是,在各个等级的马中,齐王的马都稍强于田 忌的马。每次赛马,田忌经常要输三千金。有一次,田忌的谋士孙膑出了 个主意:让田忌用下等马对齐王的上等马,用中等马对齐王的下等马,用 上等马对齐王的中等马。这样,比赛结果田忌一负两胜,反而赢得了一千 金。由此可见,掌握准确的信息,制定正确的行动方案是制胜的关键。在 现实生活中,例如乒乓球团体赛,选手的排序不同,往往导致比赛的结果 不同。在各种冲突的现象中,参与者如何决策是关系重大的问题。
一、简例
例2 Von Neumann根据福尔摩斯探案中的情节,略加修改,把对策论的精 神融会其中,使大侦探与巨盗的斗争,更加引人入胜。大侦探福尔摩斯严 重妨碍了当时邪恶势力的头子莫里亚蒂。此人诡计多端,心黑手狠,多次 扬言要对福尔摩斯下毒手。风声传到福尔摩斯耳朵里,他感到,当时自己 势孤力单,“三十六计,走为上计”,决定暂时离开英国,福尔摩斯匆忙 上了从伦敦到多佛尔的火车。从车窗里,他突然发现莫里亚蒂也在站台上, 并且觉察到对手已发现他坐在火车里,火车正要开动,下车躲避已不可能。 福尔摩斯在火车里,紧张地盘算着对策。从伦敦到多佛尔,火车只停靠一 个中间站坎特伯雷,他是否要在那里下车,中途脱逃呢?另一方面,莫里 亚蒂分析问题的本领毫不逊色于福尔摩斯,他当然会考虑到福尔摩斯中途 是否会下车。两人各自应该采取怎样的对策才更有利于自己?这些问题都 是对策论所要研究的。

管理运筹学课件第13章-对策论

管理运筹学课件第13章-对策论
管理运筹学课件第13章对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。

运筹学-对策论

运筹学-对策论

3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路:对甲(乙)给出一个选取不同策 略的概率分布,以使甲(乙)在各种情 况下的平均赢得(损失)最多(最少)。 -----即混合策略
重要定理
定理 任一矩阵对策G {S1,S2;A}, 任一矩阵对策G={S1,S2;A},一定存在混 合策略意义下的解。 合策略意义下的解。 • 定理 设有两个矩阵对策 • G1= G2= G1={S1,S2;A1} G2={S1,S2;A2} • 其中A1=(aij),A2=(aij+L),L为任一常数。 A1= 其中A1 (aij),A2=(aij+L), 为任一常数。 则 • (1)G1 G2同解 G1与 同解; (1)G1与G2同解; • (2)VG2 VG2= (2)VG2=VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的,即 矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人 阶的, A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解,则很容易求解; 如果此对策有纯策略意义下的解,则很容易求解;如果没有 纯策略意义下的解, 纯策略意义下的解,则为求出各局中人的最优混合策略可求解下 列方程组: 列方程组: • a11x1+a21x2= a11y1+a12y2= a11x1+a21x2=v a11y1+a12y2=v • a12x1+a22x2= a21y1+a22y2= a12x1+a22x2=v a21y1+a22y2=v • y1+y2= x1+x2= y1+y2=1 x1+x2=1 • 当没有纯策略意义下的解时,方程组一定有严格非负解 x*= 当没有纯策略意义下的解时, x1* x2* y*=(y1*,y2*), (x1*,x2*)和y*=(y1*,y2*), 即为各局中人的最优混合策 略。

运筹学对策论全解

运筹学对策论全解

赢 A
B
石头
剪子

石头 0 1 -1
剪子 -1 0 1

1 -1
0
分析:无确定最优解,可用“混合策略”求解。
4.齐王赛马
战国时期,齐国国王有一天提出要与大将军田忌赛马。 田忌答应后,双方约定: 1)每人从上中下三个等级中各出一匹马,共出三匹; 2) 一共比赛三次,每一次比赛各出一匹马; 3) 每匹被选中的马都得参加比赛,而且只能参加一次; 4) 每次比赛后输者要付给胜者一千金。
例:囚犯困境中,每个囚犯均有2个策略:
{坦白,抵赖}
(3)局势
坦白 抵赖
坦白 抵赖 -9,-9 0,-10 -10,0 -1,-1
当每个局中人从各自策略集合中选择一策略而组 成的策略组成为一个局势,用 (si , d j )来表示。
(4)赢得(支付)
局中人采用某局势时的收益值。
例:当局中人甲选择策略si ,局中人乙选策略 dj 时,局中人甲的赢得值可用 R甲(si , d j )表示。
九十年代以来博弈理论在金融、管理和经济领域中 得到广泛应用
• 九十年代以来对策理论在金融、管理和经济领域 中得到广泛应用
• 博弈论和诺贝尔经济奖
1994:非合作博弈:纳什(Nash)、泽尔腾(Selten) 、海萨尼 (Harsanyi) 1996:不对称信息激励理论:莫里斯(Mirrlees)和维克瑞(Vickrey) 2001:不完全信息市场博弈:阿克罗夫(Akerlof)(商品市场)、斯潘 塞(Spence)(教育市场)、斯蒂格里兹(Stiglitze)(保险市场) 2005: 授予罗伯特·奥曼与托马斯·谢林,以表彰他们通过博弈理论的分析 增强世人对合作与冲突的理解。 2007年,授予赫维茨(Leonid Hurwicz)、马斯金(Eric S. Maskin)以及 迈尔森(Roger B. Myerson)。三者的研究为机制设计理论奠定了基础。 2012年,授予罗斯(Alvin E. Roth)与沙普利(Lloyd S. Shapley)。他 们创建“稳定分配”的理论,并进行“市场设计”的实践。

运筹学--对策论

运筹学--对策论

max min E(X,Y)= min max E(X,Y)
X S1* Y S2*
Y S2* X S1*
则称这个公共值为对策G在混合意义 下的值,记为V*G,而达到V*G 的混 合局势(X*,Y*)称为对策G在混合 策略意义下的解,而X*和Y*分别称 为局中人I,II的最优混合策略。
定理14-2:矩阵对策 G = S1,S2;A
0 2 3 0
赢得矩阵为 A 2 0 3 0
0
3
0 4
0
3
4
0
14.2 矩阵对策的混合策略
定义:对给定的矩阵对策
G = Ⅰ,Ⅱ;S1,S2;A
其中 S1= 1, 2…m
S2= 1 , 2… n
A=(aij)mn
把纯策略集合对应的概率向量
X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
分别称为局中人I和局中人II的混合策略。
如果局中人I选取的策略为
X=(x1, x2 … xm) 局中人II选取的策略为
Y=(y1 , y2 … yn ),则期望值 E(X,Y)= xi aij yj=XAYT 称为局中人I期望赢得,而局势(X,Y) 称为“混合局势”,局中人I,II的混合 策略集合记为S1*, S2*。
S1= 1、 2…… m
同样,局中人II有n个策略:1、 2。。。 n ;用S2表示这些策略的集合: S2= 1、 2… n 局中人I的赢得矩阵是:
a11 a12 …… a1n a21 a22 …… a2n A= …… …… …… a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对策记为G: G= S1,S2;A

运筹学-第六讲对策论

运筹学-第六讲对策论
对策G常写成: G={S1,…,Sn;h1,…hn}
【定义 】 在对策G={S1,S2…,Sn;h1,h2…hn}中,假如由各个对策方旳各 选用一种策略构成旳某个策略组合(S1*,S2*…,Sn*)中,任一对策方i 旳策略 Si*,都是对其他策略方策略旳组合 (S1*,…,S*i-1,S*i+1…,Sn*)旳最佳策略, 即h i(S1*, … , S*i-1, Si*, S*i+1,…Sn*)≥hi(S1*, …, S*i-1, Sij, S*i+1 , …, Sn*)对任意 Sij∈Si 都成立,则称(S1*,…,Sn*)为G旳一种纯策略意义下旳“纳什均 衡”(Nash Equilibrium).
(2,0)
(4,0)
反应函数法
对策论 game theory
【例4】 考虑上述模型旳另一种情况即各厂商所选择旳是价格而不是产量,假 设产量与价格旳函数关系为:
q1 ( p2 ) a1 b1 p1 d1 p2
q2 ( p1 ) a2 b2 p2 d 2 p1
其他条件不变,边际成本为C1、C2,试求解其纳什均衡。
P2
R2 ( p1 )
1 2b2
(a2
b2 c2
d 2 p1 )
p1*
p2*
1 2b1 1 2b2
(a1b1c1ຫໍສະໝຸດ d1p* 2
)
(a2 b2c2 d 2 p1* )
P1*
d1 4b1b2 d1d 2
(a2
b2c2 )
2b2 4b1b2 d1d 2
(a1
b1c1 )
P2*
d2 4b1b2 d1d 2
Nash对对策论旳贡献有: (i) 合作对策中旳讨价还价模型,称为Nash讨价还价解; (ii) 非合作对策旳均衡分析。

运筹学—对策论(一)

运筹学—对策论(一)

3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。

二人
动 策无


对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵

运筹学-10、对策论

运筹学-10、对策论
第五章
对策论
第一节 引言
一、对策行为与对策论
对策论又称博弈论,是运筹学的一个重要分 支。对策论所研究的主要对象是带有斗争或竞争性 质的现象。由于对策论研究的对象与政治、军事、 工业、农业、交通、运输等领域有密切关系,处理 问题的方法又有着明显的特色,所以越来越受到人 们的重视。
1
在日常生活中,我们经常看到一些相互之间的 竞争、比赛性质的现象,如下棋、打扑克、体育竞 赛等。
所以:min max aij
j i
max min aij (1)
i j
i
j
另一方面,对任意i,j均有:
min aij aij max aij j i max min aij max aij
i j i
j j
max min aij min max aij (2)
i
所以: max min aij
7
例1:设有矩阵对策,局中人Ⅱ的支付矩阵如下:
7 3 A 16 3
1 8 2 4 1 9 0 5
解: α3 → β3 → α4 → β1 → α 3
如果各局中人都不想冒险,必须考虑对方会 选择策略使他得到最差的收入。因此各局中人都 选择理智的决策行为。
对策的值为VG= 5。
17
二、矩阵对策的混合策略
矩阵对策G有鞍点时,就存在最优解(最优纯策 略),但是否一切矩阵对策问题中,各局中人都有 上述意义的最优纯策略呢?答案是否定的。
1 1 0 A 1 0 1 例1:石头、剪刀、布 1 1 0
max min aij 1 min max aij 1
i j j i
不存在上述纯策略意义下的解。

管理运筹学11对策论

管理运筹学11对策论

A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
局中人甲应选择2 ,此时不管局中人乙采取什么策略,甲的
赢得均不小于3。
2024/3/29
2. 矩阵对策解的问题
设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,3,4}, S2 = {1 ,2 , 3}
Min
-4 2 -6 -6
对策矩阵G={S1,S2,A}在混合策略意义下有 解的充分必要条件是存在着
x * S1* , y * S2*使(x *,y *) 为E (x,y) 的 一个鞍点,即对于一切x S1* , y S2* 有
E (x,y *) E (x *,y *) E (x *,y)
2024/3/29
3. 矩阵对策的混合策略
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
Max
8 36
Min 3
局中人甲应选择2 ,乙应采取2策略;结果甲赢得3,乙付
出3。
2024/3/29
2. 矩阵对策解的问题
定义1:设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,…,m}, S2 = {1 ,2 , …, n}
6 5 7 5 5 0 1 -1 2 -1
Max 7 5 9 5
Min = 5
i = 1, 3 ,j = 2, 4,ai*j* = 5,四个局势均为矩 阵对策的解。
2024/3/29
3. 矩阵对策的混合策略
对矩阵对策G={S1,S2,A}来说,局中人甲 有把握的最小赢得是:
v1 = max min aij
x S1* y S2*

运筹学:chap12_对策论 (简)

运筹学:chap12_对策论 (简)

上策与上策均衡
上策:无论其它局中人如何选择都使自己利益 极大化的策略。
上策均衡:对策的各局中人都有一个上策,各 自选择自己的上策就达到了均衡状态。
囚犯困境
两个嫌疑犯涉嫌一大案被警官拘留,并被分别进行审讯。 根据法律,如果两人均认罪,则每人将各判刑7年;如 果两人均不认罪,根据已掌握的证据,则每人将各判刑 1年;如果只有一人认罪,则认罪者将被宽大释放,不 认罪者则将判刑9年。
S S1 S2 Sn
赢得函数(支付函数)
对于任意一个局势s,应该为每一个局中人i规定一个赢得值
Hi (s) ,称为局中人i的赢得函数。
个人的赢得函数不仅依赖于自己的选择,而且依赖于他 人的选择;
个体的最优选择是他人选择的函数。
对策现象举例---田忌赛马
战国时期,齐王提出要与田忌赛马,双方约定: 1. 从各自的上、中、下三个等级的马中各选一匹
囚犯A
认罪 不认罪
囚犯B
认罪 -7,-7 -9,0
不认罪 0,-9 -1,-1
囚犯困境决策树
认罪 认罪
0,-9
认罪
-9,0
不认罪
-1,-1
囚犯困境引发的思考
➢经济学的经典理论:个体利益的极大化必 然导致整体利益的提高,个体理性与整体理 性是一致的。
➢囚犯困境的上策均衡:个体的最优选择带 来了总体最不利的结局,个体理性与整体理 性发生了冲突。
i
j
aij
min j
max i
aij
,存在最优纯策略。

max i
min j
aij
min j
max i
aij,情况会怎样?
矩阵对策的混合策略示例
3 6 A 5 4
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

min
ai2 a32 a3j
对 i=1,2,3,4 j=1,2,3,4 都成立: a12 = a32 =5由定理5-1,对策 值=5,对策的解( 1 , 2 ),( 3 , 2 ),( 1 , 4 ),( 3 , 4 )
例14-4:某单位采购员在秋天时要决定
冬天取暖用煤的采购量。已知在正常气 温条件下需要用煤15吨,在较暖和较冷 气温条件下需要用煤10吨和20吨。假定 冬季的煤价随着天气寒冷的程度而变化, 在较暖、正常、较冷气温条件下每吨煤 价为100元、150元、200元。又秋季每吨 煤价为100元。在没有关于当年冬季气温 情况下,秋季应购多少吨煤,能使总支 出最少?
日军 盟军 北线 南线
北线 2天 1天
南线 2天 3天
(阴,能见度差) (晴,能见度好)
这场海空遭遇与对抗一定会发生, 双方的统帅如何决策呢?历史的实际 情况是:局势1成为现实。肯尼将军命 令盟军的侦察机重点搜索北线;而山 本五十六大将命令日本舰队取道北线 航行。由于气候恶劣,能见度差,盟 军飞机在一天后发现了日本舰队,基 地在南线的盟军轰炸机群远程航行, 实施了两天的有效轰炸,重创了日本 舰队,但未能全歼。
定义14-3:对给定的矩阵对策
G = S1,S2;A
则对策G*= S1*,S2*;E
称为对策G混合扩充。
纯策略是混合策略的一个特例。例如:局中人Ⅰ的纯策 略 k 等价于混合策略
x ( x1, x2 ,, xm )T S1 ,
*
其中,
1, i k xi 0, i k
气象预报表明:未来3天中,北线阴雨,能见度差; 而南线天气晴好,能见度好。 肯尼将军的轰炸机布置在南线的机场,侦察机全天 候进行侦察,但有一定的搜索半径。 日军 盟军 北线 南线 北线 2天 1天 南线 2天 3天
(阴,能见度差) (晴,能见度好)
经测算,双方均可得到如下估计:
局势1: 盟军的侦察机重点搜索北线,日本舰队也恰好走 北线。由于气候恶劣,能见度差,盟军只能实施两天的 轰炸。 局势2:盟军的侦察机重点搜索北线,日本舰队走南线。 由于发现晚,尽管盟军的轰炸机群在南线,但有效轰炸 也只有两天。 日军 盟军 北线 南线 北线 2天 1天 南线 2天 3天
练习:“二指莫拉问 题”,甲乙两人游戏, 每人出一个或两个手 指头,同时又把猜测 对方所出的手指数叫 出来,若只有一个人 猜测正确,则他所赢 得数为二人所出手指 之和,否则,重新开 始。写出该对策各局 中人的策略集合及甲 的赢得矩阵,并回答 局中人是否存在某种 出法比其他出法更为 有利。
0 -2 3 0
3较冷
-1750 -3000
2 (15)
3 (20)
-1500
-2000
-1500 -2500
-2000 -2000
已知在正常气温条件下需要 用煤15吨,在较暖和较冷气 温条件下需要用煤10吨和20 吨。在较暖、正常、较冷气 温条件下每吨煤价为100元、 150元、200元。又秋季每吨 煤价为100元。
素 ai*j*是其所在行中最小的同时又 是其所在列中最大的。这时ai*j*即 是对策值,因此ai*j*也称为“鞍 点”,而( *i*, *j *),为对策 的解。
Z
鞍点
Y
X
马鞍面z=f(x,y)
Z
Y
在X=0的平面上
z=f(0,y)
鞍点是z=f(0,y)
的极大值点
Z
z=f(x,0)
X
在Y=0的平面上
max min aij= min max aij = a33 = -2000
I j j i
该最优策略为(3, 3),即秋季购煤20 吨。
练习:“二指莫拉问题”,甲乙两人游戏,每人出一个或 两 个手指头,同时又把猜测对方所出的手指数叫出来,若只 有一个人猜测正确,则他所赢得数为二人所出手指之和,
第十四章 对策论
对策论概论
对策论(The Game Theory)也称竞赛论或博
弈论,是研究具有竞争、对抗、利益分配等方面
的数量化方法,并提供寻求最优策略的途径。
20世纪40年代形成并发展。1944年以来,对策
论在投资分析、价格制定、费用分摊、财政转移 支付、投标与拍卖、对抗与追踪、国际冲突、双 边贸易谈判、劳资关系以及动物行为进化等领域 得到广泛应用。
同样,局中人II有n个策略:1、 2。。。 n ;用S2表示这些策略的集合:
S2= 1、 2… n 局中人I的赢得矩阵是:
a11
a21
a12 …… a1n
a22 …… a2n
A= …… …… ……
a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对4-4:设G*= S1*,S2*;E 是对策G 混合扩充,如果有 max min E(X,Y)= min max E(X,Y)
X S1* Y S2* Y S2* X S1*
则称这个公共值为对策G在混合意义 下的值,记为V*G,而达到V*G 的混 合局势(X*,Y*)称为对策G在混合 策略意义下的解,而X*和Y*分别称 为局中人I,II的最优混合策略。
(阴,能见度差) (晴,能见度好)
所以局中人I应首先考虑用 所能赢 得的最小,然后在这些最小赢得中 选择最大。局中人I可以保证赢得
max min aij
i j
同样,局中人II可以保证局中人I的 赢得不超过 min max aij
j i
案例中局中人I(盟军)应当选择 (北线)策略1,这样能保证赢得2。局 中人II(日军)应当选择(北线)策略1 使盟军赢得不超过2。实际上,在( 1, 1)局势下,有
(阴,能见度差) (晴,能见度好)
局势3:盟军的侦察机重点搜索南线,而日本舰队走北 线。由于发现晚、盟军的轰炸机群在南线,以及北线气 候恶劣,故有效轰炸只有一天。
局势4:盟军的侦察机重点搜索南线,日本舰队也恰好 走南线。此时日本舰队迅速被发现,盟军的轰炸机群所 需航程很短,加上天气晴好,有效轰炸时间三天。
解: 局中人I(采购员)有三个策略:
策略1: 10吨,策略2: 15吨,策略3 :20吨。
局中人II(环境): 策略1 较暖 ,策略2 正常,策略3较冷 现把该单位冬天取暖用煤全部费 用(秋季购煤费用与冬天不够时再补购 煤费用)作为采购员的赢得矩阵。
1较暖
1(10) -1000
2正常
否则,重新开始。写出该对策各局中人的策略集合及甲的
赢得矩阵,并回答局中人是否存在某种出法比其他出法更 为有利。
解:(i, j ) 表示自己出 i 个手指,猜测对方出 j 个手指。
乙的策略 甲的赢得 甲的策略
(1,1) (1,2) (2,1) (2,2) (1,1) (1,2) (2,1) (2,2)
2 0 0 -3
-3 0 0 4
0 3 -4 0
0 2 赢得矩阵为 A 3 0
2 0 0 3
3 0 0 4
0 3 4 0
14.2
矩阵对策的混合策略
G = Ⅰ,Ⅱ;S1,S2;A
定义:对给定的矩阵对策
其中 S1= 1, 2…m S2= 1 , 2… n A=(aij)mn 把纯策略集合对应的概率向量 X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
(日军)
北线 南线
(盟军)北线
南线
2
1
2
3
=A
(盟军)
北线 南线
(日军)北线
南线
-2
-1
-2
-3
=B
在本例中的每一个对局,双方的 赢得的代数之和为零,这样的对 策称为“有限零和二人对策” 设两个局中人为I,II,局中人I有 m 个策略:1、 2… m ;用S1表 示这些策略的集合: S1= 1、 2…… m
14-1矩阵对策的基本概念
案例:俾斯麦海的海空对抗 1943年2月,第二次世界大战中的日本, 在太平洋战区已经处于劣势。为扭转局势,
日本统帅山本五十六大将统率下的一支舰队
策划了一次军事行动:由集结地——南太平 洋的新不列颠群岛的蜡包尔出发,穿过俾斯 麦海,开往新几内亚的莱城,支援困守在那 里的日军。
对策的三要素:
局中人:有权决定自己行为方案的对 局参加者称为局中人。案例中,美日 双方的决策者为局中人。当对局中局 中人只有两人时,称为二人对策。
策略:对局中一个实际可行的方案称 为一个策略。案例中,美日双方各有 二个策略。
赢得矩阵(支付):当每个局中人 在确定了所采取的策略后,他们就 会获得相应的收益或损失,此收益 或损失的值称为赢得(支付)。赢 得与策略之间的对应关系称为赢得 (支付)函数。 案例中,肯尼将军与山本五十六大 将的赢得(支付)函数都可以用矩 阵A、B表示。
定理14-1:矩阵对策
G = S1,S2;A
在纯策略意义下有解的充分必要条 件是: 存在一个局势( *i*, *j *),使 得对一切 i=1,2,… m, j=1, 2…n 均有
aij*<=ai*j*<= ai*j
定理14-1表明矩阵对策
G = S1,S2;A
有解的充分必要条件是在A中存在元
证明:必要性:因为纯策略是混合策略的特例,故成立
充分性:当局中人取纯策略 i 时,
E(i , y) E(i, y) (0,,1,0,0)(aij )( y1 ,, yn ) aij y j
T
当局中人取纯策略 j 时, E( x, j ) E( x, j ) ( x1 ,, xm )(aij )(0,,1,0)T aij xi
鞍点是z=f(x,0)
的极小值点
例14-3:对给定的矩阵对策 G = S1,S2;A
相关文档
最新文档