管理运筹学课件第13章对策论

合集下载

《管理运筹学-对策论》

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

运筹学_对策论

运筹学_对策论
第17页
混合策略
• 混合扩充
矩阵对策扩充 N人有限对策
• 混合平衡解
矩阵对策 N人有限对策
• 均衡解的存在性
第18页
混 合 扩 充—矩阵对策
策略集
m
S * 1
{X
( x1 , x2 ,..., xm )
xi 1, xi 0, i 1,2,..., m}
i 1
nS* 2{Y( y1 ,y2 ,...,
yn )
y j 1, y j 0, j 1,2,..., n}
j 1
支付函数
mn
E( X ,Y )
aij xi y j
i1 j1
混合扩充: *
{
S1*
,
S
* 2
,
E
(
x
,
y),
x
S1* ,
y
S
* 2
}
第19页
混 合 扩 充—N人有限对策
N 人有限对策 I {1,2,..., N }, Si , i I , H i (s), i I
• 定理1 N人有限对策的混合扩充存在平衡局势. • 定理2 矩阵对策的混合扩充存在平衡局势.
第23页
矩阵对策的解法
• 问题的简化
优超 算例
• 线性规划方法
基本思想 算例
第24页
优超
给定矩阵对策 {S1 , S2 , A} , A 是 m n 的矩阵,如果
akj alj , j 1,2,..., n
则称局中人 1 的策略 k 优超于策略 l。如果
aik ail , i 1,2,..., m
则称局中人 2 的策略 k 优超于策略 l。
注:局中人 1 的策略 k 优超于策略 l 则说明对局中人 1

管理运筹学课件第13章-对策论

管理运筹学课件第13章-对策论
管理运筹学课件第13章对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。

管理运筹学ppt课件

管理运筹学ppt课件

最小生成树问题
要点一
总结词
最小生成树问题是网络优化中的另一类重要问题,旨在寻 找一个子图,该子图包含图中所有节点且边的总权重最小 。
要点二
详细描述
最小生成树问题是网络优化中的另一类重要问题。在一个 加权图中,我们希望找到一个子图,该子图包含图中所有 节点且边的总权重最小。这个子图被称为最小生成树。 Kruskal算法和Prim算法是最著名的最小生成树问题的求 解方法。这些算法可以帮助我们在加权图中找到一个最小 生成树,从而在实际应用中实现最小成本的网络设计或路 由选择。
决策变量
整数规划的决策变量是整数类型的变量,用于表 示决策结果。
ABCD
约束条件
整数规划的约束条件可以是等式或不等式,例如 资源限制、时间限制等。
整数约束
整数规划的约束条件要求决策变量取整数值,以 确保问题的可行解是整数解。
整数规划的求解方法
枚举法
枚举法是一种暴力求解方法,通 过列举所有可能的决策变量组合 来找到最优解。
约束条件
非线性规划的约束条件可以是等式或不等式, 限制决策变量的取值范围。
决策变量
非线性规划的决策变量可以是连续的或离散的,根据问题的具体情况而定。
非线性规划的求解方法
梯度法
通过计算目标函数的梯度,逐步逼近最优解。
牛顿法
利用目标函数的二阶导数信息,迭代逼近最优解。
拟牛顿法
通过构造一个近似于目标函数的二次函数,迭代 逼近最优解。
07 决策分析
决策分析的基本概念
决策分析
指在面临多种可能的选择时,基于一 定的目标,通过分析、比较和评估,
选择最优方案的过程。
决策要素
包括决策者、决策对象、决策信息、 决策目标、决策方案和决策评价。

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件
局中人称为“i旳对手”,记为-i。
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1

1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}

运筹学--对策论

运筹学--对策论

max min E(X,Y)= min max E(X,Y)
X S1* Y S2*
Y S2* X S1*
则称这个公共值为对策G在混合意义 下的值,记为V*G,而达到V*G 的混 合局势(X*,Y*)称为对策G在混合 策略意义下的解,而X*和Y*分别称 为局中人I,II的最优混合策略。
定理14-2:矩阵对策 G = S1,S2;A
0 2 3 0
赢得矩阵为 A 2 0 3 0
0
3
0 4
0
3
4
0
14.2 矩阵对策的混合策略
定义:对给定的矩阵对策
G = Ⅰ,Ⅱ;S1,S2;A
其中 S1= 1, 2…m
S2= 1 , 2… n
A=(aij)mn
把纯策略集合对应的概率向量
X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
分别称为局中人I和局中人II的混合策略。
如果局中人I选取的策略为
X=(x1, x2 … xm) 局中人II选取的策略为
Y=(y1 , y2 … yn ),则期望值 E(X,Y)= xi aij yj=XAYT 称为局中人I期望赢得,而局势(X,Y) 称为“混合局势”,局中人I,II的混合 策略集合记为S1*, S2*。
S1= 1、 2…… m
同样,局中人II有n个策略:1、 2。。。 n ;用S2表示这些策略的集合: S2= 1、 2… n 局中人I的赢得矩阵是:
a11 a12 …… a1n a21 a22 …… a2n A= …… …… …… a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对策记为G: G= S1,S2;A

运筹学—对策论(一)

运筹学—对策论(一)

3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。

二人
动 策无


对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵

运筹学教程对策论

运筹学教程对策论
局中人2 局中人1 1(正) 2(反) 1(正) 1 -1 2(反) -1 1
Games) §2.矩阵对策(Matrix Games) 2.矩阵对策( 矩阵对策
剪刀、 例2:“石头 、剪刀、布”游戏
局中人2 局中人2 局中人1 局中人1 1(石头) ) 2(剪刀) 剪刀) 3 (布) 0 -1 1 1 0 -1 -1 1 0 1(石头) ) 2(剪刀) 剪刀) 3 (布)
0=0
3.最优纯策略
齐王赛马:
-1<3
3.最优纯策略
定义:一个矩阵对策,如果它的支付矩阵A的元素满足: 定义:一个矩阵对策,如果它的支付矩阵A的元素满足:
则称这个值v为对策的值。如果纯局势(i*,j*)使: 则称这个值v为对策的值。
则称( 为对策G的鞍点( point),也称它是对策G 则称(i*,j*)为对策G的鞍点(Saddle point),也称它是对策G在 纯策略中的解, 分别为局中人1和局中人2的最优解。 纯策略中的解,i*与j*分别为局中人1和局中人2的最优解。
故对策的解为(3,3),即秋季贮煤20吨合理。(决策论中的悲观准则)
3.最优纯策略
例6:甲、乙双方谈判签订一项合同,甲方的“要价”是25万元,而乙方的“ 出价”是20万元,谈判陷于僵局。为打破僵局,双方约定,再各报一个价。以 下述价格成交:谁让步多,取谁出的价;如果双方让步相同,则取双方报价的 中间值。问甲、乙双方应如何报价?最后的成交价是多少? 解 显然,甲、乙双方的报价都在20万元到25万元之间。不妨取整数值,甲 、乙各有6个策略:报价20,21,…,25(单位:万元)。由约定知,甲的支付矩 阵可用表所示。
•局中人: •策略: 自始至终的行动方案; 把局中人的策略全体,称做这个局中人的策略集合; 例如,在齐王与田忌赛马的例子中,如果—开始就要把各人的三匹马排好 次序,然后依次出赛。各局中人都有六个策略:(1)(上、中、下),(2) ( 上、下、中)(3)(中、上、下)(4)(中、下、上),( 5 ) ( 下 、 中 、 上 ) , (6) (下、上、中)。这个策略全体就是局中人的策略集合。 有限,无限

管理运筹学(第四版)PPT全套课件

管理运筹学(第四版)PPT全套课件
我国古代有很多关于运筹学思想方法的典故。
➢ 齐王赛马
➢ 丁渭修皇宫
➢ 沈括运军粮
第一章
绪论
运筹学的产生和发展
运筹学作为一门新兴的学科是在第二次世界大战期
间才出现的。
第一章
绪论
运筹学的产生和发展
英美成立了“运作研究”(Operation Research)
小组,解决了许多复杂的战略和战术问题。
➢ 有效保护从美国到英国的商船补给运输线;
2
2
B
无限制
1
3
总资源需求
(A+B)需求≥350吨
时间限制(小时)
600
试问在满足生产需要的前提下,在公司加工能力的范围
内,如何购买 A,B 两种原料,使得购进成本最低?
§2
图解法
建立模型:
目标函数:min = 21 + 32
约束条件:1 + 2 ≥350
1 ≥ 125
2x1 + 2 ≤ 600
集团CRHG
惠普
戴尔Dell
效果
收入2-4%年增长率,增加1600
万美元
商业转型中的决策分析
2002-2012年电子商务业务翻3番
价值链渠道转型
系统解决方案和服务占收入1/3和
利润的50%
§3
运筹学在工商管理中的应用
组织
配对捐赠联盟
美国能源局
应用
优化匹配
拯救了220个生命
水力发电量优化
根据风电和太阳能电源数量调整
0
1
50
100
250kg
目标函数:max z = 50 + 100
约束条件: + ≤ 300

第15章 对策论 (管理运筹学 第三版 课件 共17章 韩伯棠)40页PPT

第15章  对策论 (管理运筹学 第三版 课件  共17章 韩伯棠)40页PPT
解:局中人I为采购员,局中人II为大自然,采购员有三个策 略,买10吨、15吨、20吨。分别记为1,2,3。大自然也有三个 策略:暖、正常、冷,分别记为1,2,3。
管理运筹学
9
§2 矩阵对策的最优纯策略
赢得矩阵如下:
1
2
3
1(10吨) -100
-175
-300
2(15吨) -150
-150
-250
即 max min aij min max aij 。
ij
ji
一个自然的想法:对甲(乙)给出一个选取不同策略的概率分 布,以使甲(乙)在各种情况下的平均赢得(损失)最多(最少) -----即混合策略。
管理运筹学
12
§3 矩阵对策的混合策略
求解混合策略的问题有图解法、迭代法、线性方程法和线性规 划法等,我们这里只介绍线性规划法,其他方法略。
7
§2 矩阵对策的最优纯策略
矩阵A中每行的最小元素分别为1,-3,-1。
在这些最少赢得中最好的结果是1,故甲队会采取策略1,无论对手 采取何策略,甲队至少得1分。对于乙队,{1,2,3}可能带来的最少 赢得,即A中每列的最大元素,分别为3,1,3。乙队会采取2策略,确保 甲队不会超过1分。
1和2分别称为局中人甲队、乙队的最优策略。由于双方必然选择这 一种策略,所以,这种策略又称为最优纯策略。
支付给局中人甲以数量为此和数的报酬;如果两人所写数字之和为奇数,
则局中人甲付给局中人乙以数量为此和数的报酬。试求出其最优策略。
解:首先计算局中人甲的赢得矩阵如下表:
甲的赢 得
乙的策略 1(出1) 2(出2)
甲的策略
3(出3)
1(出1)
2
-3

管理运筹学课件第13章 对策论

管理运筹学课件第13章 对策论

2020/1/23
课件
6
13.1.2 对策问题的分类
局中人之
间是否允 许合作?
策略选择
是否与时 间有关?
合作对策 对 策 论
非合作对策
静态对策 动态对策
二人对策 多人对策
2020/1/23
局中人多 寡?
课件
零和对策 常和对策 变和对策
赢得值代 数和是否 为0?
7
13.1.2 对策问题的分类
本章主要内容
13.1 对策论的基本概念 13.1.1 对策模型的基本要素 13.1.2 对策问题的分类 13.2 矩阵对策的纯策略 13.2.1优超原则 13.2.2最大最小原则 13.3 矩阵对策的混合策略 13.3.1 混合策略的概念 13.3.2 图解法 13.3.3 线性规划法 13.4 纳什均衡 13.4.1 纯策略纳什均衡的划线法 13.4.2 混合策略纳什均衡的LP方法 13.4 应用举例 案例13-1 市场竞争策略 案例13-2 对抗赛项目确定 本章小结
课件
13
13.3.1 混合策略的概念
设甲出正面(α1)的概率x,出反面(α2)的概率1-x;乙猜正面(β1)的概率y,猜反 面(β2)的概率1-y。则乙两个策略的期望值分别为:
E 1 1 x ( 1 )(1 x) 2 x 1 E 2 ( 1 ) x 1 (1 x ) 1 2 x
局中人采用不同策略对策时,各方总是有得或有失,统称赢得(payoff)或
得益。
1
2
3
4
5
6
(上中下) (上下中) (中上下) (中下上) (下上中) (下中上)
(1 上中下) (2 上下中) (3 中上下) (4 中下上) (5 下上中) (6 下中上)

运筹学教 程对策论共49页PPT

运筹学教 程对策论共49页PPT
运筹学教 程对策论
11、不为五斗米折腰。 12、芳菊开林耀,青松冠岩列。怀此 贞秀姿 ,卓为 霜下杰 。
13、归去来兮,田蜀将芜胡不归。 14、酒能祛百虑,菊为制颓龄。 15、春蚕收长丝,秋熟靡王税。
Hale Waihona Puke 41、学问是异常珍贵的东西,从任何源泉吸 收都不可耻。——阿卜·日·法拉兹
42、只有在人群中间,才能认识自 己。——德国
43、重复别人所说的话,只需要教育; 而要挑战别人所说的话,则需要头脑。—— 玛丽·佩蒂博恩·普尔
44、卓越的人一大优点是:在不利与艰 难的遭遇里百折不饶。——贝多芬
45、自己的饭量自己知道。——苏联
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 :v2 3x5(1x)52x
203.0:2v.23021 11x2(1x) 9x2
步骤:
(1)绘制x数轴,标出x取值范围[0,1]
(2)x取0和1,确定三条直线端点,绘制三 条甲赢得值直线
(3)由于乙是理智的,甲的赢得值只能是 最小的(粗线所示)
(4)甲只能在最小中取最大,对应的策略 为 X * ( 3 , 8 ) ,最优对策值为V*=49/11
同 理 可 定 义 局 中 人 乙 的 混 合 策 略 与 混 合 策 略 集 .
当甲采取混合策略x,乙采取混合策略y,则称(x,y)为一个混合局势.
G*S1*,S2*,E 表示一个混合策略矩阵对策及G的一个混合扩充.
20.02.2021
课件
17
13.3.2 图解法
图解法求解矩阵对策,一般
适用于赢得矩阵为 或 的对
20.02.2021
课件
6
13.1.1 对策模型的基本要素
1.局中人
局中人(players)是指参与竞争的各方,每方必须有独立的决策能力和承 担风险的能力。(如:田忌、齐王)
2.策略集
在对策问题中,局中人为了应对其他局中人的行动而采取的方案和手段 称为该局中人的一个策略(strategy)。
3.赢得及赢得函数
5
2
4
5
2
4
m
ax
2
max 6 3 4 2
最 优 纯 策 略 (3,4)
20.02.2021
min2
课件
13
13.3.1 混合策略的概念
【例13.5】 猜硬币游戏:甲、乙两个儿童玩猜硬币游戏, 甲手中拿着一枚硬币,把硬币盖在桌子上,让儿童乙猜是 正面向上还是反面向上。如若猜对甲给乙1元钱,猜错乙给 甲1元钱。
设甲出正面(α1)的概率x,出反面(α2)的概率1-x;乙猜正面(β1)的概率y,猜反 面(β2)的概率1-y。则乙两个策略的期望值分别为:
E 1 1 x ( 1 )(1 x) 2 x 1 E 2 ( 1 ) x 1 (1 x ) 1 2 x
令 E1 E2,可 得 x0.5
(1) 当x<0.5时,E1 E2,理性的儿童乙会选择猜反面;
max 5 1 4
min1
20.02.2021
课件
12
13.2.2 最大最小原则
1
A 1
a11
m am1
max
n min
a1n
max
ars
amn
如果ars ahk,则该值所对 应的策略为最优纯策略
min ahk
【例13.4】
m in
2 3 4 4 4
A
6
4
2
4 3 3
2 3 2
m
则 m 维 概 率 向 量 x ( x 1 ,. . . ,x m ) T , x i 1 ,x i 0 称 为 甲 的 一 个 混 合 策 略 i 1
则 m 维 称 S 1 * x ( x 1 ,...,x m ) T |i m 1 x i 1 ,x i 0 称 为 甲 的 混 合 策 略 集
混合扩充:设有矩阵对策 GS1,S2,A混合扩充 G*S1*,S2*,E
S
* 2
y1
S
* 1
S2
1
S1
yn 甲 各 方 案 最 n 小 期 望 赢 得
n
甲至少期望赢得
x 1 1 a11
A
x m m am1
a1n
amn
m i n a 1 j y j
m
j1
n
i n a m j y j
管理运筹学课件第13章对策论
单击此处添加副标题内容
第13章 对策论
教学目标与要求
【教学目标】 1. 理解下列基本概念: 矩阵对策,矩阵对策三要素,最优纯策略与最优混合策略,鞍点和对策值 2. 算法要求: (1) 会用“超优原则”和“最大最小”原则求矩阵对策的最优纯策略 (2) 会用“线性规划”方法求矩阵对策的最优混合策略 (3) 了解纯策略和混合策略的纳什均衡求取。 【知识结构】
课件 V
j
y
j

0
i 1, 2, j 1, 2,
,m ,n
20
13.3.3 线性规划法
同理,甲采取策略组合 x1,…,xm 时,也是从利己主 义出发的,会使自己的期望 赢得最大(也即乙的损失最 大)
y1
yn
x1 a11
A
xm a m1
m
max ai1xi
i1
a1n
a mn
m
ainxi
1 1 6
A1 3 5
4 1
0 4 2 1 3
第1列优超于 第5列,第4列 优超于第2列
1
1 6
A2
3
5
3 5 1 .5
4 1 3
4
4
4
第1行优于 2、3行
0
A3 1
2 3 4 5
4 5 4 6.5
5 1.5 4
9
3 3 0 8
1
2
3
6 4 5
20.02.2021
最优纯策略(α1,β2)
20.02.2021
课件
10
13.2.1超优原则
1.对 r , s 若恒有arj asj 则称 r 超优于 s 2.对 h , k 若恒有aih aik 则称 h 超优于 k
【例13.2】
第3行优超
6
1
A5
1
4 2 5 3
5 0 1.5 3
4 3 4 0
6 .5
7
9
8
于第2行, 第1行优超 于第5行
0
y* 1 y
由于甲是理智的,故乙取最大损
2 3 11
A 7 5
2
失(粗线)
乙会在最大损失中找出最小,即 乙最优混合策略为:
可知,当甲使用α1,α2,时,乙的损失
2值0.02为.202:1
课件
Y * (0, 9 , 2 ) 11 11 19
13.3.3 线性规划法
y1
x1 a11
A
xm a m1
局中人采用不同策略对策时,各方总是有得或有失,统称赢得(payoff)或
得益。
1
2
3
4
5
6
(1 上中下) (2 上下中) (3 中上下) (4 中下上) (5 下上中) (6 下中上)
(上中下) 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
(上下中) 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1
yn
m in
甲至少期望赢得
n
a1n a 1 j y j
a mn
j 1 n
a
mjy
j
max
min
X S1*
Y
S
* 2
m i 1
n
aij xi y j
j 1
V
j 1
乙采取策略组合y1,…,yn时,是从利己主义出发的,会使自己的期望损失最 小(也即甲的赢得最小)
甲会使用某种策略组合x1,…,xm,使得在最小赢得的概率组合尽可能地大.
基本概念:三要素,分类

二人零和纯策略:超优原则、maxmin 和 minmax 原则


二人零和混合策略:图解法(2 行或 2 列收益矩阵)
LP 方法(一般情况)
20.02.2021
纳什均衡(非零和):纯策略(划线法) 混合策略(LP 方法)
课件
3
20.02.2021
课件
4
20.02.2021
(中上下) 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
(中下上) 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
(下上中) -1,1 1,-1 1,-1 1,-1 3,-3 1,-1
(下中上) 1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
20.02.2021
课件
5
本章主要内容
13.1 对策论的基本概念 13.1.1 对策模型的基本要素 13.1.2 对策问题的分类 13.2 矩阵对策的纯策略 13.2.1优超原则 13.2.2最大最小原则 13.3 矩阵对策的混合策略 13.3.1 混合策略的概念 13.3.2 图解法 13.3.3 线性规划法 13.4 纳什均衡 13.4.1 纯策略纳什均衡的划线法 13.4.2 混合策略纳什均衡的LP方法 13.4 应用举例 案例13-1 市场竞争策略 案例13-2 对抗赛项目确定 本章小结
11 11
11
7 β1
5 β2
β3
3
2
2
课0 件
x*
1 x 18
13.3.2 图解法
从图还可以看出局中人乙的最 优混合策略为β2β3的组合.
11
1:v33y11(1y)118y 2:v45y2(1y)23y
y分别取0和1,绘制图形如下:
7 β1 5 β2
11 α1
β3
3
5
2
2
α2
3
0
x*
2 1x
故β1的概率为0.设β2,β3的概率为 y,(1-y).由效率矩阵:
猜硬币游戏属于矩阵对策,儿童甲的策略有出正面向上(α1)
和出反面向上(α2),儿童乙的策略有猜正面向上(β1)和猜反
面向上(β2)。
m in
1
A
1
1 1
1
1
m ax
1
max 1 1
m in 1
m jinm a ixaij m jinm a ixaij
相关文档
最新文档