管理运筹学课件第13章对策论

合集下载

运筹学课件--对策论共105页

运筹学课件--对策论共105页
运筹学课件--对策论
21、没有人陪你走一辈子,所以你要 适应孤 独,没 有人会 帮你一 辈子, 所以你 要奋斗 一生。 22、当眼泪流尽的时候,留下的应该 是坚强 。 23、要改变命运,首先改变自己。
24、勇气很有理由被当作人类德性之 首,因 为这种 德性保 证了所 有其余 的德性 。--温 斯顿. 丘吉尔 。 25、梯子的梯阶从来不是用来搁脚的 ,它只 是让人 们的脚 放上一 段时间 ,以便 让别一 只脚能 够再往 上登。
谢谢!Βιβλιοθήκη 61、奢侈是舒适的,否则就不是奢侈 。——CocoCha nel 62、少而好学,如日出之阳;壮而好学 ,如日 中之光 ;志而 好学, 如炳烛 之光。 ——刘 向 63、三军可夺帅也,匹夫不可夺志也。 ——孔 丘 64、人生就是学校。在那里,与其说好 的教师 是幸福 ,不如 说好的 教师是 不幸。 ——海 贝尔 65、接受挑战,就可以享受胜利的喜悦 。——杰纳勒 尔·乔治·S·巴顿

《管理运筹学-对策论》

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

管理运筹学-PPT精品

管理运筹学-PPT精品

(50*60+100*250) - (50*50+100*250) = 500
, 500 / 10 = 50 元
说明在一定范围内每增加(减少)1个台时的设备能力就可增加(减少)50元利 润,称为该约束条件的对偶价格。
• 假设原料 A 增加10 千克时,即 b2变化为410,这时可行域扩大,但最优解仍为 x2 = 250 和 x1 + x2 = 300 的交点 x1 = 50,x2 = 250 。 此变化对总利润无影响,该约束条件的对偶价格为 0 。
§1问题的提出
例1. 某工厂在计划期内要安排甲、乙两种产品的生产,已知生产单位产品所需的设备台时 及A、B两种原材料的消耗以及资源的限制,如下表:
设 备 原 料A 原 料B 单 位 产 品 获 利
甲 1 2 0 50元
乙 1 1 1 100元
资 源 限 制 300台 时 400千 克 250千 克
17
第三章 线性规划问题的计算机求解(2)
• 结果考察:(演示例1) 1、当目标函数的系数 ci 单一变化时,只要不超过其上、下限,最优解不变; 2、当约束条件中右边系数 bj 变化时,当其不超过上、下限,对偶价格不变(最优
解仍是原来几个线性方程的解); 3、当有多个系数变化时,需要进一步讨论。 • 百分之一百法则:对于所有变化的目标函数决策系数(约束条件右边常数值),
线性规划的最优解如果存在,则必定有一个顶点(极点)是最优解; 有的线性规划问题存在无穷多个最优解的情况; 有的线性规划问题存在无有限最优解的情况,也称无解; 有的线性规划问题存在无可行解的情况。
作业:P24---1,2,3,4,5
14ቤተ መጻሕፍቲ ባይዱ
§3图解法的灵敏度分析

运筹学_对策论

运筹学_对策论
第17页
混合策略
• 混合扩充
矩阵对策扩充 N人有限对策
• 混合平衡解
矩阵对策 N人有限对策
• 均衡解的存在性
第18页
混 合 扩 充—矩阵对策
策略集
m
S * 1
{X
( x1 , x2 ,..., xm )
xi 1, xi 0, i 1,2,..., m}
i 1
nS* 2{Y( y1 ,y2 ,...,
yn )
y j 1, y j 0, j 1,2,..., n}
j 1
支付函数
mn
E( X ,Y )
aij xi y j
i1 j1
混合扩充: *
{
S1*
,
S
* 2
,
E
(
x
,
y),
x
S1* ,
y
S
* 2
}
第19页
混 合 扩 充—N人有限对策
N 人有限对策 I {1,2,..., N }, Si , i I , H i (s), i I
• 定理1 N人有限对策的混合扩充存在平衡局势. • 定理2 矩阵对策的混合扩充存在平衡局势.
第23页
矩阵对策的解法
• 问题的简化
优超 算例
• 线性规划方法
基本思想 算例
第24页
优超
给定矩阵对策 {S1 , S2 , A} , A 是 m n 的矩阵,如果
akj alj , j 1,2,..., n
则称局中人 1 的策略 k 优超于策略 l。如果
aik ail , i 1,2,..., m
则称局中人 2 的策略 k 优超于策略 l。
注:局中人 1 的策略 k 优超于策略 l 则说明对局中人 1

管理运筹学课件第13章-对策论

管理运筹学课件第13章-对策论
管理运筹学课件第13章对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。

运筹学中的对策论与博弈论

运筹学中的对策论与博弈论

人工智能技术为 对策论与博弈论 提供新的研究工 具和思路
机器学习算法在 对策论与博弈论 中的应用,提高 决策效率和准确 性
深度学习技术可 以模拟复杂的博 弈场景,为对策 论与博弈论提供 更真实的数据支 持
人工智能与对策 论与博弈论的结 合将推动相关领 域的发展和创新
对策论与博弈论在商业竞争中的应用研究
不完全信息静态博弈
定义:博弈参与者在完全信息条 件下进行的一次性决策,每个参 与者只能选择一种策略,并且所 有参与者同时做出选择。
示例:寡头垄断市场中的价格竞 争、囚徒困境等。
添加标题
添加标题
添加标题
添加标题
特点:参与者之间无法进行有效 的沟通或协商,只能依靠自己的 判断和决策。
应用:在经济学、政治学、社会 学等领域有广泛应用。
03
对策论的主要内容
合作博弈与非合作博弈
合作博弈:参与者通过合作达成共赢,核心概念包括联盟和核心
非合作博弈:参与者追求个体理性,核心概念包括纳什均衡和优势策略
区别:合作博弈强调合作与共赢,非合作博弈注重竞争与冲突
应用场景:合作博弈常用于国际关系、经济合作等领域,非合作博弈适用于市场竞争、决策分 析等场景
对策论与博弈论 在商业竞争中具 有重要地位,是 制定竞争策略和 决策的重要工具。
随着大数据和人 工智能技术的发 展,对策论与博 弈论在商业竞争 中的应用将更加 广泛和深入。
对策论与博弈论 可以帮助企业预 测竞争对手的行 动,制定更加有 效的竞争策略。
在商业竞争中, 运用对策论与博 弈论需要综合考 虑各种因素,包 括市场环境、竞 争对手、自身实 力等。
面临的挑战与问题:如何将对策论与博弈论更好地应用于实际场景,解决 复杂的问题,仍需进一步的研究和探索。

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件
局中人称为“i旳对手”,记为-i。
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1

1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}

运筹学—对策论(一)

运筹学—对策论(一)

3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。

二人
动 策无


对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵

运筹学教程对策论

运筹学教程对策论
局中人2 局中人1 1(正) 2(反) 1(正) 1 -1 2(反) -1 1
Games) §2.矩阵对策(Matrix Games) 2.矩阵对策( 矩阵对策
剪刀、 例2:“石头 、剪刀、布”游戏
局中人2 局中人2 局中人1 局中人1 1(石头) ) 2(剪刀) 剪刀) 3 (布) 0 -1 1 1 0 -1 -1 1 0 1(石头) ) 2(剪刀) 剪刀) 3 (布)
0=0
3.最优纯策略
齐王赛马:
-1<3
3.最优纯策略
定义:一个矩阵对策,如果它的支付矩阵A的元素满足: 定义:一个矩阵对策,如果它的支付矩阵A的元素满足:
则称这个值v为对策的值。如果纯局势(i*,j*)使: 则称这个值v为对策的值。
则称( 为对策G的鞍点( point),也称它是对策G 则称(i*,j*)为对策G的鞍点(Saddle point),也称它是对策G在 纯策略中的解, 分别为局中人1和局中人2的最优解。 纯策略中的解,i*与j*分别为局中人1和局中人2的最优解。
故对策的解为(3,3),即秋季贮煤20吨合理。(决策论中的悲观准则)
3.最优纯策略
例6:甲、乙双方谈判签订一项合同,甲方的“要价”是25万元,而乙方的“ 出价”是20万元,谈判陷于僵局。为打破僵局,双方约定,再各报一个价。以 下述价格成交:谁让步多,取谁出的价;如果双方让步相同,则取双方报价的 中间值。问甲、乙双方应如何报价?最后的成交价是多少? 解 显然,甲、乙双方的报价都在20万元到25万元之间。不妨取整数值,甲 、乙各有6个策略:报价20,21,…,25(单位:万元)。由约定知,甲的支付矩 阵可用表所示。
•局中人: •策略: 自始至终的行动方案; 把局中人的策略全体,称做这个局中人的策略集合; 例如,在齐王与田忌赛马的例子中,如果—开始就要把各人的三匹马排好 次序,然后依次出赛。各局中人都有六个策略:(1)(上、中、下),(2) ( 上、下、中)(3)(中、上、下)(4)(中、下、上),( 5 ) ( 下 、 中 、 上 ) , (6) (下、上、中)。这个策略全体就是局中人的策略集合。 有限,无限

第15章 对策论 (管理运筹学 第三版 课件 共17章 韩伯棠)40页PPT

第15章  对策论 (管理运筹学 第三版 课件  共17章 韩伯棠)40页PPT
解:局中人I为采购员,局中人II为大自然,采购员有三个策 略,买10吨、15吨、20吨。分别记为1,2,3。大自然也有三个 策略:暖、正常、冷,分别记为1,2,3。
管理运筹学
9
§2 矩阵对策的最优纯策略
赢得矩阵如下:
1
2
3
1(10吨) -100
-175
-300
2(15吨) -150
-150
-250
即 max min aij min max aij 。
ij
ji
一个自然的想法:对甲(乙)给出一个选取不同策略的概率分 布,以使甲(乙)在各种情况下的平均赢得(损失)最多(最少) -----即混合策略。
管理运筹学
12
§3 矩阵对策的混合策略
求解混合策略的问题有图解法、迭代法、线性方程法和线性规 划法等,我们这里只介绍线性规划法,其他方法略。
7
§2 矩阵对策的最优纯策略
矩阵A中每行的最小元素分别为1,-3,-1。
在这些最少赢得中最好的结果是1,故甲队会采取策略1,无论对手 采取何策略,甲队至少得1分。对于乙队,{1,2,3}可能带来的最少 赢得,即A中每列的最大元素,分别为3,1,3。乙队会采取2策略,确保 甲队不会超过1分。
1和2分别称为局中人甲队、乙队的最优策略。由于双方必然选择这 一种策略,所以,这种策略又称为最优纯策略。
支付给局中人甲以数量为此和数的报酬;如果两人所写数字之和为奇数,
则局中人甲付给局中人乙以数量为此和数的报酬。试求出其最优策略。
解:首先计算局中人甲的赢得矩阵如下表:
甲的赢 得
乙的策略 1(出1) 2(出2)
甲的策略
3(出3)
1(出1)
2
-3

运筹学教 程对策论共49页PPT

运筹学教 程对策论共49页PPT
运筹学教 程对策论
11、不为五斗米折腰。 12、芳菊开林耀,青松冠岩列。怀此 贞秀姿 ,卓为 霜下杰 。
13、归去来兮,田蜀将芜胡不归。 14、酒能祛百虑,菊为制颓龄。 15、春蚕收长丝,秋熟靡王税。
Hale Waihona Puke 41、学问是异常珍贵的东西,从任何源泉吸 收都不可耻。——阿卜·日·法拉兹
42、只有在人群中间,才能认识自 己。——德国
43、重复别人所说的话,只需要教育; 而要挑战别人所说的话,则需要头脑。—— 玛丽·佩蒂博恩·普尔
44、卓越的人一大优点是:在不利与艰 难的遭遇里百折不饶。——贝多芬
45、自己的饭量自己知道。——苏联
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

13.3.3 线性规划法
y1 L
x1 a11 L
A M
M
O
xm am1 L
yn
min
甲至少期望赢得
n
a1n a1 j y j
aM mn
j 1
M
n
amj y j
max
min
X S1* YS2*
m i 1
n
aij xi y j
j 1
V
j 1
乙采取策略组合y1,…,yn时,是从利己主义出发的,会使自己的期望损失最 小(也即甲的赢得最小)
猜硬币游戏属于矩阵对策,儿童甲的策略有出正面向上(α1)
和出反面向上(α2),儿童乙的策略有猜正面向上(β1)和猜反
面向上(β2)。
min
A
1
1
1 1 1 1 max 1
max 1{1
min1
min j
max i
aij
min j
max i
aij
2020/5/14
课件
13
13.3.1 混合策略的概念
(2) 当x>0.5时,E1 E2 ,理性的儿童乙会选择猜正面; (3) 当x=0.5时,E1 E2 0 ,儿童乙不论采取何种策略,平均赢得都是零。
x
x
x
1
1
1
0.5
0.5
0.5
0
0.5
1y
乙的策略
2020/5/14
0
0.5
1y
同理甲的策略
课件
0
0.5
1y
最优混合策略
14
13.3.1 混合策略的概念
局中人采用不同策略对策时,各方总是有得或有失,统称赢得(payoff)或
得益。
1
2
3
4
5
6
(上中下) (上下中) (中上下) (中下上) (下上中) (下中上)
(1上中下) (2上下中) (3中上下) (4中下上) (5下上中) (6下中上)
3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
2 3 11
A 7
5
2
S1 1,2 S2 1, 2 , 3
解 设甲的混合策略为x,(1x),x∈[0,1], 则 乙 分 别 使 用 β1,β2,β3时,甲赢得值:
1 : v1 2x 7(1 x) 7 5x
2 : v2 3x 5(1 x) 5 2x
: v 2020/5/14 33
2020/5/14
课件
5
13.1.1 对策模型的基本要素
1.局中人
局中人(players)是指参与竞争的各方,每方必须有独立的决策能力和承 担风险的能力。(如:田忌、齐王)
2.策略集
在对策问题中,局中人为了应对其他局中人的行动而采取的方案和手段 称为该局中人的一个策略(strategy)。
3.赢得及赢得函数
min
2 3 4 4 4
A 6 4 2
4 3 3
2 3 2
5 2 4
5 2
max
2
4
max 61 4432 44 432
最优纯策略(3 ,4 )
2020/5/14
min2
课件
12
13.3.1 混合策略的概念
【例13.5】 猜硬币游戏:甲、乙两个儿童玩猜硬币游戏, 甲手中拿着一枚硬币,把硬币盖在桌子上,让儿童乙猜是 正面向上还是反面向上。如若猜对甲给乙1元钱,猜错乙给 甲1元钱。
11x
2(1
x)
9x
2
步骤:
(1)绘制x数轴,标出x取值范围[0,1]
(2)x取0和1,确定三条直线端点,绘制三 条甲赢得值直线
(3)由于乙是理智的,甲的赢得值只能是 最小的(粗线所示)
(4)甲只能在最小中取最大,对应的策略 为 X * ( 3 , 8 ) ,最优对策值为V*=49/11
11 11
β3
3
522源自α230x*
2 1x
故β1的概率为0.设β2,β3的概率为 y,(1-y).由效率矩阵:
0
y* 1 y
由于甲是理智的,故乙取最大损
2 3 11
A 7 5
2
失(粗线)
乙会在最大损失中找出最小,即 乙最优混合策略为:
可知,当甲使用α1,α2,时,乙的损失
2值020为/5/14:
课件
Y * (0, 9 , 2 ) 11 11 18
设局中人甲使用策略i的概率为xi
m
则m维概率向量x (x1,..., xm )T , xi 1, xi 0称为甲的一个混合策略 i 1
则m维称S1*
x
(x1,..., xm )T
|
m i 1
xi
1, xi
0 称为甲的混合策略集
同理可定义局中人乙的混合策略与混合策略集.
当甲采取混合策略x,乙采取混合策略y,则称(x,y)为一个混合局势.
2020/5/14
课件
9
13.2.1超优原则
1.对 r ,s 若恒有arj asj 则称 r 超优于 s 2.对 h , k 若恒有aih aik 则称 h 超优于 k
【例13.2】
第3行优超
6
1
A5
1
4 2 5 3
5 0 1.5 3
4 3 4 0
6.5
7
9
8
于第2行, 第1行优超 于第5行
甲会使用某种策略组合x1,…,xm,使得在最小赢得的概率组合尽可能地大.
因此有: aij y j ≤V
j
y j 1
j
i 1, 2,L , m
令:yj
yj V
,则:
n j 1
yj
1 V
,于是有 :
n
max
y
j
j 1
y j ≥ 0
j 1, 2,L , n
乙的目标是期望损失最小:minV或max 1
课件
10
【例13.3】 某地区有甲、乙两家企业生产同种产品,采取相同的价格
出售,为了提高市场份额,均采取做广告的方式扩大自己的销售量。
甲和乙均有三种广告策略。甲企业所占的市场份额增加的百分数如下
面矩阵A所示。 1 2 3 min
A 1 2
3 5
1 6
4 1 1 6 max 1
3 4 2 3 3
第13章 对策论
教学目标与要求
【教学目标】 1. 理解下列基本概念: 矩阵对策,矩阵对策三要素,最优纯策略与最优混合策略,鞍点和对策值 2. 算法要求: (1) 会用“超优原则”和“最大最小”原则求矩阵对策的最优纯策略 (2) 会用“线性规划”方法求矩阵对策的最优混合策略 (3) 了解纯策略和混合策略的纳什均衡求取。 【知识结构】
max 514 21 434
min1
2020/5/14
课件
11
13.2.2 最大最小原则
1 L
A 1
M
a11
M
L O
m am1 L
n min
a1n M
max
ars
amn
如果ars ahk ,则该值所对 应的策略为最优纯策略
max 1 44 2 4 43
min ahk
【例13.4】
M
n
min amj y j
max
min
X S1* YS2*
m i 1
n
aij xi y j
j 1
m
m
j 1
乙各方案最大损失max ai1xi L max ain xi
i 1
i 1
mn
乙最多期望损失 min max a x y YS2* XS1* i1 j1 ij i j
由于甲乙都是理智的,故
设甲出正面(α1)的概率x,出反面(α2)的概率1-x;乙猜正面(β1)的概率y,猜反 面(β2)的概率1-y。则乙两个策略的期望值分别为:
E1 1 x (1)(1 x) 2x 1 E2 (1) x 1 (1 x) 1 2x
令E1 E2 , 可得x 0.5
(1) 当x<0.5时,E1 E2,理性的儿童乙会选择猜反面;
1,-1 3,-3 -1,1 1,-1 1,-1 1,-1
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
2020/5/14
最优混合策略为max min E(X,Y ) min max E(X,Y )时X,Y的解
X S1 YS2
YS2 X S1
2020/5/14
课件
15
13.3.1 混合策略的概念
矩阵对策G S1 , S2 , A
甲的策略集S1 1 , ...,m 乙的策略集S2 1 , ..., n 赢得矩阵A aij mn
1 1 6
A1 3 5
4 1
0 4 2 1 3
第1列优超于 第5列,第4列 优超于第2列
1
1 6 A2 3 5
3
5 1.5
4 1 3
4
4 4
第1行优于 2、3行
0
A3
1
2 3 4 5
4 5 4 6.5
5 1.5 4
9
3 3 0 8
1
2
3
6 4 5
2020/5/14
最优纯策略(α1,β2)
11
7 β1
5 β2
β3
3
2
2
课0 件
x*
1 x 17
相关文档
最新文档