运筹学--对策论 PPT

合集下载

运筹学-第15章--对策论

运筹学-第15章--对策论

1 8 5 8 5 5*
2 2 3 2 1 1
3 4
9 0
5 2
6 3
5 5*
3
0
max 9 5* 8 5*
可知 ai* j* =5,i*=1,3,j*=2,4.故(α1,β2)(α1,β4)(α2,
β2)(α2,β4)为对策的纳管 什理均运衡,筹 V学G=5.
15
• 最优纯策略求解步骤:
• 1、行中取小,小中取大得最大化最小收益 值;
• 2、列中取大,大中取小得最小化最大支付 值;
• 3、比较两值是否相等。若相等便存在最优 纯策略。若不等,则不存在最优纯策略。
管理运筹学
16
§3 矩阵对策的混合策略
设矩阵对策 G = { S1, S2, A }。当
max
i
min
j
aij
min
j
max
i
aij
时,不存在最优纯策略。
例:设一个赢得矩阵如下:
一个局势,一个局势决定了各局中人的对策结果(量化) 称为该局势对策的益损值。
管理运筹学
3
§1 对策论的基本概念
出赛的次序是一个策略 “齐王赛马”齐王在各局势中的益损值表(单位:千金)
管理运筹学
4
§1 对策论的基本概念
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。
A=[aij]m×n i 行代表甲方策略 i=1, 2, …, m;j 列代表乙方策略 j=1, 2, …, n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下甲方的 益损值。此时乙方的益损值为 -aij(零和性质)。

《运筹学教学资料》ch14 对策论116页PPT

《运筹学教学资料》ch14 对策论116页PPT

博弈论有三个基本假设: 参与人是理性的; 他们有这些理性的共同知识; 他们知道博弈规则. 任何一个博弈问题都包含如下三个要素:局中人、
策略和支付函数.
二、对策行为的三要素
(1)局中人(player)
一个对策中,有权决定自己行动方案的对策参 加者称为局中人,通常用 I 表示局中人的集合。 如果有 n 个局中人,则 I={ 1,2,…,n }. 一般要求一个对策中至少有两个局中人. 如果局中人数为2,则称对策为二元对策。 如在“齐王赛马”中,局中人是齐王和田忌。
设 si 是第 i 个局中人的一个策略,则 n 个局中人的 策略形成的策略组 s 就是一个局势.
s =( s1,s2,……,sn )
如 (α1, β1 ), (α1, β2 ), (α3, β1 ), …… 全部局势的集合 S 可以表示为
SS1S2 Sn
当局势出现后,对策行为的结果也就确定。 当一个局势 s 出现后,应该为每一局中人 i 规定一 个赢得值(或所失值) Hi(s). 显然, Hi(s)是定义在 S 上的函数,称为局中人 i 的 赢得函数(支付矩阵) 。
表中每一个小方格内的数字被称为局中人的支付, 其中左边的数字代表甲的支付,右边的是乙的支付.
表中的双变量矩阵称为博弈支付矩阵.
局中人所选择的战略构成的组合(招,招)被称为 博弈均衡.这个组合中前后两个战略分别表示甲和 乙所选择的战略.
如果甲和乙在决策时抛掉谨慎,加入一定的“疯 狂”,不约而同地采取“不招”的策略,其结果 是每人只被判1年.
(2)策略集(strategy set)
对策中,可供局中人选择的一个实际可行的完 整的行动方案称为一个策略。
所有策略构成局中人的策略集。
每一局中人 i 的策略集记为Si ,一般每一局中人 的策略集中至少应包括两个策略。

运筹学课件 第六章对策论基础

运筹学课件 第六章对策论基础
• 博弈论是研究博弈现象的规律的数学理论 和方法 • 博弈现象的要素
– 局中人(参与人) —二人或多人 – 行动与策略—有限或无限 – 信息—完全或不完全 – 支付函数—可正可负
一、基本概念与名词
• 局中人 • 策略与策略集 • 局势 • 赢得函数 • 零和对策 • 矩阵对策:二人有限零和对策
二、对策分类
矩阵混合对策问题的解
X (0,0,1 / 3,2 / 3,0) Y (1 / 2,1 / 2,0,0,0) V 5
T
T
相关定理
记T(G)为矩阵对策G的解集
定理1 设有两个矩阵对策 G1={S1,S2,A1}, G2={S1,S2,A2}, 其中A1=(aij), A2=(aij+L), L为一任意常数,则
– 支付函数—赢了得一千金,输了付一千金。
齐王赛马赢得函数
田 忌 (上中下) 1 (上下中) 2
齐 (中上下) 3 王 (中下上) 4 (下中上) 5 (下上中) 6
1 2 3 4 5 6
3 1 1 -1 1 1 1 3 -1 1 1 1 1 1 3 1 -1 1 1 1 1 3 1 -1 1 -1 1 1 3 1 -1 1 1 1 1 3
• 划去普遍较大的列,例如第3、4、5三列, 结果如上。
进一步化简
• 上述结果的第一行比第三行普遍更优,因 此再划去第三行,得 1 2
3 7 3 A 4 4 6
• 若混合策略均不为零,由上述定理知混合 对策问题数学模型的不等式应为等式。因 此有
第二步 用方程组求解
分析上述例子
• 因为 max min{aij } 2, min max{aij } 3 j j i i • 所以 max min{aij } min max{aij }

运筹学_对策论

运筹学_对策论
第17页
混合策略
• 混合扩充
矩阵对策扩充 N人有限对策
• 混合平衡解
矩阵对策 N人有限对策
• 均衡解的存在性
第18页
混 合 扩 充—矩阵对策
策略集
m
S * 1
{X
( x1 , x2 ,..., xm )
xi 1, xi 0, i 1,2,..., m}
i 1
nS* 2{Y( y1 ,y2 ,...,
yn )
y j 1, y j 0, j 1,2,..., n}
j 1
支付函数
mn
E( X ,Y )
aij xi y j
i1 j1
混合扩充: *
{
S1*
,
S
* 2
,
E
(
x
,
y),
x
S1* ,
y
S
* 2
}
第19页
混 合 扩 充—N人有限对策
N 人有限对策 I {1,2,..., N }, Si , i I , H i (s), i I
• 定理1 N人有限对策的混合扩充存在平衡局势. • 定理2 矩阵对策的混合扩充存在平衡局势.
第23页
矩阵对策的解法
• 问题的简化
优超 算例
• 线性规划方法
基本思想 算例
第24页
优超
给定矩阵对策 {S1 , S2 , A} , A 是 m n 的矩阵,如果
akj alj , j 1,2,..., n
则称局中人 1 的策略 k 优超于策略 l。如果
aik ail , i 1,2,..., m
则称局中人 2 的策略 k 优超于策略 l。
注:局中人 1 的策略 k 优超于策略 l 则说明对局中人 1

管理运筹学课件第13章-对策论

管理运筹学课件第13章-对策论
管理运筹学课件第13章对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件
局中人称为“i旳对手”,记为-i。
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1

1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}

运筹学对策论优秀课件

运筹学对策论优秀课件
6
用矩阵表示为(称为局中人Ⅰ的赢得矩阵 或局中人Ⅱ的支付矩阵):
a11 a12
A
a21
a22
am1 am2Biblioteka a1n a2namn
我们称两人有限零和对策为矩阵对策, 记为:G={Ⅰ,Ⅱ ;S1,S2;A} 或 G={S1,S2; A}。
7
例1:设有矩阵对策,局中人Ⅱ的支付矩阵如下:
7 1 8
m a i xm jinaij m jinai*j
m
ax
i
a ij
:
16,2,5
局中人Ⅱ选择这些最大数中的最小者。即:
m j in m a ix a ij m in { 1 6 ,2 ,5 } 2 a 2 2
即选择策略β2。 Ⅰ的最优策略为α2, Ⅱ的最优策略为β2 。
10
定义:设G={S1,S2;A}为矩阵对策,其中S1= {α1,α2,…αm},S2={β1,β2,…βn}。A=(aij) m×n, 若满足等式:
2
在这类行为中,参加斗争或竞争的各方各自 具有不同的目标和利益,为了达到各自的目标和 利益各方必须考虑对手的各种可能的行动方案, 并力图选取对自己最为有利或最为合理的方案, 对策论就是研究对策行为中斗争各方是否存在着 最合理的行动方案,以及如何找到这个合理的行 动方案的数学理论和方法。
例:两个儿童玩的“石头—剪子—布”游戏 和我国古代的“齐王赛马”就是典型的对策论研 究的例子。
5
第二节 矩阵对策的基本定理
一、矩阵对策的数学模型
特点:①局中人只有两人,分别用局中人Ⅰ和局 中人Ⅱ表示,双方都只有有限个策略可供选择,
Ⅰ的策略集为: S1(1,2, ,m)
Ⅱ的策略集为:S2(1,2, ,n)

运筹学教材课件(第九章 对策论)

运筹学教材课件(第九章 对策论)

j
ai* j
a a i* j*
i* j
同理有
因此 max i
aij*
ai* j
a a i* j*
ij*
由式(9-6)和式(9-7)得
aij* ai* j* ai* j i=1,2, ,m ;j=1,2, ,n
证得 (i* , j* )是G的纯策略解。
(9-6) (9-7)
9.2.1 最优纯策略和鞍点
4
2*
3
-3
8
1
4
-3
4
0
1
-5
3
-5
max
2*
8
i
2*
5
2
(1, 1), (1, 3), (2, 1), (2, 3) 都是G的鞍点,因而它们也都是最优纯策略
解,对策值VG=2 ,Ⅰ的最优纯策略解是1,2,Ⅱ的最优纯策略解 是 1, 3。
9.2.1 最优纯策略和鞍点
纯策略解有下述两条性质: (1)无差别性
定义9-4 设G* {X ,Y ; E},是矩阵对策 G {s1, s2; A}的混和扩充, 如果存在混合局势(x*, y*)使得对所有x∈X,y∈Y,有
E(x, y*) E(x*, y*) E(x*, y)
(9-10)
则称(x*, y*)是对策G的混合策略解,简称对策G的解,或称最优
混合局势,简称最优局势。称 x*, y*分别是局中人Ⅰ和Ⅱ的最
ai*
j
又因为
min j
max i
aij
max i
aij*
;
min j
ai*
j
max min
i
j
aij
所以
min j

清华大学运筹学完整ppt课件2024新版

清华大学运筹学完整ppt课件2024新版

分支定界法的优缺点
优点是可以求解较大规模的整数规划 问题,缺点是计算量较大,需要多次 迭代和比较。
割平面法
割平面法的基本思想
通过添加割平面来切割掉原问题中不满足整数约束条件的部分,从而得到新的可行域,并 在新的可行域上继续求解。
割平面法的步骤
构造一个割平面,将原问题的可行域切割为两部分;求解切割后的问题,若得到的最优解 满足整数约束条件,则停止迭代;否则继续添加割平面进行切割,直到得到满足整数约束 条件的最优解或确定原问题无解。
线性规划问题的对偶理论与灵敏度分析
对偶问题
每一个线性规划问题都有一个与 之对应的对偶问题,对偶问题的 目标函数和约束条件与原问题密 切相关。
对偶性质
原问题和对偶问题之间存在一系 列重要的性质,如弱对偶性、强 对偶性等。
灵敏度分析
灵敏度分析用于研究当原问题的 参数发生变化时,最优解和最优 值会如何变化。这对于实际问题 中的决策制定具有重要意义。
THANK YOU
感谢聆听
最优解
03
目标函数等值线与可行域的交点中,使目标函数达到最优(最
大或最小)的点称为最优解。
单纯形法
初始基可行解
单纯形法从一个初始基可行解开始,该解通常是通过添加人工变 量构造的。
迭代过程
单纯形法通过一系列迭代过程,不断改进当前解,直到找到最优 解或确定问题无解。
旋转操作
在每次迭代中,单纯形法通过旋转操作将当前非基变量替换为基 变量,同数规划问题的数学模型
01
整数规划问题的定 义
整数规划是一类要求部分或全部 决策变量取整数值的数学规划问 题。
02
整数规划问题的分 类
根据整数变量的取值范围,可分 为纯整数规划、混合整数规划和 0-1整数规划。

运筹学课件——对策1

运筹学课件——对策1
第7章 对策论
对策论的产生,发展和应用 对策论的产生 发展和应用
早期工作 (1)191献。策梅罗设法证明了,对于每一个严格争利 严格争利 的二人完备信息 完备信息对局,或者其中一个对策者有一个确定的胜局 完备信息 纯策略,或者二个都有可靠的平局纯策略。这个结果适用于象 棋一类的棋类对局,证明胜局策略或平局的存在是一回事,而 找出它们就是另一回事了。到目前为止,还没有人找出一局象 棋的胜局策略或平局策略,甚至不知道到底是某一方有一胜局 策略,还是双方都有平局策略.
(2)策略 一局对策中,可供局中人选择的一个实际可行 实际可行 的完整的行动方案称为一个策略。 的完整的行动方案 策略的全体称为策略集,策略集可以是有限或无限 的。若策略集为有限集称为有限对策,否则称为无 限对策。 参加对策的每个局中人(i∈I)都有自己的策略集, S i 一般,每一局中人的策略集中至少应包括两个策略。

(2) 对于对策论的产生作出了重要贡献的另一位数学
家是法国人波涅尔,1921--1927年间他发表了一系 列文章,建立了对策论的数学基础。但是,波涅 尔没有证明对策论的核心定理——极小极大定理, 他还轻率地预言这个定理是不能证明的。
(3)1928年冯·诺意曼证明了博弈论的基本原理,从 而宣告了博弈论的正式诞生.(德国数学家冯-诺意 曼简洁明确地证明了极小极大定理)。
发展成熟 Nash均衡、经济博奕论、信息不对称对策和广义 、 对策.
标准型,广义型和合作型等基本的博弈模型,解的概 标准型,广义型和合作型等基本的博弈模型, 念及分析方法,构建了博弈论的理论框架. 念及分析方法,构建了博弈论的理论框架.
(4) 谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博 弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什 均衡的概念和均衡存在定理。 此外,塞尔顿、哈桑尼的研究也对博弈 论发展起到推动作用。为此,美国的数学家、经济学家纳什(John
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

当盟军获悉此情报后,盟军统帅麦克阿 梭命令太平洋战区空军司令肯尼将军组织空 中打击。
日本统帅山本五十六大将心里很明白: 在日本舰队穿过俾斯麦海的三天航行中,不 可能躲开盟军的空中打击,他要策划的是尽 可能减少损失。
日美双方的指挥官及参谋人员都进行了 冷静的思考与全面的谋划。
自然条件对于双方 都是已知的。基本情况如下: 从蜡包尔出发开往莱城的海上航线有南北两条。通过时 间均为3天。
案例中,肯尼将军与山本五十六大 将的赢得(支付)函数都可以用矩 阵A、B表示。
(盟军)北线 南线
(日军)北线 南线
(日军)
北线
南线
22 =A1源自3(盟军)北线
南线
-2
-2 =B
-1
-3
在本例中的每一个对局,双方的 赢得的代数之和为零,这样的对 策称为“有限零和二人对策”
设两个局中人为I,II,局中人I有 m 个策略:1、 2… m ;用S1表 示这些策略的集合:
max min aij
i
j
同样,局中人II可以保证局中人I的 赢得不超过
min max aij
j
i
案例中局中人I(盟军)应当选择 (北线)策略1,这样能保证赢得2。局 中人II(日军)应当选择(北线)策略1 使盟军赢得不超过2。实际上,在( 1, 1)局势下,有
max min aij= min max aij
局势3:盟军的侦察机重点搜索南线,而日本舰队走北 线。由于发现晚、盟军的轰炸机群在南线,以及北线气 候恶劣,故有效轰炸只有一天。
局势4:盟军的侦察机重点搜索南线,日本舰队也恰好 走南线。此时日本舰队迅速被发现,盟军的轰炸机群所 需航程很短,加上天气晴好,有效轰炸时间三天。
大家应该也有点累了,稍作休息
对策的三要素:
局中人:有权决定自己行为方案的对 局参加者称为局中人。案例中,美日 双方的决策者为局中人。当对局中局 中人只有两人时,称为二人对策。
策略:对局中一个实际可行的方案称 为一个策略。案例中,美日双方各有 二个策略。
赢得矩阵(支付):当每个局中人 在确定了所采取的策略后,他们就 会获得相应的收益或损失,此收益 或损失的值称为赢得(支付)。赢 得与策略之间的对应关系称为赢得 (支付)函数。
气象预报表明:未来3天中,北线阴雨,能见度差; 而南线天气晴好,能见度好。
肯尼将军的轰炸机布置在南线的机场,侦察机全天
候进行侦察,但有一定的搜索半径。
经测算,双方均可得到如下估计:
局势1: 盟军的侦察机重点搜索北线,日本舰队也恰好走 北线。由于气候恶劣,能见度差,盟军只能实施两天的 轰炸。
局势2:盟军的侦察机重点搜索北线,日本舰队走南线。 由于发现晚,尽管盟军的轰炸机群在南线,但有效轰炸 也只有两天。
定理14-1:矩阵对策 G = S1,S2;A
在纯策略意义下有解的充分必要条 件是:
存在一个局势( *i*, *j *),使 得对一切 i=1,2,… m, j=1, 2…n 均有
aij*<=ai*j*<= ai*j
定理14-1表明矩阵对策
G = S1,S2;A
有解的充分必要条件是在A中存在元
素 ai*j*是其所在行中最小的同时又 是其所在列中最大的。这时ai*j*即 是对策值,因此ai*j*也称为“鞍
14-1矩阵对策的基本概念
案例:俾斯麦海的海空对抗
1943年2月,第二次世界大战中的日本, 在太平洋战区已经处于劣势。为扭转局势, 日本统帅山本五十六大将统率下的一支舰队 策划了一次军事行动:由集结地——南太平 洋的新不列颠群岛的蜡包尔出发,穿过俾斯 麦海,开往新几内亚的莱城,支援困守在那 里的日军。
i
j
j
i
上式蕴涵的思想是朴素自然的,可以概 括为:“从最坏处着想,去争取最好的 结果”
定义14-1:对给定的矩阵对策
G = S1,S2;A 若等式
max min aij= min max aij
i
j
j
i
成立,则称这个公共值为对策G的值, 记为VG,而达到的局势( i, j ) 称为对策G在纯策略意义下的解,记 为( i*, j *)而i*和 j *分别称为 局中人I和局中人II的最优纯策略。
大家有疑问的,可以询问和交
这场海空遭遇与对抗一定会发生, 双方的统帅如何决策呢?历史的实际 情况是:局势1成为现实。肯尼将军命 令盟军的侦察机重点搜索北线;而山 本五十六大将命令日本舰队取道北线 航行。由于气候恶劣,能见度差,盟 军飞机在一天后发现了日本舰队,基 地在南线的盟军轰炸机群远程航行, 实施了两天的有效轰炸,重创了日本 舰队,但未能全歼。
北线 1 南线2
(盟军)北线 1 2
2 =A
南线2
1
3
在矩阵中,盟军的最大赢得是3,而要得到3, 必须选择策略 2,而日军的目的是使盟军的赢得尽 量的小,必须选择策略1 ,使盟军的赢得只有1。
在局中人I设法使自己的赢得尽可能大的同时, 局中人II也设法使局中人I的赢得尽可能小。
所以局中人I应首先考虑用 所能赢 得的最小,然后在这些最小赢得中 选择最大。局中人I可以保证赢得
点”,而( *i*, *j *),为对策 的解。
Z
鞍点
Y
X
马鞍面z=f(x,y)
Y
在X=0的平面上
鞍点是z=f(0,y)
的极大值点
Z
z=f(0,y)
Z
在Y=0的平面上
鞍点是z=f(x,0)
的极小值点
z=f(x,0)
X
例14-3:对给定的矩阵对策 G = S1,S2;A
运筹学--对策论
对策论概论
对策论(The Game Theory)也称竞赛论或博
弈论,是研究具有竞争、对抗、利益分配等方面 的数量化方法,并提供寻求最优策略的途径。
20世纪40年代形成并发展。1944年以来,对策 论在投资分析、价格制定、费用分摊、财政转移 支付、投标与拍卖、对抗与追踪、国际冲突、双 边贸易谈判、劳资关系以及动物行为进化等领域 得到广泛应用。
S1= 1、 2…… m
同样,局中人II有n个策略:1、 2。。。 n ;用S2表示这些策略的集合: S2= 1、 2… n 局中人I的赢得矩阵是:
a11 a12 …… a1n a21 a22 …… a2n A= …… …… …… a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对策记为G: G= S1,S2;A
相关文档
最新文档