运筹学—对策论(三)
合集下载
《管理运筹学-对策论》
![《管理运筹学-对策论》](https://img.taocdn.com/s3/m/de78793ba36925c52cc58bd63186bceb18e8ed5f.png)
博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。
管理运筹学解决实际问题的步骤及内容
![管理运筹学解决实际问题的步骤及内容](https://img.taocdn.com/s3/m/cf546b3210661ed9ad51f37a.png)
第三章 线性规划问题的计算机求解
教学要求
本章学习如何使用计算机软件包求解线性规划问题,并通过上机操作训练掌握较简单的线性规划问题使用计算机软件包求解的方法。
课时分配
6学时(含计算机上机操作训练)
教学内容
一、管理运筹学计算机软件包的使用说明和结构内容。
二、线性规划问题的菜单界面和输入要点。
简要介绍管理运筹学所涉及的应用领域,如生产计划、库存管理、运输问题、人事管理、市场营销、财务会计、项目评价等;介绍管理运筹学在国内外的应用和发展状况。
四、管理运筹学使用计算机软件的原则
思考题
1、简述运筹学的发展历史和发展前景。
2、管理运筹学的主要分支和应用领域有哪些?
3、使用管理运筹学计算机软件有哪些基本原则?
第十二章 排队论
教学要求
本章学习研究排队现象,主要了解和掌握在不增加固定资产投资前提下,如何把排队时间控制到一定限度内,在服务质量的提高和成本降低之间取得平衡,寻找最恰当的解。
课时分配
3学时
教学内容
一、排队过程的组成部分
二、单服务台泊松到达、负指数服务时间的排队模型
通过图解法作图过程,直观地讲解目标函数中系数的灵敏度分析、约束条件右边常数的灵敏度分析的基本原理。
思考题
1、试述可行域、目标函数等值线、松驰变量和剩余变量的含义。
2、试述线性规划图解法的基本特点、适用范围、图解法求解的基本程序,步骤和方法
3、线性规划问题是如何化为标准形式的?
三、多服务台泊松到达、负指数服务时间的排队模型
四、单服务台泊松到达、任意服务时间的排队模型
五、多服务台泊松到达、任意服务时间、损失制排队模型
《运筹学》教材编写组《运筹学》笔记和课后习题(含考研真题)详解(对策论基础)
![《运筹学》教材编写组《运筹学》笔记和课后习题(含考研真题)详解(对策论基础)](https://img.taocdn.com/s3/m/506a43d5bceb19e8b9f6ba15.png)
圣才电子书 十万种考研考证电子书、题库视频学习平台
(2)2× 或 ×2 对策的图解法
注意:该方法用在赢得矩阵为 2× 或 ×2 阶的对策上特别方便,也可用在 3× 或
×3 对策上。但对 和 均大于 3 的矩阵对策就丌适用了。
设缩减后的赢得矩阵为二阶无鞍点对策问题,局中人Ⅰ的混合策略为
的最优纯策略。 定理 1 矩阵对策 使得对一切
在纯策略意义下有解的充分必要条件是:存在纯局势
,均有
。
定义 2 设
为一个定义在
及
上的实值函数,如果存在
,使得对一切
和
,有
,则称
为
函数 的一个鞍点。 矩阵对策解的性质:
性质 1 无差别性。即若 性质 2 可交换性。即若
也是解。 定义 3 设有矩阵对策
记
是对策 G 的两个解,则
定理 11 设矩阵对策
的值为 ,则
6.矩阵对策的解法 (1)2×2 对策的公式法 所谓 2×2 对策是指局中人Ⅰ的赢得矩阵为 2×2 阶的,即
如果 A 有鞍点,则很快可求出各局中人的最优纯策略;如果 A 没有鞍点,为求最优混 合策略可求下列等式组:
上面等式组(Ⅰ)和(Ⅱ)一定有严格非负解
和
,其中
6 / 33
是对策 G 的两个解,则
和
,其中
,
,
则 和 分别称为局中人Ⅰ和Ⅱ的混的混合策略(或策略);对
,称
为一个混合局势(或局
势),局中人Ⅰ的赢得函数记成
这样得到的一个新的对策记成
,称 为对策 G 的混合扩充。
定义 4 设
是矩阵对策
的混合扩充,如果
3 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
对策论(Theory of Games)
![对策论(Theory of Games)](https://img.taocdn.com/s3/m/42369723482fb4daa58d4b69.png)
定义
并不是所有的对策都存在鞍点,如 A为齐王的赢得矩阵 3 1 1 1 1 -1 1 3 1 1 -1 1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 -1 1 3 1 1 1 1 -1 1 3 max(min aij)= -1 min (max aij)=3 i j j i
例如:
• 给定矩阵对策
6 5 6 A 1 4 2 8 5 7
对策的最优值为5,对策的解有两个,分 别为局势 , 和 , 。
1 2 3 2
(三)矩阵对策的混合策略
1、矩阵对策的混合策略的定义
2、原则:坏中求好的原则。 3、解的存在:一定有解 4、混合策略求解:利用期望转化成 线性规划问题求解。
三、矩阵对策模型
(一)矩阵对策的概念 (二)矩阵对策的最优纯策略 (三)矩阵对策的混合策略 (四)矩阵对策的解法
(一)矩阵对策的概念 1、矩阵对策的定义 2、建立矩阵对策模型
1、矩阵对策的定义 局中人只有两个,对策中各方只能从有限 的策略集中确定性的选择一种,且对策双 方的支付之和为零的对策称为两人零和纯 策略对策。
表2
齐 王 上中 下 田忌 上中下 3 上下 中上 中 下 1 1 中下 上 -1 下中 上 1 下上 中 1
上下中 1 中上下 1
中下上 1 下中上 1
3 1
1 -1
-1 3
1 1
1 1
3 1
1 -1
1 3
1 1
-1 1
下上中 -1
1
1
1
1
3
引例3
有两个儿童A和B在一起玩“石头-剪子布”游戏。我们规定胜者得1分,负者得 -1分,平手时各得0分。双方选定的各种 出法及相应的结果可由下表列出。双方 应取何种策略?
运筹学考研试题
![运筹学考研试题](https://img.taocdn.com/s3/m/df9e48f704a1b0717fd5dd7e.png)
2.单纯形法中,要把数学模型化为标准型,须引入 ; 若约束条件中附加变量的系数是 或原约束为 ,则 必须引入 ,以构成初始可行基。 3.0-1规划的隐枚举法的基本思想是从所有变量等于 出 发,依次指定一些变量为 ,直到得到一个可行解。
d i 和 d i 分别表示 4.目标规划中,
对于第i个目标约束 ,如果希望 f i X bi ,则目标函数为
工厂 甲厂 乙厂 运费 利润 运费 利润 运费 利润 3 4 20 25 4 6 25 22 5 3 27 24
丙厂
5
27
3
24
4
22
该公司按以下目标调运产品: 第一目标:满足各销售点的需求; 第二目标:因路况原因,C销售点的服装最好由乙厂供应; 第三目标:甲厂因仓库限制,其产品应尽量全部调出; 第四目标:利润不少于60000元; 第五目标:调运总费用最省; 试建立该目标规划问题的数学模型(不要求求解)。(15分)
(1)求线性规划问题的最优解(20分) (2)求对偶问题的最优解(5分) (3)当△b3=-150时最优基是否发生变化?为什么?(5分) (4)求c2的灵敏度范围(5分) (5)如果x3的系数由[1,3,5]变为[1,3,2],最优基是否改变?若 改变求最优解。(5分)
二、已知某运输问题其供销关系及单位运价表如下表所示:
3.已知线性规划的数学模型如下,请写出对偶问题的 数学模型,并求其对偶问题的最优解。(15分)
max z 5 x1 3 x2 6 x3 x1 2 x2 x3 18 2 x x 3 x 16 1 2 3 s.t. x1 x2 x3 10 x1 , x2 0, x3无约束
运筹学
Operational Research
管理运筹学课件第13章-对策论
![管理运筹学课件第13章-对策论](https://img.taocdn.com/s3/m/7a9e2ce80129bd64783e0912a216147917117ec7.png)
管理运筹学课件第13章对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。
精心整理的运筹学重点10.对策论
![精心整理的运筹学重点10.对策论](https://img.taocdn.com/s3/m/003e1d65011ca300a6c3901c.png)
v1 = max min(3 − 2 x, 2 + 2 x) , v1 = max min(3 − 2 x, 2 + 2 x) 就是折线 ABC,它是局 0≤ x ≤1 0≤ x ≤1
中人 I 的最小赢得线,B 就是折线 ABC 的最高点,所以 B 点所对应的值就是混合策略意 义下的最大最小值。
i j j i
3.无鞍点的两人有限零和对策求解 X = ( x1 , x2 ,..., xm )T 为局中人 I 的混合策略,
Y = ( y1 , y 2 ,..., yn )
T
∑ x = 1 为局中人 II 的混合策略, ∑ y = 1 , ( X , Y ) 称为混合局势。
i i
最优混合策略求解方法 y1 y2
第十章 对策论 1.对策论类型 1)根据局中人个数:二人对策、多人对策 2)根据局中人间是否允许合作:合作对策、非合作对策 3)根据局中人的策略集中的策略个数:有限对策、无限对策 4)根据各局中人的赢得函数的代数和是否为零:零和对策、非零和对策 5)根据策略的选择是否与时间推移有关:静态对策、动态对策 6)根据对策中各局中人所拥有的有关决策信息:完全信息对策、不完全信息对策 7)根据对策模型的数学特征:矩阵对策、连续对策、微分对策、随机对策 矩阵对策:又称为二人有限零和对策。 2.有鞍点的两人有限零和对策求解 G = {S1, S2 , A} 求解: maxmin{aij } = V1,minmax{aij } = V2
x1 a11 x2 a21
矩阵对策求解方法
有
a12 a22
有无鞍点?
无 是
获得
2*n 或 m*2 矩阵
否
图解
运筹学教学-对策论公开课获奖课件百校联赛一等奖课件
![运筹学教学-对策论公开课获奖课件百校联赛一等奖课件](https://img.taocdn.com/s3/m/b9c5cc9dd4bbfd0a79563c1ec5da50e2524dd130.png)
局中人称为“i旳对手”,记为-i。
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1
布
1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1
布
1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}
浅析解 “对策问题” 的两种思路
![浅析解 “对策问题” 的两种思路](https://img.taocdn.com/s3/m/66709ad049649b6648d747f0.png)
思路二:特殊性方法 平衡状态: Fibonacci数 决策规律: 反复缩小范围,找最大Fibonacci数
特殊性方法 空间复杂度 O(1) 时间复杂度 O(logN)
大大降低
一般性方法 空间复杂度 O(N2) 时间复杂度 O(N3)
浅析解 “对策问题” 的两种思路
思路二:特殊性方法
l 状 态 l 逆向分析
浅析解 “对策问题” 的两种思路
一般性方法 与 特殊性方法
《取石子》问题的推广:
1一次可取先前对方所取石子数的3倍
1一次可取先前对方所取石子数的4倍 1一次可取先前对方所取石子数的5倍
一般性方法
VS 特殊性方法
1…………
1一次可取先前对方所取石子数的K倍
浅析解 “对策问题” 的两种思路
一般性方法 与 特殊性方法
注:这里的胜败指的均是先手胜败。
浅析解 “对策问题” 的两种思路
1如果一个状态至少有一个子状态是先手败,则该状态是先手胜
(4, 3)
胜 胜
(3, 2)
胜
胜
(2, 2)
胜 败
(1, 1)
败
(2, 2)
胜
败
(1, 1) (1, 1) (0, 0) (0, 0)
败 败
(1, 1) (0, 0) (0, 0) (0, 0)
“特殊性方法”是从结局或残局出发,自底而上分析,无须 构造“状态转移的拓扑结构”,无须考察所有可能的状态与策略, 时间和空间复杂度相对于“一般性方法”都不高。 例如POI99 《多边形》 ,IOI96的取数字也可以用“特殊性 方法”来解决。
浅析解 “对策问题” 的两种思路
思路二:特殊性方法
l 状 态 列举影响结局胜负的所有因素,综合描述成“状态”,但并不需 要构造出“状态转移的拓扑结构”。
特殊性方法 空间复杂度 O(1) 时间复杂度 O(logN)
大大降低
一般性方法 空间复杂度 O(N2) 时间复杂度 O(N3)
浅析解 “对策问题” 的两种思路
思路二:特殊性方法
l 状 态 l 逆向分析
浅析解 “对策问题” 的两种思路
一般性方法 与 特殊性方法
《取石子》问题的推广:
1一次可取先前对方所取石子数的3倍
1一次可取先前对方所取石子数的4倍 1一次可取先前对方所取石子数的5倍
一般性方法
VS 特殊性方法
1…………
1一次可取先前对方所取石子数的K倍
浅析解 “对策问题” 的两种思路
一般性方法 与 特殊性方法
注:这里的胜败指的均是先手胜败。
浅析解 “对策问题” 的两种思路
1如果一个状态至少有一个子状态是先手败,则该状态是先手胜
(4, 3)
胜 胜
(3, 2)
胜
胜
(2, 2)
胜 败
(1, 1)
败
(2, 2)
胜
败
(1, 1) (1, 1) (0, 0) (0, 0)
败 败
(1, 1) (0, 0) (0, 0) (0, 0)
“特殊性方法”是从结局或残局出发,自底而上分析,无须 构造“状态转移的拓扑结构”,无须考察所有可能的状态与策略, 时间和空间复杂度相对于“一般性方法”都不高。 例如POI99 《多边形》 ,IOI96的取数字也可以用“特殊性 方法”来解决。
浅析解 “对策问题” 的两种思路
思路二:特殊性方法
l 状 态 列举影响结局胜负的所有因素,综合描述成“状态”,但并不需 要构造出“状态转移的拓扑结构”。
运筹学对策论全解
![运筹学对策论全解](https://img.taocdn.com/s3/m/8122f8cc28ea81c758f578ba.png)
赢 A
B
石头
剪子
布
石头 0 1 -1
剪子 -1 0 1
布
1 -1
0
分析:无确定最优解,可用“混合策略”求解。
4.齐王赛马
战国时期,齐国国王有一天提出要与大将军田忌赛马。 田忌答应后,双方约定: 1)每人从上中下三个等级中各出一匹马,共出三匹; 2) 一共比赛三次,每一次比赛各出一匹马; 3) 每匹被选中的马都得参加比赛,而且只能参加一次; 4) 每次比赛后输者要付给胜者一千金。
例:囚犯困境中,每个囚犯均有2个策略:
{坦白,抵赖}
(3)局势
坦白 抵赖
坦白 抵赖 -9,-9 0,-10 -10,0 -1,-1
当每个局中人从各自策略集合中选择一策略而组 成的策略组成为一个局势,用 (si , d j )来表示。
(4)赢得(支付)
局中人采用某局势时的收益值。
例:当局中人甲选择策略si ,局中人乙选策略 dj 时,局中人甲的赢得值可用 R甲(si , d j )表示。
九十年代以来博弈理论在金融、管理和经济领域中 得到广泛应用
• 九十年代以来对策理论在金融、管理和经济领域 中得到广泛应用
• 博弈论和诺贝尔经济奖
1994:非合作博弈:纳什(Nash)、泽尔腾(Selten) 、海萨尼 (Harsanyi) 1996:不对称信息激励理论:莫里斯(Mirrlees)和维克瑞(Vickrey) 2001:不完全信息市场博弈:阿克罗夫(Akerlof)(商品市场)、斯潘 塞(Spence)(教育市场)、斯蒂格里兹(Stiglitze)(保险市场) 2005: 授予罗伯特·奥曼与托马斯·谢林,以表彰他们通过博弈理论的分析 增强世人对合作与冲突的理解。 2007年,授予赫维茨(Leonid Hurwicz)、马斯金(Eric S. Maskin)以及 迈尔森(Roger B. Myerson)。三者的研究为机制设计理论奠定了基础。 2012年,授予罗斯(Alvin E. Roth)与沙普利(Lloyd S. Shapley)。他 们创建“稳定分配”的理论,并进行“市场设计”的实践。
运筹学--对策论
![运筹学--对策论](https://img.taocdn.com/s3/m/1422062926d3240c844769eae009581b6bd9bdf5.png)
max min E(X,Y)= min max E(X,Y)
X S1* Y S2*
Y S2* X S1*
则称这个公共值为对策G在混合意义 下的值,记为V*G,而达到V*G 的混 合局势(X*,Y*)称为对策G在混合 策略意义下的解,而X*和Y*分别称 为局中人I,II的最优混合策略。
定理14-2:矩阵对策 G = S1,S2;A
0 2 3 0
赢得矩阵为 A 2 0 3 0
0
3
0 4
0
3
4
0
14.2 矩阵对策的混合策略
定义:对给定的矩阵对策
G = Ⅰ,Ⅱ;S1,S2;A
其中 S1= 1, 2…m
S2= 1 , 2… n
A=(aij)mn
把纯策略集合对应的概率向量
X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
分别称为局中人I和局中人II的混合策略。
如果局中人I选取的策略为
X=(x1, x2 … xm) 局中人II选取的策略为
Y=(y1 , y2 … yn ),则期望值 E(X,Y)= xi aij yj=XAYT 称为局中人I期望赢得,而局势(X,Y) 称为“混合局势”,局中人I,II的混合 策略集合记为S1*, S2*。
S1= 1、 2…… m
同样,局中人II有n个策略:1、 2。。。 n ;用S2表示这些策略的集合: S2= 1、 2… n 局中人I的赢得矩阵是:
a11 a12 …… a1n a21 a22 …… a2n A= …… …… …… a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对策记为G: G= S1,S2;A
运筹学-第六讲对策论
![运筹学-第六讲对策论](https://img.taocdn.com/s3/m/6d8ee989b04e852458fb770bf78a6529647d35eb.png)
对策G常写成: G={S1,…,Sn;h1,…hn}
【定义 】 在对策G={S1,S2…,Sn;h1,h2…hn}中,假如由各个对策方旳各 选用一种策略构成旳某个策略组合(S1*,S2*…,Sn*)中,任一对策方i 旳策略 Si*,都是对其他策略方策略旳组合 (S1*,…,S*i-1,S*i+1…,Sn*)旳最佳策略, 即h i(S1*, … , S*i-1, Si*, S*i+1,…Sn*)≥hi(S1*, …, S*i-1, Sij, S*i+1 , …, Sn*)对任意 Sij∈Si 都成立,则称(S1*,…,Sn*)为G旳一种纯策略意义下旳“纳什均 衡”(Nash Equilibrium).
(2,0)
(4,0)
反应函数法
对策论 game theory
【例4】 考虑上述模型旳另一种情况即各厂商所选择旳是价格而不是产量,假 设产量与价格旳函数关系为:
q1 ( p2 ) a1 b1 p1 d1 p2
q2 ( p1 ) a2 b2 p2 d 2 p1
其他条件不变,边际成本为C1、C2,试求解其纳什均衡。
P2
R2 ( p1 )
1 2b2
(a2
b2 c2
d 2 p1 )
p1*
p2*
1 2b1 1 2b2
(a1b1c1ຫໍສະໝຸດ d1p* 2
)
(a2 b2c2 d 2 p1* )
P1*
d1 4b1b2 d1d 2
(a2
b2c2 )
2b2 4b1b2 d1d 2
(a1
b1c1 )
P2*
d2 4b1b2 d1d 2
Nash对对策论旳贡献有: (i) 合作对策中旳讨价还价模型,称为Nash讨价还价解; (ii) 非合作对策旳均衡分析。
【定义 】 在对策G={S1,S2…,Sn;h1,h2…hn}中,假如由各个对策方旳各 选用一种策略构成旳某个策略组合(S1*,S2*…,Sn*)中,任一对策方i 旳策略 Si*,都是对其他策略方策略旳组合 (S1*,…,S*i-1,S*i+1…,Sn*)旳最佳策略, 即h i(S1*, … , S*i-1, Si*, S*i+1,…Sn*)≥hi(S1*, …, S*i-1, Sij, S*i+1 , …, Sn*)对任意 Sij∈Si 都成立,则称(S1*,…,Sn*)为G旳一种纯策略意义下旳“纳什均 衡”(Nash Equilibrium).
(2,0)
(4,0)
反应函数法
对策论 game theory
【例4】 考虑上述模型旳另一种情况即各厂商所选择旳是价格而不是产量,假 设产量与价格旳函数关系为:
q1 ( p2 ) a1 b1 p1 d1 p2
q2 ( p1 ) a2 b2 p2 d 2 p1
其他条件不变,边际成本为C1、C2,试求解其纳什均衡。
P2
R2 ( p1 )
1 2b2
(a2
b2 c2
d 2 p1 )
p1*
p2*
1 2b1 1 2b2
(a1b1c1ຫໍສະໝຸດ d1p* 2
)
(a2 b2c2 d 2 p1* )
P1*
d1 4b1b2 d1d 2
(a2
b2c2 )
2b2 4b1b2 d1d 2
(a1
b1c1 )
P2*
d2 4b1b2 d1d 2
Nash对对策论旳贡献有: (i) 合作对策中旳讨价还价模型,称为Nash讨价还价解; (ii) 非合作对策旳均衡分析。
管理运筹学-对策论
![管理运筹学-对策论](https://img.taocdn.com/s3/m/851de146492fb4daa58da0116c175f0e7cd119fd.png)
min 8 策略1
min 9 5
max 8 9
j
3.矩阵对策的混合策略
矛盾:甲取2 ,乙取时1,甲实际赢得8比预期多2(乙就少2)这对乙讲是不满意的,考虑这一点,乙采取策略2,若甲分析到这一点,取策略1,则赢得更多为9…
01
此时,甲,乙方没有一个双方均可接受的平衡局势。
01
一个思路:对甲(乙)给出一个选取不同策略的概率分布,以使甲(乙)在各种情况下的平均赢得(损失)最多(最少)。-----即混合策略
建立线性模型: min X1+X2 s.t. 5X1+8X21 X1= 1/21 9X1+6X21 X2= 2/21 X1, X20 1/V= X1+X2=1/7 所以:V=7 返回原问题: X1’= X1V= 1/3 X2’= X2V= 2/3 于是甲的最优混合策略为: 以1/3的概率选1;以2/3的概率选2 最优值V=7.
3.矩阵对策的混合策略(续)
例 设甲方的益损值 赢得矩阵。 3 2 0 3 0 被第3、4行所优超 5 0 2 5 9 被第3行所优超 A= 7 3 9 5 9 4 6 8 7 5.5 6 0 8 8 3 得到 7 3 9 5 9 被第1列所优超 A1= 4 6 8 7 5.5 被第2列所优超 6 0 8 8 3
同样可求乙的最优混合策略: 设乙使用策略1的概率为Y1′ Y1′+Y2′=1 设乙使用策略2的概率为Y2′ Y1′,Y2′0 设在最坏的情况下,甲赢得的平均值为V. 这也是乙损失的平均值,越小越好 作变换: Y1= Y1’/V ; Y2= Y2’/V 建立线性模型: max Y1+Y2 s.t. 5Y1+9Y21 Y1= 1/14 8Y1+6Y21 Y2= 1/14 Y1, Y20 1/V= Y1+Y2=1/7 所以:V=7
min 9 5
max 8 9
j
3.矩阵对策的混合策略
矛盾:甲取2 ,乙取时1,甲实际赢得8比预期多2(乙就少2)这对乙讲是不满意的,考虑这一点,乙采取策略2,若甲分析到这一点,取策略1,则赢得更多为9…
01
此时,甲,乙方没有一个双方均可接受的平衡局势。
01
一个思路:对甲(乙)给出一个选取不同策略的概率分布,以使甲(乙)在各种情况下的平均赢得(损失)最多(最少)。-----即混合策略
建立线性模型: min X1+X2 s.t. 5X1+8X21 X1= 1/21 9X1+6X21 X2= 2/21 X1, X20 1/V= X1+X2=1/7 所以:V=7 返回原问题: X1’= X1V= 1/3 X2’= X2V= 2/3 于是甲的最优混合策略为: 以1/3的概率选1;以2/3的概率选2 最优值V=7.
3.矩阵对策的混合策略(续)
例 设甲方的益损值 赢得矩阵。 3 2 0 3 0 被第3、4行所优超 5 0 2 5 9 被第3行所优超 A= 7 3 9 5 9 4 6 8 7 5.5 6 0 8 8 3 得到 7 3 9 5 9 被第1列所优超 A1= 4 6 8 7 5.5 被第2列所优超 6 0 8 8 3
同样可求乙的最优混合策略: 设乙使用策略1的概率为Y1′ Y1′+Y2′=1 设乙使用策略2的概率为Y2′ Y1′,Y2′0 设在最坏的情况下,甲赢得的平均值为V. 这也是乙损失的平均值,越小越好 作变换: Y1= Y1’/V ; Y2= Y2’/V 建立线性模型: max Y1+Y2 s.t. 5Y1+9Y21 Y1= 1/14 8Y1+6Y21 Y2= 1/14 Y1, Y20 1/V= Y1+Y2=1/7 所以:V=7
运筹学基础教学课件PPT
![运筹学基础教学课件PPT](https://img.taocdn.com/s3/m/657472247ed5360cba1aa8114431b90d6d85897a.png)
都江堰水利工程
Page 4
川西太守李冰 父子主持修建, 其目标是利用 岷江上游的水 资源灌溉川西 平原,追求的 效益还有防洪 与航运。其总 体构思是系统 思想的杰出运 用
北宋丁谓主持修复皇宫
Page 5
例2、北宋丁谓主持修复皇宫 面临的问题:木材、石材、 砖瓦等建筑材料如何取得?
修建如何进行?
大街 开封 皇宫
2、策略集
策 略:在对策中,局中人在整个决策过程中针对一系 列行动制定的完整行动方案。
策略集:每个局中人策略的全体集合。 局 势:每个局中人从自己的策略集合中选择一个策
略,构成一个局势。
3、赢得函数
利用全部局势集合上的一个实值函数,来描述 每个局势完结后局中人的得失的报酬数值。
对策的分类
Page 23
目标函数: 约束条件:1原材料的限制 2工时的限制 3座椅的限制 4非负限制 数学模型:
图解法
x2
1000
5x1+2.5x2≤2500
x1=400
800
Z=2600
600
400
Z=1800
Page 20
max Z=4x1+3x2
2x1 2x2 1600 5x1x1420.05x2 2500 x1 0、x2 0
线平衡率 秒表法/PTS
动作和方法研究
动改法
成本控制 设施规划
双手操作法 人机配合法
物流分析
防错法
PMP体系
PAC体系
系统设计
……
工作抽样法 流程程序法
五五法 其它
1工程学 2人机学(人因工程学) 3材料学 4管理学 5统计学 6运筹学 7系统工程学 8材料力学 9工程力学 10物流与设施规划
第十二章-对策论(运筹学讲义)课件
![第十二章-对策论(运筹学讲义)课件](https://img.taocdn.com/s3/m/f40c8c11e418964bcf84b9d528ea81c759f52e1a.png)
局中人2 出1指
5 -5
出2指 -5 5
局中人1从局中人2该如何选择策略,已获得利益?
-
3
例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在 不同的屋子里审讯。警察告诉他们: 如果两人都坦白,各 判刑8年;如果两人都抵赖,由于证据不充分,两人将各 判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者 立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯 都有两种策略: 坦白或抵赖。可以用一个矩阵表示两个嫌 疑犯的策略的损益
3.一局势对策的益损值: 局中人各自使用一个对策就形成了一 个局势,一个局势决定了各局中人的对策结果(量化)称 为该局势对策的益损值。
赢得函数(payoff function): 定义在局势上,取值为相应益 损值的函数
4. 纳什均衡: 纳什均衡指所有局中人最优策略组成的一种局势,
既在给定其他局中人策略的情况下,没有任何局中人有积
A
1
4
3
2
解因
m i a x m j in a ij 2 , m j in m i a x a ij 3
m a ixm jina ij m jinm a ixa ij
不符合鞍点条件, 故G的鞍点不存在。
例6 求解矩阵对策,其中: 解 容易得到
A 11
0 1
1 1
v a i * j * 1i * 1 ,2 ;j * 3
A
a
2
1
a22
a1m
a2
m
a
m
1
am2
amn
aij为局中人甲在局势
( i , j )下的赢得 -
9
“齐王赛马”是一个矩阵策略。
其中: 齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 },
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定理3 定理 设x*∈ S1* ,y*∈ S2*,则(x*,y*)是G的解的充要条 ∈ ∈ 则 是 的解的充要条 件是:对任意i=1,2, …,m和j=1,2, …,n,有 件是:对任意 和 , E(i,y*) ≤ E(x*,y*) ≤ E(x*,j) 定理4 定理 设x*∈ S1* ,y*∈ S2*,则(x*,y*)是G的解的充要条 ∈ ∈ 则 是 的解的充要条 件是:存在v,使得 使得x*和 分别是不等式组 件是:存在 使得 和y*分别是不等式组 m E(x,j) ∑ aijxi ≥ v , j=1,2, …,n E(i,y) i=1 m n ∑ xi = 1 ∑ aijyj i=1 ≤ v , i=1,2, …,m j=1 xi≥0 , i=1,2, …,m n 和 ∑ yi =1 j=1 yj≥0 , j=1,2, …,n 的解, 的解,且v=VG 。
定理7 定理 设有两个矩阵对策 G1= {S1, S2;A},G2= {S1, , 其中α>0为任一常数,则有⑴ VG2= α VG1 为任一常数, S2; α A} ,其中 为任一常数 则有⑴ ⑵ T(G1)=T(G2) 例 2 设G1和G2赢得矩阵分别为 6 4 3 2 A2= 4 8 A1= 2 4 4 0 2 0 定义5 设G={S1 , S2;A}为矩阵对策,其中 为矩阵对策, 定义 为矩阵对策 S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} ,A=(aij) , ( 如果对一切j=1,2, …,n,都有 i0j≥ ak0j 即矩阵 都有a 即矩阵A 。如果对一切 都有 m×n × 的第i 行均不小于第k 行的对应元素,则称局中人Ⅰ 的第 0行均不小于第 0行的对应元素,则称局中人Ⅰ 的纯策略α 优超于α 同样,若对一切i= 的纯策略 i0优超于 k0 ;同样,若对一切 1,2, …,m, 即矩阵A的第 列均不小于第j 的第l 都有a 都有 ij0≤ ail0即矩阵 的第 0列均不小于第 0列的对应 元素,则称局中人Ⅱ的纯策略β 优超于β 元素,则称局中人Ⅱ的纯策略 j0优超于 l0。
优超原则:定理 给出了一个简化赢得矩阵 的原则, 给出了一个简化赢得矩阵A的原则 优超原则:定理8给出了一个简化赢得矩阵 的原则, 称之为优超原则。根据这个原则,当局中人Ⅰ 称之为优超原则。根据这个原则,当局中人Ⅰ的某 纯策略α 纯策略 i被其它纯策略或纯策略的G 中划去第i行而得到一个与原对策 超,可在矩阵 中划去第 行而得到一个与原对策 等价但赢得矩阵阶数较小的对策G′,通过求G′而得 等价但赢得矩阵阶数较小的对策 ,通过求 而得 的解。 到G的解。 的解
运筹学—对策论 三 运筹学 对策论(三) 对策论 定理5 对任一矩阵对策G= {S1, S2;A},一定存在混合 定理 对任一矩阵对策 , 策略意义下的解。 策略意义下的解。 记矩阵对策G的解集为 记矩阵对策 的解集为T(G), 关于对策解集有下列 的解集为 两个性质: 两个性质: 定理6 }, 定理6 设有两个矩阵对策 G1= {S1, S2;A1},G2= {S1, S2;A2} ,其中 1 =(aij), A2 =(aij+L),L为任一常数,则有 其中A 为任一常数, 为任一常数 ⑴ VG2= VG1+L ⑵T(G1)=T(G2) 例 1 设G1和G2赢得矩阵分别为 5 A1= 2 4 1 4 0 7 A2= 4 6 3 6 2
复习已讲的矩阵对策内容
定理1 矩阵对策G={S1 , S2;A}在纯策略意义下有解 定理 矩阵对策 在纯策略意义下有解 的充要条件是:存在纯局势( 的充要条件是:存在纯局势( α i* , β j* )使得对一切 i=1,2, …,m, j=1,2, …,n, 均有 ij*≤ ai*j* ≤ ai*j 。 均有a 定理2 矩阵对策G= {S1, S2;A} 在混合策略意义下有解 定理 矩阵对策 的充要条件是:存在x ∈ 的充要条件是:存在 *∈ S1* ,y*∈ S2*,使(x*,y*)为E(x,y) ∈ 使 为 的一个鞍点,即对一切x , 的一个鞍点,即对一切 ∈ S1* ,y∈ S2*,有 E(x,y*) ≤ E(x*,y*) ≤ E(x*,y)
对于A 易知无鞍点,应用定理4, 对于 3,易知无鞍点,应用定理 ,求解不等式组 7y1+3y2≤ υ 7x3+4x4≥ υ 4y1+6y2≤ υ 3x3+6x4≥ υ y1+y2=1 x3+x4=1 和 y1,y2 ≥ 0 X3,x4 ≥ 0 首先考虑方程组的解 7x3+4x4= υ 7y1+3y2= υ 3x3+6x4= υ 4y1+6y2= υ x3+x4=1 y1+y2=1 求解得x 求解得 3*=1/3,x4 *=2/3; y1*=1/2,y2 *=1/2; υ=5 , ; , ; 于是,原矩阵对策的一个解就是: 于是,原矩阵对策的一个解就是: X*=(0,0,1/3,2/3,0)T, Y*=(1/2, 1/2,0,0,0 ) T , VG=5
练习题 “二指莫拉问题”。甲乙二人游戏,每人 二指莫拉问题” 甲乙二人游戏, 二指莫拉问题 出一个或两个手指, 出一个或两个手指,同时又把猜测对方所出 的指数叫出来。如果只有一个人猜测正确, 的指数叫出来。如果只有一个人猜测正确, 则他所赢得的数目为二人所出指数之和, 则他所赢得的数目为二人所出指数之和,否 则重新开始。 则重新开始。写出该对策中各局中人的策略 集合及甲的赢得矩阵, 集合及甲的赢得矩阵,并回答局中人是否存 在某种出法比其它出法更为有利。 在某种出法比其它出法更为有利。
例 4 设赢得矩阵为 3 2 0 3 0 5 0 2 5 9 A= 7 3 9 5 9 求解这个矩 4 6 8 7 5.5 阵对策。 阵对策。 6 0 8 8 3 解: 由于第 行优超第 行,第3行优超第 行,故可划 由于第4行优超第 行优超第1行 行优超第2行 行优超第 去第1行和第 行和第2行 去第 行和第 行,得到新的赢得矩阵 7 3 9 5 9 A1= 4 6 8 7 5.5 6 0 8 8 3 列优超第3列 列优超第4列 对A1第1列优超第 列,第2列优超第 列,1/3×(第1 列优超第 列优超第 ×第 优超第5列 故可划去第3﹑ ﹑ 列 列)+2/3 (第2列)优超第 列,故可划去第 ﹑ 4﹑5列,得 第 列 优超第 到新的赢得矩阵 A2第1行优超第 行优超第 7 3 7 3 A3= 4 6 3行,故划去第 行 A2= 4 6 6 0 3行,得到 行
在定理8中 若纯策略α 不是为α 推论 : 在定理 中,若纯策略 1不是为 2, …,αm中 而是为α 之一所优超 ,而是为 2, …,αm的某个凸线性组合所 优超,定理的结论仍然成立。 优超,定理的结论仍然成立。 例: A= 7 4 6 3 6 0 9 8 8 9 5.5 3 1/3×(第1列)+2/3 ×第 列 (第2列)优超第 列 第 列 优超第4列 优超第
例 3 设G赢得矩阵为 赢得矩阵为
3 A= 5 2
2 2 5
2 3 1
定理8 为矩阵对策, 定理 设G={S1 , S2;A}为矩阵对策,其中 为矩阵对策 S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , , A=(aij)m×n 。如果纯策略 1被α2, …,αm中之一所优 ( 如果纯策略α × 可得到一个新的矩阵对策G′: 超 ,由G可得到一个新的矩阵对策 : G′= {S1 ′, S2; 可得到一个新的矩阵对策 A ′} 其中S 其中 1 ′= {α2, …,αm}, , A ′ =(aij ′)(m-1)×n aij ′= aij , i=2, …,m , ( ) - × j=1,2, …,n ,则⑴V G′ =VG ;⑵ G′中局中人Ⅱ的最优 中局中人Ⅱ 则 中局中人 策略就是其在G中的最优策略 中的最优策略; 策略就是其在 中的最优策略;⑶若(x2*, …, xm*)T是 G′中局中人Ⅰ的最优策略,则x*= (0,x2*, …, xm*)T便 中局中人Ⅰ 中局中人 的最优策略, , 是其在G中的最优策略 中的最优策略。 是其在 中的最优策略。