对策论
运筹学-第15章--对策论
1 8 5 8 5 5*
2 2 3 2 1 1
3 4
9 0
5 2
6 3
5 5*
3
0
max 9 5* 8 5*
可知 ai* j* =5,i*=1,3,j*=2,4.故(α1,β2)(α1,β4)(α2,
β2)(α2,β4)为对策的纳管 什理均运衡,筹 V学G=5.
15
• 最优纯策略求解步骤:
• 1、行中取小,小中取大得最大化最小收益 值;
• 2、列中取大,大中取小得最小化最大支付 值;
• 3、比较两值是否相等。若相等便存在最优 纯策略。若不等,则不存在最优纯策略。
管理运筹学
16
§3 矩阵对策的混合策略
设矩阵对策 G = { S1, S2, A }。当
max
i
min
j
aij
min
j
max
i
aij
时,不存在最优纯策略。
例:设一个赢得矩阵如下:
一个局势,一个局势决定了各局中人的对策结果(量化) 称为该局势对策的益损值。
管理运筹学
3
§1 对策论的基本概念
出赛的次序是一个策略 “齐王赛马”齐王在各局势中的益损值表(单位:千金)
管理运筹学
4
§1 对策论的基本概念
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。
A=[aij]m×n i 行代表甲方策略 i=1, 2, …, m;j 列代表乙方策略 j=1, 2, …, n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下甲方的 益损值。此时乙方的益损值为 -aij(零和性质)。
运筹与优化--对策论
y∈S2*为局中人I和Ⅱ的混合策略,(x,y)为混合局势,
局中人I的赢得函数为 E(x,y)xTAy aix jiyj
称G* ={S1*,S2*,E}为对策G的混合扩充. i j
A
12
设 mm ax E i(x n ,y)mE i(x n *,y)
x S 1 * y S2 *
y S2 *
mm inE a(x,x y)mE a(x,x y*)
注意:G在纯策略下解存在时,定义4中的
VG ;Gai在j 混合策略意义下的解(x*,y*)
存在时,VG=E(x*,y*).
例4. 解矩阵对策 中
3 G6={S1 ,S2 ;A },其
A
5
4
A
14
局中人I取纯策略αi时,其赢得函数为 E(i,y)=∑aijyj ,
局中人Ⅱ取纯策略βj时,其赢得函数为 E(x,j)=∑aijxi .
人I以概率xi≥0取纯策略αi,局中人Ⅱ以概率yj≥0取
纯策略βj ,且
m
xi
1.记,
n
yj 1
i1
j1
m
S 1 {x(x1,x2, ,xm ) E mxi0 , xi1 }
i 1
n
S2 {y(y1,y2, ,yn) E nyj0, yj1 }
j 1
则S1* ,S2*分别称为局中人I和Ⅱ的混合策略集.称x∈S1*,
A
24
推论.如果纯策略α1被纯策略α2 , … αm的凸线 性组合所优超,则定理10的结论仍成立.
由上两式得
E(x,y)=∑E(i,y)xi
(5)
E(x,y)=∑E(x,j)yj . (6)
定理3.设x∈S1*,y∈S2*,则(x*,y*)是G的解的充要条 件是: 对任意i=1,2,…,m 和 j=1,2,…,n,有
《管理运筹学-对策论》
博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。
对策论也称博弈论
对策论也称博弈论,是研究斗争策略的数学理论。
所谓斗争策略是指两个或两个以上参加斗争的各方,具有相互矛盾的利益,为了使自己获胜,他们各自采取对付对方所用的各种可能的办法。
对策论是一门应用性很强的学科,与人们的生产实践有着密切的关系,特别在经济管理、政治和军事方面的作用,已引起了广泛的注意,其处理问题的特殊又吸引着为数不少的数学工作者。
可以举出很多对策论的例子。
如在日常生活中的下棋、打桥牌、猜拳、体育竞赛等,斗争的各方,都各有自己的长处和短处,在竞赛过程中,各方都设法发挥自己的长处,进攻别人的短处,尽一切可能战胜对方。
在军事方面,对策论的例子更是到处可见,进攻和防守,包围与反包围,围剿与反围剿,在国际上侵略与反侵略,封锁与反封锁,目的都是在保存自己,消灭对方。
在经济领域内,国际间的贸易谈判,争夺原料与市场的斗争、限制进口和反限制的斗争。
在国内,各工厂与企业之间的产品竞争,商业上的市场竞争,销售和顾客的讨价还价等等,各方都想在谈判中取胜或在竞争中挤垮对方。
在政治方面,国与国间的外交谈判,国内各政治集团之间的和平谈判,各方都想在谈判中处于有理地位,或在谈判中得到好处。
上面所列举的各种现象,都是相互斗争或竞争的现象,称为对策现象。
对策论就是研究斗争各方如何战胜对方的数学理论。
依照局中人在对策中所能利用的信息总和来分类,如全信息对策等。
在对策模型中,占有重要地位的是二人有限零和对策。
一般也称之为矩阵对策。
在这种对策中,局中人在各种局势下的支付,可以用一个局中人的支付矩阵来表示。
二人有限零和对策是研究得对比完善的一直对策,理论的研究和求解方法都比较完整。
且其理论是研究其他对策模型的基础。
一般地,设矩阵对策{}A P P G ,,21=的支付矩阵为{}mxn ij a A =如果对某个k,存在一个i ,使对每个n j ≤≤1都有:()1,1,1≠≤≤≤≤≤k m i m k a a ij kj 成立,则对局中人1P 而言,策略1A 优于k a 。
对策论
对策论(博弈论) 中文名称:博弈论 英文名称:game theory 定义1:一种处理竞争与合作问题的数学决策方法。 应用学科:地理学(一级学科);数量地理学 (二级学科) 定义2:研究竞争中参加者为争取最大利益应当如何 做出决策的数学方法。 应用学科:生态学(一级 学科);数学生态学(二级学科) 定义3:根据信息分析及能力判断,研究多决策主体 之间行为相互作用及其相互平衡,以使收益或效 用最大化的一种对策理论。 应用学科:资源科技 (一级学科);资源管理学(二级学科)
•
高中概率、排列、组合知识的学习。
• 例2:河南政法 2010A-41)把 9 个苹果分 给 5 个人,每人至少一个苹果,那么不同 的分法一共有多少种?
• A.30 B.40 C.60 D.70
• [强化 1]D • [简析]9 个苹果排成一排,形成 8 个空, 中间插上 4 个挡板,就可以把这 9 个苹果 分成 5 份,并且每份至少 1 个。在 8 个空 中插上 4 个档板:C4/8=70 (种)分法。
• [例 5]B • [简析]挑选 2 个不同的年级有 3种情形, 总共有 5×6+6×3+3×5=63(种)选择。
• [例 9]A • [简析]先插入第一个节目,有 4 个位置, 所以有 4 种方法;再插入第二个节目,此 时有 5 个位置, • 所以有 5 种方法。共有不同安排方法 更多 资料4×5=20 种。
• • 例1:田忌与齐威王赛马并最终获胜被传为 佳话。假设齐威王以上等马、中等马和下 等马的固定顺序排阵,那么田忌随机将自 己的三匹马排阵时,能够获得两场胜利的 概率是( )。福建 (2010-101) • A.2/3 B.1/3 C.1/6 D.1/9
• C • • [简析]田忌随机排布自己的三匹马一共 有 A3 /3种方法,但是只有“下等马、上等 马、中等马”这种唯一的排布可以获得两 场胜利,所以概率为 1/6。
对策论(Theory of Games)
定义
并不是所有的对策都存在鞍点,如 A为齐王的赢得矩阵 3 1 1 1 1 -1 1 3 1 1 -1 1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 -1 1 3 1 1 1 1 -1 1 3 max(min aij)= -1 min (max aij)=3 i j j i
例如:
• 给定矩阵对策
6 5 6 A 1 4 2 8 5 7
对策的最优值为5,对策的解有两个,分 别为局势 , 和 , 。
1 2 3 2
(三)矩阵对策的混合策略
1、矩阵对策的混合策略的定义
2、原则:坏中求好的原则。 3、解的存在:一定有解 4、混合策略求解:利用期望转化成 线性规划问题求解。
三、矩阵对策模型
(一)矩阵对策的概念 (二)矩阵对策的最优纯策略 (三)矩阵对策的混合策略 (四)矩阵对策的解法
(一)矩阵对策的概念 1、矩阵对策的定义 2、建立矩阵对策模型
1、矩阵对策的定义 局中人只有两个,对策中各方只能从有限 的策略集中确定性的选择一种,且对策双 方的支付之和为零的对策称为两人零和纯 策略对策。
表2
齐 王 上中 下 田忌 上中下 3 上下 中上 中 下 1 1 中下 上 -1 下中 上 1 下上 中 1
上下中 1 中上下 1
中下上 1 下中上 1
3 1
1 -1
-1 3
1 1
1 1
3 1
1 -1
1 3
1 1
-1 1
下上中 -1
1
1
1
1
3
引例3
有两个儿童A和B在一起玩“石头-剪子布”游戏。我们规定胜者得1分,负者得 -1分,平手时各得0分。双方选定的各种 出法及相应的结果可由下表列出。双方 应取何种策略?
管理运筹学课件第13章-对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。
对策论
Y X
马鞍面z=x /4马鞍面z=x2/4-y2/6
Y=0的平面上鞍点 Z 在Y=0的平面上鞍点 是z=f(0,y)的极大值点 z=f(0,y)的极大值点
Y X
Z
在X=0的平面上鞍点 X=0的平面上鞍点 z=f(0,y)的极小值点 是z=f(0,y)的极小值点
Y X
例12-3:对给定的矩阵对策 G= {S1,S2;A} 12S 1 = { α1 , α2 , α3 } {α 6 A= 1 8 5 4 5 S 2= { β 1 , β 2 , β 3 } {β 6 2 7
所以局中人I应首先考虑用α 所以局中人I应首先考虑用α 所能赢得 的最小, 的最小,然后在这些最小赢得中选择最 局中人I 大。局中人I可以保证赢得 max
i
min
j
aij
同样,局中人II可以保证局中人I的赢 II可以保证局中人 同样,局中人II可以保证局中人I 得不超过 min max aij
j i
自然条件对于双方 都是已知的。 都是已知的。 基本情况如下: 基本情况如下:从蜡包尔出发开往莱 城的海上航线有南北两条。 城的海上航线有南北两条。通过时间 均为3 均为3天。 气象预报表明:未来3天中,北 气象预报表明:未来3天中, 线阴雨,能见度差;而南线天气晴好, 线阴雨,能见度差;而南线天气晴好, 能见度好。 能见度好。 肯尼将军的轰炸机布置在南线的 机场, 机场,侦察机全天候进行侦察,但有 一定的搜索半径。
i j j I
上式蕴涵的思想是朴素自然的,可 上式蕴涵的思想是朴素自然的, 以概括为: 从最坏处着想, 以概括为:“从最坏处着想,去争 取最好的结果” 取最好的结果”
定义12 定义12-1:对给定的矩阵对策 12G
i
对策论
在日常生活中,经常可以看到一些具有相互斗 争或竞争性质的行为,
如下棋、打牌、体育比赛等 还有企业间的竞争、军队或国家间的战争、政治斗 争等,都具有对抗的性质。
这种具有竞争或对抗性质的行为称为对策行为。
在这类行为中,各方具有不同的目标和利益。为实 现自己的目标和利益,各方必须考虑对手可能采取 的行动方案,并力图选择对自己最为有利或最为合 理的行动方案。
在田忌赛马中
局中人集合I={1,2}
齐王和田忌的策略集合可分别用S1={α1,…,α6}, S2={β1,…,β6}
齐王的任一策略αi和田忌的任一策略βj就构成了一个 局势sij
如果α1 =(上,中,下), β1 =(上,中,下), 则在局势s11下,齐王的赢得为H1(s11)=3,田忌的赢 得为H2(s11)=-3
6 1 8 3 2 4 A 9 1 10 3 0 6
局中人Ⅰ当然也会猜到局中人Ⅱ的这种心理,转而出α4来对 付,使局中人Ⅱ得不到10,反而失掉6; …… 如果双方都不想冒险,都不存在侥幸心理,而是考虑到对方 必然会设法使自己所得最少这一点,就应该从各自可能出现 的最不利情形中选择一个最有利的情形作为决策一句。 这就是所谓的“理智行为”,也是对策双方实际上可以接收 并采取的一种稳妥的方法。
对策问题举例:市场购买力争夺问题
据预测,某乡镇下一年的饮食品购买力将有4000万元。乡镇企 业和中心城市企业饮食品的生产情况是:乡镇企业有特色饮食品 和一般饮食品两类,中心城市企业有高档饮食品和低档饮食品两 类产品。他们购买这一部分购买力的结局表如下。
乡镇企业所得(万元)
乡镇企业 的策略 出售特色饮食品
即局中人Ⅰ、Ⅱ的策略集分别为
对策论专题知识讲座
在甲方旳赢得矩阵中: A=[aij]m×n
i 行代表甲方策略 i=1, 2, …, m;j 列代表乙方策略 j=1, 2, …, n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下 甲方旳益损值。此时乙方旳益损值为 -aij(零和性质)。
在考虑各方采用旳策略时,必须注意一种前提,就是 双方都是理智旳,即双方都是从各自可能出现旳最不利旳 情形选择一种最为有利旳情况作为决策旳根据。
10.4 矩阵对策旳矩阵降维
优超原则:
假设矩阵对策 G ={ S1, S2, A } 甲方赢得矩阵 A=[aij]mn 若存在两行(列),s 行(列)旳各元素均优于 t 行(列)旳元 素,即
asjatj j=1,2 … n ( ais ait i=1,2 … m )
称甲方策略s优超于t ( s优超于t)。
成立时,双方才有最优纯策略,并把(1,2)称为对策G在纯 策略下旳解,又称(1,2)为对策G旳鞍点。把其值V称之为对
策G={S1,S2,A}旳值。
10.3 矩阵对策旳混合策略
设矩阵对策 G = { S1, S2, A }。当
max i
min j
aij
min j
max i
aij
时,不存在最优纯策略。
人对策一样也是对策方在乎识到其他对策方旳存在,意识到其他 对策方对自己决策旳反应和反作用存在旳情况下谋求本身最大利 益旳决策活动。因而,它们旳基本性质和特征与两人对策是相同 旳,我们经常能够用研究两人对策一样旳思绪和措施来研究它们, 或将两人对策旳结论推广到多人对策。
但多人对策中出现了更多旳追求各自利益旳独立决策者,策 略旳相互依存关系也就更为复杂,对任一对策方旳决策引起旳反 应也就要比两人对策复杂得多。
第四讲对策论
计算结果为(保留有效部分)
Global optimal solution found at iteration: 0
Objective value:
5.000000
Variable
Value Reduced Cost
V_A 5.000000
0.000000
X( 1) 0.000000
2.000000
优化建模
例1.1 “石头--剪子--布”中儿童甲的支付函数
乙
石头
剪子
布
石头
0
1
-1
甲
剪子
-1
0
1
布
1
-1
0
优化建模
•当局中人得失总和为零时,称这类对策为零和对策; 否则称为非零和对策。
•当局中人只有两个,且对策得失总和为零,则称为 二人零和对策,若总得失总和为常数,则称为二人常 数和对策,若得失总和是非常数的,则称为二人非常 数和对策。
在对策论中,应有以下要素:
优化建模
(1) 局中人。是指参与对抗的各方,可以是一个人, 也可以是一个集团。在例1.1的甲、乙两名儿童就 是局中人。
(2) 策略。是指局中人所拥有的对付其他局中人的 手段、方案的集合。如例1.1中共有石头、剪子、 布三种策略。
(3) 支付函数(或收益函数)。是指一局对策后各局 中人的得与失,通常用正数字表示局中人的得,用 负数字表示局中人的失。在例1.1的局中人甲的支付 函数如表所示。
j 1
的概率混合使用他的n种策略。
优化建模
当A采用混合策略,B分别采用纯策略
bj(j=1,2, …,n), A的赢得分别为
m
cij xi ( j 1,2,, n)
对策论的名词解释
对策论的名词解释策论,也称策略论,是一种研究人类决策行为和优化选择的学科。
它涉及到许多领域,包括经济学、心理学和社会学等,从而成为一门综合性的学科。
在这篇文章中,我将详细介绍策论的概念、背景、原理以及其在实际生活中的应用。
一、策论的概念策论是研究个体和群体在信息不完全和互动条件下进行决策的理论。
它关注的是个体在面对有限的资源和不确定的环境下,如何制定最优化选择,以最大化自身利益的问题。
在策论中,人们通常假设决策者是理性的,并且可以预测他们的选择。
二、策论的背景策论源于经济学中对人类决策行为的研究,特别是涉及到不完全信息和决策互动的情况。
经济学家认识到,在现实生活中,决策者经常面临信息不对称、风险和竞争等问题,这些因素都会影响他们的决策过程和结果。
因此,策论的出现填补了传统经济学中的一些缺失,使我们能够更好地理解人类决策行为。
三、策论的原理策论的核心原理主要包括两个方面:信息和行动。
信息是决策者进行决策所拥有的可获得知识,行动是指决策者基于信息所采取的具体行为。
在策论中,决策者通常面临信息不完全的情况,而且他们的决策还会受到其他决策者的行为影响。
因此,策论研究的重点是如何在有限信息和复杂环境中做出最优决策。
四、策论的应用策论在实际生活中有着广泛的应用。
首先,在经济领域中,策论被广泛运用于市场分析、定价和竞争策略等领域。
例如,在拍卖市场中,卖家和买家需要通过策论的分析来确定最佳的定价和出价策略。
此外,策论还可以应用于金融领域的投资决策、风险管理和资产定价等方面。
其次,在政治学和社会学领域,策论可以解释个体和群体在政治和社会环境中做出的决策。
例如,策论可以帮助我们理解政治选举中的选民行为,以及政府在制定政策时所面临的困境和选择。
此外,策论还可以应用于战略决策、谈判过程和合作策略等问题的研究。
最后,在行为经济学和心理学中,策论也有着广泛的应用。
策论可以帮助我们理解决策者在面临风险和不确定性时的行为,以及他们在不同情境下的决策偏差和错误。
对策论的基本概念
对策论的基本概念引言对策论是一种重要的决策理论,它在多个领域,包括经济学、政治学、管理学等方面都有广泛的应用。
本文将介绍对策论的基本概念,包括对策、对策矩阵、纳什均衡等内容。
对策的定义对策是指在决策过程中,一方的行动将受到另一方行动的影响,从而引发一系列后续行动的反应。
对策是一种针对不确定性情况下的最佳决策方法,通过预测对手的可能行动并制定相应的应对策略来实现最优效果。
对策通常涉及两个或多个决策者之间的互动。
在对策中,每个决策者都试图通过选择最优的行动来达到自己的目标,同时也要考虑到对手的行动。
对策矩阵是对策论分析的基本工具之一,用于描述对策者在不同行动下的收益情况。
对策矩阵通常以表格形式呈现,横轴代表一个决策者的行动,纵轴代表另一个决策者的行动,每个单元格中的数值表示在特定行动组合下各方的收益。
例如,考虑两个决策者A和B在某个游戏中的对策矩阵如下:行动1 行动2 行动3行动1 2, 2 0, 3 1, 1行动2 1, 0 3, 2 2, 1行动3 1, 1 2, 2 0, 3在这个对策矩阵中,每个单元格表示A和B在特定行动组合下的收益情况。
例如,当A选择行动1,B选择行动2时,A的收益为0,B 的收益为3。
纳什均衡是对策论中的一个重要概念,指的是在对策矩阵中,各方在给定对手行动的情况下,选择能够最大化自己收益的行动组合。
在对策矩阵中,如果不存在更好的选择来取代当前的行动组合,那么该组合就是一个纳什均衡。
在纳什均衡下,每个决策者都无法通过改变自己的行动来获得更好的结果。
以前面的对策矩阵为例,在该矩阵中,行动组合(行动1, 行动2)是一个纳什均衡,因为在这种情况下,A选择行动1,B选择行动2时,双方的收益已经达到最大化。
结论对策论是一种重要的决策理论,可以应用于各种领域,帮助我们理解和分析决策者之间的互动和冲突。
本文介绍了对策的基本概念,包括对策、对策矩阵和纳什均衡。
了解对策论的基本概念将有助于我们更好地理解和解决复杂的决策问题。
运筹学-第六讲对策论
【定义 】 在对策G={S1,S2…,Sn;h1,h2…hn}中,假如由各个对策方旳各 选用一种策略构成旳某个策略组合(S1*,S2*…,Sn*)中,任一对策方i 旳策略 Si*,都是对其他策略方策略旳组合 (S1*,…,S*i-1,S*i+1…,Sn*)旳最佳策略, 即h i(S1*, … , S*i-1, Si*, S*i+1,…Sn*)≥hi(S1*, …, S*i-1, Sij, S*i+1 , …, Sn*)对任意 Sij∈Si 都成立,则称(S1*,…,Sn*)为G旳一种纯策略意义下旳“纳什均 衡”(Nash Equilibrium).
(2,0)
(4,0)
反应函数法
对策论 game theory
【例4】 考虑上述模型旳另一种情况即各厂商所选择旳是价格而不是产量,假 设产量与价格旳函数关系为:
q1 ( p2 ) a1 b1 p1 d1 p2
q2 ( p1 ) a2 b2 p2 d 2 p1
其他条件不变,边际成本为C1、C2,试求解其纳什均衡。
P2
R2 ( p1 )
1 2b2
(a2
b2 c2
d 2 p1 )
p1*
p2*
1 2b1 1 2b2
(a1b1c1ຫໍສະໝຸດ d1p* 2
)
(a2 b2c2 d 2 p1* )
P1*
d1 4b1b2 d1d 2
(a2
b2c2 )
2b2 4b1b2 d1d 2
(a1
b1c1 )
P2*
d2 4b1b2 d1d 2
Nash对对策论旳贡献有: (i) 合作对策中旳讨价还价模型,称为Nash讨价还价解; (ii) 非合作对策旳均衡分析。
第10章对策论
i
( j = 1, 2," , m )
然后再找出各最大值中的最小值(最优支付)
min(max α ij ) = min α i* j = V2
j i j
这里 V2 = 2 我们把甲的最优赢得和乙的最优支付的这个公共值,称为矩阵对策的值,记作 VG , 即:
VG = max(min α ij ) = min(max α ij )
10.2 矩阵对策
矩阵对策就是有限零和二人对策,指的是参加对策的局中人只有两方(或二人) , 每一方局中人的可供选择策略数是有限多个,而且每一局对策结束时,一方的收入(或 赢得)等于另一方的支出(或称输出) ,换句话说,二方得失之和总是等于零。这类对 策比较简单,理论上也比较成熟,在实践中应用的也极为广泛。由于矩阵对策的理论奠 定了研究“对策现象”的基本思路,所以它是对策论中必须掌握的内容。 10.2.1 矩阵对策的数学模型 对于矩阵对策,我们用甲、乙表示两个局中人,假设甲有 m 个策略(又称纯策略) , 分别以 α1 , α 2 ," , α m 表示,乙有 n 个策略,分别以 β1 , β 2 ," , β n 表示。根据对策规定,若 (a , β ) 甲选用第 i 个策略,乙选用第 j 个策略,则称 i j 为一个纯局势,那么,甲的赢得可 以用 α ij 表示(若 α ij 是负数时,表示甲是支出而不是收入)。于是,甲的支付可以列成表
min α ij = α ij*
j
( i = 1, 2," , m )
然后在这些最小值中找到最大值(最优赢得) , 即:
max(min α ij ) = max α ij* = V1
i j i
在本对策 G 中, V1 = 2 局中人乙则和甲相反, 他的原则首先是在各纯策略 (列) 中找出最大值 (可靠支付) :
第三章-对策论
纳什简介
1994年诺贝尔经济学奖获得者, 纳什在普林斯顿读博士时刚刚20岁出 头,他的一篇关于非合作对策的博士 论文和其他两篇相关文章确立了他博 奕论大师的地位。到上世纪50年代末, 他已是闻名世界的大牌科学家了。
然而,正当他的事业如日中天的时候,天妒英才,他得了 严重的精神分裂症。多亏前妻艾莉西亚的爱心呵护和普林 斯顿大学诸多朋友和同事无私的帮助才没有使他流落街头, 并最终把他推上诺贝尔经济学奖宝座(1994年获奖)。
一、纯策略与混合策略 二、纯策略对策 三、混合策略对策
一、纯策略与混合策略
纯策略是指确定的选择某策略;而混合策略 则指以某一概率分布选择各策略。
§2 二人有限零和对策
一、纯策略与混合策略 二、纯策略对策
引例 纯策略分析 纯策略对策模型的解 优超原理
三、混合策略对策
二、纯策略对策
1. 引例
例 设一对策 G S, D, A,其中 S s1, s2 , s3,
{坦白,抵赖}
(3)局势
坦白 抵赖
坦白 抵赖 -9,-9 0,-10 -10,0 -1,-1
当每个局中人从各自策略集合中选择一策略而组 成的策略组成为一个局势,用 (si , d j )来表示。
(4)赢得(支付)
局中人采用某局势时的收益值。
例:当局中人甲选择策略si ,局中人乙选策略 dj 时,局中人甲的赢得值可用 R甲(si , d j )表示。
D d1, d2 , d3 ,其赢得矩阵为:
d1 d2 d3
A
s1 s2
3 6
1 0
2 - 3
s3 - 5 - 1 4
前提: 对策双方均理智
结论: 最不利中选最有利
问:双方局中人采用何策略最佳。
第十二章-对策论(运筹学讲义)课件
局中人2 出1指
5 -5
出2指 -5 5
局中人1从局中人2该如何选择策略,已获得利益?
-
3
例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在 不同的屋子里审讯。警察告诉他们: 如果两人都坦白,各 判刑8年;如果两人都抵赖,由于证据不充分,两人将各 判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者 立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯 都有两种策略: 坦白或抵赖。可以用一个矩阵表示两个嫌 疑犯的策略的损益
3.一局势对策的益损值: 局中人各自使用一个对策就形成了一 个局势,一个局势决定了各局中人的对策结果(量化)称 为该局势对策的益损值。
赢得函数(payoff function): 定义在局势上,取值为相应益 损值的函数
4. 纳什均衡: 纳什均衡指所有局中人最优策略组成的一种局势,
既在给定其他局中人策略的情况下,没有任何局中人有积
A
1
4
3
2
解因
m i a x m j in a ij 2 , m j in m i a x a ij 3
m a ixm jina ij m jinm a ixa ij
不符合鞍点条件, 故G的鞍点不存在。
例6 求解矩阵对策,其中: 解 容易得到
A 11
0 1
1 1
v a i * j * 1i * 1 ,2 ;j * 3
A
a
2
1
a22
a1m
a2
m
a
m
1
am2
amn
aij为局中人甲在局势
( i , j )下的赢得 -
9
“齐王赛马”是一个矩阵策略。
其中: 齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 },
对策论三要素
对策论三要素
对策论是指在面对问题或挑战时,制定出明确的对策和计划,以应对种种可能出现的情况。
而对策论的三要素是指目标、方法和资源。
首先,对策论的第一个要素是目标。
制定明确的目标是对策论的基础。
只有清楚地知道自己要达成什么目标,才能更有针对性地制定出相应的对策。
比如,如果企业要提高销售额,那么制定的对策就应该围绕如何吸引更多的顾客、如何提高产品的市场竞争力等方面展开。
目标的明确性和可操作性对于制定对策至关重要。
其次,对策论的第二个要素是方法。
制定对策需要有清晰的方法和步骤。
这就需要对问题进行全面的分析和研究,以找出最有效的解决方法。
比如,如果一个政府部门要解决交通拥堵问题,就需要从道路规划、公共交通建设、交通管理等方面综合考虑,找出最适合的解决方法。
方法的科学性和实用性是对策论成功与否的关键。
最后,对策论的第三个要素是资源。
没有足够的资源,再好的对策也无法顺利实施。
资源包括人力、物力、财力等方面。
比如,一个组织要实施一个新的项目,就需要充足的人力资源、资金支持以及物质设备等。
只有足够的资源支持,对策才能得以有效实施。
总的来说,对策论的三要素——目标、方法和资源,是相辅相成、缺一不可的。
只有制定明确的目标,找出科学的解决方法,再加上充足的资源支持,对策才能最终取得成功。
在面对各种问题和挑战时,我们都可以运用对策论的三要素,制定出更加有效的解决方案。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当美军获悉此情报后,美军统帅 麦克阿瑟命令太平洋战区空军司令肯 尼将军组织空中打击。 山本五十六清楚的知道:在日本 舰队穿过俾斯麦海的三天航行中,不 可能躲开美军的空中打击,他想做到 的是尽可能减少损失。 日美双方的指挥官及参谋人员都 进行了冷静的思考与全面的谋划。
2013年6月28日星期五 绍兴文理学院 18
自然条件对于双方都是已知的。 基本情况如下:从蜡包尔出发开往莱 城的海上航线有南北两条。通过时间 均为3天。 气象预报表明:未来3天中,北线 阴雨,能见度差;而南线天气晴好, 能见度好。 肯尼将军的轰炸机布置在南线的 机场,侦察机全天候进行侦察,但有 一定的搜索半径。
2013年6月28日星期五 绍兴文理学院 29
•所以局中人I应首先考虑用每个i所能赢 得的最小是多少,然后在这些最小赢得中 选择最大。局中人I可以保证赢得 p = max{ min { aij } }
i j
最优策略
j i
•同样,局中人Ⅱ可以保证局中人I的赢得 不超过 q = min{ max { aij } }
2013年6月28日星期五 绍兴文理学院 16
与经济学的关系
矩阵对策的基本概念
案例:俾斯麦海的海空对抗 1943年2月,第二次世界大战中的 日本,在太平洋战区已经处于劣势。 为扭转局势,日本海军统帅山本五十 六大将要策划了一次军事行动:统率 一支舰队从其集结地——南太平洋的 新不列颠群岛的勒鲍尔出发,穿过俾 斯麦海,开往新几内亚的莱城,支援 困守在那里的日军。
井 字 棋
2013年6月28日星期五
┃ ━╋━╋━ ┃ ┃ ━╋━╋━ ┃ ┃ 先者可不输 →围棋
绍兴文理学院
抢中, 对手? ┃
五子棋
10
• “田忌赛马” • 华容道:曹操在赤壁之战大败而逃时,先后遭 到吴、蜀多名战将的围追堵截,…… • 二战中,1943年2月美军获悉日本舰队的企图, 分析日舰可能走两条航线(N,S),美军拦截也有 日 两种方案(N,S). N S 四种可能情况中美 美 军赢得的轰炸时间: N 2 2 (俾斯麦海的海战)
2013年6月28日星期五 绍兴文理学院 14
纳什(John Nash)
2005.10.10.瑞典皇家科学院宣布,将今年诺贝尔经 济学奖授予罗伯特.奥曼(以、美)和托马斯.谢林(美) , 以表彰他们在博弈论领域所作出的贡献。 诺贝尔评奖委员会说,这两位经济学家"通过对博 弈论的分析,加强了我们对冲突和合作的理解"。 奥曼(75岁),出生于 德国法兰克福,现任耶路 撒冷希伯来大学教授和美 国纽约州立大学斯坦尼分 校教授。 谢林(84岁),曾任美 国哈佛大学肯尼迪学院、 马里兰大学公共政策学院 和经济系教授。 15 2013年6月28日星期五
绍兴文理学院 26
2013年6月28日星期五
有限零和二人对策
•在这几个例中的每一个对局,双方的赢得 的代数之和为零,这样的对策称为“有限 零和二人对策”。
•设两个局中人为I,Ⅱ;
•局中人Ⅰ有m个策略:1 ,2 ,…,m ;用S1 表示这些策略的集合:S1={1 ,2 ,…,m } •局中人Ⅱ有n个策略:β1,β2,…,βn;用 S2表示这些策略的集 合:S2={β1,β2,…,βn}
p=q时的最优纯策略
aij*≤ai*j*≤ ai*j [鞍点] (P.330例2。)
2013年6月28日星期五 绍兴文理学院 33
•某单位采购员在秋天时要决定冬天取暖 用煤的采购量。已知在正常气温条件下需 要用煤15吨,在较暖和较冷气温条件下需 要用煤10吨和20吨。假定冬季的煤价随着 天气寒冷的程度而变化,在较暖、正常、 较冷气温条件下每吨煤价为100元、150元、 200元。又秋季每吨煤价为100元。在没有 关于当年冬季气温准确预报的情况下,秋 季应购多少吨煤,能使总支出最少?
i j j i
上式蕴涵的思想是朴素自然的,可以概 括为:“作最坏的打算,努力去争取最 好的结果”。
2013年6月28日星期五 绍兴文理学院 31
p=q时的最优策略
定义14-1:对给定的矩阵对策 G = { S1 , S2 , A } 若等式 max min aij = min max aij
i j j i
绍兴文理学院
2013年6月28日星期五
27
有限零和二人对策 •局中人Ⅰ选第i个策略 ,局中人Ⅱ选第j
个策略βj局中人I的益损值是aij: •局中人I的赢得矩阵是:A=(aij),(Ⅱ是-A) a11 a12 …… a1n
i
a21
A= …… am1
2013年6月28日星期五
a22
am2
绍兴文理学院
2013年6月28日星期五 绍兴文理学院 23
赢得矩阵(支付):当各局中人使用 一定策略形成一个局势,这个局势决 定了各局中人的对策的结果。局中人 各选择某策略后,他们获得相应的收 益或损失,此收益或损失的值称为赢 得(支付)。赢得与策略之间的对应 关系称为赢得(支付)函数。 案例中,肯尼将军与山本五十六大将 的赢得(支付)函数分别可以用矩阵A、 B表示。
•定理:p≤q
2013年6月28日星期五 绍兴文理学院 30
p=q时的最优策略
•案例中局中人I(美军)应当选择(北 线)策略1,这样能保证赢得2。局中人 Ⅱ(日军)应当选择(北线)策略1使 盟军赢得不超过2。实际上,在(1,1) 局势下,有 max min aij = min max aij
冯‧诺依曼
13
•1950年的博士论文《Non-cooperative Games非 合作的对策》第一个区分了非合作对策与合作对 策,并提出了非合作对策的“Nash equilibrium 纳什平衡 ”。 •1958年,30岁的纳什开始患 病,在他和家人的共同努力下 最终康复了。著名电影《美丽 心灵》即以此为素材。 •1994年与另两人分享了当年 的诺贝尔经济奖,以奖励他们 在非合作对策论中平衡分析方 面的先驱性工作。
S2 益损值 S1
田忌赛马
α1(上中下) α2(上下中) α3(中上下) α4(中下上) α5(下上中) α6(下中上)
β1 β2 β3 β4 β5 β6 (上中下) (上下中) (中上下) (中下上) (下上中) (下中上) 3 1 1 1 -1 1 1 3 1 1 1 -1 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3
2013年6月28日星期五 绍兴文理学院
对策论的实例
S
1
3
12
•美籍匈牙利科学家[本 科是学化学的] :计算 机的鼻祖。1944年与 他人合著《对策论与 经济行为》是公认的 对策论的经典著作, 被称为奠基人。
2013年6月28日星期五 绍兴文理学院
(von Neumann John) 1903-1957
绍兴文理学院
奥曼和谢林分享今年 诺贝尔经济奖
• 博弈论以前并不是经济学的一个分支,它只是 一种方法,所以更多人将其看成一个数学的分 支。博弈论已经在政治、经济、生物、军事、 外交和社会学领域有了广泛的应用,它为解决 不同实体的冲突和合作提供了一个宝贵的方法。 • 在对参与者行为研究这一点上,博弈论和经济 学家的研究模式完全一样。经济学越来越转向 人与人关系的研究,特别是人与人之间行为的 相互影响和相互作用,人与人之间利益和冲突、 竞争与合作,而这正是博弈论的研究对象。
2013年6月28日星期五 绍兴文理学院 34
例14-2
例14-2解
•局中人I(采购员)有三个策略: 策略1:10(吨),策略2:15,策略3:20。 •局中人Ⅱ(环境)也有三个策略: 策略1较暖,策略2正常,策略3较冷 •现把该单位冬天取暖用煤全部费用(秋 季购煤费用与冬天不够时再补购的费用 之和)作为采购员的赢得矩阵。
2013年6月28日星期五 绍兴文理学院 19
经测算,双方均可得到如下估计: 局势1:美军的侦察机重点搜索北线, 日本舰队也恰好走北线。由于气候 恶劣,能见度差,美军只能实施两 天的轰炸。 局势2:美军的侦察机重点搜索北线, 日本舰队走南线。由于发现晚,尽 管美军的轰炸机群在南线,但有效 轰炸也只有两天。
对策论 (博弈论)
绍兴文理学院用
2013年6月28日星期五 绍兴文理学院 2
引理
最小
最大
行最小
1.75 1.62 1.90 1.63
1.76 1.75 1.65 1.78
1.83 1.84 1.64 1.77
i
1.75 1.62 1.64 1.63
j
列最大
1.90 1.78 1.84 1.75<1.78
2013年6月28日星期五 绍兴文理学院 22
对策的三要素: 局中人(player):参与对抗的各方。有权 决定自己行为方案的对局参加者称为局 中人。上述案例中,美日双方决策者为 局中人。当对局中只有两局中人时,称 为二人对策,多于两人时叫多人对策。 策略(strategies):可供局中人选择的对付 其它局中人的行动方案。对局中一个实 际可行的方案称为一个策略。上述案例 中,美日双方各有二个策略。 策略集:局中人可选的策略的全体。
2013年6月28日星期五 绍兴文理学院 24
美军的益损矩阵 (日军) 北线 南线 北线 (美军) 南线 日军的益损矩阵 北线 (美军) 南线
2013年6月28日星期五
2 1
2 3
=A
(日军) 北线 南线
-2 -2 = B = -A -1 -3
绍兴文理学院 25
• 局中人为:齐王和田忌; • 两人的策略集中各有六个策略S1,S2; • 齐王的益损值如下表:
Games),又称博弈论,是使用严谨 的数学模型研究冲突对抗条件下最 优决策问题的理论,是研究竞争的 逻辑和规律的数学分支。简单地说, 对策是决策者在竞争场合下作出的 决策。对策论是研究对策的理论与 方法。它既是现代数学的新分支, 也是运筹学的一个重要课题。