运筹学:对策论基础
运筹学-第15章--对策论
1 8 5 8 5 5*
2 2 3 2 1 1
3 4
9 0
5 2
6 3
5 5*
3
0
max 9 5* 8 5*
可知 ai* j* =5,i*=1,3,j*=2,4.故(α1,β2)(α1,β4)(α2,
β2)(α2,β4)为对策的纳管 什理均运衡,筹 V学G=5.
15
• 最优纯策略求解步骤:
• 1、行中取小,小中取大得最大化最小收益 值;
• 2、列中取大,大中取小得最小化最大支付 值;
• 3、比较两值是否相等。若相等便存在最优 纯策略。若不等,则不存在最优纯策略。
管理运筹学
16
§3 矩阵对策的混合策略
设矩阵对策 G = { S1, S2, A }。当
max
i
min
j
aij
min
j
max
i
aij
时,不存在最优纯策略。
例:设一个赢得矩阵如下:
一个局势,一个局势决定了各局中人的对策结果(量化) 称为该局势对策的益损值。
管理运筹学
3
§1 对策论的基本概念
出赛的次序是一个策略 “齐王赛马”齐王在各局势中的益损值表(单位:千金)
管理运筹学
4
§1 对策论的基本概念
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。
A=[aij]m×n i 行代表甲方策略 i=1, 2, …, m;j 列代表乙方策略 j=1, 2, …, n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下甲方的 益损值。此时乙方的益损值为 -aij(零和性质)。
运筹学[第十四章对策论基础]山东大学期末考试知识点复习
第十四章对策论基础1.对策行为具有对策行为的模型称为对策模型或对策,包含三个基本要素。
(1)局中人:在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。
用I表示局中人的集合,若有n个局中人,则I={1,2,…,n},一般要求一个对策中至少要有两个局中人。
(2)策略集:一局对策中,可供局中人选择的一个实际可行的完整的行动方案,称为一个策略。
参加对策的每一个局中人i,i∈I,都有自己的策略集S,i一般每个局中人的策略集中至少应包括两个策略。
(3)赢得函数(支付函数):在一局对策中,各局中人所选定的策略形成的策是第i个局中人的一个策略,则n个局中人的策略组略组称为一个局势,即若Sis=(s1,s2,…s)n为一个局势,全体局势的集合S可用局中人策略集的笛卡尔积表示,即S=S1×S2×…×Sn当一个局势出现后,对策的结果也就确定了,∀s∈S,局中人i可以得到一个赢得Hi(s),Hi(s)为局势s的函数,称之为第i个局中人的赢得函数。
一般当这三个基本因素确定后,一个对策模型也就给定了。
2.最优混合策略的求解方法(1)2×2对策的公式法。
2×2对策是局中人I的赢得矩阵为2×2阶的,即若A不存在鞍点,为求最优混合策略可求下列等式组:(2)2×n或m×2对策的图解法。
设缩减后的赢得矩阵为2阶无鞍点对策问题,设局中人工的混合策略为(x,1-x)T,局中人Ⅱ的混合策略(y,1-y)T。
即则赢得期望值为局中人Ⅰ的期望方程为将①和②式用图形绘出,两图形中的V值先取小然后取大,所得点的坐标即为局中人Ⅰ的最优混合策略。
将③和④式用图形绘出,两图形中的V值先取大然后取小,所得点的坐标即为局中人Ⅱ的最优混合策略。
(3)线性方程组法。
确定对策的解。
若上述方程组存在非负解x*和y*,则便求得对策的一个解(x*,y*);若求出的解中有负的分量,则无对策的解;若x*和y*。
运筹学第9章 对策论
3. 赢得函数(支付函数)(payoff function)
一个对策中,每一个局中人所出策略形成的策略 组称为一个局势。 即设 s i 是第 i 个局中人的一个策略, 则n个局中人的策略形成的策略组 s ( s1 , s2 ,, sn )
s 就是一个局势。
在“齐王VS田忌赛马”中,
齐王有6个策略: 2 ( 上,下,中)、 1 (上,中,下)、 4 (中,下,上)、 5 ( 下,上,中)、
1 2
设局中人I采用纯策略 1和 2的概率 分别为 x1 和 x2 ,x1 x2 1, x1,2 0 设局中人II采用纯策略 1和 2的概率 分别为 y1 和 y2 ,y1 y2 1, y1,2 0
SI 1 , 2 设局中人I的策略集原来为: 那么在没找到纯策略的前提下,局中人I的策略集变为: 局中人I的策略 SI X ( x1, x2 )T x1 x2 1, x12 0 有无穷多个 S II 1 , 2 设局中人I的策略集原来为: 那么在没找到纯策略的前提下,局中人II的策略集变为:
当一个局势 s 出现后,每一局中人就会面对
一个赢得值或损失值,记作 Hi (s)。
Hi (s) 是定义在局势上的函数,
所以称为局中人 i 的赢得函数。
通常的分类方式有: (1) 根据局中人的个数,分为二人对策和多人对策; (2) 根据各局中人的赢得函数的代数和是否为零,分 为零和对策与非零和对策; (3) 根据各局中人间是否允许合作,分为合作对策和 非合作对策; (4) 根据局中人的策略集中的策略个数,分为有限对 策和无限对策等等。
max VG X 1 E ( X 1 , 1 ) E ( X 1 , 2 ) X 2 E ( X 2 , 1 ) E ( X 2 , 2 ) 5 x1 8 x2 VG E s . t . X 3 E ( X 3 , 1 ) E ( X 3 , 2 ) 9 x1 6 x2 VG x x 1 , x , x 0 1 2 1 2
《运筹学》教材编写组《运筹学》笔记和课后习题(含考研真题)详解(对策论基础)
圣才电子书 十万种考研考证电子书、题库视频学习平台
(2)2× 或 ×2 对策的图解法
注意:该方法用在赢得矩阵为 2× 或 ×2 阶的对策上特别方便,也可用在 3× 或
×3 对策上。但对 和 均大于 3 的矩阵对策就丌适用了。
设缩减后的赢得矩阵为二阶无鞍点对策问题,局中人Ⅰ的混合策略为
的最优纯策略。 定理 1 矩阵对策 使得对一切
在纯策略意义下有解的充分必要条件是:存在纯局势
,均有
。
定义 2 设
为一个定义在
及
上的实值函数,如果存在
,使得对一切
和
,有
,则称
为
函数 的一个鞍点。 矩阵对策解的性质:
性质 1 无差别性。即若 性质 2 可交换性。即若
也是解。 定义 3 设有矩阵对策
记
是对策 G 的两个解,则
定理 11 设矩阵对策
的值为 ,则
6.矩阵对策的解法 (1)2×2 对策的公式法 所谓 2×2 对策是指局中人Ⅰ的赢得矩阵为 2×2 阶的,即
如果 A 有鞍点,则很快可求出各局中人的最优纯策略;如果 A 没有鞍点,为求最优混 合策略可求下列等式组:
上面等式组(Ⅰ)和(Ⅱ)一定有严格非负解
和
,其中
6 / 33
是对策 G 的两个解,则
和
,其中
,
,
则 和 分别称为局中人Ⅰ和Ⅱ的混的混合策略(或策略);对
,称
为一个混合局势(或局
势),局中人Ⅰ的赢得函数记成
这样得到的一个新的对策记成
,称 为对策 G 的混合扩充。
定义 4 设
是矩阵对策
的混合扩充,如果
3 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
运筹学课件 第六章对策论基础
– 局中人(参与人) —二人或多人 – 行动与策略—有限或无限 – 信息—完全或不完全 – 支付函数—可正可负
一、基本概念与名词
• 局中人 • 策略与策略集 • 局势 • 赢得函数 • 零和对策 • 矩阵对策:二人有限零和对策
二、对策分类
矩阵混合对策问题的解
X (0,0,1 / 3,2 / 3,0) Y (1 / 2,1 / 2,0,0,0) V 5
T
T
相关定理
记T(G)为矩阵对策G的解集
定理1 设有两个矩阵对策 G1={S1,S2,A1}, G2={S1,S2,A2}, 其中A1=(aij), A2=(aij+L), L为一任意常数,则
– 支付函数—赢了得一千金,输了付一千金。
齐王赛马赢得函数
田 忌 (上中下) 1 (上下中) 2
齐 (中上下) 3 王 (中下上) 4 (下中上) 5 (下上中) 6
1 2 3 4 5 6
3 1 1 -1 1 1 1 3 -1 1 1 1 1 1 3 1 -1 1 1 1 1 3 1 -1 1 -1 1 1 3 1 -1 1 1 1 1 3
• 划去普遍较大的列,例如第3、4、5三列, 结果如上。
进一步化简
• 上述结果的第一行比第三行普遍更优,因 此再划去第三行,得 1 2
3 7 3 A 4 4 6
• 若混合策略均不为零,由上述定理知混合 对策问题数学模型的不等式应为等式。因 此有
第二步 用方程组求解
分析上述例子
• 因为 max min{aij } 2, min max{aij } 3 j j i i • 所以 max min{aij } min max{aij }
《运筹学教学资料》ch14对策论
寡头垄断市场上的价格竞争案例中,存在几 家大型企业,它们通过价格策略来争夺市场 份额。如果企业都选择降价,将导致价格战; 如果都选择维持高价,将获得更多利润。但 企业往往会选择降价来争夺市场,最终导致 双方受损。
THANK YOU
感谢聆听
纯策略均衡
在纳什均衡中,每个参与者都采用单 一策略。如果所有参与者的纯策略组 合构成纳什均衡,则称为纯策略均衡。
混合与者以一定的概率分布随机选择不同的策略,使得对手无法通过预测获 得优势。在混合策略均衡中,每个参与者的预期收益达到相对稳定的状态。
混合策略纳什均衡
在经济学中,帕累托前沿表示在所有可能的资源配置中,能够使得所有
玩家的利益都得到最大化的配置集合。帕累托前沿用于衡量资源配置的
效率和公平性。
03
应用
纳什均衡和帕累托前沿是评价博弈结果和资源配置的重要工具,可以帮
助理解在竞争和合作中的最优选择和资源配置问题。
04
多人对策
合作博弈与非合作博弈
合作博弈
参与者通过合作达成协议,以最 大化共同利益。合作博弈强调联 盟和集体行动,通常使用夏普里 值来分配收益。
运筹学教学资料
目
CONTENCT
录
• 对策论简介 • 二人有限零和对策 • 二人有限非零和对策 • 多人对策 • 对策论案例分析
01
对策论简介
对策论的定义与特点
定义
对策论,也称为博弈论,是研究决策主体在相互竞争、对抗或合 作中的行为和决策的数学分支。
特点
对策论强调理性个体之间的策略互动,通过数学模型描述和预测 主体之间的行为和结果,为决策者提供最优策略和解决方案。
对策论的应用领域
01
02
管理运筹学课件第13章-对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。
教案_对策论基础
2020/12/5
• 齐王的赢得矩阵(支付矩阵)A
3
1
1
1
1
-1
1
3
1
1
-1
1
•
A=
1
-1
3
1
1
1
-1
1
1
3
1
1
1
1
-1
1
3
1
1
1
1
-1
1
3
• 田忌的赢得矩阵是什么?
2020/12/5
锤头、剪刀、布游戏
• 设游戏双方为甲、乙,则甲的赢得
乙
甲的赢得
包
剪
锤
甲
包
0
-1
1
剪
1
0
-1
锤
2020/12/5
博弈现象
下棋与打牌 体育比赛 战争 市场进入 谈判 生产管理决策 竞拍
2020/12/5
几个典型的博弈案例
• 锤子、剪刀、布的儿童游戏 • 囚徒困境 • 智猪博弈 • 强盗分金币
2020/12/5
一、基本概念与名词
• 局中人 • 策略与策略集 • 局势 • 赢得函数 • 零和对策 • 矩阵对策:二人有限零和对策
运筹学
2020/12/5
第六章 对策论基础
• 概论 • 矩阵对策的基本理论
2020/12/5
第一节 概论
• 对策与决策 • 决策是由单方做出的 • 对策是由利害冲突的多方做出的 • 1944年,Von Neumann &
D.Morgenstern合作出版《对策论与经济 行为》,标志着对策论的诞生
S 1 { a 1 ,a 2 , ,a m } S 2 ,{ 1 ,2 , ,n }
运筹学教学-对策论公开课获奖课件百校联赛一等奖课件
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1
布
1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}
运筹学第十章
共八十四页
在纯策略下有解的矩阵对策(duìcè)的解 法
解法的思想(sīxiǎng):双方都立足在不利的情况下争取最好 的结果─最大最小原则。
例 求解矩阵对策 G ={S1,S2;A},其中:
7 1 8
A
3
2
4
16 1 3
3 0 5
共八十四页
解:
max aij
i
1 2 3
1 7 1 8
共八十四页
第1节 引言(yǐnyán) 1.1 对策行为和对策论
对策行为是指具有(jùyǒu)竞争或对抗性质的 行为,在这类行为中,竞争对手可能采取的 各种策略是清楚的;各方一旦选定了自己 的策略,竞争结果就清楚了,竞争结果可 以定量描述;双方都希望取得最好的结果 而且十分清楚对方也想达到同样的目的。
S1 ={α1,α2…,αm} S2 ={β1,β2,…βn}
共八十四页
为了与后面的概念区分开来,称αi为I的 纯策略,βj为II的纯策略,对于(duìyú)纯策略
构 成的局势(αi,βj)称为纯局势。
共八十四页
局中人I的赢得(yíngdé)矩阵记 为
a11 a12
a1 j
a21
a22
a2 j
金,田忌要输3千金。田忌的谋士建议田忌在赛前先探
听齐王赛马的出场次序,然后用自己的下马对齐王的上 马,用中马对齐王的下马,用上马对齐王的中马。结果
(jiē guǒ)负一局胜两局赢得1千金。由此看来,两个人各 采取什么样的出马次序对胜负是至关重要的。
共八十四页
1.2 对策(duìcè)模型的三要素
我们称具有对策(duìcè)行为的模型为对策(duìcè) 模型或
min j
aij
运筹学-第六讲对策论
【定义 】 在对策G={S1,S2…,Sn;h1,h2…hn}中,假如由各个对策方旳各 选用一种策略构成旳某个策略组合(S1*,S2*…,Sn*)中,任一对策方i 旳策略 Si*,都是对其他策略方策略旳组合 (S1*,…,S*i-1,S*i+1…,Sn*)旳最佳策略, 即h i(S1*, … , S*i-1, Si*, S*i+1,…Sn*)≥hi(S1*, …, S*i-1, Sij, S*i+1 , …, Sn*)对任意 Sij∈Si 都成立,则称(S1*,…,Sn*)为G旳一种纯策略意义下旳“纳什均 衡”(Nash Equilibrium).
(2,0)
(4,0)
反应函数法
对策论 game theory
【例4】 考虑上述模型旳另一种情况即各厂商所选择旳是价格而不是产量,假 设产量与价格旳函数关系为:
q1 ( p2 ) a1 b1 p1 d1 p2
q2 ( p1 ) a2 b2 p2 d 2 p1
其他条件不变,边际成本为C1、C2,试求解其纳什均衡。
P2
R2 ( p1 )
1 2b2
(a2
b2 c2
d 2 p1 )
p1*
p2*
1 2b1 1 2b2
(a1b1c1ຫໍສະໝຸດ d1p* 2
)
(a2 b2c2 d 2 p1* )
P1*
d1 4b1b2 d1d 2
(a2
b2c2 )
2b2 4b1b2 d1d 2
(a1
b1c1 )
P2*
d2 4b1b2 d1d 2
Nash对对策论旳贡献有: (i) 合作对策中旳讨价还价模型,称为Nash讨价还价解; (ii) 非合作对策旳均衡分析。
运筹学教材课件(第九章 对策论)
j
ai* j
a a i* j*
i* j
同理有
因此 max i
aij*
ai* j
a a i* j*
ij*
由式(9-6)和式(9-7)得
aij* ai* j* ai* j i=1,2, ,m ;j=1,2, ,n
证得 (i* , j* )是G的纯策略解。
(9-6) (9-7)
9.2.1 最优纯策略和鞍点
4
2*
3
-3
8
1
4
-3
4
0
1
-5
3
-5
max
2*
8
i
2*
5
2
(1, 1), (1, 3), (2, 1), (2, 3) 都是G的鞍点,因而它们也都是最优纯策略
解,对策值VG=2 ,Ⅰ的最优纯策略解是1,2,Ⅱ的最优纯策略解 是 1, 3。
9.2.1 最优纯策略和鞍点
纯策略解有下述两条性质: (1)无差别性
定义9-4 设G* {X ,Y ; E},是矩阵对策 G {s1, s2; A}的混和扩充, 如果存在混合局势(x*, y*)使得对所有x∈X,y∈Y,有
E(x, y*) E(x*, y*) E(x*, y)
(9-10)
则称(x*, y*)是对策G的混合策略解,简称对策G的解,或称最优
混合局势,简称最优局势。称 x*, y*分别是局中人Ⅰ和Ⅱ的最
ai*
j
又因为
min j
max i
aij
max i
aij*
;
min j
ai*
j
max min
i
j
aij
所以
min j
运筹学—对策论(一)
3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。
对
二人
动 策无
态
限
对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵
运筹学-10、对策论
对策论
第一节 引言
一、对策行为与对策论
对策论又称博弈论,是运筹学的一个重要分 支。对策论所研究的主要对象是带有斗争或竞争性 质的现象。由于对策论研究的对象与政治、军事、 工业、农业、交通、运输等领域有密切关系,处理 问题的方法又有着明显的特色,所以越来越受到人 们的重视。
1
在日常生活中,我们经常看到一些相互之间的 竞争、比赛性质的现象,如下棋、打扑克、体育竞 赛等。
所以:min max aij
j i
max min aij (1)
i j
i
j
另一方面,对任意i,j均有:
min aij aij max aij j i max min aij max aij
i j i
j j
max min aij min max aij (2)
i
所以: max min aij
7
例1:设有矩阵对策,局中人Ⅱ的支付矩阵如下:
7 3 A 16 3
1 8 2 4 1 9 0 5
解: α3 → β3 → α4 → β1 → α 3
如果各局中人都不想冒险,必须考虑对方会 选择策略使他得到最差的收入。因此各局中人都 选择理智的决策行为。
对策的值为VG= 5。
17
二、矩阵对策的混合策略
矩阵对策G有鞍点时,就存在最优解(最优纯策 略),但是否一切矩阵对策问题中,各局中人都有 上述意义的最优纯策略呢?答案是否定的。
1 1 0 A 1 0 1 例1:石头、剪刀、布 1 1 0
max min aij 1 min max aij 1
i j j i
不存在上述纯策略意义下的解。
运筹学[第十四章对策论基础]山东大学期末考试知识点复习范文
第十四章对策论基础1.对策行为具有对策行为的模型称为对策模型或对策,包含三个基本要素。
(1)局中人:在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。
用I表示局中人的集合,若有n个局中人,则I={1,2,…,n},一般要求一个对策中至少要有两个局中人。
(2)策略集:一局对策中,可供局中人选择的一个实际可行的完整的行动方案,称为一个策略。
参加对策的每一个局中人i,i∈I,都有自己的策略集S,i一般每个局中人的策略集中至少应包括两个策略。
(3)赢得函数(支付函数):在一局对策中,各局中人所选定的策略形成的策是第i个局中人的一个策略,则n个局中人的策略组略组称为一个局势,即若Sis=(s1,s2,…s)n为一个局势,全体局势的集合S可用局中人策略集的笛卡尔积表示,即S=S1×S2×…×Sn当一个局势出现后,对策的结果也就确定了,∀s∈S,局中人i可以得到一个赢得Hi(s),Hi(s)为局势s的函数,称之为第i个局中人的赢得函数。
一般当这三个基本因素确定后,一个对策模型也就给定了。
2.最优混合策略的求解方法(1)2×2对策的公式法。
2×2对策是局中人I的赢得矩阵为2×2阶的,即若A不存在鞍点,为求最优混合策略可求下列等式组:(2)2×n或m×2对策的图解法。
设缩减后的赢得矩阵为2阶无鞍点对策问题,设局中人工的混合策略为(x,1-x)T,局中人Ⅱ的混合策略(y,1-y)T。
即则赢得期望值为局中人Ⅰ的期望方程为将①和②式用图形绘出,两图形中的V值先取小然后取大,所得点的坐标即为局中人Ⅰ的最优混合策略。
将③和④式用图形绘出,两图形中的V值先取大然后取小,所得点的坐标即为局中人Ⅱ的最优混合策略。
山东大学期末考试知识点复习(3)线性方程组法。
确定对策的解。
若上述方程组存在非负解x*和y*,则便求得对策的一个解(x*,y*);若求出的解中有负的分量,则无对策的解;若x*和y*。
第8章:对策论《运筹学》
S2 {1, 2 , 3}
4 2 6
A
4
3
5
8 1 10
3 0
6
试求出双方的最优纯策略和对策值。
S1 {,1,2 ,3,4}
1 2 3
1 4 2 6
2
4
3
5
3 8 1 10
4 3 0
6
解:由 A 可以看出,局中人甲的最大赢得是8,要想得到这 个赢得,他就得选择纯策略α3 。
3
0
6
-3
836
定义1:设G={S1,S2;A}为矩阵对策,其中双方的策略集和赢
得矩阵分别为 S1 {1,2、, ,m} S2 、{1, 2, 。,若n有} 等A式 {:aij}mn
mai x[mjin(aij )] mjin[mai x(aij )] ai j
成立,则称 ai为 j 对策G的值,局势( i) , 为j对策G的解或平
意义上的解;
x* 和 y* 分别称为局中人甲和乙的最优混合策略;
VG 为矩阵对策G={S1,S2;A}或G’={X,Y;E}的值。
定理2: 局势(x*,y*)是矩阵对策G={S1,S2;A}在混合策略意义 上解的充分必要条件是对于一切 x∈X、y∈Y均存在:
E(x, y) E(x, y) E(x, y)
第二节 矩阵对策的基本理论
有限二人零和对策,即参加对策的局中人只有两个,而每个局
中人都有有限个可供选择的策略。而且在任一局势中,两个局中
人的得失之和总等于零(一个局中人的所得即为另一个局中人的
所失)。局中人的利益是冲突的,也称为对抗对策。
一、矩阵对策的数学模型
用甲、乙表示两个局中人,假设甲有 m 个策略,表示为:
管理运筹学-对策论
min 9 5
max 8 9
j
3.矩阵对策的混合策略
矛盾:甲取2 ,乙取时1,甲实际赢得8比预期多2(乙就少2)这对乙讲是不满意的,考虑这一点,乙采取策略2,若甲分析到这一点,取策略1,则赢得更多为9…
01
此时,甲,乙方没有一个双方均可接受的平衡局势。
01
一个思路:对甲(乙)给出一个选取不同策略的概率分布,以使甲(乙)在各种情况下的平均赢得(损失)最多(最少)。-----即混合策略
建立线性模型: min X1+X2 s.t. 5X1+8X21 X1= 1/21 9X1+6X21 X2= 2/21 X1, X20 1/V= X1+X2=1/7 所以:V=7 返回原问题: X1’= X1V= 1/3 X2’= X2V= 2/3 于是甲的最优混合策略为: 以1/3的概率选1;以2/3的概率选2 最优值V=7.
3.矩阵对策的混合策略(续)
例 设甲方的益损值 赢得矩阵。 3 2 0 3 0 被第3、4行所优超 5 0 2 5 9 被第3行所优超 A= 7 3 9 5 9 4 6 8 7 5.5 6 0 8 8 3 得到 7 3 9 5 9 被第1列所优超 A1= 4 6 8 7 5.5 被第2列所优超 6 0 8 8 3
同样可求乙的最优混合策略: 设乙使用策略1的概率为Y1′ Y1′+Y2′=1 设乙使用策略2的概率为Y2′ Y1′,Y2′0 设在最坏的情况下,甲赢得的平均值为V. 这也是乙损失的平均值,越小越好 作变换: Y1= Y1’/V ; Y2= Y2’/V 建立线性模型: max Y1+Y2 s.t. 5Y1+9Y21 Y1= 1/14 8Y1+6Y21 Y2= 1/14 Y1, Y20 1/V= Y1+Y2=1/7 所以:V=7
运筹学 CH8对策论基础(二)
赢得矩阵为
矩阵对策的纯策略
解: 直接在A提供的赢得表上计算,有
1 1 2 3 4
6 1 8 0 max 8
Page 9
2
5 4 5 2 5*
3
6 2 7 6 7
4 min
5 1 5 2 5* 5* 1 5
*
于是
max min aij min max aij ai* j* 5
Page 11
max min aij min max aij
i j j i
时,不存在最优纯策略
求解混合策略。
例:设一个赢得矩阵如下:
5
A = 8
9
6
矩阵对策的混合策略
max min aij 6 8 min max aij
i j j i
Page 12
矛盾:甲取2 ,乙取时1,甲实际赢得8比预期多2 (乙就少2)这对乙讲是不满意的,考虑这一点,乙采取 策略2,若甲分析到这一点,取策略1,则赢得更多为9… 此时,甲,乙方没有一个双方均可接受的平衡局势。 一个思路:对甲(乙)给出一个选取不同策略的概 率分布,以使甲(乙)在各种情况下的平均赢得(损失) 最多(最少)。-----即混合策略。
* *
aij * ai* j * ai* j (10 2)
矩阵对策的纯策略
例 求对策的解。设矩阵对策 G S1 , S2 ; A 其中 S1 1 , 2 , 3 , 4
6 1 A 8 0 5 4 5 2 6 2 7 6
Page 8
S2 1 , 2 ,3 , 4
ai 2 a22 a2 j i 1, 2, 3, 4; j 1, 2, 3
第十二章-对策论(运筹学讲义)课件
局中人2 出1指
5 -5
出2指 -5 5
局中人1从局中人2该如何选择策略,已获得利益?
-
3
例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在 不同的屋子里审讯。警察告诉他们: 如果两人都坦白,各 判刑8年;如果两人都抵赖,由于证据不充分,两人将各 判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者 立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯 都有两种策略: 坦白或抵赖。可以用一个矩阵表示两个嫌 疑犯的策略的损益
3.一局势对策的益损值: 局中人各自使用一个对策就形成了一 个局势,一个局势决定了各局中人的对策结果(量化)称 为该局势对策的益损值。
赢得函数(payoff function): 定义在局势上,取值为相应益 损值的函数
4. 纳什均衡: 纳什均衡指所有局中人最优策略组成的一种局势,
既在给定其他局中人策略的情况下,没有任何局中人有积
A
1
4
3
2
解因
m i a x m j in a ij 2 , m j in m i a x a ij 3
m a ixm jina ij m jinm a ixa ij
不符合鞍点条件, 故G的鞍点不存在。
例6 求解矩阵对策,其中: 解 容易得到
A 11
0 1
1 1
v a i * j * 1i * 1 ,2 ;j * 3
A
a
2
1
a22
a1m
a2
m
a
m
1
am2
amn
aij为局中人甲在局势
( i , j )下的赢得 -
9
“齐王赛马”是一个矩阵策略。
其中: 齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 },
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1994年纳什获得了诺贝尔经济学奖。他提出的著名的纳什均衡概 念在非合作博弈理论中起着核心作用。由于纳什均衡的提出和不 断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、 军事科学等领域奠定了坚实的理论基础。
第1节 引言
1.1 对策行为和对策论 1.2 对策行为的三个基本要素 1.3 对策问题举例及对策的分类
1.1 对策行为和对策论
双方实力分析
各有三个等级的马:上、中、下等马; 在同一等级马中,齐王的马可胜过田 忌的马;在不同等级马中,田忌的次 一等级马可胜过齐王的上一等级马。
田 忌
齐 王
比 赛 规 则
双方从每一等级马中各选一匹 参赛,共赛3次。最后按净胜次 数决定胜负。
1.2 对策行为的三个基本要素
对策论基础
第1节
引言 第2节 矩阵对策的基本定理 第3节 矩阵对策的解法 第4节 其他类型对策简介
第1节 引言
对策论
自古以来的政治家和军事家都很注意研究的问题。 20世纪40年代形成并发展起来的。 1944 年 冯 · 诺 依 曼 (von Neumann) 与 摩 根 斯 特 恩 (O.Morgenstern) 的《博弈论与经济行为》一书出版,标志着 现代系统博弈理论的初步形成。 20 世纪50 年代,纳什(Nash)建立了非合作博弈的“纳什均 衡”理论,标志着博弈的新时代开始,是纳什在经济博弈论领 域划时代的贡献,是继冯 · 诺依曼之后最伟大的博弈论大师之 一。
1.1 对策行为和对策论
什么是对策行为
在日常生活中,经常会看到一些相互之间具 有斗争或竞争性质的行为,如下棋、打牌、 体育比赛等。还比如战争活动中的双方,都 力图选取对自己最有利的策略,千方百计去 战胜对手。在政治方面,国际间的谈判,各 种政治力量之间的斗争,各国际集团之间的 斗争等无一不具有斗争的性质。在经济活动 中,各国之间、各公司企业之间的经济谈判, 企业之间为争夺市场而进行的竞争等,举不 胜举。
乡镇策略 出售特色饮食品
出售一般饮食品
1000
3000
1.3 对策问题举例及对策的分类
例2 (销售竞争问题)
假定企业Ⅰ,Ⅱ均能向市场出售某一产品,不妨假定他们可 于时间区间[0 ,1 ]内任一时点出售。设企业Ⅰ在时刻 x出 售,企业Ⅱ在时刻y出售,则企业Ⅰ的收益(赢得)函数为:
1. 局中人
在一个对策行为(或一局对策)中,有权决定自己行动方案的对 策参加者,称为局中人。通常用I表示局中人的集合。如果有n 个局中人,则。一般要求一个对策中至少要有两个局中人。如 在“齐王赛马”的例子中,局中人是齐王和田忌。
1.2 对策行为的三个基本要素
2. 策略集
一局对策中,可供局中人选择的一个实际可行的完整的行动方 案称为一个策略。参加对策的每一局中人,都有自己的策略集。 一般,每一局中人的策略集中至少应包括两个策略。 在“齐王赛马”的例子中,如果用(上,中,下)表示以上马、 中马、下马依次参赛这样一个次序,这就是一个完整的行动方 案,即为一个策略。可见,局中人齐王和田忌各自都有6个策 略:(上,中,下)、(上,下,中)、(中,上,下)、(中,下, 上)、(下,中,上)、(下,上,中)。
1.2 对策行为的三个基本要素
3. 赢得函数(支付函数)
在一局对策中,各局中人选定的策略形成的策略组称为一个局 势,即若si是第i个局中人的一个策略,则n个局中人的策略组
s (s1 , s2 , , sn )
就是一个局势。全体局势的集合S可用各局中人策略集的笛卡 儿积表示,即
S S1 S2 Sn
1.1 对策行为和对策论
对策论的典型例子—齐王赛马
战国时期,有一天齐王提出要与田忌赛马,双方约定从各自的 上、中、下三个等级的马中各选一匹参赛,每匹马均只能参赛 一次,每一次比赛双方各出一匹马,负者要付给胜者千金。已 经知道,在同等级的马中,田忌的马不如齐王的马,而如果田 忌的马比齐王的马高一等级,则田忌的马可取胜。当时,田忌 手下的一个谋士给他出了个主意:每次比赛时先让齐王牵出他 要参赛的马,然后来用下马对齐王的上马,用中马对齐王的下 马,用上马对齐王的中马。比赛结果,田忌二胜一负,夺得千 金。由此看来,两个人各采取什么样的出马次序对胜负是至关 重要的。
1.3 对策问题举例及对策的分类
例1 (市场购买力争夺问题)
据预测,某乡镇下一年的饮食品购买力将有4000万元。乡镇 企业和中心城市企业饮食品的生产情况是:乡镇企业有特色 饮食品和低档饮食品两类,中心城市企业有高档饮食品和低 档饮食品两类产品。它们争夺这一部分购买力的结局见表 14-1(表中数字的单位是万元),问题是乡镇企业和中心城市 企业应如何选择对自己最有利的产品策略。 表14-1 乡镇企业所得 中心城市企业的策略 出售高档饮食品 2000 出售低档饮食品 3000
当一个局势出现后,对策的结果也就确定了。也就是说,对任 Hi ( s) 一局势 s S ,局中人i可以得到一个赢得值 Hi (s) 。显然, 是局势s的函数,称为第i个局中人的赢得函数。在齐王与田忌 赛马的例子中,局中人集合为 I 1, 2 ,齐王和田忌的策略集可 分别用 S1 a1, a2 , a3 , a4 , a5 , a6 和 S2 1, 2 , 3 , 4 , 5 , 6 表示。 这样,齐王的任一策略和田忌的任一策略就形成了一个局势。 s11 如果 a1 ( 上,中,下), 1 (上,中,下),则在局势 下齐 王的赢得值为 H1 (s11 ) 3 ,田忌的赢得值为 H 2 (s11 ) 3 。
1.1 对策行为和对策论
什么是对策论
对策论亦称竞赛论或博弈论,是研究具有斗 争或竞争性质现象的数学理论和方法。一般 认为,它是现代数学的一个新分支,是运筹 学的一个重要学科。对策论发展的历史并不 长,但由于它研究的问题与政治、经济、方法具有明显特色,所以日 益引起广泛注意。