运筹与优化--对策论
合集下载
运筹学-第15章--对策论
1 8 5 8 5 5*
2 2 3 2 1 1
3 4
9 0
5 2
6 3
5 5*
3
0
max 9 5* 8 5*
可知 ai* j* =5,i*=1,3,j*=2,4.故(α1,β2)(α1,β4)(α2,
β2)(α2,β4)为对策的纳管 什理均运衡,筹 V学G=5.
15
• 最优纯策略求解步骤:
• 1、行中取小,小中取大得最大化最小收益 值;
• 2、列中取大,大中取小得最小化最大支付 值;
• 3、比较两值是否相等。若相等便存在最优 纯策略。若不等,则不存在最优纯策略。
管理运筹学
16
§3 矩阵对策的混合策略
设矩阵对策 G = { S1, S2, A }。当
max
i
min
j
aij
min
j
max
i
aij
时,不存在最优纯策略。
例:设一个赢得矩阵如下:
一个局势,一个局势决定了各局中人的对策结果(量化) 称为该局势对策的益损值。
管理运筹学
3
§1 对策论的基本概念
出赛的次序是一个策略 “齐王赛马”齐王在各局势中的益损值表(单位:千金)
管理运筹学
4
§1 对策论的基本概念
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。
A=[aij]m×n i 行代表甲方策略 i=1, 2, …, m;j 列代表乙方策略 j=1, 2, …, n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下甲方的 益损值。此时乙方的益损值为 -aij(零和性质)。
运筹与优化--对策论
y∈S2*为局中人I和Ⅱ的混合策略,(x,y)为混合局势,
局中人I的赢得函数为 E(x,y)xTAy aix jiyj
称G* ={S1*,S2*,E}为对策G的混合扩充. i j
A
12
设 mm ax E i(x n ,y)mE i(x n *,y)
x S 1 * y S2 *
y S2 *
mm inE a(x,x y)mE a(x,x y*)
注意:G在纯策略下解存在时,定义4中的
VG ;Gai在j 混合策略意义下的解(x*,y*)
存在时,VG=E(x*,y*).
例4. 解矩阵对策 中
3 G6={S1 ,S2 ;A },其
A
5
4
A
14
局中人I取纯策略αi时,其赢得函数为 E(i,y)=∑aijyj ,
局中人Ⅱ取纯策略βj时,其赢得函数为 E(x,j)=∑aijxi .
人I以概率xi≥0取纯策略αi,局中人Ⅱ以概率yj≥0取
纯策略βj ,且
m
xi
1.记,
n
yj 1
i1
j1
m
S 1 {x(x1,x2, ,xm ) E mxi0 , xi1 }
i 1
n
S2 {y(y1,y2, ,yn) E nyj0, yj1 }
j 1
则S1* ,S2*分别称为局中人I和Ⅱ的混合策略集.称x∈S1*,
A
24
推论.如果纯策略α1被纯策略α2 , … αm的凸线 性组合所优超,则定理10的结论仍成立.
由上两式得
E(x,y)=∑E(i,y)xi
(5)
E(x,y)=∑E(x,j)yj . (6)
定理3.设x∈S1*,y∈S2*,则(x*,y*)是G的解的充要条 件是: 对任意i=1,2,…,m 和 j=1,2,…,n,有
《管理运筹学-对策论》
博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。
运筹学第9章 对策论
3. 赢得函数(支付函数)(payoff function)
一个对策中,每一个局中人所出策略形成的策略 组称为一个局势。 即设 s i 是第 i 个局中人的一个策略, 则n个局中人的策略形成的策略组 s ( s1 , s2 ,, sn )
s 就是一个局势。
在“齐王VS田忌赛马”中,
齐王有6个策略: 2 ( 上,下,中)、 1 (上,中,下)、 4 (中,下,上)、 5 ( 下,上,中)、
1 2
设局中人I采用纯策略 1和 2的概率 分别为 x1 和 x2 ,x1 x2 1, x1,2 0 设局中人II采用纯策略 1和 2的概率 分别为 y1 和 y2 ,y1 y2 1, y1,2 0
SI 1 , 2 设局中人I的策略集原来为: 那么在没找到纯策略的前提下,局中人I的策略集变为: 局中人I的策略 SI X ( x1, x2 )T x1 x2 1, x12 0 有无穷多个 S II 1 , 2 设局中人I的策略集原来为: 那么在没找到纯策略的前提下,局中人II的策略集变为:
当一个局势 s 出现后,每一局中人就会面对
一个赢得值或损失值,记作 Hi (s)。
Hi (s) 是定义在局势上的函数,
所以称为局中人 i 的赢得函数。
通常的分类方式有: (1) 根据局中人的个数,分为二人对策和多人对策; (2) 根据各局中人的赢得函数的代数和是否为零,分 为零和对策与非零和对策; (3) 根据各局中人间是否允许合作,分为合作对策和 非合作对策; (4) 根据局中人的策略集中的策略个数,分为有限对 策和无限对策等等。
max VG X 1 E ( X 1 , 1 ) E ( X 1 , 2 ) X 2 E ( X 2 , 1 ) E ( X 2 , 2 ) 5 x1 8 x2 VG E s . t . X 3 E ( X 3 , 1 ) E ( X 3 , 2 ) 9 x1 6 x2 VG x x 1 , x , x 0 1 2 1 2
运筹学-对策论概述
局势3:盟军的侦察机重点搜索南线, 而日本舰队走北线。由于发现晚、盟 军的轰炸机群在南线,以及北线气候 恶劣,故有效轰炸只有一天。
局势4:盟军的侦察机重点搜索南线, 日本舰队也恰好走南线。此时日本舰 队迅速被发现,盟军的轰炸机群所需 航程很短,加上天气晴好,有效轰炸 时间三天。
这场海空遭遇与对抗一定会发生, 双方的统帅如何决策呢?历史的实际 情况是:局势1成为现实。肯尼将军 命令盟军的侦察机重点搜索北线;而 山本五十六大将命令日本舰队取道北 线航行。由于气候恶劣,能见度差, 盟军飞机在一天后发现了日本舰队, 基地在南线的盟军轰炸机群远程航行, 实施了两天的有效轰炸,重创了日本 舰队,但未能全歼。
则对策G*= { S1*,S2*;E}
称为对策G混合扩充。
定义4:设G*={S1*,S2*;E}是对策G混合 扩充,如果有
max min E(X,Y)= min max E(X,Y)
X S1* Y S2*
Y S2* X S1*
则称这个公共值为对策G在混合意义下 的值,记为V*G,而达到V*G 的混合局 势(X*,Y*)称为对策G在混合策略 意义下的解,而X*和Y*分别称为局中 人I,II的最优混合策略。
S1= {1、 2…… m }
同样,局中人II有n个策略:1、 2。。。 n ;用S2表示这些策略的集合: S2= { 1、 2… n } 局中人I的赢得矩阵是:
a11 a12 …… a1n a21 a22 …… a2n A= …… …… …… a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对策记为G: G= { S1,S2;A}
当盟军获悉此情报后,盟军统帅 麦克阿梭命令太平洋战区空军司令肯 尼将军组织空中打击。
管理运筹学课件第13章-对策论
管理运筹学课件第13章对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。
运筹学-对策论
3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路:对甲(乙)给出一个选取不同策 略的概率分布,以使甲(乙)在各种情 况下的平均赢得(损失)最多(最少)。 -----即混合策略
重要定理
定理 任一矩阵对策G {S1,S2;A}, 任一矩阵对策G={S1,S2;A},一定存在混 合策略意义下的解。 合策略意义下的解。 • 定理 设有两个矩阵对策 • G1= G2= G1={S1,S2;A1} G2={S1,S2;A2} • 其中A1=(aij),A2=(aij+L),L为任一常数。 A1= 其中A1 (aij),A2=(aij+L), 为任一常数。 则 • (1)G1 G2同解 G1与 同解; (1)G1与G2同解; • (2)VG2 VG2= (2)VG2=VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的,即 矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人 阶的, A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解,则很容易求解; 如果此对策有纯策略意义下的解,则很容易求解;如果没有 纯策略意义下的解, 纯策略意义下的解,则为求出各局中人的最优混合策略可求解下 列方程组: 列方程组: • a11x1+a21x2= a11y1+a12y2= a11x1+a21x2=v a11y1+a12y2=v • a12x1+a22x2= a21y1+a22y2= a12x1+a22x2=v a21y1+a22y2=v • y1+y2= x1+x2= y1+y2=1 x1+x2=1 • 当没有纯策略意义下的解时,方程组一定有严格非负解 x*= 当没有纯策略意义下的解时, x1* x2* y*=(y1*,y2*), (x1*,x2*)和y*=(y1*,y2*), 即为各局中人的最优混合策 略。
运筹学ABC-4-2对策论
北京科技大学 经济管理学院
12
2
n
100
a≈1174313×100万
运筹学ABC —— 对策论
2、胜负次数各半时的实际值计算
每投入一次,若获胜,则资本拥有值: M = a /2 + a/2 + 1.6×a/2 = 1.8 a 每投入一次,若失败,则资本拥有值: M = a /2 = 0.5 a 故进行100次,胜负各50次,则实际拥有值:
50
北京科技大学 经济管理学院
18
运筹学ABC —— 对策论
• 获胜概率的计算 N=10000 次时, n≥ 4418 次 此事件发生的概率几乎为 1 ; N=100 次时, n≥ 45 次 此事件发生的概率约为 0.8513 。
结语: 1、高期望与高风险并存;
2、分清期望值、实际值的差异; 3、讲究策略优化。
—— 支付规则(payoff Rule)
3
运筹学ABC —— 对策论
支付可用支付矩阵来描述
对儿童甲来说,其支付矩阵(赢得矩阵):
石 剪 布 石 0 -1 1 0 -1 1 0
A甲= 剪
布
1 -1
局中人、策略集与支付规则
构成了Game 的基本内涵。
北京科技大学 经济管理学院
4
运筹学ABC —— 对策论
1
2 3 4
北线 (α1)
北线 (α1) 南线 (α2) 南线 (α2)
北线 (β1)
南线 (β2) 北线 (β1) 南线 (β2)
坏
好 坏 好
远
近 远 近 3天
2天
2天 1天
试分析双方的策略的选择。
北京科技大学 经济管理学院
24
运筹学ABC —— 对策论
12
2
n
100
a≈1174313×100万
运筹学ABC —— 对策论
2、胜负次数各半时的实际值计算
每投入一次,若获胜,则资本拥有值: M = a /2 + a/2 + 1.6×a/2 = 1.8 a 每投入一次,若失败,则资本拥有值: M = a /2 = 0.5 a 故进行100次,胜负各50次,则实际拥有值:
50
北京科技大学 经济管理学院
18
运筹学ABC —— 对策论
• 获胜概率的计算 N=10000 次时, n≥ 4418 次 此事件发生的概率几乎为 1 ; N=100 次时, n≥ 45 次 此事件发生的概率约为 0.8513 。
结语: 1、高期望与高风险并存;
2、分清期望值、实际值的差异; 3、讲究策略优化。
—— 支付规则(payoff Rule)
3
运筹学ABC —— 对策论
支付可用支付矩阵来描述
对儿童甲来说,其支付矩阵(赢得矩阵):
石 剪 布 石 0 -1 1 0 -1 1 0
A甲= 剪
布
1 -1
局中人、策略集与支付规则
构成了Game 的基本内涵。
北京科技大学 经济管理学院
4
运筹学ABC —— 对策论
1
2 3 4
北线 (α1)
北线 (α1) 南线 (α2) 南线 (α2)
北线 (β1)
南线 (β2) 北线 (β1) 南线 (β2)
坏
好 坏 好
远
近 远 近 3天
2天
2天 1天
试分析双方的策略的选择。
北京科技大学 经济管理学院
24
运筹学ABC —— 对策论
运筹学对策论全解
赢 A
B
石头
剪子
布
石头 0 1 -1
剪子 -1 0 1
布
1 -1
0
分析:无确定最优解,可用“混合策略”求解。
4.齐王赛马
战国时期,齐国国王有一天提出要与大将军田忌赛马。 田忌答应后,双方约定: 1)每人从上中下三个等级中各出一匹马,共出三匹; 2) 一共比赛三次,每一次比赛各出一匹马; 3) 每匹被选中的马都得参加比赛,而且只能参加一次; 4) 每次比赛后输者要付给胜者一千金。
例:囚犯困境中,每个囚犯均有2个策略:
{坦白,抵赖}
(3)局势
坦白 抵赖
坦白 抵赖 -9,-9 0,-10 -10,0 -1,-1
当每个局中人从各自策略集合中选择一策略而组 成的策略组成为一个局势,用 (si , d j )来表示。
(4)赢得(支付)
局中人采用某局势时的收益值。
例:当局中人甲选择策略si ,局中人乙选策略 dj 时,局中人甲的赢得值可用 R甲(si , d j )表示。
九十年代以来博弈理论在金融、管理和经济领域中 得到广泛应用
• 九十年代以来对策理论在金融、管理和经济领域 中得到广泛应用
• 博弈论和诺贝尔经济奖
1994:非合作博弈:纳什(Nash)、泽尔腾(Selten) 、海萨尼 (Harsanyi) 1996:不对称信息激励理论:莫里斯(Mirrlees)和维克瑞(Vickrey) 2001:不完全信息市场博弈:阿克罗夫(Akerlof)(商品市场)、斯潘 塞(Spence)(教育市场)、斯蒂格里兹(Stiglitze)(保险市场) 2005: 授予罗伯特·奥曼与托马斯·谢林,以表彰他们通过博弈理论的分析 增强世人对合作与冲突的理解。 2007年,授予赫维茨(Leonid Hurwicz)、马斯金(Eric S. Maskin)以及 迈尔森(Roger B. Myerson)。三者的研究为机制设计理论奠定了基础。 2012年,授予罗斯(Alvin E. Roth)与沙普利(Lloyd S. Shapley)。他 们创建“稳定分配”的理论,并进行“市场设计”的实践。
运筹学-第六讲对策论
对策G常写成: G={S1,…,Sn;h1,…hn}
【定义 】 在对策G={S1,S2…,Sn;h1,h2…hn}中,假如由各个对策方旳各 选用一种策略构成旳某个策略组合(S1*,S2*…,Sn*)中,任一对策方i 旳策略 Si*,都是对其他策略方策略旳组合 (S1*,…,S*i-1,S*i+1…,Sn*)旳最佳策略, 即h i(S1*, … , S*i-1, Si*, S*i+1,…Sn*)≥hi(S1*, …, S*i-1, Sij, S*i+1 , …, Sn*)对任意 Sij∈Si 都成立,则称(S1*,…,Sn*)为G旳一种纯策略意义下旳“纳什均 衡”(Nash Equilibrium).
(2,0)
(4,0)
反应函数法
对策论 game theory
【例4】 考虑上述模型旳另一种情况即各厂商所选择旳是价格而不是产量,假 设产量与价格旳函数关系为:
q1 ( p2 ) a1 b1 p1 d1 p2
q2 ( p1 ) a2 b2 p2 d 2 p1
其他条件不变,边际成本为C1、C2,试求解其纳什均衡。
P2
R2 ( p1 )
1 2b2
(a2
b2 c2
d 2 p1 )
p1*
p2*
1 2b1 1 2b2
(a1b1c1ຫໍສະໝຸດ d1p* 2
)
(a2 b2c2 d 2 p1* )
P1*
d1 4b1b2 d1d 2
(a2
b2c2 )
2b2 4b1b2 d1d 2
(a1
b1c1 )
P2*
d2 4b1b2 d1d 2
Nash对对策论旳贡献有: (i) 合作对策中旳讨价还价模型,称为Nash讨价还价解; (ii) 非合作对策旳均衡分析。
【定义 】 在对策G={S1,S2…,Sn;h1,h2…hn}中,假如由各个对策方旳各 选用一种策略构成旳某个策略组合(S1*,S2*…,Sn*)中,任一对策方i 旳策略 Si*,都是对其他策略方策略旳组合 (S1*,…,S*i-1,S*i+1…,Sn*)旳最佳策略, 即h i(S1*, … , S*i-1, Si*, S*i+1,…Sn*)≥hi(S1*, …, S*i-1, Sij, S*i+1 , …, Sn*)对任意 Sij∈Si 都成立,则称(S1*,…,Sn*)为G旳一种纯策略意义下旳“纳什均 衡”(Nash Equilibrium).
(2,0)
(4,0)
反应函数法
对策论 game theory
【例4】 考虑上述模型旳另一种情况即各厂商所选择旳是价格而不是产量,假 设产量与价格旳函数关系为:
q1 ( p2 ) a1 b1 p1 d1 p2
q2 ( p1 ) a2 b2 p2 d 2 p1
其他条件不变,边际成本为C1、C2,试求解其纳什均衡。
P2
R2 ( p1 )
1 2b2
(a2
b2 c2
d 2 p1 )
p1*
p2*
1 2b1 1 2b2
(a1b1c1ຫໍສະໝຸດ d1p* 2
)
(a2 b2c2 d 2 p1* )
P1*
d1 4b1b2 d1d 2
(a2
b2c2 )
2b2 4b1b2 d1d 2
(a1
b1c1 )
P2*
d2 4b1b2 d1d 2
Nash对对策论旳贡献有: (i) 合作对策中旳讨价还价模型,称为Nash讨价还价解; (ii) 非合作对策旳均衡分析。
运筹学—对策论(一)
3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。
对
二人
动 策无
态
限
对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵
运筹学-10、对策论
第五章
对策论
第一节 引言
一、对策行为与对策论
对策论又称博弈论,是运筹学的一个重要分 支。对策论所研究的主要对象是带有斗争或竞争性 质的现象。由于对策论研究的对象与政治、军事、 工业、农业、交通、运输等领域有密切关系,处理 问题的方法又有着明显的特色,所以越来越受到人 们的重视。
1
在日常生活中,我们经常看到一些相互之间的 竞争、比赛性质的现象,如下棋、打扑克、体育竞 赛等。
所以:min max aij
j i
max min aij (1)
i j
i
j
另一方面,对任意i,j均有:
min aij aij max aij j i max min aij max aij
i j i
j j
max min aij min max aij (2)
i
所以: max min aij
7
例1:设有矩阵对策,局中人Ⅱ的支付矩阵如下:
7 3 A 16 3
1 8 2 4 1 9 0 5
解: α3 → β3 → α4 → β1 → α 3
如果各局中人都不想冒险,必须考虑对方会 选择策略使他得到最差的收入。因此各局中人都 选择理智的决策行为。
对策的值为VG= 5。
17
二、矩阵对策的混合策略
矩阵对策G有鞍点时,就存在最优解(最优纯策 略),但是否一切矩阵对策问题中,各局中人都有 上述意义的最优纯策略呢?答案是否定的。
1 1 0 A 1 0 1 例1:石头、剪刀、布 1 1 0
max min aij 1 min max aij 1
i j j i
不存在上述纯策略意义下的解。
对策论
第一节 引言
一、对策行为与对策论
对策论又称博弈论,是运筹学的一个重要分 支。对策论所研究的主要对象是带有斗争或竞争性 质的现象。由于对策论研究的对象与政治、军事、 工业、农业、交通、运输等领域有密切关系,处理 问题的方法又有着明显的特色,所以越来越受到人 们的重视。
1
在日常生活中,我们经常看到一些相互之间的 竞争、比赛性质的现象,如下棋、打扑克、体育竞 赛等。
所以:min max aij
j i
max min aij (1)
i j
i
j
另一方面,对任意i,j均有:
min aij aij max aij j i max min aij max aij
i j i
j j
max min aij min max aij (2)
i
所以: max min aij
7
例1:设有矩阵对策,局中人Ⅱ的支付矩阵如下:
7 3 A 16 3
1 8 2 4 1 9 0 5
解: α3 → β3 → α4 → β1 → α 3
如果各局中人都不想冒险,必须考虑对方会 选择策略使他得到最差的收入。因此各局中人都 选择理智的决策行为。
对策的值为VG= 5。
17
二、矩阵对策的混合策略
矩阵对策G有鞍点时,就存在最优解(最优纯策 略),但是否一切矩阵对策问题中,各局中人都有 上述意义的最优纯策略呢?答案是否定的。
1 1 0 A 1 0 1 例1:石头、剪刀、布 1 1 0
max min aij 1 min max aij 1
i j j i
不存在上述纯策略意义下的解。
运筹学教程对策论
局中人2 局中人1 1(正) 2(反) 1(正) 1 -1 2(反) -1 1
Games) §2.矩阵对策(Matrix Games) 2.矩阵对策( 矩阵对策
剪刀、 例2:“石头 、剪刀、布”游戏
局中人2 局中人2 局中人1 局中人1 1(石头) ) 2(剪刀) 剪刀) 3 (布) 0 -1 1 1 0 -1 -1 1 0 1(石头) ) 2(剪刀) 剪刀) 3 (布)
0=0
3.最优纯策略
齐王赛马:
-1<3
3.最优纯策略
定义:一个矩阵对策,如果它的支付矩阵A的元素满足: 定义:一个矩阵对策,如果它的支付矩阵A的元素满足:
则称这个值v为对策的值。如果纯局势(i*,j*)使: 则称这个值v为对策的值。
则称( 为对策G的鞍点( point),也称它是对策G 则称(i*,j*)为对策G的鞍点(Saddle point),也称它是对策G在 纯策略中的解, 分别为局中人1和局中人2的最优解。 纯策略中的解,i*与j*分别为局中人1和局中人2的最优解。
故对策的解为(3,3),即秋季贮煤20吨合理。(决策论中的悲观准则)
3.最优纯策略
例6:甲、乙双方谈判签订一项合同,甲方的“要价”是25万元,而乙方的“ 出价”是20万元,谈判陷于僵局。为打破僵局,双方约定,再各报一个价。以 下述价格成交:谁让步多,取谁出的价;如果双方让步相同,则取双方报价的 中间值。问甲、乙双方应如何报价?最后的成交价是多少? 解 显然,甲、乙双方的报价都在20万元到25万元之间。不妨取整数值,甲 、乙各有6个策略:报价20,21,…,25(单位:万元)。由约定知,甲的支付矩 阵可用表所示。
•局中人: •策略: 自始至终的行动方案; 把局中人的策略全体,称做这个局中人的策略集合; 例如,在齐王与田忌赛马的例子中,如果—开始就要把各人的三匹马排好 次序,然后依次出赛。各局中人都有六个策略:(1)(上、中、下),(2) ( 上、下、中)(3)(中、上、下)(4)(中、下、上),( 5 ) ( 下 、 中 、 上 ) , (6) (下、上、中)。这个策略全体就是局中人的策略集合。 有限,无限
Games) §2.矩阵对策(Matrix Games) 2.矩阵对策( 矩阵对策
剪刀、 例2:“石头 、剪刀、布”游戏
局中人2 局中人2 局中人1 局中人1 1(石头) ) 2(剪刀) 剪刀) 3 (布) 0 -1 1 1 0 -1 -1 1 0 1(石头) ) 2(剪刀) 剪刀) 3 (布)
0=0
3.最优纯策略
齐王赛马:
-1<3
3.最优纯策略
定义:一个矩阵对策,如果它的支付矩阵A的元素满足: 定义:一个矩阵对策,如果它的支付矩阵A的元素满足:
则称这个值v为对策的值。如果纯局势(i*,j*)使: 则称这个值v为对策的值。
则称( 为对策G的鞍点( point),也称它是对策G 则称(i*,j*)为对策G的鞍点(Saddle point),也称它是对策G在 纯策略中的解, 分别为局中人1和局中人2的最优解。 纯策略中的解,i*与j*分别为局中人1和局中人2的最优解。
故对策的解为(3,3),即秋季贮煤20吨合理。(决策论中的悲观准则)
3.最优纯策略
例6:甲、乙双方谈判签订一项合同,甲方的“要价”是25万元,而乙方的“ 出价”是20万元,谈判陷于僵局。为打破僵局,双方约定,再各报一个价。以 下述价格成交:谁让步多,取谁出的价;如果双方让步相同,则取双方报价的 中间值。问甲、乙双方应如何报价?最后的成交价是多少? 解 显然,甲、乙双方的报价都在20万元到25万元之间。不妨取整数值,甲 、乙各有6个策略:报价20,21,…,25(单位:万元)。由约定知,甲的支付矩 阵可用表所示。
•局中人: •策略: 自始至终的行动方案; 把局中人的策略全体,称做这个局中人的策略集合; 例如,在齐王与田忌赛马的例子中,如果—开始就要把各人的三匹马排好 次序,然后依次出赛。各局中人都有六个策略:(1)(上、中、下),(2) ( 上、下、中)(3)(中、上、下)(4)(中、下、上),( 5 ) ( 下 、 中 、 上 ) , (6) (下、上、中)。这个策略全体就是局中人的策略集合。 有限,无限
运筹学第八章对策论
上述两个案例均为矩阵对策。
一般地,用 和 分别表示两个局中人,并设局中人 和 的策略集分别为 S, S, 局中人 的收益矩阵为A, 则矩
阵对策的模型记为 S,S.;A
如案例2中,双方策略集同为{(上,中,下),(上,下中),
(中,上,下),(中,下,上), (下,中,上,(下,上,中)},为了
区别,相应地记为 S {1 和, 2, 3 , 4 , 5 , 6 ,}则局中人 ,
即齐S 王 的{赢1 ,得2 ,矩3 ,阵4 为, 5 , 6 }
1 2 3 4 5 6
1 3 1 1 1 1 1
2
1
3
1
1
1
1
A 3 4
1 1
1
1
3 1
1 3
1 1
1
1
5
1
1 1 1
3
1
6 1 1 1 1 1 3
纯策略矩阵对策
定义1:设 S,S;A 为矩阵对策,其中
赢得矩阵(支付):当每个局中人在确定了所采 取的策略后,他们就会获得相应的收益或损失, 此收益或损失的值称为赢得(支付)。赢得与策 略之间的对应关系称为赢得(支付)函数。
矩阵对策的模型
矩阵对策即二人有限零和对策。 “二人”是指参加对策的局中人有两个; “有限”是指每个局中人的策略集均为 有限集;“零和”是指在任一局势下, 两个局中人的赢得之和总等于零,即一 个局中人的所得值恰好等于另一局中人 的所失值,双方的利益是完全对抗的。
定理 1 矩阵对策在纯策略意义下有解的充要条件是
aij* ai*j* ai*j 。
证:充分性: 由 aij* ai*j* ai*j可以得到 m i aaij*xai*j* m j a iin *j 。
一般地,用 和 分别表示两个局中人,并设局中人 和 的策略集分别为 S, S, 局中人 的收益矩阵为A, 则矩
阵对策的模型记为 S,S.;A
如案例2中,双方策略集同为{(上,中,下),(上,下中),
(中,上,下),(中,下,上), (下,中,上,(下,上,中)},为了
区别,相应地记为 S {1 和, 2, 3 , 4 , 5 , 6 ,}则局中人 ,
即齐S 王 的{赢1 ,得2 ,矩3 ,阵4 为, 5 , 6 }
1 2 3 4 5 6
1 3 1 1 1 1 1
2
1
3
1
1
1
1
A 3 4
1 1
1
1
3 1
1 3
1 1
1
1
5
1
1 1 1
3
1
6 1 1 1 1 1 3
纯策略矩阵对策
定义1:设 S,S;A 为矩阵对策,其中
赢得矩阵(支付):当每个局中人在确定了所采 取的策略后,他们就会获得相应的收益或损失, 此收益或损失的值称为赢得(支付)。赢得与策 略之间的对应关系称为赢得(支付)函数。
矩阵对策的模型
矩阵对策即二人有限零和对策。 “二人”是指参加对策的局中人有两个; “有限”是指每个局中人的策略集均为 有限集;“零和”是指在任一局势下, 两个局中人的赢得之和总等于零,即一 个局中人的所得值恰好等于另一局中人 的所失值,双方的利益是完全对抗的。
定理 1 矩阵对策在纯策略意义下有解的充要条件是
aij* ai*j* ai*j 。
证:充分性: 由 aij* ai*j* ai*j可以得到 m i aaij*xai*j* m j a iin *j 。
运筹学与最优化方法课件--第七章--对策论模型--2012
海萨尼
值得一提的是纳什,他发表奠定 其在博弈论中重要地位的学术论文时,年 仅22岁,被人称为“一个天才”。1959年, 纳什被精神病医生诊断为“妄想性精神分 裂”,饱受精神病折磨40余年。
泽尔滕
二、基本概念
例1 市场上的某种商品仅由甲,乙两厂生产, 它们都 想通过内部改造,获得更多的市场份额,且两厂分别都有 三个可行方案.据预测,当双方采取不同的方案后甲厂的 市场占有份额(百分比)变动情况如下:
(五)静态博弈和动态博弈
1.静态博弈:是指所有博弈方同时或可看作同时选择策 略、采取行动的博弈。 2.动态博弈:是指博弈方的选择、行动有先有后,而且后 选择、后行动的博弈方在自己进行选择、行动之前可以看在 他之前选择、行动的博弈方的选择、行动的博弈。
(六)完全信息博弈和不完全信息博弈
1.完全信息博弈:是指每一参与者都拥有所有其他参 与者的特征、策略集及得益函数等方面的准确信息的博弈。 2.不完全信息博弈:是指参与者只了解上述信息中的 一部分的博弈。 将博弈的信息特征和行为时间特征结合起来,可以进一 步把博弈细分为下面四种类型的非合作博弈,得到四种均衡:
博 弈 论
美藉匈牙利数学家冯·诺依曼(John Von Neuman) 和美藉奥地利经济学家摩根斯顿(Morgenstern)相识于 普林斯顿大学,他们于1944年出版了经典著作《博弈论 与经济行为》,为现代博弈论的发展奠定了基础。
纳什
美国的数学家、经济学家纳什(John Nash), 美籍匈牙利经济学家海萨尼(John C. Harsanyi) 和德国经济学家泽尔滕(R.Selten)因对博弈论的卓 越贡献而获得1994年度的诺贝尔经济学家。
信息博弈 纳什均衡 完全信息动态博弈 子博弈精炼纳什均衡
管理运筹学11对策论
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
局中人甲应选择2 ,此时不管局中人乙采取什么策略,甲的
赢得均不小于3。
2024/3/29
2. 矩阵对策解的问题
设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,3,4}, S2 = {1 ,2 , 3}
Min
-4 2 -6 -6
对策矩阵G={S1,S2,A}在混合策略意义下有 解的充分必要条件是存在着
x * S1* , y * S2*使(x *,y *) 为E (x,y) 的 一个鞍点,即对于一切x S1* , y S2* 有
E (x,y *) E (x *,y *) E (x *,y)
2024/3/29
3. 矩阵对策的混合策略
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
Max
8 36
Min 3
局中人甲应选择2 ,乙应采取2策略;结果甲赢得3,乙付
出3。
2024/3/29
2. 矩阵对策解的问题
定义1:设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,…,m}, S2 = {1 ,2 , …, n}
6 5 7 5 5 0 1 -1 2 -1
Max 7 5 9 5
Min = 5
i = 1, 3 ,j = 2, 4,ai*j* = 5,四个局势均为矩 阵对策的解。
2024/3/29
3. 矩阵对策的混合策略
对矩阵对策G={S1,S2,A}来说,局中人甲 有把握的最小赢得是:
v1 = max min aij
x S1* y S2*
第十二章-对策论(运筹学讲义)课件
局中人2 出1指
5 -5
出2指 -5 5
局中人1从局中人2该如何选择策略,已获得利益?
-
3
例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在 不同的屋子里审讯。警察告诉他们: 如果两人都坦白,各 判刑8年;如果两人都抵赖,由于证据不充分,两人将各 判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者 立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯 都有两种策略: 坦白或抵赖。可以用一个矩阵表示两个嫌 疑犯的策略的损益
3.一局势对策的益损值: 局中人各自使用一个对策就形成了一 个局势,一个局势决定了各局中人的对策结果(量化)称 为该局势对策的益损值。
赢得函数(payoff function): 定义在局势上,取值为相应益 损值的函数
4. 纳什均衡: 纳什均衡指所有局中人最优策略组成的一种局势,
既在给定其他局中人策略的情况下,没有任何局中人有积
A
1
4
3
2
解因
m i a x m j in a ij 2 , m j in m i a x a ij 3
m a ixm jina ij m jinm a ixa ij
不符合鞍点条件, 故G的鞍点不存在。
例6 求解矩阵对策,其中: 解 容易得到
A 11
0 1
1 1
v a i * j * 1i * 1 ,2 ;j * 3
A
a
2
1
a22
a1m
a2
m
a
m
1
am2
amn
aij为局中人甲在局势
( i , j )下的赢得 -
9
“齐王赛马”是一个矩阵策略。
其中: 齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 },
管理运筹学-对策论
对策论
由“齐王赛马”引入
1.对策论的基本概念
• 三个基本要素;集:局中人选择对付其它局 中人的行动方案称为策略。
某局中人的所有可能策 略全体称为策略集;
3.局势对策的益损值:各局中人各自 使用一个对策就形成一个局势,一 个局势决定了个局众人 的对策结果 (量化)称为该局势对策的益损值)
• “齐王赛马”即是一个矩阵策略.
2.矩阵对策的最优纯策略
• 在甲方赢得矩阵中:
•
A=[aij]m*n
• i行代表甲方策略 i=1,2…m
• J列代表乙方策略 j=1,2…n
• aij代表甲方取策略i,乙方取策略j,这一局势下 甲方的益损值,此时乙方的益损值为-aij(零 和性质)。
• 在讨论各方采用的策略是必须注意一个前提就 是对方是理智的。这就是要从最有把握取得的 益损值情况考虑。
STEP 2
作变换: X1= X1’/V ; X2= X2’/V • 得到上述关系式变为:
X1+ X2=1/V 5X1+ 8X21 9X1+ 6X21 X1, X20
(V愈大愈好)待定
• 建立线性模型:
min X1+X2 s.t. 5X1+8X21
9X1+6X21 X1, X20
X1= 1/21 X2= 2/21 1/V= X1+X2=1/7 所以:V=7
739
A2= 4 6 5.5 603
被第1行所优超
得到
73 9
被第1列所优超
A3= 4 6 5.5
73
最终得到 A4= 46
3.矩阵对策的混合策略(续)
• 对A4计算,用线性规划方法得到: (注意:余下的策略为3,4,1,2) 甲: X* = (0,0,1/15,2/15,0)T V=5
由“齐王赛马”引入
1.对策论的基本概念
• 三个基本要素;集:局中人选择对付其它局 中人的行动方案称为策略。
某局中人的所有可能策 略全体称为策略集;
3.局势对策的益损值:各局中人各自 使用一个对策就形成一个局势,一 个局势决定了个局众人 的对策结果 (量化)称为该局势对策的益损值)
• “齐王赛马”即是一个矩阵策略.
2.矩阵对策的最优纯策略
• 在甲方赢得矩阵中:
•
A=[aij]m*n
• i行代表甲方策略 i=1,2…m
• J列代表乙方策略 j=1,2…n
• aij代表甲方取策略i,乙方取策略j,这一局势下 甲方的益损值,此时乙方的益损值为-aij(零 和性质)。
• 在讨论各方采用的策略是必须注意一个前提就 是对方是理智的。这就是要从最有把握取得的 益损值情况考虑。
STEP 2
作变换: X1= X1’/V ; X2= X2’/V • 得到上述关系式变为:
X1+ X2=1/V 5X1+ 8X21 9X1+ 6X21 X1, X20
(V愈大愈好)待定
• 建立线性模型:
min X1+X2 s.t. 5X1+8X21
9X1+6X21 X1, X20
X1= 1/21 X2= 2/21 1/V= X1+X2=1/7 所以:V=7
739
A2= 4 6 5.5 603
被第1行所优超
得到
73 9
被第1列所优超
A3= 4 6 5.5
73
最终得到 A4= 46
3.矩阵对策的混合策略(续)
• 对A4计算,用线性规划方法得到: (注意:余下的策略为3,4,1,2) 甲: X* = (0,0,1/15,2/15,0)T V=5
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 -1 3 1 1 1
-1 1 1 3 1 1
1 1 -1 1 3 1
1 1 1 -1 1 3
最优策略:有利于自己获得最大赢得(或最少损 失)的策略.
选择最优策略的原则:牢记对方总是以最
不利于你的行动方案来对付你.
例2.设矩阵对策G={S1,S2;A},其中
S1={α1,α2,α3,α4}, S2={β1,β2,β3},
设
xS1* yS2*
yS2*
min max E(x, y) max E(x, y*)
yS
* 2
xS1*
xS1*
min E(x*, y) E(x*, y*) max E(x, y*)
则有 yS2*
xS1*
定义4. 设G*={S1*,S2*;E}是矩阵对策
G=m{Sa1x,Sm2;Ain}E的(混x, y合) 扩 m充in,若max E(x, y) (3)
若存在x*∈A, y*∈B,使得对x∈A, y∈B,有
f(x, y*)≤f(x* , y*)≤f(x* , y) (3)
则称(x* , y*)为f(x,y)的一个鞍点.
矩阵对策G在纯策略意义下有解,且 VG ai j 的充要条件是: a是i j矩 阵A的一个鞍点.
例3. 确定p和q的取值范围,使矩阵
由 aiq ≤ apq= akr ≤ akq≤ apq = akr ≤ akj 得aiq≤akq≤ akj ,即akq是鞍点. 故(αk,βq)是解.同理,(αp,βr)是解. 性质1、2表明,矩阵对策的值是唯一的.
例5.P385例题.
定义3.设矩阵对策G={S1,S2;A}, A=(aij)m×n.若局中
运筹与优化
第十四章 对策论
对策论
对策论的基本概念 对策论的基本定理 矩阵对策的解法
第一节 对策论的基本概念
对策论亦称竞赛论或博奕论,是研究具有斗 争或竞争性质的数学理论和方法.
具有竞争或对抗性质的行为称为对策行为. 对策论是研究对策行为中竞争各方是否存在 最合理的行动方案,以及如何找到最合理方案的 数学理论和方法. 具有对策行为的模型称为对策模型,或对策.
则S1* ,S2*分别称为局中人I和Ⅱ的混合策略集.称x∈S1*,
y∈S2*为局中人I和Ⅱ的混E(合x,策y)略,(xxT,yA)为y 混 合局a势ij xi, y j
局中人I的赢得函数为
ij
称G* ={S1*,S2*,E}为对策G的混合扩充.
max min E(x, y) min E(x*, y)
xS1 yS2
yS2 xS1
记其值为VG ,则称VG为对策G*的值,使(3)成立
的混合局势(x*,y*)为G在混合策略意义下的解.
定理2.矩阵对策G={S1 ,S2;A }在混合策略 中有解的充要条件是: (x*,y*)为E(x,y)的
一个鞍点,即对一切 x∈S1*,y∈S2*,有 E(x,y*)≤E(x*,y*)≤E(x*,y) (4)
例1.“齐王赛马”中,齐王的赢得矩阵为:
田忌 齐王
α1 (上中下) α2 (上下中) α3 (中上下) α4 (中下上) α5 (下中上) α6 (下上中)
β1
β2
β3
β4
β5
β6
(上中下) (上下中) (中上下) (中下上) (下中上) (下上中)
3 1 1 1 1 ቤተ መጻሕፍቲ ባይዱ1
1 3 1 1 -1 1
第二节 对策论的基本定理
局中人I的纯策略集 S1 ={α1 ,α2 , … αm};局中人 Ⅱ的纯策略集S2 ={β1 ,β2 , … βn}; 对任一纯局 势(αi,βj) (共m×n个),局中
人I的赢得值为aij ,赢得矩阵为A=(aij)m×n . 局中人Ⅱ的赢得矩阵为-A.
矩阵对策记为 G={Ⅰ,Ⅱ,S1,S2;A} 或 G={S1,S2;A}.
对策三要素
局中人:在一个对策行为中,有权决定自己行动 方案的对策者.n个局中人的集合I={1,2,…,n}.
理智的决策者:不存在侥幸心理者. 策略集:可供局中人i选择的一个实际可行的完 整的行动方案称为一个策略si,策略集Si.
局势:在对策中,各局中人所选定的策略构成的 策略组s=(s1, s2,… sn).全体局势S=S1×S2×…×Sn 赢得函数:局势s的函数Hi(s). 矩阵对策:二人有限零和对策.
6 1 8
A
3
2
4
9 1 10
试求双方的最优策略和赢得.
3 0
6
理智行为:双方各按最不利于自己的情形
中选择最为利己的结果作为决策的依据.
定m1义iamx1.1m设 jinn矩aij阵 对1m ji策nn(m11Gi)amx=a{ijS1
,aSi2 j
;A
},若等式
成立,记 VG ,则ai j称 VG为对策G的值,称使(1) 成立的纯局势 (i ,为 jG) 在纯策略下的解
A在(α2,β2)处存在鞍点.其中
∵q≤a22≤p ,∴p≥5,q≤5
1 q 6
A
p
5
10
6 2 3
例4.设矩阵对策G={S1,S2;A},其中
S1={α1,α2,α3,α4}, S2={β1,β2,β3},
6 5 6 5
A
1
4
2
1
试求双方的最优策略和赢得.
8 5 7 5
0
2
6
2
人I以概率xi≥0取m 纯xi 策 1略, αi,n局y中j 人1Ⅱ以概率yj≥0取
纯策略βj ,且 i1 .记 j1
m
S1 {x (x1, x2,, xm ) Em xi 0, xi 1}
i1
n
S2 {y ( y1, y2,, yn ) En y j 0, y j 1}
j 1
(或平衡局势、双赢局势).
定理1.矩阵对策G={S1 , S2 ;A }在纯策略 中有解的充要条件是:存在纯局势 (i使, 得j )
aij ai j ai j (2) (i=1,2,…,m, j=1,2,…,n). 既是其a所i j 在
行的最小元素,又是其所在列的最大元素.
定义2.设实函数f(x,y)定义在x∈A, y∈B上,
性质1(无差别性).若(αk,βr)和 (αp,βq)
是对策G的两个解,则 akr =apq.
事实上,由 aij ,有ai j ai j
apq≤ apr≤ akr ≤ akq ≤ apq
因此 akr =apq.
性质2(可交换性).若(αk,βr)和 (αp,βq) 是对策G的两个解,则(αk,βq)和 (αp,βr) 也是对策G的解.