第十章 对策论课件
《管理运筹学-对策论》
博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。
第十章 对策论
第十章 对策论主要内容:1、对策行为的基本要素; 2、矩阵对策; 3、矩阵对策的解法。
重点与难点:矩阵对策的数学模型,最优策略,混合策略,无鞍点矩阵对策的求解方法。
要 求: 准确理解极大极小原理、最优策略,最优混合策略,熟练掌握求解矩阵对策的公式法、图解法和线性规划方法,并能够正确使用这些方法解决实际问题。
§1 概述 一、对策行为和对策论对策论亦称竞赛论或博奕论,是研究具有斗争或竞争性质现象的数学理论和方法。
具有竞争或对抗性质的行为称为对策行为。
二、对策行为的三个要素具有对策行为的模型称为对策模型或对策。
对策模型的种类千差万别,但从本质上都包括如下三个要素:(1)局中人在一个对策行为(或一局对策)中有权决定自己行动方案的对策参加者,称为局中人。
一般要求一个对策中至少要有两个局中人。
(2)策略一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。
局中人所制定的策略全体,称为局中人的策略集合。
在一局对策中,如果各局中人的策略有限,则称之为“有限策略”,否则称之为“无限策略”。
(3)赢得函数(支付函数)一局对策结束时,对每个局中人来说,结果总是肯定的,并以一定的形式表现出来。
我们称这样的结果为“赢得”或“支付”。
一局对策结束时,每个局中人的盈亏是该策略组的函数,通常称为“赢得函数”或“支付函数”。
从每个局中人的策略集中各取一个策略组成的策略组,称为“局势”。
§2 矩阵对策矩阵对策就是有限二人零和对策。
它指的是只有两个参加对策的局中人,每个局中人都具有有限个策略可供选择。
在任一局势下,两个局中人的赢得之和总是等于零,即双方的利益是激烈对抗的。
一、矩阵对策的数学模型用Ⅰ、Ⅱ分别表示两个局中人,并设局中人Ⅰ有m 个纯策略m ααα,,, 21可供选择,局中人Ⅱ有n 个纯策略n βββ,,, 21可供选择,则局中人Ⅰ、Ⅱ的策略集分别为:{}{}n m s s βββααα,,,,,, 212211==当局中人Ⅰ选定纯策略i α和局中人Ⅱ选定纯策略j β后,就形成了一个纯局势),(j i βα。
运筹学--对策论 PPT
当盟军获悉此情报后,盟军统帅麦克阿 梭命令太平洋战区空军司令肯尼将军组织空 中打击。
日本统帅山本五十六大将心里很明白: 在日本舰队穿过俾斯麦海的三天航行中,不 可能躲开盟军的空中打击,他要策划的是尽 可能减少损失。
日美双方的指挥官及参谋人员都进行了 冷静的思考与全面的谋划。
自然条件对于双方 都是已知的。基本情况如下: 从蜡包尔出发开往莱城的海上航线有南北两条。通过时 间均为3天。
案例中,肯尼将军与山本五十六大 将的赢得(支付)函数都可以用矩 阵A、B表示。
(盟军)北线 南线
(日军)北线 南线
(日军)
北线
南线
22 =A1源自3(盟军)北线
南线
-2
-2 =B
-1
-3
在本例中的每一个对局,双方的 赢得的代数之和为零,这样的对 策称为“有限零和二人对策”
设两个局中人为I,II,局中人I有 m 个策略:1、 2… m ;用S1表 示这些策略的集合:
max min aij
i
j
同样,局中人II可以保证局中人I的 赢得不超过
min max aij
j
i
案例中局中人I(盟军)应当选择 (北线)策略1,这样能保证赢得2。局 中人II(日军)应当选择(北线)策略1 使盟军赢得不超过2。实际上,在( 1, 1)局势下,有
max min aij= min max aij
局势3:盟军的侦察机重点搜索南线,而日本舰队走北 线。由于发现晚、盟军的轰炸机群在南线,以及北线气 候恶劣,故有效轰炸只有一天。
局势4:盟军的侦察机重点搜索南线,日本舰队也恰好 走南线。此时日本舰队迅速被发现,盟军的轰炸机群所 需航程很短,加上天气晴好,有效轰炸时间三天。
运筹学第十章
共八十四页
在纯策略下有解的矩阵对策(duìcè)的解 法
解法的思想(sīxiǎng):双方都立足在不利的情况下争取最好 的结果─最大最小原则。
例 求解矩阵对策 G ={S1,S2;A},其中:
7 1 8
A
3
2
4
16 1 3
3 0 5
共八十四页
解:
max aij
i
1 2 3
1 7 1 8
共八十四页
第1节 引言(yǐnyán) 1.1 对策行为和对策论
对策行为是指具有(jùyǒu)竞争或对抗性质的 行为,在这类行为中,竞争对手可能采取的 各种策略是清楚的;各方一旦选定了自己 的策略,竞争结果就清楚了,竞争结果可 以定量描述;双方都希望取得最好的结果 而且十分清楚对方也想达到同样的目的。
S1 ={α1,α2…,αm} S2 ={β1,β2,…βn}
共八十四页
为了与后面的概念区分开来,称αi为I的 纯策略,βj为II的纯策略,对于(duìyú)纯策略
构 成的局势(αi,βj)称为纯局势。
共八十四页
局中人I的赢得(yíngdé)矩阵记 为
a11 a12
a1 j
a21
a22
a2 j
金,田忌要输3千金。田忌的谋士建议田忌在赛前先探
听齐王赛马的出场次序,然后用自己的下马对齐王的上 马,用中马对齐王的下马,用上马对齐王的中马。结果
(jiē guǒ)负一局胜两局赢得1千金。由此看来,两个人各 采取什么样的出马次序对胜负是至关重要的。
共八十四页
1.2 对策(duìcè)模型的三要素
我们称具有对策(duìcè)行为的模型为对策(duìcè) 模型或
min j
aij
十对策分析PPT课件
例2:
猜拳游戏:
没有
鞍点
乙 甲
石头 布
剪刀
max
石头 布 剪刀 min
0 -1 1 -1
1
0 -1 -1
-1
1 0 -1
1
11
P351例 某单位采购员在秋天决定冬季取暖用煤的储量 问题,已知在正常的冬季气温条件下要消耗15吨煤,在较暖 和较冷的天气下要消耗10吨和20吨。假定冬天的煤价随天气 寒冷程度而有所变化,在较暖和、正常、较冷的气候条件下 每吨煤价分别为10元、15元、20元。又设冬季时煤炭价格为 每吨10元。在没有关于当年冬季准确的气象预报的条件下, 秋天储煤多少吨能使得单位的支出最少?
二人有限零和对策(two-person zero score game)
❖对策中存在有2个局中人; ❖每个局中人的策略集的策略数是有限
的; ❖每一局势的对策都有确定的损益值,
且对同一局势的两个局中人的损益值 之和为零。 ❖例:齐王赛马
赢得矩阵:
❖将二人有限零和对策双方的得失用矩阵表示, 称为赢得矩阵,又叫支付矩阵。
在非零和对策中存在着总得益较大的策略组合和总得益较小的策略组合之间的区别这也就意味着在对策方之间存在着互相配合争取较大的总得益和个人得益的可能两人零和对策是完全对抗性的总得益为0其解法可能性根据矩阵对策予以求解但在非零和对策下矩阵对策求解法已经不适用了下面用例子予以说明
对策论
对策论
§1 对策论的基本概念(掌握) §2 矩阵对策的最优纯策略(掌握) §3 矩阵对策的混合策略(掌握)
❖在竞争过程的各方为了达到自己的 目标和利益,必须考虑对手的各种 可能的行动方案,并力图选取对自 己最为有利可最为合理的方案,
第10章 对策论
运 筹 帷 幄 之 中 Game Theory
决 胜
对 策 论
千 里 之 外
第1页
对 策 论
• 引言 • 矩阵对策的平衡局势 • 非合作对策的平衡局势 • 合作对策
第2页
引言
• 对策论发展简史
• 对策模型 • 例子
第3页
对策论发 展 简 史
• 早期工作
1912年E.Zermelo “关于集合论在象棋对பைடு நூலகம்中的应用” 1921年E.Borel 引入最优策略 1928年J.V.Neumann证明了一些猜想
• 两人有限零和对策(也称矩阵对策)
有两个局中人,每个局中人的策略集合都是有限的,两个 局中人的支付函数 H1 , H 2 具有性质 H1 H 2 0 。
第8页
矩阵对策的设定
• 两人有限零和对策
局中人:两人 策略集:
S1 { 1 , 2 ,..., m } S 2 { 1 , 2 ,..., n }
的充要条件是
ai *j a *i *j a ,*i ji , 2 , . m. , 1 . j
1 , 2n, . . . ,
第12页
例 子
例 求下面的矩阵对策的解
1 2 3 2 5 3 6 4 0 2 4 2
显然对于a22 满足上述要求, 所以局势( 2 , 2 ) 就是对策的解。
第13页
矩阵对策的混合扩充
为了克服有些矩阵对策没有平衡局势的困难,我们将 扩充这些矩阵对策,并且扩充以后,平衡局势存在的可能 性就大得多。 做这样的扩充: 把每个局中人的策略集合 S i 扩 充为在集合 S i 上的概率分布集合 Si * , i 1, 2 。就是说,在 进行多次对策时,不是每次都选择同一策略,而是以不同 的概率选择每个策略。支付函数是进行多次对策所得到支 付的数学期望值,称这种扩充为混合扩充。
《对策》PPT教学课文课件
孙膑还没有说完,田忌瞪了他一眼:“想不到你也来挖苦我!”孙膑说: “我不是挖苦你,我是说你再同他赛一次,我有办法准能让你赢了他。”田忌 疑惑地看着孙膑:“你是说另换一匹马来?”孙膑摇摇头说:“连一匹马也不 需要更换。”
田忌 下等马 上等马 中等马
胜者 齐王 田忌 田忌
探究新知
请在表格里填出田忌所有的应对方法。
方案
第一场
第二场
第三场
田忌1
上等马
中等马
下等马
田忌2
上等马
下等马
中等马
田忌3
中等马
上等马
下等马
田忌4
中等马
下等马
上等马
田忌5
下等马
上等马
中等马
田忌6
下等马
中等马
上等马
发现:田忌只有一种情况能赢。
获胜方
齐王 齐王 齐王 齐王 田忌 齐王
实践应用
抢10游戏
游戏规则:两人一组,轮流报数,每次只能报1或2,把两人报的 所有数加起来,谁报数后和是10,谁就获胜。
策略思考:如果让你先报数,为了确保获胜,你第一次应该先报 几?接下来应该怎么报?
如果把游戏中的10改成30,应该怎么报才能确保获胜?
做一做
孙膑拿上等马对齐王的中等马,获胜了一局。齐王有点慌乱了。 第三局比 赛,孙膑拿中等马对齐王的下等马,又战胜了一局。这下,齐王目瞪口呆了。 比赛的结果是三局两胜,田忌赢了齐王。还是同样的马匹,由于调换一下比赛 的出场顺序,就得到转败为胜的结果。
管理运筹学-对策论幻灯片PPT
• 都至少可以得益。〔最多损失0〕
• 分别称甲,乙公司的最优策略,由 唯一性又称最优纯策略。
• 存在前提:
• max min aij = min max aij = v
• ij
ji
• 又称〔 2 , 3 〕为对策
3.矩阵对策的混合策略
• 设矩阵对策 G ={S1,S2,A}
•
当
i
max j
min j
iaij
min
max
aij
时,不存在最优纯策略 求解混 合策略。
3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
min
59 5
A=
max 6 策略2
86 6 i
max 8 9
min 8 策略1
j
• 矛盾:甲取 2 ,乙取时 1,甲实际赢 得8比预期多2〔乙就少2〕这对乙讲是不 满意的,考虑这一点,乙采取策略 2, 假设甲分析到这一点,取策略 1,那么 赢得更多为9…
作变换: X1= X1’/V ; X2= X2’/V 得到上述关系式变为:
X1+ X2=1/V (V愈大愈好〕待定 5X1+ 8X2 1 9X1+ 6X2 1 X1, X2 0
• 建立线性模型:
min X1+X2
s.t. 5X1+8X21
X1= 1/21
9X1+6X21
X2= 2/21
X1, X20
〔量化〕称为该局势对策的益损值〕
“齐王赛马〞齐王在各局势中 的益损值表〔单位:千金〕
• 其中: • 齐王的策略集:
S1={ 1, 2, 3, 4, 5, 6} • 田忌的策略集:
S1={ 1, 2, 3, 4, 5, 6} • 以下矩阵称齐王的赢得矩阵: • 3 1 1 1 -1 1 • 1 3 1 1 1 -1 • A= 1 -1 3 1 1 1 • -1 1 1 3 1 1 • 1 1 1 -1 3 1
对策论 幻灯片
想一想:如果让你先报,为了确保胜 利,你第一次应该报几?接下来应该 怎么报?
• 有15根火柴,甲乙两人轮流取火柴, 每次只能取1根或2根,谁取到最后一 根火柴谁就赢。想一想:如果是你, 为了确保获胜,是应该先取火柴,还 是应该后取火柴?怎样取?
你能用博奕论法在这个游戏中获胜吗? 游戏:有54张扑克牌,甲乙俩人轮流 从中抽取扑克,规定每人每次从中至少 抽取一张,但不多于4张,谁抽的最后 一张谁获胜.若你先抽取,你怎样抽取 才能保证一定会赢?
7 7 5 5 3 3
5 3 7 3 7 5
3 5 3 7 5 7
3 )局 4 5 6
)局 )局 )局
• 田忌比赛的故事:齐国大将田忌很喜欢赛马,一回,他跟 齐王约定,把各自的马分成上中下三等进行比赛,齐王每 个等级的马都比田忌快一些,按常规比赛齐王一定能取胜 ......
数学书第116页
• 生活中的对策论:
• 新田忌赛马,马增加到4匹。分为上等, 中上等,中等,下等,四等级的马。
齐王 第一场 第二场 第三场 田忌 本场胜者
第四场
四(1)班和四(2)班进行跳绳比赛,每班送 出跳绳最好的5名同学参赛,每场比赛时间是1 分钟,5局3胜,这些选手1分钟的最好成绩如下 表:如果四(1)班想赢,该怎样安排?
个/分钟 四(1)
对策论的应用
第一组
第二组
比赛要求:老师和学生各选一组进行比赛,先选的先出牌, 每次各出一张牌谁的牌大谁就赢?采用三局两胜制。
要求:按一定顺序填表,做到不从 重复,不遗漏。
红方 8 6 4
黑方 第( 黑方 第( 黑方 第( 黑方 第( 黑方 第( 黑方 第(
胜利方
红 红 红 红 黑 红
1 2
第10章 对策理论 谢家平2
下面矩阵称齐王的赢得矩阵:
1 2 3 A 4 5 6
1 3 1 1 1 1 1
2 1 3 1 1 1 1
3 1 1 3 1 1 1
4 1 1 1 3 1 1
5 1 1 1 1 3 1
之为对策G={S1,S2,A}的值。
• 称G为有鞍点的对策。
r , k , v v
* * *
aij* ai* j* ai* j
10
例10-2
甲 α1
乙
β1
-7
β2
1
β3
-8
min(aij)
-8
α2 α3 α4 max(aij)
3 16 -3 16
2 -1 0 2
4 -3 5 5
6
é a ê 11 ê a A = ê 21 ê ê a ë m1
a12 a22 am 2
a1n ù ú a2 n ú ú ú amn ú û
为局中人I的赢得矩阵(或为局中人II的支付矩阵)
例 1 0 - 1 “ 田忌赛马”齐王在各局势中的益损值表(单位:千金)
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 },
ì a y £ v, i = 1, ,m ij j ïå i ï (Ⅱ) íå y j = 1 ï j ï y ³ 0, j = 1, ,n î j
矩阵对策及其解的性质
定理1:对任一矩阵 G S1 ,S2 ; A ,一定存在混合策略意义下的解。
定理2:设 x , y 是矩阵对策G的解,v V ,则:
人Ⅰ、Ⅱ的策略集分别为 S1 = {a1 ,a2 ,
运筹学-10、对策论
对策论
第一节 引言
一、对策行为与对策论
对策论又称博弈论,是运筹学的一个重要分 支。对策论所研究的主要对象是带有斗争或竞争性 质的现象。由于对策论研究的对象与政治、军事、 工业、农业、交通、运输等领域有密切关系,处理 问题的方法又有着明显的特色,所以越来越受到人 们的重视。
1
在日常生活中,我们经常看到一些相互之间的 竞争、比赛性质的现象,如下棋、打扑克、体育竞 赛等。
所以:min max aij
j i
max min aij (1)
i j
i
j
另一方面,对任意i,j均有:
min aij aij max aij j i max min aij max aij
i j i
j j
max min aij min max aij (2)
i
所以: max min aij
7
例1:设有矩阵对策,局中人Ⅱ的支付矩阵如下:
7 3 A 16 3
1 8 2 4 1 9 0 5
解: α3 → β3 → α4 → β1 → α 3
如果各局中人都不想冒险,必须考虑对方会 选择策略使他得到最差的收入。因此各局中人都 选择理智的决策行为。
对策的值为VG= 5。
17
二、矩阵对策的混合策略
矩阵对策G有鞍点时,就存在最优解(最优纯策 略),但是否一切矩阵对策问题中,各局中人都有 上述意义的最优纯策略呢?答案是否定的。
1 1 0 A 1 0 1 例1:石头、剪刀、布 1 1 0
max min aij 1 min max aij 1
i j j i
不存在上述纯策略意义下的解。
对策论-2人零和
第十章竞争型决策方法学习目的了解竞争型决策的基本概念;理解矩阵对策基本概念和基本原理;掌握矩阵对策的求解方法。
引导案例公元前四世纪的中国,处在诸侯割据的状态,历史上称为“战国时期”。
在魏国作官的孙膑,因为受到同僚庞涓的迫害,被齐国使臣救出后,到达齐国国都。
齐国使臣将他引见给齐国的大将军田忌,田忌向孙膑请教兵法,孙膑讲了三天三夜,田忌特别佩服,将孙膑待为贵宾,孙膑对田忌也很感激,经常为他献计献策。
赛马是当时最受齐国贵族欢迎的娱乐项目。
上至国王,下到大臣,常常以赛马取乐,并以重金赌输赢。
田忌多次与国王及其他大臣赌输赢,屡赌屡输。
一天他赛马又输了,回家后闷闷不乐。
孙膑安慰他说:“下次有机会带我到马场看看,也许我能帮你。
”当又一次赛马时,孙膑随田忌来到赛马场,满朝文武官员和城里的平民也都来看热闹。
孙膑了解到,大家的马按奔跑的速度分为上中下三等,等次不同装饰不同,各家的马依等次比赛,比赛为三赛二胜制。
孙膑仔细观察后发现,田忌的马和其他人的马相差并不远,只是策略运用不当,以致失败。
孙膑告诉田忌:“大将军,请放心,我有办法让你获胜。
”田忌听后非常高兴,随即以千金作赌注约请国王与他赛马。
国王在赛马中从没输过,所以欣然答应了田忌的邀请。
比赛前田忌按照孙膑的主意,用上等马鞍将下等马装饰起来,冒充上等马,与齐王的上等马比赛。
比赛开始,只见齐王的好马飞快地冲在前面,而田忌的马远远落在后面,国王得意地开怀大笑。
第二场比赛,还是按照孙膑的安排,田忌用自己的上等马与国王的中等马比赛,在一片喝彩中,只见田忌的马竟然冲到齐王的马前面,赢了第二场。
关键的第三场,田忌的中等马和国王的下等马比赛,田忌的马又一次冲到国王的马前面,结果二比一,田忌赢了国王。
从未输过比赛的国王目瞪口呆,他不知道田忌从哪里得到了这么好的赛马。
这时田忌告诉齐王,他的胜利并不是因为找到了更好的马,而是用了计策。
随后,他将孙膑的计策讲了出来,齐王恍然大悟,立刻把孙膑召入王宫。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
极大极小原则
如果局中人Ⅰ采用他的策略αi ,则至少赢得为
min aij
1 jn
局中人Ⅰ希望a ij越大越好,因此他可以选择使上式为最大 的策略,从而他的赢得不少于
❖ 在对策行为中,参与竞争的各方(局中人)各有不同的 利益目标,各有自己的可能的行动方案(策略),在每 一次竞争过程(局势)中,都力图选取对自己最为有利 或最为合理的方案(最优策略)。
齐王赛马
❖ 战国时代,齐王有一天要和他的大将军田忌赛马。比赛 三场,每场各自选上中下三个等级的马一匹进行比赛, 并规定每个等级的马只能赛一场,三赛二胜者为赢。已 知在同等级的马中,齐王的马都比田忌的马强;在不同 等级中,齐王的马要比田忌的高一个等级的马弱。
齐王赛马支付矩阵
3 1 1 1 1 1
1 3 1 1 1 1
A
1
1311来自11 1 1 3 1 1
1 1
1 1 1 3 1 1 1 1
1 3
如α11=3表明,当齐王取策略α1,田忌取策略β1时, 齐王应取得的支付值3,即田忌得到的支付值是-3;
或者说齐王赢得3,田忌输掉3。
教学内容
❖ 讨论二元对策论的数学模型、 ❖ 二元对策论与线性规划的关系, ❖ 给出最优策略的算法。
§10.1 二元对策
设Ⅰ,Ⅱ表示二元对策中的两个局中人; 局中人Ⅰ和局中人Ⅱ的策略集分别表示,
S1 ={α1,α2, …,αm}, S2={β1,β2,…,βn}。 设αij表示局势(αi,βj)的结果, αij表明局中人Ⅰ选定策略αi、局中人Ⅱ选定策略βj后,局 中人Ⅰ得到的赢得值。
齐王赛马的策略集
❖ 在齐王赛马中,一次对策行为分为三场进行,三匹马依次参赛 的次序就是一个完整的行动方案,构成齐王或田忌的一个策略。
❖ 齐王和田忌各有六个策略: (上中下)、(上下中)、(中上下)、(中下上)、(下中上)、(下上中)。 S1={α1,α2,α3,α4,α5,α6} S2={β1,β2,β3,β4,β5,β6}
4 610
策略分析
6 1 8
A
3 9 3
2 1 0
4 610
❖ 如果局中人Ⅰ愿意冒险,想获得最大赢得值a 31 =9,而选择策 略3,同时满心希望局中人Ⅱ选择策略1,造成最有利于自己 的局势( 3 , 1 )。
❖ 若局中人Ⅱ识破局中人Ⅰ的企图,而选择策略3,则将造成最 不有利于局中人Ⅰ的局势( 3 , 3 ),使其赢得值a 33 = -10.
对局策略
❖ 田忌为取得比赛的胜利,接受了孙膑的建议:每场比 赛时先让齐王牵出要比赛的马 (名为恭敬实有对策), 然后用自己的下马对齐王的上马,中马对齐王的下马, 上马对齐王的中马。比赛结果,田忌获胜。
❖ 在这个故事里,田忌并没有设法去得到更好的马,而 只是在比赛中运用了较好的策略而获胜。
基本概念一
齐王赛马数学模型
“齐王赛马”的数学模型 G= {S1,S2;A},
S1={α1,α2,α3,α4,α5,α6} S2={β1,β2,β3,β4,β5,β6} 其中αi与βj表示策略为 (上中下),(上下中),(中上下),(中下上),(下中上),(下上中)。 齐王赛马是零和对策。
策略分析
❖ 给定一个二元对策G={S1,S2;A}。局中人如何选取对自 己最为有利,或最合理的策略问题。
赢得矩阵(或支付矩阵)
❖ 局中人Ⅰ的赢得矩阵(支付矩阵)可记为:
a 11
A
a 21
a 12
a 22
a 1n
a 2n
(1)
a m1
a m2
a mn
数学模型
二元对策矩阵的数学模型记为 G={Ⅰ,Ⅱ;S1,S2;A},
如果无需表明局中人,则二元对策模型可简记为 G={S1,S2;A}。
在一个二元对策G中,如果两个局中人所得到的支付值之和 都等于0,称对策G为零和对策(zero-sum games),或二元零 和对策(two-person zero-sum games)。
基本概念三
❖ 局势 在二元对策行为中,参与对策的所有局中人各自选取一个 策略后,即可构成这次对策行为的一个局势,或结局。 当局势出现后,对策行为的结果也就确定。
基本概念四
❖ 支付矩阵(payoff matrix) 在二元对策行为中,所有局势的结果可构成一个矩阵, 称之为支付矩阵或赢得函数、支付函数。 二元对策也称为矩阵对策。因为利用对策的支付矩阵能 够完成确定对策。 ❖ 对策问题的三要素: 局中人、策略集、支付矩阵。
❖ 在支付矩阵A中 A ij mn
❖ a ij 既是局中人Ⅰ的赢得值,又是局中人Ⅱ的损失值。 ❖ 局中人Ⅰ希望赢得值a ij越大越好, ❖ 而局中人Ⅱ则希望损失值a ij越小越好。 ❖ 因此,矩阵对策完全是对抗性的。
例1 矩阵对策G={S1,S2;A}
6 1 8
A
3 9 3
2 1 0
❖ 局中人(player) 在对策行为中,有权决定自己行动方案的对策参加者,称
为局中人。 如齐王赛马中,齐王和田忌就是局中人。 如果局中人数为2,则称对策为二元对策。
基本概念二
❖ 策略集(strategy set) 在一次对策行为中,可供局中人选择的一个实际可行的完 整的行动方案称为一个策略(strategy)。 所有策略构成局中人的策略集。
第十章 对策论
❖ 对策论(game theory)是运筹学的又一重要分 支,它研究具有竞争(或斗争)性质现象的数 学理论和方法,也称为博奕论。
概述
❖ 在人类社会活动中,经常会遇到这种具有竞争或对抗性 质的行为,比如体育比赛、军事战争、政治斗争等,尤 其是在经济生活中,企业之间为争夺市场而竞争,企业 之间的各种经济谈判,不胜枚举。称这种具有竞争性质 的或对抗性质的行为为对策行为。
v1
max
1im
min
1 jn
aij
(1)
极小极大原则
如果局中人Ⅱ选取策略βj,则他至多失去
max aij (4)
1im
❖ 局中人希望a ij越小越好,他可以选择使上式最小的策略, 即保证他的损失不大于
v2
min
1 jn
max