对策论基础
对策论的基本概念
– 策略: 可供局中人选择的一个实际可行的完整的行动 方案.
– 策略集:局中人所拥有的对付其它局中人的手段、方案 的集合。每局中人,都有自己的策略集,一般每一局 中人的策略集中至少应包括两个策略。
对策现象的基本要素
➢ 赢得函数(支付函数)
对策中, 每一局中人所出策略形成的策略组称为一个局势。例如, si 是第 i 个局中人的
运筹学
一个策略,则 n 个局中人的策略形成的策略组
s (s1, s2 ,sn ) , s 就是一个局势,全体局势的集合 S 可用各局中人策略集的笛卡尔积表示,即
S S1 S2 Sn 当一个局势 s (s1, s2 ,sn ) 给定以后,就用一个数来表示局中人的得失(或输赢),显
然,这种“得失”或“输赢”是局势的函数,称为支付函数。通常用正的数字表示局中人的
运筹学
对策论的基本概念
➢对策论的由来和发展历史 ➢ 对策现象的基本要素 ➢ 对策问题举例及对策的分类
对策论的由来和发展历史
在社会生活和经济、经常碰到各种各样具有竞争或利益相对抗的现象,研 究对抗或竞争现象的数学理论和方法,称为对策论。 20 世纪初数学家波雷尔(Borel)和策墨洛(E.Zermelo)开始用数学方 法研究对策现象,研究对象主要是日常生活中的一些游戏(如扑克、象棋 等),因而对策论在相当长的时间内发展缓慢。 冯• 诺依曼(Von Neumann)在 1928 年创立了二人零和对策理论,为对策 论的进一步发展奠定了基础。 1944 年冯•诺伊曼和摩根斯特恩(Morgenstern)合著的《对策论与经济 行为》一书的出版,标志着系统的对策理论的初步形成。 1994 年三位长期致力于对策论的理论和应用研究的学者纳什(John F Nash)、泽尔腾(Reinhard Selten)和海萨尼(John Harsanyi)共同获 得诺贝尔经济学奖,则更是对对策论地位和作用的最具权威性的肯定。 2005 年,以色列经济学家罗伯特·奥曼和美国经济学家托马斯·谢林获 得诺贝尔经济学 奖。罗伯特·奥曼提出的“重复博弈 ”分析,目前成为所 有社会科学的主流分支。托马斯·谢林提出了冲突局势理论,在上世纪 50 年代和 60 年代的冷战时期,该理论极大地影响了美国政府对核威慑的 态度。
《运筹学》教材编写组《运筹学》笔记和课后习题(含考研真题)详解(对策论基础)
圣才电子书 十万种考研考证电子书、题库视频学习平台
(2)2× 或 ×2 对策的图解法
注意:该方法用在赢得矩阵为 2× 或 ×2 阶的对策上特别方便,也可用在 3× 或
×3 对策上。但对 和 均大于 3 的矩阵对策就丌适用了。
设缩减后的赢得矩阵为二阶无鞍点对策问题,局中人Ⅰ的混合策略为
的最优纯策略。 定理 1 矩阵对策 使得对一切
在纯策略意义下有解的充分必要条件是:存在纯局势
,均有
。
定义 2 设
为一个定义在
及
上的实值函数,如果存在
,使得对一切
和
,有
,则称
为
函数 的一个鞍点。 矩阵对策解的性质:
性质 1 无差别性。即若 性质 2 可交换性。即若
也是解。 定义 3 设有矩阵对策
记
是对策 G 的两个解,则
定理 11 设矩阵对策
的值为 ,则
6.矩阵对策的解法 (1)2×2 对策的公式法 所谓 2×2 对策是指局中人Ⅰ的赢得矩阵为 2×2 阶的,即
如果 A 有鞍点,则很快可求出各局中人的最优纯策略;如果 A 没有鞍点,为求最优混 合策略可求下列等式组:
上面等式组(Ⅰ)和(Ⅱ)一定有严格非负解
和
,其中
6 / 33
是对策 G 的两个解,则
和
,其中
,
,
则 和 分别称为局中人Ⅰ和Ⅱ的混的混合策略(或策略);对
,称
为一个混合局势(或局
势),局中人Ⅰ的赢得函数记成
这样得到的一个新的对策记成
,称 为对策 G 的混合扩充。
定义 4 设
是矩阵对策
的混合扩充,如果
3 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
管理运筹学课件第13章-对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。
对策论
• 60年代,泽尔腾(1965)引入动态分析, 提出“精练纳什均衡”概念。海萨尼 (1967-1968)则把不完全信息引入对策 论的研究。
某局中人的所有可能策 略全体称为策略集;
3.局势对策的益损值:各局中人各自 使用一个对策就形成一个局势,一 个局势决定了局中人 的对策结果 (量化)称为该局势对策的益损值)
“齐王赛马”齐王在各局势中 的益损值表(单位:千金)
• 其中:
• 齐王的策略集: S1={1,2,3,4,5,6}
• 建立线性模型:
min X1+X2 s.t. 5X1+8X21
9X1+6X21 X1, X20
X1= 1/21 X2= 2/21 1/V= X1+X2=1/7 所以:V=7
返回原问题: X1’= X1V= 1/3 X2’= X2V= 2/3
于是甲的最优混合策略为:
以1/3的概率选1;以2/3的概率选2 最优值V=7.
j
j
i
又称( 2 ,3 )为对策G={s1,s2,A}
的鞍点。值V为G的值。
3.矩阵对策的混合策略
• 设矩阵对策 G ={S1,S2,A}
• 当 max min aij min max aij
ij
ji
时,不存在最优纯策略 混合策略。
求解
3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
min
• aij代表甲方取策略i,乙方取策略j,这一局势下 甲方的益损值,此时乙方的益损值为-aij(零和 性质)。
对策论基础NEW
田 忌 (上中下) 1 (上下中) 2 齐 (中上下) 3 王 (中下上) 4
1 2 3 4 5 6
3 1 1 -1 1 1 1 3 -1 1 1 1 1 1 3 1 -1 1 1 1 1 3 1 -1 1 -1 1 1 3 1 -1 1 1 1 1 3
(下中上) 5 (下上中) 6
一、基本概念与名词
7.零和对策:如果在任一“局势”中, 全体局中人的“得失”相加总是等于0 时,这个对策就称为零和对策。上述 赛马就是零和对策。否则称为非零和 对策 8.矩阵对策:参加对策的局中人只有二 人,而每个局中人可选策略只有有限个, 每局的得失之和为零.
二、对策分类
结 盟 对 策
联合对策
-1 1 1 1 1 3
(上下中)
齐 (中上下) 王 (中下上) (下中上) (下上中)
策略组合的得失:齐王赛马赢得矩阵A
田 忌 (上中下) 1 (上下中) 2
齐 (中上下) 3 王 (中下上) 4 (下中上) 5 (下上中) 6
1 2 3 4 5 6
3 1 1 -1 1 1 1 3 -1 1 1 1 1 1 3 1 -1 1 1 1 1 3 1 -1 1 -1 1 1 3 1 -1 1 1 1 1 3
1 2
8 4 1 10 0 6
• 从最坏处着想,去争取最好的结果---即最优纯策略。 • 对局中人甲来说,所有最坏的结果是(取A中每一行的最 小) :得 • {-8,2,-10,-3},在这些最坏的情况中最好的结果是 2,因此,无论局中人乙采取什么策略,局中甲只要选a2 参加对策,就能保证收入不会小于2。 • 对局中人乙来说,所有最坏的结果是(取A中每一列的最 大元素,损失最大): • {9,2,6}, • 在这些最坏的情况中最好的结果是2,因此,无论局中人 甲采取什么策略,局中乙只要选B2参加对策,就能保证损 失(支出)不会大于2。 • 那么,此时,局中人甲和乙的最坏情况下的最好结果的绝 对值相等(都是2),那么我们就称a2为局中人甲的最优 策略,B2就称为局中人乙的最优策略。(a2,B2)就称为 对策模型G={S1,S2,A}的最优局势,而局中人甲的赢 得值2称为对策G的值;
博弈论知识点总结完整版
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
对策论的基本概念
对策论的基本概念引言对策论是一种重要的决策理论,它在多个领域,包括经济学、政治学、管理学等方面都有广泛的应用。
本文将介绍对策论的基本概念,包括对策、对策矩阵、纳什均衡等内容。
对策的定义对策是指在决策过程中,一方的行动将受到另一方行动的影响,从而引发一系列后续行动的反应。
对策是一种针对不确定性情况下的最佳决策方法,通过预测对手的可能行动并制定相应的应对策略来实现最优效果。
对策通常涉及两个或多个决策者之间的互动。
在对策中,每个决策者都试图通过选择最优的行动来达到自己的目标,同时也要考虑到对手的行动。
对策矩阵是对策论分析的基本工具之一,用于描述对策者在不同行动下的收益情况。
对策矩阵通常以表格形式呈现,横轴代表一个决策者的行动,纵轴代表另一个决策者的行动,每个单元格中的数值表示在特定行动组合下各方的收益。
例如,考虑两个决策者A和B在某个游戏中的对策矩阵如下:行动1 行动2 行动3行动1 2, 2 0, 3 1, 1行动2 1, 0 3, 2 2, 1行动3 1, 1 2, 2 0, 3在这个对策矩阵中,每个单元格表示A和B在特定行动组合下的收益情况。
例如,当A选择行动1,B选择行动2时,A的收益为0,B 的收益为3。
纳什均衡是对策论中的一个重要概念,指的是在对策矩阵中,各方在给定对手行动的情况下,选择能够最大化自己收益的行动组合。
在对策矩阵中,如果不存在更好的选择来取代当前的行动组合,那么该组合就是一个纳什均衡。
在纳什均衡下,每个决策者都无法通过改变自己的行动来获得更好的结果。
以前面的对策矩阵为例,在该矩阵中,行动组合(行动1, 行动2)是一个纳什均衡,因为在这种情况下,A选择行动1,B选择行动2时,双方的收益已经达到最大化。
结论对策论是一种重要的决策理论,可以应用于各种领域,帮助我们理解和分析决策者之间的互动和冲突。
本文介绍了对策的基本概念,包括对策、对策矩阵和纳什均衡。
了解对策论的基本概念将有助于我们更好地理解和解决复杂的决策问题。
运筹学—对策论(一)
3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。
对
二人
动 策无
态
限
对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵
运筹学[第十四章对策论基础]山东大学期末考试知识点复习范文
第十四章对策论基础1.对策行为具有对策行为的模型称为对策模型或对策,包含三个基本要素。
(1)局中人:在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。
用I表示局中人的集合,若有n个局中人,则I={1,2,…,n},一般要求一个对策中至少要有两个局中人。
(2)策略集:一局对策中,可供局中人选择的一个实际可行的完整的行动方案,称为一个策略。
参加对策的每一个局中人i,i∈I,都有自己的策略集S,i一般每个局中人的策略集中至少应包括两个策略。
(3)赢得函数(支付函数):在一局对策中,各局中人所选定的策略形成的策是第i个局中人的一个策略,则n个局中人的策略组略组称为一个局势,即若Sis=(s1,s2,…s)n为一个局势,全体局势的集合S可用局中人策略集的笛卡尔积表示,即S=S1×S2×…×Sn当一个局势出现后,对策的结果也就确定了,∀s∈S,局中人i可以得到一个赢得Hi(s),Hi(s)为局势s的函数,称之为第i个局中人的赢得函数。
一般当这三个基本因素确定后,一个对策模型也就给定了。
2.最优混合策略的求解方法(1)2×2对策的公式法。
2×2对策是局中人I的赢得矩阵为2×2阶的,即若A不存在鞍点,为求最优混合策略可求下列等式组:(2)2×n或m×2对策的图解法。
设缩减后的赢得矩阵为2阶无鞍点对策问题,设局中人工的混合策略为(x,1-x)T,局中人Ⅱ的混合策略(y,1-y)T。
即则赢得期望值为局中人Ⅰ的期望方程为将①和②式用图形绘出,两图形中的V值先取小然后取大,所得点的坐标即为局中人Ⅰ的最优混合策略。
将③和④式用图形绘出,两图形中的V值先取大然后取小,所得点的坐标即为局中人Ⅱ的最优混合策略。
山东大学期末考试知识点复习(3)线性方程组法。
确定对策的解。
若上述方程组存在非负解x*和y*,则便求得对策的一个解(x*,y*);若求出的解中有负的分量,则无对策的解;若x*和y*。
博弈论基础
博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
参见:行为生态学(behavioral ecology)。
约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
第7章-对策论
例 设一对策 G S, D, A,其中 S s1, s2 , s3 ,
D d1, d2 , d3 ,其赢得矩阵为:
d1 d2 d3
A
s1 s2
3 6
1 0
2 - 3
前提: 对策双方均理智 结论:
s3 - 5 - 1 4 最不利中选最有利
问:双方局中人采用何策略最佳。
囚犯困境问题在经济、政治、军事等领域的应用举例
例:寡头垄断企业定价的博弈
卡特尔价格不是纳什均衡, 最终结果:每个企业按照纳什均衡的价格进行定价, 其利润小于卡特尔价格条件下的利润。
例:公共产品的供给博弈
如果大家都出钱兴办公用事业,所有人的福 利都会增加。问题是,如果我出钱你不出钱, 我得不偿失;而如果你出钱我不出钱,我就可 以占便宜。
赢 B 石头 剪子 布 A
石头 0 1 -1
剪子 -1
0
1
布 1 -1 0
分析:无确定最优解,可用“混合策略”求 解。
4.齐王赛马
战国时期,齐国国王有一天提出要与大将军田忌赛马。田 忌答应后,双方约定: 1)每人从上中下三个等级中各出一匹马,共出三匹; 2) 一共比赛三次,每一次比赛各出一匹马; 3) 每匹被选中的马都得参加比赛,而且只能参加一次; 4) 每次比赛后输者要付给胜者一千金。
解:可用下述表格表示上述寻找最优纯策略过程:
d1
d2
d3
min j
aij
s1
3
1
2
1
s2
6
0
-3
-3
s3
-5 -14-5源自max iaij6
1
4
故若双方都采取理智行为,局势 (s1 , d2 )为最优纯策略.
对策论三要素
对策论三要素
对策论是指在面对问题或挑战时,制定出明确的对策和计划,以应对种种可能出现的情况。
而对策论的三要素是指目标、方法和资源。
首先,对策论的第一个要素是目标。
制定明确的目标是对策论的基础。
只有清楚地知道自己要达成什么目标,才能更有针对性地制定出相应的对策。
比如,如果企业要提高销售额,那么制定的对策就应该围绕如何吸引更多的顾客、如何提高产品的市场竞争力等方面展开。
目标的明确性和可操作性对于制定对策至关重要。
其次,对策论的第二个要素是方法。
制定对策需要有清晰的方法和步骤。
这就需要对问题进行全面的分析和研究,以找出最有效的解决方法。
比如,如果一个政府部门要解决交通拥堵问题,就需要从道路规划、公共交通建设、交通管理等方面综合考虑,找出最适合的解决方法。
方法的科学性和实用性是对策论成功与否的关键。
最后,对策论的第三个要素是资源。
没有足够的资源,再好的对策也无法顺利实施。
资源包括人力、物力、财力等方面。
比如,一个组织要实施一个新的项目,就需要充足的人力资源、资金支持以及物质设备等。
只有足够的资源支持,对策才能得以有效实施。
总的来说,对策论的三要素——目标、方法和资源,是相辅相成、缺一不可的。
只有制定明确的目标,找出科学的解决方法,再加上充足的资源支持,对策才能最终取得成功。
在面对各种问题和挑战时,我们都可以运用对策论的三要素,制定出更加有效的解决方案。
教案_对策论基础
作图如下(示意)
0
1
局中人I用“最大最小”原则选取自己的策略, 即
Max[M0xin1(V1,V2,V3,V4 )]
从图中可知,V2,V3联立即可求出B点坐标为 (5/7, 17/7),此即为局中人I的最优解
则称(X*,Y*)为最优混合局势,或叫做G 在混合策略下的解,V叫做对策G的值。 X*、Y*分别是局中人I、II的最优混合策 略。
混合对策问题的解法
任意一个矩阵对策 G S1, S2, A 一定有解(在混
合策略意义下).且如果G的值是V,则局中人I和II 的最优策略是下列两组不等式的解:
m
aij xi V , j 1,2, n
若满足
max i
mjin{aij
}
min j
miax{aij
}
则上述条件规定的局势
(i*,
* j
)
叫做最优纯局势,也是矩阵对策的最优解,
是局中人I、II的最优纯策略,即鞍点
定理:矩阵对策G={S1,S2,A}有纯策略解的
充要条件是存在一个纯局势
(i*
,
* j
)使得
aij* ai* j* ai* j ,i 1,2, , m; j 1,2, , n
下棋与打牌 体育比赛 战争 市场进入 谈判 生产管理决策 竞拍
几个典型的博弈案例
锤子、剪刀、布的儿童游戏 囚徒困境 智猪博弈 强盗分金币
一、基本概念与名词
局中人 策略与策略集 局势 赢得函数 零和对策 矩阵对策:二人有限零和对策
局中人
在一个对策行为(或一局对策)中,有权决 定自己行动方案的对策参加者,称为局中人 (Player)
对策论的基本概念(PPT 38张)
甲:行局中人;乙:列局中人
6
对策论的基本概念
其中:公司甲的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 公司乙的策略集:S2={ 1, 2, 3}。
下面矩阵称公司甲的赢得矩阵:
A=2/Βιβλιοθήκη 0.5 0.5 0.7 0.7 0.6
0.6 2/3 17/30 0.75 0.7 43/60
此时,局中人公司甲只可能以4,5作为其最优选择,局中人公司乙
只可能以1作为其最优选择,相应的可能的局势有(4,1)和(5,1)。
a x m i n a m i n m a x a 只有当赢得矩阵A=(aij)满足 m i j i j 时,上面 j j i i
的局势才是稳定的,此时两个居中人都不能通过单方面改变策略而受益。
每个公司都想使自己的营业额尽可能多,试分析:两个公司
的最优策略以及各应该占有多大的市场份额。
3
对策论的基本概念
对策模型的三个基本要素: • 1.局中人:局中人指能够选择自己的行动方案从而使自身 的利益最大化的决策主体,即有决策权的参加者。(理性) • 2.策略集:局中人选择对付其它局中人的行动方案称为策
17
矩阵对策的混合策略
公司甲: 公司乙选择纯策略 此时,公司甲的预期收益
0 . 75 x 0 . 7 x 43 x / 60 1 2 3
(1,0) (0,1)
0 . 7 x 0 . 75 x 43 x / 60 1 2 3
给定公司甲的混合策略(x1,x2,x3),在最坏的情况下,公司甲
所以,当对策重复进行时,居中人都会坚持使用该策略不变。这种策略称 为最优纯策略,并把(4,1)和(5,1)称为对策G在纯策略意义下的解,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-1
1
1
3
1
1
1
1
-1
1
3
1
1
1
1
-1
1
3
田忌的赢得矩阵是什么?
锤头、剪刀、布游戏
设游戏双方为甲、乙,则甲的赢得
乙
甲的赢得
包
剪
锤
甲
包
0
-1
1
剪
1
0
-1
锤
-1
1
0
二、最优纯策略
现有一矩阵对策 G S1, S2 , A
S1 {1,2 ,3,4}, S2 {1, 2 , 3}
其中
1 2 3
例子的最优纯策略
在上述定理中
aij*
min j
(aij
),
ai* j miax(aij )
因此符合条件
max(a
i
ij
*
)
min j
(ai*
j
)
的即为最优纯策略。
上述例子的最优纯策略为:最优局势
(2, 2 )
且G=2为局中人I的赢得值。
再看一例
已知
G
(S1, S2 ,
A),
其中S1
{1,
零和对策
如果各局中人的赢得函数之和为零,则称之 为零和对策,反之为非零和对策
矩阵对策
有限二人零和对策
三个特征:局中人只有2个;每个局中人只 有有限个可选择的策略;在任一局势中,两 个局中人的得失之和为零
二、对策分类
(一)按对策双方是否存在有约束力的协议 来分:合作对策 非合作对策 (二)按局中人数分类:二人对策 多人对策 (三)按策略数分类:
在儿童游戏中,锤子、剪刀、布就分别是一 个策略,{锤子、剪刀、布}就是一个策略 集。
如果每个局中人只有有限个策略,则相应的 对策称为有限对策,否则称为无限对策
局势
在一局对策中,每个局中人采用的策略所形 成的策略组称为一个局势,用s表示。
赢得函数(支付、支付函数,Payoff)
当局势出现后,对策的结果也就确定。即: 对任一局势 s S,局中人i可以得到一个赢得 Hi (s) ,显然,H i (s) 是局势s的函数,称之 为第i个局中人的赢得函数
运筹学
讲课教师:汤建影
南京航空航天大学经济与管理学院
第六章 对策论基础
概论 矩阵对策的基本理论
第一节 概论
对策与决策 决策是由单方做出的 对策是由利害冲突的多方做出的 1944年,Von Neumann &
D.Morgenstern合作出版《对策论与经济 行为》,标志着对策论的诞生
博弈现象
1 6 1 8
A
2
3
2
4
3 4
9 3
1 0
10
6
纯策略与纯局势
如果局中人I,II的策略集分别为
S1 {a1, a2 , , am}, S2 {1, 2 , , n}
称 i为I
的纯策略,
为
j
II
的纯策略,
对于纯策略i , j 构成的策略偶( i , j )称
为纯局势
矩阵对策的纯策略解(鞍点解)
,
2
,
3
4}
S2
{1,
,
2
,
3
4}
8 6 8 6
A
1
3
4
3
9 6 7 6
3 1 10
3
求解此矩阵对策
对策的解可能不是唯一的,但是对策的值 是唯一的,对策的解不唯一时,满足以下两 条性质:
无差别性:若 (i1, j1)与 i2 , j2 是矩阵对策G
的两个解,则 ai1, j1 ai2, j 2
下棋与打牌 体育比赛 战争 市场进入 谈判 生产管理决策 竞拍
几个典型的博弈案例
锤子、剪刀、布的儿童游戏 囚徒困境 智猪博弈 强盗分金币
一、基本概念与名词
局中人 策略与策略集 局势 赢得函数 零和对策 矩阵对策:二人有限零和对策
局中人
在一个对策行为(或一局对策)中,有权决 定自己行动方案的对策参加者,称为局中人 (Player)
对策的数学表示
二人矩阵对策用下列式子表示
G I, II , S1, S2, A或G S1, S2, A
其中I、II表示两个局中人,S1、S2分别 表示局中人I、II的策Байду номын сангаас集,A则表示赢得
矩阵: A (aij )
齐王的赢得矩阵(支付矩阵)A
3
1
1
1
1
-1
1
3
1
1
-1
1
A=
1
-1
3
1
1
1
对于局中人I来说,各策略中最坏的结果 分别为{-8, 2, -10, -3}
在这些最坏的情况中,最好的结果是
max{-8, 2, -10, -3}=2
即:只要局中人I采用 2 ,无论II采用何
种策略,I都可以保证赢得不少于2
在这种情况下,II应采用策略 2 ,否则
输得更多
最优纯策略的表述
有限策略对策 无限策略对策
二人有限零和对策是讨论的重点。
第二节 矩阵对策的基本理论
矩阵对策的数学模型 最优纯策略 混合策略与混合扩充
一、矩阵对策的数学模型
以齐王赛马为例说明: 齐王赛马—二人有限零和对策
局中人—齐王和田忌
策略— 上 中下三种等级的马的组合 ,比三次,有六组
策略:( 上,中,下) 、 ( 中,上,下) 、 ( 上,下,中) 、
通常用I表示局中人的集合,如果有n个局中 人,则I={1,2,3,…,n}
在一个对策中,至少要有两个局中人 局中人,不一定是单个人,也可以是利益完
全一致的一个集体 只有两个局中人的对策,称为两人对策
策略和策略集
一局对策中,可供局中人选择的一个实际可 行的完整的行动方案,称为一个策略,它的 集合称为策略集S。
若满足
max i
mjin{aij
}
min j
miax{aij
}
则上述条件规定的局势
(i*,
* j
)
叫做最优纯局势,也是矩阵对策的最优解,
是局中人I、II的最优纯策略,即鞍点
定理:矩阵对策G={S1,S2,A}有纯策略解的
充要条件是存在一个纯局势
(i*
,
* j
)使得
aij* ai* j* ai* j ,i 1,2, , m; j 1,2, , n
可交换性:若 (i1, j1)与 i2 , j2 是矩阵对策的 两个解,则 (i1, j2 )与 i2 , j1 也是对策的解
( 中,下,上) 、 ( 下,上,中) 、 ( 下,中,上) ,对齐王
,表这示六,组对策田略忌用,则i , i用
1,2,3,4,5,6 i , i 1,2,3,4,5,6
表示。
支付函数—赢了得一千金,输了付一千金。
齐王赛马赢得函数
田忌
1 2 3 4 5 6
(上中下) 1 3 1 1 1 1 -1 (上下中) 2 1 3 1 1 -1 1 齐 (中上下) 3 1 -1 3 1 1 1 王 (中下上) 4 -1 1 1 3 1 1 (下中上) 5 1 1 -1 1 3 1 (下上中) 6 1 1 1 -1 1 3