第十章 对策论
《管理运筹学-对策论》
博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。
对策论概述
对策论对策论是对决策者之间的行为的相互影响的研究。
因为对对策论的研究特别强调决策者行为的理性,在过去的二十年间,对策论已被广泛地应用于经济学中。
确实大多数经济行为能够被看成是对策论的一个特殊的情形。
5.1 对策的描述一个对策是对许多决策者的行为的相互影响的正式的表示。
行为的相互影响意思是每一个人的福利不仅依赖她自己的行为而且依赖其他人的行为。
而且她可能采取的最好的行为依赖于她对其他人的行为的预期。
要想完整地描述一个对策,我们必须知道以下四件事情:(1)局中人:有那些人卷入该对策?(2)规则:谁什么时候行动?当他们行动时他们知道什么?他们能干什么?(3)结果:对于局中人的每一组行为,对策的结果是什么?(4)报酬:局中人关于各种可能的结果的偏好(也即效用函数)是什么?例子5.1.1:配对的便士(A)局中人:这里有两个局中人,分别记为1和2。
规则:两个局中人同时抛下一个便士,要么正面向上要么反面向上。
结果:如果两个便士是配对的(要么两个正面向上要么两个反面向上),那么局中人1付一元钱给局中人2;否则,局中人2付一元钱给局中人1。
报酬:每个局中人的报酬简单地等于她得到的或失去的钱的数量。
一般地,这里有两种方法描述一个对策:策略(规范)形式的表示和扩展形式的表示。
5.1.1 一个对策的策略(规范)形式表示假设这里有有限个局中人,局中人的集合为},,2,1{I 。
每一个局中人i ∈},,2,1{I 有一个策略集,记为i S 。
在一个-I 人对策中,局中人的策略组合用一个向量表示为},,{1I s s s =,这里i s 是局中人i 的策略选择。
有时我们也把策略组合s 表示成),(i i s s -,这里i s -是除了局中人i 以外的)1(-I 个局中人的策略组合。
对于每一个策略组合},,{1I s s s =,局中人i 的效用函数为),,(1I i s s u 。
一个-I 人对策的规范形式的表示记为)}]({},{,[⋅=Γi i N u S I 。
第十章_贸易保护的理论
二.国内市场失灵论 1.怎样确定这种社会利益从而选择好有正外部
性的行业进行保护
2.保护手段的选择
Government Policies towards Externalities
A.C. Pigou: Tax-or –subsidy approach
Ronald Coase:
Coase Theorem: If there are zero transaction costs, the efficient outcome will occur regardless of legal entitlement. If the property owners and the influencers can deal costlessly, it does not matter FROM AN EFFICIENCY STANDPOINT who has the legal "right."
国际储备主要具有以下四大功能或作用:
第一,外汇储备可以抵补贸易赤字,并保持一国 必要的、正常的进口能力。
第二,保有一定的外汇储备,是一国对外借债与 偿债的信用担保与物质保证。
第三,外汇储备是一国政府干预本国外汇市场、 调节本币汇率的有力武器。
第四,在国家经济动荡或是遇上战争灾难时,外 汇储备将是一国最后的战略储备。
(一)超贸易保护主义的特点:
1、保护的对象扩大了,从幼稚产业扩大到所以其他产业。 2、保护目的的变化了,巩固和加强对国外市场的垄断。 3、保护方式的变化,从防御性限制进口到进攻性扩张。 4、保护的阶级利益变化,保护大企业和资产阶级的利益。 5、保护措施的变化,从唯关税转变为多样化的措施。
(二)贸易乘数理论
内,与中国进行交涉,解决盗版问题, 要求贸易办公室将中国列为知识产权优 先监管对象,这最终有可能导致美国对 中国的贸易制裁。他们援引国际调查公 司的数据,声称中国的盗版每年给美国 造成240亿美元的损失,而美国全年的损 失不过500亿美元。
对策论
在日常生活中,经常可以看到一些具有相互斗 争或竞争性质的行为,
如下棋、打牌、体育比赛等 还有企业间的竞争、军队或国家间的战争、政治斗 争等,都具有对抗的性质。
这种具有竞争或对抗性质的行为称为对策行为。
在这类行为中,各方具有不同的目标和利益。为实 现自己的目标和利益,各方必须考虑对手可能采取 的行动方案,并力图选择对自己最为有利或最为合 理的行动方案。
在田忌赛马中
局中人集合I={1,2}
齐王和田忌的策略集合可分别用S1={α1,…,α6}, S2={β1,…,β6}
齐王的任一策略αi和田忌的任一策略βj就构成了一个 局势sij
如果α1 =(上,中,下), β1 =(上,中,下), 则在局势s11下,齐王的赢得为H1(s11)=3,田忌的赢 得为H2(s11)=-3
6 1 8 3 2 4 A 9 1 10 3 0 6
局中人Ⅰ当然也会猜到局中人Ⅱ的这种心理,转而出α4来对 付,使局中人Ⅱ得不到10,反而失掉6; …… 如果双方都不想冒险,都不存在侥幸心理,而是考虑到对方 必然会设法使自己所得最少这一点,就应该从各自可能出现 的最不利情形中选择一个最有利的情形作为决策一句。 这就是所谓的“理智行为”,也是对策双方实际上可以接收 并采取的一种稳妥的方法。
对策问题举例:市场购买力争夺问题
据预测,某乡镇下一年的饮食品购买力将有4000万元。乡镇企 业和中心城市企业饮食品的生产情况是:乡镇企业有特色饮食品 和一般饮食品两类,中心城市企业有高档饮食品和低档饮食品两 类产品。他们购买这一部分购买力的结局表如下。
乡镇企业所得(万元)
乡镇企业 的策略 出售特色饮食品
即局中人Ⅰ、Ⅱ的策略集分别为
博弈论与竞争策略ppt课件
报酬(payoff)(支付)与报酬函数(payoff function):博弈的结果给参与人带来的好处。可 以用报酬矩阵(支付矩阵、得益矩阵、赢得矩阵)
3
2、博弈均衡的基本概念
(1)占优策略均衡 占优策略:无论其他参与者采取什么策略,
博弈论就是用数学方法研究决策相互影响的理性人是 如何进行决策以获取最大收益的。
博奕:多人决策过程 引例:田忌赛马
2
1、博奕论的基本要素
参与者(player)(博奕方、局中人、对局者):即 有哪些人参与博弈。一般至少有两个参与者。
策略(strategy)与策略空间(strategy set):什么人 在什么时候行动;当他行动时,他具有什么样的信 息;他能做什么,不能做什么。
-1 -12
不坦白
-12 -1
-2 -2
5
• 如果两个疑犯都能够选择不坦白的话,他们 将明显地得到一个更大的收益,但由于两人 的信息无法沟通,选择不坦白并不是两人的 理性选择。对于两人而言,不管对方坦白或 是不坦白,自己选择坦白都是更优的选择, 因而,{坦白,坦白}就是均衡战略。
6
占优策略均衡
犯人招供与黑社会制裁
嫌犯B
坦白
嫌犯A
坦白
-∞ -∞
不坦白
-12 -∞
不坦白 -∞ -12 -2 -2
7
(2)纳什均衡
纳什均衡:在一个纳什均衡里,任何一个 参与者都不会改变自己的策略,如果其他 参与者均不改变各自的策略。
博弈中双方都没有绝对的最优策略,一方 的最优策略取决于对方的选择。
占优策略均衡一定是纳什均衡,但纳什均 衡不一定是占优策略均衡。
对策论
第一节:概述 一、对策现象对策是决策者在竞争(对抗)条件下做出的,关于行动方案的决定,或者说,是在竞争(对抗)条件下的决策。
对策论是研究对策现象并寻求致胜策略的一门科学,是运筹学的一个重要分枝。
早在战国时期,就有一个齐王、田忌赛马的故事 如出三匹马,三场比赛,输一场就输千金在现代的企业经营管理中,竞争(对抗)更加激烈,更加复杂,不过从上例,可见在竞争(对抗)中,如何寻求致胜策略是大可研究的。
二、对策现象的三要素1、局中人:齐王一方,田忌(孙膑)一方;桥牌:东、南、西、北 三国:刘、孙、曹2、策略:局中人的可行的、自始自终通盘筹划的行动方案称策略: 如: 是三个不同的策略,策略的全体,称为策略集合。
3、一局对策的得失上 下 中中 中 上 下 上 下从每个局中人的策略集合中采取一个策略组成的策略组,称作局势。
得失是局势的函数。
如果在任一局势中,全体局中人的“得失”相加总是等于0时,这个对策就称为“零和对策”,否则就称为“非零和对策”。
对策的分类:一、矩阵对策矩阵对策就是二人有限零和对策。
它是指这样一类对抗和争斗现象。
1、局中人:二人;2、每个局中人都仅有有限个可供选择的策略;3、在任何一局势中,两个局中人的得失之和恒为零,即局中人甲的所得,总是局中人乙的所失。
这类对策比较简单,在理论上也比较成熟。
而且这些理论奠定了研究“对策现象”的基本思路。
矩阵对策是对策论的基础。
矩阵对策:有鞍点,无鞍点 二、数学模型a 2 a 21 A 2 … a 2n … … … … …a ma m1a m2…a mn其中a ij 为当甲出策略a i ,乙出策略βj 时,甲的赢得或支付; -a ij 为当甲出策略a i ,乙出策略βj 时,乙的赢得或支付; 因为A=(a ij )mxn 为局中人甲的赢得矩阵; A *=(-a ij )mxn 为局中人乙的赢得矩阵。
以甲方赢得矩阵为准:S 1=(a 1,a 2,…,a m )叫甲的策略集合; S 2=(β1,β2,…,βn )叫乙的策略集合;为了和以后的(无鞍点、混合策略相区别),称a i ,βj 叫做纯策略。
运筹学-10、对策论
对策论
第一节 引言
一、对策行为与对策论
对策论又称博弈论,是运筹学的一个重要分 支。对策论所研究的主要对象是带有斗争或竞争性 质的现象。由于对策论研究的对象与政治、军事、 工业、农业、交通、运输等领域有密切关系,处理 问题的方法又有着明显的特色,所以越来越受到人 们的重视。
1
在日常生活中,我们经常看到一些相互之间的 竞争、比赛性质的现象,如下棋、打扑克、体育竞 赛等。
所以:min max aij
j i
max min aij (1)
i j
i
j
另一方面,对任意i,j均有:
min aij aij max aij j i max min aij max aij
i j i
j j
max min aij min max aij (2)
i
所以: max min aij
7
例1:设有矩阵对策,局中人Ⅱ的支付矩阵如下:
7 3 A 16 3
1 8 2 4 1 9 0 5
解: α3 → β3 → α4 → β1 → α 3
如果各局中人都不想冒险,必须考虑对方会 选择策略使他得到最差的收入。因此各局中人都 选择理智的决策行为。
对策的值为VG= 5。
17
二、矩阵对策的混合策略
矩阵对策G有鞍点时,就存在最优解(最优纯策 略),但是否一切矩阵对策问题中,各局中人都有 上述意义的最优纯策略呢?答案是否定的。
1 1 0 A 1 0 1 例1:石头、剪刀、布 1 1 0
max min aij 1 min max aij 1
i j j i
不存在上述纯策略意义下的解。
对策论
对策型决策当决策系统中的自然状态是由竞争对手的策略(行动方案)决定的时候,这种情况下的决策就构成了对策型决策。
与上不同的是此时的自然状态的出现是由人决定的,甚至是比你聪明的对手出的招数。
对策论是研究对策型决策的数学学科,即在不完全知道对方行动或意图的条件下构建和研究的数学决策模型。
对策论(Game Theory)又称为博弈论,是研究带有竞争与对抗问题的理论与方法。
在现实生活中,我们常常看到双方对抗、竞争的现象,例如从日常生活中的下棋、游戏到政治、军事上的斗争,以及经济领域各个企业的相互竞争,均属此类现象。
最著名的例子是田忌赛马和乒乓球团体赛队员出场名单及出场顺序。
在有对抗性和竞争性现象中,斗争的各方总是希望自己一方最终取得胜利或获的尽可能好的结局。
但是总会遭遇对方的干扰、破坏、抵抗或进攻。
在这种情况下人们想获得尽可能好的结局,必须考虑对手可能怎样采取策略,从而选取自己的一个好的对付策略。
对策型决策的三要素:1局中人:具有决策权的双方(或多方)称为局中人。
如棋局中的对弈双方,战争中敌我双方的司令员等。
2 策略:是指决策者为了战胜对手所可能选择的行动方案。
所有策略一起构成一个策略集。
每个局中人各有一个策略集。
3 局势和支付函数:在对策型决策问题中,每一个局中人从各自的策略集中任取一个策略,组成的策略组称为一个局势。
局势直接导致的结果是局中人是失败还是成功,对它的定量表述在一般经济问题中称为支付函数。
支付函数是以局势为自变量,以局中人的得失为因变量的函数。
我们下面主要讨论零和对策和矩阵决策。
所谓零和决策是指:若在任意局势中,全体局中人的得与失相加等于零,这种决策称为零和决策。
又当只有两个局中人且他们的策略集均是有限集时,支付函数可用矩阵表示,称此时的零和对策为矩阵决策。
矩阵对策及其数学模型:局中人Ⅰ的m个纯策略S1={α1,α2,…αm}。
局中人Ⅱ的n个纯策略S2={β1,β2,…βn}。
支付矩阵:A=(aij )m*n称为局中人Ⅰ的赢得矩阵(或局中人Ⅱ的损失矩阵),即aij 表示在局势(αi,βj)的情况下局中人Ⅰ赢得的值(等于局中人Ⅱ损失值)。
第10章对策论
i
( j = 1, 2," , m )
然后再找出各最大值中的最小值(最优支付)
min(max α ij ) = min α i* j = V2
j i j
这里 V2 = 2 我们把甲的最优赢得和乙的最优支付的这个公共值,称为矩阵对策的值,记作 VG , 即:
VG = max(min α ij ) = min(max α ij )
10.2 矩阵对策
矩阵对策就是有限零和二人对策,指的是参加对策的局中人只有两方(或二人) , 每一方局中人的可供选择策略数是有限多个,而且每一局对策结束时,一方的收入(或 赢得)等于另一方的支出(或称输出) ,换句话说,二方得失之和总是等于零。这类对 策比较简单,理论上也比较成熟,在实践中应用的也极为广泛。由于矩阵对策的理论奠 定了研究“对策现象”的基本思路,所以它是对策论中必须掌握的内容。 10.2.1 矩阵对策的数学模型 对于矩阵对策,我们用甲、乙表示两个局中人,假设甲有 m 个策略(又称纯策略) , 分别以 α1 , α 2 ," , α m 表示,乙有 n 个策略,分别以 β1 , β 2 ," , β n 表示。根据对策规定,若 (a , β ) 甲选用第 i 个策略,乙选用第 j 个策略,则称 i j 为一个纯局势,那么,甲的赢得可 以用 α ij 表示(若 α ij 是负数时,表示甲是支出而不是收入)。于是,甲的支付可以列成表
min α ij = α ij*
j
( i = 1, 2," , m )
然后在这些最小值中找到最大值(最优赢得) , 即:
max(min α ij ) = max α ij* = V1
i j i
在本对策 G 中, V1 = 2 局中人乙则和甲相反, 他的原则首先是在各纯策略 (列) 中找出最大值 (可靠支付) :
第十章 对策分析
交通运输系统工程
主讲人 白书战
2013年6月12日
求真务实,开放拓新
第10章
对策分析ห้องสมุดไป่ตู้
10.1
基本概念
• 对策问题:具有竞争或对抗性质的问题,统称为对 策问题。 • 对策论:又称博弈论,是研究决策主体的行为发生 直接相互作用时的决策以及这种决策的均衡问题的 ,是描绘和分析人类理性行为的恰当工具。 • 同样的实力条件下,对策的不同决定着成败得失, 例如田忌赛马。
• 赢得矩阵
• 纳什均衡局势:当对策双方均取得最优策略时的局 势。局中人单方面改变策略,都会使自己的赢得函 数值降低,双方都不愿去改变,是一种稳定的状态
• 最优纯策略 • 对矩阵对策G(X1,X2,A),局势(αi,βj)是纯 策略纳什均衡的充分必要条件是:对任意的i和j, 都有
aij ai j ai j
• 对策问题的要素:
–局中人 –局中人的策略 –结局
• 对策论中,信息的重要性。
10.2
二人零和对策
• 二人零和对策也叫矩阵对策。是一种最简单、最基 本的对策。
–只有两个局中人,每个局中人各有有限个可供选择的策略 ,两人的收益总和为零。两个局中人的利益是相反的,因 此不存在合作的可能性。
• N人对策情况要复杂的多,1951年纳什提出了“平衡 点”的概念。里面牵扯到复杂的联盟问题 。 • 非零和对策可以通过引进假想的第n+1个局中人转化 为n人零和对策。
• 混合和策略的纳什均衡 • 引入概率,即以一定的概率随机的采用各个策略。 • 局中人双方各采取一个混合策略所构成的混合策略 组,成为一个混合局势。 • 最优纯策略可以看作是混合策略的特例,即视为等 同于相应与该纯策略的概率为1,而相应于其他纯策 略的概率都为0的概率分布。
第十二章-对策论(运筹学讲义)课件
局中人2 出1指
5 -5
出2指 -5 5
局中人1从局中人2该如何选择策略,已获得利益?
-
3
例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在 不同的屋子里审讯。警察告诉他们: 如果两人都坦白,各 判刑8年;如果两人都抵赖,由于证据不充分,两人将各 判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者 立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯 都有两种策略: 坦白或抵赖。可以用一个矩阵表示两个嫌 疑犯的策略的损益
3.一局势对策的益损值: 局中人各自使用一个对策就形成了一 个局势,一个局势决定了各局中人的对策结果(量化)称 为该局势对策的益损值。
赢得函数(payoff function): 定义在局势上,取值为相应益 损值的函数
4. 纳什均衡: 纳什均衡指所有局中人最优策略组成的一种局势,
既在给定其他局中人策略的情况下,没有任何局中人有积
A
1
4
3
2
解因
m i a x m j in a ij 2 , m j in m i a x a ij 3
m a ixm jina ij m jinm a ixa ij
不符合鞍点条件, 故G的鞍点不存在。
例6 求解矩阵对策,其中: 解 容易得到
A 11
0 1
1 1
v a i * j * 1i * 1 ,2 ;j * 3
A
a
2
1
a22
a1m
a2
m
a
m
1
am2
amn
aij为局中人甲在局势
( i , j )下的赢得 -
9
“齐王赛马”是一个矩阵策略。
其中: 齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 },
管理运筹学-对策论
由“齐王赛马”引入
1.对策论的基本概念
• 三个基本要素;集:局中人选择对付其它局 中人的行动方案称为策略。
某局中人的所有可能策 略全体称为策略集;
3.局势对策的益损值:各局中人各自 使用一个对策就形成一个局势,一 个局势决定了个局众人 的对策结果 (量化)称为该局势对策的益损值)
• “齐王赛马”即是一个矩阵策略.
2.矩阵对策的最优纯策略
• 在甲方赢得矩阵中:
•
A=[aij]m*n
• i行代表甲方策略 i=1,2…m
• J列代表乙方策略 j=1,2…n
• aij代表甲方取策略i,乙方取策略j,这一局势下 甲方的益损值,此时乙方的益损值为-aij(零 和性质)。
• 在讨论各方采用的策略是必须注意一个前提就 是对方是理智的。这就是要从最有把握取得的 益损值情况考虑。
STEP 2
作变换: X1= X1’/V ; X2= X2’/V • 得到上述关系式变为:
X1+ X2=1/V 5X1+ 8X21 9X1+ 6X21 X1, X20
(V愈大愈好)待定
• 建立线性模型:
min X1+X2 s.t. 5X1+8X21
9X1+6X21 X1, X20
X1= 1/21 X2= 2/21 1/V= X1+X2=1/7 所以:V=7
739
A2= 4 6 5.5 603
被第1行所优超
得到
73 9
被第1列所优超
A3= 4 6 5.5
73
最终得到 A4= 46
3.矩阵对策的混合策略(续)
• 对A4计算,用线性规划方法得到: (注意:余下的策略为3,4,1,2) 甲: X* = (0,0,1/15,2/15,0)T V=5
第十章---博弈论初步精选全文完整版
甲 (式乙)
p.61
p.42
A B
混合策略组合及其支付也就有无限多的可能。
q.31 C 4,6 7,3
乙
.q72 D 9,1 2,8 9
不存在纯策略均衡时的混合策略均衡3
• 条件混合策略:参与人在假定其他参与人按某一概率选择某一策略
的条件下设计的对自己而言具有相对优势的(即期望支付最大的)混合 策略,称为“条件混合策略”。
• 对乙而言,如果假定甲合作,那么乙合作的支付为6,比不合作的支付 多1,因此合作是甲合作条件下乙的条件策略;假定甲不合作,那么乙的 条件策略是也不合作,乙若合作支付只有1,不合作则可得到3。
• 条件策略组合:参与人以其他参与人选择某一策略为条件的条件策略与
作为它的条件的对方策略之间的组合,称为“条件优势策略组合”或
• 假q2=定1-(q1p代1,入p甲2)与、乙(各q自1,的q2期)望的支取付值表从达0到式1有无,限经多整可理能可,得把:p2=1-p1和 E甲= p1(7-10q1)+5q1+2(式1); E乙= 5q1(2p1-1)-7p1+8(式2)
• 每个参与人需要确定,在另一参与人为其混合策略选择某个概率值时, 己方混合策略的概率向量应怎样取值,才能使自己的期望支付最大。
e点的坐标是p1=0.5,q1=0.7,则纳什均衡 时p2=0.5,q2=0.3 。
q1 1
本题中混合策略的纳什均衡还可表示为:
((p1 , p2),(q1 ,q2) )= ((0.5 , 0.5),(0.7 , 0.3) )。 0.7 本题中,只有唯一的这个纳什均衡点。
1
q1<0.7
p1= [0,1] q1 = 0.7
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十章 对策论主要内容:1、对策行为的基本要素; 2、矩阵对策; 3、矩阵对策的解法。
重点与难点:矩阵对策的数学模型,最优策略,混合策略,无鞍点矩阵对策的求解方法。
要 求: 准确理解极大极小原理、最优策略,最优混合策略,熟练掌握求解矩阵对策的公式法、图解法和线性规划方法,并能够正确使用这些方法解决实际问题。
§1 概述 一、对策行为和对策论对策论亦称竞赛论或博奕论,是研究具有斗争或竞争性质现象的数学理论和方法。
具有竞争或对抗性质的行为称为对策行为。
二、对策行为的三个要素具有对策行为的模型称为对策模型或对策。
对策模型的种类千差万别,但从本质上都包括如下三个要素:(1)局中人在一个对策行为(或一局对策)中有权决定自己行动方案的对策参加者,称为局中人。
一般要求一个对策中至少要有两个局中人。
(2)策略一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。
局中人所制定的策略全体,称为局中人的策略集合。
在一局对策中,如果各局中人的策略有限,则称之为“有限策略”,否则称之为“无限策略”。
(3)赢得函数(支付函数)一局对策结束时,对每个局中人来说,结果总是肯定的,并以一定的形式表现出来。
我们称这样的结果为“赢得”或“支付”。
一局对策结束时,每个局中人的盈亏是该策略组的函数,通常称为“赢得函数”或“支付函数”。
从每个局中人的策略集中各取一个策略组成的策略组,称为“局势”。
§2 矩阵对策矩阵对策就是有限二人零和对策。
它指的是只有两个参加对策的局中人,每个局中人都具有有限个策略可供选择。
在任一局势下,两个局中人的赢得之和总是等于零,即双方的利益是激烈对抗的。
一、矩阵对策的数学模型用Ⅰ、Ⅱ分别表示两个局中人,并设局中人Ⅰ有m 个纯策略m ααα,,, 21可供选择,局中人Ⅱ有n 个纯策略n βββ,,, 21可供选择,则局中人Ⅰ、Ⅱ的策略集分别为:{}{}n m s s βββααα,,,,,, 212211==当局中人Ⅰ选定纯策略i α和局中人Ⅱ选定纯策略j β后,就形成了一个纯局势),(j i βα。
局中人Ⅰ的赢得值用ij a 表示,便得到一个矩阵A ,称之为局中人Ⅰ的赢得矩阵。
由于假定对策为零和的,故局中人Ⅱ的赢得矩阵为-A 。
⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=mn m m n n a a aa a a a a a A 212222111211 矩阵对策可记为}{A s s G ,,,,21ⅡⅠ=或{}A s s G ,,21=在“齐王赛马”的例子中,齐王的赢得可列成如下表赢得矩阵⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡------=311111131111113111111311111131111113A二、最优策略和极大极小原理 设有矩阵对策{}A s s G ,,21=,其中:{}43211,,,αααα=s ,{}3212,,βββ=s ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-----=6031019423816A对Ⅰ2)m i n (m a x =ij jia对Ⅱ2)m a x (m i n =ij ija一般地,若等式**max min min max j i ij ijij jia a a ==成立,记**j i G a V =,则称G V 为对策G 的值,该等式是矩阵对策在纯对策下有解的充分必要条件,亦即求解矩阵对策的极大极小原理。
**ji βα,称为局中人Ⅰ、Ⅱ的最优纯策略,),(**j i βα称为最优局势,亦可称为矩阵对策G 的“鞍点”。
三、混合策略设{}A s s G ,,21=,其中⎥⎦⎤⎢⎣⎡--=5423A此时2min max -=ij ji a3m a x m i n =ij ija显然二者不相等,面对这种对策现象,极大极小原理不再适应,局中人可采取混合策略进行对策。
所谓混合策略,就是局中人为了预防对方识破自己的行动,按照一定的概率分布随机地选取各个纯策略。
这时,局中人的赢得称为“期望赢得”。
对本例,若局中人Ⅰ以概率1p 选取纯策略1α,以概率2p 选取2α;局中人Ⅱ以概率1q 选取1β,以概率2q 选取2β,此处12121,1q q p p -=-=于是局中人Ⅰ的期望赢得值:21)21)(149(1459714)1)(1(5)1(4)1(235423),(111111*********2122111+--=+--=--+----=+--==q p q p q p q p q p q p q p q p q p q p q p q p E V G所以,局中人Ⅰ的最优策略{}}145,149{,21==p p p局中人Ⅱ的最优策略{}}21,21{,21==q q q 对策值21=G V§3 矩阵对策的解法矩阵对策可分为有鞍点和无鞍点两大类。
有鞍点矩阵对策用极大极小原理来求解,本节只讨论无鞍点矩阵对策的解法。
一、2×2矩阵对策的公式法 设 {}A s s G ,,21=,其中 ⎥⎦⎤⎢⎣⎡=22211211a a a a A 局中人Ⅰ、Ⅱ的混合策略:{}{}2121,,q q q p p p ==则G V q p a q p a q p a q p a =+++2222122121121111 ⎩⎨⎧=+=+=+≥=+++)2()1(1,0)()(2221212121112122212122121111GG i GV q a q a V q a q a p p p V q a q a p q a q a p同理:∴⎩⎨⎧=+=+=+≥)4()3(1,022211222111121G Gj Vp a p a V p a p a q q q解方程组(1)—(4)得:)()()()()()()()()()(21122211211222112112221121112211222111222121122211121122112221121221a a a a a a a a V a a a a a a q a a a a a a q a a a a a a p a a a a a a p G +-+-=+-+-=+-+-=+-+-=+-+-=例1 求解矩阵对策{}A s s G,,21=,其中⎥⎦⎤⎢⎣⎡=2431A 解:双方最优混合策略分别为:25,43,41,21,21=⎭⎬⎫⎩⎨⎧=⎭⎬⎫⎩⎨⎧=G V q p 对策值二、2×n 或m ×2矩阵对策的图解法 (1)2×n 对策的图解法局中人Ⅰ只有两个策略,他的最小收入{}{})1()(min ,,2,1,min 2112122211p p a p a a n j p a p a V j j j j j j jG -=+-==+=他所希望的是上式最小值中的最大者。
例2 求解赢得矩阵为⎥⎦⎤⎢⎣⎡=06145132A 的矩阵对策。
解:在横坐标上截取长度为1的线段,并在0,1处分别作横坐标的两条垂直线Ⅰ-Ⅰ、Ⅱ-Ⅱ(垂线上点的纵坐标值分别表示局中人Ⅰ采取纯策略21αα和时,局中人Ⅱ采取各种纯策略时的赢得值)。
然后取1,021==p p ,并分别绘出在赢得矩阵各列上的G V 图线。
如图:①代表2242221221111+=+=+=p p p p a p a V G ②代表323221222112+-=+=+=p p p p a p a V G ③代表156221223113+=+=+=p p p p a p a V G ④代表55521224114+-==+=p p p a p a V GA 点为所有最小赢得中的最大者,它是②、③的交点。
于是有⎩⎨⎧+=+=+-=+=156323221221p p p V p p p V GG 解得:75,717,7212===p V p G 则 即局中人Ⅰ的最优混合策略为⎭⎬⎫⎩⎨⎧=72,75p ,期望赢得值717=GV 。
由于最优混合策略与局中人Ⅱ采取的纯策略41,ββ无关,所以041==q q 。
又 ⎩⎨⎧+-=+=+=+=+=+=656123232323222232313212q q q q a q a V q q q q a q a V G G解得:72,7532==q q 所以,局中人Ⅱ的最优混合策略是⎭⎬⎫⎩⎨⎧=0,72,75,0q 。
(2)m ×2对策的图解法 自己讨论三、m ×n 矩阵对策的线性规划解法 设赢得矩阵[]nj m i a A ij,,2,1,,2,1 ===即⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=mn m m n n a a a a a a a a a A212222111211 设矩阵对策值为G V ,则将其转化为求解两个不等式方程组:⎪⎪⎪⎩⎪⎪⎪⎨⎧=+++≥+++≥+++≥+++1)1(21221122221121221111m Gm mn n n G m m G m m p p p Vp a p a p a V p a p a p a V p a p a p a ⎪⎪⎪⎩⎪⎪⎪⎨⎧=+++≤+++≤+++≤+++1)2(21221122221211212111n Gn mn m m G n n G n n q q q Vq a q a q a V q a q a q a V q a q a q a即 ⎪⎪⎩⎪⎪⎨⎧≥=≥∑∑==)0(111i m i i mi G i ij p p V p a⎪⎪⎩⎪⎪⎨⎧≥=≤∑∑==)0(111j nj j G nj j ij q q V q a 令Gj j G ii V q y V p x ==,,则有⎪⎪⎪⎩⎪⎪⎪⎨⎧≥=≥∑∑==01111i G m i i mi i ij x V x x a ⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧≥=≤∑∑==01111j G nj j nj j ij y V y y a 对局中人Ⅰ来说,他要获得尽可能大的G V ,就应使m Gx x x V +++= 211最小。
对局中人Ⅱ来说,他要获得尽可能小的G V ,就应使n Gy y y V +++= 211最大。
所以,上述问题可转化为两个线性规划问题;(1)m x x x z+++= 21min ⎪⎩⎪⎨⎧≥≥∑=011imi i ij x x a(2)n y y y z+++= 21max⎪⎩⎪⎨⎧≥≤∑=011jnj j ij y y a例3、利用线性规划方法求解赢得矩阵为⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=1109092927A 的矩阵对策。
解:上述问题可化为两个互为对偶的线性规划问题。
(1)⎪⎪⎩⎪⎪⎨⎧≥≥+≥+≥++++=0,,11191921927min 3213121321321x x x x x x x x x x x x x z (2) ⎪⎪⎩⎪⎪⎨⎧≥≤+≤+≤++++=0,,11191921927max 3213121321321y y y y y y y y y y y y y ω用单纯形法求得:415201215101415201332211=⨯=⋅==⨯=⋅==⨯=⋅=∴x V p x V p x V p G G G即局中人Ⅰ的最优混合策略⎭⎬⎫⎩⎨⎧=41,21,41p同理求得: 41,21,41321===q q q即局中人Ⅱ的最优混合策略⎭⎬⎫⎩⎨⎧=41,21,41q。