第11讲对策论一LP作业
11第十一章 对策论及其应用
![11第十一章 对策论及其应用](https://img.taocdn.com/s3/m/13621c20e2bd960590c6779e.png)
第十一章>>第三节
• 三、纳什均衡多重性
– 纳什在1950年证明了在任何有限博弈中,都存 在至少一个纳什均衡。这也是纳什均衡的弱点 所在,它并不能保证唯一性,当存在多个纳什 均衡的时候,哪一个会成为参与博弈的局中人 理性选择的最终结果,这是问题的关键所在。
第十一章>>第四节
第十一章>>第四节
• 古诺双头垄断模型
第十一章>>第二节
二、纳什均衡的应用
• 3.不存在纯策略的纳什均衡解 在有些对策局势中没有纯策略纳什均衡解,而只 有混合策略纳什均衡解,这就是需要在对策论 中引入混合策略概念的原因。
第十一章>>第三节
第十一章>>第三节
• 一、混合策略 • 二、纳什均衡的存在性
– 纳什定理(Nash,1950):在n个参与者的 标准式对策 中,如果n是有 G {S1 , S2i, , Sn也是有限的,则对策存 ; u1 , u2 , , un } 限的,且对于每个 , Si 在至少一个纳什均衡,均衡可能包含混合策略。
试求出这一局势中所有的纳什均衡。 • 8.试列举现实中应用了对策论方法的一些经济现 象,并对其中某一现象进行详细分析。
Thank You!
L/O/G/O
1 2 n 1 2 n
第十一章>>第二节
二、纳什均衡的应用
• 在各种对策局势中,纳什均衡解的数目不一定相 同,可分为以下几种情况:
– 1.存在唯一的纯策略纳什均衡解 通过剔除严格劣策略的方法得到最后唯一的一个策略, 这个唯一的策略就是唯一的纳什均衡解。 – 2.存在多个纯策略纳什均衡解 在某些对策局势中,纳什均衡解不是唯一的,而是存在 多个纳什均衡解,这种情况很常见。
对策论(全)
![对策论(全)](https://img.taocdn.com/s3/m/700ef43787c24028915fc39d.png)
例:公共产品的供给博弈
如果大家都出钱兴办公用事业,所有人的福 利都会增加。问题是,如果我出钱你不出钱, 我得不偿失;而如果你出钱我不出钱,我就可 以占便宜。
最终结果:每个人都“不出钱”。这种纳什 均衡使得所有的人的福利都没法得到提高。
例:寡头垄断企业定价的博弈
卡特尔价格不是纳什均衡, 最终结果:每个企业按照纳什均衡的价格进行定价, 其利润小于卡特尔价格条件下的利润。
生活中的例子
囚徒困境现象在现实生活中比比皆是。姜昆和 唐杰忠过去说过一个公共楼道占用问题的相声。 住户在公共楼道里堆满了杂物,结果大家都极 不方便,以致即将分娩的妇女都没法及时被送 往医院。但你如果不占用公共楼道,别人也会 占用。每一居住面积狭小的住户从自我利益最 大化出发,都会选择占用。但占用的结果却最 终损害了大家的利益。
但是,尽管政府当时无力制止这种事情,公众也不 必担心彩电价格会上涨。这是因为,“彩电厂商自 律联盟”只不过是一种“囚徒困境”,彩电价格不 会上涨。在高峰会议之后不到二周,国内彩电价格 不是上涨而是一路下跌。这是因为厂商们都有这样 一种心态:无论其他厂商是否降价,我自己降价是 有利于自己的市场份额扩大的。 问题:明确该对策问题的各要素:局中人、策略集、 赢得矩阵
等待
4, 4 0, 0
3.中国的游戏——“剪刀、石头、布”
小孩A与B猜手,若规定赢得1分,平得0分, 输得 -1分,则 A的赢得可用下表来表示。
赢 B 石头 A 石头
剪子
布
0
1
-1
剪子
布
-1
1
0
-1
1
0
分析:无确定最优解,可用“混合策略”求解。
4.齐王赛马
战国时期,齐国国王有一天提出要与大将军田忌赛马。田 忌答应后,双方约定: 1)每人从上中下三个等级中各出一匹马,共出三匹; 2) 一共比赛三次,每一次比赛各出一匹马; 3) 每匹被选中的马都得参加比赛,而且只能参加一次; 4) 每次比赛后输者要付给胜者一千金。 当时在三个不同等级中,齐王的马要比田忌的强些,看来 田忌要输三千金了,但由于田忌采用了谋士的意见,最终 反败为胜。谋士的主意是: 1) 每次比赛前先让齐王说出他要出哪匹马; 2) 让田忌用下马对齐王上马; 3) 用中马对齐王下马; 4) 用上马对齐王中马。
对策论
![对策论](https://img.taocdn.com/s3/m/ff05dc9ed0d233d4b14e69a2.png)
在日常生活中,经常可以看到一些具有相互斗 争或竞争性质的行为,
如下棋、打牌、体育比赛等 还有企业间的竞争、军队或国家间的战争、政治斗 争等,都具有对抗的性质。
这种具有竞争或对抗性质的行为称为对策行为。
在这类行为中,各方具有不同的目标和利益。为实 现自己的目标和利益,各方必须考虑对手可能采取 的行动方案,并力图选择对自己最为有利或最为合 理的行动方案。
在田忌赛马中
局中人集合I={1,2}
齐王和田忌的策略集合可分别用S1={α1,…,α6}, S2={β1,…,β6}
齐王的任一策略αi和田忌的任一策略βj就构成了一个 局势sij
如果α1 =(上,中,下), β1 =(上,中,下), 则在局势s11下,齐王的赢得为H1(s11)=3,田忌的赢 得为H2(s11)=-3
6 1 8 3 2 4 A 9 1 10 3 0 6
局中人Ⅰ当然也会猜到局中人Ⅱ的这种心理,转而出α4来对 付,使局中人Ⅱ得不到10,反而失掉6; …… 如果双方都不想冒险,都不存在侥幸心理,而是考虑到对方 必然会设法使自己所得最少这一点,就应该从各自可能出现 的最不利情形中选择一个最有利的情形作为决策一句。 这就是所谓的“理智行为”,也是对策双方实际上可以接收 并采取的一种稳妥的方法。
对策问题举例:市场购买力争夺问题
据预测,某乡镇下一年的饮食品购买力将有4000万元。乡镇企 业和中心城市企业饮食品的生产情况是:乡镇企业有特色饮食品 和一般饮食品两类,中心城市企业有高档饮食品和低档饮食品两 类产品。他们购买这一部分购买力的结局表如下。
乡镇企业所得(万元)
乡镇企业 的策略 出售特色饮食品
即局中人Ⅰ、Ⅱ的策略集分别为
对策论专题知识讲座
![对策论专题知识讲座](https://img.taocdn.com/s3/m/4b8472e5fc0a79563c1ec5da50e2524de518d0f7.png)
在甲方旳赢得矩阵中: A=[aij]m×n
i 行代表甲方策略 i=1, 2, …, m;j 列代表乙方策略 j=1, 2, …, n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下 甲方旳益损值。此时乙方旳益损值为 -aij(零和性质)。
在考虑各方采用旳策略时,必须注意一种前提,就是 双方都是理智旳,即双方都是从各自可能出现旳最不利旳 情形选择一种最为有利旳情况作为决策旳根据。
10.4 矩阵对策旳矩阵降维
优超原则:
假设矩阵对策 G ={ S1, S2, A } 甲方赢得矩阵 A=[aij]mn 若存在两行(列),s 行(列)旳各元素均优于 t 行(列)旳元 素,即
asjatj j=1,2 … n ( ais ait i=1,2 … m )
称甲方策略s优超于t ( s优超于t)。
成立时,双方才有最优纯策略,并把(1,2)称为对策G在纯 策略下旳解,又称(1,2)为对策G旳鞍点。把其值V称之为对
策G={S1,S2,A}旳值。
10.3 矩阵对策旳混合策略
设矩阵对策 G = { S1, S2, A }。当
max i
min j
aij
min j
max i
aij
时,不存在最优纯策略。
人对策一样也是对策方在乎识到其他对策方旳存在,意识到其他 对策方对自己决策旳反应和反作用存在旳情况下谋求本身最大利 益旳决策活动。因而,它们旳基本性质和特征与两人对策是相同 旳,我们经常能够用研究两人对策一样旳思绪和措施来研究它们, 或将两人对策旳结论推广到多人对策。
但多人对策中出现了更多旳追求各自利益旳独立决策者,策 略旳相互依存关系也就更为复杂,对任一对策方旳决策引起旳反 应也就要比两人对策复杂得多。
第11讲对策论
![第11讲对策论](https://img.taocdn.com/s3/m/14ae01165fbfc77da369b117.png)
设有对策G =(S1,S2,A),其中 S1={α1,α2,…,αm}, S2={β1,β2,… , βn}, A=(aij)m×n。 如果A中存在一个元素ark满足:
ark
?
max i
min j
aij
?
min j
max i
aij
则局势(αr ,βk)称为G 的解或鞍点。α*=αr,β*=βk称 为甲、乙的最优纯策略。设G 的值为vG,vG = ark 。
=( S1, S2,A)
本节中我们仅研究二人有限零和对策,即
A1+A2=0
运筹学
第11讲:对策论(一)
3、对策的分类
? 按局中人的数目分类:二人对策,多人对策(诸侯争霸) ? 按策略的数目分类:有限对策,无限对策(警察抓罪犯) ? 按赢得矩阵之和是否为零分类:零和对策,非零和对策(囚 徒困境) ? 按局中人是否合作分类:非合作对策(同类企业竞争),合 作对策(供应链成员,OPEC等)
同理,齐王的策略分别为: β1=(上,中,下);β 2=(上,下,中);β 3=(中,上,下); β 4=(中,下,上);β 5=(下,上,中);β 6=(下,中,上)。
运筹学
第11讲:对策论(一)
策略集:局中人i 所有策略的集合,用Si 表示 例如:设田忌为第1人,i=1;齐王为第2人,i=2。
第11讲:对策论(一)
浙江工业大学经贸管理学院 曹柬
运筹学
第11讲:对策论(一)
一、对策论的基本概念
1、对策现象及其三个要素 (以“田忌赛马”为例)
? 局中人:与对策有直接效用关系的实体(人、集体等)
齐王、田忌、孙膑X 、马X
? 策略:一个局中人对付其他局中人的方法或措施
对策论应用示例
![对策论应用示例](https://img.taocdn.com/s3/m/729bc7fef61fb7360b4c656d.png)
对策论应用示例对策理论(Game Theory)现在广泛应用于军事、经济等领域。
对策论的主要分类大致如下:§1 对策论应用举例例1 齐王与田忌赛马(孙膑对策)传说齐威王与大臣田忌赛马,每人都以上等马、中等马、下等马比赛,三局两胜制,胜者得1千金。
齐王的同等马优于田忌的同等马,田忌总输。
后来军事家孙膑为田忌出主意:田忌用上等马赢齐王的中等马、用中等马赢齐王的下等马,最后以下等马输给齐王一局,这样田忌就以总分3:2获胜。
对局图如下:齐王的马田忌的马上等马上等马中等马中等马下等马下等马在这个对策中,双方对于对方的情况十分熟悉,事先也知道比赛规则,这在对策论中叫做双方全信息的对策。
另外,在这个对策中,一方用计谋和策略,另一方不用,这不是现代意义下的对策。
现代意义下的对策,对局双方都用计谋和策略,并且双方都选择对自己有利的策略,这在对策论中叫理智的局中人(经济对策中叫理性的消费者)。
例2 1943年2月,由于战争的失败,日本舰队打算从新不列颠岛撤退到伊里安岛(如图)。
美国西南太平洋空军奉命轰炸这支日本舰队。
北日本舰队的可能撤退航线有两条:南线与北线,航程都是3天。
气象预报:未来3天,北线阴雨、南线晴天。
日本人应该选择哪一条撤退航线呢?美军的选择是重点搜索的方向:(1)非重点搜索:派少量搜索飞机,发现目标后派大量飞机轰炸;(2)重点搜索:派大量搜索飞机,发现目标后再派大量飞机轰炸。
根据气象预报,未来3天,北线阴雨,能见度很差,不利于侦察飞机巡航侦察(二战时,主要依靠飞行员目测侦察);南线晴天,能见度好,有利于侦察机巡航侦察。
美军应该把搜索重点放在北边还是南边呢?表中第一行第一列的-2/3表示:日方若选择北线撤退,美军的重点搜索方向也在北线,日本舰队在3天中大约能安全行走一天,然后被美军侦察机发现,招来大批轰炸机,在未来2天被轰炸。
下面讨论双方应该选择的较好的策略。
日本方面:北边的损失向量(-2/3,-1/3)≥南边的损失向量(-2/3,-3/3),表示北线损失比南线小,日方司令官若是理智的决策者就应选北线作为航线。
对策论
![对策论](https://img.taocdn.com/s3/m/9d9f5dc758f5f61fb7366673.png)
第一节:概述 一、对策现象对策是决策者在竞争(对抗)条件下做出的,关于行动方案的决定,或者说,是在竞争(对抗)条件下的决策。
对策论是研究对策现象并寻求致胜策略的一门科学,是运筹学的一个重要分枝。
早在战国时期,就有一个齐王、田忌赛马的故事 如出三匹马,三场比赛,输一场就输千金在现代的企业经营管理中,竞争(对抗)更加激烈,更加复杂,不过从上例,可见在竞争(对抗)中,如何寻求致胜策略是大可研究的。
二、对策现象的三要素1、局中人:齐王一方,田忌(孙膑)一方;桥牌:东、南、西、北 三国:刘、孙、曹2、策略:局中人的可行的、自始自终通盘筹划的行动方案称策略: 如: 是三个不同的策略,策略的全体,称为策略集合。
3、一局对策的得失上 下 中中 中 上 下 上 下从每个局中人的策略集合中采取一个策略组成的策略组,称作局势。
得失是局势的函数。
如果在任一局势中,全体局中人的“得失”相加总是等于0时,这个对策就称为“零和对策”,否则就称为“非零和对策”。
对策的分类:一、矩阵对策矩阵对策就是二人有限零和对策。
它是指这样一类对抗和争斗现象。
1、局中人:二人;2、每个局中人都仅有有限个可供选择的策略;3、在任何一局势中,两个局中人的得失之和恒为零,即局中人甲的所得,总是局中人乙的所失。
这类对策比较简单,在理论上也比较成熟。
而且这些理论奠定了研究“对策现象”的基本思路。
矩阵对策是对策论的基础。
矩阵对策:有鞍点,无鞍点 二、数学模型a 2 a 21 A 2 … a 2n … … … … …a ma m1a m2…a mn其中a ij 为当甲出策略a i ,乙出策略βj 时,甲的赢得或支付; -a ij 为当甲出策略a i ,乙出策略βj 时,乙的赢得或支付; 因为A=(a ij )mxn 为局中人甲的赢得矩阵; A *=(-a ij )mxn 为局中人乙的赢得矩阵。
以甲方赢得矩阵为准:S 1=(a 1,a 2,…,a m )叫甲的策略集合; S 2=(β1,β2,…,βn )叫乙的策略集合;为了和以后的(无鞍点、混合策略相区别),称a i ,βj 叫做纯策略。
运筹学—对策论(一)
![运筹学—对策论(一)](https://img.taocdn.com/s3/m/97c3b2e551e79b8969022634.png)
3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。
对
二人
动 策无
态
限
对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵
数学建模---对策论模型
![数学建模---对策论模型](https://img.taocdn.com/s3/m/aeea20fd770bf78a652954d1.png)
纯局势(i*,j*)为对策在纯策略下的解(亦称均衡局势)。
i*和j*分别称为局中人Ⅰ和Ⅱ的最优纯策略。
3.方法步骤: 上例求解过程可简单的表述如下:
7 1 8
A 3
2
4
16 4 3
其步骤是:
3 0
5
第一步:分别确定A各行中的最小值,并在该数字上加圈表示;
第二步:分别确定A各列中的最大值,并在该数字上加框表示;
=8xy-6y-x+8
= 8( x
3 )( 4
y
1 8
)
7
1 4
这就是说,局中人 I 分别以概率 X * (3 , 1) 选用1,2 时,至
44
少赢得 7
1 4
,同理,局中人Ⅱ分别以概率Y *
(1 8
,
7) 8
选用策略1,2,
至多损失 7 1 。但当 X * (3 , 1) 或Y * (1 , 7) 时,则会受到更大的
3.赢得函数(支付函数)
(1)局势:对策中,每一局中人所选定策略形成的策略组
合称一个局势。设局中人1从自己的策略集S1={1,2 …,m}中 选定策略i,局中人2从自己的策略集S2={1, 2 …, n}选定策 略j,则(i, j)就构成两人对策中的一个局势。
在n个对策中,设si表示第i局中人的一个策略,则n个局中 人的策略组合形成的局势为S=(s1,s2,…sn)。
aij
8
2
max i
a
i
*
j
2
3
3
V1
max i
min j
aij
2 ,V2
min j
max i
aij
2 ,V1
V2
对策论讲稿
![对策论讲稿](https://img.taocdn.com/s3/m/c9738021dd36a32d737581c9.png)
3.2 矩阵对策的最优纯策略
• 定理1 (αi*,βj*)为矩阵对策G= {S1,S2;A} 的鞍点的充要条件是对于任意 的i,j,有 aij*≤ai*j*≤ai*j • 即鞍点有这样的性质: ai*j*是第j*列的 最大元素,是第i*行的最小元素,也就 是说,对于纯局势(αi*,βj*),有下列 式成立:min ai*j =max aij*
3.2 矩阵对策的最优纯策略
例3 对于一个矩阵博弈G={甲,乙, S1 S2,A},其中 S1={1,2,3},S2={1,2,3}, -5 1 -7 A= 3 2 5 16 -1 -9 -4 0 4 求双方的最优策略? • 解:对于局中人甲,求矩阵A每行的最小值: • min{-5,1,-7}=-7; min{3,2,5}=2 • min{16,-1,-9}=-9; min{-4,0,4}=-4在从这些数中取 最大值,即max{-7,2,-9,-4}=2,因此局中人甲的ai*= a2 对于局中人乙,求矩阵每列的最大值,然后在求 最小值,局中人乙的βj*= a2 因此2是博弈G的值,即 v=2, a 与β 分别为局中人甲和乙的纯最优策略。
管理运筹学11对策论
![管理运筹学11对策论](https://img.taocdn.com/s3/m/8d789898370cba1aa8114431b90d6c85ec3a8806.png)
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
局中人甲应选择2 ,此时不管局中人乙采取什么策略,甲的
赢得均不小于3。
2024/3/29
2. 矩阵对策解的问题
设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,3,4}, S2 = {1 ,2 , 3}
Min
-4 2 -6 -6
对策矩阵G={S1,S2,A}在混合策略意义下有 解的充分必要条件是存在着
x * S1* , y * S2*使(x *,y *) 为E (x,y) 的 一个鞍点,即对于一切x S1* , y S2* 有
E (x,y *) E (x *,y *) E (x *,y)
2024/3/29
3. 矩阵对策的混合策略
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
Max
8 36
Min 3
局中人甲应选择2 ,乙应采取2策略;结果甲赢得3,乙付
出3。
2024/3/29
2. 矩阵对策解的问题
定义1:设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,…,m}, S2 = {1 ,2 , …, n}
6 5 7 5 5 0 1 -1 2 -1
Max 7 5 9 5
Min = 5
i = 1, 3 ,j = 2, 4,ai*j* = 5,四个局势均为矩 阵对策的解。
2024/3/29
3. 矩阵对策的混合策略
对矩阵对策G={S1,S2,A}来说,局中人甲 有把握的最小赢得是:
v1 = max min aij
x S1* y S2*
对策论讲义(南开大学)_OK
![对策论讲义(南开大学)_OK](https://img.taocdn.com/s3/m/6302bfd0aaea998fcd220ed5.png)
(i* , j* ) (i, j* ),
i S1
(i* , j* ) max (i, j* ) min max (i, j)
i
j
i
(10.3)
右端是上对策值。
另一方面, (i* , j* ) (i* , j)
j S2
即
(i* , j* ) (i* , j),
j S2
(i* , j* ) min (i*, j) max min (i, j)
若I选择A的期望得益为 2pC+5pD; 若I选择B的期望得益为 3pC+pD,
因而令
2pC+5pD=3pC+pD
联立(10.1)和(10.2)解得
(10.2)
pA=4pB 4pD=pC
pA=(4 1-pA) pC=(4 1-pC)
ppCA==00..88,,
pB=0.2 pB=0.2
20
由于当 pA=0.8 ,pB=0.2 ,pC=0.8 , pD=0.2时 任何一方都无法通过改变自己的混合策略来改善 自己的期望利益,因此这种混合策略组合是稳定 的,称之为Nash混合均衡策略,而他们的期望利益 分别为:
从他的策略集中删去。
例10.6 双方的坦白策略均 比抗拒策略为严格上策,因而 可以删去抗拒策略,
抗拒
双方只会选取坦白策略。 坦白
自然,这就是Nash均衡策略了。
抗拒
1 , 1
0 , 8
坦白 8 , 0
5 , 5
12பைடு நூலகம்
例10.7 设对局如图:
左 中 右
由严格下策删去法,可以 上 1 , 0 1 , 3 0 , 1
uI =pA (2 pc 5 pD ) pB (3 pc pD ) =0.8(2 0.8+5 0.2)+0.2(3 0.8+0.2)=2.6
11 对策论
![11 对策论](https://img.taocdn.com/s3/m/edb371134431b90d6c85c7a9.png)
11 对策论1、甲、乙二人零和对策,已知甲的赢得矩阵,求双方的最优策略与对策值。
(1)2124148523A --⎡⎤⎢⎥=⎢⎥⎢⎥-⎣⎦ (2)221344216A ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦(3)963564743A --⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦ (4)176435024A ⎡⎤⎢⎥=--⎢⎥⎢⎥-⎣⎦(5)2314641543322324A --⎡⎤⎢⎥--⎢⎥=⎢⎥⎢⎥--⎣⎦ (6)93180654672433856221A ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦解(1)max[min()]min[max()]ij ij jjiia a ==1甲的最优策略:2α,乙的最有策略:1β;对策值1G V = (2)max[min()]min[max()]ij ij jjiia a ==3甲的最优策略:2α,乙的最有策略:1β;对策值3G V = (3)max[min()]min[max()]ij ij jjiia a ==4甲的最优策略:2α,乙的最有策略:3β;对策值4G V = (4)max[min()]min[max()]ij ij jjiia a ==1甲的最优策略:1α,乙的最有策略:1β;对策值1G V = (5)max[min()]min[max()]ij ij jjiia a ==2甲的最优策略:3α,乙的最有策略:4β;对策值2G V = (6)max[min()]min[max()]ij ij jjiia a ==4甲的最优策略:2α,乙的最有策略:3β;对策值4G V =2、甲、乙二人进行一种游戏,甲先在横轴的[0,1]x ∈区间内任选一个数,不让乙知道;然后乙在纵轴的[0,1]y ∈区间内任选一个数。
双方选定后,乙对甲的支付为22175(,)22224P x y y x xy x y =--++,求甲、乙二人的最优策略和对策值。
7422524px y xp y x y∂⎧=-+⎪∂⎪⎨∂⎪=-+∂⎪⎩因为22222422px py px y ⎧∂=-⎪∂⎪⎪∂⎪=⎨∂⎪⎪∂=-⎪∂∂⎪⎩所以p(x,y)由最小值。
第十一章 对策论
![第十一章 对策论](https://img.taocdn.com/s3/m/f3ba5509763231126edb1170.png)
4
直到1944年冯· 诺依曼(von Neumann)与摩根斯坦 恩(O. Morgenstern)的《博弈论与经济行为》一书出版, 标志着现代系统博弈理论的初步形成。 20世纪50年代,纳什(Nash)建立了非合作博弈的 “纳什均衡”理论,标志着博弈论的新时代开始,是纳什
在经济博弈论领域划时代的贡献,是继诺依曼之后最伟大
一般情况下,局中人 Ⅰ的赢得值不会多于局中人 Ⅱ的
所失值,即总有 v1 ≤ v2 。当 v1 = v2 时,矩阵对策存在纯策 略意义下的解,且 VG = v1 = v2 。但在一般情况下,更多的 是 v1 < v2 。例某赢得矩阵如下:
5 A x2 4 2
4* 5
x1 1
y1
y2
2
田忌赛马 (齐王赛马)
田忌策略
齐王策略
β1 上中下
β2 上下中 1 3 -1 1 1 1
β3 中上下 1 1 3 1 -1 1
β4 中下上 1 1 1 3 1 -1
β5 下中上 1 -1 1 1 3 1
β6 下上中 -1 1 1 1 1 3
3
α1 α2 α3 α4 α5 α6
(上中下) (上下中) (中上下) (中下上) (下中上) (下上中)
Max Min aij Min Max aij ai* j*
i j j i
成立,记 VG ai* j* 。则称 VG 为对策 G 的值,称使上式成 立的局势 ( i* , j* ) 为 G 在纯策略意义下的解。这个解是 该矩阵的鞍点。
课堂练习 P270/10.3/(1)
16
第十一章 对策论
a11 a A 21 am1
a12 a22 am 2
对策论-PPT文档资料
![对策论-PPT文档资料](https://img.taocdn.com/s3/m/4e419839650e52ea5518982d.png)
展开型对策
( , ;au ;) 定义2:设 为对策树,称 1 2 n 1 2 n ( S , SS . . . ; P , P . . . P ) 为由 产生的n人 对策,对策 也称为展开型对策. 定义3:在对策 (S, P)中,设有策略组 1 2 n ( ,. . . ) 使对于任何的 i N 及 i S i i 12 n i 1 i 1i i 1 n P (, . . . ) P ( . . . , , . . . ) 均有: ,则称 为对策 的一个平衡点.
二人零和有限对策
保守解策略是如下的策略{ 1 , 2 } , 1 1 P ( ) s u pin f P ( , ) v 1 1 2
2 1 P ( ) s u pin f( P ( , ) 2 1 2) 1 S 1 S2 2 1 i n fs u p P ( , ) v 1 2 2
基本概念
7.合作对策&非合作对策 8.两人对策&多人对策 9.零和对策&常和对策&变和对策 10.静态对策&动态对策&重复对策 11.完全信息对策&不完全信息对策
一个例子
囚徒困境
乙 甲 不 坦 白 坦 白
不 坦 白 ( 1 ,1 ) ( 0 ,1 0 )
坦 白 ( 1 0 ,0 ) ( 8 ,8 )
.
展开型对策
定理:设 为对策树,则 有一个平衡点
正规型对策
i i {, N {} S , {} P } 定义1:给定三元组 其 i N i N
对策论课后习题题目
![对策论课后习题题目](https://img.taocdn.com/s3/m/264913fae009581b6bd9eb1a.png)
对策论作业1对策论注意:作业请发至谭老师邮箱和zhouyany js @1.今有甲、乙两厂生产同一种产品,它们都想通过内部改革挖潜,获得更多的市场份额已知两厂分别都有三个策略措施,据预测,当双方采取不同的策略措施后两厂的市场占有份额变动情况如表所示:Table 1:``````````````````````甲厂策略甲厂产品市场份额变动乙厂策略β1β2β3α110-13α21210-5α36852.某企业决定由职工代表大会选举行政负责人,经提名产生候选人甲和乙。
他们根据企业的发展战略和群众关心的事业各自提出了企业改革的方案。
甲提出了四种:α1,α2,α3,α4;乙提出了了三种:β1,β2,β3.他们的参谋人员为使竞争对奔放有利,预先作了个民意抽样测验。
因各方提供的不同策略对选票吸引力不同。
测验选票经比较后差额如下表(单位:十张)所示:Table 2:H HH H H H H H H 甲a i j 乙β1β2β3α1-40-6α2324α3161-9α4-1173.(猜花色游戏问题)设有两个小孩问扑克牌花色游戏,游戏规定:由小孩甲每次从4种花色的牌中拿出一张牌给小孩乙猜,如果猜对花色,则甲付给乙三个小石子;否则,即小孩乙猜不对,则乙付给甲一个石子,试求解这个对策问题,即这两个小孩各应该采取什么对。
4.(餐馆的经营问题)设有两个相邻的餐馆都能做甜早点和咸早点,如果它们做的早点是一样的,则可能卖不出去而各亏本100元,如果两个餐馆做的早点不同,则做咸早餐的餐馆可以赚到400元,而做甜早餐的餐馆可以赚到200元.如果他们不协商,试问这两个餐馆各自的最优策略为何?5.(猜硬币问题)甲、乙两人玩猜硬币的游戏,要求二人各出一枚硬币,如果两个硬币都呈正面,或者反面,则甲得1分,同时乙付出1分;反之,甲付出1分,乙得1分。
试问甲和乙各自的最优策略是什么?6.(智猪争食问题)猪圈里有一大一小两头猪,猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈另一边的投食口就会落下少量的食物。
对策论例题
![对策论例题](https://img.taocdn.com/s3/m/4e9149e9172ded630b1cb65c.png)
对策论
9.1 主要解题方法和典型例题分析 1。 有鞍点的最优纯策略问题 其解题步骤是: 第一步,确定赢的矩阵A各行中的最小值,并在该 数字上加圈 第二步,确定A各列中的最大值并在该数字上加框 第三步,若A中的某元素同时被圈和框住,则该元素 即为对策的值,该元素即为对策的值,该元素内所在 的行和列相应的策略则为局中人Ⅰ和Ⅱ为最优策略。
则B规划的线性规划模型为表5。1 初始表
m W = y1 + y2 + y3, ax
3y1 2y2 st. . 2y1 −y2 y1, y2 , +2y3 ≤1 ≤1 +4y3 ≤1 y3 ≥ 0
相应的单纯型表5。1所示
表 5。1 初 始 表 。
YB
b 1 1 1 0 1/3 1 1/3 1/3
B 2 0 2 -1 3 2 0 4
把此对策问题表示成一个线性规划模型,并用单纯 形法求解此对策。
ax in in ax 解 由 m m aij = 0, m m aij = 2, 知v>0 j j i i ' ' ' 先求B的最优策略,设B的策略为 ( y1, y2 , y3 ), 对策值
' ' ' y1 y2 y3 为v,并令 y1 = , y2 = , y3 = , v v v
Γ
= 5.
注: 此例说明,对策的解可以不惟一,但值是唯一的. 2。无鞍点的混合策划问题 (1)线性规划法求解 例 2 某小城市有两家超级市场相互竞争,超级市场
A有三个广告策略,超级高级B也有三个广告策略, 已经算出当双方采取不同的广告策略时,A方所占市场 份额增加的百分数如下:
策略 1 1 A 2 3 3 0 2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第11讲:对策论(一)
一、对策论的基本概念
1、对策现象及其三个要素(以“田忌赛马”为例)
局中人:与对策有直接效用关系的实体(人、集体等) 齐王、田忌、孙膑、马 X X
策略:一个局中人对付其他局中人的方法或措施
田忌的策略共有 3!= 6 α 1=(上,中,下);α 2=(上,下,中);α 3=(中,上,下); α 4=(中,下,上);α 5=(下,上,中);α 6=(下,中,上)。 同理,齐王的策略分别为: β 1=(上,中,下);β 2=(上,下,中);β 3=(中,上,下); β 4=(中,下,上);β 5=(下,上,中);β 6=(下,中,上)。
已知:α 1=(上,中,下);α 2=(上,下,中);α 3=(中,上,下);α 4=(中,下,上); α 5=(下,上,中);α 6=(下,中,上)。 α i=β j , i =j = 1,… ,6。
运筹学
第11讲:对策论(一)
2、矩阵对策的基本模型
赢得矩阵:局中人i 在不同局势下的赢得所组成的矩阵,用 Ai 表示。例如:田忌的赢得矩阵为: β1 β2 β3 β4 β5 β6
格为100元,在没有关于当年冬季气温情况准确预报的条
件下,秋季应采购多少吨煤能使总支出最少?
运筹学
第11讲:对策论(一)
三、混合策略
设有对策G =(S1,S2,A),其中 S1={α 1,α 2,…,α m}, S2={β1,β2,… , βn},
* 1
A=(aij)m×n。 记:
S x E m | xi 0, i 1, 2, * S2 y E n | y j 0, j 1, 2,
LP作业讲解
习题2-7
解: 设需要甲、乙、丙、丁肥料各x1,x2,x3,x4千克,则该问题的线性规 划模型可写为:
min z = 0.04x1 + 0.15x2 + 0.10x3 + 0.13x4
s. t. 0.03x1 + 0.30x2 + 0.15x4 ≥ 32 0.05x1 + 0.20x3 + 0.10x4 = 24
xij ≥ 0 ( i = 1,2, j = 1,2,3 )
运筹学
LP作业讲解
1.1 (1)多重最优解 (2) 无可行解
(3) 惟一最优解 (4) 无界解
1.7 (1) 无界解
(3) 极点解X *=[2/5, 9/5, 1,0]T, Z *=17/5
习题2-6 Z * = 9000, 多重最优解
运筹学
运筹学
第11讲:对策论(一)
例3
■ 某单位采购员在秋天时要决定冬季取暖用煤的采购量。 已知在正常气温条件下需要煤15吨,在较暖和较冷气温条 件下需要煤10吨和20吨。假定冬季的煤价随天气寒冷程 度而变化,在较暖、正常、较冷气温条件下每吨煤的价格 分别为100元、150元和200元。又设秋季时每吨煤的价
0.14x1 + 0.07x4 ≤ 42
xi ≥ 0 ( i = 1,2,3,4 )
300, 230 , 45,0 该问题存在两个极点解: X 0, 320 3 ,120,0 , X 3 300 300 230 / 3 30 则此题有多重最优解: * , X * X 1* (1 ) X 2 [0,1] 45 75 * Z 28 0
齐王的赢得矩阵为:A2=-A1,A1 也可称为齐王的损失矩阵
运筹学
第11讲:对策论(一)
矩阵对策
两个局中人的对策表述 —— G =(S1, S2, A1)
=(S1,S2,A) 本节中我们仅研究二人有限零和对策,即 A1+A2=0
运筹学
第11讲:对策论(一)
3、对策的分类
按局中人的数目分类:二人对策,多人对策(诸侯争霸) 按策略的数目分类:有限对策,无限对策(警察抓罪犯) 按赢得矩阵之和是否为零分类:零和对策,非零和对策(囚 徒困境)
按局中人是否合作分类:非合作对策(同类企业竞争),合
作对策(供应链成员,OPEC等)
综上所述,田忌赛马为二人有限零和不合作对策。
运筹学
第11讲:对策论(一)
二、纯策略
例1 设对策G =(S1,S2,A),其中
β1 α1
A= α2
β2
β3
β4
α3
7 8 2 3 3 6 1 2 9 2 3 5
, m; xi 1 i 1
m
, n; y j 1 i 1
n
则分别称S1*和S2*为局中人甲、乙的混合策略集;对于
* x S1* , y S2 , 称x和y为混合策略,(x, y)为混合局势。
运筹学
第11讲:对策论(一)
例4
求解G =(S1,S2,A),S1={α1, α2}, S2={β1, β2},
如果甲、乙都是理性的人,应各选什么策略?
运筹学
第11讲:对策论(一)
设有对策G =(S1,S2,A),其中 S1={α 1,α 2,…,α m}, S2={β1,β2,… , βn},
A=(aij)m×n。
如果A中存在一个元素ark满足:
ark max min aij min max aij
* 1 * 2
T
T
运筹学
LP作业讲解
附:1.15 Lindo语句
max 1000x11+1000x12+1000x13+700x21+700x22+700x23+600x31+600x32+600x33 st 8x11+6x21+5x31<=2000 8x12+6x22+5x32<=3000 8x13+6x23+5x33<=1500 10x11+5x21+7x31<=4000 10x12+5x22+7x32<=5400 10x13+5x23+7x33<=1500 最优值: Z*=801000 x11+x12+x13<=600 x21+x22+x23<=1000 最优解: x31+x32+x33<=1500 x11 = 150, x12 = 375, 184x12+138x22+115x33-240x11-180x21-150x31>=0 x13 = 75, x23 = 150, 240x11+180x21+150x31-136x12-102x22-85x33>=0 x31 = 160, 184x12+138x22+115x33-320x13-240x23-200x33>=0 其余xij= 0 320x13+240x23+200x33-136x12-102x22-85x33>=0 176x13+132x23+110x33-120x11-90x21-75x31>=0 120x11+90x21+75x31-144x13-108x23-90x33>=0 end
运筹学
第11讲:对策论(一)
策略集:局中人i 所有策略的集合,用Si 表示 例如:设田忌为第1人,i=1;齐王为第2人,i=2。 则田忌的策略集为:S1={α1,α2,α3,α4,α5,α6};
齐王的策略集为:S2={β1,β2, β3, β4, β5, β6}。
局势:每个局中人各从其策略集中取一个策略参与对策,则 这些策略的组合称为局势,用s表示。 例如:田忌和齐王的某个局势为:s51或(α 5,β 1),即s51 =(α 5,β 1) 赢得函数:局中人i 在局势s下的所得,用Ui (s)表示 U1(s51) 1 U2(s51)=-1 U1(s11)= U2(α 2,β 5)= 1 -3 =
7 4 A 3 6
,求甲乙两人应采取的策略?
如果双方进行一次对策,则甲随机选择,乙选β2的概率大一点; 如果双方进行六次对策,甲分别取3次α 1和α 2,乙选2次β 1,4次β
2
运筹学
第11讲:对策论(一)
例5
求解下列矩阵对策,其中:
4 2 A 0 8
i j j i
则局势(α r ,β k)称为G 的解或鞍点。α *=α r,β *=β k称
为甲、乙的最优纯策略。设G 的值为vG,vG = ark 。
运筹学
第11讲:对策论(一)
例2 求解G =(S1,S2,A),其中
β1 β2
α1 A= α 2 α3
β3
β4
4 3 6 3 2 2 0 6 5 3 4 3
作业:12.1,12.2,12.3,12.4
ห้องสมุดไป่ตู้
运筹学
LP作业讲解
LP作业讲解
习题2-3
解: 设 xij采用第 i ( i = 1,2,对应于甲,乙 ) 种机床加工第 j 种工件的 数量( j = 1,2,3),z为总加工费用,则该问题的线性规划模型可写为: min z = 13x11 +9x12 + 10x13 + 11x21 +12x22 +8x23 s. t. 0.4x11 +1.1x12 + x13 ≤ 700 0.5x21 +1.2x22 + 1.3x23 ≤ 800 x11 + x21 =(≥) 300 x12 + x22 =(≥) 500 x13 + x23 =(≥) 400 这两台机床的可用 台时数分别为700 和800,三种工件 的待加工数量分别为 300、500和400