第三节双矩阵对策
矩阵对策
max aij 对局中人 II,求 min j i
若 max min aij min max aij a i
i j j i
*
j*
策略 i , j 为I,II 的最优策略
这一对策 的值为 V a i
j
几个术语
局势 对策的解
最优纯策略
对策的值 鞍点 e. g. 2 (续)求解取暖购煤问题
两人零和对策
对抗对策(antagonistic game)
矩阵对策(matrix game)
二.实际问题中的矩阵对策模型
e. g. 1 扩大销售模型
公司I,公司II 的同一产品竞争市场份额,各有三种办 法扩大销售额(由于市场需求一定,一家扩大,意味 另一家缩减),三种方法比如:①改进包装;②广告; ③降价.公司I 的三种策略表示为 1 , 2 , 3 ,公司II 的三种策略为 1 , 2 , 3 ,在不同策略下销售量增长百 分比不同.下表中表示公司I 的增长率,而公司II 的即 为相反数
e. g. 6 (续)求最优策略与值
作业
P206,
Ex 6. 3:1,2
1=急转 2 =不转
1
给急转弯者以1 分,不转弯者以5 分 局中人II 局中人I 局 =急转 1 中 人 2=不转 II
3 5
1 =急转 2=不转
1 0
0
II 的支付矩阵
此对策中,若两者都想得5 分,则发生惨祸, 全部玩完.实际上两人最好的做法是同时停车 或转弯,各得3 分. Remark 此例已不是 2 人有限零和对策问题(因为在 每个对局中,双方支付的代数和不为零), 称为双矩阵对策.
e. g. 2 取暖购煤问题 某公司在秋末需决定冬季取暖用煤问题.根据气温 情况,用煤量和煤价均不同,可用下表表示: 正常气温 较冷气温 较暖气温 需求量15 吨 需求量20 吨 需求量10 吨 200元/吨 250元/吨 150元/吨
矩阵对策的最优纯策略
,m α,
,
,n β;则分别为
},m α和},n β。
当局中人Ⅰ选定纯策略i α和局中人Ⅱ选定纯策略后,就形成了一个纯局)j ,这样的纯局势共有m n ⨯个。
对任一纯局势赢得值为ij a ,称
12122
212n n m m mn a a a a a ⎤⎥⎥⎥⎥⎦
为局中人Ⅰ的赢得矩阵。
局中人Ⅱ的赢得矩阵就是当局中人Ⅰ,Ⅱ的策略集12,S S 及局中人Ⅰ的赢得矩阵对策也就给定了,记为{}12,,G S S A =。
在齐王赛马的例子中,齐王的赢得矩阵
},
,m α,
},n β,max )
成立,记其值为)成立的纯局势()
,i j αβ**
在纯策略意义下的解(或鞍点)
},m α,},n S β,
1,2,
,,m x ∑1,2,
,,n y ∑分别称为局中人Ⅰ和Ⅱ的混合策略集分别称为局中人Ⅰ和Ⅱ的混合策略(或策略),对
),m x 可设想成当两个局中人多次重复进行对策
12,,
,m ααα的频率。
若只进行一次时对策,混合
对策可设想成局中人Ⅰ对各纯策略的偏爱程度。
求解混合策略的问题有图解法,迭代法、线性方程组法和线性规划法,在。
运筹与优化--对策论
y∈S2*为局中人I和Ⅱ的混合策略,(x,y)为混合局势,
局中人I的赢得函数为 E(x,y)xTAy aix jiyj
称G* ={S1*,S2*,E}为对策G的混合扩充. i j
A
12
设 mm ax E i(x n ,y)mE i(x n *,y)
x S 1 * y S2 *
y S2 *
mm inE a(x,x y)mE a(x,x y*)
注意:G在纯策略下解存在时,定义4中的
VG ;Gai在j 混合策略意义下的解(x*,y*)
存在时,VG=E(x*,y*).
例4. 解矩阵对策 中
3 G6={S1 ,S2 ;A },其
A
5
4
A
14
局中人I取纯策略αi时,其赢得函数为 E(i,y)=∑aijyj ,
局中人Ⅱ取纯策略βj时,其赢得函数为 E(x,j)=∑aijxi .
人I以概率xi≥0取纯策略αi,局中人Ⅱ以概率yj≥0取
纯策略βj ,且
m
xi
1.记,
n
yj 1
i1
j1
m
S 1 {x(x1,x2, ,xm ) E mxi0 , xi1 }
i 1
n
S2 {y(y1,y2, ,yn) E nyj0, yj1 }
j 1
则S1* ,S2*分别称为局中人I和Ⅱ的混合策略集.称x∈S1*,
A
24
推论.如果纯策略α1被纯策略α2 , … αm的凸线 性组合所优超,则定理10的结论仍成立.
由上两式得
E(x,y)=∑E(i,y)xi
(5)
E(x,y)=∑E(x,j)yj . (6)
定理3.设x∈S1*,y∈S2*,则(x*,y*)是G的解的充要条 件是: 对任意i=1,2,…,m 和 j=1,2,…,n,有
第1章 矩阵对策
此时局中人 1 和 2 是同时并且独立地进行选择.因此局中人 1 获得支付 aij ,局中人 2 获得支
( ) 付 −aij .如果支付是一个负数, 那么可以认为是局中人的实际损失.
记具有支付矩阵 A 的对策 Γ 为 ΓA ,并且根据矩阵的维数,称之为 (m × n) 对策.如果
果它被隐藏在那里)的概率为 0 < βi ≤ 1 ,i = 1, 2, , n .如果找到目标,局中人 1 获得收益 为α .在其中隐藏和搜索物体的坑的编号是局中人的策略,局中人 1 的支付等于期望收益与
寻找目标时所付出的努力之差.隐藏和搜索目标的问题可以转化为矩阵对策,其支付矩阵为
⎡αβ1 −τ1 −τ1 −τ1
选择进行攻击的目标(局中人 1)和防卫目标(局中人 2)的问题可以转化为矩阵对策,
其支付矩阵为
⎡β1τ1 τ1
A
=
⎢ ⎢
τ2
β2τ 2
⎢
⎢ ⎣
τn
τn
τ1 ⎤
τ2
⎥ ⎥
⎥
β
nτ
n
⎥ ⎦
例 1.1.5 (离散型搜索对策)有 n 个坑,局中人 2 在 n 个坑中之一隐藏物体,局中人
1 希望找到它.在寻找第 i 个坑时局中人 1 付出的努力为τi > 0 ,在第 i 个坑中找到目标(如
m −1 > n ,则 a10 = n +1+1 = n + 2 , a11 = n −1+1 = n , a1 j = n − j +1−1−1 = n − j −1,
2 ≤ j ≤ n .一般情况下(对任意的 m 和 n )元素 aij , i = 0, m , j = 0, n 以及支付矩阵可以
第八讲 矩阵对策概要
矩阵G的一般解法
1)取每行的最小值:
min gij i 1, 2, , m
j
i
maxmin gij i 1, 2, , m 2)从上述值中选最大值: j
j
3)取每列的最大值: max gij j 1,
i
2, , n
max gij j 1, 2, , n 4)从3)项中选最大值:min j
E X ,Y E X ,Y
那么: X
x和y EX ,Y
都成立时
局中人P1的最优策略; 局中人P2的最优策略; 对策的值; 对策的解;
Y
E X ,Y
X
,Y
最优策略的解法
假设策略的值是V,最优策略及策略的解可 通过下式求得。
m
E X , j g ij xi V
Y , , 5) 13 13 13 25 V 13
E 1, Y 3 y1 y2 y3 V E 2, Y y1 y2 5 y3 V E 3, Y y1 4 y2 y3 V y1 y2 y3 1
i
min gij min max gij gi* j* 时, 5)若 max j j i i
ai* →P1的最优纯策略; b * →P2的最优纯策略; j
a , b 对策的解; V
i* j*
g i* j* 对策 a * , b * 的值。 i j
例3
某耕地根据种植划以及自然条件,规划 与收益存在如下表所示的关系。 试求出最佳规划方案。
swot分析和战略矩阵选择
1建立专门的网站进行销售,消除地域的限制,扩大市场份额。
2提供产品的专业化服务,实施服务差异化策略。
3打造如来医药的品牌知名度。
WT
策
略
1紧密联系各关系单位,获取客户的有效信息。
2快速渗透策略,用低价格和高促销费用占领市场份额。
3社会经济的发展,居民对健康的关注带动医疗器械的需求增长。
优势(Strengths)
1代理产品多为知名品牌,具有较高的信誉度和售后保证。
2具有可靠的货源保证和经费支持。
3优质的服务在广大客户中赢得良好的口碑,便于扩大市场,降低营销成本.
4潜在目标市场规模相对较大。
5拥有一批经验丰富的推销人员,与关系企业具有良好的关系。
2作为一家规模较小的代理商,在价格上缺乏自主权,很难以低价格打开市场。
图6 SWOT分析图
通过SWOT分析可以看出,“**医药”ABC代理的产品类产品属于“新兴类产品”,但**医药ABC自身发展成熟,资金实力较强,客户资源多。因此,这都为**医药开发新市场打下了坚实的基础,要在市场中寻求发展,不断开发新客户、保持老客户,一定能够将PMD肺功能监测仪在中国推广开来,成为中国医疗器械行业的知名品牌。
威胁(Threats)
1大型代理商进入市场早,占有份额多,且不易夺取。
2由于较低的进入壁垒,陆续有新的医药用品代理商进入市场,使原已成熟的市场竞争更加激烈。
3集团客户的交易量大,会惯性的选择有一定了解的可靠的代理商作为供货源头。
劣势(Weaknesses)
1由于医药用品的主要销售对象是集团购买,客户的转移成本较大。
二、SWOT组合策略
SO
矩阵对策问题及其解法
矩阵对策问题及其解法背景对策论研究具有竞争性质的现象。
有权决定⾃⾝⾏为的对策参加者称为局中⼈,所有局中⼈构成集合I,在⼀局对策中可供剧中⼈选择的⼀个实际可⾏的完整的⾏动⽅案成为策略,对于任意剧中⼈i∈I,都有⾃⼰的策略集S i。
⼀局对策中由各剧中⼈选定的策略构成的策略组称为局势s=(s1,...,s n),⽽全体局势集合S=S1×...×S n。
局势决定了对策的结果,对局势s∈S,局中⼈i可以得到收益H i(s),也称为局中⼈i的赢得函数。
矩阵对策即⼆⼈有限零和对策,是⼀类较为简单的对策模型。
矩阵对策基础我们假设,局中⼈ I 有纯策略α1,...,αm,局中⼈ II 有纯策略β1,...,βn,⼆者各选择⼀个纯策略则构成m×n个纯局势 (αi,βj),将 (αi,βj)下 I 的赢得值记为a i,j,设矩阵A=[a i,j],称为 I 的赢得矩阵或 II 的⽀付矩阵。
局中⼈ II 的赢得矩阵就是 −A T。
最优纯策略若纯局势 (a i∗,b j∗) 满⾜max i minj a i,j=minjmaxi a i,j=a i∗,j∗则称为矩阵对策 {S1,S2;A} 的最优纯策略。
显然,最有纯策略在赢得矩阵中对应的元素⼀定满⾜,其是所在⾏的最⼩元素,也是所在列的最⼤元素,即矩阵的鞍点。
混合策略当纯策略不存在时,我们希望给出⼀个选取不同策略的概率分布。
我们记 I,II 的概率分布向量分别为x,y,所有概率分布向量构成的集合为S1,S2,则局中⼈ I 的赢得函数为E(x,y)=x T Ay。
纯策略是混合策略的特例。
若混合局势 (x∗,y∗) 满⾜max x miny E(x,y)=minymaxx E(x,y)=E(x∗,y∗)则称为矩阵对策 {S1,S2;A} 的最优混合策略。
同样,混合策略 (x∗,y∗) 是最有混合策略的充要条件也是 (x∗,y∗) 是函数E(x,y) 的鞍点。
swot 矩阵组合策略
SWOT矩阵是一种常用的战略分析工具,用于评估一个组织或项目的优势、劣势、机会和威胁。
基于SWOT矩阵的分析结果,可以制定相应的组合策略。
以下是几种常见的SWOT矩阵组合策略:1. SO策略(Strengths-Opportunities,优势-机会):SO策略是利用组织或项目的优势来抓住市场机会。
这种策略强调通过充分利用自身的优势来实现增长和发展。
例如,如果一个公司具有强大的品牌声誉和广泛的分销网络(优势),并且市场上出现了一个新兴的高增长领域(机会),那么公司可以利用自身的优势进入该领域并获取更多市场份额。
2. ST策略(Strengths-Threats,优势-威胁):ST策略是通过利用组织或项目的优势来应对潜在的威胁。
这种策略旨在保持现有业务的竞争优势并抵御潜在的风险。
例如,如果一个公司在某个市场上具有领先地位(优势),同时面临来自竞争对手的激烈竞争(威胁),公司可以通过进一步提升产品质量和降低成本来保持竞争优势。
3. WO策略(Weaknesses-Opportunities,劣势-机会):WO策略是通过克服组织或项目的劣势来抓住市场机会。
这种策略强调通过改善劣势领域来实现增长和发展。
例如,如果一个公司在技术创新方面存在不足(劣势),但市场上出现了一个高增长的市场领域(机会),公司可以通过加强研发和技术投入来弥补技术劣势,并进入该领域。
4. WT策略(Weaknesses-Threats,劣势-威胁):WT策略是通过减轻组织或项目的劣势来应对潜在的威胁。
这种策略旨在强化组织的竞争地位并减少潜在风险。
例如,如果一个公司在供应链管理方面存在问题(劣势),同时面临着供应链中断或原材料涨价等威胁(威胁),公司可以通过与供应商建立更紧密的合作关系或寻找替代供应商来减轻劣势和应对威胁。
以上是一些常见的SWOT矩阵组合策略,具体的策略选择应根据具体情况进行评估和决策。
矩阵对策
2 3 1 1 2 3 3 1 2
第三部分
二人有限非零和对策
一、非零和对策的一般表达 1、局中人集合:i = 1, 2 ,…,n 2、每个局中人的策略集:Si (i = 1,…,n) 3、每个局中人的赢得函数:ui (s1, …, s i , … sn)
对策的一般表达:G={S1, … Sn ; u1, … un }
1
1 3 1
1
1 1 3
4、优超原理
定义: 若A中第i, k 行有aij akj , j 1 n 称 i 优超于 k 。 记 i k 若A中第j, l列有aij ail , i 1 m 称 j 优超于l 记 j l 。
例: A
1 0 2 2 3 1
称为i的劣策略(Dominated strategy)。
' i
'' i
例: B1 Ⅰ A1 A2 1, 0 0, 3
Ⅱ
B2 1, 2 0, 1 B3 0, 1 2, 0
劣策略
可按如下思路寻找均衡解: 首先找出某个局中人的劣策略(如果存在),剔除该劣 策略,得到新的博弈;再剔除该新博弈中的某个中人的 劣策略。重复进行,直至只剩下唯一的策略组合为止, 这个剩下的策略称为重复剔除的占优均衡(Iterated dominance equilibrium)。
对策值V=1
(2) 多鞍点与无鞍点对策
例 设有一矩阵对策如下,求它的解。
6 1 A 8 0 5 4 5 2 6 2 7 6 5 - 1 5 2
局势 ( s1 , d 2 ) ( s1 , d 4 ) ( s3 , d 2 ) ( s3 , d 4 ) 均构成鞍点, 此对策有多个解。
博弈论算法讲义
博弈论算法一、博弈的战略式表述及纳什均衡的定义在博弈论里,一个博弈可以用两种不同的方式来表述:一种是战略式表述(strategic form representation ),另一种是扩展式表述(或译为“展开式表述”)(extensive form representation )。
从分析的角度看,战略式表述更适合于静态博弈,而扩展式表述更适合于讨论动态博弈。
1.1博弈的战略式表述战略式表述又称为标准式表述(normal form representation )。
在这种表述中,所参与人同时选择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。
战略式表述给出:1.博弈的参与人集合:(),1,2,,i n ∈ΓΓ=。
2.每个参与人的战略空间:,1,2,,i S i n =。
3.每个参与人的支付函数:12(,,,),1,2,,i n u s s s i n =。
我们用()11,,;,,n n G S S u u =代表战略式表述博弈。
例如在两个寡头产量博弈里,企业是参与人,产量是战略空间,利润是支付;战略式表述博弈为:{}121122120, 0; (,), (,)G q q q q q q ππ=≥≥ (1.1)这里i q 、i π别表示第i 个企业的产量和利润。
1.2纳什均衡的定义有n 个参与人的战略式表述博弈()11,,;,,n n G S S u u =,战略组合{}1,,,,i n s s s s ****=是一个纳什均衡。
如果对于每一个i 、i s *是给定其他参与人选择{}111,,,,,i i i n s s s s s *****--+=的情况下第个参与人的最优战略,即(,)(,),,i i i i i i i i u s s u s s s S i***--≥∀∈∀ (1.2)或者用另一种表述方式,i s *是下述最大化问题的解:111argmax (,...,,,,...,),1,2,..., ;i i i i i n i i s u s s s s s i n s S *****-+∈=∈(1.3)我们用这个定义来检查一个特定的战略组合是否是一个纳什均衡。
8.1对策问题的提出8.2对策论模型8.3矩阵对策的解法知识归纳习题
合作… 对策模型… 零和 二人 有限 非零和 完全信息 静态 多人…… 无限…… 非合作 不完全信息…… 完全信息 动态 不完全信息……
(2)策略 在一局对策中,可供局中人选择的一个实际可行的自始至终通盘筹划的完整行动 方案称为这个局中人的一个“策略”。参加对策的局中人i(i∈I)的所有可供选择的 策略的全体所构成的集合叫做局中人i的“策略集”,简记作Si。 (3)赢得函数 一局对策结束之后,对每个局中人来说,不外乎是胜利或失败,名次的前后, 以及其他物质的收入或支出等,这些可以统称为“得失”或“益损”。 在齐王与田 忌赛马的例子中,最后田忌赢得一千金,而齐王损失一千金,即为这局对策(结局时) 双方的“得失”。 实际上,每个局中人在一局对策结束时的得失,与局中人所选定的策略有关。 例如,上述赛马的例子中,当齐王出策略“上、中、下”,田忌出策略“下、上、中” 时,田忌得千金;而如果与田忌都出策略“上、中、下”时,田忌就得付出三千金了。 因此,在一局对策中,当局势给定以后,对策的结果也就确定了。 一局对策结束时,每个局中人的“得失”是全体局中人所决定的一组策略即 “局势”的函数,我们称之为“赢得函数”。 在最终局势ω下,局中人i∈I的赢得函数记作:H(i,ω)。 在一局对策中,如果在任一“局势”中,全体局中人的“得失”相加总和为零, 就称该对策为“零和对策”,否则,就称为“非零和对策”。上述齐王与田忌赛马的 例子中,不论比赛双方的策略如何,比赛的结果,一方的所得必为另一方的所失,因 此该对策就是一个零和对策。 一般来说,当上述三个基本要素确定以后,一个对策模型就确定了。
(3)发展阶段 20世纪60至80年代是博弈论体系的发展壮大时期。一方面,研究的领域从军事 战略战术问题推广应用到经济领域;另一方面,研究的内容也不断发展出新。合作博 弈理论继续得到充实和丰富,而非合作博弈理论更是发展迅速,成为博弈论研究和应 用的主流。 (4)成熟阶段 纪80年代至今是博弈论的完善和应用期。此间博弈论本身发展成为了一个 相对完善、内容丰富的理论体系,羽翼已丰的非合作博弈理论在理论研究和实践应用 中都占据了主导地位。更重要的是,博弈理论在各种经济学科中都得到了深入的应用, 在政治学、生物学、计算机科学、道德哲学、社会学等领域内也产生了重要影响。 1994年,纳什、泽尔腾、海萨尼三人因博弈论及其在经济应用方面的突出贡献而荣 获诺贝尔经济学奖,1996年诺贝尔经济学奖再度授予了在博弈论研究方面作出突出 贡献的维克里和莫里斯。由此,吸引了更多的学者投入到博弈论的研究当中,使得博 弈论成为世界范围内的研究热点,博弈论也逐步趋于完善和成熟。2001年,研究博 弈论的学者再一次获得诺贝尔经济学奖。美国教授乔治· 阿克尔洛夫、迈克尔· 斯彭斯 和约瑟夫· 斯蒂格利茨在20世纪70年代奠定了对充满不对称信息市场进行分析的理论 基础,正是由于他们在“对充满不对称信息市场进行分析”领域所做出的重要贡献, 而分享了2001年诺贝尔经济学奖。
对策论模型
9 7 y E ( X , Y ) ( x,1 x) 2 8 1 y
=8xy-6y-x+8 3 1 1 8( x )( y ) 7 = 4 8 4
3 1 这就是说,局中人分别以概率 X * ( , ) 选用1,2 时,至少 4 4 1 1 7 * 赢得 7 ,同理,局中人Ⅱ分别以概率Y ( , ) 选用策略1,2, 4 8 8 1 3 1 1 7 7 。但当 X * ( , ) 或 Y * ( , ) 时,则会受到更大的 至多损失 4 4 4 8 8 损失。
1.混合策略和混合局势
一般地, 设给定 S1 , S2 ; A, 令 X ( x1 , x 2 , , x m), Y ( y1 , y2 , , yn )
m m
S {X | x i 0; x i 1}, S {Y | y j 0; y j 1}
1
1 1 3 1
-1
1 1 1 3
A=
1 -1 1 1
-1 1
这是一个两人有限零和对策。
二、在纯策略下有解的矩阵对策的解法
1.解法的思想:双方都立足在不利的情况下争取最好的结果 ──最大最小原则。 例 求解矩阵对策 ={S1,S2;A},其中:
7 3 A 16 3 1 8 2 4 4 3 0 5
解:
1
1 7 2 3 3 16 4 3
i
2
1
3
min a ij
j
max aij
8 2 4 4 3 0 5 16 2 5
8 2 max ai j 2 i 3 3
*
min aij* 2
运筹学教学-对策论公开课获奖课件百校联赛一等奖课件
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1
布
1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}
(优选)矩阵对策的解法详解.
3.1 公式法、图解法和方程组法
1. 2×2 对策的公式法
2×2 对策是指局中人Ⅰ的赢得矩阵为2×2 阶的, 即
A
a11 a21
a12
a22
如果 A 有鞍点, 则很快可求出各局中人的最优纯策略; 如果
A 没有鞍点,则可证明各局中人最优混合策略中的 xi* , yj* 均 大于零。于是, 由定理 6 可知, 为求最优混合策略可求下列
(5)确定经过点 P 的两相交直线,根据两相交直线列出对应方程 组,求出 y*.
(6)根据定理6的结论计算 x* 的值。
2020/7/19
10
例14
用图解法求解矩阵对策 G = { S1 , S2 ; A} , 其中
2 7
A
6
6
11 2
2020/7/19
11
2020/7/19
12
例 15
求解赢得矩阵A 的矩阵对策
A 4 1
8
3 5
4 5
2 7
2020/7/19
13
2020/7/19
14
3. 线性方程组方法
根据定理4 , 求解矩阵对策解( x*, y* ) 的问题等价于求解不 等式组,又根据定理5 和定理6 , 如果假设最优策略中的 xi* 和 yj* 均不为零, 即可将上述两个不等式组的求解问题转化 成求解下面两个方程组的问题:
(1) i
i
aij xi v, j 1,2,...,n
xi 1
(2)
j j
aij y j v,i 1,2,...,m yj 1
2020/7/19
15
3. 线性方程组方法
例16
求解矩阵对策——“齐王赛马”
矩阵对策的基本理论
A
a21
a22
a2n
am1 am2 amn
(12-3)
为局中人Ⅰ的赢得 矩阵。由于对策为零和的,故局中人 Ⅱ的赢得矩阵为-A。
当局中人Ⅰ、Ⅱ的策略集 S1, S2 及局中人Ⅰ的赢得矩阵 A 确定后,一个矩阵对策就给定
了。因此将矩阵对策表示为 G S1,S2;A.
矩阵对策的最优纯策略
x E m
x
x , x ,, x
12
m
T
,
x i
0, i
1,,
m,
m
x i
i 1
1
S 2
y
E
n
y
y , y ,, y
12
n
T,
y j
0,
j
1,
n,
n
j 1
y j
1
S 和S 1
2
分别称为局中人Ⅰ和Ⅱ的混合策略集;
x
S
1
和y
S
2
分别称为局中人Ⅰ和Ⅱ
的混合策略;当
x
S 1
和y
S
2
其中, T G1
和T G 2
分别为局中人 I 和 II 的策略集。
运筹学
使自己的赢得尽可能的小,理性的选择就应该是从各自可能出现的最不利的情形中争取尽可
能好的结果。
战略规划的经典分析工具:SWOT分析
SWOT分析
-战略规划和竞争情报的经典分析工具,经常被用于企业战略制
定、竞争对手分析等场合。
1
1战略管理工具
目录
1. 概念含义 .....................................................................................................................................................................3 1.1. 优势与劣势分析(SW) .............................................................................................................................3 1.2. 机会与威胁分析(OT) .............................................................................................................................5
7. 相关工具 ...................................................................................................................................................................27 7.1. TOWS分析 ...................................................................................................................................................27 7.2. 高级SWOT分析法 .......................................................................................................................................28
具有策略偏好的模糊双矩阵对策模型及其应用
f sl ac ltd; a d u i g a f z y o d rn t o i ty c lua e r n sn u z r e ig me h d, t e f z y mo e s ta so me n o a x l i h u z d li r n f r d it n e p i t c
Ab t a t A o v n t o o u z i a rx g me wih s r t g r f r n ei r p s d i h s p p r s r c : s l i g me h d f rf z y b m t i a t t a e y p e e e c p o o e t i a e . s n Ac o d n o t e OW A i h e o p sto p r t r , t e s r t g r f r n e v c o s o l y r r c r i g t h we g t d c m o ii n o e a o s h t a e y p e e e c e t r f p a e s a e
b m a r x g m e h o u i n m e h d b s d o a tce s r o tmia i n i lo g v n i ti a ,t e s l to t o a e n p r il wa m p i z to s a s i e .Th e EW i h i g fg tn e f c i e e s e a u to fe tv n s v l a in mo e f f z y b ma rx g me i u o wa d Th t d e u t o h v h d lo u z i ti a s p t f r r . e s u y r s ls d a e t e mi t r p l a i n v l e f r r s u c i t i u i n a d i r v n i h i g e f c i e e s l a y a p i to a u o e o r e d s rb t n mp o i g f t fe t n s . i c o g n v Ke wo d : s r t g p e e e c , f z y b ma rx g me p r il s r y r s ta e y r f r n e u z i t i a , a tce wa m o tmia i n, fg t g p i zt o ih i n
对策论第2,3节 矩阵对策的基本定理与解法
存在前提:
max min aij = min max aij= v
i
j
ji
ห้องสมุดไป่ตู้
又称( 2 ,3 )为对策G={s1,s2,A}的鞍点。值 V为G的值。
定义9-1:对给定的矩阵对策
G = S1,S2;A 若等式
max min aij= min max aij
i
j
j
i
成立,则称这个公共值为对策G的值,记 为VG,而达到的局势( i, j )称为对 策G在纯策略意义下的解,记为( I*, j *)而I*和 j *分别称为局中人I和局中 人II的最优纯策略。
第2,3节 矩阵对策理论与求解方法
一、矩阵对策的最优纯策略
•在甲方赢得矩阵A=[aij]m*n中: aij代表甲方取策略i,乙方取策略j, 这一局势
下甲方的益损值,此时乙方的益损值为-aij(零 和性质)。 •在讨论各方采用的策略是必须注意一个前提就 是对方是理智的。这就是要从最有把握取得的 益损值情况考虑。
显然 ai2 a12 a1j ai2 a32 a3j 对 I=1,2,3 j=1,2,3 都成立: a12 = a32 =5 由定理5-1,对策值=5,对策的解:( 1 , 2 ) 和( 3 , 2 )
例3:某单位采购员在秋天时要决定冬天取暖 用煤的采购量。已知在正常气温条件下需要用 煤15吨,在较暖和较冷气温条件下需要用煤10 吨和20吨。假定冬季的煤价随着天气寒冷的程 度而变化,在较暖、正常、较冷气温条件下每 吨煤价为100元、150元、200元。又秋季每 吨煤价为100元。在没有关于当年冬季气温情 况下,秋季应购多少吨煤,能使总支出最少?
E(X,Y)= xi aij yj=XAYT 称为局中人I期望赢得,而局势(X,Y)称为“混合 局势”,局中人I,II的混合策略集合记为S1*, S2*。
双矩阵对策
平衡局势(X *,Y *)对应的二局中人的期望收益 ( X *T AY *, X *T BY * )就是G的值,记为(U *,V *)。
定理1:任何双矩阵对策至少存在一个平衡局势。
定理2:(X *,Y *)为双矩阵对策G的一个平衡局势的
充要条件是存在数p*和q*使[ X * Y * p* q* ]T 是下述问题的一个解:
公理(5 线性变换不变性):设P'是从P经线性变换 U ' aU b,V ' cV d (a, c 0)
(U0,V0 )称为安全点,表示收益的“下限”。
(2) Nash谈判集 满足U U0且V V0的Pareto点(U ,V )的全体。
VA
(U0 ,V0)
0
B
U
显然,最优点应从Nash谈判集中产生,称为Nash谈判解。
4.Nash谈判解的计算 ⑴Nash谈判公理
为了从Nash谈判集中寻找使双方可达成协议的解(U *,V *), 记所有可能成为(U *,V *)的可行解的集合为P(可即Nash谈判集) Nash给出了(U *,V *)的6个公理:
B1 0 B2 0
0yyyy01111yy110011,,,,11,0,BBB0B1212xx11xx11xy1B1BBB12BB12BB112112
y1
1
B2
B1
0
1
x1
y1
1
B2
B1
0
1
x1
y1
8
B1 0 B2 0
1
y1 1, 0 x1 1
0
1
x1
y1
9
B1 0 B2 0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
局中人I选择 S ,局中人II选择 S ,则对策局势为 , ,与这个局势相 应的局中人I的收入为 a ,局中人II的收入不再是 a ,而是 b ,记作 a , b 。 对这种对策,通常用 G I , II ; S , S ; A, B 表示,其中 A a , B b 分别是局中人I与II 的支付矩阵,或简记为 G S , S ; A, B 。由于对策的赢得(或收入)必须用两个 矩阵 A a 及 B b 给出,故也称二人有限非零和对策为双矩阵对策。
大猪/小猪
按 等待
按
(5,1) (9,-1)
等待
(4,4) (0,0)
2
MOR:SM
SHUFE
第三节 双矩阵对策
解: 以智猪博弈为例,说明纯策略下的纳什均衡的求取。
(1)当小猪选择按按钮时,如果大猪也选择按按钮,大猪的赢得是5;如果大 猪选择等待,大猪的赢得是9,所以在第一列的9下面划线; (2)当小猪选择等待时,如果大猪选择按按钮,大猪的赢得是4;如果大猪也 选择等待,大猪的赢得是0,所以在第二列的第一个分量4下面划线; (3)当大猪选择按按钮时,如果小猪选择按按钮,小猪的赢得是1;如果小猪 选择等待,小猪的赢得是4,所以在第一行的第二个分量的4下面划线; (4)当大猪选择等待时,如果小猪选择按按钮,小猪的赢得是-1;如果小猪选 择等待,小猪的赢得是0,所以在第二行的第二个分量0下面划线 因此,本例中存在唯一的纯策略纳什平衡偶(4,4),即大猪按按钮,小猪选 择等待是唯一可能出现的结局。
i 1
j 2
i j
ij
ij
ij
ij
ij
1
2
ij
ij
1
2
ij
ij
双矩阵对策的解法 平衡偶
在非零和对策中,设 E X ,Y 与 E X ,Y 分别是局中人I与II的收入,这里 X S ,Y S , 为任意策略 X S ,Y S 。如果存在一对策略使得 E X ,Y E X ,Y , E X ,Y E X ,Y 对任意的 X S 与 Y S 均成立,则称策略为双矩阵对策 G 的一个平衡偶
MOR:SM
I II
1
2
*
*
*
*
*
*
*
*
1
2
I
I
I
I
1
2
纳什定理:任何具有有限个纯策略的二人对策(包括零和对策与非零和
对策),至少有一个平衡偶
1
MOR:SM
SHUFE
第三节 双矩阵对策
双矩阵对策求解
例:智猪博弈
笼子里面有两只猪,一只大一只小。笼子很长,一头有一个踏板,另一头是饲 料的出口和食槽。每踩一下踏板,在远离踏板的猪圈一边的投食口就会落下 少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落 下的食物。按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付 出2个单位的成本。若大猪先到槽边,大小猪吃到食物的比例是9∶1;若大小 猪同时到槽边进食,它们吃到食物的比例是7∶3;若小猪先到槽边,它们吃到 食物的比例是6∶4。如表10—2所示,那么,在两头猪都有智慧的前提下,最终 结果是什么呢? 智猪博弈双矩阵: