第十二章 对策论
运筹学-第15章--对策论
1 8 5 8 5 5*
2 2 3 2 1 1
3 4
9 0
5 2
6 3
5 5*
3
0
max 9 5* 8 5*
可知 ai* j* =5,i*=1,3,j*=2,4.故(α1,β2)(α1,β4)(α2,
β2)(α2,β4)为对策的纳管 什理均运衡,筹 V学G=5.
15
• 最优纯策略求解步骤:
• 1、行中取小,小中取大得最大化最小收益 值;
• 2、列中取大,大中取小得最小化最大支付 值;
• 3、比较两值是否相等。若相等便存在最优 纯策略。若不等,则不存在最优纯策略。
管理运筹学
16
§3 矩阵对策的混合策略
设矩阵对策 G = { S1, S2, A }。当
max
i
min
j
aij
min
j
max
i
aij
时,不存在最优纯策略。
例:设一个赢得矩阵如下:
一个局势,一个局势决定了各局中人的对策结果(量化) 称为该局势对策的益损值。
管理运筹学
3
§1 对策论的基本概念
出赛的次序是一个策略 “齐王赛马”齐王在各局势中的益损值表(单位:千金)
管理运筹学
4
§1 对策论的基本概念
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。
A=[aij]m×n i 行代表甲方策略 i=1, 2, …, m;j 列代表乙方策略 j=1, 2, …, n;aij 代表甲方取策略 i,乙方取策略 j,这一局势下甲方的 益损值。此时乙方的益损值为 -aij(零和性质)。
《管理运筹学》12-管理博弈
管理博弈的基本概念与分类
例12-5 产量竞争问题
一、博弈的基本要素
解 企业A和B分别为两个局中人,它们的策略为各自的产量qi ϵ[0,∞)(i=1,2),每一方都有无穷多个策略。在局势(q1 + q2)下,局中人i的赢得函数为
衬底1
管理博弈的基本概念与分类
按局中人的数量:二人博弈和多人博弈; 按各局中人赢得函数的代数和是否为零:零和博弈与非零和博弈; 按局中人之间是否合作:合作博弈和非合作博弈; 按策略集中策略数目的有限和无限:有限博弈和无限博弈; 按局中人选择策略的先后顺序:静态博弈和动态博弈; 按博弈过程中对信息掌握的情况:完全信息博弈和不完全信息博弈。
采购员
自然状态
行最小
较暖
正常
较冷
采购100吨
-5
-7.75
-11
-11
采购150吨
-7.5
-7.5.
-10.5.
-10.5
采购200吨
-10
-10
-10
-10*
列最大值
-5
衬底1
管理博弈的基本概念与分类
例12-3 囚徒困境
一、博弈的基本要素
解 A和B为两个局中人,每个局中人都有两个策略:坦白或不坦白。按照各局中人的策略组合,共有四个局势:{坦白,坦白},{坦白,不坦白},{不坦白,坦白},{不坦白,不坦白}。两个局中人的赢得函数可以用表12-2所示的一个双变量矩阵来表示。
β1
β2
β3
4
4
10
4
2
3
1
1
6
5
7
5*
6
5*
10
表12-4 具有鞍点的矩阵博弈的赢得矩阵
对策论的基本概念
– 策略: 可供局中人选择的一个实际可行的完整的行动 方案.
– 策略集:局中人所拥有的对付其它局中人的手段、方案 的集合。每局中人,都有自己的策略集,一般每一局 中人的策略集中至少应包括两个策略。
对策现象的基本要素
➢ 赢得函数(支付函数)
对策中, 每一局中人所出策略形成的策略组称为一个局势。例如, si 是第 i 个局中人的
运筹学
一个策略,则 n 个局中人的策略形成的策略组
s (s1, s2 ,sn ) , s 就是一个局势,全体局势的集合 S 可用各局中人策略集的笛卡尔积表示,即
S S1 S2 Sn 当一个局势 s (s1, s2 ,sn ) 给定以后,就用一个数来表示局中人的得失(或输赢),显
然,这种“得失”或“输赢”是局势的函数,称为支付函数。通常用正的数字表示局中人的
运筹学
对策论的基本概念
➢对策论的由来和发展历史 ➢ 对策现象的基本要素 ➢ 对策问题举例及对策的分类
对策论的由来和发展历史
在社会生活和经济、经常碰到各种各样具有竞争或利益相对抗的现象,研 究对抗或竞争现象的数学理论和方法,称为对策论。 20 世纪初数学家波雷尔(Borel)和策墨洛(E.Zermelo)开始用数学方 法研究对策现象,研究对象主要是日常生活中的一些游戏(如扑克、象棋 等),因而对策论在相当长的时间内发展缓慢。 冯• 诺依曼(Von Neumann)在 1928 年创立了二人零和对策理论,为对策 论的进一步发展奠定了基础。 1944 年冯•诺伊曼和摩根斯特恩(Morgenstern)合著的《对策论与经济 行为》一书的出版,标志着系统的对策理论的初步形成。 1994 年三位长期致力于对策论的理论和应用研究的学者纳什(John F Nash)、泽尔腾(Reinhard Selten)和海萨尼(John Harsanyi)共同获 得诺贝尔经济学奖,则更是对对策论地位和作用的最具权威性的肯定。 2005 年,以色列经济学家罗伯特·奥曼和美国经济学家托马斯·谢林获 得诺贝尔经济学 奖。罗伯特·奥曼提出的“重复博弈 ”分析,目前成为所 有社会科学的主流分支。托马斯·谢林提出了冲突局势理论,在上世纪 50 年代和 60 年代的冷战时期,该理论极大地影响了美国政府对核威慑的 态度。
对策论(Theory of Games)
定义
并不是所有的对策都存在鞍点,如 A为齐王的赢得矩阵 3 1 1 1 1 -1 1 3 1 1 -1 1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 -1 1 3 1 1 1 1 -1 1 3 max(min aij)= -1 min (max aij)=3 i j j i
例如:
• 给定矩阵对策
6 5 6 A 1 4 2 8 5 7
对策的最优值为5,对策的解有两个,分 别为局势 , 和 , 。
1 2 3 2
(三)矩阵对策的混合策略
1、矩阵对策的混合策略的定义
2、原则:坏中求好的原则。 3、解的存在:一定有解 4、混合策略求解:利用期望转化成 线性规划问题求解。
三、矩阵对策模型
(一)矩阵对策的概念 (二)矩阵对策的最优纯策略 (三)矩阵对策的混合策略 (四)矩阵对策的解法
(一)矩阵对策的概念 1、矩阵对策的定义 2、建立矩阵对策模型
1、矩阵对策的定义 局中人只有两个,对策中各方只能从有限 的策略集中确定性的选择一种,且对策双 方的支付之和为零的对策称为两人零和纯 策略对策。
表2
齐 王 上中 下 田忌 上中下 3 上下 中上 中 下 1 1 中下 上 -1 下中 上 1 下上 中 1
上下中 1 中上下 1
中下上 1 下中上 1
3 1
1 -1
-1 3
1 1
1 1
3 1
1 -1
1 3
1 1
-1 1
下上中 -1
1
1
1
1
3
引例3
有两个儿童A和B在一起玩“石头-剪子布”游戏。我们规定胜者得1分,负者得 -1分,平手时各得0分。双方选定的各种 出法及相应的结果可由下表列出。双方 应取何种策略?
运筹学--第十二章 对策论
12.1 A、B两人各有1元、5角和1角的硬币各一枚。
在双方互不知道的情况下各出一枚硬币,并规定当和为奇数时,A赢得B所出硬币;当和为偶数时,B赢得A所出硬币。
试据此列出二人零和对策的模型,并说明该项游戏对双方是否公平合理。
12.2A、B两人在互不知道的情况下,各自在纸上写﹛-1,0,1﹜三个数字中的任意一个。
设A所写数字为s,B所写数字为t,答案公布后B付给A的钱为〔s(t-s)+t(t+s)〕元。
试列出此问题对A的支付矩阵,并说明该游戏对双方是否公平合理。
12.3 已知A、B两人对策时对A的赢得矩阵如下,求双方各自的最优策略及对策值。
(1)2 1 4 (2)―3 -2 6 2 0 3 2 0 2 -1 -2 0 5 -2 -412.4 在下列矩阵(a ij)3×3中确定p和q的取值范围,使得该矩阵在元素a22处存在鞍点。
(1) 1 q 6 (2) 2 4 5p 5 10 10 7 q6 2 3 4 p 612.5 A和B进行一种游戏。
A先在横坐标x轴的〔0,1〕区间内任选一个数,但不让B知道,然后B在纵坐标y的〔0,1〕区间内任选一个数。
双方选定后,B对A的支付为p(x,y)=0.5y2-2x2-2xy+3.5x+1.25y求A、B各自的最优策略及对策值。
12.6 证明下列矩阵对策具有纯策略解(其中字母为任意实数)(1) a b (2) a e a e a e a ec d b f b f f b f ba d c g g c c g g cc b12.7 下列矩阵为A、B对策时A的赢得矩阵,先尽可能按优超原则简化,再用图解法求A,B各自的最优策略及对策值。
(1)-3 3 0 2 (2) 2 4 0 -2-4 -1 2 -2 4 8 2 61 1 -2 0 -2 0 4 20 -1 3 -1 -4 -2 -2 012.8 用线性规划方法求解下列对策问题:(1) 3 -1 -3 (2)―1 2 1-3 3 -1 1 -2 2-4 -3 3 3 4 -330630712.9每行与每列均包含有整数1,…,m 的m ×m 矩阵称为拉丁方。
运筹学教材习题答案详解
B1:2.0
3
需要量(套)
200
150
问怎样下料使得(1)用料最少;(2)余料最少.
【解】第一步:求下料方案,见下表。
方案
一
二
三
四
五
六
七
八
九
十
十一
十二
十三
十四
需要量
B1:2.7m
2
1
1
1
0
0
0
0
0
0
0
0
0
0
300
B2:2m
0
1
0
0
3
2
2
1
1
1
0
0
0
0
450
A1:1.7m
0
0
1
0
0
1
0
2
1
0
3
2
1
0
(2)
【解】最优解X=(3/4,7/2);最优值Z=-45/4
(3)
【解】最优解X=(4,1);最优值Z=-10
(4)
【解】最优解X=(3/2,1/4);最优值Z=7/4
(5) 【解】最优解X=(3,0);最优值Z=3
(6)
【解】无界解。
(7)
【解】无可行解。
(8)
【解】最优解X=(2,4);最优值Z=13
【解】设x1、x2、x3分别为产品A、B、C的产量,则数学模型为
1.3建筑公司需要用6m长的塑钢材料制作A、B两种型号的窗架.两种窗架所需材料规格及数量如表1-23所示:
表1-23窗架所需材料规格及数量
型号A
型号B
每套窗架需要材料
长度(m)
对策论
Y X
马鞍面z=x /4马鞍面z=x2/4-y2/6
Y=0的平面上鞍点 Z 在Y=0的平面上鞍点 是z=f(0,y)的极大值点 z=f(0,y)的极大值点
Y X
Z
在X=0的平面上鞍点 X=0的平面上鞍点 z=f(0,y)的极小值点 是z=f(0,y)的极小值点
Y X
例12-3:对给定的矩阵对策 G= {S1,S2;A} 12S 1 = { α1 , α2 , α3 } {α 6 A= 1 8 5 4 5 S 2= { β 1 , β 2 , β 3 } {β 6 2 7
所以局中人I应首先考虑用α 所以局中人I应首先考虑用α 所能赢得 的最小, 的最小,然后在这些最小赢得中选择最 局中人I 大。局中人I可以保证赢得 max
i
min
j
aij
同样,局中人II可以保证局中人I的赢 II可以保证局中人 同样,局中人II可以保证局中人I 得不超过 min max aij
j i
自然条件对于双方 都是已知的。 都是已知的。 基本情况如下: 基本情况如下:从蜡包尔出发开往莱 城的海上航线有南北两条。 城的海上航线有南北两条。通过时间 均为3 均为3天。 气象预报表明:未来3天中,北 气象预报表明:未来3天中, 线阴雨,能见度差;而南线天气晴好, 线阴雨,能见度差;而南线天气晴好, 能见度好。 能见度好。 肯尼将军的轰炸机布置在南线的 机场, 机场,侦察机全天候进行侦察,但有 一定的搜索半径。
i j j I
上式蕴涵的思想是朴素自然的,可 上式蕴涵的思想是朴素自然的, 以概括为: 从最坏处着想, 以概括为:“从最坏处着想,去争 取最好的结果” 取最好的结果”
定义12 定义12-1:对给定的矩阵对策 12G
i
运筹学(胡运权第三版)绪论
3.《辞海》(1979年版)的解释是:运筹学“主 要研究经济活动与军事活动中能用数量来表达的、有 关运用、筹划与管理等方面的问题,根据问题的要求, 通过数学的分析与运算,作出综合性的合理安排,以 达到较经济较有效地使用人力物力。” 4.《中国企业管理百科全书》(1984年版)的解 释是:运筹学“应用分析、试验、量化的方法,对经 济管理系统中人、财、物等有限资源进行统筹安排, 为决策者提供有依据的最优方案,以实现最有效的管 理。”
齐王出马的对策有六种:
(上、中、下)、(上、下、中)、(中、上、下)、
①
②
③
(中、下、上)、(下、上、中)、(下、中、上)。
④
⑤
⑥
田忌的对策也同样有六种:
(上、中、下)、(上、下、中)、(中、上、下)、
a
b
e
c
(中、下、上)、(下、上、中)、(下、中、上)。
d
f
这样搭配起来就有 36种对赛的格局。
几个例子: 例1.田忌赛马例子 战国时期齐威王常邀武臣田忌赛马赌金,双方约
定每方出上马、中马、下马各一匹各赛一局,每 局赌注是黄金一千两。 由于田忌的马比齐王同等级的马都要略逊一筹, 而在头一轮的比赛中,双方都是用同等级的马进 行对抗,所以齐王很快赢了全部三场,得到了三 千两黄金。
2、图与网络分析(Graph Theory and Network Analysis)
工程设计中经常碰到研究各种管道、线路的通过
能力,以及仓库、设施的布局等问题。运筹学中把一
些研究的对象用节点表示,对象之间的联系用连线(边) 表示,这些点和边连接起来,就构成了所说的图。图 论是研究由节点和边所组成图形的数学理论和方法。 图是网络分析的基础,根据研究的具体问题,赋
对策论应用示例
对策论应用示例对策理论(Game Theory)现在广泛应用于军事、经济等领域。
对策论的主要分类大致如下:§1 对策论应用举例例1 齐王与田忌赛马(孙膑对策)传说齐威王与大臣田忌赛马,每人都以上等马、中等马、下等马比赛,三局两胜制,胜者得1千金。
齐王的同等马优于田忌的同等马,田忌总输。
后来军事家孙膑为田忌出主意:田忌用上等马赢齐王的中等马、用中等马赢齐王的下等马,最后以下等马输给齐王一局,这样田忌就以总分3:2获胜。
对局图如下:齐王的马田忌的马上等马上等马中等马中等马下等马下等马在这个对策中,双方对于对方的情况十分熟悉,事先也知道比赛规则,这在对策论中叫做双方全信息的对策。
另外,在这个对策中,一方用计谋和策略,另一方不用,这不是现代意义下的对策。
现代意义下的对策,对局双方都用计谋和策略,并且双方都选择对自己有利的策略,这在对策论中叫理智的局中人(经济对策中叫理性的消费者)。
例2 1943年2月,由于战争的失败,日本舰队打算从新不列颠岛撤退到伊里安岛(如图)。
美国西南太平洋空军奉命轰炸这支日本舰队。
北日本舰队的可能撤退航线有两条:南线与北线,航程都是3天。
气象预报:未来3天,北线阴雨、南线晴天。
日本人应该选择哪一条撤退航线呢?美军的选择是重点搜索的方向:(1)非重点搜索:派少量搜索飞机,发现目标后派大量飞机轰炸;(2)重点搜索:派大量搜索飞机,发现目标后再派大量飞机轰炸。
根据气象预报,未来3天,北线阴雨,能见度很差,不利于侦察飞机巡航侦察(二战时,主要依靠飞行员目测侦察);南线晴天,能见度好,有利于侦察机巡航侦察。
美军应该把搜索重点放在北边还是南边呢?表中第一行第一列的-2/3表示:日方若选择北线撤退,美军的重点搜索方向也在北线,日本舰队在3天中大约能安全行走一天,然后被美军侦察机发现,招来大批轰炸机,在未来2天被轰炸。
下面讨论双方应该选择的较好的策略。
日本方面:北边的损失向量(-2/3,-1/3)≥南边的损失向量(-2/3,-3/3),表示北线损失比南线小,日方司令官若是理智的决策者就应选北线作为航线。
对策论_运筹学
习题解答1. 已知矩阵博弈局中人I 的赢得矩阵如下,求最优纯策略及博弈值。
(1) ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡8354667565443494 (2) ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡------------21221405126331222210 解: (1) ()8695 35438354667565443494⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡ 所以),(13βα,V=5(2) 2- 3 2- 2 2 2562)2(1)2(214051263312)2(2)2(10----⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡------------所以 ),(31βα,),(51βα,),(33βα,),(53βα,V=-22. 甲乙两国进行乒乓球团体赛,每国由三个人组成一个队参加比赛。
甲国的人员根据不同的组合可组成4个队,乙国的人员可组成3个队,根据以往的比赛记解:62828276128184)2(3715---⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡------ 所以),(22βα,V=2 答: 双方应均派第2队出场3. 对任意一个m 行n 列的实数矩阵A=(a ij ),试证有下式成立ij mi n j ij nj m i a a ≤≤≤≤≤≤≤≤≤1111max min min max证:ijmi n j ij nj m i ijmi ij nj m i ijij nj a a a a j a a n j m i j i ≤≤≤≤≤≤≤≤≤≤≤≤≤≤≤≤≤∴≤∀∴≤≤≤≤≤∀11111111max min min max max min max ,min : 1,1,,有有4. 某城区有A 、B 、C 三个居民小区,分别居住着40%,30%,30%的居民,有两个公司甲和乙都计划在区内建造超市,公司甲计划建两个,公司乙计划建一个,每个公司都知道,如果在某个小区内设有两个超市,那么这两个超市将平分该区的消费,如果在某个小区只有一个超市,则该超市将独揽这个小区的消费。
对策论模型
9 7 y E ( X , Y ) ( x,1 x) 2 8 1 y
=8xy-6y-x+8 3 1 1 8( x )( y ) 7 = 4 8 4
3 1 这就是说,局中人分别以概率 X * ( , ) 选用1,2 时,至少 4 4 1 1 7 * 赢得 7 ,同理,局中人Ⅱ分别以概率Y ( , ) 选用策略1,2, 4 8 8 1 3 1 1 7 7 。但当 X * ( , ) 或 Y * ( , ) 时,则会受到更大的 至多损失 4 4 4 8 8 损失。
1.混合策略和混合局势
一般地, 设给定 S1 , S2 ; A, 令 X ( x1 , x 2 , , x m), Y ( y1 , y2 , , yn )
m m
S {X | x i 0; x i 1}, S {Y | y j 0; y j 1}
1
1 1 3 1
-1
1 1 1 3
A=
1 -1 1 1
-1 1
这是一个两人有限零和对策。
二、在纯策略下有解的矩阵对策的解法
1.解法的思想:双方都立足在不利的情况下争取最好的结果 ──最大最小原则。 例 求解矩阵对策 ={S1,S2;A},其中:
7 3 A 16 3 1 8 2 4 4 3 0 5
解:
1
1 7 2 3 3 16 4 3
i
2
1
3
min a ij
j
max aij
8 2 4 4 3 0 5 16 2 5
8 2 max ai j 2 i 3 3
*
min aij* 2
第12章决策分析
转折概率的求法是:
设p为某一自然状态的概率,则另一自然状态出现的概率
为1 p ,计算两个方案的期望收益值,并使之相等,此时解
得的概率值即为转折概率。
在上例中,不妨假设状态1 出现的概率为p,两个方
案的期望收益值分别为 E(S1) 1000 p (400 ) (1 p) E(S2) (300) p 2000 (1 p)
按照决策环境分类:
确定型:对未来情况可以获得精确、可靠的 数据
随机型:未来有几种可能的状态和相应后果, 其出现的概率可以预测
非确定型:未来可出现的状态和后果难以估 计
决策分析是为解决随机型和非确定型问题提供一 套推理方法和逻辑步骤。
根据决策问题的基本模式,可划分决策问题的 类型。其中依照不同标准所得到类型也不同,下面 四种类型是最基本和最常见的划分。
conflict analysis(冲突分析)。
决策分析框架
确定结构
评定后果
评定不确定因素
评价方案 灵敏度分析 选择方案
收集信息
决策分析框架
确定决策模型结构:确定决策过程的阶段、相应 的环境信息、各阶段的状态和备选方案以及他们 间的层次结构关系
评定后果:估计备选方案在不同环境状态下所付 出的代价和取得的收益后果值。衡量效益往往采 用效用值指标作为准则。
决策树法
描述多级决策(序列决策)的工具 “• ”表示决策节点,从它引出的分枝为方案枝,
分枝数量与方案数量相同,分枝上要注明方案名 称。 “Ο”表示状态节点,从它引出的分枝为状态分 枝或概率分枝,分枝数量与可能出现的自然状态 数量相同,分枝上要注明状态出现的概率。 决策节点反映决策者的谋略,状态节点反映其机 遇。 “△”表示结果节点,不同方案在各种状态下所 取得的结果(益损值),标注在结果节点的右端。
第十二章-对策论(运筹学讲义)课件
局中人2 出1指
5 -5
出2指 -5 5
局中人1从局中人2该如何选择策略,已获得利益?
-
3
例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在 不同的屋子里审讯。警察告诉他们: 如果两人都坦白,各 判刑8年;如果两人都抵赖,由于证据不充分,两人将各 判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者 立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯 都有两种策略: 坦白或抵赖。可以用一个矩阵表示两个嫌 疑犯的策略的损益
3.一局势对策的益损值: 局中人各自使用一个对策就形成了一 个局势,一个局势决定了各局中人的对策结果(量化)称 为该局势对策的益损值。
赢得函数(payoff function): 定义在局势上,取值为相应益 损值的函数
4. 纳什均衡: 纳什均衡指所有局中人最优策略组成的一种局势,
既在给定其他局中人策略的情况下,没有任何局中人有积
A
1
4
3
2
解因
m i a x m j in a ij 2 , m j in m i a x a ij 3
m a ixm jina ij m jinm a ixa ij
不符合鞍点条件, 故G的鞍点不存在。
例6 求解矩阵对策,其中: 解 容易得到
A 11
0 1
1 1
v a i * j * 1i * 1 ,2 ;j * 3
A
a
2
1
a22
a1m
a2
m
a
m
1
am2
amn
aij为局中人甲在局势
( i , j )下的赢得 -
9
“齐王赛马”是一个矩阵策略。
其中: 齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 },
对策论课后习题题目
对策论作业1对策论注意:作业请发至谭老师邮箱和zhouyany js @1.今有甲、乙两厂生产同一种产品,它们都想通过内部改革挖潜,获得更多的市场份额已知两厂分别都有三个策略措施,据预测,当双方采取不同的策略措施后两厂的市场占有份额变动情况如表所示:Table 1:``````````````````````甲厂策略甲厂产品市场份额变动乙厂策略β1β2β3α110-13α21210-5α36852.某企业决定由职工代表大会选举行政负责人,经提名产生候选人甲和乙。
他们根据企业的发展战略和群众关心的事业各自提出了企业改革的方案。
甲提出了四种:α1,α2,α3,α4;乙提出了了三种:β1,β2,β3.他们的参谋人员为使竞争对奔放有利,预先作了个民意抽样测验。
因各方提供的不同策略对选票吸引力不同。
测验选票经比较后差额如下表(单位:十张)所示:Table 2:H HH H H H H H H 甲a i j 乙β1β2β3α1-40-6α2324α3161-9α4-1173.(猜花色游戏问题)设有两个小孩问扑克牌花色游戏,游戏规定:由小孩甲每次从4种花色的牌中拿出一张牌给小孩乙猜,如果猜对花色,则甲付给乙三个小石子;否则,即小孩乙猜不对,则乙付给甲一个石子,试求解这个对策问题,即这两个小孩各应该采取什么对。
4.(餐馆的经营问题)设有两个相邻的餐馆都能做甜早点和咸早点,如果它们做的早点是一样的,则可能卖不出去而各亏本100元,如果两个餐馆做的早点不同,则做咸早餐的餐馆可以赚到400元,而做甜早餐的餐馆可以赚到200元.如果他们不协商,试问这两个餐馆各自的最优策略为何?5.(猜硬币问题)甲、乙两人玩猜硬币的游戏,要求二人各出一枚硬币,如果两个硬币都呈正面,或者反面,则甲得1分,同时乙付出1分;反之,甲付出1分,乙得1分。
试问甲和乙各自的最优策略是什么?6.(智猪争食问题)猪圈里有一大一小两头猪,猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈另一边的投食口就会落下少量的食物。
对策论三要素
对策论三要素
对策论是指在面对问题或挑战时,制定出明确的对策和计划,以应对种种可能出现的情况。
而对策论的三要素是指目标、方法和资源。
首先,对策论的第一个要素是目标。
制定明确的目标是对策论的基础。
只有清楚地知道自己要达成什么目标,才能更有针对性地制定出相应的对策。
比如,如果企业要提高销售额,那么制定的对策就应该围绕如何吸引更多的顾客、如何提高产品的市场竞争力等方面展开。
目标的明确性和可操作性对于制定对策至关重要。
其次,对策论的第二个要素是方法。
制定对策需要有清晰的方法和步骤。
这就需要对问题进行全面的分析和研究,以找出最有效的解决方法。
比如,如果一个政府部门要解决交通拥堵问题,就需要从道路规划、公共交通建设、交通管理等方面综合考虑,找出最适合的解决方法。
方法的科学性和实用性是对策论成功与否的关键。
最后,对策论的第三个要素是资源。
没有足够的资源,再好的对策也无法顺利实施。
资源包括人力、物力、财力等方面。
比如,一个组织要实施一个新的项目,就需要充足的人力资源、资金支持以及物质设备等。
只有足够的资源支持,对策才能得以有效实施。
总的来说,对策论的三要素——目标、方法和资源,是相辅相成、缺一不可的。
只有制定明确的目标,找出科学的解决方法,再加上充足的资源支持,对策才能最终取得成功。
在面对各种问题和挑战时,我们都可以运用对策论的三要素,制定出更加有效的解决方案。
运筹学教程
1、填空题(6分,每空1分) 2、选择题(20分,每题2分) 3、名词解释(18分,每题6分) 4、简答题(36分,每题12分) 5、论述题(20分)
绪论
一、运筹学释义与发展简史
二、运筹学的基本信念 三、 运筹学主要分支简介 四、 运筹学解决问题的方法步骤 五、进度安排与学习建议
他估计到齐王由于上一次的大获全胜,这一次是不 会轻易更改这种对策的。
这使得孙膑在对局前便把握了主动权,有的放矢地 制定了“退一步,进两步”的策略。
孙膑决定用自己的下等马和国王的上等马比赛,而 用自己的上等马和国王的中等马比赛,中等马和国 王的下等马比赛。
比赛开始,第一场国王的马以极大的优势取得了胜 利,但在二、三场中田忌的马都取得了胜利。这次 国王不但没赢,反而输了一千金。
这类问题的解决方法是:先根据问题要达到的目标选 取适当的变量,问题的目标通过用变量的函数形式表示(称 为目标函数),对问题的限制条件用有关变量的等式或不等 式表达(称为约束条件)。当变量连续取值,且目标函数和 约束条件均为线性时,称这类模型为线性规划的模型 。
例 求解线性规划问题
max z 2x1 3x2 ,
定每方出上马、中马、下马各一匹各赛一局,每 局赌注是黄金一千两。 由于田忌的马比齐王同等级的马都要略逊一筹, 而在头一轮的比赛中,双方都是用同等级的马进 行对抗,所以齐王很快赢了全部三场,得到了三 千两黄金。
田忌的军师孙膑得知后,便 替田忌出了一个主意: 用自己的下等马和国王的上等马比赛,而用自己 的上等马和国王的中等马比赛,中等马和国王的 下等马比赛。
比赛开始,第一场国王的马以极 大的优势取得了 胜利。国王没有料到田忌的马竟然如此不堪一击, 为此俯仰大笑,得意不已。但美景不长,在二、 三场中田忌的马都取得了胜利。这一轮国王不但 没 赢,反而输了一千金。
社会心理学[第十二章合作与竞争]山东大学期末考试知识点复习
第十二章合作与竞争一、合作与竞争概述(一)合作与竞争的概念不同主体(包括个体、群体)为实现共同利益或各自利益而进行的合作与实现自身利益而展开的竞争,是相互作用的两种基本形式.1.合作(cooperation)合作是指不同的个体为了共同的目标而协同活动,促使某种既有利于自己、又有利于他人的结果得以实现的行为或意向。
合作的结果是共享其利或各得其利。
合作是人类实践活动中相互作用的一种基本形式。
2.竞争(competition)竞争是指不同的个体为同一个目标展开争夺,促使某种只有利于自己的结果获得实现的行为或意向。
竞争的结果往往是优胜劣汰。
竞争是人类实践生活中相互作用的另一种基本形式。
(二)合作和竞争的类型1.合作的类型(1)按合作对象、目标的范围来分:广义的合作和狭义的合作;(2)按合作的层次来分:简单合作、复杂合作;(3)按合作的内容来分:经济合作、政治合作、文化合作、科技合作、军事合作等;(4)按合作的社会作用来分:正当的合作和不正当的合作;(5)按照合作主体来分:团体合作与个人合作;(6)按照合作的道德性来分:道德的合作和非道德的合作。
2.竞争的类型(1)按竞争对象、目标的范围来分:广义的竞争和狭义的竞争;(2)按照人的需要层次来分:生存竞争和发展竞争;(3)按竞争的内容来分:经济竞争、政治竞争、军事竞争、文化竞争、社会竞争;(4)按照竞争对人类社会的作用来分:文明的竞争和不文明的竞争;(5)按照竞争主题来分:团体竞争和个体竞争等。
(三)竞争与合作的辩证关系合作与竞争既对立又统一。
1.二者不能同时并存于同一主体的选择中。
针对某一利益目标,不同的主体选择了竞争的方式达成目标就不可能同时又选择合作的方式来达成目标.2.二者相互依存,相互转化,竞争中包含合作,合作中也包含着竞争。
人类永远不可能看到只有竞争没有合作或者只有合作没有竞争的局面,特别是在当今时代,二者之间的相互依赖、相互促进表现得更加普遍更加明显.总之,合作与竞争是相互联系辩证统一的.竞争存在于合作之中,合作以竞争为前提。
第十章---博弈论初步精选全文完整版
甲 (式乙)
p.61
p.42
A B
混合策略组合及其支付也就有无限多的可能。
q.31 C 4,6 7,3
乙
.q72 D 9,1 2,8 9
不存在纯策略均衡时的混合策略均衡3
• 条件混合策略:参与人在假定其他参与人按某一概率选择某一策略
的条件下设计的对自己而言具有相对优势的(即期望支付最大的)混合 策略,称为“条件混合策略”。
• 对乙而言,如果假定甲合作,那么乙合作的支付为6,比不合作的支付 多1,因此合作是甲合作条件下乙的条件策略;假定甲不合作,那么乙的 条件策略是也不合作,乙若合作支付只有1,不合作则可得到3。
• 条件策略组合:参与人以其他参与人选择某一策略为条件的条件策略与
作为它的条件的对方策略之间的组合,称为“条件优势策略组合”或
• 假q2=定1-(q1p代1,入p甲2)与、乙(各q自1,的q2期)望的支取付值表从达0到式1有无,限经多整可理能可,得把:p2=1-p1和 E甲= p1(7-10q1)+5q1+2(式1); E乙= 5q1(2p1-1)-7p1+8(式2)
• 每个参与人需要确定,在另一参与人为其混合策略选择某个概率值时, 己方混合策略的概率向量应怎样取值,才能使自己的期望支付最大。
e点的坐标是p1=0.5,q1=0.7,则纳什均衡 时p2=0.5,q2=0.3 。
q1 1
本题中混合策略的纳什均衡还可表示为:
((p1 , p2),(q1 ,q2) )= ((0.5 , 0.5),(0.7 , 0.3) )。 0.7 本题中,只有唯一的这个纳什均衡点。
1
q1<0.7
p1= [0,1] q1 = 0.7
运筹学教材习题答案详解
显然用料最少的方案最优。
1.4A、B两种产品,都需要经过前后两道工序加工,每一个单位产品A需要前道工序1小时和后道工序2小时,每一个单位产品B需要前道工序2小时和后道工序3小时.可供利用的前道工序有11小时,后道工序有17小时.
3
B1:2.0
3
需要量(套)
200
150
问怎样下料使得(1)用料最少;(2)余料最少.
【解】第一步:求下料方案,见下表。
方案
一
二
三
四
五
六
七
八
九
十
十一
十二
十三
十四
需要量
B1:2.7m
2
1
1
1
0
0
0
0
0
0
0
0
0
0
300
B2:2m
0
1
0
0
3
2
2
1
1
1
0
0
0
0
450
A1:1.7m
0
0
1
0
0
1
0
2
1
0
3
2
1
0
《运筹学》
第1章线性规划
第2章线性规划的对偶理论
第3章整数规划
第4章目标规划
第5章运输与指派问题
第6章网络模型
第7章网络计划
第8章动态规划
第9章排队论
第10章存储论
第11章决策论
第12章对策论
习题一
1.1讨论下列问题:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5
如果双方不存在侥幸心理,考虑到在零和对策中双方利益的根本对立,对方必然会设法
使自己的赢得尽可能的小,理性的选择就应该是从各自可能出现的最不利的情形中争取尽可
能好的结果。
局中人Ⅰ、Ⅱ的理性选择应该是策略 α2 和 β2,在此局势下局中人Ⅰ的赢得值和局中人 Ⅱ的损失值的绝对值相等,每一方所选择的策略都是针对对方所选策略的最优反应,即如果
第4页
对策现象的基本要素
1、对策行为和对策论 • 对策行为: 具有竞争和对抗性质的行为.
– 体育比赛 – 政治斗争 – 企业之间的竞争 • 对策论:
研究对策行为中斗争各方是否存在着最合理的行动 方案,以及如何找到这个合理方案的数学理论和方法。 需要建立对策模型。
第5页
对策现象的基本要素
➢ 局中人: 有权决定自己行动方案的参与者. 具有广义性 I={1,2,...,n}, n>=2.
第12页
矩阵对策的最优纯策略
问题:如何选择对自己最为有利的策略以谋取最大的赢得(或最小损失)。
【例 12.5】设有一矩阵对策 G S1,S2;A ,其中 S1={α1,α2,α3,α4},S2={β1,β2,β3},
2 1 6
A
3
2
4
6 2 7
3 0
a12 a22 am2
a1n
a2n amn
(12-3)
为局中人Ⅰ的赢得矩阵。由于对策为零和的,故局中人Ⅱ的赢得矩阵为-A。
当局中人Ⅰ、Ⅱ的策略集 S1, S2 及局中人Ⅰ的赢得矩阵 A 确定后,一个矩阵对策就给定
了。因此将矩阵对策表示为 G S1,S2;A.
15000
20000 20000
由
于
max i
min j
aij
min j
max i
aij
20000
a33
,故 对策的 值为-2000 0,局 势(α3,β3)
为该对策的解,即秋季贮煤 200 吨为采购员的最优纯策略,冬季用煤的实际费用为 20000 元。第16页 这是一个稳妥、保险的策略选择。
运筹学课件
运
筹
帷
对策论Βιβλιοθήκη 幄之中决 胜 千 里 之 外
第1页
对策论
• 对策论的基本概念 • 矩阵对策的基本理论 • 矩阵对策的解法 • 其他类型对策简介
第2页
对策论的基本概念
➢对策论的由来和发展历史 ➢ 对策现象的基本要素 ➢ 对策问题举例及对策的分类
第3页
对策论的由来和发展历史
在社会生活和经济、经常碰到各种各样具有竞争或利益相对抗的现象,研 究对抗或竞争现象的数学理论和方法,称为对策论。 20 世纪初数学家波雷尔(Borel)和策墨洛(E.Zermelo)开始用数学方 法研究对策现象,研究对象主要是日常生活中的一些游戏(如扑克、象棋 等),因而对策论在相当长的时间内发展缓慢。 冯• 诺依曼(Von Neumann)在 1928 年创立了二人零和对策理论,为对策 论的进一步发展奠定了基础。 1944 年冯•诺伊曼和摩根斯特恩(Morgenstern)合著的《对策论与经济 行为》一书的出版,标志着系统的对策理论的初步形成。 1994 年三位长期致力于对策论的理论和应用研究的学者纳什(John F Nash)、泽尔腾(Reinhard Selten)和海萨尼(John Harsanyi)共同获 得诺贝尔经济学奖,则更是对对策论地位和作用的最具权威性的肯定。 2005 年,以色列经济学家罗伯特·奥曼和美国经济学家托马斯·谢林获 得诺贝尔经济学 奖。罗伯特·奥曼提出的“重复博弈 ”分析,目前成为所 有社会科学的主流分支。托马斯·谢林提出了冲突局势理论,在上世纪 50 年代和 60 年代的冷战时期,该理论极大地影响了美国政府对核威慑的 态度。
策略 i 和 j 之所以被称为最优纯策略,是因为当一方采取上述策略时,若另
一方不采取相应的策略,他的利益就会受损。当对策存在鞍点时,理性的局中人 应采取自己的最优策略,使自己处于有利地位,双方的最优策略互为最优反应策
略,任何一方单独改变策略都不会使自己获益。因此,最优局势( i , j )具有
第10页
矩阵对策的基本理论
➢矩阵对策的最优纯策略 ➢ 矩阵对策的混合策略 ➢ 矩阵对策的基本定理
第11页
矩阵对策的最优纯策略
矩阵对策即为二人有限零和对策。 二人:参加对策的局中人有两个,用Ⅰ、Ⅱ分别表示两个局中人。 有限:每个局中人的策略集均为有限集,设局中人Ⅰ、Ⅱ的策略集分别为
SI 1,2 , ,m SII 1, 2 , , n 。
s 就是一个局势,全体局势的集合 S 可用各局中人策略集的笛卡尔积表示,
即
S S1 S2 Sn
当一个局势 s (s1, s2, sn ) 给定以后,就用一个数来表示局中人的得失(或
输赢),显然,这种“得失”或“输赢”是局势的函数,称为支付函数。通常
用正的数字表示局中人的赢得,负的数字表示局中人的损失。即对任一局势
s S ,局中人 i 得到一个赢得 Hi (s) 。显然 Hi (s) 是局势 s 的函数,称为第 i 个局
中人的赢得函数(支付函数)。
第7页
对策问题举例及对策的分类
【例 12.1】(囚徒困境)
嫌疑犯 A 和 B 因为一桩案件而被捕,两人被关在不同的屋子里接受审讯。警 察告诉他们:如果两人都坦白,各判刑 5 年;如果其中一人坦白,另一人抵赖, 则坦白者立即释放,抵赖者判刑 9 年;如果两人都抵赖,各判刑 1 年(或许因证 据不足)。这两名疑犯该如何选择?
稳定性,有时把这种局势称为均衡局势。 由例 12-5 知,
ai2 a22 a2 j , i 1,2,3,4; j 1,2,3.
第14页
矩阵对策的最优纯策略
定理 12.1 矩阵对策 G S1,S2;A有纯策略解的充分必要条件是:存在某
纯局势( i , j ),使得对一切 i=1,2,…,m,j=1,2,…,n 都有
这一问题可建立对策模型来分析,A 和 B 为两个局中人,每个局中人都有两个 策略:坦白或抵赖。共有四个局势:{坦白,坦白},{坦白,抵赖},{抵赖,坦白}, {抵赖,抵赖}。两个局中人的赢得函数可以用下表所示的一个双变量矩阵来表示, 表中的每一个数字单元格都有两个数字,其中第一个数字是疑犯 A 的赢得,第二 个数字是疑犯 B 的赢得(负数表示局中人在该局势下遭受损失)。
局中人Ⅱ为了使其所失最少只能选择 j ,可见,双方的最优策略互为最 优反应策略。
第15页
矩阵对策的最优纯策略
【例 12.6】某公司采购员在秋季决定冬季取暖用煤的贮量问题,已知在正常的气温条件下要 消耗 150 吨煤,在较暖与较冷的气温条件下要消耗 100 吨和 200 吨。假定冬季的煤价随天气 的寒冷程度而变化,在较暖、正常、较冷的气候条件下每吨煤价分别为 100 元,150 元和 200 元,设秋季时煤价为每吨 100 元。在没有关于当年冬季气温的准确气象预报的条件下,秋季 贮存多少吨煤能使单位的支出最小?
1,-1 3,-3 1,-1 1,-1
1,-1 1,-1 3,-3 -1,1
1,-1 1,-1 1,-1 3,-3
-1,1 1,-1 1,-1 1,-1
(下,中,上) 1,-1
1,-1
-1,1
1,-1
1,-1
3,-3
第9页
对策问题举例及对策的分类
对策的分类: 依据对策模型的三要素,通常的分类方式有: ⑴根据局中人的个数,分为二人对策和多人对策; ⑵根据局中人间是否允许合作,分为合作对策和非合作对策; ⑶根据局中人的策略集中的策略个数,分为有限对策和无限对策; ⑷根据各局中人的赢得函数的代数和是否为零,分为零和对策与非零和对策。
零和:在任意局势下,两个局中人的赢得之和总等于零,即双方的赢得互为相反数。
当局中人Ⅰ选定策略 ai 和局中人Ⅱ选定策略 j 后,就形成了一个局势 (ai , j ) .对任一
局势 (ai , j ) ,记局中人Ⅰ的赢得值为 aij (局中人Ⅱ的赢得为 aij ),并称
a11 A aam211
Ⅰ选择 α2,Ⅱ的最好选择就是 β2,反之亦然。局中人Ⅰ是按最小最大原则,局中人Ⅱ是按 最大最小原则选择各自的策略,这对双方来说都是一种最稳妥的行为。因此 α2 和 β2 分别为 局中人Ⅰ、Ⅱ的最优策略。
第13页
矩阵对策的最优纯策略
定义
12.1
设矩阵对策为 G
S1,S
2;A,其中
S 1
, 1
在众多的对策模型中,占有重要地位的是一类非合作对策模型,即所谓的二 人有限零和对策,又称矩阵对策。它是整个对策论的基础,无论是理论研究,还是 实际应用,都不能越过矩阵对策这个“第一道大门”。同时矩阵对策也是到目前为 止在理论研究和求解方法方面都比较完善的一类对策模型,而且这类对策的研究 方法和理论结果又是研究其它类型的对策模型的基础。因此,本章主要介绍矩阵 对策的理论和方法,对其它对策模型只作简要介绍。
,m ,S2
, 1
, n
,
A
aij
。若有
mn
max i
min j
aij
min j
max i
aij
ai j
v
(12-4)
则 v*称为对策 G 的值,策略 i 和 j 分别为局中人Ⅰ、Ⅱ的最优纯策略,局势
( i , j )为对策 G 的鞍点,也称为 G 在纯策略下的解。
假设: 局中人都是理智的,等智力的. ➢ 策略集:
– 策略: 可供局中人选择的一个实际可行的完整的行动 方案.
– 策略集:局中人所拥有的对付其它局中人的手段、方案 的集合。每局中人,都有自己的策略集,一般每一局 中人的策略集中至少应包括两个策略。