运筹学-第十二章二人有限非零和对策

合集下载

第四节二人的无限零和对策

第四节二人的无限零和对策

定理8.4.1设无限对策的支付函数 P(x, y) 是
在 x 0,1 ,y 0,1 上的连续函数,则
V1 =
11
max min P(x, y)dF(x)dG(y)
精品课程《运筹学》
F
G 00

第四节 二人的无限零和对策
11
V2
=
min G
max F
P(
x,
y)dF
(
x)dG(y)
存在并相等。式中 0 0 F(x) 与 G( y) 分别
x0 0,1 有 1 P(x0, y)dG*(y) < V
则 Pr x000
Hale Waihona Puke (2)F*(x) 为局中人I的最优策略,如果对某个
V 精品课程《运y0筹学0》,1 有 1 P(x, y0 )dF*(x) >
0
第四节 二人的无限零和对策
则 Pr y0 0
§4.2 凸对策 当单位正方形上连续对策的支付函数如果对于 其中一个变量来说是个凸函数,这种对策叫做 凸对策(或具凸支付函数的对策).
第四节 二人的无限零和对策
G*(y) I1 (y) 2
,F
*(x)
1 2
I0
(x)
1 2
I1(x)
定理8.4.2 设 P(x, y) 是在x 0,1 ,y 0,1上连续的支付
函数,F(x) 、G( y) 为局中人I、局中人Ⅱ的混合 策略,V 为对策的值。
(1)设G * ( y) 为局中人Ⅱ的最优策略,如果对某个
为局中人I、局中人Ⅱ的分布函数。
当支付函数为连续函数的无限对策称为 连续对策。
例8.4.1设连续对策的支付函数是
P(x, y) = (x y)2, x 0,1 ,y 0,1

运筹学12-2对策论

运筹学12-2对策论

3.矩阵对策的混合策略(续)
-- 优超原则:当局中人甲方的策略t被其它 策略所优超时,可在其赢得矩阵A中划去第t 行(同理,当局中人乙方的策略t被其它策 略所优超时,可在矩阵A中划去第t列)。 如此得到阶数较小的赢得矩阵A’,其对
应的矩阵对策
G’= { S1,S2,A’}与 G ={ S1,S2,A } 等价,即解相同。
17
再讨论“齐王赛马”
• “齐王赛马”的赢得矩阵A有 max min aij=-1 min max aij=3
i j j i
故需求混合策略,由于A中有非正元素, 可选k=2,令矩阵中每一元素加上k得到新的 正矩阵A’:
5 3 3 1 3 3 3 5 1 3 3 3 3 3 5 3 3 1 3 3 3 5 1 3 1 3 3 3 5 3 3 1 3 3 3 5
19
再讨论“齐王赛马”(续)
• 求乙方(田忌)最优策略的线性规划模型:
min Y1+Y2 +Y3 +Y4 +Y5 +Y6 s.t. 5Y1+3Y2 +3Y3 +3Y4 + Y5 +3Y6 1 3Y1+5Y2 +3Y3 +3Y4 +3Y5 + Y6 1 3Y1+ Y2 +5Y3 +3Y4 +3Y5 +3Y6 1 Y1+3Y2 +3Y3 +5Y4 +3Y5 +3Y6 1 3Y1+3Y2 +3Y3 + Y4 +5Y5 +3Y6 1 3Y1+3Y2 + Y3 +3Y4 +3Y5 +5Y6 1 Y1,Y2,Y3,Y4,Y5,Y6 0 可得两组解:(1/9,0,0,1/9,1/9,0)T, (1/18,1/18,1/18,1/18,1/18,1/18)T ,V’=3 于是,Y’=(1/3,0,0,1/3,1/3,0)T, Y’=(1/6,1/6,1/6,1/6,1/6,1/6)T V = V’-2 = 1 即田忌的最优混合策略值是输1千金

《管理运筹学》12-管理博弈

《管理运筹学》12-管理博弈
衬底1
管理博弈的基本概念与分类
例12-5 产量竞争问题
一、博弈的基本要素
解 企业A和B分别为两个局中人,它们的策略为各自的产量qi ϵ[0,∞)(i=1,2),每一方都有无穷多个策略。在局势(q1 + q2)下,局中人i的赢得函数为
衬底1
管理博弈的基本概念与分类
按局中人的数量:二人博弈和多人博弈; 按各局中人赢得函数的代数和是否为零:零和博弈与非零和博弈; 按局中人之间是否合作:合作博弈和非合作博弈; 按策略集中策略数目的有限和无限:有限博弈和无限博弈; 按局中人选择策略的先后顺序:静态博弈和动态博弈; 按博弈过程中对信息掌握的情况:完全信息博弈和不完全信息博弈。
采购员
自然状态
行最小
较暖
正常
较冷
采购100吨
-5
-7.75
-11
-11
采购150吨
-7.5
-7.5.
-10.5.
-10.5
采购200吨
-10
-10
-10
-10*
列最大值
-5
衬底1
管理博弈的基本概念与分类
例12-3 囚徒困境
一、博弈的基本要素
解 A和B为两个局中人,每个局中人都有两个策略:坦白或不坦白。按照各局中人的策略组合,共有四个局势:{坦白,坦白},{坦白,不坦白},{不坦白,坦白},{不坦白,不坦白}。两个局中人的赢得函数可以用表12-2所示的一个双变量矩阵来表示。
β1
β2
β3
4
4
10
4
2
3
1
1
6
5
7
5*
6
5*
10
表12-4 具有鞍点的矩阵博弈的赢得矩阵

大连理工大学智慧树知到“物流管理”《运筹学》网课测试题答案5

大连理工大学智慧树知到“物流管理”《运筹学》网课测试题答案5

大连理工大学智慧树知到“物流管理”《运筹学》网课测试题答案(图片大小可自由调整)第1卷一.综合考核(共15题)1.最短路问题可以采用狄克斯屈标号法进行求解。

()A.正确B.错误2.确定主观概率常用的方法是专家咨询法。

()A.正确B.错误3.一个连通无圈简单图称为树。

()A.正确B.错误4.最大流问题是一个特殊的线性规划问题。

()A.正确B.错误5.若原问题和对偶问题都有可行解,则它们都有最优解,且它们的最优解的目标函数值相等。

()A.正确B.错误6.数学规划的研究方向,包括线性规划、非线性规划、对偶规划、几何规划、整数规划、动态规划及多目标规划等。

()A.正确B.错误7.若线性规划问题有最优解,则要么最优解唯一,要么有无穷多最优解。

()A.正确B.错误8.作业的最早结束时间是指它的最早开始时间加上该项作业的计划时间。

()A.正确B.错误9.无概率决策问题始终依据决策者对自然状态的看法以及对待风险的态度,而不可能完全客观。

()A.正确B.错误10.最大流问题可以采用福特—富尔克逊标号法等方法进行求解。

()A.正确B.错误11.满足目标要求的可行解称为最优解。

()A.正确B.错误12.在二人有限对策中,若甲乙双方的赢得总和不全为零,则称为二人有限非零和对策。

()A.正确B.错误13.决策变量、目标函数和约束条件是数学规划模型的三个要素,若目标函数和约束条件均为线性的数学规划问题称为非线性规划。

()A.正确B.错误14.求最小树问题时,任选一圈,去掉该圈中的一条最小边,重复至无圈为止,此时得到的图就是最小树。

()A.正确B.错误15.()是指决策者在情况不明时,对自然状态抱最乐观的态度,从最好的自然状态出发,先从各方案中挑选最大收益值,然后从这些最大收益值中挑选出最优决策方案。

A.乐观准则B.折中准则C.等可能准则D.后悔值准则第2卷一.综合考核(共15题)1.线性规划问题凸集的顶点个数一定是有限的。

《运筹学》ch12博弈论

《运筹学》ch12博弈论

1的最优 策略(行)
目录
博弈论的基本概念 纯策略矩阵博弈
混合策略矩阵博弈
其它类型博弈简介(多人博弈、非零和博弈)
基本概念
设矩阵博弈G {S1, S2 , A} 的支付矩阵是 A (aij )mn ,其中S1 {A1, , Am}
S2 {B1, , Bn }
多人非合作博弈
(1)局中人集合 I {1, , n} ; (2)每个局中人i有一个纯策略的有限集:
Si
{s(i)} {s1i , s2i ,
,
si mi
}
i 1, , n
Hale Waihona Puke (3)每个局中人i有一个支付函数u i ,i 1, , n 。
记为此博弈为G {I , Si ,ui }。
第十二章 博弈论
教学要求:
了解博弈论的基本分析方法 掌握二人零和博弈模型和求解方法 会运用该模型分析一些经济和管理问题
目录
博弈论的基本概念 纯策略矩阵博弈 混合策略矩阵博弈 其它类型博弈简介(多人博弈、非零和博弈)
目录
博弈论的基本概念
纯策略矩阵博弈 混合策略矩阵博弈 其它类型博弈简介(多人博弈、非零和博弈)
同越理小,越若好局,中所人以,2选局择中策人略2可B j以,选则择他至B j ,多使失他去失m1ia去mx a的ij 。不因大局于中1m ji人nm m21i希amx望aij aij
鞍点:如果存在 i*, j* 使支付矩阵 (aij ) 的元素满足:
max
1im
min
1 jn


动态博弈 微分博弈
最常见
目录
博弈论的基本概念

管理运筹学期末复习资料【韩伯棠】

管理运筹学期末复习资料【韩伯棠】

运筹学(Operational Research)复习资料第一章绪论一、名词解释1.运筹学:运筹学是应用分析、试验、量化的方法,对经济管理系统中的人力、物力、财力等资源进行统筹安排,为决策者提供有依据的最优方案,以实现最有效的管理。

二、选择题1.运筹学的主要分支包括(ABDE )A图论B线性规划C非线性规划D整数规划E目标规划2. 最早运用运筹学理论的是( A )A . 二次世界大战期间,英国军事部门将运筹学运用到军事战略部署B . 美国最早将运筹学运用到农业和人口规划问题上C . 二次世界大战期间,英国政府将运筹学运用到政府制定计划D . 50年代,运筹学运用到研究人口,能源,粮食,第三世界经济发展等问题上第二章线性规划的图解法一、选择题/填空题1.线性规划标准式的特点:(1)目标函数最大化(2)约束条件为等式(3 决策变量为非负(4 ) 右端常数项为非负2. 在一定范围内,约束条件右边常数项增加一个单位:(1)如果对偶价格大于0,则其最优目标函数值得到改进,即求最大值时,最优目标函数值变得更大,求最小值时最优目标函数值变得更小。

(2)如果对偶价格小于0,则其最优目标函数值变坏,即求最大值时,最优目标函数值变小了;求最小值时,最优目标函数值变大了。

(3)如果对偶价格等于0,则其最优目标函数值不变。

3.LP模型(线性规划模型)三要素:(1)决策变量(2)约束条件(3)目标函数4. 数学模型中,“s·t”表示约束条件。

5. 将线性规划模型化成标准形式时,“≤”的约束条件要在不等式左端加上松弛变量。

6. 将线性规划模型化成标准形式时,“≥”的约束条件要在不等式左端减去剩余变量。

7.下列图形中阴影部分构成的集合是凸集的是A【解析】:如何判断是凸集?凸集:两点之间连线在图内凹集:两点之间连线在图外8. 线性规划问题有可行解且凸多边形无界,这时CA没有无界解 B 没有可行解 C 有无界解 D 有有限最优解9. 对于线性规划问题,下列说法正确的是( D )A. 线性规划问题可能没有可行解B. 在图解法上,线性规划问题的可行解区域都是“凸”区域C. 线性规划问题如有最优解,则最优解可在可行解区域顶点上到达D. 上述说法都正确第三章线性规划问题的计算机求解一、名词解释1.相差值:相应的决策变量的目标系数需要改进的数量,使得决策变量为正值。

大工19春《运筹学》在线作业123参考答案

大工19春《运筹学》在线作业123参考答案

大工19春《运筹学》在线作业123参考答案大工19春《运筹学》在线作业1数学规划的研究对象为()。

A.数值最优化问题B.最短路问题C.整数规划问题D.最大流问题正确答案:A运筹学的基本特点不包括()。

A.考虑系统的整体优化B.多学科交叉与综合C.模型方法的应用D.属于行为科学正确答案:D()是解决多目标决策的定量分析的数学规划方法。

A.线性规划B.非线性规划C.目标规划D.整数规划正确答案:C线性规划问题中决策变量应为()。

A.连续变量B.离散变量C.整数变量D.随机变量正确答案:A数学规划模型的三个要素不包括()。

A.决策变量B.目标函数C.约束条件D.最优解正确答案:D数学规划的应用极为普遍,它的理论和方法已经渗透到自然科学、社会科学和工程技术中。

T.对F.错正确答案:A存储论的对象是一个由补充、存储和需求三个环节构成的现实运行系统,且以存储为中心环节,故称为存储系统。

T.对F.错正确答案:A满足目标要求的可行解称为最优解。

T.对F.错正确答案:A运筹学是运用数学方法,对需要进行管理的问题统筹规划,为决策机构进行决策时提供以数量化为基础的科学方法。

T.对F.错正确谜底:A线性规划的建模是指将用语言文字描述的应用问题转化为用线性规划模型描述的数学问题。

T.对F.错正确答案:A在国际上,通常认为“运筹学”与“管文科学”是具有相同或附近涵义。

T.对F.错正确谜底:A整数规划问题中的整数变量可以分为一般离散型整数变量和连续型整数变量。

T.对F.错正确答案:B线性规划数学模型的三要素包括目标函数、约束条件和解。

T.对F.错正确谜底:B基本解的概念适用于所有的线性规划问题。

T.对F.错正确谜底:B线性规划问题的可行解是满足约束条件的解。

T.对F.错正确谜底:A存储策略是决定多长时间补充一次货物以及每次补充多少数量的策略。

T.对F.错正确谜底:A线性规划的最优解是指使目标函数达到最优的可行解。

T.对F.错正确答案:A线性规划的求解方法包括图解法、纯真形法、椭球法、内点法等。

管理运筹学期末复习资料【韩伯棠】

管理运筹学期末复习资料【韩伯棠】

运筹学(Operational Research)复习资料第一章绪论一、名词解释1.运筹学:运筹学是应用分析、试验、量化的方法,对经济管理系统中的人力、物力、财力等资源进行统筹安排,为决策者提供有依据的最优方案,以实现最有效的管理。

二、选择题1.运筹学的主要分支包括(ABDE )A图论B线性规划C非线性规划D整数规划E目标规划2. 最早运用运筹学理论的是( A )A . 二次世界大战期间,英国军事部门将运筹学运用到军事战略部署B . 美国最早将运筹学运用到农业和人口规划问题上C . 二次世界大战期间,英国政府将运筹学运用到政府制定计划D . 50年代,运筹学运用到研究人口,能源,粮食,第三世界经济发展等问题上第二章线性规划的图解法一、选择题/填空题1.线性规划标准式的特点:(1)目标函数最大化(2)约束条件为等式(3 决策变量为非负(4 ) 右端常数项为非负2. 在一定范围内,约束条件右边常数项增加一个单位:(1)如果对偶价格大于0,则其最优目标函数值得到改进,即求最大值时,最优目标函数值变得更大,求最小值时最优目标函数值变得更小。

(2)如果对偶价格小于0,则其最优目标函数值变坏,即求最大值时,最优目标函数值变小了;求最小值时,最优目标函数值变大了。

(3)如果对偶价格等于0,则其最优目标函数值不变。

3.LP模型(线性规划模型)三要素:(1)决策变量(2)约束条件(3)目标函数4. 数学模型中,“s·t”表示约束条件。

5. 将线性规划模型化成标准形式时,“≤”的约束条件要在不等式左端加上松弛变量。

6. 将线性规划模型化成标准形式时,“≥”的约束条件要在不等式左端减去剩余变量。

7.下列图形中阴影部分构成的集合是凸集的是A【解析】:如何判断是凸集?凸集:两点之间连线在图内凹集:两点之间连线在图外8. 线性规划问题有可行解且凸多边形无界,这时CA没有无界解 B 没有可行解 C 有无界解 D 有有限最优解9. 对于线性规划问题,下列说法正确的是( D )A. 线性规划问题可能没有可行解B. 在图解法上,线性规划问题的可行解区域都是“凸”区域C. 线性规划问题如有最优解,则最优解可在可行解区域顶点上到达D. 上述说法都正确第三章线性规划问题的计算机求解一、名词解释1.相差值:相应的决策变量的目标系数需要改进的数量,使得决策变量为正值。

运筹学--第十二章 对策论

运筹学--第十二章 对策论

12.1 A、B两人各有1元、5角和1角的硬币各一枚。

在双方互不知道的情况下各出一枚硬币,并规定当和为奇数时,A赢得B所出硬币;当和为偶数时,B赢得A所出硬币。

试据此列出二人零和对策的模型,并说明该项游戏对双方是否公平合理。

12.2A、B两人在互不知道的情况下,各自在纸上写﹛-1,0,1﹜三个数字中的任意一个。

设A所写数字为s,B所写数字为t,答案公布后B付给A的钱为〔s(t-s)+t(t+s)〕元。

试列出此问题对A的支付矩阵,并说明该游戏对双方是否公平合理。

12.3 已知A、B两人对策时对A的赢得矩阵如下,求双方各自的最优策略及对策值。

(1)2 1 4 (2)―3 -2 6 2 0 3 2 0 2 -1 -2 0 5 -2 -412.4 在下列矩阵(a ij)3×3中确定p和q的取值范围,使得该矩阵在元素a22处存在鞍点。

(1) 1 q 6 (2) 2 4 5p 5 10 10 7 q6 2 3 4 p 612.5 A和B进行一种游戏。

A先在横坐标x轴的〔0,1〕区间内任选一个数,但不让B知道,然后B在纵坐标y的〔0,1〕区间内任选一个数。

双方选定后,B对A的支付为p(x,y)=0.5y2-2x2-2xy+3.5x+1.25y求A、B各自的最优策略及对策值。

12.6 证明下列矩阵对策具有纯策略解(其中字母为任意实数)(1) a b (2) a e a e a e a ec d b f b f f b f ba d c g g c c g g cc b12.7 下列矩阵为A、B对策时A的赢得矩阵,先尽可能按优超原则简化,再用图解法求A,B各自的最优策略及对策值。

(1)-3 3 0 2 (2) 2 4 0 -2-4 -1 2 -2 4 8 2 61 1 -2 0 -2 0 4 20 -1 3 -1 -4 -2 -2 012.8 用线性规划方法求解下列对策问题:(1) 3 -1 -3 (2)―1 2 1-3 3 -1 1 -2 2-4 -3 3 3 4 -330630712.9每行与每列均包含有整数1,…,m 的m ×m 矩阵称为拉丁方。

有限的二人非零和对策

有限的二人非零和对策
V = E2(x, y)
C(4,4) A(1,2)
B(1,2)
图8.5.3
D(8,3)
U = E1(x, y)
精品课程《运筹学》
第五节 有限的二人非零和对策
其中CD 线段上点既不被其他点共同优超,因 而其构成 的集合 B = {(u , v ) u + 4v = 20,4 ≤ u ≤ 8} 为协商集。在这个集合中找出能使 (u−10)(v− 5) 3 2 达到最大的点 ,要求 u + 4v = 20 ,解之知 (6 2 ,3 1)是其唯一的谈判解。 3
精品课程《运筹学》
第五节 有限的二人非零和对策
例8.5.1夫妇爱好问题. 一对夫妇,打算外出欢度周末。丈夫(局中人I) 喜欢看足球赛,妻子(局中人Ⅱ)喜欢看芭蕾舞。 但必须采取同一行动,一同外出娱乐。两人赢得 (支付)矩阵为
2 − 1 A= −1 1
1 −1 B= −1 2
3
精品课程《运筹学》
H =
{(U , V )U
=
∑∑
2
2
j =1 i =1
Pij a ij , V =
∑∑
2
2
j =1 i =1
Pij b ij , Pij ≥ 0 , ∑ Pij = 1
i, j
2
}
精品课程《运筹学》
第五节 有限的二人非零和对策
此为赢得区域,其为纯局势下赢得的点为顶点的 凸多边形 。 定义8.5.3 若两对赢得
第五节 有限的二人非零和对策
§5.1 非零和对策的模型 §5.2 求平衡解的 字形图解法 §5.3 有限二人合作型对策
精品课程《运筹学》
第五节 有限的二人非零和对策

天津大学《运筹学》在线作业一-02

天津大学《运筹学》在线作业一-02

《运筹学》在线作业一
对于确定型决策问题,下列说法错误的是()
A:确定型决策就是指在知道某个自然因素必然发生的前提下所作的决策
B:当计算成本或费用时,“选优”原则是取损益值最小的方案
C:当计算利润或收益时,“选优”原则是取损益值最小的方案
D:确定性决策除了满足一般决策问题的四个条件外,还需要加一个条件:只存在一个确定的自然因素
参考选项:C
某咨询公司要解答“筹划一个新超市应设置多少个收银台才合适”的问题,应选择
A:同行类比方法
B:模拟方法
C:数学规划方法
D:马尔柯夫分析方法
参考选项:B
可行流应满足的条件是()
A:容量条件
B:平衡条件
C:容量条件和平衡条件
D:容量条件或平衡条件
参考选项:C
以下叙述不是泊松流具备的条件的是()
A:无后效性
B:无记忆性
C:平稳性
D:普通性
参考选项:B
资源的影子价格是一种()
A:机会成本
B:市场价格
C:均衡价格
D:实际价格
参考选项:A
线性规划可行域的顶点一定是( )
A:基本可行解
B:非基本解
C:非可行解
1。

运筹学—第十二章 对策论

运筹学—第十二章 对策论

第4页 页பைடு நூலகம்
第3页 页
对策现象的基本要素
1、对策行为和对策论 、 • 对策行为 具有竞争和对抗性质的行为 对策行为: 具有竞争 对抗性质的行为 竞争和 性质的行为. – 体育比赛 – 政治斗争 – 企业之间的竞争 • 对策论 对策论: 研究对策行为中斗争各方 对策行为中斗争各方是否存在着最合理的行动 研究对策行为中斗争各方是否存在着最合理的行动 方案,以及如何找到这个合理方案的数学理论和方法。 如何找到这个合理方案的数学理论和方法 方案,以及如何找到这个合理方案的数学理论和方法。 需要建立对策模型。 需要建立对策模型。
对策论
• 对策论的基本概念 • 矩阵对策的基本理论 • 矩阵对策的解法 • 其他类型对策简介
第1页 页
对策论的基本概念
对策论的由来和发展历史 对策现象的基本要素 对策问题举例及对策的分类
第2页 页
对策论的由来和发展历史
济、 益相对抗的现象, 在社会生活和经 济 、经常碰到各种各样具有竞争或利 益相对抗的现象 ,研 象的数学理论和方法, 称为对策 论。 究对抗或竞争现 象的数学理论和方法 , 称为 对策 论 。 世纪初数 学家波雷尔 波雷尔( el)和策墨洛( Zermelo) 20 世纪初 数 学家 波雷尔( Bor el )和策墨洛 ( E .Zermelo ) 开始用数学方 法研究对策现象, 些游戏( 如扑克、 法研究对策现象 ,研究对象主要是日常生活中的一 些游戏( 如扑克 、象棋 ,因而对策 论在相当长的时间内发展缓慢。 等 ) 因而对策 论在相当长的时间内发展缓慢 。 , 诺依曼( mann) 冯 • 诺依曼( Von Neu mann )在 1928 年创立了二人零和对策理论 ,为对策 奠定了基础。 论的进一步发展 奠定了基础 。 1944 年 冯•诺伊曼和摩根 斯特恩( Morgenste rn) 合著的《 对策 论与经济 冯• 斯特恩 ( rn) 合著的 《 行为》 版, 标志着系统的对策理论的初 步形成。 行为 》 一书的出 版 , 标志着系统的 对策理论的初 步形成 。 者纳 1994 年 三 位 长 期致 力 于对 策 论 的理 论 和应 用 研 究的 学 者 纳 什 ( John F Nash) 泽尔腾( Selten) i) Nash ) 泽尔腾 ( Reinhard Selten ) 和海萨尼 ( John Harsany i ) 共同获 、 奖, 的最具权威性的肯定。 得诺贝尔经济学 奖 , 则更是对对策论地位和作用 的最具权威性的肯定 。 罗伯特· 奥曼和美 国经济学家托马斯 谢林获 2005 年 , 以色列经济学家 罗伯特 · 奥曼 和美 国经济学家 托马斯 · 谢林 获 奖。罗伯特· 奥曼提出的“ 分析, 得诺贝尔经济学 奖 。罗伯特 · 奥曼提出的 “ 重复博弈 ” 分析 ,目前成为所 分支。 斯· 有 社会 科学的 主流 分支 。 托马 斯 · 谢 林提 出了冲 突局势 理论 , 在上 世纪 年代的冷战时期, 50 年代和 6 0 年代的冷战时期 ,该理论极大地影响了美国政 府对核威慑的 态度。 态度 。

运筹学12-1对策论

运筹学12-1对策论
第十二章 对策论
对策:具有对抗性质的问题。 对策:具有对抗性质的问题。在竞争中寻找有利 于自己的策略。 于自己的策略。 对策论:竞争中的决策论。 对策论:竞争中的决策论。
前一页
后一页
退出
§12.1 对策论的基本Байду номын сангаас念
一、引例
1) 猜硬币:甲、乙各出示一枚硬币,如果两个 猜硬币: 乙各出示一枚硬币, 硬币都呈正面或者反面,甲得1分 硬币都呈正面或者反面,甲得 分,同时乙损 失1分,反之,甲损失 分,乙得 分。 分 反之,甲损失1分 乙得1分
前一页 前一页 后一页 退出 退 出
1 2 111 解之, 解之,得到 X = ( ,0, ),Y = ( , , ) 7 7 777 3 3 3 ∑ xi = ∑ y j = 7 i =1 j =1 1 7 V= 3 = 则原矩阵对策的值, 则原矩阵对策的值, 3 最优混合策略为: 最优混合策略为: ∑ xi
前一页
后一页
退出
§12.1 对策论的基本概念
二、基本要素: 基本要素: 1.局中人:参与对抗的各方; 局中人: 局中人 2.策略集:局中人选择对付其它局中人的行动方 策略集: 策略集
案称为策略。 某局中人的所有可能策略全体称为策略集;
3.收益函数:当每一个局中人都选定了一个策略 收益函数: 收益函数
后一页
退出 退 出
i j j i
成立的充分必要条件是:存在局势(i ), 成立的充分必要条件是:存在局势(i*,j*),使得
aij* ≤ ai * j* ≤ ai * j ( i = 1,...m , j = 1,...n)
前一页 前一页
后一页
退出 退 出
A} 定义9.1 对于矩阵对策 Γ = { S1 , S 2 ,,如果存在 定义 局势(i 局势 *,j*),使得 , aij* ≤ ai * j* ≤ ai * j ( i = 1,...m , j = 1,...n)

第十二章-对策论(运筹学讲义)课件

第十二章-对策论(运筹学讲义)课件

局中人2 出1指
5 -5
出2指 -5 5
局中人1从局中人2该如何选择策略,已获得利益?
-
3
例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在 不同的屋子里审讯。警察告诉他们: 如果两人都坦白,各 判刑8年;如果两人都抵赖,由于证据不充分,两人将各 判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者 立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯 都有两种策略: 坦白或抵赖。可以用一个矩阵表示两个嫌 疑犯的策略的损益
3.一局势对策的益损值: 局中人各自使用一个对策就形成了一 个局势,一个局势决定了各局中人的对策结果(量化)称 为该局势对策的益损值。
赢得函数(payoff function): 定义在局势上,取值为相应益 损值的函数
4. 纳什均衡: 纳什均衡指所有局中人最优策略组成的一种局势,
既在给定其他局中人策略的情况下,没有任何局中人有积
A
1
4
3
2
解因
m i a x m j in a ij 2 , m j in m i a x a ij 3
m a ixm jina ij m jinm a ixa ij
不符合鞍点条件, 故G的鞍点不存在。
例6 求解矩阵对策,其中: 解 容易得到
A 11
0 1
1 1
v a i * j * 1i * 1 ,2 ;j * 3
A
a
2
1
a22
a1m
a2
m
a
m
1
am2
amn
aij为局中人甲在局势
( i , j )下的赢得 -
9
“齐王赛马”是一个矩阵策略。
其中: 齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 },

运筹学5-5

运筹学5-5
4. 混合策略 Nash 均衡:
m n * * S I x xi 0, xi 1, S II y y j 0, y j 1, i 1 j 1
如混合策略 ( x* , y * )满足
* xA( y * )T x* A( y * )T , x* By x* B( y * )T , x S I* , y S II
称 ( x* , y * ) 为一个混合策略Nash 均衡.
5. 非零和对策复杂,求解难度大,但做Nash 均衡 研究的学者获得多次诺贝尔经济奖.
以 S I , S II ; ( A, B)表示两人有限非零和对 策.
3. 非零和对策的解
纳什(Nash)均衡
如 S I , S II * S II , 则称局势 ( i* , j* ) 是一个纳什均衡.
5.5 两人有限非零和对策简介
1. 在两个局中人的对策中,如对于每一局势, 两局中人的赢得之和不一定等于零,称之 为非零和对策. 2. 两人有限非零和对策数学模型:
局中人 I 的纯策略集 S I 1 ,, m , 局中人 II 的纯策略集S II 1 ,, n ,
A (aij ) mn 和 B (bij ) mn 分别为 I 和 II 的赢得矩阵 .

运筹学12对策论

运筹学12对策论
《运筹学课程建设组》 管理科学与工程学院
26
(2)策略集
• 局中人选择对付其它局中人的行动方案 称为策略;某局中人的所有可能策略全 体称为策略集;
(3)一局势对策的益损值
局中人各自使用一个对策就形成了一个 局势,一个局势决定了各局中人的对策 结果,称为该局势对策的益损值。
《运筹学课程建设组》 管理科学与工程学院
《运筹学课程建设组》
管理科学与工程学院
1
§1 引论
为了对什么是博弈论以及博弈包括哪些 类型等问题有一些更清晰的理解和认识,本 节先介绍几个典型的简单博弈问题实例,并 对它们作初步的分析。其实博弈本身就如这 些实例一样,并不像人们通常理解的那样深 奥、复杂,当然,要想完全弄懂它,也的确 需要下一番功夫。
管理科学与工程学院
4
表12-1中盖硬币者和猜硬币者为本博弈 的两个博弈方,它们各有正面和反面两种可 选择的情况(策略)。由于每一方都不会让 对方在选择之前知道自己的选择(当然也不 可能提前知道),因此,此博弈可看作两博 弈方是同时作决策的。收益矩阵中数组元素 表示在所处行列对应的两博弈方的策略组合 下双方各自的收益,其中前一数字表示盖硬 币者的收益,后一数字表示猜硬币者的收益。
27
(4)行动 ACTIONS OR MOVES
• 参与人在博弈的某个时点的决策变量。(坦白) N个参与人的行动的有序集称为行动组合(坦 白,抵赖)。 行动的顺序 • 对于博弈的结果非常重要。有关静态和动态博 弈的区分就是基于行动的顺序做出的。 • 同样的行动集合,行动的顺序不同,每个参与 人的最有决策就不同,博弈的结果也不同。尤 其在不完全信息博弈中,后行动者依赖观察先 行动者的行动来获取信息。
《运筹学课程建设组》 管理科学与工程学院

运筹学第十二章二人有限非零和对策

运筹学第十二章二人有限非零和对策


y1
0 y1 1
1
图示
1 2
0 x1 1 y1 0 0 x1 1
0
1
x1
y1
1
0
1
x1
y1
3
4
y1 1
1
0 x1 1
0
1
x1
y1 1, 0 x1 1 0 y1 1, x1 0
y1
1
0
1
x1
y1
5
B1 0 B2 0 B1 0 B2 0 B1 0 B2 0 B1 0 B2 0 B1 0 B2 0
0
1
x1
6 7
8 9
x1 0,
y1
1
A2 A1
0
1
x1
y1
1
A2 A1
0
1
y1
1
x1
x1 1, 0 y1 1
0
y1
1
x1
x1 0, 0 y1 1
1
0
1
x1
条件序号
条件
B1 0 B2 0 B1 0 B2 0 B1 0 B2 0 B1 0 B2 0
丈夫的解: 4 x1 0, 0 y1 5 4 x1 1, y1 1 5 4 0 x1 1, y1 5 妻子的解: 1 y1 0, 0 x1 5 1 0 y1 1, x1 5 1 y1 1, x1 1 5
y1
4 5
y1
1 1
4 5 1 5
0 y1 1, x1 0 y1 0, 0 x1 1
B 0 x1 2 B B2 1 0 y1 1, x1 B1 B2 y1 1 y1 1, B1 B2 x1 1 y1 0, B1 B 0 y1 1, x1 2 B1B y1 1, 0 x1 2 B1

运筹学:chap12_对策论 (简)

运筹学:chap12_对策论 (简)

上策与上策均衡
上策:无论其它局中人如何选择都使自己利益 极大化的策略。
上策均衡:对策的各局中人都有一个上策,各 自选择自己的上策就达到了均衡状态。
囚犯困境
两个嫌疑犯涉嫌一大案被警官拘留,并被分别进行审讯。 根据法律,如果两人均认罪,则每人将各判刑7年;如 果两人均不认罪,根据已掌握的证据,则每人将各判刑 1年;如果只有一人认罪,则认罪者将被宽大释放,不 认罪者则将判刑9年。
S S1 S2 Sn
赢得函数(支付函数)
对于任意一个局势s,应该为每一个局中人i规定一个赢得值
Hi (s) ,称为局中人i的赢得函数。
个人的赢得函数不仅依赖于自己的选择,而且依赖于他 人的选择;
个体的最优选择是他人选择的函数。
对策现象举例---田忌赛马
战国时期,齐王提出要与田忌赛马,双方约定: 1. 从各自的上、中、下三个等级的马中各选一匹
囚犯A
认罪 不认罪
囚犯B
认罪 -7,-7 -9,0
不认罪 0,-9 -1,-1
囚犯困境决策树
认罪 认罪
0,-9
认罪
-9,0
不认罪
-1,-1
囚犯困境引发的思考
➢经济学的经典理论:个体利益的极大化必 然导致整体利益的提高,个体理性与整体理 性是一致的。
➢囚犯困境的上策均衡:个体的最优选择带 来了总体最不利的结局,个体理性与整体理 性发生了冲突。
i
j
aij
min j
max i
aij
,存在最优纯策略。

max i
min j
aij
min j
max i
aij,情况会怎样?
矩阵对策的混合策略示例
3 6 A 5 4

运筹学()——精选推荐

运筹学()——精选推荐

4
1.3 设有单人打字室一间,顾客的到达为 Poisson 流,平均到达时间间隔为 20 分钟,打字 时间服从负指数分布,平均为 15 分钟。求: (1)顾客来打字不必等待的概率; (2)打字室内顾客的平均数; (3)顾客在打字室内的平均逗留时间; (4)若顾客在打字室内的平均逗留时间超过 1.25 小时,则主人将考虑增加设备及打字员。 问顾客的平均到达率为多少时,主人才会考虑这样做?
(1)根据 / 说明增加工人的原因;
(2)增加工人后店内空闲的概率;店内至少有 2 个或更多的顾客的概率 ;
(3)求 L, Lq ,W ,Wq 。
1.13 某火车站的电话问讯处有 3 部电话,可以视为 M/M/3/3 系统。已知平均每隔 2 分钟 有一次问讯电话(包括接通和未接通的),每次通话平均时间为 3 分钟。试问打来问讯处的 电话能接通的概率为多少?
1.15 顾客以每小时 4 人的平均到达率到一个双人理发店理发,顾客到达过程为 Poisson 流。当顾客到达理发店 时发现理发店已 有顾客在理发, 则该顾客就拒绝 进入此店,并不再 来。若理发店的理发时间服从负指数分布。试问:
(1)若要保证在可能到达的顾客中至多有 40% 的顾客不进入理发店,则每个理发师 必须以怎样的服务率进行服务?
(2)进入理发店的平均顾客数是多少? (3)顾客的平均理发时间是多少?
二、对策论题(以下试题选做一道题,20 分)
2.1 甲、乙两游泳队举行包括两个项目的对抗比赛,两队各有一名健将级运动员(甲队为
李,乙队为王),在 3 个项目上的成绩都很突出。但规则规定他们每人只许参加两项比赛,
每队的其他两名运动员可参加全部 3 项比赛。已知各运动员的平时成绩(秒)见表 2。假定 各运动员在比赛中正常发挥水平,又设比赛的第一名得 5 分,第二名得 3 分,第三名得 1 分。问教练应决定让自己队健将参加那两项比赛,可使本队得分最多?
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

C
0
1
x1
0
1
x1
A
1
x1
A点对应平衡局势( X * , Y * ) = ([0 1]T ,[0 1]T ), 即两人同去看球,相 应得失值(U * , V * ) = ( X * AY * , X * BY * ) = (4,1), 丈夫得到最大满足。 1 4T 4 1T ] ,[ ] ), 即两人均以一定 B点对应平衡局势( X * , Y * ) = ([ 5 5 5 5 4 4 的概率选择,相应得失值(U * , V * ) = ( , ), 满意度得到均衡, 5 5 但却都降低了。 C点对应平衡局势( X * , Y * ) = ([1 0]T ,[1 0]T ), 即两人去看芭蕾,相 应得失值(U * , V * ) = ( X * AY * , X * BY * ) = (1, 4), 妻子得到最大满足。
0 < y1 ≤ 1 y1 = 0
y1
1
0
1
x1
0 ≤ x1 ≤ 1,
1
x1
9
y1
5 6 7 8 9
A1 < 0 A2 = 0 A1 > 0 A2 > 0
x1 = 0, 0 < y1 ≤ 1
1
0
0 ≤ x1 ≤ 1, y1 = 0
A 0 ≤ y1 < 2 A2 A1 0 ≤ x1 ≤ 1, y1 = A1 A2 < y1 ≤ 1 x1 = 1, A1 A2 < y1 ≤ 1 x1 = 0, A1 A2 0 ≤ x1 ≤ 1, y1 = A1 A x1 = 1, 0 ≤ y1 < 2 A1 x1 = 0, x1 = 1, 0 ≤ y1 ≤ 1
A + B = 0时,双矩阵对策即化为矩阵对策。
2
二 、非合作双矩阵对策
1.解的概念与存在性定理 平衡局势:
* * 设 X * ∈ S 1* , Y * ∈ S 2 , , 若 对 任 何 X ∈ S1* 和 任 何 Y ∈ S 2

X T AY * ≤ X * AY * X * BY ≤ X * BY *
Ι 的 混 合 策 略 集 S 1* = { X = ( x1 L L x m ) | ∑ x i = 1, x i ≥ 0}
i =1 n m
Π 的 混 合 策 略 集 S = {Y = ( y1 LL y n ) | ∑ y i = 1, y i ≥ 0}
* 2 i =1
1
在矩阵对策中,由于Ι的得就是Π的失,二人 处于完全竞争的非合作状态。而在双矩阵对策中, 由于Ι的得并不一定等于Π的失,二人可以同时得, 故二人之间可能合作,从而得到更多的利益。
b b12 y1 T * * 11 X * BY = x 1 x − 1 1 b21 b 22 1 − y1
* * = (b11 − b12 − b21 + b22 ) x1 − (b22 − b21 ) y1 + b22 + (b12 − b22 ) x1
0
图示
1
0
1 2
1
x1
y1
1 1
B1 = 0 B2 > 0 B1 = 0 B2 < 0 B1 > 0 B2 = 0
x1
y1
3
4
y1 = 1 0 ≤ x1 ≤ 1
1
0
y1 = 1, 0 ≤ x1 ≤ 1 0 ≤ y1 ≤ 1, x1 = 0
y1
1
x1
1
0
1
x1
11
y1
5 6 7 8 9
B1 < 0 B2 = 0 B1 > 0 B2 > 0 B1 < 0 B2 < 0 B1 > 0 B2 < 0 B1 < 0 B2 > 0
T
y1
若( X * , Y * )是均衡局势,由平衡局势的定义,X *和Y *应 分别是X T AY *在S1*上和X * BY 在S 2*上的极大点。
5

* a11 a12 y1 X AY = [ x1 1 − x1 ] * − 1 y a21 a22 1 T * * * = (a11 − a12 − a21 + a22 ) y1 − (a22 − a12 ) x1 + a22 + (a21 − a22 ) y1
0 ≤ y1 ≤ 1,
x1 = 0
1
0
y1 = 0, 0 ≤ x1 ≤ 1 B 0 ≤ x1 < 2 B B1 0 ≤ y1 ≤ 1, x1 = 2 B1 B2 < y1 ≤ 1 y1 = 1, B1 B2 < x1 ≤ 1 y1 = 0, B1 B 0 ≤ y1 ≤ 1, x1 = 2 B1B y1 = 1, 0 ≤ x1 < 2 B1 y1 = 0, y1 = 1, 0 ≤ x1 ≤ 1
A2 4 = A1 5
B2 1 = B1 5
妻 子 的解: 1 5 1 0 ≤ y1 ≤ 1, x1 = 5 1 y1 = 1, < x1 ≤ 1 5 y1 = 0, 0 ≤ x1 <
4 < y1 ≤ 1 5 4 0 ≤ x1 ≤ 1, y1 = 5
15
y1
4 5
y1
1 1
4 5 1 5
y1
1
B 1 5
★与矩阵对策不同,双矩阵对策的不同的解对应不同的值。
T T T T
16
例2:(囚犯两难推理)两名囚犯I和II因涉嫌抢劫被捕。警 方 因证据不足先将二人分关二室,并宣布:若二人均 不坦白,则只能因藏有枪支而被判刑1年;若有一人 坦白而另一个不坦白,则坦白者无罪释放,不坦白者 被判刑10年;若二人都坦白了,则同判9年。此二人 确系抢劫犯,请分析他们的抉择。
T T
T
则 称 ( X * , Y * )为 双 矩 阵 对 策 G 的 平 衡 局 势 。 平 衡 局 势 ( X * , Y *) 对 应 的 二 局 中 人 的 期 望 收 益 ( X * AY * , X * BY * ) 就 是 G的 值 , 记 为 (U * , V * )。
T T
3
定理1:任何双矩阵对策至少存在一个平衡局势。 ( X * , Y *) 为 双 矩 阵 对 策 G的 一 个 平 衡 局 势 的 定理2: 充 要 条 件 是 存 在 数 p * 和 q *使 [ X * Y * p * q * ]T 是下述问题的一个解: max ( X T AY + X T BY − p − q) AY ≤ pE n T X B ≤ qE m s .t . T T Em X = En Y = 1 X ,Y ≥ 0 其 中 E m , E n 为 分 量 为1的 向 量 。
其策略为α1 (看芭蕾)、α 2 (看足球),相应混合策略( x1 1 − x1 ); 妻子为局中人II,其策略为β1 (看芭蕾)、β( 2 看足球),相应 混合策略( y1 1- y1 ).设得失矩阵为:
II I
(1, 4) (0, 0) (0, 0) (4,1)
矩阵中位于第i行j列的括号即( aij , bij )

B1 = b11 − b12 − b21 + b22 B2 = b22 − b21
T
* 则使X * BY 达到极大的y1 应满足
0, 当B1 x1* − B2 < 0 * y1 = [0,1]中任意值, 当B1 x1* − B2 = 0 当B1 x1* − B2 > 0 1,
(2)
7
4
2. 2×2双矩阵对策的解法
a a b b 当A和B均为2×2阶时, A = 11 12 , B = 11 12 , a21 a22 b21 b22 相应的双矩阵对策可表示为: II
I
1 − y1 x1 (a11 , b11 ) (a12 , b12 ) (a , b ) (a , b ) (0 ≤ x1 ≤ 1, 0 ≤ y1 ≤ 1) 1 − x1 21 21 22 22
14
1 0 4 0 A= , B = 0 1 0 4 A1 = 1 − 0 − 0 + 4 = 5, A2 = 4 − 0 = 4, B1 = 4 − 0 − 0 + 1 = 5, B2 = 1 − 0 = 1,
丈 夫 的解: x1 = 0, 0 ≤ y1 < x1 = 1, 4 5
根据式(1)和式(2),可在以x1和y1为横、纵轴的坐标系中确 定出对局中人I来说可能成为平衡局势的点(不妨称为I的解)
* (x1 ,y1 )的轨迹和对于局中人II来说可能成为平衡局势的点(不妨 * * * 称为II的解)(x1 ,y1 )的轨迹。二轨迹的公共点即(x1 ,y1 ),由此便
可得到平衡局势。将这一分析的结果各分为9种情形(即A1和A 2、 B1和B2取各种符号时的9种条件),如下表所示:

将此问题看做如下的双矩阵对策问题:
II 坦白 (−9, −9) (0, −10) 不坦白 (−10, 0) (−1, −1) 坦白 不坦白
I



0 −9 −9 − 10 A= , B = 0 −1 −10 − 1 A1 = −9 − 0 − (−10) + (−1) = 0, A2 = −1 − 0 = −1 B1 = −9 − (−10) − 0 + (−1) = 0, B2 = −1 − 0 = −1
18
三 、合作的双矩阵对策
1.合作思路——采用联合随机策略 在非合作的夫妇之争的例子中,若夫妇希望在得失值 (4,1)和(1,4)中权衡,即协商选择概率α ,及期 望得失值:
相关文档
最新文档