第十二章对策论
对策论概述
对策论对策论是对决策者之间的行为的相互影响的研究。
因为对对策论的研究特别强调决策者行为的理性,在过去的二十年间,对策论已被广泛地应用于经济学中。
确实大多数经济行为能够被看成是对策论的一个特殊的情形。
5.1 对策的描述一个对策是对许多决策者的行为的相互影响的正式的表示。
行为的相互影响意思是每一个人的福利不仅依赖她自己的行为而且依赖其他人的行为。
而且她可能采取的最好的行为依赖于她对其他人的行为的预期。
要想完整地描述一个对策,我们必须知道以下四件事情:(1)局中人:有那些人卷入该对策?(2)规则:谁什么时候行动?当他们行动时他们知道什么?他们能干什么?(3)结果:对于局中人的每一组行为,对策的结果是什么?(4)报酬:局中人关于各种可能的结果的偏好(也即效用函数)是什么?例子5.1.1:配对的便士(A)局中人:这里有两个局中人,分别记为1和2。
规则:两个局中人同时抛下一个便士,要么正面向上要么反面向上。
结果:如果两个便士是配对的(要么两个正面向上要么两个反面向上),那么局中人1付一元钱给局中人2;否则,局中人2付一元钱给局中人1。
报酬:每个局中人的报酬简单地等于她得到的或失去的钱的数量。
一般地,这里有两种方法描述一个对策:策略(规范)形式的表示和扩展形式的表示。
5.1.1 一个对策的策略(规范)形式表示假设这里有有限个局中人,局中人的集合为},,2,1{I 。
每一个局中人i ∈},,2,1{I 有一个策略集,记为i S 。
在一个-I 人对策中,局中人的策略组合用一个向量表示为},,{1I s s s =,这里i s 是局中人i 的策略选择。
有时我们也把策略组合s 表示成),(i i s s -,这里i s -是除了局中人i 以外的)1(-I 个局中人的策略组合。
对于每一个策略组合},,{1I s s s =,局中人i 的效用函数为),,(1I i s s u 。
一个-I 人对策的规范形式的表示记为)}]({},{,[⋅=Γi i N u S I 。
博弈论
对策论(Theory of Games)第1、2讲对策论也称博弈论,是运筹学的一个重要分支。
1928年冯·诺意曼(J.von Neumann)等人由于经济问题的启发,研究了一类具有某种特性的博弈问题,这是对策论的最早期的工作。
在我国古代的战国时期,“齐王与田忌赛马”就是一个非常典型的对策论的例子。
对策论所研究的主要对象是带有斗争性质(或至少含有斗争成分)的现象。
由于对策论研究的对象与政治、军事、工业、农业、交通、运输等领域有密切关系,处理问题的方法又有着明显的特色,所以越来越受到人们的注意。
日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为,例如下棋、打牌、体育比赛等,还如战争活动中的双方,都力图选取对自己最为有利的策略,千方百计去战胜对手,在政治方面,国际间的谈判,各种政治力量之间的斗争。
各国际集团之间的斗争等无一不具有斗争的性质。
经济生活中,各国之间、各公司之间的各种经济谈判,企业为争夺市场而进行的竞争等,举不胜举。
具有竞争或对抗性质的行为,称为对策行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标和利益,为了达到各自的目标和利益各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案,对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。
在我国古代,“齐王赛马”就是一个典型的对策论研究的例子。
战国时期,齐王有一天提出要与大将田忌赛马。
双方约定:从各自的上中下三个等级的马中选一匹参赛。
每匹马均只能参赛一次;每次比赛双方各出一匹马,负者要付给胜者千金。
已经知道,在同等级的马中,田忌的马不如齐王的马,而如果田忌的马比齐王的马高一等级,则田忌的马可取胜。
当时,田忌手下的一个谋士给田忌出了个主意:每次比赛时先让齐王牵出他要参赛的马,然后用下马对齐王的上马,用中马对齐王的下马,用上马对齐王的中马。
比赛结果,田忌,二胜一负,可得千金,由此看来,两人各采取什么样的出马次序,对胜负是至关重要的。
对策论
对策论(博弈论) 中文名称:博弈论 英文名称:game theory 定义1:一种处理竞争与合作问题的数学决策方法。 应用学科:地理学(一级学科);数量地理学 (二级学科) 定义2:研究竞争中参加者为争取最大利益应当如何 做出决策的数学方法。 应用学科:生态学(一级 学科);数学生态学(二级学科) 定义3:根据信息分析及能力判断,研究多决策主体 之间行为相互作用及其相互平衡,以使收益或效 用最大化的一种对策理论。 应用学科:资源科技 (一级学科);资源管理学(二级学科)
•
高中概率、排列、组合知识的学习。
• 例2:河南政法 2010A-41)把 9 个苹果分 给 5 个人,每人至少一个苹果,那么不同 的分法一共有多少种?
• A.30 B.40 C.60 D.70
• [强化 1]D • [简析]9 个苹果排成一排,形成 8 个空, 中间插上 4 个挡板,就可以把这 9 个苹果 分成 5 份,并且每份至少 1 个。在 8 个空 中插上 4 个档板:C4/8=70 (种)分法。
• [例 5]B • [简析]挑选 2 个不同的年级有 3种情形, 总共有 5×6+6×3+3×5=63(种)选择。
• [例 9]A • [简析]先插入第一个节目,有 4 个位置, 所以有 4 种方法;再插入第二个节目,此 时有 5 个位置, • 所以有 5 种方法。共有不同安排方法 更多 资料4×5=20 种。
• • 例1:田忌与齐威王赛马并最终获胜被传为 佳话。假设齐威王以上等马、中等马和下 等马的固定顺序排阵,那么田忌随机将自 己的三匹马排阵时,能够获得两场胜利的 概率是( )。福建 (2010-101) • A.2/3 B.1/3 C.1/6 D.1/9
• C • • [简析]田忌随机排布自己的三匹马一共 有 A3 /3种方法,但是只有“下等马、上等 马、中等马”这种唯一的排布可以获得两 场胜利,所以概率为 1/6。
12矩阵对策
对策与优化
Monty Hall悖论 悖论
参赛者会看见三扇关闭了的门,其中一扇的后面有一辆 参赛者会看见三扇关闭了的门, 汽车,选中后面有车的那扇门就可以赢得该汽车, 汽车,选中后面有车的那扇门就可以赢得该汽车,而另 外两扇门后面则各藏有一只山羊。 外两扇门后面则各藏有一只山羊。当参赛者选定了一扇 但未去开启它的时候, 门,但未去开启它的时候,节目主持人会开启剩下两扇 门的其中一扇,露出其中一只山羊。 门的其中一扇,露出其中一只山羊。主持人其后会问参 赛者要不要换另一扇仍然关上的门。问题是换另一扇门 赛者要不要换另一扇仍然关上的门。 是否会增加参赛者赢得汽车的机率? 是否会增加参赛者赢得汽车的机率?
英式拍卖法 一级密封价格拍卖法 二级密封价格拍卖法
机制设计
有七个人曾经住在一起,每天分一大桶粥。 有七个人曾经住在一起,每天分一大桶粥。要命的 粥每天都是不够的。一开始, 是,粥每天都是不够的。一开始,他们抓阄决定谁 来分粥,每天轮一个。于是乎每周下来, 来分粥,每天轮一个。于是乎每周下来,他们只有 一天是饱的,就是自己分粥的那一天。 一天是饱的,就是自己分粥的那一天。后来他们开 始推选出一个道德高尚的人出来分粥。 始推选出一个道德高尚的人出来分粥。强权就会产 生腐败,大家开始挖空心思去讨好他,贿赂他, 生腐败,大家开始挖空心思去讨好他,贿赂他,搞 得整个小团体乌烟障气。 得整个小团体乌烟障气。然后大家开始组成三人的 分粥委员会及四人的评选委员会, 分粥委员会及四人的评选委员会,但他们常常互相 攻击,扯皮下来,粥吃到嘴里全是凉的。 攻击,扯皮下来,粥吃到嘴里全是凉的。
对策论的发展
税收与拉弗曲线 拍卖机制的设计 二手车市场信息 逆向选择的信贷 机制设计的合作
对策论
例 1:
甲、乙两名儿童玩猜拳游戏。游戏中 双方可分别出拳头(代表石头)、 手掌(代表布),两个手指(代表 剪刀)。规则是剪刀赢布,布赢石 头,石头赢剪刀,赢者得一分。若 双方所出相同,算和局,均不得分。 试列出游戏中儿童甲的赢得矩阵。
儿童甲的赢得矩阵:
乙 甲 石头 布 剪刀 石头 0 1 -1 布 -1 0 1 剪刀 1 -1 0
在矩阵对策模型中,赢得矩阵每一行代表 了局中人甲的一个策略,每一列代表了局 中人乙的一个策略; 行的数目表示了甲的策略集的策略数目, 列的数目表示了乙的策略集的策略数目; 赢得矩阵的第i行第j列的数值表示了甲出 第i个策略,乙出第j个策略时,所得的损 益值(所得的损益值应为该数的相反数.)
例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组 成,双方都可排成三种不同的阵容,每一种阵容可以看作一
★各局中人使用一定的对策形成一个 局势时,一个局势就决定了各局中人 的对策的结果也称为对策的损益值。 ★一般而然,当以上三个基本因素确 定后一个对策模型也就确定了。 ★在众多对策模型中,占有重要地位 的是二人有限零和对策。
二人有限零和对策(two-person zero score game) 对策中存在有2个局中人; 每个局中人的策略集的策略数是有限 的; 每一局势的对策都有确定的损益值, 且对同一局势的两个局中人的损益值 之和为零。 例:齐王赛马
(上中下)(上下中)(中上下)(中下上)(下上中)(下中上)
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。 下面矩阵称齐王的赢得矩阵: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3
运筹学--第十二章 对策论
12.1 A、B两人各有1元、5角和1角的硬币各一枚。
在双方互不知道的情况下各出一枚硬币,并规定当和为奇数时,A赢得B所出硬币;当和为偶数时,B赢得A所出硬币。
试据此列出二人零和对策的模型,并说明该项游戏对双方是否公平合理。
12.2A、B两人在互不知道的情况下,各自在纸上写﹛-1,0,1﹜三个数字中的任意一个。
设A所写数字为s,B所写数字为t,答案公布后B付给A的钱为〔s(t-s)+t(t+s)〕元。
试列出此问题对A的支付矩阵,并说明该游戏对双方是否公平合理。
12.3 已知A、B两人对策时对A的赢得矩阵如下,求双方各自的最优策略及对策值。
(1)2 1 4 (2)―3 -2 6 2 0 3 2 0 2 -1 -2 0 5 -2 -412.4 在下列矩阵(a ij)3×3中确定p和q的取值范围,使得该矩阵在元素a22处存在鞍点。
(1) 1 q 6 (2) 2 4 5p 5 10 10 7 q6 2 3 4 p 612.5 A和B进行一种游戏。
A先在横坐标x轴的〔0,1〕区间内任选一个数,但不让B知道,然后B在纵坐标y的〔0,1〕区间内任选一个数。
双方选定后,B对A的支付为p(x,y)=0.5y2-2x2-2xy+3.5x+1.25y求A、B各自的最优策略及对策值。
12.6 证明下列矩阵对策具有纯策略解(其中字母为任意实数)(1) a b (2) a e a e a e a ec d b f b f f b f ba d c g g c c g g cc b12.7 下列矩阵为A、B对策时A的赢得矩阵,先尽可能按优超原则简化,再用图解法求A,B各自的最优策略及对策值。
(1)-3 3 0 2 (2) 2 4 0 -2-4 -1 2 -2 4 8 2 61 1 -2 0 -2 0 4 20 -1 3 -1 -4 -2 -2 012.8 用线性规划方法求解下列对策问题:(1) 3 -1 -3 (2)―1 2 1-3 3 -1 1 -2 2-4 -3 3 3 4 -330630712.9每行与每列均包含有整数1,…,m 的m ×m 矩阵称为拉丁方。
运筹学教材习题答案详解
B1:2.0
3
需要量(套)
200
150
问怎样下料使得(1)用料最少;(2)余料最少.
【解】第一步:求下料方案,见下表。
方案
一
二
三
四
五
六
七
八
九
十
十一
十二
十三
十四
需要量
B1:2.7m
2
1
1
1
0
0
0
0
0
0
0
0
0
0
300
B2:2m
0
1
0
0
3
2
2
1
1
1
0
0
0
0
450
A1:1.7m
0
0
1
0
0
1
0
2
1
0
3
2
1
0
(2)
【解】最优解X=(3/4,7/2);最优值Z=-45/4
(3)
【解】最优解X=(4,1);最优值Z=-10
(4)
【解】最优解X=(3/2,1/4);最优值Z=7/4
(5) 【解】最优解X=(3,0);最优值Z=3
(6)
【解】无界解。
(7)
【解】无可行解。
(8)
【解】最优解X=(2,4);最优值Z=13
【解】设x1、x2、x3分别为产品A、B、C的产量,则数学模型为
1.3建筑公司需要用6m长的塑钢材料制作A、B两种型号的窗架.两种窗架所需材料规格及数量如表1-23所示:
表1-23窗架所需材料规格及数量
型号A
型号B
每套窗架需要材料
长度(m)
对策论
Y X
马鞍面z=x /4马鞍面z=x2/4-y2/6
Y=0的平面上鞍点 Z 在Y=0的平面上鞍点 是z=f(0,y)的极大值点 z=f(0,y)的极大值点
Y X
Z
在X=0的平面上鞍点 X=0的平面上鞍点 z=f(0,y)的极小值点 是z=f(0,y)的极小值点
Y X
例12-3:对给定的矩阵对策 G= {S1,S2;A} 12S 1 = { α1 , α2 , α3 } {α 6 A= 1 8 5 4 5 S 2= { β 1 , β 2 , β 3 } {β 6 2 7
所以局中人I应首先考虑用α 所以局中人I应首先考虑用α 所能赢得 的最小, 的最小,然后在这些最小赢得中选择最 局中人I 大。局中人I可以保证赢得 max
i
min
j
aij
同样,局中人II可以保证局中人I的赢 II可以保证局中人 同样,局中人II可以保证局中人I 得不超过 min max aij
j i
自然条件对于双方 都是已知的。 都是已知的。 基本情况如下: 基本情况如下:从蜡包尔出发开往莱 城的海上航线有南北两条。 城的海上航线有南北两条。通过时间 均为3 均为3天。 气象预报表明:未来3天中,北 气象预报表明:未来3天中, 线阴雨,能见度差;而南线天气晴好, 线阴雨,能见度差;而南线天气晴好, 能见度好。 能见度好。 肯尼将军的轰炸机布置在南线的 机场, 机场,侦察机全天候进行侦察,但有 一定的搜索半径。
i j j I
上式蕴涵的思想是朴素自然的,可 上式蕴涵的思想是朴素自然的, 以概括为: 从最坏处着想, 以概括为:“从最坏处着想,去争 取最好的结果” 取最好的结果”
定义12 定义12-1:对给定的矩阵对策 12G
i
第12章 对策论1
1 2 3 4 min
1 2 A 3 4
8 1 9 3 max 9 6 8 3 4 6 7 1 10 6 10 6 6 3 1 Max 6 6 6 3 3 6
鞍点:
1 , 2 1 , 4 3 , 2 3 , 4
V乙
12
8 4 0
v1=ห้องสมุดไป่ตู้1-8y v2=2+3y
无论乙使用哪种策略,甲最小赢得如红线所示: 由最小最大原则,应选C点,由v2,v3两个方程联 立,解得x=3/11,此时的最优值v2=v3=v=49/11. 而v1=62/11,为下策,乙不会采用,即y1=0。 设:y2=y,y3=1-y,则甲的赢得期望为:
2.最大最小原则
对于矩阵对策G={S1,S2,A},设A={aij)m×n为局在人 甲的赢得矩阵,aij为在纯局势(αi,βj)下局中人甲的损益值, 对行中元素先取小后取大,即max min(aij),对应的局中 人甲的策略为αr;
对列中元素先取大后取小,即min max(aij),对应着
局中人乙的策略为βs,如果max min(aij)=min max(aij)=V成 立时,矩阵对策才存在最优纯策略,并把纯局势(αi,βj)称
3 4
Min
A 1 4 4 -4 Max=2 2 3 2 3
Max 4 3 Min=3
双方若仍然使用纯策略对策, 就会出现不稳定状态。
12.3 矩阵对策的最优混合策略
1.混合策略的概念
采取的不是惟一的策略,而是其策略空间上的一种概率分布。
[例12.4]儿童玩掷硬币游戏,乙猜对,甲给乙1元,错乙给甲1元. 甲出正面:α1,出背面:α2; 乙猜正面:β1,猜背面:β2。 最大最小原则 Min -1 Max=-1 -1 Max 1 1 Min=1 MaxMin(aij)≠MInMax(aij)
对策论
对策论----第一次精英团讲座这一次讲座,非常的成功。
内容恰当、充足,准备充分,讲述的也比较流畅,讨论比较激烈,每个人都能融入其中。
对于我们第一次讲座来说,可以说非常的成功。
好话不多说,下面我将自己对这堂课的理解拿出来分享给大家:1.如何理解对策论?(概念不予重复)1)参与决策的局中人都是足够聪明(就是你能想到的其他人也可以想到,并且各方都是绞尽脑汁的)2)局中人都是理性的(关于这个问题大家一直有着矛盾,我认为此处有理性是比较抽想的说法,可以理解为每个人都只想取胜,这里的取胜是指达到他的目的)3)对策轮中,不是哪一个人努力了就可以达到他想取得的胜利的,而是局中各方最后达成一致的结果,也就是一个稳定性的结果。
(这一点很重要,也是的研究对策论有了实际意义:就是求解这个默契的、稳定的结果)2.零和对策1)零和对策可以理解包含三个必要条件或者说是标准:1)两个人2)两人可选择的决策是有限的3)每局中对于双方来说总有一个和胜一个负(彼此的竞争是激烈的)2)零和对策中的S,代表一个n(n是人数)维矩阵(这里两个人就是简单的二维矩阵),这里可以理解为,1一个人有3种方法,第二个人有4种方法,那么对于第一个人的每一种方法都会有4种,这样决策的组合就可以记为:3⨯4的二维矩阵,如果再有第三个人(5种决策法)的话,这样对于任何一个第一个人和第二个人的组合都有5种方法,这样就又形成了一个3⨯4⨯5的三维矩阵,依次类推。
决策数的个数我就不用再说啦吧。
3)零和对策有个表示法不知道大家注意到没有:含义不多说啦,个人感觉这代表一种表示理念吧。
3.简单零和决策1)简单零和就是可以在零和矩阵中找到一个这个要求解的稳定点。
2)鞍点的求解方法是:按行来,每行取个最小的,在选择其中最大的;按列来,每列选择最大的,在选择其中最小的。
(应该是挺好理解的,个人感觉这里对于按点的性质就不用再记了,反正证明不出来,也记不住,记得这个方法就好了)4.复杂零和对策1)就是上面按行、按列方法求解到的鞍点不统一。
运筹学-对策论
3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路:对甲(乙)给出一个选取不同策 略的概率分布,以使甲(乙)在各种情 况下的平均赢得(损失)最多(最少)。 -----即混合策略
重要定理
定理 任一矩阵对策G {S1,S2;A}, 任一矩阵对策G={S1,S2;A},一定存在混 合策略意义下的解。 合策略意义下的解。 • 定理 设有两个矩阵对策 • G1= G2= G1={S1,S2;A1} G2={S1,S2;A2} • 其中A1=(aij),A2=(aij+L),L为任一常数。 A1= 其中A1 (aij),A2=(aij+L), 为任一常数。 则 • (1)G1 G2同解 G1与 同解; (1)G1与G2同解; • (2)VG2 VG2= (2)VG2=VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的,即 矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人 阶的, A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解,则很容易求解; 如果此对策有纯策略意义下的解,则很容易求解;如果没有 纯策略意义下的解, 纯策略意义下的解,则为求出各局中人的最优混合策略可求解下 列方程组: 列方程组: • a11x1+a21x2= a11y1+a12y2= a11x1+a21x2=v a11y1+a12y2=v • a12x1+a22x2= a21y1+a22y2= a12x1+a22x2=v a21y1+a22y2=v • y1+y2= x1+x2= y1+y2=1 x1+x2=1 • 当没有纯策略意义下的解时,方程组一定有严格非负解 x*= 当没有纯策略意义下的解时, x1* x2* y*=(y1*,y2*), (x1*,x2*)和y*=(y1*,y2*), 即为各局中人的最优混合策 略。
第十二章 对策论(运筹学讲义)
j
v
max min aij min ai* j ai* j
i j j
j
aij 在 j = j * 时达到最小,即 同样 max j
min max aij max aij* aij*
j i i
ai j* ai* j* ai* j
在如此反复对策的过程中,各局中人如果不想冒险,就应 该考虑从自身可能出现的最坏情况下着眼,去选择一种 尽可能好的结果,即双方都是从各自可能出现的最不利 的情形选择一种最为有利的情况作为决策的依据。这就 是所谓“理智行为”。称为最小最大准则,按照这个各 方均避免冒险的观念,就形成如下的推演过程。
§2
出1指 5
-5
出2指 -5 5
局中人1从局中人2该如何选择策略,已获得利益?
例2 囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在 不同的屋子里审讯。警察告诉他们:如果两人都坦白, 各判刑8年;如果两人都抵赖,由于证据不充分,两人将 各判刑2年;如果其中一人坦白,,另一人抵赖,则坦白 者立即释放,抵赖者判刑10年。在这个例子中两人嫌疑 犯都有两种策略:坦白或抵赖。可以用一个矩阵表示两 个嫌疑犯的策略的损益
max min aij min max aij
i j j i
i
j
j
i
不符合鞍点条件,故G的鞍点不存在。 例6 求解矩阵对策,其中: 解 容易得到
1 0 A 1 1
*
1 1
v ai* j* 1
i
1, 2 ; j * 3
由此可见,G的解可以不唯一,但G的值必是唯一的。
j j i
故
max min aij min max aij
对策论
第一节:概述 一、对策现象对策是决策者在竞争(对抗)条件下做出的,关于行动方案的决定,或者说,是在竞争(对抗)条件下的决策。
对策论是研究对策现象并寻求致胜策略的一门科学,是运筹学的一个重要分枝。
早在战国时期,就有一个齐王、田忌赛马的故事 如出三匹马,三场比赛,输一场就输千金在现代的企业经营管理中,竞争(对抗)更加激烈,更加复杂,不过从上例,可见在竞争(对抗)中,如何寻求致胜策略是大可研究的。
二、对策现象的三要素1、局中人:齐王一方,田忌(孙膑)一方;桥牌:东、南、西、北 三国:刘、孙、曹2、策略:局中人的可行的、自始自终通盘筹划的行动方案称策略: 如: 是三个不同的策略,策略的全体,称为策略集合。
3、一局对策的得失上 下 中中 中 上 下 上 下从每个局中人的策略集合中采取一个策略组成的策略组,称作局势。
得失是局势的函数。
如果在任一局势中,全体局中人的“得失”相加总是等于0时,这个对策就称为“零和对策”,否则就称为“非零和对策”。
对策的分类:一、矩阵对策矩阵对策就是二人有限零和对策。
它是指这样一类对抗和争斗现象。
1、局中人:二人;2、每个局中人都仅有有限个可供选择的策略;3、在任何一局势中,两个局中人的得失之和恒为零,即局中人甲的所得,总是局中人乙的所失。
这类对策比较简单,在理论上也比较成熟。
而且这些理论奠定了研究“对策现象”的基本思路。
矩阵对策是对策论的基础。
矩阵对策:有鞍点,无鞍点 二、数学模型a 2 a 21 A 2 … a 2n … … … … …a ma m1a m2…a mn其中a ij 为当甲出策略a i ,乙出策略βj 时,甲的赢得或支付; -a ij 为当甲出策略a i ,乙出策略βj 时,乙的赢得或支付; 因为A=(a ij )mxn 为局中人甲的赢得矩阵; A *=(-a ij )mxn 为局中人乙的赢得矩阵。
以甲方赢得矩阵为准:S 1=(a 1,a 2,…,a m )叫甲的策略集合; S 2=(β1,β2,…,βn )叫乙的策略集合;为了和以后的(无鞍点、混合策略相区别),称a i ,βj 叫做纯策略。
对策的方法
为中,参加斗争或竞争的各方各自具有不同的利益和目标,
各方需考虑对手的各种可能的行动方案,如何采取行动以及 与对手互动对自己最为有利。 许多游戏具有特征: (1)有一定的规则 (2)有一个结果 (3)有可供选择的策略 (4)策略与利益相互依存
静 态 对 策 对 策
动 态 对 策
结 盟 对 策 不 结 盟 对 策
重点 学习 的对 策。
有 限
二人 无 限
微分对策等
【例12.1】1943年2月,日本统帅山本五十六大将计划由南太平洋 新不列颠群岛的拉包尔出发,3天穿过俾斯麦海,开往新几内亚的 莱城,支援困守的日军。有两条路线:北线和南线。 盟军统帅麦克阿瑟命令他麾下的太平洋战区空军司令肯尼将军组 织空中打击。侦察机重点搜索有两个方案:北线和南线。 当时未来3天中:北线阴雨,能见度差;南线晴天,能见度佳。 日美双方各自应采用哪种方案
2 0 ( m m ) , 1 2m 3 P = P () Q 2 0 Q 0 ,
Q 2 0 Q 2 0
不妨先假设三个厂商开始时分别生产3单位,9单位和6单位产量, 这时三厂商是否满意各自的产量,要从利润进行分析. 由于产量不能超过20,则第i个厂商的利润函数为
当局中人,策略,赢得函数三个因素确定后,一 个对策模型也就给定了。
12.1.3 对策的结构和分类
按对策方式 对策分类 按对策人数 按对策状态 非合作对策 合作对策
完全理性 有限理性
著名法国经济学家泰勒尔(Jean Tirole )说:“正如理
运筹学12对策论
下上中
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
下中上
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
《运筹学课程建设组》
14
由表12-2我们可以看到,如果按照严格的博弈问题的假设来重新 安排这一游戏的话,齐威王只要把从策略集中选择策略的顺序不断改
动(随机产生选择),不让田忌掌握策略规律,齐威王的胜率(统计 事件)显然要高于田忌。
《运筹学课程建设组》
回本章目录
2
一、猜币博弈
古老的流传广泛的猜硬币游戏想来对于我们每一个人来说都不陌 生,而正是这样的一个简单游戏构成了一个最基本的博弈问题。
这个游戏非常简单,两人通过猜硬币的正反面赌输赢,其中一人 抛起一枚硬币,用手盖住后,由另一方猜是正面朝上还是反面朝上, 若猜对,则猜者赢,盖硬币者输;否则,猜者输,而盖硬币者赢。
第十二章 博弈论
§1 引论 §2 博弈论的概念及历史沿革 §3 矩阵对策的最优纯策略 §4 矩阵对策的混合策略 §5 我们从博弈论中学习什么
《运筹学课程建设组》
1
§1 引论
为了对什么是博弈论以及博弈包括哪些类型等问题有一些更清晰 的理解和认识,本节先介绍几个典型的简单博弈问题实例,并对它们 作初步的分析。其实博弈本身就如这些实例一样,并不像人们通常理 解的那样深奥、复杂,当然,要想完全弄懂它,也的确需要下一番功 夫。
《运筹学课程建设组》
3
如果我们记赢的一方收益为1角(记为收益1),输的一方损失1 角(记为收益-1),则我们可用表12-1中收益矩阵表示这个猜硬币 博弈问题。
表12-1 猜币博弈
猜硬币方 盖硬币方
正面 反面
《运筹学课程建设组》
正面
运筹学教材习题答案详解
显然用料最少的方案最优。
1.4A、B两种产品,都需要经过前后两道工序加工,每一个单位产品A需要前道工序1小时和后道工序2小时,每一个单位产品B需要前道工序2小时和后道工序3小时.可供利用的前道工序有11小时,后道工序有17小时.
3
B1:2.0
3
需要量(套)
200
150
问怎样下料使得(1)用料最少;(2)余料最少.
【解】第一步:求下料方案,见下表。
方案
一
二
三
四
五
六
七
八
九
十
十一
十二
十三
十四
需要量
B1:2.7m
2
1
1
1
0
0
0
0
0
0
0
0
0
0
300
B2:2m
0
1
0
0
3
2
2
1
1
1
0
0
0
0
450
A1:1.7m
0
0
1
0
0
1
0
2
1
0
3
2
1
0
《运筹学》
第1章线性规划
第2章线性规划的对偶理论
第3章整数规划
第4章目标规划
第5章运输与指派问题
第6章网络模型
第7章网络计划
第8章动态规划
第9章排队论
第10章存储论
第11章决策论
第12章对策论
习题一
1.1讨论下列问题:
运筹学教学大纲
《运筹学》课程教学大纲一、教学对象本课程大纲适用于工商企业管理专业三年制高职学生。
二、学分与学时本课程共68学时三、课程模块类别及课程属性课程模块:专业课课程属性:必修课四、课程性质、任务和目的性质:《运筹学》是工商企业管理专业的专业基础课程,它广泛应用现有的科学技术知识和数学方法,解决实际工作中提出的专门问题,为决策者选择满意方案提供定量依据。
任务:使学生获得系统最优化的基本知识、必要的基础理论和常用的思维方式及运算方法,培养学生的分析思维能力和比较熟练的运算能力,为提高学生的基本素质和后继课程的学习以及进一步扩大应用数学知识解决实际问题奠定良好的基础。
目的:通过这门课程的学习,使学生掌握整体优化的基本思想,培养学生的逻辑思维能力和创新素质;使学生掌握运筹学的工作步骤,培养学生运用模型和算法并借助计算机手段解决实际问题的能力;使学生了解本领域的发展动态。
五、主要先修与后续课程先修课程:高等数学、概率论与数理统计、管理学后续课程:生产运作与管理、人力资源管理、采购管理、管理会计六、教学目的要求和主要内容第一章线性规划与单纯形法【目的要求】1.掌握线性规划数学模型的基本特征和标准形式,以及线性规划问题数学模型的建立方法,学会用图解法求解简单的线性规划问题;掌握运用单纯形法求解线性规划问题;2.熟悉线性规划问题的解的概念;3.了解线性规划的基本理论,了解单纯形表的构成。
【主要内容】●讲授内容1.问题的提出2.图解法3.线性规划问题解的标准形式4.线性规划问题解的概念5.单纯形法的解题思路6.单纯形表7.线性规划应用举例●自学内容1.初始可行基的求法---人工变量法第二章对偶理论与灵敏度分析(自学)【目的要求】1.掌握原问题与对偶问题的关系;掌握运用对偶单纯形法求解线性规划问题;2.熟悉对偶单纯形法的计算步骤;3.了解线性规划的对偶理论【主要内容】1.单纯形法的矩阵描述2.对偶问题的概念3.对偶问题的基本性质4.影子价格5.对偶单纯形法6.灵敏度分析第三章运输问题【目的要求】1.掌握运输问题表上作业法,产销不平衡的运输问题及其求解方法;2.熟悉表上作业法的理论依据;3.了解运输问题的经济含义,表上作业法与单纯形法的关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
12.1 引言
CH12 对策论 game theory
12.1.2 对策三要素
一个对策需要3个基本要素: 一个对策需要 个基本要素: 个基本要素 (1)局中人 局中人(players) 局中人 (2)策略集 策略集(strategies) 策略集 (3)得益函数 得益函数(payoffs) 得益函数
π i = pmi = [20 − ( m1 + m 2 + m3 )] × mi
12.2 纳什均衡
CH12 对策论 game theory
π i = pmi = [20 − ( m1 + m2 + m3 )] × mi
根据上述公式可算出在产量组合为(3, , 时 市场价格为2, 根据上述公式可算出在产量组合为 ,9,6)时,市场价格为 ,三厂商的利 润分别为6, 和 ,再作其它产量组合时亦会有不同的结果,如表12.2. 润分别为 ,18和12,再作其它产量组合时亦会有不同的结果,如表 . 表12.2 三厂商离散产量结合对应价格和利润
12.2 纳什均衡
CH12 对策论 game theory
【例12.1】 假设有三个厂商在同一市场上生产销售完全相同的产品,它们各 】 假设有三个厂商在同一市场上生产销售完全相同的产品, 自的产量分别用m 表示,再假设m 只能取1、 、 自的产量分别用 1、m2和m3表示,再假设 1、m2和m3只能取 、2、3…等正 等正 整数值.市场出清价格一定是市场总产量Q=m1+m2+m3的函数,假设该函数 的函数, 整数值.市场出清价格一定是市场总产量 为:
S = S1 × S 2 × ⋯ theory
12.1.3 对策的结构和分类 完全理性 按对策方式 非合作对策 有限理性 合作对策 二人零和对策 二人对策 对策分类 按对策人数 二人非零和对策 多人对策 完全信息静态对策 静态对策 不完全信息静态对策 按对策状态 完全信息动态对策 动态对策 不完全信息动态对策
20 − (m1 + m2 + m3 ), P=P(Q) = 20 − Q = 0,
Q < 20
Q ≥ 20
为简化计算,假设各厂商的生产无成本,并且各厂商同时决定各自产量, 为简化计算,假设各厂商的生产无成本,并且各厂商同时决定各自产量,求 整个市场会均衡怎样的产量和价格水平? 整个市场会均衡怎样的产量和价格水平? 分析:采用比较和试探的方法来确定本决策的均衡产量。 分析:采用比较和试探的方法来确定本决策的均衡产量。不妨先假设三个厂 商开始时分别生产3单位 单位和 单位产量, 单位, 单位和6单位产量 商开始时分别生产 单位,9单位和 单位产量,这时三厂商是否满意各自的 产量,要从利润进行分析。由于产量不能超过20,则第i个厂商的利润函数为 产量,要从利润进行分析。由于产量不能超过 ,则第 个厂商的利润函数为
运筹学
Operations Research
第十二章 对策论
Game Theory
12.1 引 言 12.2 纳什均衡 12.3 反应函数法 12.4 有限二人零和对策 12.5 有限二人非零和对策
11.1 引言
Introduction
CH12 对策论 game theory
引例
(囚徒的困境 囚徒的困境) 囚徒的困境
局中人:在一个决策行为中,有权决定自己行动方案的对策参加者,常用I 局中人:在一个决策行为中,有权决定自己行动方案的对策参加者,常用 表示局中人的集合。一般要求一个对策中至少要有两个局中人。 表示局中人的集合。一般要求一个对策中至少要有两个局中人。 策略集: 在一局对策中,可供局中人选择的一个实际可行的完整的行动方案 策略集: 在一局对策中, 称为一个策略,所有行动方案的集合成为策略集。每个局中人i 称为一个策略,所有行动方案的集合成为策略集。每个局中人 都有自己的 策略集,每一局中人的策略集中至少包含两个策略。 策略集,每一局中人的策略集中至少包含两个策略。 得益函数(也称赢得函数 :在一局对策中, 得益函数 也称赢得函数):在一局对策中,对应于各参与方每一组可能的决策 也称赢得函数 选择,都应有一个结果表示该策略组合下每个参与方的得益, 选择,都应有一个结果表示该策略组合下每个参与方的得益,常用得益函数表 若一个策略中有n个参与方 个参与方, 示。若一个策略中有 个参与方,则他们可形成一个策略组 s = ( s1 , s 2 , ⋯ , s n ) 是一个局势。 是一个局势。 局势 全体局势的集合S可用各局中人的策略集的迪卡尔集表示 全体局势的集合 可用各局中人的策略集的迪卡尔集表示, 即 可用各局中人的策略集的迪卡尔集表示
12.1 引言
CH12 对策论 game theory
下一节:纳什均衡 下一节:
12.2 纳什均衡
Nash Equilibrium
对于对策中的每一个局中人, 对于对策中的每一个局中人,真正成功的措施应该是针对于其他局中 人所采取的每次行动,相应地采取有利于自己地反应策略, 人所采取的每次行动,相应地采取有利于自己地反应策略,于是每一 个局中人应采取的必定是他对其他局中人策略的预测的最佳反应。 个局中人应采取的必定是他对其他局中人策略的预测的最佳反应。
G={S1,…,Sn;h1,…hn} ,
【定义 12.1】 在对策 】 在对策G={S1,S2…,Sn;h1,h2…hn}中,如果由各个对策方 , 中 的各选取一个策略组成的某个策略组合(S 的各选取一个策略组成的某个策略组合 1*,S2*…,Sn*)中,任一对策方 的 , 中 任一对策方i 策略S 策略 i*,都是对其余策略方策略的组合 (S1*,…,S*i-1,S*i+1…,Sn*)的最佳 , , 的最佳 策略, 策略,即h i(S1*, … , S*i-1, Si*, S*i+1,…Sn*)≥hi(S1*, …, S*i-1, Sij, S*i+1 , …, Sn*)对任 对任 都成立,则称(S 的一个纯策略意义下的“ 意 Sij∈Si 都成立,则称 1*,…,Sn*)为G的一个纯策略意义下的“纳什均 , 为 的一个纯策略意义下的 衡”(Nash Equilibrium). . 定义中各选取一个策略组成的某个策略组合构成一个局势,其最优局势称为 定义中各选取一个策略组成的某个策略组合构成一个局势, 局势 纯策略意义下的最优局势 最优局势. 纯策略意义下的最优局势.
m1 3 3 5 5 3 6
m2 9 8 5 5 3 3
m3 6 6 6 5 3 3
p 2 3 4 5 11 8
π1 6 9 20 25 33 48
π2 18 24 20 25 33 24
π3 12 18 24 25 33 24
CH12 对策论 game theory
12.1 引言
CH12 对策论 game theory
12.1.1 对策论概述
对策论(game theory)亦称博弈论 是研究具有对抗或竞争性质现象的数学理 亦称博弈论 对策论 亦称博弈论: 论和方法,它既是数学的一个分支,也是运筹学的一个重要学科。 论和方法,它既是数学的一个分支,也是运筹学的一个重要学科。 对策行为: 是指具有竞争或对抗性质的行为,在这类行为中, 对策行为 是指具有竞争或对抗性质的行为,在这类行为中,参加斗争或竞 争的各方各自具有不同的利益和目标, 争的各方各自具有不同的利益和目标,各方需考虑对手的各种可能的行动方 案,并力图选择对自己最为有利或最为合理的方案 。 并力图选择对自己最为有利或最为合理的方案 对策:是一些个人、对组或其它组织,面对一定的环境条件, 对策:是一些个人、对组或其它组织,面对一定的环境条件,在一定的规则 同时或先后从各自允许的行为或策略中进行选择并加以实施, 下,同时或先后从各自允许的行为或策略中进行选择并加以实施,各自取得 相应结果的过程。 相应结果的过程。 对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案, 对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及 如何找到这个合理方案的数学理论和方法。 如何找到这个合理方案的数学理论和方法。是研究决策主体的行为发生直接 相互作用时的决策及这种决策的均衡问题。 相互作用时的决策及这种决策的均衡问题。即它是研究聪明而又理智的决策 者在冲突或合作中的策略选择理论。它将成为当代经济管理学科的前沿领城。 者在冲突或合作中的策略选择理论。它将成为当代经济管理学科的前沿领城。
,-5 -5,- ,- -10, 0 ,
0, -10 , ,-1 -1,- ,-
CH12 对策论 game theory
对策论历史简介: 对策论历史简介:
(1) 1713年,瓦德格拉夫提出两人对策的经典模型; 年 瓦德格拉夫提出两人对策的经典模型; (2) 古诺和博特兰分别在 古诺和博特兰分别在1838年与 年与1883年提出对策论最经典的模型; 年提出对策论最经典的模型; 年与 年提出对策论最经典的模型 (3) 中国古代的“齐王赛马”; 中国古代的“齐王赛马” (4) 1944年,冯·诺依曼和摩根斯坦合著出版《博弈论与经济行为》一书,被 诺依曼和摩根斯坦合著出版《博弈论与经济行为》一书, 年 看作是对策论真正发展的起点; 看作是对策论真正发展的起点; (5) 1994年,瑞典皇家科学院决定将诺贝尔经济学奖授予纳什、哈萨尼和泽 年 瑞典皇家科学院决定将诺贝尔经济学奖授予纳什、 尔腾三人,表彰他们在博弈理论和应用方面作出的杰出贡献; 尔腾三人,表彰他们在博弈理论和应用方面作出的杰出贡献; Nash对对策论的贡献有: 对对策论的贡献有: 对对策论的贡献有 (i) 合作对策中的讨价还价模型,称为 合作对策中的讨价还价模型,称为Nash讨价还价解; 讨价还价解; 讨价还价解 (ii) 非合作对策的均衡分析。 非合作对策的均衡分析。 (6) 目前,博弈论在定价、招投标、谈判、拍卖、委托—代理以及很多的经营 目前,博弈论在定价、招投标、谈判、拍卖、委托— 决策中得到应用,它已成为现代经济学的重要基础。现代对策论总体上是一门 决策中得到应用,它已成为现代经济学的重要基础。 新兴的发展中的学科。 新兴的发展中的学科。