第1章:对策论(高级运筹学-中南大学 徐选华)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、建模:建立得失期望值函数
1·混合策略 设局中人甲有m个纯策略 S甲={1,2,…,m},局中人乙有n个纯策略 S乙={1,2,…,n}。 纯局势(i,j)得失为aij,构成的支付矩阵A无鞍点。G = {甲,乙,S甲,S乙,A}。 设甲以 x1,x2,…,xm 的概率取纯策略 1,2,…,m , 则称概率向量 X = (x1,x2,…,xm)为甲的一个混合策略,xi≥0,x1+x2+…+xm=1, 甲的混合策略集记为 S(m); 设乙以 y1,y2,…,yn 的概率取纯策略 1,2,…,n , 则称概率向量 Y = (y1,y2,…,yn )为乙的一个混合策略,yi≥0,y1+y2+…+yn=1, 乙的混合策略集记为 T(n) 。 2·混合局势 (X,Y)称为混合局势。 3·得失期望值
0 -1 1
2 (剪刀)
1 0 -1
3 ( 布)
-1 1 0
支付矩阵为(无鞍点):
1(石头) 2(剪刀) 3(布)
1 1 0 A 1 0 1 1 1 0
得失期望值为:
T E ( X , Y ) XAY (m) X S Y S ( n )
四、对策
参加竞争的各方为了取胜,而研究出一组对付对方的策略。
五、对策的三要素
1·局中人:参加竞争,并有决策权的各方(二人或多人)。 如:齐王和田忌。 2·策略:在一局竞争中,每一局中人均有供他选择的实际可行的完整行动方案。
如例1-1,齐王有6个策略:{(上中下),(上下中), (中上下), (中下上),(下上中), (下中上)} 田忌有6个策略:{(上中下),(上下中), (中上下), (中下上),(下上中), (下中上)} 如例1-2,甲小孩有3个策略:{石头,剪刀,布} 乙小孩有3个策略:{石头,剪刀,布} 3·一局对策的得失:局中人的得失。叫支付函数,对有限策略集,叫支付矩阵。
3
联合对策 结 盟 对 策 静 态 对 策 不 结 盟 对 策
合作对策 零和 二人 有 限 多人 非零和 二人 无 限 零和 非零和 零和 非零和
4
非零和 零和
对 策
多人
动 态 对 策 微分对策
1.2
支付矩阵有鞍点的二人有限零和对策
一、特点
1·策略公开。 2·得失确定且总和为零:一方所得必为另一方所失,局中人利益冲突(对抗对策)。 3·单局竞争决定胜负。
-3400 -5100 -6800
-8400 -7600 -6800
甲用策略3,乙用策略3, 即 秋季购进煤2O吨,总费用最低为68OO元。
10
例1-5 某厂工程师设计了三个矿石冶炼(或选矿)流程,考虑到它们的所用设备和工艺环节等因素, 若付诸实施可会遇上生产正常和生产不正常两种情况,这两种情况的出现及其概率未能予知, 但三个流程在这两种情况下的单位支付费用已算出,如下表,问:选用哪个流程较好? aij 乙 甲 1(流程1) 2(流程2) 3(流程3) 1 2 (生产正常) (生产不正常) -1.5 -1.4 -1.4 -1.4 -1.7 -1.8 -1.7 -1.7 -1.7 -1.8 -1.7 解:有二个鞍点局势(1,2)和(3,2) 甲用1,乙用2;甲用3,乙用2 最小支付费用为:1.7(百元/吨)。 所以应选“流程1‖ 或“流程3‖ 。
a11 a 21 A a m 1
a 12 a 22 am2
a1n a 2n a mn
对策可写成 G = {甲,乙,S甲,S乙,A}。
5
如例1-1.齐王与田忌赛马: aij 田忌
齐王
1 (上中下) 3 1 1 -1 1 1
2 (上下中) 1 3 -1 1 1 1
第 1 章:对策论
1.1 基本概念
一、竞争现象
各种比赛:体育、棋类等比赛。 政治方面:外交谈判。 经济方面:贸易谈判,争夺市场,各种经营竞争等。 工业生产方面:多创价值。 例1-1.齐王与田忌赛马:他们各有上等、中等、下等马各一匹,且同级马,齐王比田忌强些。双方 约定:每局比赛三场,每负一场者应付1千金,且每匹马都应参加比赛。结果田忌以 O:3 输了后请教孙膑,则采用如下策略反败为胜,结果田忌二胜一负,实得1千金。 齐王 上等马 中等马 下等马 胜 胜 败 田忌 上等马 中等马 下等马
1
例1-2.两小孩玩石头、剪刀、布的游戏:甲、乙两小孩出的手势都有可能是石头、剪刀、布, 若他们三次出的手势如下图,则乙小孩二胜一负。 甲小孩 乙小孩 石头 剪刀 布 胜 胜 败 石头 剪刀 布
二、竞争现象的特点
双方均有理智:为击败对手,可随机应变改变策略(多为保密)。 实力强者:稳扎稳打以优势取胜。 实力弱者:避开对方优势锋芒,打击对方弱点取胜。 在经济管理对策中:把非理智的客观世界设想为“理智人”,并与之斗争。
1 1 0 0 0.5 0.05 (0.3,0.3,0.4) 1 0 1 1 1 0 0.5
所以,甲平均要输 0.05。
13
4·最优混合策略 ⑴ 定义:若 X*S(m),Y*T(n),使对所有 XS(m),YT(n),都有 E(X,Y*)≤E(X*,Y*)≤E(X*,Y), 则 X*、Y* 分别称为甲、乙的最优混合策略,(X*,Y*)为对策的解,E(X*,Y*)为对策值V。 例1-6 给定一个矩阵对策 G = {甲,乙,S甲,S乙,A},S甲={1,2},S乙={1,2} ,
3 (中上下) 1 1 3 1 -1 1
4 (中下上) 1 1 1 3 1 -1
5 (下上中) 1 -1 1 1 3 1
6 (下中上) -1 1 1 1 1 3
1(上中下) 2(上下中) 3(中上下) 4(中下上) 5(下上中) 6(下中上) 则支付矩阵为:
1 1 1 1 1 3 1 3 1 1 1 1 1 1 3 1 1 1 A 1 1 1 3 1 1 1 1 1 1 3 1 1 1 1 1 1 3
2 3
4
3 16
-1 16
2 1
1
4 -9
7 7
2
9
2·稳妥性原则数学表达: ①对甲而言是最小最大原则:从支付矩阵每行元素中取最小数,再从这些最小数中取最大数,得
max min a ij v 1
i j
wk.baidu.com
②对乙而言是最大最小原则:从支付矩阵每列元素中取最大数,再从这些最大数中取最小数,得 min max a ij v 2
6
如例1-2.两小孩玩游戏: aij 乙
甲
1 (石头) 0 -1 1
2 (剪刀) 1 0 -1
3 ( 布) -1 1 0
1(石头) 2(剪刀) 3(布)
则支付矩阵为:
1 1 0 A 1 0 1 1 1 0
7
例1-3.某单位秋季要决定冬季取暖用煤的贮量。冬季用煤贮量在较暖、正常和较冷情况下分为 10、15和20吨。设冬季煤价也随寒冷程度而变,在上述三种情况下分别为340、420和500元/吨, 已知秋季煤价为340元/吨,冬季气象未能予知,问秋季合理贮煤量为多少? 解:建模,设局中人甲为:贮煤量决策者; 局中人乙为:未来冬季气候。 费用总和=秋季贮煤量费用+冬季补购煤量费用 aij 乙 甲 1(10 吨) 2(15 吨) 3(20 吨) 1 (较暖) -(10×340)=-3400 -(15×340)=-5100 -(20×340)=-6800 2 (正常) -(10×340+5×420)=-5500 -(15×340)=-5100 -(20×340)=-6800 3 (较冷) -(10×340+10×500)=-8400 -(15×340+5×500)=-7600 -(20×340)=-6800
二、建模:建立支付函数,这里是支付矩阵(也叫矩阵对策问题)
设局中人甲有m个纯策略 S甲= {1,2,…,m},局中人乙有n个纯策略 S乙= {1,2,…,n}。 纯局势(i,j)得失为aij:当aij>0时,甲赢得aij,乙损失aij; 当aij<0时,甲损失-aij,乙赢得-aij。 构成支付矩阵 A:
j i
若V1=V2=VG,则稳妥原则实现,VG为支付矩阵的稳定值—即鞍点值,对应的纯策略i*,j*为 甲、乙的最优纯策略,局势(i*,j*)为对策的最优解,即:
aij* ai* j* ai* j
如例1-3.
行元素 变化趋势
列元素 变化趋势
鞍点
3400 5500 8400 A 5100 5100 7600 6800 6800 6800
三、对策论的概念
研究竞争现象的一种定量分析理论。
三、对策论的起源
1·我国古代围棋比赛和17世纪欧洲国际象棋比赛 — 形成模拟模型。 2·1912年,数学家翟墨罗发表论文“把集合论应用于象棋的博奕理论”,
把对策从模拟模型抽象为数学模型。 3·第一次世界大战期间,产生了军事对策(战役、战略、军事装备等)。 4·1944年,冯· 诺意曼与经济学家摩根斯特恩合写“对策论与经济行为”,把对策论应用于经济管理。 2 5·我国公元前六世纪(春秋)―孙子兵法”13篇。
三、鞍点对策问题两个性质 1·解的稳定性 对策的最终结局可在支付矩阵中得到双方均认可的妥协, 双方均认识到在原有策略中存在最优策略。 2·对策的公开性 双方均明确并可公开申明参加对策的最优策略,最优局势是双方妥协的结果, 反映双方策略的实力。
11
1.3 支付矩阵无鞍点的二人有限零和对策
一、特点
1·策略保密性:图谋出奇制胜。 2·得失随机性:某局竞争的胜败难于予料,强者可败,弱者可胜。 3·多局竞争性:多局竞争后决定胜负。
则支付矩阵为:
3400 5500 8400 A 5100 5100 7600 6800 6800 6800
8
二、求解 1·稳妥性原则 局中人在公开对策的前提下,都从最坏处着想,在最坏的环境中争取最好的结果。 例1-4 某企业决定由职工代表大会选举行政负责人,经提名产生候选人甲和乙。他们根据企业的 发展战略和群众关心的事业各自提出了企业改革的方案。甲提出了四种:1,2,3,4; 乙提出了三种:1,2,3。他们的参谋人员为使竞争对本方有利,予先作了个民意抽样 测验。因各方提供的不同策略对选票吸引力不同。测验选票经比较后差额如下表 (单位:十张): aij 乙 甲 1 -4 0 -6 1 2 3 问:甲和乙在竞选中应采用何种策略? 解:对策时,双方均理智,且发挥主动性。 -6 最后,甲用2竞选,领先2O票优势; 乙只能用2竞选,缩短票数差距。 2 双方均认为只能如此,为双方妥协结果。 -9 -1 支付矩阵中: 每行选最小值,这些最小值中选最大值V1; 每列选最大值,这些最大值中选最小值V2; 若 V1 = V2 ,则得最优解。
12
如例1-2.两小孩共玩了10局游戏对策,最后总计谁胜谁负,设这10次游戏中: 甲随机出了 3次石头、3次剪刀、4次布,即甲采用混合策略 X = (0.3,0.3,0.4); 乙随机出了 0次石头、5次剪刀、5次布,即乙采用混合策略 Y = (0,0.5,0.5) 。 aij 乙
甲
1 (石头)
如:齐王出策略(上中下),田忌出策略(中上下), 则齐王二胜一负,赢得1千金;田忌损失1千金。
六、局势
每个局中人从各自的策略集合中选取一个策略参加对策,形成的一个处于竞争的策略组。 如:齐王选策略(上中下),田忌选策略(中上下),构成一个局势{(上中下),(中上下)}。 局势的得失总和为0。
七、对策的分类
T E ( X , Y ) XAY (m) X S Y T ( n )
a11 a 21 ( x1 , x 2 , , x m ) a m 1
a12
a 22 am2
a1n y1 y m n a 2n 2 xi aij y j i 1 j 1 a mn y n