第七章 对策论

合集下载

《管理运筹学-对策论》

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

第七章 对策论习题课精品文档67页

第七章  对策论习题课精品文档67页

s1 s2
1 2 3 4
1
2
7
1
3
2
16 1 136 02
3 m-in8aij
8
2
4
-3
3 -3
55
m miaxm aijja a ix ji m n j m iia n ia j a 2 x 22
G 的解为(2,2), VG=2 , 2 与2分别是 局中人I和II的最优纯策略。
例3 求解矩阵对策 G ={S1, S2; A},其中
例4 某单位采购员在秋天要决定冬季取 暖用煤的贮量局中问人题I。:采已购知员在正常的冬季气温条 件下要消耗1三5个吨策煤略,:在在较秋天暖时与买较煤冷的气温条件 下要消耗10吨10和吨2、0吨15。吨假、定20冬分季别记时的煤价随天 气寒冷程为度:而有1,所2变,化3,, 在较暖、正常、较冷 的气候条件下局中每人吨I煤I:价大分自然别为10元,15元和20 元,又设秋季三种时策煤略价:为冬每季出吨现10元.在没有关于 当年冬季准确较的暖气、象正预常报、的条较件冷下,秋季贮煤 多少吨能分使别单记位为的:支1出,最2少,?3,
齐王 上 中 下 田忌 下 上 中
最终净胜一局,赢得1000金。
表14-1 齐王赛马中齐王的赢得表
田忌
1
的策略 上
齐王

的策略

1上 中 下
3
2上 下 中
1
3中 上 下
1
4中 下 上
-1
5下 中 上
1
6下 上 中
1
2
3
4
5
6









博弈论与策略性行为

博弈论与策略性行为
寡头垄断市场上的卖方将价格定在足以 获得经济利润,但又不致于引起新企业进入 的水平上。
与掠夺性定价的异同
企业采用限制性定价,直接目的是阻止新 企业进入市场,但实质上这是一种牺牲部分短 期利润以追求长期利润最大化。因此同掠夺性 定价一样,都是企业长期定价的策略性行为。 所不同的是采用限制性定价的企业短期内仍有 “利润”,而采用掠夺性定价的企业在短期内 处于亏损状态。
动态限制性定价
是指一家在位企业在长期内确定价格和产 量来减少或消除导致新企业进入它所在市场的 诱因的方法。
市场主导企业经常是先定立一个高价,然 后随新企业进入逐渐降低价格。现实经济中, 我们可以看到,新产品刚刚导入时价格定得很 高,然后逐渐回落到竞争性价格水平。
影响限制性定价的主要因素
市场进入壁垒高,新企业难以进入, 阻止的价格也就高。壁垒低,新企业容易 进入,要阻止新企业进入,必须按平均的 甚至更低的利润水平定价。
第七章 博弈论与策略性行为
博弈论又称为对策论或游戏论,是研究决 策主体的行为发生直接相互作用时的决策以及 这种决策的均衡问题。
近20年来,博弈论在经济学中得到了广泛 的应用,它对寡头理论、信息经济学等方面的 发展做出了重要贡献。
1994年度的诺贝尔经济学奖授予三位从事对策论 研究的经济学家:纳什、泽尔腾、海萨尼。
(2)对于现实经济而言,掠夺性定价并不是 经常发生,大企业更愿意通过兼并来消灭竞 争者,因为兼并能使企业免受低价造成的利 润损失,又有利于增强企业的实力和竞争力。
什么情况下掠夺性定价行为难以成功?
两家企业的成本函数相同 完全可竞争市场
二、限制性定价行为
限制性定价又称阻止进入定价,指一家 在位企业将其价格和产量定在新企业进入市 场后所剩的需求不足以使它生存的水平。

对策论

对策论

例 1:
甲、乙两名儿童玩猜拳游戏。游戏中 双方可分别出拳头(代表石头)、 手掌(代表布),两个手指(代表 剪刀)。规则是剪刀赢布,布赢石 头,石头赢剪刀,赢者得一分。若 双方所出相同,算和局,均不得分。 试列出游戏中儿童甲的赢得矩阵。
儿童甲的赢得矩阵:
乙 甲 石头 布 剪刀 石头 0 1 -1 布 -1 0 1 剪刀 1 -1 0
在矩阵对策模型中,赢得矩阵每一行代表 了局中人甲的一个策略,每一列代表了局 中人乙的一个策略; 行的数目表示了甲的策略集的策略数目, 列的数目表示了乙的策略集的策略数目; 赢得矩阵的第i行第j列的数值表示了甲出 第i个策略,乙出第j个策略时,所得的损 益值(所得的损益值应为该数的相反数.)
例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组 成,双方都可排成三种不同的阵容,每一种阵容可以看作一
★各局中人使用一定的对策形成一个 局势时,一个局势就决定了各局中人 的对策的结果也称为对策的损益值。 ★一般而然,当以上三个基本因素确 定后一个对策模型也就确定了。 ★在众多对策模型中,占有重要地位 的是二人有限零和对策。
二人有限零和对策(two-person zero score game) 对策中存在有2个局中人; 每个局中人的策略集的策略数是有限 的; 每一局势的对策都有确定的损益值, 且对同一局势的两个局中人的损益值 之和为零。 例:齐王赛马
(上中下)(上下中)(中上下)(中下上)(下上中)(下中上)
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。 下面矩阵称齐王的赢得矩阵: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3

对策论管理运筹学李军

对策论管理运筹学李军
甲:有m个策略,表示为S1=( 1, 2, 3,……, m) 乙:有n个策略,表示为S2=( 1, 2, 3,……, n) 当甲选定策略i 、乙选定策略j 时,就形成了一个 局势( i , j )。可见这样的局势总共有m n个,对任 意局势( i , j )甲的赢得值为aij,即甲的赢得矩阵为
Min
-4 2 -6 -6
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
Max
8 36
Min 3
局中人甲应选择2 ,乙应采取2策略;结果甲赢得3,乙付
出3。
2019/8/22

2. 矩阵对策解的问题
定义1:设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,…,m}, S2 = {1 ,2 , …, n}
A = {aij}mn ;若
Max min aij = Min max aij = ai*j*
i
j
j
i
则称ai*j*为对策G的值,局势( i* ,j* )为G的 解,i*和j*分别称为局中人的最优策略。
2019/8/22

2. 矩阵对策解的问题
由于ai*j*既是其所在行的最小值,又是其所在 列的最大值,于是有:
Min
7 5 6 5 5 A= 2 -3 9 -4 -4 Max = 5
6 5 7 5 5 0 1 -1 2 -1
Max 7 5 9 5
1 -1 3 1 1 1 A=
-1 1 1 3 1 1
2019/8/22
1 1 -1 1 3 1
1 1 1 -1 1 3

1. 矩阵对策的示例1
例1 :甲的赢得矩阵

对策论

对策论

如果博弈有唯一的纳什均衡点,那么这个博弈是 可预测的。 斗鸡博弈则有两个纳什均衡:一方进而另一方退。 那么到底是公鸡1退还是公鸡2退,我们无法预测。 即我们不知道谁进谁退,谁输谁赢。
你死我活的竞争—零和博弈
石头剪刀布游戏 B 剪刀 1, -1
石头 A 石头 0, 0
布 -1, 1
剪刀

-1, 1
1, -1
0, 0
-1, 1
1, -1
0, 0
在这个博弈中一方所得即为另一方所失,没有纳什均衡
零和博弈与非零和博弈
零和博弈:一方的收益必然意味着另一方 的损失,博弈各方的收益和损失相加总和 永远为“零”。
石头剪刀布、体育竞赛、猜硬币游戏
非零和博弈:博弈中各方的收益或损失的 总和不是零值,它区别于零和博弈,属于 合作博弈,博弈双方存在 “双赢”的可能 。
3.
收益

支付或报酬。一个特定的策略组合下参与者 得到的确定的效用或期望效用。
收益矩阵
单次博弈的收益矩阵
参与者乙 行动A 行动B
参与者甲
行动A
行动B
(a, b)
(e, f)
(c, d)
(g, h)
企业竞合问题—囚徒困境
1. 2.
局中人:嫌疑犯A和B 策略:担白、抵赖
3.
各策略的收益

合作博弈
囚徙博弈中的合作策略(抵赖,抵赖)对双方均 有更大收益。 合作博弈亦称为正和博弈,是指博弈双方的利益 都有所增加,或者至少是一方的利益增加,而另 一方的利益不受损害,因而整个社会的利益有所 增加。 合作博弈研究人们达成合作时如何分配合作得到 的收益,即收益分配问题。
供应链中的合作问题
如何达成此合作?

对策论方法

对策论方法
2013年8月7日星期三 绍兴文理学院 35
1 1 2 -100 -150
2 -175 -150
3 -300 -250 -200
行最小
3 -200 -200 列最大 -100 -150
•定理:p≤q
2013年8月7日星期三 绍兴文理学院 30
p=q时的最优策略
•案例中局中人I(美军)应当选择(北 线)策略1,这样能保证赢得2。局中人 Ⅱ(日军)应当选择(北线)策略1使 盟军赢得不超过2。实际上,在(1,1) 局势下,有 max min aij = min max aij
S2 益损值 S1
田忌赛马
α1(上中下) α2(上下中) α3(中上下) α4(中下上) α5(下上中) α6(下中上)
β1 β2 β3 β4 β5 β6 (上中下) (上下中) (中上下) (中下上) (下上中) (下中上) 3 1 1 1 -1 1 1 3 1 1 1 -1 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3
绍兴文理学院 26
2013年8月7日星期三
有限零和二人对策
•在这几个例中的每一个对局,双方的赢得 的代数之和为零,这样的对策称为“有限 零和二人对策”。
•设两个局中人为I,Ⅱ;
•局中人Ⅰ有m个策略:1 ,2 ,…,m ;用S1 表示这些策略的集合:S1={1 ,2 ,…,m } •局中人Ⅱ有n个策略:β1,β2,…,βn;用 S2表示这些策略的集 合:S2={β1,β2,…,βn}
2013年8月7日星期三 绍兴文理学院 14
纳什(John Nash)
2005.10.10.瑞典皇家科学院宣布,将今年诺贝尔经 济学奖授予罗伯特.奥曼(以、美)和托马斯.谢林(美) , 以表彰他们在博弈论领域所作出的贡献。 诺贝尔评奖委员会说,这两位经济学家"通过对博 弈论的分析,加强了我们对冲突和合作的理解"。 奥曼(75岁),出生于 德国法兰克福,现任耶路 撒冷希伯来大学教授和美 国纽约州立大学斯坦尼分 校教授。 谢林(84岁),曾任美 国哈佛大学肯尼迪学院、 马里兰大学公共政策学院 和经济系教授。 15 2013年8月7日星期三

运筹学-对策论

运筹学-对策论

3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路:对甲(乙)给出一个选取不同策 略的概率分布,以使甲(乙)在各种情 况下的平均赢得(损失)最多(最少)。 -----即混合策略
重要定理
定理 任一矩阵对策G {S1,S2;A}, 任一矩阵对策G={S1,S2;A},一定存在混 合策略意义下的解。 合策略意义下的解。 • 定理 设有两个矩阵对策 • G1= G2= G1={S1,S2;A1} G2={S1,S2;A2} • 其中A1=(aij),A2=(aij+L),L为任一常数。 A1= 其中A1 (aij),A2=(aij+L), 为任一常数。 则 • (1)G1 G2同解 G1与 同解; (1)G1与G2同解; • (2)VG2 VG2= (2)VG2=VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的,即 矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人 阶的, A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解,则很容易求解; 如果此对策有纯策略意义下的解,则很容易求解;如果没有 纯策略意义下的解, 纯策略意义下的解,则为求出各局中人的最优混合策略可求解下 列方程组: 列方程组: • a11x1+a21x2= a11y1+a12y2= a11x1+a21x2=v a11y1+a12y2=v • a12x1+a22x2= a21y1+a22y2= a12x1+a22x2=v a21y1+a22y2=v • y1+y2= x1+x2= y1+y2=1 x1+x2=1 • 当没有纯策略意义下的解时,方程组一定有严格非负解 x*= 当没有纯策略意义下的解时, x1* x2* y*=(y1*,y2*), (x1*,x2*)和y*=(y1*,y2*), 即为各局中人的最优混合策 略。

对策论

对策论

第一节:概述 一、对策现象对策是决策者在竞争(对抗)条件下做出的,关于行动方案的决定,或者说,是在竞争(对抗)条件下的决策。

对策论是研究对策现象并寻求致胜策略的一门科学,是运筹学的一个重要分枝。

早在战国时期,就有一个齐王、田忌赛马的故事 如出三匹马,三场比赛,输一场就输千金在现代的企业经营管理中,竞争(对抗)更加激烈,更加复杂,不过从上例,可见在竞争(对抗)中,如何寻求致胜策略是大可研究的。

二、对策现象的三要素1、局中人:齐王一方,田忌(孙膑)一方;桥牌:东、南、西、北 三国:刘、孙、曹2、策略:局中人的可行的、自始自终通盘筹划的行动方案称策略: 如: 是三个不同的策略,策略的全体,称为策略集合。

3、一局对策的得失上 下 中中 中 上 下 上 下从每个局中人的策略集合中采取一个策略组成的策略组,称作局势。

得失是局势的函数。

如果在任一局势中,全体局中人的“得失”相加总是等于0时,这个对策就称为“零和对策”,否则就称为“非零和对策”。

对策的分类:一、矩阵对策矩阵对策就是二人有限零和对策。

它是指这样一类对抗和争斗现象。

1、局中人:二人;2、每个局中人都仅有有限个可供选择的策略;3、在任何一局势中,两个局中人的得失之和恒为零,即局中人甲的所得,总是局中人乙的所失。

这类对策比较简单,在理论上也比较成熟。

而且这些理论奠定了研究“对策现象”的基本思路。

矩阵对策是对策论的基础。

矩阵对策:有鞍点,无鞍点 二、数学模型a 2 a 21 A 2 … a 2n … … … … …a ma m1a m2…a mn其中a ij 为当甲出策略a i ,乙出策略βj 时,甲的赢得或支付; -a ij 为当甲出策略a i ,乙出策略βj 时,乙的赢得或支付; 因为A=(a ij )mxn 为局中人甲的赢得矩阵; A *=(-a ij )mxn 为局中人乙的赢得矩阵。

以甲方赢得矩阵为准:S 1=(a 1,a 2,…,a m )叫甲的策略集合; S 2=(β1,β2,…,βn )叫乙的策略集合;为了和以后的(无鞍点、混合策略相区别),称a i ,βj 叫做纯策略。

第七章 对策论

第七章 对策论

第七章对策论§1 引言社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来解决这样的问题开始于17世纪的科学家,如C.,Huygens和W.,Leibnitz等。

现代对策论起源于1944年J.,V on Neumann和O.,Morgenstern的著作《Theory of Games and Economic Behavior》。

对策论亦称竞赛论或博弈论。

是研究具有斗争或竞争性质现象的数学理论和方法。

一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。

对策论发展的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常生活等有着密切的联系,并且处理问题的方法又有明显特色。

所以日益引起广泛的注意。

在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。

具有竞争或对抗性质的行为称为对策行为。

在这类行为中。

参加斗争或竞争的各方各自具有不同的目标和利益。

为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。

对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。

§2 对策问题对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果。

先考察一个实际例子。

例1 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑18个月;如果双方都供认伪造了钱币,将各被判刑3年;如果一方供认另一方不供认,则供认方将被从宽处理而免刑,但另一方面将被判刑7年。

将嫌疑犯A、B被判刑的几种可能情况列表如下:嫌疑犯B供认不供认嫌疑犯A供认(3,3)(0,7)不供认(7,0)(1.5,1.5)表中每对数字表示嫌疑犯BA、被判刑的年数。

经济学第七章--垄断竞争与寡头垄断市场

经济学第七章--垄断竞争与寡头垄断市场

表7-2 纳什均衡
37
上策均衡和纳什均衡
• 上策均衡-卡特尔困境 乙

表7-3 卡特尔的困境
38
静态博弈和动态博弈
• 静态博弈与动态博弈
静态博弈指局中人同时决策或虽非同时决策,但后 决策者不知道先决策者采取什么策略的博弈。
• “学习经济学的目的,不是为了在经济问题上找到 一系列现成的答案,而是为了避免被经济学家们所 欺骗。”——琼·罗宾逊
6
垄断竞争市场的特点
垄断竞争市场是更接近于现实的一种市场结构,在完全 竞争和完全垄断两个理论极端之间,更偏向于竞争,垄 断竞争市场有以下三个特点:
产品差别:产品的竞争性与垄断性并存,价格是影响购 买的因素但不是唯一要素,市场势力大小取决于产品差 异程度;
C
E d
MR
O
q1
q2
q
图7-3 垄断竞争厂商的长期均衡
10
非价格竞争
• 垄断竞争厂商产品间有一定替代性,使厂商更着 重于非价格竞争。
• 产品差异
品质竞争,即产品差异化竞争,包括提高质量、改进性 能和结构、增加功能、完善服务等,以减轻替代品的威 胁,吸引更多消费者。也可通过市场细分、产品定向来 争取局部市场的竞争优势。
美国著名经济学家
琼·罗宾逊(Joan Robinson,1903-19853)
琼·罗宾逊的至理名言
• “The purpose of studing economics is not to acquire a set of ready-made answers to economic questions, but to learn how to avoid being deceived by economists.”——Joan Robinson

第7章-对策论

第7章-对策论

例 设一对策 G S, D, A,其中 S s1, s2 , s3 ,
D d1, d2 , d3 ,其赢得矩阵为:
d1 d2 d3
A
s1 s2
3 6
1 0
2 - 3
前提: 对策双方均理智 结论:
s3 - 5 - 1 4 最不利中选最有利
问:双方局中人采用何策略最佳。
囚犯困境问题在经济、政治、军事等领域的应用举例
例:寡头垄断企业定价的博弈
卡特尔价格不是纳什均衡, 最终结果:每个企业按照纳什均衡的价格进行定价, 其利润小于卡特尔价格条件下的利润。
例:公共产品的供给博弈
如果大家都出钱兴办公用事业,所有人的福 利都会增加。问题是,如果我出钱你不出钱, 我得不偿失;而如果你出钱我不出钱,我就可 以占便宜。
赢 B 石头 剪子 布 A
石头 0 1 -1
剪子 -1
0
1
布 1 -1 0
分析:无确定最优解,可用“混合策略”求 解。
4.齐王赛马
战国时期,齐国国王有一天提出要与大将军田忌赛马。田 忌答应后,双方约定: 1)每人从上中下三个等级中各出一匹马,共出三匹; 2) 一共比赛三次,每一次比赛各出一匹马; 3) 每匹被选中的马都得参加比赛,而且只能参加一次; 4) 每次比赛后输者要付给胜者一千金。
解:可用下述表格表示上述寻找最优纯策略过程:
d1
d2
d3
min j
aij
s1
3
1
2
1
s2
6
0
-3
-3
s3
-5 -14-5源自max iaij6
1
4
故若双方都采取理智行为,局势 (s1 , d2 )为最优纯策略.

管理运筹学-对策论

管理运筹学-对策论
对策论
由“齐王赛马”引入
1.对策论的基本概念
• 三个基本要素;集:局中人选择对付其它局 中人的行动方案称为策略。
某局中人的所有可能策 略全体称为策略集;
3.局势对策的益损值:各局中人各自 使用一个对策就形成一个局势,一 个局势决定了个局众人 的对策结果 (量化)称为该局势对策的益损值)
• “齐王赛马”即是一个矩阵策略.
2.矩阵对策的最优纯策略
• 在甲方赢得矩阵中:

A=[aij]m*n
• i行代表甲方策略 i=1,2…m
• J列代表乙方策略 j=1,2…n
• aij代表甲方取策略i,乙方取策略j,这一局势下 甲方的益损值,此时乙方的益损值为-aij(零 和性质)。
• 在讨论各方采用的策略是必须注意一个前提就 是对方是理智的。这就是要从最有把握取得的 益损值情况考虑。
STEP 2
作变换: X1= X1’/V ; X2= X2’/V • 得到上述关系式变为:
X1+ X2=1/V 5X1+ 8X21 9X1+ 6X21 X1, X20
(V愈大愈好)待定
• 建立线性模型:
min X1+X2 s.t. 5X1+8X21
9X1+6X21 X1, X20
X1= 1/21 X2= 2/21 1/V= X1+X2=1/7 所以:V=7
739
A2= 4 6 5.5 603
被第1行所优超
得到
73 9
被第1列所优超
A3= 4 6 5.5
73
最终得到 A4= 46
3.矩阵对策的混合策略(续)
• 对A4计算,用线性规划方法得到: (注意:余下的策略为3,4,1,2) 甲: X* = (0,0,1/15,2/15,0)T V=5

第07章对策论模型

第07章对策论模型
类似地,可以定义局中人 II 的纯策略 j0 优超于 l0 。
定理7.7 设 G {S1, S2; A} ,如果纯策略 1 被其余的纯策略 2 , ,m 中
之一所优超,由 G 可得一个新矩阵对策G ' {S1' , S2; A'} ,其中S1' (2, ,m )
A' (ai'j )(m1)n , ai'j aij ( i 2, , m ; j 2, , n ),则有 (1)vG’=vG ; (2)G' 中局中人 II 的最优策略就是其在 G 中的最优策略; (3)若 (x2*, x3*, , xm* )T 是 G' 中局中人 I 的最优策略,则 x* (0, x2*, x3*, , xm* )T
是存在正数 v 使得 x*,y* 分别是不等式组


m i 1
aij
xi

v
( j 1, 2,
, n)

n j 1
aij
y
j

v
(i 1, 2,
, m)


x m
i1 i
1

xi

0
(i 1, 2,
, m)


n j 1
yj
1

y j 0 ( j 1, 2, , n)
6
5

5*

2 1 1
7
5

5*

6
2 0

max 8 5* 7 5*
max i
min j
aij

min j
max i

运筹学课件——对策1

运筹学课件——对策1
第7章 对策论
对策论的产生,发展和应用 对策论的产生 发展和应用
早期工作 (1)191献。策梅罗设法证明了,对于每一个严格争利 严格争利 的二人完备信息 完备信息对局,或者其中一个对策者有一个确定的胜局 完备信息 纯策略,或者二个都有可靠的平局纯策略。这个结果适用于象 棋一类的棋类对局,证明胜局策略或平局的存在是一回事,而 找出它们就是另一回事了。到目前为止,还没有人找出一局象 棋的胜局策略或平局策略,甚至不知道到底是某一方有一胜局 策略,还是双方都有平局策略.
(2)策略 一局对策中,可供局中人选择的一个实际可行 实际可行 的完整的行动方案称为一个策略。 的完整的行动方案 策略的全体称为策略集,策略集可以是有限或无限 的。若策略集为有限集称为有限对策,否则称为无 限对策。 参加对策的每个局中人(i∈I)都有自己的策略集, S i 一般,每一局中人的策略集中至少应包括两个策略。

(2) 对于对策论的产生作出了重要贡献的另一位数学
家是法国人波涅尔,1921--1927年间他发表了一系 列文章,建立了对策论的数学基础。但是,波涅 尔没有证明对策论的核心定理——极小极大定理, 他还轻率地预言这个定理是不能证明的。
(3)1928年冯·诺意曼证明了博弈论的基本原理,从 而宣告了博弈论的正式诞生.(德国数学家冯-诺意 曼简洁明确地证明了极小极大定理)。
发展成熟 Nash均衡、经济博奕论、信息不对称对策和广义 、 对策.
标准型,广义型和合作型等基本的博弈模型,解的概 标准型,广义型和合作型等基本的博弈模型, 念及分析方法,构建了博弈论的理论框架. 念及分析方法,构建了博弈论的理论框架.
(4) 谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博 弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什 均衡的概念和均衡存在定理。 此外,塞尔顿、哈桑尼的研究也对博弈 论发展起到推动作用。为此,美国的数学家、经济学家纳什(John
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七章 对策论§1 引言社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来解决这样的问题开始于17世纪的科学家,如C.,Huygens 和W.,Leibnitz 等。

现代对策论起源于1944年J.,V on Neumann 和O.,Morgenstern 的著作《Theory of Games and Economic Behavior 》。

对策论亦称竞赛论或博弈论。

是研究具有斗争或竞争性质现象的数学理论和方法。

一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。

对策论发展的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常生活等有着密切的联系,并且处理问题的方法又有明显特色。

所以日益引起广泛的注意。

在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。

具有竞争或对抗性质的行为称为对策行为。

在这类行为中。

参加斗争或竞争的各方各自具有不同的目标和利益。

为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。

对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。

§2 对策问题对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果。

先考察一个实际例子。

例1 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑18个月;如果双方都供认伪造了钱币,将各被判刑3年;如果一方供认另一方不供认,则供认方将被从宽处理而免刑,但另一方面将被判刑7年。

将嫌疑犯A 、B 被判刑的几种可能情况列表如下:嫌疑犯B供认 不供认 嫌疑犯A 供认 (3,3) (0,7) 不供认 (7,0) (1.5,1.5)表中每对数字表示嫌疑犯B A 、被判刑的年数。

如果两名疑犯均担心对方供认并希望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。

从这一简单实例中可以看出对策现象中包含有的几个基本要素。

2.1 对策的基本要素 (i )局中人在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。

通常用I 表示局中人的集合.如果有n 个局中人,则},,2,1{n I =。

一般要求一个对策中至少要有两个局中人。

在例1中,局中人是B A 、两名疑犯。

(ii )策略集 一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。

参加对策的每一局中人i ,I i ∈,都有自己的策略集i S 。

一般,每一局中人的策略集中至少应包括两个策略。

(iii )赢得函数(支付函数)在一局对策中,各局中人所选定的策略形成的策略组称为一个局势,即若i s 是第i 个局中人的一个策略,则n 个局中人的策略组),,,(21n s s s s =就是一个局势。

全体局势的集合S 可用各局中人策略集的笛卡尔积表示,即n S S S S ⨯⨯⨯= 21当局势出现后,对策的结果也就确定了。

也就是说,对任一局势,S s ∈,局中人i 可以得到一个赢得)(s H i 。

显然,)(s H i 是局势s 的函数,称之为第i 个局中人的赢得函数。

这样,就得到一个向量赢得函数))(,),(()(1s H s H s H n =。

本节我们只讨论有两名局中人的对策问题,其结果可以推广到一般的对策模型中去。

2.2 零和对策(矩阵对策)零和对策是一类特殊的对策问题。

在这类对策中,只有两名局中人,每个局中人都只有有限个策略可供选择。

在任一纯局势下,两个局中人的赢得之和总是等于零,即双方的利益是激烈对抗的。

设局中人Ⅰ、Ⅱ的策略集分别为},,{11m S αα =,},,{12n S ββ = 当局中人Ⅰ选定策略i α和局中人Ⅱ选定策略j β后,就形成了一个局势),(j i βα,可见这样的局势共有mn 个。

对任一局势),(j i βα,记局中人Ⅰ的赢得值为ij a ,并称⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=mn m m n n a a a a a a a a a A 212222111211为局中人Ⅰ的赢得矩阵(或为局中人Ⅱ的支付矩阵)。

由于假定对策为零和的,故局中人Ⅱ的赢得矩阵就是A -。

当局中人Ⅰ、Ⅱ和策略集1S 、2S 及局中人Ⅰ的赢得矩阵A 确定后,一个零和对策就给定了,零和对策又可称为矩阵对策并可简记成};,{21A S S G =。

例 2 设有一矩阵对策};,{21A S S G =,其中},,{3211ααα=S ,},,,{43212ββββ=S ,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----=16100610182142230612A从A 中可以看出,若局中人Ⅰ希望获得最大赢利30,需采取策略1α,但此时若局中人Ⅱ采取策略4β,局中人Ⅰ非但得不到30,反而会失去22。

为了稳妥,双方都应考虑到对方有使自己损失最大的动机,在最坏的可能中争取最好的结果,局中人Ⅰ采取策略321ααα、、时,最坏的赢得结果分别为22}22,30,6,12min{-=--2}10,18,2,14min{= 10}16,10,0,6min{-=--其中最好的可能为2}10,2,22max{=--。

如果局中人Ⅰ采取策略2α,无论局中人Ⅱ采取什么策略,局中人Ⅰ的赢得均不会少于2。

局中人Ⅱ采取各方案的最大损失为14}6,14,12max{=-,2}0,2,6max{=-,30}10,18,30max{=-,和16}16,10,22max{=-。

当局中人Ⅱ采取策略2β时,其损失不会超过2。

注意到在赢得矩阵中,2既是所在行中的最小元素又是所在列中的最大元素。

此时,只要对方不改变策略,任一局中人都不可能通过变换策略来增大赢得或减少损失,称这样的局势为对策的一个稳定点或稳定解。

定义1 设),(y x f 为一个定义在A x ∈及B y ∈上的实值函数,如果存在A x ∈*,B y ∈*,使得对一切A x ∈和B y ∈,有)*,(*)*,(*),(y x f y x f y x f ≤≤则称*)*,(y x 为函数f 的一个鞍点。

定义 2 设};,{21A S S G =为矩阵对策,其中},,,{211m S ααα =,},,,{212n S βββ =,n m ij a A ⨯=)(。

若等式**m a x m i n m i n m a x j i ij ijij jia a a == (1)成立,记**j i G a V =,则称G V 为对策G 的值,称使(1)式成立的纯局势),(**j i βα为对策G 的鞍点或稳定解,赢得矩阵中与),(**j i βα相对应的元素**j i a 称为赢得矩阵的鞍点,*i α与*j β分别称为局中人Ⅰ与Ⅱ的最优纯策略。

给定一个对策G ,如何判断它是否具有鞍点呢?为了回答这一问题,先引入下面的极大极小原理。

定理 1 设},,{21A S S G =,记ij jia min max =μ,ij ija max min -=ν,则必有0≤+νμ。

证明 )(m i n m a xij ija -=ν,易见μ为Ⅰ的最小赢得,ν为Ⅱ的最小赢得,由于G 是零和对策,故0≤+νμ必成立。

定理2 零和对策G 具有稳定解的充要条件为0=+νμ。

证明:(充分性)由μ和ν的定义可知,存在一行(例如p 行)μ为p 行中的最小元素且存在一列(例如q 列)ν-为q 列中的最大元素。

故有μ≥pq a 且ν-≤pq a又因0=+νμ,所以νμ-=,从而得出μ=pq a ,pq a 为赢得矩阵的鞍点,),(q p βα为G 的稳定解。

(必要性)若G 具有稳定解),(q p βα,则pq a 为赢得矩阵的鞍点。

故有pq pj jij jia a a =≥=min min max μpq iq iij ija a a =≤=-max max min ν从而可得0≥+νμ,但根据定理1,0≤+νμ必成立,故必有0=+νμ。

上述定理给出了对策问题有稳定解(简称为解)的充要条件。

当对策问题有解时,其解可以不唯一,当解不唯一时,解之间的关系具有下面两条性质:性质 1 无差别性。

即若),(11j i βα与),(22j i βα是对策G 的两个解,则必有2211j i j i a a =性质2 可交换性。

即若),(11j i βα和),(22j i βα是对策G 的两个解,则),(21j i βα和),(12j i βα也是解。

§3 零和对策的混合策略具有稳定解的零和问题是一类特别简单的对策问题,它所对应的赢得矩阵存在鞍点,任一局中人都不可能通过自己单方面的努力来改进结果。

然而,在实际遇到的零和对策中更典型的是0≠+νμ的情况。

由于赢得矩阵中不存在鞍点,此时在只使用纯策略的范围内,对策问题无解。

下面我们引进零和对策的混合策略。

设局中人Ⅰ用概率i x 选用策略i α,局中人Ⅱ用概率j y 选用策略j β,∑∑====m i nj ji yx 111,记T m x x X ),,(1 =,T n y y Y ),,(1 =,则局中人Ⅰ的期望赢得为AY X Y X E T=),(。

记*1S :策略 m αα,,1 *2S :策略 n ββ,,1 概率 m x x ,,1 概率 n y y ,,1 分别称*1S 与*2S 为局中人Ⅰ和Ⅱ的混合策略。

定义4 若存在m 维概率向量X 和n 维概率向量Y ,使得对一切m 维概率向量X 和n 维概率向量Y 有AY X Y A X Y A X T YT XT min max ==则称),(Y X 为混合策略对策问题的鞍点。

定理3 任意混合策略对策问题必存在鞍点,即必存在概率向量X 和Y ,使得:AY X AY X Y A X T XYT YXT max min min max ==。

使用纯策略的对策问题(具有稳定解的对策问题)可以看成使用混合策略的对策问题的特殊情况,相当于以概率1选取其中某一策略,以概率0选取其余策略。

例3 B A 、为作战双方,A 方拟派两架轰炸机Ⅰ和Ⅱ去轰炸B 方的指挥部,轰炸机Ⅰ在前面飞行,Ⅱ随后。

两架轰炸机中只有一架带有炸弹,而另一架仅为护航。

轰炸机飞至B 方上空,受到B 方战斗机的阻击。

若战斗机阻击后面的轰炸机Ⅱ,它仅受Ⅱ的射击,被击中的概率为0.3(Ⅰ来不及返回攻击它)。

若战斗机阻击Ⅰ,它将同时受到两架轰炸机的射击,被击中的概率为0.7。

一旦战斗机未被击落,它将以0.6的概率击毁其选中的轰炸机。

请为B A 、双方各选择一个最优策略,即:对于A 方应选择哪一架轰炸机装载炸弹?对于B 方战斗机应阻击哪一架轰炸机?解 双方可选择的策略集分别是},{21αα=A S ,1α:轰炸机Ⅰ装炸弹,Ⅱ护航2α:轰炸机Ⅱ装炸弹,Ⅰ护航},{21ββ=B S ,1β:阻击轰炸机Ⅰ2β:阻击轰炸机Ⅱ赢得矩阵22)(⨯=ij a R ,ij a 为A 方采取策略i α而B 方采取策略j β时,轰炸机轰炸B 方指挥部的概率,由题意可计算出:82.0)6.01(3.07.011=-+=a 112=a ,121=a58.0)6.01(7.03.022=-+=a即⎥⎦⎤⎢⎣⎡=58.01182.0R易求得82.0min max ==ij jia μ,1max min -=-=ij ija ν。

相关文档
最新文档