第七章 对策论
《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。
第七章 对策论习题课精品文档67页

s1 s2
1 2 3 4
1
2
7
1
3
2
16 1 136 02
3 m-in8aij
8
2
4
-3
3 -3
55
m miaxm aijja a ix ji m n j m iia n ia j a 2 x 22
G 的解为(2,2), VG=2 , 2 与2分别是 局中人I和II的最优纯策略。
例3 求解矩阵对策 G ={S1, S2; A},其中
例4 某单位采购员在秋天要决定冬季取 暖用煤的贮量局中问人题I。:采已购知员在正常的冬季气温条 件下要消耗1三5个吨策煤略,:在在较秋天暖时与买较煤冷的气温条件 下要消耗10吨10和吨2、0吨15。吨假、定20冬分季别记时的煤价随天 气寒冷程为度:而有1,所2变,化3,, 在较暖、正常、较冷 的气候条件下局中每人吨I煤I:价大分自然别为10元,15元和20 元,又设秋季三种时策煤略价:为冬每季出吨现10元.在没有关于 当年冬季准确较的暖气、象正预常报、的条较件冷下,秋季贮煤 多少吨能分使别单记位为的:支1出,最2少,?3,
齐王 上 中 下 田忌 下 上 中
最终净胜一局,赢得1000金。
表14-1 齐王赛马中齐王的赢得表
田忌
1
的策略 上
齐王
中
的策略
下
1上 中 下
3
2上 下 中
1
3中 上 下
1
4中 下 上
-1
5下 中 上
1
6下 上 中
1
2
3
4
5
6
上
中
中
下
下
下
上
下
中
上
博弈论与策略性行为

与掠夺性定价的异同
企业采用限制性定价,直接目的是阻止新 企业进入市场,但实质上这是一种牺牲部分短 期利润以追求长期利润最大化。因此同掠夺性 定价一样,都是企业长期定价的策略性行为。 所不同的是采用限制性定价的企业短期内仍有 “利润”,而采用掠夺性定价的企业在短期内 处于亏损状态。
动态限制性定价
是指一家在位企业在长期内确定价格和产 量来减少或消除导致新企业进入它所在市场的 诱因的方法。
市场主导企业经常是先定立一个高价,然 后随新企业进入逐渐降低价格。现实经济中, 我们可以看到,新产品刚刚导入时价格定得很 高,然后逐渐回落到竞争性价格水平。
影响限制性定价的主要因素
市场进入壁垒高,新企业难以进入, 阻止的价格也就高。壁垒低,新企业容易 进入,要阻止新企业进入,必须按平均的 甚至更低的利润水平定价。
第七章 博弈论与策略性行为
博弈论又称为对策论或游戏论,是研究决 策主体的行为发生直接相互作用时的决策以及 这种决策的均衡问题。
近20年来,博弈论在经济学中得到了广泛 的应用,它对寡头理论、信息经济学等方面的 发展做出了重要贡献。
1994年度的诺贝尔经济学奖授予三位从事对策论 研究的经济学家:纳什、泽尔腾、海萨尼。
(2)对于现实经济而言,掠夺性定价并不是 经常发生,大企业更愿意通过兼并来消灭竞 争者,因为兼并能使企业免受低价造成的利 润损失,又有利于增强企业的实力和竞争力。
什么情况下掠夺性定价行为难以成功?
两家企业的成本函数相同 完全可竞争市场
二、限制性定价行为
限制性定价又称阻止进入定价,指一家 在位企业将其价格和产量定在新企业进入市 场后所剩的需求不足以使它生存的水平。
对策论

例 1:
甲、乙两名儿童玩猜拳游戏。游戏中 双方可分别出拳头(代表石头)、 手掌(代表布),两个手指(代表 剪刀)。规则是剪刀赢布,布赢石 头,石头赢剪刀,赢者得一分。若 双方所出相同,算和局,均不得分。 试列出游戏中儿童甲的赢得矩阵。
儿童甲的赢得矩阵:
乙 甲 石头 布 剪刀 石头 0 1 -1 布 -1 0 1 剪刀 1 -1 0
在矩阵对策模型中,赢得矩阵每一行代表 了局中人甲的一个策略,每一列代表了局 中人乙的一个策略; 行的数目表示了甲的策略集的策略数目, 列的数目表示了乙的策略集的策略数目; 赢得矩阵的第i行第j列的数值表示了甲出 第i个策略,乙出第j个策略时,所得的损 益值(所得的损益值应为该数的相反数.)
例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组 成,双方都可排成三种不同的阵容,每一种阵容可以看作一
★各局中人使用一定的对策形成一个 局势时,一个局势就决定了各局中人 的对策的结果也称为对策的损益值。 ★一般而然,当以上三个基本因素确 定后一个对策模型也就确定了。 ★在众多对策模型中,占有重要地位 的是二人有限零和对策。
二人有限零和对策(two-person zero score game) 对策中存在有2个局中人; 每个局中人的策略集的策略数是有限 的; 每一局势的对策都有确定的损益值, 且对同一局势的两个局中人的损益值 之和为零。 例:齐王赛马
(上中下)(上下中)(中上下)(中下上)(下上中)(下中上)
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。 下面矩阵称齐王的赢得矩阵: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3
对策论管理运筹学李军

Min
-4 2 -6 -6
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
Max
8 36
Min 3
局中人甲应选择2 ,乙应采取2策略;结果甲赢得3,乙付
出3。
2019/8/22
2. 矩阵对策解的问题
定义1:设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,…,m}, S2 = {1 ,2 , …, n}
A = {aij}mn ;若
Max min aij = Min max aij = ai*j*
i
j
j
i
则称ai*j*为对策G的值,局势( i* ,j* )为G的 解,i*和j*分别称为局中人的最优策略。
2019/8/22
2. 矩阵对策解的问题
由于ai*j*既是其所在行的最小值,又是其所在 列的最大值,于是有:
Min
7 5 6 5 5 A= 2 -3 9 -4 -4 Max = 5
6 5 7 5 5 0 1 -1 2 -1
Max 7 5 9 5
1 -1 3 1 1 1 A=
-1 1 1 3 1 1
2019/8/22
1 1 -1 1 3 1
1 1 1 -1 1 3
1. 矩阵对策的示例1
例1 :甲的赢得矩阵
对策论

如果博弈有唯一的纳什均衡点,那么这个博弈是 可预测的。 斗鸡博弈则有两个纳什均衡:一方进而另一方退。 那么到底是公鸡1退还是公鸡2退,我们无法预测。 即我们不知道谁进谁退,谁输谁赢。
你死我活的竞争—零和博弈
石头剪刀布游戏 B 剪刀 1, -1
石头 A 石头 0, 0
布 -1, 1
剪刀
布
-1, 1
1, -1
0, 0
-1, 1
1, -1
0, 0
在这个博弈中一方所得即为另一方所失,没有纳什均衡
零和博弈与非零和博弈
零和博弈:一方的收益必然意味着另一方 的损失,博弈各方的收益和损失相加总和 永远为“零”。
石头剪刀布、体育竞赛、猜硬币游戏
非零和博弈:博弈中各方的收益或损失的 总和不是零值,它区别于零和博弈,属于 合作博弈,博弈双方存在 “双赢”的可能 。
3.
收益
支付或报酬。一个特定的策略组合下参与者 得到的确定的效用或期望效用。
收益矩阵
单次博弈的收益矩阵
参与者乙 行动A 行动B
参与者甲
行动A
行动B
(a, b)
(e, f)
(c, d)
(g, h)
企业竞合问题—囚徒困境
1. 2.
局中人:嫌疑犯A和B 策略:担白、抵赖
3.
各策略的收益
合作博弈
囚徙博弈中的合作策略(抵赖,抵赖)对双方均 有更大收益。 合作博弈亦称为正和博弈,是指博弈双方的利益 都有所增加,或者至少是一方的利益增加,而另 一方的利益不受损害,因而整个社会的利益有所 增加。 合作博弈研究人们达成合作时如何分配合作得到 的收益,即收益分配问题。
供应链中的合作问题
如何达成此合作?
对策论方法

1 1 2 -100 -150
2 -175 -150
3 -300 -250 -200
行最小
3 -200 -200 列最大 -100 -150
•定理:p≤q
2013年8月7日星期三 绍兴文理学院 30
p=q时的最优策略
•案例中局中人I(美军)应当选择(北 线)策略1,这样能保证赢得2。局中人 Ⅱ(日军)应当选择(北线)策略1使 盟军赢得不超过2。实际上,在(1,1) 局势下,有 max min aij = min max aij
S2 益损值 S1
田忌赛马
α1(上中下) α2(上下中) α3(中上下) α4(中下上) α5(下上中) α6(下中上)
β1 β2 β3 β4 β5 β6 (上中下) (上下中) (中上下) (中下上) (下上中) (下中上) 3 1 1 1 -1 1 1 3 1 1 1 -1 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3
绍兴文理学院 26
2013年8月7日星期三
有限零和二人对策
•在这几个例中的每一个对局,双方的赢得 的代数之和为零,这样的对策称为“有限 零和二人对策”。
•设两个局中人为I,Ⅱ;
•局中人Ⅰ有m个策略:1 ,2 ,…,m ;用S1 表示这些策略的集合:S1={1 ,2 ,…,m } •局中人Ⅱ有n个策略:β1,β2,…,βn;用 S2表示这些策略的集 合:S2={β1,β2,…,βn}
2013年8月7日星期三 绍兴文理学院 14
纳什(John Nash)
2005.10.10.瑞典皇家科学院宣布,将今年诺贝尔经 济学奖授予罗伯特.奥曼(以、美)和托马斯.谢林(美) , 以表彰他们在博弈论领域所作出的贡献。 诺贝尔评奖委员会说,这两位经济学家"通过对博 弈论的分析,加强了我们对冲突和合作的理解"。 奥曼(75岁),出生于 德国法兰克福,现任耶路 撒冷希伯来大学教授和美 国纽约州立大学斯坦尼分 校教授。 谢林(84岁),曾任美 国哈佛大学肯尼迪学院、 马里兰大学公共政策学院 和经济系教授。 15 2013年8月7日星期三
运筹学-对策论

3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路:对甲(乙)给出一个选取不同策 略的概率分布,以使甲(乙)在各种情 况下的平均赢得(损失)最多(最少)。 -----即混合策略
重要定理
定理 任一矩阵对策G {S1,S2;A}, 任一矩阵对策G={S1,S2;A},一定存在混 合策略意义下的解。 合策略意义下的解。 • 定理 设有两个矩阵对策 • G1= G2= G1={S1,S2;A1} G2={S1,S2;A2} • 其中A1=(aij),A2=(aij+L),L为任一常数。 A1= 其中A1 (aij),A2=(aij+L), 为任一常数。 则 • (1)G1 G2同解 G1与 同解; (1)G1与G2同解; • (2)VG2 VG2= (2)VG2=VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的,即 矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人 阶的, A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解,则很容易求解; 如果此对策有纯策略意义下的解,则很容易求解;如果没有 纯策略意义下的解, 纯策略意义下的解,则为求出各局中人的最优混合策略可求解下 列方程组: 列方程组: • a11x1+a21x2= a11y1+a12y2= a11x1+a21x2=v a11y1+a12y2=v • a12x1+a22x2= a21y1+a22y2= a12x1+a22x2=v a21y1+a22y2=v • y1+y2= x1+x2= y1+y2=1 x1+x2=1 • 当没有纯策略意义下的解时,方程组一定有严格非负解 x*= 当没有纯策略意义下的解时, x1* x2* y*=(y1*,y2*), (x1*,x2*)和y*=(y1*,y2*), 即为各局中人的最优混合策 略。
对策论

第一节:概述 一、对策现象对策是决策者在竞争(对抗)条件下做出的,关于行动方案的决定,或者说,是在竞争(对抗)条件下的决策。
对策论是研究对策现象并寻求致胜策略的一门科学,是运筹学的一个重要分枝。
早在战国时期,就有一个齐王、田忌赛马的故事 如出三匹马,三场比赛,输一场就输千金在现代的企业经营管理中,竞争(对抗)更加激烈,更加复杂,不过从上例,可见在竞争(对抗)中,如何寻求致胜策略是大可研究的。
二、对策现象的三要素1、局中人:齐王一方,田忌(孙膑)一方;桥牌:东、南、西、北 三国:刘、孙、曹2、策略:局中人的可行的、自始自终通盘筹划的行动方案称策略: 如: 是三个不同的策略,策略的全体,称为策略集合。
3、一局对策的得失上 下 中中 中 上 下 上 下从每个局中人的策略集合中采取一个策略组成的策略组,称作局势。
得失是局势的函数。
如果在任一局势中,全体局中人的“得失”相加总是等于0时,这个对策就称为“零和对策”,否则就称为“非零和对策”。
对策的分类:一、矩阵对策矩阵对策就是二人有限零和对策。
它是指这样一类对抗和争斗现象。
1、局中人:二人;2、每个局中人都仅有有限个可供选择的策略;3、在任何一局势中,两个局中人的得失之和恒为零,即局中人甲的所得,总是局中人乙的所失。
这类对策比较简单,在理论上也比较成熟。
而且这些理论奠定了研究“对策现象”的基本思路。
矩阵对策是对策论的基础。
矩阵对策:有鞍点,无鞍点 二、数学模型a 2 a 21 A 2 … a 2n … … … … …a ma m1a m2…a mn其中a ij 为当甲出策略a i ,乙出策略βj 时,甲的赢得或支付; -a ij 为当甲出策略a i ,乙出策略βj 时,乙的赢得或支付; 因为A=(a ij )mxn 为局中人甲的赢得矩阵; A *=(-a ij )mxn 为局中人乙的赢得矩阵。
以甲方赢得矩阵为准:S 1=(a 1,a 2,…,a m )叫甲的策略集合; S 2=(β1,β2,…,βn )叫乙的策略集合;为了和以后的(无鞍点、混合策略相区别),称a i ,βj 叫做纯策略。
第七章 对策论

第七章对策论§1 引言社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来解决这样的问题开始于17世纪的科学家,如C.,Huygens和W.,Leibnitz等。
现代对策论起源于1944年J.,V on Neumann和O.,Morgenstern的著作《Theory of Games and Economic Behavior》。
对策论亦称竞赛论或博弈论。
是研究具有斗争或竞争性质现象的数学理论和方法。
一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。
对策论发展的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常生活等有着密切的联系,并且处理问题的方法又有明显特色。
所以日益引起广泛的注意。
在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。
具有竞争或对抗性质的行为称为对策行为。
在这类行为中。
参加斗争或竞争的各方各自具有不同的目标和利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。
对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。
§2 对策问题对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果。
先考察一个实际例子。
例1 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑18个月;如果双方都供认伪造了钱币,将各被判刑3年;如果一方供认另一方不供认,则供认方将被从宽处理而免刑,但另一方面将被判刑7年。
将嫌疑犯A、B被判刑的几种可能情况列表如下:嫌疑犯B供认不供认嫌疑犯A供认(3,3)(0,7)不供认(7,0)(1.5,1.5)表中每对数字表示嫌疑犯BA、被判刑的年数。
经济学第七章--垄断竞争与寡头垄断市场

表7-2 纳什均衡
37
上策均衡和纳什均衡
• 上策均衡-卡特尔困境 乙
甲
表7-3 卡特尔的困境
38
静态博弈和动态博弈
• 静态博弈与动态博弈
静态博弈指局中人同时决策或虽非同时决策,但后 决策者不知道先决策者采取什么策略的博弈。
• “学习经济学的目的,不是为了在经济问题上找到 一系列现成的答案,而是为了避免被经济学家们所 欺骗。”——琼·罗宾逊
6
垄断竞争市场的特点
垄断竞争市场是更接近于现实的一种市场结构,在完全 竞争和完全垄断两个理论极端之间,更偏向于竞争,垄 断竞争市场有以下三个特点:
产品差别:产品的竞争性与垄断性并存,价格是影响购 买的因素但不是唯一要素,市场势力大小取决于产品差 异程度;
C
E d
MR
O
q1
q2
q
图7-3 垄断竞争厂商的长期均衡
10
非价格竞争
• 垄断竞争厂商产品间有一定替代性,使厂商更着 重于非价格竞争。
• 产品差异
品质竞争,即产品差异化竞争,包括提高质量、改进性 能和结构、增加功能、完善服务等,以减轻替代品的威 胁,吸引更多消费者。也可通过市场细分、产品定向来 争取局部市场的竞争优势。
美国著名经济学家
琼·罗宾逊(Joan Robinson,1903-19853)
琼·罗宾逊的至理名言
• “The purpose of studing economics is not to acquire a set of ready-made answers to economic questions, but to learn how to avoid being deceived by economists.”——Joan Robinson
第7章-对策论

例 设一对策 G S, D, A,其中 S s1, s2 , s3 ,
D d1, d2 , d3 ,其赢得矩阵为:
d1 d2 d3
A
s1 s2
3 6
1 0
2 - 3
前提: 对策双方均理智 结论:
s3 - 5 - 1 4 最不利中选最有利
问:双方局中人采用何策略最佳。
囚犯困境问题在经济、政治、军事等领域的应用举例
例:寡头垄断企业定价的博弈
卡特尔价格不是纳什均衡, 最终结果:每个企业按照纳什均衡的价格进行定价, 其利润小于卡特尔价格条件下的利润。
例:公共产品的供给博弈
如果大家都出钱兴办公用事业,所有人的福 利都会增加。问题是,如果我出钱你不出钱, 我得不偿失;而如果你出钱我不出钱,我就可 以占便宜。
赢 B 石头 剪子 布 A
石头 0 1 -1
剪子 -1
0
1
布 1 -1 0
分析:无确定最优解,可用“混合策略”求 解。
4.齐王赛马
战国时期,齐国国王有一天提出要与大将军田忌赛马。田 忌答应后,双方约定: 1)每人从上中下三个等级中各出一匹马,共出三匹; 2) 一共比赛三次,每一次比赛各出一匹马; 3) 每匹被选中的马都得参加比赛,而且只能参加一次; 4) 每次比赛后输者要付给胜者一千金。
解:可用下述表格表示上述寻找最优纯策略过程:
d1
d2
d3
min j
aij
s1
3
1
2
1
s2
6
0
-3
-3
s3
-5 -14-5源自max iaij6
1
4
故若双方都采取理智行为,局势 (s1 , d2 )为最优纯策略.
管理运筹学-对策论

由“齐王赛马”引入
1.对策论的基本概念
• 三个基本要素;集:局中人选择对付其它局 中人的行动方案称为策略。
某局中人的所有可能策 略全体称为策略集;
3.局势对策的益损值:各局中人各自 使用一个对策就形成一个局势,一 个局势决定了个局众人 的对策结果 (量化)称为该局势对策的益损值)
• “齐王赛马”即是一个矩阵策略.
2.矩阵对策的最优纯策略
• 在甲方赢得矩阵中:
•
A=[aij]m*n
• i行代表甲方策略 i=1,2…m
• J列代表乙方策略 j=1,2…n
• aij代表甲方取策略i,乙方取策略j,这一局势下 甲方的益损值,此时乙方的益损值为-aij(零 和性质)。
• 在讨论各方采用的策略是必须注意一个前提就 是对方是理智的。这就是要从最有把握取得的 益损值情况考虑。
STEP 2
作变换: X1= X1’/V ; X2= X2’/V • 得到上述关系式变为:
X1+ X2=1/V 5X1+ 8X21 9X1+ 6X21 X1, X20
(V愈大愈好)待定
• 建立线性模型:
min X1+X2 s.t. 5X1+8X21
9X1+6X21 X1, X20
X1= 1/21 X2= 2/21 1/V= X1+X2=1/7 所以:V=7
739
A2= 4 6 5.5 603
被第1行所优超
得到
73 9
被第1列所优超
A3= 4 6 5.5
73
最终得到 A4= 46
3.矩阵对策的混合策略(续)
• 对A4计算,用线性规划方法得到: (注意:余下的策略为3,4,1,2) 甲: X* = (0,0,1/15,2/15,0)T V=5
第07章对策论模型

定理7.7 设 G {S1, S2; A} ,如果纯策略 1 被其余的纯策略 2 , ,m 中
之一所优超,由 G 可得一个新矩阵对策G ' {S1' , S2; A'} ,其中S1' (2, ,m )
A' (ai'j )(m1)n , ai'j aij ( i 2, , m ; j 2, , n ),则有 (1)vG’=vG ; (2)G' 中局中人 II 的最优策略就是其在 G 中的最优策略; (3)若 (x2*, x3*, , xm* )T 是 G' 中局中人 I 的最优策略,则 x* (0, x2*, x3*, , xm* )T
是存在正数 v 使得 x*,y* 分别是不等式组
m i 1
aij
xi
v
( j 1, 2,
, n)
n j 1
aij
y
j
v
(i 1, 2,
, m)
x m
i1 i
1
xi
0
(i 1, 2,
, m)
和
n j 1
yj
1
y j 0 ( j 1, 2, , n)
6
5
5*
2 1 1
7
5
5*
6
2 0
max 8 5* 7 5*
max i
min j
aij
min j
max i
运筹学课件——对策1

对策论的产生,发展和应用 对策论的产生 发展和应用
早期工作 (1)191献。策梅罗设法证明了,对于每一个严格争利 严格争利 的二人完备信息 完备信息对局,或者其中一个对策者有一个确定的胜局 完备信息 纯策略,或者二个都有可靠的平局纯策略。这个结果适用于象 棋一类的棋类对局,证明胜局策略或平局的存在是一回事,而 找出它们就是另一回事了。到目前为止,还没有人找出一局象 棋的胜局策略或平局策略,甚至不知道到底是某一方有一胜局 策略,还是双方都有平局策略.
(2)策略 一局对策中,可供局中人选择的一个实际可行 实际可行 的完整的行动方案称为一个策略。 的完整的行动方案 策略的全体称为策略集,策略集可以是有限或无限 的。若策略集为有限集称为有限对策,否则称为无 限对策。 参加对策的每个局中人(i∈I)都有自己的策略集, S i 一般,每一局中人的策略集中至少应包括两个策略。
•
(2) 对于对策论的产生作出了重要贡献的另一位数学
家是法国人波涅尔,1921--1927年间他发表了一系 列文章,建立了对策论的数学基础。但是,波涅 尔没有证明对策论的核心定理——极小极大定理, 他还轻率地预言这个定理是不能证明的。
(3)1928年冯·诺意曼证明了博弈论的基本原理,从 而宣告了博弈论的正式诞生.(德国数学家冯-诺意 曼简洁明确地证明了极小极大定理)。
发展成熟 Nash均衡、经济博奕论、信息不对称对策和广义 、 对策.
标准型,广义型和合作型等基本的博弈模型,解的概 标准型,广义型和合作型等基本的博弈模型, 念及分析方法,构建了博弈论的理论框架. 念及分析方法,构建了博弈论的理论框架.
(4) 谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博 弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什 均衡的概念和均衡存在定理。 此外,塞尔顿、哈桑尼的研究也对博弈 论发展起到推动作用。为此,美国的数学家、经济学家纳什(John
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
赢B
石头
剪子
布
A
石头
0
1
-1
剪子
-1
0
1
布
1
-1
0
3.对策论的产生
1944 年,纽曼与曼彻斯特发表了题为《对策论和经济行为》。二次大战前后,由于军事
需要,抽象成数学模型。
50 年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的
“核”的概念。同时,非合作对策也开始创立。纳什于 1950 和 1951 年发表了两篇关于非合作
Ⅰ,Ⅱ的最优纯策略, ai* j* 称为 G 的值,记为VG 。
( ) ( ) (2)
鞍点:若局势 αi* , β j*
对应的 ai* j*
=
max i
min j
aij
=
min j
max i
aij
,则称
αi* , β
j*
为
鞍点。
分析上例中 a23 ,它就满足 ai3 ≤ a23 ≤ a2 j
( ) ( ) 定理 1: G 在纯策略中有解 αi* , β j* ⇔ αi* , β j* 是鞍点
7.1 基本概念
7.1.1 对策现象与对策论
1.对策和对策论 在日常生活中及各种领域内,经常可以看到一些充满着竞争、对抗、冲突的现象。对策 论是研究上述现象的数学理论和方法。它是一种理论模型,其中包括参加者所掌握的全部信 息及可能采取的行动等。 对策论把各式各样的冲突现象抽象成一种数学模型,然后给出分析这些问题的方法和 解。应该说明的是,所谓解是指对策中的所有参与者都按最佳策略行动而得到的结果。对策 论的研究中一般都假设:在对策中所有参与者都是“完全理智”的,在采取的策略上没有任 何失误。 2.对策现象 (1)下棋:围棋源于我国殷代。 (2)齐王赛马:齐王与大将田忌赛马,各自的马都分为三等,但齐王的同等马均强于 田忌。孙膑给田忌出主意,用下----上,上----中,中----下,结果田忌胜出。 (3)猜手:小孩 A 与 B 猜手,若规定赢得 1 分,平得 0 分,输得 -1 分,则 A 的赢得可 用下表来表示
⎛ 0 −2
2⎞
−2 •
例 7.2
⎜ ⎜⎜⎝
5 2
4 3
−−43 ⎟⎟⎟⎠
−3 −4
54 2
min
j
max i
aij
=
2,
max i
min j
aij
=
−2 ,鞍点不存在,即在纯策略意义下无解
⎛6 5 6 5 ⎞ 5
⎜•
•⎟ •
⎜ 1 4 2 −1⎟ −1
例 7.3
⎜ ⎜
8
5
•
7
5
•
⎟ ⎟
5
•
⎜⎝ 0 2 6 2 ⎟⎠ 0
第七章 对策论
(Game Theory)
本章重点:基本概念、矩阵对策的混合扩充 本章难点:矩阵对策的混合扩充
Game Theory 也可译为博弈论,是研究决策主体的行为发生直接相互作用时的决策以及 这种决策的均衡问题的学科。
1994 年诺贝尔经济学奖授给了三位博弈论专家:纳什、泽尔腾、海萨尼。博弈论已经 成为当代经济学的基石。博弈论博大精深,它不仅在经济学领域得到广泛应用,在军事、政 治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响,工程学中如 控制论工程也少不了它。
一个混合局势。
(4)对一个混合局势 (X, Y) ,用 E(X, Y) = XTAY 表示局中人Ⅰ的收益期望值。 (5)用G* = (S1*,S*2 ,E) 表示G= (S1,S2 ,A) 的混合扩充。
(6) 混合扩充的解与值
若G* 的值VG* = E( X *,Y *) 满足 E( X ,Y *) ≤ E( X *,Y *) ≤ E( X *,Y ) * 式 G* 的解 ( X *,Y *) 也称 G 在混合策略意义下的解。
7.2.1 矩阵对策的最优纯策略
1.矩阵对策 设二人有限零和对策问题中的局中人为Ⅰ,Ⅱ,
策略集为 S 1
=
{α1 , α 2
,αm}, S2 = {β1,β 2
, βn},
α1 则支付可以用矩阵 A =
αm
β1, ⎜⎛ a11, ⎜ ⎜⎝ am1,
, βn , a1n ⎟⎞ 表示,
⎟ , amn ⎟⎠
min j
aij
=
2
,即对策解是(α3, β1)VG
=
2。
根据性质 3,则 X* = (0, 0,1, 0),Y * = (1, 0, 0, 0),VG* = 2
性质 4: G1 = (S1, S2 , A1), G2 = (S1, S2 , A2 ), A1 = (aij ), A2 = (aij + d ) ,则:
分析*式:
E(X ,Y*) ≤ E(X *,Y*) ≤ E(X *,Y)
E( X *,Y * ) = X *T AY *
分析左式:
= (x1*
⎛ a11
xm*
)
⎜ ⎜
…
a1n
⎞⎛ ⎟⎜
y1*
⎞ ⎟
⎟⎜ ⎟
⎜⎝ am1
amn ⎟⎠ ⎜⎝ yn* ⎟⎠
E( X ,Y *) = X T AY * = (x1
也可以写成:
⎛
xm
)
⎜ ⎜
A1
⎞⎛ ⎟⎜ ⎟⎜
y1*
⎞ ⎟ ⎟
=
( x1
⎜⎝ Am ⎟⎠ ⎜⎝ yn* ⎟⎠
⎛ ⎜
A1Y
*
⎞ ⎟
xm ) ⎜
⎟
⎜⎝ AmY * ⎟⎠
y1*
x1
⎛ ⎜
a11
⎜ xm ⎜⎝ am1
yn*
…
a1n
⎞ ⎟
⎟ amn ⎟⎠
x1 A1Y *
Y * 已固定Ⅰ将在 X 中选
xm AM Y *
证明: ⇐
记
min j
ai*
j
=
min j
max i
aij
=
max i
min j
aij
=
max i
aij*
min j
ai*
j
=
ai*
j*
,
max i
aij*
=
ai* j*
故 aij* ≤ a , a i* j* i* j* ≤ ai* j i = 1, , m j = 1, , n
( ) ∴ aij* ≤ ai* j* ≤ ai* j ,即 αi* , β j* 是 G 的解
使得受益最大
x1* A1Y * ≤
xm* AmY *
x1* A1Y *
进一步:
中必有每个 AiY * ≤ VG*
xm* AmY *
( 因为若有某个 Ai0Y* > VG* ,则Ⅰ出αi0 ,即取 X = 0
1
0) ,
i0
此时Vi0 > VG* 矛盾。而且若有某 i0 ,使 Ai0Y* <VG* ,则必有 X i0=0 。
对策的文章,图克于 1950 年定义了“囚徒困境”问题。 60 年代,泽尔腾(1965)引入动态分析,提出“精练纳什均衡”概念。海萨尼(1967-1968)
则把不完全信息引入对策论的研究。
7.1.2 对策问题的组成
1. 局中人(参加者):一局对策的参加者。如齐王赛马例中局中人为齐王和田忌。 2. 策略:局中人在一局对策中对付对手的一个完整的方案。 策略集:局中人在一局对策中所有策略的全体。记为 S(分为有限和无限) 问:田忌和齐王的 S=? 答:(S={(上中下),(上下中),(中上下),(中下上),(下上中),(下中上)}) 3. 局势:在一局对策中,每个局中人都选定一策略后的各策略总和。
(1) VG = VG' (2) y*' = y* 若 X *' = (x1* xk*−1,xk*+1 xm* ) ,则 X * = (x1* xk*−1,0,xk*+1 xm* )
例 7.5 用优超原理求解下列对策问题
⎛ 1 0 3 4⎞
A
=
⎜ ⎜
-1
⎜2
4 2
0 2
1
⎟ ⎟
3⎟
⎜ ⎝
0
4
1
1
⎟ ⎠
其中 aij 为Ⅰ的得(也是Ⅱ的失),Ⅱ的得即为 − aij 。
( ) 故又称二人有限零和对策为矩阵对策,记为 G = S1, S2, A
2.理智局中人的选择
在矩阵对策中,局中人将如何选取自己的策略呢?
α1 举例说明,若 A = α2
α3
β1, β2 , β3 ⎜⎛ −1 3 − 2⎟⎞ ⎜4 3 2⎟ ⎜⎝ 6 1 − 8 ⎟⎠
⇒
∵ aij* ≤ ai* j* ≤ ai* j i = 1, , m j = 1, , n
∴
max i
aij*
≤
ai* j*
≤
min j
ai*
j
min j
max i
aij
≤
max i
aij*
≤
ai* j*
≤
min j
ai*
j
≤
max i
min j
aij
但对于任意
A
,有
max i
min j
aij
≤
min j
max i
aij
( ) ∴只有 ai* j*
=
min j
max i
aij
=
max min
i
j
aij
,即
αi* , β
j*
是鞍点