第七章_对策论(本)

合集下载

《管理运筹学-对策论》

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

对策论概述

对策论概述

对策论对策论是对决策者之间的行为的相互影响的研究。

因为对对策论的研究特别强调决策者行为的理性,在过去的二十年间,对策论已被广泛地应用于经济学中。

确实大多数经济行为能够被看成是对策论的一个特殊的情形。

5.1 对策的描述一个对策是对许多决策者的行为的相互影响的正式的表示。

行为的相互影响意思是每一个人的福利不仅依赖她自己的行为而且依赖其他人的行为。

而且她可能采取的最好的行为依赖于她对其他人的行为的预期。

要想完整地描述一个对策,我们必须知道以下四件事情:(1)局中人:有那些人卷入该对策?(2)规则:谁什么时候行动?当他们行动时他们知道什么?他们能干什么?(3)结果:对于局中人的每一组行为,对策的结果是什么?(4)报酬:局中人关于各种可能的结果的偏好(也即效用函数)是什么?例子5.1.1:配对的便士(A)局中人:这里有两个局中人,分别记为1和2。

规则:两个局中人同时抛下一个便士,要么正面向上要么反面向上。

结果:如果两个便士是配对的(要么两个正面向上要么两个反面向上),那么局中人1付一元钱给局中人2;否则,局中人2付一元钱给局中人1。

报酬:每个局中人的报酬简单地等于她得到的或失去的钱的数量。

一般地,这里有两种方法描述一个对策:策略(规范)形式的表示和扩展形式的表示。

5.1.1 一个对策的策略(规范)形式表示假设这里有有限个局中人,局中人的集合为},,2,1{I 。

每一个局中人i ∈},,2,1{I 有一个策略集,记为i S 。

在一个-I 人对策中,局中人的策略组合用一个向量表示为},,{1I s s s =,这里i s 是局中人i 的策略选择。

有时我们也把策略组合s 表示成),(i i s s -,这里i s -是除了局中人i 以外的)1(-I 个局中人的策略组合。

对于每一个策略组合},,{1I s s s =,局中人i 的效用函数为),,(1I i s s u 。

一个-I 人对策的规范形式的表示记为)}]({},{,[⋅=Γi i N u S I 。

对策论讲义

对策论讲义

对策论讲义对策论【教学内容】对策论的基本概念,纳什均衡,矩阵对策,二人的无限零和对策,有限的二人非零和对策,n人合作型对策与n人合作型对策。

【教学要求】要求学生理解对策论的基本概念,掌握矩阵对策的求解方法;理解纳什均衡的概念及相应的求解方法、理解二人的无限零和对策及有限的二人非零和对策问题,了解n人合作型对策与n人合作型对策。

【教学重点】对策论的基本概念、矩阵对策及求解、纳什均衡与求解、二人的无限零和对策,有限的二人非零和对策。

【教学难点】建立对策的模型求解。

【教材内容及教学过程】对策论来自于生活。

简单的问题如游戏,决策者的策略对最终结果有着举足轻重的影响,但决策者的策略选择也要考虑其它策略者的策略选择,现实生活中一个坏的策略选择未必带来坏的结果(原因是他方选择了对自己不利,对前者有利的策略),对策论的研究中排除了对方犯错误的可能性,每个决策者都在考虑到他方的各种策略后,选择对自己最有利的策略。

对策论解决的问题大的象经济生活中的经营决策、市场竞争,政治、军事活动中的竞选、谈判、联合和战争等,从这点来说对策论大有用武之地。

本章先介绍了对策论的基本概念,然后通过例子介绍了纳什均衡的概念及求解方法,重点介绍了二人零和对策(矩阵对策)与求解,接着介绍二人的无限零和对策、有限的二人非零和对策。

最后介绍n人合作型对策与n人合作型对策,目的是让学生通过本章学习,对其基本方法有所掌握与了解,为以后的实际应用打好基础。

i.§1.1 对策的三要素第一节引言从前述可看出对策论是研究具有斗争或竞争性质现象的数学理论和方法。

根据不同性质的问题,可建立不同的对策模型。

尽管对策模型的种类可以千差万别,但本质上都必须包含3个基本要素:1.局中人局中人即在一个对策行为中,有权决定自己行动方案的对策参加者。

通常用I表示局中- 1 -人的集合,如果有n个局中人,则I=?1,2,3,…n两个局中人。

?。

一般要求一个对策中至少要有对策中关于局中人的概念是广义的。

第七章 博弈论

第七章  博弈论

第七章 教学要求



1、概念:博弈论、占优策略、占优策略 均衡、纳什均衡 2、理解占优策略均衡与纳什均衡的关系。 3、掌握支付矩阵表,能够准确找到博弈 均衡的解。 4、掌握序贯博弈的博弈树均衡解法。 5、理解经典案例的启示。
其实,世上最温暖的语言,“ 不是我爱你,而是在一起。” 所以懂得才是最美的相遇!只有彼此以诚相待,彼此尊重, 相互包容,相互懂得,才能走的更远。 相遇是缘,相守是爱。缘是多么的妙不可言,而懂得又是多么的难能可贵。否则就会错过一时,错过一世! 择一人深爱,陪一人到老。一路相扶相持,一路心手相牵,一路笑对风雨。在平凡的世界,不求爱的轰轰烈烈;不求誓 言多么美丽;唯愿简单的相处,真心地付出,平淡地相守,才不负最美的人生;不负善良的自己。 人海茫茫,不求人人都能刻骨铭心,但求对人对己问心无愧,无怨无悔足矣。大千世界,与万千人中遇见,只是相识的 开始,只有彼此真心付出,以心交心,以情换情,相知相惜,才能相伴美好的一生,一路同行。 然而,生活不仅是诗和远方,更要面对现实。如果曾经的拥有,不能天长地久,那么就要学会华丽地转身,学会忘记。 忘记该忘记的人,忘记该忘记的事儿,忘记苦乐年华的悲喜交集。 人有悲欢离合,月有阴晴圆缺。对于离开的人,不必折磨自己脆弱的生命,虚度了美好的朝夕;不必让心灵痛苦不堪, 弄丢了快乐的自己。擦汗眼泪,告诉自己,日子还得继续,谁都不是谁的唯一,相信最美的风景一直在路上。 人生,就是一场修行。你路过我,我忘记你;你有情,他无意。谁都希望在正确的时间遇见对的人,然而事与愿违时, 你越渴望的东西,也许越是无情无义地弃你而去。所以美好的愿望,就会像肥皂泡一样破灭,只能在错误的时间遇到错的人。 岁月匆匆像一阵风,有多少故事留下感动。愿曾经的相遇,无论是锦上添花,还是追悔莫及;无论是青涩年华的懵懂赏 识,还是成长岁月无法躲避的经历……愿曾经的过往,依然如花芬芳四溢,永远无悔岁月赐予的美好相遇。 其实,人生之路的每一段相遇,都是一笔财富,尤其亲情、友情和爱情。在漫长的旅途上,他们都会丰富你的生命,使 你的生命更充实,更真实;丰盈你的内心,使你的内心更慈悲,更善良。所以生活的美好,缘于一颗善良的心,愿我们都能 善待自己和他人。 一路走来,愿相亲相爱的人,相濡以沫,同甘共苦,百年好合。愿有情有意的人,不离不弃,相惜相守,共度人生的每 一个朝夕……直到老得哪也去不了,依然是彼此手心里的宝,感恩一路有你!

对策论

对策论
对 策 论
对策论(博弈论) 中文名称:博弈论 英文名称:game theory 定义1:一种处理竞争与合作问题的数学决策方法。 应用学科:地理学(一级学科);数量地理学 (二级学科) 定义2:研究竞争中参加者为争取最大利益应当如何 做出决策的数学方法。 应用学科:生态学(一级 学科);数学生态学(二级学科) 定义3:根据信息分析及能力判断,研究多决策主体 之间行为相互作用及其相互平衡,以使收益或效 用最大化的一种对策理论。 应用学科:资源科技 (一级学科);资源管理学(二级学科)

高中概率、排列、组合知识的学习。

• 例2:河南政法 2010A-41)把 9 个苹果分 给 5 个人,每人至少一个苹果,那么不同 的分法一共有多少种?
• A.30 B.40 C.60 D.70
• [强化 1]D • [简析]9 个苹果排成一排,形成 8 个空, 中间插上 4 个挡板,就可以把这 9 个苹果 分成 5 份,并且每份至少 1 个。在 8 个空 中插上 4 个档板:C4/8=70 (种)分法。
• [例 5]B • [简析]挑选 2 个不同的年级有 3种情形, 总共有 5×6+6×3+3×5=63(种)选择。
• [例 9]A • [简析]先插入第一个节目,有 4 个位置, 所以有 4 种方法;再插入第二个节目,此 时有 5 个位置, • 所以有 5 种方法。共有不同安排方法 更多 资料4×5=20 种。
• • 例1:田忌与齐威王赛马并最终获胜被传为 佳话。假设齐威王以上等马、中等马和下 等马的固定顺序排阵,那么田忌随机将自 己的三匹马排阵时,能够获得两场胜利的 概率是( )。福建 (2010-101) • A.2/3 B.1/3 C.1/6 D.1/9
• C • • [简析]田忌随机排布自己的三匹马一共 有 A3 /3种方法,但是只有“下等马、上等 马、中等马”这种唯一的排布可以获得两 场胜利,所以概率为 1/6。

第七章 对策论习题课精品文档67页

第七章  对策论习题课精品文档67页

s1 s2
1 2 3 4
1
2
7
1
3
2
16 1 136 02
3 m-in8aij
8
2
4
-3
3 -3
55
m miaxm aijja a ix ji m n j m iia n ia j a 2 x 22
G 的解为(2,2), VG=2 , 2 与2分别是 局中人I和II的最优纯策略。
例3 求解矩阵对策 G ={S1, S2; A},其中
例4 某单位采购员在秋天要决定冬季取 暖用煤的贮量局中问人题I。:采已购知员在正常的冬季气温条 件下要消耗1三5个吨策煤略,:在在较秋天暖时与买较煤冷的气温条件 下要消耗10吨10和吨2、0吨15。吨假、定20冬分季别记时的煤价随天 气寒冷程为度:而有1,所2变,化3,, 在较暖、正常、较冷 的气候条件下局中每人吨I煤I:价大分自然别为10元,15元和20 元,又设秋季三种时策煤略价:为冬每季出吨现10元.在没有关于 当年冬季准确较的暖气、象正预常报、的条较件冷下,秋季贮煤 多少吨能分使别单记位为的:支1出,最2少,?3,
齐王 上 中 下 田忌 下 上 中
最终净胜一局,赢得1000金。
表14-1 齐王赛马中齐王的赢得表
田忌
1
的策略 上
齐王

的策略

1上 中 下
3
2上 下 中
1
3中 上 下
1
4中 下 上
-1
5下 中 上
1
6下 上 中
1
2
3
4
5
6









博弈论与策略性行为

博弈论与策略性行为
寡头垄断市场上的卖方将价格定在足以 获得经济利润,但又不致于引起新企业进入 的水平上。
与掠夺性定价的异同
企业采用限制性定价,直接目的是阻止新 企业进入市场,但实质上这是一种牺牲部分短 期利润以追求长期利润最大化。因此同掠夺性 定价一样,都是企业长期定价的策略性行为。 所不同的是采用限制性定价的企业短期内仍有 “利润”,而采用掠夺性定价的企业在短期内 处于亏损状态。
动态限制性定价
是指一家在位企业在长期内确定价格和产 量来减少或消除导致新企业进入它所在市场的 诱因的方法。
市场主导企业经常是先定立一个高价,然 后随新企业进入逐渐降低价格。现实经济中, 我们可以看到,新产品刚刚导入时价格定得很 高,然后逐渐回落到竞争性价格水平。
影响限制性定价的主要因素
市场进入壁垒高,新企业难以进入, 阻止的价格也就高。壁垒低,新企业容易 进入,要阻止新企业进入,必须按平均的 甚至更低的利润水平定价。
第七章 博弈论与策略性行为
博弈论又称为对策论或游戏论,是研究决 策主体的行为发生直接相互作用时的决策以及 这种决策的均衡问题。
近20年来,博弈论在经济学中得到了广泛 的应用,它对寡头理论、信息经济学等方面的 发展做出了重要贡献。
1994年度的诺贝尔经济学奖授予三位从事对策论 研究的经济学家:纳什、泽尔腾、海萨尼。
(2)对于现实经济而言,掠夺性定价并不是 经常发生,大企业更愿意通过兼并来消灭竞 争者,因为兼并能使企业免受低价造成的利 润损失,又有利于增强企业的实力和竞争力。
什么情况下掠夺性定价行为难以成功?
两家企业的成本函数相同 完全可竞争市场
二、限制性定价行为
限制性定价又称阻止进入定价,指一家 在位企业将其价格和产量定在新企业进入市 场后所剩的需求不足以使它生存的水平。

第七章 对策论

第七章 对策论

设 局 中 人 Ⅰ 用 概 率 xi 选 用 策 略 αi , 局 中 人 Ⅱ 用 概 率 y j 选 用 策 略 β j ,
m
n
∑ ∑ xi = y j = 1 ,记 x = (x1,L, xm )T , y = ( y1,L, yn )T ,则局中人Ⅰ的期望赢得为
i =1
j =1
E(x, y) = xT Ay 。
方都供认伪造了钱币,将各被判刑 3 年;如果一方供认另一方不供认,则供认方将被从
宽处理而免刑,但另一方面将被判刑 7 年。将嫌疑犯 A 、 B 被判刑的几种可能情况列
于表 1。
表1
嫌疑犯 B
供认
不供认
嫌疑犯 A
供认 不供认
(3,3) (7,0)
(0,7) (1.5,1.5)
表 1 中每对数字表示嫌疑犯 A、B 被判刑的年数。如果两名疑犯均担心对方供认并希
望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。 从这一简单实例中可以看出对策现象中包含有的几个基本要素。 2.1 对策的基本要素 (i)局中人 在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局
中人。通常用 I 表示局中人的集合.ቤተ መጻሕፍቲ ባይዱ果有 n 个局中人,则 I = {1,2,L, n} 。一般要求 一个对策中至少要有两个局中人。在例 1 中,局中人是 A、B 两名疑犯。
炸机飞至 B 方上空,受到 B 方战斗机的阻击。若战斗机阻击后面的轰炸机Ⅱ,它仅受
Ⅱ的射击,被击中的概率为 0.3(Ⅰ来不及返回攻击它)。若战斗机阻击Ⅰ,它将同时受
到两架轰炸机的射击,被击中的概率为 0.7。一旦战斗机未被击中,它将以 0.6 的概率
击毁其选中的轰炸机。请为 A、B 双方各选择一个最优策略,即:对于 A 方应选择哪

对策论

对策论
对策论
在日常生活中,经常可以看到一些具有相互斗 争或竞争性质的行为,
如下棋、打牌、体育比赛等 还有企业间的竞争、军队或国家间的战争、政治斗 争等,都具有对抗的性质。
这种具有竞争或对抗性质的行为称为对策行为。
在这类行为中,各方具有不同的目标和利益。为实 现自己的目标和利益,各方必须考虑对手可能采取 的行动方案,并力图选择对自己最为有利或最为合 理的行动方案。
在田忌赛马中
局中人集合I={1,2}
齐王和田忌的策略集合可分别用S1={α1,…,α6}, S2={β1,…,β6}
齐王的任一策略αi和田忌的任一策略βj就构成了一个 局势sij
如果α1 =(上,中,下), β1 =(上,中,下), 则在局势s11下,齐王的赢得为H1(s11)=3,田忌的赢 得为H2(s11)=-3
6 1 8 3 2 4 A 9 1 10 3 0 6
局中人Ⅰ当然也会猜到局中人Ⅱ的这种心理,转而出α4来对 付,使局中人Ⅱ得不到10,反而失掉6; …… 如果双方都不想冒险,都不存在侥幸心理,而是考虑到对方 必然会设法使自己所得最少这一点,就应该从各自可能出现 的最不利情形中选择一个最有利的情形作为决策一句。 这就是所谓的“理智行为”,也是对策双方实际上可以接收 并采取的一种稳妥的方法。
对策问题举例:市场购买力争夺问题
据预测,某乡镇下一年的饮食品购买力将有4000万元。乡镇企 业和中心城市企业饮食品的生产情况是:乡镇企业有特色饮食品 和一般饮食品两类,中心城市企业有高档饮食品和低档饮食品两 类产品。他们购买这一部分购买力的结局表如下。
乡镇企业所得(万元)
乡镇企业 的策略 出售特色饮食品
即局中人Ⅰ、Ⅱ的策略集分别为

对策论

对策论

对策论(Theory of Games)第1、2讲对策论也称博弈论,是运筹学的一个重要分支。

1928年冯·诺意曼(J.von Neumann)等人由于经济问题的启发,研究了一类具有某种特性的博弈问题,这是对策论的最早期的工作。

在我国古代的战国时期,“齐王与田忌赛马”就是一个非常典型的对策论的例子。

对策论所研究的主要对象是带有斗争性质(或至少含有斗争成分)的现象。

由于对策论研究的对象与政治、军事、工业、农业、交通、运输等领域有密切关系,处理问题的方法又有着明显的特色,所以越来越受到人们的注意。

日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为,例如下棋、打牌、体育比赛等,还如战争活动中的双方,都力图选取对自己最为有利的策略,千方百计去战胜对手,在政治方面,国际间的谈判,各种政治力量之间的斗争。

各国际集团之间的斗争等无一不具有斗争的性质。

经济生活中,各国之间、各公司之间的各种经济谈判,企业为争夺市场而进行的竞争等,举不胜举。

具有竞争或对抗性质的行为,称为对策行为。

在这类行为中,参加斗争或竞争的各方各自具有不同的目标和利益,为了达到各自的目标和利益各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案,对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。

在我国古代,“齐王赛马”就是一个典型的对策论研究的例子。

战国时期,齐王有一天提出要与大将田忌赛马。

双方约定:从各自的上中下三个等级的马中选一匹参赛。

每匹马均只能参赛一次;每次比赛双方各出一匹马,负者要付给胜者千金。

已经知道,在同等级的马中,田忌的马不如齐王的马,而如果田忌的马比齐王的马高一等级,则田忌的马可取胜。

当时,田忌手下的一个谋士给田忌出了个主意:每次比赛时先让齐王牵出他要参赛的马,然后用下马对齐王的上马,用中马对齐王的下马,用上马对齐王的中马。

比赛结果,田忌,二胜一负,可得千金,由此看来,两人各采取什么样的出马次序,对胜负是至关重要的。

对策论 书籍

对策论 书籍

对策论书籍
《对策论》是一本关于解决问题的实用指南,旨在帮助读者在面对各种挑战和困境时制定有效的对策。

本书不仅提供了丰富的案例分析和实践经验,还探讨了对策制定的基本原理和方法。

通过深入浅出的讲解和生动有趣的故事,本书将帮助读者提高对策制定的能力,成为解决问题的高手。

在本书中,作者首先介绍了对策制定的基本概念和原则。

对策制定是一个系统性的过程,需要全面分析问题的根源、背景和影响因素,以及评估各种解决方案的可行性和效果。

作者强调了对策制定的科学性和客观性,不应受到个人主观意识和偏见的干扰。

接着,本书通过一系列实例,展示了对策制定的具体步骤和方法。

首先是问题定义和目标设定,明确要解决的问题和期望达到的目标。

其次是信息收集和分析,通过搜集相关数据和信息,并进行综合分析,以获得全面准确的问题认知。

然后是解决方案的生成和评估,通过头脑风暴和评估方法,产生多种可能的解决方案,并比较它们的优缺点。

最后是方案实施和监控,确保对策能够顺利实施并取得预期效果。

在本书的后半部分,作者还重点介绍了一些常见问题的对策制定方法。

例如,如何应对市场竞争激烈、技术变革迅速的挑战;如何应对组织内部冲突和团队合作问题;如何应对外部环境的不确定性和风险等。

通过具体案例的分析和讲解,读者可以学习到不同情境下
的对策制定技巧和经验。

《对策论》是一本实用性强的书籍,它不仅为读者提供了对策制定的理论知识,还通过大量的实例和案例,帮助读者掌握实际应用的技巧和方法。

通过阅读本书,读者可以提高对策制定的能力,更好地解决问题,实现自身的发展和成功。

让我们一起读这本书,成为对策制定的高手!。

对策论

对策论

第一节:概述 一、对策现象对策是决策者在竞争(对抗)条件下做出的,关于行动方案的决定,或者说,是在竞争(对抗)条件下的决策。

对策论是研究对策现象并寻求致胜策略的一门科学,是运筹学的一个重要分枝。

早在战国时期,就有一个齐王、田忌赛马的故事 如出三匹马,三场比赛,输一场就输千金在现代的企业经营管理中,竞争(对抗)更加激烈,更加复杂,不过从上例,可见在竞争(对抗)中,如何寻求致胜策略是大可研究的。

二、对策现象的三要素1、局中人:齐王一方,田忌(孙膑)一方;桥牌:东、南、西、北 三国:刘、孙、曹2、策略:局中人的可行的、自始自终通盘筹划的行动方案称策略: 如: 是三个不同的策略,策略的全体,称为策略集合。

3、一局对策的得失上 下 中中 中 上 下 上 下从每个局中人的策略集合中采取一个策略组成的策略组,称作局势。

得失是局势的函数。

如果在任一局势中,全体局中人的“得失”相加总是等于0时,这个对策就称为“零和对策”,否则就称为“非零和对策”。

对策的分类:一、矩阵对策矩阵对策就是二人有限零和对策。

它是指这样一类对抗和争斗现象。

1、局中人:二人;2、每个局中人都仅有有限个可供选择的策略;3、在任何一局势中,两个局中人的得失之和恒为零,即局中人甲的所得,总是局中人乙的所失。

这类对策比较简单,在理论上也比较成熟。

而且这些理论奠定了研究“对策现象”的基本思路。

矩阵对策是对策论的基础。

矩阵对策:有鞍点,无鞍点 二、数学模型a 2 a 21 A 2 … a 2n … … … … …a ma m1a m2…a mn其中a ij 为当甲出策略a i ,乙出策略βj 时,甲的赢得或支付; -a ij 为当甲出策略a i ,乙出策略βj 时,乙的赢得或支付; 因为A=(a ij )mxn 为局中人甲的赢得矩阵; A *=(-a ij )mxn 为局中人乙的赢得矩阵。

以甲方赢得矩阵为准:S 1=(a 1,a 2,…,a m )叫甲的策略集合; S 2=(β1,β2,…,βn )叫乙的策略集合;为了和以后的(无鞍点、混合策略相区别),称a i ,βj 叫做纯策略。

对策论

对策论

对策型决策当决策系统中的自然状态是由竞争对手的策略(行动方案)决定的时候,这种情况下的决策就构成了对策型决策。

与上不同的是此时的自然状态的出现是由人决定的,甚至是比你聪明的对手出的招数。

对策论是研究对策型决策的数学学科,即在不完全知道对方行动或意图的条件下构建和研究的数学决策模型。

对策论(Game Theory)又称为博弈论,是研究带有竞争与对抗问题的理论与方法。

在现实生活中,我们常常看到双方对抗、竞争的现象,例如从日常生活中的下棋、游戏到政治、军事上的斗争,以及经济领域各个企业的相互竞争,均属此类现象。

最著名的例子是田忌赛马和乒乓球团体赛队员出场名单及出场顺序。

在有对抗性和竞争性现象中,斗争的各方总是希望自己一方最终取得胜利或获的尽可能好的结局。

但是总会遭遇对方的干扰、破坏、抵抗或进攻。

在这种情况下人们想获得尽可能好的结局,必须考虑对手可能怎样采取策略,从而选取自己的一个好的对付策略。

对策型决策的三要素:1局中人:具有决策权的双方(或多方)称为局中人。

如棋局中的对弈双方,战争中敌我双方的司令员等。

2 策略:是指决策者为了战胜对手所可能选择的行动方案。

所有策略一起构成一个策略集。

每个局中人各有一个策略集。

3 局势和支付函数:在对策型决策问题中,每一个局中人从各自的策略集中任取一个策略,组成的策略组称为一个局势。

局势直接导致的结果是局中人是失败还是成功,对它的定量表述在一般经济问题中称为支付函数。

支付函数是以局势为自变量,以局中人的得失为因变量的函数。

我们下面主要讨论零和对策和矩阵决策。

所谓零和决策是指:若在任意局势中,全体局中人的得与失相加等于零,这种决策称为零和决策。

又当只有两个局中人且他们的策略集均是有限集时,支付函数可用矩阵表示,称此时的零和对策为矩阵决策。

矩阵对策及其数学模型:局中人Ⅰ的m个纯策略S1={α1,α2,…αm}。

局中人Ⅱ的n个纯策略S2={β1,β2,…βn}。

支付矩阵:A=(aij )m*n称为局中人Ⅰ的赢得矩阵(或局中人Ⅱ的损失矩阵),即aij 表示在局势(αi,βj)的情况下局中人Ⅰ赢得的值(等于局中人Ⅱ损失值)。

第7章对策论

第7章对策论

7
二、求解 1·稳妥性原则 局中人在公开对策的前提下,都从最坏处着想,在最坏的环境中争取最好的结果。
例1-4 某企业决定由职工代表大会选举行政负责人,经提名产生候选人甲和乙。他们根据企业的 发展战略和群众关心的事业各自提出了企业改革的方案。甲提出了四种:1,2,3,4; 乙提出了三种:1,2,3。他们的参谋人员为使竞争对本方有利,予先作了个民意抽样 测验。因各方提供的不同策略对选票吸引力不同。测验选票经比较后差额如下表
解:建模,设局中人甲为:贮煤量决策者; 局中人乙为:未来冬季气候。
费用总和=秋季贮煤量费用+冬季补购煤量费用
aij 乙 甲 1(10 吨)
2(15 吨)
3(20 吨)
1 (较暖) -(10×340)=-3400
-(15×340)=-5100
-(20×340)=-6800
2 (正常)
-(10×3Hale Waihona Puke 0+5×420)=-5500
局势的得失总和为0。
七、对策的分类
2
联合对策
结 盟 对

合作对策
零和
静 态
二人
对 策

有 限
非零和 零和


多人

非零和

对 策
二人
零和
无 限
非零和
多人
零和

态 对
微分对策
非零和

3
1.2 支付矩阵有鞍点的二人有限零和对策
一、特点
1·策略公开。 2·得失确定且总和为零:一方所得必为另一方所失,局中人利益冲突(对抗对策)。
例1-2.两小孩玩石头、剪刀、布的游戏:甲、乙两小孩出的手势都有可能是石头、剪刀、布,

运筹学与最优化方法课件--第七章--对策论模型--2012

运筹学与最优化方法课件--第七章--对策论模型--2012

海萨尼
值得一提的是纳什,他发表奠定 其在博弈论中重要地位的学术论文时,年 仅22岁,被人称为“一个天才”。1959年, 纳什被精神病医生诊断为“妄想性精神分 裂”,饱受精神病折磨40余年。
泽尔滕
二、基本概念
例1 市场上的某种商品仅由甲,乙两厂生产, 它们都 想通过内部改造,获得更多的市场份额,且两厂分别都有 三个可行方案.据预测,当双方采取不同的方案后甲厂的 市场占有份额(百分比)变动情况如下:
(五)静态博弈和动态博弈
1.静态博弈:是指所有博弈方同时或可看作同时选择策 略、采取行动的博弈。 2.动态博弈:是指博弈方的选择、行动有先有后,而且后 选择、后行动的博弈方在自己进行选择、行动之前可以看在 他之前选择、行动的博弈方的选择、行动的博弈。
(六)完全信息博弈和不完全信息博弈
1.完全信息博弈:是指每一参与者都拥有所有其他参 与者的特征、策略集及得益函数等方面的准确信息的博弈。 2.不完全信息博弈:是指参与者只了解上述信息中的 一部分的博弈。 将博弈的信息特征和行为时间特征结合起来,可以进一 步把博弈细分为下面四种类型的非合作博弈,得到四种均衡:
博 弈 论
美藉匈牙利数学家冯·诺依曼(John Von Neuman) 和美藉奥地利经济学家摩根斯顿(Morgenstern)相识于 普林斯顿大学,他们于1944年出版了经典著作《博弈论 与经济行为》,为现代博弈论的发展奠定了基础。
纳什
美国的数学家、经济学家纳什(John Nash), 美籍匈牙利经济学家海萨尼(John C. Harsanyi) 和德国经济学家泽尔滕(R.Selten)因对博弈论的卓 越贡献而获得1994年度的诺贝尔经济学家。
信息博弈 纳什均衡 完全信息动态博弈 子博弈精炼纳什均衡

第7章-对策论

第7章-对策论

例 设一对策 G S, D, A,其中 S s1, s2 , s3 ,
D d1, d2 , d3 ,其赢得矩阵为:
d1 d2 d3
A
s1 s2
3 6
1 0
2 - 3
前提: 对策双方均理智 结论:
s3 - 5 - 1 4 最不利中选最有利
问:双方局中人采用何策略最佳。
囚犯困境问题在经济、政治、军事等领域的应用举例
例:寡头垄断企业定价的博弈
卡特尔价格不是纳什均衡, 最终结果:每个企业按照纳什均衡的价格进行定价, 其利润小于卡特尔价格条件下的利润。
例:公共产品的供给博弈
如果大家都出钱兴办公用事业,所有人的福 利都会增加。问题是,如果我出钱你不出钱, 我得不偿失;而如果你出钱我不出钱,我就可 以占便宜。
赢 B 石头 剪子 布 A
石头 0 1 -1
剪子 -1
0
1
布 1 -1 0
分析:无确定最优解,可用“混合策略”求 解。
4.齐王赛马
战国时期,齐国国王有一天提出要与大将军田忌赛马。田 忌答应后,双方约定: 1)每人从上中下三个等级中各出一匹马,共出三匹; 2) 一共比赛三次,每一次比赛各出一匹马; 3) 每匹被选中的马都得参加比赛,而且只能参加一次; 4) 每次比赛后输者要付给胜者一千金。
解:可用下述表格表示上述寻找最优纯策略过程:
d1
d2
d3
min j
aij
s1
3
1
2
1
s2
6
0
-3
-3
s3
-5 -14-5源自max iaij6
1
4
故若双方都采取理智行为,局势 (s1 , d2 )为最优纯策略.

运筹学课件——对策1

运筹学课件——对策1
第7章 对策论
对策论的产生,发展和应用 对策论的产生 发展和应用
早期工作 (1)191献。策梅罗设法证明了,对于每一个严格争利 严格争利 的二人完备信息 完备信息对局,或者其中一个对策者有一个确定的胜局 完备信息 纯策略,或者二个都有可靠的平局纯策略。这个结果适用于象 棋一类的棋类对局,证明胜局策略或平局的存在是一回事,而 找出它们就是另一回事了。到目前为止,还没有人找出一局象 棋的胜局策略或平局策略,甚至不知道到底是某一方有一胜局 策略,还是双方都有平局策略.
(2)策略 一局对策中,可供局中人选择的一个实际可行 实际可行 的完整的行动方案称为一个策略。 的完整的行动方案 策略的全体称为策略集,策略集可以是有限或无限 的。若策略集为有限集称为有限对策,否则称为无 限对策。 参加对策的每个局中人(i∈I)都有自己的策略集, S i 一般,每一局中人的策略集中至少应包括两个策略。

(2) 对于对策论的产生作出了重要贡献的另一位数学
家是法国人波涅尔,1921--1927年间他发表了一系 列文章,建立了对策论的数学基础。但是,波涅 尔没有证明对策论的核心定理——极小极大定理, 他还轻率地预言这个定理是不能证明的。
(3)1928年冯·诺意曼证明了博弈论的基本原理,从 而宣告了博弈论的正式诞生.(德国数学家冯-诺意 曼简洁明确地证明了极小极大定理)。
发展成熟 Nash均衡、经济博奕论、信息不对称对策和广义 、 对策.
标准型,广义型和合作型等基本的博弈模型,解的概 标准型,广义型和合作型等基本的博弈模型, 念及分析方法,构建了博弈论的理论框架. 念及分析方法,构建了博弈论的理论框架.
(4) 谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博 弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什 均衡的概念和均衡存在定理。 此外,塞尔顿、哈桑尼的研究也对博弈 论发展起到推动作用。为此,美国的数学家、经济学家纳什(John
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2. 二人有限非零和对策(又称双矩阵对策)
第二部分 二人有限零和对策
§2 纯策略对策
一、纯策略与混合策略
纯策略是指确定的选择某策略;而混合策略 则指以某一概率分布选择各策略。 二、纯策略对策的解 1. 引例
D d1 , d 2 , d 3 ,其赢得矩阵为: d1 d 2 d 3

设一对策 G S , D, A,其中 S s1 , s2 , s3 ,
抵赖
-8,-8 0,-10 对策问题的基本要素 坦白 抵赖 -10,0 -1,-1 (1)局中人(Players) 参与对抗的各方;不一定指自然人 (2)策略集(Strategies) 局中人选择对付其它局中人的行动方案称为策略; 某局中人的所有可能策略全体称为策略集;
对策双方的策略集一般记为:
3
-1 1 1 1
1
3 1 1 -1
1
1 3 -1 1
1
1 1 3 1
-1
1 1 1 3
“齐王赛马”齐王在各局势的赢得表(单位:千金)
田忌 齐王
β1 β2 β3 β4 β5 β6 (上中下) (上下中) (中上下) (中下上) (下上中) (下中上)
α1 (上中下) α2 (上下中) α1 (中上下) α1 (中下上) α1 (下上中) α1 (下中上)
但是,尽管政府当时无力制止这种事情,公众也不 必担心彩电价格会上涨。这是因为,“彩电厂商自 律联盟”只不过是一种“囚徒困境”,彩电价格不 会上涨。在高峰会议之后不到二周,国内彩电价格 不是上涨而是一路下跌。这是因为厂商们都有这样 一种心态:无论其他厂商是否降价,我自己降价是 有利于自己的市场份额扩大的。 问题:明确该对策问题的各要素:局中人、策略集、 赢得矩阵
小猪

例:股票市场中的 大户、小户 大 按 猪 等待 5,1 9,-1
等待
4,4 0,0
例:市场中的大企业、小企业
进行研究开发、为新产品做广告,对大 企业是值得的,对小企业则得不偿失。
所以,一种可能的情况是,小企业把精 力花在模仿上,或等待大企业用广告打开 市场后出售廉价产品。
小猪

大 按 猪 等待 例:公共产品的提供 村里住两户人家,一户富,一户穷,有 一条路年久失修。这时候,富户一般会承 担起修路的责任,穷户则很少这样干,因 为富户常常高朋满座,路用得更多。穷户 对于修路无所谓。 5,1 9,-1
他的故事被好莱坞拍成了电影《美丽心灵》,该影片获 得了2002年奥斯卡金像奖的四项大奖
三、对策问题举例
1. 囚犯困境(Prisoners’ dilemma) 囚犯困境是图克(Tucker)1950年提出的 该对策是博弈论最经典、著名的博弈 该博弈本身讲的是一个法律刑侦或犯罪学方 面的问题,但可以扩展到许多经济问题,以 及各种社会问题,可以揭示市场经济的根本 缺陷
最终结果:每个人都“不出钱”。这种纳什 均衡使得所有的人的福利都没法得到提高。
例:军备竞赛
冷战期间,美苏两国的军备竞赛,使得两国 的社会福利都变得更糟。
案例分析: 生活中的“囚徒困境”例 子
—— 商家价格战 出售同类产品的商家之间本来可以通 过共同将价格维持在高位而获利,但实 际上却是相互杀价,结果都赚不到钱。 当一些商家共谋将价格抬高,消费者 实际上不用着急,因为商家联合维持高 价的垄断行为一般不会持久,可以等待 垄断的自身崩溃,价格就会掉下来。
S s1 , s2 ,, sm D d1 , d 2 ,, d n
例:囚犯困境中,每个囚犯均有2个策略: {坦白,抵赖}
坦白
抵赖 0,-10 -1,-1
(3)局势
坦白 抵赖
-8,-8 -10,0
当每个局中人从各自策略集合中选择一策略而组 成的策略组成为一个局势,用 ( si , d j )来表示。 (4)赢得(支付)
前提: 对策双方均理智 结论: 最不利中选最有利
s1 3 A s 2 6 s 3 - 5
1 0 -1
2 - 3 4
问:双方局中人采用何策略最佳。
解:可用下述表格表示上述寻找最优纯策略过程:
d1 s1 s2 s3 3 6 -5 6 d2 1 0 -1 1 d3 2 -3 4 4
• • • 我国春秋战国时期的“孙子兵法” ; 围棋,发明于我国殷代; 对策作为一种数学理论开始于1944年。
由美国数学家冯· 诺依曼(Von. Neumann)和经济学家 摩根斯坦(Morgenstern))发表了题为“博弈论与经济行 为”的著作 • 1950年,纳什完成博士论文“非合作博弈”, • 九十年代以来博弈理论在金融、管理和经济领域 中得到广泛应用
大 按 猪 等待
5,1
Nash均衡:
(按,等待)
9,-1
0,0
小猪
智猪博弈的应用举例
大 按 猪 等待

5,1 9,-1
等待
4,4 0,0
例:大、小股东的职责
股份公司中,股东承担着监督经理的职能。 监督需要成本,大股东从监督中获得的好 处要多于小股东。 Nash均衡:大股东担当起搜集信息、监督 经理的责任,小股东“搭便车”。
min a ij
j
1 -3 -5
max aij
i
故若双方都采取理智行为,局势 ( s1 , d 2 )为最优纯策略.
2. 纯策略分析
(1)局中人甲对每个策略si的评价值为
si
* i
评价
f ( si ) min a ij
j
故局中人甲选择策略模型为:
s max f ( si ) maxminaij Vmax

坦白 坦白 Ⅰ 抵赖 -8,-8 -10,0
抵赖 0,-10 -1,-1 均衡解:
二人均坦白
相关概念介绍
对策分析的基本假设
(1)个人理性
假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。 (2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最 大化的策略。
坦白
囚犯困境问题在经济、政治、军事等领域的应用举例
例:寡头垄断企业定价的博弈
卡特尔价格不是纳什均衡, 最终结果:每个企业按照纳什均衡的价格进行定价, 其利润小于卡特尔价格条件下的利润。
例:公共产品的供给博弈
如果大家都出钱兴办公用事业,所有人的福 利都会增加。问题是,如果我出钱你不出钱, 我得不偿失;而如果你出钱我不出钱,我就可 以占便宜。
i i j
(2)局中人乙对每个策略dj的评价值为
dj
评价
g (d j ) max a ij
i
故局中人乙选择策略模型为:
d ming(d j ) minmaxaij Vmin
* j j j i
3. 纯策略对策模型的解
(1) 鞍点与解 对于一个对策 G S , D, A ,如果有
局中人采用某局势时的收益值。 例:当局中人甲选择策略si ,局中人乙选策略 dj 时,局中人甲的赢得值可用 R(si , d j ) 表示。 甲
坦白
抵赖 0,-10 -1,-1
继续讨论“囚犯困境”问题: 坦白
抵赖
-8,-8 -10,0
启示:个人理性和集体理性的矛盾
当一个社会中的每个个体都为自身的 利益打算时,即使大家都遵守社会规则, 个体的行为不一定能实现个体的最佳利益。 结论:政府在社会经济活动中的组织协调 工作是必需的,放任自流不是导致全社会 最大福利的最佳政策。
等待
4,4 0,0
3.中国的游戏——“剪刀、石头、布”
小孩A与B猜手,若规定赢得1分,平得0分, 输得 -1分,则 A的赢得可用下表来表示。
赢 B 石头 A 石头
剪1
1
0
-1
1
0
分析:无确定最优解,可用“混合策略”求 解。
4.齐王赛马
战国时期,齐国国王有一天提出要与大将军田忌赛马。田 忌答应后,双方约定: 1)每人从上中下三个等级中各出一匹马,共出三匹; 2) 一共比赛三次,每一次比赛各出一匹马; 3) 每匹被选中的马都得参加比赛,而且只能参加一次; 4) 每次比赛后输者要付给胜者一千金。 当时在三个不同等级中,齐王的马要比田忌的强些,看来 田忌要输三千金了,但由于田忌采用了谋士的意见,最终 反败为胜。谋士的主意是: 1) 每次比赛前先让齐王说出他要出哪匹马; 2) 让田忌用下马对齐王上马; 3) 用中马对齐王下马; 4) 用上马对齐王中马。
2、按局中人赢得
3、按解的表达形式
4、按对策过程
本课件的分类思路:
1. 二人有限零和对策(又称矩阵对策)
• 特点: • 局中人为2; • 对策双方的策略均有限; • 对策双方的赢得值之和为零。
• 记矩阵对策为:
G = {S, D, A} 甲的策略集 甲的赢得矩阵 乙的策略集 • 例:“齐王赛马”即是一个矩阵策略。
2、智猪博弈
猪圈里有两头猪:一头大猪、一头小猪,猪圈 的一头有一个猪食槽,另一头安装一个按钮,控制 着猪食的供应。按一下按钮就会有10个单位的猪食 进槽,但谁按按钮谁就需要付2个单位的成本。若 大猪先到,大猪吃到9个单位,小猪只能吃1个单位; 若同时到,大猪吃到7个单位,小猪吃3个单位;若 小猪先到,大猪吃到6个单位,小猪吃4个单位; 小猪 按 等待 4,4
三、对策问题举例
1. 囚犯困境(Prisoners’ dilemma)
两名囚犯I和II因涉嫌抢劫被捕。警方 因证据不足 先将二人分关二室,并宣布: 若二人均不坦白,则只能因藏有枪支而被判刑1年; 若有一人坦白而另一个不坦白,则坦白者无罪释放, 不坦白者 被判刑10年; 若二人都坦白了,则同判8年。 此二人确系抢劫犯,请分析他们的抉择。

纳什简介 1994年诺贝尔经济学奖获得者, 纳什在普林斯顿读博士时刚刚20岁出 头,他的一篇关于非合作博弈的博士 论文和其他两篇相关文章确立了他博 弈论大师的地位。到上世纪50年代末, 他已是闻名世界的大牌科学家了。
相关文档
最新文档