第五讲 博弈论与决策策略
博弈论原理 第5讲 不完全信息静态博弈
贝叶斯纳什均衡
不完全信息博弈-无法避免的不确定性
有一次,主人派伊索进城。半路上,他遇见一位法官。法官严厉 地盘问:“你要去哪儿?” 伊索回答说“不知道” 。法官起了 疑心,派人把伊索关进了监狱,严加审问。“法官先生,要知道, 我讲的是实话。”伊索说,“我确实不知道我会进监狱”。
5.1 不完全信息与不完全信息静态博弈
二、静态贝叶斯博弈的表示 在静态贝叶斯博弈中,各博弈方虽然知道自己的 得益函数,但却无法了解其他博弈方的得益函数,按照 一般静态博弈分析方法无法解决该问题。为此,我们可 以这样来考虑:虽然一些博弈方(如博弈方k)不能确定 其他博弈方在一定策略组合下的得益,但一般知道其他 博弈方(如博弈方i)的得益有哪些可能的结果,而具体哪 种可能的结果会出现则取决于博弈方属于哪种“类型” (Type)。这些“类型”是博弈方自己清楚而他人博弈 方无法完全清楚的有关私人内部信息。
低成本情况 斗争 -10,100 0,400
进入者关于在位者成本信息是不完全的,进入者的最优选择依赖于他在多大程度上 认为在位者是低成本的。 假定进入者认为在位者是高成本的概率是p,低成本的概率是(1-p),那么,进入 者选择进入的期望利润是p(40)+(1-p)(-10),选择不进入的利润是0,因此, 进入者的最优选择是:如果p>=1/5,进入,如果p<1/5,当p=1/5时,进入与不进 入是无差异的,我们假定其进入。
密封拍卖一般有这样几个基本特征: (1)各方的报价放在密封的信封里上交 (2)在统一的时间里公证开标; (3 )每一个报价方知道自己对标的的估 价,但不知 道其他报价方对标的的估价 (4)一般是标价最高者中标
显然, 拍卖或招投标问题属于不完全信息博弈,包括不 完全信息静态博弈和不完全信息动态博弈。
经济学原理十六讲(高辉)5第五讲 博弈与经济行为-PPT课件
经济学原理十六讲 College of Business : Chengdu University of Technology
第一节 博弈论
还能举出生 活中的博弈的例 子吗
至少两个参与者
• 博弈论的参与者又被成为决策主体。没有参与者就不 会有博弈,而且参与者至少为两人。
利益
• 博弈的最终目的都是为了自己争取最大利益。 • 必须是决策主体在意的东西才能称之为利益。
案 例 引 入
2019年1月,瓦鲁法斯基在就任财长的第一次 演讲中便向国际债权人发出了咄咄逼人的“退欧 战书”开始,希腊债务危机便逐步在希腊政府面 对紧缩政策的决不妥协和国际债权人的没有紧缩 就没有贷款的博弈中被逼入了“囚笼”。 从6月1日,希腊政府拒绝按期归还IMF贷款, 并称债权人给出的贷款条件“荒谬”,到6月9日 作为债权人代表之一的欧盟委员会主席容克拒绝 接听希腊总理齐普拉斯的电话,关闭对话渠道为 止,欧洲市场在大部分时间里都被裹挟在了绝望 的情绪之中。在这期间的7个交易日中,欧洲股市 均以下跌收盘,创下2019年以来最长时间的连跌。4
有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两位 犯罪嫌疑人,张三和李四,并从他们的住处搜出被害人家中丢失的财物。但是,他矢 口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警 方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。 检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。但是,我 可以和你做个交易。如果你单独坦白杀人的罪行,我就放你出去,但你的同伙要判十 年刑。如果你拒不坦白,而被同伙检举,那么你就将判十年刑,他被放掉。但是,如 果你们两人都坦白交代,那么,你们都要被判6年刑。”
商学院MBA博弈理论与战略决策分析优秀课件
Session 3Game Theory and Strategic DecisionAnalysis博弈论与战略决策分析管理决策统计分析Prof. Ren Jianbiao, 20111-2Session TopicsStrategic Thinking 策略思考Introduction to Game Theory 博弈论介绍 Game’s Game 博弈游戏How to Shape Strategy 用博弈论构筑企业战略Prof. Ren Jianbiao, 20111-3Strategic Thinking策略性思考罗伯特-奥曼教授拍卖一张一百美元的钞票,至无人出价时停止,由喊出最高价者得此钞票,并付给教授他所喊的价格,同时喊出次高价者也须付给教授他所喊的价格。
什么是你的最佳喊价策略?童话故事中国王让囚犯戴上红白两色帽子,其中有两顶红帽,并对囚犯说:“你们之中至少有一顶红帽,但不准与其他人交谈或者查看自己帽子的颜色,违者处死。
每天放完风可以找牢头猜你们帽子的颜色,猜错者处死,猜对者就被立即释放”。
囚犯的最佳策略是什么?Prof. Ren Jianbiao, 20111-4Game Theory博弈论博弈论是由冯·诺依曼(Von. Neumann)和摩根斯坦(Morgenstern)于1944年创立的方法论性质的学科 1994年诺贝尔经济学奖纳什(Nash )、海萨尼(Harsanyi )和泽尔滕(Selten )电影《美丽心灵》2002年奥斯卡金像奖四项大奖Prof. Ren Jianbiao, 20111-51994年诺贝尔经济学奖纳什(Nash ):均衡存在性定理海萨尼(Harsanyi ):不完全信息博弈分析方法 泽尔滕(Selten ):动态博弈分析方法Prof. Ren Jianbiao, 20111-6博弈论的诺贝尔经济学奖1996年,莫里斯(Mirrlees)和维克里(Vickrey):博弈论应用于不对称信息下机制设计2001年,阿克洛夫(Akerlof)、斯宾塞(Spence)和斯蒂格利茨(Stiglitz) :运用博弈论研究信息经济学2005年,罗伯特-奥曼和托玛斯-谢林:冲突与合作 2007年,赫维茨、罗杰·B.迈尔森、马斯金:机制设计理论Prof. Ren Jianbiao, 20111-7詹姆斯·莫里斯(James A.Mirrlees )教授在信息经济学理论领域作出了重大贡献,尤其是不对称信息条件下的经济激励理论的论述;威廉·维克瑞(William Vickrey)在信息经济学、激励理论、博弈论等方面都作出了重大贡献。
博弈论及其在决策中的应用..
例4: 设某个矩阵博弈为G={S1,S2,A}
其中策略集分别为S1={α1,α2,α3}. β 1,β 2,β 3, S2={β1,β2,β3}, α1, 支付矩阵为 α2, 1 4 2
α3
A5 6
3 2
2 6
由于局中人都是理性人,每一局中人必然会考 虑到对方会设法使自己获益最少,同时自己又 力求在各种可能情况下谋求自己的最大利益。
14
博弈模型的三个要素
局中人(参与人,player)
策略(战略, strategy) 支付函数(得益, 赢得, payment)
15
所以,构成博弈有三个要素:
1.局中人或参与人(player):有权决定选择何种策略的参 加者。 根据局中人的多少,分为两人对策和多人对策 2. 策略(Strategy)和策略集:在每局对策中,参加对策的局中 人都有可供实际选择的完整的行动方案,成为策略集合。 其中,一种方案成为一个策略。如,{石头,剪子,布} 就是一个策略集。 根据策略集中元素个数多少,可分为有限对策与无限对策 3.支付函数(Payment): 又称为赢得函数,是指每一局对策结 束之后,对其中一个局中人来说,其得到的成果(也许 是物质或现金之类的收入或支出),统称为得益。常常 以某一函数统一表示。
精品文档博弈论及其在决策中的应用精品文档2第第6章博弈论及其在决策中的应用内容概览61博弈论的基本概念62零和博弈矩阵博弈63二人非零和博弈64博弈论在经济决策中的应用精品文档3博弈论gametheory又称对策论策略运筹学等是研究竞争策略运筹的科学或者说是研究具有竞争冲突等问题的科学其应用始终与经济决策有密切的联系在市场竞争中大有用武之地
博弈论与策略决策
博弈论与策略决策博弈论是研究决策者在相互影响下做出决策的一门数学分析工具。
它旨在研究决策双方的策略选择及其对结果的影响。
在现代社会中,博弈论被广泛应用于战略规划、经济学、政治科学等领域。
本文将探讨博弈论在策略决策中的应用及其意义。
一、博弈论基础博弈论的基础概念包括参与者、策略和支付。
参与者是指参与博弈的个体或组织,他们根据自身的利益选择策略。
策略是指参与者可选择的行动方案,而支付则是博弈结果所给予的回报或惩罚。
二、非合作博弈非合作博弈是指参与者在博弈过程中采取相对独立的决策,不进行合作或沟通。
在非合作博弈中,参与者的选择受到其他参与者选择的影响。
在这种情况下,参与者需要通过分析其他参与者的策略来优化自己的决策。
三、纳什均衡纳什均衡是现代博弈论的核心概念。
它指的是在非合作博弈中,参与者选择最优策略,并且没有动机改变自己的策略,因为任何单方行动的改变都不能使其获益。
纳什均衡的存在和稳定性对于理解策略决策的合理性和可能性至关重要。
四、博弈论在经济学中的应用博弈论在经济学中有重要的应用。
例如,在市场竞争中,厂商们面临着相互竞争的博弈环境。
他们需要根据其他竞争者的策略来制定最佳的定价和营销策略,以获得最大的市场份额和利润。
此外,博弈论也可以用于研究拍卖市场、合作与共享资源等经济现象。
五、博弈论在政治科学中的应用博弈论在政治科学中的应用主要是研究政治参与者之间的策略决策。
例如,在选举中,候选人需要根据选民的反应制定竞选策略。
博弈论可以帮助他们预测选民对不同政策的反应,并找到最佳的竞选策略。
此外,博弈论还可以用于研究国际间的冲突与合作等政治问题。
六、博弈论的意义与局限性博弈论为我们提供了思考和分析策略决策的有力工具。
通过研究博弈论,我们可以更好地理解其他参与者的策略和动机,从而优化自己的决策并预测可能的结果。
然而,博弈论也有其局限性,它往往假设参与者具有理性和完全信息。
然而,在现实生活中,参与者的决策常常受到情感、不确定性和信息不对称的影响。
博弈论与领导决策
得结果的好坏,不仅取决于自身的策略选择, 也取决于其他参加者的策略选择。
策略本身常常没有绝对的好坏之分,只有相对于 他方策略的相对好坏。
PPT文档演模板
博弈论与领导决策
博弈论也称为“对策论”。其实并不
是很恰当。因为“对策”在实际中常被用 来表示具体的针对性反应方案,或站在某 个决策方的立场上找针对其他方的对策。 博弈论所研究的决策问题却是有开始、有 次序、有结果的整个过程。 “博弈”的通
•博弈过程 •静态博弈、动态博弈、重复博弈;
•信息结构
•完全信息博弈(静、动态)、不完全 信息博弈(静、动态) ,完美信息动
态博弈、不完美信息动态博弈;
•博弈方的理性 •和行为逻辑
•完全理性博弈、有限理性博 弈;合作博弈、非合作博弈。
PPT文档演模板
博弈论与领导决策
常见的博弈分类 :
•(1) 参与人行动的先后顺序
集体的最优结果未必来源于个人的最优决策。 领导的政绩? ④ 改变博弈结果的根本方法是改变博弈的支付 矩阵。
PPT文档演模板
博弈论与领导决策
囚徒困境的解脱
• ① 奖励
有这样一个博弈
• 此时,两者的纳什均衡为(不合作,不合作)。
PPT文档演模板
博弈论与领导决策
假如对采取“合作”策略的博弈方奖励 3
•奖励矩阵为:
PPT文档演模板
博弈论与领导决策
启示:
当博弈是零和博弈时,只有混合策 略均衡。
什么样的决策是科学决策?随机决 策(当面对零和博弈时)科学吗?
PPT文档演模板
博弈论与领导决策
3. 警卫与小偷
PPT文档演模板
第五章 国家间博弈
对于国际关系中博弈论运用的评判 • 博弈论的借鉴和应用对国际关系的学科发展做出 了突出的贡献,自博弈论引入到国际关系研究中 后,理性主义范式不断深化拓展,国际关系作为 一门学科越来越精确化和科学化。 • 博弈论的应用也对国际关系研究产生了一些负作 用和弊端,如博弈论的模型过于简单和理想化, 常常与国际关系的实际不相符合,容易使原本生 动的国际关系研究变得僵化。 • 不管怎样,博弈论对国际关系学科的系统化起到 了巨大的推动作用,也被科学行为主义学派所极 力推崇。
囚徒B 坦白 囚徒A 不坦白
坦白 不坦白
-8,-8
0,-10
-10,0
-1,-1
一个相关的概念:纳什均衡
• ”纳什均衡“简介: 纳什均衡是一种策略组合,即每一个参与人的策略是对 其他人策略的最优反应。如果N个人参与博弈,其中没有 任何一方可以独自行动而增加收益。(即为了自身的利益 最大化,没有任何一方愿意改变策略),则此种策略组合 被称为纳什均衡。
2002年《美丽心灵》获多项奥斯卡奖。
田忌赛马:历史上的博弈
齐国的大将田忌和齐威王约定赛马。 比赛的时候,由于齐威王每个等级的马都比田忌的马强 得多,田忌用上马对上马,中马对中 马,下马对下马, 所以比赛了几次,田忌都 失败了。
Байду номын сангаас
田忌的朋友孙膑说:“我有办法准能让你赢了他。” 孙 膑先以下等马对齐威王的上等马,第一局输了。第二场 比赛,孙膑拿上等马对齐威王的中等马,获胜了一局。 第三局比赛,孙膑拿中等马对齐威王的下等马,又战胜 了一局。
• 20世纪50年代以后,国际关系理论学者在数学中 博弈概念的基础上,通过借鉴和发展,逐渐形成 了国际关系学的博弈论,并广泛应用到国际安全 和国际经济学领域,推动了国际关系学科的科学 化。
博弈论策略与决策分析
博弈论策略与决策分析博弈论(Game Theory)是一门数学工具,用于研究决策者之间相互作用的决策问题。
它通过建立模型和分析不同策略的效果,帮助我们做出更明智的决策。
在本文中,我将介绍博弈论的基本概念,并探讨其在决策分析中的应用。
一、博弈论基本概念1.1 纳什均衡纳什均衡(Nash Equilibrium)是博弈论中的一个重要概念,指的是在一个博弈中,每个参与者根据其他参与者的策略选择,无法通过单方面改变自己策略来获得更好的结果。
换句话说,每个参与者都在做出最优策略选择,考虑其他人的行为。
1.2 帕累托最优解帕累托最优解(Pareto Optimality)是指在一个博弈中,无法通过任何改变的手段,改善一个人的情况而不损害其他人的情况。
换句话说,帕累托最优解是一种达到最优利益分配的状态。
二、博弈论策略2.1 常见博弈策略(这里可以详细介绍不同的博弈策略,如:纳什均衡、完全理性、混合策略等)2.2 博弈策略的分析方法(这里可以介绍博弈论中常用的分析方法,如:博弈树分析、博弈矩阵分析等)三、决策分析中的博弈论应用3.1 商业竞争中的决策分析(这里可以举例说明如何利用博弈论进行商业竞争决策分析,如:定价策略、市场份额竞争等)3.2 政治决策中的博弈论应用(这里可以举例说明如何利用博弈论进行政治决策分析,如:选举策略、政策制定等)3.3 环境资源分配中的博弈论应用(这里可以举例说明如何利用博弈论进行环境资源分配决策分析,如:国际气候谈判、水资源分配等)四、博弈论策略与决策分析的局限性4.1 信息不完全性(这里可以介绍博弈论中信息不完全性对决策分析的影响)4.2 策略限制性(这里可以介绍博弈论中策略限制性对决策分析的影响)五、结论博弈论是一种强大的决策分析工具,可以帮助我们理解参与者之间的相互作用,并优化决策结果。
然而,我们也需要认识到博弈论的局限性,将其与其他决策分析方法结合使用,以获得更全面准确的决策结果。
博弈与决策--吴维库
博弈与决策讲师:吴维库博士第一讲运用博弈建立与比较竞争优势大家好,欢迎同我一起走进竞争分析与博弈课堂。
两个人出来看风景,大家都没少看,一个人就率先精明了,他说我要比你早看一步,然后他就快走一步;第二个人发现,你快走我也不是没腿,第二个人快走两步;第一个人没招了,快走四步,第二个人八步,最后变成了赛跑。
俩人本来是出来看风景的,最后变成了赛跑,大家谁也啥都没看见。
这个故事用来启动竞争分析与博弈。
我们来到这个世界上是来看风景的,还是来赛跑的?这就需要解决竞分析的问题。
1、竞争的定义牛津辞典这样定义竞争:竞争是拥有同样商品的厂商之间为争夺顾客而进行的斗争。
中国人对竞争是这样分的:对辩曰争,并逐曰竞,“竞”在行动上,“争”在口舌上。
当我们研究竞争的时候,我们要解决四个问题:同谁争、争什么、在哪争、如何争。
2、竞争的层次竞争的三个层次首先要搞清楚,竞争是分层次的,我把竞争分成三个层次:CEO,一个企业同另一个企业的竞争,最开始是CEO同CEO的竞争,一个老总比另外一个老总率先聪明,那他就有比较竞争优势了,老总和老总竞争互动,彼此具有学习能力,过一段时间以后,再参加同样的培训,读同样的书,大家水平就相当了,这时就没有比较竞争优势了。
高管团队,哪一个企业的高管团队比另外一个企业高管团队更有竞争力,那他将具有比较竞争优势,比方我的人力资源总监比你的人力资源总监有竞争力,那么我就比你具有竞争优势,所以一些企业就从其他的优秀企业去挖人力资源总监,比方说都从那些优秀的跨国公司挖一个人力资源总监来,最后总监和总监的过招彼此也相当了,大家又出来学习培训,参加同样的培训班、听同样的课、读同样的案例、读同样的书,最后大家水平又相当了,所以高管团队又没有比较竞争优势了。
员工,企业与企业的竞争进入更深层次,员工同员工的竞争,哪一个企业率先提升了员工的竞争力,他将具有比较竞争优势,就像蜜蜂一样,花蜜是由一个一个的蜜蜂采集来的,所以一个蜂群的蜜蜂比另外一个蜂群的单个蜜蜂有力量,那它就具有竞争优势。
经济学中的博弈论与策略决策知识点
经济学中的博弈论与策略决策知识点博弈论是经济学中的一个重要分支,主要研究在决策过程中各个参与者之间的相互影响及其结果。
博弈论的出现为经济学提供了一种全新的视角,有助于我们更好地理解复杂的经济现象。
在博弈论中,策略决策也是一个关键概念,它涉及到参与者如何选择行动以达到自己的最优结果。
本文将探讨经济学中的博弈论与策略决策的几个重要知识点。
一、博弈论的基本概念和模型在博弈论中,参与者之间相互影响的行为被称为博弈。
博弈论通过对参与者的决策和行动进行建模,分析他们可能的策略选择和结果。
在博弈论的基本概念中,有两个核心元素:参与者和策略。
参与者是博弈的主体,他们在博弈中可以选择不同的策略。
策略是参与者可供选择的行动方式,不同的策略可能带来不同的结果。
在博弈论中,常用的模型包括博弈树模型、矩阵模型和演化博弈模型。
二、经济学中的合作与竞争博弈论研究的一个重要议题是合作与竞争。
在经济学中,合作与竞争是一对矛盾的存在。
在一些博弈中,参与者可能通过合作来实现共同利益,而在另一些博弈中,参与者则可能通过竞争来追求自身最大化的利益。
合作与竞争的效果在很大程度上取决于参与者的策略选择和博弈规则的制定。
三、纳什均衡的概念及其应用纳什均衡是博弈论中的一个重要概念,它指的是在一个博弈中,每个参与者都选择自己最佳的策略,且在这种策略选择下,没有参与者有动机单方面改变策略。
简单来说,纳什均衡是参与者根据对手的策略选择自己的最佳策略。
纳什均衡的应用广泛,不仅可以解释市场中的竞争现象,还可以用于分析国际贸易、产业结构等经济现象。
四、博弈论在价格战中的应用价格战是企业竞争中常见的一种策略。
博弈论可以有效地解释价格战的产生和演化。
在一个价格战中,企业之间通过调整价格来争夺市场份额。
博弈论中的博弈策略和均衡分析可以帮助我们理解价格战的动态过程,并提供一些决策参考。
五、博弈论在拍卖中的应用拍卖是一种市场中常见的交易方式,也是博弈论的一个重要应用领域。
决策与博弈论课件
商业决策与博弈
商业策略
决策与博弈论在商业竞争中有着 广泛的应用,如价格战、广告投 放、市场份额争夺等场景,通过 博弈分析可以帮助企业制定更加
合理的策略。
合作与竞争
决策与博弈论可以帮助企业理解 在商业环境中的合作与竞争关系 ,促进企业间的合作,实现共赢
。
风险管理
通过决策与博弈论,企业可以更 好地预测竞争对手的可能行动, 从而制定应对策略,降低风险。
大数据与决策与博弈论
大数据在决策与博弈论中的应用
随着大数据时代的来临,越来越多的数据可用于分析和研究决策与博弈论问题。例如, 利用大数据分析来研究市场中的竞争策略、消费者行为等,从而更好地理解博弈中的策
略互动和结果。
大数据对决策与博弈论的影响
大数据的应用为决策与博弈论提供了更广泛的数据来源和分析工具,有助于更深入地理 解博弈中的复杂性和不确定性。同时,大数据也要求研究者具备更高的数据处理和分析
优化的学科。
参与者
在博弈中,参与者通常被称为 局中人,他们各自追求自己的 利益或目标。
行动与策略
局中人在博弈中的行动和策略 选择,决定了博弈的结果和均 衡。
支付
局中人在博弈中的收益或损失 ,是衡量博弈结果的重要指标
。
博弈论的基本类型
零和博弈
在一场零和博弈中,一 方的收益等于另一方的
损失,即总和为零。
人工智能与决策与博弈论
人工智能在决策与博弈论中的应用
随着人工智能技术的不断发展,越来越多的学者开始探索如何将人工智能应用于 决策与博弈论中。例如,利用机器学习算法来分析复杂的博弈数据,或者通过智 能代理来模拟人类行为,从而更好地理解博弈中的策略互动。
人工智能对决策与博弈论的影响
决策与博弈理论分析PPT
纳什均衡假设每个玩家都完全理性,能够准确预测对手的策略,这在现实中可能并不成 立。
混合策略均衡分析
混合策略均衡
指在博弈中,每个玩家都有一定的概率采取不同的策略。
混合策略均衡的特点
混合策略均衡是一种更加现实的博弈结果,因为在实际生 活中,玩家往往无法准确预测对手的策略,需要采取一定 的随机性来应对。
国际政治博弈案例
总结词
国际政治博弈
详细描述
国际政治中,各国之间的利益冲突和战略互动经常需要运用博弈论来分析。例 如,冷战期间的美苏博弈、国际贸易谈判中的利益博弈等。
市场博弈竞争案例
总结词
市场竞争博弈
详细描述
在市场竞争中,企业之间经常运用博弈论来分析竞争对手的策略和市场格局,以制定有效的竞争策略 。例如,价格战、广告战等。
随着大数据和人工智能技术的快速发 展,如何利用这些技术提高决策效率 和精度也是未来研究的重要方向之一。
THANKS
感谢观看
06
结论与展望
决策与博弈理论的重要性和意义
决策与博弈理论在经济学、管理学、 政治学等领域具有广泛的应用价值, 为解决现实问题提供了重要的理论支 持和实践指导。
决策与博弈理论的发展对于推动相关 学科的进步和交叉融合具有重要意义, 有助于促进学科之间的交流和合作。
该理论有助于理解个体和群体在决策 过程中的行为特征和决策偏好,为企 业制定战略、政府制定政策提供科学 依据。
行为决策理论
关注实际决策过程中人的心理、情感和认知等因 素对决策的影响。
当代决策理论
综合了古典和行为决策理论的观点,强调理性和 非理性因素在决策中的共同作用。
02
博弈理论概述
博弈的定义与分类
《博弈论与决策行为》PPT课件讲解学习
考虑两商店之间价格竞争的纳什均衡,即行动变 量为价格pi,( i=1,2)。需求函数Di(p1,p2), ( i=1,2)。
如果住在x的消费者在两个商店之间是无差异的, 即满足:
p1 + tx = p2 + t(1-x)
那么,住在比x距离近的消费者都会在商店1购买, 住在比x距离远的消费者都会在商店2购买。则需 求函数分别为:
Nash Equilibrium:
“I’m doing the best I can given what you are doing”
“You’re doing the best you can given what I am doing.”
定义:在博弈G={S1,…,Sn;u1,…,un}中,如果 由各个博弈方的各一个策略组合(s1*,…,sn*) 中,任一博弈方i的策略si*都是对其余博弈方策略 组合(s1*,…, si-1*,si+1*,…, sn*)的最佳策略, 即ui(s1*,…, si-1*,si*,si+1*,…, sn*)≥ui (s1*,…, si-1*,sij,si+1*,…, sn*)对任意sij∈Si 都成立,则称(s1*,…,sn*)为G的一个纳什均 衡。
3.75,5
5,3.75
4,4
以自身最大利益为目标:各生产 2单位产量,各自得益为4
以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
2.2.2 完全信息静态博弈的典型应用
一、豪泰林(Hotelling)价格竞争模型 在古诺模型中,产品是同质的。在这个假设下,
如果企业的竞争战略是价格而不是产量,伯川德 (Bertrand)证明,即使只有两个企业,在均衡 情况下,价格等于平均成本,企业的利润为零, 与完全竞争市场均衡一样。这便是所谓的“伯川 德悖论”。(Bertrand Paradox)
博弈论与决策策略 讲义(半天,10月26日上午)
• 如果这块土地为私人所有,那么他该养4只 或5只羊,羊肉总增加重量20斤。 • 如果只有两个人养羊呢,会各养几只羊?
54
如果有两个人养羊(博弈)
养羊数量 每只羊增重 总增重 1 8 8 2 3 4 5 6 7 7 6 5 4 3 2 14 18 20 20 18 14 8 1 8 9 0 0
• 如果只有两个人,那么博弈均衡的养羊数 量是3+3=6只。 • 因为每一个人的收益都为9,如果某人养2 只羊,收益为8,养4只羊,收益也为8。 2 4只×4 2斤/只=8斤
博弈论与决策策略
中山大学岭南学院 孙洛平
lnsslp@
田忌赛马
• 田忌与齐国诸公子赛马,设重金赌注。孙 膑发现他们的马脚力都差不多,可分为上、 中、下三等。于是孙膑对田忌说:“您只 管下大赌注,我能让您取胜。”田忌相信 并答应了他,与齐王和诸公子用千金来赌 注。比赛即将开始,孙膑说:“用您的下 等马对付他们的上等马,用您的上等马对 付他们的中等马,用您的中等马对付他们 的下等马。”三场比赛完后,线法
嫌犯乙
坦白
嫌犯甲
沉默
坦白 8年 8年 自由 20年
沉默 20年 自由 1年 1年
• 参与博弈的人具备“同时最优”的对策结 果为均衡结果,也称之为纳什均衡。
20
污染博弈
表中的数值 表示利润。
治理 企业1 污染
企业2
治理 污染 ¥ 100 ¥ 120 ¥ 100 ¥ 30 ¥ 30 ¥ 100 ¥ 120 ¥ 100
下上中
下中上
下上中
下中上
上下中
上中下
中下上
中上下
42
混合策略
混合策略
• 在上面讨论过的博弈中,我们假定每个参 加者都只选择一个行动方案。这种方案选 择称为纯策略。但在许多博弈中,纯策略 可能是一种坏的选择。 • 在实践中,我们可能以某种概率(或可能 性)选取不同的策略,这种方法就称为混 合策略。
博弈论与决策论
主讲人:邓光耀1、几个定义•定义1.1 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
•定义1.2 序贯博弈是指参与者选择策略有时间先后的博弈形式。
因此,某些对局者可能率先采取行动,它是一种较为典型的动态博弈,而重复博弈则可视为一种特殊的动态博弈形式。
•在序贯博弈中,先行者可能占据一定的有利地位,我们把它叫做先行者优势。
•定义1.3 决策论(Decision theory)决策论是根据信息和评价准则,用数量方法寻找或选取最优决策方案的科学,是运筹学的一个分支和决策分析的理论基础。
在实际生活与生产中对同一个问题所面临的几种自然情况或状态,又有几种可选方案,就构成一个决策,而决策者为对付这些情况所取的对策方案就组成决策方案或策略。
2、序贯博弈之例•例1:桌上有25枚硬币,每次可以取1枚、2枚或者3枚。
你与对手交替选择,谁先选到第25枚硬币谁就胜利。
假设你首先选择,你这样才能保证自己胜利?•解答:你应当这样选择:每次选择的最后一个数依次为1、5、9、13、17、21、25,这样无论对方如何选择,你均可以保证自己胜利。
也就是说你要保证每次最后选择的是4n+1型的数。
而这种保证是可以做到的,读者可以思考一下原因。
•推广1:此类游戏可以推广到选择4k+1枚硬币的情形,优胜策略也是保证每次最后选择的是4n+1型的数。
•推广2:设步长为a,(例1中步长为3),则形如(a+1)k+1枚硬币的情形,优胜策略也是保证每次最后选择的是(a+1)n+1型的数。
3、囚徒困境• 3.1 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
博弈论与策略思维讲义.pptx
Q q1 q2 q3
P P(Q) 20 Q {
20 (q1 q2 q3)
0
i P qi [20 (q1 q2 q3)] qi
Q 20 Q 20
q1
q2
q3
P
1
2
4
8
6
2
8
16
4
5
6
5
20
25
5
5
6
4
20
20
5
5
5
5
25
25
3
43
3
11
33
33
7
3
3
7
49
21
3
12 30 24 25 33 21
博弈论历史没有公认答案 对具有策略依存特点决策问题的研究可上溯
到18世纪初甚至更早 博弈论真正的发展在二十世纪 博弈论总体上仍然是发展中的学科
38
2000年前我国古代的“齐威王田忌赛马”
1500年前巴比伦犹太教法典“婚姻合同问题” 等。
1838年古诺寡头模型。
弈、变和博弈
29
零和博弈:也称“严格竞争博弈”。博弈方之 间利益始终对立,总和为零。(一方所失即为 另一方所得) —猜硬币,田忌赛马,石头-剪刀-布
常和博弈:博弈方之间利益的总和为常数。博 弈方之间的利益本质上是对立的且是竞争关系 —分配固定数额的奖金、利润,遗产官司
变和博弈:零和博弈和常和博弈以外的所有博 弈。合作利益存在,博弈效率问题的重要性。 —囚徒困境、产量博弈、制式问题等
12
一、基本模型
囚徒1:坦白 囚徒2:坦白
囚 坦白 徒
1 不坦白
囚徒 2
坦白
不坦白
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 2.
4,4 , 6,3 ,
3
3,6 , 2,2 ,
2
企业2 企业 最小
同步决策
支配策略 最大最小策略 纳什均衡 纳什均衡
1 2 3
纳什均衡(1) 纳什均衡( 均衡
下面博弈中,厂商A没有支配策略。因为A 下面博弈中,厂商A没有支配策略。因为A的最佳决策取决 的选择: 选择做广告时, 应当选择做广告;然而, 于B的选择:当B选择做广告时,A应当选择做广告;然而, 选择不做广告时, 应当选择不做广告。 当B选择不做广告时,A应当选择不做广告。假定两个厂商 需要同时决策, 应当如何决策? 需要同时决策,A应当如何决策? 解答这一问题, 需要把自己放在B的位置, 解答这一问题,A需要把自己放在B的位置,并在此基础上 考虑自己的选择。支付矩阵表明B有一个支配策略:不论A 考虑自己的选择。支付矩阵表明B有一个支配策略:不论A 选择如何, 选择做广告时利益较大,因而A可以判断B 选择如何,B选择做广告时利益较大,因而A可以判断B会 选择做广告。而在B做广告时, 应当选择做广告。因而, 选择做广告。而在B做广告时,A应当选择做广告。因而, 均衡结局是双方都做广告。 均衡结局是双方都做广告。
支配策略的推广: 支配策略的推广:智猪博弈
猪圈中有一头大猪,一头小猪, 猪圈中有一头大猪,一头小猪,它们各有 一个按钮,控制猪食供应; 一个按钮,控制猪食供应;每按一下按钮 就会有十个单位饲料, 就会有十个单位饲料,但要付出两个单位 成本,其支付矩阵如下: 5,1 , 9,-1 , 等待 4,4 , 0,0 ,
同步决策
支配策略 最大最小策略 纳什均衡 纳什均衡
1 2 3
支配策略: 支配策略:支付矩阵
可以用支付矩阵(Payoff Matrix,又称得益矩阵, 可以用支付矩阵( Matrix,又称得益矩阵, 收益矩阵等)来描述一个博弈结构。 收益矩阵等)来描述一个博弈结构。下面简单的支付 矩阵中,有两个参与者厂商A和厂商B 矩阵中,有两个参与者厂商A和厂商B;它们各自可以 选择两种策略(它们可以表示生产或不生产某种商品, 选择两种策略(它们可以表示生产或不生产某种商品, 提高或不提高价格,做不做广告的选择等); );数字表 提高或不提高价格,做不做广告的选择等);数字表 示双方在不同策略选择组合下各自得到的支付,较大 示双方在不同策略选择组合下各自得到的支付, 数字代表较大利益或效用。 数字代表较大利益或效用。
厂商B 做广告 做广告 10,5 6,8 不做广告 15,0 20,2
厂商A
不做广告
纳什均衡( 纳什均衡(2)
上述均衡结果被称作纳什均衡 Equilibrium): (The Nash Equilibrium):假设 个人参与博弈, 有n个人参与博弈,给定其他人策 略条件下, 略条件下,每个人选择自己的最 优策略( 优策略(个人最优策略可能依赖 于也可能不依赖于其他人的策 ),所有参与人选择的策略组 略),所有参与人选择的策略组 合便是纳什均衡。 合便是纳什均衡。在纳什均衡状 态下, 态下,只要其它参与者不变换策 略选择, 略选择,任何单个参与者不可能 单方面通过变换策略来提高他的 所获支付。 所获支付。
厂商B 价格不变 厂商A 价格不变 涨价 10,10 -20,30 涨价 100,-30 140,35
这一博弈中每个参与者都存 在 一 个 支 配 策 略 ( Dominant Strategy, Strategy, 又称占优或超优策 即不管对手采用什么策略, 略),即不管对手采用什么策略, A、B 厂商都将保持价格不变作 为最优策略。 因此, 为最优策略 。 因此 , 可以肯定 地说, 地说 , 这一博弈结果是价格不 变。
博弈理论的发展与代表人物
1944年,J·冯·诺依曼、O·摩根斯坦恩在《博弈 1944年 冯 诺依曼、 摩根斯坦恩在 诺依曼 摩根斯坦恩 理论与经济行为》首先提出一些博弈论的概念。 理论与经济行为》首先提出一些博弈论的概念。 纳什和图克等人奠定了非合作博 50年代 年代, 纳什和图克 50年代,J·纳什和图克等人奠定了非合作博 弈论的基础。 弈论的基础。 60年代 年代, ·泽尔腾在纳什均衡引进动态分析, 泽尔腾在纳什均衡引进动态分析 60年代,R·泽尔腾在纳什均衡引进动态分析, 海萨尼引进不完全信息的研究 引进不完全信息的研究。 海萨尼引进不完全信息的研究。 1994年 纳什、 1994年,纳什、泽尔腾和海萨尼获得诺贝尔 经济学奖。 经济学奖。
博弈的种类
合作博弈与非合作博弈
厂商之间的经济博弈可 以是合作的, 以是合作的,也可以是非合 作的。 作的。区别在于是否存在一 有约束力的协议。如果有, 个有约束力的协议。如果有, 就是合作博弈;如果没有, 就是合作博弈;如果没有, 就是非合作博弈。 就是非合作博弈。前者强调 团体理性,即效率、 团体理性,即效率、公平和 公正;后者强调个人理性 个人理性和 公正;后者强调个人理性和 个人最优决策。 个人最优决策。
由此可见,小猪的最优选择是“等待”, 由此可见,小猪的最优选择是“等待” 大猪的最优选择是“ 大猪的最优选择是“按”。
•在竞争性市场中存在着不同规 在竞争性市场中存在着不同规 模的企业, 进行研究开发, 为 模的企业 , 进行研究开发 , 新产品做广告, 对大企业是值 新产品做广告 , 得的, 对小企业则得不偿失。 得的 , 对小企业则得不偿失 。 因而, 常见的情形是, 因而 , 常见的情形是 , 小企业 把精力花在模仿上, 把精力花在模仿上 , 或等待大 企业用广告打开市场后出售产 品。
夏普公司 六个地区 七个地区
六个地区 施乐公司 七个地区
40
70
35
55
30
60
45
45
连续排除最差策略
当厂商存在多种策略时, 当厂商存在多种策略时 , 可通过 连续排除最差策略方式简化决策, 连续排除最差策略方式简化决策 , 即通过重复排除最差的结果, 即通过重复排除最差的结果 , 直 到没有最差的策略,做出选择。 到没有最差的策略,做出选择。
•一个所谓 Game 至少需要三个要素 : 一个所谓Game 至少需要三个要素: 一个所谓 Game至少需要三个要素 博弈或游戏参加者。 ( 1 ) 博弈或游戏参加者 。 博奕论 分析假定参与者都是机智而理性的。 分析假定参与者都是机智而理性的。 行动或策略空间。 ( 2 ) 行动或策略空间 。 博奕参与 者必须知道他自己及其对手伙伴的 策略选择范围, 策略选择范围,并了解各种策略之 间的因果关系。 间的因果关系 。 ( 3 ) 有可评价优 劣高下的决策行为结果。 劣高下的决策行为结果。博弈论用 数字表示这类结果, 数字表示这类结果,并称之为支付 Payoff). (Payoff).上述三部分描述了一个 博弈的规则或结构。 博弈的规则或结构。
动 态
完 全 信 息 动 态 均 衡 ;子 博弈精炼纳什均衡
不完全信息静态均衡; 不完全信息动态均衡; 贝叶斯纳什均衡 精炼贝叶斯纳什均衡
静态博弈:博弈中参与人同时选择行动,或虽非同时但后行动 静态博弈 博弈中参与人同时选择行动, 博弈中参与人同时选择行动 者并不知道前行动者采取什么行动; 者并不知道前行动者采取什么行动; 动态博弈:参与人的行动有先后顺序 参与人的行动有先后顺序, 动态博弈 参与人的行动有先后顺序,且后行动者能够观察到 先行动者所选择的行动。 先行动者所选择的行动。 完全信息指的是每一个参与人对所有其他参与人 对手) 指的是每一个参与人对所有其他参与人( 完全信息指的是每一个参与人对所有其他参与人(对手)的特 战略空间及支付函数有准确的知识,否则就是不完全信息 不完全信息。 征、战略空间及支付函数有准确的知识,否则就是不完全信息
零和博弈与非零和博弈
在零和博弈中, 在零和博弈中,一方之 所得即为另一方之所失; 所得即为另一方之所失; 在非零和博弈中, 在非零和博弈中,双 方的得失取决于各自选择 采取的行动。 采取的行动。
博弈的种类
博弈的分类与对应的均衡概念
行动顺序/ 信息状况
完全信息 不完全信息
静 态
完全信息静态博弈; 纳什均衡
同步决策
支配策略 最大最小策略 纳什均衡 纳什均衡
1 2 3
最大最小策略
依照风险—厌恶假定, 依照风险 厌恶假定,不论对手采用何种策 厌恶假定 略,决策者采用确保在可能的最坏结果中得 到最好结果的策略,称谓“最大最小策略” 到最好结果的策略,称谓“最大最小策略”。 最大最小策略步骤: 最大最小策略步骤: 选择每种策略中最差的结果(最小值); 选择每种策略中最差的结果(最小值); 在最小值中选取最大值。 在最小值中选取最大值。
简单的结论
在管理决策中, 在管理决策中,首先应该寻找 是否存在支配策略 支配策略; 是否存在支配策略;如果有支 配策略,则应选择支配策略。 配策略,则应选择支配策略。 如果不存在支配策略, 如果不存在支配策略,则寻找 最差策略, 最差策略,并通过不断排除最 差策略, 差策略,找到可能得到的最好 的策略。 的策略。
施乐与夏普是两家提供复印机维修服务的公司, 施乐与夏普是两家提供复印机维修服务的公司,现在 它们需要决定是否停止在第七个地区的服务? 它们需要决定是否停止在第七个地区的服务? 从施乐公司看,它不存在支配策略;但从夏普公司看, 从施乐公司看,它不存在支配策略;但从夏普公司看, 它存在一个支配策略,即停止第七个地区的服务, 它存在一个支配策略,即停止第七个地区的服务,可 以使其利润上升。 以使其利润上升。P201
本讲内容
博弈论基本概念 同步决策 顺序决策
重复决策
什么是同步决策
在寡头垄断市场, 在寡头垄断市场,当管理者在无法 知道竞争对手的决策情况下, 知道竞争对手的决策情况下,要做 同步决策。 出自己的决策,则称为同步决策 出自己的决策,则称为同步决策。 同步决策不在于强调决策者与竞争 对手的决策在时间上同时做出, 时间上同时做出 对手的决策在时间上同时做出,只 是表明, 是表明,在管理者做出自己的决策 时不知道竞争对手的决策。 时不知道竞争对手的决策。