非合作博弈理论
纳什均衡
纳什均衡简介纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。
一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
纳什均衡的得来关于纳什均衡的普遍意义和存在性定理的证明等奠定非合作博弈理论发展基础的重要成果,是约翰·纳什在普林斯顿大学攻读博士学位时完成的。
实际上,博弈论的研究起始于1944年冯·诺依曼(Von Neumann)和奥斯卡·摩根斯坦(Oscar Morgenstern)合著的《博弈论和经济行为》。
然而却是纳什首先用严密的数学语言和简明的文字准确地定义了纳什均衡这个概念,并在包含“混合策略(mixed strategies)”的情况下,证明了纳什均衡在n人有限博弈中的普遍存在性,从而开创了与诺依曼和摩根斯坦框架路线均完全不同的“非合作博弈(Non-cooperative Game)”理论,进而对“合作博弈(Cooperative Game)”和“非合作博弈”做了明确的区分和定义。
阿尔伯特·塔克(Alberttucker)教授评价其论文,“这是对博弈理论的高度原创性和重要的贡献。
它发展了本身很有意义的n人有限非合作博弈的概念和性质。
并且它很可能开拓出许多在两人零和问题以外的,至今尚未涉及的问题。
在概念和方法两方面,该论文都是作者的独立创造。
”纳什均衡例子博弈论中一个著名的例子就是囚徒困境。
囚徒困境是一个非零和博弈,说的是两个嫌疑犯甲和乙私人民宅联手作案,被警方逮住但未获证据。
警方于是将两个嫌疑犯分开审讯。
警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑3个月,对方将被判刑10年;若两人都不招供则因未获证据但私人民宅将各拘留1年;如果两人均招供,每人将被判刑5年。
非合作博弈纳什均衡及其关系
非合作博弈纳什均衡及其关系非合作博弈是博弈论的重要分支之一,它研究的是在缺乏沟通和协调的情况下,个体之间的决策和行为。
而纳什均衡则是非合作博弈中的一个重要概念,指的是一种策略组合,使得在这种组合下,任何一个个体都没有动力单独改变自己的策略。
本文将介绍非合作博弈的基本概念,并探讨纳什均衡与博弈者行为之间的关系。
我们来了解一下非合作博弈的基本概念。
非合作博弈是指每个博弈者在做出决策时,只考虑自己的利益,而不关心其他博弈者的利益。
在非合作博弈中,博弈者之间彼此独立,没有任何形式的合作和沟通。
博弈者通过选择不同的策略来追求自己的利益,并根据其他博弈者的选择来调整自己的策略。
在非合作博弈中,博弈者的目标是尽可能地使自己获得最大的利益。
而纳什均衡是非合作博弈中的一个重要概念,它指的是一种策略组合,使得在这种组合下,任何一个博弈者都没有动力单独改变自己的策略。
换句话说,纳什均衡是一种稳定的策略组合,使得每个博弈者都认为在其他博弈者的策略给定的情况下,自己没有更好的选择。
在纳什均衡下,所有博弈者都做出了最优策略的选择,不存在任何一个博弈者可以通过改变自己的策略来获得更大的利益。
非合作博弈的纳什均衡与博弈者的行为密切相关。
在非合作博弈中,每个博弈者根据其他博弈者的选择来做出自己的决策。
当博弈者选择的策略达到纳什均衡时,他们就没有动力再改变自己的策略。
这意味着博弈者的行为是一种理性行为,他们根据自己的利益来做出决策,而不会被其他博弈者的选择所左右。
然而,在非合作博弈中,并不是所有的博弈都存在纳什均衡。
有些博弈可能存在多个纳什均衡,而有些博弈则可能不存在纳什均衡。
对于存在多个纳什均衡的博弈,博弈者可以根据自己的目标和利益来选择不同的策略。
而对于不存在纳什均衡的博弈,博弈者的行为将变得复杂和不确定。
非合作博弈纳什均衡的研究对于理解人类行为和社会决策具有重要意义。
在现实生活中,人们常常面临着各种博弈情境,需要根据自己的利益和目标做出决策。
博弈论介绍
博弈论介绍博弈论是一门研究决策者如何在不确定环境中做出决策的数学理论。
它是经济学、政治学、社会学以及其它社会科学中重要的工具之一,也被广泛应用于计算机科学、生物学等领域。
博弈论通过分析不同参与者的策略选择和结果预测,揭示了人类行为背后的数学原理和心理动机。
在博弈论中,参与者被称为玩家,他们的目标是最大化自己的效用。
博弈论的研究对象是博弈,即一种决策过程,其中多个决策者在有限资源环境中选择不同策略,以达到自己的目标。
博弈分为合作博弈和非合作博弈。
在合作博弈中,玩家可以通过合作来实现最优结果;而在非合作博弈中,玩家没有合作的选择,只能依靠自己的策略来最大化效用。
博弈论的基本元素包括玩家、策略和支付。
玩家是参与博弈的个体或组织,他们在决策过程中根据自己的目标和信息选择策略。
策略是指玩家在博弈中可选的行动,可以是单一的动作,也可以是一系列行动的组合。
支付是玩家在博弈结束时得到的结果,通常用于衡量玩家在博弈中的成功程度。
在博弈论中,最常用的分析工具是博弈矩阵。
博弈矩阵是一个二维表格,其中每个单元格表示不同玩家在不同策略组合下的支付。
通过分析博弈矩阵,我们可以推断玩家的最佳策略选择以及最终结果。
博弈论的核心概念之一是纳什均衡。
纳什均衡是指在一个博弈中,每个玩家的策略选择都是最佳的,给定其他玩家的策略选择不变。
换句话说,不存在玩家可以通过改变自己的策略来获得更好的结果。
纳什均衡并不一定是最优策略,只是所有玩家选择的最稳定状态。
除了纳什均衡,博弈论还涉及许多其他的解概念,如部分均衡、极大极小解等。
这些解概念提供了不同的策略选择和结果预测方法,使得博弈论在实际应用中更加有价值。
博弈论的应用范围非常广泛。
在经济学中,博弈论被用于分析市场竞争、价格战略以及拍卖等问题。
在政治学中,博弈论可以帮助我们理解选举、国际关系以及公共政策制定等方面的决策过程。
在社会学中,博弈论可以揭示社会规范、合作问题以及社会团体之间的关系。
在计算机科学中,博弈论被广泛应用于人工智能、机器学习和多智能体系统等领域。
贝叶斯纳什均衡
一、现代博弈论简单发展史
• 1960年开始,不同类型的博弈问题的研究取得突破性进展
•
•
1965年,Selten将纳什均衡概念引入动态分析,提出“子博弈精炼纳什均衡”
1967年,Harsanyi把不完全信息引入博弈论研究,提出“海萨尼转换”方 法,给出“贝叶斯纳什75)、Kreps和Wilson(1982)、Fudenberg和
2002:弗农史密斯(Vernon Lomax Smith) 贡献主要在于通过实验室实验来测试根据经济学理论 而做出预测的未知或不确定性。是对以博弈论为基础构 建的理论模型进行实证证伪工作的一大创举。(两位美 国学者丹尼尔·卡纳曼和弗农史密斯 ) 2005(以色列)奥曼( Robert J. Aumann)、谢林(美)( Thomas C. Schelling) 他们通过博弈理论分析增加了世人对合作与冲突的 理解。其理论模型应用在解释社会中不同性质的冲 突、贸易纠纷、价格之争以及寻求长期合作的模式 等经济学和其他社会科学领域。
二、博弈论与主流经济学的发展
• 博弈论研究对象:
当成果无法由个体完全掌握,而结局须视群体共同决策 而定时,个人为了取胜,应该采取什么策略
• 方法论:
经济学、政治学、管理、军事、外交、国际关系、 公共选择、犯罪学
• “深蓝”和“更深的蓝”使用动态博弈理论 编写程序,后来战胜了无敌的卡斯帕罗夫
“要想在现代社会做一个有文化的人,你必 须对博弈论有一个大致了解” ——保罗· 萨缪尔森
(一) 完全信息静态博弈:纳什均衡
基本分析思路和方法
• 占优战略均衡: (dominant-strategy equilibrium) 反映了所有人的绝对偏好,因此十分稳定。但 这种情况较少见。又称为上策均衡。
合作博弈
1.非合作博弈(noncooperative game): 参与者无法协调相互之间战略选择的博弈,得到的是非合作博弈解(noncooperative solution),理性经济人需要解决的问题是:“当其他参与者会对自己的战略选择做出最优反应时,我的最优战略选择是什么?”2.合作博弈(cooperative game):参与者可以协调相互之间战略选择的博弈,得到的是合作博弈解(cooperative solution),合作博弈需要解决的问题是:“如果参与者的战略可以相互协调,什么样的战略选择才会带来整体最大收益呢?”3.在非合作博弈的世界里,是不会存在商品买卖行为的。
市场中,往往存折这能够促使买卖双方进行互利交易的机构,这样就可以得到所期望的合作博弈解。
4.在合作博弈中,买卖双方的转让支付是与协议联系在一起的,这种支付叫做旁支付(sidepayment)。
若个人的收益是主观的,与货币无关,则不存在旁支付。
5.解集:在保证每个参与者至少获得非合作博弈收益的基础上,使总收益达到最大值的所有合作联盟。
解集是全部有效(帕累托最优)联盟结构与收益分配方式的集合,参与者们至少能够获得非合作博弈下的收益。
6.怎样尽可能缩小可行解的范围:可以考虑以下因素来缩小可行解范围,比如来自其他潜在交易者的竞争压力,公平性,讨价还价能力7.当参与者不能对合作战略作出可信承诺时,将产生非合作博弈解8.联盟结构(coalition structure):每一种可能的联盟方式;大联盟(grand coalition):所有参与者联合在一起的联盟;单人联盟(singleton coalition):参与者各自形成一个联盟。
9.合作博弈理论的通用分析方法:分析重点在于收益不同的联盟形式的选择,也就是说只需要知道哪些联盟结构是博弈的核就可以了10.合作博弈的核:核包含在解集中,核是稳定的解11.存在转移效用(transferable utility):如果存在转移效用,参与者的主观收益与货币的多少紧密地结合在一起,可以通过货币转移来调整参与者之间的收益。
集体行动的困境理论阐释与实证分析非合作博弈下的公共管理危机及其克服
集体行动的困境理论阐释与实证分析非合作博弈下的公共管理危机及其克服一、本文概述本文将深入探讨集体行动的困境理论,并对其在公共管理领域的应用进行实证分析。
集体行动的困境是指,当个体利益与集体利益发生冲突时,个体往往会选择追求自身利益最大化,而非为了集体利益而行动,这导致了集体行动的困难和低效。
这一现象在公共管理中尤为明显,特别是在非合作博弈的情况下,公共管理危机往往由此产生。
本文将首先概述集体行动困境理论的基本内涵和发展历程,接着分析其在公共管理领域中的实际应用,特别是如何通过实证数据揭示非合作博弈下公共管理危机的形成机制。
在此基础上,本文将进一步探讨如何克服集体行动的困境,提高公共管理的效率和效果,为解决公共管理危机提供理论支持和实证依据。
本文的研究不仅有助于深入理解集体行动困境理论,也有助于提高公共管理的实践水平,对于推动公共管理学科的发展具有重要的理论价值和现实意义。
二、集体行动困境的理论阐释集体行动困境是一个普遍存在于社会、经济和政治等领域的现象,它指的是在群体中,尽管每个个体都有共同的利益诉求,但在缺乏有效组织和协调的情况下,个体往往难以采取集体行动以实现共同利益。
这一现象在公共管理领域尤为突出,表现为公共管理危机的频发和难以解决。
集体行动困境的理论阐释主要基于非合作博弈论。
在非合作博弈中,参与者以自身利益最大化为目标,缺乏统一的行动指南和协调机制,导致集体行动难以形成。
具体来说,集体行动困境的产生主要有以下几个方面的原因:个体理性与集体理性的冲突。
在集体行动中,每个个体都追求自身利益最大化,而集体利益的最大化往往需要个体牺牲部分自身利益。
这种个体理性与集体理性的冲突使得个体在面临集体行动时往往选择保持观望或搭便车,导致集体行动难以形成。
信息不对称和沟通障碍。
在集体行动中,个体之间往往存在信息不对称和沟通障碍,导致个体难以全面了解和评估集体行动的风险和收益。
这种信息不对称和沟通障碍使得个体在面临集体行动时难以做出正确的决策,进一步加剧了集体行动困境。
博弈论论文--非合作博弈论
非合作博弈论博弈论也叫对策论,是现代微观经济学的基础领域之一,主要研究在彼此互动的情形下个人是如何做决策的。
近年来它已经被广泛地应用于商业、政治、社会学等其他社会科学的分析中。
博弈的分类根据不同的基准也有不同的分类。
一般认为,博弈主要可以分为合作博弈和非合作博弈。
合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。
他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。
从而揭示了博弈均衡与经济均衡的内在联系。
纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。
1944年冯·诺依曼与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。
尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。
例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。
冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。
合作型博弈在20世纪50年代达到了巅峰期。
然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。
正是在这个时候,非合作博弈—“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。
博弈论与信息经济学-非合作博弈理论
例2.2 石头、剪刀、布的支付矩阵
乙 甲
石头 剪刀
石头
0,0 -1,1
剪刀
1,-1 0,0
布
-1,1 1,-1
布 1,-1 -1,1 0,0
利用重复剔除严格劣策略无法求解
例2.6 利用重复剔除严格劣策略无法求解
乙 甲 上 中 下
左
0,4 4,0 3,5
策 略:政 济
府:救济,不救
不找工作
下岗工人:找工作,
工人 政府
救济
找工作 不找 3,2 -1,3
不救济 -1,1 0,0
求出性别大战博弈的混合策略纳什均衡
女
足球
男
足球 3,2
芭蕾 1,1
芭蕾 -1,-1 2,3
第五节 纳什均衡的存在性
定理1:(Nash, 1950)每个有限策略型博弈至 少存在一个纳什均衡(纯策略的或混合策略的)。
上下中 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1
中上下 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1
中下上 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1
下上中 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1
下中上 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
例2.4 性别大战(battle of the sexes)
局中人:男,女 策 略:男:看足球,看芭蕾 女:看足球,看芭蕾 支付矩阵:见下一页
性别大战的支付矩阵
女 男
足球
足球 3,2
芭蕾 1,1
芭蕾
-1,-1
2,3
第二节 重复剔除严格劣策略均衡
博弈论的几个经典模型
诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔
奖的理性主义学派的领袖卢卡斯
(Lukas),其理论与博
弈论都有着较深的联系。现在博弈论正渗透到各门社会科学,
更重要的是它正深刻地改变着人们的思
• 汪贤裕、肖玉明编著,博弈论及其应用,科学出版社,2008 年2月
第四章 博弈论的几个经典模型
讲授人 谭建国
引言
博弈论又被称为对策论(Game Theory),按照2005年因对博 弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法, 博弈论就是研究互动决策的理论。所谓互动决策,即各行动方 (即局中人[player])的决策是相互影响的,每个人在决策的时 候必须将他人的决策纳入自己的决策考虑之中,当然也需要把 别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情 形进行决策,选择最有利于自己的战略(strategy)。
博弈论的几个经典模型
引言
你的选择必须考虑其他人的选择,而其他人的选择也考虑 你的选择。你的结果——博弈论称之为支付,不仅取决于你的 行动选择——博弈论称之为策略选择,同时取决于他人的策略 选择。你和这群人构成一个博弈(game)。
上述博弈是一个叫张翼成的中国人在1997年提出的一个博 弈 论 模 型 , 被 称 之 为 少 数 者 博 弈 或 少 数 派 博 弈 ( Minority Game)。
协调互动合作互动协调互动是指一个参与人获得的支付依赖于其他参与人是否选择了相同行动如左行右行博弈如果两个相对而行的参与人选择不同的方向行进那么他们会相碰而选择相同方向则可以顺利通合作互动是指既存在协调又存在冲突的博弈协调是因为两个参与同时改变行动可以变得更好冲突是因为尽管其他参与人承诺行动也不一定有利于该参与人支付的增加前者可能引起无效率后者则意意味着无效率状态会成为均衡猎鹿类型协调博弈由策略不确定性所引起的均衡结果依赖于参与人之间的行为预期博弈支付与策略风险
第九章合作博弈理论初步
效用配置集
仅有分配概念还不够。 博弈方的风险态度和主观价值评价,尤其是当双方 存在差异时,可能影响讨价还价的态度和结果。 讨价还价对象是一批图书,一个是读书人,另一 个是收废品的,同样的分配对双方的效用不同。
效用配置集
果农和粮农分土地,种粮食和水果利润分别为每亩 500元和800元,同样的分配对双方价值不一样。
两人讨价还价一般表示
一个两人讨价还价问题需要设定可行分配集、破裂点,博弈
方各自的效用函数 B(S,d; u1,u2)
具体问题可能还有一些具体情况和特征需要设定。 两人讨价还价问题可以是完全对称的,也可以是不对称的。 双方在立场地位、效用函数、破裂点等方面都无差异,可用 效用配置集的对称性,也就是若(u1,u2)U 则 (u1,u2)U 表示。
两人讨价还价合作博弈解的帕累托效率要求可用“帕累托效率
公理”表示。
帕累托效率公理
如果 (s1,s2) 和 (s1’,s2’) 都是该讨价还价问题可行分配
集合中的点,且满足u1(s1)>u1(s1’) ,和 u2(s2)>u2(s2’) ,那 么(s1’,s2’) 肯定不是讨价还价博弈的结果。
作为博弈的解 (u1*,u2*)必须满足u1*=u2* 。
图形表示对称性公理,就是图9.2这个对称讨价还价问 题的解必须落在粗线条表示的对称线上。
对称性公理图示
图9.2 对称性公理图示
u2
对称线
d2 d1
u1
帕累托效率和对称性公理可解对称两人讨价还价问题。 以关于100元现金的讨价还价为例:
必须引进能分析联合理性合作行为的合作博弈理论。
非合作博弈纳什均衡及其关系
非合作博弈纳什均衡及其关系非合作博弈理论是现代博弈论的核心内容之一,而纳什均衡则是非合作博弈理论的重要概念。
本文将介绍非合作博弈纳什均衡的概念、性质及其与其他概念的关系,以帮助读者更好地理解和应用非合作博弈理论。
非合作博弈是指参与者在博弈过程中不进行合作,而是根据自身利益做出决策的一种博弈模式。
在非合作博弈中,每个参与者都追求自身的最大利益,而不考虑其他参与者的利益。
这种博弈模式下,每个参与者的决策会直接影响其他参与者的利益,形成了相互依存的关系。
纳什均衡是非合作博弈中的一种重要解概念。
它是指在博弈中每个参与者选择的策略组合下,没有参与者有动机改变自己的策略,即每个参与者都认为自己的策略是最佳选择。
换句话说,纳什均衡是一种稳定的策略组合,其中没有参与者愿意单独改变自己的策略。
非合作博弈纳什均衡具有以下几个特点:1. 博弈参与者的理性:在非合作博弈中,每个参与者都是理性的,追求自身的最大利益。
他们会根据自己的判断和利益选择最优策略,而不会受到其他参与者的影响。
2. 互相依存的关系:在非合作博弈中,每个参与者的决策会直接影响其他参与者的利益。
因此,参与者之间形成了相互依存的关系,他们的利益会相互影响。
3. 稳定性:纳什均衡是一种稳定的策略组合,其中没有参与者愿意单独改变自己的策略。
在纳什均衡下,每个参与者都认为自己的策略是最佳选择,没有动机去改变。
非合作博弈纳什均衡与其他概念之间存在密切的关系。
首先,非合作博弈纳什均衡与合作博弈纳什解是相对应的概念。
在合作博弈中,参与者可以进行合作,达成协议并共同追求最大化利益。
而在非合作博弈中,参与者之间没有合作的可能,只能根据自身利益做出决策。
因此,非合作博弈纳什均衡更加符合现实情况。
非合作博弈纳什均衡与博弈树、博弈矩阵等概念密切相关。
博弈树是用于描述博弈过程中各方决策与结果之间关系的工具,而博弈矩阵则是用于表示参与者之间策略选择与利益关系的表格。
非合作博弈纳什均衡可以通过分析博弈树或博弈矩阵得出,帮助参与者理解和选择最优策略。
博弈论讲义2 非合作博弈理论
开发商A
开发 4000,4000 不开发 0,8000
8000,0 0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的战略式表述
一 、博弈的基本概念及战略表述
博弈论的基本概念包括: ✓ 参与人:博弈论中选择行动以最大化自己效用的决策主体; ✓ 行动:参与人的决策变量 ✓ 战略:参与人选择行动的规则 ✓ 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和
一 、博弈的基本概念及战略表述
需求大的情况
开发商B 开发 不开发
开发商A
开发 4000,4000 不开发 0,8000
8000,0 0,0
需求小的情况 Βιβλιοθήκη 发商A开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的战略式表述
不完全信息动态博弈-精练贝叶斯纳什均衡 泽尔腾(1965)
一 、博弈的基本概念及战略表述
博弈的战略式表述:
战略式表述给出: 1、博弈的参与人集合:i , (1,2, , n); 2、每个参与人的战略空间:Si,i 1,2, , n; 3、每个参与人的支付函数:ui (s1, , si , , sn ),i 1,2, , n)
用G S1, ,Sn;u1, , un代表战略式表述博弈。
✓ 完美信息:指一个参与人对其他参与人(包括“自然”)的 行动选择有准确了解的情况,即每一个信息集只包含一个值。
✓ 完全信息:指自然不首先行动或自然的行动的初始行动所有 参与人观察到的情况。
✓ 共同知识:指“所有参与人知道所有参与人知道所有参与人 知道….”的知识。
经济博弈大赛知识点总结
经济博弈大赛知识点总结一、博弈论基本概念1.博弈论的定义博弈论是研究决策者之间相互影响的一种数学分析方法。
在该理论中,参与者的每一种决策都会影响到其他参与者的收益,因此需要在多方利益中进行权衡和选择。
2.博弈论的基本概念(1)参与者:指参与决策的一方或多方。
(2)策略:指参与者的行动选择。
(3)效用:指参与者从某种行动选择中得到的收益。
(4)收益矩阵:指博弈过程中不同参与者在不同策略组合下得到的收益组合。
3.博弈论的基本分类(1)合作与非合作博弈:合作博弈是指参与者之间可以进行合作协商,共同选择最优策略;非合作博弈是指参与者之间没有合作协商,各自选择最优策略。
(2)零和博弈与非零和博弈:零和博弈是指参与者的利益总和为零,一方得利即另一方受损;非零和博弈是指参与者的利益总和不为零,可以互惠互利或共同受益。
二、博弈论的基本模型1.纳什均衡纳什均衡是指在博弈论中,参与者的策略选择达到一种平衡状态,任何一个参与者都没有动机改变自己的策略。
纳什均衡是博弈理论的核心概念,对于非合作博弈中的理性参与者来说,最终会达到纳什均衡状态。
2.囚徒困境囚徒困境是博弈论中的一个经典模型,描述了两名囚犯被捕后面临的选择。
在这种情况下,即使两名囚犯都采取自己最佳的策略,他们最终都会面临到一种不利的结果。
这个模型的实质是说明了在自利最大化的前提下,最终可能导致共同损失的结果。
3.拍卖博弈拍卖博弈是指卖家和买家之间进行的策略与竞争。
在这种场景下,卖家需要选择出售物品的方式,而买家需要决定出价的高低。
这种博弈的结构包括英国拍卖、封闭式拍卖、荷兰拍卖等不同的竞争方式。
4.博弈树博弈树是一种博弈模型的图形表示方式,以树状的形式展现参与者的策略选择和结果。
博弈树有助于分析博弈的决策过程和可能的结果,帮助参与者制定最优策略。
5.拉力博弈拉力博弈是指在博弈中的一种竞争形式,即参与者面对的是关于资源的竞争和纷争。
这种博弈模型常见于市场竞争和企业之间的竞争,对于提高市场份额和竞争力有重要意义。
博弈论
博弈类型及其表述形式1 博弈的分类博弈模型一般分为合作博弈(cooperative game )和非合作博弈(non- cooperative game ),如图1.1。
合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素(Martin J.Osborne and Ariel Rubinstein ,2000,P2),也就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关系,并因为这种关系影响到博弈的结局。
合作博弈强调的是团体理性(collective rationality )、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是低效率或无效率的(张维迎,1996,P5)。
20世纪50年代,合作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐步转向在非合作博弈领域。
有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认为两者不相上下(Martin J.Osborne and Ariel Rubinstein ,2000,P2)。
合作博弈,有时也叫做联盟博弈(coalitional game ),一般根据有无转移支付而分为两类:可转移支付联盟博弈(coalitional game with transferable payoff )和不可转移支付联盟博弈(coalitional game with non-transferable payoff )。
可转移支付也叫有旁支付(side payment ),可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得,且各联盟的赢得可以按任意方式在联盟成员中分摊;否则,就是不可转移支付联盟博弈。
图1.1 博弈的分类非合作博弈的分类主要从两个角度进行划分。
非合作博弈算法-概述说明以及解释
非合作博弈算法-概述说明以及解释1.引言1.1 概述非合作博弈算法是一种在博弈论中常见的算法,用于处理个体之间相互作用但不协作的情况。
在非合作博弈中,每个参与者都追求自身的利益最大化,而不考虑其他参与者的利益。
通过非合作博弈算法,可以模拟和分析各种实际情况下的竞争和冲突,从中找出最佳策略和结果。
非合作博弈算法通常涉及到博弈论、优化理论、数学建模等多个领域的知识,因此在实际应用中具有广泛的适用性。
这些算法已经被成功运用在经济学、管理学、计算机科学、工程学等多个领域,为决策者提供了重要的参考和帮助。
本文将对非合作博弈算法进行深入探讨,分析其原理、特点、应用领域以及优势和局限性,旨在为读者提供全面的了解和收益。
1.2 文章结构本文将围绕非合作博弈算法展开,首先将介绍非合作博弈算法的基本概念和原理,包括其与博弈论的关系以及算法的运行机制。
接着将探讨非合作博弈算法在不同领域的应用,例如经济学、计算机科学和社会科学等。
然后将分析非合作博弈算法的优势和局限性,深入探讨其在实际应用中可能面临的挑战和限制。
最后,通过总结现有研究成果,展望未来非合作博弈算法的发展方向和潜在的应用领域,为读者提供对该领域的深入了解和启发。
1.3 目的:本文旨在介绍非合作博弈算法的基本概念、应用领域、优势和局限性,从而让读者对该领域有一个清晰的认识。
通过对非合作博弈算法的介绍,读者能够了解该算法在实际应用中的重要性和作用,以及在不同领域中的具体应用情况。
同时,本文也旨在探讨非合作博弈算法的未来发展方向,为相关研究和实践提供一定的参考和指导。
通过本文的阐述,希望能够促进对非合作博弈算法的学习和研究,推动该领域的进一步发展和应用。
2.正文2.1 什么是非合作博弈算法非合作博弈算法是一种博弈论中的概念,它主要研究在博弈过程中各参与者之间的竞争和冲突。
相对于合作博弈算法,非合作博弈算法更侧重于个体之间的自利行为,每个参与者都追求自身的最大利益而不考虑其他参与者的利益。
博弈论
ui ( si , s i ) ui ( si , s i ), s i,si si where s i ( s1 , , si 1 , si 1 , , sn ) 即s i S1 Si 1 Si 1 S n
称si*为局中人i的(严格)占优策略
各局中人先后、依次进行选择、行动 后出手者通常能观察到先出手者的选择 策略≠行动
按信息
信息是局中人关于博弈的知识,是实施决策的重要依据 完全信息(Complete Information):没有私人信息
局中人的策略集和支付函数均为共同知识
□ 策略集蕴含了行动集和出手时间
完全信息静态博弈是最简单的一种博弈类型。
中国科学技术大学管理学院 @ 2010
9
矩阵博弈与Maximin解(续)
矩阵博弈的Maximin解:
考虑到对方可能取使己方支付最小的策略(比如:对方通过各种渠道事先窥探 到己方策略),为稳健起见,选择纯策略的原则是:
让最小支付值尽可能大(取最差情况中最好的) ——悲观逻辑、最大最小原则 □ 考虑己方每个纯策略可能带来的最小支付(每行中的最小值) □ 比较这些最小支付,对应于最大的纯策略即为己方所选
对于矩阵博弈A=(aij)m×n,根据稳健的“最大最小原则”
己方Maximin策略: 对方Maximin策略:
i arg max
i{1,, m} j{1,, n}
min aij
1、逐行行内取小 2、小中取大 1、逐列列内取大 2、大中取小
j arg max
j{1,, n} i{1,, m}
合作博弈(Cooperative Game)
部分或全部局中人能够联合,达成一个具有约束力且可强制执行的协议的博弈 类型。 合作博弈强调的是集体理性,强调效率、公正、公平。 通过合作能带来“合作剩余” 合作博弈最重要的两个概念是联盟和分配。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
动态博弈(dynamic game)是指参与人的行动有先后顺序,而且行动在 后者可以观察到行动在先者的选择,并据此作出相应的选择。
2.纯战略和混合战略
纯战略(pure strategy)指参与人确定地做出一项给定的行动选择, 与之相反,参与人以某种概率选择某一行动称为混合战略(mixed strategy)。
(2b d )(1 bc) d 2 c p 4b 2 2d 2
* 1
* * p2 R2 p1
(回顾斯塔克伯格模型:两家企业同质产品的产量上序贯博弈)
例2:思路——逆向归纳、贴现、无差异
“几乎完美”的信息博弈
1.定义:假定博弈被分解为若干时期,在每个时期t,参与 人同时选择行动,他们知道在时期1和t-1之间每个人选择 过的所有行动。由于这种博弈只是在一个时期内引入了同 时性,因此,我们把这样的扩展型成为“几乎完美”的信 息博弈。 最简单的例子是“重复博弈”,其中,一个简单的一 期同时移动博弈被重复T次,在时期t,参与人知道t之前 的所有移动。在重复博弈中,时期之间没有实际联系。
纳什均衡→精炼均衡
纳什均衡适用于所有博弈,而不仅仅是静态博弈,但 是如果博弈分析的目的是预测博弈参与人的行为,纳什均 衡并不太合理。 同时纳什均衡假定每一个参与人在选择自己的最优战 略时假定其他人的选择是给定的,也即参与人不考虑自己 的选择对别人的影响,因此纳什均衡很难说是动态博弈的 一个合理解。为此学者们便提出了很多改进,精炼均衡便 是一种重要的改进。
在此输入文字标题
非合作博弈理论
主 要 内 容
1、博弈与战略 2、纳什均衡 3、精炼均衡 4、贝叶斯均衡 5、精炼贝叶斯均衡
博弈的分类及对应的均衡概念
行动顺序 静态
完全信息静态博弈 纳什均衡 不完全信息静态均衡 贝叶斯均衡
动态
完全信息动态博弈 子博弈精炼纳什均衡 不完全信息动态均衡 精炼贝叶斯均衡
信息
完全信息
不完全信息
第 一 节 博 弈 与 战 略
描述扩展型→博弈树
博弈形式化
标准型
① L ② l 2 0 r l 2 1 -1 0 博弈1 R ② r 3 1 l 2 0 L
① R
博 弈 树
②
r l 2 1 -1 0 博弈2 r 3 1
概念比较
1.静态博弈和动态博弈
静态博弈(static game)中,参与人同时选择行动或虽有先有后但后行 动者并不知道先行动者的选择。
C
2,-1
F C
1,0
囚徒困境
3,1
纳 什 均 衡 的 引 入 和 定 义
入: n 2.定义:战略组合 ai i 1 是一个纯战略纳什均 衡,当且仅当对所有 Ai 中的 a i ,
i i ai , a a , a i i i
这里 ai a1 ,...,ai 1 , ai 1 ,...,an 也即一个纳什均衡是一个行动组合,使得在视其 对手行动给定的条件下,没有一个参与人希望改 变自身的行动。这个定义可以直接扩展到允许混 合战略存在的情形。(以性别战博弈为例说明)
* *
Ai常常是一个连续空间, i 常常是可微的,将每个参
与人收益函数对他自己的行动求微分,得到一个纯战略均 衡,于是一阶条件是: i * *
i ai , ai 0
j
举例:两家生产有差别产品的企业进行价格竞争, ai pi , 对企业i产品需求:q D p , p 1 bp dp
4 a2 r, l
2,0
2,-1
2,0
2,-1
a12 R
1,0
3,1
3,1
1,0
占 优 战 略 均 衡
1.占优战略:无论对手作何选择,该 战略都是最优的战略
2.占优战略均衡:由博弈中的所有参 与者的占优策略组合所构成的均衡
重复剔除的战略均衡 VS 占优战略均衡
参与人2 参与人1
F
2,0
博弈1
标 准 型
参与人2 参与人1
1 a1 L
2 a a1 l , l 2 r , r 2
3 a2 l, r
4 a2 r, l
2,0
2,-1
2,0
2,-1
a12 R
1,0
3,1
3,1
1,0
博弈2
标 准 型
参与人2 参与人1
a l
1 2
a r
2 2
a L
1 1
2,0 1,0
2,-1 3,1
a R
2 1
第 二 节 纳 什 均 衡
1.重复剔除的战略均衡 2.占优战略均衡 3.纳什均衡
重 复 剔 除 的 占 优 均 衡
博弈1
参与人2 参与人1
1 a1 L
2 a a1 l , l 2 r , r 2
3 a2 l, r
两个概念:
1.子博弈:满足三个条件 2.子博弈精炼均衡:是指一组战略,使得在任何一个子博弈 中,这组战略都组成一个纳什均衡。 这样,精炼均衡要 求,不管在博弈树的哪个点,以及是否谓语均衡路径上, 参与人所使用的战略构成均衡战略。
完美信息博弈
1.定义:完美信息博弈中,轮到行动的参与人知道这之前所 有被选择过的行动,不涉及同时行动问题。 2.举例: 例1:①描述 ②思路 ③均衡解
举例:回顾囚徒困境
Back to 博弈1
“合理”and“不合理”
求解均衡的方法
逆向归纳过程-库恩算法:给定博弈到达最后一个决策结,该 决策结上行动行动的参与人有一个最优选择,这个最优选择 就是该决策结开始的子博弈纳什均衡,然后我们回到倒数第 二个决策结,找出倒数第二个决策者的最优选择,这个最优 选择与我们在第一步找出的最后决策者的最优选择构成倒数 第二个决策结开始的子博弈的一个纳什均衡。 如此不断直到初始结,每一步都得到对应子博弈的一个 纳什均衡,在这个过程的最后一步得到的整个博弈的纳什均 衡也就是这个博弈的子博弈精炼纳什均衡。
i i
i i
j
其中, 0 d b ,如果企业i单位成本为c,那么
pi c1 bpi dp j
i
一阶导为零
* * p1 p2
1 bc 2b d
均衡解
回忆古诺模型和古诺均衡(同质产品的产量博弈)
第 三 节 精 炼 均 衡
1.精炼均衡的引入 2.完美信息博弈 3.“几乎完美”的信息博弈