博弈论的通俗解释共97页文档

合集下载

博弈论名词解释

博弈论名词解释

博弈论名词解释博弈论是一种研究冲突和合作决策的数学理论。

在博弈论中,玩家通过制定决策来实现自己的利益,同时也要考虑其他玩家的决策对自己利益的影响。

博弈论的研究对象是在有限的资源和信息条件下,决策制定者之间的相互作用。

以下是一些常见的博弈论名词解释:1. 纳什均衡(Nash equilibrium):是指在博弈过程中,每个玩家依据其他玩家的行为选择自己的最佳策略,而没有动机单方面改变策略。

纳什均衡是一种稳定状态,即每个玩家的策略都是最优的。

2. 零和博弈(zero-sum game):是指一个玩家的收益与另一个玩家的损失完全相等,总收益为零。

在零和博弈中,一个玩家的利益的增加必然导致另一个玩家的利益的减少,双方利益存在完全的对立关系。

3. 非零和博弈(non-zero-sum game):是指一个玩家的利益的增加不一定导致另一个玩家的利益减少。

在非零和博弈中,玩家之间的利益可以相互协调、互利互惠。

4. 博弈树(game tree):是博弈论中常用的一种图形表示方式,用于展示博弈过程中的决策步骤和可能的结果。

博弈树由顶点和边组成,顶点表示玩家的决策点,边表示不同的行动选择。

5. 最优策略(optimal strategy):在博弈论中,最优策略是指玩家的最佳选择,使得在对手的任何策略下,自身获得最大利益。

最优策略可能根据玩家的目标和信息不同而变化。

6. 合作与背叛(cooperation and defection):博弈论中常涉及到的两个关键概念。

合作指玩家之间通过协调行动来获得共同利益,背叛指玩家为了自身利益而选择对方不合作。

7. 博弈矩阵(game matrix):是一种表示博弈参与者和策略选择关系的表格。

博弈矩阵以参与者为行,以策略选择为列,用数字表示参与者在不同策略下的收益情况。

8. 支配策略(dominant strategy):在博弈论中,一种策略如果在所有可能的对手策略下都能带来最佳结果,则被称为支配策略。

博弈论

博弈论

博弈论是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。

1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。

纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的学科。

博弈的分类根据不同的基准也有所不同。

一般认为,博弈主要可以分为合作博弈和非合作博弈。

它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

博弈论介绍

博弈论介绍

博弈论介绍博弈论是一门研究决策者如何在不确定环境中做出决策的数学理论。

它是经济学、政治学、社会学以及其它社会科学中重要的工具之一,也被广泛应用于计算机科学、生物学等领域。

博弈论通过分析不同参与者的策略选择和结果预测,揭示了人类行为背后的数学原理和心理动机。

在博弈论中,参与者被称为玩家,他们的目标是最大化自己的效用。

博弈论的研究对象是博弈,即一种决策过程,其中多个决策者在有限资源环境中选择不同策略,以达到自己的目标。

博弈分为合作博弈和非合作博弈。

在合作博弈中,玩家可以通过合作来实现最优结果;而在非合作博弈中,玩家没有合作的选择,只能依靠自己的策略来最大化效用。

博弈论的基本元素包括玩家、策略和支付。

玩家是参与博弈的个体或组织,他们在决策过程中根据自己的目标和信息选择策略。

策略是指玩家在博弈中可选的行动,可以是单一的动作,也可以是一系列行动的组合。

支付是玩家在博弈结束时得到的结果,通常用于衡量玩家在博弈中的成功程度。

在博弈论中,最常用的分析工具是博弈矩阵。

博弈矩阵是一个二维表格,其中每个单元格表示不同玩家在不同策略组合下的支付。

通过分析博弈矩阵,我们可以推断玩家的最佳策略选择以及最终结果。

博弈论的核心概念之一是纳什均衡。

纳什均衡是指在一个博弈中,每个玩家的策略选择都是最佳的,给定其他玩家的策略选择不变。

换句话说,不存在玩家可以通过改变自己的策略来获得更好的结果。

纳什均衡并不一定是最优策略,只是所有玩家选择的最稳定状态。

除了纳什均衡,博弈论还涉及许多其他的解概念,如部分均衡、极大极小解等。

这些解概念提供了不同的策略选择和结果预测方法,使得博弈论在实际应用中更加有价值。

博弈论的应用范围非常广泛。

在经济学中,博弈论被用于分析市场竞争、价格战略以及拍卖等问题。

在政治学中,博弈论可以帮助我们理解选举、国际关系以及公共政策制定等方面的决策过程。

在社会学中,博弈论可以揭示社会规范、合作问题以及社会团体之间的关系。

在计算机科学中,博弈论被广泛应用于人工智能、机器学习和多智能体系统等领域。

博弈论的基本概念

博弈论的基本概念

博弈论的基本概念•博弈论是研究两人或多人谋略和决策的理论。

•博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著.博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系.纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的的学科.•参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。

参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。

参与者可以是自然人,也可以是团体。

•信息:信息是指参与者在博弈过程中能了解和观察到的知识。

信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。

完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

•策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。

通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。

如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。

•收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。

通常用u i表示参与者i的收益,它是策略组合的函数。

•均衡:均衡是所有参与者的最优策略组合,记为s*。

博弈论

博弈论

什么是博弈论?古语有云,世事如棋。

生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。

博弈论是研究棋手们“出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。

换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。

事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。

数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。

这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…博弈论是关于运用数学法研究处于利益冲突的双方在竞争性活动中制定最优化的胜利策略的理论,博弈方法即根据游戏规则选择处理竞争,冲突或危机的最佳方案[。

而卡尔·多伊奇和莫顿·卡普兰认为博弈论既是研究国际冲突的策略理论,又是处理国际关系的实际手段。

其目的是为行为者在面临冲突和危机时设计各种合理选择和理性行为。

综上,博弈理论可以定义为各行为主体在一定的环境条件和规则下,选择一定的行为或策略加以实施并取得相应结果的过程。

根本目的是通过政策选择,在最大程度上用和平手段保护自己的国家利益。

南海是全球最重要、最复杂、最紧张的商道和水路之一。

处于越南金兰湾和菲律宾苏比克湾两大海军基地之间,是东亚通往南亚、中亚、非洲、欧洲必经的国际重要航道,也是中国维护对外开放的重要通道和南疆安全的重要屏障,其战略地位极其重要。

然而,随着地质考古发现南海地区储藏着丰富的石油、天然气,东南亚一些国家开始了南海岛屿主权日益激烈的争夺。

美国为了维护在亚太地区的主导权也一而再再而三地侵犯中国在南海海域的主权。

博弈论的基本概念

博弈论的基本概念

博弈论的基本概念博弈论的基本概念博弈要素:(1)决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。

(2) 对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。

他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。

(3)局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。

只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。

(4)策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。

(5)得失(payoffs):一局博弈结局时的结果称为得失。

每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。

所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

(6)次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。

(7)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。

在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。

所谓纳什均衡,它是一稳定的博弈结果。

纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

博弈论概论

博弈论概论

博弈论概述由于现代经济活动的规模越来越大,对抗性、竞争性越来越强,特别是寡头垄断或垄断竞争市场,竞争和决策较量更是厂商经营活动的核心内容,这些都使得人们越来越重视经济活动的环境条件及其变化,越来越重视竞争者或合作者的反应,因此经济决策的“博弈性”越来越强。

而且,博弈论在许多情况下所得出的结论更加符合经济现实和更加具有应用性,对参与经济互动的各方或国家政府的决策互动有更强的指导作用。

所以,研究博弈论是很必要的。

一.基本概念博弈:即一些个人,队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各允许选择的行为或策略中进行选择并加以实施,各自取得相应的结果的过程。

从上述定义可以看出,规定或定义一个博弈需要设定下列四个方面。

(1)、博弈的参加者(Players)。

即在所定义的博弈中究竟有哪几个独立决策、独立承担结果的个人或组织.对我们来说,只要在一个博弈中统一决策,统一行动、统一承担结果,不管一个组织有多大,哪怕是一个国家,甚至是由许多国有组成的联合国,都可以作为博弈中的一个参加方。

并且,在博弈的规则确定之后,各参加方都是平等的,大家都必须严格按照规则办事。

(2)、各博弈方各自可选择的全部策略(Strategies)或行为(Actions)的集合。

即规定每个博弈方在进行决策时,可以选择的方法,做法或经济活动的水平,量值等。

在不同博弈中可供博弈方选择的策略或行为的数量很不相同,在同一个博弈中,不同博弈方的可选策略或行为的内容或数量也常不同,有时只有有限的几种,甚至只有一种,而有时又可能有许多种,甚至无限多种可选策略或行为。

(3)、进行博弈的次序(Order)。

在现实的各种决策活动中,当存在多个独立决策方进行决策时,有时候需要这些博弈方的决策又有先后之分,并且有时一个博弈方还要作不止一次的决策选择。

这就免不了有一个次序问题。

因此规定一个博弈必须规定其中的次序,次序不同一般就是不同的博弈,即使博弈的其他方面都相同。

博弈论简介

博弈论简介

博弈论——这是当今社会上最炙手可热的概念,并且早已跳脱数学领域,在经济学中占据着越来越重要的地位。

简而言之,博弈论研究的是策略形势。

博弈论研究策略形势,即不完全竞争的情况。

换句话说,行为影响结果,结果不但取决于你的行为,还取决于其他人的行为。

博弈论(game theory)所分析的是两个或两个以上的竞争者或参与者选择能够共同影响每一参与者的行动或策略的方式。

下面我们通过一个有趣的案例,来体会博弈中将会遇到的进退得失。

智猪博弈(Pigs Payoffs)猪圈里有一头大猪,一头小猪。

猪圈的一边有一个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。

如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。

当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

那么,这两只猪各会采取什么策略呢?答案是,小猪将选择“搭便车”策略,即舒舒服服地等在食槽边,而大猪则为这一点食物不知疲倦地奔波于踏板和食槽之间。

原因其实很简单,因为若小猪去踩踏板,它将一无所获,不踩踏板反而能吃上食物。

对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。

反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强,所以不得不亲力亲为。

原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。

但对于整个社会而言,由于小猪未能参与竞争,这种“搭便车”的现象导致不平衡的社会资源配置。

现在我们来看另外一个例子:假设一家网上书店amazing公司,他们公司的口号是“我们的售价不会高于别人”。

而后来,又出现一家新开的网上书店叫newbooks,他们的广告口号是“我们的卖价总比别人低10%”。

这两家公司若坚持相互削价竞争,结果势必会以相互毁灭、价格趋零而告终。

因为只有降低到零价格,双方的价格战略才能够做到言行一致(0的90%等于0)。

《博弈论》

《博弈论》

博弈论在大数据分析中的应用
数据挖掘
博弈论可以应用于数据挖掘中的关联规则挖掘、分类和聚类等问 题,如基于博弈论的关联规则挖掘算法等。
异常检测
博弈论可以应用于异常检测中的异常值识别和分类等问题,如基 于博弈论的异常检测算法等。
推荐系统
博弈论可以应用于推荐系统中的用户行为预测和个性化推荐等问 题,如基于博弈论的推荐算法等。
04
博弈论的应用领域
经济领域
价格竞争
博弈论可以用来分析企业之间的价格竞争,研究竞争对手的反应 和策略,以制定更有效的定价策略。
寡头市场
博弈论可以用来研究寡头市场的均衡和稳定性,分析不同寡头企业 的策略和相互影响。
拍卖理论
博弈论可以用来研究拍卖机制的设计和优化,以提高拍卖的效率和 公平性。
政治领域
线性方程组
02
求解博弈中的均衡策略通常需要解线性方程组。
特征值与特征向量
03
一些博弈问题可以通过分析矩阵的特征值和特征向量来得到解
决。
概率论与数理统计基础
概率分布
在博弈中,支付通常被假 设为随机变量,其分布可 以通过概率分布来描述。
期望与方差
支付的期望和方差是博弈 论中常用的概念,它们可 以用来衡量支付的不确定 性。
弈。
特点
混合博弈既强调参与者的合作与协 商,又强调参与者的竞争与对抗, 通过综合运用两种策略实现自身利 益最大化。
应用领域
混合博弈在经济学、政治学、社会 学等领域都有广泛的应用,尤其是 在现实世界中,很多博弈都可以被 视为混合博弈。
03
博弈论的数学基础
线性代数基础
向量与矩阵
01
博弈论中经常使用向量和矩阵来表示策略和支付。

博弈论

博弈论

博弈论的基本概念1.博弈论:博弈论,又称对策论,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论的定义可以这样理解:博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自可选择的行为或策略中进行选择并加以实施,并从中取得相应收益的过程。

2.参与人:参与人指的是博弈中选择行动以最大化自己效用的决策主体(个人、团体)。

3、行动:行动是参与人在博弈的某个时点的决策变量。

一般来讲,把第i个参与人的一个行动为ai,其可供i选择的行动集合表示为Action set: Ai ={ai}。

在一个n人博弈中,n个参与人的行动的有序集为a={a1,…,an},称为行动组合。

根据行动顺序,可以把博弈分为静态博弈、动态博弈。

静态博弈:一般来讲,如果行动时同时发生的或相当于同时发生的,则称之为静态博弈。

动态博弈:如果行动的发生有先后顺序,则称之为动态博弈。

4.信息:信息指的是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。

信息集是指参与人在特定时刻所拥有的有关变量的值的知识。

例如:囚徒困境甲不知乙的选择,则甲的信息集为{坦白或者抵赖}乙已经行动,甲观察到乙的选择,则甲的信息集为{坦白}或者是{抵赖}。

5.战略:战略是参与人在给定信息集的情况下的行动规则,是参与人完整的一套行动计划,它规定参与人在什么时候选择什么行动。

战略不同于行动,它是行动的规则,对于战略的表述应该是完备的。

例如:人不犯我,我不犯人;人若犯我,我必犯人”例如:田忌赛马,田忌所选的赛马计划就是一套完整的行动计划,也就是一个战略。

6.战略空间:参与者可以选择的战略的全体组成了战略空间。

田忌赛马,六种行动方案可供选择:上中下,上下中,中上下,中下上,下上中,下中上。

这些可选择的战略的全体组成了战略空间。

任何一人战略的改变都将使结果也随之改变。

7、收益:支付、报酬,指在一个特定的战略组合下参与人得到的效用水平或期望效用水平。

博弈论最全完整-讲解

博弈论最全完整-讲解
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的
逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
例3:为什么教授如此苛刻?
问题是,一个好心肠的教授如何维持如 此铁石心肠的承诺?
他必须找到某种使拒绝变得强硬和可信 的方法。
拿行政程序或者学校政策来做挡箭牌 在课程开始时做出明确和严格的宣布 通过几次严打来获得“冷面杀手”的声

导论
博弈均衡与一般均衡 博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型 主要参考文献
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
按照大家是否清楚对局情况下每个 局中人的得益。
“各种对局情况下每个人的得益是 多少” 是所有局中人的共同知识 (common knowledge)。
据“共同知识”的掌握分为完全信 息与不完全信息博弈。
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information)
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。

博弈论的原理

博弈论的原理

博弈论的原理博弈论是一门研究冲突与合作的数学理论,它被广泛应用于经济学、政治学、生物学等领域。

博弈论的核心思想是分析参与者之间的策略选择和利益冲突,以及他们如何在这些冲突中做出决策。

在博弈论中,参与者通常被称为玩家,他们根据自己的利益和对手的行为来选择策略,从而达到最优的结果。

博弈论的基本概念包括博弈、策略、收益和均衡。

博弈是指参与者之间的互动,策略是玩家可以选择的行动方案,收益是每个玩家根据选择的策略所获得的利益,均衡是指在一定策略下,每个玩家都无法通过改变自己的策略来获得更多的收益。

在博弈论中,最经典的模型是囚徒困境。

囚徒困境是指两名嫌疑犯被分开审讯,如果他们都沉默,将会获得较轻的刑罚;如果其中一人供出另一人,供出的人将获得豁免,而另一人将面临重刑;如果两人都供出对方,都将面临一定的刑罚。

在这种情况下,每个囚徒都会选择供出对方,这样虽然对方也供出自己,但自己至少可以获得较轻的刑罚。

这个例子展示了博弈论中的非合作博弈,即每个玩家为了自己的利益而选择策略,最终导致了双方都无法获得最优结果的情况。

除了非合作博弈,博弈论还研究了合作博弈。

在合作博弈中,玩家之间可以通过合作来达到最优结果。

合作博弈的核心是寻找合作的伙伴以及如何分配合作所带来的收益。

合作博弈的一个经典模型是合作博弈中的核心。

核心是指合作博弈中所有玩家都无法通过改变合作方式来获得更多收益的状态。

在核心中,每个玩家都能获得他们认为公平的收益,没有人会因为其他玩家的选择而感到不满。

博弈论的应用非常广泛,比如在经济学中,博弈论被用来分析市场竞争和价格形成机制;在政治学中,博弈论被用来研究国际关系和决策制定过程;在生物学中,博弈论被用来分析动物社会行为和进化稳定策略。

博弈论的研究不仅帮助我们更好地理解人类行为,也为我们提供了一种分析和解决冲突的数学工具。

总之,博弈论作为一门研究冲突与合作的数学理论,深刻影响了经济学、政治学、生物学等多个领域。

通过分析参与者之间的策略选择和利益冲突,博弈论帮助我们更好地理解人类行为,并为我们提供了分析和解决冲突的数学工具。

博弈论

博弈论

博弈论何谓博弈论?博弈论,亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。

而我们理解的博弈论就是分析事物发展的规律与可能性,从而找到相应的最高利益的应对措施,从而达到优化的目的。

博弈论的创始在20世纪20年代,由匈牙利大数学家冯·诺伊曼创始。

1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。

对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。

在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解”或“平衡”,也就是对参与双方来说都最“合理”、最优的具体策略?怎样才是“合理”?应用传统决定论中的“最小最大”准则,即博弈的每一方都假设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对於每一个二人零和博弈,都能够找到一个“最小最大解”。

通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。

当然,其隐含的意义在於,这套最优策略并不依赖于对手在博弈中的操作。

用通俗的话说,这个著名的最小最大定理所体现的基本“理性”思想是“抱最好的希望,做最坏的打算”。

50年代是博弈论的成长期。

博弈论(整理过名词解释和简答)(DOC)

博弈论(整理过名词解释和简答)(DOC)

博弈论(整理过名词解释和简答)(DOC)第一篇:博弈论(整理过名词解释和简答)(DOC)一、名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。

2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。

3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。

4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。

在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。

7、均衡:所有参与人的最优战略组合。

8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。

9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。

10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。

11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。

12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。

共同知识 博弈论

共同知识 博弈论

共同知识博弈论一、博弈论简介1. 定义- 博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论。

简单来说,就是在多个参与者(称为局中人)之间,每个局中人的决策会影响其他局中人的收益,同时也受其他局中人决策的影响,博弈论就是分析这种相互影响下的决策过程和结果。

- 例如在“囚徒困境”中,两个囚犯就是局中人,他们各自的坦白或抵赖决策会影响对方的刑期,也受对方决策的影响。

2. 基本要素- 局中人(Players):参与博弈的决策主体,可以是个人、企业、国家等。

例如在市场竞争博弈中,各个企业就是局中人。

- 策略(Strategies):局中人在博弈中可以采取的行动方案。

如在石头 - 剪刀- 布游戏中,出石头、剪刀、布就是不同的策略。

- 支付(Payoffs):局中人在不同策略组合下所得到的收益或者效用。

比如在企业竞争中,利润就是支付,如果一家企业通过降价策略获得了更多市场份额和更高利润,这个利润就是它在这种策略下的支付。

3. 博弈的分类- 按照局中人行动的先后顺序分类- 静态博弈(Static Game):局中人同时选择策略,或者虽然不是同时选择,但后行动者并不知道先行动者采取了什么策略。

例如猜硬币正反面的游戏,双方同时出硬币,或者即使不是严格同时,后出的人不知道先出的人出的是正面还是反面。

- 动态博弈(Dynamic Game):局中人的行动有先后顺序,并且后行动者能够观察到先行动者所选择的策略。

如象棋、围棋等棋类游戏,一方先走,另一方根据对方的走法再做决策。

- 按照局中人对其他局中人的特征、策略空间及支付函数的了解程度分类- 完全信息博弈(Game of Complete Information):每个局中人对所有其他局中人的特征、策略空间及支付函数有准确的了解。

例如在一个完全竞争的市场中,企业都知道其他企业的成本结构、生产能力等信息(这是一种理想情况)。

- 不完全信息博弈(Game of Incomplete Information):至少有一个局中人不完全了解其他局中人的特征、策略空间或支付函数。

博弈论的定义和主要思想

博弈论的定义和主要思想

清华诚志
23
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意 义。个人理性与集体理性的冲突,各人 追求利己行为而导致的最终结局是一个 “纳什均衡”,也是对所有人都不利的 结局。他们两人都是在坦白与抵赖策略 上首先想到自己,这样他们必然要服长 的刑期。只有当他们都首先替对方着想 时,或者相互合谋(串供)时,才可以得到 最短时间的监禁的结果。
清华诚志
11
4、信息指的是参与人在博弈中所知道的 关于自己以及其他参与人的行动、策略 及其得益函数等知识;
5、得益是参与人在博弈结束后从博弈中 获得的效用,一般是所有参与人的策略 或行动的函数,这是每个参与人最关心 的东西;
6、均衡是所有参与人的最优策略或行动 的组合;均衡结果是指博弈结束后博弈 分析者感兴趣的一些要素的集合,如在 各参与人的均衡策略作用下,各参与人 最终的行动或效用集合。
清华诚志
5
Selten and Harsanyi
泽尔腾(1965)将纳 什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概 念;以及进一步刻画 不完全信息动态博弈 的“完备贝叶斯纳什 均衡”
而海萨尼则发展了刻 画不完全信息静态博
弈的“贝叶斯纳什均 衡”(1967-1968)。 总之,他俩进一步将
清华诚志
26
囚徒困境在经济学上的应用
1、两个寡头企业选择产量的博弈 如两企业联合起来形成卡特尔,选择垄断利润 最大化的产量,每个企业都可以得到更多的利 润,但卡特尔协定不是一个纳什均衡,因为给 定对方遵守协议的情况下,每个企业都想增加 产量,结果是,每个企业都只得到纳什均衡产 量的利润,它小于卡特尔产量下的利润。 有些 情况下,个人理性与集体理性的冲突对整个社 会来说也许是一件好事。

博弈论基本概念

博弈论基本概念

(1)决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。

(2)对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。

他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。

(3)局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。

只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。

(4)策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。

(5)得失(payoffs):一局博弈结局时的结果称为得失。

每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。

所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

(6)次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。

(7)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。

在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。

所谓纳什均衡,它是一稳定的博弈结果。

纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档