博弈论

合集下载

博弈论定义与主要思想

博弈论定义与主要思想

Selten and Harsanyi
泽尔腾(1965)将纳 而海萨尼则发展了刻
什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概念; 以及进一步刻画不完 全信息动态博弈的 “完备贝叶斯纳什均
画不完全信息静态博 弈的“贝叶斯纳什均 衡”(1967-1968)。 总之,他俩进一步将 纳什均衡动态化,加 入了接近实际的不完 全信息条件。他们的
著名经济学家保罗.萨缪尔森说:“要想在现代 社会做一个有文化的人,您必须对博弈论有一 个大致了解。”
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的 思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式 。
2005年诺奖授予有以色列和美国双重国籍的罗 伯特·奥曼和美国人托马斯·谢林,以表彰他们 在博弈论领域作出的贡献。
主要思想
博弈论并不是经济学的一个分支,它只是一种 方法,这也是为什么许多人将其看成数学的一 个分支的缘故。
在对参与者行为研究这一点上,博弈论和经济 学家的研究模式是完全一样的。经济学越来越 转向人与人关系的研究,特别是人与人之间行 为的相互影响和相互作用,人与人之间利益和 冲突、竞争与合作,而这正是博弈论的研究对 象。
4、信息指的是参与人在博弈中所知道的 关于自己以及其他参与人的行动、策略 及其得益函数等知识;
5、得益是参与人在博弈结束后从博弈中 获得的效用,一般是所有参与人的策略 或行动的函数,这是每个参与人最关心 的东西;

博弈论百度百科

博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。

在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。

所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。

不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。

博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

博弈论

博弈论
(一)、博弈论的定义
博弈论是一种建立在抽象推理基础之上“研究处于利益冲突的各方在竞争性活动中制定最优化胜利的策略”的理论。
作为科学行为主义学派的重要一支,博弈论不仅是研究国际冲突的策略理论,而且还是处理国际关系问题的实际手段。
(二)、博弈论的要素
1、弈者(想获得最优结果的参与者);
双方让路
(最保险、最可靠选择) A让B不让
(B的最佳方案)
A不让B让
(A的最佳方案) 相撞
(最差的结果)
双方零合博弈的典型事例是:冷战时期的美苏争夺格局。
②、多方零合博弈
多方零合博弈的典型事例是:国际关系中的领土或资产纠纷。
(3)、零合博弈强调冲突的可能性以及解决冲突的机制。
(结构现实主义理论强调国际结构中冲突的可能性,认为国际结构中的国家为了获取自己的相对收益,常常是以牺牲别国为代价的(零合博弈))。
双方变数博弈的典型即,长期以来美苏之间的军备竞赛政策的运用。
②、多方变数博弈
它是“有三方以上参与者的博弈,并且一方所得并非其他方所失,得失之和并不等于零”。
该博弈与两方变数博弈特点相似。但由于独立决策者的增多,策略的相互依存关系也就更为复杂,策略的数目按几何级数上升(2的n次方),因此目前学术界并没有关于多方非零和博弈的成熟理论。尽管如此,政治学家还是指出,该类博弈的“关键问题就是如何能够实现让所有博弈者都满意的合理的收益分配”。
(二)、支持
博弈论提出假设的有效方法,为对外政策决策者说面临的战略选择作出了解释。
博弈论是国际关系和外交决策研究的“思想发动机”,有助于一国实现最佳的策略选择,有助于认识国际冲突的性质、动力和结果,不失为一种具有实用价值的关于对策的研究方法。

《西方经济学》第七章 博弈论

《西方经济学》第七章 博弈论

21
第五节
不完全信息动态博弈
对应于不完全信息动态博弈的均衡概念是精炼 精炼 贝叶斯均衡(perfect Bayesian equilibrium). 贝叶斯均衡 这个概念是完全信息动态博弈的子博弈精炼纳 什均衡与不完全信息静态均衡的贝叶斯纳什均 衡的结合.具体来说,精炼贝叶斯均衡是所有 参与人战略和信念的一种结合.它满足如下条 件:第一,在给定每个参与人有关其他参与人 类型的信念的条件下,该参与人的战略选择是 最优的.第二,每个参与人关于其他参与人所 属类型的信念,都是使用贝叶斯法则从所观察 到的行为中获得的.
22
贝叶斯法则 贝叶斯法则是概率统计中的应用所观察 到的现象对有关概率分布的主观判断 (即先验概率)进行修正的标准方法.
23


1. 什么是占优策略均衡?什么是重复剔除的占优策 略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性 博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为 0.两寡头所进行的是产量竞争.对于寡头产品 的市场需求曲线为P=30-Q,其中Q=Q1+ Q2.Q1是寡头1的产量,Q2是寡头2的产量. (1)假定两个寡头所进行的是一次性博弈. 如果两寡头同时进行产量决策,两个寡头各生产 多少产量?各获得多少利润?
25

第七章
第一节 第三节 第四节 第五节
博弈论
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
第一节 博弈问题概述
一,博弈的基本概念 二,博弈的分类
2
一,博弈的基本概念
博弈论 博弈论(game theory)是研究决策主体的 行为发生直接相互作用时候的决策以及这 种决策的均衡问题的. 博弈论的基本概念包括:参与人 行动 参与人,行动 参与人 行动, 战略,信息 支付函数,结果 均衡. 信息,支付函数 结果,均衡 战略 信息 支付函数 结果 均衡

什么是博弈论?

什么是博弈论?

什么是博弈论?博弈论是一门研究策略决策的学科,它涉及到两个或多个参与者的博弈过程。

博弈论的研究对象可以是经济、政治、社会等领域,也可以是日常生活中的人际交往。

下面,我们来详细了解一下这门学科。

一、博弈论的起源博弈论起源于20世纪40年代,当时美国数学家冯·诺依曼(John von Neumann)和经济学家奥斯卡·莫根斯特恩(Oskar Morgenstern)合著了《博弈论与经济行为》一书。

这是一本奠定博弈论基础的重要著作,它将博弈论应用于经济学领域,从而成为博弈论的奠基之作。

二、博弈论的基本概念1.参与者博弈论的参与者指的是博弈过程中参与决策的个体或组织,例如一个独立的个人、两个公司或国家之间的竞争。

2.策略策略是指参与者在博弈中所采用的行为方式或决策方法。

不同的策略可能导致不同的博弈结果,因此博弈过程中策略的选择非常重要。

3.收益收益是博弈过程中参与者所能获取的利益,包括经济利益、社会地位、权力等。

收益对参与者而言是决策的目的和结果,因此其大小和分布会影响博弈的结果。

4.博弈形式博弈形式指的是博弈参与者、策略和收益之间的关系,是博弈过程的精神核心。

博弈形式一般分为合作博弈和非合作博弈两种,而在这两种博弈形式下,又分别有多种复杂的形式。

三、博弈论的应用1.经济学领域博弈论在经济学领域的应用最为广泛。

经济学研究的主题之一是市场竞争,而博弈论可以帮助我们透彻理解市场竞争的规律。

例如,博弈论可以用来研究企业之间的价格战、垄断行为、拍卖等问题。

2.政治学领域博弈论在政治学领域的应用也非常重要。

政治学研究的主题之一是国家之间的竞争和协作,而博弈论可以帮助我们研究国际关系、外交政策等问题。

例如,博弈论可以用来研究国际贸易谈判、军备竞赛等问题。

3.人际交往领域博弈论在人际交往领域的应用也相当重要。

通过博弈论,我们可以学习如何有效地沟通和合作,避免双方的冲突和误解。

例如,博弈论可以用来研究双方的协调、合作等问题。

博弈论

博弈论

博弈论是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。

1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。

纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的学科。

博弈的分类根据不同的基准也有所不同。

一般认为,博弈主要可以分为合作博弈和非合作博弈。

它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

博弈论概述

博弈论概述
“坦白”是A的占优策略。同样,“坦白”也是B的占优策略。
一般地,称 si*为局中人i的(严格)占优策略, 若对应所有的
si , s i*是i的严格最优策略 , 即:
ui (si*, si ) ui (si' , si ) si , si' si*
对应地,所有的 si' si* 被称为“劣策略”。注意:这
甲的策略
1
2
3
乙的策略
1
7
8
9
2
6
2
3
3
5
4
0
1.乙先行动。若乙选1,则甲选3;乙选2,则甲选1;乙选3, 则甲选1。乙在行动时会估计到甲的行动,它估计三种选择 中的最高代价为策略1(损失900万),其次为策略2(损失 600万),最低为策略3(损失为500万)。因此,乙必选代 价最低的策略3。——最大最小原理。结论:乙选择3,甲选 1作为回应,乙损失500万,甲获益500万。
在博弈论里,一个博弈可以有两种表述方式:一种是策 略式(strategic form representation)表述,另一种是 扩展式( extensive form representation )表述。前者 适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式 表述中,所有参与人同时选择各自的策略,所有参与人选择 的策略一起决定每个参与人的支付。
2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E.

博弈论的定义和主要思想

博弈论的定义和主要思想
著名经济学家保罗.萨缪尔森说:“要想在现代 社会做一个有文化的人,您必须对博弈论有一 个大致了解。”
清华诚志
9
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的 思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式 。
清华诚志
12
两种均衡
占优策略是无论其他局中人采取什么策 略对于自己来说都是最好的策略。
占优均衡所有局中人都有占优策略而形 成的均衡。
纳什均衡是指某一局中人在其他局 中人的策略给定时选择最好策略而 形成的均衡。
清华诚志
13
占优均衡一定是纳什均衡,但 纳什均衡不一定是占优均衡。
占优均衡
– “不管你做什么,我所做的都是最佳选择。” – “不管我做什么,你所做的都是最佳选择。”
纳什均衡
– “给定你的行为,我所做的是最佳选择。” – “给定我做什么,你所做的是最佳选择。”
清华诚志
14
博弈的分类
1)根据参与人的多少,可将博弈分为两人 博弈和多人博弈;
2)根据博弈结果的不同,又可分为零和博 弈、常和博弈和变和博弈;
3)根据博弈方策略的数量,可分为有限博 弈和无限博弈;
清华诚志
清华诚志
5
Selten and Harsanyi
泽尔腾(1965)将纳 什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概 念;以及进一步刻画 不完全信息动态博弈 的“完备贝叶斯纳什 均衡”

博弈论

博弈论

博弈论研究的主题是:理性人的互动行为。

博弈论作为一种解释力非常强的理论有三个基本假定:1 、理性人假定;2 、利益相关性假定; 3 、每个人是理性的是所有参与者的公共知识。

博弈论是一门数学,这是博弈论的学科特点。

主要有三种博弈:零和博弈;变和博弈;常和博弈。

对于任何一个博弈来说,都有一个均衡点,也就是那什均衡,那什均衡是博弈的解。

博弈论中的典型例子:囚徒困境。

囚徒困境在博弈论中有一个经典案例--囚徒困境,非常耐人寻味。

“囚徒困境”说的是两个囚犯的故事。

这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。

在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。

这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。

但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。

而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。

当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。

那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。

但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。

这种想法的诱惑力实在太大了。

但他也意识到,他的同伙也不是傻子,也会这样来设想他。

所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。

博弈论

博弈论

支付
支付是指在一个指定的战略组合下参与 人得到的确定效用水平,或者是参与人 得到的期望效用水平
结果
结果是博弈分析者所要揭示的东西,是 分析者感兴趣的要素的集合,如均衡战 略组合,均衡行动组合,均衡支付组合 等。
均衡
均衡,是所有参与人的最优战略组合或 行动组合
博弈类型
博弈的类型可以从两个角度描述; (1) 参与人行动的先后顺序。从此度,博 弈可以分为静态和动态两种。(2)参与 人对有关其他参与人(竞争对手)的特 征、战略空间及支付函数的知识。从此 角度,博弈可分为完全信息博弈和不完 全信息博弈
囚犯的难题
博弈的纳什均衡的另一个问题是它并不 一定导致帕累托有效的结果。 囚犯的难题深刻揭示了这一问题。 囚犯的难题在经济和政治现象中有广泛 的应用。如:裁军计划、两个寡头选择 产量的博弈等。
完全信息动态博弈: 子博弈精炼纳什均衡
动态博弈和精炼纳什均衡 有限次重复博弈:“连锁店之迷” 无限次重复博弈:“针锋相对”策略
动态博弈与精炼纳什均衡
用混合策略解决有些博弈中不存在纳什均衡的问题, 除此之外,纳什均衡还有另外的问题,即有些博弈中 可能不止一个(甚至是无穷个)纳什均衡,而究竟哪 个均衡实际上会发生?很难回答。在纳什均衡中,参 与人在选择自己的战略时,把其他参与人的策略当作 给定的,不考虑自己的选择将如何影响对手的 策略。 实际上,当一个人行动在前,另一个人行动在后时, 后者自然会根据前者的选择调整自己的选择,前者在 作选择时自然会理性地考虑这一点,所以,不可能不 考虑自己的选择对其对手选择的影响。由于纳什均衡 中,不考虑这种影响,事实上便允许了“不可置信威 胁的”存在,于是增加了纳什均衡的个数。而泽而腾 机敏地引入动态博弈分析完善了纳什均衡的概念。

什么是博弈论?它对我们的生活起到了什么作用?

什么是博弈论?它对我们的生活起到了什么作用?

什么是博弈论?它对我们的生活起到了什么作用?
一、什么是博弈论?
博弈论是研究决策者在不确定信息下作出决策的一种数学理论。

基本
模型是博弈,意思是一个包含一组演员、一组策略和一些收益的场景,演员根据选定的策略得到一定的收益。

博弈论的研究对象是决策者行
为和决策制度的理性分析,以及对他们行为的合理比较。

二、博弈论在社会生活中的应用
1.经济领域
博弈论在经济学中有着广泛的应用,它主要研究市场竞争、战略合作、激励机制等问题。

在竞争的市场中,企业之间需要采取合适的策略来
保持竞争优势,而博弈论可以帮助企业进行理性的决策。

例如在定价
问题上,企业可以采用策略博弈理论来制定最优策略,达到利润最大化。

2.政治领域
在政治中,博弈论主要研究的是多个政治力量之间的互动,以及政治
决策的成本和效果。

例如,在某些政治制度下,不同的政治力量会进
行策略博弈,来实现自己的目的。

3.社会学领域
博弈论在社会学领域主要研究集体行为,例如合作行为、冲突行为等。

例如,在家庭中,夫妻之间可能会面临各种策略博弈,例如互相表达
感情、处理矛盾问题等。

4.生物学领域
博弈论在生物学中也有着广泛的应用,例如在两个激素反馈环路中,
光线激活素可以促使二者同时发生变化。

这样的相互作用在生物学上
是基于博弈论的思想。

三、结语
博弈论已经广泛应用到各个领域。

它不仅有助于我们理解现实世界中
所发生的复杂现象,而且可以帮助我们制定最优策略,实现我们的目标。

它对我们的社会生活起到了重要的作用。

博弈论简介

博弈论简介
பைடு நூலகம்
经济学
拍卖理论
1
• 博弈论可以用来解释不同拍卖机制下的拍 卖策略和价格形成。
寡头垄断竞争
2
• 研究寡头垄断企业如何制定竞争策略,以 实现自身利益最大化。
劳动力市场与产品市场
3
• 博弈论被用于分析劳动者和雇主在劳动力 市场上的博弈行为,以及企业在产品市场上
的竞争策略。
政治学
选举行为
01
• 研究选民、政党、候选人之间的策略互动,以及投票行
生态学
• 研究生态系统中的食物链、竞争、共生等关系,以及物种之间的博弈策略。
游戏与计算机科学
01
游戏设计
• 博弈论被用于设计具有挑战性和趣味性的游戏,如棋类游戏、策略游戏 等。
02
计算机科学
• 研究计算机在处理问题时的决策过程和算法设计,如人工智能、机器学
习等领域。
03
信息论
• 研究信息传递过程中的策略选择和最优信息传输,如密码学、信息编码
博弈论简介
contents
目录
• 博弈论的基本概念 • 博弈论的基本理论 • 博弈论的应用 • 博弈论的未来发展 • 结论
01
博弈论的基本概念
定义与特点
• 博弈论(Game Theory)是一门应用数学
1
分支,主要研究在特定情境下个体或团队如 何做出决策以及这些决策之间的相互作用。
• 博弈论的特点在于强调决策的互动性和策
3
,常用于研究长期竞争和合作关系。
合作博弈
• 合作博弈是指参与者可以通过达成协议或联盟来优化整
01
体利益的博弈。
02
• 在合作博弈中,参与者可能会放弃部分利益,以换取整

博弈论

博弈论

• 4. 战略(strategy)
• 指参与人在给定信息集的情况下的行动规则, 它规定参与人在什么时候选择什么行动。 • (1)一般用si 表示第i个参与人的一个特定战 略,Si = {si}代表第i 个参与人的所有可选择 的战略集合。如果n个参与人每人选择一个战略, n维向量s=(s1,…,si,…,sn )称为一个战略组 合(strategy profile),其中si是第i个参与人 选择的战略。

囚徒困境引出重要结 论: 一种制度(体制)安 排,要发生效力,必须是 一种纳什均衡。否则,这 种制度安排便不能成立。 现实中囚徒困境问题: 军备竞赛、公共产品私 人提供、寡头竞争等。
领域
纳什均衡 (增产,增 产)
制度安排
寡头竞争 公共产品 私人 提供
• (2)战略与行动是两个不同的概念,战略是行动 的规则而不是行动本身。 • 例如:“人不犯我,我不犯人;人若犯我,我 必犯人”是一种战略,“犯”与“不犯”是两种 行动,战略规定了什么时候“犯”,什么时候 “不犯”。 • (3)作为一种行动规则,战略必须是完备的,它 要给出参与人在每一种可想象到的情况下的行动 选择,即使参与人并不预期这种情况会实际发生。
博 弈 论
西 北 大 学 经济管理学院
课程主体结构
一、博弈论概述 二、博弈论的基本概念 三、完全信息静态博弈 四、完全信息动态博弈
课程主体结构
五、不完全信息静态博弈
六、不完全信息动态博弈
一、博弈论概述
• 1.博弈论概念(game theory) • (1)博弈:又称为对策或游戏,是指一些人或组 织在“策略相互依存”情形下相互影响、互相作 用的状态。 • (2)博弈论:研究决策主体的行为发生直接相互 作用时的决策,以及这种决策的均衡问题,即当 一个主体的选择受到其他主体选择的影响,而且 反过来影响到其他主体选择时的决策问题和均衡 问题。

经典博弈论概述

经典博弈论概述

经典博弈论概述1 什么是博弈论博弈论是一种独特的处于各学科之间的研究人类行为的方法。

与博弈论有关的学科包括数学,经济学和其他社会科学和行为科学。

博弈论是由约翰•冯•诺依曼创立的,该领域第一本重要著作是诺依曼和另一个伟大的数理经济学家奥斯卡•摩根斯坦所著的。

博弈论是关于包含相互依存情况中理性行为的研究。

所谓相互依存,通常是指博弈中的任何一个参与者受到其他参与者行为的影响,反过来,他的行为也影响到其他参与者。

由于这种相互依存性,游戏或博弈的结果依赖于每一个参与者的决策,没有一个人能完全地控制所要发生的事情,也没有一个参与者处于孤独的状态。

相互依存常使博弈中的参与者之间产生竞争。

譬如两个人分蛋糕、每个参与者都希望自己的那块可以分得大一些。

然而,竞争仅仅是博弈论中相互依存的一个方面。

应该指出,通常地博弈并非纯粹是参与者之间的竞争,相互依存的另一个方面是参与者可以有某些共同的兴趣或利益所在。

仍以分蛋糕为例,作为参与者策略行动的结果,蛋糕的大小可以增加或者减少。

参与者的共同兴趣在于增加蛋糕的总量,他们互相“倾轧”之处在于如何分配。

从博弈论研究的角度,增大蛋糕应是博弈的第一步,而分配蛋糕则是博弈的第二步。

在博弈论中还需要对一个词“理性行为” 作一些说明。

博弈论中的所谓理性,一般不是指道德标准。

从参加博弈的参与者的眼光来看,他们试图去实施自己认为可能最好的行为,尽管这样的行为有可能损害了其他参与者。

由于参与者的相互依存性,博弈中一个理性的决策必定建立在预测其他参与者的反应之上。

一个参与者将自己置身于其他参与者的位置并为他着想从而预测其他参与者将选择的行动,在这个基础上该参与者决定自己最理想的行动,这就是博弈论方法的本质与精髓。

博弈论中每一个参与者做出理性决策的重要依据之一是他的可能收益有多少,这就是一个参与者需要认真计算的收益函数(payoff function) 。

对于每一个参与者、如果他们在可供自己选择的策略空间中任取一个策略作为自己的行动,既不会给自己带来盈利,又不会使他们必须付出,这种失去了激励机制的游戏本身也就失去了“博” 的意义,在社会经济领域中尤其不太可能出现这类现象。

博弈论

博弈论

博弈论的基本概念1.博弈论:博弈论,又称对策论,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论的定义可以这样理解:博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自可选择的行为或策略中进行选择并加以实施,并从中取得相应收益的过程。

2.参与人:参与人指的是博弈中选择行动以最大化自己效用的决策主体(个人、团体)。

3、行动:行动是参与人在博弈的某个时点的决策变量。

一般来讲,把第i个参与人的一个行动为ai,其可供i选择的行动集合表示为Action set: Ai ={ai}。

在一个n人博弈中,n个参与人的行动的有序集为a={a1,…,an},称为行动组合。

根据行动顺序,可以把博弈分为静态博弈、动态博弈。

静态博弈:一般来讲,如果行动时同时发生的或相当于同时发生的,则称之为静态博弈。

动态博弈:如果行动的发生有先后顺序,则称之为动态博弈。

4.信息:信息指的是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。

信息集是指参与人在特定时刻所拥有的有关变量的值的知识。

例如:囚徒困境甲不知乙的选择,则甲的信息集为{坦白或者抵赖}乙已经行动,甲观察到乙的选择,则甲的信息集为{坦白}或者是{抵赖}。

5.战略:战略是参与人在给定信息集的情况下的行动规则,是参与人完整的一套行动计划,它规定参与人在什么时候选择什么行动。

战略不同于行动,它是行动的规则,对于战略的表述应该是完备的。

例如:人不犯我,我不犯人;人若犯我,我必犯人”例如:田忌赛马,田忌所选的赛马计划就是一套完整的行动计划,也就是一个战略。

6.战略空间:参与者可以选择的战略的全体组成了战略空间。

田忌赛马,六种行动方案可供选择:上中下,上下中,中上下,中下上,下上中,下中上。

这些可选择的战略的全体组成了战略空间。

任何一人战略的改变都将使结果也随之改变。

7、收益:支付、报酬,指在一个特定的战略组合下参与人得到的效用水平或期望效用水平。

博弈论(整理过名词解释和简答)

博弈论(整理过名词解释和简答)

一、名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。

2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。

3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。

4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。

在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。

7、均衡:所有参与人的最优战略组合。

8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。

9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。

10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。

11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。

12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。

13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。

博弈论

博弈论

1.什么是博弈论?“博弈论”译自英文“Game Theory”,直译就是“游戏理论”。

博弈论是研究行为人在矛盾和对抗性关系中的行为决策中一般性规律规律的学科。

是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。

博弈:一些个人、组织,面对一定的环境条件,在一定的规律下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。

包括:博弈的参加者,各博弈方的全部策略或行为集合,进行博弈的次序,博弈方的得益四方面。

纳什均衡:设存在一个策略组合Bx’和By’,且Bx’∈Bx(Bx1,Bx2,……,BxN),By’∈By(By1,By2,……,ByN) ,当x选择Bx’时,y的最优策略选择是By’,同时,当y选择By’时,x的最优选择是Bx’,因此,x和y选择了Bx’和By’时,谁都不会再改变策略。

这种局面称为Nash均衡,是Nash最早提出并证明了它的存在。

1951年Nash提出了Nash均衡的概念,并证明了Nash均衡的存在——真正奠定了博弈论作为一门学科的基础。

之前,虽然有很多人致力于研究博弈对策的规律,但总没有得出有意义的成果,直到Nash。

n人博弈纳什均衡定⏹设:G={A1,A2,A3,…….,AN;U1,U2, U3,…………,UN}⏹如果存在一个策略组合{a1*, a2*,……,aN*},其中a1*∈A1,a2*∈A2,…….,aN*∈AN,使Ui*=Ui{a1*, a2*,…,aN*} ≥Ui{a1*,…,ai-1*,aij*,ai+1*…,aN*}⏹对任意i ∈N都成立,则{a1*, a2*,……,aN*}为Nash均衡。

囚徒困境坦白B不坦白A 坦白A 不坦白两个被捕的囚徒之间的一种特殊博弈,双方的利益不仅取决于他们自己的策略选择也取决于对方的策略选择。

博弈论

博弈论

个词:供给与需求。博弈论专家坎多瑞引申说:要成为现
代经济学家,这只鹦鹉必须再多学一个词,这个词就是 “纳什均衡”。
纳什均衡是完全信息静态博弈的一般情况。占优 战略均衡和重复剔除的占优战略均衡是其中的特例, 并且是均存在唯一的纳什均衡点。
举例: “性别之战”
男方和女方商量共度周末。男方喜欢看足球,而女
1、子博弈精炼纳什均衡
房地产开发博弈
B 开发 A 开发
不开发 不开发
-3,-3 0,1
1,0
0,0
开发商A是先行者。并且在行动之前拥有后行动者B
选择战略的完全信息。
对B的战略进行了预测,在不计较得失的情况下 ,
预测结果无非有这么几种选择:

无论A是否开发,B都要开发。 如果A开发,B也开发;如果A不开发,B也不开发; 如果A开发,B不开发;如果A不开发,B就开发; 无论A是否开发,B必定开发。
高成本
默许
进入
A
低成本
默许 阻挠
阻挠
-10,0 0,300
B
40,50 0,300
30,100 0,400
-10,140
0,400
不进入
假定高成本的概率为x,则低成本的概率为1-x B进入得到的期望利润为40x+(-10)(1-x) B不进入得到的期望利润为0 B最终是否进入取决于两者得到的期望利润,进入的
第七章
博弈论
要想在现代社会中做一个有文化的人, 你必须对博弈论有一个大致了解。 ——保罗.萨谬尔森
主要内容:
博弈问题概述
完全信息静态博弈
完全信息动态博弈
不完全信息静态博弈 不完全信息动态博弈
一、博弈ame Theory ):是研究决策主体的行 为发生直接相互作用时候的决策以及这种决策的均衡问 题的。又称对策论,是描述、分析多人对策行为的理论 现代经济博奕理论始于1944年冯· 诺依曼(John Von Neumann)和莫根施特恩(Oskar Margenston)的《博奕论 与经济行为》一书。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。

博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。

简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。

1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。

20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。

在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。

1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。

博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。

它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。

正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。

正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。

”张维迎:《博弈论与信息经济学》,上海人民出版社2004 年版,第3 页。

②2001 年诺贝尔经济学奖授予了在不对称信息市场理论方面做出杰出贡献的三位博弈论专家,他们是美国加利福尼亚大学伯克利分校的阿克诺夫(GorgeAkerlof)教授、斯坦福大学的斯宾塞(A. M. Spence)教授和哥伦比亚大学的斯蒂格利茨(J. Stiglitz)教授。

在博弈论分析中,一定场合下的每个博弈者在决定采取何种行动时都策略地、有目的地行事,他既要考虑其他博弈者对自己决策行为的影响,又要考虑自己的决策对其他博弈者决策的可能影响,并在寻求自身效益最大化的前提下,来确定自己的决策。

一个博弈所包括的要素有:参与人、信息、策略、行动的次序、收益、结果。

1、参与人:参与人是博弈的决策主体,他们的目的是通过选择行动(或策略)以最大化自己的支付(效用)水平。

参与人可以是自然人,也可以是各种社会组织,如企业、政府、社团等。

2、信息:信息是参与人有关博弈的知识,特别是有关“自然①”的选择、其他参与人的特征和行动的知识。

信息对于博弈参与者的意义和作用至关重要,掌握信息的多少将直接影响到决策的准确性,从而关系到整个博弈的成败。

3、策略:策略是指在博弈的每一环上,参与者的行事规则,即按什么规则选择行动。

在不同的博弈中可供博弈方选择的策略或行动很不相同。

即使在同一博弈中,不同博弈方的可选策略或行为也常常不同,有时只有有限的几种,甚至只有一种,而有时又可能有许多种,甚至无限多种。

4、行动的次序:在现实的各种决策中,当多个独立博弈方进行决策时,有时候这些博弈方必须同时做出选择(这样能保证公平合理),但有时候各博弈方的决策又必须有先后之分。

并且,在一些博弈中每个博弈方还要不止一次地做出选择,这就免不了有一个次序问题。

因此,规定一个博弈就必须规定其中的次序,不同的次序必然是不同的博弈,即使其他方面都相同。

5、收益:在博弈论中,收益或者是指在一个特定的战略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用水平。

收益可以是正值,也可以是负值。

虽然各博弈方在各种情况下的收益是客观存在的,但这并不意味着各博弈方都充分了解各方的收益情况。

在许多博弈中,总存在某些博弈方对其他博弈方的收益无法肯定的情况。

6、结果:结果是指博弈中参与者的行动所产生的每一种可能性,包括策略的组合、行动组合以及支付组合等。

①这里所说的“自然”是指代表随机选择作用的博弈方。

2.2.2 纳什均衡纳什在他1950 年的经典论文中,首先提出了他自己称为“均衡点(Equilibrium Point)”的纳什均衡概念,并且同时证明了在相当广泛的博弈类型中,混合策略意义上的纳什均衡是普遍存在的。

纳什均衡可以描述为:如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极去改变这一战略组合,这一战略组合称为该博弈的纳什均衡。

纳什均衡揭示了博弈均衡与经济均衡的内在联系,它奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开。

纳什均衡的普遍存在性,意味着纳什均衡在分析大多数博弈问题中,都是一种基本的分析方法。

因此,在本文的分析中也把纳什均衡作为基本的分析工具之一。

一博弈理论概述经典博弈论概述博弈论又被称为对策论,它是研究决策者在决策主体各方相互作用情况下如何进行决策及有关这种决策的均衡问题的理论。

与其他理论不同,博弈论强调决策主体各方策略的相互依存性,即任何一个决策主体必须在考虑其他局中人可能的策略选择基础上来确定自己的最优行动策略。

其精髓在于博弈中的一个理性决策者必须考虑局中其他人反应的基础之上来选择自己最理想的行动方案。

所谓均衡即所有局中参与人的最优策略组合,各方博弈产生的结果是一个均衡结局,它可能不是局中各方及整体的利益最大化,但它是在已给定信息与知识条件下的一种必然结果,因为任何一方改变策略而导致均衡的变化都有可能使自己得到一个更差的结果。

博弈论研究人们的行为在直接相互作用时的决策以及决策的均衡问题。

经典博弈论预设人是完全理性的,即人人都会在给定的约束条件下最大化自身的利益,人们的行为互相影响且通常信息不对称。

博弈的结局往往是一种博弈策略组合所产生的均衡结果,我们称之为纳什均衡。

,即给定对手的策略,每个参与人选择自己的最优策略。

本文根据理性假设依据的不同,把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈论,它是依据完全理性的经济人出发来研究均衡问题的将经典博弈论与生态演化论相结合的博弈理论称之为演化博弈论,它是依据有限理性的社会人出发来研究均衡问题的。

演化博弈论概述演化博弈论概念。

演化博弈论又称进化博弈论,是经典博弈论与生态演化论相结合的研究成果,它从有限理性的社会人出发来分析参与人的资源配置行为,并以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的演化趋势。

演化博弈理论基本均衡概念一进化稳定策略。

进化稳定策略,,是由梅纳德·史密斯和普赖斯在年引入,并由史密斯在著作《演化与博弈论》中得到了进一步的发展。

其直观思想是如果一个群体原群体的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体更高的期望支付,随着时间的演化,突变者群体最终会从原群体中消失,原群体所选择的策略就是进化稳定策略。

如果用于分析人类的群体行为,那么进化的结果将是那些选择突变策略的群体最终会改变策略而选择进化稳定策略。

演化博弈论基本动态概念一模仿者动态。

进化博弈论用系统论的观点看待群体行为的调整过程,主要研究群体行为演化系统的变化,如何描述动态系统的状态变化是进化博弈论的关键,对此经济学家从不同的方面对演化系统的过程进行了描述,提出了不同的动态模型。

到目前为止,在进化博弈论中应用得最多的还是由在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态即。

所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。

经典博弈论与演化博弈论的区别理性假定不同。

经典博弈论从完全理性出发,把经济中参与人之间的行为关系看作为一种原子式的互动或者机械式的反应。

该理论认为在任何情况下,参与人都能对环境的任何变化做出最优反应,然而在多数情况下这个理性假定是难以满足的。

演化博弈论从有限理性出发,认为经济中参与人只能知道世界状态的一部分而不可能知道世界的所有状态,参与人也不可能知道各种状态出现的客观概率及不同状态对自己支付的意义,在多数情况下参与人并不能对环境的任何变化做出最优反应,其决策是基于某种常规而非理性的计算结果,这种常规一般来自于博弈的历史,因为历史已经包含了对手如何行动的相关信息,同时通过对历史的观察有助于参与人知道什么是成功策略什么是不成功策略。

研究对象及方法不同。

经典博弈论以参与者个人为研究对象,它虽然认为个人之间的行为是相互影响的,但却在假定其他参与人行为选择一定的情况下来考察个人最优化行为。

即假定每个参与人都能从对手的选择中正确地推断出博弈的支付结构进而预测到均衡结果,所以不需要考察达到均衡的动态过程。

演化博弈论以参与人群体为研究对象,假定各群体、个体之间的行为相互影响且不同群体的个体之间进行重复博弈,个体在给定信息下并不一定选择最优化行为,而是通过学习、模仿等动态调整过程做出决策,其均衡的结果依赖于博弈的历史及博弈所处的社会环境等。

达到均衡的过程影响均衡的结果,因而演化博弈论主要利用动态方法研究群体达到均衡的行为调整过程,这种方法可以把从个体行为到集体行为的形成机制、组织和制度等因素都纳入到模型中,因此能够更真实地反应经济主体行为的多样性和复杂性。

动态概念不同。

经典博弈论虽然也研究动态博弈,但与演化博弈论所研究的动态不同。

经典博弈论的动态博弈假定各参与人都有特定的对手,以参与人行为的时间顺序及信息的传递为依据。

在动态博弈中后行动者通过观察选择先行动者的选择而做出最优反应决策,先行动者也会预期到自己的行动会传递自己的信息,因而先行动者在给定预期后行动者的行为反应下选择自己的最优策略,后行动者在给定先行动者行为所传递的信息下做出自己的最优选择。

显然这种动态博弈并不涉及达到均衡的调整过程也不涉及外在因素对均衡的影响。

演化博弈论假定参与人并没有特定的博弈对手,它所强调的动态是相对于群体行为达到均衡的调整过程。

相关文档
最新文档