博弈论

合集下载

博弈论定义与主要思想

博弈论定义与主要思想

Selten and Harsanyi
泽尔腾(1965)将纳 而海萨尼则发展了刻
什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概念; 以及进一步刻画不完 全信息动态博弈的 “完备贝叶斯纳什均
画不完全信息静态博 弈的“贝叶斯纳什均 衡”(1967-1968)。 总之,他俩进一步将 纳什均衡动态化,加 入了接近实际的不完 全信息条件。他们的
著名经济学家保罗.萨缪尔森说:“要想在现代 社会做一个有文化的人,您必须对博弈论有一 个大致了解。”
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的 思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式 。
2005年诺奖授予有以色列和美国双重国籍的罗 伯特·奥曼和美国人托马斯·谢林,以表彰他们 在博弈论领域作出的贡献。
主要思想
博弈论并不是经济学的一个分支,它只是一种 方法,这也是为什么许多人将其看成数学的一 个分支的缘故。
在对参与者行为研究这一点上,博弈论和经济 学家的研究模式是完全一样的。经济学越来越 转向人与人关系的研究,特别是人与人之间行 为的相互影响和相互作用,人与人之间利益和 冲突、竞争与合作,而这正是博弈论的研究对 象。
4、信息指的是参与人在博弈中所知道的 关于自己以及其他参与人的行动、策略 及其得益函数等知识;
5、得益是参与人在博弈结束后从博弈中 获得的效用,一般是所有参与人的策略 或行动的函数,这是每个参与人最关心 的东西;

博弈论百度百科

博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。

在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。

所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。

不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。

博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

博弈论

博弈论

2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。

博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。

简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。

1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。

20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。

在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。

1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。

博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。

它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。

正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。

正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。

博弈论

博弈论
(一)、博弈论的定义
博弈论是一种建立在抽象推理基础之上“研究处于利益冲突的各方在竞争性活动中制定最优化胜利的策略”的理论。
作为科学行为主义学派的重要一支,博弈论不仅是研究国际冲突的策略理论,而且还是处理国际关系问题的实际手段。
(二)、博弈论的要素
1、弈者(想获得最优结果的参与者);
双方让路
(最保险、最可靠选择) A让B不让
(B的最佳方案)
A不让B让
(A的最佳方案) 相撞
(最差的结果)
双方零合博弈的典型事例是:冷战时期的美苏争夺格局。
②、多方零合博弈
多方零合博弈的典型事例是:国际关系中的领土或资产纠纷。
(3)、零合博弈强调冲突的可能性以及解决冲突的机制。
(结构现实主义理论强调国际结构中冲突的可能性,认为国际结构中的国家为了获取自己的相对收益,常常是以牺牲别国为代价的(零合博弈))。
双方变数博弈的典型即,长期以来美苏之间的军备竞赛政策的运用。
②、多方变数博弈
它是“有三方以上参与者的博弈,并且一方所得并非其他方所失,得失之和并不等于零”。
该博弈与两方变数博弈特点相似。但由于独立决策者的增多,策略的相互依存关系也就更为复杂,策略的数目按几何级数上升(2的n次方),因此目前学术界并没有关于多方非零和博弈的成熟理论。尽管如此,政治学家还是指出,该类博弈的“关键问题就是如何能够实现让所有博弈者都满意的合理的收益分配”。
(二)、支持
博弈论提出假设的有效方法,为对外政策决策者说面临的战略选择作出了解释。
博弈论是国际关系和外交决策研究的“思想发动机”,有助于一国实现最佳的策略选择,有助于认识国际冲突的性质、动力和结果,不失为一种具有实用价值的关于对策的研究方法。

博弈论百度百科

博弈论百度百科

博弈论百度百科博弈论是一门研究决策制定和决策结果的学科,它是应用数学的一个分支,通过运用数学和逻辑工具,探讨参与者在互动决策中的最佳策略选择。

在博弈论中,参与者被称为玩家,他们根据自身利益和目标来做出决策。

博弈论适用于各种不同领域的情境,包括经济学、政治学、生物学等。

一、概述博弈论的研究对象是策略性互动。

在一个博弈中,每个玩家都会依据一定的策略选择进行行动,而这个选择可能会受到其他玩家的影响。

博弈论试图理解和分析在这种互动中,参与者如何做出决策,并找到最优的解决方案。

博弈论的核心概念是博弈,一个博弈可以用一个四元组表示:(N, A, U, F),其中:- N表示参与博弈的玩家集合;- A表示每个玩家可选的行动集合;- U表示每个玩家的效用函数,用于衡量不同结果对该玩家的好坏程度;- F表示每个玩家的信息集合。

信息集合是指每个玩家在博弈过程中所了解的信息。

二、博弈论的重要概念1. 纳什均衡纳什均衡是博弈论中最重要的概念之一,指的是在一个博弈中,所有玩家选择的策略组合,使得任何玩家都没有动机单方面改变自己的策略。

纳什均衡是一个稳定状态,玩家之间不再有改变策略的动机。

2. 零和博弈与非零和博弈博弈可以分为零和博弈和非零和博弈。

零和博弈是指参与博弈的玩家的收益之和为零,即一方获利必然导致另一方的损失。

非零和博弈是指参与博弈的玩家的收益之和不为零,即可以存在多方共同受益的情况。

3. 微观博弈与宏观博弈微观博弈是指研究个体玩家之间的策略性互动,关注的是个体决策的结果。

宏观博弈是指研究整体群体之间的策略性互动,关注的是全局结果。

三、应用领域博弈论的研究在众多领域中都具有广泛的应用。

以下是博弈论在一些领域的应用举例:1. 经济学博弈论在经济学领域中有着广泛的应用。

它可以用来研究市场竞争、合作与冲突、价格形成等经济问题。

例如,博弈论可以用来分析竞争市场中的价格战和垄断市场中的价格定价策略。

2. 政治学博弈论在政治学领域中也有着重要的应用。

什么是博弈论?

什么是博弈论?

什么是博弈论?博弈论是一门研究策略决策的学科,它涉及到两个或多个参与者的博弈过程。

博弈论的研究对象可以是经济、政治、社会等领域,也可以是日常生活中的人际交往。

下面,我们来详细了解一下这门学科。

一、博弈论的起源博弈论起源于20世纪40年代,当时美国数学家冯·诺依曼(John von Neumann)和经济学家奥斯卡·莫根斯特恩(Oskar Morgenstern)合著了《博弈论与经济行为》一书。

这是一本奠定博弈论基础的重要著作,它将博弈论应用于经济学领域,从而成为博弈论的奠基之作。

二、博弈论的基本概念1.参与者博弈论的参与者指的是博弈过程中参与决策的个体或组织,例如一个独立的个人、两个公司或国家之间的竞争。

2.策略策略是指参与者在博弈中所采用的行为方式或决策方法。

不同的策略可能导致不同的博弈结果,因此博弈过程中策略的选择非常重要。

3.收益收益是博弈过程中参与者所能获取的利益,包括经济利益、社会地位、权力等。

收益对参与者而言是决策的目的和结果,因此其大小和分布会影响博弈的结果。

4.博弈形式博弈形式指的是博弈参与者、策略和收益之间的关系,是博弈过程的精神核心。

博弈形式一般分为合作博弈和非合作博弈两种,而在这两种博弈形式下,又分别有多种复杂的形式。

三、博弈论的应用1.经济学领域博弈论在经济学领域的应用最为广泛。

经济学研究的主题之一是市场竞争,而博弈论可以帮助我们透彻理解市场竞争的规律。

例如,博弈论可以用来研究企业之间的价格战、垄断行为、拍卖等问题。

2.政治学领域博弈论在政治学领域的应用也非常重要。

政治学研究的主题之一是国家之间的竞争和协作,而博弈论可以帮助我们研究国际关系、外交政策等问题。

例如,博弈论可以用来研究国际贸易谈判、军备竞赛等问题。

3.人际交往领域博弈论在人际交往领域的应用也相当重要。

通过博弈论,我们可以学习如何有效地沟通和合作,避免双方的冲突和误解。

例如,博弈论可以用来研究双方的协调、合作等问题。

博弈论

博弈论

博弈论是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。

1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。

纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的学科。

博弈的分类根据不同的基准也有所不同。

一般认为,博弈主要可以分为合作博弈和非合作博弈。

它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

博弈论概述

博弈论概述
“坦白”是A的占优策略。同样,“坦白”也是B的占优策略。
一般地,称 si*为局中人i的(严格)占优策略, 若对应所有的
si , s i*是i的严格最优策略 , 即:
ui (si*, si ) ui (si' , si ) si , si' si*
对应地,所有的 si' si* 被称为“劣策略”。注意:这
甲的策略
1
2
3
乙的策略
1
7
8
9
2
6
2
3
3
5
4
0
1.乙先行动。若乙选1,则甲选3;乙选2,则甲选1;乙选3, 则甲选1。乙在行动时会估计到甲的行动,它估计三种选择 中的最高代价为策略1(损失900万),其次为策略2(损失 600万),最低为策略3(损失为500万)。因此,乙必选代 价最低的策略3。——最大最小原理。结论:乙选择3,甲选 1作为回应,乙损失500万,甲获益500万。
在博弈论里,一个博弈可以有两种表述方式:一种是策 略式(strategic form representation)表述,另一种是 扩展式( extensive form representation )表述。前者 适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式 表述中,所有参与人同时选择各自的策略,所有参与人选择 的策略一起决定每个参与人的支付。
2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E.

博弈论的定义和主要思想

博弈论的定义和主要思想
著名经济学家保罗.萨缪尔森说:“要想在现代 社会做一个有文化的人,您必须对博弈论有一 个大致了解。”
清华诚志
9
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的 思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式 。
清华诚志
12
两种均衡
占优策略是无论其他局中人采取什么策 略对于自己来说都是最好的策略。
占优均衡所有局中人都有占优策略而形 成的均衡。
纳什均衡是指某一局中人在其他局 中人的策略给定时选择最好策略而 形成的均衡。
清华诚志
13
占优均衡一定是纳什均衡,但 纳什均衡不一定是占优均衡。
占优均衡
– “不管你做什么,我所做的都是最佳选择。” – “不管我做什么,你所做的都是最佳选择。”
纳什均衡
– “给定你的行为,我所做的是最佳选择。” – “给定我做什么,你所做的是最佳选择。”
清华诚志
14
博弈的分类
1)根据参与人的多少,可将博弈分为两人 博弈和多人博弈;
2)根据博弈结果的不同,又可分为零和博 弈、常和博弈和变和博弈;
3)根据博弈方策略的数量,可分为有限博 弈和无限博弈;
清华诚志
清华诚志
5
Selten and Harsanyi
泽尔腾(1965)将纳 什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概 念;以及进一步刻画 不完全信息动态博弈 的“完备贝叶斯纳什 均衡”

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论一:基本知识1.1定义:博弈论;又称对策论;是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论;是研究竞争的逻辑和规律的数学分支..即;博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用;以及不同决策主体之间的均衡..1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数;是博弈最重要的基本要素..1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论..两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议binding agreement..倘若不能;则称非合作博弈Non-cooperative game..合作博弈强调的是集体主义;团体理性;是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大;强调个人理性、个人最优决策;其结果有时有效率;有时则不然..目前经济学家谈到博弈论主要指的是非合作博弈;也就是各方在给定的约束条件下如何追求各自利益的最大化;最后达到力量均衡..博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息;是否了解两个角度进行..把两个角度结合就得到了4种博弈:a、完全信息静态博弈;纳什均衡;Nash1950b、完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾1965c、不完全信息静态博弈;贝叶斯纳什均衡;海萨尼1967-1968d、不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾1975 Kreps; Wilson1982 Fudenberg; Tirole19911.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述 Strategic form; 扩展式表述Extensive form1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略;一个参与人的某个策略给他带来的支付值始终高于其他策略;或至少不劣于其他策略;则称该策略为该参与人的严格占优策略或占优策略..对于所有的s-i; si称为参与人i的严格占优战略;如果满足:uisi;s-i>uisi';s-is-i; si' sib、占优均衡:一个博弈的某个策略组合中;如果对应的所有策略都是各参与人的占优策略;则称该策略组合为该博弈的一个占优均衡..1.7重复剔除严劣策略均衡:a、“严劣”和“弱劣”的含义:设 s i’和s i’’是参与人i可选择的两个策略;若对其他参与人的任意策略组合s-i; 均成立u i s i’; s-i < u i s i’’; s-i; 则说策略s i’严劣于策略s i’’ ..上面式子中;若将“<”改为“≤”;则说策略s i’弱劣于策略s i’’ ..b、定义:重复剔除严格策略就是各参与人在其各自策略集中;不断剔除严劣策略…如果最终各参与人仅剩下一个策略;则该策略组合就被称为重复剔除严劣策略均衡..二:纳什均衡Nash Equilibrium2.1纳什均衡定义:对于一个策略式表述的博弈G= {N;S i; u i; i ∈N}; 称策略组合s=s1; …s i; …; s n是一个纳什均衡;如果对于每一个i ∈N; s i是给定其他参与人选择s-i={s1; … ;s i-1; s i+1; … ;s n} 情况下参与人i的最优策略经济理性策略;即:u i s i; s-i≥ u i s i; s-i; 对于任意的s i∈S i ;任意的i∈N均成立..通俗定义:纳什均衡是一种策略组合;给定对手的策略;每个参与人选择自己的最优策略..纳什均衡是一种稳定的策略组合:当所有参与人的选择公开以后;每个人都满意自己作出了正确的选择;没有人能得到更好的结果了..在博弈论中这种结果被称为纳什均衡NE..2.2定理:Nash在1950年证明:任何有限博弈;都至少存在一个NE——Existence of Nash Equilibrium..即在一个有n个参与人的策略式博弈G={S1;…;Sn; u1;…;un}中;如果n是有限的;且Si是有限集i=1;…;n;则该博弈至少存在一个纳什均衡在混合策略意义下Wilson1971证明;几乎所有有限博弈;都存在有限奇数个NE;包括纯策略NE和混合策略NE..——Oddness Theorem2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理 a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡;但反过来不一定成立;定理 b 纳什均衡一定不能通过重复剔除严劣策略方法剔除..2.4划线法先找出自己针对其他博弈方每种策略或策略组合对多人博弈的最佳对策;即自己的可选策略中与其他博弈方的策略或策略组合配合;给自己带来最大得益的策略这种相对最佳策略总是存在的;不过不一定唯一;然后在此基础上;通过对其他博弈方策略选择的判断;包括对其他博弈方对自己策略判断的判断等;预测博弈的可能结果和确定自己的最优策略..这就是划线法..2.5箭头法箭头法对于理解博弈关系很有好处;是寻找相对稳定性策略组合的分析方法..对博弈中的每个策略组合进行分析;考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益..如能;则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组..最后综合对每个策略组合的分析情况;形成对博弈结果的判断..划线法和箭头法的结果是一致的;可以相互替代..三:混合策略Mixed Strategies 纳什均衡3.1定义:混合策略的定义:在博弈G={N; Si; ui; i∈N}中;假设参与人i的纯策略构成的策略集合为Si={si1;…; sik};若参与人i 以概率分布pi=pi1;…; pik 在其k 个可选策略中随机选择“策略”;称这样的选择方式为混合策略..这里;0≤pij ≤ 1;对于j=1 ;…; k 都成立;且有; pi1+…+ pik=1..纯策略可看成特殊的混合策略..上述定义是在有限博弈前提下进行的..3.2混合策略意义下策略组合的表述{x1∈X1; …; xn∈Xn};其中Xi ; i =1; …; n表示参与人i所有纯策略生成的概率空间;xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{1/2; 1/2;1/2; 1/2}3.3VNM效用函数Von Neumann and Morgenstern冯·诺依曼和摩根斯坦如果某个随机变量X以概率Pi 取值xi;i=1;2;…;n;而某人在确定地得到xi时的效用为uxi;那么;该随机变量给他的效用便是: UX =P1ux1 + P2ux2 + ... + Pnuxn表示关于随机变量X的期望效用..因此UX称为期望效用函数;又叫做冯·诺依曼——摩根斯坦效用函数VNM函数..3.4基于混合策略意义下的博弈策略式表述定义:基于v-N-M效用的策略式博弈由 a、参与人集合 b、每个参与人有一个纯策略集合 c、对于每一个参与人来说;由所有参与人纯策略组合构成的风险结果空间;存在一个v-N-M效用3.5混合策略意义下的纳什均衡定义:对于博弈G= {N; Si; ui; i∈N};基于v-N-M效用的混合策略组合α是一个纳什均衡;若对于每一个i; 以及i的任意一个混合策略αi;α对应的期望支付至少和αi;α-i 的期望支付一样大换句话说;称混合策略组合α是一个纳什均衡;如果没有一个参与人通过偏离策略αi 实现支付的增加3.6一个定理对于N-人静态博弈问题;设混合策略纳什均衡对应的策略组合为Xi ; X –i ..对于任意的i ;若最优混合策略为Xi= {x1;…;xl;0…0}不失一般性;假设前l个分量严格大于0;记分量xk k=1;…; l 对应的纯策略sk;则对于参与人i而言;sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值;等于纳什均衡混合策略组合 Xi; X –i 的收益值..即ui sk; X –i = ui Xi; X –i 成立 ; k=1;…; l3.7方法:a、求解混合策略均衡可以用期望收益等值法b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡四:多重纳什均衡解及其分析4.1 帕雷托占优均衡帕雷托占优均衡的含义是:在多个纳什均衡中;若存在一个纳什均衡;其支付结果针对每个参与人而言都严格优于其它纳什均衡;则该纳什均衡是帕雷托占优纳什均衡..4.2风险占优均衡risk-dominant equilibrium参与人对风险占优均衡的选择倾向;有一种强化的机制..当部分或所有参与人选择风险占优均衡的可能性增强的时候;任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小;而这又使得帕雷托占优均衡策略的支付更小;从而形成一种选择风险占优均衡策略的正反馈机制;并使其出现的概率越来越大..当参与人数目增加时;选择合作的风险将会更大;可借助该点考虑招标机制如何减少投标方勾结问题..上述问题是我们知道建立诚信机制社会的重要意义..上述问题引出一个博弈相关分支为协调博弈coordination game4.3聚点均衡由实际问题抽象出来的博弈模型中;更多的一类问题是:多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系;如夫妻爱好问题的两个纯策略均衡..这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例;在实际中往往二人很默契地知道如何进行博弈;双方往往知道怎么进行选择策略;且能够相互了解这里面排除了互相协商后达成的一致实际博弈中参与人往往会利用博弈模型以外的信息;实现对特定博弈均衡一致关注的“聚点”这些信息如:参与人共同的文化背景或规范;共同的知识;具有特定意义事物的特征;某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性;但因为涉及因素太多;对于一般博弈模型很难总结普遍规律;只能具体问题具体分析聚点:人们通常会协调彼此的行为..你弱他就强;先例产生的影响远大于逻辑或者法律效力;人们总是乐于安守现状或接受自然形成的界线三八线4.4相关均衡correlated equilibrium实际上;在现实中遇到选择困难时;特别是在长期中反复遇到相似选择难题时;常会通过收集更多信息;形成特定的机制和规则;为某种形式的制度安排等主动寻找思路..相关均衡就是这样的一种均衡选择机制..对于实际中比较复杂的博弈问题;参与人是否有能力设计这种机制;并且有足够能力理解、信任这种机制;是有一定疑问的..相关均衡作为社会经济制度创新的一种解释也许更有意义..4.5防共谋均衡coalition-proof equilibrium 定义:如果一个博弈的某个策略组合满足a、没有任何单个参与人的“串通”会改变博弈的结果;即单独改变策略无利可图该策略组合是纳什均衡..b、给定选择偏离的参与人有再次偏离的自由时;没有任何两个参与人通过“串通”改变博弈的结果..c、依此类推;直到所有参与人都参加的串通也不会改变博弈的结果..满足上述要求的均衡策略组合称为“防共谋均衡”在有多个参与人的博弈中;若部分参与人通过某种形式的默契或串通形成小团体;可能得到比不串通个大的支付..这就是多人博弈的共谋问题..防共谋均衡是指这样的一个纳什均衡;在该均衡局势下;少数参与人集合不能通过均衡策略的偏离;实现更好的局部利益..防共谋均衡是两个以上参与人参加的博弈中;参与人在帕雷托占优均衡中进行合作思想的扩展..五:动态博弈5.1特点一类博弈行为通常需要参与人多步决策才能完成;具有明显的阶段性..博弈的结局、各参与人的收益由多阶段决策结果确定..各参与人的决策有一定的顺序..由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性;通常用扩展式extensive form表述法描述这些信息..5.2博弈的扩展式表示参与人集合:i=1; … ;N..用N表示虚拟参与人“自然”;自然的含义是某些外生的客观概率分布事件参与人的行动顺序the orderof moves:描述各参与人在什么时候行动;参与人的行动空间actionset:在每次行动时;参与人可选择的行动集合;参与人的信息集information set:每次行动时参与人知道什么;参与人的收益函数:在行动结束之后;每个参与人得到些什么..自然选择的概率分布假定自然状态是共同知识..对于有限博弈;博弈树是常用的表述方式..5.3博弈树a若动态博弈是有限博弈;则可用博弈树表示该博弈..这里有限的含义是:各阶段各参与人的行动数目有限;博弈的阶段数有限..b博弈树的基本结构为结点nodes..包括决策结及终点结..决策结是参与人采取行动的时点;终点结是博弈行动路径的终点..枝branches..从一个决策结到它的直接后续结的连线;每一个枝代表参与人的一个行动选择..信息集..是决策结集合的一个子集..将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集..注:每个决策结都是同一个参与人的决策结..该参与人知道博弈进入该集合的某个决策结;但不知道自己究竟出于哪一个决策结若该信息集有两个或两个以上元素..5.4对于有限动态博弈;若参与人对彼此在各决策结点的行动集合;彼此的效用函数;历史的行动有着完全的了解;则称这样的博弈为完全信息动态博弈..如果博弈树的所有信息集都是单元素集;称该博弈为完美信息博弈game of perfectinformation..上述两个定义的差别在于对自然行动信息的描述..5.5动态博弈的策略式表述a相机选择contingent play动态博弈中参与人的策略是各自预先设定的;在博弈的各阶段;针对各种情况做出相应决策..即“等待”博弈到达自己的信息集包含一个或多个决策结后再决定如何行动..在策略式表述博弈中;参与人似乎是博弈开始之前就制定出了一个完全的相机选择;即“如果……发生;我将选择……”..b从扩展式表述构造战略式表述若把B的信息集从左到右排列;上述四个纯策略可以简单记为{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}..上面四个纯策略含义:当A选择开发时;B选择大括号中前面的策略;当A选择不开发时;B选择大括号中后面的策略..B的纯策略为:{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}A的纯策略为:SA=开发;不开发于是可以写成策略式表述形式;为开发;开发开发;不开发不开发;开发不开发;不开发开发-3;-3-3;-31;01;0不开发0;10;00;10;0在扩展式表述博弈中;所有n个参与人的一个纯战略组合s=s1;…;sn决定了博弈树上的一个路径..比如开发;{不开发;开发}决定了博弈的路径为A 开发 B 不开发1;05.6完全信息动态博弈纳什均衡存在性定理如果有限博弈是完美信息博弈;他还有一个纯战略纳什均衡Zermelo;1913..5.7逆向归纳法:a逆向归纳法求解策略:从动态博弈的最后一个阶段出发;对该参与人采用经济理性原则进行分析;逐步到推回前一个阶段相应参与人的行动选择;一直到第一阶段的分析方法..b逆向归纳法是求解完美信息动态博弈的经典方法..逆推归纳法是完美信息动态博弈分析中使用最普遍的方法..c与策略式分析比较:如果A选择U;那么B的信息集不能达到;我们说B的信息集不在均衡路径上out-of-equilibrium path.. 此种情况下;B的选择对A没有什么影响..因此;纳什均衡对一个参与人在非均衡信息集上的选择没有限制..但是;一个参与人在非均衡信息集上的战略可以影响其他参与人在均衡信息集上的选择..d逆向归纳法实质上是重复剔除劣战略法在扩展式博弈中的应用..逆向归纳法适不用于无限博弈和不完美信息博弈..逆向归纳法剔除了“非理性”的均衡策略5.8子博弈完美均衡子博弈精炼纳什均衡①子博弈概念:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结Tx组成;它满足下列条件:x是一个单结信息集;即hx={x};对于所有的Tx中的x’;如果x’’与x’同属于一个信息集;则x’’也在Tx中..需要说明的是;G本身是自己的一个子博弈..②子博弈完美纳什均衡子博弈精炼纳什均衡扩展式博弈的一个战略组合s=s1;…;s i;…;s n是一个子博弈完美纳什均衡;如果它是原博弈的纳什均衡..它在每一个子博弈上都是纳什均衡③纳什均衡与子博弈精炼纳什均衡的关系前面分析说明;一个特定的纳什均衡决定了原博弈树上唯一的一条路径;这条路径称为“均衡路径”equilibrium path..相对该纳什均衡;其他路径称为非均衡路径out-of-equilibrium path..在每一个子博弈上给出纳什均衡意味着;构成子博弈纳什均衡的战略不仅在均衡路径的决策结上是最优的;同时在非均衡路径的决策结上也是最优的..对于有限完美信息博弈;前面介绍的逆推归纳法得出的纳什均衡即是子博弈精炼纳什均衡..六多阶段静态博弈6.1该类模型中至少在某个阶段参与人同时选择其决策..这类模型实质上就是完美信息动态博弈;因此仍然可以采用逆推归纳法进行分析..因为存在同时选择;因此每个阶段不再是单人优化问题;而是一个静态博弈..6.2前向归纳法:前面已经说明;完美信息动态博弈的经典求解方法为逆序归纳法..还有一种分析方式;就是前向归纳法forward induction..前向归纳法由科尔博格和莫顿斯1986提出..这里不进行严格的数学描述;仅通过一个例题进行说明..6.3重复博弈重复博弈repeated game的定义指同样结构的博弈重复多次;其中的每次博弈称为“阶段博弈stage game”..如两个多次犯罪的“囚徒问题”..由于动态博弈是相机行动;反映到重复博弈中;就是可以使自己在某个阶段的博弈选择依赖于其他参与人过去的行动历史..影响重复博弈均衡结果的主要因素是博弈重复次数和信息的完备性completeness..重复次数对参与人可能会有的影响是:参与人为了获得长远利益而牺牲眼前利益的策略成为可能..关于完备性;简单地说;但一个参与人的支付函数不为其他参与人所知时;该参与人可能有积极性建立一个“好”的声誉reputation以换取长远利益..在社会行为中;经常可以看到本质不好的人在相当长的时期内干好事的原因..定理:令G是阶段博弈;GT是G重复T次的重复博弈T<∞..那么;如果G有唯一的纳什均衡;重复博弈GT的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次即每个阶段博弈出现的都是一次性博弈的均衡结果..上述定理说明;只要博弈的重复次数是有限的;重复本身并不改变囚徒困境的均衡结果..上述定理中“唯一性”是一个重要条件..如果纳什均衡不是唯一的;上述结论就不一定成立..当博弈有多个纳什均衡时;参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为..(七)不完全信息静态博弈不完全信息静态贝叶斯博弈贝叶斯纳什均衡海萨尼转换拍卖理论八合作博弈可传递效用 transferableutility合作博弈的特征函数合作的分配可行分配核心的定义 Shapley 值。

博弈论简介

博弈论简介
பைடு நூலகம்
经济学
拍卖理论
1
• 博弈论可以用来解释不同拍卖机制下的拍 卖策略和价格形成。
寡头垄断竞争
2
• 研究寡头垄断企业如何制定竞争策略,以 实现自身利益最大化。
劳动力市场与产品市场
3
• 博弈论被用于分析劳动者和雇主在劳动力 市场上的博弈行为,以及企业在产品市场上
的竞争策略。
政治学
选举行为
01
• 研究选民、政党、候选人之间的策略互动,以及投票行
生态学
• 研究生态系统中的食物链、竞争、共生等关系,以及物种之间的博弈策略。
游戏与计算机科学
01
游戏设计
• 博弈论被用于设计具有挑战性和趣味性的游戏,如棋类游戏、策略游戏 等。
02
计算机科学
• 研究计算机在处理问题时的决策过程和算法设计,如人工智能、机器学
习等领域。
03
信息论
• 研究信息传递过程中的策略选择和最优信息传输,如密码学、信息编码
博弈论简介
contents
目录
• 博弈论的基本概念 • 博弈论的基本理论 • 博弈论的应用 • 博弈论的未来发展 • 结论
01
博弈论的基本概念
定义与特点
• 博弈论(Game Theory)是一门应用数学
1
分支,主要研究在特定情境下个体或团队如 何做出决策以及这些决策之间的相互作用。
• 博弈论的特点在于强调决策的互动性和策
3
,常用于研究长期竞争和合作关系。
合作博弈
• 合作博弈是指参与者可以通过达成协议或联盟来优化整
01
体利益的博弈。
02
• 在合作博弈中,参与者可能会放弃部分利益,以换取整

博弈论

博弈论

• 4. 战略(strategy)
• 指参与人在给定信息集的情况下的行动规则, 它规定参与人在什么时候选择什么行动。 • (1)一般用si 表示第i个参与人的一个特定战 略,Si = {si}代表第i 个参与人的所有可选择 的战略集合。如果n个参与人每人选择一个战略, n维向量s=(s1,…,si,…,sn )称为一个战略组 合(strategy profile),其中si是第i个参与人 选择的战略。

囚徒困境引出重要结 论: 一种制度(体制)安 排,要发生效力,必须是 一种纳什均衡。否则,这 种制度安排便不能成立。 现实中囚徒困境问题: 军备竞赛、公共产品私 人提供、寡头竞争等。
领域
纳什均衡 (增产,增 产)
制度安排
寡头竞争 公共产品 私人 提供
• (2)战略与行动是两个不同的概念,战略是行动 的规则而不是行动本身。 • 例如:“人不犯我,我不犯人;人若犯我,我 必犯人”是一种战略,“犯”与“不犯”是两种 行动,战略规定了什么时候“犯”,什么时候 “不犯”。 • (3)作为一种行动规则,战略必须是完备的,它 要给出参与人在每一种可想象到的情况下的行动 选择,即使参与人并不预期这种情况会实际发生。
博 弈 论
西 北 大 学 经济管理学院
课程主体结构
一、博弈论概述 二、博弈论的基本概念 三、完全信息静态博弈 四、完全信息动态博弈
课程主体结构
五、不完全信息静态博弈
六、不完全信息动态博弈
一、博弈论概述
• 1.博弈论概念(game theory) • (1)博弈:又称为对策或游戏,是指一些人或组 织在“策略相互依存”情形下相互影响、互相作 用的状态。 • (2)博弈论:研究决策主体的行为发生直接相互 作用时的决策,以及这种决策的均衡问题,即当 一个主体的选择受到其他主体选择的影响,而且 反过来影响到其他主体选择时的决策问题和均衡 问题。

博弈论

博弈论

博弈论的基本概念1.博弈论:博弈论,又称对策论,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论的定义可以这样理解:博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自可选择的行为或策略中进行选择并加以实施,并从中取得相应收益的过程。

2.参与人:参与人指的是博弈中选择行动以最大化自己效用的决策主体(个人、团体)。

3、行动:行动是参与人在博弈的某个时点的决策变量。

一般来讲,把第i个参与人的一个行动为ai,其可供i选择的行动集合表示为Action set: Ai ={ai}。

在一个n人博弈中,n个参与人的行动的有序集为a={a1,…,an},称为行动组合。

根据行动顺序,可以把博弈分为静态博弈、动态博弈。

静态博弈:一般来讲,如果行动时同时发生的或相当于同时发生的,则称之为静态博弈。

动态博弈:如果行动的发生有先后顺序,则称之为动态博弈。

4.信息:信息指的是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。

信息集是指参与人在特定时刻所拥有的有关变量的值的知识。

例如:囚徒困境甲不知乙的选择,则甲的信息集为{坦白或者抵赖}乙已经行动,甲观察到乙的选择,则甲的信息集为{坦白}或者是{抵赖}。

5.战略:战略是参与人在给定信息集的情况下的行动规则,是参与人完整的一套行动计划,它规定参与人在什么时候选择什么行动。

战略不同于行动,它是行动的规则,对于战略的表述应该是完备的。

例如:人不犯我,我不犯人;人若犯我,我必犯人”例如:田忌赛马,田忌所选的赛马计划就是一套完整的行动计划,也就是一个战略。

6.战略空间:参与者可以选择的战略的全体组成了战略空间。

田忌赛马,六种行动方案可供选择:上中下,上下中,中上下,中下上,下上中,下中上。

这些可选择的战略的全体组成了战略空间。

任何一人战略的改变都将使结果也随之改变。

7、收益:支付、报酬,指在一个特定的战略组合下参与人得到的效用水平或期望效用水平。

博弈论(整理过名词解释和简答)

博弈论(整理过名词解释和简答)

一、名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。

2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。

3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。

4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。

在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。

7、均衡:所有参与人的最优战略组合。

8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。

9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。

10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。

11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。

12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。

13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。

博弈论

博弈论

1.什么是博弈论?“博弈论”译自英文“Game Theory”,直译就是“游戏理论”。

博弈论是研究行为人在矛盾和对抗性关系中的行为决策中一般性规律规律的学科。

是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。

博弈:一些个人、组织,面对一定的环境条件,在一定的规律下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。

包括:博弈的参加者,各博弈方的全部策略或行为集合,进行博弈的次序,博弈方的得益四方面。

纳什均衡:设存在一个策略组合Bx’和By’,且Bx’∈Bx(Bx1,Bx2,……,BxN),By’∈By(By1,By2,……,ByN) ,当x选择Bx’时,y的最优策略选择是By’,同时,当y选择By’时,x的最优选择是Bx’,因此,x和y选择了Bx’和By’时,谁都不会再改变策略。

这种局面称为Nash均衡,是Nash最早提出并证明了它的存在。

1951年Nash提出了Nash均衡的概念,并证明了Nash均衡的存在——真正奠定了博弈论作为一门学科的基础。

之前,虽然有很多人致力于研究博弈对策的规律,但总没有得出有意义的成果,直到Nash。

n人博弈纳什均衡定⏹设:G={A1,A2,A3,…….,AN;U1,U2, U3,…………,UN}⏹如果存在一个策略组合{a1*, a2*,……,aN*},其中a1*∈A1,a2*∈A2,…….,aN*∈AN,使Ui*=Ui{a1*, a2*,…,aN*} ≥Ui{a1*,…,ai-1*,aij*,ai+1*…,aN*}⏹对任意i ∈N都成立,则{a1*, a2*,……,aN*}为Nash均衡。

囚徒困境坦白B不坦白A 坦白A 不坦白两个被捕的囚徒之间的一种特殊博弈,双方的利益不仅取决于他们自己的策略选择也取决于对方的策略选择。

经济学中的博弈论

经济学中的博弈论

经济学中的博弈论经济学中的博弈论是一门研究个体决策行为及其互动的学科,通过建立数学模型和理论框架来分析人们在不同情境下做出的选择,并推导出各种可能的结果。

博弈论广泛应用于经济学、政治学、管理学等领域,以解释人们在决策过程中存在的合作、冲突、竞争等行为。

1. 博弈论的基本概念博弈论的基本概念包括参与者、策略、支付和效用。

参与者是指在博弈中作出决策的个体或集体,策略是参与者可选择的行动,支付是参与者根据不同策略和结果所得到的收益或成本,效用是参与者对不同结果的主观评价。

2. Nash均衡Nash均衡是博弈论中的一个重要概念,指的是参与者在互动中无法通过单独改变策略来获得更多收益的情况。

Nash均衡的存在可能有多个,并且可能存在不稳定的均衡点。

通过寻找Nash均衡,我们可以预测和解释人们在特定情境下的决策行为。

3. 合作与冲突博弈论分析了合作与冲突的两种情况。

在合作博弈中,参与者会通过协商和合作来实现互利的结果,而在冲突博弈中,参与者通过竞争和对抗来追求自身的利益。

通过研究这两种情况,我们可以更好地理解人们如何在不同的情境下做出决策。

4. 广义博弈论广义博弈论是博弈论的一个扩展领域,它考虑了参与者对其他参与者行动的预期和判断。

在广义博弈论中,参与者的决策不仅仅取决于自身利益,还要考虑到其他参与者可能做出的决策,并基于对其他参与者的预期行动做出相应的选择。

5. 应用举例博弈论在实际经济中有着广泛的应用。

举例来说,在寡头垄断市场中,各大企业之间的价格竞争就可以通过博弈论的方法来分析。

博弈论还可以应用于拍卖市场、市场竞争中的定价策略、国际关系中的战略决策等领域。

6. 博弈论的局限性尽管博弈论在经济学中有着广泛的应用,但它也存在一些局限性。

首先,博弈论在分析中假设参与者都是理性的、全面的决策者,但实际情况下人们的决策行为不一定都是理性的。

其次,博弈论在分析中通常假设参与者具有相同的信息和评判准则,但实际情况下参与者之间的信息差异很大。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

经济博弈论思想“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。

”经济学的最后一个通才,美国诺贝尔经济学奖第一人保罗.萨缪尔森选择两条路在树林里分叉,而我选择人迹罕至的那一条,从此一切变了样。

电影《死亡诗社/Dead Poets Society》教学目的1、本次教学介绍博弈论的基本概念,包括什么是博弈和博弈论,给出一些经典博弈例子。

对博弈分类和博弈理论的结构作一些讨论,对博弈论的发展历史等作简单介绍。

2、目标是让大家对博弈论的内容和博弈模型有更直观的概念和印象,对博弈分析的基本思想方法等形成初步的认识,为今后工作提供新的分析思路教学内容1、博弈论的概念和发展;2、博弈论的结构和分类1、什么是博弈论:1.1 从游戏到博弈;1.2 一个非技术性定义;1.3 博弈论的发展。

1.1 从游戏到博弈博弈Game,Game即游戏、竞技,博弈论Game Theory,博弈论研究与游戏有共同特征的决策或者说策略问题游戏和经济等决策竞争较量的共同特征:规则;结果;策略选择;策略和利益相互依存。

为什么是博弈论而不是游戏论?1.2 一个非技术性定义定义:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。

四个核心方面博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行为(Actions)博弈的次序(Order)博弈方的得益(Payoffs)均衡均衡是经济学中的重要概念。

均衡即是平衡的意思,英文是:equilibrium。

在经济学中,均衡意即相关量处于稳定值。

在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能将商品卖出去。

此时我们就说,该商品的供求达到了均衡。

此时的价格可称之为均衡价格,产量称之均衡产量。

均衡分析是经济学中的重要分析。

纳什均衡在对方策略确定的情况下,每个参与者的策略都是最好的,此时没有人愿意先改变自己的策略。

通俗解释:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。

(谢识予《纳什均衡论》)博弈分析的目的:预测博弈的均衡结果。

即给定“每个参与人都是理性的,每个参与人都知道每个参与人都是理性的”是共同知识,什么是每个参与人的最优策略?什么是所有参与人的最优策略组合?而均衡就是博弈分析的解,均衡是博弈结果之一。

1.3 博弈论的发展•对具有策略依存特点的决策问题的研究可以上溯到18世纪以前,如古诺模型和伯特兰德模型•20世纪20年代,法国数学家Borel用最佳策略的概念研究了下棋等具体的决策问题,试图建立应用数学的一个分支,可惜没有完成博弈论的体系建设•二战期间,博弈的思想方法被用于军事领域和战事活动中,初显威力。

1944年,数学家John von Neumann和经济学家Oskar Morgenstern合著《博弈论和经济行为》标志着博弈理论的初步形成。

•近几十年来,博弈论得到大发展。

1994年,Nash, Harsanyi及Selten同时获得诺贝尔经济学奖,表明该学科的重要性;1996年,从信息经济学角度研究博弈论的J. Mirrlees也获得了经济学奖,博弈论已经成为西方经济理论的主流之一。

2005年罗伯特·奥曼和托马斯·谢林获得诺贝尔经济学奖,为世界和平作出了贡献。

2、博弈结构和博弈分类2.1 博弈中的博弈方;2.2 博弈中的策略;2.3 博弈中的得益;2.4 博弈的过程;2.5 博弈的信息结构;2.6 博弈方的能力和理性;2.7 博弈的分类和博弈理论的结构;2.1 博弈中的博弈方博弈方:独立决策、独立承担博弈结果的个人或组织•博弈方数量对博弈结果和分析有影响。

因为博弈方越多,策略依存性越复杂。

•根据博弈方数量分单人博弈、两人博弈、多人博弈等。

最常见的是两人博弈,单人博弈是退化的博弈单人博弈——只有一个博弈方的博弈例一:单人迷宫(单人博弈实质个体最优化问题)例二:运输路线(个体最优化数学期望)商人需要将一批商品从A地向B地运输,从A地到B地有水、陆两条路线,走陆路运输成本为10000元,走水路的运输成本为7000元。

走陆路比较安全,走水路则有一定的风险,如果遇到恶劣天气将会造成这批货物总价值10%的损失。

假设已知该批货物的总价值为90000元,运输期间出现暴风雨天气的概率为1/4,该商人的选择?运输路线得益矩阵两人博弈•两人博弈即有两个博弈方的博弈•两人博弈最常见,研究最多,是最基本和有用的博弈类型•两人博弈有多种可能性,博弈方的利益方向可能一致,也可以不一致囚徒困境:塔克(Tucker)1950年提出研究经济效率问题的基本模型检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。

但是,我可以和你做个交易。

如果你单独坦白杀人的罪行,我释放你,而你的同伙要被判10年刑。

如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他将被释放。

但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。

”分析方法1:上策均衡占优策略dominant strategy在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他参与人的策略选择,即,不论其他博弈方选择什么策略,他的最优策略是唯一的,这样的策略被称为占优策略。

谢识予提出:博弈的问题的根本特征是具有策略依存性。

每一个游戏者所得结果的好坏,不仅取决于自身的策略选择,也取决于其他参加者的策略选择。

上策均衡(Dominant-Strategy Equilibrium)如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈比较稳定的结果,我们称这样的策略组合为该博弈的一个“上策均衡”。

从囚徒1的角度来考虑:假设囚徒2选择不坦白(列策略):则囚徒1不坦白(行策略)的得益为-1,坦白的得益为0。

假设囚徒2选择坦白(列策略):则囚徒1不坦白(行策略)的得益为-10,坦白的得益为-5。

无论囚徒2选择坦白还是不坦白,囚徒1的选择都是坦白。

同样的,囚徒2的选择也是坦白。

分析方法2:划线法多人博弈•三个博弈方之间的博弈•可能存在“破坏者”:其策略选择对自身的利益并没有影响,但却会对其他博弈方的利益产生很大的,有时甚至是决定性的影响。

例子:申办奥运会80个评委ABC3个城市得票33 29 18•多人博弈的表示有时与两人博弈不同,需要多个得益矩阵,或者只能用描述法或者函数法产量决策的古诺模型•古诺模型是寡头产量竞争,是市场经济中最常见的问题之一•古诺1838年提出,直到现在还是经常使用•古诺模型有很多扩展•古诺模型与囚徒困境相似,对理解市场经济和博弈分析本身都有重要价值2.2 博弈中的策略策略:博弈中各博弈方的选择内容•策略有定性定量、简单复杂之分•不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同•有限博弈:每个博弈方的策略数都是有限的•无限博弈:至少有某些博弈方的策略有无限多个2.3 博弈中的得益得益:各博弈方从博弈中所获得的利益•得益对应博弈的结果,也就是各博弈方策略的组合•得益是各博弈方追求的根本目标及行为和判断的主要依据•根据得益的博弈分类:零和博弈、常和博弈、变和博弈零和博弈:也称“严格竞争博弈”。

博弈方之间利益始终对立,偏好通常不同——猜硬币,田忌赛马,石头-剪刀-布常和博弈:博弈方之间利益的总和为常数。

博弈方之间的利益是对立的且是竞争关系——分配固定数额的奖金、利润,遗产官司变和博弈:零和博弈和常和博弈以外的所有博弈。

合作利益存在,博弈效率问题的重要性。

——囚徒困境、产量博弈、制式问题等2.4 博弈的过程博弈过程:博弈方选择、行为的次序,包括是否多次重复选择、行为。

•博弈过程对博弈结果也有重要影响。

•根据博弈的过程,博弈可分为静态博弈、动态博弈、重复博弈。

静态博弈:所有博弈方同时或可看作同时选择策略的博弈石头、剪子、布:取胜关键:不让对方猜到自己策略,尽可能猜出对方策略智猪博弈•猪圈里有两头猪,一头大猪,一头小猪。

猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮。

•按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4智猪博弈原理启示•多劳未必多得!?•双方力量不对等时的正确策略–力量强:主动出击–力量弱:等待,搭强者的便车。

大小猪博弈的应用•政治博弈——大国是大猪,小国是小猪•资本市场——大股东是大猪,小股东是小猪•企业创新策略——大企业是大猪,小企业是小猪•婆媳关系——儿子是大猪,媳妇是小猪动态博弈:各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动。

•弈棋、市场进入、领导—追随型市场结构•先发优势与后发优势—枪手博弈重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效策略博弈结果的新可能长期客户、长期合同、信誉问题•有限次重复博弈——剃头故事吃香蕉的猴子•无限次重复博弈2.5 博弈的信息结构•完全信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益•不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为“不对称信息博弈”•完美信息博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈•不完美信息博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈2.6 博弈方的能力和理性完全理性和有限理性•完全理性:有完美的分析判断能力和不会犯选择行为的错误•有限理性:博弈方的判断选择能力有缺陷1)理性的程度与掌握信息的多少有关;2)完全理性在现实中是少数情况;3)有限理性是现实中的多数情况;4)非理性容易走向失败;5)但伪装的非理性也是一种有效的策略。

个体理性和集体理性•个体理性:一个体利益最大为目标•集体理性:追求集体利益最大化•合作博弈:允许存在有约束力协议的博弈•非合作博弈:不允许存在有约束力协议的博弈羊群效应穿红衣服的成功人士2.7 博弈的分类和博弈理论的结构•非合作博弈和合作博弈•非合作博弈范围内:完全理性博弈和有限理性博弈(进化博弈)•静态博弈,动态博弈,重复博弈•完全信息静态博弈,不完全信息静态博弈,完全且完美信息动态博弈,完全但不完美信息动态博弈,不完全信息动态博弈•零和博弈和非零和博弈,单人博弈和多人博弈。

相关文档
最新文档