博弈论

合集下载

博弈论定义与主要思想

博弈论定义与主要思想

Selten and Harsanyi
泽尔腾(1965)将纳 而海萨尼则发展了刻
什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概念; 以及进一步刻画不完 全信息动态博弈的 “完备贝叶斯纳什均
画不完全信息静态博 弈的“贝叶斯纳什均 衡”(1967-1968)。 总之,他俩进一步将 纳什均衡动态化,加 入了接近实际的不完 全信息条件。他们的
著名经济学家保罗.萨缪尔森说:“要想在现代 社会做一个有文化的人,您必须对博弈论有一 个大致了解。”
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的 思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式 。
2005年诺奖授予有以色列和美国双重国籍的罗 伯特·奥曼和美国人托马斯·谢林,以表彰他们 在博弈论领域作出的贡献。
主要思想
博弈论并不是经济学的一个分支,它只是一种 方法,这也是为什么许多人将其看成数学的一 个分支的缘故。
在对参与者行为研究这一点上,博弈论和经济 学家的研究模式是完全一样的。经济学越来越 转向人与人关系的研究,特别是人与人之间行 为的相互影响和相互作用,人与人之间利益和 冲突、竞争与合作,而这正是博弈论的研究对 象。
4、信息指的是参与人在博弈中所知道的 关于自己以及其他参与人的行动、策略 及其得益函数等知识;
5、得益是参与人在博弈结束后从博弈中 获得的效用,一般是所有参与人的策略 或行动的函数,这是每个参与人最关心 的东西;

博弈论百度百科

博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。

在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。

所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。

不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。

博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

博弈论

博弈论

经济学世界十部经典著作
1、亚当.斯密(英国)《国富论》。斯密此书是现代经济学的奠基之作,也是最伟大的经济学著作。他的劳动价值论,分工与专业化是经济效率之源的理论,“看不见的手”经济自由主义理论,都睥睨古人,下开百世。对经济学的贡献堪比牛顿对物理学的贡献。
2、《博弈圣经》(新加坡) 。独创了国正论、国正双赢理论和粒子行为论,是一部影响人类的非物质文化的经济学高级学术著作,它的粒子基因的映射均衡理论,单方占优理论,引起世界经济学、军事科学、自然哲学、博弈论界的极大关注。
简介
1.博弈根据是否可以达成具有约束力的协议分为合作博弈和非合作博弈。 合作博弈亦称为正和博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。合作博弈研究人们达成合作时如何分配合作得到的收益,即收益分配问题。合作博弈采取的是一种合作的方式,或者说是一种妥协。妥协其所以能够增进妥协双方的利益以及整个社会的利益,就是因为合作博弈能够产生一种合作剩余。这种剩余就是从这种关系和方式中产生出来的,且以此为限。至于合作剩余在博弈各方之间如何分配,取决于博弈各方的力量对比和技巧运用。因此,妥协必须经过博弈各方的讨价还价,达成共识,进行合作。在这里,合作剩余的分配既是妥协的结果,又是达成妥协的条件。 合作博弈强调的团体理性(collective rationality),是效率、公平、公正;
博弈要素
1.决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。(博弈圣经)
2.对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。(博弈圣经)

博弈论

博弈论

2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。

博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。

简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。

1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。

20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。

在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。

1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。

博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。

它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。

正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。

正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。

什么是博弈论?

什么是博弈论?

什么是博弈论?博弈论是一门研究策略决策的学科,它涉及到两个或多个参与者的博弈过程。

博弈论的研究对象可以是经济、政治、社会等领域,也可以是日常生活中的人际交往。

下面,我们来详细了解一下这门学科。

一、博弈论的起源博弈论起源于20世纪40年代,当时美国数学家冯·诺依曼(John von Neumann)和经济学家奥斯卡·莫根斯特恩(Oskar Morgenstern)合著了《博弈论与经济行为》一书。

这是一本奠定博弈论基础的重要著作,它将博弈论应用于经济学领域,从而成为博弈论的奠基之作。

二、博弈论的基本概念1.参与者博弈论的参与者指的是博弈过程中参与决策的个体或组织,例如一个独立的个人、两个公司或国家之间的竞争。

2.策略策略是指参与者在博弈中所采用的行为方式或决策方法。

不同的策略可能导致不同的博弈结果,因此博弈过程中策略的选择非常重要。

3.收益收益是博弈过程中参与者所能获取的利益,包括经济利益、社会地位、权力等。

收益对参与者而言是决策的目的和结果,因此其大小和分布会影响博弈的结果。

4.博弈形式博弈形式指的是博弈参与者、策略和收益之间的关系,是博弈过程的精神核心。

博弈形式一般分为合作博弈和非合作博弈两种,而在这两种博弈形式下,又分别有多种复杂的形式。

三、博弈论的应用1.经济学领域博弈论在经济学领域的应用最为广泛。

经济学研究的主题之一是市场竞争,而博弈论可以帮助我们透彻理解市场竞争的规律。

例如,博弈论可以用来研究企业之间的价格战、垄断行为、拍卖等问题。

2.政治学领域博弈论在政治学领域的应用也非常重要。

政治学研究的主题之一是国家之间的竞争和协作,而博弈论可以帮助我们研究国际关系、外交政策等问题。

例如,博弈论可以用来研究国际贸易谈判、军备竞赛等问题。

3.人际交往领域博弈论在人际交往领域的应用也相当重要。

通过博弈论,我们可以学习如何有效地沟通和合作,避免双方的冲突和误解。

例如,博弈论可以用来研究双方的协调、合作等问题。

博弈论

博弈论

博弈论是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。

1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。

纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的学科。

博弈的分类根据不同的基准也有所不同。

一般认为,博弈主要可以分为合作博弈和非合作博弈。

它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

博弈论概述

博弈论概述
“坦白”是A的占优策略。同样,“坦白”也是B的占优策略。
一般地,称 si*为局中人i的(严格)占优策略, 若对应所有的
si , s i*是i的严格最优策略 , 即:
ui (si*, si ) ui (si' , si ) si , si' si*
对应地,所有的 si' si* 被称为“劣策略”。注意:这
甲的策略
1
2
3
乙的策略
1
7
8
9
2
6
2
3
3
5
4
0
1.乙先行动。若乙选1,则甲选3;乙选2,则甲选1;乙选3, 则甲选1。乙在行动时会估计到甲的行动,它估计三种选择 中的最高代价为策略1(损失900万),其次为策略2(损失 600万),最低为策略3(损失为500万)。因此,乙必选代 价最低的策略3。——最大最小原理。结论:乙选择3,甲选 1作为回应,乙损失500万,甲获益500万。
在博弈论里,一个博弈可以有两种表述方式:一种是策 略式(strategic form representation)表述,另一种是 扩展式( extensive form representation )表述。前者 适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式 表述中,所有参与人同时选择各自的策略,所有参与人选择 的策略一起决定每个参与人的支付。
2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E.

博弈论简介

博弈论简介
பைடு நூலகம்
经济学
拍卖理论
1
• 博弈论可以用来解释不同拍卖机制下的拍 卖策略和价格形成。
寡头垄断竞争
2
• 研究寡头垄断企业如何制定竞争策略,以 实现自身利益最大化。
劳动力市场与产品市场
3
• 博弈论被用于分析劳动者和雇主在劳动力 市场上的博弈行为,以及企业在产品市场上
的竞争策略。
政治学
选举行为
01
• 研究选民、政党、候选人之间的策略互动,以及投票行
生态学
• 研究生态系统中的食物链、竞争、共生等关系,以及物种之间的博弈策略。
游戏与计算机科学
01
游戏设计
• 博弈论被用于设计具有挑战性和趣味性的游戏,如棋类游戏、策略游戏 等。
02
计算机科学
• 研究计算机在处理问题时的决策过程和算法设计,如人工智能、机器学
习等领域。
03
信息论
• 研究信息传递过程中的策略选择和最优信息传输,如密码学、信息编码
博弈论简介
contents
目录
• 博弈论的基本概念 • 博弈论的基本理论 • 博弈论的应用 • 博弈论的未来发展 • 结论
01
博弈论的基本概念
定义与特点
• 博弈论(Game Theory)是一门应用数学
1
分支,主要研究在特定情境下个体或团队如 何做出决策以及这些决策之间的相互作用。
• 博弈论的特点在于强调决策的互动性和策
3
,常用于研究长期竞争和合作关系。
合作博弈
• 合作博弈是指参与者可以通过达成协议或联盟来优化整
01
体利益的博弈。
02
• 在合作博弈中,参与者可能会放弃部分利益,以换取整

博弈论简介

博弈论简介
但是,并不是所有博弈的博弈方都像上面这些博弈问题中的那样,有关于 各博弈方得益或了解各博弈方得益所需要的全部信息的。典型的例子是在投标、 拍卖活动构成的博弈中,由于各博弈方(竞投、竞拍者)对其他博弈方关于标的 的估价很难了解,因此即使最后的成交价是大家都能看到的,各个博弈方仍然 无法知道其他博弈方中标、拍得标的物的真正得益究竟是多少。

但并不是所有重复博弈都有事先确定的重复次数,也就是停止重复时间的, 有些重复博弈似乎是会不断重复下去的。我们称这样的重复博弈为“无限次重 复博弈”(Infinitely Repeated Games)

14
(六)博弈的信息结构

所谓信息,是指关于事物运动的状态和规律的表征,也是关
于事物运动的知识。 信息就是用符号、信号或消息所包含的内容,来消除对客观 事物认识的不确定性。它普遍存在于自然界、人类社会和人 的思维之中。 信息的概念是人类社会实践的深刻概括,并随着科学技术的 发展而不断发展。 这里,我们博弈中的信息,是指在博弈中博弈方对其他博弈



方的特征、战略空间及得益函数等的知识。
15
1.关于得益的信息
博弈中最重要的信息之一是关于得益的信息,即每个博弈方 在每种结果(策略组合)下的得益情况。在许多博弈问题中,各 个博弈方不仅对自己的得益情况完全清楚,而且对其他博弈方 的得益也都很清楚。如在囚徒的困境博弈中,因为两囚徒所处 的地位是相同的,而且警察把他们双方的处境给他们都交代清 楚了,因此两个博弈方都对双方在每种情况下的得益非常清楚。
11
2.动态博弈
除了各博弈方同时决策的静态博弈以外,也有大量现实决
策活动构成的博弈中,各博弈方的选择和行动不仅有先后次序,
而且后选择、后行动的博弈方在自己选择、行动之前,可以看 到其他博弈方的选择、行动,甚至还包括自己的选择和行动。

《博弈论》知识点总结高中

《博弈论》知识点总结高中

《博弈论》知识点总结高中一、引言博弈论是数学的一个分支,探究的是在多个参与者决策的状况下,参与者之间的最优策略选择。

博弈论不仅在经济学、管理学等社会科学领域有重要应用,而且在生物学、计算机科学、战略决策等领域也有广泛应用。

在高中阶段,我们将进一步了解博弈论的相关知识,精通其基本原理和应用方法。

二、博弈论的基本观点1. 博弈形式博弈形式是博弈双方的策略选择和支付函数的描述。

通常用一个数学模型表示,包括博弈参与者、参与者可实行的策略、以及参与者之间的支付函数。

2. 纳什均衡纳什均衡是博弈论中的核心观点,指的是在一个博弈形式中,全部参与者选择的策略互相一致,没有改变策略的动机。

纳什均衡可以是单一的,也可以是多个同时存在的。

三、经典的博弈论问题1. 帕累托改进帕累托改进是对博弈形式进行改进,使得至少有一个参与者的支付得到提高,而其他参与者的支付不受损。

帕累托改进是为了创设更好的博弈结果,改进策略的选择。

2. 环保囚徒逆境环保囚徒逆境是博弈论中经典的问题之一。

逆境的情境是两名罪犯(囚徒)被抓获,警方没有足够的证据定罪,只能以较轻的罪名裁定,但若果两人都选择供出对方,那么都会得到较重的刑罚。

囚徒之间需要合作做出决策,以达到双方利益的最大化。

3. 博弈矩阵博弈矩阵是一种常见的博弈形式描述方式,用来表示参与者的策略选择和相应的支付函数。

矩阵中的每个元素表示参与者所得到的支付。

通过博弈矩阵可以便利地分析博弈中各个参与者的最优策略。

四、博弈论的应用1. 经济学博弈论在经济学中有广泛的应用,特殊是在市场竞争和战略决策中。

通过分析参与者之间的博弈干系,可以猜测市场行为和做出最优决策。

例如,博弈论可以诠释价格竞争、拍卖机制以及操纵市场策略等经济现象。

2. 生物学生物学中的适者生存和进化问题,也可以用博弈论进行建模和分析。

通过博弈论的方法,可以探究动物群体中的合作与竞争干系,以及基因在群体中的演化。

3. 计算机科学在人工智能和计算机科学领域,博弈论被广泛应用于智能决策和机器进修。

博弈论

博弈论

• 4. 战略(strategy)
• 指参与人在给定信息集的情况下的行动规则, 它规定参与人在什么时候选择什么行动。 • (1)一般用si 表示第i个参与人的一个特定战 略,Si = {si}代表第i 个参与人的所有可选择 的战略集合。如果n个参与人每人选择一个战略, n维向量s=(s1,…,si,…,sn )称为一个战略组 合(strategy profile),其中si是第i个参与人 选择的战略。

囚徒困境引出重要结 论: 一种制度(体制)安 排,要发生效力,必须是 一种纳什均衡。否则,这 种制度安排便不能成立。 现实中囚徒困境问题: 军备竞赛、公共产品私 人提供、寡头竞争等。
领域
纳什均衡 (增产,增 产)
制度安排
寡头竞争 公共产品 私人 提供
• (2)战略与行动是两个不同的概念,战略是行动 的规则而不是行动本身。 • 例如:“人不犯我,我不犯人;人若犯我,我 必犯人”是一种战略,“犯”与“不犯”是两种 行动,战略规定了什么时候“犯”,什么时候 “不犯”。 • (3)作为一种行动规则,战略必须是完备的,它 要给出参与人在每一种可想象到的情况下的行动 选择,即使参与人并不预期这种情况会实际发生。
博 弈 论
西 北 大 学 经济管理学院
课程主体结构
一、博弈论概述 二、博弈论的基本概念 三、完全信息静态博弈 四、完全信息动态博弈
课程主体结构
五、不完全信息静态博弈
六、不完全信息动态博弈
一、博弈论概述
• 1.博弈论概念(game theory) • (1)博弈:又称为对策或游戏,是指一些人或组 织在“策略相互依存”情形下相互影响、互相作 用的状态。 • (2)博弈论:研究决策主体的行为发生直接相互 作用时的决策,以及这种决策的均衡问题,即当 一个主体的选择受到其他主体选择的影响,而且 反过来影响到其他主体选择时的决策问题和均衡 问题。

第八章 博弈论

第八章 博弈论

做广告
可口可乐的决策 做广告 不做广告
百 事 可 乐 的 决 策
做 每家 亿美元的利润 可口可乐得到 亿美元利润 每家30亿美元的利润 可口可乐得到20亿美元利润 广 百事可乐得到50亿美元利润 百事可乐得到 亿美元利润 告
可口可乐得到50亿美 可口可乐得到 亿美 不 元利润 每家都得到40亿美元利润 做 百事可乐得到 亿美 每家都得到 亿美元利润 百事可乐得到20亿美 广 元利润

(二)动态博弈
博弈方的决策有先后顺序, 博弈方的决策有先后顺序,后行动的博弈方 在看到其他博弈方的决策选择后采取相应的、 在看到其他博弈方的决策选择后采取相应的、 有针对性的行动。 有针对性的行动。 动态博弈存在一定的不对称性, 动态博弈存在一定的不对称性,先行动者需 深思熟虑
动态博弈扩展形
B 打进 A 打击 (-2,3) 不进 (0,10) 和平相处 (5,5)
一个著名的例子:囚徒困境 一个著名的例子:
张三和李四两人偷车时被捕, 张三和李四两人偷车时被捕,警察怀疑他俩是 本市一系列偷车案的惯犯,但没有充分证据, 本市一系列偷车案的惯犯,但没有充分证据,为 防止两人串供,关在两间牢房分别审问: 防止两人串供,关在两间牢房分别审问: 如某人坦白,另一人抵赖,并把主要罪名推给对 如某人坦白,另一人抵赖, 轻判2 对方判15 15年 方,轻判2年,对方判15年 如两人均坦白,各判10年 如两人均坦白,各判10年 10 如两人拒不坦白,证据不足,罪名较轻,各判5 如两人拒不坦白,证据不足,罪名较轻,各判5年
重复博弈:
o
动态博弈是一种反复进行的博弈。 动态博弈是一种反复进行的博弈。 重复博弈是动态博弈的一种特殊情况, 重复博弈是动态博弈的一种特殊情况,在重 是动态博弈的一种特殊情况 复博弈中,同一个博弈被重复多次。 复博弈中,同一个博弈被重复多次。

博弈论(整理过名词解释和简答)

博弈论(整理过名词解释和简答)

一、名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。

2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。

3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。

4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。

在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。

7、均衡:所有参与人的最优战略组合。

8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。

9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。

10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。

11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。

12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。

13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。

博弈论最全完整-讲解

博弈论最全完整-讲解
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的
逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
例3:为什么教授如此苛刻?
问题是,一个好心肠的教授如何维持如 此铁石心肠的承诺?
他必须找到某种使拒绝变得强硬和可信 的方法。
拿行政程序或者学校政策来做挡箭牌 在课程开始时做出明确和严格的宣布 通过几次严打来获得“冷面杀手”的声

导论
博弈均衡与一般均衡 博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型 主要参考文献
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
按照大家是否清楚对局情况下每个 局中人的得益。
“各种对局情况下每个人的得益是 多少” 是所有局中人的共同知识 (common knowledge)。
据“共同知识”的掌握分为完全信 息与不完全信息博弈。
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information)
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。

博弈最简单的解释

博弈最简单的解释

博弈最简单的解释博弈论是一种研究策略决策和结果的数学分析方法。

在博弈论中,两个或多个参与者通过选择动作或策略来决定最终结果。

这些结果通常是由获胜者和输家以及获得的利益或损失来表示的。

在一些博弈中,胜利既不完全受手上的牌或棋子的强度制约,也不完全受对手的动作的规定;在许多博弈中,其他因素会影响到胜利与否。

胜利还可能取决于谁先行动,每个人的信息素质,对手是否协作,行动的先后顺序等因素。

因此,博弈论并不是一种纯粹的数学领域,也涉及了统计学、心理学、经济学等广泛的领域。

下面分别介绍博弈所涉及的主要概念和理论。

1. 博弈的基本概念博弈是一种决策过程,在博弈中每个参与者都必须在有限的时间内做出决策,并根据自己的决策和对手的决策来获得利益或承担损失。

每个参与者在博弈中的作用可以称为操作者或者玩家,每个操作者可能会面对多种选择(动作或策略)。

博弈包括确定性博弈和随机博弈。

确定性博弈是指每个参与者在决策时都有确定性结果的博弈,而随机博弈则是指参与者面临的结果有可能是不确定的或随机的。

2. 零和博弈和非零和博弈零和博弈是指参与者的收益是一项非常确定的事情,换句话说,一个参与者的损失就是另一个参与者的收益,总和为0。

在零和博弈中,各个操作者在利益上互相对抗,每个人的收益和损失成反比。

非零和博弈是指参与者的收益不一定相等,因此博弈的结果不可能表示为0的总和。

在这种情况下,博弈中参与者的收益和损失完全不同。

3. 纳什均衡纳什均衡是指在博弈中,参与者都采取了使其收益最大化的策略后,不再改变其策略成为更优效果的状态。

换句话说,它是一种达到了稳定状态的博弈状态,而双方没有必要改变他们的策略。

纳什均衡是一种理论概念,它保证参与者在博弈中都采取最优策略。

但是,并不是所有的博弈都存在纳什均衡状态。

4. 最小最大决策准则最小最大决策准则是博弈论中的一种分析工具,它可以找出一个参与者在博弈中采取的最佳策略。

最小最大决策准则是指通过对少一方可能获得的最小利益进行最小化,使得他们能够获得最大利益。

博弈论

博弈论

1.什么是博弈论?“博弈论”译自英文“Game Theory”,直译就是“游戏理论”。

博弈论是研究行为人在矛盾和对抗性关系中的行为决策中一般性规律规律的学科。

是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。

博弈:一些个人、组织,面对一定的环境条件,在一定的规律下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。

包括:博弈的参加者,各博弈方的全部策略或行为集合,进行博弈的次序,博弈方的得益四方面。

纳什均衡:设存在一个策略组合Bx’和By’,且Bx’∈Bx(Bx1,Bx2,……,BxN),By’∈By(By1,By2,……,ByN) ,当x选择Bx’时,y的最优策略选择是By’,同时,当y选择By’时,x的最优选择是Bx’,因此,x和y选择了Bx’和By’时,谁都不会再改变策略。

这种局面称为Nash均衡,是Nash最早提出并证明了它的存在。

1951年Nash提出了Nash均衡的概念,并证明了Nash均衡的存在——真正奠定了博弈论作为一门学科的基础。

之前,虽然有很多人致力于研究博弈对策的规律,但总没有得出有意义的成果,直到Nash。

n人博弈纳什均衡定⏹设:G={A1,A2,A3,…….,AN;U1,U2, U3,…………,UN}⏹如果存在一个策略组合{a1*, a2*,……,aN*},其中a1*∈A1,a2*∈A2,…….,aN*∈AN,使Ui*=Ui{a1*, a2*,…,aN*} ≥Ui{a1*,…,ai-1*,aij*,ai+1*…,aN*}⏹对任意i ∈N都成立,则{a1*, a2*,……,aN*}为Nash均衡。

囚徒困境坦白B不坦白A 坦白A 不坦白两个被捕的囚徒之间的一种特殊博弈,双方的利益不仅取决于他们自己的策略选择也取决于对方的策略选择。

博弈论十句经典口诀

博弈论十句经典口诀

博弈论十句经典口诀
1. “知己知彼,百战不殆”。

就像下棋一样,你得清楚对手的套路,才能下好这盘棋呀!比如在商业谈判中,了解对方的需求和底线,那不是胜算大多了嘛!
2. “不谋万世者,不足谋一时”。

哎呀,这就好比盖房子,你不规划好长远,只看眼前能行吗?就像做投资,要有长远眼光呀!
3. “以迂为直,以患为利”。

这就好像走路遇到大石头,绕个弯不就过去了,还可能发现新风景呢!在竞争中遇到困难,换个思路也许就变成机会啦!
4. “兵无常势,水无常形”。

就跟天气似的,一会儿晴一会儿雨,策略也得灵活多变呀!比如市场变化了,咱就得赶紧调整策略呀!
5. “攻其无备,出其不意”。

这不就像给对方来个突然袭击嘛!比如在比赛中出其不意地使出绝招,肯定能让对手措手不及!
6. “智者之虑,必杂于利害”。

就好像考虑买东西,得想想好处和坏处呀!在做决策时要全面权衡呀!
7. “善战者,致人而不致于人”。

要掌握主动权呀,可不能被别人牵着走!好比在人际关系中,要引导而不是被引导呀!
8. “兵以诈立”。

这就跟玩游戏使点小计谋一样,合理地用点手段才能赢呀!像在竞争中偶尔来点策略性的伪装也无妨嘛!
9. “小敌之坚,大敌之擒也”。

硬扛不行呀,该退让就得退让,不然就被抓住啦!就像跟人争论,太固执可能反而吃亏呀!
10. “将者,智、信、仁、勇、严也”。

一个好的领导者不就得具备这些嘛!就像带领团队,没这些品质怎么行呢!
我觉得博弈论这些口诀真的超有用,能让我们在各种情境中更加明智地做出选择和行动呀!。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论囚徒困境模型研究目录引言 (3)1.经典的囚徒困境 (4)解说 (4)2. 囚徒困境模型的形式 (6)一、完全信息静态“囚徒困境”博弈 (6)二、完全信息动态“囚徒困境”博弈———重复“囚徒困境”博弈.. 7三、不完全信息静态“囚徒困境”博弈 (8)四、不完全信息动态“囚徒困境”博弈 (9)3.解救囚徒困境的途径 (12)4. 囚徒困境模型现实例子和相关事件 (13)参考文献 (15)引言囚徒困境(Prisoner's Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。

或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。

虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。

在重复的囚徒困境中,博弈被反复地进行。

因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。

这时,合作可能会作为均衡的结果出现。

欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。

作为反复接近无限的数量,纳什均衡趋向于帕累托最优。

囚徒困境的主旨为,囚徒们彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在无法沟通的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。

但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。

1.经典的囚徒困境1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。

经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。

于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

若二人都互相检举(互相“背叛”),则二人同样判监2年。

用表格概述如下:甲沉默(合作)甲认罪(背叛)乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年二人同服刑2年乙认罪(背叛)甲服刑10年;乙即时获释解说我们来看看这个博弈可预测的均衡是什么。

对甲来说,尽管他不知道乙作何选择,但他知道无论乙选择什么,他选择“认罪”总是最优的。

显然,根据对称性,乙也会选择“认罪”,结果是两人都被判刑2年。

但是,倘若他们都选择“沉默”,每人只被判刑半年。

在表2.2中的四种行动选择组合中,(认罪、认罪)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。

不难看出,“认罪”是任一犯罪嫌疑人的占优战略,而(沉默,沉默)是一个占优战略均衡。

要了解纳什的贡献,首先要知道什么是非合作博弈问题。

现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。

博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。

好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。

其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。

博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。

所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。

话说有一天,一位富翁在家中被杀,财物被盗。

警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。

但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。

于是警方将两人隔离,分别关在不同的房间进行审讯。

由地方检察官分别和每个人单独谈话。

检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。

但是,我可以和你做个交易。

如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。

如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。

但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。

”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。

显然最好的策略是双方都抵赖,结果是大家都只被判一年。

但是由于两人处于隔离的情况下无法串供。

所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。

因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。

这种策略是损人利己的策略。

不仅如此,坦白还有更多的好处。

如果对方坦白了而自己抵赖了,那自己就得坐10年牢。

太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。

所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。

这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。

因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。

也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。

没有人会主动改变自己的策略以便使自己获得更大利益。

从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。

我们将例举出许多类似于“囚徒的两难处境”这样的例子。

如价格战、军奋竞赛、污染等等。

一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。

其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。

所有的博弈问题都会遇到这三个要素。

2.囚徒困境模型的形式一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。

它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。

为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。

当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们!年徒刑。

用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益):表1 囚徒2囚 徒 1假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。

容易看出,由于对于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白)是博弈的Nash 均衡。

坦白 不坦白 坦白 (-3,-3) (0,-5) 不坦白 (-5,0) (-1,-1)二、完全信息动态“囚徒困境”博弈———重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。

而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。

下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。

首先观察“囚徒困境”的有限博弈,以T 记基本博弈的重复次数。

博弈重复进行所耗时间会比较长,支付的时间价值必须考虑,记r 为折现因子。

在有限博弈的情况下,可简化在r=1的情况下讨论,并采用动态博弈的逆向归纳法进行 研究。

先分析r=T 阶段两博弈方的选择,这仍然是一个基本的囚徒困境博弈,此时前一阶段的结果已成为事实,又无后续阶段,因此不难得出结论,这一阶段的结果是(坦白,坦白),双方得益(-3,-3)。

现在回到r=T-1阶段,理性的博弈方对于后一阶段的结局非常清楚,其结果必然是(坦白,坦白).因此不管现阶段的博弈结果是什么,双方在本阶段以后的最终得益都是在本阶段得益的基础上各加上-3此时的得益矩阵是:表2囚徒2囚 徒 1容易看出,坦白仍是两博弈方的严格优超策略,即(坦白,坦白)是r=T-1阶段的唯一的纯Nash 均衡。

以此往上类推,每阶段“囚徒困境”博弈的结果都是博弈双方采用坦白,所以T 次重复博弈的子博弈精炼Nash 均衡是每个博弈阶段双方都采用坦白。

再考虑“囚徒困境”博弈重复无数次。

因为无限博弈没有最终阶段,所以不能运用逆向归纳法求解。

考虑博弈双方都采用“冷酷战略”:(1)开始阶段选择抵赖;((2)2)选择抵赖直到有一方选择了坦白,为了报复对手的背叛,以后都选择坦白。

假定囚徒j 严格执行上述冷酷战略,考察囚徒i 的最优策略是否为冷酷战略?如果i 在博弈的某个阶段首先选择了坦白,他在该阶段得到0,而不是—1,但他的这次背叛会遭到囚徒j 的永远惩罚,因此i 在随后每个阶段的支付都是-3。

如果下列条件满足,给定j 没有选择坦白,i 将不会选择坦白:进一步假定j 首先选择坦白,那么i 是否有积极性坚持冷酷战略以惩罚5的不合作行为?如果i 坚持冷酷战略,他随后每个阶段的支付是-3,但如果他选择其他战略,他在任何单一阶段的支付都不会大于-3,因此,无论r 是多大,i 都有积极性坚持冷酷战略。

在博弈重复无数次的情况下,只要r>1/3,子博弈精炼均衡是每个阶段博弈双方都采用抵赖进行合作。

坦白 不坦白 坦白 (-3,-3) (0,-5) 不坦白 (-5,0) (-1,-1)由于现实生活中许多博弈并不满足完全信息的要求,比如买卖双方都对彼此的信息掌握不完全,买者不知卖者产品的质量到底如何,卖者也不知道买者愿意付出多高的价格等等,因此研究不完全信息下的博弈有着重要的理论和现实意义。

假定囚徒1两种类型,理性的(或称为不合作的)和非理性的(有意愿合作的),概率分别为1-p和p,又假定囚徒2只有一种类型———理性的。

假定理性的囚徒可以选择任意的策略,而非理性的囚徒1只有一种策略“针锋相对”,即开始阶段选择抵赖,随后的阶段以对方前一阶段的策略为自己现阶段的策略进行鼓励或报复。

由于博弈只进行一个回合,博弈双方没有合作可能,于是理性的囚徒!的最优策略是“坦白”。

相关文档
最新文档