博弈论基础
博弈论基础吉本斯课后答案
博弈论基础吉本斯课后答案
一、原题
1. 什么是博弈论?
答:博弈论是一门研究决策者之间的竞争性行为的学科,它研究的是如何在竞争性环境中获得最佳结果。
它涉及到决策者之间的博弈,以及如何利用策略来获得最佳结果。
2. 什么是吉本斯博弈论?
答:吉本斯博弈论是一种研究两个或多个决策者之间的博弈的学科,它研究的是如何在竞争性环境中获得最佳结果。
它是由美国经济学家约翰·吉本斯在20世纪50年代提出的,他提出了一种新的方法来研究博弈,即使用数学模型来分析博弈的结果。
3. 吉本斯博弈论的基本概念是什么?
答:吉本斯博弈论的基本概念是博弈矩阵,它是一个表格,用来描述两个或多个决策者之间的博弈。
它由行和列组成,每一行代表一个决策者,每一列代表另一个决策者,每个单元格中的数字代表每个决策者在每种可能的结果下的收益。
4. 吉本斯博弈论中的均衡点是什么?
答:吉本斯博弈论中的均衡点是指当两个或多个决策者之间的博弈结果达到一种平衡时,每个决策者都不会有更多的收益。
这种平衡可以是一个纳什均衡,也可以是一个非纳什均衡,具体取决于博弈的结构。
博弈论基础
博弈论基础第一节博弈问题概述一、博弈的基本概念博弈论的基本概念包括:参与人、行为、信息、战略、支付函数、结果、均衡。
参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。
行动是指参与人的决策变量。
战略是指参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。
例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。
这里,“犯”与“不犯”是两种不同的行动。
战略规定了什么时候选择“犯”,什么时候选择“不犯”。
信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。
支付函数是参与人从博弈中获得的效用水平,它是所有参与人战略或行动的函数,是每个参与人真正关心的东西。
结果是指博弈者感兴趣的要素的集合。
均衡是所有参与人的最优战略或行动的组合。
上述概念中,参与人、行动、结果统称为博弈规则。
博弈分析的目的是使用博弈规则决定均衡。
二、博弈的分类根据博弈者选择的战略,可以将博弈分成合作博弈(cooperative games)与非合作博弈(non-cooperative games).合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。
如果有,就是合作博弈;反之,就是非合作博弈。
根据参与人行动的先后顺序,可以将博弈分成静态博弈(static game)与动态博弈(dynamic game)。
静态博弈是指,博弈中参与人同时选择行动;或者虽非同时行动,但行动在后者并不知道行动在先者采取了什么具体行动。
动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。
根据参与人对其他参与人的了解程度,可以将博弈分成完全信息博弈(games of complete information)和不完全信息博弈(games of incomplete information)。
完全信息博弈是指:在每个参与人对所有其他参与人(对手)的特征、战略和支付函数都有精确了解的情况下,所进行的博弈。
博弈论基础
其他参与人选择什么策略,某参与人的 最优策略是唯一的,这样的唯一的最优 战略被称为“占优策略”; � “博弈均衡”指博弈中的所有参与人都不想 改变自己的策略的这样一种状态。
(一)占优策略均衡
� 在一个博弈中,如果每个参与人都有一
个占优策略,且每个参与人都采取占优 策略,那么由所有参与人的(占优)策 略组合所构成的均衡就是占优策略均衡。 � 占优策略均衡的求解: 常用方法——划线法
“囚犯的困境”博弈中的“报酬矩阵” (Payoff Matris)
嫌犯B 坦白 不坦白 坦白 -10,-10 0,20 嫌犯A 不坦白 -20,0 -1,-1
三、占优策略均衡和纳什均衡
� (一)占优策略均衡 � (二)纳什均衡 � (三)占优策略均衡和纳什均衡比较
(一)占优策略均衡
� 占优策略(Dominant Strategies):不论
二、博弈的基本概念
� 1、参与人(players):一个博弈中独立决策、
独立承担结果的主体。 � 2、行动(actions or moves):参与人在博弈 的某个时点的决策变量。 � 3、策略(strategies):参与人在给定信息 集的情况下的行动规则 � 4、得益(pay off)(或支付、报酬):指在 一个特定的策略组合下参与人得到的确定效用 水平,或者是指参与人得到的期望效用水平。
(二)纳什均衡
� 在一个纳什均衡里,如果其他参与人不
改变策略,任何一个参与人都不会改变 自己的策略。
(二)纳什均衡
例:斗鸡博弈 B 进 A 退 0, 2 0,0 进 -3,-3 退 2,0
(三)占优策略均衡与纳什均衡比较
� 占优策略均衡要求任何一个参与人对于
其他参与人的任何策略选择来说,其最 优的策略都是唯一的。 � 纳什均衡只要求任何一个参与人在其他 参与人的策略选择给定的条件下,其选 择的策略是最优的。 � 占优策略均衡一定是纳什均衡,但纳什 均衡不一定就是占优策略均衡。
纳什均衡——博弈论的基础
纳什均衡——博弈论的基础下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by the editor. I hope that after you download them, they can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!In addition, our shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!纳什均衡——博弈论的基础引言博弈论作为一门交叉学科,融合了数学、经济学、政治学等多个领域的知识,旨在研究决策者在相互影响下的最佳策略选择。
博弈论前四章笔记整理
博弈论前四章笔记整理第一章:博弈论基础概念。
- 博弈的定义与要素。
- 博弈是指在一定的规则下,多个参与者(至少两个)进行策略选择并得到相应结果(收益)的过程。
- 要素包括参与者(局中人)、策略(每个参与者可选择的行动方案)、收益(每个参与者在不同策略组合下的所得)。
例如在“囚徒困境”中,两个囚犯是参与者,坦白或不坦白是他们的策略,不同策略组合下的刑期长短就是收益。
- 博弈的分类。
- 按参与者数量可分为两人博弈和多人博弈。
- 按策略空间是否有限分为有限博弈和无限博弈。
如猜硬币是有限博弈(正面或反面两种策略),企业的产量竞争(产量可在一定范围内连续取值)可能是无限博弈。
- 按收益情况分为零和博弈(一方的收益就是另一方的损失,总和为零,如赌博)、常和博弈(收益总和为常数)和非零和博弈(收益总和不为零,如企业合作共同开拓市场,双方都可能获利)。
第二章:完全信息静态博弈。
- 策略式表述(标准式表述)- 通常用一个矩阵来表示,行代表一个参与者的策略,列代表另一个参与者的策略,矩阵中的元素是对应的收益组合。
以“性别战”为例,丈夫和妻子选择看电影或看球赛,就可以构建一个2×2的收益矩阵。
- 占优策略均衡。
- 占优策略是指无论其他参与者选择什么策略,该策略都是某个参与者的最优策略。
如果每个参与者都有占优策略,那么由这些占优策略组成的策略组合就是占优策略均衡。
例如在“囚徒困境”中,每个囚徒的占优策略都是坦白,所以(坦白,坦白)是占优策略均衡。
- 纳什均衡。
- 纳什均衡是指在一个策略组合中,每个参与者的策略都是对其他参与者策略的最优反应。
即给定其他参与者的策略,没有参与者有动机单方面改变自己的策略。
与占优策略均衡不同,纳什均衡并不要求每个参与者都有占优策略。
例如在“性别战”中,(看电影,看电影)和(看球赛,看球赛)都是纳什均衡。
第三章:完全信息动态博弈。
- 扩展式表述。
- 包括博弈树的构建,节点表示参与者的决策点,树枝表示可选择的策略,终端节点表示博弈的结果并标有相应的收益。
博弈论基础
博弈论基础本讲要点:博弈论的基本思想,博弈的构成要素,简单博弈的求解方法,纳什均衡的概念,博弈的分类,动态博弈与重复博弈,信息不对称,道德风险,逆向选择,信号传递。
重点:博弈论的基本思想,纳什均衡的概念,信息不对称。
难点:博弈的构成要素,纳什均衡的概念。
讲授时间:6学时一、博弈的基本要素1、博弈论与古典经济学的区别古典经济学的基本思路:给定约束条件,考虑行为主体的最优结果。
博弈论的基本思路:以行为主体之间的相互影响为前提,考虑行为主体的最优结果。
两者的根本区别:是否考虑对方的行为。
古典经济学中消费者行为理论:假定收入、商品价格以及效用函数给定,求最优消费组合。
消费者A不会考虑消费者B的影响。
古典经济学中的厂商理论:假定生产函数、成本函数、商品价格给定,求厂商的最优生产决策。
厂商A不会考虑厂商B的影响。
古典经济学中的宏观经济理论:假定一国的资源禀赋给定,考虑价格指数、利率等因素的变化对国民收入、就业等的影响。
国家A不会考虑国家B的影响。
博弈论:每个人要考虑别人的行为怎样影响自己的选择。
扑克牌游戏:一个人不可能只顾自己出牌,而不考虑别人怎么出牌。
下棋:无论中国象棋、国际象棋、围棋,一个人在走某一步之前,都要考虑对手是怎么走的,以及对手在我走了一步之后会怎么走,以及我又会在对手走了一步之后怎么走,以至无穷。
高手与俗手的区别也就在此。
高手往往能够考虑10步甚至20步以后的变化。
总之:你的输赢不仅取决于你的决策,而且取决于你对手的决策。
2、博弈论简史博弈论的思路在古诺(Cournot,Antoine Augustin,1801-1977)的双头垄断模型中最早提出,冯•诺伊曼(John von Neumann,1903-1957)和摩根斯坦恩(Oskar Margenstern, 1902-1977)在1944年出版了《博弈论与经济行为》(Theory of Games and EconomicBehavior)一书,最早提出了博弈论的概念。
博弈论基础
博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
参见:行为生态学(behavioral ecology)。
约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
五讲博弈论基础 共72页
第一节 博弈论导论
博弈的四要素: 1.博奕的参加者,即博奕方或参与人。
2.各博奕方可选择的全部策略或行为的集合。
3.进行博奕的次序。
4.博奕方的得益。 例:囚徒困境
囚徒A
坦白 抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为:A、B都选择坦白,各判8年刑
第一节 博弈论导论
比如说:夜间唱歌
科斯定理图示
农场主的边际净损失
牧羊的边际利润
S
P
O
社会最优量
牧养人放牧的数量
说明
如果产权归农场主,农场主可以禁止放牧(点0),小于 社会最优量S;但此时,增加放牧给牧羊人带来的边际利 润大于给农场主造成的损失,牧羊人将有积极性贿赂农场 主,直到放牧量达到S为止;
如果产权归牧羊人,牧羊人的利润最大点是P,大于社会 最优量S;但此时,减少放牧量对牧羊人的边际利润损失 小于给农场主节约的边际成本,所以,农场主将有积极性 贿赂牧羊人,直到S;
博奕论前提假设:博弈的参与者都是理性人 所谓理性人是指有一个很好定义的偏好,在面临给定的约束 下最大化自己的偏好。 理性人可能是利己主义者,也可能是利它主义者。
第一节 博弈论导论
例:囚徒困境
囚徒A
坦白 抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为:A、B都选择坦白,各判8年刑
革命通常不是一个帕累托改进。
外部性与科斯定理
个人收益与社会收益:一项活动的社会收 益等于决策者个人得到的收益加社会其他 成员得到的收益,如养花;
个人成本与社会成本:社会成本等于决策 者的个人承担的成本加社会其他成员承担 的成本,如环境污染,交通堵塞;
博弈论基础复习
《博弈论基础》主要知识点一、名词解释(5×2=10分)策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。
纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合.混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。
扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具.博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。
博弈树类似于状态图和问题求解搜索中使用的搜索树.完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。
子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈. 行为策略是指每一个参与人在每一个信息集上随机的选择行动.逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。
在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。
冷酷策略又称触发策略。
指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作.类型:一般地,将一个参与人所拥有的所有私人信息称为他的类型。
信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。
分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。
混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。
特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。
联盟二、选择题(5×2=10分)三、简答题(28—30分)1.博弈的分类及相关概念.合作博弈:强调效率、公正、公平非合作博弈:博弈论的主要研究对象,强调在互动假设下的个人理性、个人最优决策从信息角度看,博弈可分为:完全信息博弈:指局中人对于自己以及其他局中人的策略空间、盈利函数等知识有完全的了解。
博弈论在生活中的应用
一、博弈论基础
博弈论的基本概念包括参与者、策略和收益。参与者是在博弈中决策的主体, 策略是每个参与者在给定信息下的决策选择,收益是每个参与者在博弈结束后 的得失。根据不同的标准,博弈论可以分为多种类型,如零和博弈、非零和博 弈、静态博弈和动态博弈等。零和博弈是指所有参与者的收益总和为零,非零 和博弈则是指收益总和不为零的情况。
博弈论的基本概念
博弈论的基本概念包括博弈局、策略、支付、纳什均衡等。博弈局是指多个决 策主体之间的互动和决策过程。策略是指每个决策主体所采取的行动方案。支 付是指每个决策主体在博弈局中所获得的收益或回报。纳什均衡是指所有决策 主体都采取最优策略,从而达到一种稳定的状态。
博弈论的应用
博弈论在实际生活中的应用非常广泛。例如,在解决公共利益问题方面,博弈 论可以帮助分析公众和政府之间的利益冲突,为政策制定提供理论支持。在合 作问题方面,博弈论可以帮助研究合作伙伴之间的利益分配和合作方式,从而 实现双赢。
博弈论的发展前景
随着社会的不断发展和科技的进步,博弈论在未来的应用前景也日益广阔。例 如,随着大数据和云计算技术的发展,博弈论在数据分析、金融风控、网络安 全等领域的应用将更加深入和广泛。同时,随着人工智能技术的不断发展,博 弈论在智能决策、自动化系统等领域的应用也将不断增加。
结论
总的来说,博弈论在社会生活中的应用具有重要性和广泛性。通过理解和掌握 博弈论的基本概念和理论,我们可以更好地分析和解决各种实际问题,提高决 策的科学性和有效性。随着科技的发展,博弈论在未来的应用前景也更加广阔, 将为人类社会的发展和进步做出更大的贡献。
首先,让我们来看看博弈论在社团活动中的应用。大学生活中,社团活动是一 个重要的组成部分。每个社团都有其独特的文化和活动,如何选择适合自己的 社团,就是一个典型的博弈论问题。我们需要在有限的资源和时间下,权衡各 种因素,比如个人兴趣、社团的活动是否与学业冲突等,来做出最优的选择。 这里,我们就是在和时间、兴趣和学业进行博弈。
博弈论的逻辑和认知基础
博弈论的逻辑和认知基础
博弈论是研究决策者在多个互动主体情境下做出最优策略的数学理论。
它基于以下逻辑和认知基础:
策略性决策:博弈论中的参与者是策略性的,他们考虑对手的行动和自己的行动,以选择最优策略。
不确定性:博弈论中的参与者不一定知道对手的策略,也不一定知道环境的完全信息。
因此,决策者需要考虑各种可能性,并制定出多种策略以应对不同情况。
有限理性:博弈论中的决策者是有限理性的,即他们的决策受到认知限制的影响。
决策者可能会做出错误的决策,或者在一定程度上偏离最优策略。
互动和交流:博弈论中的参与者可以通过互动和交流来影响对手的策略选择。
这种交流可能会带来信息的对称或不对称,这会对最终结果产生影响。
综上所述,博弈论的逻辑和认知基础包括策略性决策、不确定性、有限理性和互动和交流。
这些基础构成了博弈论的核心思想,为解决博弈问题提供了理论基础。
吉本斯博弈论基础pdf
吉本斯博弈论基础pdf
吉本斯博弈论基础主要包括以下几个方面:
1.参与者:在博弈论中,参与者是决策的主体,可以是个人、组织或国家等。
在吉本斯博弈论中,参与者通常被视为具有有限理性的个体,他们根据自身的利益和偏好进行决策。
2.战略:战略是参与者在博弈中的选择,可以是合作或竞争等不同的行为方式。
在吉本斯博弈论中,战略的制定需要考虑对手的反应和预期,以达到最优的决策效果。
3.收益:收益是参与者在博弈中的结果,可以是经济利益、社会地位等。
在吉本斯博弈论中,收益的分配取决于参与者的策略选择和博弈规则的设定。
4.均衡:均衡是博弈中的一种状态,指所有参与者的最优策略组合。
在吉本斯博弈论中,均衡的概念非常重要,它是分析博弈结果和预测未来行为的基础。
5.动态博弈:动态博弈是指参与者的决策和行动有先后顺序,后行动者可以根据先行动者的行为做出最优的决策。
在吉本斯博弈论中,动态博弈的分析需要考虑时间因素和信息不完全等因素。
总的来说,吉本斯博弈论基础主要包括参与者、战略、收益、均衡和动态博弈等几个方面。
这些基础概念和分析方法构成了吉本斯博弈论的基本框架,为研究决策制定和行为模式提供了重要的理论支持。
博弈论 基础 数学
博弈论是一门研究决策问题的学科,它主要关注如何在有限的资源和信息条件下进行决策,以及不同决策对于结果的影响。
在博弈论中,人们通常会将所有可能的决策结果,以及不同决策结果的概率、收益等因素进行抽象和计算,从而得到最优决策方案。
博弈论的基础数学包括以下几个方面:
1. 集合论和命题逻辑:
-博弈论中的集合是指由一组元素组成的对象,在集合论中,可以用各种符号和运算来描述和计算不同集合之间的关系。
-命题逻辑是一种处理命题(或陈述)之间关系的方法,其中包括真值表、命题符号、蕴含关系等概念。
2. 概率论与统计学:
-在博弈论中,概率论用于计算不同决策结果的概率和期望收益,从而帮助人们进行决策。
-统计学则用于对已有数据进行分析和推断,从中发现规律、总结经验以及预测未来的趋势。
3. 线性代数:
-线性代数是一门研究向量空间和线性变换的学科,它在博弈论中被广泛应用于处理矩阵、向量、线性方程组等问题。
4. 最优化理论:
-最优化理论是一种研究如何在限制条件下找到最优解的方法,它在博弈论中被用来寻找最优决策方案。
5. 数理逻辑:
-数理逻辑是研究符号语言和推理的学科,它在博弈论中主要用于形式化建模和证明博弈论中的结论。
综上所述,博弈论的基础数学包括集合论、命题逻辑、概率论与统计学、线性代数、最优化理论和数理逻辑等多个方面。
掌握这些数学知识对于理解和应用博弈论具有重要的意义。
第1讲:博弈论基础
21
(1)Agent/Player(博弈方)
博弈中独立决策、独立承担博弈结果的个人或组织。 为简单计,将博弈中的每个独立决策参加者称为“博 弈方”。
例:“囚徒困境”中的两个犯罪嫌疑人是“博弈方”,但制定规 则、自身不参与决策活动的警察不是“博弈方”。
囚徒2 坦白 抵赖 坦白 (-5,-5) (0,-8) 囚徒1 抵赖 (-8,0) (-1,-1)
博弈发生在相互影响、相互作用的“一些人、团队 或其他组织”中间。 看到“相互影响、相互作用”,可以想到“系统” 概念。
5
系统
系统是由相互联系、相互作用着的一些
事物组成的总体。也可以概括地说,系 统是由部分组成的总体。(王浣尘,1986)
6
博弈系统?
博弈发生在相互影响、相互作用的“一些人、 团队或其他组织”中间。 这些相互影响、相互作用的“一些人、团队 或其他组织”可以构成一个系统。
12
系统的边界
讨论系统的“组成性”,必须弄清楚系统的 “边界”。 但是,明确系统的边界不是一件容易的事情。 在博弈系统中,更是如此。
13
Classical Examples of Games
(1)Prisoner’s Dilemma(囚徒困境) (2)Battle of the sexes(性别之争博弈) (3)Hawk–Dove game(鹰鸽博弈)
1
第1讲:博弈论基础
2
博弈论强调经济主体之间的直接相互联系和影响。
博弈论(Game Theory)是研究决策主体的 行为发生直接相互作用时的决策以及这种决 策的均衡问题,因此也被称为“对策论 (Theory of Interactive Decision)”。这 一理论最重要的特点是强调了经济主体之间 的直接相互联系和影响。(董保民等,2008, 第1页)
博弈论基础 mobi
博弈论基础 mobi(实用版)目录1.博弈论的概述2.博弈论的基本要素3.博弈论的分类4.博弈论的应用案例5.博弈论的发展与前景正文一、博弈论的概述博弈论,作为一门研究决策制定的数学理论,主要关注在特定情况下,决策者如何做出最佳选择以实现自身目标。
博弈论的研究对象包括各种决策问题,如竞争、合作、冲突等,旨在揭示这些决策问题的规律性,并提供有效的解决方法。
二、博弈论的基本要素1.参与者:博弈中的决策者,可以是个人、组织或国家等。
2.策略:参与者可选择的行动方案。
3.支付:参与者采取某策略后获得的收益或损失。
4.博弈:参与者之间相互作用的过程,包括策略选择和支付计算。
三、博弈论的分类1.合作博弈与非合作博弈:根据参与者之间是否存在协作关系进行划分。
2.静态博弈与动态博弈:根据博弈过程的时间特性进行划分。
3.完全信息博弈与不完全信息博弈:根据参与者对对方策略的了解程度进行划分。
四、博弈论的应用案例1.囚徒困境:揭示了合作与竞争之间的矛盾,解释了为何在某些情况下,合作可能导致更差的结果。
2.拍卖理论:研究拍卖市场中的策略选择与支付分配问题,为实际拍卖活动提供理论依据。
3.信任博弈:分析信任关系对合作决策的影响,有助于理解人际关系中的信任问题。
五、博弈论的发展与前景1.发展历程:博弈论起源于 20 世纪中叶,经过几代学者的发展,已经成为一门较为完善的理论体系。
2.发展趋势:博弈论与其他学科的交叉研究日益增多,如经济学、社会学、心理学等。
3.前景展望:随着人工智能、大数据等技术的发展,博弈论在实际应用中将发挥更大的作用。
总之,博弈论作为一门研究决策制定的数学理论,不仅具有深厚的理论基础,还具有广泛的应用前景。
gibbons博弈论基础
gibbons博弈论基础
《博弈论基础》是Robert Gibbons编著的一本书,博弈论是研究多人决策问题的理论,在经济学、管理学等领域有广泛应用。
在微观研究领域,交易机制的模型(诸如讨价还价模型和拍卖模型)就涉及博弈论;在中观经济研究中,劳动力经济学和金融理论都有关于企业要素投入品市场(而非寡头垄断模型中的产出品市场)的博弈论模型;从宏观的角度看,国际经济学中有关于国家间的相互竞争(或互相串谋),选择关税或其他贸易政策的模型;宏观经济学中也有货币当局和工资、价格制定者(厂商等微观单位)间的战略相互影响,最终决定了货币政策效果的模型。
博弈论在各个领域都有广泛的应用,学习《博弈论基础》可以帮助我们更好地理解和应对复杂的决策问题。
博弈论知识点总结完整版
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
参见:行为生态学(behavioral ecology)。
约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的学科。
编辑本段诺贝尔奖从1994年诺贝尔经济学奖授予3位博弈论专家开始,共有5届的诺贝尔经济学奖与博弈论的研究有关,分别为:1994年,授予美国伯克利加利福尼亚大学的约翰·海萨尼(J.Narsanyi)、普林斯顿大学约翰·纳什(J.Nash)和德国波恩大学的赖因哈德·泽尔滕(Reinhard Selten)。
1996年,授予英国剑桥大学的詹姆斯·莫里斯(James A. Mirrlees)与美国哥伦比亚大学的威廉·维克瑞(William Vickrey)。
2001年,授予美国加州大学伯克莱分校的乔治·阿克尔洛夫(George A. Akerlof )生于1940年、美国斯坦福大学的迈克尔·斯宾塞(A. Michael Spence )和美国纽约哥伦比亚大学的约瑟夫·斯蒂格利茨(Joseph E. Stiglitz)。
2005年,授予美国马里兰大学的托马斯·克罗姆比·谢林(Thomas Crombie Schelling)和耶路撒冷希伯来大学的罗伯特·约翰·奥曼(Robert John Aumann)。
2007年,授予美国明尼苏达大学的里奥尼德·赫维茨(Leonid Hurwicz)、美国普林斯顿大学的埃里克·马斯金(Eric S. Maskin)以及美国芝加哥大学的罗杰·迈尔森(Roger B. Myerson)。
作为一门工具学科能够在经济学中如此广泛运用并得到学界垂青实为罕见。
编辑本段基本概念(1)决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。
(2)对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。
他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。
(3)局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
(4)策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
(5)得失(payoffs):一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。
所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。
(6)次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。
(7)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。
在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。
所谓纳什均衡,它是一稳定的博弈结果。
纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
也就是说,此时如果他改变策略他的收益将会降低。
在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。
所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A的收益不会超过他采取原来的策略a*的收益。
这一结果对局中人B亦是如此。
这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a,b*)≤偶对(a*,b*)≥偶对(a*,b)。
对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a,b*)≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。
有了上述定义,就立即得到纳什定理:任何具有有限纯策略的二人博弈至少有一个均衡偶。
这一均衡偶就称为纳什均衡点。
纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。
通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。
纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。
但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。
塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。
编辑本段博弈类型博弈的分类根据不同的基准也有不同的分类。
一般认为,博弈主要可以分为合作博弈和非合作博弈。
合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。
完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。
不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。
目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。
非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。
与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。
博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型,等等。
编辑本段纳什均衡定义纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。
假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。
所有局中人策略构成一个策略组合(Strategy Profile)。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。
即在给定别人策略的情况下,没有人有足够理由打破这种均衡。
纳什均衡,从实质上说,是一种非合作博弈状态。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。
纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。