博弈论知识考点
《博弈论》知识点总结
《博弈论》知识点总结博弈论作为一门交叉学科,涵盖了数学、经济学、政治学、心理学等多个学科领域。
其研究对象包括零和博弈、非零和博弈、合作博弈、序贯博弈等。
博弈论的应用领域也非常广泛,包括经济学、政治学、社会学、管理学等。
博弈论在求解决策问题、预测市场行为、推导策略和解释社会现象等方面有着广泛的应用。
博弈论的主要内容包括:1.博弈的定义博弈是指互相影响的参与者所进行的一种决策活动。
在博弈中,每个参与者都要做出一个选择,其结果受到其他参与者的选择的影响。
博弈的结果取决于所有参与者的选择。
2.博弈的基本元素博弈的基本元素包括参与者、策略和结果。
参与者是进行决策的主体,策略是参与者可以选择的行为方式,结果是参与者选择策略后所得到的收益或损失。
3.博弈的分类根据参与者的利益关系和决策方式,博弈可以分为零和博弈和非零和博弈。
零和博弈指参与者的利益完全相反,一方获利即意味着另一方损失,而非零和博弈则指参与者的利益可能存在重叠或者是共同合作的情况。
4.博弈的解博弈的解是指在博弈参与者做出决策选择之后,通过某种机制确定最终的结果。
常见的博弈解包括纳什均衡、霍夫达均衡、帕累托最优等。
5.博弈论的应用博弈论在经济学、政治学、社会学等领域有着广泛的应用。
在经济学中,博弈论可以用来解释市场行为、预测价格变动等。
在政治学中,博弈论可以用来分析政治决策、议事程序等。
在社会学中,博弈论可以用来解释群体行为、合作问题等。
博弈论是一门具有重要理论意义和广泛应用价值的学科,它不仅可以帮助人们更好地理解决策制定的规律和机制,还可以为人们提供更科学的决策指导。
在日常生活中,我们可以通过学习和应用博弈论的知识,更加理性地做出决策,并更好地理解他人的选择和行为。
希望未来博弈论能够继续在各个领域发挥作用,为人类社会的进步和发展做出更大的贡献。
博弈论知识点总结完整版
博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。
它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。
下面是博弈论中的一些重要知识点的总结。
1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。
-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。
-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。
2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。
-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。
3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。
-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。
-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。
4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。
-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。
-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。
5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。
-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。
-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。
6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。
-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。
-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。
7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。
-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。
《博弈论》知识点总结归纳
《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。
本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。
关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。
博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。
本文将对博弈论的相关知识进行详细的总结和归纳。
一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。
博弈的基本要素包括:参与者、策略、收益和信息。
1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。
参与者的目标是实现自身利益的最大化。
1.3 策略策略是指参与者在博弈中所能采取的行动或选择。
通常分为纯策略和混合策略。
1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。
收益可以用来衡量参与者的利益大小。
1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。
信息可以分为对称信息和非对称信息。
二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。
常见的均衡概念有纳什均衡、帕累托最优和博弈解。
2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。
2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。
帕累托最优是一种资源分配的有效方式。
2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。
博弈解往往是均衡的特殊情况。
三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。
博弈论考试重点
一、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
博弈论 研究决策主体的行为及其相互决策和均衡问题的学科。
在经济学中 博弈论是研究经济主体的二、博弈论基本要素博弈参与者、各博弈方各自可选择的全部策略或行为的集合、进行博弈的次序、博弈方的利益、博弈行为、博弈信息、结果、均衡三、名词解释静态博弈:同时决策或者同时行动的博弈属于静态博弈—田忌赛马、猜硬币、古诺模型动态博弈:先后或序贯决策或者行动的博弈属于动态博弈—弈棋、市场进入、领导完全信息博弈:所有博弈方都清楚其他博弈方的得益状况不完全信息博弈(贝叶斯博弈):至少有一个博弈方不完全清楚其他博弈方的得益或得益函数囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈纳什均衡:在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的冷酷战略:重复博弈中,任何博弈方的一次性不合作将引起其他博弈方的永远不合作,从而导致的所有博弈方的收益减少。
针锋相对战略:参与人在博弈开始时选择合作;在时期t选择对方在时期t-1期所采用的战略,即如果对方在t-1期背叛(不合作),则自己在t期也选择背叛重复博弈:静态或动态博弈的重复进行,即重复进行的博弈过程聚点均衡:在理论上一个博弈中可能有多个纳什均衡点,这时在现实生活中,行为人往往利用在理论上省略掉的那些信息,找到一个大家都感兴趣的点,这个点往往成为现实世界中博弈的最终解。
当参与人之间没有正式的信息交流时,他们存在于其中的“环境”往往可以提供某种暗示,使得参与人不约而同地选择与各自条件相称的策略(聚点),从而达到均衡卡尔多-希克斯标准:一种变革使得受益者的所得足以弥补受损者的所失,这种变革就是卡尔多-希克斯改进。
《博弈论》知识点总结归纳
《博弈论》知识点总结归纳博弈论是研究决策者之间相互作出决策时,通过考虑对方的行动和可能的结果来进行决策的一门学科。
它主要关注对策略的选择与分析,以及对方可能的反应。
下面我们来对博弈论的知识点进行总结归纳。
1.普通博弈和扩展博弈:博弈论分为两类,即普通博弈和扩展博弈。
普通博弈是指参与者在同一时间同时做出决策的博弈,扩展博弈是指参与者在不同的时间节点上做出决策的博弈。
2.博弈的组成要素:博弈论研究的关键要素包括博弈参与者、参与者的策略、参与者的支付、参与者的效用等。
博弈论的目标是通过合理的策略选择来实现最优的支付和效用。
3.纳什均衡:纳什均衡是博弈论中一个重要的概念,指的是当每个参与者都选择了最优的策略后,没有人会改变自己的策略来获得更好的支付。
纳什均衡是博弈的稳定状态。
4.博弈的分类:根据参与者的合作与否,博弈可以分为合作博弈和非合作博弈。
合作博弈中,参与者可以通过合作与其他参与者达成协议,而非合作博弈中,参与者彼此之间没有合作关系。
5.零和博弈和非零和博弈:零和博弈是指所有参与者的支付之和为零的博弈,即一方获利就意味着其他方会损失相应的支付。
非零和博弈是指所有参与者的支付之和不为零的博弈,即所有参与者都有可能获得一定的支付。
6.博弈的解析方法:解析方法是通过分析博弈的特性和参与者的策略来研究博弈的方法。
解析方法包括主要包括支配策略法、混合策略法、最佳反应函数等。
7.博弈的策略选择:博弈论研究的核心问题之一是参与者在博弈中如何选择最优的策略。
策略选择可以通过分析博弈的收益矩阵和参与者的目标来实现。
8.博弈的应用领域:博弈论的应用十分广泛,包括经济学、政治学、生物学、社会学等多个领域。
在经济学中,博弈论被用来研究市场竞争、价格形成等问题,在政治学中,博弈论被用来分析政治决策与合作等问题。
9.孤立型博弈和重复博弈:孤立型博弈是指只进行一轮博弈的情况,参与者只能根据当下的情况来做出决策。
重复博弈是指进行多轮博弈的情况,参与者可以根据之前的决策和结果来进行策略的调整。
博弈论知识点总结完整版
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
完整版)博弈论知识点总结
完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。
该学科的研究假设包括:1)决策主体是理性的,会尽可能地最大化自己的收益;2)完全理性是共同知识;3)每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。
博弈中涉及到的变量包括:参与人、行动、战略和信息。
完全信息指每个参与人都了解其他参与人的支付函数,而完美信息则指在博弈过程中,每个参与人都能观察和记忆之前的行动选择。
不完全信息则表示参与人没有完全掌握其他参与人的信息,存在不确定性因素。
博弈与传统决策的区别在于,博弈是决策主体之间的相互作用,需要考虑其他决策者的选择和效用函数。
博弈的表示形式包括战略式博弈和扩展式博弈,其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题,而扩展式博弈则更适用于描述动态博弈问题。
与战略式博弈不同,扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析,而不是仅关注博弈结果的描述。
扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。
战略式博弈是一种静态模型,而扩展式博弈是一种动态模型。
博弈论可以分为合作博弈和非合作博弈,其中合作博强调团体理性、团体最优决策和效率,而非合作博弈强调个人理性和个人最优决策。
根据参与人行动先后顺序的不同,博弈可以分为静态博弈和动态博弈,后者包括先行动者获得先行动者行动信息的情况。
根据参与人对信息的掌握程度,博弈可以分为完全信息和不完全信息博弈。
根据决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。
不同类型的博弈有不同的均衡类型和求解方法,顺序的不同也会影响均衡结果。
Hotelling价格竞争模型是一种重要的扩展式博弈,用于描述两个企业在同一市场上的价格竞争。
相对应。
占有均衡是指在博弈中存在一组参与人的战略选择,使得每个参与人都无法通过改变自己的战略来提高自己的支付。
博弈论前四章笔记整理
博弈论前四章笔记整理第一章:博弈论基础概念。
- 博弈的定义与要素。
- 博弈是指在一定的规则下,多个参与者(至少两个)进行策略选择并得到相应结果(收益)的过程。
- 要素包括参与者(局中人)、策略(每个参与者可选择的行动方案)、收益(每个参与者在不同策略组合下的所得)。
例如在“囚徒困境”中,两个囚犯是参与者,坦白或不坦白是他们的策略,不同策略组合下的刑期长短就是收益。
- 博弈的分类。
- 按参与者数量可分为两人博弈和多人博弈。
- 按策略空间是否有限分为有限博弈和无限博弈。
如猜硬币是有限博弈(正面或反面两种策略),企业的产量竞争(产量可在一定范围内连续取值)可能是无限博弈。
- 按收益情况分为零和博弈(一方的收益就是另一方的损失,总和为零,如赌博)、常和博弈(收益总和为常数)和非零和博弈(收益总和不为零,如企业合作共同开拓市场,双方都可能获利)。
第二章:完全信息静态博弈。
- 策略式表述(标准式表述)- 通常用一个矩阵来表示,行代表一个参与者的策略,列代表另一个参与者的策略,矩阵中的元素是对应的收益组合。
以“性别战”为例,丈夫和妻子选择看电影或看球赛,就可以构建一个2×2的收益矩阵。
- 占优策略均衡。
- 占优策略是指无论其他参与者选择什么策略,该策略都是某个参与者的最优策略。
如果每个参与者都有占优策略,那么由这些占优策略组成的策略组合就是占优策略均衡。
例如在“囚徒困境”中,每个囚徒的占优策略都是坦白,所以(坦白,坦白)是占优策略均衡。
- 纳什均衡。
- 纳什均衡是指在一个策略组合中,每个参与者的策略都是对其他参与者策略的最优反应。
即给定其他参与者的策略,没有参与者有动机单方面改变自己的策略。
与占优策略均衡不同,纳什均衡并不要求每个参与者都有占优策略。
例如在“性别战”中,(看电影,看电影)和(看球赛,看球赛)都是纳什均衡。
第三章:完全信息动态博弈。
- 扩展式表述。
- 包括博弈树的构建,节点表示参与者的决策点,树枝表示可选择的策略,终端节点表示博弈的结果并标有相应的收益。
博弈论必背100句
博弈论必背100句1. 博弈论是研究决策制定和策略选择的数学理论。
2. 在博弈论中,参与者的利益和行为是分析和决策的重点。
3. 博弈论可以应用于各种领域,如经济学、政治学和生物学等。
4. 博弈论的基本概念包括参与者、策略和收益。
5. 在博弈论中,参与者可以是个人、团队或国家等。
6. 策略是参与者为了实现自己的目标而采取的行动方式。
7. 收益是参与者根据策略选择所获得的结果。
8. 博弈论中常见的博弈类型包括零和博弈和非零和博弈。
9. 零和博弈中,参与者的利益完全相反,一方的收益必然导致另一方的损失。
10. 非零和博弈中,参与者的利益可能相互依赖,一方的收益不一定导致另一方的损失。
11. 在博弈论中,纳什均衡是指参与者在给定其他参与者策略的情况下,无法通过单方面改变自己的策略来提高自己的收益。
12. 纳什均衡是博弈论中最重要的解概念之一。
13. 博弈论中的合作和竞争是两种常见的行为方式。
14. 合作是指参与者为了实现共同目标而采取协调行动的方式。
15. 竞争是指参与者为了争夺有限资源而采取相互对抗的方式。
16. 在博弈论中,策略的选择是参与者根据自身利益和对其他参与者行为的预测来做出的决策。
17. 博弈论中的信息不对称是指参与者在做出决策时拥有不同的信息。
18. 信息不对称可以导致博弈结果的不确定性。
19. 在博弈论中,重复博弈是指参与者进行多次博弈的情况。
20. 在重复博弈中,参与者的策略可能受到之前博弈结果的影响。
21. 在博弈论中,博弈的解可能是多个纳什均衡的组合。
22. 博弈论中的博弈树是一种图形表示博弈过程的工具。
23. 博弈树可以帮助参与者理解博弈的策略和结果。
24. 在博弈论中,博弈的结果可以通过数学模型和计算机模拟来预测。
25. 博弈论中的博弈解法包括支配解、纳什均衡和最优解等。
26. 支配解是指在博弈中存在一种策略可以在任何情况下都能带来更好的收益。
27. 最优解是指在博弈中存在一种策略可以在所有情况下都能带来最大收益。
博弈论复习题及答案
博弈论复习题及答案1. 博弈论中,非合作博弈与合作博弈的主要区别是什么?答案:非合作博弈是指参与者之间没有约束性协议的博弈,每个参与者都独立地选择自己的策略以最大化自己的利益。
而合作博弈则允许参与者之间形成具有约束力的协议,共同合作以达到共同的目标。
2. 什么是纳什均衡?答案:纳什均衡是指在一个博弈中,每个参与者都选择了最优策略,并且考虑到其他参与者的策略后,没有参与者有动机单方面改变自己的策略。
3. 零和博弈与非零和博弈有何不同?答案:零和博弈是指博弈中所有参与者的收益总和为零,即一个参与者的收益必然导致另一个参与者的损失。
非零和博弈则是指参与者的收益总和不为零,参与者之间可能存在合作共赢的情况。
4. 如何判断一个博弈是否存在纯策略纳什均衡?答案:可以通过构建博弈的收益矩阵,然后寻找每个参与者在其他参与者策略给定的情况下的最佳响应策略。
如果存在一组策略,使得每个参与者在其他参与者策略不变的情况下,都没有动机改变自己的策略,那么这个策略组合就是一个纯策略纳什均衡。
5. 混合策略纳什均衡与纯策略纳什均衡有何不同?答案:纯策略纳什均衡是指参与者在均衡状态下选择的策略是确定的,而混合策略纳什均衡则是指参与者在均衡状态下选择的策略是随机的,每个策略都有一定的概率被选择。
6. 什么是支配策略?答案:支配策略是指在博弈中,无论其他参与者选择什么策略,某个参与者选择该策略都能获得比其他策略更好的结果。
7. 博弈论中的“囚徒困境”说明了什么?答案:“囚徒困境”说明了即使合作对所有参与者都有利,但由于缺乏信任和沟通,参与者可能会选择对自身最有利的策略,导致集体结果不是最优的。
8. 什么是博弈论中的“倒后归纳法”?答案:“倒后归纳法”是一种解决动态博弈的方法,通过从博弈的最后阶段开始,逆向分析每个阶段的最优策略,直到博弈的初始阶段。
9. 博弈论在经济学中的应用有哪些?答案:博弈论在经济学中的应用非常广泛,包括但不限于市场结构分析、拍卖理论、合同理论、产业组织、宏观经济政策分析等。
博弈论知识点总结完整版
博弈论知识点总结完整版博弈论是研究决策者在互相影响的情况下做出最佳决策的数学模型和方法。
在博弈论中,决策者被称为玩家,他们的决策会受到其他玩家的影响。
以下是博弈论的一些重要知识点的总结:1.资料和约定-玩家:博弈论中的决策者。
-策略:玩家可以采取的行动。
-支付:玩家根据博弈结果获得的效用或价值。
-最优策略:在给定博弈条件下,可以使玩家获得最大效用的策略。
-纯策略和混合策略:纯策略是指玩家在每次博弈中都采取相同的行动;混合策略是指玩家以一定概率采取不同的行动。
2.标准形博弈-扩展形式:博弈者按照时间次序做出决策,每个决策节点有多个玩家可以选择的动作。
-纳什均衡:在标准形博弈中,如果所有玩家都不愿意单方面改变他们的策略,则该策略组合是纳什均衡。
-最优反应函数:针对每个玩家的策略组合,最优反应函数给出了该玩家的最佳策略。
-支配策略:一个策略在任何情况下都能够给出玩家更好的结果,那么我们可以说这个策略是支配的。
3.矩阵博弈-矩阵:博弈论中描述玩家策略和效用的表格。
-矩阵博弈的解:通过找到纳什均衡,我们可以得出矩阵博弈的解决方案。
-互动博弈:双方玩家的效用都取决于对方的策略选择。
4.博弈树-博弈树:根据博弈的时间顺序和玩家之间的相互影响,构建的树形结构。
-极小极大算法:用于确定博弈树上的最佳策略。
- alpha-beta剪枝:通过剪枝,减少博弈树的节点数量,从而提高效率。
5.进化博弈论-重复博弈:博弈过程被连续重复进行,玩家可以根据之前的结果来调整策略。
-演化稳定策略:一个策略集合中的策略,在当前环境下被所有玩家采纳并且难以被其他策略取代。
6.合作博弈论-合作博弈:玩家可以自由选择与其他玩家联合合作,并共享所获得的效用。
-特征函数:描述合作博弈的效用分配。
-核心:合作博弈中所有合法的效用分配的集合。
- Shafer值:一种用于将效用分配给个体的方法,使得每个个体的效用都能够得到公平分配。
博弈论是多学科交叉的研究领域,应用广泛,涉及经济、管理、政治等多个领域。
博弈论(2)专业知识
假如你是第一种强盗,你该怎样提出分配 方案才干使自己旳收益最大化呢?
博弈论2023
45
➢ 启示:第五人看似安全,其实并没利益,因 为威胁不可置信。收买失意者更为轻易
为何革命者总是找穷苦人? 为何恐怖分子在阿富汗受欢迎? 为何组织中旳一把手,经常抛开二号人物, 而与会计出纳打得火热?
策略组合s*,对于任意旳ε,存在着一种位于 [0,1]区间上旳正数向量δ1,…,δn和一种完全 混合策略向量σ1,…,σn,使得每一种策略都被策 略(1-δi)si+δiσn所取代旳新博弈有一种纳什均衡, 且该纳什均衡中旳每一种策略和s*旳距离不大于ε。
博弈论2023
35
例: 出 史密斯 进
(1,1) 上
注:不完全信息不等于不对称信息
博弈论2023
8
例:扑克牌游戏下注前行为规则。
(1)全部牌洗成面朝上; (完美,拟定)
(2)全部牌洗成面朝下且不能看自己旳牌; (不完全,对称,拟定)
(3)全部牌洗成面朝下且参加人只能看自己旳牌; (不完全,不对称,拟定)
(4)全部牌洗成面朝上,但每个参加人随即都能够 用手护住并悄悄丢掉一张牌;
博弈论2023
4
博弈论2023
5
博弈论2023
6
博弈论2023
7
➢信息类型
完美perfect:每个信息集都是单结旳。
完全complete:自然(类型或支付)不首先 行动或它旳最初行动被全部人观察到。
拟定certain:自然(类型或支付)不在任何一 种参加人行动之后行动。
对称symmetric:没有人在行动时或终点结 处拥有与其他人不同旳信息。
博弈论重点
1.纳什均衡:这种战略组合由所有参与人的最优战略组成,即当s i *(i= 1,2,…,n)对给定s -i *=(s 1*,s 2*,…,s i-1*,s i+1*,…,s n *) 满足:u i (s i *,s -i *)≥u i (s i ,s -i *),s i ∈Si 即s i *∈argmax u i (s 1* ,…,s i-1*, s i ,s i+1*,…,s n *),i=1,2,…,n 则称s *=(s 1* , s 2*,…,s i *,…,s n *)是一个纳什均衡(NE )。
2.占优战略均衡:不论对手选择什么战略,参与人i 的最优战略是唯一的,即它的最优战略与其他参与人的战略选择无关。
令s -i =(s 1,s 2,…,s i-1,s i+1,…,s n ),称s i *为参与人(严格)占优战略,若均成立。
并称s *=(s 1*,s 2*,…,s n *)为占优战略均衡(DSE )。
3.共同知识:信息是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。
共同知识是与信息有关的一个重要概念。
共同知识指的是“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道……”的知识。
4.信息集:每次行动参与人知道什么(如A 知不知B 已选择了什么行动,或对自然了解如何)。
博弈树上的所有决策结分割成不同的信息集。
每一个信息集是决策集合的一个子集,该子集包括所有满足下列条件的决策结:(1)每一个人决策结都是同一参与人的决策结。
(2)该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策界。
5.子博弈:一个扩展式表述博弈的子博弈G 由一个决策结x 和所有该决策结的后续结T (x )(包括终结点)组成,它满足下列条件:)(),(),()2(},{)()1(x T x x h x x T x x x x h ∈'''∈''∈'∀=则若是一个单结信息集;6.可置信威胁:精炼均衡必须是纳什均衡,但纳什均衡不一定是精炼均衡。
(完整版)博弈论知识点总结
博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。
2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。
完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主题所选择的行动的函数。
从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别:3、博弈论与传统决策的区别:1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。
可表示为:maxU(P,l),其中P为市场价格,丨为消费者可支配收入。
2、其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
博弈论知识点总结完整版
博弈论一:基本知识1.1定义:博弈论;又称对策论;是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论;是研究竞争的逻辑和规律的数学分支..即;博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用;以及不同决策主体之间的均衡..1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数;是博弈最重要的基本要素..1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论..两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议binding agreement..倘若不能;则称非合作博弈Non-cooperative game..合作博弈强调的是集体主义;团体理性;是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大;强调个人理性、个人最优决策;其结果有时有效率;有时则不然..目前经济学家谈到博弈论主要指的是非合作博弈;也就是各方在给定的约束条件下如何追求各自利益的最大化;最后达到力量均衡..博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息;是否了解两个角度进行..把两个角度结合就得到了4种博弈:a、完全信息静态博弈;纳什均衡;Nash1950b、完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾1965c、不完全信息静态博弈;贝叶斯纳什均衡;海萨尼1967-1968d、不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾1975 Kreps; Wilson1982 Fudenberg; Tirole19911.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述 Strategic form; 扩展式表述Extensive form1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略;一个参与人的某个策略给他带来的支付值始终高于其他策略;或至少不劣于其他策略;则称该策略为该参与人的严格占优策略或占优策略..对于所有的s-i; si称为参与人i的严格占优战略;如果满足:uisi;s-i>uisi';s-is-i; si' sib、占优均衡:一个博弈的某个策略组合中;如果对应的所有策略都是各参与人的占优策略;则称该策略组合为该博弈的一个占优均衡..1.7重复剔除严劣策略均衡:a、“严劣”和“弱劣”的含义:设 s i’和s i’’是参与人i可选择的两个策略;若对其他参与人的任意策略组合s-i; 均成立u i s i’; s-i < u i s i’’; s-i; 则说策略s i’严劣于策略s i’’ ..上面式子中;若将“<”改为“≤”;则说策略s i’弱劣于策略s i’’ ..b、定义:重复剔除严格策略就是各参与人在其各自策略集中;不断剔除严劣策略…如果最终各参与人仅剩下一个策略;则该策略组合就被称为重复剔除严劣策略均衡..二:纳什均衡Nash Equilibrium2.1纳什均衡定义:对于一个策略式表述的博弈G= {N;S i; u i; i ∈N}; 称策略组合s=s1; …s i; …; s n是一个纳什均衡;如果对于每一个i ∈N; s i是给定其他参与人选择s-i={s1; … ;s i-1; s i+1; … ;s n} 情况下参与人i的最优策略经济理性策略;即:u i s i; s-i≥ u i s i; s-i; 对于任意的s i∈S i ;任意的i∈N均成立..通俗定义:纳什均衡是一种策略组合;给定对手的策略;每个参与人选择自己的最优策略..纳什均衡是一种稳定的策略组合:当所有参与人的选择公开以后;每个人都满意自己作出了正确的选择;没有人能得到更好的结果了..在博弈论中这种结果被称为纳什均衡NE..2.2定理:Nash在1950年证明:任何有限博弈;都至少存在一个NE——Existence of Nash Equilibrium..即在一个有n个参与人的策略式博弈G={S1;…;Sn; u1;…;un}中;如果n是有限的;且Si是有限集i=1;…;n;则该博弈至少存在一个纳什均衡在混合策略意义下Wilson1971证明;几乎所有有限博弈;都存在有限奇数个NE;包括纯策略NE和混合策略NE..——Oddness Theorem2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理 a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡;但反过来不一定成立;定理 b 纳什均衡一定不能通过重复剔除严劣策略方法剔除..2.4划线法先找出自己针对其他博弈方每种策略或策略组合对多人博弈的最佳对策;即自己的可选策略中与其他博弈方的策略或策略组合配合;给自己带来最大得益的策略这种相对最佳策略总是存在的;不过不一定唯一;然后在此基础上;通过对其他博弈方策略选择的判断;包括对其他博弈方对自己策略判断的判断等;预测博弈的可能结果和确定自己的最优策略..这就是划线法..2.5箭头法箭头法对于理解博弈关系很有好处;是寻找相对稳定性策略组合的分析方法..对博弈中的每个策略组合进行分析;考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益..如能;则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组..最后综合对每个策略组合的分析情况;形成对博弈结果的判断..划线法和箭头法的结果是一致的;可以相互替代..三:混合策略Mixed Strategies 纳什均衡3.1定义:混合策略的定义:在博弈G={N; Si; ui; i∈N}中;假设参与人i的纯策略构成的策略集合为Si={si1;…; sik};若参与人i 以概率分布pi=pi1;…; pik 在其k 个可选策略中随机选择“策略”;称这样的选择方式为混合策略..这里;0≤pij ≤ 1;对于j=1 ;…; k 都成立;且有; pi1+…+ pik=1..纯策略可看成特殊的混合策略..上述定义是在有限博弈前提下进行的..3.2混合策略意义下策略组合的表述{x1∈X1; …; xn∈Xn};其中Xi ; i =1; …; n表示参与人i所有纯策略生成的概率空间;xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{1/2; 1/2;1/2; 1/2}3.3VNM效用函数Von Neumann and Morgenstern冯·诺依曼和摩根斯坦如果某个随机变量X以概率Pi 取值xi;i=1;2;…;n;而某人在确定地得到xi时的效用为uxi;那么;该随机变量给他的效用便是: UX =P1ux1 + P2ux2 + ... + Pnuxn表示关于随机变量X的期望效用..因此UX称为期望效用函数;又叫做冯·诺依曼——摩根斯坦效用函数VNM函数..3.4基于混合策略意义下的博弈策略式表述定义:基于v-N-M效用的策略式博弈由 a、参与人集合 b、每个参与人有一个纯策略集合 c、对于每一个参与人来说;由所有参与人纯策略组合构成的风险结果空间;存在一个v-N-M效用3.5混合策略意义下的纳什均衡定义:对于博弈G= {N; Si; ui; i∈N};基于v-N-M效用的混合策略组合α是一个纳什均衡;若对于每一个i; 以及i的任意一个混合策略αi;α对应的期望支付至少和αi;α-i 的期望支付一样大换句话说;称混合策略组合α是一个纳什均衡;如果没有一个参与人通过偏离策略αi 实现支付的增加3.6一个定理对于N-人静态博弈问题;设混合策略纳什均衡对应的策略组合为Xi ; X –i ..对于任意的i ;若最优混合策略为Xi= {x1;…;xl;0…0}不失一般性;假设前l个分量严格大于0;记分量xk k=1;…; l 对应的纯策略sk;则对于参与人i而言;sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值;等于纳什均衡混合策略组合 Xi; X –i 的收益值..即ui sk; X –i = ui Xi; X –i 成立 ; k=1;…; l3.7方法:a、求解混合策略均衡可以用期望收益等值法b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡四:多重纳什均衡解及其分析4.1 帕雷托占优均衡帕雷托占优均衡的含义是:在多个纳什均衡中;若存在一个纳什均衡;其支付结果针对每个参与人而言都严格优于其它纳什均衡;则该纳什均衡是帕雷托占优纳什均衡..4.2风险占优均衡risk-dominant equilibrium参与人对风险占优均衡的选择倾向;有一种强化的机制..当部分或所有参与人选择风险占优均衡的可能性增强的时候;任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小;而这又使得帕雷托占优均衡策略的支付更小;从而形成一种选择风险占优均衡策略的正反馈机制;并使其出现的概率越来越大..当参与人数目增加时;选择合作的风险将会更大;可借助该点考虑招标机制如何减少投标方勾结问题..上述问题是我们知道建立诚信机制社会的重要意义..上述问题引出一个博弈相关分支为协调博弈coordination game4.3聚点均衡由实际问题抽象出来的博弈模型中;更多的一类问题是:多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系;如夫妻爱好问题的两个纯策略均衡..这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例;在实际中往往二人很默契地知道如何进行博弈;双方往往知道怎么进行选择策略;且能够相互了解这里面排除了互相协商后达成的一致实际博弈中参与人往往会利用博弈模型以外的信息;实现对特定博弈均衡一致关注的“聚点”这些信息如:参与人共同的文化背景或规范;共同的知识;具有特定意义事物的特征;某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性;但因为涉及因素太多;对于一般博弈模型很难总结普遍规律;只能具体问题具体分析聚点:人们通常会协调彼此的行为..你弱他就强;先例产生的影响远大于逻辑或者法律效力;人们总是乐于安守现状或接受自然形成的界线三八线4.4相关均衡correlated equilibrium实际上;在现实中遇到选择困难时;特别是在长期中反复遇到相似选择难题时;常会通过收集更多信息;形成特定的机制和规则;为某种形式的制度安排等主动寻找思路..相关均衡就是这样的一种均衡选择机制..对于实际中比较复杂的博弈问题;参与人是否有能力设计这种机制;并且有足够能力理解、信任这种机制;是有一定疑问的..相关均衡作为社会经济制度创新的一种解释也许更有意义..4.5防共谋均衡coalition-proof equilibrium 定义:如果一个博弈的某个策略组合满足a、没有任何单个参与人的“串通”会改变博弈的结果;即单独改变策略无利可图该策略组合是纳什均衡..b、给定选择偏离的参与人有再次偏离的自由时;没有任何两个参与人通过“串通”改变博弈的结果..c、依此类推;直到所有参与人都参加的串通也不会改变博弈的结果..满足上述要求的均衡策略组合称为“防共谋均衡”在有多个参与人的博弈中;若部分参与人通过某种形式的默契或串通形成小团体;可能得到比不串通个大的支付..这就是多人博弈的共谋问题..防共谋均衡是指这样的一个纳什均衡;在该均衡局势下;少数参与人集合不能通过均衡策略的偏离;实现更好的局部利益..防共谋均衡是两个以上参与人参加的博弈中;参与人在帕雷托占优均衡中进行合作思想的扩展..五:动态博弈5.1特点一类博弈行为通常需要参与人多步决策才能完成;具有明显的阶段性..博弈的结局、各参与人的收益由多阶段决策结果确定..各参与人的决策有一定的顺序..由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性;通常用扩展式extensive form表述法描述这些信息..5.2博弈的扩展式表示参与人集合:i=1; … ;N..用N表示虚拟参与人“自然”;自然的含义是某些外生的客观概率分布事件参与人的行动顺序the orderof moves:描述各参与人在什么时候行动;参与人的行动空间actionset:在每次行动时;参与人可选择的行动集合;参与人的信息集information set:每次行动时参与人知道什么;参与人的收益函数:在行动结束之后;每个参与人得到些什么..自然选择的概率分布假定自然状态是共同知识..对于有限博弈;博弈树是常用的表述方式..5.3博弈树a若动态博弈是有限博弈;则可用博弈树表示该博弈..这里有限的含义是:各阶段各参与人的行动数目有限;博弈的阶段数有限..b博弈树的基本结构为结点nodes..包括决策结及终点结..决策结是参与人采取行动的时点;终点结是博弈行动路径的终点..枝branches..从一个决策结到它的直接后续结的连线;每一个枝代表参与人的一个行动选择..信息集..是决策结集合的一个子集..将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集..注:每个决策结都是同一个参与人的决策结..该参与人知道博弈进入该集合的某个决策结;但不知道自己究竟出于哪一个决策结若该信息集有两个或两个以上元素..5.4对于有限动态博弈;若参与人对彼此在各决策结点的行动集合;彼此的效用函数;历史的行动有着完全的了解;则称这样的博弈为完全信息动态博弈..如果博弈树的所有信息集都是单元素集;称该博弈为完美信息博弈game of perfectinformation..上述两个定义的差别在于对自然行动信息的描述..5.5动态博弈的策略式表述a相机选择contingent play动态博弈中参与人的策略是各自预先设定的;在博弈的各阶段;针对各种情况做出相应决策..即“等待”博弈到达自己的信息集包含一个或多个决策结后再决定如何行动..在策略式表述博弈中;参与人似乎是博弈开始之前就制定出了一个完全的相机选择;即“如果……发生;我将选择……”..b从扩展式表述构造战略式表述若把B的信息集从左到右排列;上述四个纯策略可以简单记为{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}..上面四个纯策略含义:当A选择开发时;B选择大括号中前面的策略;当A选择不开发时;B选择大括号中后面的策略..B的纯策略为:{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}A的纯策略为:SA=开发;不开发于是可以写成策略式表述形式;为开发;开发开发;不开发不开发;开发不开发;不开发开发-3;-3-3;-31;01;0不开发0;10;00;10;0在扩展式表述博弈中;所有n个参与人的一个纯战略组合s=s1;…;sn决定了博弈树上的一个路径..比如开发;{不开发;开发}决定了博弈的路径为A 开发 B 不开发1;05.6完全信息动态博弈纳什均衡存在性定理如果有限博弈是完美信息博弈;他还有一个纯战略纳什均衡Zermelo;1913..5.7逆向归纳法:a逆向归纳法求解策略:从动态博弈的最后一个阶段出发;对该参与人采用经济理性原则进行分析;逐步到推回前一个阶段相应参与人的行动选择;一直到第一阶段的分析方法..b逆向归纳法是求解完美信息动态博弈的经典方法..逆推归纳法是完美信息动态博弈分析中使用最普遍的方法..c与策略式分析比较:如果A选择U;那么B的信息集不能达到;我们说B的信息集不在均衡路径上out-of-equilibrium path.. 此种情况下;B的选择对A没有什么影响..因此;纳什均衡对一个参与人在非均衡信息集上的选择没有限制..但是;一个参与人在非均衡信息集上的战略可以影响其他参与人在均衡信息集上的选择..d逆向归纳法实质上是重复剔除劣战略法在扩展式博弈中的应用..逆向归纳法适不用于无限博弈和不完美信息博弈..逆向归纳法剔除了“非理性”的均衡策略5.8子博弈完美均衡子博弈精炼纳什均衡①子博弈概念:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结Tx组成;它满足下列条件:x是一个单结信息集;即hx={x};对于所有的Tx中的x’;如果x’’与x’同属于一个信息集;则x’’也在Tx中..需要说明的是;G本身是自己的一个子博弈..②子博弈完美纳什均衡子博弈精炼纳什均衡扩展式博弈的一个战略组合s=s1;…;s i;…;s n是一个子博弈完美纳什均衡;如果它是原博弈的纳什均衡..它在每一个子博弈上都是纳什均衡③纳什均衡与子博弈精炼纳什均衡的关系前面分析说明;一个特定的纳什均衡决定了原博弈树上唯一的一条路径;这条路径称为“均衡路径”equilibrium path..相对该纳什均衡;其他路径称为非均衡路径out-of-equilibrium path..在每一个子博弈上给出纳什均衡意味着;构成子博弈纳什均衡的战略不仅在均衡路径的决策结上是最优的;同时在非均衡路径的决策结上也是最优的..对于有限完美信息博弈;前面介绍的逆推归纳法得出的纳什均衡即是子博弈精炼纳什均衡..六多阶段静态博弈6.1该类模型中至少在某个阶段参与人同时选择其决策..这类模型实质上就是完美信息动态博弈;因此仍然可以采用逆推归纳法进行分析..因为存在同时选择;因此每个阶段不再是单人优化问题;而是一个静态博弈..6.2前向归纳法:前面已经说明;完美信息动态博弈的经典求解方法为逆序归纳法..还有一种分析方式;就是前向归纳法forward induction..前向归纳法由科尔博格和莫顿斯1986提出..这里不进行严格的数学描述;仅通过一个例题进行说明..6.3重复博弈重复博弈repeated game的定义指同样结构的博弈重复多次;其中的每次博弈称为“阶段博弈stage game”..如两个多次犯罪的“囚徒问题”..由于动态博弈是相机行动;反映到重复博弈中;就是可以使自己在某个阶段的博弈选择依赖于其他参与人过去的行动历史..影响重复博弈均衡结果的主要因素是博弈重复次数和信息的完备性completeness..重复次数对参与人可能会有的影响是:参与人为了获得长远利益而牺牲眼前利益的策略成为可能..关于完备性;简单地说;但一个参与人的支付函数不为其他参与人所知时;该参与人可能有积极性建立一个“好”的声誉reputation以换取长远利益..在社会行为中;经常可以看到本质不好的人在相当长的时期内干好事的原因..定理:令G是阶段博弈;GT是G重复T次的重复博弈T<∞..那么;如果G有唯一的纳什均衡;重复博弈GT的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次即每个阶段博弈出现的都是一次性博弈的均衡结果..上述定理说明;只要博弈的重复次数是有限的;重复本身并不改变囚徒困境的均衡结果..上述定理中“唯一性”是一个重要条件..如果纳什均衡不是唯一的;上述结论就不一定成立..当博弈有多个纳什均衡时;参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为..(七)不完全信息静态博弈不完全信息静态贝叶斯博弈贝叶斯纳什均衡海萨尼转换拍卖理论八合作博弈可传递效用 transferableutility合作博弈的特征函数合作的分配可行分配核心的定义 Shapley 值。
博弈论笔记
博弈论1.在一场博弈中,你必须考虑对方的选择,以确定你自己的最优选择,而对方也必须考虑你的选择来确定他的最优选择。
2.赢利:在博弈中所得到的。
3.博弈最本质的特征:行动及相互影响又相互依赖。
4.博弈:所谓博弈,就是策略性的互动决策。
5.弱者努力去维持一个稳定的三角结构,即于次强者联盟,但却不愿意消灭真正的强者。
6.既然是兔死狗烹,那么最好的策略就是不要让兔子全死掉。
7.博弈论的应用领域:信息经济学,其基本模型是逆向选择和信息甄别。
8.显性歧视,即根据外在特征进行歧视。
9.一个博弈至少包括三个要素:局中人,局中人可选的行动,局中人的盈利。
10.应当随时考虑别人的利益,条件是不这样做自己的利益就会受到损害。
11.优势策略与劣势策略。
如果两个人都选择其优势策略而达到的均衡称为优势策略纳什均衡。
12.搭便车行为的产生很大程度上与缺乏产权界定或产权配置的无效率有关。
13.纳什均衡:在该状态下每个参与人所采取的策略都是对于其他参与人的策略的最优反应。
14.最优反应:给定对手选定一个策略,则我选择一个策略比选择其他策略都要好。
15.相关均衡;如果博弈的参与人可以根据某个共同观测到的信号采取行动,就可能出现相关均衡。
16.分析许冠博弈的一个重要思路:向前展望,向后推理,即面向未来,思考现在,站在未来的立场上来确定现在的最优行动。
17.所谓均衡路径,即指在每一个决策阶段,没有人会偏离这条路径。
这条路径所代表的策略均衡被称作子博弈完美均衡。
18.逆向归纳的步骤:首先,从最后阶段行动的参与人决策开始考虑。
然后,考虑次后阶段行动的人。
19.博弈中,威胁和承诺是否可信,不应听对手说了什么,而应看他做了什么。
20.。
博弈论基础复习
《博弈论基础》主要知识点一、名词解释(5×2=10分)策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。
纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合.混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。
扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具.博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。
博弈树类似于状态图和问题求解搜索中使用的搜索树.完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。
子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈. 行为策略是指每一个参与人在每一个信息集上随机的选择行动.逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。
在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。
冷酷策略又称触发策略。
指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作.类型:一般地,将一个参与人所拥有的所有私人信息称为他的类型。
信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。
分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。
混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。
特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。
联盟二、选择题(5×2=10分)三、简答题(28—30分)1.博弈的分类及相关概念.合作博弈:强调效率、公正、公平非合作博弈:博弈论的主要研究对象,强调在互动假设下的个人理性、个人最优决策从信息角度看,博弈可分为:完全信息博弈:指局中人对于自己以及其他局中人的策略空间、盈利函数等知识有完全的了解。
博弈论重点——精选推荐
博弈论重点⼀、名词解释1接相互作⽤时候的决策以及这种决策的均衡问题。
3占优均衡— 重复剔除占优均衡— 纯战略纳什均衡 —混合战略纳什均衡4⼀致性 : 均衡原则利益最⼤化原则不⼀致性 : 信息不完全个体理性与集体理性不完全⼀致5完全信息静态博弈-纳什均衡 (纯策略纳什均衡混合策略纳什均衡)完全信息动态博弈(序贯博弈重复博弈)⼦博弈精炼纳什均衡不完全信息静态博弈-贝叶斯纳什均衡不完全信息动态博弈-精练贝叶斯纳什均衡 6、⾮合作博弈的基本分类根据出招顺序分为:静态博弈和动态博弈。
根据局中⼈信息的掌握情况分为(不)完全信息博弈共同信息(不)完美信息博弈。
历史信息7、静态博弈:同时决策或者同时⾏动的博弈属于静态博弈 —⽥忌赛马、猜硬币、古诺模型8、动态博弈:先后或序贯决策或者⾏动的博弈属于动态博弈 —弈棋、市场进⼊、领导——追随型市场结构 9、共同知识:各种对局情况下每个⼈的得益是多少是所有局中⼈的共同知识10、完美信息博弈:如果在博弈进⾏过程中的每⼀时刻,⾯临决策或者⾏动的参与⼈,对于博弈进⾏到这个时刻为⽌所有参与⼈曾经采取的决策或者⾏动完全清楚,则称为完美信息博弈11、完全信息静态博弈即各局中⼈同时决策,且所有局中⼈对各⽅得益都了解的博弈。
完全信息静态博弈的⼏点特性同时出招,出招⼀次;知道博弈结构与游戏规则(共同知识);不管是否沟通过,⽆法做出有约束⼒的承诺(⾮合作)博弈分析的⽬的是预测均衡结果 12、⾮合作博弈的其他分类根据局中⼈数量分单⼈博弈、两⼈博弈、多⼈博弈等。
根据博弈中的策略分为:有限博弈、和⽆限博弈。
根据得益分为:零和博弈、常和博弈、变和博弈。
13、零和博弈:如果⼀个博弈在所有各种对局下全体参与⼈之得益总和总是保持为零,这个博弈就叫零和博弈;零和博弈是利益对抗程度最⾼的博弈14、⾮零和博弈:如果⼀个博弈在所有各种对局下全体参与⼈之得益总和不总是保持为零,这个博弈就叫⾮零和博弈。
15、常和博弈:如果⼀个博弈在所有各种对局下全体参与⼈之得益总和总是保持为⼀个常数,这个博弈就叫常和博弈;常和博弈也是利益对抗程度最⾼的博弈16、⾮常和博弈:如果⼀个博弈在所有各种对局下全体参与⼈之得益总和不总是保持为⼀个常数,这个博弈就叫⾮常和博弈17、有限博弈:每个博弈⽅的策略数都是有限的。
博弈论,笔记
第一章导论
1.博弈是指决策主体在相互对抗中,对抗的双方或多方相互依存的一系列的策略和行
动的过程集合。
2.博弈论是指专门研究博弈如何出现均衡的规律的学科。
3.经济学研究离不开四个重要范畴:决策主体、行为、制度结构和均衡。
4.市场失灵五个方面:
1)非完全竞争
2)外在性
3)公共产品
4)逆向选择问题
5)道德风险
5.个体理性导致的是整体的非理性。
6.博弈的四个要素:
1)参与者
2)博弈的规则
3)结果
4)收益
第一部静态博弈
第二章完全信息静态博弈
1.完全信息静态博弈游戏的三大要素:
1)参加博弈有哪些”人”
2)每一个参与者的可用策略
3)收益函数
2.博弈最后的结果最可能是一种均衡状态。
3.如果一个博弈中所有的参与者都存在严格优策略,那么严格优策略一定是该博弈的
唯一均衡解。
4.纳什定理:
1)混合策略纳什均衡:在纯策略下,纳什均衡的核心是每一个参与者所选择的策略
均为对手的最有反应策略
2)纯策略是混合策略的退化,纯策略集合是混合策略集合的真子集。
第三章非完全信息静态博弈
1.在贝叶斯静态博弈中,参与者的策略是类型的函数,类型不同采取的行动也不同。
2.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈是人们的行为之间的交互作用博弈论的含义博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。
策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动是指,每个人要根据其他人的可能反应来决定自己的决策和行动。
在所有社会,人们经常互动。
有时,互动是合作,其他的时候,互动是竞争。
在这两种情况下,都可以用一个术语,即相互依赖性来表示一个人的行为对另外一个人的福利造成的影响。
相互依赖的情形可称为策略环境。
因为人们为了确定所采取的最优行动,必须考虑他周围的其他人会怎样选择行动。
策略对于社会的运行来说,是非常基本的。
我们要学会了解在策略环境下,人们实际上是如何采取行动的,以及他们应该怎样采取行动。
这种系统的研究形成了策略互动的理论。
博弈论三要素:博弈的三个基本要素三个基本要素,即参与人、参与人的策略和参与人的支付。
所谓参与人(或称局中人),就是在博弈中进行决策的个体;所谓参与人的策略,指的是一项规则,根据该规则,参与人在博弈的每一时点上选择如何行动;所谓参与人的支付是指,在所有参与人都选择了各自的策略且博弈已经完成之后,参与人获得的效用(或期望效用)。
3.博弈的简单分类根据参与人的数量,可以分为二人博弈和多人博弈;根据参与人的支付情况,可分为零和博弈和非零和博弈;根据参与人拥有的策略的数量多少,可分为有限博弈和无限博弈;根据参与人在实施策略上是否有时间的先后,可分为同时博弈和序贯博弈。
一些概念:局中人或参与者(Players)规则(rules):规定博弈各方的行动顺序、方式、以及最终的结果等。
策略(Strategy):一整套的行动方案,规定了各种情况下的行动。
比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。
相机策略(contingent strategy):仅在不确定事件发生时才会采取的策略。
如:人不犯我,我不犯人;人若犯我,我必犯人。
行动:局中人在特定条件下的行为支付( Pay-off ):博弈结束时,各方得到的收益。
策略均衡:参与者之间稳定的、可预测的互动行为模式,就是策略均衡。
上策均衡与纳什均衡上策均衡:我所做的是不管你做什么我所能做的最好的你所做的是不管我做什么你所能做的最好的所谓上策,是指这样一种策略,即不管对手采取什么策略,这种策略都是最优的。
而当对局者选择的都是上策的时候,这种均衡叫做上策均衡。
NASH均衡:我所做的是给定你所做的我所能做的最好的你所做的是给定我所做的你所能做的最好的纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。
在一个纳什均衡里,任何一个参与者都不会改变自己的策略,如果其他参与者不改变策略。
的判别式A 是))(1()(其中,)()()])(1()([)-1()-1()-1()-1(2212121111222221112222211221212111112211211112111111A A q A A q A A A A q A p A A A q A A q A A q p A q p A q p A q p A q p E A --+-=∆+-+∆=+-+--+-=+++=上策均衡与纳什均衡的区别:⑴ 上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。
⑵ 纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。
⑶ 上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策均衡。
求纯策略博弈的纳什均衡街解的方法混合策略均衡的情侣博弈,根据支付矩阵计算出博弈双方的期望得益 分析该博弈的纳什均衡的概率分布 寻找混合策略纳什均衡的思路令各博弈方随机选择纯策略的概率分布,满足使其他博弈方采用不同策略的期望得益相同,从而计算出各个博弈方随机选择各纯策略的概率。
在猜硬币博弈中,设盖硬币方出正面的概率为p ,出反面的概率为1-p 。
则猜硬币方猜正面的期望得益为p ·1+(1-p )·(-1)=2p-1,猜反面的期望得益是p ·(-1)+(1-p) ·1=1-2p,令二者相等,得p=1/2。
盖硬币方的混合策略是以(1/2,1/2)的概率随机选择正面和反面。
类似的,可以计算出猜硬币方的混合策略。
.期望支付运用两个参与人的混合策略组合,可以分别表示出两个参与人得到的支付。
博弈树1.博弈树的起点“起点”又叫做“初始决策点”,通常只有一个。
起点是博弈树的“根”,是序贯博弈开始的地方,是博弈的最先行动者进行决策的地方。
2.博弈树的线段从初始决策点出发,向右伸展两条线段,分别表示竞争者可以采取的两个行动或策略。
3.博弈树的中间点中间点又叫做“中间决策点”,通常至少应有两个。
通常在这些中间决策点的旁边标上另一参与人,表示中间点是另一参与人做决策的地方。
博弈树的终点第一,终点不是决策点 终点是博弈结束的地方。
与起点和中间点不同,终点不是决策点:既不是初始决策点,也不是中间决策点。
因此,终点不属于任何的参与人,终点的旁边没有标注任何的参与人。
第二,终点的两层含义一是代表博弈的一个策略组合——从起点开始导向某个终点的所有线段按先后秩序排列的一个组的判别式B 是))(1()(其中,)()()])(1()([)-1()-1()-1()-1(2212121111222221112222211221212111112211211112111111B B q B B q B B B B q B p B B B q B B q B B q p B q p B q p B q p B q p E B --+-=∆+-+∆=+-+--+-=+++=合。
二是代表与某一个策略组合相对应的一个支付组合——在每一个终点的旁边,有一对用圆括号围住的数字,其中的第一个数字是先行动者的支付,第二个数字是后行动者的支付。
逆向归纳法求解子博弈的精炼纳什均衡解逆向归纳法的两个步骤第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈;第二步,再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。
这个最简博弈,就是原博弈的解。
举例情侣博弈简化之后女方的选择完全由男方的选择所决定:男(足)-女(足);男(芭)-女(芭)男方的最优策略是选足球,女也选足球,即最优策略组合为(足球,足球)。
逆向归纳策略总是纳什均衡,纳什均衡不一定是逆向归纳均衡。
先动优势从情侣博弈的例子中可以看到所谓的“先动优势”——先行动者的得益大于后行动者的得益。
如男方先动,逆向归纳的结果就是对男方更有利的纳什均衡(足球,足球);如改为女方先动,则逆向归纳的结果就是对女方更有利的纳什均衡(芭蕾,芭蕾)。
该混合策略纳什均衡给丽娟带来的期望得益是:(1-p)•θ•1+p•θ•0+(1-p) •(1-θ)•(-1)+p•(1- θ) •2=0.5给大海带来的期望得益是:(1-p)•θ•2+p•θ•0+(1-p) •(1-θ)•(-1)+p•(1- θ) •1=0.5丽娟p为丽娟选择芭蕾的概率足芭蕾2,10,0-1,-11,2逆向递归法逻辑基础:动态博弈中先行动的博弈方,在前面阶段选择行为时必然会考虑后行为博弈方在后面阶段的选择,只有在博弈最后一个阶段选择的博弈方才能直接作出明确选择。
而当后面阶段博弈方的选择确定后,前一阶段博弈方的行为也就容易确定了。
一般方法:从动态博弈的最后一个阶段开始分析,每一次确定出所分析阶段博弈方的选择和路径,然后再确定前一个阶段博弈方的选择和路径,逐步向前逆推以求解出动态博弈均衡。
子博弈定义:由一个单结信息集开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。
子博弈精炼纳什均衡定义:如果在一个完全信息动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个子博弈精炼纳什均衡。
幻灯片26以法律保障不足的开金矿博弈为例●策略组合“乙在第一阶段选择‘借’,第三阶段选择‘打’;甲在第二阶段选择‘分’”,即{(借,打),(分)},虽然是整个博弈的一个纳什均衡,但这个策略组合中乙的策略要求乙在第三阶段的子博弈中选择的“打”,不是该子博弈的一个纳什均衡,因此这个策略组合不是子博弈精炼纳什均衡。
●而策略组合{(不借,不打),(不分)}则是该博弈的子博弈精炼纳什均衡。
因为该策略组合的双方策略不仅在整个博弈中构成纳什均衡,而且在两级子博弈中也都构成纳什均衡(从而不存在任何不可信的威胁或承诺)。
●注意:当博弈方按上述子博弈精炼纳什均衡策略组合行动时,实际上不会进行到博弈的第二、三阶段,两博弈方在第二、三阶段的行为实际上不会发生。
但作为完整策略的表达,在描述子博弈精炼纳什均衡的策略选择时,必须将其给出。
幻灯片28三、子博弈精炼纳什均衡求解方法●逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。
●完全信息动态博弈的每一个决策结都是一个单独的信息集,每一个决策结都开始一个子博弈。
这样,可以从最后一个子博弈开始(即从最后一个决策结开始)逆推上去,求解子博弈精炼纳什均衡。
幻灯片30四、承诺行动与子博弈精炼纳什均衡●前面已知,有些纳什均衡之所以不是精炼均衡,是因为它们包含了不可信威胁。
这也意味着,如果参与人能在博弈之前采取某种措施改变自己的行动空间或支付函数,原来不可信的威胁就可能变得可信,博弈的均衡就会相应改变。
将这些为改变博弈结果而采取的措施称为“承诺行动”。
●在许多情况下,承诺行动对当事人是很有价值的。
特别的,有时一个参与人通过减少自己的选择机会使自己受益,原因在于保证自己不选择某些行动可以改变对手的最优选择。