(完整word版)博弈论知识点总结,.docx

合集下载

《博弈论》知识点总结

《博弈论》知识点总结博弈论作为一门交叉学科，涵盖了数学、经济学、政治学、心理学等多个学科领域。

其研究对象包括零和博弈、非零和博弈、合作博弈、序贯博弈等。

博弈论的应用领域也非常广泛，包括经济学、政治学、社会学、管理学等。

博弈论在求解决策问题、预测市场行为、推导策略和解释社会现象等方面有着广泛的应用。

博弈论的主要内容包括：1.博弈的定义博弈是指互相影响的参与者所进行的一种决策活动。

在博弈中，每个参与者都要做出一个选择，其结果受到其他参与者的选择的影响。

博弈的结果取决于所有参与者的选择。

2.博弈的基本元素博弈的基本元素包括参与者、策略和结果。

参与者是进行决策的主体，策略是参与者可以选择的行为方式，结果是参与者选择策略后所得到的收益或损失。

3.博弈的分类根据参与者的利益关系和决策方式，博弈可以分为零和博弈和非零和博弈。

零和博弈指参与者的利益完全相反，一方获利即意味着另一方损失，而非零和博弈则指参与者的利益可能存在重叠或者是共同合作的情况。

4.博弈的解博弈的解是指在博弈参与者做出决策选择之后，通过某种机制确定最终的结果。

常见的博弈解包括纳什均衡、霍夫达均衡、帕累托最优等。

5.博弈论的应用博弈论在经济学、政治学、社会学等领域有着广泛的应用。

在经济学中，博弈论可以用来解释市场行为、预测价格变动等。

在政治学中，博弈论可以用来分析政治决策、议事程序等。

在社会学中，博弈论可以用来解释群体行为、合作问题等。

博弈论是一门具有重要理论意义和广泛应用价值的学科，它不仅可以帮助人们更好地理解决策制定的规律和机制，还可以为人们提供更科学的决策指导。

在日常生活中，我们可以通过学习和应用博弈论的知识，更加理性地做出决策，并更好地理解他人的选择和行为。

希望未来博弈论能够继续在各个领域发挥作用，为人类社会的进步和发展做出更大的贡献。

博弈论知识点总结

博弈论知识点总结博弈论知识总结博弈论概述：1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论研究的假设：1、决策主体是理性的，最大化自己的收益。

2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。

行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。

信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。

1、2、既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。

但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。

4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。

战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

1、参与人集合：2、每位参与人非空的战略集 S i3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。

与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程{1,2,...,}n Γ=11(,...,,...,)ni i n i s s s s ==∏中遇到决策问题时序列结构的分析。

包含要素： 1、参与人集合 2、参与人的行动顺序，即每个参与人在何时行动； 3、序列结构：每个参与人行动时面临的决策问题，包括参与人行动时可供选择的行动方案、所了解的信息； 4、参与人的支付函数。

比较：1、战略式博弈从本质上来讲是一种静态模型。

2、扩展式博弈从本质上来讲是一种动态模型。

博弈论总结

博弈论总结博弈论是一门研究决策和策略在竞争环境下的科学，它不仅仅应用于经济学领域，还渗透到了生活的方方面面。

通过分析不同参与者的利益和行动，博弈论揭示了决策者之间的相互关系和可能的结果。

一、基本概念博弈论中的基本概念包括参与者、策略、收益和均衡。

参与者是决策的主体，可以是个人、组织或国家。

策略是参与者根据自身利益选择的行动方式。

收益是参与者在特定策略下获得的结果，可以是利润、权力或其他形式的回报。

博弈论研究的重点是均衡，即在参与者做出决策后，没有动力再次改变策略，这是一种稳定的状态。

二、博弈类型在博弈论中，存在多种不同的博弈类型，其中最经典的是零和博弈和非零和博弈。

零和博弈是指参与者的利益互为对立，一个人的收益必然导致另一个人的损失。

这种博弈策略是零和博弈中的核心，参与者通过优化自身利益来获取最大化的收益。

经典的例子是赌场中的赌博游戏，赌徒之间的输赢是相互抵消的，没有合作的可能。

非零和博弈则将参与者的利益看作是互补的，不同决策者之间可以通过合作或竞争来达到共同的目标。

例如，在商业竞争中，公司之间的合作可以达到双赢的局面，而过度竞争则可能导致市场的破坏。

三、重要理论博弈论涉及了许多重要的理论和策略，其中最著名的是纳什均衡和最优响应。

纳什均衡是博弈论中的重要概念，指的是在参与者做出最优决策的情况下，没有动力再次改变策略。

纳什均衡强调了个体的最佳策略选择，每个参与者都基于其他参与者的行动来做出自己的决策。

最优响应则指的是参与者在其他参与者的选择之后，做出的对自身利益最有利的策略。

这种策略可以是合作的也可以是竞争的，取决于参与者的利益和目标。

四、博弈论的应用博弈论不仅在经济学领域有广泛的应用，还渗透到了生活的各个方面。

在商业中，博弈论可以帮助企业制定市场定价和竞争策略。

通过分析竞争对手的行动，企业可以找到最优的策略以提高自身的竞争力。

在个人生活中，博弈论可以帮助我们理解和处理人际关系。

无论是在家庭、友谊还是爱情关系中，博弈论的概念都可以帮助我们更好地理解彼此行为的动机，并寻求互惠互利的解决方案。

博弈论知识简要

寻找混合策略纳什均衡的思路
• 令各博弈方随机选择纯策略的概率分布，满足使其他博弈方采用不同策略的期望得益相同，从而计算出各个博弈方随机选择各纯策略的概率。
• 在猜硬币博弈中，设盖硬币方出正面的概率为p，出反面的概率为1-p。则猜硬币方猜正面的期望得益为p·1+（1-p）·(-1)=2p-1，猜反面的期望得益是p·(-1)+(1-p) ·1=1-2p,令二者相等，得p=1/2。盖硬币方的混合策略是以（1/2,1/2）的概率随机选择正面和反面。类似的，可以计算出猜硬币方的混合策略。
S
i

1,2,...
表示 Si 中的某个特定策略。在静态博弈中，Si 中包含
的所有
S
i
就是第
i 个参与人的所有可选择的行动；ui
是第 i 个参与人的得益函数，它是所有参与人选择的
某个特定策略组合的函数，即
ui
ui
S1
,...,
S
i
,...,
S
n
。
•例两寡头的产量博弈中，参与人就分别是编号为1和2的两个企业；其各自的策略选择就是选择各自的产量；其各自的策略空间就是其各自所能够生产的各种产量的集合。如果假设两个企业，都能够生产大于0的任何数量的产量，那
下选择什么行动的预先安排； • 行动：参与人在博弈过程中轮到自己选择时所作的某个具体决策； • 得益：参与人从博弈中获得的效用，一般是所有参与人的策略
或行动的函数，这是每个参与人最关心的东西；
• 信息：参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识；
• 均衡：所有参与人的最优策略或行动的组合；
精炼贝叶斯均衡泽尔腾等

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支，研究决策制度下的相互作用和决策策略。

它是通过数学模型来描述和分析不同参与者的决策行为和决策结果，并找到最优的决策策略。

下面是博弈论中的一些重要知识点的总结。

1.博弈的定义和基本概念：-博弈是指参与者在一定的规则下做出决策，并根据其他参与者的决策结果来确定自己的收益或损失。

-参与者称为博弈者，他们的决策称为策略，策略的组合称为策略组合。

-博弈可以是合作博弈或非合作博弈，合作博弈强调协作，非合作博弈强调竞争。

2.标准博弈：-标准博弈是博弈论中最基础的形式，参与者之间的策略和收益都是确定的。

-标准博弈可以是零和博弈（总收益为零）或非零和博弈（总收益不为零）。

3.纳什均衡：-纳什均衡是指在博弈中，不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。

-纳什均衡是博弈论中的核心概念，它描述了博弈中的稳定状态。

-一个博弈可能有一个或多个纳什均衡，也可能没有纳什均衡。

4.基本博弈：-二人零和博弈是一种特殊的博弈，其中一个参与者的利益是另一个参与者的损失。

-石头、剪刀、布是一个典型的二人零和博弈，存在一个纳什均衡策略。

-行棋游戏如国际象棋、围棋也是二人零和博弈，但策略空间较复杂。

5.博弈理论的扩展：-广义博弈是对博弈理论的扩展，考虑了更复杂的情况，如多人博弈、不完全信息博弈等。

-多人博弈是指博弈中有多个参与者，每个参与者都会影响其他参与者的决策。

-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。

6.博弈论在经济学中的应用：-博弈论在经济学中有广泛的应用，如市场竞争、拍卖等。

-例如，决定定价策略的厂商可以使用博弈论来确定最优的定价策略。

-拍卖是一种常见的博弈形式，在博弈过程中参与者可以选择不同的竞标策略。

7.演化博弈：-演化博弈是博弈论的一个重要分支，研究博弈在一定的演化过程中的演化规律。

-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要：博弈论是研究决策者之间相互影响和决策制定的数学分析工具。

本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳，以帮助读者更好地理解和应用博弈论的相关知识。

关键词：博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具，源自于经济学和数学两大学科的交叉。

博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。

本文将对博弈论的相关知识进行详细的总结和归纳。

一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。

博弈的基本要素包括：参与者、策略、收益和信息。

1.2 参与者参与者是指博弈中的决策者，可以是个人、团体、企业、国家等。

参与者的目标是实现自身利益的最大化。

1.3 策略策略是指参与者在博弈中所能采取的行动或选择。

通常分为纯策略和混合策略。

1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。

收益可以用来衡量参与者的利益大小。

1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。

信息可以分为对称信息和非对称信息。

二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后，没有动力再改变策略，从而达到一种稳定状态。

常见的均衡概念有纳什均衡、帕累托最优和博弈解。

2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择，使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对，没有动机再改变策略。

2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择，使得至少有一个参与者的收益达到最大，而其他参与者的收益至少不会减小。

帕累托最优是一种资源分配的有效方式。

2.4 博弈解博弈解是指在博弈中的一组策略选择，使得没参与者都没有动力再改变策略。

博弈解往往是均衡的特殊情况。

三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式，即参与者的利益总和为零。

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳博弈论是研究决策者之间相互作出决策时，通过考虑对方的行动和可能的结果来进行决策的一门学科。

它主要关注对策略的选择与分析，以及对方可能的反应。

下面我们来对博弈论的知识点进行总结归纳。

1.普通博弈和扩展博弈：博弈论分为两类，即普通博弈和扩展博弈。

普通博弈是指参与者在同一时间同时做出决策的博弈，扩展博弈是指参与者在不同的时间节点上做出决策的博弈。

2.博弈的组成要素：博弈论研究的关键要素包括博弈参与者、参与者的策略、参与者的支付、参与者的效用等。

博弈论的目标是通过合理的策略选择来实现最优的支付和效用。

3.纳什均衡：纳什均衡是博弈论中一个重要的概念，指的是当每个参与者都选择了最优的策略后，没有人会改变自己的策略来获得更好的支付。

纳什均衡是博弈的稳定状态。

4.博弈的分类：根据参与者的合作与否，博弈可以分为合作博弈和非合作博弈。

合作博弈中，参与者可以通过合作与其他参与者达成协议，而非合作博弈中，参与者彼此之间没有合作关系。

5.零和博弈和非零和博弈：零和博弈是指所有参与者的支付之和为零的博弈，即一方获利就意味着其他方会损失相应的支付。

非零和博弈是指所有参与者的支付之和不为零的博弈，即所有参与者都有可能获得一定的支付。

6.博弈的解析方法：解析方法是通过分析博弈的特性和参与者的策略来研究博弈的方法。

解析方法包括主要包括支配策略法、混合策略法、最佳反应函数等。

7.博弈的策略选择：博弈论研究的核心问题之一是参与者在博弈中如何选择最优的策略。

策略选择可以通过分析博弈的收益矩阵和参与者的目标来实现。

8.博弈的应用领域：博弈论的应用十分广泛，包括经济学、政治学、生物学、社会学等多个领域。

在经济学中，博弈论被用来研究市场竞争、价格形成等问题，在政治学中，博弈论被用来分析政治决策与合作等问题。

9.孤立型博弈和重复博弈：孤立型博弈是指只进行一轮博弈的情况，参与者只能根据当下的情况来做出决策。

重复博弈是指进行多轮博弈的情况，参与者可以根据之前的决策和结果来进行策略的调整。

博弈论复习..

36
1.1.7 博弈的主要方面〔要素〕
►博弈的挨次〔Orders〕：行为决策挨次，不同的博弈挨次产生的博弈结果可能会不同。 ►博弈方的得益〔Payoffs〕：对应于各博弈方的每一组的可能决策选择，都应当有一个结果表示该策略组合下各博弈方的所得或所失。“这些”所得所失就是博弈方的得益，也叫做“支付”。通常来说，一个博弈，最困难的地方就是确定各博弈方的得益。博弈的多样性也都是由得益的多样性产生的。
39
1.2.1 囚徒逆境
1.囚徒逆境的根本模型〔1〕囚徒逆境的根本模型是塔克 1950年提出的。〔2〕主题：个人理性与集体理性冲突。〔3〕囚徒逆境博弈的主要方面〔要素〕： ►局中人：两个共同作案的囚徒；囚徒1、囚徒2； ►策略集合：{坦白，不坦白}； ►博弈的挨次：双方同时选择策略； ►博弈方的得益：如下页得益〔支付〕矩阵中所示。
罗斯
沙普利 20
1.1.3 博弈论与诺贝尔经济学奖
2023年，来自法国图卢兹大学的法国教授让-梯假设尔 (Jean Tirole)因其对市场力气和管制的争论分析获得诺贝尔经济学奖。
梯假设
21
1.1.4 纳什的故事
《美丽心灵》
22
1.1.4 纳什的故事
1928年6月13日，约翰·福布斯·纳什〔John Forbes Nash〕诞生于美国西弗吉尼亚州〔美国较穷的州〕的布鲁菲尔德市。20岁，1948年9月入普林斯顿大学作争论生；22岁，1950年获数学博士学位，并留校任讲师一年。23岁，1951年到麻省理工学院任教，直到31岁，1959年因精神分裂症而离职。 66岁，1994年获诺贝尔经济学奖。
► 50年月，合作博弈论鼎盛时期，讨价还价模型 —纳什〔1950〕和夏普里〔1953〕，核的概念— 吉利斯和夏普里〔1953〕；

博弈论知识点总结完整版

博弈论（一）：基本知识1.1定义:博弈论，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。

即，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间的均衡。

1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数，是博弈最重要的基本要素。

1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。

两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议（binding agreement）。

倘若不能，则称非合作博弈（Non-cooperative game）。

合作博弈强调的是集体主义，团体理性，是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果有时有效率，有时则不然。

目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益的最大化，最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。

把两个角度结合就得到了4种博弈：a、完全信息静态博弈，纳什均衡，Nash(1950)b、完全信息动态博弈，子博弈精炼纳什均衡，泽尔腾（1965）c、不完全信息静态博弈，贝叶斯纳什均衡，海萨尼（1967-1968）d、不完全信息动态博弈，精炼贝叶斯纳什均衡，泽尔腾（1975）Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式：策略式表述(Strategic form), 扩展式表述（Extensive form）1.6占优均衡：a、占优策略：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。

完整版)博弈论知识点总结

完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。

该学科的研究假设包括：1）决策主体是理性的，会尽可能地最大化自己的收益；2）完全理性是共同知识；3）每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。

博弈中涉及到的变量包括：参与人、行动、战略和信息。

完全信息指每个参与人都了解其他参与人的支付函数，而完美信息则指在博弈过程中，每个参与人都能观察和记忆之前的行动选择。

不完全信息则表示参与人没有完全掌握其他参与人的信息，存在不确定性因素。

博弈与传统决策的区别在于，博弈是决策主体之间的相互作用，需要考虑其他决策者的选择和效用函数。

博弈的表示形式包括战略式博弈和扩展式博弈，其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题，而扩展式博弈则更适用于描述动态博弈问题。

与战略式博弈不同，扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析，而不是仅关注博弈结果的描述。

扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。

战略式博弈是一种静态模型，而扩展式博弈是一种动态模型。

博弈论可以分为合作博弈和非合作博弈，其中合作博强调团体理性、团体最优决策和效率，而非合作博弈强调个人理性和个人最优决策。

根据参与人行动先后顺序的不同，博弈可以分为静态博弈和动态博弈，后者包括先行动者获得先行动者行动信息的情况。

根据参与人对信息的掌握程度，博弈可以分为完全信息和不完全信息博弈。

根据决策主体对信息的掌握程度和行动的先后顺序，博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。

不同类型的博弈有不同的均衡类型和求解方法，顺序的不同也会影响均衡结果。

Hotelling价格竞争模型是一种重要的扩展式博弈，用于描述两个企业在同一市场上的价格竞争。

相对应。

占有均衡是指在博弈中存在一组参与人的战略选择，使得每个参与人都无法通过改变自己的战略来提高自己的支付。

博弈论知识点总结

博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论研究的假设:1、决策主体就是理性的,最大化自己的收益。

2、完全理性就是共同知识3、每个参与人被假定为可以对所处环境以及其她参与者的行为形成正确的信念与预期2、与博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。

行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也就是参与人行动的规则。

信息:参与人在博弈中的知识,尤其就是其她决策主体的战略、收益、类型(不完全信息)等的信息。

完全信息:每个参与人对其她参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。

不完全信息:参与人没有完全掌握其她参与人的特征、战略空间及支付函数等信息,即存在着有关其她参与人的不确定性因素。

支付:决策主体在博弈中的收益。

在博弈中支付就是所有决策主题所选择的行动的函数。

从经济学的角度讲,博弈就是决策主体之间的相互作用,因此与传统个人决策存在着区别:3、博弈论与传统决策的区别:1、传统微观经济学的个人决策就就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具就是无差异曲线。

可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。

2、其她消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入与偏好,不用考虑其她消费者的影响。

但就是在博弈论理个人效用函数还依赖于其她决策者的选择与效用函数。

4、博弈的表示形式:战略式博弈与扩展式博弈战略式博弈:就是博弈问题的一种规范性描述,有时亦称标准式博弈。

战略式博弈就是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈就是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

博弈论前四章笔记整理

博弈论前四章笔记整理第一章：博弈论基础概念。

- 博弈的定义与要素。

- 博弈是指在一定的规则下，多个参与者（至少两个）进行策略选择并得到相应结果（收益）的过程。

- 要素包括参与者（局中人）、策略（每个参与者可选择的行动方案）、收益（每个参与者在不同策略组合下的所得）。

例如在“囚徒困境”中，两个囚犯是参与者，坦白或不坦白是他们的策略，不同策略组合下的刑期长短就是收益。

- 博弈的分类。

- 按参与者数量可分为两人博弈和多人博弈。

- 按策略空间是否有限分为有限博弈和无限博弈。

如猜硬币是有限博弈（正面或反面两种策略），企业的产量竞争（产量可在一定范围内连续取值）可能是无限博弈。

- 按收益情况分为零和博弈（一方的收益就是另一方的损失，总和为零，如赌博）、常和博弈（收益总和为常数）和非零和博弈（收益总和不为零，如企业合作共同开拓市场，双方都可能获利）。

第二章：完全信息静态博弈。

- 策略式表述（标准式表述）- 通常用一个矩阵来表示，行代表一个参与者的策略，列代表另一个参与者的策略，矩阵中的元素是对应的收益组合。

以“性别战”为例，丈夫和妻子选择看电影或看球赛，就可以构建一个2×2的收益矩阵。

- 占优策略均衡。

- 占优策略是指无论其他参与者选择什么策略，该策略都是某个参与者的最优策略。

如果每个参与者都有占优策略，那么由这些占优策略组成的策略组合就是占优策略均衡。

例如在“囚徒困境”中，每个囚徒的占优策略都是坦白，所以（坦白，坦白）是占优策略均衡。

- 纳什均衡。

- 纳什均衡是指在一个策略组合中，每个参与者的策略都是对其他参与者策略的最优反应。

即给定其他参与者的策略，没有参与者有动机单方面改变自己的策略。

与占优策略均衡不同，纳什均衡并不要求每个参与者都有占优策略。

例如在“性别战”中，（看电影，看电影）和（看球赛，看球赛）都是纳什均衡。

第三章：完全信息动态博弈。

- 扩展式表述。

- 包括博弈树的构建，节点表示参与者的决策点，树枝表示可选择的策略，终端节点表示博弈的结果并标有相应的收益。

博弈论的复习资料word资料5页

名词解释：1，共同知识：是指所有当事人对该事件都知道，并且也所有当事人都知道其他当事人也知道这一事件，并且所有当事人都知道所有当事人都知道这一事件。

那么该事件就是共同知识。

2，先动优势：在序贯情侣博弈中，任何一方率先采取行动可能得到的好处，都比他或她后行动可能得到的好处大。

这种局中人先动得益大于后行得益的情况，叫做先动优势。

3，后动优势：后行动的得益比先行动的得益大的情况4，信息集：我们用一个扁椭圆形的虚线的圈，把所论局中人的若干决策节点罩起来，成为他的一个信息集。

•单点集：我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位，称为单点集。

•触发策略：即只要他的对手在博弈中一直采取合作策略，则该局中人也会在博弈中继续采取合作策略；但是，一旦对手在某一个阶段采取背叛策略，将会触发该局中人在往后的一段时期内采取不合作策略，甚至永远采取不合作策略，从而对对手实施惩罚。

•冷酷策略：双方一开始的时候选择合作，然后继续选择合作，直到有一方选择背叛，从此永远选择背叛。

即任何局中人的一次性不合作将触发永远不合作。

•礼尚往来策略：开始的时候和冷酷策略一样，即双方从合作开始，在以后的每个阶段，如果你的对手在最近的一次博弈中还是采取合作策略，则你继续跟他合作；如果你的对手在上一阶段的博弈中采取背叛策略，则你在下次的博弈中采取背叛策略惩罚他，但是如果你的对手在下一次博弈中改邪归正，采用合作策略，则你在下次继续博弈中还是跟他合作。

触发策略是带有奖励和惩罚措施的一种博弈机制。

在这个机制中，惩罚措施是其中的关键。

注意：（1），一个信息集罩住的必须是同一个局中人的决策点。

•必须是同一个局中人在同一个时点的决策节点。

同时，即使是同一个人在同一时点进行决策，也不一定构成一个信息集，他还必须满足：在每一个决策点他的行动选择集合必须是相同的。

因为局中人在做行动选择时并不知道自己位于哪个决策点，因此，他不可能做出不同的行动选择。

简答题：1,博弈的构成要素：•局中人决策主体，目的是通过选择行动（或策略）以最大化自己的支付（效用、得益）水平。

博弈论知识点总结完整版

博弈论一：基本知识1.1定义:博弈论;又称对策论;是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论;是研究竞争的逻辑和规律的数学分支..即;博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用;以及不同决策主体之间的均衡..1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数;是博弈最重要的基本要素..1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论..两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议binding agreement..倘若不能;则称非合作博弈Non-cooperative game..合作博弈强调的是集体主义;团体理性;是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大;强调个人理性、个人最优决策;其结果有时有效率;有时则不然..目前经济学家谈到博弈论主要指的是非合作博弈;也就是各方在给定的约束条件下如何追求各自利益的最大化;最后达到力量均衡..博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息;是否了解两个角度进行..把两个角度结合就得到了4种博弈：a、完全信息静态博弈;纳什均衡;Nash1950b、完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾1965c、不完全信息静态博弈;贝叶斯纳什均衡;海萨尼1967-1968d、不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾1975 Kreps; Wilson1982 Fudenberg; Tirole19911.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式：策略式表述 Strategic form; 扩展式表述Extensive form1.6占优均衡：a、占优策略：在博弈中如果不管其他参与人选择什么策略;一个参与人的某个策略给他带来的支付值始终高于其他策略;或至少不劣于其他策略;则称该策略为该参与人的严格占优策略或占优策略..对于所有的s-i; si称为参与人i的严格占优战略;如果满足：uisi;s-i>uisi';s-is-i; si' sib、占优均衡：一个博弈的某个策略组合中;如果对应的所有策略都是各参与人的占优策略;则称该策略组合为该博弈的一个占优均衡..1.7重复剔除严劣策略均衡：a、“严劣”和“弱劣”的含义：设 s i’和s i’’是参与人i可选择的两个策略;若对其他参与人的任意策略组合s-i; 均成立u i s i’; s-i < u i s i’’; s-i; 则说策略s i’严劣于策略s i’’ ..上面式子中;若将“<”改为“≤”;则说策略s i’弱劣于策略s i’’ ..b、定义：重复剔除严格策略就是各参与人在其各自策略集中;不断剔除严劣策略…如果最终各参与人仅剩下一个策略;则该策略组合就被称为重复剔除严劣策略均衡..二：纳什均衡Nash Equilibrium2.1纳什均衡定义：对于一个策略式表述的博弈G= {N;S i; u i; i ∈N}; 称策略组合s=s1; …s i; …; s n是一个纳什均衡;如果对于每一个i ∈N; s i是给定其他参与人选择s-i={s1; … ;s i-1; s i+1; … ;s n} 情况下参与人i的最优策略经济理性策略;即：u i s i; s-i≥ u i s i; s-i; 对于任意的s i∈S i ;任意的i∈N均成立..通俗定义：纳什均衡是一种策略组合;给定对手的策略;每个参与人选择自己的最优策略..纳什均衡是一种稳定的策略组合：当所有参与人的选择公开以后;每个人都满意自己作出了正确的选择；没有人能得到更好的结果了..在博弈论中这种结果被称为纳什均衡NE..2.2定理：Nash在1950年证明：任何有限博弈;都至少存在一个NE——Existence of Nash Equilibrium..即在一个有n个参与人的策略式博弈G={S1;…;Sn; u1;…;un}中;如果n是有限的;且Si是有限集i=1;…;n;则该博弈至少存在一个纳什均衡在混合策略意义下Wilson1971证明;几乎所有有限博弈;都存在有限奇数个NE;包括纯策略NE和混合策略NE..——Oddness Theorem2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理 a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡;但反过来不一定成立；定理 b 纳什均衡一定不能通过重复剔除严劣策略方法剔除..2.4划线法先找出自己针对其他博弈方每种策略或策略组合对多人博弈的最佳对策;即自己的可选策略中与其他博弈方的策略或策略组合配合;给自己带来最大得益的策略这种相对最佳策略总是存在的;不过不一定唯一;然后在此基础上;通过对其他博弈方策略选择的判断;包括对其他博弈方对自己策略判断的判断等;预测博弈的可能结果和确定自己的最优策略..这就是划线法..2.5箭头法箭头法对于理解博弈关系很有好处;是寻找相对稳定性策略组合的分析方法..对博弈中的每个策略组合进行分析;考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益..如能;则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组..最后综合对每个策略组合的分析情况;形成对博弈结果的判断..划线法和箭头法的结果是一致的;可以相互替代..三：混合策略Mixed Strategies 纳什均衡3.1定义：混合策略的定义：在博弈G={N; Si; ui; i∈N}中;假设参与人i的纯策略构成的策略集合为Si={si1;…; sik};若参与人i 以概率分布pi=pi1;…; pik 在其k 个可选策略中随机选择“策略”;称这样的选择方式为混合策略..这里;0≤pij ≤ 1;对于j=1 ;…; k 都成立;且有; pi1+…+ pik=1..纯策略可看成特殊的混合策略..上述定义是在有限博弈前提下进行的..3.2混合策略意义下策略组合的表述{x1∈X1; …; xn∈Xn};其中Xi ; i =1; …; n表示参与人i所有纯策略生成的概率空间;xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{1/2; 1/2;1/2; 1/2}3.3VNM效用函数Von Neumann and Morgenstern冯·诺依曼和摩根斯坦如果某个随机变量X以概率Pi 取值xi;i=1;2;…;n;而某人在确定地得到xi时的效用为uxi;那么;该随机变量给他的效用便是： UX =P1ux1 + P2ux2 + ... + Pnuxn表示关于随机变量X的期望效用..因此UX称为期望效用函数;又叫做冯·诺依曼——摩根斯坦效用函数VNM函数..3.4基于混合策略意义下的博弈策略式表述定义：基于v-N-M效用的策略式博弈由 a、参与人集合 b、每个参与人有一个纯策略集合 c、对于每一个参与人来说;由所有参与人纯策略组合构成的风险结果空间;存在一个v-N-M效用3.5混合策略意义下的纳什均衡定义：对于博弈G= {N; Si; ui; i∈N};基于v-N-M效用的混合策略组合α是一个纳什均衡;若对于每一个i; 以及i的任意一个混合策略αi;α对应的期望支付至少和αi;α-i 的期望支付一样大换句话说;称混合策略组合α是一个纳什均衡;如果没有一个参与人通过偏离策略αi 实现支付的增加3.6一个定理对于N-人静态博弈问题;设混合策略纳什均衡对应的策略组合为Xi ; X –i ..对于任意的i ;若最优混合策略为Xi= {x1;…;xl;0…0}不失一般性;假设前l个分量严格大于0;记分量xk k=1;…; l 对应的纯策略sk;则对于参与人i而言;sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值;等于纳什均衡混合策略组合 Xi; X –i 的收益值..即ui sk; X –i = ui Xi; X –i 成立 ; k=1;…; l3.7方法：a、求解混合策略均衡可以用期望收益等值法b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡四：多重纳什均衡解及其分析4.1 帕雷托占优均衡帕雷托占优均衡的含义是：在多个纳什均衡中;若存在一个纳什均衡;其支付结果针对每个参与人而言都严格优于其它纳什均衡;则该纳什均衡是帕雷托占优纳什均衡..4.2风险占优均衡risk-dominant equilibrium参与人对风险占优均衡的选择倾向;有一种强化的机制..当部分或所有参与人选择风险占优均衡的可能性增强的时候;任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小;而这又使得帕雷托占优均衡策略的支付更小;从而形成一种选择风险占优均衡策略的正反馈机制;并使其出现的概率越来越大..当参与人数目增加时;选择合作的风险将会更大;可借助该点考虑招标机制如何减少投标方勾结问题..上述问题是我们知道建立诚信机制社会的重要意义..上述问题引出一个博弈相关分支为协调博弈coordination game4.3聚点均衡由实际问题抽象出来的博弈模型中;更多的一类问题是：多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系;如夫妻爱好问题的两个纯策略均衡..这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例;在实际中往往二人很默契地知道如何进行博弈;双方往往知道怎么进行选择策略;且能够相互了解这里面排除了互相协商后达成的一致实际博弈中参与人往往会利用博弈模型以外的信息;实现对特定博弈均衡一致关注的“聚点”这些信息如：参与人共同的文化背景或规范;共同的知识;具有特定意义事物的特征;某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性;但因为涉及因素太多;对于一般博弈模型很难总结普遍规律;只能具体问题具体分析聚点：人们通常会协调彼此的行为..你弱他就强；先例产生的影响远大于逻辑或者法律效力；人们总是乐于安守现状或接受自然形成的界线三八线4.4相关均衡correlated equilibrium实际上;在现实中遇到选择困难时;特别是在长期中反复遇到相似选择难题时;常会通过收集更多信息;形成特定的机制和规则;为某种形式的制度安排等主动寻找思路..相关均衡就是这样的一种均衡选择机制..对于实际中比较复杂的博弈问题;参与人是否有能力设计这种机制;并且有足够能力理解、信任这种机制;是有一定疑问的..相关均衡作为社会经济制度创新的一种解释也许更有意义..4.5防共谋均衡coalition-proof equilibrium 定义：如果一个博弈的某个策略组合满足a、没有任何单个参与人的“串通”会改变博弈的结果;即单独改变策略无利可图该策略组合是纳什均衡..b、给定选择偏离的参与人有再次偏离的自由时;没有任何两个参与人通过“串通”改变博弈的结果..c、依此类推;直到所有参与人都参加的串通也不会改变博弈的结果..满足上述要求的均衡策略组合称为“防共谋均衡”在有多个参与人的博弈中;若部分参与人通过某种形式的默契或串通形成小团体;可能得到比不串通个大的支付..这就是多人博弈的共谋问题..防共谋均衡是指这样的一个纳什均衡;在该均衡局势下;少数参与人集合不能通过均衡策略的偏离;实现更好的局部利益..防共谋均衡是两个以上参与人参加的博弈中;参与人在帕雷托占优均衡中进行合作思想的扩展..五：动态博弈5.1特点一类博弈行为通常需要参与人多步决策才能完成;具有明显的阶段性..博弈的结局、各参与人的收益由多阶段决策结果确定..各参与人的决策有一定的顺序..由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性;通常用扩展式extensive form表述法描述这些信息..5.2博弈的扩展式表示参与人集合：i=1; … ;N..用N表示虚拟参与人“自然”；自然的含义是某些外生的客观概率分布事件参与人的行动顺序the orderof moves:描述各参与人在什么时候行动；参与人的行动空间actionset：在每次行动时;参与人可选择的行动集合；参与人的信息集information set：每次行动时参与人知道什么；参与人的收益函数：在行动结束之后;每个参与人得到些什么..自然选择的概率分布假定自然状态是共同知识..对于有限博弈;博弈树是常用的表述方式..5.3博弈树a若动态博弈是有限博弈;则可用博弈树表示该博弈..这里有限的含义是：各阶段各参与人的行动数目有限；博弈的阶段数有限..b博弈树的基本结构为结点nodes..包括决策结及终点结..决策结是参与人采取行动的时点；终点结是博弈行动路径的终点..枝branches..从一个决策结到它的直接后续结的连线;每一个枝代表参与人的一个行动选择..信息集..是决策结集合的一个子集..将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集..注：每个决策结都是同一个参与人的决策结..该参与人知道博弈进入该集合的某个决策结;但不知道自己究竟出于哪一个决策结若该信息集有两个或两个以上元素..5.4对于有限动态博弈;若参与人对彼此在各决策结点的行动集合;彼此的效用函数;历史的行动有着完全的了解;则称这样的博弈为完全信息动态博弈..如果博弈树的所有信息集都是单元素集;称该博弈为完美信息博弈game of perfectinformation..上述两个定义的差别在于对自然行动信息的描述..5.5动态博弈的策略式表述a相机选择contingent play动态博弈中参与人的策略是各自预先设定的;在博弈的各阶段;针对各种情况做出相应决策..即“等待”博弈到达自己的信息集包含一个或多个决策结后再决定如何行动..在策略式表述博弈中;参与人似乎是博弈开始之前就制定出了一个完全的相机选择;即“如果……发生;我将选择……”..b从扩展式表述构造战略式表述若把B的信息集从左到右排列;上述四个纯策略可以简单记为{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}..上面四个纯策略含义：当A选择开发时;B选择大括号中前面的策略；当A选择不开发时;B选择大括号中后面的策略..B的纯策略为：{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}A的纯策略为：SA=开发;不开发于是可以写成策略式表述形式;为开发;开发开发;不开发不开发;开发不开发;不开发开发-3;-3-3;-31;01;0不开发0;10;00;10;0在扩展式表述博弈中;所有n个参与人的一个纯战略组合s=s1;…;sn决定了博弈树上的一个路径..比如开发;{不开发;开发}决定了博弈的路径为A 开发 B 不开发1;05.6完全信息动态博弈纳什均衡存在性定理如果有限博弈是完美信息博弈;他还有一个纯战略纳什均衡Zermelo;1913..5.7逆向归纳法：a逆向归纳法求解策略：从动态博弈的最后一个阶段出发;对该参与人采用经济理性原则进行分析;逐步到推回前一个阶段相应参与人的行动选择;一直到第一阶段的分析方法..b逆向归纳法是求解完美信息动态博弈的经典方法..逆推归纳法是完美信息动态博弈分析中使用最普遍的方法..c与策略式分析比较：如果A选择U;那么B的信息集不能达到;我们说B的信息集不在均衡路径上out-of-equilibrium path.. 此种情况下;B的选择对A没有什么影响..因此;纳什均衡对一个参与人在非均衡信息集上的选择没有限制..但是;一个参与人在非均衡信息集上的战略可以影响其他参与人在均衡信息集上的选择..d逆向归纳法实质上是重复剔除劣战略法在扩展式博弈中的应用..逆向归纳法适不用于无限博弈和不完美信息博弈..逆向归纳法剔除了“非理性”的均衡策略5.8子博弈完美均衡子博弈精炼纳什均衡①子博弈概念：一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结Tx组成;它满足下列条件：x是一个单结信息集;即hx={x};对于所有的Tx中的x’;如果x’’与x’同属于一个信息集;则x’’也在Tx中..需要说明的是;G本身是自己的一个子博弈..②子博弈完美纳什均衡子博弈精炼纳什均衡扩展式博弈的一个战略组合s=s1;…;s i;…;s n是一个子博弈完美纳什均衡;如果它是原博弈的纳什均衡..它在每一个子博弈上都是纳什均衡③纳什均衡与子博弈精炼纳什均衡的关系前面分析说明;一个特定的纳什均衡决定了原博弈树上唯一的一条路径;这条路径称为“均衡路径”equilibrium path..相对该纳什均衡;其他路径称为非均衡路径out-of-equilibrium path..在每一个子博弈上给出纳什均衡意味着;构成子博弈纳什均衡的战略不仅在均衡路径的决策结上是最优的;同时在非均衡路径的决策结上也是最优的..对于有限完美信息博弈;前面介绍的逆推归纳法得出的纳什均衡即是子博弈精炼纳什均衡..六多阶段静态博弈6.1该类模型中至少在某个阶段参与人同时选择其决策..这类模型实质上就是完美信息动态博弈;因此仍然可以采用逆推归纳法进行分析..因为存在同时选择;因此每个阶段不再是单人优化问题;而是一个静态博弈..6.2前向归纳法：前面已经说明;完美信息动态博弈的经典求解方法为逆序归纳法..还有一种分析方式;就是前向归纳法forward induction..前向归纳法由科尔博格和莫顿斯1986提出..这里不进行严格的数学描述;仅通过一个例题进行说明..6.3重复博弈重复博弈repeated game的定义指同样结构的博弈重复多次;其中的每次博弈称为“阶段博弈stage game”..如两个多次犯罪的“囚徒问题”..由于动态博弈是相机行动;反映到重复博弈中;就是可以使自己在某个阶段的博弈选择依赖于其他参与人过去的行动历史..影响重复博弈均衡结果的主要因素是博弈重复次数和信息的完备性completeness..重复次数对参与人可能会有的影响是：参与人为了获得长远利益而牺牲眼前利益的策略成为可能..关于完备性;简单地说;但一个参与人的支付函数不为其他参与人所知时;该参与人可能有积极性建立一个“好”的声誉reputation以换取长远利益..在社会行为中;经常可以看到本质不好的人在相当长的时期内干好事的原因..定理：令G是阶段博弈;GT是G重复T次的重复博弈T<∞..那么;如果G有唯一的纳什均衡;重复博弈GT的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次即每个阶段博弈出现的都是一次性博弈的均衡结果..上述定理说明;只要博弈的重复次数是有限的;重复本身并不改变囚徒困境的均衡结果..上述定理中“唯一性”是一个重要条件..如果纳什均衡不是唯一的;上述结论就不一定成立..当博弈有多个纳什均衡时;参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为..（七）不完全信息静态博弈不完全信息静态贝叶斯博弈贝叶斯纳什均衡海萨尼转换拍卖理论八合作博弈可传递效用 transferableutility合作博弈的特征函数合作的分配可行分配核心的定义 Shapley 值。

博弈论基础复习

《博弈论基础》主要知识点一、名词解释（5×2＝10分）策略型博弈它是由三个部分组成，即局中人、策略和各种策略组合中所得到的利益。

纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合.混合策略局中人的混合策略是其纯策略空间上的一种概率分布，表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。

扩展型博弈博弈存在着局中人行动的先后次序，是对具有动态结构的决策形式进行研究的规范分析工具.博弈树对于任何一种双人完备博弈，都可以用一个博弈树来描述，并通过博弈树搜索策略寻找最佳解。

博弈树类似于状态图和问题求解搜索中使用的搜索树.完美信息博弈是指一次只有一个局中人在行动，而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。

子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈. 行为策略是指每一个参与人在每一个信息集上随机的选择行动.逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。

在求解子博弈精炼纳什均衡时，从最后一个子博弈开始逆推上。

冷酷策略又称触发策略。

指参与人在开始时选择合作，在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛，则永远选择背叛,永不合作.类型：一般地，将一个参与人所拥有的所有私人信息称为他的类型。

信号博弈是研究具有信息传递作用的信号机制的一般博弈模型，其基本特征是两个博弈方，分别称为信号发出方和信号接收方。

分离均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者以概率1选择不同的信号，接收者完全可以通过信号来准确判断出发送者的类型。

混同均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者选择了相同的信号，接收者无法从信号中得到新的信息,无法对先验信念进行修正。

特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益，也就是给出了一种集合函数，称为特征函数。

联盟二、选择题(5×2＝10分）三、简答题（28—30分）1.博弈的分类及相关概念.合作博弈:强调效率、公正、公平非合作博弈：博弈论的主要研究对象,强调在互动假设下的个人理性、个人最优决策从信息角度看，博弈可分为:完全信息博弈：指局中人对于自己以及其他局中人的策略空间、盈利函数等知识有完全的了解。

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是研究决策者在互相影响的情况下做出最佳决策的数学模型和方法。

在博弈论中，决策者被称为玩家，他们的决策会受到其他玩家的影响。

以下是博弈论的一些重要知识点的总结：1.资料和约定-玩家：博弈论中的决策者。

-策略：玩家可以采取的行动。

-支付：玩家根据博弈结果获得的效用或价值。

-最优策略：在给定博弈条件下，可以使玩家获得最大效用的策略。

-纯策略和混合策略：纯策略是指玩家在每次博弈中都采取相同的行动；混合策略是指玩家以一定概率采取不同的行动。

2.标准形博弈-扩展形式：博弈者按照时间次序做出决策，每个决策节点有多个玩家可以选择的动作。

-纳什均衡：在标准形博弈中，如果所有玩家都不愿意单方面改变他们的策略，则该策略组合是纳什均衡。

-最优反应函数：针对每个玩家的策略组合，最优反应函数给出了该玩家的最佳策略。

-支配策略：一个策略在任何情况下都能够给出玩家更好的结果，那么我们可以说这个策略是支配的。

3.矩阵博弈-矩阵：博弈论中描述玩家策略和效用的表格。

-矩阵博弈的解：通过找到纳什均衡，我们可以得出矩阵博弈的解决方案。

-互动博弈：双方玩家的效用都取决于对方的策略选择。

4.博弈树-博弈树：根据博弈的时间顺序和玩家之间的相互影响，构建的树形结构。

-极小极大算法：用于确定博弈树上的最佳策略。

- alpha-beta剪枝：通过剪枝，减少博弈树的节点数量，从而提高效率。

5.进化博弈论-重复博弈：博弈过程被连续重复进行，玩家可以根据之前的结果来调整策略。

-演化稳定策略：一个策略集合中的策略，在当前环境下被所有玩家采纳并且难以被其他策略取代。

6.合作博弈论-合作博弈：玩家可以自由选择与其他玩家联合合作，并共享所获得的效用。

-特征函数：描述合作博弈的效用分配。

-核心：合作博弈中所有合法的效用分配的集合。

- Shafer值：一种用于将效用分配给个体的方法，使得每个个体的效用都能够得到公平分配。

博弈论是多学科交叉的研究领域，应用广泛，涉及经济、管理、政治等多个领域。

博弈论（整理过名词解释和简答）（DOC）

博弈论（整理过名词解释和简答）（DOC）第一篇：博弈论(整理过名词解释和简答)(DOC)一、名词解释：1、博弈：一些个人、团体或其他组织，在一定的规则约束下，依据所掌握的信息，同时或者先后，一次或者多次从允许选择的行为或战略进行选择并加以实施，并从中各自取得相应结果或收益的过程。

2、囚徒困境：从博弈中的两个利益主体出发选择行为，结果是既没有实现两人总体的最大利益，也没有真正实现自身的个体最大利益，比如经济领域的寡头竞争、公共产品的供给。

3、非合作博弈与合作博弈：人们行为相互作用时，当事人能达成一个具有约束力的协议，也就是合作博弈，反之，就是非合作博弈。

4、常和博弈：是指博弈双方的得益总和为非零的常数变和博弈：是指在不同的策略组合或者结果下，所有博弈方的得益总和一般是不相同的零和博弈：是指在博弈中，一方的得益就是另一方的损失，所有博弈方的得益总和为零5、博弈论：研究决策主体的行为及其相互决策和均衡问题的学科。

在经济学中，博弈论是研究经济主体的决策相互影响6、战略：参与人在给定信息集的情况下的行为规则的完备描述。

7、均衡：所有参与人的最优战略组合。

8、均衡路径：如果一个博弈有几个子博弈，一个特定的纳什均衡决定了原博弈树上唯一的一条路径，或者说是一个纳什均衡结果在博弈树中所形成的路径。

9、占优均衡：无论其他参与人选择什么战略，参与人的某一种战略均是最优的。

10、重复剔除劣战略的占优均衡：首先找到某个参与人的劣战略（假定存在），把这个劣战略删除掉，重新构造一个不包含已删除的劣战略的新的博弈，然后再删除这个新的博弈中的某个参与人的劣战略，一直重复这个过程，直到只剩下唯一的战略组合为止。

11、纳什均衡：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是最好的策略，即双方在给定的战略上不愿意改变自己的策略。

12、混合战略：如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为，我们称该战略为混合战略。

博弈论基础知识汇总

博弈论（Game Theory），亦名“对策论”、“赛局理论”，属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究，目前主要有两种方法。

一种是“进化博弈论方法”。

它将人类的经济活动和竞争性经济行为同生物的进化相类比，研究人类经济行为中的策略和行为方式的均衡，以及向均衡状态调整、收敛的过程与性质。

另一种新方法是“重复博弈论方法”，它运用更精细的均衡概念，如“子博弈精炼均衡”来分析历史与现实中的制度选择与变迁过程。

基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。

其中局中人、策略和收益是最基本要素。

局中人、行动和结果被统称为博弈规则。

博弈主要可以分为合作博弈和非合作博弈。

合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈、从行为的时间序列性，博弈论进一步分为静态博弈、动态博弈两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。

通俗的理解："囚徒困境"就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。

完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。

在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。

博弈论看法博弈论的基本假设：参与人追求利润最大化。

《博弈论》知识点总结高中

《博弈论》知识点总结高中一、引言博弈论是数学的一个分支，探究的是在多个参与者决策的状况下，参与者之间的最优策略选择。

博弈论不仅在经济学、管理学等社会科学领域有重要应用，而且在生物学、计算机科学、战略决策等领域也有广泛应用。

在高中阶段，我们将进一步了解博弈论的相关知识，精通其基本原理和应用方法。

二、博弈论的基本观点1. 博弈形式博弈形式是博弈双方的策略选择和支付函数的描述。

通常用一个数学模型表示，包括博弈参与者、参与者可实行的策略、以及参与者之间的支付函数。

2. 纳什均衡纳什均衡是博弈论中的核心观点，指的是在一个博弈形式中，全部参与者选择的策略互相一致，没有改变策略的动机。

纳什均衡可以是单一的，也可以是多个同时存在的。

三、经典的博弈论问题1. 帕累托改进帕累托改进是对博弈形式进行改进，使得至少有一个参与者的支付得到提高，而其他参与者的支付不受损。

帕累托改进是为了创设更好的博弈结果，改进策略的选择。

2. 环保囚徒逆境环保囚徒逆境是博弈论中经典的问题之一。

逆境的情境是两名罪犯（囚徒）被抓获，警方没有足够的证据定罪，只能以较轻的罪名裁定，但若果两人都选择供出对方，那么都会得到较重的刑罚。

囚徒之间需要合作做出决策，以达到双方利益的最大化。

3. 博弈矩阵博弈矩阵是一种常见的博弈形式描述方式，用来表示参与者的策略选择和相应的支付函数。

矩阵中的每个元素表示参与者所得到的支付。

通过博弈矩阵可以便利地分析博弈中各个参与者的最优策略。

四、博弈论的应用1. 经济学博弈论在经济学中有广泛的应用，特殊是在市场竞争和战略决策中。

通过分析参与者之间的博弈干系，可以猜测市场行为和做出最优决策。

例如，博弈论可以诠释价格竞争、拍卖机制以及操纵市场策略等经济现象。

2. 生物学生物学中的适者生存和进化问题，也可以用博弈论进行建模和分析。

通过博弈论的方法，可以探究动物群体中的合作与竞争干系，以及基因在群体中的演化。

3. 计算机科学在人工智能和计算机科学领域，博弈论被广泛应用于智能决策和机器进修。

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述：1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论研究的假设：1、决策主体是理性的，最大化自己的收益。

行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。

信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。

完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。

不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。

支付：决策主体在博弈中的收益。

在博弈中支付是所有决策主题所选择的行动的函数。

从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别：3、博弈论与传统决策的区别：1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。

可表示为：maxU(P,l),其中P为市场价格，丨为消费者可支配收入。

2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。

但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。

4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论知识总结博弈概述：1、博弈概念：博弈：就是研究决策主体的行生直接相互作用的决策以及种决策的均衡。

博弈研究的假：1、决策主体是理性的，最大化自己的收益。

2、完全理性是共同知3、每个参与人被假定可以所境以及其他参与者的行形成正确的信念与期2、和博弈有关的量：博弈参与人：博弈中行以最大化自己受益的决策主体。

行：参与人的决策略：参与人的行，即事件与决策主体行之的映射，也是参与人行的。

信息：参与人在博弈中的知，尤其是其他决策主体的略、收益、型（不完全信息）等的信息。

完全信息：每个参与人其他参与人的支付函数有准确的了解；完美信息：在博弈程的任何点每个参与人都能察并之前各局中人所的行，否不完美信息。

不完全信息：参与人没有完全掌握其他参与人的特征、略空及支付函数等信息，即存在着有关其他参与人的不确定性因素。

支付：决策主体在博弈中的收益。

在博弈中支付是所有决策主所的行的函数。

从学的角度，博弈是决策主体之的相互作用，因此和个人决策存在着区：3、博弈与决策的区：1、微学的个人决策就是在定市价格、消者收入条件下，最大化自己效用，研究工具是无差异曲。

可表示：maxU(P,I)，其中 P 市价格， I 消者可支配收入。

2、其他消者个人的合影响表示一个参数——市价格，所以在市价格既定下，消者效用只依于自己的收入和偏好，不用考其他消者的影响。

但是在博弈理个人效用函数依于其他决策者的和效用函数。

4、博弈的表示形式：略式博弈和展式博弈略式博弈：是博弈的一种范性描述，有亦称准式博弈。

略式博弈是一种假每个参与人一次行或略，并且参与人同行的决策模型，因此，从本上来略式博弈是一种静模型，一般适用于描述不需要考博弈程的完全信息静博弈。

1、参与人集合{ 1 , 2,...,n }：2、每位参与人非空的略集Sins i(s1,...,si,..., sn)上的效用函数Ui(s1,s2,⋯,sn).3、每位参与人定在略合i1展式博弈：是博弈的一种范性描述。

与略式博弈重博弈果的描述相比，展式博弈更注重参与人在博弈程中遇到决策序列构的分析。

包含要素：1 、参与人集合{ 1 , 2,...,n }类型完全信息静态博弈2 、参与人的行动顺序，即每个参与人在何时行动；3 、序列结构：每个参与人行动时面临的决策问题，包括参与人行动时可供选择的行动方案、所了解的信息；4 、参与人的支付函数。

比较：1、战略式博弈从本质上来讲是一种静态模型。

2、扩展式博弈从本质上来讲是一种动态模型。

5、博弈论分类：按决策主体的行为相互作用时，当事人能否达成一个具有约束力的协议可分为：1、合作博弈（强调团体理性、团体最优决策、效率）2、非合作博弈（强调个人理性，个人最优决策）按参与人行动先后顺序可分为：1、静态博弈：博弈中参与人同时行动，或者虽然不是同时行动，但是在行动前不知道其他参与人所选择的行动。

2、动态博弈：参与人的行动有先后顺序，后行动者获得先行动者的行动信息。

按参与人对信息的掌握程度可分为：1、完全信息：每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解，博弈开始时不存在不确定性因素。

2、不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。

按决策主体对信息的掌握程度和行动的先后顺序，博弈可以分为：完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。

静态动态完全信息完全信息静态博弈完全信息动态博弈均衡：纳什均衡均衡：子博弈精炼纳什均衡不完全信息不完全信息静态博弈不完全信息动态博弈均衡：贝叶斯纳什均衡均衡：精炼贝叶斯纳什均衡6、根据所学这四种博弈的特点对这四种博弈做一个对比分析：信息和行动特点均衡均衡类型特别均衡求解方法学过的例子性质每个参与人对其纳什均纯战略纳占优战略纳箭头法Hotelling 价格竞多重性和存他所有参与人的衡什均衡什均衡划线法争在性特征、战略空间及(PNE)（ DSE）库诺特价格竞争支付函数有精确重复剔除的不断剔除劣一般一个博弈中的了解，博弈开始占有均衡战略（弱劣存在参与者有多时不存在不确定(IFDE)战略的剔除个行动时可以先性因素，参与人同顺序会影响考虑能否剔除弱时行动或者不是均衡结果战略简化博弈同时行动但是后混合战略聚点均衡支付最大化社会福利博弈行动者不知道行纳什均衡法小偷－守卫博弈动者的行动信息。

(MNE)支付等值法战略和行动相同。

完全信在博弈开始之前子博弈息动态参与人之间的信精炼纳博弈息不存在不确定什均衡性，但是参与人行动存在先后顺序。

在完全信息动态博弈中，为了表示参与人之间的信息掌握关系，引入了信息及的概念。

不完全在博弈开始之前贝叶斯信息静参与人之间的信纳什均态博弈息存在不确定性，衡但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。

不确定是参与人的了性的不确定性子博弈精有限次重复与纳什均衡连锁店悖论炼纳什均博弈均衡的唯一性有衡关无限次重复与贴现因子囚徒困境（冷酷博弈均衡有关战略）（无名氏定无限期轮流讨价理）还价模型一般博弈逆向归纳法斯坦科尔伯格寡求解头竞争雇主与公会之间的竞争贝叶斯纳混合战略对原混合战性别战什均衡（不完全信略加入少许息情况下纯不确定性因战略均衡的素，求极限。

极限）一般贝叶斯Harsanyi 转机制设计均衡换1、均衡结果是原博弈的Nash 均衡；2、同时在每一个子博弈上构成Nash 均衡1、均衡存在性2、不确定性体现为类型的不确定性不完全信息动态博弈在博弈开始前参精炼贝信号传递分离均衡与人之间的信息叶斯纳博弈存在不确定性，同什均衡混同均衡时参与人行动存在先后顺序。

不完准分离均衡全信息动态博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。

根据所得信信号传递博弈不完全信息息修正判断不完全信息重复动态博弈子概率，根据博弈与声誉博弈精炼纳收益最大化Milgrom-Roberts什均衡与海决策垄断限价模型萨尼不完全信息静态博弈贝叶斯均衡的结合。

二、四种博弈类型具体分述1、完全信息静态博弈1.1 完全信息静态博弈特点：每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解，博弈开始时不存在不确定性因素，参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。

战略和行动相同。

1.2完全信静态博弈相关概念：以新产品开发博弈举例说明：参与人：参与人 1 和 2。

参与人的集合卡表示：Γ={1,2，⋯n}.表示所有参与人的集合，在新品开博弈中：Γ={1,2}行：开、不开。

Ai 表示参与人行的集合。

新品开博弈中参与人的行集合A1=A2={a,b},其中 a 开， b 不开。

a={a1,a2⋯an}表示参与人的行合。

新品开博弈中：A={（ a,a）,(a,b),(b,a),(b,b)}略：参与人的行。

在博弈中的略可以定从集到行集的映射关系，即：Si:Xi— Ai。

用Si={si}表示参与人所有略的集合。

在n 人博弈中，用 S=(s1,s2,s3⋯,s n )表示 n 个参与人的略合，它表示博弈中每个参与人采取略 si 的一种博弈情形。

在完全信息静博弈中，由于不存在决策序上的差异，所有参与人在同一决策点即博弈开始的那一刻决策，因此，所有参与人面的决策情形都只有一种，所以，参与人的略集与行集相同。

支付：是指参与人在博弈中的所得。

一般情况下也是用效用函数来表示参与人在博弈中的所得。

因此，参与人的支付就可表示一种特定博弈情形下参与人得到的确定效用水平或期望效用水平。

支付一般用ui(1,2,⋯,n)表示参与人i 的支付 (效用水平 )，支付合 u=(u1,u2, ⋯un)表示参与人在特定博弈情形下所得到的支付，其中参与人i 的支付。

因此，参与人i=(i=1,2,⋯,n)的支付就可表示：ui=ui(s i ,s-i).信息：是参与人所具有的有关博弈的所有知，如有关其它参与人行或略的知、有关参与人支付的知等等。

在“新品开博弈”中，如果两个企都知道市需求，那么的博弈情形就是我前面所提到的完全信息假；如果两个企中至少有一个不知道市需求，那么的博弈情形就是我前面所提到的不完全信息假。

1.3略什均衡略：参与人在定信息下只一种特定（或确定性）的略混合略：混合略解了一个参与人其他参与人所采取的行的不确定性，它描述了参与人在定信息下以某种概率分布随机地不同的行或略。

略什均衡中包括：占有均衡、重复剔除劣略均衡、一般略什均衡等。

1、占均衡占略：参与人的最略 si * 与其他参与人的s-i无关。

无其他参与人什么略，参与人的最略是唯一的，的最略称之“占略”。

在 n 人博弈中，如果于所有的其他参与人的s-i，si * 都是参与人i 的最u i (s i* , s i ) u i (s i , s i )称 si *参与人的占略。

在 n 人博弈中，如果所有参与人都存在占略si * ，占略合si*=（s1 * si2*, ⋯, sn *）称占略均衡。

如果所有参与人都有占略存在，那么占略均衡就是唯一的所有理性参与人可以到的博弈果。

2、重复剔除劣略如果在一个博弈中，参与人不存在占略，但是参与人i 存在两个略，其中一u i ( s i, s i ) u i (s i , s i )个略叫另一个略的所得效用要大，理性的参与人不会略。

格劣略：u i ( s i , s i ) u i ( s i , s i )u ( s i , s i )u i ( s i , s i )弱劣略：若重复剔除程一直可持到只剩下唯一的略合，略合即重复剔除的占均衡，此博弈是重复剔除略可解。

要点：再重复剔除程中，如果每次剔除的是格劣略，均衡果与剔除序无关；如果剔除的是弱劣略，均衡果可能与剔除序有关。

3、一般 Nash 均衡Nash 均衡是完全信息静博弈的解的概念，略是不可剔除的，即不存在任何一个略格于在完全信息静博弈中，Nash 均衡略。

构成Nash 均衡的求解什均衡的方法划法、箭法。

划法：1、考察参与人1 的最略2、用上述方法找出参与人 2 的最略3、找出最略合箭法：1、于每个略合，是否有参与人会偏离个略合2、直至找出没有参与人会偏离的略合略均衡反映函数：各博弈方的策略其他博弈方策略的反。

1.4 混合略什均衡混合略：在博弈G { ; S 1 ,..., S n ;u 1,..., u n } 中，任一参与人i ， Si={S i1, ⋯ ,S i k }, 参与人i 的一个混合略定在略集Si 上的一个概率分布δi={ δ i 1, ⋯, δ ik}, 其中δ i j（j=1, ⋯ ,k ）表示参与人 i 略表示参与人 i 略i j的概率的概率，即δi jS足 0≦δ i j ≦ 1，其中概率之和 1。