博弈论知识点总结

合集下载

博弈论朱·弗登博格摘抄

博弈论朱·弗登博格摘抄

博弈论朱·弗登博格摘抄一、简介博弈论是一种研究决策问题的理论,广泛应用于经济、政治、军事等领域。

朱·弗登博格是博弈论的杰出代表人物之一,他的理论贡献和实际应用备受瞩目。

本文将摘抄朱·弗登博格的一些重要观点和理论,以便读者更好地理解和应用博弈论。

二、博弈论基本原理1.策略选择:在博弈论中,每个参与者都需要在给定其他参与者的策略选择情况下,选择自己的最优策略。

因此,策略选择是博弈论的核心。

2.收益分析:在博弈论中,收益分析是至关重要的。

每个参与者的收益取决于其他参与者的策略选择,以及当前环境等因素。

因此,收益分析需要综合考虑各种因素。

3.合作与竞争:在博弈论中,合作与竞争是两个相互关联的概念。

合作是指在博弈中,参与者可以达成协议,实现共同的利益。

竞争则是指参与者相互对立,追求自己的利益最大化。

三、博弈论在现实中的应用1.金融市场:朱·弗登博格指出,金融市场中的投资者经常处于博弈之中。

投资者需要综合考虑市场信息、风险和收益等因素,做出最优决策。

2.政治决策:政治决策往往涉及到多方利益,需要博弈论的原理和方法进行分析。

通过博弈论分析,可以更好地理解各方的利益诉求和决策过程,为政策制定提供科学依据。

3.企业管理:企业管理中也需要运用博弈论原理和方法。

例如,企业在进行人力资源管理、市场营销和供应链管理时,需要综合考虑各种因素,做出最优决策。

四、朱·弗登博格的其他观点1.动态博弈:朱·弗登博格强调动态博弈的重要性。

在动态博弈中,参与者之间的策略选择是相互影响的,需要综合考虑各种因素,做出灵活应对。

2.合作博弈和非合作博弈:合作博弈是指参与者为了实现共同利益而进行的博弈,而非合作博弈则是指参与者之间存在利益对立的情况。

朱·弗登博格认为,在实践中,需要关注非合作博弈中的利益冲突和协调问题。

3.信任和信誉:朱·弗登博格认为,信任和信誉是博弈论中的重要因素。

《博弈论》知识点总结

《博弈论》知识点总结

《博弈论》知识点总结博弈论作为一门交叉学科,涵盖了数学、经济学、政治学、心理学等多个学科领域。

其研究对象包括零和博弈、非零和博弈、合作博弈、序贯博弈等。

博弈论的应用领域也非常广泛,包括经济学、政治学、社会学、管理学等。

博弈论在求解决策问题、预测市场行为、推导策略和解释社会现象等方面有着广泛的应用。

博弈论的主要内容包括:1.博弈的定义博弈是指互相影响的参与者所进行的一种决策活动。

在博弈中,每个参与者都要做出一个选择,其结果受到其他参与者的选择的影响。

博弈的结果取决于所有参与者的选择。

2.博弈的基本元素博弈的基本元素包括参与者、策略和结果。

参与者是进行决策的主体,策略是参与者可以选择的行为方式,结果是参与者选择策略后所得到的收益或损失。

3.博弈的分类根据参与者的利益关系和决策方式,博弈可以分为零和博弈和非零和博弈。

零和博弈指参与者的利益完全相反,一方获利即意味着另一方损失,而非零和博弈则指参与者的利益可能存在重叠或者是共同合作的情况。

4.博弈的解博弈的解是指在博弈参与者做出决策选择之后,通过某种机制确定最终的结果。

常见的博弈解包括纳什均衡、霍夫达均衡、帕累托最优等。

5.博弈论的应用博弈论在经济学、政治学、社会学等领域有着广泛的应用。

在经济学中,博弈论可以用来解释市场行为、预测价格变动等。

在政治学中,博弈论可以用来分析政治决策、议事程序等。

在社会学中,博弈论可以用来解释群体行为、合作问题等。

博弈论是一门具有重要理论意义和广泛应用价值的学科,它不仅可以帮助人们更好地理解决策制定的规律和机制,还可以为人们提供更科学的决策指导。

在日常生活中,我们可以通过学习和应用博弈论的知识,更加理性地做出决策,并更好地理解他人的选择和行为。

希望未来博弈论能够继续在各个领域发挥作用,为人类社会的进步和发展做出更大的贡献。

博弈论知识简要

博弈论知识简要

寻找混合策略纳什均衡的思路
• 令各博弈方随机选择纯策略的概率分布,满足使其 他博弈方采用不同策略的期望得益相同,从而计算 出各个博弈方随机选择各纯策略的概率。
• 在猜硬币博弈中,设盖硬币方出正面的概率为p, 出反面的概率为1-p。则猜硬币方猜正面的期望得 益为p·1+(1-p)·(-1)=2p-1,猜反面的期望得益 是p·(-1)+(1-p) ·1=1-2p,令二者相等,得p=1/2。 盖硬币方的混合策略是以(1/2,1/2)的概率随机 选择正面和反面。类似的,可以计算出猜硬币方的 混合策略。
S
i

1,2,...
表示 Si 中的某个特定策略。在静态博弈中,Si 中包含
的所有
S
i
就是第
i 个参与人的所有可选择的行动;ui
是第 i 个参与人的得益函数,它是所有参与人选择的
某个特定策略组合的函数,即
ui
ui
S1
,...,
S
i
,...,
S
n

•例 两寡头的产量博弈中,参与人就分别是编号为1和2的两个 企业;其各自的策略选择就是选择各自的产量;其各自的 策略空间就是其各自所能够生产的各种产量的集合。如果 假设两个企业,都能够生产大于0的任何数量的产量,那
下选择什么行动的预先安排; • 行动:参与人在博弈过程中轮到自己选择时所作的某个具体决策; • 得益:参与人从博弈中获得的效用,一般是所有参与人的策略
或行动的函数,这是每个参与人最关心的东西;
• 信息:参与人在博弈中所知道的关于自己以及其他参与人的行 动、策略及其得益函数等知识;
• 均衡:所有参与人的最优策略或行动的组合;
精炼贝叶斯均衡 泽尔腾等

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。

它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。

下面是博弈论中的一些重要知识点的总结。

1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。

-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。

-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。

2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。

-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。

3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。

-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。

-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。

4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。

-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。

-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。

5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。

-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。

-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。

6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。

-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。

-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。

7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。

-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。

本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。

关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。

博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。

本文将对博弈论的相关知识进行详细的总结和归纳。

一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。

博弈的基本要素包括:参与者、策略、收益和信息。

1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。

参与者的目标是实现自身利益的最大化。

1.3 策略策略是指参与者在博弈中所能采取的行动或选择。

通常分为纯策略和混合策略。

1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。

收益可以用来衡量参与者的利益大小。

1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。

信息可以分为对称信息和非对称信息。

二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。

常见的均衡概念有纳什均衡、帕累托最优和博弈解。

2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。

2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。

帕累托最优是一种资源分配的有效方式。

2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。

博弈解往往是均衡的特殊情况。

三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。

博弈论总结(精选13篇)

博弈论总结(精选13篇)

博弈论总结第1篇最大化自己最坏情况下的收益。

着眼于自己的收益,保证自己收益,防止风险使得自己的收益变小。

以性别之战为例子:首先你得先得到一个关于妻子和丈夫的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育 xxx子期望收益(着眼于自己的期望收益): Uw(q,p)=2PQ + 0×P(1-Q) + 0×Q(1-P) +1×(1-P)(1-Q) = 3PQ - P -Q +1 前面的系数参考收益表(妻子收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,妻子的收益可能为0;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看体育,收益同样最小)这里只是在讨论妻子收益最小的可能性4.妻子的最坏收益为:minUw(p,q) = min(1-P,2P)5.最大化最坏收益: max(min(1-P,2P))解的:P=1/3则妻子的maxmin策略为:1/3概率选择韩剧,2/3概率选择体育。

同理得丈夫的maxmin策略为:1/3概率选择体育,2/3概率选择韩剧。

minmax策略 1.最小化对手最好情况下的收益。

是着眼于对手的收益。

还是这样的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育2.丈夫期望收益(着眼于对方的期望收益):(与maxmin不同要注意!!)Uw(q,p)=PQ + 0×P(1-Q) + 0×Q(1-P) +2×(1-P)(1-Q) = 3PQ - 2P -2Q +2前面的系数参考收益表(丈夫收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,如果这时妻子也想看体育,丈夫收益到2;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看韩剧,收益同最大1)这里只是在讨论妻子收益最小的可能性xxx夫的最大收益为:maxUw(p,q) = max(2-2P,P) 5.最小化最好收益: min(max(1-P,2P))妻子的minmax策略:2/3概率选择韩剧,1/3概率选择体育同里丈夫为的minmax为…在零和博弈中,maxmin策略和minmax策略是等价的。

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳博弈论是研究决策者之间相互作出决策时,通过考虑对方的行动和可能的结果来进行决策的一门学科。

它主要关注对策略的选择与分析,以及对方可能的反应。

下面我们来对博弈论的知识点进行总结归纳。

1.普通博弈和扩展博弈:博弈论分为两类,即普通博弈和扩展博弈。

普通博弈是指参与者在同一时间同时做出决策的博弈,扩展博弈是指参与者在不同的时间节点上做出决策的博弈。

2.博弈的组成要素:博弈论研究的关键要素包括博弈参与者、参与者的策略、参与者的支付、参与者的效用等。

博弈论的目标是通过合理的策略选择来实现最优的支付和效用。

3.纳什均衡:纳什均衡是博弈论中一个重要的概念,指的是当每个参与者都选择了最优的策略后,没有人会改变自己的策略来获得更好的支付。

纳什均衡是博弈的稳定状态。

4.博弈的分类:根据参与者的合作与否,博弈可以分为合作博弈和非合作博弈。

合作博弈中,参与者可以通过合作与其他参与者达成协议,而非合作博弈中,参与者彼此之间没有合作关系。

5.零和博弈和非零和博弈:零和博弈是指所有参与者的支付之和为零的博弈,即一方获利就意味着其他方会损失相应的支付。

非零和博弈是指所有参与者的支付之和不为零的博弈,即所有参与者都有可能获得一定的支付。

6.博弈的解析方法:解析方法是通过分析博弈的特性和参与者的策略来研究博弈的方法。

解析方法包括主要包括支配策略法、混合策略法、最佳反应函数等。

7.博弈的策略选择:博弈论研究的核心问题之一是参与者在博弈中如何选择最优的策略。

策略选择可以通过分析博弈的收益矩阵和参与者的目标来实现。

8.博弈的应用领域:博弈论的应用十分广泛,包括经济学、政治学、生物学、社会学等多个领域。

在经济学中,博弈论被用来研究市场竞争、价格形成等问题,在政治学中,博弈论被用来分析政治决策与合作等问题。

9.孤立型博弈和重复博弈:孤立型博弈是指只进行一轮博弈的情况,参与者只能根据当下的情况来做出决策。

重复博弈是指进行多轮博弈的情况,参与者可以根据之前的决策和结果来进行策略的调整。

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。

即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。

1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。

1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。

两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。

倘若不能,则称非合作博弈(Non-cooperative game)。

合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。

目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。

把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。

完整版)博弈论知识点总结

完整版)博弈论知识点总结

完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。

该学科的研究假设包括:1)决策主体是理性的,会尽可能地最大化自己的收益;2)完全理性是共同知识;3)每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。

博弈中涉及到的变量包括:参与人、行动、战略和信息。

完全信息指每个参与人都了解其他参与人的支付函数,而完美信息则指在博弈过程中,每个参与人都能观察和记忆之前的行动选择。

不完全信息则表示参与人没有完全掌握其他参与人的信息,存在不确定性因素。

博弈与传统决策的区别在于,博弈是决策主体之间的相互作用,需要考虑其他决策者的选择和效用函数。

博弈的表示形式包括战略式博弈和扩展式博弈,其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题,而扩展式博弈则更适用于描述动态博弈问题。

与战略式博弈不同,扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析,而不是仅关注博弈结果的描述。

扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。

战略式博弈是一种静态模型,而扩展式博弈是一种动态模型。

博弈论可以分为合作博弈和非合作博弈,其中合作博强调团体理性、团体最优决策和效率,而非合作博弈强调个人理性和个人最优决策。

根据参与人行动先后顺序的不同,博弈可以分为静态博弈和动态博弈,后者包括先行动者获得先行动者行动信息的情况。

根据参与人对信息的掌握程度,博弈可以分为完全信息和不完全信息博弈。

根据决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。

不同类型的博弈有不同的均衡类型和求解方法,顺序的不同也会影响均衡结果。

Hotelling价格竞争模型是一种重要的扩展式博弈,用于描述两个企业在同一市场上的价格竞争。

相对应。

占有均衡是指在博弈中存在一组参与人的战略选择,使得每个参与人都无法通过改变自己的战略来提高自己的支付。

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。

即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。

1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。

1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。

两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。

倘若不能,则称非合作博弈(Non-cooperative game)。

合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。

目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。

把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。

博弈论知识点总结

博弈论知识点总结

博弈论知识点总结博弈论是一门研究决策与策略的数学理论,主要涉及博弈参与者之间的冲突、竞争和合作,并通过数学模型和方法来分析博弈参与者的最佳决策和最优策略。

下面是博弈论的一些基本概念和重要知识点的总结。

1. 标准形博弈(Normal Form Game):标准形博弈是博弈论中最常见的形式,参与者同时选择策略,并根据选择产生相应的收益或损失。

标准形博弈由参与者的策略集合、收益函数和参与者的收益组成。

2. 纳什均衡(Nash Equilibrium):纳什均衡是指在一个博弈中,参与者选择的策略组合使得没有任何一个参与者单方面改变自己的策略能够获得更高的收益。

纳什均衡是博弈论的核心概念,用来描述博弈中的稳定状态。

3. 零和博弈(Zero-sum Game):零和博弈是指当其中一个参与者获得了收益,另一个参与者就会产生相应的损失,总收益为零。

在零和博弈中,参与者之间的利益完全相反,他们的决策是对立的。

4. 混合策略(Mixed Strategy):混合策略是指在博弈中,参与者以一定概率选择不同的纯策略。

混合策略在博弈论中用来描述参与者的随机决策,可以通过计算期望收益来确定最优混合策略。

5. 博弈树(Game Tree):博弈树是用来表示博弈过程的树状结构,每个节点代表一个博弈的状态,边代表参与者的策略选择。

博弈树可以用来推导纳什均衡策略和分析博弈过程。

6. 合作博弈(Cooperative Game):合作博弈是指参与者之间可以合作达到更好的结果的博弈形式。

在合作博弈中,参与者通过互相合作,在利益最大化和成本最小化之间进行协商和决策。

7. 非合作博弈(Non-cooperative Game):非合作博弈是指参与者之间独立地做决策,不进行合作和协商的博弈形式。

在非合作博弈中,参与者根据自身利益进行策略选择,涉及策略选择和对手的预测。

8. 进化博弈(Evolutionary Game):进化博弈是将生物进化的概念引入博弈论中的一种模型。

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是研究决策者在互相影响的情况下做出最佳决策的数学模型和方法。

在博弈论中,决策者被称为玩家,他们的决策会受到其他玩家的影响。

以下是博弈论的一些重要知识点的总结:1.资料和约定-玩家:博弈论中的决策者。

-策略:玩家可以采取的行动。

-支付:玩家根据博弈结果获得的效用或价值。

-最优策略:在给定博弈条件下,可以使玩家获得最大效用的策略。

-纯策略和混合策略:纯策略是指玩家在每次博弈中都采取相同的行动;混合策略是指玩家以一定概率采取不同的行动。

2.标准形博弈-扩展形式:博弈者按照时间次序做出决策,每个决策节点有多个玩家可以选择的动作。

-纳什均衡:在标准形博弈中,如果所有玩家都不愿意单方面改变他们的策略,则该策略组合是纳什均衡。

-最优反应函数:针对每个玩家的策略组合,最优反应函数给出了该玩家的最佳策略。

-支配策略:一个策略在任何情况下都能够给出玩家更好的结果,那么我们可以说这个策略是支配的。

3.矩阵博弈-矩阵:博弈论中描述玩家策略和效用的表格。

-矩阵博弈的解:通过找到纳什均衡,我们可以得出矩阵博弈的解决方案。

-互动博弈:双方玩家的效用都取决于对方的策略选择。

4.博弈树-博弈树:根据博弈的时间顺序和玩家之间的相互影响,构建的树形结构。

-极小极大算法:用于确定博弈树上的最佳策略。

- alpha-beta剪枝:通过剪枝,减少博弈树的节点数量,从而提高效率。

5.进化博弈论-重复博弈:博弈过程被连续重复进行,玩家可以根据之前的结果来调整策略。

-演化稳定策略:一个策略集合中的策略,在当前环境下被所有玩家采纳并且难以被其他策略取代。

6.合作博弈论-合作博弈:玩家可以自由选择与其他玩家联合合作,并共享所获得的效用。

-特征函数:描述合作博弈的效用分配。

-核心:合作博弈中所有合法的效用分配的集合。

- Shafer值:一种用于将效用分配给个体的方法,使得每个个体的效用都能够得到公平分配。

博弈论是多学科交叉的研究领域,应用广泛,涉及经济、管理、政治等多个领域。

博弈论基础知识汇总

博弈论基础知识汇总

博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。

一种是“进化博弈论方法”。

它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。

另一种新方法是“重复博弈论方法”,它运用更精细的均衡概念,如“子博弈精炼均衡”来分析历史与现实中的制度选择与变迁过程。

基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。

其中局中人、策略和收益是最基本要素。

局中人、行动和结果被统称为博弈规则。

博弈主要可以分为合作博弈和非合作博弈。

合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈、从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。

完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

博弈论看法博弈论的基本假设:参与人追求利润最大化。

博弈论笔记

博弈论笔记

博弈论1.在一场博弈中,你必须考虑对方的选择,以确定你自己的最优选择,而对方也必须考虑你的选择来确定他的最优选择。

2.赢利:在博弈中所得到的。

3.博弈最本质的特征:行动及相互影响又相互依赖。

4.博弈:所谓博弈,就是策略性的互动决策。

5.弱者努力去维持一个稳定的三角结构,即于次强者联盟,但却不愿意消灭真正的强者。

6.既然是兔死狗烹,那么最好的策略就是不要让兔子全死掉。

7.博弈论的应用领域:信息经济学,其基本模型是逆向选择和信息甄别。

8.显性歧视,即根据外在特征进行歧视。

9.一个博弈至少包括三个要素:局中人,局中人可选的行动,局中人的盈利。

10.应当随时考虑别人的利益,条件是不这样做自己的利益就会受到损害。

11.优势策略与劣势策略。

如果两个人都选择其优势策略而达到的均衡称为优势策略纳什均衡。

12.搭便车行为的产生很大程度上与缺乏产权界定或产权配置的无效率有关。

13.纳什均衡:在该状态下每个参与人所采取的策略都是对于其他参与人的策略的最优反应。

14.最优反应:给定对手选定一个策略,则我选择一个策略比选择其他策略都要好。

15.相关均衡;如果博弈的参与人可以根据某个共同观测到的信号采取行动,就可能出现相关均衡。

16.分析许冠博弈的一个重要思路:向前展望,向后推理,即面向未来,思考现在,站在未来的立场上来确定现在的最优行动。

17.所谓均衡路径,即指在每一个决策阶段,没有人会偏离这条路径。

这条路径所代表的策略均衡被称作子博弈完美均衡。

18.逆向归纳的步骤:首先,从最后阶段行动的参与人决策开始考虑。

然后,考虑次后阶段行动的人。

19.博弈中,威胁和承诺是否可信,不应听对手说了什么,而应看他做了什么。

20.。

博弈论知识点笔记总结

博弈论知识点笔记总结

博弈论知识点笔记总结导论博弈论是一门研究决策者在相互竞争环境中所做出的决策的学科。

在博弈论中,决策者被称为“玩家”,他们之间通过不同的策略来竞争、合作或者对抗。

博弈论可以应用于各种领域,包括经济学、政治学、生物学等。

其研究对象从两人博弈到多人博弈,从完全信息博弈到不完全信息博弈,为了更好地解决博弈问题,博弈论需要用到数学、计算机科学和逻辑学等工具。

博弈的定义在博弈论中,博弈由以下要素组成:1. 玩家:决策者被称为玩家,不同玩家拥有不同的决策空间和目标。

2. 策略:玩家选择的决策方案称为策略,在博弈论中一般表示为S1,S2等。

3. 支付和:玩家在每种策略组合下可以获得的回报。

博弈的分类根据博弈的研究对象和特点,博弈可以分为很多种类,其中比较常见的分类方式有以下几种:1. 根据玩家数量:- 两人博弈:博弈中仅有两名玩家。

- 多人博弈:博弈中有超过两名玩家。

2. 根据信息完整性:- 完全信息博弈:在博弈中,每名玩家可以知道其他玩家的所有信息。

- 不完全信息博弈:在博弈中,每名玩家无法获得其他玩家的所有信息。

3. 根据策略顺序:- 同时博弈:在博弈中,所有玩家同时选择决策方案。

- 顺序博弈:在博弈中,玩家按照一定的时间顺序依次选择决策方案。

博弈的基本模型1. 正交矩阵博弈正交矩阵博弈是博弈论中最基本的模型之一,在这种类型的博弈中,每名玩家的策略选择都会对其它玩家的选择产生一定的影响,并产生相应的收益。

在这种博弈中,每名玩家的收益都可以用一个矩阵来表示,这个矩阵被称为“正交矩阵”,通常用R表示。

2. 零和博弈零和博弈是博弈论中的另一种基本模型,它的特点是玩家的利益完全互相对立。

也就是说,一名玩家的收益就是另一名玩家的损失,反之亦然。

在这种博弈中,总的收益为零,因此被称为“零和博弈”。

3. 最佳响应和纳什均衡在正交矩阵博弈中,每名玩家都会尝试选择一种策略,使得自己的收益最大化。

这种策略被称为“最佳响应”。

而当每名玩家都选择了最佳响应后,得到的策略组合称为“纳什均衡”。

经济博弈大赛知识点总结

经济博弈大赛知识点总结

经济博弈大赛知识点总结一、博弈论基本概念1.博弈论的定义博弈论是研究决策者之间相互影响的一种数学分析方法。

在该理论中,参与者的每一种决策都会影响到其他参与者的收益,因此需要在多方利益中进行权衡和选择。

2.博弈论的基本概念(1)参与者:指参与决策的一方或多方。

(2)策略:指参与者的行动选择。

(3)效用:指参与者从某种行动选择中得到的收益。

(4)收益矩阵:指博弈过程中不同参与者在不同策略组合下得到的收益组合。

3.博弈论的基本分类(1)合作与非合作博弈:合作博弈是指参与者之间可以进行合作协商,共同选择最优策略;非合作博弈是指参与者之间没有合作协商,各自选择最优策略。

(2)零和博弈与非零和博弈:零和博弈是指参与者的利益总和为零,一方得利即另一方受损;非零和博弈是指参与者的利益总和不为零,可以互惠互利或共同受益。

二、博弈论的基本模型1.纳什均衡纳什均衡是指在博弈论中,参与者的策略选择达到一种平衡状态,任何一个参与者都没有动机改变自己的策略。

纳什均衡是博弈理论的核心概念,对于非合作博弈中的理性参与者来说,最终会达到纳什均衡状态。

2.囚徒困境囚徒困境是博弈论中的一个经典模型,描述了两名囚犯被捕后面临的选择。

在这种情况下,即使两名囚犯都采取自己最佳的策略,他们最终都会面临到一种不利的结果。

这个模型的实质是说明了在自利最大化的前提下,最终可能导致共同损失的结果。

3.拍卖博弈拍卖博弈是指卖家和买家之间进行的策略与竞争。

在这种场景下,卖家需要选择出售物品的方式,而买家需要决定出价的高低。

这种博弈的结构包括英国拍卖、封闭式拍卖、荷兰拍卖等不同的竞争方式。

4.博弈树博弈树是一种博弈模型的图形表示方式,以树状的形式展现参与者的策略选择和结果。

博弈树有助于分析博弈的决策过程和可能的结果,帮助参与者制定最优策略。

5.拉力博弈拉力博弈是指在博弈中的一种竞争形式,即参与者面对的是关于资源的竞争和纷争。

这种博弈模型常见于市场竞争和企业之间的竞争,对于提高市场份额和竞争力有重要意义。

博弈论总复习提纲

博弈论总复习提纲

总复习内容一、静态博弈部分1、纯策略均衡的博弈模型---------“囚徒”困境博弈需要解决的问题:要求会画支付矩阵、分析博弈的结果(即均衡分析)、会通过博弈分析的方法,解决与这类博弈相同或相近的实际问题,就是由此博弈衍生出来的问题,就所谓制度、规则等对于结果的重要性分析。

2、混合策略博弈模型要求:懂得如何判断什么情况下博弈属于混合策略博弈------即博弈没有纯策略博弈存在的情况下,就转化成混合策略博弈。

要求:会计算混合策略的概率罪犯不盗 盗巡逻 警察休息要求:会用混合策略博弈的原理解释“监管者与被监管者”之间博弈过程中的制度安排,以避免管理中“激励悖论”问题。

二、动态博弈部分1、要求:熟悉动态博弈的概念、博弈方策略、支付的表达形式,即博弈树或扩展型。

2、要求:弄懂博弈树中信息节点处的数字含义。

如:3、通过博弈树的研究分析,能找到动态博弈的均衡路径或者叫策略均衡4、能解释一些其他由此衍生出的博弈问题。

三、合作博弈问题1、弄清楚合作博弈与非合作博弈的区别与联系以及它们之间的转化条件2、合作博弈的利益分配和成本分担问题3、合作博弈联盟的规模及稳定性问题分析。

博弈根据是否可以达成具有约束力的协议分为合作博弈和非合作博弈。

合作博弈研究人们达成合作时如何分配合作得到的收益,即收益分配问题。

合作博弈采取的是一种合作的方式,或者说是一种妥协。

妥协其所以能够增进妥协双方的利益以及整个社会的利益,就是因为合作博弈能够产生一种合作剩余。

这种剩余就是从这种关系和方式中产生出来的,且以此为限。

至于合作剩余在博弈各方之间如何分配,取决于博弈各方的力量对比和技巧运用。

因此,妥协必须经过博弈各方的讨价还价,达成共识,进行合作。

在这里,合作剩余的分配既是妥协的结果,又是达成妥协的条件。

合作博弈是研究人们达成合作时如何分配合作得到的收益,即收益分配问题。

而非合作博弈是研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论知识点总结博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。

2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。

行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。

信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。

1、2、 既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。

但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。

4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。

战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

1、参与人集合 :2、每位参与人非空的战略集 S i3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。

与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程{1,2,...,}n Γ=11(,...,,...,)ni i n i s s s s ==∏中遇到决策问题时序列结构的分析。

包含要素: 1、 参与人集合 2、 参与人的行动顺序,即每个参与人在何时行动; 3、序列结构:每个参与人行动时面临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。

比较:1、战略式博弈从本质上来讲是一种静态模型。

2、扩展式博弈从本质上来讲是一种动态模型。

5、博弈论分类:按决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议可分为:1、合作博弈(强调团体理性、团体最优决策、效率){1,2,...,}n Γ=2、非合作博弈(强调个人理性,个人最优决策)按参与人行动先后顺序可分为:1、静态博弈:博弈中参与人同时行动,或者虽然不是同时行动,但是在行动前不知道其他参与人所选择的行动。

2、动态博弈:参与人的行动有先后顺序,后行动者获得先行动者的行动信息。

按参与人对信息的掌握程度可分为:1、完全信息:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素。

2、不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。

按决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。

静态动态完全信息完全信息静态博弈均衡:纳什均衡完全信息动态博弈均衡:子博弈精炼纳什均衡不完全信息不完全信息静态博弈均衡:贝叶斯纳什均衡不完全信息动态博弈均衡:精炼贝叶斯纳什均衡6、根据所学这四种博弈的特点对这四种博弈做一个对比分析:二、四种博弈类型具体分述1、完全信息静态博弈1.1 完全信息静态博弈特点:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。

战略和行动相同。

1.2 完全信静态博弈相关概念:以新产品开发博弈举例说明:参与人:参与人1和2。

参与人的集合卡表示为:Γ={1,2,…n}.表示所有参与人的集合,在新产品开发博弈中为:Γ={1,2}行动:开发、不开发。

Ai表示参与人行动的集合。

新产品开发博弈中参与人的行动集合为A1=A2={a,b},其中a 为开发,b为不开发。

a={a1,a2…an}表示参与人的行动组合。

新产品开发博弈中为:A={(a,a),(a,b),(b,a),(b,b)}战略:参与人的行动规则。

在博弈中的战略可以定义为从观测集到行动集的映射关系,即: Si:Xi—Ai。

用Si={si}表示参与人所有战略的集合。

在n人博弈中,用S=(s1,s2,s3…,s n)表示 n 个参与人的战略组合,它表示博弈中每个参与人采取战略si的一种博弈情形。

在完全信息静态博弈中,由于不存在决策时序上的差异,所有参与人在同一决策时点即博弈开始的那一时刻决策,因此,所有参与人面临的决策情形都只有一种,所以,参与人的战略集与行动集相同。

支付:是指参与人在博弈中的所得。

一般情况下也是用效用函数来表示参与人在博弈中的所得。

因此,参与人的支付就可表示为一种特定博弈情形下参与人得到的确定效用水平或期望效用水平。

支付一般用ui(1,2,…,n)表示参与人i的支付(效用水平),支付组合u=(u1,u2,…un)表示参与人在特定博弈情形下所得到的支付,其中为参与人i的支付。

因此,参与人 i=(i=1,2,…,n)的支付就可表示为:ui=ui(si ,s-i).信息:是参与人所具有的有关博弈的所有知识,如有关其它参与人行动或战略的知识、有关参与人支付的知识等等。

在“新产品开发博弈”中,如果两个企业都知道市场需求,那么这样的博弈情形就是我们前面所提到的完全信息假设;如果两个企业中至少有一个不知道市场需求,那么这样的博弈情形就是我们前面所提到的不完全信息假设。

1.3 纯战略纳什均衡纯战略:参与人在给定信息下只选择一种特定(或确定性)的战略混合战略:混合战略解释了一个参与人对其他参与人所采取的行动的不确定性,它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略。

纯战略纳什均衡中包括:占有均衡、重复剔除劣战略均衡、一般纯战略纳什均衡等。

1、占优均衡占优战略:参与人的最优战略si *与其他参与人的选择 s -i 无关。

无论其他参与人选择什么战略,参与人的最优战略总是唯一的,这样的最优战略称之为“占优战略”。

在n 人博弈中,如果对于所有的其他参与人的选择s -i ,si *都是参与人 i 的最优选择则称si *为参与人的占优战略。

在n 人博弈中,如果对所有参与人都存在占优战略si *,则占优战略组合si*=(s1 * si2*,…, sn *)称为占优战略均衡。

如果所有参与人都有占优战略存在,那么占优战略均衡就是唯一的所有理性参与人可以预测到的博弈结果。

2、重复剔除劣战略如果在一个博弈中,参与人不存在占优战略,但是参与人i 存在两个战略,其中一个战略叫另一个战略的所得效用要大,则理性的参与人绝对不会选择战略。

严格劣战略: *(,)(,)i i i i i i u s s u s s -->(,)(,)iiiiiiu s s u s s --'''>(,)(,)iiiiiiu s s u s s --'''>(,)(,)iii i i u s su s s --'''≥弱劣战略:若重复剔除过程一直可持续到只剩下唯一的战略组合,则该战略组合即为重复剔除的占优均衡,此时该博弈是重复剔除战略可解。

要点:再重复剔除过程中,如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;如果剔除的是弱劣战略,均衡结果可能与剔除顺序有关。

3、一般Nash均衡Nash均衡是完全信息静态博弈的解的概念,在完全信息静态博弈中,构成Nash均衡的战略是不可剔除的,即不存在任何一个战略严格优于Nash均衡战略。

求解纳什均衡的方法划线法、箭头法。

划线法:1、考察参与人1的最优战略2、用上述方法找出参与人2的最优战略3、找出最优战略组合箭头法:1、 对于每个战略组合,检查是否有参与人会偏离这个战略组合2、 直至找出没有参与人会偏离的战略组合纯战略均衡反映函数:各博弈方选择的纯策略对其他博弈方纯策略的反应。

1.4 混合战略纳什均衡混合战略: 在博弈中,对任一参与人i ,设Si={S i 1,…,S i k},则参与人i 的一个混合战略为定义在战略集Si 上的一个概率分布δi={δi 1,…, δi k },其中δi j (j=1,…,k )表示参与人i 选择战略 表示参与人i 选择战略S i j的概率的概率,即δi j满足0≦δi j ≦1,其中概率之和为1。

支付:混合战略的支付为各种概率下收益的加权平均。

混合战略纳什均衡:在博弈 中,混合战略组合δi={δ1*,…, δn*}为一个Nash 均衡。

当且仅11{;,...,;,...,}n n G S S u u =Γ11{;,...,;,...,}n n G S S u u =Γ***,,(,)(,)i i i i i i i i i v v σσσσσ--∀∈Γ∀∈∑≥有当。

混合战略Nash均衡的求解:1.支付最大化法;2.支付等值法;混合战略均衡反映函数:在混合策略的范畴内,博弈方的决策是选择概率分布,因此,反应函数就是一方对另一方选择的概率分布的反应。

聚点均衡:在现实生活中,参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点”均衡。

这些信息可能与社会文化习惯、参与人过去博弈的历史有关。

不同均衡概念之间的关系:占优均衡<重复剔除劣战略均衡<纯战略纳什均衡<混合战略纳什均衡1.5 纳什均衡的多重性与存在性存在性:每个有限战略式博弈(参与人与相应的战略集均为有限)必存在纳什均衡,这个均衡可能是纯战略纳什均衡,也可能是混合战略纳什均衡。

多重性:一个博弈可能有多个均衡,博弈论并没有一个一般的理论证明,哪一个纳什均衡结果一定能出现。

2、完全信息动态博弈2.1 完全信息动态博弈特点:在博弈开始之前参与人之间的信息不存在不确定性,但是参与人行动存在先后顺序。

在完全信息动态博弈中,为了表示参与人之间的信息掌握关系,引入了信息及的概念。

2.2 完全信息动态博弈有关概念:信息集:信息集I i是参与人i决策结的一个集合,它满足以下两个条件:中的每个决策结都是参与人i的决策1、 Ii结;2、当博弈到达I i时,参与人i知道自己处在该信息集中的某个决策结,但不知道是哪一个。

在博弈树中,属于同一信息集的决策结一般用虚线连接起来。

结:包括决策结和终点结两类。

决策结是参与人采取行动的点时点,终点结是博弈行动路径的终点。

一个信息集可能只包含一个决策结,也可能包含多个决策结。

如果只包含一个决策结的信息集就是但单结信息集。

如果博弈中所有信息集都是单结的则成为完美信息博弈。

子博弈:是原博弈的一部分,它始于原博弈中一个单结信息集中的决策结x ,并由决策结x 及其后续结共同组成。

相关文档
最新文档