博弈论概要

合集下载

博弈论百度百科

博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。

在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。

所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。

不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。

博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

《博弈论》知识点总结

《博弈论》知识点总结

《博弈论》知识点总结博弈论作为一门交叉学科,涵盖了数学、经济学、政治学、心理学等多个学科领域。

其研究对象包括零和博弈、非零和博弈、合作博弈、序贯博弈等。

博弈论的应用领域也非常广泛,包括经济学、政治学、社会学、管理学等。

博弈论在求解决策问题、预测市场行为、推导策略和解释社会现象等方面有着广泛的应用。

博弈论的主要内容包括:1.博弈的定义博弈是指互相影响的参与者所进行的一种决策活动。

在博弈中,每个参与者都要做出一个选择,其结果受到其他参与者的选择的影响。

博弈的结果取决于所有参与者的选择。

2.博弈的基本元素博弈的基本元素包括参与者、策略和结果。

参与者是进行决策的主体,策略是参与者可以选择的行为方式,结果是参与者选择策略后所得到的收益或损失。

3.博弈的分类根据参与者的利益关系和决策方式,博弈可以分为零和博弈和非零和博弈。

零和博弈指参与者的利益完全相反,一方获利即意味着另一方损失,而非零和博弈则指参与者的利益可能存在重叠或者是共同合作的情况。

4.博弈的解博弈的解是指在博弈参与者做出决策选择之后,通过某种机制确定最终的结果。

常见的博弈解包括纳什均衡、霍夫达均衡、帕累托最优等。

5.博弈论的应用博弈论在经济学、政治学、社会学等领域有着广泛的应用。

在经济学中,博弈论可以用来解释市场行为、预测价格变动等。

在政治学中,博弈论可以用来分析政治决策、议事程序等。

在社会学中,博弈论可以用来解释群体行为、合作问题等。

博弈论是一门具有重要理论意义和广泛应用价值的学科,它不仅可以帮助人们更好地理解决策制定的规律和机制,还可以为人们提供更科学的决策指导。

在日常生活中,我们可以通过学习和应用博弈论的知识,更加理性地做出决策,并更好地理解他人的选择和行为。

希望未来博弈论能够继续在各个领域发挥作用,为人类社会的进步和发展做出更大的贡献。

博弈论讲的是什么

博弈论讲的是什么

博弈论讲的是什么
博弈论是研究决策制定者之间相互关系的一门数学分支,主要关注在冲突和合作的情境下,个体或群体的最佳决策和策略选择问题。

博弈论的研究对象可以包括个体、团体、国家、公司等各种决策制定者。

以下是博弈论的一些核心概念和主要内容:
1.博弈的定义:博弈是指多方参与者在特定环境下做出决策,彼此之间的决策会相互影响。

每个参与者的目标是通过制定最佳策略来最大化其利益。

2.参与者:博弈论中的参与者被称为“玩家”,可以是个体、群体、国家等。

每个玩家都有自己的目标和利益,但他们的决策会影响其他玩家的结果。

3.策略:策略是玩家在博弈中可选的行动或决策。

博弈论研究玩家如何选择最优策略以最大化他们的利益。

4.支付:支付是指每个玩家根据博弈的结果获得的收益或损失。

博弈论分析玩家如何在不同策略下分配支付,以及如何最大化其期望收益。

5.博弈的分类:博弈可以分为零和博弈和非零和博弈。

零和博弈中,一个玩家的利益损失就是其他玩家的利益增益,总和为零。

非零和博弈中,各玩家的利益不一定互相抵消,可以共赢或共输。

6.博弈的解:博弈论研究如何找到博弈中的均衡点或解决方案。

最著名的解决概念之一是纳什均衡,它描述了一种情况,在该情况下,每个玩家的策略是对方玩家策略的最佳响应。

7.博弈的应用:博弈论在经济学、政治学、生物学、计算机科学
等领域有广泛的应用。

例如,在商业谈判、拍卖、国际关系、网络安全等方面,博弈论都可以提供洞察和指导。

总体而言,博弈论通过数学建模和分析,帮助我们理解在决策制定者之间互动的情境中,各方如何做出最佳的决策以达到其个体或集体的目标。

博弈论百度百科

博弈论百度百科

博弈论百度百科博弈论是一门研究决策制定和决策结果的学科,它是应用数学的一个分支,通过运用数学和逻辑工具,探讨参与者在互动决策中的最佳策略选择。

在博弈论中,参与者被称为玩家,他们根据自身利益和目标来做出决策。

博弈论适用于各种不同领域的情境,包括经济学、政治学、生物学等。

一、概述博弈论的研究对象是策略性互动。

在一个博弈中,每个玩家都会依据一定的策略选择进行行动,而这个选择可能会受到其他玩家的影响。

博弈论试图理解和分析在这种互动中,参与者如何做出决策,并找到最优的解决方案。

博弈论的核心概念是博弈,一个博弈可以用一个四元组表示:(N, A, U, F),其中:- N表示参与博弈的玩家集合;- A表示每个玩家可选的行动集合;- U表示每个玩家的效用函数,用于衡量不同结果对该玩家的好坏程度;- F表示每个玩家的信息集合。

信息集合是指每个玩家在博弈过程中所了解的信息。

二、博弈论的重要概念1. 纳什均衡纳什均衡是博弈论中最重要的概念之一,指的是在一个博弈中,所有玩家选择的策略组合,使得任何玩家都没有动机单方面改变自己的策略。

纳什均衡是一个稳定状态,玩家之间不再有改变策略的动机。

2. 零和博弈与非零和博弈博弈可以分为零和博弈和非零和博弈。

零和博弈是指参与博弈的玩家的收益之和为零,即一方获利必然导致另一方的损失。

非零和博弈是指参与博弈的玩家的收益之和不为零,即可以存在多方共同受益的情况。

3. 微观博弈与宏观博弈微观博弈是指研究个体玩家之间的策略性互动,关注的是个体决策的结果。

宏观博弈是指研究整体群体之间的策略性互动,关注的是全局结果。

三、应用领域博弈论的研究在众多领域中都具有广泛的应用。

以下是博弈论在一些领域的应用举例:1. 经济学博弈论在经济学领域中有着广泛的应用。

它可以用来研究市场竞争、合作与冲突、价格形成等经济问题。

例如,博弈论可以用来分析竞争市场中的价格战和垄断市场中的价格定价策略。

2. 政治学博弈论在政治学领域中也有着重要的应用。

完全控制状态下的博弈论-概述说明以及解释

完全控制状态下的博弈论-概述说明以及解释

完全控制状态下的博弈论-概述说明以及解释1.引言1.1 概述博弈论是一门研究决策制定和策略选择的数学理论,它研究的是多个参与者之间的相互作用、利益冲突和策略选择问题。

博弈论的研究对象可以是人类、政府、企业等拥有决策能力的个体或组织,它们在不同的情境下通过制定策略来达到自己的目标。

在博弈论中,我们通常关注的是参与者之间的冲突和合作,并通过数学建模和分析来解决这些问题。

博弈论可以用于分析多个领域,如经济学、政治学、社会学等,它提供了一种理论基础,使我们能够更好地理解和解决现实生活中的决策问题。

完全控制状态下的博弈论是博弈论中的一个重要分支,它假设参与者具有完全的信息和足够的能力,能够准确地预测对方的行动和决策,从而在博弈过程中能够做出最优的决策。

在这种状态下,参与者可以通过精确的计算和分析来制定优势策略,有效地掌控博弈的走向。

本文将重点讨论完全控制状态下的博弈论概念、模型和应用。

首先,我们将介绍完全控制状态下的博弈论的基本概念,包括完全信息、最优策略和纳什均衡等。

然后,我们将探讨完全控制状态下的博弈论的数学模型,包括正规形式和扩展形式。

最后,我们将分析完全控制状态下的博弈论在实际应用中的一些案例,包括经济决策、政治决策和社会决策等领域。

通过对完全控制状态下的博弈论的深入研究,我们可以更好地理解参与者之间的决策行为和相互作用,为决策制定者提供更科学、更有效的决策依据,并为未来的研究和实践提供一些有益的启示。

(Word count: 263)1.2 文章结构文章结构部分的内容应包括对整篇文章的组织和内容的概述。

在这部分中,需要说明文章的主要章节和每个章节的内容概要。

以下是可能的内容示例:文章结构:本文将从引言、正文和结论三个部分来详细介绍完全控制状态下的博弈论的相关内容。

引言部分将在第一章进行阐述,主要包括概述、文章结构和目的。

概述部分将对完全控制状态下的博弈论的基本概念进行简要介绍,以引起读者的兴趣。

博弈论知识简要

博弈论知识简要

寻找混合策略纳什均衡的思路
• 令各博弈方随机选择纯策略的概率分布,满足使其 他博弈方采用不同策略的期望得益相同,从而计算 出各个博弈方随机选择各纯策略的概率。
• 在猜硬币博弈中,设盖硬币方出正面的概率为p, 出反面的概率为1-p。则猜硬币方猜正面的期望得 益为p·1+(1-p)·(-1)=2p-1,猜反面的期望得益 是p·(-1)+(1-p) ·1=1-2p,令二者相等,得p=1/2。 盖硬币方的混合策略是以(1/2,1/2)的概率随机 选择正面和反面。类似的,可以计算出猜硬币方的 混合策略。
S
i

1,2,...
表示 Si 中的某个特定策略。在静态博弈中,Si 中包含
的所有
S
i
就是第
i 个参与人的所有可选择的行动;ui
是第 i 个参与人的得益函数,它是所有参与人选择的
某个特定策略组合的函数,即
ui
ui
S1
,...,
S
i
,...,
S
n

•例 两寡头的产量博弈中,参与人就分别是编号为1和2的两个 企业;其各自的策略选择就是选择各自的产量;其各自的 策略空间就是其各自所能够生产的各种产量的集合。如果 假设两个企业,都能够生产大于0的任何数量的产量,那
下选择什么行动的预先安排; • 行动:参与人在博弈过程中轮到自己选择时所作的某个具体决策; • 得益:参与人从博弈中获得的效用,一般是所有参与人的策略
或行动的函数,这是每个参与人最关心的东西;
• 信息:参与人在博弈中所知道的关于自己以及其他参与人的行 动、策略及其得益函数等知识;
• 均衡:所有参与人的最优策略或行动的组合;
精炼贝叶斯均衡 泽尔腾等

博弈论概述

博弈论概述
“坦白”是A的占优策略。同样,“坦白”也是B的占优策略。
一般地,称 si*为局中人i的(严格)占优策略, 若对应所有的
si , s i*是i的严格最优策略 , 即:
ui (si*, si ) ui (si' , si ) si , si' si*
对应地,所有的 si' si* 被称为“劣策略”。注意:这
甲的策略
1
2
3
乙的策略
1
7
8
9
2
6
2
3
3
5
4
0
1.乙先行动。若乙选1,则甲选3;乙选2,则甲选1;乙选3, 则甲选1。乙在行动时会估计到甲的行动,它估计三种选择 中的最高代价为策略1(损失900万),其次为策略2(损失 600万),最低为策略3(损失为500万)。因此,乙必选代 价最低的策略3。——最大最小原理。结论:乙选择3,甲选 1作为回应,乙损失500万,甲获益500万。
在博弈论里,一个博弈可以有两种表述方式:一种是策 略式(strategic form representation)表述,另一种是 扩展式( extensive form representation )表述。前者 适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式 表述中,所有参与人同时选择各自的策略,所有参与人选择 的策略一起决定每个参与人的支付。
2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E.

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。

它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。

下面是博弈论中的一些重要知识点的总结。

1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。

-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。

-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。

2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。

-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。

3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。

-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。

-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。

4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。

-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。

-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。

5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。

-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。

-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。

6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。

-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。

-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。

7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。

-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。

博弈论的主要研究内容

博弈论的主要研究内容

博弈论的主要研究内容博弈论是研究决策制胜的一门学科,它通过分析各方的利益和策略来预测和解决冲突和竞争问题。

博弈论的研究内容包括博弈模型、博弈解的概念和方法、博弈均衡理论、博弈的应用等多个方面。

博弈模型是博弈论的基础。

博弈模型是对博弈参与者、信息和策略的抽象和描述。

在博弈模型中,参与者通常被称为玩家,他们的决策会受到对手的决策和可能的结果影响。

博弈模型可以是非合作的,即玩家之间没有合作,也可以是合作的,即玩家之间可以通过协商和合作达成某种共识。

博弈解的概念和方法是博弈论的重要内容。

博弈解是通过合理的分析和推理找到的一种可行的策略或决策方案。

常见的博弈解概念包括纳什均衡、完美均衡、次序均衡等。

纳什均衡是最常用的博弈解概念,它指的是在一个博弈中,每个玩家都选择了最优的策略,而且没有动机去改变自己的策略。

通过分析和计算,可以找到博弈模型中的纳什均衡点,从而得到博弈的解。

博弈均衡理论是博弈论的核心内容之一。

博弈均衡理论研究的是在一个博弈中,玩家之间如何通过策略选择来达到一个稳定的状态。

博弈均衡可以分为纳什均衡、帕累托均衡、科尔曼均衡等不同类型。

纳什均衡是最常见的博弈均衡,它指的是在一个博弈中,每个玩家都选择了最优的策略,而且没有动机去改变自己的策略。

帕累托均衡是指在一个博弈中,没有任何玩家可以通过改变策略来获得更好的结果。

科尔曼均衡是指在一个博弈中,每个玩家都按照对方的期望行动,而对方又按照自己的期望行动,从而形成一种稳定的状态。

博弈的应用是博弈论的重要研究内容之一。

博弈论可以应用于经济学、政治学、生物学等多个领域。

在经济学中,博弈论可以用于分析市场竞争、价格战略等问题,帮助企业制定最优的决策。

在政治学中,博弈论可以用于分析国际关系、选举策略等问题,帮助政府和政治组织做出正确的决策。

在生物学中,博弈论可以用于分析动物行为、进化策略等问题,帮助科学家理解生物界的竞争和合作。

博弈论的主要研究内容包括博弈模型、博弈解的概念和方法、博弈均衡理论、博弈的应用等多个方面。

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳博弈论是研究决策者之间相互作出决策时,通过考虑对方的行动和可能的结果来进行决策的一门学科。

它主要关注对策略的选择与分析,以及对方可能的反应。

下面我们来对博弈论的知识点进行总结归纳。

1.普通博弈和扩展博弈:博弈论分为两类,即普通博弈和扩展博弈。

普通博弈是指参与者在同一时间同时做出决策的博弈,扩展博弈是指参与者在不同的时间节点上做出决策的博弈。

2.博弈的组成要素:博弈论研究的关键要素包括博弈参与者、参与者的策略、参与者的支付、参与者的效用等。

博弈论的目标是通过合理的策略选择来实现最优的支付和效用。

3.纳什均衡:纳什均衡是博弈论中一个重要的概念,指的是当每个参与者都选择了最优的策略后,没有人会改变自己的策略来获得更好的支付。

纳什均衡是博弈的稳定状态。

4.博弈的分类:根据参与者的合作与否,博弈可以分为合作博弈和非合作博弈。

合作博弈中,参与者可以通过合作与其他参与者达成协议,而非合作博弈中,参与者彼此之间没有合作关系。

5.零和博弈和非零和博弈:零和博弈是指所有参与者的支付之和为零的博弈,即一方获利就意味着其他方会损失相应的支付。

非零和博弈是指所有参与者的支付之和不为零的博弈,即所有参与者都有可能获得一定的支付。

6.博弈的解析方法:解析方法是通过分析博弈的特性和参与者的策略来研究博弈的方法。

解析方法包括主要包括支配策略法、混合策略法、最佳反应函数等。

7.博弈的策略选择:博弈论研究的核心问题之一是参与者在博弈中如何选择最优的策略。

策略选择可以通过分析博弈的收益矩阵和参与者的目标来实现。

8.博弈的应用领域:博弈论的应用十分广泛,包括经济学、政治学、生物学、社会学等多个领域。

在经济学中,博弈论被用来研究市场竞争、价格形成等问题,在政治学中,博弈论被用来分析政治决策与合作等问题。

9.孤立型博弈和重复博弈:孤立型博弈是指只进行一轮博弈的情况,参与者只能根据当下的情况来做出决策。

重复博弈是指进行多轮博弈的情况,参与者可以根据之前的决策和结果来进行策略的调整。

好书推荐:《博弈论》

好书推荐:《博弈论》

好书推荐:《博弈论》博弈论的思想在古代便产生了,只是它在初期仅研究象棋、赌博中的一些胜负问题,并未形成专业的理论系统。

当时的人们对于博弈的认识只停留在经验的认知和积累上,并未形成专业的理论基础,正式成为一门学科则是在20世纪初期。

20世纪20年代末期,约翰,冯.诺依曼正式证明了博弈的基础原理,在此基础上宣告博弈论诞生,因此,冯.诺依曼被称为“博弈论之父”。

再到20世纪40年代中期,一本跨越时代的巨著《博弈论与经济行为》问世,而作者正是冯.诺依曼和摩根斯坦。

这两位卓越的数学家经过不断研究,最终将最初的二人博弈理论推广到了n人博弈理论,还将博论成功应用到经济领域,他们莫定了博弈论的基础和理论体系。

假设现在有人能够让博弈行为接近野蛮,或者让人类之间的支善行为和凶残行为之间的差距无限大,那么谁就更容易在博弈中取胜。

这是(博弈圣经》中提到的一段话。

提起博弈论,便需要说起“孤独的天才”约翰.纳什,他更是博弈论的天才。

约翰、纳什在20世纪中期正式发表了一篇论文(n人博的均衡点》,对博弈论起到了良好的推荐作用。

除此之外,哈桑尼与赛尔顿对博弈论的研究和贡献,也为博部论的发展起到了催化作用。

再列(博弈圣经)问世,它与原有的博弈论有着极大的区刚、最大的差异在于《博弈圣经》中论述了博弈的文化理论,突出表现了人类博弈占据的优势。

事实上,(博弈圣经》最大的优点是,它能够将原有的博弈理论正式应用到现实中,还能帮助普通大众通过自身的学习和研究成为博弈的真正高手。

它还能将博弈论应用到政治、经济、文化等多个领城,对于个人的生活和发展也能起到促进和推动作用。

简单来说,博弈的基本构成要素分为决策人、对抗者、生物亲序、局中人、策略、得失、次序。

所谓决策人,指的是在博弈的赛局中率先做出选择的一方,决策人往往会根据自己的经验、自身在对局中的感受、自身的状态等,率先做出一种具有方向性的选择。

在二人博弈对局中的对抗者,往往是选择滞后的那个人,需要做出与决策人的行为相反的选择,而且这个对抗者不仅选择落后,连行为与动作也是落后的,而且他的选择几乎是默认的、被动的,但是这将成为他最后的优势。

博弈论概论

博弈论概论

博弈论概述由于现代经济活动的规模越来越大,对抗性、竞争性越来越强,特别是寡头垄断或垄断竞争市场,竞争和决策较量更是厂商经营活动的核心内容,这些都使得人们越来越重视经济活动的环境条件及其变化,越来越重视竞争者或合作者的反应,因此经济决策的“博弈性”越来越强。

而且,博弈论在许多情况下所得出的结论更加符合经济现实和更加具有应用性,对参与经济互动的各方或国家政府的决策互动有更强的指导作用。

所以,研究博弈论是很必要的。

一.基本概念博弈:即一些个人,队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各允许选择的行为或策略中进行选择并加以实施,各自取得相应的结果的过程。

从上述定义可以看出,规定或定义一个博弈需要设定下列四个方面。

(1)、博弈的参加者(Players)。

即在所定义的博弈中究竟有哪几个独立决策、独立承担结果的个人或组织.对我们来说,只要在一个博弈中统一决策,统一行动、统一承担结果,不管一个组织有多大,哪怕是一个国家,甚至是由许多国有组成的联合国,都可以作为博弈中的一个参加方。

并且,在博弈的规则确定之后,各参加方都是平等的,大家都必须严格按照规则办事。

(2)、各博弈方各自可选择的全部策略(Strategies)或行为(Actions)的集合。

即规定每个博弈方在进行决策时,可以选择的方法,做法或经济活动的水平,量值等。

在不同博弈中可供博弈方选择的策略或行为的数量很不相同,在同一个博弈中,不同博弈方的可选策略或行为的内容或数量也常不同,有时只有有限的几种,甚至只有一种,而有时又可能有许多种,甚至无限多种可选策略或行为。

(3)、进行博弈的次序(Order)。

在现实的各种决策活动中,当存在多个独立决策方进行决策时,有时候需要这些博弈方的决策又有先后之分,并且有时一个博弈方还要作不止一次的决策选择。

这就免不了有一个次序问题。

因此规定一个博弈必须规定其中的次序,次序不同一般就是不同的博弈,即使博弈的其他方面都相同。

博弈论知识点总结

博弈论知识点总结

博弈论知识总结博弈论概述:1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论研究的假设:1、 决策主体是理性的,最大化自己的收益。

2、 完全理性是共同知识3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。

行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。

信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。

完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。

不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。

支付:决策主体在博弈中的收益。

在博弈中支付是所有决策主题所选择的行动的函数。

从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别:1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。

可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。

2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。

但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。

4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。

战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论一:基本知识1.1定义:博弈论;又称对策论;是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论;是研究竞争的逻辑和规律的数学分支..即;博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用;以及不同决策主体之间的均衡..1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数;是博弈最重要的基本要素..1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论..两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议binding agreement..倘若不能;则称非合作博弈Non-cooperative game..合作博弈强调的是集体主义;团体理性;是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大;强调个人理性、个人最优决策;其结果有时有效率;有时则不然..目前经济学家谈到博弈论主要指的是非合作博弈;也就是各方在给定的约束条件下如何追求各自利益的最大化;最后达到力量均衡..博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息;是否了解两个角度进行..把两个角度结合就得到了4种博弈:a、完全信息静态博弈;纳什均衡;Nash1950b、完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾1965c、不完全信息静态博弈;贝叶斯纳什均衡;海萨尼1967-1968d、不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾1975 Kreps; Wilson1982 Fudenberg; Tirole19911.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述 Strategic form; 扩展式表述Extensive form1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略;一个参与人的某个策略给他带来的支付值始终高于其他策略;或至少不劣于其他策略;则称该策略为该参与人的严格占优策略或占优策略..对于所有的s-i; si称为参与人i的严格占优战略;如果满足:uisi;s-i>uisi';s-is-i; si' sib、占优均衡:一个博弈的某个策略组合中;如果对应的所有策略都是各参与人的占优策略;则称该策略组合为该博弈的一个占优均衡..1.7重复剔除严劣策略均衡:a、“严劣”和“弱劣”的含义:设 s i’和s i’’是参与人i可选择的两个策略;若对其他参与人的任意策略组合s-i; 均成立u i s i’; s-i < u i s i’’; s-i; 则说策略s i’严劣于策略s i’’ ..上面式子中;若将“<”改为“≤”;则说策略s i’弱劣于策略s i’’ ..b、定义:重复剔除严格策略就是各参与人在其各自策略集中;不断剔除严劣策略…如果最终各参与人仅剩下一个策略;则该策略组合就被称为重复剔除严劣策略均衡..二:纳什均衡Nash Equilibrium2.1纳什均衡定义:对于一个策略式表述的博弈G= {N;S i; u i; i ∈N}; 称策略组合s=s1; …s i; …; s n是一个纳什均衡;如果对于每一个i ∈N; s i是给定其他参与人选择s-i={s1; … ;s i-1; s i+1; … ;s n} 情况下参与人i的最优策略经济理性策略;即:u i s i; s-i≥ u i s i; s-i; 对于任意的s i∈S i ;任意的i∈N均成立..通俗定义:纳什均衡是一种策略组合;给定对手的策略;每个参与人选择自己的最优策略..纳什均衡是一种稳定的策略组合:当所有参与人的选择公开以后;每个人都满意自己作出了正确的选择;没有人能得到更好的结果了..在博弈论中这种结果被称为纳什均衡NE..2.2定理:Nash在1950年证明:任何有限博弈;都至少存在一个NE——Existence of Nash Equilibrium..即在一个有n个参与人的策略式博弈G={S1;…;Sn; u1;…;un}中;如果n是有限的;且Si是有限集i=1;…;n;则该博弈至少存在一个纳什均衡在混合策略意义下Wilson1971证明;几乎所有有限博弈;都存在有限奇数个NE;包括纯策略NE和混合策略NE..——Oddness Theorem2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理 a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡;但反过来不一定成立;定理 b 纳什均衡一定不能通过重复剔除严劣策略方法剔除..2.4划线法先找出自己针对其他博弈方每种策略或策略组合对多人博弈的最佳对策;即自己的可选策略中与其他博弈方的策略或策略组合配合;给自己带来最大得益的策略这种相对最佳策略总是存在的;不过不一定唯一;然后在此基础上;通过对其他博弈方策略选择的判断;包括对其他博弈方对自己策略判断的判断等;预测博弈的可能结果和确定自己的最优策略..这就是划线法..2.5箭头法箭头法对于理解博弈关系很有好处;是寻找相对稳定性策略组合的分析方法..对博弈中的每个策略组合进行分析;考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益..如能;则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组..最后综合对每个策略组合的分析情况;形成对博弈结果的判断..划线法和箭头法的结果是一致的;可以相互替代..三:混合策略Mixed Strategies 纳什均衡3.1定义:混合策略的定义:在博弈G={N; Si; ui; i∈N}中;假设参与人i的纯策略构成的策略集合为Si={si1;…; sik};若参与人i 以概率分布pi=pi1;…; pik 在其k 个可选策略中随机选择“策略”;称这样的选择方式为混合策略..这里;0≤pij ≤ 1;对于j=1 ;…; k 都成立;且有; pi1+…+ pik=1..纯策略可看成特殊的混合策略..上述定义是在有限博弈前提下进行的..3.2混合策略意义下策略组合的表述{x1∈X1; …; xn∈Xn};其中Xi ; i =1; …; n表示参与人i所有纯策略生成的概率空间;xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{1/2; 1/2;1/2; 1/2}3.3VNM效用函数Von Neumann and Morgenstern冯·诺依曼和摩根斯坦如果某个随机变量X以概率Pi 取值xi;i=1;2;…;n;而某人在确定地得到xi时的效用为uxi;那么;该随机变量给他的效用便是: UX =P1ux1 + P2ux2 + ... + Pnuxn表示关于随机变量X的期望效用..因此UX称为期望效用函数;又叫做冯·诺依曼——摩根斯坦效用函数VNM函数..3.4基于混合策略意义下的博弈策略式表述定义:基于v-N-M效用的策略式博弈由 a、参与人集合 b、每个参与人有一个纯策略集合 c、对于每一个参与人来说;由所有参与人纯策略组合构成的风险结果空间;存在一个v-N-M效用3.5混合策略意义下的纳什均衡定义:对于博弈G= {N; Si; ui; i∈N};基于v-N-M效用的混合策略组合α是一个纳什均衡;若对于每一个i; 以及i的任意一个混合策略αi;α对应的期望支付至少和αi;α-i 的期望支付一样大换句话说;称混合策略组合α是一个纳什均衡;如果没有一个参与人通过偏离策略αi 实现支付的增加3.6一个定理对于N-人静态博弈问题;设混合策略纳什均衡对应的策略组合为Xi ; X –i ..对于任意的i ;若最优混合策略为Xi= {x1;…;xl;0…0}不失一般性;假设前l个分量严格大于0;记分量xk k=1;…; l 对应的纯策略sk;则对于参与人i而言;sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值;等于纳什均衡混合策略组合 Xi; X –i 的收益值..即ui sk; X –i = ui Xi; X –i 成立 ; k=1;…; l3.7方法:a、求解混合策略均衡可以用期望收益等值法b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡四:多重纳什均衡解及其分析4.1 帕雷托占优均衡帕雷托占优均衡的含义是:在多个纳什均衡中;若存在一个纳什均衡;其支付结果针对每个参与人而言都严格优于其它纳什均衡;则该纳什均衡是帕雷托占优纳什均衡..4.2风险占优均衡risk-dominant equilibrium参与人对风险占优均衡的选择倾向;有一种强化的机制..当部分或所有参与人选择风险占优均衡的可能性增强的时候;任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小;而这又使得帕雷托占优均衡策略的支付更小;从而形成一种选择风险占优均衡策略的正反馈机制;并使其出现的概率越来越大..当参与人数目增加时;选择合作的风险将会更大;可借助该点考虑招标机制如何减少投标方勾结问题..上述问题是我们知道建立诚信机制社会的重要意义..上述问题引出一个博弈相关分支为协调博弈coordination game4.3聚点均衡由实际问题抽象出来的博弈模型中;更多的一类问题是:多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系;如夫妻爱好问题的两个纯策略均衡..这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例;在实际中往往二人很默契地知道如何进行博弈;双方往往知道怎么进行选择策略;且能够相互了解这里面排除了互相协商后达成的一致实际博弈中参与人往往会利用博弈模型以外的信息;实现对特定博弈均衡一致关注的“聚点”这些信息如:参与人共同的文化背景或规范;共同的知识;具有特定意义事物的特征;某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性;但因为涉及因素太多;对于一般博弈模型很难总结普遍规律;只能具体问题具体分析聚点:人们通常会协调彼此的行为..你弱他就强;先例产生的影响远大于逻辑或者法律效力;人们总是乐于安守现状或接受自然形成的界线三八线4.4相关均衡correlated equilibrium实际上;在现实中遇到选择困难时;特别是在长期中反复遇到相似选择难题时;常会通过收集更多信息;形成特定的机制和规则;为某种形式的制度安排等主动寻找思路..相关均衡就是这样的一种均衡选择机制..对于实际中比较复杂的博弈问题;参与人是否有能力设计这种机制;并且有足够能力理解、信任这种机制;是有一定疑问的..相关均衡作为社会经济制度创新的一种解释也许更有意义..4.5防共谋均衡coalition-proof equilibrium 定义:如果一个博弈的某个策略组合满足a、没有任何单个参与人的“串通”会改变博弈的结果;即单独改变策略无利可图该策略组合是纳什均衡..b、给定选择偏离的参与人有再次偏离的自由时;没有任何两个参与人通过“串通”改变博弈的结果..c、依此类推;直到所有参与人都参加的串通也不会改变博弈的结果..满足上述要求的均衡策略组合称为“防共谋均衡”在有多个参与人的博弈中;若部分参与人通过某种形式的默契或串通形成小团体;可能得到比不串通个大的支付..这就是多人博弈的共谋问题..防共谋均衡是指这样的一个纳什均衡;在该均衡局势下;少数参与人集合不能通过均衡策略的偏离;实现更好的局部利益..防共谋均衡是两个以上参与人参加的博弈中;参与人在帕雷托占优均衡中进行合作思想的扩展..五:动态博弈5.1特点一类博弈行为通常需要参与人多步决策才能完成;具有明显的阶段性..博弈的结局、各参与人的收益由多阶段决策结果确定..各参与人的决策有一定的顺序..由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性;通常用扩展式extensive form表述法描述这些信息..5.2博弈的扩展式表示参与人集合:i=1; … ;N..用N表示虚拟参与人“自然”;自然的含义是某些外生的客观概率分布事件参与人的行动顺序the orderof moves:描述各参与人在什么时候行动;参与人的行动空间actionset:在每次行动时;参与人可选择的行动集合;参与人的信息集information set:每次行动时参与人知道什么;参与人的收益函数:在行动结束之后;每个参与人得到些什么..自然选择的概率分布假定自然状态是共同知识..对于有限博弈;博弈树是常用的表述方式..5.3博弈树a若动态博弈是有限博弈;则可用博弈树表示该博弈..这里有限的含义是:各阶段各参与人的行动数目有限;博弈的阶段数有限..b博弈树的基本结构为结点nodes..包括决策结及终点结..决策结是参与人采取行动的时点;终点结是博弈行动路径的终点..枝branches..从一个决策结到它的直接后续结的连线;每一个枝代表参与人的一个行动选择..信息集..是决策结集合的一个子集..将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集..注:每个决策结都是同一个参与人的决策结..该参与人知道博弈进入该集合的某个决策结;但不知道自己究竟出于哪一个决策结若该信息集有两个或两个以上元素..5.4对于有限动态博弈;若参与人对彼此在各决策结点的行动集合;彼此的效用函数;历史的行动有着完全的了解;则称这样的博弈为完全信息动态博弈..如果博弈树的所有信息集都是单元素集;称该博弈为完美信息博弈game of perfectinformation..上述两个定义的差别在于对自然行动信息的描述..5.5动态博弈的策略式表述a相机选择contingent play动态博弈中参与人的策略是各自预先设定的;在博弈的各阶段;针对各种情况做出相应决策..即“等待”博弈到达自己的信息集包含一个或多个决策结后再决定如何行动..在策略式表述博弈中;参与人似乎是博弈开始之前就制定出了一个完全的相机选择;即“如果……发生;我将选择……”..b从扩展式表述构造战略式表述若把B的信息集从左到右排列;上述四个纯策略可以简单记为{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}..上面四个纯策略含义:当A选择开发时;B选择大括号中前面的策略;当A选择不开发时;B选择大括号中后面的策略..B的纯策略为:{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}A的纯策略为:SA=开发;不开发于是可以写成策略式表述形式;为开发;开发开发;不开发不开发;开发不开发;不开发开发-3;-3-3;-31;01;0不开发0;10;00;10;0在扩展式表述博弈中;所有n个参与人的一个纯战略组合s=s1;…;sn决定了博弈树上的一个路径..比如开发;{不开发;开发}决定了博弈的路径为A 开发 B 不开发1;05.6完全信息动态博弈纳什均衡存在性定理如果有限博弈是完美信息博弈;他还有一个纯战略纳什均衡Zermelo;1913..5.7逆向归纳法:a逆向归纳法求解策略:从动态博弈的最后一个阶段出发;对该参与人采用经济理性原则进行分析;逐步到推回前一个阶段相应参与人的行动选择;一直到第一阶段的分析方法..b逆向归纳法是求解完美信息动态博弈的经典方法..逆推归纳法是完美信息动态博弈分析中使用最普遍的方法..c与策略式分析比较:如果A选择U;那么B的信息集不能达到;我们说B的信息集不在均衡路径上out-of-equilibrium path.. 此种情况下;B的选择对A没有什么影响..因此;纳什均衡对一个参与人在非均衡信息集上的选择没有限制..但是;一个参与人在非均衡信息集上的战略可以影响其他参与人在均衡信息集上的选择..d逆向归纳法实质上是重复剔除劣战略法在扩展式博弈中的应用..逆向归纳法适不用于无限博弈和不完美信息博弈..逆向归纳法剔除了“非理性”的均衡策略5.8子博弈完美均衡子博弈精炼纳什均衡①子博弈概念:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结Tx组成;它满足下列条件:x是一个单结信息集;即hx={x};对于所有的Tx中的x’;如果x’’与x’同属于一个信息集;则x’’也在Tx中..需要说明的是;G本身是自己的一个子博弈..②子博弈完美纳什均衡子博弈精炼纳什均衡扩展式博弈的一个战略组合s=s1;…;s i;…;s n是一个子博弈完美纳什均衡;如果它是原博弈的纳什均衡..它在每一个子博弈上都是纳什均衡③纳什均衡与子博弈精炼纳什均衡的关系前面分析说明;一个特定的纳什均衡决定了原博弈树上唯一的一条路径;这条路径称为“均衡路径”equilibrium path..相对该纳什均衡;其他路径称为非均衡路径out-of-equilibrium path..在每一个子博弈上给出纳什均衡意味着;构成子博弈纳什均衡的战略不仅在均衡路径的决策结上是最优的;同时在非均衡路径的决策结上也是最优的..对于有限完美信息博弈;前面介绍的逆推归纳法得出的纳什均衡即是子博弈精炼纳什均衡..六多阶段静态博弈6.1该类模型中至少在某个阶段参与人同时选择其决策..这类模型实质上就是完美信息动态博弈;因此仍然可以采用逆推归纳法进行分析..因为存在同时选择;因此每个阶段不再是单人优化问题;而是一个静态博弈..6.2前向归纳法:前面已经说明;完美信息动态博弈的经典求解方法为逆序归纳法..还有一种分析方式;就是前向归纳法forward induction..前向归纳法由科尔博格和莫顿斯1986提出..这里不进行严格的数学描述;仅通过一个例题进行说明..6.3重复博弈重复博弈repeated game的定义指同样结构的博弈重复多次;其中的每次博弈称为“阶段博弈stage game”..如两个多次犯罪的“囚徒问题”..由于动态博弈是相机行动;反映到重复博弈中;就是可以使自己在某个阶段的博弈选择依赖于其他参与人过去的行动历史..影响重复博弈均衡结果的主要因素是博弈重复次数和信息的完备性completeness..重复次数对参与人可能会有的影响是:参与人为了获得长远利益而牺牲眼前利益的策略成为可能..关于完备性;简单地说;但一个参与人的支付函数不为其他参与人所知时;该参与人可能有积极性建立一个“好”的声誉reputation以换取长远利益..在社会行为中;经常可以看到本质不好的人在相当长的时期内干好事的原因..定理:令G是阶段博弈;GT是G重复T次的重复博弈T<∞..那么;如果G有唯一的纳什均衡;重复博弈GT的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次即每个阶段博弈出现的都是一次性博弈的均衡结果..上述定理说明;只要博弈的重复次数是有限的;重复本身并不改变囚徒困境的均衡结果..上述定理中“唯一性”是一个重要条件..如果纳什均衡不是唯一的;上述结论就不一定成立..当博弈有多个纳什均衡时;参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为..(七)不完全信息静态博弈不完全信息静态贝叶斯博弈贝叶斯纳什均衡海萨尼转换拍卖理论八合作博弈可传递效用 transferableutility合作博弈的特征函数合作的分配可行分配核心的定义 Shapley 值。

第四篇-博弈论

第四篇-博弈论
博弈论是系统研究各种博弈问题,寻求博弈 方合理的策略选择和合理选择策略时的博弈 结果,并分析结果的经济、效率意义的理论 与方法。
二、博弈论发展的里程碑
古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
伯特兰德模型(Bertrand) (1883)(价格竞争) 《博弈论与经济行为》(1944)
兔子 0,3 3,3
3、聚点(Focal point)均衡(夫妻博弈) 谢林(Schelling ,1960)指出在现实生活中人
们可能通过一些被标准化的博弈模型所抽象 掉了的信息来达到一个特定的均衡。如夫妻 博弈中,借助生日等信息双方选定特定的均 衡;如当让两个博弈方同时报一个时间,所 报时间相同时会获奖,尽管可能存在无数的 纳什均衡,但是双方选择“中午12点”“0点” 等的可能性要大于“12点20”。
开业 +2,+4
-2,-2
一、纳什均衡
1、定义:
在有n个参与人的标准型博弈
G (S1,...,Sn ;1,..., n )中,如果策略组合
s* (s1*,...,sn* )满足对每一个参与人i,si*是 该参与人针对其他参与人所选择策略 s*i (s1*,...,si*1, si*1,...,sn* )的最优反应策略, 则称策略组合s* (s1*,...,sn* )是该博弈的一 个纳什均衡。即:
按博弈收益信息的了解程度
– 完全信息博弈(Complete information) 囚徒困境等 – 不完全信息(Incomplete information)或不对称信息
(Asymmetric Information) 暗标拍卖和招投标
按对博弈过程的信息 (针对动态博弈)

经典博弈论概述

经典博弈论概述

经典博弈论概述1 什么是博弈论博弈论是一种独特的处于各学科之间的研究人类行为的方法。

与博弈论有关的学科包括数学,经济学和其他社会科学和行为科学。

博弈论是由约翰•冯•诺依曼创立的,该领域第一本重要著作是诺依曼和另一个伟大的数理经济学家奥斯卡•摩根斯坦所著的。

博弈论是关于包含相互依存情况中理性行为的研究。

所谓相互依存,通常是指博弈中的任何一个参与者受到其他参与者行为的影响,反过来,他的行为也影响到其他参与者。

由于这种相互依存性,游戏或博弈的结果依赖于每一个参与者的决策,没有一个人能完全地控制所要发生的事情,也没有一个参与者处于孤独的状态。

相互依存常使博弈中的参与者之间产生竞争。

譬如两个人分蛋糕、每个参与者都希望自己的那块可以分得大一些。

然而,竞争仅仅是博弈论中相互依存的一个方面。

应该指出,通常地博弈并非纯粹是参与者之间的竞争,相互依存的另一个方面是参与者可以有某些共同的兴趣或利益所在。

仍以分蛋糕为例,作为参与者策略行动的结果,蛋糕的大小可以增加或者减少。

参与者的共同兴趣在于增加蛋糕的总量,他们互相“倾轧”之处在于如何分配。

从博弈论研究的角度,增大蛋糕应是博弈的第一步,而分配蛋糕则是博弈的第二步。

在博弈论中还需要对一个词“理性行为” 作一些说明。

博弈论中的所谓理性,一般不是指道德标准。

从参加博弈的参与者的眼光来看,他们试图去实施自己认为可能最好的行为,尽管这样的行为有可能损害了其他参与者。

由于参与者的相互依存性,博弈中一个理性的决策必定建立在预测其他参与者的反应之上。

一个参与者将自己置身于其他参与者的位置并为他着想从而预测其他参与者将选择的行动,在这个基础上该参与者决定自己最理想的行动,这就是博弈论方法的本质与精髓。

博弈论中每一个参与者做出理性决策的重要依据之一是他的可能收益有多少,这就是一个参与者需要认真计算的收益函数(payoff function) 。

对于每一个参与者、如果他们在可供自己选择的策略空间中任取一个策略作为自己的行动,既不会给自己带来盈利,又不会使他们必须付出,这种失去了激励机制的游戏本身也就失去了“博” 的意义,在社会经济领域中尤其不太可能出现这类现象。

博弈论概述

博弈论概述

博弈论概述博弈论是研究决策制定者之间相互作用的一门学科。

在博弈论中,决策者被称为"玩家",他们的决策会影响其他玩家的利益。

博弈论的目标是研究玩家在不同情境下的最佳决策策略,以及这些策略对整体结果的影响。

以下是博弈论的一些基本概念和要点:1.玩家(Players):博弈中的参与者被称为玩家。

这可以是个体、公司、国家等。

2.策略(Strategies):玩家在博弈中采取的行动或决策被称为策略。

每个玩家可以有多种可能的策略。

3.支付(Payoffs):博弈的结果被称为支付,它反映了每个玩家在博弈结束时的效用或利润。

4.博弈矩阵(Game Matrix):通过博弈矩阵,可以清晰地表示玩家的策略选择和相应的支付。

博弈矩阵通常用于描述二人零和博弈。

5.纳什均衡(Nash Equilibrium):纳什均衡是指在博弈中,每个玩家都选择了最优的策略,给定其他玩家的选择,没有一个玩家有动机单方面改变自己的策略。

6.博弈形式(Normal Form)和博弈扩展形式(Extensive Form):博弈形式描述了一次性的、同步进行的博弈,而博弈扩展形式描述了具有序列和时间概念的博弈。

7.博弈的分类:博弈可以分为合作博弈和非合作博弈、零和博弈和非零和博弈、完全信息博弈和不完全信息博弈等。

8.博弈的应用领域:博弈论在经济学、政治学、社会学、生物学、计算机科学等多个领域都有广泛应用。

博弈论提供了一种分析人们在决策过程中相互作用的方式,它的应用范围涵盖了众多领域。

在博弈中,每个玩家都追求自己的最大利益,因此博弈论可以帮助人们更好地理解和预测复杂的决策场景。

共同知识 博弈论

共同知识 博弈论

共同知识博弈论一、博弈论简介1. 定义- 博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论。

简单来说,就是在多个参与者(称为局中人)之间,每个局中人的决策会影响其他局中人的收益,同时也受其他局中人决策的影响,博弈论就是分析这种相互影响下的决策过程和结果。

- 例如在“囚徒困境”中,两个囚犯就是局中人,他们各自的坦白或抵赖决策会影响对方的刑期,也受对方决策的影响。

2. 基本要素- 局中人(Players):参与博弈的决策主体,可以是个人、企业、国家等。

例如在市场竞争博弈中,各个企业就是局中人。

- 策略(Strategies):局中人在博弈中可以采取的行动方案。

如在石头 - 剪刀- 布游戏中,出石头、剪刀、布就是不同的策略。

- 支付(Payoffs):局中人在不同策略组合下所得到的收益或者效用。

比如在企业竞争中,利润就是支付,如果一家企业通过降价策略获得了更多市场份额和更高利润,这个利润就是它在这种策略下的支付。

3. 博弈的分类- 按照局中人行动的先后顺序分类- 静态博弈(Static Game):局中人同时选择策略,或者虽然不是同时选择,但后行动者并不知道先行动者采取了什么策略。

例如猜硬币正反面的游戏,双方同时出硬币,或者即使不是严格同时,后出的人不知道先出的人出的是正面还是反面。

- 动态博弈(Dynamic Game):局中人的行动有先后顺序,并且后行动者能够观察到先行动者所选择的策略。

如象棋、围棋等棋类游戏,一方先走,另一方根据对方的走法再做决策。

- 按照局中人对其他局中人的特征、策略空间及支付函数的了解程度分类- 完全信息博弈(Game of Complete Information):每个局中人对所有其他局中人的特征、策略空间及支付函数有准确的了解。

例如在一个完全竞争的市场中,企业都知道其他企业的成本结构、生产能力等信息(这是一种理想情况)。

- 不完全信息博弈(Game of Incomplete Information):至少有一个局中人不完全了解其他局中人的特征、策略空间或支付函数。

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论概要1.研究背景及意义在现实生活中,人们的利益冲突与一致具有普遍性,因此,几乎所有的决策问题都可以认为是博弈。

博弈论在政治学、经济学等许多领域都有着广泛的应用。

在经济学中博弈论作为一种重要的分析方法已渗透到几乎所有的领域,每一领域的最新进展都应用了博弈论,博弈论已经成为主流经济学的一部分,对经济学理论与方法正产生越来越重要的影响。

虽然博弈论是数学的一个分支,但其应用范围十分广泛,在经济学、管理学、社会学、政治学、法律学、军事学等领域都有许多成功运用博弈论的案例。

早在1994年,提出博弈均衡理论的纳什博士与他的伙伴哈尔萨尼教授、泽尔滕教授就共同分享了当年的诺贝尔经济学奖和93万美元的奖金。

2005年,瑞典皇家科学院再次把诺贝尔经济学奖颁给了有着以色列、美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林,以表彰他们在博弈论领域作出的贡献。

纳什的贡献是在1944年与奥斯卡·摩根斯特恩合著了《博弈论与经济行为》一书,标志着现代系统博弈理论的的初步形成。

而谢林和奥曼两位博弈论先驱在政治理论、社会学甚至生物学等方面成功运用到了博弈学理论。

奥曼用数学分析为博弈论列出了精确的公式,谢林则是想通过实践来展示博弈论在社会各个领域的实际意义。

他们两位利用博弈论对商业谈判、种族隔离、武器控制等领域进行了实际分析,谢林教授认为博弈论运用的重要领域应该包括核威慑和武器控制,同时还可以研究种族关系、有组织犯罪、雇员关系乃至自我管理等方面。

2.博弈论相关概念与发展史综述2.1博弈论的概念2.1.1博弈论的定义博弈论(Game Theory,又称对策论)研究决策主体的行为在发生直接的相互作用时,人们如何进行决策以及这种决策的均衡问题。

博弈论是研究理性的决策者之间冲突与合作的理论。

在博弈论分析中,一定场合中的每个对弈者在决定采取何种行动时都策略地、有目的地行事,他考虑到他的决策行为对其他人的可能影响,以及其他人的行为对他的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。

"博弈"一词的英文单词是Game,意为对策、游戏。

因此,一谈到博弈,人们自然会想到游戏,博弈论的早期思想也确实源于游戏。

在诸如下棋、打牌、划拳等游戏中,人们要解决的问题是如何才能获胜,这实际上是当事人面对一定的信息量寻求最佳行动和最优策略的问题。

在实际生活中,许多游戏都反映了博弈论的思想。

例如,在人们非常熟悉的"石头、剪刀、布"的游戏中,我们的问题是:对方如何行动?而我又将如何应对才是最佳?这实际上就涉及到了博弈论的核心问题,即博弈论以对方的行为作为自己决策的依据,并寻求最佳。

在四人进行的扑克牌游戏中,每个当事人所面临的是一场"完全无信息"的多人动态博弈;而在桥牌比赛中,每个当事人则面对的是一个"不完全无信息"博弈(有一定量信息,因为有一个人要摊牌)。

在各种广为流传的棋谱中,要分析每一种可能的情况,即分析对局者在每种局势下的最佳走法,实际上进行的是二人轮流进行的"动态最优"博弈。

但博弈不仅仅是指游戏,它研究的是当人们的行为存在相互作用时的策略行为及其结果。

社会生活中的许多现象,都带有相互竞争与合作的特征,可以说,一切都在博弈之中。

2.2博弈论的发展史2.2.1中国传统文化中的博弈论在我国,博弈论的思想源远流长,古代人民很早就认识了博弈问题,虽然没有形成一套完整的理论体系和方法,但博弈论的思想和实践活动,则可以追溯到2000多年前。

著名的"齐王与田忌骞马"就是一经典事例。

这里,田忌进行的是"在给定齐王策略不变情况下如何取胜"这一策略选择,实际上就是现代博弈论中的完全信息条件下的两人博弈问题。

著名的《孙子兵法》一书对战争胜负的认识,以及胜负之间诸因素的相互作用的深刻论述,和所提出的一系列军事对策等,都反映出其系统的博弈论思想。

而《三十六计》则可以称做是一部活生生的军事博弈论教科书。

《孙子兵法》和《三十六计》虽然是两部兵书,但它们所揭示的各种情形下的谋略与策略,已广泛为在现代市场竞争中做决策的企业家们所学习和采用。

2.2.2 外国早期的博弈论在国外,博弈论的思想与实践活动也有较长的历史。

巴比伦王国的犹太法典,编辑记载了公元1—5世纪的古代法律及传统。

犹太法典中讨论了一个所谓的"婚姻合同问题",被人们认为是最早地使用了现代合作博弈理论。

1713年11月,詹姆斯瓦尔德格雷夫(James Waldegrave)在给朋友蒙特茅特(Montmort)关于两人玩扑克牌的方法的信中,对两人博弈提出了第一个著名的最小最大混合策略解。

20世纪60年代,沃德格雷夫的观点曾引起许多学者的深入研究。

然而,尽管博弈论的思想与实践在中外都有着很长的历史,但现代博弈论的建立及其理论体系的形成,却是在20世纪40年代中期到50年代初期,博弈论的发展、完善及在经济学方面的广泛应用,则是近二三十年的事。

2.2.3 博弈论发展阶段第一阶段:1944年以前,早期思想和基本概念的形成。

1944年以前,博弈论并没有形成完整的思想体系和方法论体系,人们主要集中于严格的竞争对策的研究,即通常所说的二人零和博弈。

但这一阶段却提出了一些重要的基本概念和定理,这些基本概念和定理成为现代博弈论发展的基础。

早在1838年,法国经济学家奥古斯汀古诺(Augustin Cournot)在分析生产者竞争时,就利用均衡概念研究了寡头市场的情况,并使用了解的概念,该概念实际上是后来的纳什均衡的一种严格说法。

1881年,英国经济学家埃奇沃斯(Francis Y.Edgworth)提出了"契约曲线(Contract Curve)"作为决定个体之间交易结果问题的一个解。

1913年,博弈论中第一个定理--泽梅罗定理(Zermelo Theorm)断言,国际象棋是严格确定的,尽管泽梅罗定理的适用范围是具有完全信息的两人零和博弈,但它的影响是巨大的,在五六十年代曾引起许多博弈论专家和经济学家的广泛深入研究。

1921—1927年间,波莱尔(Emile Borel)发表了四篇关于策略博弈的文章,第一次给出了一个混合策略的现代形式,并找到了有3个或多个可能策略的二人博弈的最小最大解。

1928年,冯诺伊曼(John von Neumann)证明了最小最大定理,该定理被认为是博弈论的精华,博弈论中的许多概念都与该定理相联系。

1930年,泽尤森(F.Zeuthen)的著作《垄断问题与经济竞争》出版,在书中他提出了一个关于讨价还价问题的解,该解后来被海萨尼证明与纳什的讨价还价解是等价的。

此外,这一阶段还提出了博弈的扩展形式、纯策略、策略形式、混合策略、个体理性等重要概念。

第二阶段:1944~1959年,现代博弈论的建立与理论体系的基本形成。

1944年,美国普林斯顿大学的著名数学家冯诺伊曼和经济学家摩根斯坦(Oskar Morgenstern)合著的《博弈论与经济行为》一书出版。

该书在详述两人零和博弈理论的同时,在博弈论的诸多方面做出了开创性研究,如合作博弈、可转移效用、联盟形式以及冯诺伊曼--摩根斯坦稳定集等,该书还说明了导致后来在经济学中广泛应用的公理化效用理论。

该书的出版,意味着博弈论作为一种系统理论的开始,奠定了现代经济博弈论的基础,构建了博弈论这一学科的理论框架。

正是通过冯诺伊曼和摩根斯坦对经济行为主体行为特征的分析,才使经济学家们了解到分析和研究经济问题的这一新工具。

整个50年代是博弈论蓬勃发展的时期,在这一埋藏,涌现了许多著名的博弈理论家,他们提出了一系列重要概念和理论,形成了现代博弈论的理论体系。

1950—1953年间,美国普林斯顿大学数学系的约翰纳什(John Nash)发表了四篇有划时代意义的论文。

纳什证明了非合作博弈均衡,纳什均衡的存在性,并提出了"纳什方案",该方案建议对合作博弈的研究可通过简化为非合作博弈形式来进行;纳什还创立了公理化讨价还价理论,证明了纳什讨价还价解的存在性,并首次提出了纳什方案的实施。

人们认为,纳什为非合作的一般理论和合作的讨价还价理论奠定了基础。

1950年,塔克(A.W.Tucker)在斯坦福大学的一份备忘录中揭示了"囚犯的困境"。

1952年,麦克金斯(John Charles C.Mckinsey)出版了第一本博弈论教科书《博弈论入门》。

由库恩(H.W.Kuhn)和塔克(A.W.Tucker)编辑的系统介绍和评述博弈论及其最新发展的丛书《博弈论论文集》共四卷在普林斯顿大学出版。

在该书第二卷中,库恩(1953)提出了扩展型博弈及其形成;沙伯利(Lloyd S.Shapley)(1953)定义了聪明联盟博弈解的概念,即著名的"沙伯利值"。

在第四卷中,沙伯利和、吉利斯(D.B.Gillies)(1950—1953)共同提出了作为一般解概念的核心的概念。

此外,沙伯利(1953)还开创了随机博弈理论。

卢斯(Robert Duncan Luce)和雷法(Howard Raiffa)(1957)出版了有巨大影响的《博弈与决策》。

奥曼(Aumann)(1959)引进了强均衡的概念。

舒比克(Martin Shubik)(1959)出版了《策略与市场结构:竞争、垄断与博弈论》一书,标志着博弈论在经济学中应用的开始。

在50年代末,还出现了关于重复博弈的研究,主要结果就是"无名氏定理"。

此外,还提出了一些关于随机博弈和动态博弈的概念及模型。

总之,以纳什非合作博弈理论为核心的现代博弈论体系,在50年代已经形成。

第三阶段:1960—1969年,博弈理论的进一步完善和发展。

整个60年代是博弈理论的进一步发展和完善时期,博弈论专家们除了对一些重要的基本概念做系统阐述和证明外,还对合作博弈解、稳定集、核心的要领等做了更深入的研究和拓广。

奥曼和皮莱格(B.Peleg)(1960)、马希勒(M.Maschler)(1965)、沙伯利(1969)等人系统研究了非转移效用的联盟博弈问题,从而完善和发展了博弈论。

博弈论研究在地域上也突破了原来的普林斯顿大学和兰德公司的局限,在以色列、德国、比利时及苏联等都建立了研究中心。

60年代,博弈论研究的重大突破和发展,是不完全信息博弈论的创立。

1966年,奥曼和马希勒的研究中出现了具有不完全信息的无限重复博弈。

1966年海萨尼对合作博弈与非合作博弈的不同,给出了现在使用最普遍的定义。

海萨尼(1967~1968)在《管理科学》杂志上分三部分发表了其著名论文"由贝叶斯对弈者进行的不完全信息博弈",从而建立了不完全信息博弈论,为信息经济学的发展打下了理论基础。

相关文档
最新文档