博弈论概述
博弈论讲的是什么
博弈论讲的是什么
博弈论是研究决策制定者之间相互关系的一门数学分支,主要关注在冲突和合作的情境下,个体或群体的最佳决策和策略选择问题。
博弈论的研究对象可以包括个体、团体、国家、公司等各种决策制定者。
以下是博弈论的一些核心概念和主要内容:
1.博弈的定义:博弈是指多方参与者在特定环境下做出决策,彼此之间的决策会相互影响。
每个参与者的目标是通过制定最佳策略来最大化其利益。
2.参与者:博弈论中的参与者被称为“玩家”,可以是个体、群体、国家等。
每个玩家都有自己的目标和利益,但他们的决策会影响其他玩家的结果。
3.策略:策略是玩家在博弈中可选的行动或决策。
博弈论研究玩家如何选择最优策略以最大化他们的利益。
4.支付:支付是指每个玩家根据博弈的结果获得的收益或损失。
博弈论分析玩家如何在不同策略下分配支付,以及如何最大化其期望收益。
5.博弈的分类:博弈可以分为零和博弈和非零和博弈。
零和博弈中,一个玩家的利益损失就是其他玩家的利益增益,总和为零。
非零和博弈中,各玩家的利益不一定互相抵消,可以共赢或共输。
6.博弈的解:博弈论研究如何找到博弈中的均衡点或解决方案。
最著名的解决概念之一是纳什均衡,它描述了一种情况,在该情况下,每个玩家的策略是对方玩家策略的最佳响应。
7.博弈的应用:博弈论在经济学、政治学、生物学、计算机科学
等领域有广泛的应用。
例如,在商业谈判、拍卖、国际关系、网络安全等方面,博弈论都可以提供洞察和指导。
总体而言,博弈论通过数学建模和分析,帮助我们理解在决策制定者之间互动的情境中,各方如何做出最佳的决策以达到其个体或集体的目标。
博弈论百度百科
博弈论百度百科博弈论是一门研究决策制定和决策结果的学科,它是应用数学的一个分支,通过运用数学和逻辑工具,探讨参与者在互动决策中的最佳策略选择。
在博弈论中,参与者被称为玩家,他们根据自身利益和目标来做出决策。
博弈论适用于各种不同领域的情境,包括经济学、政治学、生物学等。
一、概述博弈论的研究对象是策略性互动。
在一个博弈中,每个玩家都会依据一定的策略选择进行行动,而这个选择可能会受到其他玩家的影响。
博弈论试图理解和分析在这种互动中,参与者如何做出决策,并找到最优的解决方案。
博弈论的核心概念是博弈,一个博弈可以用一个四元组表示:(N, A, U, F),其中:- N表示参与博弈的玩家集合;- A表示每个玩家可选的行动集合;- U表示每个玩家的效用函数,用于衡量不同结果对该玩家的好坏程度;- F表示每个玩家的信息集合。
信息集合是指每个玩家在博弈过程中所了解的信息。
二、博弈论的重要概念1. 纳什均衡纳什均衡是博弈论中最重要的概念之一,指的是在一个博弈中,所有玩家选择的策略组合,使得任何玩家都没有动机单方面改变自己的策略。
纳什均衡是一个稳定状态,玩家之间不再有改变策略的动机。
2. 零和博弈与非零和博弈博弈可以分为零和博弈和非零和博弈。
零和博弈是指参与博弈的玩家的收益之和为零,即一方获利必然导致另一方的损失。
非零和博弈是指参与博弈的玩家的收益之和不为零,即可以存在多方共同受益的情况。
3. 微观博弈与宏观博弈微观博弈是指研究个体玩家之间的策略性互动,关注的是个体决策的结果。
宏观博弈是指研究整体群体之间的策略性互动,关注的是全局结果。
三、应用领域博弈论的研究在众多领域中都具有广泛的应用。
以下是博弈论在一些领域的应用举例:1. 经济学博弈论在经济学领域中有着广泛的应用。
它可以用来研究市场竞争、合作与冲突、价格形成等经济问题。
例如,博弈论可以用来分析竞争市场中的价格战和垄断市场中的价格定价策略。
2. 政治学博弈论在政治学领域中也有着重要的应用。
博弈论与经济行为
博弈论与经济行为博弈论是研究决策者在相互依赖的环境中进行策略选择的数学模型。
在经济学领域,博弈论可以用来分析经济主体之间的相互作用、决策策略以及市场竞争等问题。
本文将探讨博弈论在经济行为中的应用,并分析其对经济领域的影响。
一、博弈论概述博弈论是数学分析和经济学的交叉学科,它研究的是在相互关联的决策中,参与者之间如何做出策略选择,以达到最优决策和最优收益。
博弈论的核心概念包括参与者、策略和支付。
参与者是指在博弈中做出决策的个体或组织,策略是参与者根据已有信息所选择的行动方式,支付是参与者根据博弈的结果所获得的效用或收益。
二、博弈论与经济行为的关系博弈论在经济学中有着广泛的应用。
首先,博弈论可以分析市场竞争中的策略选择。
在一个竞争激烈的市场环境中,企业需要根据竞争对手的策略选择来制定自己的竞争策略。
通过博弈论的模型,企业可以分析竞争对手的可能行动,并制定出最优的反应策略,以实现市场利润最大化。
其次,博弈论可以应用于公共政策制定。
在公共政策制定过程中,政府需要考虑不同群体的利益冲突和协调问题。
博弈论提供了一种框架,可以分析不同利益相关方之间的博弈关系,以制定出最优的政策方案,实现社会福利最大化。
另外,博弈论还可以用来分析企业间的策略决策。
在合作与竞争并存的企业环境中,企业需要考虑与合作伙伴的博弈关系,以及与竞争对手的策略选择。
博弈论的模型可以帮助企业分析自身的策略选择,并制定出最优的决策方案,以取得竞争优势。
三、博弈论的实际案例1. 拍卖市场的策略选择拍卖市场是博弈论在经济行为中的一个重要应用领域。
在拍卖市场上,卖家和买家需要根据自己的信息和目标来选择出价或接受报价。
博弈论的模型可以帮助卖家和买家分析其他参与者的可能行动,并制定出最优的出价或接受报价策略,以达到自己的利益最大化。
2. OPEC的策略博弈OPEC(石油输出国组织)是博弈论在国际经济行为中的一个典型案例。
OPEC成员国需要协商产油配额,并制定出合理的产油政策。
博弈论概述
一般地,称 si*为局中人i的(严格)占优策略, 若对应所有的
si , s i*是i的严格最优策略 , 即:
ui (si*, si ) ui (si' , si ) si , si' si*
对应地,所有的 si' si* 被称为“劣策略”。注意:这
甲的策略
1
2
3
乙的策略
1
7
8
9
2
6
2
3
3
5
4
0
1.乙先行动。若乙选1,则甲选3;乙选2,则甲选1;乙选3, 则甲选1。乙在行动时会估计到甲的行动,它估计三种选择 中的最高代价为策略1(损失900万),其次为策略2(损失 600万),最低为策略3(损失为500万)。因此,乙必选代 价最低的策略3。——最大最小原理。结论:乙选择3,甲选 1作为回应,乙损失500万,甲获益500万。
在博弈论里,一个博弈可以有两种表述方式:一种是策 略式(strategic form representation)表述,另一种是 扩展式( extensive form representation )表述。前者 适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式 表述中,所有参与人同时选择各自的策略,所有参与人选择 的策略一起决定每个参与人的支付。
2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E.
运筹学博弈论
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
精品
智猪博弈(大小猪博弈)
精品
5. 2001年诺贝尔经济 学奖得主:迈克尔 ·斯 宾塞:在不对称信息市 场分析方面所做出开创 性研究。
精品
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
精品
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
精品
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
精品
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
博弈论介绍
博弈论介绍博弈论是一门研究决策者如何在不确定环境中做出决策的数学理论。
它是经济学、政治学、社会学以及其它社会科学中重要的工具之一,也被广泛应用于计算机科学、生物学等领域。
博弈论通过分析不同参与者的策略选择和结果预测,揭示了人类行为背后的数学原理和心理动机。
在博弈论中,参与者被称为玩家,他们的目标是最大化自己的效用。
博弈论的研究对象是博弈,即一种决策过程,其中多个决策者在有限资源环境中选择不同策略,以达到自己的目标。
博弈分为合作博弈和非合作博弈。
在合作博弈中,玩家可以通过合作来实现最优结果;而在非合作博弈中,玩家没有合作的选择,只能依靠自己的策略来最大化效用。
博弈论的基本元素包括玩家、策略和支付。
玩家是参与博弈的个体或组织,他们在决策过程中根据自己的目标和信息选择策略。
策略是指玩家在博弈中可选的行动,可以是单一的动作,也可以是一系列行动的组合。
支付是玩家在博弈结束时得到的结果,通常用于衡量玩家在博弈中的成功程度。
在博弈论中,最常用的分析工具是博弈矩阵。
博弈矩阵是一个二维表格,其中每个单元格表示不同玩家在不同策略组合下的支付。
通过分析博弈矩阵,我们可以推断玩家的最佳策略选择以及最终结果。
博弈论的核心概念之一是纳什均衡。
纳什均衡是指在一个博弈中,每个玩家的策略选择都是最佳的,给定其他玩家的策略选择不变。
换句话说,不存在玩家可以通过改变自己的策略来获得更好的结果。
纳什均衡并不一定是最优策略,只是所有玩家选择的最稳定状态。
除了纳什均衡,博弈论还涉及许多其他的解概念,如部分均衡、极大极小解等。
这些解概念提供了不同的策略选择和结果预测方法,使得博弈论在实际应用中更加有价值。
博弈论的应用范围非常广泛。
在经济学中,博弈论被用于分析市场竞争、价格战略以及拍卖等问题。
在政治学中,博弈论可以帮助我们理解选举、国际关系以及公共政策制定等方面的决策过程。
在社会学中,博弈论可以揭示社会规范、合作问题以及社会团体之间的关系。
在计算机科学中,博弈论被广泛应用于人工智能、机器学习和多智能体系统等领域。
1博弈论概述2完全信息静态博弈3完全信息动态博弈4
②从局中人行动的先后顺序可划分为静 态博弈(Static game)和动态博弈 (dynamic game)。静态博弈是指在博弈中, 局中人同时选择行动或虽非同时行动但后行 动者并不知道先行动者采取了什么具体行动。 动态博弈是指局中人的行动有先后顺序,且 后行动者能够观察到先行动者所选择的行动。
③从局中人是否具有有关其他参与人 (对手)的特征、策略空间及支付函数方面 的知识的角度,可划分为完全信息博弈
合作博弈和非合作博弈的区别在于人们的行动为相互 作用时,当事人能否达成一个具有约束力(binding agreement)的协议。若有,就是合作博弈;否则就是非合 作博弈。例如,两个寡头企业,如果他们之间达成一个协议, 联合最大化垄断利润,且各自按该协议生产,即是合作博弈。 其面临的问题是如何分享合作带来的剩余。但若两个企业间 的协议不具有约束力,即没有哪一方能强制另一方遵守该协 议,每个企业都只选择自己的最优产量(或价格),则是非 合作博弈。另外,合作博弈强调的是团体理性、效率、公正 和公平。非合作博弈强调的是个人理性、个人最优决策,其 结果可能是有效率的,也可能是无效率的。
一、占优策略均衡
通常情况下,每个局中人的支付是博弈中所有参与 人策略的函数,故每个局中人的最优策略选择依赖于所 有其他参与人的策略选择。但在一些特殊博弈中,一个 参与人的最优策略选择可能并不依赖于其他参与人的策 略选择,即无论其他参与人选择什么策略,他的最优策 略是唯一的,这种最优策略被称为“占优策略” (dominant strategy)。 例:“囚徒困境” 囚徒困境是博弈论中的经典案例。该故事讲的是,两 个嫌疑犯作案后被警察抓住,分别被关在不同的房间里 进行审讯。警察知道两人有罪,但缺乏有力的证据,除 非两人之中有一个坦白。警察告诉每个人,他们的可选 择的策略与支付如下表:
博弈论概论
博弈论概述由于现代经济活动的规模越来越大,对抗性、竞争性越来越强,特别是寡头垄断或垄断竞争市场,竞争和决策较量更是厂商经营活动的核心内容,这些都使得人们越来越重视经济活动的环境条件及其变化,越来越重视竞争者或合作者的反应,因此经济决策的“博弈性”越来越强。
而且,博弈论在许多情况下所得出的结论更加符合经济现实和更加具有应用性,对参与经济互动的各方或国家政府的决策互动有更强的指导作用。
所以,研究博弈论是很必要的。
一.基本概念博弈:即一些个人,队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各允许选择的行为或策略中进行选择并加以实施,各自取得相应的结果的过程。
从上述定义可以看出,规定或定义一个博弈需要设定下列四个方面。
(1)、博弈的参加者(Players)。
即在所定义的博弈中究竟有哪几个独立决策、独立承担结果的个人或组织.对我们来说,只要在一个博弈中统一决策,统一行动、统一承担结果,不管一个组织有多大,哪怕是一个国家,甚至是由许多国有组成的联合国,都可以作为博弈中的一个参加方。
并且,在博弈的规则确定之后,各参加方都是平等的,大家都必须严格按照规则办事。
(2)、各博弈方各自可选择的全部策略(Strategies)或行为(Actions)的集合。
即规定每个博弈方在进行决策时,可以选择的方法,做法或经济活动的水平,量值等。
在不同博弈中可供博弈方选择的策略或行为的数量很不相同,在同一个博弈中,不同博弈方的可选策略或行为的内容或数量也常不同,有时只有有限的几种,甚至只有一种,而有时又可能有许多种,甚至无限多种可选策略或行为。
(3)、进行博弈的次序(Order)。
在现实的各种决策活动中,当存在多个独立决策方进行决策时,有时候需要这些博弈方的决策又有先后之分,并且有时一个博弈方还要作不止一次的决策选择。
这就免不了有一个次序问题。
因此规定一个博弈必须规定其中的次序,次序不同一般就是不同的博弈,即使博弈的其他方面都相同。
博弈论概述
大猪仍然会霸占着食物,将食物全部吃光,小猪只能无可奈何
地被挤在一旁。在这种情况下,大猪可以不劳而获,得到的收 益为 10。小猪徒劳无功,看到大猪不劳而获,更增加了小猪的 郁闷,小猪得到收益 -2。 如果大猪和小猪都不去按压开关,则大猪和小猪都无法吃到食 物,大猪和小猪均得到收益 0。
小猪 按开关 大猪 等待
通过“划横线法”无法找到“锤头、剪刀、布”博弈的纳什均衡。
混合策略均衡
混合策略纳什均衡的定义和求解方法 混合策略均衡指博弈参与者以一定的概率分布随机选择
策略集中的策略,使得其他博弈参与者在各个可能的策
略之间无差异。
在“锤头、剪刀、布”的博弈中
博弈参与者 1 的混合策略指:博弈参与者 1 在“锤头、剪刀、
智猪博弈
猪栏里养了两头猪,一头大猪、一头小猪。 在猪圈的一端有一个盛食槽。 在猪圈的另一端有一个按压式开关。
开关每被按压一次,就有固定数量的食物出现在盛食槽中。
大猪和小猪都在思考是否去按压开关。
如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈 另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会 比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按 压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为
类似的,得到联立方程组:
剪刀 布 锤头 布 p2 p2 p2 p2 锤头 布 锤头 剪刀 p p p p 2 2 2 2 p 锤头 p 剪刀 p 布 1 2 2 2
得到
p
锤头 1
p
剪刀 1
p 1/ 3
布 1
布”三个策略中随机选择,使得博弈参与者 2 在“锤头、剪刀、 布”三个策略之间无差异。 博弈参与者 2 的混合策略指:博弈参与者 2 在“锤头、剪刀、 布”三个策略中随机选择,使得博弈参与者 1 在“锤头、剪刀、
博弈论知识点总结
博弈论知识总结博弈论概述:1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、 决策主体是理性的,最大化自己的收益。
2、 完全理性是共同知识3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。
完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主题所选择的行动的函数。
从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别:1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。
可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。
2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
focal point 博弈论
focal point 博弈论
摘要:
1.博弈论的概述
2.博弈论的基本元素
3.博弈论的应用
4.我国在博弈论领域的发展
正文:
一、博弈论的概述
博弈论,又称为对策论或赛局理论,是一种研究决策制定的数学工具,主要应用于分析多个理性决策者在特定情况下如何做出决策以实现自身利益的最大化。
博弈论的研究对象包括各种游戏、谈判、竞争等,它旨在揭示这些情境下的决策规律。
二、博弈论的基本元素
1.参与者:博弈论中的决策者,可以是个人、组织或国家。
2.策略:参与者在特定情况下采取的行动。
3.支付:参与者采取某策略后获得的收益或损失。
4.博弈矩阵:描述参与者在不同策略组合下支付的矩阵。
5.纳什均衡:一种特殊的博弈均衡,指在博弈中,当其他参与者保持不变时,每个参与者的最佳策略。
三、博弈论的应用
1.经济学:博弈论在价格制定、市场竞争、拍卖等方面具有广泛应用。
2.社会学:博弈论可用于分析社会现象,如信任、合作、投票等。
3.政治学:博弈论在分析国际政治、选举、政策制定等方面具有重要意义。
4.军事战略:博弈论可用于研究战争策略、武器竞赛等。
四、我国在博弈论领域的发展
我国在博弈论领域的研究始于20 世纪50 年代。
经过几十年的发展,我国在博弈论研究方面取得了显著成果,包括在理论研究、应用研究以及人才培养等方面。
我国学者在博弈论方面的研究成果已逐渐受到国际学术界的关注和认可。
总之,博弈论作为一门跨学科的理论工具,在各个领域具有广泛的应用。
博弈论综述
博弈论综述引言博弈论是一门研究决策制定和行为模式的学科,它涉及到多个参与者之间的相互作用和冲突。
在博弈论中,参与者的利益和策略选择是关键因素。
博弈论的研究对象可以是个体、企业、国家甚至整个社会。
本文将综述博弈论的基本概念、理论模型和应用领域。
基本概念博弈论的基本概念包括参与者、策略、收益和博弈形式。
参与者是指博弈中的个体或群体,策略是参与者在决策过程中可以选择的行动方式,收益是参与者在特定策略下获得的利益或成本,博弈形式描述了参与者之间的相互关系和行为规则。
理论模型博弈论的理论模型有多种,其中最经典的是博弈矩阵和博弈树。
博弈矩阵是一种二维表格,用于描述参与者在不同策略下的收益。
博弈树是一种图形化表示方式,用于展示参与者之间的决策过程和可能的结果。
博弈论的经典模型包括囚徒困境、合作博弈和非合作博弈。
囚徒困境模型描述了两名囚犯面临的决策问题,他们可以选择合作或背叛对方。
合作博弈模型着重于参与者之间的合作和联盟形成,非合作博弈模型则关注参与者之间的竞争和利益最大化。
应用领域博弈论在生活和社会中有广泛的应用。
在经济学领域,博弈论被应用于市场竞争、定价策略和战略决策等方面。
在政治学领域,博弈论被用于分析国际关系、选举和谈判等议题。
在生物学领域,博弈论被应用于研究动物行为、进化和生态系统稳定性等方面。
博弈论的局限性尽管博弈论在许多领域有着广泛的应用,但它也存在一些局限性。
首先,博弈论的理论模型建立在理性决策者的假设上,而现实世界中的决策往往受到情感、认知和信息不对称等因素的影响。
其次,博弈论的模型通常是简化和抽象的,无法完全反映复杂的现实情况。
此外,博弈论的应用也需要考虑参与者的目标和价值观等因素,以及外部环境的变化和不确定性。
结论博弈论是一门重要的学科,它对于理解和解决决策制定和行为模式的问题具有重要的意义。
通过研究博弈论的基本概念、理论模型和应用领域,我们可以更好地理解参与者之间的相互作用和冲突,并找到有效的解决方案。
博弈论
• 4. 战略(strategy)
• 指参与人在给定信息集的情况下的行动规则, 它规定参与人在什么时候选择什么行动。 • (1)一般用si 表示第i个参与人的一个特定战 略,Si = {si}代表第i 个参与人的所有可选择 的战略集合。如果n个参与人每人选择一个战略, n维向量s=(s1,…,si,…,sn )称为一个战略组 合(strategy profile),其中si是第i个参与人 选择的战略。
•
囚徒困境引出重要结 论: 一种制度(体制)安 排,要发生效力,必须是 一种纳什均衡。否则,这 种制度安排便不能成立。 现实中囚徒困境问题: 军备竞赛、公共产品私 人提供、寡头竞争等。
领域
纳什均衡 (增产,增 产)
制度安排
寡头竞争 公共产品 私人 提供
• (2)战略与行动是两个不同的概念,战略是行动 的规则而不是行动本身。 • 例如:“人不犯我,我不犯人;人若犯我,我 必犯人”是一种战略,“犯”与“不犯”是两种 行动,战略规定了什么时候“犯”,什么时候 “不犯”。 • (3)作为一种行动规则,战略必须是完备的,它 要给出参与人在每一种可想象到的情况下的行动 选择,即使参与人并不预期这种情况会实际发生。
博 弈 论
西 北 大 学 经济管理学院
课程主体结构
一、博弈论概述 二、博弈论的基本概念 三、完全信息静态博弈 四、完全信息动态博弈
课程主体结构
五、不完全信息静态博弈
六、不完全信息动态博弈
一、博弈论概述
• 1.博弈论概念(game theory) • (1)博弈:又称为对策或游戏,是指一些人或组 织在“策略相互依存”情形下相互影响、互相作 用的状态。 • (2)博弈论:研究决策主体的行为发生直接相互 作用时的决策,以及这种决策的均衡问题,即当 一个主体的选择受到其他主体选择的影响,而且 反过来影响到其他主体选择时的决策问题和均衡 问题。
经典博弈论概述
经典博弈论概述1 什么是博弈论博弈论是一种独特的处于各学科之间的研究人类行为的方法。
与博弈论有关的学科包括数学,经济学和其他社会科学和行为科学。
博弈论是由约翰•冯•诺依曼创立的,该领域第一本重要著作是诺依曼和另一个伟大的数理经济学家奥斯卡•摩根斯坦所著的。
博弈论是关于包含相互依存情况中理性行为的研究。
所谓相互依存,通常是指博弈中的任何一个参与者受到其他参与者行为的影响,反过来,他的行为也影响到其他参与者。
由于这种相互依存性,游戏或博弈的结果依赖于每一个参与者的决策,没有一个人能完全地控制所要发生的事情,也没有一个参与者处于孤独的状态。
相互依存常使博弈中的参与者之间产生竞争。
譬如两个人分蛋糕、每个参与者都希望自己的那块可以分得大一些。
然而,竞争仅仅是博弈论中相互依存的一个方面。
应该指出,通常地博弈并非纯粹是参与者之间的竞争,相互依存的另一个方面是参与者可以有某些共同的兴趣或利益所在。
仍以分蛋糕为例,作为参与者策略行动的结果,蛋糕的大小可以增加或者减少。
参与者的共同兴趣在于增加蛋糕的总量,他们互相“倾轧”之处在于如何分配。
从博弈论研究的角度,增大蛋糕应是博弈的第一步,而分配蛋糕则是博弈的第二步。
在博弈论中还需要对一个词“理性行为” 作一些说明。
博弈论中的所谓理性,一般不是指道德标准。
从参加博弈的参与者的眼光来看,他们试图去实施自己认为可能最好的行为,尽管这样的行为有可能损害了其他参与者。
由于参与者的相互依存性,博弈中一个理性的决策必定建立在预测其他参与者的反应之上。
一个参与者将自己置身于其他参与者的位置并为他着想从而预测其他参与者将选择的行动,在这个基础上该参与者决定自己最理想的行动,这就是博弈论方法的本质与精髓。
博弈论中每一个参与者做出理性决策的重要依据之一是他的可能收益有多少,这就是一个参与者需要认真计算的收益函数(payoff function) 。
对于每一个参与者、如果他们在可供自己选择的策略空间中任取一个策略作为自己的行动,既不会给自己带来盈利,又不会使他们必须付出,这种失去了激励机制的游戏本身也就失去了“博” 的意义,在社会经济领域中尤其不太可能出现这类现象。
博弈论概述
博弈论概述博弈论是研究决策制定者之间相互作用的一门学科。
在博弈论中,决策者被称为"玩家",他们的决策会影响其他玩家的利益。
博弈论的目标是研究玩家在不同情境下的最佳决策策略,以及这些策略对整体结果的影响。
以下是博弈论的一些基本概念和要点:1.玩家(Players):博弈中的参与者被称为玩家。
这可以是个体、公司、国家等。
2.策略(Strategies):玩家在博弈中采取的行动或决策被称为策略。
每个玩家可以有多种可能的策略。
3.支付(Payoffs):博弈的结果被称为支付,它反映了每个玩家在博弈结束时的效用或利润。
4.博弈矩阵(Game Matrix):通过博弈矩阵,可以清晰地表示玩家的策略选择和相应的支付。
博弈矩阵通常用于描述二人零和博弈。
5.纳什均衡(Nash Equilibrium):纳什均衡是指在博弈中,每个玩家都选择了最优的策略,给定其他玩家的选择,没有一个玩家有动机单方面改变自己的策略。
6.博弈形式(Normal Form)和博弈扩展形式(Extensive Form):博弈形式描述了一次性的、同步进行的博弈,而博弈扩展形式描述了具有序列和时间概念的博弈。
7.博弈的分类:博弈可以分为合作博弈和非合作博弈、零和博弈和非零和博弈、完全信息博弈和不完全信息博弈等。
8.博弈的应用领域:博弈论在经济学、政治学、社会学、生物学、计算机科学等多个领域都有广泛应用。
博弈论提供了一种分析人们在决策过程中相互作用的方式,它的应用范围涵盖了众多领域。
在博弈中,每个玩家都追求自己的最大利益,因此博弈论可以帮助人们更好地理解和预测复杂的决策场景。
博弈论概述
博弈论思想古已有之,我国古代的《孙子 兵法》就不仅是一部军事著作,而且算是 最早的一部博弈论专著。 博弈论最初主要研究象棋、桥牌、赌博中 的胜负问题,人们对博弈局势的把握只停 留在经验上,没有向理论化发展,正式发 展成一门学科则是在20世纪初。
1928年冯·诺依曼证明了博弈论的基本原 理,从而宣告了博弈论的正式诞生。 1944年,冯·诺依曼(John Von Neumann) 和奥· 摩根斯坦(Oscar Morgenstern)共著的 划时代巨著《博弈论与经济行为》将二人 博弈推广到n人博弈结构,并将博弈论系统 的应用于经济领域,从而奠定了这一学科 的基础和理论体系。
“囚徒的两难选择”有广泛而深刻的意义
个人理性与集体理性的冲突,各人追求利 己行为而导致的最终结局是一个“纳什均 衡”,也是对所有人都不利的结局。 他们两人都是在坦白与抵赖策略上首先想 到自己,这样他们必然要服长的刑期。 只有当他们都首先替对方着想时,或者相 互合谋(串供)时,才可以得到最短时间的 监禁的结果。
“纳什均衡”首先向“看不见的手”的原理提出 挑战 按照斯密的理论,在市场经济中,每一个 人都从利己的目的出发,而最终全社会达 到利他的效果。 从“纳什均衡”引出了“看不见的手”的 原理的一个悖论: 从利己目的出发,结果损人不利己,既不 利己也不利他。 从这个意义上说,“纳什均衡”提出的悖 论实际上动摇了西方经济学的基石。
最好的激励机制设计就象改变方案三-----减量加移位的办法,奖励并非人人有份, 而是直接针对个人(如业务按比例提成), 既节约了成本(对公司而言),又消除了 “搭便车”现象,能实现有效的激励。
许多人并未读过“智猪博弈”的故事,但是 却在自觉地使用小猪的策略。 股市上等待庄家抬轿的散户;等待产业市场 中出现具有赢利能力新产品,继而大举仿制 牟取暴利的游资;公司里不创造效益但分享 成果的人,等等。 因此,对于制订各种经济管理游戏规则的人, 必须深谙“智猪博弈”指标改变中的道理。
共同知识 博弈论
共同知识博弈论一、博弈论简介1. 定义- 博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论。
简单来说,就是在多个参与者(称为局中人)之间,每个局中人的决策会影响其他局中人的收益,同时也受其他局中人决策的影响,博弈论就是分析这种相互影响下的决策过程和结果。
- 例如在“囚徒困境”中,两个囚犯就是局中人,他们各自的坦白或抵赖决策会影响对方的刑期,也受对方决策的影响。
2. 基本要素- 局中人(Players):参与博弈的决策主体,可以是个人、企业、国家等。
例如在市场竞争博弈中,各个企业就是局中人。
- 策略(Strategies):局中人在博弈中可以采取的行动方案。
如在石头 - 剪刀- 布游戏中,出石头、剪刀、布就是不同的策略。
- 支付(Payoffs):局中人在不同策略组合下所得到的收益或者效用。
比如在企业竞争中,利润就是支付,如果一家企业通过降价策略获得了更多市场份额和更高利润,这个利润就是它在这种策略下的支付。
3. 博弈的分类- 按照局中人行动的先后顺序分类- 静态博弈(Static Game):局中人同时选择策略,或者虽然不是同时选择,但后行动者并不知道先行动者采取了什么策略。
例如猜硬币正反面的游戏,双方同时出硬币,或者即使不是严格同时,后出的人不知道先出的人出的是正面还是反面。
- 动态博弈(Dynamic Game):局中人的行动有先后顺序,并且后行动者能够观察到先行动者所选择的策略。
如象棋、围棋等棋类游戏,一方先走,另一方根据对方的走法再做决策。
- 按照局中人对其他局中人的特征、策略空间及支付函数的了解程度分类- 完全信息博弈(Game of Complete Information):每个局中人对所有其他局中人的特征、策略空间及支付函数有准确的了解。
例如在一个完全竞争的市场中,企业都知道其他企业的成本结构、生产能力等信息(这是一种理想情况)。
- 不完全信息博弈(Game of Incomplete Information):至少有一个局中人不完全了解其他局中人的特征、策略空间或支付函数。
博弈论基本概念
博弈论基本概念博弈论、优化理论、策略、报酬、均衡、囚徒困境一、博弈论1.定义:博弈论是描述、分析多人决策行为的一种决策理论,是多个经济主体在相互影响下的多元决策,决策的均衡结果取决于双方或多方的决策。
如下棋,最后的结果就是由下棋双方你来我往轮流做出决策,决策又相互影响、相互作用而得出的结果。
2.博弈论与优化理论的异同点1)相同点:博弈论与优化理论都是在给定的条件下,寻求最优决策的过程;2)不同点:A.优化理论可以看成是单人决策,而博弈理论可以看成是多人决策。
在优先理论的决策过程中,影响结果的所有变量都控制在决策者自己手里;而在博弈论的决策过程中,影响结果的变量是由多个决策者操纵的。
如企业在追求成本最小化、产量最大化、利润最大化的过程中总是假定外部条件给定,这实际上表明是一个优化问题,因为除了给定的外部条件外,剩下的因素都有决策者来控制,从而决策者自己就能控制决策的结果;如果外部条件不是给定的,而是有其他主体参与的过程,这时的决策过程就变成了一个博弈过程了,因为决策的最终结果不但取决于决策者本身,而且也取决于其他决策者的决策。
B.优化过程是一个确定的过程,而博弈过程是确定性和不确定性的统一。
优化过程是一个确定的过程,因为做出决策后,确定的结果就出来了。
说博弈过程有确定性,是因为决策各方的决策做出后,每一方的收益就确定了;说博弈过程有不确定性,在于一方做出决策后,影响结果的变量还有众多的其他决策者,在不知道其他主体行为的情况下,结果就不确定。
例如:在一次具体的战斗中,一方是否发起进攻,是一个决策。
如果发起进攻,对方肯定有所反应,客观上讲,必然会有一个确定的结果存在,这是确定性的表现。
但是最后的结果如何,取决于对方如何应对,所以在发起进攻时,并不能知道结局是怎样的,这就是不确定性的表现。
如果一方发起进攻后,另一方马上投降,则战斗结束;如果对方进行反攻,从理论上来讲,结果取决于双方实力以及双方收益的大小。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论与企业决策博弈论与企业决策第一章概述第二章博弈论的非技术描述第三章完全信息静态博弈第四章完全信息动态博弈第五章不完全信息静态博弈第六章不完全信息动态博弈第一章概述第一节博弈论与企业决策第二节博弈论的基本概念第三节博弈的分类第四节博弈论的发展简史第五节本课程基本内容第一节博弈论与企业决策一、市场结构与企业决策1、完全竞争市场1.市场特点:厂商假设产品假设信息假设要素假设2.厂商关系:相互独立影响极小3.厂商决策:MP=P P市场均衡价格4.市场性质:理论标尺第一节博弈论与企业决策2、完全垄断市场1.市场特点:一个厂商无相近替代品市场不可进入2.厂商关系:完全独立3.厂商决策:MR=P P由市场需求曲线决定4.市场性质:理论标尺注意:1.竞争和垄断的两重含义:市场状态和行为2.垄断厂商的需求曲线弹性不是无穷大的,而是有一定的弹性,弹性越小越可能垄断。
第一节博弈论与企业决策 3、垄断竞争市场1.市场特点:厂商众多产品差异自由进退2.厂商关系:相互影响,不易觉察3.厂商决策:MR=P P受厂商相互行为影响4.市场性质:现实市场第一节博弈论与企业决策4、寡头垄断市场1.市场特点:厂商数量不多产品同质或差异需求曲线不确定2.厂商行为:相互依赖,相互依存3.厂商决策:MR=P P可能是决策变量4.市场性质:现实市场第一节博弈论与企业决策二、企业决策特点1、现实市场是垄断竞争和寡头垄断市场2、现实市场上企业之间的决策是相互依赖,相互影响的3、传统的自我决策是不行的,企业之间的决策是策略性决策举例:二食堂一楼的盖饭(垄断竞争)一般两荤一素6.5元,有一家涨到10元,结果冷冷清清汽车制造企业的决策(寡头垄断)见:《中国企业企业广告行为》第一节博弈论与企业决策三、博弈论与企业决策1、博弈论就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。
2、现实中企业就是相互依赖、相互影响的关系。
3、因此,企业决策必须有博弈论的思想和方法。
第二节博弈论的基本概念二、博弈的构成要素1、参与人参与人是一个博弈的决策主体,他的目的是通过选择行动或战略以最大化自己的支付水平,每个参与人必须有可供选择的行动和一个很好定义的偏好函数。
那些不做决策的被动主体构成环境参数。
哪些人构成参与人要看博弈分析的目的。
参与人可以是自然人、组织、国家甚至国家集团。
虚拟参与人,也叫自然,是指决定外生随机变量概率分布的机制。
虚拟参与人没有自己的支付和目标函数,但是它的选择能影响参与人的决策后果。
第二节 博弈论的基本概念 2、行动行动是参与人在博弈的某个时点的决策变量。
行动空间是指某个参与人i 所有可选择行动的集合。
一般用A i 表示,用a i ∈A i 表示参与人i 的一个特定行动。
行动可以是离散的,也可以是连续的。
行动组合是指在n 人博弈中,n 个参与人的某个特定行动所构成的有序集,一般用a=(a 1,...,a i ,...a n )来表示,其中a i 是地i 个参与人的一个特定行动。
行动顺序是指一个博弈中参与人选择行动的先后顺序。
行动顺序不一定是指时间概念,更多的是信息概念。
因为参与人的行动往往包含参与人属于某种类型的信息。
博弈论一般假设参与人的行动空间和行动顺序是所有参与人的共同知识。
第二节博弈论的基本概念3、信息信息是指参与人有关博弈的知识,特别是与有关自然的选择、其他参与人的特征和行动的知识。
信息集是描述参与人信息特征的概念,是指一个参与人无法准确知道的变量的集合。
完美信息是指一个参与人对其他参与人包括自然的行动选择有准确了解的情况,即每一个信息集只包含一个值。
完全信息是指自然不首先行动或者自然的初始行动被所有参与人准确观察到的情况,即没有事前的不确定性。
共同知识是指所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道…的知识。
共同知识有时被称为一致信念。
第二节 博弈论的基本概念 4、战略(3)分析范式战略是指参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。
因为信息集包含着一个人有关其他参与人之前行动的知识,战略告诉参与人如何对其他参与人的行动作出反应,所以战略是参与人的相机行动方案。
战略空间是指一个参与人的所有可选择战略的集合。
战略组合是指n 个参与人某个特定战略所构成的有序集合。
一般用s i ∈S i 参与人i 的一个特定战略,S i 是参与人i 的战略空间。
s=(s 1,...,s i ,...,s n )表示n 个参与人的一个战略组合,其中s i 是第i 个参与人的一个特定战略。
∈第二节博弈论的基本概念战略与行动的关系:战略是行动的规则,行动是在战略规定下具体的选择变量。
在静态博弈中只有行动,无所谓战略,因为在静态博弈中参与人同时行动,其他参与人的行动是不可观察的。
而在动态博弈中行动和战略是有区别的。
作为行动规则,参与人的战略必须是完备的,它要给出参与人在每一种可想象到的情况下的行动选择,即使参与人并不预期这种情况会实际发生。
事实上,一种特定情况是否着你的发生,往往依赖于参与人的战略。
弱的怕强的,强的怕横的,横的怕不要命的。
第二节博弈论的基本概念5、支付支付是指在一定的战略组合下参与人得到的确定效用水平或者是指参与人得到的期望效用水平。
我们假定,每一个参与人的偏好都可以由一个v-N-M期望效用函数来代表。
令u i是第i个参与人的支付,u=(u1,...,u i,...,u n)为n个参与人的支付组合。
注意:博弈的一个重要特征是一个参与人的支付不仅取决于自己的战略选择,而且取决于所有其它参与人的战略选择,所以参与人的支付是所有参与人的战略选择的函数: u i=u i(s1,...,s i,...,s n)第二节博弈论的基本概念6、结果结果是博弈分析者(当然包括博弈的参与人)所感兴趣的所有东西,包括均衡战略组合、均衡行动组合、均衡支付组合等。
第二节博弈论的基本概念7、均衡均衡是所有参与人的最优战略的组合,一般记为 s*=(s1*,...,s i*,...,s n*)其中si *是第i个参与人在均衡情况下的最优战略,给定其他参与人的战略组合s-i =(s1,...,s i-1,s i+1,...,s n)。
说s i*是给定s-i情况下参与人i的最优战略,意味着u i(s i*,s-i)≥u i(s i',s-i) 对于所有的s i'≠s i* ,对于所有的i=1,...,n均衡和结果的关系:均衡是指所有人的最优战略组合,而结果是这个最优战略组合下所有可能出现的东西。
注意:均衡在物理中是各种力的抵消的结果,在经济学中是个人最大化的结果,而在博弈论中参与人最大化效用的最优战略组合。
第二节博弈论的基本概念三、博弈论博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的理论。
第三节博弈的分类一、按照博弈的参与人的人数分类1、单人博弈含义:单人博弈就是只有一个参与人的博弈。
特点:由于不存在其他参与人对博弈中唯一参与人的决策和行为的反应和反作用,单人博弈已经退化为一般的最优化问题。
单人博弈作为个体最优化问题,参与人用的信息越多越好,决策的准确性越高,得益就越好。
但是在两人及两人以上博弈中,拥有信息优势不一定能使参与人境况变好。
当然个体拥有信息必须符合效率原则,即信息的收集、加工、应用应该是有效率的。
第三节博弈的分类2、两人博弈含义:两人博弈就是有两个参与人的博弈。
特点:第一,利益并不总是对立的;第二,占有信息多未必多获益;第三,在相互作用下,个体追求最大化的行为往往不能导致实现社会收益最大化,有时也不能实现自身收益最大化。
第三节博弈的分类例子假设班级选班长,规则是得票多者当选。
假设班级有51人可以投票,有三个候选人分别是A、B和C。
如果投票可能结果如下:A:23票 B:20票 C:8票。
可见,C无论参与竞选或不参与竞选,他都不能当选(假设其收益是一样的),但是他的参选或不参选对A、B的影响是巨大的。
作为A当然希望他参选,而作为B当然不希望他参选,B只要能从其8票中争取到6票,则B当选。
C就是这个博弈中的破坏者。
第三节博弈的分类二、按照博弈参与人的行动顺序分类1、静态博弈含义:静态博弈是指参与人同时选择行动或者虽非同时但后行动的人不能观察到先行动的人的行动选择的博弈。
特点:“同时”不是时间概念,而是信息概念。
同时选择行动当然不能观察别人的行动选择;即使时间上不同时,只要后行动的人不能观察到先行动的人的行动选择,就不能从先行动的人的行动中获得其有关的信息,仍是静态博弈。
例子:划拳一级密封投标第三节博弈的分类2、动态博弈含义:动态博弈是参与人的行动有先后顺序且后行动的人能够观察到先行动的参与人所选择的行动的博弈。
特点:第一,行动有先后顺序,行动会透露出参与人的一些信息,后行动的人会根据先行动的人的行动所透露的信息采取相应的行动,先行动的人也会根据自己的偏好选择对自己最有力的行动。
第二,具有不对称性。
先后行动且可观察造成不对称性。
但是先行动未必有利。
先动优势(产量决策)后动优势(价格决策)第三节博弈的分类三、按博弈的信息分部分类1、完全信息博弈含义:完全信息博弈是指每一个博弈参与人对所有其它参与人的特征、战略空间和支付函数有准确知识的博弈。
特点:第一,博弈的每一个参与人都对其他所有参与人有完全的了解。
第二,博弈的信息不仅是完全的而且是对称的,也就是说博弈的所有信息都是共同知识。
2、不完全信息博弈含义:不完全信息博弈是指博弈的某一个参与人对至少某一个参与人的信息不完全的博弈。
特点:至少一个参与人具有私人信息。
第三节博弈的分类四、按博弈的战略空间分类1、有限战略博弈含义:有限战略博弈是指博弈的战略空间是有限的。
特点:第一,参与人的人数是有限的;第二,每个参与人的战略是有限的。
2、无限战略博弈含义:无限战略博弈是指博弈的战略空间是无限的。
特点:第一,参与人的人数是无限;或者第二,某个参与人的战略空间是无限的。
注意:博弈各个参与人的空间并不是对称的。
第三节博弈的分类五、按博弈的收益分类1、零和博弈含义:零和博弈是指在一定战略组合下特别是均衡战略组合下,所有参与人收益之和为零的博弈。
特点:第一,博弈参与人各方利益总是对立的。
第二,博弈即使重复多次各博弈方的利益也是对立的。
第三,无论博弈的收益如何分配,博弈的总收益对各博弈方构成的集体来说,都是无差异的。
第三节博弈的分类2、常和博弈含义:是指在一定战略组合下特别是均衡战略组合下,所有参与人收益之和为非零的常数的博弈。
特点:第一,各博弈方的利益是对立的。
第二,在重复博弈中因为总收益会增加,因此会出现相互妥协和和平共处。
注意:对立体现在既定利益如何分配上,共处体现在一旦达成协议,各方都会获得一定的利益,特别是在重复博弈中。