博弈论1
博弈论百度百科
博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
博弈论第一章
1完整信息静态博弈1.0 对策论研究的内容与根本形式对策论研究的内容对策论研究多个行为主体的决议问题。
对策论研究的形式博弈 (game),由多个行为主体组成的系统。
例Stackelberg modelCournot model博弈的种类参加者行动的时间与次序同时行动——静态博弈;先后行动——动向博弈。
参加者的信息多少信息同样——完整信息;信息不一样——不完整信息。
1.1 根本理论 : 博弈的标准式和纳什平衡例 1少儿游戏:“石头、剪刀、布〞。
博弈的准式表示(normal-form representation)(1) 参加人( player).n个参加人: 1, 2, ⋯, i, ⋯, n.(2)略 (strategy).一个参加人的略是他采纳的一个行。
参加人 i 的略: s i.参加人 i 的略空 : S i .略的一个合 : s ={s1,s2, ⋯, s n}.化表示: s-i ={ s1,⋯, s i -1, s i+1, ⋯ , s n }.(3)利润 (payoff).参加人i 的利润: u i= u i(s1,s2, ⋯, s n)n 个参加人博弈的准形式表示:G = {S1, S2,⋯S,n;u1, u2,⋯u,n}完整信息 (complete information) :每个参加人知道其余人的略空和利润。
静博弈(static game):全部的参加人同行。
每一个人行,不知道其余人的行。
例 1〔〕:博弈 {石、剪刀、布 } 的描绘:参加人:1,2。
略空:S1 = S2 = {石、剪刀、布 }利润:两人出手的函数u1 (石,石 ) = 0, u1 (石,剪刀 ) = 1, u1 (石,布 ) = -1⋯u2 (石,石 ) = 0, u2 (石,剪刀 ) = -1,u2 (石,布 ) = 1⋯⋯利润表:两个参加人,有限个略的博弈的表示方法。
P2石头剪刀布石头0 , 01,-1-1 ,1P剪刀-1,10 , 0 1 ,-11布 1 ,-1-1,10 , 0博弈的:可否知道每个参加人的略?例 2: 囚犯窘境 (The Prisoner ’s Dilemma)囚犯2缄默招认缄默-1 ,-1-9 ,0囚犯1招认0 ,-9-6 ,-6囚犯 1 的考:无方缄默是招,自己“招〞好于“缄默〞。
博弈论公式(一)
博弈论公式(一)博弈论公式1. 最小最大定理(Minimax Theorem)最小最大定理是博弈论中的重要定理之一,用于描述两个参与者在零和博弈中的最佳策略选择。
公式:[minimax theorem formula](在公式中,a和b是参与者的策略选择,F(a, b)是参与者根据自己的策略选择所获得的收益。
例子:假设有两名囚犯A和B,他们被起诉犯有共同的罪行。
检察官为了尽可能追求公正,提供了以下交易:•如果A和B都选择保持沉默,则每人判刑1年。
•如果A和B都选择揭发对方,则每人判刑3年。
•如果A揭发B而B选择保持沉默,则A不被判刑而B被判刑6年。
•如果B揭发A而A选择保持沉默,则B不被判刑而A被判刑6年。
根据最小最大定理,囚犯A和B都会选择揭发对方,因为即使对方也选择揭发自己,判刑3年的收益仍然比判刑6年的收益更高。
2. 纳什均衡(Nash Equilibrium)纳什均衡是博弈论中的概念,用于描述参与者选择最优策略时的平衡状态。
公式:[nash equilibrium formula](在公式中,A是参与者的策略集合,a是参与者的策略选择,u是参与者的效用函数,i表示参与者的编号。
例子:考虑一个两人博弈,参与者A和B可以选择合作(C)或背叛(D),他们的效用函数如下:•A选择合作(C)且B选择合作(C):A的效用=3,B的效用=3。
•A选择合作(C)且B选择背叛(D):A的效用=0,B的效用=5。
•A选择背叛(D)且B选择合作(C):A的效用=5,B的效用=0。
•A选择背叛(D)且B选择背叛(D):A的效用=1,B的效用=1。
在这种情况下,合作(C)和背叛(D)是纳什均衡,因为任何一名参与者如果改变自己的策略选择,都无法获得更高的效用。
3. 马赛克文件公式(Blurred File Formula)马赛克文件公式是博弈论中用于保护数据隐私的方法之一,通过模糊化数据来限制敏感信息的泄露。
公式:[blurred file formula](在公式中,F是原始文件,K是用于模糊化的密钥,⊕表示按位异或运算。
博弈论百度百科
博弈论百度百科博弈论是一门研究决策制定和决策结果的学科,它是应用数学的一个分支,通过运用数学和逻辑工具,探讨参与者在互动决策中的最佳策略选择。
在博弈论中,参与者被称为玩家,他们根据自身利益和目标来做出决策。
博弈论适用于各种不同领域的情境,包括经济学、政治学、生物学等。
一、概述博弈论的研究对象是策略性互动。
在一个博弈中,每个玩家都会依据一定的策略选择进行行动,而这个选择可能会受到其他玩家的影响。
博弈论试图理解和分析在这种互动中,参与者如何做出决策,并找到最优的解决方案。
博弈论的核心概念是博弈,一个博弈可以用一个四元组表示:(N, A, U, F),其中:- N表示参与博弈的玩家集合;- A表示每个玩家可选的行动集合;- U表示每个玩家的效用函数,用于衡量不同结果对该玩家的好坏程度;- F表示每个玩家的信息集合。
信息集合是指每个玩家在博弈过程中所了解的信息。
二、博弈论的重要概念1. 纳什均衡纳什均衡是博弈论中最重要的概念之一,指的是在一个博弈中,所有玩家选择的策略组合,使得任何玩家都没有动机单方面改变自己的策略。
纳什均衡是一个稳定状态,玩家之间不再有改变策略的动机。
2. 零和博弈与非零和博弈博弈可以分为零和博弈和非零和博弈。
零和博弈是指参与博弈的玩家的收益之和为零,即一方获利必然导致另一方的损失。
非零和博弈是指参与博弈的玩家的收益之和不为零,即可以存在多方共同受益的情况。
3. 微观博弈与宏观博弈微观博弈是指研究个体玩家之间的策略性互动,关注的是个体决策的结果。
宏观博弈是指研究整体群体之间的策略性互动,关注的是全局结果。
三、应用领域博弈论的研究在众多领域中都具有广泛的应用。
以下是博弈论在一些领域的应用举例:1. 经济学博弈论在经济学领域中有着广泛的应用。
它可以用来研究市场竞争、合作与冲突、价格形成等经济问题。
例如,博弈论可以用来分析竞争市场中的价格战和垄断市场中的价格定价策略。
2. 政治学博弈论在政治学领域中也有着重要的应用。
博弈论-第一章
二、博弈的基本式
如何将博弈表示成一种便于研究和分析的 形式显然是很重要的。如果用参与者、策略 和收益函数来(科学)描述一个博弈,就称 为博弈表达的基本式。
三、博弈的扩展式
博弈的扩展式就是非常详细地描绘出一个 博弈的参与者、策略、行动顺序以及行动时 拥有的信息、可能的结果和收益等细节就称 为博弈的扩展式。
四、信息和顺序
完全信息和非完全信息,完全和非完全 判断的标准就是如果有些信息只有一部分 参与者知道,并不是所有的信息都是公共 信息,那么博弈就是非完全信息博弈。
静态博弈和动态博弈,静态和动态的区 别并不在于时间上是否同时,而是在信息 上的一种同时行动。
公共知识与一般信息的区别。
定义1.2 博弈论是专门研究博弈如何出现均衡的 规律的学科。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
第二节 博弈论的经济学渊源
博弈论与经济学存在着不解之缘,主要是 由于下面几个方面: (1)博弈论的核心问题是经济学最早提出并 加以系统研究的。 (2)博弈论理论发展主要是经济学的需要推 动的,也主要是由经济学家加以发展。 (3)博弈论中的主要问题基本上都涉及到经 济利益冲突问题。
定义1.1 博弈是指利益存在冲突的决策主体(个 人,企业,集团,政党,国家等等)在相互对抗 (或合作)中,对抗双方(或多方)相互依存的 一系列策略和行动的过程集合。
在定义1.1中,我们最需要注意的就是策略的相互 依存性。对于策略的相互依存性,传统的经济学 不是不想研究,而是缺乏有效的工具。从这个意 义上而言,博弈论正是为了解决这一问题而产生 的。也是从这个意义上讲,我们有了博弈论的定 义。
• • • •
博弈论(第一、二章)
游戏2:摘柿子
甲 跑
摇 跑
乙
摇 跑
甲
摇
乙 跑
摇 跑
甲
不跑 (2,2)
(0,0)
(0,1) (2,0)
(0,3) (4,0)
游戏3:免费彩票博弈
每个人可以免费购买任意数量彩票,随机 抽取1张彩票中奖,奖金总额为1000万元/n,n 为彩票数量。
博弈论:研究理性人行为选择的理论
博弈论作用:帮助个人、组织等决策主 体深刻理解策略并明智的选择行动。
第二章 完全信息静态博弈
� 基本分析思路和方法 � 纳什均衡 � 混合策略 � 纳什均衡的选择
第一节 基本分析思路和方法
行动或策略(acቤተ መጻሕፍቲ ባይዱion or strategy)
si:局中人i的一个特定策略 Si:局中人i的策略集(strategy set)或策略空间 (strategy space),可以是离散的或连续的。
纳什的基本贡献是证明了非合作博弈均衡解 及其存在性,建立了作为博弈论基础的“纳 什均衡”概念;海萨尼则把不完全信息纳入 到博弈论方法体系中;泽尔腾的贡献在于将 博弈论由静态向动态的扩展,建立了“子博 弈精练纳什均衡”的概念。
1996莫里斯(James A.Mirrlees)和维克瑞(William Vickrey)
游戏1:军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1
C -1 +1 +1
游戏1:军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1
经济博弈论1
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的 利益并没有影响,但却会对其他博弈方的利 益产生很大的,有时甚至是决定性的影响。 申办奥运会是典型例子。(竞选等。破坏者、
合作者——共谋)
多人博弈的表示有时与两人博弈不同,需要 多个得益矩阵,或者只能用描述法
多个厂商(3厂商)采用新技术与老技术的博弈
“囚徒困境”的内在根源是在个体之间存在行为和利 益相互制约的博弈结构中,以个体理性和个体选择为 基础的分散决策方式,无法有效地协调各方面的利益, 并实现整体、个体利益共同的最优。简单地说, “囚徒困境”问题都是个体理性和集体理性的矛盾引 起的。
现实中“囚徒困境”类型的问题是很多的。例如厂商 之间的价格大战、恶性的广告竞争、初等和中等教育 中的应试教育、乱砍林木、生育、排污等,其实都是 “囚徒困境”博弈的表现形式。
1.3.2 博弈中的策略
策略:博弈中各博弈方的选择内容(每个博弈方的 可选策略不一定完全相同,即不一定对称) 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可选策 略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限多个 (如连续产量的确定)
这是对称的零和博弈
其他几个典型的博弈问题
1、智猪博弈(Boxed Pigs)
猪圈里圈两头猪,一头大猪,一头小猪。猪圈的一边有一个猪 食槽,另一边安装一个按钮,控制着猪食的供应。按一下按钮会 有10个单位的猪食进槽,但谁按按钮谁就需要付2个单位的成本。 若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到, 大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位, 小猪吃4个单位。最后结果如何呢? 小猪 按 等 按 大猪 等
《产业经济学》第五章--(博弈1)讲解
在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。
微观经济学第11章博弈论1
4.3 博弈论的成长和发展
一、第一个研究高潮,本世纪40年代末和50年代初
1950年纳什提出“纳什均衡”(Nash equilibrium)概 念和证明纳什定理,发展非合作博弈的基础理论。 1950年Melvin Dresher和Merrill Flood在兰德公司(美国 空军)“囚徒的困境”(Prison’s dilemma)博弈实验, (Howard Raiffa)独立进行这个博弈实验; 1952-1953年期间(L. S. Shapley)和(D. B. Gillies)提 出“核”(Core)作为合作博弈的一般解概念 Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。 奥曼(R. J. Aumann)“40年代末50年代初是博弈论历 史上令人振奋的时期,原理已经破茧而出,正在试飞 它们的双翅,活跃着一批巨人。”
1
运输路线得益矩阵
单人博弈实质 个体最优化问题
-7000
-10000 -16000
运输路线扩展形
-10000
二、两人博弈
两人博弈即有两个博弈方的博弈 两人博弈最常见,研究最多,是最基本和有用 的博弈类型 囚徒困境、猜硬币、齐威王田忌赛马等都是两 人博弈 两人博弈有多种可能性,博弈方的利益方向可 能一致,也可以不一致
政府组织协调的 必要性和重要性
寡头1:低价(70) 寡头2:低价(70)
2.2 赌胜博弈
赌博、竞技等构成的博弈问题,在经济中 也有许多应用,赌胜博弈也是一类重要的 博弈问题,对经济竞争和合作也有很大启 示 赌胜博弈的特点是一方得等于另一方失, 不可能双赢,属于“零和博弈”
博弈论习题1
1、一逃犯从关押他的监狱中逃走,一看守奉命追捕。
如果逃
犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。
逃犯逃脱可少坐10年牢,但一旦被抓住则要
加刑10年;看守抓住逃犯能得1000元奖金。
请用得益矩阵表示该博弈。
2、你正在考虑是否投资100万元开设一家饭店。
假设情况是
这样的:你决定开,则0.35的概率你将收益300万元(包
括投资),而0.65的概率你将全部亏损掉;如果你不开,
则你能保住本钱但也不会有利润。
请你:
(1)用得益矩阵表示该博弈。
(2)如果你是风险中性者,你会怎样选择?
(3)如果你是风险规避者,且期望得益的折扣系数为0.9,你的策略选择是什么?
3、假设长虹和创维这两家彩电生产商都可以选择集中力量研
发生产低档产品或高档产品,但他们在选择时都不知道对方的选择。
假设他们在不同选择下的收益矩阵如下图所示。
请问:该博弈的均衡是什么?。
博弈论(一)
◆博弈论(game theory)是由美国数学家冯·诺依曼(Von. Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。
1994年,三位博弈论专家即数学家纳什(Nash,他的故事被好莱坞拍成电影《美丽心灵》,该影片获得了2002年奥斯卡金像奖的四项大奖)、经济学家海萨尼(Harsanyi)和泽尔滕(Selten)因在博弈论及其在经济学中的应用研究上所作出的巨大贡献而获得诺贝尔经济学奖。
◆1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。
2005年诺贝尔经济学奖由拥有以色列和美国双重国籍的经济学家罗伯特·奥曼和美国经济学家托马斯·谢林分享,两位经济学家获得诺贝尔经济学奖是因为“他们通过对博弈论的分析加深了我们对冲突与合作的理解” (瑞典皇家科学院评语)。
◆为什么博弈论在经济学领域会产生如此大的影响呢?这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订。
一、什么是博弈论:从“囚徒困境”谈起1. 囚徒困境两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。
警方将两人分别臵于两间房间分开审讯,政策是若一人坦白但另一人抵赖,则坦白者立即被释放,抵赖者判入狱10年;若二人都坦白则两人各判刑8年;若两人都不坦白则未获证据但因私入民宅各拘留1年。
表1 囚徒困境博弈乙坦白抵赖坦白甲抵赖(问题:甲、乙如何选择?)☐囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。
博弈论初步(1)
【例题1.1.1】出硬币博弈———硬币配对游戏
解甲、乙两人各拿一枚1元硬币,背靠背各自将硬币正面(1元币值面)或反向(菊花图案面)朝上置于手掌心中握紧。
然后,转身面对面,同时展开手掌。
游戏规则是,如果两人掌上硬币都是正面朝上或都是反面朝上,那么甲就赢了乙1元钱,或者说乙输给了甲1元钱;如果两人掌上硬币是一正一反,那么乙就赢了甲1元钱,或者说甲输给了乙1元钱。
【例题1.1.2】价格竞争博弈
解企业A与企业B生产同一种商品在市场上形成双寡头垄断市场,它们对商品都可以选择三种价格(高价、中价或低价)投放市场。
市场规则:不管哪个企业开出较低价格,它就可以得整个市场;如果两个企业开价相同,它们将平分市场。
这里进一步给出企业A,B选择不同价格获得的收益情况:企业A选择“中价”,企业B选择“高价”,这时企业A独占市场收益10万元;企业A选择“低价”,而企业B选择“高价”或“中价”,这时企业A仍独占市场,但因定出“低价”,因此收益为8万元。
当企业B选择较低价格,情况类同。
当企业A,B同时都选择“高价”,这时它们平分市场,各自收益为6万元;同时都选择“中价”,各自收益为5万元;同时都选择“低价”,各自收益为4万元。
博弈论(第一章)
博弈的表述方法的例题
例:囚徒困境博弈的集合表示:G=((坦白,不坦白), (坦 白,不坦白);(-5,-5),(0,-8),(-8, 0),(-1,-1)) 例:在两个公司竞争出售同一产品的博弈中,两个公司是两 个博弈方,两个公司的各自销售量q1,q2是策略空间,
两个公司的所获利润u1(q1,q2),u2(q1,q2)是得
①用损益矩阵表示 例1:故事齐威王与大将田忌赛马,赛马的规则是这样的,每次 双方各出三匹马,一对一比赛三场,每一场的输方要赔1000斤 铜给赢方,齐威王的三匹马和田忌的三匹马按实力都可以分为 上,中,下三等,但齐威王的上,中,下三匹马分别比田忌的 上,中,下三匹马略胜一筹,由于总是同等次的马进行比赛, 因此田忌都是连输三场。实际上,田忌的上马尽管不如齐威王 的上马,却比齐威王的中马和下马要好,而田忌的中马比齐威 王的下马要好一些。因此,田忌的谋士孙膑为田忌出了个主意, 用自己的下马对齐威王的上马,上马对齐威王的中马,中马对 齐威王的下马。这样,二胜一负,田忌反而能赢齐威王1000斤 铜,试写出其标准式表述。
你能否写出上述问题的矩阵形式?
(3)囚徒困境的应用
③ 假定你是一个公司的采购人员,考虑向两家供应商采 购100万只零件,每只零件的成本为6元。如果你分别 向两家供应商各订购50万只,则每个供应商就会把价 格定在10元。你可以设计一个采购策略,以便在两家 供应商之间制造出囚徒困境的情形,从而给自己带来 好处。如何取定这样的采购政策,并写出其矩阵的表 达形式。同时,考虑你的采购策略的使用条件是什么?
低价
80, 80 100, 20
20, 100 50, 50
(3)囚徒困境的应用
② 公共产品的供给也可以看作是一个囚徒困境问题,如 果大家都出钱兴办公用事业,所有的人福利都会增加。 问题是,如果我出钱你不出钱,我得不偿失,而如果 你出钱我不出钱,我可以占你的便宜。所以每个人的 最优选择都是“不出钱”,但是这种状态使得所有人 的福利得不到提高。
博弈论第一章
招认 囚徒1 沉默
囚徒2 招认 沉默 –5, -5 0, -8 -8, 0 -1 , -1
囚徒的困境
策略“沉默”严格劣于策略“招认”
博弈分析的目的:预测博弈的均衡结果, 即给定每个参与人都是理性的是共同知识, 什么是每个参与人的最优策略?什么是所有 参与人的最优策略组合?
*肯定性(sure-thing)或替代性(substitution) 公理:一个决策者在事件A发生的偏好选项1 胜于选项2,并且在事件A不发生时也 偏好选项1胜于选项2,那么就有,他 在知道事件A无论是发生还是不发生之 前都应该偏好选项1胜于选项2。
Chapter 1 完全信息静态博弈 Static Games of Complete Information In this chapter we consider games of the following simple form: first, the players simultaneously choose actions; then, the players receive payoffs that depend on the combination of actions just chosen. Within the class of such static (or simultaneous-move) games,we restrict attention to games of complete information. That
招认
囚徒2 招认 沉默 –5, -5 0, -8
-8, 0 -1 , -1
囚徒1
沉默
囚徒的困境
We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game; (2)the strategies available to each player; (3)the payoff received by each player for each combination of strategies that could be chosen by the players.
MBA必修课程《博弈论》第一部分:典型案例及导论
弱者是如何胜出的?
Page 8
他就是枪手丙。是的,没错,他的枪法最差,怎么说也 轮不到他胜利呀。但事实是,如果没有出现重大意外或者奇 迹,这场对决中只有枪手丙能够活下来。
甲:向乙开枪100% 乙:向甲开枪80% 丙:向甲开枪60% 结局死的概率:
甲: 80%*40%+60%*20%+80%*60%=32+12+48=92%
乔治·阿克尔洛夫
乔治·阿克尔洛夫 (1940-)美国人,他对市场的不对称信息 研究具有里程碑意义.引入信息经济学研究中的一个著名 模型是“柠檬市场”(注:“柠檬”一词在美国俚语中表 示“次品”或“不中用的东西”),主要用来描述当产品 的卖方对产品质量比买方有更多的信息时,低质量产品将 会驱逐高质量商品,从而使市场上的产品质量持续下降的 情形.阿克尔洛夫的理论被广泛运用于一些完全不同的领 域,如健康保险、金融市场和雇佣合同等.获得2001年诺 贝尔经济奖.
2001诺贝尔经济奖
Page 21
2001年,三位经济学家阿克洛夫(G.A.Akerlof )、斯蒂格利茨 (J.E.Stiglitz)和斯彭斯(A.M.Spence)因运用博弈论研究信息经济学所取 得的成就而成为这个年度的诺贝尔经济学奖得主.
迈克尔·斯彭斯
迈克尔·斯彭斯 (1948-)美国人 ,他认为,假如雇主不能区分 高能力和低能力的劳动能力之间的区别,那么就会导致劳动 力市场以低工资雇用低能力者,形成劳动力市场上“劣币驱 逐良币”的现象.斯彭斯还发现一个现象,即高能力的男性预 期获得比同等能力的妇女更高的学历.在这种均衡下,在男女 之间的教育回报由于教育方面投资的不同而不同.另外,斯彭 斯信号发送模型还对博弈论产生了深远的影响,他的专业竞 争下的市场均衡模型已经影响到其他领域,比如增长理论和 国际贸易.获得2001年诺贝尔经济奖.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
零和博弈:也称“严格竞争博弈”。博弈方之 间利益始终对立,偏好通常不同 —猜硬币,田忌赛马,石头-剪刀-布 常和博弈:博弈方之间利益的总和为常数。博 弈方之间的利益是对立的且是竞争关系 —分配固定数额的奖金、利润,遗产官司 (?) 变和博弈:零和博弈和常和博弈以外的所有博 弈。合作利益存在,博弈效率问题的重要性。 —囚徒困境、产量博弈(OPEC)、制式问 题(充电器:万能插头)等
高级微观经济学的五大部分( MWG)
个体决策 博弈论 市场均衡与市场失灵 一般均衡 福利经济学与激励。
【博弈论与追女生】如果四个男生全都去追一 个漂亮女生,那她一定会摆足架子,谁也不答 理;这时男生再去追别的女孩儿,别人也不会 接受,因为没有人愿意当次品。但是,如果他 们四个先追其她女生,那个漂亮女孩儿就会被 孤立,这时再追她就简单多了。 ——数学大师纳什关于博弈论的最简单表述 。
1.3.5 博弈的信息结构
[Complete]完全信息博弈:各博弈方都完全 了解所有博弈方各种情况下的得益 不完全信息博弈:至少部分博弈方不完全了解 其他博弈方得益的情况的博弈,也称为“不对 称信息博弈” [Perfect]完美信息博弈: (动态博弈中)每 个轮到行为的博弈方对博弈的进程完全了解的 博弈 不完美信息博弈:至少某些博弈方在轮到行动 时不完全了解此前全部博弈的进程的博弈
一、单人博弈——只有一个博弈方的博弈
例一:单人迷宫
节点(Nodes)、信息集(Inf Set) 扩展形 A,1 右 A B 0 出口(奖金M) M 0 右 Extensive Form 左 B,1
入口
左
例二:运输路线
自 然 好天气(75%) 商 人 水 路 陆 路 -7000 -10000 坏天气(25%) -16000 -10000
1.1.2 一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定的环 境条件,在一定的规则下,同时或先后,一次或多次,从各 自允许选择的行为或策略中进行选择并加以实施,各自取得 相应结果的过程。
四个核心方面 博弈的参加者(Players)——博弈方 各博弈方的策略(Strategies)或行为(Actions) 博弈的次序(Orders) 博弈方的得益(Payoffs)[支付]:连续、反身、传递、完全
1.3.4 博弈的过程
博弈过程:博弈方选择、行为的次序,包括 是否多次重复选择、行为。 博弈过程对博弈结果也有重要影响。 根据博弈的过程,博弈可分为静态(static) 博弈、动态(Dynamic/Multistage)博弈、 重复(Repeated)博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型 动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构[技术战(专利保护)/商业战(无专利 保护)]
1.3.3 博弈中的得益
得益:各博弈方从博弈中所获得的利益 得益对应博弈的结果,也就是各博弈方策 略的组合 得益是各博弈方追求的根本目标及行为和 判断的主要依据 根据得益的博弈分类:零和博弈(Zero-sum Gams)、常和(Constant-sum)博弈、变和 (Variable-sum)博弈
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题 一次性(One-shot)博弈:原博弈、阶段博弈 有限次重复博弈(Finitely Repeated Games) 无限次重复博弈(Infinitely Repeated Games) 声誉问题:KMRW的四人帮模型(1982) 参与人对其他参与人支付函数或战略空间的不 完全信息对均衡结果有重要影响,合作行为在 有限次重复博弈中会出现,只要博弈重复次数 足够长。 (冷酷)触发策略(Grim Trigger Strategy) vs 以牙还牙(Tit for Tat)
1.2 几个经典博弈模型
1.2.1 囚徒的困境 1.2.2 赌胜博弈 1.2.3 产量决策的古诺模型
1.2.1 囚徒的困境
囚徒的困境是图克(Tucker)1950年提出 的 该博弈是博弈论最经典、著名的博弈 该博弈本身讲的是一个法律刑侦或犯罪学 方面的问题,但可以扩展到许多经济问题, 以及各种社会问题,可以揭示市场经济的 根本缺陷
25
20 25 33 21
30
24 25 33 21
3 4
3
二、n个厂商连续产量
n
Q
q
i 1
i
P P(Q) P( qi )
i 1
n
qi P qi P( qi )
i 1
n
qi P( qi ) cqi qi [ P( qi ) c]
i 1 i 1
下 上 中
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
下 中 上 1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
得益矩阵
取胜关键:不让对方猜到自己策略,尽可能猜出对方策略
二、猜硬币博弈
猜硬币方 正 面
盖 硬 币 方
反 面
1, -1 -1, 1
正 面
反 面
-1, 1 1, -1
一、基本模型
囚徒 2 坦 白 囚 坦 白 徒 1 不坦白 囚徒1:坦白 囚徒2:坦白 -5, -5 -8, 0 不坦白 0, -8 -1, -1
两个罪犯的得益矩阵 (Payoff Matrix)
二、双寡头削价竞争
寡头2 高 价 寡 头 1 高 价 低 价 100,100 150,20 低 价 20,105 70,70
Tirole :正如理性预期使宏观经济学发生 革命一样, 博弈论广泛而深远地改变了 经济学家的思维方式 。 如果说博弈论能改变经济学家的思维方 式, 那么机制设计就能使规则制定者的 梦想成真 。
教材:
《博弈论基础》Robert Gibbons 中国社会科学出版社
博弈论、信息经济学
本章介绍博弈论的基本概念,包括什么是 博弈和博弈论,给出一些经典博弈例子。对博 弈分类和博弈理论的结构作一些讨论,对博弈 论的发展历史等作简单介绍。目标是让读对博 弈论的内容和博弈模型有更直观的概念和印象, 本教材的基本内容,以及博弈分析的基本思想 方法等形成初步的认识,为后面各章展开详细 分析作好铺垫和准备。
1.3.6 博弈方的能力和理性
完全理性和有限理性 完全理性(perfect rationality):有完美的分析判断能力和不会 犯选择行为的错误 有限理性(Bounded Rationality):博弈方的判断选择能力有缺陷 演化博弈(Evolutionary Game): John Maynard Smith “进化 稳定策略”( Evolutionarily stable strategy,ESS)鞍点稳定 个体理性和集体理性 个体理性:一个体利益最大为目标 集体理性:追求集体利益最大化 合作博弈:允许存在有约束力协议的博弈 非合作博弈:不允许存在有约束力协议的博弈
好天气 (75%)
0
坏天气 (25%)
1
运输路线得益矩阵
单人博弈实质 个体最优化问题
-7000
-10000 -16000
运输路线扩展形
-10000
二、两人博弈
两人博弈即有两个博弈方的博弈 两人博弈最常见,研究最多,是最基本和有用 的博弈类型 囚徒困境、猜硬币、齐威王田忌赛马等都是两 人博弈 两人博弈有多种可能性,博弈方的利益方向可 能一致,也可以不一致
三、石头、剪子、布(4)
1.2.3 产量决策的古诺模型
古诺模型是寡头产量竞争,是市场经济中 最常见的问题之一 古诺1838年提出,直到现在还是经常使用 古诺模型有很多扩展 古诺模型与囚徒困境相似,对理解市场经 济和博弈分析本身都有重要价值
一、三厂商离散产量
Q q1 q2 q3
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利 益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
1.3.2 博弈中的策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可 选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限 多个
一、田忌赛马
田 忌
上 中 下
齐 威 王 上中下 上下中 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
上 下 中
1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
中 上 下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
中 下 上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
本章分五节
1. 1. 1. 1. 1.
பைடு நூலகம்
1什么是博弈论 2几类经典博弈模型 3博弈结构和博弈的分类 4博弈论历史和发展的简要评述 5博弈论在我国的应用
1.1 什么是博弈论
1.1.1 从游戏到博弈 1.1.2 一个非技术性定义
1.1.1 从游戏到博弈
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、 策略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和ISIS、以色列和巴勒斯坦