博弈论与实验研究(泽尔腾)

合集下载

博弈论完整版PPT课件

博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。

“博弈论”中的经典案例

“博弈论”中的经典案例

“博弈论”中的经典案例“博弈论”中的经典案例“博弈论”中一些经典案例,不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然。

“博弈论”中有一些由点及面、发人深思的经典案例,这些案例不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然;不仅成为“博弈论”中的一道亮丽风景,也是整个经济学领域中的学术奇葩。

1、囚徒困境假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。

警察局将这两名嫌疑犯分别关押以防他们串供。

两名囚徒明白,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的妨碍公务罪各判1年;如果一人交代,另一人不交代,交代者有可能会被立即释放,不交代者则将可能被重判8年。

对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。

但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一囚徒交代了,自己就将可能处于非常不利的境地。

对于囚徒A而言,不管囚徒B采取何种策略,他的最佳策略都是交代。

对于囚徒B而言也是如此。

最后两人都会选择交代。

因此,囚徒困境反映了个体理性行为与集体理性行为之间的矛盾、冲突。

囚徒困境现象在现实生活中比比皆是。

记得姜昆和唐杰忠过去说过一个公共楼道占用问题的相声。

住户在公共楼道里堆满了杂物,结果大家都极不方便,以致即将分娩的妇女都没法及时被送往医院。

但你如果不占用公共楼道,别人也会占用。

每一居住面积狭小的住户从自我利益最大化出发,都会选择占用。

但占用的结果却最终损害了大家的利益。

前几年,我国彩电市场上,生产厂家基于自我利益选择大幅降价,但由此引发的价格战使所有生产厂家都遭受重创,这也是一种囚徒困境。

2、斗鸡博弈两只公鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味着认输。

在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、背水一战的决心来,以迫使对方退却。

博弈论介绍

博弈论介绍


为什么博弈论在经济学领域会产生如此大的影响呢?这 是因为博弈论改变了传统微观经济学的某些基本假设,从 一个独特的视角帮助我们更加深刻地理解和把握经济现象, 并指导更加有效的经济政策制订。博弈论作为现代经济学 的前沿领域,已成为占据主流的基本分析工具。
一、博弈论的基本概念
博弈论,英文为Game theory,是研究相互依赖、相互影响的 决策主体的理性决策行为以及这些决策的均衡结果的理论。 • 这些相互依赖、相互影响的决策行为及其结果的组合称为博 弈(Game)。
行动次序
信息
静态 纳什均衡 纳什 贝叶斯均衡 海萨尼
动态 子博弈精练 纳什均衡 泽尔腾 精炼贝叶斯均衡 泽尔腾等
完全信息
不完全信息
二、博弈的种类
• 一、完全信息静态博弈 • (一)完全信息静态博弈定义 • 所谓完全信息静态博弈指的是各博弈方同时决策,或者决 策行动虽有先后,但后行动者不知道先行动者的具体行动 是什么且各博弈方对博弈中各种策略组合情况下所有参与 人相应的得益都完全了解的博弈。 • 在博弈论中,一个博弈可以用两种不同的方式来表达: • 一种是策略式表达:另一种是扩展式表达.策略式表达更适 合于静态博弈,而扩展式表达更适合于讨论动态博弈。
•性别战(battle of sexes) 女 足球 男 足球 芭蕾 2,1 0,0 芭蕾 0,0 1,2
• 斗鸡博弈(chicken game)(胆小鬼博弈)
B 进 退
A
进 退
-3,-3
0,2
2,0
0,0
• 进入阻挠(entry deterrance) 在位者 默许 斗争
进入者
进入 不进入
40,50
0,300
-10,0
0,300

博弈基础知识

博弈基础知识

2014
让-梯若尔(Jean Tirole)
2014 年诺贝尔奖获得者——让-梯若尔
The science of taming powerful firms Market power and regulation
4
2014 年诺贝尔奖获得者——让-梯若尔
Government incentives in procurement and regulation theory(1993)
博弈论与诺贝尔经济学奖 博弈论相关基础知识



区域产品质量监管机制研究
政府、企业和消费者
政府、企业和第三方检测机构
1.博弈类型划分


按照能否达成一个具有约束力的协议: 合作博弈(团体理性)、非合作博弈 (个人理性) 按照行动的顺序:静态博弈、动态博弈 按照信息拥有程度:完全信息博弈、不完全信息博弈 按照博弈结果:零和博弈(输赢)、非零和博弈(双赢)
表2-1 博弈的类型划分
行动顺序 信息
静态 动态 (标准形式、战略式表述) (博弈树、扩展式表述) 完全信息静态博弈 完全信息动态博弈
完全信息
不完全信息
不完全信息静态博弈
不完全信息动态博弈
8
2.博弈均衡




完全信息静态博弈:占优战略均衡、重复剔除 占优战略均衡、纯战略Nash均衡、混合战略 Nash均衡 完全信息动态博弈:子博弈精炼Nash均衡、重 复剔除劣战略、 Leader-Follower主从对策模型 不完全信息静态博弈:海萨尼(Harsanyi)转换、 贝叶斯Nash均衡 不完全信息动态博弈:贝叶斯法则、精炼贝叶 斯Nash均衡、序贯均衡、混同均衡、分离均衡

博弈论历史

博弈论历史

博弈论历史博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。

以下是我为你整理的博弈论发展历史。

欢迎欣赏阅读。

博弈论发展历程博弈的原始思想萌芽于两千多年前,《孙子兵法》、《孙膑兵法》、《三十六计》、《六韬》等书中就有许多博弈案例,“田忌与齐王赛马”就是博弈实例之一。

《摩诃婆罗多》、《梨俱吠陀》、《圣经》中记述了骰子游戏,我国在春秋战国时期就出现六博、围棋等博弈。

在西欧,德国哲学家和数学家莱布尼茨于1710年就预言了关于策略博弈理论出现的必要性和可能性。

其后两年,詹姆斯·华尔德格拉特James Waldradre首次提出了“极小极大”定理的概念。

虽然对具有策略依存特点的决策问题的零星研究则可上溯到18世纪初甚至更早,但是,博弈论的真正发展与成熟还是在20世纪。

在20世纪20年代,法国数学家波莱尔 Borel最早用数学语言刻画了博弈问题,提出了“策略”和“混和策略”概念,用最佳策略和概念研究了下棋和其它许多具体的决策问题,并试图把它们作为应用数学的分支加以系统研究。

冯·诺伊曼Von Neumann是博弈论又称对策论的创始人之一,1928年他发表“关于伙伴游戏理论”Zur Theorie der Gesellschaftsspiele提出两人零和博弈的极小极大定理。

他首次证明了博弈论基本定理,即“每个矩阵博弈都能通过引进混合策略而被严格决定”,现代博弈论正式诞生。

他讨论了合作对策问题,特别是三人零和博弈中有两方联合的情形,结果表明在附加条件下,N人博弈问题的解存在且唯一。

1944年冯·诺伊曼和摩根斯坦Morgenstern合作的《博弈论和经济行为》一书提出合作博弈的基本模型,标志着系统的博弈理论的初步形成。

他们创立了博弈论研究的基本概念。

到20世纪50年代,合作博弈发展到鼎盛时期,包括纳什Nash和夏普里shapley的“讨价还价模型”,吉尔斯Gillies和夏普里关于合作博弈中的“核”Core的概念以及其他一些人的贡献。

博弈论研究

博弈论研究

博弈论研究博弈论研究的是什么?1994年10月11日,瑞典皇家科学院宣布,由于纳什博士对非合作博弈理论中的均衡问题进行了开创性分析,与哈尔萨尼教授(P rofessor JohnC.Harsanyi)和泽尔滕教授(P rofessorDr.Reinhard Selten)分享了该年度的诺贝尔经济学奖,奖金93万美元。

博弈论研究人们的策略互动行为。

博弈论认为:一、人是理性的,即人人都会在约束条件下最大化自身的利益;二、人们在交往合作中有冲突,行为互相影响,而且信息不对称。

博弈论研究人们的行为,在直接相互作用时的决策,以及决策的均衡问题。

换句话说,博弈论研究如何使得人们在市场经济中,自愿做出大家都遵守和实施的有效制度安排,以增进社会的福利的机制。

博弈论是深刻理解经济行为和社会问题的基础。

现在人们说的博弈论,一般指非合作博弈论。

它的特征是:人们行为相互作用时,当事人不能达成一个有约束力的协议。

或者说,行为人之间的合约对于签约人没有实质性约束力。

例如,现实中的非合作博弈问题的例子是,石油卡特尔欧佩克的产量协议,对于其成员国就没有约束力。

你心里想什么我不知道,我也不想让你知道我心里想什么。

因此,协议经常不能坚持到底,总有一国先行增产降价以谋求自己更高的利润。

纳什在1950年和1951年发表了两篇关于非合作博弈的论文,《n人博弈中的均衡点》和《非合作博弈》,定义了“纳什均衡”概念,与T ucker于1950年定义的“囚徒困境”一起,奠定了当代非合作博弈论的基石。

纳什获得诺贝尔经济学奖,就是基于这两篇论文。

在纳什的基础上,后来的泽尔滕精炼了纳什均衡概念,定义了完全信息动态博弈的“子博弈完备纳什均衡”(1965),以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”(1975)。

而哈尔萨尼则发展了刻画不完全信息静态博弈的“贝叶斯纳什均衡”(1967-1968)。

总之,他俩进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。

博弈论发展史及主要著作

博弈论发展史及主要著作

博弈论发展史及主要著作博弈论发展史及主要著作纳什(JohnNash)、泽尔腾(ReinhardSelten)和海萨尼(JohnHarsany)三位博弈理论家和经济学家。

第一阶段:1944年以前,早期思想和基本概念的形成。

1838年,法国经济学家奥古斯汀古诺(AugustinCournot)在分析生产者竞争时,就利用均衡概念研究了寡头市场的情况,并使用了解的概念,该概念实际上是后来的纳什均衡的一种严格说法。

1881年英国经济学家埃奇沃斯(FrancisY.Edgworth)提出了"契约曲线(ContractCurve)"作为决定个体之间交易结果题目的一个解。

1913年,博弈论中第一个定理--泽梅罗定理(ZermeloTheorm)断言,国际象棋是严格确定的,尽管泽梅罗定理的适用范围是具有完全信息的两人零和博弈,但它的影响是巨大的,在五六十年代曾引起很多博弈论专家和经济学家的广泛深进研究。

1921― 1927年间,波莱尔(EmileBorel)发表了四篇关于策略博弈的文章,第一次给出了一个混合策略的现代形式,并找到了有3个或多个可能策略的二人博弈的最小最大解。

1928年,冯诺伊曼(JohnvonNeumann)证实了最小最大定理,该定理被以为是博弈论的精华,博弈论中的很多概念都与该定理相联系。

1930年泽尤森(F.Zeuthen)的著作《垄断题目与经济竞争》出版,在书中他提出了一个关于讨价还价题目的解,该解后来被海萨尼证实与纳什的讨价还价解是等价的。

此外,这一阶段还提出了博弈的扩展形式、纯策略、策略形式、混合策略、个体理性等重要概念。

第二阶段:1944~1959年,现代博弈论的建立与理论体系的基本形成。

1944年,美国普林斯顿大学的著名数学家冯诺伊曼和经济学家摩根斯坦(OskarMorg enstern)合著的《博弈论与经济行为》一书出版。

该书在详述两人零和博弈理论的同时,在博弈论的诸多方面做出了开创性研究,如合作博弈、可转移效用、同盟形式以及冯诺伊曼--摩根斯坦稳定集等,该书还说明了导致后来在经济学中广泛应用的公理化效用理论。

博弈论原理与方法-关于均衡的分析

博弈论原理与方法-关于均衡的分析
胜的关键是不能让另一方猜到自己的策略而
同时自己又要尽可能猜出对方的策略。
在一次博弈中结果取决于机会,在多次重复
中,如果双方决策都正确,则我们可求得平
均的双方收益。彼此得益相同。
绪论-博弈基本要素

参与人players
又称“局中人”或”博弈方”,是指博弈中独
立决策、独立承担后果、以自身利益最大化来
选择行动的决策主体(可以是个人、也可以是
策略,假设寡头2采用低价策略,那么寡头1采用高
价策略得益20,采用低价策略得益60,它也应采用
低价策略。用同样方法可得寡头2也应采用低价策略。
低价-低价对双方不是理想的结果,但因为双方均无
法信任,所以均坚持采用低价策略。
绪论-几个典型模型
猜方
正面

猜硬币游戏
反面
正面
盖方
反面
分析:
在本博弈什均衡动态化,加入了
接近实际的不完全信息条件。他们的工作为后
人继续发展博弈论,提供了基本思路和模型

绪论-博弈论的历史沿革

博弈论根据其所采用的假设不同而分为合作博
弈理论和非合作博弈理论。两者的区别在于参
与人在博弈过程中是否能够达成一个具有约束
力的协议(binding agreement) 。倘若不能,则

博弈理论开始于1944年由冯·诺依曼(Von
Neumann)和摩根斯坦恩(Oskar Morgenstern)合
作的《博弈论和经济行为》(The Theory of
Games and Economic Behaviour)一书由Princeton
University Press出版。

20世纪50年代以来,纳什(Nash)、泽尔腾

1经济博弈论概述

1经济博弈论概述

合作博弈的概念是冯·诺依曼(John von Neumann)和摩根 斯顿( Oskar Morgenstern)在他们的《博弈论与经济行为》 (1944)一书中首次提出。到50年代,合作博弈理论的发展 到达鼎盛时期,其中包括纳什(Nash,1950)和夏普利 (Shapley,1953)的“讨价还价模型”,Gillies和 Shapley(1953)关于合作博弈中的“核”的概念,以及其他 一些人的贡献。
著名经济学家泰勒尔(Jean Tirole)说: “正 如理性预期使宏观经济学发生革命一 样,博弈论广泛而深远地改变了经济学 家的思维方式”
如果情况确实如此,对今天的经济学家来说 ,不懂得博弈论显然是不行了。
博弈论为何如此热门?
诺贝尔经济学奖偏爱博弈论研究
1994年诺贝尔经济学授予 约翰·纳什 约翰·海萨尼 莱因哈德·泽尔腾
但是有一些市场里头,价格的作用受到多种限制 ,可能是来自法律等正式规则的限制,也可能是 来自习俗或伦理道德等非正式制度的限制。
例如:找对象,不是价高者得,而是情投意合
才能结成夫妻。
问题是情投意合这种分配方式讲究“配对”, 而且这种配对最好还需要“稳定”,麻烦的是 还不能依靠传统的价格机制,在这种情况下经 济学应该怎么办呢?
发表了一篇关于实习医生的文章,将夏普利的 理论应用到解释实际经济问题中。
在医学领域,学生通常在后几年学习生涯中需 要去医院实习。
40年代,美国的医院系统开始大规模发展,但 医学院学生的数量很少,医院之间的竞争导致 对医学院学生需求的急剧增加,于是很多医院 就让学生提前实习,甚至在这些学生还没有选 定专业领域的情况下就参加实习。
2012年的诺贝尔经济学奖就授给了夏普利(L. S. Shapley)和罗斯(A. E. Roth),表彰他 们在“for the theory of stable allocations and the practice of market design”

诺贝尔经济学奖与数学

诺贝尔经济学奖与数学

诺贝尔对数学家是有心结的。

诺贝尔奖一开始就没有设立数学奖。

据说因为诺贝尔与数学家Mittag-Leffler不合,所以不愿设置数学奖。

不合的由来是两人为争夺一位女子。

后来又听说Mittag-Leffler累积不少财富,但在这过程中却惹怒了诺贝尔。

诺贝尔认为若设了数学奖,则Mittag-Leffler会对瑞典皇家科学院施压,使他成为首位获奖者。

另外,尚有一些说法,如诺贝尔中学时代厌恶数学,因此不愿设数学奖。

不过这些传闻均未能证实。

可能只是基于某种原因使诺贝尔认为不需设数学奖,或是他从未想过该设数学奖。

但事实是,几十年后唯一的一次扩大的机会却给了经济学,尽管只是一种纪念奖,奖金也不是来源于诺贝尔的遗产收入,但毕竟是对经济学科学地位的一种肯定,而诸多科学之基础的数学则无此幸运。

应该说经济学进入诺奖范围是有争议的。

一些自然科学家不愿把诺贝尔奖扩大到新的学科,不愿让经济学与物理学等“硬学科”处于平等地位,担心经济学奖的“科学性”。

一些皇家科学院的经济学院士,尤其是缪尔达尔力陈设立经济学奖的重要意义和经济学的科学性,最终使皇家科学院接受了这个建议。

1969年1月,诺贝尔经济学奖得到瑞典政府批准,同年12月颁发了第一届诺贝尔经济学奖。

在诺贝尔设立一个世纪以来,曾经有许多在诺贝尔遗嘱中没有提到的学科企图成为诺贝尔家族的新成员,以分享这项荣誉,但只有经济学成功地达到了这个目的。

这无疑反映了经济学在整个人类科学体系中的重要地位以及经济学资深的科学性。

但诺奖也并没有对数学家完全关上大门。

在诺奖上,数学家不让经济学家专美。

借用经济学这个敲门砖敲开诺奖大门数学家,大有人在。

这些人有三种情况,地一种是原来不是专门学经济的或数学的,或学经济学时辅修了数学,或原来是学的与数学比较接近的专业,如物理,研究成果也是以数学应用或数量分析为主,如以计量经济学出名的。

他们算是半个学数学出身的。

如第一位获得诺贝尔经济学奖的简·丁伯根,并非经济学科班出身。

颤抖手均衡

颤抖手均衡

有群体中的个体可以看作只和原有群体中的另一些个体相遇,因为新 来者只是群体中可以忽略的部分。

因此,如果新来的个体与原有的个体相遇时比原有的个体相遇的“收 益”更高,那么就称新来的战略是可以侵入原来战略。那么,反之, 就称为原来的战略是不可侵入,从而引发了演进博弈论的核心概念, 即这个策略也就是演进稳定战略。
性的“扰动”,缺乏在有限理性条件下的稳定性。

通过上述分析可以看出,颤抖手均衡就是一种精炼子博弈完美纳 什均衡的概念。能够通过颤抖手均衡检验的子博弈纳什均衡,在 动态博弈中的稳定性必然更强,预测也更加可靠一些。

当然,颤抖手均衡并没有解决博弈方犯错误的问题,因此也不能保
证它的预测一定就是实际博弈的结果,即使动态博弈中有唯一的 颤抖手均衡。
也可以认为,人们对一种习俗(演进稳定性)的偏离,也可能出自泽尔
腾所说的那种人们社会博弈中的“颤抖”。

以下图中的博弈为例:
博 弈 方 L U D 10,0
博弈方2 R
6,2
2,0
10,1


因为从这个策略组合出发,不管博弈方2是否有偏离R的可能, 在这个博弈中(D,L)和(U,R)都是纳什均衡,其中(D,L)对博弈方 博弈方1都没有必要偏离U;对博弈方2来说,虽然博弈方1从U偏 1较为有利,(U,R)对博弈方2较为有利。 离到D对他的利益有不利的影响,但只要博弈方1偏离的可能性不 在不考虑选择和行为偏差的情况下,这两种纳什均衡都是稳定 超过2/3,那么自己改变策略并不合理。 的,即为该博弈可能的结果。如果考虑到博弈方的选择和行为 [假设博弈方1偏离U的概率为a,那么不偏离的概率为1-a,则2(1-a)=a,得到a=2/3]
会偶尔出错,这就是所谓的“颤抖之手”。因此,一个博弈者的均衡

博弈论以及经典案例分析

博弈论以及经典案例分析
占优策略均衡一定是纳什均衡
纳什均衡的正式定义自己看书理解。
现实生活中,有相当多的博弈,我们无法使用占优策略均 衡或重复剔除的策略均衡的方法找出均衡解。例如:
在房地产开发博弈中,假定市场需求有限,A、B两个 开发商都想开发一定规模的房地产,但是市场对房地产 的需求只能满足一个房地产的开发量,而且,每个房地 产商必须一次性开发这一定规模的房地产才能获利。
所谓“严格劣策略” 是指:在博弈中,不论其他参与 人采取什么策略,某一参与人可能采取的策略中,对 自己严格不利的策略。
重复这个过程,直到只剩下一个唯一的策略组合为止。
这个唯一剩下的策略组合就是这个博弈的均衡解,称 为“重复剔除的占优均衡”。
注意,上述表述中强调了“唯一”这个词。也就是说, 如果重复剔除后剩下的策略组合不唯一,那么该博弈 就不是可通过重复剔除劣策略求解的。
完全信息指的是每一个参与人对所有其他参与人的特征, 如策略集合及得益函数都有准确完备的知识;否则就是 不完全信息。
☞将上述角度的划分结合起来,我们就得到四种不同类型 的博弈,这就是:完全信息静态博弈、完全信息动态博 弈、不完全信息静态博弈、不完全信息动态博弈
表5-1 博弈的分类和均衡表
行动次序 信息
因此小股东往往不会象大股东那样去监督经理人员而大股东也明确无误地知道小股东会选择不监督这是小股东的占优策略大股东明知道小股东要搭大股东的便车但是大股东别无选大股东选择监督经理的责任独自承担监督成本是在小股东占优选择的前提下必须选择的最优策纳什均衡是完全信息静态博弈解的一般概念构成纳什均衡的策略一定是重复剔除严格劣策略过程中留下的不能被剔除的策略即没有任何一个策略严格优于纳什均衡策略
1、参与人,又称局中人,指博弈中选择行动以自身利益最大化的决策主体(可 以是个人,也可以是团体,如厂商、政府、国家)。

博弈论产生与发展的过程

博弈论产生与发展的过程

博弈论产生与发展的过程
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

以下是博弈论产生与发展的过程:
1.古代时期:博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。

2.20世纪初:博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

3.1944年:冯•诺依曼(Von Neumann)与摩根斯坦(Morgenstern)合作的《博弈论与经济行为》这本书,标志着博弈理论的正式诞生,不过,此书与现代博弈论关系不大。

4.1950年:纳什和夏普里的“讨价还价”模型以及“核”的概念,提出了合作博弈的概念。

5.20世纪60年代:纳什均衡被提出;泽尔腾(1965)引入动态分析,提出了“子博弈精练纳什均衡”;海萨尼(1967-1968)将不完全信息引入博弈论研究,这标志着博弈论的快速发展时期。

以上内容仅供参考,建议查阅专业书籍获取更全面和准确的信息。

博弈论与国际机制理论:方法论上的启示

博弈论与国际机制理论:方法论上的启示

博弈论与国际机制理论:方法论上的启示博弈论概说所谓“博弈”(Game),是指某些个人或组织作出相互有影响的决策,它不仅包括扑克、桥牌等游戏,也包含现实生活中大量的合作和冲突现象。

博弈论又称“对策论”,研究的核心是决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论的原始思想萌芽于2000多年前,中国春秋战国时代的典籍如《孙子兵法》、《孙膑兵法》中都充满了博弈的案例。

“田忌与齐王赛马”就是我国耳熟能详的博弈实例之一,但这不过是博弈思想的雏形,现代意义上的博弈论则是20世纪的贡献了。

一般认为,1944年同冯·诺伊曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作发表的《博弈论与经济行为》(The Theory of Games and Economic Behavior)提出合作博弈的基本模型,标志着现代博弈论的开始。

50年代,博弈论巨匠辈出,纳什(Nash)提出了非合作博弈论,塔科尔(Tucker)定义了“囚徒困境”,从而奠定了现代非合作博弈的理论基石。

60后代,泽尔腾(Selten)将纳什均衡引入动态分析,创立了“精炼纳什均衡”的概念;海萨尼(Harsanyi)则把不完全信息引入博弈论研究,随后出现了不完全信息博弈论。

至此,博弈论的理论构架基本完成。

博弈论可以划分为合作博弈(cooperative game)和非合作博弈(non-cooperative game)。

二者的区别主要在于参与人能否在行为时达成有约束力的协议,达成则是合作博弈;反之,不能强制他方遵守协议,各参与人只能选择自己的最优战略,则是非合作博弈。

合作博弈强调团体理性、效率、公平和公正;非合作博弈则强调个人理性、个人最优决策。

我们谈到的博弈多指非合作博弈。

博弈有两种划分:从参与人出场的先后顺序来看,博弈分为静态博弈(static game)和动态博弈(dynamic game)。

静态博弈指博弈参与人同时选择行动或非同时行动但对前者行动一无所知;动态博弈指参与人行动有先后顺序,且后行动者能够观察到先行动者的选择。

博弈论简介

博弈论简介

启示: 启示:个体理性决策常导致集体非理性结果
实例:投标(总工程量50,贿赂成本5,甲乙双方实 力相当 ) 甲 贿赂 不贿赂
贿赂 乙 不贿赂 0 45 25 20 20 45 25 0里住着一大一小两头猪。 背景:在一个猪圈里住着一大一小两头猪。它们从同一个食槽中 获得食物。但食槽的按钮与食物的出口分布在相反的两端。 获得食物。但食槽的按钮与食物的出口分布在相反的两端。每按 一次按钮,可得10个单位食物 但需付出2个单位劳动 个单位食物, 个单位劳动。 一次按钮,可得 个单位食物,但需付出 个单位劳动。 规则:若大猪按按钮:大猪吃6个单位 小猪吃4个单位 个单位, 个单位; 规则:若大猪按按钮:大猪吃 个单位,小猪吃 个单位; 若小猪按按钮:大猪吃9个单位 小猪吃1个单位 个单位, 个单位; 若小猪按按钮:大猪吃 个单位,小猪吃 个单位; 若一起去按:大猪吃7个单位 小猪吃3个单位 个单位, 个单位; 若一起去按:大猪吃 个单位,小猪吃 个单位; 问题:哪头猪将会去按按钮? 问题:哪头猪将会去按按钮?
1930年 Selten出生于现属于波兰的德国 年 出生于现属于波兰的德国 城市, 年获法兰克福大学数学博士学位, 城市,1961年获法兰克福大学数学博士学位, 年获法兰克福大学数学博士学位 曾先后任教于柏林自由大学、 曾先后任教于柏林自由大学、比勒菲尔特大 学和波恩大学。 学和波恩大学。 Selten的主要贡献是首次对分析动态策略 的主要贡献是首次对分析动态策略 交互作用深化了Nash均衡的概念。 均衡的概念。 交互作用深化了 均衡的概念 1920年Harsanyi出生于匈牙利, 年 出生于匈牙利, 出生于匈牙利 1947年获布达佩斯大学博士学位, 年获布达佩斯大学博士学位, 年获布达佩斯大学博士学位 后逃亡澳大利亚,再到美国, 后逃亡澳大利亚,再到美国,1954 年获斯坦福大学博士学位, 年获斯坦福大学博士学位,曾先后 任教于澳大利亚国立大学、 任教于澳大利亚国立大学、加州伯 克利分校。 年去世。 克利分校。于2000年去世。 年去世 Harsanyi研究和分析了不完全 研究和分析了不完全 研究和分析了 信息博弈,从而为信息经济学提供 信息博弈, 了一个理论基础。 了一个理论基础。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

我今天讲的是博弈理论,这也是实验研究的一个重要基础。

首先是博弈论的起源,它来自德国冯·诺依曼1928年的文章。

但博弈论的真正开始是冯·诺依曼和摩根斯腾(John von Neumann-Oskar Morgenstern)1944年的著作《博弈论和经济行为》。

先来讲一下什么是博弈论,博弈论是基于目标导向的冲突和合作中交互作用的数学建模和分析方法,即一种数学建模的分析方法。

博弈论研究的情况发生在几个参与者发生目标导向交互作用的时候,交互作用包括冲突、合作或者二者并存。

参与者可以是人,也可以是动物,还可以是人类构成的组织,如企业间的冲突和合作等。

下面,我们需要澄清一些误解,即博弈论不是什么。

为何它不是帮助我们赢得纸牌赌博或者轮盘赌的学问?从长期来讲,你是不会赢得这些人机游戏的,它们不是多个参与者的活动。

博弈论也不是告诉人们如何通过投机在股票市场上致富的理论。

另外,博弈论给你一些基本的思考原则和启示,但也不是帮你赢得下棋或者扑克等复杂游戏的理论。

那么,博弈论对于什么有帮助呢?博弈论是一种提供参与者在交互过程中策略和行动的内在逻辑洞察力的学问,可以应用到人类社会的经济理论、政治理论、军事理论或者生态演化理论中,也可以用于机制设计和成本会计等具体领域。

接下来,我们通过一个例子来说明博弈论的一些基本概念。

这里有三个企业(i =1, 2, 3)互相竞争,处在一种求大于供的市场,x i (x i 的取值区间为0到20)为各个企业的产品供应数量,总供应量x 为三者之和,即x =x 1+x 2+x 3。

当x ≤20时,价格由公式p =20-x 给出,其它情况价格为0。

各个厂商的利润P i 为x i 乘以p 。

这个实验可以以学生为对象参与进行,获得结果后随机分博弈论与实验研究○ (德)莱茵哈德·泽尔滕第一种情况下,三个厂商供应量分别为4、8、6个单位,总量为18,所以价格为2,三个厂商的利润分别为8、16和12。

第一问题是谁表现最出色?是否为厂商2?因为在此次博弈中它的利润比其他两个厂商高。

不过,我们可以看到,在第二种实验情况下,如果它将供应量调整为5,那么价格为5,它的利润便会提升为25。

实际上它犯了一个错误,自己损失了9个利润单位,在这个错误中,它的利润高于其他厂商是因为它对其他厂商的损害大于对自己的损害。

第二个问题是这种情况下应该如何做。

有人讲,每个厂商供应量应该为3,则三个厂商总的最大利润为99,每个厂商利润为33。

那么这是满意的解决方案吗?还不是,如果每个人供应量为3,而第一个厂商如果提供7个而不是3个单位,那么它就得到49的利润,其他人获得21的利润,这是一个很大的诱惑,供应量都为3的情况容易被否决,所以某个厂商如果获悉其他人的供应量为3,那么它就可以在3到7之间进行选择。

也就是每个人都提供三个产量在具有绑定的协议的情况下是可以实现的;但是绑定的协议在这种情况下是很难发生的,在厂商不知道彼此的信息、沟通存在困难的情况下,不会产生相应的结果。

再一个问题是,我们可以如何做。

第五种试验情况下,各个厂商的供应量为5,那么利润都是25,如果一个厂商增加或者减少供应量,它的利润都会减少,如第6或者第7列下所显示的结果。

这时如果任何厂商打破理论提供的选择方案的话,他们采取任何行为都不能改善自己的支付结果。

这种结果就是均衡的概念,均衡就是一种具有如下属性的、通用的理论推荐解,只要其他人按照推荐解行动,那么参与者的任何背离不会产生额外支付。

由此简单例子,我们可以得出一些有启示意义的结论,获得支付最多的参与者不代表他的策略是优秀的,而是他犯了严重的错误,在伤害自己的同时更多地伤害了其他参与者。

也就是一个企业在市场获得更多利润,不是因为它的运作更优秀,而恰恰是犯了错误,结果使得自己受到了损失,也使得其他人受到更多的损失。

理性状态下获得的互利合作(本例子中(3, 3, 3)方案)只有在均衡状况(本例子中(5, 5, 5)方案)下实现。

下面来看另一个例子。

价格双寡头市场的例子,供应商一和供应商二,可以围绕三种价格提供产品,如果两个供应商在相同的价格下供应产品,则平分总利润,如果价格不同,在这个双寡头垄断市场作用的例子中,有两个竞争者,他们可以选择高价格H、中价格M和低价格L,如果他们都选择H,那么总利润10会在他们之间平均分配,也就是每个人得到5。

如果他们都选择M,每个人得到3,如果他们都选择L,每个人得到1,然而,如果一个选择高价格,另一个选择低的价格,那么低价格者将得到全部利润,而高价格者利润为零。

这里有两个均衡,即(M,M)和(L,L)。

在一次性博弈中,(H, H)不是一个均衡,因为如果一个厂商选择H,另一个选择M,那么选择H的厂商什么也得不到,而选择M 的厂商将得到全部利润6,而不是原来的5。

(M,M)是一个均衡,因为如果都选择M,他们都可以得到3的利润,而如果选择L,只能得到2,少于3,如果选择H,将什么也得不到。

选择(L,L)也是一个均衡,都可以得到1的利润,如果他们选择更高的价格,M或者H,他们什么也得不到,因此在一次性博弈中,存在两个均衡,即(M,M)和(L,L)。

1950年,赫伯特·西蒙(Herbert A. Simon)在他的一篇高度数学化的论文中提出,如果博弈是重复进行的,那么情况会和仅仅进行一次性博弈的情况完全不同。

这个简单的例子说明为何如此,我们看一个二阶段的博弈,如表3,每个人都有两次选择,在第一次选择后,他们的选择将被公开,然后进行第二次选择,并且各自获得两个阶段的总支付。

二阶段博弈中存在一个与一次性博弈不同的均衡,在第一个阶段,两个人都选择H,那么他们都得到5的利润,在第二个阶段,如果他们都选择M,则可以得到3的利润,而如果他们进行了其他选择,也就是选择了L,则利润为1,可见,这种情况下,在第一次选择高价格的情况下,他没有背离(M,M)的动机,即背离均衡。

如果厂商在第一阶段就选择背离,那么可以得到6,而在第二阶段只能得到1的利润,总利润为7,比起均衡时的8的利润要少。

所以在这种重复博弈中,合作可以稳定重复博弈中前面阶段的选择,这个例子中即第一阶段的选择,而在多次重复博弈中,也存在类似的情况。

原因是一次性博弈中存在两个均衡,即这个例子中合作可以使得厂商选择(H,H)进行重复博弈,除去最后一个阶段的选择,直到最后阶段具有了结局效应(End Effect),可能选择(M,M)或者(L,L),所以非合作博弈如果在重复进行的情况下会产生合作行为。

这里我们也可以得出一个有意义的启示,即重复博弈和一次性博下面谈谈机制设计,这是一个具体应用的例子。

1994年,首次无线通信频率拍卖在美国进行,那之前的很多年,无线通信频率一直是由一个委员会进行分配的。

他们按照祖父原则(Grandfather Principle)进(下转第16页)有两大类:第一,对于高管来说很难自己发现的相关信息;有一些服务政府已经提供,如经济数据、总体的实际模型建构和未来预测,再如,很少有关于工人技能的信息。

高管意识到需要做很多事情,因为做决定需要用到大量的信息,他希望这些能够得到资助,如可以通过政府服务获取有用信息。

第二,咨询公司提供的外部建议。

但不能确定这个论点是否合乎逻辑。

有人可能也会问,咨询公司给出的建议是否总是很好,但其中很多看起来很好。

那么这意味着什么呢?并不是说政府应该资助咨询公司的工作,但原则上来说,可以通过重新规定高管薪酬的基础而不是直接以利润为基础。

应该利用津贴来获取外部建议,支付所有来源的信息。

这种做法应该得到鼓励,而高管更应该这样做。

可能有人还会想到其它方式来把此应用到提高薪酬福利上。

七、薪酬给多少?本文最后要谈一谈人们都感兴趣、但却迷惑的一些事情。

人们很难避免这样一种印象,即在很多国家,高管的薪酬过高(从持股人的角度来看太高了)。

尤其是在美国,高管的薪酬水平足可以引起很大争议,并没有充分的客观理由来解释这一现象,在英国也是一样。

可能持股人、董事们变得更加聪明,了解了应该做的事,认识到了他们哪些应该多支付。

但有一个原因是,高管过去的业绩可能会错误地预测未来业绩。

如果某人曾在一家公司成功地大幅度提高了公司利润,另一家公司很自然地想付给他高额薪酬以便雇佣他到自己的公司里来。

公司业绩的变化很大程度上也要依靠运气,这样就可以理解前面的现象了。

但另一个原因是,董事们在设定或协商薪酬时,可能没有正确的激励机制。

因此在很多国家,包括中国,都转向确保决定高管薪酬的董事会成员应该独立于高管层。

这也就是说,他们自己不应该是其它公司的高管,或者有其它一些能够引起高收入的来源。

人们怎样来保证董事们进行的关键而重大的决定是符合持股人总体利益的呢?这也是公司治理的一个热门问题。

很明显,在这个领域,政府能够起主要作用,我们将拭目以待。

本文根据莫里斯教授在2005年11月8日第三届公司治理国际研讨会上的主题发言翻译整理,由李建标、贾荣鹏译。

译成中文时,得到了莫里斯教授夫人(中文名字白霞)的指导,特别感谢行分配,使得哪些资源更多在委员会成员之间进行分配。

为了公平也引入了抽彩票的方式,每个人都有申请购买的权利,可是得到资源和机会的人往往会马上转手高价倒卖给那些无法得到频率的企业,很快赚了很多钱。

这时政府认为,为何不进行拍卖,自己拿到那些钱呢?可是拍卖程序的设计和组织就成了问题,如果将频率资源简单的一个一个拍卖,会有问题,因为人们会希望拿到一个一揽子的频率组合。

美国联邦通信委员会(FCC)第一项拍卖的是窄带无线个人通信服务频率,这是BP机用的频率,比如医生会用到BP机,以便病人可以找到他。

在曼哈顿、新泽西和纽约等地需要的频率资源组合是不同的。

如果进行单项拍卖,一个企业在获得一项拍卖后,不清楚是否能得到后面的标的,这样就缺乏效率。

于是实施了一种同时多轮拍卖,每个人都必须出价,标的由出价最高的获得。

每一个竞标者每一轮都可以对于他想要的标的频率进行出价,要经过多轮出价,最后每一频率由出价最高的竞标者获得,因此,你可以随时看到你关心的组合中每一个频率的价格以决定是否继续出价,每个竞标者也不能等待太长时间进行投标。

当时专家预计会得到5000万美元的拍卖额,而实际获得61700万美元,开始新竞买者很多,然后很快减少,并伴随竞价轮次的增加稳定下降,经过40多轮后趋于停止,竞价收入则不断上升,一直到61700万美元,拍卖进行了三个多小时。

为了说明在这种拍卖中如何做和如何组织,你需要博弈论的知识,但博弈论还不够,也需要实验研究,因为理论上人们总是有限理性的,人们在经济环境中的行为并不总是严格按照理论预测进行的,你还要通过实验研究观察人们在这种环境中是如何真正行为的,博弈分析是重要的、必要的,但不能提供人们想得到的所有答案。

相关文档
最新文档