第八章博弈论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈的类型
①根据博弈者选择的策略,博弈论可划分为合作 博弈与非合作博弈。纳什(Nash)、泽尔腾(Selten) 和豪尔绍尼(Harsanyi)(1994诺贝尔经济学奖获得 者)的主要贡献在于非合作博弈方面,而且现在大多 数经济学家论及博弈时,也主要是指非合作博弈。
合作博弈和非合作博弈的区别在于人们的行动为相互作 用时,当事人能否达成一个具有约束力(binding agreement) 的协议。若有,就是合作博弈;否则就是非合作博弈。
7、需求小,A不开发,B开发,则A的利润0, B的利润为1千万;
8、需求小,A不开发,B不开发,利润各为0
如果需求是不确定的,是否开发依赖于各自在 多大程度上认为市场需求是大的及对方是否开发。
例:如需求大的概率为0.3,A认为B开发的可 能性为x,那么A开发的期望利润为:
Eu=0.3[4000x+8000(1-x)]+
(5)博弈均衡(games equilibrium):是指所有局中 人的最优策略组合。这里所讲的均衡与一般均衡是有区别 的,前者是局中人的最优策略组合,即局中人之间的冲突 与合作达到一种相对稳定的状态;而后者则是这种策略组 合所产生的结果。从某种程度上讲是“均衡”和“均衡结 果”的关系。前者是一种动态概念,后者是一种静态概念。 与纯策略相对应的均衡是纯策略均衡,与混合策略相对应 的均衡是混合策略均衡。
泽尔腾则在60年代中期将纳什均衡的概念引入动态 分析。他在1965年发表《需求减少条件下寡头垄断模 型的对策论描述》一文,提出了“子博弈精炼纳什均 衡”(Subgame perfect Nash equilibrium)的概 念,又称“子对策完美纳什均衡”。这一研究对纳什 均衡进行了第一次改进,选择了更具说服力的均衡点。
第八章 博 弈 论 Game Theory
主要内容
§1.博弈论概述 §2.完全信息静态博弈 §3.完全信息动态博弈 §4.不完全信息静态博弈 §5.不完全信息动态博弈
一 博弈论概述
博弈论(Came theory)又称对策论、游戏理论或 策略运筹学。它最早由德国数学家,哲学家莱布尼兹 于1710年提出。
(3)支付(pay off):指在一个特定的策略组合下,局中人得到 的效用水平或期望效用水平。一个局中人的支付是所有局中人的策略 选择的函数,它不仅取决于自己的策略选择,而且还取决于(他所设 想的)所有其他局中人的策略选择,任何一个局中人改变自己的策略 都将影响其他局中人的支付水平,即,局中人之间的利益是相互牵制 的和制约的。所有局中人的支付的一个有序集合称为博弈的一个支付 组合(payoff profile。
抵赖
-10,0
抵赖
0,-10 -1,-1
扩展式:博弈树 A 开发
不开发
N
N
大(1/2) 小(1/2) 大(1/2) 小(1/2)
开发
B
B
不开发
开发

不开发
B
不开发
开发
开发
B
不开发
(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1) (0,0)
8-1
博弈论进入主流经济学,反映了经济学发展的 以下几个趋势:
博弈论的基本概念
博弈是指一些个人、团队或组织,面对一定的环 境条件,在一定的规则下,同时或先后,一次或多次, 从各自允许选择的行为或策略中进行选择并加以实施, 各自从中取得相应结果的过程。
博弈论就是描述在这种形势下各方理性地选择自己 的行动所实现的结果,分析各决策主体的行为发生相 互作用时的决策以及这种决策的均衡问题。
例:房地产开发
1、A B两个开发商,投资1亿; 2、如果市场上有两栋房出售,需求大,每栋:
1.4亿;需求小,每栋:7千万; 如果市场上有一栋房出售,需求大,每栋:
1.8亿;需求小,每栋:1.1亿; 3、开发与不开发。

8种可能的结果
1、需求大,A开发,B不开发,则A的利润8 千万, B的利润为0;
Si={si} S=(s1,s2,…si …sn) 如果一个策略规定局中人在每一个给定信息的情况下,
选择一种特定的行动,则这个策略称为纯策略(pure strategies)。相反,如果一个策略规定局中人在每一个 给定信息的情况下,以某种概率分布随机地选择不同的行 动,则这种策略称为混合策略(mixed strategies)

第一,经济学研究的对象越来越转向个体,放弃了一 些没有微观基础的假定,如消费函数及其投资函数、销售 最大化等,一切从个人效用函数及其约束条件开始,解约 束条件下的个人效用函数及其约束条件开始,解约束条件 下的个人效用最大化问题而导出行为及均衡结果。
第二,经济学越来越转向人与人关系的研 究,特别是人与人之间行为的相互影响和作用, 人们之间的利益冲突与一致,竞争与合作的研 究。
非合作博弈的发展
博弈论包括合作博弈与非合作博弈两种类型。我们 谈到的博弈论,一般是指非合作博弈,如下象棋等。
非合作博弈创立于50年代。1950年,22岁的纳什 连续发表两篇划时代的论文:《N个人对策的均衡点》 与《讨价还价问题》,1951年又发表了《非合作对 策》。(纳什均衡)
塔克(A.Tucker)在1950年他的一篇名为《两个 之谜》的论文中对“囚徒困境”作了明确的定义。他 们两人的著作基本上奠定了现代非合作博弈论的基石。
第三, 经济学越来越重视对信息的研究, 特别是信息不对称对个人选择及制度安排的影 响。
二 完全信息静态博弈
2、需求大,A开发,B开发,则A的利润4千 万, B的利润4千万;
3、需求大,A不开发,B开发,则A的利润0, B的利润为8千万;
4、需求大,A不开发,B不开发,利润各为0
5、需求小,A开发,B不开发,则A的利润1 千万, B的利润为0;
6、需求小,A开发,B开发,则A的利润-3千 万, B的利润-3千万;
虚拟局中人:自然,是外部随机变量,对所有利益 主体都无差异。
(2)行动与策略( actions or strategies) 。行动是 局中人在博弈的某个时点的决策变量;每一个局中人的所 有可能选择的行动的集合称这该局中人的行动空间 (action space);所有局中人的行动的一个有序集合称 为该博弈的一个行动组合(action profile);
合作博弈强调的是团体理性、效率、公正和公平。非合作 博弈强调的是个人理性、个人最优决策,其结果可能是有效 率的,也可能是无效率的。
②从局中人行动的先后顺序可划分为静态博弈 (Static game)和动态博弈(dynamic game)。静态博弈 是指在博弈中,局中人同时选择行动或虽非同时行动但后 行动者并不知道先行动者采取了什么具体行动。动态博弈 是指局中人的行动有先后顺序,且后行动者能够观察到先 行动者所选择的行动。
特征
完全信息
不完全信息
纳什均衡
贝叶斯纳什均衡
静态 纳什(1950,1951)豪尔绍尼(1967,1968)
动态
子博弈精练纳什均 衡
泽尔腾(1965)
精练贝叶斯纳什均衡
泽尔腾(1975) 克瑞普斯和威尔逊
(1982)
博弈的表述方式:策略式与扩展式
策略式:支付矩阵
囚犯B的 策略
囚犯 A的策略
坦白
坦白 -8,-8
博弈专家之所以获经济学奖,原因大致有三点:
1.博弈论在经济学领域中应用最广泛,最成功;博 弈论的许多成果也是借助于经济学的例子来发展引申 的;
2.经济学家对博弈论的贡献也越来越大,特别是 在动态分析和不完全信息引入博弈后,例如克瑞普斯, 威尔逊都是经济学家;
3.最根本性的原因是经济学和博弈论的研究模式 是一样的,都强调个人理性,即追求给定条件下效用 最大化。

Ui=Ui(s1,s2,…si …sn)
参与博弈的多个局中人的收益可用一个矩阵或框图表示,这种矩阵
或框图叫做收益矩阵。
(4)信息(information):是局中人有关博弈的知识, 特别是有关其他局中人的特征(如策略空间、支付函数等 等)和行动的知识。信息集(information sets)是局中 人在特定时刻进行决策时,所面对的信息变量值的集合。 共同知识(common knowledge)是指“所有局中人知 道,所有局中人知道所有局人知道,……”(或信息)。 如果局中人的策略选择、支付函数等都是共同知识,则称 之为完全信息(complete information ),否则就是不 完全信息(incomplete information )
1994年10月11日,瑞典皇家科学院公布了该年 度诺贝尔经济学奖评先结果:
美国普林斯顿大学的纳什(F.J.Nash)和加利 福尼亚大学的豪尔绍尼(J.Harsanyi)与德国波 恩大学经济学家泽尔腾(Reinhard.selten),因 长期致力于博弈论及其在经济学中运用的研究, 共同获此殊荣。
③从局中人是否具有有关其他参与人(对手)的特征、 策略空间及支付函数方面的知识的角度,可划分为完 全信息博弈(game of complete information)和不完全 信息博弈(game of incomplete information)。
此外,根据支付结构不同:常和与变和博弈
博弈的分类
豪尔绍尼在60年代末把不完全信息引入博弈分析。 他在1967年发表的开拓性论文《由贝叶斯局中人参加 的不完全信息博弈》中重新给出了不完全信息的新定 义,并由此提出“贝叶斯均衡”的概念。
进入80年代后,克瑞普斯(kreps)和威尔逊 (wilson)则对不完全信息动态博弈的研究作出了突 出的贡献,并提出了更高级的均衡概念:“贝叶斯精 炼纳什均衡”或称“完美贝叶斯均衡”。
纳什 John Nash
2005年10月10日,瑞典皇家科学院在瑞典首都斯 德哥尔摩的皇家科学院议事厅宣布,将2005年诺贝尔 经济学奖授予有以色列和美国双重国籍的罗伯特·奥曼 和美国人托马斯·谢林,以表彰他们通过博弈理论的分 析增强世人对合作与冲突的理解。

博弈论与传统经济学有关理论的区别
1713年,杰姆斯·瓦尔德格雷夫首次提出了博弈论 中的极大中的极小定理(minimax)。然而,直到 1944年,以冯·诺依曼和奥斯卡·摩根斯坦合著《博弈 论与经济行为》一书的出版为标志,博弈论才得以广 泛应用于经济学领域,并成为微观经济学的一个新的 重要组成部分。
博弈思想最早产生于我国古代。 早在两千多年的春秋时期,孙武在《孙子兵法》中论述 的军事思想和治国策略,就蕴育了丰富和深刻的对策论思想。 孙武的后代孙膑,为田忌谋划,巧胜齐王,这个著名的“田 忌赛马”,就是典型的对策思想的成功运用。
传统经济学涉及的个人决策,是在给定价格参数和收入的条 件下,追求效用最大化的决策(消费者均衡或生产者均衡);个 人效用只依赖于自己的选择,而外在于他人的选择;个人最优选 择只是价格和收入的函数而不包含其他人选择的函数。
在博弈论看来,个人效用不仅依赖于自己的选择,而且依赖于 他人的选择;个人的最优选择是其他人选择的函数。
策略是局中人在所有给定信息集(信息集是局中人在特 定时刻进行决策时所面对的集合)下的行动规则,他规定 局中人在什么时候选择什么行动。

策略和行动不是等同的,它是行动的规则而不是行动本 身,策略必须具有完备性,即一个策略是关于行动的一个 完整计划——它明确了局中人在每一种可能情况下对可行 动的选择;一个局中人所有可能策略的集合称为该局中人 的策略空间(stratgy space),所有局中人策略的一个 有序集合称为博弈的一个策略组合(strategy profile。

0.7[-3000x+1000(1-x)]
A不开发的期望利润为0。解Eu>0 x<31/40
博弈三要素、信息及博弈均衡
(1)局中人(player):指参加博弈的各个决策个 体,既可以是自然人,也可以是团体。局中人都是 “理性”的,即他清楚地了解自己的目标或利益所在, 在决策时考虑自己的知识(信息)以及对其他局中人 策略的期望,总是采取最佳行动(或策略)以实现其 支付的最大化。
相关文档
最新文档