博弈论完整版
博弈论讲义完整版
同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境
囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的‚最优策略‛使整个‚系统‛处于不利 的状态。
思考:为什么会造成囚徒困境 是否由于‚通讯‛问题造成了囚徒困境? ‚要害‛是否在于‚利己主义‛即‚个人理 性‛?
第一章 导论-囚徒困境
通俗地讲:
纳什均衡的含义是:给定别人战略情况下,没有 任何单个参与人有积性选择其他战略,从而没有人 有积极性打破这种均衡。
第一章 导论-囚徒困境 一只河蚌正张开壳晒太阳,不料,飞来了 一只鸟,张嘴去啄他的肉,河蚌连忙合起两张 壳,紧紧钳住鸟的嘴巴,鸟说:‚今天不下雨, 明天不下雨,就会有死蚌肉。‛河蚌说:‚今 天不放你,明天不放你,就会有死鸟。‛谁也 不肯松口,有一个渔夫看见了,便过来把他们 一起捉走了。
不开发
1000,0 0,0
开发商A
博弈的战略式表述
一 、博弈的基本概念及战略表述
需求小时,售价7千万;
如果市场上只有一栋楼 需求大时,可卖1.8亿 需求小时,可卖1.1亿
一 、博弈的基本概念及战略表述
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 不开发
开发商B 开发 不开发
4000,4000 0,8000 8000,0 0,0
开发商B
开发
-3000,-3000 0,1000
第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了‚星期五‛
石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
第六讲博弈论课件
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪
踩
踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。
博弈论完整版PPT课件
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
第28章博弈论1
Game Theory
博弈论
• 博弈论是对策略互动进行一般分析的理 论。
• 博弈论的英文名称为game theory,是研 究决策主体的行为发生直接相互作用的 失衡的决策以及这种决策的均衡问题的。
博弈论的应用
• 经济学:市场往往是不完全的,参与者的行为 相互影响,因此,个人决策时必须考虑到对方 的反应
谁先选择?
• 在前面的两个例子中,参与者都是同时 采取行动的。
• 这种博弈称为同时博弈 (simultaneous play games).
• 但是某些博弈是某个参与者首先采取行 动,其他参与者后采取行动。
• 这类博弈称为序贯博弈(sequential play games)。
• 首先行动的参与者是领导者,第二个行 动的参与者是跟随者。
纳什均衡
• 如果存在一个策略组合,其中每一个参 与者的选择都是他的最优选择,此时的 策略组合就是一个纳什均衡 (Nash equilibrium)组合。
• 我们的例子中有两个纳什均衡策略组合 (U,L)和(D,R)。
例子
Player B LR
U (3,9) (1,8)
Player A
D (0,0) (2,1)
序贯博弈举例
• 有时博弈不止一个纳什均衡结果,此时 很难看出哪一种结果可能发生。
• 此时如果博弈行动有先后,那么我们就 有可能判断出哪一种结果更可能出现。
Player B LR
U (3,9) (1,8)
Player A
D (0,0) (2,1)
当同时行动时,(U,L) 、(D,R) 都是纳什均衡 的策略组合,我们无法判断哪一种组合结果 出现的可能性更大。
Clyde
完整版)博弈论知识点总结
完整版)博弈论知识点总结博弈论是研究决策主体在相互作用中做出的决策以及均衡问题的学科。
该学科的研究假设包括:1)决策主体是理性的,会尽可能地最大化自己的收益;2)完全理性是共同知识;3)每个参与者都能对环境和其他参与者的行为形成正确的信念和预期。
博弈中涉及到的变量包括:参与人、行动、战略和信息。
完全信息指每个参与人都了解其他参与人的支付函数,而完美信息则指在博弈过程中,每个参与人都能观察和记忆之前的行动选择。
不完全信息则表示参与人没有完全掌握其他参与人的信息,存在不确定性因素。
博弈与传统决策的区别在于,博弈是决策主体之间的相互作用,需要考虑其他决策者的选择和效用函数。
博弈的表示形式包括战略式博弈和扩展式博弈,其中战略式博弈适用于描述不需要考虑博弈进程的完全信息静态博弈问题,而扩展式博弈则更适用于描述动态博弈问题。
与战略式博弈不同,扩展式博弈更注重参与者在博弈过程中面临的决策问题的序列结构分析,而不是仅关注博弈结果的描述。
扩展式博弈包括参与人集合、参与人的行动顺序、序列结构和参与人的支付函数等要素。
战略式博弈是一种静态模型,而扩展式博弈是一种动态模型。
博弈论可以分为合作博弈和非合作博弈,其中合作博强调团体理性、团体最优决策和效率,而非合作博弈强调个人理性和个人最优决策。
根据参与人行动先后顺序的不同,博弈可以分为静态博弈和动态博弈,后者包括先行动者获得先行动者行动信息的情况。
根据参与人对信息的掌握程度,博弈可以分为完全信息和不完全信息博弈。
根据决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。
不同类型的博弈有不同的均衡类型和求解方法,顺序的不同也会影响均衡结果。
Hotelling价格竞争模型是一种重要的扩展式博弈,用于描述两个企业在同一市场上的价格竞争。
相对应。
占有均衡是指在博弈中存在一组参与人的战略选择,使得每个参与人都无法通过改变自己的战略来提高自己的支付。
博弈论完整版
ke 第1次作业1、考虑一个工作申请的博弈。
两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。
工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。
现在假定每家企业的工资满足:W1/2<W2<2W1,则问:a .写出以上博弈的战略式描述b .求出以上博弈的所有纳什均衡(包括混合策略均衡) 解:a .写出以上博弈的战略式描述学生B学生Ab .求出以上博弈的所有纳什均衡(包括混合策略均衡)①存在两个纯战略纳什均衡: (企业1,企业2),收益为)2,1(W W ;(企业2,企业1),收益为)1,2(W W 。
②存在一个混合策略均衡:学生A 选择企业1的概率为p ,选择企业2的概率为p -1;学生B 选择企业1的概率为q ,选择企业2的概率为q -1。
当学生A 以)1,(p p -的概率选择时,学生B 选择企业1的期望收益应该与选择企业2的期望收益相等,同时当学生B 以)1,(q q -的概率选择时,学生A 选择企业1与选择企业2的期望收益相等,即:221).1(2.1)1(121.W p W p W p W p -+=-+ 221).1(2.1)1(121.W q W q W q W q -+=-+ 解得:21212W W W W p +-=,211221W W W W p +-=-;21212W W W W q +-=,211221W W W W q +-=-所以,混合策略纳什均衡为:学生A 、B 均以)21122,21212(W W W W W W W W +-+-的概率选择企业1,企业2。
2、两个厂商生产一种完全同质的商品,该商品的市场需求函数为P Q -=100,设厂商1和厂商2都没有固定成本。
若他们在相互知道对方边际成本的情况下,同时作出产量决策是分别生产20单位和30单位。
博弈论最全完整-讲解课件
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
博弈论最全完整ppt-讲解
迈克尔·斯彭斯 1948年生于美国的新泽 西,1972年获美国哈佛 大学博士头衔,现兼任 美国哈佛和斯坦福两所 大学的教授。
乔治·阿克尔洛夫 1940年生于美国的纽黑 文,1966年获美国麻省 理工学院博士头衔,现 为美国加利福尼亚州大 学经济学教授。
约瑟夫·斯蒂格利茨, 1943年生于美国的印第 安纳州,1967年获美国 麻省理工学院博士头衔, 曾担任世界银行的首席 经济学家,现任美国哥 伦比亚大学经济学教授
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的逻辑,或者
认为这一选择同样显然。并且是否你认为这一选择是否 对他同样显然;反之,是否她认为这一选择对你同样显 然。……以此类推。 也就是说,需要的是对这样的情况下该选什么的预期的 收敛。这一使得参与者能够成功合作的共同预期的策略 被称为焦点。心有灵犀一点通。
何最好地利用身体(物质)的技巧的一种算计。
什么是策略博弈?
What is a Game of Strategy?
• 策略思考本质上涉及到与他人的相互影响。其他人在同一时间、 对同一情形也在进行类似的思考。
• 博弈论就是用来分析这样交互式的决策的。 • 理性的行为指的是:明白自己的目的和偏好,同时了解自己行
如果一个博弈在所有各种对局下全体参与人之得 益总和总是保持为一个常数,这个博弈就叫常和 博弈;
相反,如果一个博弈在所有各种对局下全体参与 人之得益总和不总是保持为一个常数,这个博弈 就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
没有某个这样的暗示,默契的合作就完全不可能。
博弈论
三、双寡头削价竞争
问两寡头最终的策略是什么?
寡 头 2
寡 头 1 高价 低价
高价
低价
100,100
150,20
10,150
70,70
§2.2 基本概念
一、定义
博弈即一些个人,队组或其他组织,面对一定的环境 条件,在一定的规则下,同时或先后,一次或多次,从各 允许选择的行为或策略中进行选择并加以实施,各自取得 相应的结果的过程。
四、博弈的过程
博弈过程也是博弈结构的重要方面。虽然我 们前面介绍的大多数博弈例子,都是几个博弈方 一次性同时进行决策选择的,但事实上社会经济 活动中也有许多策略较量的博弈问题,是先后、 反复或者重复的策略对抗。例如寡头削价竞争就 完全可能是先后进行的而不是同时进行的。博弈 过程的这种差异对博弈的结果和博弈分析也有非 常重大的影响,因此需要注意它们的区别,分类 进行研究。根据博弈过程方面的这些差异,博弈 问题通常分为“静态博弈”、“动态博弈”和 “重复博弈”几个大类。
博弈论(Game Theory)
第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 引论 基本概念 完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈 合作博弈 演化博弈
第一章 引论
研究对象:冲突、竞争现象的定量分析理论。 对策: 参加竞争的各方为了获胜而需研究出一组对付对方的策略。 历史沿革:(1)我国古代围棋、国际象棋(印度)等; (2)1912年,数学家翟墨罗把对策从模拟模型抽象为数学模 型; (3)第一次、第二次世界大战,军事对策应用于战役和战 略研究; (4)1944年,冯· 诺意曼、摩根斯特合写了“博弈论和经济 行 为”,推动了博弈论在经济管理中的应用; (5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔经济学奖 (1994),进一步推动了博弈论的研究。
博弈论最全完整-讲解
问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
正因为这样的博弈对所有参与者存在着或大 或小的潜在成本,如何达成和维护互利的合 作就成为一个值得探究的重要问题。
存在双赢的博弈吗?实用文档
6
例2:焦点博弈 “We Can’t Take the Exam,
获奖理由:在非合作博弈的均衡分析理 论方面做出了开创性的贡献,对博弈论 和经济学产生了重大影响 。
实用文档
17
约翰·纳什 1928年生于美国
莱因哈 德·泽 尔腾, 1930 年生于 德国
实用文档
约翰· 海萨尼 1920年 生于美 国
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
实用文档
19
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英 国
实用文档
20
2001年诺贝尔经济学奖获得者
实用文档
35
第一章 完全信息静态博弈
博弈论的基本概念及战略式表述 纳什均衡
纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性与多重性
实用文档
36
第一节 博弈论的基本概念
与战略式表述
Байду номын сангаас
实用文档
37
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行 为发生直接相互作用时候的决策以及这种 决策的均衡问题。
博弈论1 (2)全篇
6
四、古典博弈论的三个基本假设:参与人是理性的;他们有 这些理性的共同知识;他们知道博弈规则。
理性的三个基本内涵:理性的局中人具有关于博弈的完全知 识;可以确切知道整个状态空间;具有相对无限的逻辑能力。
五、博弈的典型例子
1 .囚徒困境 坦白
坦白
不坦白
-6,-6 -1,-8
3
2、博弈与一般决策的区别
二、博弈模型要素
1、参与人:博弈中的决策主体。他的目的是通过选择策 略以最大化自己的支付(效用)水平。
虚拟参与人(自然):指决定外生的随机变量的概率分布 的机制。自然作为虚拟参与人没有自己的支付与目标函数, 即所有的结果对它都是无差异的。
2、策略:参与人在给定信息集(信息集包含了一个参与人有关 其他参与人之前行动的知识,可理解为参与人在特定时刻有关 变量值的知识。一个参与人无法准确知道的变量全体属于一个 信息集)的情况下的行动规则。它规定参与人在什么时候选择 什么行动。[策略是可供局中人选择对付其它局中人的完整行动 方案。]
21
例 某个地方的居民均匀地环绕一个圆形湖居 住。两小贩来此地推销商品。1)若居民都选 择离自己较近的小贩购买商品,问小贩选择推 销地点博弈的NE是什么?2)若有三个小贩同 时到此地推销商品,则推销地点博弈的NE又是 什么?3)若圆形湖的周长是1(千米),居民 的购买量是Q=1-D,D为居民与小贩推销点距 离,则两个和三个小贩博弈的NE各是什么?
14
例6 设 s1 [10,0] s2 [3,0]
u1 (s) 10s1 7s1s2 s12
u2 s 15s2 5s1s2 s22
求NE。
15
例7 设 s1 [10,0] s2 [3,0]
(完整版)博弈论知识点总结
博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。
2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。
完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主题所选择的行动的函数。
从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别:3、博弈论与传统决策的区别:1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。
可表示为:maxU(P,l),其中P为市场价格,丨为消费者可支配收入。
2、其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
第十章---博弈论初步精选全文完整版
甲 (式乙)
p.61
p.42
A B
混合策略组合及其支付也就有无限多的可能。
q.31 C 4,6 7,3
乙
.q72 D 9,1 2,8 9
不存在纯策略均衡时的混合策略均衡3
• 条件混合策略:参与人在假定其他参与人按某一概率选择某一策略
的条件下设计的对自己而言具有相对优势的(即期望支付最大的)混合 策略,称为“条件混合策略”。
• 对乙而言,如果假定甲合作,那么乙合作的支付为6,比不合作的支付 多1,因此合作是甲合作条件下乙的条件策略;假定甲不合作,那么乙的 条件策略是也不合作,乙若合作支付只有1,不合作则可得到3。
• 条件策略组合:参与人以其他参与人选择某一策略为条件的条件策略与
作为它的条件的对方策略之间的组合,称为“条件优势策略组合”或
• 假q2=定1-(q1p代1,入p甲2)与、乙(各q自1,的q2期)望的支取付值表从达0到式1有无,限经多整可理能可,得把:p2=1-p1和 E甲= p1(7-10q1)+5q1+2(式1); E乙= 5q1(2p1-1)-7p1+8(式2)
• 每个参与人需要确定,在另一参与人为其混合策略选择某个概率值时, 己方混合策略的概率向量应怎样取值,才能使自己的期望支付最大。
e点的坐标是p1=0.5,q1=0.7,则纳什均衡 时p2=0.5,q2=0.3 。
q1 1
本题中混合策略的纳什均衡还可表示为:
((p1 , p2),(q1 ,q2) )= ((0.5 , 0.5),(0.7 , 0.3) )。 0.7 本题中,只有唯一的这个纳什均衡点。
1
q1<0.7
p1= [0,1] q1 = 0.7
博弈论知识点总结完整版
博弈论(一):基本知识1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。
即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。
两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。
倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。
目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。
把两个角度结合就得到了4种博弈:a、完全信息静态博弈,纳什均衡,Nash(1950)b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
囚徒困境博弈虽然简单,但是却体现了非合作博 弈的基础,称(招,招)为 “纳什均衡”。纳什均衡 是局中人战略选择上构成的一种“僵局”,给定其他 局中人的选择不变,任何一个局中人的选择是最好的, 他也不会改变其战略选择。所以,可以预期(招,招) 是甲乙最终完成的稳定的选择。 囚徒困境反映了个人理性和集体理性的矛盾。
囚徒困境博弈
乙
招
不招 0,-10 -1,-1
招
甲 不招
-8,-8 -10,0
(问题1:甲、乙如何选择?)
甲和乙是参与博弈的人,称为“ 局 中人 ”。表 1 中每一个小方格内的数字 被称为局中人的支付,其中左边的数字 代表甲的支付,右边的是乙的支付。表 1中的双变量矩阵称为博弈支付矩阵。
甲或乙可以作出的选择被称为“ 战 略”,如“招”或“不招”都是战略。
为什么博弈论在经济学领域会产生如 此大的影响呢?这是因为博弈论改变了 传统微观经济学的某些基本假设,从一 个独特的视角帮助我们更加深刻地理解 和把握经济现象,并指导更加有效的经 济政策制订。博弈论作为现代经济学的 前沿领域,已成为占据主流的基本分析 工具。
博弈论是一门十分有趣但理论上又是 十分艰深的学问,本节介绍一些大家能 够凭直观或简单分析就能把握的例子, 为大家介绍博弈论的基本概念及应用, 以引起大家对这门目前已成为热门科学 的兴趣和获得初步的了解。这些例子也 是我们在日常生活中经常所遇到的问题 或观察到的现象,通过博弈论,我们能 够更加深刻地理解它们。
类似的例子还有: 政府要负责修建公共设施,因为私人没有积极性出资 修建公共设施 苏格兰的草地为什么消失了?公共资源经常被过度利 用。 渤海中的鱼愈来愈少了,工业化中的大气及河流污染, 森林植被的破坏等。 解决公共资源过度利用的出路是政府制订相应的 规制政策加强管理,如我国政府规定海洋捕鱼中,每 年有一段时间的“休渔期”,此时禁止捕鱼,让小鱼 苗安安静静地生长,大鱼好好地产卵,并对鱼网的网 眼大小作出规定,禁用过小网眼的捕网打鱼,保护幼 鱼的生存。 问题:为什么在城市中心道路上禁止汽车鸣喇叭?
2. 生活中的“囚徒困境”例子
例子1 商家价格战
出售同类产品的商家之间本来可以 通过共同将价格维持在高位而获利,但 实际上却是相互杀价,结果都不能获得 超额利润。 当一些商家共谋将价格抬高,消费 者实际上不用着急,因为商家联合维持 高价的垄断行为一般不会持久,可以等 待垄断的自身崩溃,价格就会掉下来。
对甲来说 ,尽管他不 知道乙是选择了“招”还是 “不招”,他发现他自己选择“招”都是比 选择“不招”为好的。因此,“不招”是相 对于“招”的劣战略,他不会选择劣战略。 所以,甲会选择“招”。 同样,根据对称性,乙也会选择“招”, 结果是甲乙两人都“招”。甲和乙都不会选 择劣战略“不招”,称为“ 剔除劣战略的占 优战略均衡”。其中“招”是占优于(优 于)“不招”的占优战略。
但是,尽管政府当时无力制止这种事 情,公众也不必担心彩电价格会上涨。 这是因为,“彩电厂商自律联盟”只不 过是一种“囚徒困境”,彩电价格不会 上涨。在高峰会议之后不到二周,国内 彩电价格不是上涨而是一路下跌。这是 因为厂商们都有这样一种心态:无论其 他厂商是否降价,我自己降价是有利于 自己的市场份额扩大的。
从“纳什均”我们引出了“看不见 的手”的原理的一个悖论:从利己目 的出发,结果损人不利己,既不利己 也不利他。两个囚徒的命运就是如此。 从这个意义上说,纳什均衡”提出的 悖论实际上动摇了西方经济学的基石。
研究囚徒困境问题的目的 利用这种困境达到有利于社会的目的 政府在经济活动中的组织协调工作的必 要性 避免囚徒困境
博弈论完整版
博弈论(game theory)是由美国数学家 冯· 诺依曼(Von. Neumann)和经济学家摩根斯坦 (Morgenstern)于1944年创立的带有方法论性质 的学科,它被广泛应用于经济学、军事、政 治科学、人工智能、生物学、火箭工程技术 等。在1994年,三位博弈论专家即数学家纳 什(Nash,他的故事被好莱坞拍成了电影《美 丽心灵》,该影片获得了2002年奥斯卡金像 奖的四项大奖)、经济学家海萨尼(Harsanyi) 和泽尔滕(Selten)因在博弈论及其在经济学 中的应用研究上所作出巨大贡献而获得诺贝 尔经济学奖。
约翰· 纳什( John.F.J.Nash)
1928年生于美国西 弗吉尼亚,1950年 于普林斯顿获数学 博士学位,曾任教 于MIT,现为普林 斯顿大学教授。主 要著作为:《n人博
弈中的均衡》(19 50), 《不合作博 弈论》(1951).
1996年,两位将博弈论应用于不对 称信息下机制设计的经济学家莫里斯 (Mirrlees)和维克里(Vickrey)、以及2001 年三位经济学家阿克洛夫(Akerlof)、斯 蒂格利茨(Stiglitz)和斯宾塞(Spence)因运 用博弈论研究信息经济学所取得的成就 而成为这两个年度的诺贝尔经济学奖得 主。专家预计,近几年还会有更多的博 弈论专家可能获得诺贝尔经济学奖。
譬如,生产彩电的大厂商合谋将彩 电价格维持高位,他们搞了一个“彩电 厂家价格自律联盟”,并在深圳举行了 由多家彩电厂商首脑参加的“彩电厂商 自律联盟高峰会议”。当时,对于这种 在发达国家明显属于违法行为的所谓 “自律联盟”,国家在法律上暂时还是 无能为力的。 2008年,方便面厂家合谋涨价。
一、什么是博弈论:从“囚徒困境”谈起
1. 囚徒困境
两个小偷甲和乙联手作案,私入民宅被警方逮 住但未获证据。警方将两人分别置于两间房间分开审 讯,政策是若一人招供但另一人未招,则招者立即被 释放,未招者判入狱10年;若二人都招则两人各判刑 8年;若两人都 不招则未获证据但因私入民宅 各拘留1年。
表1
对经典经济学的冲击 ������ “纳什均衡”首先对亚当· 斯密的 “看不见的手”的原理提出挑战。按照斯 密的理论,在市场经济中,每一个人都从 利己的目的出发,而最终全社会达到利他 的效果。 ������ 《国富论》:“通过追求(个人的) 自身利益,他常常会比其实际上想做的那 样更有效地促进社会利益。”