博弈论与企业管理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从而得到四种不同类型的博弈
信息
. 行动顺序
完全信息
完全信息静态博弈
纳什均衡 Nash (1950,1951)
不完全信息
不完全信息静态博弈
贝叶斯纳什均衡 Harsanyi (1967-1968)
静态
完全信息动态博弈
子博弈完美纳什均衡
不完全信息动态博弈
完美贝叶斯纳什均衡 Selten (1975);
动态
不坦白 -1,-8 -2,-2
§2
纳什均衡
一、纳什均衡的思想
“双赢”或“多赢”的思想。
二、纳什均衡的意义 它是关于博弈结局的一致性预测,如果 所有局中人预测一个特定的纳什均衡会出现, 那么这种均衡就会出现,预测之间没有矛盾, 不会因为有局中人认为不符合自己的利益要 求而失败。
三、纳什均衡的定义
博弈论与企业管理
王文举 教授 首都经济贸易大学
第一部分 引 论
一、博弈论的研究对象
二、博弈论与经济学的关系
三、企业管理与博弈论 四、博弈论的产生与发展
五、博弈论的分类
一、博弈论的研究对象
博弈论是研究在利益相互影 响的局势中,局中人如何选择自 己的策略才能使自身的收益最大 化时的均衡问题。
二、博弈论与经济学的关系
例1中囚徒困境的纳什均衡
用双划线法可以求出纳什均衡:
(坦白,坦白),(-6,-6) 意义:揭示个人理性与集体理性之间的矛盾。
乙
甲 坦白 不坦白
坦白 -6,-6 -8,-1
不坦白 -1,-8 -2,-2
例2、智猪博弈(boxed pigs)
局中人:大猪,小猪 策 略:大猪:按,等待 小猪:按,等待 支付矩阵: 纳什均衡:(按,等待)
一、纳什均衡存在的问题
5、与第4个问题相联系,由于不考虑自己选 择对别人选择的影响,纳什均衡允许了不可 置信威胁的存在。
这就引出了泽尔腾(的贡献。
二、Selten的贡献
Selten指出:“纳什均衡”的概念仅 适用于分析一些静态的“非重复性博弈”; 当用它来分析一些动态或重复性的博弈时, 所得结果往往过于含糊、笼统。因此,必须 对“纳什均衡”的概念加以修正。从1965年 起,泽尔腾对“纳什均衡”的概念进行了精 心的研究,提出了两个著名的新概念:“子 博弈完美纳什均衡”和“颤抖手完美纳什均 衡”,去剔除那些缺乏说服力的纳什均衡点, 提出了“均衡选择”问题。
小猪
大猪 按 等待
按 5,1 9,-1
等待 4,4 0,0
例3、性别大战(battle of the sexes)
局中人:男,女 策 略:男:看足球,看芭蕾 女:看足球,看芭蕾 支付矩阵: 纳什均衡:(足球,足球);(芭蕾,芭蕾)
女
男 足球 芭蕾
足球 3,2 -1,-1
芭蕾 1,1 2,3
例4、猜左右手游戏
1883年,Bertrand两寡头价格竞争模型
Bertrand, J., “Theorie Mathematique
de la Richesse Sociale”, Journal des Savants, 1883, 499-508.
作为博弈论诞生的标志
1944年,冯· 诺依曼和摩根斯坦,
《博弈论与经济行为》
Reinhard Selten: 德国波恩大学 John C.Harsanyi: 美国加州大学泊克莱分校
1996年Nobel经济学奖
非对称信息下的激励机制设计理论
James A.Mirrlees: 英国剑桥大学
William Vickrey: 美国哥伦比亚大学
2001年Nobel经济学奖
逆向选择:非对称信息下的市场交易理论
不找 -1,3
0,0
救济
不救济
—— 完全信息动态博弈
一、纳什均衡存在的问题
1、一局博弈可能有不止一个纳什均衡,事实上,有 些博弈可能有无数个纳什均衡,究竟哪个纳什均衡 实际上会发生?不知道。 2、纳什均衡并不一定导致帕累托最优。例如“囚徒 困境”意味纳什均衡并不导致帕累托最优,导致了 个人理性与集体理性的矛盾。对于这样的问题,纳 什均衡没有给出解决的办法。
1、博弈的纳什均衡是这样一种最优策略组 合,是一种你好、我好大家都好的理性结局, 其中每一个局中人均不能也不想单方面改变自 己的策略而增加收益,每个局中人选择的策略 是对其他局中人所选策略的最佳反应。 2、严格的数学定义
四、纳什均衡的求法
1、双人有限博弈:双划线
对局中人2的每一个给定策略,为局 中人1寻找使其支付最大的策略(结果 可能不只一个),在其对应支付下划 线;然后对局中人1进行相应的步骤; 最后,凡是两个局中人支付下均被划 线的结局就是纳什均衡。
§2 扩展型博弈的纳什均衡
一、以房地产开发博弈为例说明从扩展型表述构造出 策略型表述,从而求出纳什均衡。 扩展型 博弈 策略型 策略型博弈纳什均衡 扩展型博弈纳什均衡
二、局中人的策略是关于行动的一个完整的计划,它 明确了在局中人可能会遇到的各种情况下对可行行 动的选择。
§2 扩展型博弈的纳什均衡
1. 从经济学的研究对象来看
传统观点:经济学是研究有限资源的 最优配置的一门学科。
现代观点:研究学是研究理性人行为 的一门学科。
理性人
合作与冲突
博弈论
2. 从新古典经济学的两个假设来看
假设一:市场是完全竞争的; 假设二:市场是完全信息的。 结 论:市场可以达到一般均衡, 资源配置达到Pareto最优。 两个假设与现实的背离,引出博弈论。
例1、房地产开发博弈
两家房地产开发商A、B,考虑是否在同一地 段开发写字楼,各自面临的选择是开发还是不开发。 该博弈的行动顺序为: (1)开发商A首先行动,选择开发或者不开发; (2)开发商B在观测到A的选择后,决定开发或不开 发。
房地产开发博弈树
A
开发
B 开发
不开发
B 不开发 开发 不开发
(-3,-3) (1,0) (0,1)
Cournot, A., Recherches sur les Principes Mathematiques de la Theorie des Richesses,1838. English Edition: Researches into the Mathematical Principles of the Theory of Wealth, edited by N. Bacon, New York: Macmillan, 1897.
局中人:甲,乙 策 略:甲:放左手,放右手 乙:猜左手,猜右手 支付矩阵: 没有纳什均衡
乙
甲 放左手 放右手
猜左手 -1,1 1,-1
猜右手 1,-1 -1,1
例5、社会保障博弈
局中人:政府和下岗工人 策略:政府:救济,不救济 下岗工人:找工作,不找工作 支付矩阵为:
工人 政府
找工作 3,2
-1,1
(0,0)
三、完美信息博弈与完美回忆博弈
1、完美信息(perfect information)博弈是 指博弈中所有的信息集都是单点集。在完美 信息博弈中,一次只有一个局中人在行动, 而且他在行动时知道博弈的所有以往行动的 历史。
2、完美回忆(perfect recall)博弈是指没有 局中人会忘记自己所知道的信息,所有局中 人都记得自己以往的行动选择。
Von Neumann, J. & O. Morgenstern, The Theory
of Games and Economic Behavior, Princeton
University Press, 1944.
1994年Nobel经济学奖
非合作博弈均衡理论
John F. Nash: 美国普林斯顿大学
Selten (1965)
Kreps &Wilson (1982)
第二部分:非合作博弈理论
—— 完全信息静态博弈 —— 完全信息动态博弈 —— 不完全信息静态博弈 —— 不完全信息动态博弈
—— 完全信息静态博弈
博弈有两种表述方法:
(1)策略型表述——适合表示静态博弈 (2)扩展型表述——适合表示动态博弈
George Akerlof: 美国加州大学泊克莱分校 Michael Spence: 美国斯坦福大学
Joseph E. Stiglitz:美国哥伦比亚大学
2005年Nobel经济学奖
“通过博弈论分析而增进我们对冲突和合作的理解。” Robert J.Aumann 教授: 以色列耶路撒冷希伯来大学理 性研究中心 Thomas C.Schelling 教授: 美国哈佛大学肯尼迪政府 学院和马里兰大学经济学系暨公共政策学院
例1、囚徒困境及其策略型表示 (Tucker,1950)
1、局中人:甲,乙 2、策略:甲和乙:坦白,不坦白 3、支付函数——支付矩阵(双人有限博弈)
每个位置上第一个数字表示局中人1在对应的策略组 合中得到的支付,第二个数字表示局中人2的相应所 获支付。
乙
甲 坦白 不坦白
坦白 -6,-6 -8,-1
例题:房地产开发博弈
A
开发
B 开发
不开发
B 不开发 开发 不开发
(-3,-3) (1,0) (0,1)
(0,0)
三、 扩展型博弈的纳什均衡
B
A (开,开) (开,不) (不,开) (不,不)
开发
-3, -3
-3, -3
1, 0
1, 0
不开
0, 1
0, 0
0, 1
0, 0
三、 扩展型博弈的纳什均衡
§1 博弈的策略型表述
一、博弈有三个要素:
1、局中人(Players); 2、策略(Strategies); 3、支付函数 (Payoff functions)
二、两种特殊博弈类型
1、有限博弈:
博弈中局中人人数有限,且每个 局中人只有有限个策略。
2、零和博弈:
博弈中局中人所获支付之和为零, 即一方所得为另一方所失。
非合作博弈可以从两个角度进行分类
(1)从局中人行动的时间顺序上,分为
静态博弈:局中人同时行动,或虽然局中人 的行动有先有后,但后行动者不能够观察到先 行动者的行动; 动态博弈:局中人的行动有先有后,且后行 动者能够观察到先行动者的行动。
(2)从局中人掌握信息的角度,分为: 完全信息博弈 不完全信息博弈
§1 博弈的扩展型表述
一、博弈的扩展型表述
扩展型扩展的是策略型中的策略,有六个要素: 1、局中人集合; 2、局中人的行动顺序; 3、局中人的行动空间; 4、局中人的信息集; 5、支付函数; 6、 外生事件的概率分布。
二、博弈树
1、结点 (nodes);
2、枝 (branches);
3、信息集 (information set)。
一、纳什均衡存在的问题
3、 纳什均衡假定:每个人将别人的策略视为给定,选择对自 己最有利的策略,即如果其他局中人不改变策略,任何单个 局中人不能通过单方面改变策略来提高他的效用或收益。这 种完全信息的假定不符合实际情况。
4、在纳什均衡中,局中人在选择自己的策略时,把其他局中人 的策略当作给定的,不考虑自己的选择如何影响对手的策略。 这个假设在研究静态博弈时是成立的,因为在静态博弈下, 所有局中人同时行动,无暇反应。但对动态博弈而言,这个 假设就有问题了。当一个人行动在先,另一个人行动在后时, 后者自然会根据前者的选择而调整自己的选择,前者自然会 理性地预期到这一点,所以不可能不考虑自己的选择对其对 手的选择的影响。
经济学离不开博弈论
三、企业管理与博弈论
1. 管理经济学的研究对象是用微观 经济学的基本理论和方法以及决 策理论与技术研究企业的经营决 策问题,即研究企业应该生产什 么、生产多少以及如何生产等问 题。 2. 企业管理(人)与博弈论
四、博弈论的产生与发展
1838年,Cournot 两寡头产量竞争模型
此博弈有三个纳什均衡: (开发,(不开发,开发)) (开发,(不开发,不开发)) (不开发,(开发,开发))
博弈论成为主流经济学的一部分
博弈论成为主流经济学的一部分 反映: 1. 重视微观基础
2. 重视人与人之间关系的研究
3. 重视信息在经济中的作用
五、博弈论的分类
从局中人之间是否有具有约束力的协议来看,博 弈可分为:
合作博弈:有。强调团体理性,强调效率、 公平和公正 非合作博弈:没有。强调个人理性、个人 最优选择,其结果可能是有效率的,也可能是 无效率的。
三、完全信息静态博弈的含义
“完全信息”,是指局中人对自己与其他局中 人的所有与博弈有关的事前信息(策略空间、 支付函数等)有充分的了解。 “静态博弈”是指博弈实际进行时,每个局中 人的策略选择同时进行而且仅运行一次。其 中的“同时”并不要求时间上的完全一致, 只要每个局中人在选择策略时不知道其他局 中人所选择的策略就可以表述为静态博弈。