商学院MBA博弈理论与战略决策分析优秀课件

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Session 3
Game Theory and Strategic Decision
Analysis
博弈论与战略决策分析
管理决策统计分析
Prof. Ren Jianbiao, 2011
1-2
Session Topics
Strategic Thinking 策略思考
Introduction to Game Theory 博弈论介绍 Game’s Game 博弈游戏
How to Shape Strategy 用博弈论构筑企业战略
Prof. Ren Jianbiao, 2011
1-3
Strategic Thinking
策略性思考
罗伯特-奥曼教授拍卖一张一百美元的钞票，至无人出价时停止，由喊出最高价者得此钞票，并付给教授他所喊的价格，同时喊出次高价者也须付给教授他所喊的价格。

什么是你的最佳喊价策略？
童话故事中国王让囚犯戴上红白两色帽子，其中有两顶红帽，并对囚犯说：“你们之中至少有一顶红帽，但不准与其他人交谈或者查看自己帽子的颜色，违者处死。

每天放完风可以找牢头猜你们帽子的颜色，猜错者处死，猜对者就被立即释放”。

囚犯的最佳策略是什么？
Prof. Ren Jianbiao, 2011
1-4
Game Theory
博弈论
博弈论是由冯·诺依曼(Von. Neumann)和摩根斯坦(Morgenstern)于1944年创立的方法论性质的学科 1994年诺贝尔经济学奖纳什（Nash ）、海萨尼（Harsanyi ）和泽尔滕（Selten ）
电影《美丽心灵》2002年奥斯卡金像奖四项大奖
Prof. Ren Jianbiao, 2011
1-5
1994
年诺贝尔经济学奖
纳什（Nash ）：均衡存在性定理
海萨尼（Harsanyi ）：不完全信息博弈分析方法泽尔滕（Selten ）：动态博弈分析方法
Prof. Ren Jianbiao, 2011
1-6博弈论的诺贝尔经济学奖
1996年，莫里斯(Mirrlees)和维克里(Vickrey):博弈论应用于不对称信息下机制设计
2001年，阿克洛夫(Akerlof)、斯宾塞(Spence)和斯蒂格利茨(Stiglitz) ：运用博弈论研究信息经济学
2005年，罗伯特-奥曼和托玛斯-谢林：冲突与合作 2007年，赫维茨、罗杰·B.迈尔森、马斯金：机制设计理论
Prof. Ren Jianbiao, 2011
1-7
詹姆斯·莫里斯（James A.Mirrlees ）教授在信息经济学理论领域作出了重大贡献，尤其是不对称信息条件下的经济激励理论的论述；威廉·维克瑞(William Vickrey)在信息经济学、激励理论、博弈论等方面都作出了
重大贡献。

1996年诺贝尔经济学奖
Prof. Ren Jianbiao, 2011
1-8
阿克劳夫论证了如果信息不对称非常严重，就有可能限制市场功能的发挥，在极端情况下，会使市场整个不存在（逆向选择）。

斯彭斯论证了掌握更多信息的一方可以通过向信息贫乏的一方传递可靠信息而在市场中获益（信号传递）。

斯蒂格利茨则从相反方向说明信息的重要性：买卖双方中拥有信息较少的一方会努力从另一方获取信息（信息经济学）。

他们的理论成为现代信息经济学的核心，被广泛应用到从传统的农产品市场到现代金融市场等各个领域。

2001年诺贝尔经济学奖
Prof. Ren Jianbiao, 2011
1-9
具有以色列和美国双重国籍的经济学家罗伯特-奥曼和美国经济学家托马斯-谢林因在博弈论分析方面的研究获得2005年诺贝尔经济学奖。

两位经济学家获得诺贝尔经济学奖是因为“他们通过对博弈论的分析加深了我们对冲突与合作的理解”。

2005年诺贝尔经济学奖
Prof. Ren Jianbiao, 2011
1-10由赫维茨开创并由马斯金、罗杰-B-迈尔森进一步发展的机制设计理论极大地加深了优化分配机制设计、个人动机的解释、私人信息的理解。

这种理论能区分市场运作良好的市场和运作不良好的市场。

帮助经济学家确定有效的贸易机制、规则体系和投票程序。

机制设计理论今天已在经济学的许多领域、政治学的一些领域发挥着重要作用。

2007年诺贝尔经济学奖
Prof. Ren Jianbiao, 2011
1-11
What Game Theory Can Help Us?博弈论能为经理人员提供什么？
思维方式（the way of thinking). 在互动的环境下，发现正确的战略，作出正确决策。

决策时不要忘记“互动”：别人和你一样，也在选择自己的最优决策。

博弈论帮助你分解出影响决策的关键因素。

博弈论帮助你在企业内部达成一致，至少可以成为同事间讨论问题的共同语言。

Prof. Ren Jianbiao, 2011
1-12
Prisoner’s Dilemma
从囚徒困境谈起
两个小偷甲和乙联手作案，私入民宅被警方逮住但未获证据。

警方将两人分别置于两间房间分开审讯，政策是若一人招供但另一人未招，则招者立即被释放，未招者判入狱10年；若二人都招则两人各判刑8年;若两人都不招则未获证据但因私入民宅各拘留1年。

Prof. Ren Jianbiao, 2011
1-14
Game Structure
博弈的结构
甲和乙是参与博弈的人，称为局中人或者参与人。

表中每一个小方格内的数字被称为局中人的报酬或者支付，其中左边的数字代表甲的报酬，右边是乙的报酬。

表中的双变量矩阵称为博弈支付矩阵。

甲或乙可以作出的选择被称为策略，如“招”或“不招”都是策略。

Prof. Ren Jianbiao, 2011
1-15
Nash Equilibrium
纳什均衡
“纳什均衡”。

纳什均衡是局中人策略选择上构成的一种“僵局”，给定
其他局中人的选择不变，任何一个局中人的选择是最好的，根据经济人假设，他也不会改变其策略选择。

纳什均衡的哲学含义：让我们设想n 个参与人在博弈之前协商达成一
个协议，规定每一个参与人选择一个特定的策略。

我们要问的一个问题是，给定其他参与人都遵守这个协议，在没有外在强制的情况下，是否有任何人有积极性不遵守这个协议？显然，只有当遵守协议带来的效用大于不遵守协议时的效用，一个人才会遵守这个协议。

如果没有任何参与人有积极性不遵守这个协议，我们说这个协议是可以自动实施的（self-enforcing ），这个协议就构成一个纳什均衡；否则，它就不是一个纳什均衡。

Prof. Ren Jianbiao, 2011
1-16
Example of Prisoner’s Dilemma
生活中的“囚徒困境”例子
出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利，但实际上却是相互杀价，结果都赚不到钱。

当一些商家共谋将价格抬高，消费者实际上不用着急，因为商家联合维持高价的垄断行为一般不会持久，可以等待垄断的自身崩溃，价格就会掉下来。

Prof. Ren Jianbiao, 2011
1-17
猪圈中有一头大猪和一头小猪，在猪圈的一端设有一个按钮，每按一下，位于猪圈另一端的食槽中就会有10单位的猪食进槽，但每按一下按钮会耗去相当于2单位猪食的成本。

如果大猪先到食槽，则大猪吃到9单位食物，小猪仅能吃到1单位食物；如果两猪同时到食槽，则大猪吃7单位，小猪吃3单位食物；如果小猪先到，大猪吃6单位而小猪吃4单位食物。

请写出这个博弈的报酬矩阵。

Boxed Pigs
智猪博弈
Prof. Ren Jianbiao, 2011
1-18
问题：
为什么中小企业很少花钱去开发新产品？Example of Boxed Pigs
生活中的“智猪博弈”例子
斗鸡博弈
Prof. Ren Jianbiao, 2011
1-20 双方都避免两败俱伤，斗鸡博弈有两个纳什均衡，一方前进，另一方后退。

由于有两个均衡点，结果无法预知。

20世纪60年代苏美间的古巴导弹危机就是一个斗鸡博弈的很好例子。

古巴导弹危机是冷战时期苏美之间最严重的一次危机，赫鲁晓夫1962年偷偷将导弹运到古巴对付美国，被美国U2飞机侦察到，美国派出携带核武器的战机、航母，威胁苏联限期从古巴撤出导弹。

苏美这两只大公鸡均在考虑进还是退？
战争的结果当然是两败俱伤，但任何一方退下来则是很不光彩的事。

博弈结果是苏联从古巴撤回了导弹，做了丢面子的“撤退的鸡”，而美国坚持了自己的策略，做了“不退的鸡”。

当然为了给苏联面子，同时也担心战争，美国也从土耳其撤了一些导弹。

古巴导弹危机
Prof. Ren Jianbiao, 2011
1-22博弈论要点
博弈论的基本概念包括：参与人、行动、信息、战略、支付函数、结果、均衡
其中，参与人、行动、结果合称博弈规则博弈有不同的种类：
z 从行动顺序角度：
9静态博弈。

参与人同时选择行动
9动态博弈。

参与人的行动有先后顺序
z 从拥有信息角度：
9完全信息博弈。

每个参与人对所有其他参与人的特征、战略空间、支付函数有准确的知识
9不完全信息博弈。

每个参与人对所有其他参与人的特征、战略空间、支付函数没有准确的知识
Prof. Ren Jianbiao, 2011
1-23博弈论模型G ＝｛P ，A ，S ，I ，U ｝
一个博弈需要有五方面内容组成：参与人、行动、行动顺序、信息、结果。

P ：为参与人，能够独立决策，独立承担责任的个人或组织，以最终实现自身利益最大化为目标。

A ：各参与人的所有可能的策略或行动的集合。

S ：博弈的进程或次序。

分为静态博弈和动态博弈。

I ：信息:能够影响最后博弈结局的所有参与人的情报。

如果各方对各种局势下所有参与人的得益状况完全清楚,称为完全信息博弈。

反之为不完全信息博弈。

在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。

如果完全了解则称之为“具有完美信息”的博弈。

反之称为“不完美信息的动态博弈”。

由于信息不完美,博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果。

U ：为参与人获得利益,也是博弈各方追求的最终目标。

分为零和博弈和变和博弈。

零和博弈中各方利益之间是完全对立的。

Prof. Ren Jianbiao, 2011
1-24
博弈论的战略式表述
参与人i =1,2,···,n N 表示自然
行动。

a i 表示第i 个参与人的一个特定行动
A i ={a i }表示可供i 个选择的所有行动的集合
n 人博弈中，n 个参与人行动的有序集a 称为“行动组合” 信息
9完美信息：某个信息集只有1个值
9完全信息：自然不首先行动或其初始行动为所有参与人知道
9共同知识
Prof. Ren Jianbiao, 2011
1-25
策略s ：参与人在给定信息集时的行动规则
9静态博弈中，战略等同于行动
9战略必须是完备的
支付u ，u =u i (s 1, ···,s i , ···s n ) 结果
均衡s *=(s 1*, ···,s i *, ···s n *)
9均衡：一种所有动作的影响都互相抵消，整个系统处于平稳的、均势的、不变的状态
博弈论的策略式表述
u i (s i *,s*-i )≥
u i (s i ',s*-i )s i '≠s i *∀
Prof. Ren Jianbiao, 2011
1-27
纳什均衡解及其分析
纳什定理说明了纳什均衡在相当广泛的博弈模型中普遍存在
但是纳什均衡只是理论模型的导出结果，其适用性存在一定局限
9纳什均衡的理论基础：如经济理性、决策准则一致性、共同知识等并不能涵盖现实行为（互惠性、利他性、不理性等）
9纳什均衡不唯一
Prof. Ren Jianbiao, 2011
1-28Dynamic Game and Commitment
动态博弈与承诺行动
通常需要参与人多步决策才能完成，具有明显的阶段性。

博弈的结局、各参与人的支付值由多阶段决策结果确定。

如果局中人在进行行动选择时有先后顺序之分，这种博弈就被称为“动态博弈”。

在动态博弈中，有些参与人先动，另一些参与人后动。

先动的人必须考虑后动的如何动，才能知道什么是自己的最优选择。

纳什均衡可能包括不可置信（Noncredible)的威胁：事前最优的选择，事后不是最优的，所以这样的威胁不可置信。

Prof. Ren Jianbiao, 2011
1-30Extensive Form 动态博弈的扩展式表示参与人集合：i=1, …,N 。

用N 表示虚拟参与人“自然”；自然的含义是某些外生的客观概率分布事件参与人的行动顺序(the order of moves):描述各参与人在什么时候行动；
参与人的行动空间(action set)：在每次行动时，参与人可选择的行动集合；
参与人的信息集(information set)：每次行动时参与人知道什么；
参与人的支付函数：在行动结束之后，每个参与人得到些什么。

自然选择的概率分布（假定自然状态是共同知识）。

对于有限博弈，博弈树是常用的表述方式。

完全信息动态博弈纳什
Prof. Ren Jianbiao, 2011
1-32
Dynamic Game and Commitment
动态博弈与承诺行动
序贯理性要求，不论过去发生了，参与人将选择最优的行动。

逆向归纳：从最后一个阶段往回推理，剔除“坏”选择，直到找到唯一的结果。

在这个博弈中，给定希望进入的情况下，正大的最优选择是合作，而非斗争。

如果希望相信正大是理性的，将选择进入。

所以，唯一合理的均衡是“进入，合作”。

这叫“精炼纳什均衡”。

Prof. Ren Jianbiao, 2011
1-33
承诺是将不可置信的威胁变成可置信的威胁：威胁不仅是事前最优的，也是事后最优的。

沉淀成本具有的承诺价值：如果正大事前扩大生产规模，让其闲置，希望就可能不敢进入了。

承诺意味着限制自己的自由：选择少反而对自己好。

Dynamic Game and Commitment
动态博弈与承诺行动
Prof. Ren Jianbiao, 2011
1-34
例子: 项羽的“破釜沉舟”
例子：海尔的“砸冰箱事件”
Dynamic Game and Commitment
动态博弈与承诺行动
Prof. Ren Jianbiao, 2011
1-35
Repeated Game
重复博弈和信誉问题
如果博弈不是一次的，而是重复进行的，参与人就可以将自己的选择依赖于其他人之前的行动，均衡结果可能大不相同。

囚徒困境中，一次博弈的唯一均衡是不合作（即坦白）。

但如果博弈无限重复，合作就可能出现。

Prof. Ren Jianbiao, 2011
1-39
Reputation
信誉的条件
重复博弈；
足够耐心；
相对确定的环境；
欺骗可以被观察到；
受骗人有积极性惩罚。

Prof. Ren Jianbiao, 2011
1-40Incomplete Information
不完全信息下的博弈
如果信息不完全，行动有先有后，后行动者就可以通过观察先行动者的选择修正自己的信息；先行动者意识到这一点，就会选择传递对自己有利的信息，避免传递对自己不利的信息；后行动者预期到这一点，就会相应地作出自己的判断。

Prof. Ren Jianbiao, 2011
1-41
二手车市场
人才市场
保险市场
信贷市场
Example of Incomplete Information Game
生活中的“不对称信息”例子
Prof. Ren Jianbiao, 2011
1-42
在发达国家，二手车（旧车）的价格往往比新车差一大截，即使旧车本身没有什么质量问题，一旦旧车进入二手车市场，其价格就会与新车相比差得老远。

在我国许多城市，二手车市场甚至难以建立起来，原因是进入市场的买车人太少。

这是为什么呢？二手车市场的博弈理论为我们解答。

二手车市场
Prof. Ren Jianbiao, 2011
1-43
Mechanism Design
机制设计
问题：有时候，拥有私人信息的一方有积极性通过一定的行动向另一方传递自己的私人信息，但有时候他们没有积极性或没有有效的办法传递自己的私人信息；
机制设计:没有私人信息的一方通过设计不同的分配方案使得有私人信息的一方通过自我选择揭示自己的私人信息,说真话的机制。

Prof. Ren Jianbiao, 2011
1-44
如果有一件古董需要拍卖，有许多人参加竞争性拍卖。

这件古董在每个买主心中有一个价值评价。

但是，卖主不知道买主的评价，买主也不会老实将其对古董的评价告诉卖主。

不同买主之间也不知道其他人的价值评价。

如何拍卖? 拍卖
Prof. Ren Jianbiao, 2011
1-45
如果采用“英式拍卖法”，买主们轮流出价，直到开出最高价的买主拿走古董并支付所开出的最高价格。

按这种拍卖方法，古董并不能按买主心中的最高评价价值卖出。

壁如，当买主中的最高评价为100万元，第二高评价为90万元时，当评价最高的买主开出91万元时，就可买走其评价为100万元的古董但只支付了91万元。

由于这是公开竞价，会出现围标问题，即买主们合谋压价。

英式拍卖法
Prof. Ren Jianbiao, 2011
1-46
另一种方法是：“一级密封价格拍卖法”。

买主每人将其开出的价格写入一个信封，密封后交给卖主。

卖主拆开所有信封，将古董卖给信封中出价最高的买主，并要求支付最高的价格。

这种方法可避免围标，但不能将古董按买主中最高的评价价值卖出。

因为买主不会按心中的评价老老实实地将价格写为其价值评价。

如果该买主认为古董值100万元，他不会写出价格为100万元，因为当他开出比100万更低一些的价格时，有可能赢得古董但净赚一个价值与价格的差额。

如当他开出90万元时，有可能成交并净赚10万元。

相反，当他开出100万元时，即使成交也无赚头。

所以，大家都不会老老实实报出心中的价值。

一级密封价格拍卖法
Prof. Ren Jianbiao, 2011
1-47
经济学家维克里发明的“二级密封价格拍卖法”（又称维克里拍卖法或维克里招标法），既可避免围标，又可诱使买主们老老实实地开出心中的真实评价。

维克里拍卖法要求每个买主写入信封一个出价，密封后交给卖主，卖主拆开信封后宣布将古董卖给出价最高的人，但只需支付开出的第二高的价格。

譬如，出价最高的为100万元，第二高的为90万元，古董就卖给开出100万元的人，但他只需支付给卖主90万元。

二级密封价格拍卖法
Prof. Ren Jianbiao, 2011
1-48
对每个买主来说，他不知道其他买主的评价，但给定其他买主的评价（尽管他不知道），他一旦获胜，支付的第二高的价格是固定的，不会随他开出的价格而变；但他开出的价格愈高，获胜的可能就愈大；但是，他不能开出比他的价值评价更高的价格。

因为一旦存在别的人开出的价格比他的价值评价还要高，当他获胜时，就必须以高出他的价值评价的价格购买古董，对他来说是得不偿失的。

所以，每个人都会老老实实在按心中的评价开出价格。

如果所有人的评价是一样的，古董就以真实的最高价值卖出。

维克里拍卖法可以诱使买主说出真话。

二级密封价格拍卖法
Prof. Ren Jianbiao, 2011
1-49
例子：所罗门王断案
Example of Mechanism Design
生活中的“机制设计”例子
Prof. Ren Jianbiao, 2011
1-50 两个女人争夺一个婴儿告到所罗门那里。

一个女人说：“陛下，我和这妇人同住一个房间。

我生了一个孩子，三天后这妇人也生了一个孩子，房间里再没别的人。

夜里这妇人睡觉的时候，把自己的孩子压死了。

她半夜醒来，趁我睡着，把我的孩子抱去，把她已经死去的孩子放在我的怀里。

天亮要喂奶的时候，我才发现怀里的孩子是死的，仔细察看，并不是我的孩子。

”另一个女人赶紧说：“不对，活孩子是我的，死的才是她的。

”她们吵得不可开交。

所罗门说：“好。

现在把这孩子辟成两半，一半给这个妇人，一半给那位妇人。

”一个女人同意，另一位女人坚决反对：“陛下把这孩子给她算了，千万不可杀他！”所罗门知道心痛孩子的女人一定是孩子的亲生母亲，就把孩子判给了她。

Example of Mechanism Design
生活中的“机制设计”例子：所罗门王断案。