博弈论部分内容
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论基础
本讲要点:博弈论的基本思想,博弈的构成要素,简单博弈的求解方法,纳什均衡的概念,博弈的分类,动态博弈与重复博弈,信息不对称,道德风险,逆向选择,信号传递。
重点:博弈论的基本思想,纳什均衡的概念,信息不对称。
难点:博弈的构成要素,纳什均衡的概念。
一、博弈的基本要素
1、博弈论与古典经济学的区别
古典经济学的基本思路:给定约束条件,考虑行为主体的最优结果。
博弈论的基本思路:以行为主体之间的相互影响为前提,考虑行为主体的最优结果。
两者的根本区别:是否考虑对方的行为。
古典经济学中消费者行为理论:假定收入、商品价格以及效用函数给定,求最优消费组合。消费者A不会考虑消费者B的影响。
古典经济学中的厂商理论:假定生产函数、成本函数、商品价格给定,求厂商的最优生产决策。厂商A不会考虑厂商B的影响。
古典经济学中的宏观经济理论:假定一国的资源禀赋给定,考虑价格指数、利率等因素的变化对国民收入、就业等的影响。国家A不会考虑国家B的影响。
博弈论:每个人要考虑别人的行为怎样影响自己的选择。
扑克牌游戏:一个人不可能只顾自己出牌,而不考虑别人怎么出牌。
下棋:无论中国象棋、国际象棋、围棋,一个人在走某一步之前,都要考虑对手是怎么走的,以及对手在我走了一步之后会怎么走,以及我又会在对手走了一步之后怎么走,以至无穷。
高手与俗手的区别也就在此。高手往往能够考虑10步甚至20步以后的变化。
总之:你的输赢不仅取决于你的决策,而且取决于你对手的决策。
2、博弈论简史
博弈论的思路在古诺(Cournot,Antoine Augustin,1801-1977)的双头垄断模型中最早提出,冯•诺伊曼(John von Neumann,1903-1957)和摩根斯坦恩(Oskar Margenstern, 1902-1977)在1944年出版了《博弈论与经济行为》(Theory of Games and Economic Behavior)一书,最早提出了博弈论的概念。
现代博弈论则是由纳什(Nash, John F.)(有一本《美丽心灵》的书,专门介绍纳什和普林斯顿的,后改编为电影)、海萨尼(Harsany, John C.)、泽尔腾(Selten, Reinhard)、夏普利(Sharpley, Lloyd S.)等人发展起来的,1994年的诺贝尔经济学奖就授予了前三位经济学家。
现在,博弈论已经成为现代经济学的基本分析工具之一,并且应用到了政治、经济、军事、社会、自然科学等各个领域。
3、博弈的要素
构建一个博弈,需要以下基本要素:
(1)局中人(参与者)(players):每局博弈至少有两个参与者。有时,要引入一个特殊的参与者,自然(nature)。比如,一个人猜硬币,可以看成是你在和自然或上帝博弈。
(2)行动集(action set):规定每个参与者可以采取的行动的集合。比如,猜硬币博弈,一个人有两个行动可供选择:正面,反面。如果是两个硬币,则行动集中的行动增加一倍:(正面,正面),(正面,反面),(反面,正面),(反面,反面)。
(3)时序(playing sequence):游戏规则中规定的每个参与者决策的先后次序。一般来说,在静态博弈中,局中人同时行动;在动态博弈中,局中人有行动的次序。
(4)策略(strategies):策略是局中人在一局博弈中的一套完整的行动计划。策略与行动不同,策略包括信息。比如囚徒困境,每个局中人的行动只有两种:坦白,抵赖。但策略就包括:(坦白,抵赖)、(抵赖,抵赖)、(抵赖,坦白)、(坦白,坦白)四种。尽管最后的均衡是(坦白,坦白),但策略有四种。
策略告诉局中人,在每一种可预见的情况下选择什么行动。
(5)报酬(支付、收益)(payoffs):局中人在不同情况下所得到的效用。
(6)信息(information):局中人决策所依据的信息。
信息分为完全信息和不完全信息。
在完全信息中,局中人在决策时知道在此之前的全部信息,并且局中人A知道局中人B知道全部信息,并且局中人A知道局中人B知道局中人A知道全部信息,如此以至无穷。比如下棋。
在不完全信息中,局中人不知道与博弈有关的全部信息。比如猜“石头——剪刀——布”的游戏。
(7)结果(outcome):结果是博弈分析者所感兴趣的所有东西,或者说,博弈分析者(建模者)从行动、支付和其他变量中所挑选出来的他感兴趣的要素的组合。比如,均衡战略组合,均衡行动组合,均衡支付组合等。
(8)均衡(equilibria):均衡是所有局中人选取的最佳策略所组成的策略组合。
在上述要素中,局中人、行动集、时序、策略、报酬和信息规定了一局博弈的游戏规则。
下面以囚徒困境为例,分析以上各个要素。
囚徒乙
坦白 抵赖
坦白 囚徒甲
抵赖
在囚徒困境中,
局中人:囚徒A 和囚徒B ;
行动集:每个囚徒的行动集是一样的,都是(坦白,抵赖)。
时序:同时。
策略:每个囚徒的策略集也是一样的,都是(坦白,抵赖)、(抵赖,抵赖)、
(抵赖,坦白)、(坦白,坦白)。
报酬:(坦白,抵赖)=(0,-10)
(抵赖,抵赖)=(-1,-1)
(抵赖,坦白)=(-10,0)
(坦白,坦白)=(-6,-6)
信息:每个囚徒都知道上述报酬,并且也知道对方知道上述报酬。但每个囚徒在决策时不知道对方是怎么决策的。因为他们是同时决策的。而且只博弈一次。
结果:有四种可能的结果。
结果1:囚徒A 想,囚徒B 可能会选择抵赖,因为这是对双方来说最好的结果。囚徒A 是个无赖,他乘人之危,不顾同伙的命运,选择了坦白,这样,得到的结果是(坦白,抵赖)。
结果2:结果1中的囚徒B 和囚徒A 刚好倒过来,则得到的结果是(抵赖,坦白)。 结果3:囚徒A 想,囚徒B 可能会选择抵赖,因为这是对双方来说最好的结果。囚徒A 是个照顾朋友的人,他也选择抵赖,这样,得到的结果是(抵赖,抵赖)。
结果4:囚徒A 和B 互相不信任,则结果是(坦白,坦白)。
均衡:(坦白,坦白)。
4、更多的博弈例子
在上学期的教学中,介绍了“囚徒困境”博弈。现在再介绍几个著名的博弈。
(1)性别战(battle of the sexes )
设有一对恋人,男的喜欢看足球,女的喜欢看芭蕾,但两人更愿意在一起。
女
足球 芭蕾
足球 男
芭蕾 在这个博弈中,有两个均衡(足球,足