博弈论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八章 博 弈 论

教学目的:明确博弈产生与发展的有关基本理论;各种博弈种类的比较。

教学要求:阐明博弈理论与传统微观经济学理论的关系。

教学重点:完全信息静态博弈;不完全信息动态博弈;不完全信息静态与动态博弈。

教学难点:纳什均衡;最大化最小化原理;不完全信息博弈。

第一节博弈问题概述

一、博弈论及其基本概念

博弈也叫作对策,译自英文的Game,字面意义可理解为游戏。博弈论“是关于策略相互作用的理论”,研究两个或两个以上参加者在对抗性或竞争性局势下如何采取行动,如何作出有利于己方的决策及其均衡问题。

在前面几章的分析中,除了寡头市场外,消费者和企业的最优决策是在简单环境下进行的,没有考虑各经济主体之间决策的相互影响。

而博弈论研究人与人之间相互“斗智”的形式和后果。

当人们的利益存在冲突时,每个人所获得的利益不仅取决于自己所采取的行动,也取决于其他人采取的行动或者对自己行动的反应,即某一经济主体的决策既受到其它经济主体决策的影响,而且该经济主体的相应决策又反过来影响到其它经济主体的决策。

博弈论描述在这种形势下各方理性地选择自己的行动所实现的结果,分析决策各决策主体的行为发生相互作用时的决策以及这种决策的均衡问题。

博弈论的基本概念包括:参与人、策略、支付。

(1)参与人(player)也称为局中人,是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体,局中人可以是自然人,也可以是各种社会组织,如:企业、政府、社团等等。

(2)策略(strategy)是指参与人选择行动的计划或规则,它规定参与人如何对其他人的行动作出反应,即在每种情况下应该如何行动,因而代表着参与者的相机行动方案。而行动是指参与人的决策变量。策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。

(3)信息(information)是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。(4)在博弈论中,可以用数值表示各局中人从博弈中各自获益多少或相应的效用水平,这个数值称为支付(payoff);支付函数是所有参与人策略或行动的函数,是每个参与人真正关心的东西。博弈均衡是所有参与人的最优策略或行动的组合。

二、博弈的类型

博弈可以根据合作性、局中人的数目、支付结构、博弈的时间结构、策略空间的性质和局中人的信息状况等进行分类。

1.根据博弈者选择的策略,博弈论主要分为两大类:合作博弈(cooperative games) 和非合作博弈(non-cooperative games)。

(1)如果在一个博弈中,局中人的意愿表示(协议、承诺或威胁)具有完全的约束力并可被强制执行,则该博弈被称为合作博弈;

(2)如果意愿表示不可被强制执行,即使博弈者之间可以进行博弈前的磋商和交流,该博弈也是非合作博弈。

2.根据支付结构的不同,博弈可以分为常和博弈(constant-sum game)与变和博弈(nonconstant-sum game)。(1)前者是指局中人的支付总和为一个常数。特别地,当这一常数为零时,该博弈称为零和博弈(zero-sum game)。任何一个常和博弈可以通过适当的变换而化为一个零和博弈。

(2)变和博弈指局中人的支付之和不为常数的博弈。

3.根据参与人行动的先后顺序,可以将博弈分成静态博弈(static game)与动态博弈(dynamic game)。

(1)静态博弈是指博弈中参与人同时选择行动;或者虽非同时行动,但后行动者并不知道先行动者采取了什么具体的行动;

(2)动态博弈是指参与人的行动有先后顺序,而且后行动者可以观察到先行动者的选择,并据此作出相应的选择。

4、根据参与人对其他参与人的了解程度,可以将博弈分成完全信息博弈(games of complete information)和不完全信息博弈(games of incomplete information)。

(1)完全信息博弈是指:每个参与人对所有其他参与人(对手)的特征、策略和支付函数都有精确了解的情况下所进行的博弈。

(2)如果了解得不够精确,或者不是对所有的参与人都有精确的了解,在这种情况下所进行的博弈就是不完全信息博弈。

三、最优策略与最大最小原理

设2人博弈的局中人分别为甲和乙,甲有m 种可选策略{x 1,x 2,x 3….x m },乙有n 种可选策略{y 1,y 2,y 3….y m },用f 和g 分别表示二者的收益函数,由于每个参与人的支付是博弈中所有参与人的策略的函数,记f ij =f (x i , y j ), g ij =g (x i , y j )。二者的支付矩阵分别为:

()n m ij ij f f ×= ()n m ij ij g g ×=

当f ij +g ij =Constant (常数)(i=1,2,3,…m, j=1,2,3,…n)时,该博弈为常和博弈,否则为非常和博弈。

该博弈的支付矩阵如下表8—1:第一行和第一烈分别表示参与人的不同行动策略,而其它的有序对表示参与人的支付,其中的第一项和第二项分别表示参与人甲和乙在他们的对应策略下可获得的支付或收益,局中人的目标是选择使自己收益最大化的策略。

表8-1 两人博弈的支付矩阵 y 1 y 2 ..…. y m

x 1 f 11, g 11

f 12,

g 12 ….. f 1n , , g 1n x 2 f 21, g 21 f 22, g 22 …… f 2n , , g 2n

….. …. ….. ….. ……

x m f m1, g m1 f m2, g m2 …… f mn ,

, g mn

下面来分析局中人如何决策。假定双方彼此了解对方的支付函数,如果甲通过某种方式知道乙采用策略y j ,甲必然会采取相应的某种策略以使自己的收益最大,即使下式成立:

}{mj j i ij f f f f ,,,max 21L =

即对应乙的这一策略,甲会在自己的行动集合中选择一个使自己收益最大的行动方案。

而当甲不知道乙会采取何种策略时,甲如何选择呢?由于不同选择带来的收益不同,有可能获得一个比较好的收益,但也可能获得一个比较差的收益,因而参与人选择时面临一定的风险,其风险态度对其决策有重要影响。如果甲是一个风险规避者,那么他将作最坏的打算,找出各种选择时可能出现的最坏的结果(支付最小),然后再在它们中间选择一个最好的结果。

首先,甲要从收益矩阵中找出自己的每一种策略下至少可以获得的收益(也即所能获得的最小收益),即先求解()m i f f f f in i i i ,,2,1},,,min{321L L =,然后从这些最小收益策略中选择出收益最大的策略,即从最小收益中选择最大收益。从支付矩阵来看这个决策过程,即甲首先选出自己支付矩阵的各行的最小收益,然后从最小值中再选出最大值:

ij n

j m i ij j i f f ≤≤≤≤=11min max min max 该方法的合理性表现为不管对方采取何种策略,甲至少可以获得这个最小值之中的最大值,因此称之为最小最大原理。

最大最小原理确保某种收益而不是最高的收益,因而是一种在最小利益中求最大利益的原则,可见这种策略相对比较“安全或保守”,参与者想确保他起码能够获得某种数量的收益,所以,参与人按照这种原则所确定的策略也叫做稳妥策略。

相关文档
最新文档