效用函数与纳什均衡
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
效用函数与纳什均衡李保明
(山东大学产权研究所,济南,250100)
刘家壮
(山东大学数学与系统科学院,济南,250100)
摘 要 本文引入效用函数将博弈问题描述为收入形式和效用形式两种模型,使得纳什均衡与参与人效用函数联系起来,并得到结论:(1)效用函数的变化对纯策略纳什均衡不产生影响,却改变真混合策略纳什均衡;(2)效用函数严格拟凹时,真混合策略纳什均衡是稳定的;(3)效用函数严格拟凸时,真混合策略纳什均衡不存在.
关键词 效用函数,博弈论,纳什均衡
1.引言
近二十年来,博弈论在经济学领域产生重大影响,并有从根本方法上改写经济学的趋势.博弈论在经济分析中的广泛适应性是因为它更好地描述了经济问题,并为决策者提供了一套可丢行的决策方法.其中的关键概念纳什均衡为相互影响的决策者提供了博弈可能结果的一致性预测,也是理性决策者最优决策的结果,从而为决策者指明了决策方向.但是博弈论本身的缺陷阻碍了经济理论的发展,其中之一就是纳什均衡的多重性,由纳什均衡不唯一性导致经济(或博弈)问题的一致性预测结果很多,决策者仍然面临不确定性问题.如何在众多的纳什均衡中选择更为合理的一个?目前仍然博弈论中的理论难点.泽尔腾的子博弈完美纳什均衡和颤抖的手完美均衡以及梅耶森的适度均衡都是精炼纳什均衡所作的努力.但是仍不能得到满意结果(即唯一的均衡),考尔伯格和默顿提出稳定均衡的概念(Stable equilibria ),并说明没有单一的策略组合能满足所有要求,因此均衡解应是某些策略组合的集合而不是单一的策略组合,这似乎给均衡精炼下了一个“不能达到唯的”结论,然而这对博弈论在经济学上的应用和解决经济问题产生巨大障碍.海萨尼、泽而滕(Harsanyi ,Selten ,1988)提出纳什均衡选择的收入占优和风险占优分析方法,但它引起许多争议,并与Cooper ,Dejong ,Forsythe ,和Ross (1990)等人的实验结果不相符.尽管如此,参与人的决策总是选择一个策略,而不是多个策略,在下面的讨论中,我们引入效用函数描述参与人的这种选择.
在所有的博弈描述中,它都是由参与人、参与人策略和各种策略组合下的结果(参与人支付)所组成.根据博弈问题的不同,它还有不同的信息结构.对于完全信息的博弈,上述三要素是参与人的共同知晓的共同知识(Common knowledge ).但是,应该看到在博弈论描述的经济问题中,决策者(或称参与人)是根据其效用选择其策略的,参与人知道自己的效用函数却不能保证他知道其他参与人的效用函数,也就是说实际决策所需的效用函数不是参与人共知的共同知识;那么,作为共同知识的支付只能是各种策略组合下参与人的收入.在纳什(Nash ,
第17卷第4期2000年12月 经 济 数 学MA THEMA TICS IN ECONOMICS Vo1117 No.4Dec.2000
收稿日期:2000-05-23
1950)定义中,他没有明确指明支付是收入还是效用,然而在讨论问题时又把它们混在一起.在后面的讨论中,我们可以看到两者的区分是很有意义的.现有的博弈结构没有完全揭示经济问题,还有描述参与人特征(比如对风险的态度等)的效用函数没有表达出来.这一问题导致了博弈论的重大缺陷即纳什均衡选择方面的困难.本文首先将效用函数引入博弈结构得到博弈问题新的描述形式,进而讨论不同效用函数导致纳什均衡的不同性质,尤其是混合策略纳什均衡的特征.2.博弈问题的新描述
描述经济问题的博弈论模型由参与人、策略和支付三要素组成,与原有的博弈论模型不同的是,我们根据支付是参与人的收入还是效用将博弈论描述分为博弈问题的收入形式模型和效用形式模型,收入形式模型是描述经济问题的中间模型,最终描述形式应是效用形式模型.
211 博弈问题收入形式模型
这种形式的博弈论模型和以前的描述没有区别,但为以后讨论问题方便,我们有必要严格表述一遍.
收入形式博弈模型由参与人、策略和收入组成,我们考虑有限博弈问题,它由以下因素组成:
(一)参与人集合N ={1,2,…,n},每一个参与人i ∈N 是博弈问题中的决策主体,其目的是其收入或期望收入最大化.
(二)参与人策略和策略组合,参与人i 的纯策略集合记为S i ={s 1i ,…,s k i i },所有参与人
的纯策略组成纯策略组合s =(s j i 1,…,s j n n ),其中j i =1,…,k i ,或简记为s ={s 1,…,s n },策略
组合的全体为S =Πn
i =1
S i .关于混合策略,参与人i 的混合策略是S i ={s 1i ,…,s k i i }上的概率分布即k i 维向量σi =(p 1i ,…,p k i 1),其中
p j i i Ε0,∑k i j i =1p j i i =1,其全体为M i ={(p 1i ,…,p k i i )|
∑k i j i =1p j i i =1},混合策略组合是由它们组成的m (m =k 1+k 2+…+k n )维向量σ=(σ1,
…σn ),其全体为M ={(σ1,…,σn })|σi ∈M i ,i ∈N }=Πn i =1
M i .当σi 的概率集中到一个纯策略s i 时,则它称为非真混合策略(improper mixed strategy )或称纯策略,记为σi =s i .否则,称为真混合策略(proper mixed strategy ).在混合策略中取概率为正的所有纯策略全体称为σi 的载体(carrier ),记为C (σi );若C (σi )=S i ,即在每一个纯策略的概率为正,则称σi 为完全混合策略(completely mixed strategy ).若所有的σi (i ∈N )均为纯策略,则它称为纯策略组合,并记为σ=s ;否则σ称为真混合策略组合(proper mixed 2strategy profile ).
(三)收入(Payoff ),参与人i 的收入不仅取决于自己的策略而且与其他参与人的策略有
关,它是策略组合的函数:对于纯策略组合s =(s j 11,…,s j n n ),其中j i =1,…,k i ,a i (s )=
a i (s j 11,…,s j 22,…,s j n n )是确定的实数,所有参与人的收入记为A =(a i (s ))s ∈S ,i ∈N ,并称为收
入矩阵.对于混合策略σ=(σ1,σ2,…,σn ),a i (σ)=a i (σ1,σ2,…,σn )是在{a i (s )|s ∈S }上
取值的随机变量,其数学期望为
Ea i (σ
)=∑k 1j 1=1∑k 2j 2=1…∑k n
j n =1a i (s j 11,s j 22,…,s j n n )p j 11p j 22…p j n
n 对于完全信息的博弈问题,上述三项均为共同知识,记为G =(N ,(S i )i ∈N ,(a i )i ∈N ),
—22— 经济数学 第17卷