博弈论第五讲

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对不完全信息动态博弈,子 博弈的概念不总是适用
贝 对先验概率 叶 斯 进行修正 纳 什 均 衡
精练Bayes均衡
动态不 完美信 息博弈
海萨尼 转换
不完全 信息静 态博弈
基本思路-不完全信息动态博弈

精练贝叶斯均衡是贝叶斯均衡、子博弈精练均 衡和贝叶斯概率推断法则的结合。它要求:
1、在每个信息集上,决策者必须有一个定义 在属于该信息集的所有决策结上的一个概率分 布(信念); 2、给定该信息集上的概率分布和其他参与人 的后续战略,参与人的行动必须是最优的; 3、每一个参与人根据贝叶斯法则和均衡战略 修正后验概率。
不完全信息动态博弈

“自然”首先行动,选择参与人的类型,参与人自 己知道,其他参与人不知道。--不完全信息 在“自然”选择之后,参与人开始行动,参与人的 行动有先有后,后行动者能观测到先行动者的行动, 但不能观测到其类型。--动态博弈 博弈过程不仅是参与人选择行动的过程,而且是参 与人不断修正信念的过程。

二 信号传递博弈及其应用举例
三 博弈论概念简要总结
不完全信息动态博弈引例
引例:古玩市场的讨价还价问题 特征:
(1)买卖双方对对方的得益(类型)都不完全清楚,信 息是不完全的;
(2)双方常常都要从“漫天要价,着地还价”开始,慢 慢地进行讨价还价,通过讨价还价过程不断获得更多关于对 方估价和成交得益的信息,修正自己的决策以争取更大的利 益,也就是说该过程是多阶段的,因此是动态的。 对这样类型的动态博弈,以前的博弈均衡概念是否还适用? 如果不适合,应如何重新定义新的均衡解、又如何求解?
基本思路-不完全信息动态博弈
完全信息动态博弈中引入了子博弈精练纳什均衡的 概念剔除那些包含不可置信威胁战略的纳什均衡,但是 在不完全信息动态博弈中,只有一个子博弈,不能将上 述方法直接用于求不完全信息动态博弈的均衡解,但可 以借用这一方法逻辑。 将从每个信息集开始的博弈的剩余部分称为一个 “后续博弈”,一个“合理”的均衡应该满足如下要求: 给定每一个参与人有关其他参与人类型的后验信念,参 与人的战略组合在每一个后续博弈上构成贝叶斯均衡。 剔除这种不合理行为的方式是:假定参与人(在所 有可能情况下)根据贝叶斯规则修正先验信念;并且, 每个参与人都假定其他参与人选择的是均衡战略。



修正之后的判断称为“后验概率”
贝叶斯法则就是人们根据新的信息从先验概率 得到后验概率的基本方法。
贝叶斯法则


以不完全信息博弈为例说明贝叶斯法则:假定 参与人的类型是独立分布的,参与人i有K个类 型,有H个可能的行动,θk和ah分别代表一个特 定的类型和一个特定的行动。 如果我们观察到i选择了ah,我们要问i属于θk的 后验概率是多少?



那么,如何定义这种“新均衡”呢?又如何求这种 “新均衡”?
不完全信息动态博弈

新均衡是:精练贝叶斯均衡。 精练贝叶斯均衡:是泽尔腾完全信息动态博弈子博弈精练纳 什均衡与海萨尼不完全信息静态博弈贝叶斯均衡、以及条件 概率推断法则(即贝叶斯法则)的结合。


这既点出了“新均衡”的定义思路又给出了求解“新均衡” 的方法论——条件概率推断的贝叶斯法则。
价格 在位者高成本时的利润 p=4 2 p=5 6 p=6 7
在位者低成本时的利润
进入者进入 在位者高成本时,均衡p=5 在位者低成本时,均衡p=4
6
在位者
9
进入者
8
3 5
1 -1
进入者只有一种类型:进 入成本为2,如果进入,生产 成本函数与高成本在位者成本 函数相同。
N
高 [μ] 在位者 低 [1-μ]
经贸学院 School of Economics & commerce
不完全信息动态博弈
作者:朱怀念
经贸学院
huainian258@163.com
第五章 不完全信息动态博弈精练贝叶斯纳什均衡


一 精练贝叶斯纳什均衡
基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡

在位者
p=4
t=2,如果进入者已进入,在位 者成本函数成为共同知识,若 在位者为高成本,每个企业利 润为3,扣除进入成本2,进入 者净利润为1。若在位者为低 成本,在位者利润是5,进入 者利润为1,扣除进入成本2, 在位者 其净利润为-1。 p=5 p=6
p=4
p=5
p=6
进入者
进入者 进入者 进入 不进入 进入 不进入 进入 进入者 不进入 进入 不进入 进入 不进入 进入 不进入 进入者 进入者



基本思路-市场进入博弈例子:



参与人:在位者,进入者; 背景:市场上只有一个垄断企业—在位者,一个潜在 进入者考虑是否进入;如果进入者进入,两个企业进 行库诺特博弈;否则,在位者获得垄断利润。 类型:在位者有两种类型:高成本或低成本,进入者 在博弈开始时只知道在位者高成本的概率是μ,低成本 概率是1-μ 。称为先验概率。进入者只有一种类型:进 入成本为2,如果进入,生产成本函数与高成本在位者 的成本函数相同。 t=1,在位者先决策:要决定该时期的价格p,假定只 有如下三种可能
价格 p=4 p=5 p=6


在位者高成本时的利润
在位者低成本时的利润
2
6
6
9
7
8
价格
p=4
p=5
p=6
在位者高成本时的利润
在位者低成本时的利润
2
6
6
9
7
8
基本思路-市场进入博弈例子

比如:无论在何种情况下,低成本的在位者不会选 择p=6(因为低成本在位者不希望进入者认为自己是 高成本),因此,如果进入者观察到在位者选择了 p=6,就可以推断在位者一定是高成本,选择进入 是有利可图的。预测到p=6会招致进入者进入,即 使是高成本的在位者也可能不会选择p=6,尽管p=6 是高成本在位者单阶段最优垄断价格。
价格 在位者高成本时的利润 p=4 2 p=5 6 p=6 7
在位者低成本时的利润
6
9
8
基本思路-市场进入博弈例子:

t=2,进入者决策:选择是否进入市场。如果进入者已 进入,在位者成本函数成为共同知识,若在位者为高 成本,两个企业成本函数相同,对称库诺特均衡产量 下,每个企业利润为3,扣除进入成本2,进入者净利 润为1。若在位者为低成本,两个企业成本函数不同, 非对称库诺特均衡产量下,在位者利润是5,进入者利 润为1,扣除进入成本2,进入者净利润为-1。
基本思路-市场进入博弈例子

t=2, 企业的行动选择是一个简单的静态博弈决策问题,但 在第一阶段,情况要复杂得多:
进入者是否进入依赖于它对在位者成本函数的判断:给定 在位者是高成本时,进入者进入的净利润是1,低成本时 进入者的净利润是-1,因此当且仅当进入者认为在位者是 高成本的概率大于1/2时,进入者才选择进入。 与静态博弈不同的是,在观测到在位者第一阶段的价格选 择后,进入者可以修正对在位者成本函数的先验概率μ, 因为在位者的价格可能包含其成本函数的信息。

问题的核心是在位者必须考虑价格选择的信息效应: 不同的价格如何影响进入者的后验概率从而影响进 入者的进入决策。
基本思路-市场进入博弈例子

一个非单阶段最优价格会减少现期利润,但如果它能 阻止进入者进入,从而使在位者在第二阶段得到的是 垄断利润而不是库诺特均衡利润,如果垄断利润与库 诺特均衡利润的差距足够大,如果在位者有足够的信 心,选择一个非单阶段最优价格可能是最优的。 在后面的分析中我们可以看到:在均衡情况下,在位 者究竟选择什么价格,不仅与成本函数有关,而且与 进入者的先验概率μ有关。而不管μ为多少,单阶段最 优垄断价格都不构成一个均衡。
基本思路图示
在不完全信息动态博弈中,由于信息不完全,故子博弈的概念不能精确细致 地描述动态博弈中的各个阶段,从而就不能剔除那些包含不可置信威胁的 Nash均衡。但是其推理逻辑可用,即“新均衡”不仅在整个博弈上构成Bayes 均衡,而且从每一个信息集开始的“后续博弈”上也构成Bayes均衡。但还不 能剔除“总是认为先验概率不变”这样的不合理行为。而实际上,参与人都 是依据他们的观测信息对自己的先验概率进行修正的-------这需要用精练Bayes 均衡。 给定别人的战略,自己的战略是最优的,即没人愿独自偏离 Nash均衡 在完全信息动态博弈中无法剔除不可置信威胁战略 子博弈精练Nash均衡 不仅是整个博弈的Nash均衡,而且是每个子博弈的 Nash均衡
Pr ob{ k a h } p(a h k ) p( k ) Pr ob{a }
h

p(a h k ) p( k ) p(a h j ) p( j )
j 1 K
贝叶斯法则

人:好人(GP),坏人(BP) 事:好事(GT),坏事(BP) 一个人干好事的概率等于他是好人的概率p(GP)乘以好人干 好事的概率p(GT|GP),加上他是坏人的概率p(BP)乘以坏人 干好事的概率p(GT|BP): Prob{GT}= p(GT|GP) × p(GP)+ p(GT|BP) × p(BP)
(2,0)
(2,0)
(6,0)
(6,0)
(7,0)
(7,0) (6,0)
(6,0) (9,0)
(9,0) (8,0)
(8,0)
第一阶段 第二阶段
(3,1) (7,0) (3,1)
(7,0)
(3,1)
(7,0) (5,-1)
(9,0) (5,-1)
(9,0) (5,-1)
(9,0)
Baidu Nhomakorabea
市场进入博弈-2阶段不完全信息动态博弈

基本思路-市场进入博弈例子




为了分析上述动态博弈的均衡结果,仅仅使用贝叶斯纳什 均衡是不够的。因为在静态贝叶斯均衡中,参与人的信念 是事前给定的,均衡概念没有规定参与人如何修正自己的 信念。但是,如果进入者可以任意修订自己有关在位者成 本函数的信念,上述不完全信息动态博弈可以有任意的贝 叶斯均衡: 比如说,假定μ=μ*<1/2,下列战略组合是一个贝叶斯均衡: 不论在位者选择什么价格,进入者总认为在位者是低成本 的概率为μ*<1/2,总是选择不进入;高成本在位者选择p=6, 低成本在位者选择p=5。 但显然这个均衡是不合理的,因为它包含了一个不可置信 的威胁:进入者不会修正对在位者成本函数的信念。 给定p=6不可能是低成本在位者的最优选择,如果在位者选 择了p=6,进入者为什么仍然认为在位者是高成本的概率小于 1/2呢?
不完全信息的表现之一

不完全信息是指博弈参与人有多种类型,参与人自 己知道,其他参与人不知道。参与人类型是由其支 付函数的结构来区分的。不同类型的参与人有不同 的支付函数。因此,其他参与人哪怕知道他的行动 但也不能确切知道他的收益。 但是,其他参与人也不是一无所知!他知道有 多少种类型,以及他分别属于这些类型的先验概率。 同时由于参与人是类型依存型的,每个参与人的行 动都传递有关自己类型的信息,后行动者可以通过 观察先行动者的行动来推断自己的最优行动。先行 动者预测到自己的行动被后行动者利用,就会设法 传递对自己最有利的信息。
成语故事:黔驴技穷


毛驴刚到贵州时,老虎见它是个庞然大物,不知有多大本事,感 到很“神奇”。给定这个“信念”,老虎躲在树林偷偷地瞧毛驴 就是一种最优选择。过了一阵子,老虎走出树林,逐渐接近毛驴, 想获得有关这个庞然大物的真实本领的信息。有一天,毛驴突然 大叫一声,老虎吓了一跳,急忙逃走,这也是最优选择,因为毛 驴的叫声是老虎意料之外的。又过了一些天,老虎又来观看,发 现毛驴并没有什么特别的本领,对毛驴的叫声也习以为常了,但 老虎仍不敢下手,因为它对毛驴的真实本领还没有完全了解。再 后来,老虎对毛驴挨得更近,往毛驴身上挤碰,故意冒犯它。毛 驴在忍无可忍的情况下,就用蹄子去踢老虎。这一踢向老虎传递 的信息是“毛驴不过这点本事而已”,所以老虎反倒高兴了。到 这时,老虎对毛驴已有了完全的了解,所以就扑过去把它吃了。 在这个例子中,老虎通过不断试探来修正对毛驴的看法,每一步 行动都是给定它的信念下最优的,毛驴也是如此。最终老虎将毛 驴吃掉。
目录导航


一 精练贝叶斯纳什均衡
基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡


二 信号传递博弈及其应用举例
三 博弈论概念简要总结
贝叶斯法则

在日常生活中,当面临不确定时,在任何一个 时点上,我们对某事件发生的可能性有一个判 断。然后,会根据新的信息来修正这个判断。 统计学上,修正之前的判断称为“先验概率”
相关文档
最新文档