不完全信息动态博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例
所罗门判子
所罗门王是古代以色列国的一位以智慧著称的 君主。一次,两个妇人为争夺一个婴儿争扯到所罗 门王殿前,她们都说婴儿是自己的,请所罗门王作 主。所罗门王稍加思考后作出决定:将婴儿一刀劈 为两段,两位妇人各得一半。这时,其中一位妇人 立即要求所罗门王将婴儿判给对方,并说婴儿不是 自己的,应完整归还给另一位妇人,千万别将婴儿 劈成两半。听罢这位妇人的求诉,所罗门王立即作 出最终裁决 —— 婴儿是这位请求不杀婴儿的妇人的, 应归于她。
但是,这种“打斗”行为尽管可以击退进入者,但由于 一段时间的降价经营可能对垄断者带来较大损失。垄断者为 了避免这种损失,可以向外宣布它是低成本的,别的厂商休 想进来与它竞争。但仅凭口头宣布人家是不会相信的,因为 即使垄断者不是低成本的厂商,它也会如此宣布。
一种方法就是,垄断者向外发送一个信号,向外界传 递它真是低成本的信息。它可以长期在一个较低价格水平上 经营。如果它的价格足够低,高成本厂商不敢模仿,行内厂 商会据此判定它确是低成本的。同时,它的价格也不能太低, 以致于较之与进入者进行降价竞争,其损失为小一些。这样, 垄断者才会采取如此策略。潜在的高成本进入者不敢进入, 垄断者得以保持长期的垄断地位。
而企业 B 开始可以蒙骗一部分消费者,但时间 一长,产品的问题会暴露出来,市场会不断缩小, 收入及未来利润都不会有企业 A 的大。这样一来, 企业A的未来预期收入远大于企业B。因此,如果企 业 A 请一位当红明星打广告,由于是当红明星,他 们打广告有很高的市场价格,就可以使企业 B 不敢 模仿。譬如,假定企业A的预期收入为3千万元,企 业B的预期收入为1千万元。当红明星打广告的市场 价格为2千万元,那么,企业A可以请明星打广告但 企业B就请不起。
P ah k P k
h j K j j 1
假如观测到了 a h ,则属于 k 类型的概率,即后验概 率
P k 0 是先验概率, k 是类型, a h 是一特定行动。问题是
P k ah
。
例 对人的判断
把所有的人划分为好人GP和坏人BP两类,所有的事 划分为好事GT和坏事BT两类。那么一个人干好事的概 率是多少?
例为什么许多实力雄厚的公司还要向银行借很 多钱?
在国外,一些资金实力雄厚的公司通常也会向 银行贷款。更加令人感到奇怪的是,一些好的公司, 一方面自己借钱给别的公司,同时,另一方面又向 银行借钱。博弈论运用“信号传递”原理可以对此 现象作出解释。
对于一家公司来说,负债增加会增大公司破产 的可能性;但是,对于实力雄厚的公司,在同样负 债比例下,其破产可能性要小一些。每个公司都会 向社会吹嘘自己是好的公司,实力雄厚,但公众不 会仅凭口头宣传就相信的。于是,真正好的公司通 过向银行借钱来增大自己破产的可能性,令其它实 际上不好的公司难以模仿。这种负债比例的增加要 做到恰到好处,它既可令其它实力稍弱的公司难以 模仿,又使自己能够承受。
假设有一家企业(记为企业 A )开发出一种很有市场潜 力的饮料,该产品饮后对人的健康确实有好处。但同时,另 一家生产假冒伪劣产品的企业(记为企业B)也准备向市场推 出一种伪劣产品饮料。两个企业都会向公众宣布其产品是上 乘的,如何如何的好。但公众是理性的,不会仅凭商业宣传 就相信它们。但是,如果产品真的好,随着时间的推移,消 费者能够识别出来。所以,生产好饮料的的企业 A对自己的 市场有信心,它相信随着时间的推移,企业 B 生产的伪劣产 品终究会被消费者识破,顾客会跑到自己这里来,从而自己 的市场会不断扩大,销售收入及利润会不断增长。
在不完全信息动态博弈一开始,某一参与人根据 其他参与人的不同类型及其所属类型的概率分布,建 立自己的初步判断。当博弈开始后,该参与人就可以 根据他所观察到的其他参与人的实际行动,来修正自 己的初步判断。并根据这种不断变化的判断,选择自 己的策略。
古玩市场 黔驴技穷
信号传递
1967年,海萨尼提出了“海萨尼转换”来处理不完全信息 的博弈。 基本思路是:引入一个虚拟的参与人——“自然”,“自然” 首先行动选定参与人的某种类型,各参与人知道自己的类型, 但其他参与人不知道。不过,“自然”以怎样的概率来选择 各参与人的类型,此概率分布却是共同知识。 以对参与人类型的概率的分析代替对参与人确切行动的分析, 这样的转换就是“海萨尼转换”。
(0,0)
(0,2)
(0,1)
精炼贝叶斯纳什均衡是 :﹛L,U;p=1﹜
假定参与人2认为参与人1选择L和M的概率分别为p和(1p)。给定这个信念,参与人2选择U的期望效用是p×1+(1-
p) ×2=2-p,选择D的期望效用是p×0+(1-p) ×1=1-p.不论
p为何值,参与人2一定选择U。给定参与人1知道参与人2将 选择U,参与人1的最优选择是L。给定L是参与人1的最优战 略,当参与人2观察到参与人1没有选择R时,他知道参与人 1一定选择了L,即p=1。
海萨尼转换后的市场进入博弈
在不完全信息开始之前,“自然”首先行动,选择各参与人 的类型。各参与人除了知道自己的类型以外,对“自然”的 行动都有着一致的信念,称之为先验信念。之后,参与人先 后行动,后行动者能观察到先行动者的行动,但观察不到先 行动者的类型。但是,因为参与人的行动是依赖于其类型的, 每个参与人的行动都传递着有关自己类型的某种信息,后行 动者可以通过观察先行动者的行动来修正对其各种类型判断 的先验信念(概率分布),然后选择自己的最优行动。先行 动者预测到自己的行动将被后行动者所利用,也就会设法传 递对自己有利的信息,避免传递对自己不利的信息。因此, 不完全信息动态博弈不仅是参与人选择行动的过程,更是参 与人不断修正信念的过程。
因此,这个博弈的唯一的精炼贝叶斯纳什均衡是﹛L,U;p=1﹜
第一,在每一个信息集上,决策者必须有一 个定义在属于该信息集的所有决策结上的一个概 率分布(信念);第二,给定该信息集上的概率 分布和其他参与人的后续策略,参与人在该信息 集处的行动必须是最优的(后续策略指的是从给 定信息集开始的后续博弈上的行动规则);第三, 每个参与人根据均衡策略和贝叶斯法则做出判断 和修正,得到后验概率。
为什么有的商品广告既无商品的价格信息又无 售货地点信息,只有明星的表演?
通常认为,商业广告的功能是向消费者提供必要的购货 信息,如散布商品的价格,质量功能,出售地点等信息。再 者,人们还认为有些广告可能是为了引导消费,特别是新产 品出现时,消费者还不知道、不熟悉它,商业广告中通过一 些电影明星使用新产品的图象,利用公众的“追星”心理打 造市场。这种关于新产品市场引导的广告在国外的电视广告 中特别常见,通常是一位当红明星在电视上用新产品表演一 番,既无价格,也无售货地点的介绍,除了显示一下商标外, 完全没有对产品性能的说明。不过,对于这类广告,博弈论 还有一种“信号传递”的解释呢。
例
黔之驴
黔无驴,有好事者船载以入。至则无可用,放之山下。 虎见之,庞然大物也,以为神。蔽林间窥之,稍出近之,憖 憖然莫相知。
他日,驴一鸣,虎大骇,远遁,以为且噬已也,甚恐。 然往来视之,觉无异能者,益习其声,又近出前后,终不敢 搏。稍近,益狎,荡倚冲冒,驴不胜怒,蹄之。虎因喜,计 之曰:“技止此耳!”因跳踉大㘎,断其喉,尽其肉,乃去。
消费者也明白这个道理,从而会在一开始就识别出不能 请当红明星打广告的企业B是生产伪劣产品的。这样,企业B 一开始就没有市场。当企业A请了当红明星打广告时,企业B 发现这位明星的市场价格太高,自己难以模仿企业 A,开始 就会放弃生产伪劣产品的计划。所以,企业 A 通过请当红明 星打广告而清除掉了潜在的市场模仿者,它向公众传递自己 是生产好产品的信号,这种信号的价值在于其所请来的当红 明星有着较高的出场价格,而不在乎明星在广告节目中说了 什么,表演了什么,当然更无所谓广告节目是否介绍产品价 格等信息了。企业A 请当红明星打广告就为公众传递了它是 生产好产品的企业的一个信号。
满足上述要求的博弈均衡就称为“精炼贝叶斯均 衡”。
信号传递博弈是一类比较简单但有广泛应用意义的不完全信 息动态博弈,许多博弈问题都可以归结为此类型的博弈。如 市场进入与遏制、委托-代理关系、拍卖机制的设计等。 在信号传递博弈中有两个参与人,先后各行动一次;参与人 1有多个类型,先行动;参与人2后行动,他不知道参与人1 的具体类型,但可以观察到先行动一方的行动并从中获得部 分信息。先行动的一方行动对后行动者来说好像是某种反映 其类型信息的信号,因此该博弈被称为“信号传递博弈”。 一般称先行动的参与人1为信号发送者,记为S;后行动的参 与人2称为信号接收者,记为R。
通过海萨尼转换,博弈开始时,所有参与人有关“自然”的 行动有一致的信念,即都知道所有人类型的概率分布,此即 “海萨尼公理”。
N
●
P
●
1-P
●
进入者 进
●
进入者 进
●
不进
●
不进
●
(0,300)
●
合作
在位者 (0,400) 打击
●
在位者 打击
●
wenku.baidu.com
合作
●
(40,50)
(-10,0) (30,80) (-10,100)
如果观测到一个人干了件好事,那么这个人是好人的 后验概率是多少?
更具体点,假定认为这个人是好人的先验概率为1/2, 那么在观测到他干了好事之后,如何修正先验概率依 赖于我们认为这件好事好到什么程度。 第一种情况,这是一件非常好的好事,好人一定干, 坏人绝不可能干。
第二种情况,这是一件非常一般的好事,好人会干,坏人 也会干 第三种情况,好人肯定会干,坏人可能干也可能不干 可以看到,我们如何改变对一个人的看法不仅依赖于我们 认为他是好人或坏人的先验概率,而且依赖于我们如何“认为” 好人干好事和坏人干好事的条件概率。不能任意地“认为”。 当认为坏人干好事的概率为 PGT / BP 时,那么,在给定信息 情况下,如果这个人确实是坏人,则 PGT / BP 是他的最优选 择。这对于理解精炼贝叶斯纳什均衡是非常重要的。
例 垄断厂商的低价销售:信号传递博弈
有许多垄断厂商并未如人们所料想的那 样给商品定出一个很高的价格,而是以较低 的价格长期销售某种产品。譬如,发达国家 的私营铁路、航空、海运码头等的价格都远 低于按照其垄断定价方法定出的价格。这是 什么原因呢?
现在,我们用这个“信号传递博弈”的原理,来解释 为何一些垄断厂商长期在低价格水平上经营。如果这个垄断 厂商是一个低生产成本的厂商,当其它较高生产成本厂商也 进入这个厂商所经营的行业与之进行竞争时,原先的那个垄 断厂商可以通过降价将进入者赶出这个行业,从而继续维持 垄断经营。 由于垄断厂商有更低的生产成本,所以,它能够将产 品价格降到比进入厂商的生产成本还要低的水平上,这就造 成进入者或者高价格经营导致顾客流失,或者同样也降价但 价格低于成本,两种情形进入者都会亏损,最后不得不退出 行业。
例 二手车市场
认为车子是好的先验概率为 P 验概率为 P B
G ,认为车子是不好的先
。当卖(Sell)这个行动发生后,车子是
好的后验概率是多少?
贝叶斯法则不是一个技术性法则,而是人们修正信念的 唯一合理方法。
1
L
(p)
●
R
●
(1,3)
M
(1-P)
●
2
U
●
●
2
D
●
D
●
U
●
(2,1)
噫!形之庞也类有德,声之友也类有能,向不出其技, 虎虽猛,疑畏卒不敢取;今若是焉,悲夫!
贝叶斯法则
概率论中贝叶斯公式
PBi A
PA B PB
n j 1 j j
P A Bi PBi
, i 1,2,...n
贝叶斯法则
P k ah
Pa P
一、基本概念和举例 二、海萨尼转换 三、贝叶斯法则 四、精炼贝叶斯纳什均衡 五、信号传递博弈 六、不完全信息动态博弈应用案例分析
在动态博弈中,行动有先后次序;在不完全信 息条件下,博弈的每一参与人知道其他参与人的有 哪几种类型以及各种类型出现的概率,即知道“自 然”参与人的不同类型与相应选择之间的关系,但 是,参与人并不知道其他的参与人具体属于哪一种 类型。由于行动有先后顺序,后行动者可以通过观 察先行动者的行为,获得有关先行动者的信息,从 而证实或修正自己对先行动者的行动。