30博弈论-第六章

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第六章贝叶斯博弈

在这一章主要内容有：

一、豪尔绍尼转换，

二、贝叶斯博弈及贝叶斯纳什均衡，

最后为显示原理。

其中贝叶斯纳什均衡的概念是需要掌握的核心概念。

第一节豪尔绍尼转换

豪尔绍尼转换的想法非常简单，并不复杂，其实质就是将非完全信息造成的不确定性通过概率的方式来加以处理。为了较为形象的理解豪尔绍尼转换，我们还是通过案例加以说明。

例6.1 贝叶斯信用困境

商人2（良商）商人2（奸商）

H C H C

H 2，2 0，‐1H 2，2 0，3

商人1

C ‐1，0 1，1 C ‐1，0 1，1

图6-1 贝叶斯信用困境

在贝叶斯信用困境这个博弈中，相当于存在着两个博弈。如果商人1

相信商人2是一个讲诚信的人，他们的纳什均衡为(H, H)和(C, C)。如果商人1相信商人2是一个奸商，那么纳什均衡为(C, C)，但到底哪一个策略组合是整个博弈的纳什均衡显然无法回答。原因在于商人1对商人2不同的信念(Belief)导致了即使是相同的策略，也会出现不同的收益，即在相同的策略组合下，收益具有不确定性。例如(H, C)这个策略组合，对参与者而言就有不同的收益，在商人2诚信的情况下，收益为(0, -1)；在商人2为奸商的情况下，收益则为(0, 3)。收益具有不确定性是所有非完全信息博弈与完全信息博弈相比最重要的差异，非完全信息也正是根据这一点来定义的。其次，图6-2实际上清楚地表明了贝叶斯信用困境所面临的困难，该博弈有两个开始点，在商人1行动的时候，商人1分不清他到底处于那种情况，是处于（商人2）诚信，还是处于（商人2）欺骗。由于该博弈有两个开始点，可以理解

为两个不同的博弈，但关键是，这两个博弈被一条虚线连接了起来，因而它又是一个博弈。两个开始点还意味着我们从博弈的结束点往回推，我们不知道会回到哪一个开始点。这意味着如果参与者要达到某个结束点，那么不知道采取什么样的策略才能达到这个结束点，也就是说没有人能保证一定走到这个结束点，因而均衡会不会出现只有上帝才知道了，当然最优策略也就无从谈起。

奸商2

良商2

图6-2 贝叶斯信用困境

最后，在石头、剪刀、布的博弈（完全信息博弈）中，混合策略形成

的纳什均衡实际上也包含着一点点的收益不确定性，这似乎意味着在非完全信息博弈和完全信息博弈之间（均衡概念上）存在着某种联系。这种联系就是期望值。

要知道期望值首先得知道概率分布。在贝叶斯信用困境中，把商人2是什么样的人看作一种概率分布，显然是一个非常妙的想法，它既克服了贝叶斯博弈中存在的矛盾，又能利用v-N-M偏好理论来分析参与者的偏好（期望值），从而最优策略，乃至纳什均衡都有了意义。最早把这一想法变成规范性的学术语言是由经济学家豪尔绍尼在1967完成的，被称为豪尔绍尼转换。也正因为这个贡献，豪尔绍尼与纳什和塞尔腾(Selten)分享了1994的诺贝尔经济学奖。

定义6.1豪尔绍尼转换——不同状态的出现服从一定的概率分布，并且这个概率分布是公共信息。

通过转换，图6-2可以重新转换为图6-3。

Nature

‐1 0

2 2 1

1 ‐10

0 2 0

2 ‐1 1

图6-3 转换后的贝叶斯信用困境

所有可能策略组合下商人1的期望值就列在了图6-4中。

其中(H，H)表示商人2为良商选择H，为奸商时选择H，其他类推。

商人 2

商人2 (H, H) (H, C) (C, H) (C, C)

商人1

H 2 1 1 0 C ‐1 0 0 1

图6-4 贝叶斯信用困境中商人1的期望值

这里我们可以看到，对于商人1而言，其策略为H和C，而对于商人2而言，其策略则为4个：(H, H)，(H, C)，(C, H)和(C, C)。读者可能会问，商人2不是知道自己是什么样的人吗？为什么商人2的策略不是H或C，却是(H, H)，(H, C)，(C, H)和(C, C)呢？我们可以从三个方面来理解这点：一是在博弈开始之前，商人2也不知道到底会出现什么状态，即不知道自己是否是诚信还是欺诈，所以他必须事先有所计划，规定好在什么样的状态下选择什么样的行动。例如商人2以为自己是奸商，但结果发现自己是良商，如果策略只是C，那么商人2将不知道在状态为良商的情况下如何行动。二是商人1到市场上交易，

那么有可能遇到良商，也可能遇到奸商，其概率各为1/2。给定商人1选择H，那么良商和奸商的策略显然不同，而(H, C)就表示良商选择H，而奸商选择C。三是虽然商人2知道自己是什么样的人，但商人1并不知道，因而商人2不得不把自己想象成商人1，以便获得有关商人1的信念的一种正确猜测，以便选择最优行动。因而，商人2的策略必然由H和C所组成。

例6.2 罗密欧与朱丽叶

罗密欧和朱丽叶相约去听音乐会，罗密欧向朱丽叶提出邀请，但罗密欧不知道朱丽叶是否喜欢自己。如果喜欢，那么两人一起听音乐一定要好过彼此分开；相反，如果不喜欢，那么朱丽叶就会主动回避，以免一起听音乐会遭遇尴尬。对于朱丽叶而言，也可能遇到相同的情况，如果罗密欧喜欢她，那么两人一起听音乐会要好过彼此分开；相

反，如果不喜欢，那么罗密欧就会主动回避，以免尴尬。而因，该博弈就可能会出现4种状态：xx，xb，bx和bb。x代表喜欢，b代表不喜欢。例如，xb表示罗密欧喜欢朱丽叶，但朱丽叶不喜欢他。

图6‐5 罗密欧与朱丽叶

第二节贝叶斯博弈与纳什均衡

一、贝叶斯博弈

要给出贝叶斯博弈的表达式需引进若干新的概念。

所谓状态就是对参与者特性集合的一个完整描述，包含着参与者的偏好和相关信息。不同的状态意味着不同的特性集合，所有可能的状态就构成了状态集合。我们用z 来表示某个状态，Z ={z 1, z 2, …}就表示状态集合。

在博弈开始时某个状态成为现实，但（有些）参与者并不能直接观察到状态（否则就是完全信息了），而是观察到某种信号，这个信号可能反映出有关状态的某些信息。我们用()i z τ来表示参与者i 在状态z 发生时观察到的信号，函数i τ就称为参与者i 的信号函数。显然，如果对于每一个参与者而言，任意z y ≠意味着()i ()i z y ττ≠，那么就不存在不