博弈论第四讲
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实例
❖ 因为无论对方紧邻自己左边还是右边,自己始 终可以得到1/2的游客,其他的位置皆不可能 得到这么多游客。于是,两个小贩就紧挨着摊 位都摆在了沙滩的中点上
❖ 这个“长滩卖水”的博弈,还可以用于政治选 举中拉票活动的分析,也可以用于解释为什么 卖同类物品的商家都紧挨着布局。不过,我们 引用这个例子是为了说明纳什均衡—本章的主 题:在什么样的策略组合下,博弈的双方可以 得到一个稳定的结果。就像那两个小贩得到稳 定的摊位布局一样。
❖图4-2: 麦琪的礼物 妻子
剪发
不剪
卖表 丈夫
不卖
00 12
21 00
4.1 最优反应与纳什均衡-- 4.1.2纳什均衡
❖4.1.2 纳什均衡
❖ 纳什均衡是这样一种状态,在该状态下每个参与 人所采取的策略都是对于其他参与人的策略的最 优反应。以二人博弈为例,纳什均衡就是一个策 略组合(甲的策略,乙的策略),甲的策略是对 乙的策略的最优反应,而乙的策略也是对甲的策 略的最优反应。譬如,在囚徒困境博弈中,我们 说(甲供认,乙供认)是一个纳什均衡,就因为 它满足纳什均衡定义所要求的特性—甲供认是对 乙供认的最优反应,而乙供认是对甲供认的最优 反应。
4.1 最优反应与纳什均衡
❖ 故事模 型……………………………………………
❖ “麦琪的礼物”博弈改编自欧·亨利的同名小说。 小说写的是这样一个故事:
❖ 一对经济拮据的夫妻,丈夫吉姆有一只爱不释手 的怀表,却没有表链;而妻子有一头美丽的长发, 却缺少一把玳瑁梳子。他俩感情深厚,生活的美 满知足。在圣诞前夕,俩人分别悄悄外出为对方 购买礼物。结果妻子剪卖自己的长发,为先生买 了条表链,好配他的怀表;而丈夫则卖了怀表, 为妻子买了一把梳子。
4.1 最优反应与纳什均衡-- 4.1.1最优反应
❖ 同理,我们也可找到妻子对丈夫的任意一个策 略的最优反应,给定丈夫卖表,妻子的最优反 应是不剪发;给定丈夫不卖表,妻子的最优反 应是剪发。为了标记妻子的最优反应,我们也 在相应的单元格中妻子的赢利数字下画一横线 (见图4-2)。
4.1 最优反应与纳什均衡-- 4.1.1最优反应
4.1 最优反应与纳什均衡
❖ 囚徒困境中存在优势策略纳什均衡(两个人都选 取优势策略),智猪博弈中有重复剔除劣势策略 纳什均衡(一人有优势,另一人没有)。但是, 在很多的博弈中,所有参与人都没有优势策略 (也就不可能有劣势策略)。比如下面这个被称 为“麦琪的礼物”的博弈,我们应如何来求解它 的博弈均衡呢?
我们用赢利表将博弈模型表示如下
❖ 把这个故事转化为博弈模型可以表示为: 图4-1麦琪的礼物
妻子
剪发
不卖
卖表 丈夫
不卖
00 12
21 00
4.1 最优反应与纳什均衡
❖ 观察这个博弈,表中的数字是这样设计出来的? ❖ 如果丈夫卖了表而妻子剪了发,则他们的礼物对
对方都没有价值,他们各自得到效用0;
❖ 如果丈夫不卖表而妻子不卖发,则他们都没有钱 买礼物给对方,仍各自得到效用0;
❖ 我爱你是因为你爱我,你爱我是因为我爱你。
❖
—佚名
Game Theory & Life
实例
在一个长度为1的沙滩上,均匀地分布着三三两 两的游客。每个游客将消费一瓶水。两个小贩前 来卖水。如果每个游客都只在靠自己最近的那个 小贩那里买水,那么两个小贩将如何布局他们的 摊位?在这样一个博弈中,两个小贩会发现,如 果自己摆在沙滩中点以左(或右)的任何位置都 是不好,因为对方可以通过摆在紧邻自己的右 (或左)2的游客消费者。只有自己 安置在沙滩的正中点,这才是最好的。
❖ 很容易地,我们会在图4-2中发现,(不卖,剪发) 和(卖表,不剪)都满足纳什均衡的条件,即丈 夫不卖表、妻子剪发和丈夫卖表、妻子不剪发, 这两种情况都是纳什均衡。
4.1 最优反应与纳什均衡-- 4.1.2纳什均衡
❖我们用画线标记出每个人对其他各个策略的最优 反应,然后寻找全部数字都有下划线的单元格来 寻找纳什均衡的方法,叫画线求解法。对于策略
4.1 最优反应与纳什均衡-- 4.1.2纳什均衡
❖换言之,在纳什均衡状态下,所有参与人都已选 取其最优反应。既然如此,我们就可以通过判断 一个策略组合中的策略是否满足成为彼此的最优 反应来确认它是否是纳什均衡。在图4-2中,我们 用画线标记出了丈夫和妻子对彼此各个策略的最 优反应,显然,如果可以找到某个单元格中两个 人的赢利数字下皆画了横线,那么就代表该组合 中的策略彼此是最优反应,该策略组合就是我们 要寻找的纳什均衡。
第四讲最优反应、纳什均衡与其他几个经典案例 1.最优反应与纳什均衡
2. 电视频道的性别战 3. 懦夫博弈 4. 协调博弈 5. 多重均衡中最可能的结果 6. 没有单纯策略均衡的结果 7. 小结
Game Theory & Life
❖ 我尊重你是因为你尊重我,你尊重我是因为我 尊重你;
❖ 我喜欢你是因为你喜欢我,你喜欢我是因为我 喜欢你;
4.1 最优反应与纳什均衡-- 4.1.1最优反应
❖4.1.1 最优反应 ❖ 我们先要介绍最优反应。最优反应是指,给定
对手选定一个策略,则我选择某个策略比选择 其他策略都要好,那么选择这“某个策略”就 是我对于对手选定策略的最优反应。譬如在图 4-1的博弈中,给定妻子剪发,丈夫的最优反应 是不卖表(因为卖表只得到0,不卖表却得到 1),为了标记出丈夫的最优反应,我们就在 (不卖,剪发)所对应的单元格中丈夫的赢利 数字“1”下面画一条横线(如图4-2所示); 给定妻子不剪发,则丈夫的最优反应是卖表, 同样,为了标记丈夫的最优反应我们在(卖表, 不剪)所对应的单元格中丈夫的赢利数字“2” 下面画一横线。
❖ 如果丈夫卖表而妻子不剪发,或者丈夫不卖表而 妻子剪发,则他们中有一方可买礼物送给对方, 因为他们如此相爱,送礼方可得到2个单位效用, 受礼方可得到1个单位效用。
4.1 最优反应与纳什均衡
❖ 这个博弈的稳定结果(或者说均衡)是什么呢? ❖ 我们再也无法寻找到他们的优势策略,因此需要
创造出一些新的寻找稳定结果的方法。可喜的是, 我们确有这样的方法,那就是根据纳什均衡的定 义来求。