《博弈羊皮卷》之智猪博弈与激励制度
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
智猪博弈与激励制度
文:赵宁
在博弈论经济学中,有一个博弈叫“智猪博弈”,其内容是这样的:假设猪圈里有一头大猪、一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,大猪和小猪可选择的策略分别是行动和等待,你认为,大猪和小猪如何做,才能获得最大收益呢?
现在从博弈的角度来分析一下,先从大猪开始,若大猪选择行动,而小猪选择等待,那么大猪将获得6个单位的食物,同时要付出2个单位的成本,其收益为4个单位;若大猪选择行动,小猪也选择行动,那么大猪将获得7个单位的食物,同时要付出2个单位的成本,其收益为5个单位;若大猪选择等待,而小猪选择行动,那么大猪将获得9个单位的食物,其收益为9个单位;还有一种情况是大猪小猪都选择等待,那么,大猪的收益为0,也就是吃不到食物。
我准备用一个单元格来表示出大猪的收益状况,如下:
单元格一
下面再分析一下小猪的策略与收益情况,并用单元格表示。对于小猪而言,若小猪选择等待,而大猪选择行动,那么小猪将获得4个单位的食物,其收益为4个单位;若小猪选择行动,这时大猪也选择行动,那么小猪将获得3个单位的食物,同时,小猪要付出2个单位的成本,其收益为1个单位;若小猪选择行动,而大猪选择等待,那么小猪将获得1个单位的食物,同时,小猪减去2个单位的成本,小猪的最后收益为 -1个单位;若小猪选择等待,而大猪也选择等待,那么小猪的收益为0。
用单元格表示出小猪的收益的状况,如下:
单元格二
把单元格一和单元格二合并起来,可以得到一个矩阵,这个矩阵是关于大猪和小猪的收益矩阵,如下:
矩阵中的收益数据,可不是凭空捏造的数字,而是经过分析得出的科学的数据,需要提醒一下,单单矩阵本身并不代表博弈,博弈研究的是策略形势,而不是矩阵,它只是作为一种明晰的工具出现在博弈中。
从矩阵中可以清晰的看出,当大猪选择等待,而小猪选择行动的时候对于大猪来说,收益是最大的,可是博弈者的大猪和小猪的决策是相互影响的,小猪是否愿意选择行动这一策略呢?
我们来分析一下小猪,对于小猪而言,无论大猪选择行动,还是等待,小猪选择等待要比选择行动更具优势。因为当大猪选择行动时,小猪选择行动的收益为1,选择等待的收益为4,很明显4>1,小猪选择等待更具优势;同理,当大猪选择等待,对小猪的选择等待与行动的收益进行比较,0>-1。因此,小猪绝对不会选择行动这一策略。大猪知道小猪不会选择行动,自己该如何选择才对自己有益呢?
再回到矩阵收益图表上,我们可以看到小猪选择等待时,大猪选择行动这一策略,其收益为4,选择等待这一策略,其收益为0,很明显4>0,因此,大猪会选择行动,而不选择等待,这样不至于被饿死。
小猪和大猪在博弈中达成了纳什均衡,也就是说小猪和大猪都找到了对于自己的最佳策略,即小猪选择等待,大猪选择行动。
我们来验证一下这个纳什均衡,对于小猪来说,当大猪选择行动时,小猪选择等待收益最大(4>1);当大猪选择等待,小猪还是选择等待收益最大(0>-1)。对于大猪而言,当小猪选择行动,大猪选择等待收益最大(9>5);当小猪选择等待,大猪选择行动收益最大(4>0),我们看到,对于大猪和小猪收益最大的策略,有一个交集(4,4),这个交集意味着大猪和小猪达成了纳什均衡。
小猪最终会选择等待,因为它明白选择行动对于自己一点好处都没有,小猪的这种聪明做法,在博弈中称为坐船或搭便车。在社会中,如果你是一个弱者,就必须学会善于利用各种有利的条件来为自己服务。打个比方说中小企业的经营者,他们没有太多的资本去研究和开发市场,他们的明智做法就是像小猪那样选择等待,让其他大企业首先开发市场,然后在此基础上有所作为,这样就可以省去市场调研和开发的一些不必要的费用,这对于任何一个中小企业来说,都是一个明智的选择。
然而,问题出现了,如果中小企业都想做不劳而获的小猪,势必会对社会带来一些不良的影响,这时,激励制度就派上用场了,就是设计一些激励方案,使小猪积极行动起来,从而促使社会稳健的发展。
激励制度,我想大家都能理解。公司为了提高员工上班的积极性,制定全勤奖励制度,这是每一个人都能接触到的事实,事实证明,它在公司中的确起到很大的作用。今天,只研究智猪博弈模型里的激励方案设计,看怎样才能调动小猪行动的积极性。
首先是减量投食方案,比如说按一次按钮只有6个单位的食物进入猪食槽中,大猪和小猪这时会采用什么策略呢?先做出大猪和小猪的收益矩阵如下:
从这个矩阵中,可以很清楚看出大猪和小猪的收益,如果大猪采用行动策略,小猪若选择行动则抢不到食物,若选择等待,那么小猪的收益为4,而大猪的收益为0,这时,大猪选择行动,而小猪选择等待对于大猪来说并没有产生收益,因此大猪会这样想,反正行动没有收益,不如不行动。
再看另一种情况,大猪选择等待是否是最优的策略。若大猪选择等待,对于小猪来说行动并没有收益,聪明的小猪是不会选择行动给大猪创造收益,因此,大猪选择等待也不是博弈中的最优策略。
这个博弈最后大猪和小猪会达成一个结果,就是大猪和小猪都不去按按钮,都不采取行动,以致最后被饿死,因此减量投食的方案是不可行的。
减量投食的方案无法激励小猪行动,最后大猪也不行动了,因此这种方案是不可取的。再来看看投食量增加的方案,现在,假设按一次按钮会有23个单位的食物进入猪食槽,那么,关于大猪和小猪的收益矩阵如下:
这个收益矩阵有点难懂,大家一看,大猪和小猪最多的情况下,一共才吃掉20个单位的食物,还有3个单位的食物到哪里去了呢?
这正是增量的设计方案,食物有剩余。这个矩阵是这样理解的,大猪一次吃饱需要10份食物。如果它行动,就要减去按按钮付出的2个单位的成本,最后收益为8个单位的食物,这时大猪还没有吃饱,需要再补充2个单位的食物,它一共吃了12个单位的食物,但收益只有10个单位的食物,因为它已经不能再吃了。小猪也是一样,假设小猪一次吃饱需要6份食物,同样无论它是选择行动,还是选择等待,都只有6个单位的收益。此时,大猪和小猪没有吃完的食物就是剩余。
在食物剩余的情况下,会出现这样一种情况,就是大猪和小猪谁饿,谁就去踩踏板。这一方案,大猪和小猪之间没有竞争的存在,各自没有必要为争夺食物而闹得热火朝天,如果你想让小猪积极行动,这可不是一个理想的方案。
经过证明,采取减量的投食方案与增量的投食方案,都不能调动小猪的积极性。我们再试一下第三种方案减量加位移的方案,看是否是可行的。
假定这时按按钮会有7份食物进入猪食槽,投食口设计在按钮附近,请记住这些信息,它很重要。还是同上面一样,先看一下大猪和小猪的收益矩阵: