博弈论06 混合策略4
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论石头剪子布游戏
石头剪子布游戏
石头剪子布游戏
石头剪子布游戏
石头剪子布游戏
石头剪子布游戏
求混合策略的收益等值法
求混合策略的收益等值法
田忌赛马
田忌赛马出自《史记》卷六十五:《孙子吴起列传第五》,是中国历史上有名的揭示如何善用自己的长处去对付对手的短处、从而在竞技中获胜的事例。
田忌赛马
齐使者如梁,孙膑以刑徒阴见,说齐使。齐使以为奇,窃载与之齐。齐将田忌善而客待之。忌数与齐诸公子驰逐重射。孙子见其马足不甚相远,马有上、中、下辈。于是孙子谓田忌曰:“君弟重射,臣能令君
胜。”田忌信然之,与王及诸公子逐射千金。及临质,孙子曰:“今以君之下驷与彼上驷,取君上驷与彼中驷,取君中驷与彼下驷。”既驰三辈毕,而田忌一不胜而再胜,卒得王千金。于是忌进孙子于威王。威王问兵法,遂以为师。
田忌赛马
田忌赛马的均衡
田忌赛马的均衡
田忌赛马的均衡
情侣博弈混合策略均衡
情侣博弈有两个纯策略纳什均衡,同时情侣博弈是协调博弈,博弈中的两个局中人具有策略一致性,如果一方知道了另一方的选择,则会选择与对方一致的策略,换句话说,两个局中人都不害怕对方猜到自己的选择。
但由于该博弈有两个纳什均衡,而情侣双方对两个纳什均衡的偏好各不相同,因此当俩人从自身最大利益出发独立同时决策时,仍然无法确定博弈的结果是那个纯策略组合,因此需要考虑局中人采用混合策
略的可能性。
情侣博弈混合策略均衡
如果男方不想让女方利用自己的选择占上风,则自己的概率选择应使
情侣博弈混合策略均衡
男方的(3/4,1/4)和女方的(1/4,3/4)构成一个混合策略纳什均衡。
在该均衡下,双方的期望收益都是0.5,显然不如双方能协调一致、或者一方迁就另一方
时的收益高。
所以双方之间的决策问题一般不应这样解决。
社会福利博弈
社会福利博弈
验证混合策略组合
((0.5,0.5),(0.2,0.8))构成纳什均衡。假定政府认为流浪汉找工作的概率小于0.2,则政府选择不救济的收益大于救济,所以政府的最优的选择是不救济;但如果政府以1的概率选择不救济,则流浪汉的最优选择是找工作,这又将导致政府选择救济的策略,流浪汉则又选择
游荡,如此等等。因此,流浪汉找工作的概率小于0.2时不构成纳什均衡。类似地还可以验证,流浪汉找工作的概率大于0.2、以及政府救济的概率大于0.5和小于0.5都不构成纳什均衡。
求混合策略的收益最大法
求混合策略的收益最大法
税收检查博弈
假设a是应纳税款,C是检查成本,F是罚款,这里不妨假定
检查成本小于应纳税款与罚款的和。
税收检查博弈
税收机关的期望总收益为
税收检查博弈
容易看出,对逃税的惩罚越重,应纳税款越多,纳税人逃税的概率越小。
因为,应纳税款越多,税收机关检查的概率越高,逃税被抓住的可能性越大,因而纳税人反而不敢逃税了。
这一点或许可以解释为什么逃税现象在小企业中比在大企业中更为普遍,在低收入阶层
比在高收入阶层更普遍。
税收检查博弈
这里假定一旦税收机关检查,逃税就会被发现。否则,比如说,高收入者有更好的办法隐藏收入,从而逃税行为更难被发现,上述结论就不一定成立。此外,应纳税款较多的纳税人可能更有积极性贿赂税务官员。将所有这些情况考虑进去,逃税的概率与应纳税款的关系可能是非单调的,比如说,最遵纪守法的是中上等收入阶层。
可以肯定的是,通过提高对逃
税者的惩罚,纳税人逃税的积极性会下降,税收机关检查的必要性也就降低。
税收检查博弈
实际经济活动中,一个税务局往往管理着很多纳税人,这种博弈不是税务局与一个纳税人的博弈,而是税务局与很多纳税人的博弈。
上述混合策略纳什均衡的或许更为合理的解释是,在这些纳税人中,选择逃税的纳税人比例为:
求混合策略的图解法当不需要精确求出混合策略
的概率值时,可以采用图解法观察混合策略的取值范围和变化趋势。
求混合策略的图解法求混合策略的图解法混合策略反应函数
混合策略反应函数
混合策略反应函数
混合策略反应函数
混合策略反应函数
本次课小结
所谓纯策略,就是可以100%选用的策略。不能100%选用的
策略,就不是纯策略,我们一般称之为混合策略。纯策略就是相对于混合策略而言的,纯策略是混合策略的特殊情况。纯策略就意味着事先确定的特定的行动,混合策略则是不同行动之间的随机选择。
当一个博弈在纯策略意义下不存在纳什均衡时,在混合策略意义下是否存在呢?例如石头剪子布博弈、猜硬币博弈等都不存在纯策略纳什均衡。
纳什给出的定理告诉我们,如果允许考虑混合策略,那么每个有限博弈都存在纳什均衡。