3 求解策略式博弈-博弈求解

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

兴奋剂博弈：运动员服用类固醇是否理性现在我们不仅假设这些运动员是理性的，而且每个人都相信其他两名与动员是理性的。这就意味着卡尔和莫里斯都相信本会使用类固醇，因为这是他的占优策略。这样对于莫和卡来说，博弈变成去掉本放弃类固醇的策略。这种情况下，卡尔拥有服用类固醇的占优策略。
3.3 博弈求解：理性成为共同知识
这种情况下，如果托选择屈服，斯选择真弹收益增加如果托选择刺杀，他选择真弹收益不会受损（2）所以对于斯来说，选择真弹就是弱占优于空弹的策略。
第3章剔除不可能：理性是共同知识下的博弈求解
3.1 博弈求解: 参与者是理性的很多案例中仅仅是参与者是理性的设想，并不足以让我们求出博弈的解。书呆子喜欢读书故其收益随努力程度增加而递增。社团男生满足B的成绩并愿意为此适度学习，但不会为提升至A而非常努力。成绩由所有成员共同决定。社团男生没有占优策略。也就是说，仅仅假设社团男生有理性并不能帮助我们预测他的行为选择。
3.1 博弈求解: 参与者是理性的
我们假设两位参与人都是理性的看能否预测他们的行为。
歌剧博弈中，假如斯卡比亚选择真子弹，托斯卡选择刺杀的收益2>选择屈服的收益1，所以当托认为斯用真子弹时（信念），将选择刺杀。同理，如果她认为斯用空弹也将选择刺杀。所以不论托认为斯会怎么做，选择刺杀策略的收益> 选择屈服策略的收益。同理，我们将看到斯卡比亚的理性会促使他选择真子弹的策略。
要推导出一个解决办法，就需要假定某个参与者在众多的策略中是如何作出选择的。这项工作的难度在于参与者选择策略的方式很大可能上取决于她对其他参与者如何作出选择的判断。我们先从对参与者的假设开始，然后研究他们行为背后的原因。先假设参与者是理性的；接着进一步假设每个参与者相信其他所有的参与者也都是理性的。在此基础上，假设每个参与者都相信所有的参与者都是理性的。
此外，如果一个参与者有占优策略，并且他是理性的，那么它就会使用这一策略。因此，当每个参与者都有占优策略时，那么唯一合理的解就是每一个参与者都运用属于自己的占优策略。
现在我们修改托斯卡的博弈情境，假设斯卡比亚认为自己被刺杀将不在乎卡瓦拉多西是死是活，相关收益如图，也就是对于斯来说真子弹与空弹的收益相同。对于托斯卡来说刺杀仍是占优策略，但对斯卡比亚来说，真子弹并不再严格优于空弹策略。
3.2 博弈求解：参与者是理性的和参与者知道参与者是理性的但如果我们假定不仅参与者是理性的，而且参与者知道他的同伴也是理性的。前述，理性参与者在具备占优策略下会使用该策略因此社团男生推测，因为他的伙伴书呆子是理性的，所以会选择非常努力学习这个占优策略。这样，社团男生就
有了占优策略— 较少努力。
第3章剔除不可能：理性是共同知识下的博弈求解
3.1 博弈求解: 参与者是理性的 3.2 博弈求解：参与者是理性的和参与者知道参与者是理性的兴奋剂博弈：运动员服用类固醇是否理性
本>卡>莫
理性无法预测卡尔和莫里斯的选择，因为他们的最优选择取决于对其他运动员策略的预测
Leabharlann Baidu
3.3 博弈求解：理性成为共同知识
兴奋剂博弈：运动员服用类固醇是否理性目前为止，莫里斯不仅知道本使用类固醇，也知道卡尔使用。排除卡尔不使用，其博弈变为下面策略。因此，选择使用类固醇也成为他的占优策略。
3.3 博弈求解：理性成为共同知识
兴奋剂博弈：运动员服用类固醇是否理性
3.3 博弈求解：理性成为共同知识
目前为止我们通过逐步增加理性知识来求得博弈的解《托斯卡》博弈只假设参与者是理性的就得出博弈解。《智猪》博弈的假设不仅包含参与者是理性的，也包括每个参与者都相信所有的参与者是理性的。兴奋剂博弈中，运动员是否使用类固醇的策略的解，
3.1 博弈求解: 参与者是理性的 3.2 博弈求解:
参与者是理性的和参与者知道参与者是理性的
3.3 博弈求解：理性成为共同知识
第3章剔除不可能：理性是共同知识下的博弈求解
3.1 博弈求解: 参与者是理性的这里假定的参与者是理性的是指，参与者根据对其他参与者会采取何种行为的信念（对其他参与者可能做出选择的信念），会采取使自己收益最大化的策略。这一假定在博弈求解的情境下意味着
后得出的
3.3.2 重复剔除严格劣势策略这些都是博弈求解的一个更为普遍的准则的例证这个准则被称为重复剔除严格劣势策略（IDSDS）重复剔除严格劣势策略包括以下一些步骤
3.3.2 重复剔除严格劣势策略这个过程直到没有策略剔除才会最终结束。如果某个博弈中每个参与者有无限个策略，则这个过程会无限进行下去。当然，通常情况下，在经过有限的步骤之后，就不再有可以剔除的策略了，剩下的就是经过重复剔除严格劣势策略后最终“生存”下的策略了。如果每个参与者只剩下一个策略（至少一个）则策略是占优可解的，并且重复剔除严格劣势策略准则对行为的预测具有唯一性。
第二部分求解策略式博弈
第3章剔除不可能：理性是共同知识下的博弈求解
第4章稳定博弈：两人或三人非连续博弈中的纳什均衡
第5章稳定博弈：N人非连续博弈中的纳什均衡
第6章稳定博弈：连续博弈中的纳什均衡第7章随机策略
第3章剔除不可能：理性是共同知识下的博弈求解
我们构建策略式或扩展式博弈的最终目的是研究人们在策略情境中的行为反应。以绑架博弈为例，我们想知道会发生绑架吗？如果发生绑架会支付赎金吗？奥兰多能够生还吗? 为了求出这一博弈中的解，意味着要从8对可能的策略中做出选择并回答上述问题。我们需要剔除不合理和不可行的策略组合，然后找出一个独特且强有力的策略组合。解决方案越少，我们对行为作出的预测越精准
3.1.1 严格占优所以对于托斯卡而言，屈服策略和刺杀策略相比属于严格的劣势策略。也就是说，不管斯卡比亚选择何种战略，托斯卡至少有一种策略（刺杀）带来的收益高于选择屈服策略的收益。而刺杀策略严格占优于屈服策略。
3.1.1 严格占优
3.1.1 严格占优
3.1.1 严格占优在博弈中如果一个策略是严格劣策略的话，那么他关于其他参与者将要如何选择的信念也不是最优的因此，一个理性的参与者将避免使用这样的战略。