3 求解策略式博弈-博弈求解

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

兴奋剂博弈:运动员服用类固醇是否理性 现在我们不仅假设这些运动员是理性的,而且 每个人都相信其他两名与动员是理性的。 这就意味着卡尔和莫里斯都相信本会使用类固醇, 因为这是他的占优策略。这样对于莫和卡来说,博 弈变成去掉本放弃类固醇的策略。 这种情况下,卡尔拥有服用类固醇的占优策略。
3.3 博弈求解:理性成为共同知识
这种情况下,如果托选择屈服,斯选择真弹收益增加 如果托选择刺杀,他选择真弹收益不会受损(2) 所以对于斯来说,选择真弹就是弱占优于空弹的策略。
第3章 剔除不可能:理性是共同知识下的博弈求解
3.1 博弈求解: 参与者是理性的 很多案例中仅仅是参与者是理性的设想,并不足 以让我们求出博弈的解。 书呆子喜欢读书故其收益随努力程度增加而递增。 社团男生满足B的成绩并愿意为此适度学习,但不会 为提升至A而非常努力。成绩由所有成员共同决定。 社团男生没有占优策略。 也就是说,仅仅假设社 团男生有理性并不能帮助 我们预测他的行为选择。
3.1 博弈求解: 参与者是理性的
我们假设两位参与人都是理性的看能否预测他们的行为。
歌剧博弈中,假如斯卡比亚选择真子弹,托斯卡选择 刺杀的收益2>选择屈服的收益1,所以当托认为斯用 真子弹时(信念),将选择刺杀。 同理,如果她认为斯用空弹也将选择刺杀。 所以不论托认为斯会怎么做,选择刺杀策略的收益> 选择屈服策略的收益。 同理,我们将看到斯 卡比亚的理性会促使 他选择真子弹的策略。
要推导出一个解决办法,就需要假定某个参与 者在众多的策略中是如何作出选择的。 这项工作的难度在于参与者选择策略的方式很大可 能上取决于她对其他参与者如何作出选择的判断。 我们先从对参与者的假设开始,然后研究他们 行为背后的原因。 先假设参与者是理性的; 接着进一步假设每个参与者 相信其他所有的参与者也都 是理性的。在此基础上,假 设每个参与者都相信所有的 参与者都是理性的。
此外,如果一个参与者有占优策略,并且他是理性 的,那么它就会使用这一策略。 因此,当每个参与者都 有占优策略时,那么唯 一合理的解就是每一个 参与者都运用属于自己 的占优策略。
现在我们修改托斯卡的博弈情境,假设斯卡比亚认为 自己被刺杀将不在乎卡瓦拉多西是死是活,相关收益 如图,也就是对于斯来说真子弹与空弹的收益相同。 对于托斯卡来说刺杀仍是占优策略,但对斯卡比亚来 说,真子弹并不再严格优于空弹策略。
3.2 博弈求解:参与者是理性的 和参与者知道参与者是理性的 但如果我们假定不仅参与者是理性的,而且参与 者知道他的同伴也是理性的。 前述,理性参与者在具备占优策略下会使用该策略 因此社团男生推测,因为他的伙伴书呆子是理性的, 所以会选择非常努力学习这个占优策略。 这样,社团男生就
有了占优策略— 较少努力。
第3章 剔除不可能:理性是共同知识下的博弈求解
3.1 博弈求解: 参与者是理性的 3.2 博弈求解:参与者是理性的 和参与者知道参与者是理性的 兴奋剂博弈:运动员服用类固醇是否理性
本>卡>莫
理性无法预测卡尔和莫里斯的选择,因为他们的最优选 择取决于对其他运动员策略的预测
Leabharlann Baidu
3.3 博弈求解:理性成为共同知识
兴奋剂博弈:运动员服用类固醇是否理性 目前为止,莫里斯不仅知道本使用类固醇,也知道 卡尔使用。 排除卡尔不使用,其博弈变为下面策略。 因此,选择使用类固醇也成为他的占优策略。
3.3 博弈求解:理性成为共同知识
兴奋剂博弈:运动员服用类固醇是否理性
3.3 博弈求解:理性成为共同知识
目前为止我们通过逐步增加理性知识来求得博弈的解 《托斯卡》博弈只假设参与者是理性的就得出博弈解。 《智猪》博弈的假设不仅包含参与者是理性的,也包 括每个参与者都相信所有的参与者是理性的。 兴奋剂博弈中,运动员是否使用类固醇的策略的解,
3.1 博弈求解: 参与者是理性的 3.2 博弈求解:
参与者是理性的和参与者知道参与者是理性的
3.3 博弈求解:理性成为共同知识
第3章 剔除不可能:理性是共同知识下的博弈求解
3.1 博弈求解: 参与者是理性的 这里假定的参与者是理性的是指,参与者根据 对其他参与者会采取何种行为的信念(对其他参与者 可能做出选择的信念),会采取使自己收益最大化的 策略。 这一假定在博弈求解的情境下意味着
后得出的
3.3.2 重复剔除严格劣势策略 这些都是博弈求解的一个更为普遍的准则的例证 这个准则被称为重复剔除严格劣势策略(IDSDS) 重复剔除严格劣势策略包括以下一些步骤
3.3.2 重复剔除严格劣势策略 这个过程直到没有策略剔除才会最终结束。 如果某个博弈中每个参与者有无限个策略,则这个 过程会无限进行下去。 当然,通常情况下,在经过有限的步骤之后, 就不再有可以剔除的策略了,剩下的就是经过重复 剔除严格劣势策略后最终“生存”下的策略了。 如果每个参与者只剩下一个策略(至少一个) 则策略是占优可解的 , 并且重复剔除严格劣势策略准则对行为的预测具有 唯一性。
第二部分 求解策略式博弈
第3章 剔除不可能:理性是共同知识下的博弈求解
第4章 稳定博弈:两人或三人非连续博弈中的纳什均衡
第5章 稳定博弈:N人非连续博弈中的纳什均衡
第6章 稳定博弈:连续博弈中的纳什均衡 第7章 随机策略
第3章 剔除不可能:理性是共同知识下的博弈求解
我们构建策略式或扩展式博弈的最终目的是研究 人们在策略情境中的行为反应。 以绑架博弈为例,我们想知道会发生绑架吗?如 果发生绑架会支付赎金吗?奥兰多能够生还吗? 为了求出这一博弈中的解,意味着要从8对可能的 策略中做出选择并回答上述问题。 我们需要剔除不合理和不可行的策略组合,然后 找出一个独特且强有 力的策略组合。解决 方案越少,我们对行 为作出的预测越精准
3.1.1 严格占优 所以对于托斯卡而言,屈服策略和刺杀策略相 比属于严格的劣势策略。也就是说,不管斯卡比亚 选择何种战略,托斯卡至少有一种策略(刺杀)带 来的收益高于选择屈服策略的收益。 而刺杀策略严格占优于屈服策略。
3.1.1 严格占优
3.1.1 严格占优
3.1.1 严格占优 在博弈中如果一个策略是严格劣策略的话,那么 他关于其他参与者将要如何选择的信念也不是最优的 因此,一个理性的参与者将避免使用这样的战略。
相关文档
最新文档