重复博弈

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
陌生人之间为何会因为踩一脚 而发生口角,甚至拳脚相向? 恋爱中的男女为什么会对彼此忠诚? 旅游景点为何坑特多,餐馆都价高不好吃?
重复博弈给你答案 让我们认识并走进重复博弈~
2
重复博弈的分类
有限次重复博弈
有限次重复博弈是指相同结构的博弈有限次重复进行。 在有限次重复博弈中,参与者会欺骗和违约,但当参与者不 知道哪一次是末期时,决策近于无限次博弈。
5
有限次重复博弈的案例
小偷与警察的博弈
假设小镇上只有一个警察和一个小偷,根据他们的 选择可以做出如下得益矩阵:
小偷 警 察 偷 睡 -D, V 不偷 S, 0
不睡
0, -P
0, 0
从上图中我们可以明显看出,小偷和守卫都没有最优策 略,小偷偷与不偷跟守卫睡与不睡有关,同时守卫睡与不睡 也跟小偷偷与不偷有关。
由此可见:在一次性博弈中中,厂商A和厂商B都存在上 策,上策均衡是双方都定低价。
假如厂商A开始制定的高价策略,从支付矩阵得到 厂商B若也定高价,其每次博弈的支付分别为( 15,15 从参与人行为看,由于博弈可以重复无数次, ,15...);若厂商B制定低价,则在第一次博弈中 博弈双方为了长期利益有时间进行试探性出价。 获得高收益,但是随后会由于厂商A的低价行为而使其 在第一次博弈时出高价以寻求竞争对手的合作, 受损,各次博弈的支付分别为(20,12,12...)。 一旦对局人为了短期利益采取不合作行为,那么 厂商A的这种策略被称为“以牙还牙”策略,这种 就会建立该对局人是不可信任的信念,在下一次 策略是A在初始选择合作,如果B合作,那么A也会一直 的博弈中都采取不合作的低价行为,使对局人的 合作下去;若 B在某一次博弈中选择不合作,那么A在以 长期利益受损。 后博弈中都采取不合作策略。 可见,厂商B在第一次博弈中由于不合作策 “以牙还牙”策略意味着任何一个参与人的一次性 略得到的高收益会在以后博弈中因A的报复性策 不合作将会引起永远的不合作。所有参与人为了长期利 略而抵消,甚至在重复博弈若干次后出现损失。 益,使得无限次重复的非合作博弈产生合作解。
Thank you
ห้องสมุดไป่ตู้
从上图可以看出
一、小偷偷盗的概率小于一定程度的时候守 卫睡觉的收益是正的!
二、加大对守卫的处罚会降低小偷偷盗的概 率,因为守卫的处罚更大,小偷只有偷盗的概率 更低守卫睡觉才能取得正效用。
三、最惊人的地方在于小偷偷盗的概率原来 跟对小偷的处罚无关,却与守卫的处罚力度有关 !!!!!!
生活中的重复博弈
无限次重复博弈
无限次重复博弈是指同一个博弈被无限次重复多次。在 无限次重复博弈中,对于任何一个参与者的欺骗和违约行为, 其他参与者总会有机会给予报复。
无限次重复博弈的案例
产品定价博弈
厂商A和厂商B是某产业的两大寡头,他们的得益决定双方 所定的价,他们的得益矩阵如下所示:
厂商B
厂 商 A 高价(元) 高价(元) 低价(元) 12,12 4, 20 低价(元) 20, 4 15, 15
• 经过对重复博弈的认识,我想你们都知道开头问题的答案 了吧。 • 陌生人发生冲突往往是一次性博弈,只需考虑这一次的利 益。而如果是熟人,考虑到长期利益(包括对你印象和与 你关系),就不会因为这种小事吵架。 • 旅游景点做的生意往往是一次性买卖。好吃与否,游客再 来的可能性也不大,所以做到一次性收益最大是理智的。 • 而想在居民区做生意而生存下来,就是一个重复博弈,要 考虑到长期合作关系,做到物美价廉,才能有稳定的收益。
所以这里问题的关键在于守卫是否睡觉(因为守卫睡 觉小偷偷是理智的),或者说守卫睡觉的概率大小,那守 卫睡觉的概率大小是多少呢?这里我们就必须讨论守卫睡 觉能得到什么,或者说他的期望效用是多少?
这里假设小偷偷盗的概率是Pt,守卫睡觉的概率是Pg, 那我们马上可以算出守卫睡觉的期望效用(收益):
ER = (-D)×Pt + S×(1-Pt) 上面守卫的期望效用可以做成如下图:
相关文档
最新文档