非合作博弈

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 第一节 占优策略均衡 • 第二节 纳什均衡的应用例子 • 第三节 古诺模型 • 第四节 非零和博弈
6
❖ 一、严格占优策略的定义 博弈参与者进行策略选择时,有可能存在某个策略的收益严 格优于其他策略的情况,该策略被称为严格占优策略 (Strictly Dominant Strategy)。
• “囚徒困境”博弈与严格占优策略
(7,10) (-3,-3)
15

努力
偷懒

努力
(a,a) (d,c)
偷懒
(c,d) (b,b)
设(努力,努力)最大收益为a,(偷懒,偷懒)的最 小收益为b , a>b. 两个参与者选择不同策略时所得的 收益分别为c、d(c>d)
只要a>c>d>b,占优策略均和合作解一致
16
• 一、纳什均衡的定义 给定其他参与者在博弈均衡时的策略,任何博弈参与者
• 他的回答是,“把车钥匙给医生,让他带着 老人去医院看病,我留下来陪着一见钟情的
人雨中漫步。”
• 什么是博弈呢?博弈实际上就是如何在现有 条件下做出最优选择的一种策略。
• 博弈论也叫做对策论,或称赛局理论,是研 究具有斗争或竞争性质的现象的理论和方法。 可以简单的说,博弈论就是运用你的智慧和 理性思维,在纷繁的选择中能够使你的利益 达到最大化的一门科学。
• 占优策略均衡:当一个博弈中的每位参与者
都选择了各自的占优策略时,相应的博弈结果就 是占优策略均衡
• 社会两难博弈
• 从整体利益考虑的解叫做博弈的合作解,一般占 优策略均衡形成的解都是非合作解,占优策略均 衡与合作解相悖,称此类博弈为社会两难问题
• 解决途径
• 合约、法规、协议或其他手段使参与者们都能 履行协调后的策略
• 如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈另一端 的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会比小猪早到达 盛食槽并把盛食槽内的食物吃光。小猪付出了按压开关的劳动却没有 吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为 -1。
• 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下开关后, 盛食槽内出现食物,小猪立即开始吃,大猪则需要花一定时间从猪圈 一端跑到另一端。当大猪到达盛食槽后,身强力壮的大猪会把小猪挤 到一旁,吃光剩余的食物。在这种情况下,大猪得到的收益是 4,小 猪得到的收益是 2。
• 如果小猪去按压开关,大猪在盛食槽旁等待。那么当小猪按下开 关后,大猪开始吃,即使当小猪从开关处跑到盛食槽旁后,大猪 仍然会霸占着食物,将食物全部吃光,小猪只能无可奈何地被挤 在一旁。在这种情况下,大猪可以不劳而获,得到的收益为 10。 小猪徒劳无功,看到大猪不劳而获,更增加了小猪的郁闷,小猪 得到收益 -2。

努力
偷懒
努力 (18,18) (10,15)

偷懒 (15,10) (5,5)
14

努力
偷懒

努力
(0,0) (0,-8)
合作博弈的 惩罚矩阵
偷懒
(-8,8) (-8,-8)

努力
偷懒

努力 (10,10) (2,15)
偷懒
(15,2) (5,5)

努力
偷懒
努力 (10,10) (2,7)

偷懒
❖ 在寻找博弈均衡时,如果该博弈某参与者存在严格占优策 略,那么在博弈均衡中,该参与者会选择严格占优策略, 而不会选择其他策略。
❖ 因为不管其他参与者选择何种策略,该参与者选择严格占 优策略的收益均高于选择其他策略的收益。
❖ 因此在博弈均衡中,理性参与者一定会选择严格占优策略。
❖ 定理: 如果每个博弈参与者都存在一个严格占优策略, 那么在博弈中各参与者必然选择其严格占优策略。 各博弈参与者的严格占优策略构成博弈均衡
• 引例:
在一个风雨交加得夜晚,当你开着一辆豪华轿车经 过一个车站时,正好遇到三个人在焦急地等待公共汽 车,一位是生命危在旦夕的老人;一位是曾经救过你 的命得医生,可以说是你的恩人,你做梦都想报答他; 还有一位是你一见倾心的异性,如果这次错过了,你 肯定一辈子都会后悔。但你的车却只能在坐一个人。 你到底会让谁坐上你的车呢?
都没有动机改变自己在博弈均衡时的策略选择。这样的均 衡被称为“纳什均衡”(Nash Equilibrium)。
在某些博弈中,并不是所有博弈参与者都存在严格占优策略均衡
• 猪栏里养了两头猪,一头大猪、一头小猪。 • 在猪圈的一端有一个盛食槽。 • 在猪圈的另一端有一个按压式开关。 • 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 • 大猪和小猪都在思考是否去按压开关。
11
• 烟草广告博弈中的政府干预的积极作用
1996.12.30,我国工商行政管理局禁止利用广播、电影、 电视、报纸等发布烟草广告
A 公司
做广告 不做广告
B 公司 做广告 40,40 20,100
不做广告 100,20 80,80
• 政府管制使厂商从 “囚徒困境中” 解放出来, 说明自由竞争并不是最有效的经济体系,适当 的政府管制可以更有效的提高社会经济和政治 效益
❖ 如果大猪选择按开关,那么小猪应该如何选择? ❖ 理性的小猪会选择等待。 ❖ 在小猪选择等待所对应的收益“2”的下方划一道短横线。 ❖ 类似可分析其他情况
嫌疑人甲
坦白 不坦白
嫌疑人乙
坦白
不坦白
(5,5) (1,10)
(10,1) (2,2)
• 不管嫌疑人乙选择何种策略(坦白还是不坦白),嫌疑人甲的最优策略 都是坦白。在这种情况下,“坦白”是嫌疑人甲的严格占优策略。
• 不管嫌疑人甲选择何种策略(坦白还是不坦白),嫌疑人乙的最优策略 都是坦白。因此“坦白”也是嫌疑人乙的严格占优策略。
12
博弈的标准式

努力
偷懒

努力 (10,10) (2,15)
偷懒
(15,2) (5,5)
要改变 合作困境,即改变博弈的均衡,可 采取奖勤罚懒措施
13

努力
偷懒

努力
(8,8) (8,0)
合作博弈的 奖赏矩阵
偷懒
(0,8) (0,0)

努力
偷懒

努力 (10,10) (2,15)
偷懒
(15,2) (5,5)
• 如果大猪和小猪都不去按压开关,则大猪和小猪都无法吃到食物, 大猪和小猪均得到收益 0。
大猪
按开关 等待
小猪
按开关
等待
(5,-1) (4,2)
(10,-2) (0,0)
“智猪博弈”的支付矩阵
• 2.通过“划横线法”求解“智猪博弈”的均衡
大猪
按开关 等待
小猪按开关等待(5,-1)(4,2)
(10,-2) (0,0)
相关文档
最新文档