非合作博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 第一节 占优策略均衡 • 第二节 纳什均衡的应用例子 • 第三节 古诺模型 • 第四节 非零和博弈
6
❖ 一、严格占优策略的定义 博弈参与者进行策略选择时,有可能存在某个策略的收益严 格优于其他策略的情况,该策略被称为严格占优策略 (Strictly Dominant Strategy)。
• “囚徒困境”博弈与严格占优策略
(7,10) (-3,-3)
15
乙
努力
偷懒
甲
努力
(a,a) (d,c)
偷懒
(c,d) (b,b)
设(努力,努力)最大收益为a,(偷懒,偷懒)的最 小收益为b , a>b. 两个参与者选择不同策略时所得的 收益分别为c、d(c>d)
只要a>c>d>b,占优策略均和合作解一致
16
• 一、纳什均衡的定义 给定其他参与者在博弈均衡时的策略,任何博弈参与者
• 他的回答是,“把车钥匙给医生,让他带着 老人去医院看病,我留下来陪着一见钟情的
人雨中漫步。”
• 什么是博弈呢?博弈实际上就是如何在现有 条件下做出最优选择的一种策略。
• 博弈论也叫做对策论,或称赛局理论,是研 究具有斗争或竞争性质的现象的理论和方法。 可以简单的说,博弈论就是运用你的智慧和 理性思维,在纷繁的选择中能够使你的利益 达到最大化的一门科学。
• 占优策略均衡:当一个博弈中的每位参与者
都选择了各自的占优策略时,相应的博弈结果就 是占优策略均衡
• 社会两难博弈
• 从整体利益考虑的解叫做博弈的合作解,一般占 优策略均衡形成的解都是非合作解,占优策略均 衡与合作解相悖,称此类博弈为社会两难问题
• 解决途径
• 合约、法规、协议或其他手段使参与者们都能 履行协调后的策略
• 如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈另一端 的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会比小猪早到达 盛食槽并把盛食槽内的食物吃光。小猪付出了按压开关的劳动却没有 吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为 -1。
• 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下开关后, 盛食槽内出现食物,小猪立即开始吃,大猪则需要花一定时间从猪圈 一端跑到另一端。当大猪到达盛食槽后,身强力壮的大猪会把小猪挤 到一旁,吃光剩余的食物。在这种情况下,大猪得到的收益是 4,小 猪得到的收益是 2。
• 如果小猪去按压开关,大猪在盛食槽旁等待。那么当小猪按下开 关后,大猪开始吃,即使当小猪从开关处跑到盛食槽旁后,大猪 仍然会霸占着食物,将食物全部吃光,小猪只能无可奈何地被挤 在一旁。在这种情况下,大猪可以不劳而获,得到的收益为 10。 小猪徒劳无功,看到大猪不劳而获,更增加了小猪的郁闷,小猪 得到收益 -2。
乙
努力
偷懒
努力 (18,18) (10,15)
甲
偷懒 (15,10) (5,5)
14
乙
努力
偷懒
甲
努力
(0,0) (0,-8)
合作博弈的 惩罚矩阵
偷懒
(-8,8) (-8,-8)
乙
努力
偷懒
甲
努力 (10,10) (2,15)
偷懒
(15,2) (5,5)
乙
努力
偷懒
努力 (10,10) (2,7)
甲
偷懒
❖ 在寻找博弈均衡时,如果该博弈某参与者存在严格占优策 略,那么在博弈均衡中,该参与者会选择严格占优策略, 而不会选择其他策略。
❖ 因为不管其他参与者选择何种策略,该参与者选择严格占 优策略的收益均高于选择其他策略的收益。
❖ 因此在博弈均衡中,理性参与者一定会选择严格占优策略。
❖ 定理: 如果每个博弈参与者都存在一个严格占优策略, 那么在博弈中各参与者必然选择其严格占优策略。 各博弈参与者的严格占优策略构成博弈均衡
• 引例:
在一个风雨交加得夜晚,当你开着一辆豪华轿车经 过一个车站时,正好遇到三个人在焦急地等待公共汽 车,一位是生命危在旦夕的老人;一位是曾经救过你 的命得医生,可以说是你的恩人,你做梦都想报答他; 还有一位是你一见倾心的异性,如果这次错过了,你 肯定一辈子都会后悔。但你的车却只能在坐一个人。 你到底会让谁坐上你的车呢?
都没有动机改变自己在博弈均衡时的策略选择。这样的均 衡被称为“纳什均衡”(Nash Equilibrium)。
在某些博弈中,并不是所有博弈参与者都存在严格占优策略均衡
• 猪栏里养了两头猪,一头大猪、一头小猪。 • 在猪圈的一端有一个盛食槽。 • 在猪圈的另一端有一个按压式开关。 • 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 • 大猪和小猪都在思考是否去按压开关。
11
• 烟草广告博弈中的政府干预的积极作用
1996.12.30,我国工商行政管理局禁止利用广播、电影、 电视、报纸等发布烟草广告
A 公司
做广告 不做广告
B 公司 做广告 40,40 20,100
不做广告 100,20 80,80
• 政府管制使厂商从 “囚徒困境中” 解放出来, 说明自由竞争并不是最有效的经济体系,适当 的政府管制可以更有效的提高社会经济和政治 效益
❖ 如果大猪选择按开关,那么小猪应该如何选择? ❖ 理性的小猪会选择等待。 ❖ 在小猪选择等待所对应的收益“2”的下方划一道短横线。 ❖ 类似可分析其他情况
嫌疑人甲
坦白 不坦白
嫌疑人乙
坦白
不坦白
(5,5) (1,10)
(10,1) (2,2)
• 不管嫌疑人乙选择何种策略(坦白还是不坦白),嫌疑人甲的最优策略 都是坦白。在这种情况下,“坦白”是嫌疑人甲的严格占优策略。
• 不管嫌疑人甲选择何种策略(坦白还是不坦白),嫌疑人乙的最优策略 都是坦白。因此“坦白”也是嫌疑人乙的严格占优策略。
12
博弈的标准式
乙
努力
偷懒
甲
努力 (10,10) (2,15)
偷懒
(15,2) (5,5)
要改变 合作困境,即改变博弈的均衡,可 采取奖勤罚懒措施
13
乙
努力
偷懒
甲
努力
(8,8) (8,0)
合作博弈的 奖赏矩阵
偷懒
(0,8) (0,0)
乙
努力
偷懒
甲
努力 (10,10) (2,15)
偷懒
(15,2) (5,5)
• 如果大猪和小猪都不去按压开关,则大猪和小猪都无法吃到食物, 大猪和小猪均得到收益 0。
大猪
按开关 等待
小猪
按开关
等待
(5,-1) (4,2)
(10,-2) (0,0)
“智猪博弈”的支付矩阵
• 2.通过“划横线法”求解“智猪博弈”的均衡
大猪
按开关 等待
小猪按开关等待(5,-1)(4,2)
(10,-2) (0,0)