纳什博弈论案例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论的产生和发展
1. 博弈在中国 《学弈》(《孟子•告 子》) :弈秋,通国之善 弈也。使弈秋侮二人弈, 其一人专心致志,惟弈秋 之为听;一人虽听之,一 心以为有鸿鹄将至,思援 弓缴而射之 。虽与之俱学 , 弗若之矣。为是其智弗若 与?吾曰:非然也。
博弈又称博戏,是一门古老的游戏。《世 本》说,“乌曹作博”,乌曹乃是夏代著 名之能工巧匠。千百年来,博弈更是与人 们的生活紧紧相连,从博棋到牌戏,从斗 戏到彩票,中华民族的历史长河中就这样 形 成 了 别 具 风 情 的 博 弈 文 化
博弈论 及经典案例
+ 比赛规则:马按奔跑的速度分为上中下三等,
等次不同装饰不同,各家的马依等次比赛,三 赛二胜。 + 比赛前田忌按照孙膑的主意,第一场,用上等 马鞍将下等马装饰起来,冒充上等马, 与齐威 王的上等马比赛;第二场,用上等马与齐威王 的中等马比赛;第三场,田忌的中等马和齐威 王的下等马比赛。结果二比一,田忌赢了齐威 王。 + 在双方条件相当时,对策得当可以战胜对方; 在双方条件相差很远时,对策得当也可将损失 减低到最低程度。
(1)我国古代围棋、国际象棋(印度)等; (2)1912年,数学家翟墨罗把对策从模拟模型抽象 为数学模型; (3)第一次、第二次世界大战,军事对策应用于战 役和战略研究; (4)1944年,冯·诺意曼、摩根斯特合写了“博弈 论和经济行为”,推动了博弈论在经济管理中的应 用; (5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔 经济学奖(1994),进一步推动了博弈论的研究。
三国中的博弈——联吴抗魏
诸葛亮在《隆中对》中提出“跨有荆益、东 有孙权、北图中原”,他舌战群儒,力劝东 吴孙权与刘备联盟。
所以,弱者总是有动力去维持一个 稳定的三角形结构:与次强者联盟, 但是却不愿真正消灭强者。
三国中的博弈——华容道
火烧赤壁一战,Baidu Nhomakorabea刘联军大败曹操,曹 操北逃。诸葛亮明知关羽重义气,必然 放走曹操,为何还将捉曹重任交给关羽?
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年,冯·诺依曼 和摩根斯顿发表《博 弈论和经济行为》的 一书, 标志着博弈论作为一门独立科学的开始, 也标志着新古典经济学进入了一个新的发 展阶段。
二、基本概念
1. 局中人或参与者(Players) 2. 规则( rules ):规定博弈各方的行动顺序、
三国中的博弈-孙刘联盟的瓦解
如果分析一下孙权的心理,我们可能对他的背信弃
义有更多同情。赤壁之战尽管符合他的利益,但到 底是他出力挽救了刘备,此后他不但把荆州长期借 给刘备,还把妹妹嫁给了这个老头子。他尽了同盟 的义务,曾与曹操大战数次,不仅损兵折将(他的大 将太史慈、董袭、陈武等都在战斗中阵亡),他自己 也险些在逍遥津送命。可从收益上说,他与刘备是 “牛打江山马坐殿”,感到不平衡是正常的。
B(80%) C(100%) A:30%
分析过程
A的行动选择集合(1)对空发射,(2)射B,(3)射C
如A对空发射, B有80%的可能杀死C(B必然射C,因为C一定选择射击B,则B必死);然 后A有30%可能杀死B(仅A,B;A必射B);如未能杀死B,则B向A射击 (A存活概率0.2)。对局结束。存活概率为0.8*(0.3+0.7*0.2)=0.352。 如B未射死C,则C射杀B,然后A要么成功射杀C,要么被C射杀;存活概率 为0.2*0.3=0.06。总体存活概率41.2%。 A射死B 概率树工具 0.3 B射死C 0.8 A未射死B B射A不中 A射空 0.7 0.2 B未射死C A射死C 0.2 0.3 A未射死C 0.7 C射A不中 0
上策与上策均衡
所谓上策,是指这样一种策略,即不管对手采取 什么策略,这种策略都是最优的。
而当对局者选择的都是上策的时候, 这种均衡叫做上策均衡 所谓均衡是指一种稳定的结局,当这种结局 出现的时候,所有的对局者都不想再改变他 们所选择的策略。
纳什均衡
纳什均衡是指在对手策略既定的情况下, 各自对局者所选择的策略都是最好的。
假如你正在和朋友用手机通电话, 突然信号断了。这时,你会立即拨电 话过去,还是等你的朋友拨电话过来? 很显然,你是否应拨电话过去,取决 于你的朋友是否会拨过来。如果你们其中 一方要拨,那么另一方最好是等待;如果 一方等待,那么另一方就最好是拨过去。 因为如果双方都拨,那么就会出现线路忙; 如果双方都等待,那么时间就会在等待中 流逝。
A可以采取的行动
对空发射: 存活概率为0.8×(0.3+0.7×0.2)+0.2×0.3=41.2%
向C发射: 存活概率为 0.3×0.2×(0.7+0.3×0.2)+0.7×41.2%=33.4% 向B发射: 存活概率为0.7×41.2%=28.84%
再说三个枪手
A和B似乎达成了某种默契:在C被干掉之前,他们相
三国中的博弈-孙刘联盟的瓦解
可是从对策论来看,孙权却犯了一个大错误,由于
嫉妒,他过早和刘备翻脸,致使两败俱伤。这就好 比枪手A突然翻脸向B开火。坐收渔利的当然是C。 虽然曹操的继任者曹丕没能抓住机会夹攻孙权,一 举消灭这两个敌手,但蜀和吴此后已经没有可能打 败魏国了。 那么,孙权的最优策略是什么?回想上面的枪 手决斗就明白了。既然已经落到A的地位,就该以A 的策略行事。让刘备去和曹操恶斗,自己扩充势力, 养精蓄锐,随机应变。无论两者胜负,自己都能从 中渔利。
纳什均衡是指在对手策略既定的情况下,各自对局者所选择 的策略都是最好的。
合作是有利的“利己策略”。但它必须符合以下黄金律: 按照你愿意别人对你的方式来对别人,但只有他们也按同 样方式行事才行。也就是中国人说的“己所不欲勿施于 人”。但前提是人所不欲勿施于我。 其次,“纳什均衡”是一种非合作博弈均衡,在现实中 非合作的情况要比合作情况普遍。
所以“纳什均衡”是对冯· 诺依曼和摩根斯特恩的合作 博弈理论的重大发展,甚至可以说是一场革命。
故事模型
A、B、C三人决斗,每人有2颗子弹,每次发一枪。
A、B、C的命中概率分别为0.3、0.8、1.0。
三人依次发射,两轮后对决结束。 每次可以选择向对手发射,也可以放空枪。 射中即死。 问在这场博弈中A的最优策略。
上策均衡与纳什均衡的区别: ⑴ 上策均衡是指不管你选择什么策略,我所选择的 是最好的;不管我选择什么策略,你所选择的是最好 的。 ⑵ 纳什均衡是指给定你的策略,我所选择的是最好 的;给定我的策略,你所选择的是最好的。 ⑶ 上策均衡是纳什均衡的一种特殊情况,但纳什均 衡却不一定是上策均衡。
纳什均衡的意义
0,0 1,-1
-1,1
0,0
0,0 -1,1
博弈论之“数学”的特征
只是数学思维、数学符号,有些符号怪模怪样,甚至
不会读,但很少有什么艰深的数学 这里的符号比较麻烦,因为它和代数中的纯粹抽 象而无意义的符号不同,在脑子里要时刻记得它 们的实际意义 但要熟悉这种简捷、抽象的思维方式,记住这些 符号的代表意义 所以,一个比较有效的学习方法是重复
博弈无处不在
石头、剪子、布
博弈方2 石 头 博 弈 方 1 石 头 剪 子 布 0, 0 -1, 1 1, -1 剪 子 1, -1 0, 0 -1, 1 布 -1, 1 1, -1 0, 0
老虎
老虎 鸡 虫 杠子 0,0 -1,1
鸡
1,-1 0,0
虫
0,0 1,-1
杠子
-1,1 0,0 1,-1 0,0
行动:局中人在特定条件下的行为 支付 ( Pay-off ):博弈结束时,各方得到的收益。 策略均衡:参与者之间稳定的、可预测的互动行 为模式,就是策略均衡。
上策均衡: 我所做的是不管你做什么我所能做的最好的 你所做的是不管我做什么你所能做的最好的
NASH均衡: 我所做的是给定你所做的我所能做的最好的 你所做的是给定我所做的你所能做的最好的
*在一场博弈中,你必须考虑对方的选择以确定你自己 的最优选择,而对方也必须考虑你的选择来确定他的 最优选择。 *你从博弈中得到的,不仅取决于你自己的行动,也取 决于对方的行动。 如果你知道恋人不会打过来(如以前断线就是她在 等电话,如果你的手机包月额度很难用完而她的接听免 费),那么你的最优行动就是拨过去。 *博弈最本质的特征是:双方的行动相互影响又相互依赖
博弈论研究对象
博弈论是研究理性的决策主体在其行为发生直接的相 互作用时的策略选择及策略均衡的理论。
博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大收益的策略)。
冲突、竞争现象的定量分析理论。
参加竞争的各方为了获胜而需研究出 一组对付对方的策略。
博弈论的产生和发展
三国中的博弈-孙刘联盟的瓦解
孙权不但“火烧赤壁”打败曹操,更在此后 还长期承担了对抗曹操的主要任务。而刘备虽在 赤壁之战中也出了力,但此后几年未与曹操打过 大仗(也就是没有尽联盟义务)。倒是趁此机会扫 荡地方势力,扩充地盘,直至占据两川,将曹操 赶出汉中,又派关羽北伐,水淹七军,不但取代 了孙权原来的老二地位,甚至有可能击败曹操, 成为新的老大。孙权地位跌落到老三,他的策略 也随之改变。 于是孙权趁关羽北伐后方空虚之机,与曹操 合谋,夺取了荆州,杀死关羽。结果是同盟破裂, 刘备兴兵报仇,又被孙权打败。蜀汉从此衰落, 东吴也面临了两面作战的不利局面。
互不是敌人。 这不难理解,毕竟人总要优先考虑对付最大的 威胁,同时这个威胁还为他们找到了共同利益,联 手打倒这个人,他们的生存机会都上升。而且,从 悲观的角度看,他们恐怕也活不到需要相互拼个你 死我活的时候。 但这个“同盟”也是很不牢固的,两个人都在 时时权衡利弊,一旦背叛的好处大于默契的好处, 他们马上就会翻脸。
“功高震主”
“木秀于林,风必摧之”
一个对他人利益不构成威胁的人,自然不会是他人意欲除掉 的对象,反而能在各种政治风云中幸存下来。 能力最强,本事最大的人,反而最有可能走向悲剧结果。 C的存活概率只有14%。 能力处于中间状态的,是最可能存活的。B:56%
能力最弱的,也可以比最强者有更大的生存机会。A:41.2%。
方式、以及最终的结果等。
3. 策略( Strategy ) : 一整套的行动方案,规定
了各种情况下的行动。比如:敌进我退,敌退 我追,敌驻我扰,敌疲我打。
4.
相机策略( contingent strategy ):仅在不确定 事件发生时才会采取的策略。如:人不犯我,我
不犯人;人若犯我,我必犯人。
5. 6. 7.
博弈论简介
+ 博弈论(Game Theory)又名对策论,游戏论
–
–
–
博弈论,英文为Game theory,是研究相互依赖、相互影响的决 策主体的理性决策行为以及这些决策的均衡结果的理论。 博弈论试图研究既存在冲突又存在合作的情况下(如寡头垄断) 人们的决策行为。博弈是一种势态,在该势态中,两个或更多的 参与人都在追求他们各自的利益,没有人能够支配结果。 博弈的过程就是一个策略上的相互作用过程。这使得任何一方的 行为都必须考虑到对方可能作出的反映。
结论:诸葛亮并不想杀掉曹操—— 曹操一死,刘备亦亡矣!
有人会问:既然放操,为何又设三重拦截? 如果孙权知道诸葛放操,则孙刘联盟瓦解,因此,既 要放,又不能让孙权看出是有意放。
现实例子:总统竞选,实力最弱的开始时总是表现低调, 实力强劲与实力中等者互相攻击,狼狈不堪,这时最弱的 竞选者粉墨登场。
揭示思想:一个人,在社会上的生存不仅取决于 其能力大小,还要看其威胁到的人。
再说三个枪手
在这个“同盟”里,最忠诚的是B ——只要C不死, 他就不会背叛;A就要滑头多了,在前面轮流开枪的 例子中,他不朝C开枪,从同盟者的角度说,就是没 有履行义务,而把盟友送上危险的境地,这不是因 为道德水平不同,而是处境不同。 B是C的头号目标,这个敌人一定要向他开枪的, 完全没有回旋的余地;而A不同,他随时愿意牺牲B 换取下次自己的先手之利。 除了压力较小之外,而且还有一个动力驱使A背 叛,那就是一旦干掉C后,B的机会比他要大,他至 少要保持先下手,才可能一争高下。