博弈论案例分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)失火了,你往哪个门跑
失火了,你往哪个门跑——这就是博弈论
一天夜晚,你参加一个派对,屋里有好多人,你玩得很高兴。
这时候,
屋里忽然失火,火势很大,没法息灭。
此时你想逃生。
你的眼前有两个门,
左门和右门,你一定在它们之间选择。
但问题是,其余人也要争抢这两个门
出逃。
假如你选择的门是好多人选择的,那么你将因人多拥堵、冲不出去而
烧死;相反,假如你选择的是较少人选择的,那么你将逃生。
这里我们不考
虑道德要素,你将怎样选择?这就是博弈论!
你的选择一定考虑其余人的选择,而其余人的选择也考虑你的选择。
你
的结果——博弈论称之为支付,不单取决于你的行动选择——博弈论称之为
策略选择,同时取决于别人的策略选择。
你和这群人构成一个博弈(game)。
上述博弈是一个叫张翼成的中国人在 1997 年提出的一个博弈论模型,被
称之为少量者博弈或少量派博弈( Minority Game)。
自然,本来的博弈形式
不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这
个博弈模型。
此刻好多学者在研究这个问题。
生活中博弈的案例好多,你会见到好多例子。
只需波及到人群的互动,
就有博弈。
什么叫博弈?博弈的英文为 game,我们一般将它翻译成“游戏”。
而在西方, game 的意义不一样于汉语中的游戏。
在英语中, game即是人们按照必定规则下的活动,进行活动的人的目的是使自己“赢” 。
奥林匹克运动会叫Olympic Games。
在英文中,game有比赛的意思,进行 game的人是很仔细的,不一样于汉语中游戏的观点。
在汉语中,游戏有儿戏的滋味。
所以将对于game
的理论,即 game theory 翻译成博弈论或许对策论,是适合的。
本书下边统
称 game theory 为博弈论。
博弈论的出现只有 50 多年的历史。
博弈论的创始者为诺意曼与摩根斯
坦,他们 1944 年第一版了《博弈论与经济行为》。
诺意曼是着名的数学家,
他同时对计算机的发明作出了巨大贡献,他逝世时博弈论还未对经济学产生
宽泛影响,不然经济学的诺贝尔奖必定有他的名字,由于诺贝尔奖有规定,只
颁发给在世的学者。
谈到博弈论,不可以忽视博弈论天才纳什(John Nash)。
纳什的创始性论文《n 人博弈的平衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什平衡的观点和平衡存在定理。
今日博弈论已发展成一个较完
善的学科。
博弈论对于社会科学有侧重要的意义,它正成为社会科学研究范式中的一种中心工具,以致于我们可称博弈论是“社会科学的数学” ,或许说是对于社会的数学。
从理论上讲,博弈论是研究理性的行动者( agents )互相作用的形式理论,而实质上它正深入到经济学、政治学、社会学等等,被各门
社会科学所应用。
甚至有学者宣称要用博弈论从头改写经济学。
1994 年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像 1985 年获取诺贝尔奖的公共选择学派的领导者布坎南, 1995 年获取诺贝尔奖的理性主义学派的领袖卢卡斯( Lukas),其理论与博弈论都有着较深的联系。
此刻博弈论正浸透到各门社会科学,更重要的是它正深刻地改变着人们的思
维。
二、博弈论能解说全部社会现象吗?
社会由不一样的人群的会合体所构成。
不一样的人群会合体形成不一样的结
构,一个构造中的集体之间的互相作用( interactions )就构成一个博弈。
这个博弈是广义上的。
社会中有不一样的文化,人类有文明、道德,假如说文明、
文化、道德是宏观的社会现象,那么还存在着微观的社会现象,如:集体为何
有合作又有不合作?为何人群之间或公司之间有“威迫”或“承诺”?这些都
是博弈论研究的对象。
本书下边将努力用博弈论的基本思想来解说社会中的这
些现象。
博弈论对人的基本假定是:人是理性的( rational )。
所谓理性的人是指
行动者拥有推理能力,在详细策略选择时的目的是使自己的利益最大化。
博弈
论研究的是理性的人之间怎样进行策略选择的。
博弈论力争在这个最简单的假定下获取丰富的结论,正如我们下边所看
到的,它的确做到了。
博弈论专家的这类做法好像物理学家对自然的假定同
样。
大家知道,物理学家常常假定几个最基本的假定,这最基本的假定构成
公设,其余的结论由它们推得,如爱因斯坦的狭义相对论只有两条假定:(1)物理定律在全部参照系中不变;(2)在全部参照系中光速保持常数。
多么简单的公设!在这两个公设下得出了诧异的结论,如运动的参照系中尺子缩短,时钟变慢,等等。
相对论的这两条公设改变了物理学的整个构架,也改变了人们对自然的整个见解!
博弈论自然不是对于自然的,它是对于社会的,它不可以构成人们对自
然见解的革命。
博弈论的假定是特别简单的,它能得出令人诧异的结论吗?
它能改变人们对于社会的见解吗?——这些是伟大科学的要求!我们将发
现,博弈论的确这样!
本书力争用“科学的”方法来解读社会现象。
经济学是对社会现象进行
研究的科学,社会学、政治学等等也都是社会科学。
然此刻天经济学已成了
帝国主义,它的领域没有疆界。
不不过经济行为是它的研究领域,它的研究
范围是“经济的”行为,在经济学家看来人类的几乎全部社会行为都是“经
济的”。
这里我们用“经济的”等同于“理性的” ,也就是“计算的” ,理性的人即是计算的人。
本书的写作方式是科普式的( popular science )。
提到的理论有时缺乏前因
后果的交代,也未对博弈论作系统的论述,如读者对所波及的理论感兴趣,请查找相关的书本或资料。
这里讲一个小小的插曲。
在与朋友聊博弈论时,他任意说了一句话给我
启迪很深。
他说,中国人研究其余学识难说,但研究博弈论是有优势的。
这
句话是褒义,也是贬义。
说它是
褒义,是由于中国古代有好多这方面的着述与实践,春秋战国期间七国争雄,其实也是谋士之间的角逐,而罗贯中的《三国演义》在今日看来就是一部博
弈论教材!不论是兵书如《孙子兵法》、《三十六计》,仍是现代流行的所
谓“商战策略”、“公共关系”以及所谓“厚黑学”都是对于怎样博得与人交往的成功的,或许说怎样获取成功的。
说它是贬义,是由于,中国人走关系、
互相算计是出了名的,中国人对博弈论有天生的认识。
正如中国人常说的“事事洞明皆学识,人情练达即文章” ,即是说人与人之间的关系、社会交往均是学识。
而中国好多“做人”的道理,道出了怎样在人与人的博弈中获取成
功,如:在任何场合下都不要冒犯人,不要轩露头角(如“枪打出头鸟” ),等等。
可是,在中国文化传统中,人与人之间的所谓关系其实不像西方那样是科学,而更像一门艺术。
本书下边将试试着用博弈论解读人类的社会行动或集体行动——这里的
社会行动或集体行动意指互动的人群会合体。
读者将发现,本来复杂的人类
社会的行动是简单获取理解的,并且会发现此中储藏着的一些道理。
本书是解说社会现象的,此中的方法、理论与案例很多是经济学中的,
但是本书不完整部是经济学的。
假如是经济学的,一定是用完美的经济学理
论
来论述和剖析确立的研究对象,一定讲“供应” 、“需求”、“价钱”、“功效”、“边沿”等观点及原理,不然是对读者不负责的。
本书力争用科学的方法,
即对各样社会现象作出解说。
自然经济学也是科学的,可是经济学已经形成
固定的研究程式。
我们这里不过告诉读者很多现象背后的东西。
本书有些地
方是哲学的,有的地方是逻辑的。
我想说的是,我们所看到的社会现象其背
后有着深刻的科学道理——自己以为这些现象的背后是理性和逻辑。
假如本书能给读者带来一些启迪,自己就满意了。
博弈案例 (1)囚犯博弈与我国应试教育的窘境
囚犯窘境能够用来说明很多现象。
我国当前的应试教育就是一个囚犯困境。
囚犯博弈是完整信息下的静态博弈,两个小偷各样策略组合下的支付是他们之间的“公共知识” (我们在下一章中将议论什么是“公共知识” )。
我们上边已经剖析了囚犯对局下各个策略下的结果或支付,以及它的平衡。
它的平衡是两方均选择“招认”的策略。
能够这么说,近来 10 多年来,我国基础教育的问题是怎样挣脱应试教
育的窘境问题。
当前给中小学生“减负”不单是学生家长的呼声,也是教育
专家和教育管理部门的呼声,也能够说是全社会的呼声。
教育管理部门这几
年做了一系列的工作,但见效甚微,并无从根本上解决问题。
学校不停给学
生增添负担是当前教育的实质状况。
大家广泛以为应试教育是抹杀学生的创建性,不论是专家仍是家长,都
在号召改变应试教育的模式。
可是不论是专家,仍是意识到教育问题的一般
老百姓以及没存心识到教育问题的老百姓,其儿童都在接受着这类教育。
在现有的教育体系下,学生(或学生家长)有两个可选择的策略:“减负”和“增负”。
学生的精力是有限的,假如选择“减负”策略,意味着学
生有更多的时间学习课本之外的东西,这样学生的素质获取提升,所以,“减负”策略常常与素质教育联系在一同;而假如选择“增负”策略,则意味着
学生花大批的时间做大批的习题,以“学透” 、“学精”课本规定的东西,此时,学生没有时间学习课本之外的没有规定的内容。
“减负”的结果是学生的全面发展;而“增负”的结果是学生获取高的分数。
在这样的博弈构造下,学生(或学生家长)怎样选择呢?每个学生这样想:其余人采纳的是“增负”教育策略的话,假如我采纳“减负”教育策略,我的考试分数不如别人,在修业方面我会落伍,接受不了好的教育,在将来求职时我也赶不上别人。
在别人采纳“增负”的策略下,我也应该采纳“增负”策略。
假如其余人采纳的是“减负”策略,我应该采纳什么策略呢?仍是应该采纳“增负”策略!由于,假如其余人采纳的是“减负”策略的话,假如我采纳的是“增负”策略,我的考试分数会比其余人高,我会上好的学校,在将来的职业竞争中我会处于优势。
所以,不论其余人采纳的是什么策略,我采纳“增负”策略都是最好的。
当每个学生都这样想的时候,全社会便进入了应试教育这样一个囚犯窘境之中。
假如我国现有的考试制度没有改变,此刻假定全部的学生都选择“减负”策略,即除了做少许的稳固性的作业外,不补课、不做其余的练习题,状况会是什么样子?
假定这类状态会出现,我们说,这类状态会很快消逝,而立刻会出现全
部学生都进入“增负”的这样一个状态。
能够说,均选择“减负”策略的状
态是不稳固的,而“增负”的状态是稳固的平衡。
原由就是,当前的教育的
博弈构造规定了各样行动或行为的利润或利处:获取高分的会进入好的初
中、高中,进入好的初中、高中的学生能够考高分进入好的大学。
在这个博
弈中,对于教师来说,学生的升学率高意味着其成绩大、奖金高,对自己的
学生采纳“增负”策略,对于自己而言是占优策略。
我国基础教育的博弈与囚犯窘境有共同的构造,大家均选择“增负”策
略构成基础教育博弈的纳什平衡。
纳什平衡是一个稳固的博弈结果,这也是
为何我国当前的应试教育难以改变的原由。
2.斗鸡博弈与古巴的导弹危机
试想有两只公鸡碰到一同,每只公鸡有两个行动选择:一是退下来,一
是攻击。
假如一方退下来,而对方没有退下来,对方获获成功,这只公鸡则
很丢面子;假如对方也退下来,两方则打个平局;假如自己没退下来,而对
方退下来,自己则成功,对方则失败;假如两只公鸡都行进,那么则两败俱
伤。
所以,对每只公鸡来说,最好的结果是,对方退下来,而自己不退。
支
付矩阵以下:
鸡乙鸡甲行进退后行进(-2 ,-2)(1 ,-1) 退后 (-1 ,1)(-1 ,-1)
上表中的数字的意思是:二者假如均选择“行进”,结果是两败俱伤,
二者均获取 -2 的支付;假如一方“行进”,此外一方“退后”,行进的公鸡获
得 1 的支付,博得了面子,尔退后的公鸡获取 -1 的支付,输掉了面子,但没有二者均“行进”遇到的损失大;二者均“退后” ,二者均输掉了面子,获取-1 的支付。
自然表中的数字不过相对的值。
这个博弈有两个纳什平衡:一方行进,另一方退后。
但重点是谁进谁退?一博弈,假如有唯一的纳什平衡点,那么这个博弈是可展望的,即这个纳什
平衡点就是预先知道的唯一的博弈结果。
可是假如一博弈有两个或两个以上的纳什平衡点,则任何人没法展望出一个结果来。
所以,我们没法展望斗鸡
博弈的结果,即不可以知道谁进谁退,谁输谁赢。
用这个博弈来解说20 世纪 60 年月初发生在美苏两个超级大国之间的一
场导弹危机,是最适合可是的了。
二战结束后,形成了对峙的两个超级大国,美国和苏联。
这两个超级大
国是两个中心,在其四周有各自的盟友,它们一同构成了两大敌对的阵营。
1962 年赫鲁晓夫偷偷地将导弹运送到加勒比海上的岛国古巴,卡斯特罗政权是苏联这个超级大国的盟友,是美国的仇敌。
苏联的目的是将导弹部署在美
国的眼皮底下,以应付美国。
但是苏联的行动被美国的U-2 飞机侦探到了,
美国发现古巴成立了导弹发射场。
此事震动美国,肯尼迪总统谴责苏联,并
发出严重警示,而苏联方面矢口否定。
美国决定对古巴进行军事封闭,差遣
了舰艇、空军及航空母舰,并集结了登岸队伍。
美国进入警戒状态,,美苏之间的战争剑拔弩张。
面对美国的反响,苏联面对着是将导弹撤归国仍是坚持部署在古巴的选
择?而对于美国,则面对着是挑起战争仍是容忍苏联的寻衅行为的选择?也
就是说,这两只“大公鸡”均在考虑采纳进的策略仍是退的策略?
战争的结果自然是两败俱伤,而任何一方退下来(而对方不退)则是不
光彩的事。
结果是苏联将导弹从古巴撤了下来,做了丢面子的“撤离的鸡”。
美国坚持了自己的策略,做了
“不退的鸡”。
自然,为了给苏联一点面子,同时也担忧苏联坚持不退而发生
美苏战争——这是美国不肯意看到的,美国象征性地从土耳其撤离了一些导
弹。
古巴导弹危机是冷战期间美苏两霸之间发生的最严重的一次危机。
这就是美国与苏联在古巴导弹上的博弈结果。
对于苏联来说,退下来的结果
是丢了面子,但总比战争要好;对美国而言,既保全了面子,又没有发生战
争。
这就是这两只“大公鸡”博弈的结果。
3.进退两难博弈与美苏武器比赛
我们常常碰到的一类博弈是,行动者进也不是,退也不是。
笔者将这样
的博弈称为进退两难博弈。
有一个拍卖,其规则是:轮番出价,谁出得最高,谁就将获取该物件,
可是出价少的人不单得不到该物件,并且要按他所叫的价付给拍卖方。
假定有两人竞价抢夺价值 100 元的物件,只需两方开始叫价,在这个博
弈中两方就进入了进退两难的状态。
由于,每一个人都这样想,假如我退出,
我将失掉我出的钱,若不退出,我将有可能获取这价值 100 元的物件,可是,跟着出价的增添,他的损失也可能越大。
每一个人面对着两难:是持续叫价还
是退出?
你会说,这个拍卖的规则不合理,在实质中这样的拍卖不会出现。
自然
这不过一个模型,但我们常常会看到此种类的博弈案例。
这个博弈有一个纳
付平衡:第一个出价人叫出100 元的竞标价,此外一个人不出价(由于在对方叫出 100 元的价钱后,他持续叫价将是不理性的),出价100元的参加人获取该物件。
在冷战期间,美苏为抢夺霸权拼死发展武器,不论是原子弹、氢弹等核
武器的研制,仍是如隐形战斗机这样的惯例武器的研制,两方均不甘落伍。
20 世纪 80 年月,里根在位时准备启动“星球大战”计划,此举意味着两个
超级大国的武器比赛将进一步升级。
美苏之间的武器比赛就相当于拍卖中轮
番出价,两方均不停出更高的价,假如一方没有出最高的价钱,退了下来,
即没有持续比赛下去,那么意味着它在军备上的投入没有成效,而对方将博
得整个场面。
但假如持续比赛下去,一旦支撑不住,损失也就越大。
1991 年苏联的倒台在必定程度上是军备比赛的结果。
苏联将整个力量放在军备比赛上,而民用建设没法跟上,国力不济,最后退下阵来。
里根的“星球大战”计划其目的就是要拖垮苏联。
一旦进入进退两难的博弈,提早走出是理智之举,但是当局者常常做不到,这就是所谓当局者迷。
这类进退两难的博弈常常出此刻国家之间,也出此刻公司或组织之间,自然个人之间也常常碰到。
20 世纪 60 年月,美国介入越南就
是一个进退两难博弈。
赌红了眼的赌徒输了钱还要持续赌下去以希望返本,也是进退两难博弈,其实,赌徒进入赌场开始赌博时,他已经进入了进退两难的状态,由于,赌场从概率上讲是必定赢的。
从理论上讲,赌徒与赌场之间的博弈假如是多次的,那么赌徒必定输的,由于赌徒的“资源”与赌场的“资源”对比实在太小了。
假如你的资源与赌场的资源对比很大,
那么赌场有可能输的;假如你的资源无穷大,只需赌徒有非 0 的赢的可能性,
那么赌徒必定会赢的。
所以,像葡京这样的赌场要设定赌博数额的限制。
博弈论专家将这里的进退两难博弈称为协和错误。
20 世纪60 年月,英国和法国政府结合投资开发大型超音速客机,即协和飞机。
该种飞机机身大、设计豪华并且速度快。
可是,英法政府发现:持续投资开发这样的机型,花
费会急剧增添,可是这样的设计定位可否适应市场还不知道;而停止研制将
使从前的投资付诸东流。
跟着研制工作的深入,他们更是没法作出停止研制
工作的决定。
协和飞机最后研制成功,但因飞机的缺点(如耗油大、噪音大、污染严重等等),它不适合市场,最后被市场裁减,英法政府为此承受很大
的损失。
在这个研制过程中,假如英法政府能提早放弃飞机的开发工作,会
使损失减少,但他们没能做到。
4.警察与小偷的故事——混淆策略问题
纳什在《n 人博弈的平衡点》这篇论文中,给出了平衡存在的简单证
明,纳什说,在 n 个人的博弈中起码存在着一个平衡,在这点上两方均不肯意先改变策略。
这里的平衡点有可能是混淆策略点。
人们称它为纳什定理。
什么是混淆策略?
警察部门负责一城市中某一区的治安。
警察要对该区的A、B 两地进行
巡逻。
假定该区有一群小偷,要实行偷窃。
警察要防备小偷的偷窃,但由于
设施有限,只有一部警车,所以,警察只好一次在一个地方巡逻。
而对于小
偷而言,他们也只好去一个地方。
假定 A 地需要保护的财富价值为 2 万元,B 地的财富价值为 1 万元。
若警察在某地进行巡逻,而小偷也选择了去该地,因警察在场,小偷没法偷窃该地的财物;若警察没有去某地巡逻而小偷选择
了去该地,则小偷偷窃成功。
警察怎么巡逻才能使成效最好?
一个显然的做法是,警察对 A 地进行巡逻,小偷去B地,这样,警察能够保住 2 万元的财富不被盗窃,小偷的利润为 1 万元。
可是这类做法是警察的最
好做法吗?有没有对这类策略改良的举措?
我们能够将警察与小偷之间的这个支付写成以下的支付矩阵。
警察巡逻某地,偷窃者在该地没法实行偷窃,假定此时小偷的受益为0( 没有利润 ) ,此时警察的受益为3( 保住 3 万元 ) 。
这个博弈也是常和博弈,它没有纯策略纳什平衡点,而有混淆策略平衡点。
这个混淆策略平衡点下的策略选择是每个参加者的最优(混淆)策略选
择。
因而可知:纯策略是参加者一次性选用的,并且坚持他选用的策略;而
混淆策略是参加者在各样备选策略中采纳随机选用的。
在博弈中,参加者可
以改变他的策略,而使得他的策略选用知足必定的概率。
当博弈是零和博弈与常和博弈时,即一方所得是此外一方的所失机,此
时只有混淆策略平衡。
对于任何一方来说,此时不行能有纯策略的占优策略。
5.《三国演义》中的空城计与信息不对称的博弈
假如我们用博弈论的目光看《三国演义》,三国演义完整部是一部记录着很多博弈案例的着作。
自然,罗贯中不行能用“博弈”一词。
假如我们用一
词来归纳《三国演义》,这个词就是“计”。
计,即计谋或策略也。
用计,即
用策略赢对方。
用计算敌,不单要自己选择适合的计谋,并且要算准对方用
什么计谋,这不就是博弈?此刻让我们看《三国演义》中着名的空城计博弈。
诸葛亮误用马谡,以致街亭失陷。
司马懿引大军十五万簇拥而来。
当时
孔明身旁别无大将,只有一班文官,五千军士,已分一半先运粮草去了,只
剩二千五百军士在城中。
众官听得这个信息,尽皆失容。
孔明登城望之,果
然灰尘冲天,魏兵分两路杀来。
孔明传令众将旌旗尽皆隐匿,诸军各收城铺。
翻开城门,每一门用二十军士,扮作百姓,洒扫街道。
而孔明乃披鹤氅,戴
纶巾,引二小孩携琴一张,于城上敌楼前凭栏而坐,焚香操琴。
司马懿自飞
立刻远眺望之,见诸葛亮焚香操琴,笑脸可掬。
司马懿陡然思疑此中有诈,
立刻叫后军作前军,前军作后军,急速退去。
司马懿之子司马昭问:“难道诸葛亮无军,故作此态,父亲何故便退军?”司马懿说:“亮一生慎重,未曾弄险。
今大开城门,必有埋伏。
我兵若进,中其计也。
”孔明见魏军退去,抚掌而笑,众官无不骇然。
诸葛亮说,司马懿“料吾平生慎重,必不弄险;
见这样模样,疑有伏兵,所以退去。
吾非行险,盖因不得已而用之” ,我兵只有二千五百,若弃城而去,必为之所擒。
这就是为后代广为歌颂的空城计。
这是一个信息不对称的博弈。
这里,司马懿不知道自己和对方在不一样行动策略下的支付,而诸葛亮是知道的,他们对博弈构造的认识是不对称的,诸葛亮拥有比司马懿更多的信息,自然有。
这类信息的不对称完整部是诸葛亮“制造出来的”。
所以这是一个信息不对称的博弈。
在这里,孔明能够选择的策略是“弃城”或“守城”。
不论是“弃”还是“守”,只需司马懿明确知道他自己的支付,那么孔明均要被其所擒。
孔
明唯一的方法就是不让司马懿知道他自己的策略结果。
他的空城计是降低司马懿攻击的可能利润,使得司马懿以为,退后比攻击要好。
司马懿孔明攻击退后守城 ( 被擒,大胜 )( 逃走,不胜不败 ) 弃城 ( 被擒,大胜 )( 逃走,不胜不败 )。