博弈论论文(囚徒困境案例纳什均衡案例完全信息静态博弈完全信息动态博弈)

合集下载

“博弈论”中的经典案例

“博弈论”中的经典案例

“博弈论”中的经典案例“博弈论”中的经典案例“博弈论”中一些经典案例,不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然。

“博弈论”中有一些由点及面、发人深思的经典案例,这些案例不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然;不仅成为“博弈论”中的一道亮丽风景,也是整个经济学领域中的学术奇葩。

1、囚徒困境假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。

警察局将这两名嫌疑犯分别关押以防他们串供。

两名囚徒明白,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的妨碍公务罪各判1年;如果一人交代,另一人不交代,交代者有可能会被立即释放,不交代者则将可能被重判8年。

对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。

但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一囚徒交代了,自己就将可能处于非常不利的境地。

对于囚徒A而言,不管囚徒B采取何种策略,他的最佳策略都是交代。

对于囚徒B而言也是如此。

最后两人都会选择交代。

因此,囚徒困境反映了个体理性行为与集体理性行为之间的矛盾、冲突。

囚徒困境现象在现实生活中比比皆是。

记得姜昆和唐杰忠过去说过一个公共楼道占用问题的相声。

住户在公共楼道里堆满了杂物,结果大家都极不方便,以致即将分娩的妇女都没法及时被送往医院。

但你如果不占用公共楼道,别人也会占用。

每一居住面积狭小的住户从自我利益最大化出发,都会选择占用。

但占用的结果却最终损害了大家的利益。

前几年,我国彩电市场上,生产厂家基于自我利益选择大幅降价,但由此引发的价格战使所有生产厂家都遭受重创,这也是一种囚徒困境。

2、斗鸡博弈两只公鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味着认输。

在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、背水一战的决心来,以迫使对方退却。

《囚徒困境》论文

《囚徒困境》论文

(一)囚徒困境理论在学习和生活中,我们会遇到诸多面临决策,进退两难的问题,那么如何决策呢?不同的策略带来不同的损益,有时当博弈双方都以自己的最大利益为策略博弈时,结果相反,时双方都陷入自己所要逃避的困境,这便是囚徒困境!囚徒困境经典案例①:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。

于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。

若二人都互相检Array举(相关术语称互相“背叛”),则二人同样判监8年。

嫌疑人甲、乙双方均不知对方的策略,且都是自私利己之人。

囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。

就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。

试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。

若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。

背叛是两种策略之中的支配性策略。

因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑5年。

(二)生活中的囚徒困境博弈在现实生活中不出不在。

博弈双方大到国际贸易国与国之间的竞争,小到个人与个人之间的经济交易;动物之间同样也存在博弈,甚至植物在阳关下吸收养分也存在博弈。

有竞争就有博弈,有交易就有博弈,博弈渗透到生活中的每个角落。

参与博弈的双方或多方如何采取策略,保障自己最大的利益和最小的损失;往往利益最大的也是风险最大的,一旦失败,损失也是最大的,如何决策,这便使得博弈人陷入“囚徒困境”。

博弈的囚徒困境覆盖面极广,涉及军事决策,政治手段,企业经营,市场策略,生活理财等诸多方面。

浅析囚徒困境与纳什均衡之欧阳家百创编

浅析囚徒困境与纳什均衡之欧阳家百创编

浅析囚徒困境欧阳家百(2021.03.07)囚徒困境是博弈论的非零和博弈中具代表性的例子,指反映个人最佳选择并非团体最佳选择。

囚徒困境的经典案例这里不再复述,让我们看一下身边的例子。

囚徒困境在生活中最常见的表现就是挤公共汽车。

从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。

学生也同样遭遇囚徒困境:减轻中小学生过重负担喊了20多年,仅1985年至2000年的15年里,中央就下达“减负令”49次。

但实际情况却是学生课业负担不但没减下来,反倒呈现出越演越烈之势,致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。

可见“减负令”难以见效,中小学生课业负担不减反增。

又比如近年来炒得火热的楼市——“我没买房,结果房价还是涨了,因为我们无法保证大家都不买房。

可是,我错了吗?没有。

当初如果我买房了,房价下跌了呢?因为我不能保证大家都买房。

人们根本不能预知在疾风暴雨式的调控之下,房价竟还能且调且涨。

可是,我对了吗?没有。

”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。

含泪的“调侃”折射出当下楼市的“囚徒困境”:买,难担高房价重负;不买,难受房价节节攀升的煎熬。

再看中国的法治之路。

虽然法治让所有人都长期受益,甚至执政者自己也不例外,但是一个狭隘理性社会却偏偏无力支撑法治,以至最后每个理性人都不得不忍受法治缺位的非理性之苦。

绝大多数中国人都是很识时务的理性人,不会故意给自己找茬,多数律师也不例外。

不过,任何事物都有两面性,“理性”过了头也就成了非理性。

这就是充斥着当今中国社会的“囚徒困境”:一种行为模式对于个人看起来是很理性的,但是对于个人构成的集体来说却是非理性的,最后对于每个人来说也是非理性的。

我们都不敢站出来说话,对每个人来说都是很“理性”的一种行为方式,但最后的结果只能是让整个社会丧失法治。

博弈论论文(囚徒困境案例纳什均衡案例完全信息静态博弈完全信息动态博弈)

博弈论论文(囚徒困境案例纳什均衡案例完全信息静态博弈完全信息动态博弈)

二、博弈论的发展史 2.1中国传统文化中的博弈论
在我国,博弈论的思想源远流长,古代人民很早就认识了博弈问题,虽然没有形 成一套完整的理论体系和方法,但博弈论的思想和实践活动,则可以追溯到 2000 多年 前。著名的"齐王与田忌骞马"就是一经典事例。这里,田忌进行的是"在给定齐王策略 不变情况下如何取胜"这一策略选择,实际上就是现代博弈论中的完全信息条件下的两 人博弈问题。著名的《孙子兵法》一书对战争胜负的认识,以及胜负之间诸因素的相 互作用的深刻论述,和所提出的一系列军事对策等,都反映出其系统的博弈论思想。 而《三十六计》则可以称做是一部活生生的军事博弈论教科书。《孙子兵法》和《三
博弈论论文
摘要:在现实生活中,人们的利益冲突与一致具有普遍性。因此,几乎所有的决 策问题都可以认为是博弈。虽然博弈论是数学的一个分支,但其应用范围十分广泛, 在经济学、管理学、社会学、政治学、法律学、军事学等领域都有许多成功运用博弈 论的案例。本文对博弈论发展简史、博弈论基本概念进行阐述,对囚徒困境、纳什均 衡、完全信息静态博弈、完全信息动态博弈、进行解析与案例分析。 关键词:博弈论、博弈论发展简史、博弈论基本概念、囚徒困境案例、纳什均衡 案例、完全信息静态博弈、完全信息动态博弈。
一、在生活中广泛应用的博弈论
在高飞老师的带领下,经过一段时间的学习,我对博弈论有了一些肤浅的理解。 诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈, 有人说没有,那是因为缺少发现博弈现象的眼睛。 人生就是在弈棋,学会博弈。虽说 博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学 语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所 以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策 性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。目前在生 物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛 的应用。人们每天都面临着无数个选择,而博弈能运用具体的案例模型和相对应的决 策方法,让人们在最短的时间内作出最有利于自己的选择。 早在 1994 年,提出博弈均衡理论的纳什博士与他的伙伴哈尔萨尼教授、泽尔滕教 授就共同分享了当年的诺贝尔经济学奖和 93 万美元的奖金。2005 年,瑞典皇家科学 院再次把诺贝尔经济学奖颁给了有着以色列、美国双重国籍的罗伯特·奥曼和美国人托 马斯·谢林,以表彰他们在博弈论领域作出的贡献。纳什的贡献是在 1944 年与奥斯 卡·摩根斯特恩合著了《博弈论与经济行为》一书,标志着现代系统博弈理论的的初步 形成。而谢林和奥曼两位博弈论先驱在政治理论、社会学甚至生物学等方面成功运用 到了博弈学理论。奥曼用数学分析为博弈论列出了精确的公式,谢林则是想通过实践 来展示博弈论在社会各个领域的实际意义。他们两位利用博弈论对商业谈判、种族隔 离、武器控制等领域进行了实际分析,谢林教授认为博弈论运用的重要领域应该包括 核威慑和武器控制,同时还可以研究种族关系、有组织犯罪、雇员关系乃至自我管理 等方面。

囚徒困境的论文

囚徒困境的论文

走出“囚徒困境”囚徒困境作为博弈论中的一个经典范例,其博弈理论逐渐被经济学、哲学、伦理学、管理学等诸多学科的研究所重视,辩证的看待这一研究现象,是促进人们深入研究相关社会现象的一种特殊的思维路劲和方法。

一、囚徒困境经典案例分析囚徒困境的内容是这样的:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。

于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

若二人都互相检举(互相“背叛”),则二人同样判监2年。

用表格概述如下:们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时做出的。

博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因此只能实现对他们都不理想的结果(各判2年),并且这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒困境”。

“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。

但是这样的分析是基于单次博弈的基础之上,而在重复的囚徒困境中,博弈会被反复的进行,因而没个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。

这时,合作可能会作为均衡的结果出现。

欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。

作为反复接近无限的数量,纳什均衡趋向于帕累托最优。

二、类似囚徒困境的经典案例分析在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。

07 静态博弈及纳什均衡的相关案例

07 静态博弈及纳什均衡的相关案例
1 1 • 反应函数: q1 48 q2 q3 2 2
公地悲剧—— N人囚徒困境
1 1 • 对于所有牧民: q1 R1 (q2 , q3 ) 48 2 q2 2 q3 1 1 q2 R2 (q1 , q3 ) 48 q1 q3 2 2 1 1 q3 R1 (q1 , q2 ) 48 q1 q2 2 2
• 私人牧场上:max (V Q – c Q) • 公有牧场上:max (V qi - c qi )
• 结果: Q * common > Q * private Q=∑qi
公地悲剧—— N人囚徒困境
• 假设:

一只羊的价值 一只羊的成本
V=100-Q c=4
• 情形1:公共牧场上 • 支付: 1 q1[100 (q1 q2 q3 )] 4q1
* * • 均衡解: q1* q2 q3 24 * * 1* 2 3 576Q*comon 72* 1728
公地悲剧—— N人囚徒困境
情形2:私人牧场上 支付:
private Q(100 Q) 4Q
max private Q(100 Q) 4Q 96Q Q 2 FOC : 96 2Q 0 FOC : 96 2Q 0 Q* *48 Q 48
猪圈的一边有个踏板,每踩一 下踏板,另一边的投食口就会 落下一些食物。
如果一只猪去踩踏板,另一只 猪就有机会抢先吃到食物。
智猪博弈——不对称的N人博弈
参与者:大猪,小猪
战略: 按,等待
智猪博弈——不对称的N人博弈
支付:
按 按 3, 1 7 , -1
小猪
等待 2, 4 0, 0

博弈论“囚徒困境”的四种形式

博弈论“囚徒困境”的四种形式

博弈论中的“囚徒困境”摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。

其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。

本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。

关键词:博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。

它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。

为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。

当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。

用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) :囚徒2囚徒1(表1)假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。

容易看出,由于对于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。

二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。

而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。

下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。

首先观察“囚徒困境”的有限博弈,以T记基本博弈的重复次数。

博弈论经典案例“囚徒困境”及其实证分析

博弈论经典案例“囚徒困境”及其实证分析

博弈论经典案例“囚徒困境”及其实证分析最近三四十年,经济学经历了一场“博弈论革命”,就是引入博弈论的概念和方法改造经济学的思维,推进经济学的研究。

诺贝尔经济学奖授予包括美国普林斯顿大学的纳什博士在内的3位博弈论专家,可以看作是一个标志,这自然也激发了人们了解博弈论的热情。

博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。

博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡,也就是说,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。

一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。

“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。

讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。

可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。

A和B均坦白是这个博弈的纳什均衡。

这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。

即是说,不管A坦白或抵赖,B的最佳选择都是坦白。

反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。

结果,两个人都选择了坦白,各判刑8年。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈理论的同时,在博弈论的诸多方面做出了开创性研究,如合作博弈、可转移效用、 联盟形式以及冯诺伊曼--摩根斯坦稳定集等,该书还说明了导致后来在经济学中广泛应 用的公理化效用理论。该书的出版,意味着博弈论作为一种系统理论的开始,奠定了 现代经济博弈论的基础,构建了博弈论这一学科的理论框架。正是通过冯诺伊曼和摩 根斯坦对经济行为主体行为特征的分析,才使经济学家们了解到分析和研究经济问题 的这一新工具。整个 50 年代是博弈论蓬勃发展的时期,在这一埋藏,涌现了许多著名 的博弈理论家,他们提出了一系列重要概念和理论,形成了现代博弈论的理论体系。 1950—1953 年间,美国普林斯顿大学数学系的约翰纳什(John Nash)发表了四篇有 划时代意义的论文。纳什证明了非合作博弈均衡,纳什均衡的存在性,并提出了"纳什 方案",该方案建议对合作博弈的研究可通过简化为非合作博弈形式来进行;纳什还创 立了公理化讨价还价理论,证明了纳什讨价还价解的存在性,并首次提出了纳什方案 的实施。人们认为,纳什为非合作的一般理论和合作的讨价还价理论奠定了基础。 1950 年,塔克(A.W.Tucker)在斯坦福大学的一份备忘录中揭示了"囚犯的困境"。 1952 年,麦克金斯(John Charles C.Mckinsey)出版了第一本博弈论教科书《博弈论 入门》。由库恩(H.W.Kuhn)和塔克(A.W.Tucker)编辑的系统介绍和评述博弈论及 其最新发展的丛书《博弈论论文集》共四卷在普林斯顿大学出版。在该书第二卷中, 库恩(1953)提出了扩展型博弈及其形成;沙伯利(Lloyd S.Shapley)(1953)定义 了聪明联盟博弈解的概念,即著名的"沙伯利值"。在第四卷中,沙伯利和、吉利斯 (D.B.Gillies)(1950—1953)共同提出了作为一般解概念的核心的概念。此外,沙伯利 (1953)还开创了随机博弈理论。卢斯(Robert Duncan Luce)和雷法 (Howard Raiffa)(1957)出版了有巨大影响的《博弈与决策》。奥曼(Aumann) (1959)引进了强均衡的概念。舒比克(Martin Shubik)(1959)出版了《策略与市场 结构:竞争、垄断与博弈论》一书,标志着博弈论在经济学中应用的开始。在 50 年代 末,还出现了关于重复博弈的研究,主要结果就是"无名氏定理"。此外,还提出了一 些关于随机博弈和动态博弈的概念及模型。总之,以纳什非合作博弈理论为核心的现 代博弈论体系,在 50 年代已经形成。 第三阶段:1960—1969 年,博弈理论的进一步完善和发展。 整个 60 年代是博弈理论的进一步发展和完善时期,博弈论专家们除了对一些重要的基 本概念做系统阐述和证明外,还对合作博弈解、稳定集、核心的要领等做了更深入的 研究和拓广。奥曼和皮莱格(B.Peleg)(1960)、马希勒(M.Maschler)(1965)、沙伯 利(1969)等人系统研究了非转移效用的联盟博弈问题,从而完善和发展了博弈论。 博弈论研究在地域上也突破了原来的普林斯顿大学和兰德公司的局限,在以色列、德 国、比利时及苏联等都建立了研究中心。60 年代,博弈论研究的重大突破和发展,是 不完全信息博弈论的创立。1966 年,奥曼和马希勒的研究中出现了具有不完全信息的 无限重复博弈。1966 年海萨尼对合作博弈与非合作博弈的不同,给出了现在使用最普
目录
一、在生活中广泛应用的博弈论............................................................................. 2 二、博弈论的发展史 ............................................................................................. 2 2.1 中国传统文化中的博弈论 ......................................................................... 2 2.2 外国早期的博弈论 ................................................................................... 3 2.3 博弈论发展阶段 ...................................................................................... 3 三、博弈论相关概念 ............................................................................................. 6 3.1博弈所涉及的内容 .................................................................................... 7 3.2 博弈的分类。 ........................................................................................... 8 四、囚徒困境 ....................................................................................................... 8 4.1 囚徒困境应用实例..................................................................................... 9 五、 纳什均衡 .................................................................................................... 10 5.1 纳什均衡应用实例................................................................................... 11 5.1.1 公共地的悲剧 ................................................................................ 11 5.1.2 公共物品的私人自愿供给 ............................................................... 13 5.1.3 基础设施建设,中央政府和地方政府之间的博弈 ................................ 15 六、完全信息静态博弈 ........................................................................................ 20 七、完全信息动态博弈 ........................................................................................ 20
二、博弈论的发展史 2.1中国传统文化中的博弈论
在我国,博弈论的思想源远流长,古代人民很早就认识了博弈问题,虽然没有形 成一套完整的理论体系和方法,但博弈论的思想和实践活动,则可以追溯到 2000 多年 前。著名的"齐王与田忌骞马"就是一经典事例。这里,田忌进行的是"在给定齐王策略 不变情况下如何取胜"这一策略选择,实际上就是现代博弈论中的完全信息条件下的两 人博弈问题。著名的《孙子兵法》一书对战争胜负的认识,以及胜负之间诸因素的相 互作用的深刻论述,和所提出的一系列军事对策等,都反映出其系统的博弈论思想。 而《三十六计》则可以称做是一部活生生的军事博弈论教科书。《孙子兵法》和《三
2.3博弈论发展阶段
第一阶段:1944 年以前,早期思想和基本概念的形成。 1944 年以前,博弈论并没有形成完整的思想体系和方法论体系,人们主要集中于严格 的竞争对策的研究,即通常所说的二人零和博弈。但这一阶段却提出了一些重要的基 本概念和定理,这些基本概念和定理成为现代博弈论发展的基础。早在 1838 年,法国 经济学家奥古斯汀古诺(Augustin Cournot)在分析生产者竞争时,就利用均衡概念研 究了寡头市场的情况,并使用了解的概念,该概念实际上是后来的纳什均衡的一种严 格说法。1881 年,英国经济学家埃奇沃斯(Francis Y.Edgworth)提出了"契约曲线 (Contract Curve)"作为决定个体之间交易结果问题的一个解。1913 年,博弈论中第 一个定理--泽梅罗定理(Zermelo Theorm)断言,国际象棋是严格确定的,尽管泽梅 罗定理的适用范围是具有完全信息的两人零和博弈,但它的影响是巨大的,在五六十 年代曾引起许多博弈论专家和经济学家的广泛深入研究。1921—1927 年间,波莱尔 (Emile Borel)发表了四篇关于策略博弈的文章,第一次给出了一个混合策略的现代 形式,并找到了有 3 个或多个可能策略的二人博弈的最小最大解。1928 年,冯诺伊曼 (John von Neumann)证明了最小最大定理,该定理被认为是博弈论的精华,博弈论 中的许多概念都与该定理相联系。1930 年,泽尤森(F.Zeuthen)的著作《垄断问题 与经济竞争》出版,在书中他提出了一个关于讨价还价问题的解,该解后来被海萨尼 证明与纳什的讨价还价解是等价的。此外,这一阶段还提出了博弈的扩展形式、纯策 略、策略形式、混合策略、个体理性等重要概念。 第二阶段:1944~1959 年,现代博弈论的建立与理论体系的基本形成。 1944 年,美国普林斯顿大学的著名数学家冯诺伊曼和经济学家摩根斯坦 (Oskar Morgenstern)合著的《博弈论与经济行为》一书出版。该书在详述两人零和
博弈论论文
摘要:在现实生活中,人们的利益冲突与一致具有普遍性。因此,几乎所有的决 策问题都可以认为是博弈。虽然博弈论是数学的一个分支,但其应用范围十分广泛, 在经济学、管理学、社会学、政治学、法律学、军事学等领域都有许多成功运用博弈 论的案例。本文对博弈论发展简史、博弈论基本概念进行阐述,对囚徒困境、纳什均 衡、完全信息静态博弈、完全信息动态博弈、进行解析与案例分析。 关键词:博弈论、博弈论发展简史、博弈论基本概念、囚徒困境案例、纳什均衡 案例、完全信息静态博弈、完全信息动态博弈。
相关文档
最新文档