博弈论论文--非合作博弈论

合集下载

供应链管理论文非合作博弈论文:基于博弈论的制造商

供应链管理论文非合作博弈论文:基于博弈论的制造商

供应链管理论文非合作博弈论文:基于博弈论的制造商摘要:传统供应链管理理论认为,制造商与销售商作为供应链上的两大组成成员,双方合作对其更为有利。

但基于合作与非合作博弈论的相关理论,本文构建了关于制造商—销售商的二级供应链解析模型,提出新的认识:在一定情况下,双方之间采取竞争更为有利。

本文并提出了相关对策。

关键词:供应链管理合作博弈非合作博弈制造商销售商制造商与销售商作为供应链上的两大组成成员,传统供应链管理理论认为,两者需要合作,以实现供应链的互利共赢。

但事实并非总是如此,企业在交易中的博弈分为两类:合作博弈和非合作博弈。

合作博弈是博弈双方通过谈判目的是为了双方的利益得到最大程度的保障,非合作即博弈双方因利益冲突不能达成协议或者达成协议后背叛协议。

1 制造商与销售商的合作博弈与非合作博弈分析传统供应链管理理论趋向于节点企业之间的合作,但笔者认为,合作并非总是最佳选择。

以下通过某个制造商与某销售商的博弈来分析两者合作与不合作的收益比较。

设有一个由制造商和销售商组成的二级供应链,为市场提供某种商品,该商品的市场需求函数为p=150-6q。

其中p 为商品的价格,q为市场对商品需求数量。

制造商提供给销售商的批发价为每件w。

销售商有不变的边际成本c=16。

现在要确定制造商如何确定批发价w,销售商如何确定产品的销售价p,以实现各自的利润最大。

因为三次函数总是含有两次波动,所以它能够很好的充当这个角色。

于是可以假设某个制造商的总成本函数tc=128+69q-14q2+q3 (1)制造商与销售商之间的博弈有两大类:一是非合作博弈;二是合作博弈。

1.1 制造商与销售商非合作博弈非合作博弈我们可以认为是制造商和销售商独立行动,各自实现自身利润最大化,各自作为独立企业。

用π1表示制造商的利润,则π1=(w-ac)q=wq-tc(2)用π2表示销售商的利润,则π2=(p-w-c)q (3)因为p=150-6q,所以可把此函数看成π2关于p的方程,为了使销售商的利润最大化,则令经过整理,得w2-252w+12692=0解得:w1=69.5,w2=182.5而w2=182.5 不符合(6)得要求,故舍去。

非合作博弈纳什均衡及其关系

非合作博弈纳什均衡及其关系

非合作博弈纳什均衡及其关系非合作博弈是博弈论的重要分支之一,它研究的是在缺乏沟通和协调的情况下,个体之间的决策和行为。

而纳什均衡则是非合作博弈中的一个重要概念,指的是一种策略组合,使得在这种组合下,任何一个个体都没有动力单独改变自己的策略。

本文将介绍非合作博弈的基本概念,并探讨纳什均衡与博弈者行为之间的关系。

我们来了解一下非合作博弈的基本概念。

非合作博弈是指每个博弈者在做出决策时,只考虑自己的利益,而不关心其他博弈者的利益。

在非合作博弈中,博弈者之间彼此独立,没有任何形式的合作和沟通。

博弈者通过选择不同的策略来追求自己的利益,并根据其他博弈者的选择来调整自己的策略。

在非合作博弈中,博弈者的目标是尽可能地使自己获得最大的利益。

而纳什均衡是非合作博弈中的一个重要概念,它指的是一种策略组合,使得在这种组合下,任何一个博弈者都没有动力单独改变自己的策略。

换句话说,纳什均衡是一种稳定的策略组合,使得每个博弈者都认为在其他博弈者的策略给定的情况下,自己没有更好的选择。

在纳什均衡下,所有博弈者都做出了最优策略的选择,不存在任何一个博弈者可以通过改变自己的策略来获得更大的利益。

非合作博弈的纳什均衡与博弈者的行为密切相关。

在非合作博弈中,每个博弈者根据其他博弈者的选择来做出自己的决策。

当博弈者选择的策略达到纳什均衡时,他们就没有动力再改变自己的策略。

这意味着博弈者的行为是一种理性行为,他们根据自己的利益来做出决策,而不会被其他博弈者的选择所左右。

然而,在非合作博弈中,并不是所有的博弈都存在纳什均衡。

有些博弈可能存在多个纳什均衡,而有些博弈则可能不存在纳什均衡。

对于存在多个纳什均衡的博弈,博弈者可以根据自己的目标和利益来选择不同的策略。

而对于不存在纳什均衡的博弈,博弈者的行为将变得复杂和不确定。

非合作博弈纳什均衡的研究对于理解人类行为和社会决策具有重要意义。

在现实生活中,人们常常面临着各种博弈情境,需要根据自己的利益和目标做出决策。

博弈论论文

博弈论论文

博弈论论文引言博弈论是数学中一个重要的分支,研究决策制定者之间的相互作用和冲突。

它的应用领域包括经济学、管理科学、政治学等。

在本论文中,我们将探讨博弈论的基本概念,讨论不完全信息情况下的博弈模型,并分析几种常见的博弈解决概念。

博弈论的基本概念博弈博弈是指一组参与者在给定的规则下进行决策,并从中获得一定的收益或效益。

参与者之间的决策互相影响,并且他们的决策往往是非合作的。

策略策略是指参与者选择的行动方案。

他们根据自己对其他参与者行为的预期和自身的目标选择策略。

支配策略对于一个参与者而言,支配策略是指无论其他参与者采取何种策略,该参与者的一个策略总是获得更高的收益。

在博弈论中,支配策略是非常重要的概念。

纯策略和混合策略纯策略是指参与者选择一个明确的行动方案,而混合策略是指参与者以一定的概率分布来选择行动方案。

不完全信息博弈模型基本的博弈模型假设参与者对其他参与者的策略和效用函数有完全的信息。

然而,在现实生活中,很多博弈情况下,参与者并不完全了解其他参与者的信息。

不完全信息博弈模型引入了信息不对称的概念。

信息不对称信息不对称指的是在博弈中,一个参与者对其他参与者的信息有限或不完全。

这会导致参与者的决策受到信息的限制,进而影响博弈的结果。

基本模型不完全信息博弈模型可以通过一个双人博弈的例子来说明。

假设有两个参与者A和B,他们面临的博弈情境是投资决策。

参与者A可以选择投资或者不投资,参与者B也可以选择投资或者不投资。

他们各自的收益函数与投资与否有关,但是参与者B的收益函数对于参与者A是不可见的。

不完全信息博弈的解不完全信息博弈的解决方法包括纳什均衡和贝叶斯博弈。

纳什均衡纳什均衡是博弈论中最重要的解概念之一。

在不完全信息博弈中,纳什均衡指的是一组策略,使得任何一个参与者在其他参与者选择策略的情况下都没有改变自己的策略的动机。

贝叶斯博弈贝叶斯博弈是指在不完全信息博弈中,参与者对其他参与者的信息有先验的概率分布,并且随着游戏的进行不断修正对其他参与者信息的估计。

大学选修课《博弈论》论文

大学选修课《博弈论》论文

《博弈论》学生结课论文班级:姓名:学号:完成时间:XX大学XX学院用博弈分析生活摘要:在生活中,博弈无处不在。

无论是日常游戏,还是体育竞技,亦或是厂商之间的价格战,国家的贸易战,军备竞赛等,都应用到了博弈论的思想。

例如京东与当当之间的图书价格战,中美贸易战,大学生活中的占座问题,学校是否补课问题,企业的效率工资制度等。

囚徒困境是博弈论中非零和博弈的典型模型,它反映了个人最佳选择并非是集体的最佳选择这一现象。

关键词:囚徒困境,纳什均衡,完全信息静态博弈,非零和博弈,生活应用。

一,理论基础现代博弈论发源于西方的17世纪,1928年,冯.诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生,到1944年,冯.诺依曼与摩根斯坦共著划时代巨著《博弈论与经济行为》的发表标志着现代博弈论的诞生。

其实在我国古代,“博弈”这个词就早早出现了,比如《史记》中记载的“田忌赛马”就是一个非常经典的博弈问题。

现代博弈论的主要应用领域是经济活动中的经营决策,市场竞争以及政治军事活动中的谈判,联合等。

博弈论所研究的博弈本质上就是(个人,小组,或其他组织的)决策行为,通过最优策略来达到博弈方的得益最优。

其实博弈现象不仅仅存在于经济活动中,在我们的日常生活中也是随处可见的,通过对博弈论的学习,我们能够将博弈思想与现实生活联系起来,从而获得最优策略。

下面我将从囚徒困境出发对生活中的博弈作出分析。

二,囚徒困境模型囚徒困境是博弈论中非零和博弈的典型模型,它反映了个人最佳选择并非是集体的最佳选择这一问题。

囚徒困境源自梅里尔•弗勒德和梅尔文•德雷希尔拟定出的相关困境理论,由艾伯特•塔克以囚徒方式阐述。

囚徒困境的原模型是警察抓住两名合伙犯罪的罪犯,为防止串供而将其分开审问,如果囚徒1和2都选择坦白,那么二者都将获刑5年,如果都不坦白,那么将获刑一年,如果囚徒1坦白,而囚徒2不坦白,那么囚徒1被立即释放,囚徒2获刑8年,如果囚徒1不坦白,囚徒2坦白,那么囚徒1获刑8年,囚徒2立即释放。

博弈论论文(囚徒困境案例纳什均衡案例完全信息静态博弈完全信息动态博弈)

博弈论论文(囚徒困境案例纳什均衡案例完全信息静态博弈完全信息动态博弈)

二、博弈论的发展史 2.1中国传统文化中的博弈论
在我国,博弈论的思想源远流长,古代人民很早就认识了博弈问题,虽然没有形 成一套完整的理论体系和方法,但博弈论的思想和实践活动,则可以追溯到 2000 多年 前。著名的"齐王与田忌骞马"就是一经典事例。这里,田忌进行的是"在给定齐王策略 不变情况下如何取胜"这一策略选择,实际上就是现代博弈论中的完全信息条件下的两 人博弈问题。著名的《孙子兵法》一书对战争胜负的认识,以及胜负之间诸因素的相 互作用的深刻论述,和所提出的一系列军事对策等,都反映出其系统的博弈论思想。 而《三十六计》则可以称做是一部活生生的军事博弈论教科书。《孙子兵法》和《三
博弈论论文
摘要:在现实生活中,人们的利益冲突与一致具有普遍性。因此,几乎所有的决 策问题都可以认为是博弈。虽然博弈论是数学的一个分支,但其应用范围十分广泛, 在经济学、管理学、社会学、政治学、法律学、军事学等领域都有许多成功运用博弈 论的案例。本文对博弈论发展简史、博弈论基本概念进行阐述,对囚徒困境、纳什均 衡、完全信息静态博弈、完全信息动态博弈、进行解析与案例分析。 关键词:博弈论、博弈论发展简史、博弈论基本概念、囚徒困境案例、纳什均衡 案例、完全信息静态博弈、完全信息动态博弈。
一、在生活中广泛应用的博弈论
在高飞老师的带领下,经过一段时间的学习,我对博弈论有了一些肤浅的理解。 诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈, 有人说没有,那是因为缺少发现博弈现象的眼睛。 人生就是在弈棋,学会博弈。虽说 博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学 语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所 以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策 性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。目前在生 物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛 的应用。人们每天都面临着无数个选择,而博弈能运用具体的案例模型和相对应的决 策方法,让人们在最短的时间内作出最有利于自己的选择。 早在 1994 年,提出博弈均衡理论的纳什博士与他的伙伴哈尔萨尼教授、泽尔滕教 授就共同分享了当年的诺贝尔经济学奖和 93 万美元的奖金。2005 年,瑞典皇家科学 院再次把诺贝尔经济学奖颁给了有着以色列、美国双重国籍的罗伯特·奥曼和美国人托 马斯·谢林,以表彰他们在博弈论领域作出的贡献。纳什的贡献是在 1944 年与奥斯 卡·摩根斯特恩合著了《博弈论与经济行为》一书,标志着现代系统博弈理论的的初步 形成。而谢林和奥曼两位博弈论先驱在政治理论、社会学甚至生物学等方面成功运用 到了博弈学理论。奥曼用数学分析为博弈论列出了精确的公式,谢林则是想通过实践 来展示博弈论在社会各个领域的实际意义。他们两位利用博弈论对商业谈判、种族隔 离、武器控制等领域进行了实际分析,谢林教授认为博弈论运用的重要领域应该包括 核威慑和武器控制,同时还可以研究种族关系、有组织犯罪、雇员关系乃至自我管理 等方面。

博弈论论文

博弈论论文

浅谈博弈论——机电1204 卢志玲博弈论,有时也称为对策论,或者赛局理论,应用数学的一个分支,目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

主要研究公式化了的激励结构(游戏或者博弈)间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

表面上不同的相互作用可能表现出相似的激励结构,所以他们是同一个游戏的特例。

其中一个有名有趣的应用例子是囚徒困境。

具有竞争或对抗性质的行为称为博弈行为。

在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。

为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。

比如日常生活中的下棋,打牌等。

博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。

生物学家使用博弈理论来理解和预测进化(论)的某些结果。

目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。

非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。

与上述四种博弈相对应的均衡概念为:纳什均衡,子博弈精炼纳什均衡,贝叶斯纳什均衡,精炼贝叶斯纳什均衡。

博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型,等等。

结合所学知识,本论文中我将用博弈论分析两个例子。

第一个是关于中国移动通信业价格竞争的博弈分析。

基于 SCP 范式,分析了目前中国移动通信业的市场竞争格局,同时运用博弈论对中国移动通信业的价格竞争行为进行探讨和分析。

我国移动通信市场上获得经营移动通信服务业务的只有两家运营商,即中国移动与中国联通。

博弈论与信息经济学-非合作博弈理论

博弈论与信息经济学-非合作博弈理论
2、这一方法对博弈结果的预测经常是不准确的.
例2.2 石头、剪刀、布的支付矩阵
乙 甲
石头 剪刀
石头
0,0 -1,1
剪刀
1,-1 0,0

-1,1 1,-1
布 1,-1 -1,1 0,0
利用重复剔除严格劣策略无法求解
例2.6 利用重复剔除严格劣策略无法求解
乙 甲 上 中 下

0,4 4,0 3,5
策 略:政 济
府:救济,不救
不找工作
下岗工人:找工作,
工人 政府
救济
找工作 不找 3,2 -1,3
不救济 -1,1 0,0
求出性别大战博弈的混合策略纳什均衡

足球

足球 3,2
芭蕾 1,1
芭蕾 -1,-1 2,3
第五节 纳什均衡的存在性
定理1:(Nash, 1950)每个有限策略型博弈至 少存在一个纳什均衡(纯策略的或混合策略的)。
上下中 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1
中上下 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1
中下上 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1
下上中 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1
下中上 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
例2.4 性别大战(battle of the sexes)
局中人:男,女 策 略:男:看足球,看芭蕾 女:看足球,看芭蕾 支付矩阵:见下一页
性别大战的支付矩阵
女 男
足球
足球 3,2
芭蕾 1,1
芭蕾
-1,-1
2,3
第二节 重复剔除严格劣策略均衡

生活中的博弈论论文

生活中的博弈论论文

生活中的博弈论这学期我在人文课的选择上,我选了“生活中的博弈论”这门课。

本来以为会很枯燥乏味,现在课要结束了,回想起来觉得还是挺有趣的。

其中含有很浓的智慧气息,趣味横生。

下面就是我关于这门课的小论文。

我们首先就会问,什么是博弈论?其实就是研究个体如何在错综复杂的相互影响中得出最合理的策略。

生活中每个人,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。

博弈论是研究棋手们“出棋”着数中理性化、逻辑化的部分,并将其系统化为一门科学。

事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。

数学家们将具体的问题抽象化,通过建立完备的逻辑框架、体系研究其规律及变化。

这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性”的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。

博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,博弈论经过了这么多年的发展已经完善成为一门十分重要的经济学分支学科,不管是在结构分析还是决策预测等方面都发挥着越来越重要的作用,尤其对于理性人来说懂得如何博弈就显得越发重要。

下面我说一下我个人的想法。

博弈其实就是一种游戏,是如何做出对自己有利选择的游戏,但又区别于传统的如体育运动、下棋、打牌等游戏,同时又和这些有些有本质的共同特征,如都有一定的规则,都有一个结果,策略至关重要,同时策略和得益有相互依存性,游戏者不同的策略会带来不同的结果。

博弈论论文

博弈论论文

博弈论论文:让·梯若尔让·梯若尔(Jean Tirole)教授,2014年诺贝尔经济学奖获得者,是世界著名的经济学大师(1990-2000年),世界经济学家排名第二。

让·梯若尔(Jean Tirole)教授,1978年,在获得巴黎第九大学应用数学博士学位后,对经济学兴趣油生,他来到著名的美国麻省理工继续深造,并于1981年获得经济学博士学位。

现担任法国鲁古兹大学产业经济研究所科研所长,同时在巴黎大学,麻省理工学院担任兼职教授,并先后在哈佛大学,斯坦福大学担任客座教授。

1984年至今担任计量经济学杂志副主编。

同时还是普纳思经济管理研究院学术委员。

梯若尔对经济学惊人的直觉,也是一般的经济学家望尘莫及的。

这个瘦高身材的法国绅士,目光敏锐,衬衫的颜色永远高贵并跟外套和谐,脸上洋溢着不瘟不火的微笑,脑子里随时可以调出各种各样的经济学模型。

梯若尔具有非凡的概括与综合能力,他总是能够把经济学的任何一个领域中最为本质的规律和最为重要的成果以最为简洁的经济学模型和语言表达出来,并整理成一个系统的理论框架。

梯若尔仿佛专为经济学而生,被誉为当代“天才经济学家”。

纵观其20多年学术生涯中所作出的贡献,足令任何经济学家瞠目:300多篇高水平论文,11部专著,内容涉及经济学的任何重要领域———从宏观经济学到产业组织理论,从博弈论到激励理论,到国际金融,再到经济学与心理学的交叉研究,梯若尔都作出了开创性的贡献。

智慧的光芒和热量洒向经济学每一个研究领域。

梯若尔纵横驰骋,尽情挥洒,激情所至,堪称天下无敌。

欧洲大陆自上世纪80年代兴起经济学复兴运动以来,最成功的当属法国图卢兹大学产业经济研究所(IDEI)。

同许多法国经济学家一样,梯若尔深深地热爱着他的祖国,1988年,梯若尔从美国回到法国,和著名经济学家让.雅克(已故)教授一起创办了享誉全球的法国产业经济研究所(IDEI),担任科研主任。

并最终辞去了麻省理工学院的终身教授职位。

博弈论论文——精选推荐

博弈论论文——精选推荐

博弈论论⽂博弈论在⾼校考试中的应⽤——混合策略博弈与完全静态博弈【摘要】⼤学⽣活是⾊彩斑斓的,喜怒哀乐⽆其不有,犹如我们⼈⽣的缩影,我们不断地⾛进困境⽽⼜从困境中⾛出来,从来不怕有困难,怕的是⾯临困难我们找不到⽅法去突围,这时的我们就会像没头苍蝇⼀样毫⽆章法地去试探,⾛多少弯路可想⽽知,⽽这些困难将在较⼤的程度上限制了我们对实践和资源的把握,等同于有了飞翔的翅膀却⽆法翱翔。

学习了博弈论之后,希望能从理论的⾓度出发,在实践中加以应⽤,让我们的⽣活质量有所提升。

【关键词】混合策略博弈;完全静态博弈⼀、博弈论在⾼校考试中的应⽤在⾼校考试作弊丑闻层出不穷的今天,出台⼀些政策来净化学⽣的学习环境、使学⽣们养成良好的学习习惯是⼗分必要的。

⽽找出其发⽣的内在原因,运⽤博弈论的思想进⾏分析之后,就能够提出可⾏的解决措施,想要杜绝⾼校考试作弊⾏为并不是那么难。

研究对象:学校,学⽣群体(区分为优秀⽣与差等⽣)——分析舞弊者与他们之间的博弈关系,监考⽼师;其中学⽣与学校的博弈为混合策略博弈,⽽学⽣与学⽣群体之间的博弈为完全静态博弈。

相互关系:⼤学⽣与⾼校的博弈。

⼆、⼤学⽣与⾼校的博弈分析事实说明:学⽣参加考试,其作弊⾏为发⽣与否,与⾼校的考试制度息息相关,⽽考试制度的直接表现者为监考⽼师,所以本博弈分析,将⾼校具体为监考⽼师,即考察学⽣与⽼师的博弈分析,⽽且该博弈⽤到的信息均为深⼤⽬前的考试制度信息。

三、舞弊者与⼤学⽣群体内部的博弈分析1.⼤学⽣内部的诚信问题背景资料:从2014年来看,⼤学⽣内部的诚信问题突出,关于⼤学⽣不诚信的报道不绝于⽿。

(1)考试作弊成风。

(2)抄袭论⽂现象普遍,有⼀句很经典的话形容当前⼤学⽣如何写论⽂:上⽹,复制,粘贴,打印。

(3)为了骗取国家助学⾦,利⽤各种关系开出三级证明,将⾃⼰包装成贫困⽣,申请到钱后,⼤吃⼤喝,⼤肆挥霍。

(4)在就业时,伪造简历。

曾有⼀次⼈才招聘会上,收到的100份⾃荐表中,竟有5⼈为来⾃同⼀学校的学⽣会主席。

非合作博弈

非合作博弈

• 第一节 占优策略均衡 • 第二节 纳什均衡的应用例子 • 第三节 古诺模型 • 第四节 非零和博弈
6
❖ 一、严格占优策略的定义 博弈参与者进行策略选择时,有可能存在某个策略的收益严 格优于其他策略的情况,该策略被称为严格占优策略 (Strictly Dominant Strategy)。
• “囚徒困境”博弈与严格占优策略
(7,10) (-3,-3)
15

努力
偷懒

努力
(a,a) (d,c)
偷懒
(c,d) (b,b)
设(努力,努力)最大收益为a,(偷懒,偷懒)的最 小收益为b , a>b. 两个参与者选择不同策略时所得的 收益分别为c、d(c>d)
只要a>c>d>b,占优策略均和合作解一致
16
• 一、纳什均衡的定义 给定其他参与者在博弈均衡时的策略,任何博弈参与者
• 他的回答是,“把车钥匙给医生,让他带着 老人去医院看病,我留下来陪着一见钟情的
人雨中漫步。”
• 什么是博弈呢?博弈实际上就是如何在现有 条件下做出最优选择的一种策略。
• 博弈论也叫做对策论,或称赛局理论,是研 究具有斗争或竞争性质的现象的理论和方法。 可以简单的说,博弈论就是运用你的智慧和 理性思维,在纷繁的选择中能够使你的利益 达到最大化的一门科学。
• 占优策略均衡:当一个博弈中的每位参与者
都选择了各自的占优策略时,相应的博弈结果就 是占优策略均衡
• 社会两难博弈
• 从整体利益考虑的解叫做博弈的合作解,一般占 优策略均衡形成的解都是非合作解,占优策略均 衡与合作解相悖,称此类博弈为社会两难问题
• 解决途径
• 合约、法规、协议或其他手段使参与者们都能 履行协调后的策略

博弈论论文

博弈论论文

博弈论论文博弈论是一门研究决策制定和行为选择的学科,主要研究在多方参与的决策过程中各方之间的相互影响与竞争。

博弈论的应用领域非常广泛,包括经济学、社会学、政治学、管理学等。

博弈论可以分为非合作博弈和合作博弈两大类。

非合作博弈是指在决策过程中各方之间缺乏有效的沟通和合作,每个参与者根据自身利益来做出决策。

合作博弈则是指各方之间可以进行有效的沟通和合作,通过达成共识来制定决策。

在非合作博弈中,博弈方通过评估自身的收益和损失来制定最优的策略。

博弈论中的核心概念包括博弈参与者、策略集、支付函数和均衡点等。

通过分析不同博弈的策略和结果,可以帮助决策者制定最优的决策,并预测其他参与者的行为。

合作博弈更加侧重于协作和合作的过程。

在合作博弈中,各方之间可以进行有效的沟通和协商,通过合作达成共同的利益最大化的目标。

博弈论中的合作博弈模型包括核心、稳定集和Shapley值等。

这些模型可以帮助分析博弈参与者之间的合作关系和利益分配。

博弈论的应用非常广泛。

在经济学中,博弈论可以用于分析市场竞争、价格决策和产业组织等问题。

在社会学中,博弈论可以用于研究社会冲突、合作行为和群体决策等。

在政治学和管理学中,博弈论可以用于分析政治竞选、战略决策和组织协调等。

博弈论的研究还面临许多挑战和问题。

例如,博弈论中的均衡概念往往基于完全理性的假设,实际中的决策者可能存在有限理性和行为偏差。

另外,博弈论的分析也需要依赖大量的信息和数据,而现实中的信息不对称和不完全可能导致分析结果的不准确性。

总之,博弈论是一门重要的学科,它提供了分析决策和行为选择的有效工具。

通过深入研究博弈论的理论和方法,可以帮助我们更好地理解人类社会的运作机制,并为决策制定提供科学依据。

博弈论-纳什均衡(非合作博弈均衡)

博弈论-纳什均衡(非合作博弈均衡)

完全理性:理性指一种行为方式,它适合实现指定目标,而且在给定条件和约束的限度之内。

在不同的学科领域,理性所涵盖的内容存在着差异完全理性的内涵具有完全理性的行为人是个无所不知的超人,他具有纵向和横向方面完备的知识。

在纵向方面,他可以预测未来;在横向方面,他通晓资源、交易伙伴和环境等情况。

具体而言,行为人的完全理性包括以下隐含内容。

(1)不存在不确定性,即使存在不确定性,也可以预知不确定性的概率分布。

也就是说,对于具有完全理性的行为人来说,一切信息都是确定的。

(2)行为人具有可以确定的效用函数(消费者的效用函数和厂商的利润函数可以统称为效用函数),同时行为人具有同质性以及一致性的偏好体系。

(3)选择结果具有描述不变性、程序不变性和前后关系独立性。

描述不变性要求行为人选择的先后顺序不应依赖于所描述或显示的选项,也就是说如果行为人经过再三思考,将两种描述视为同一问题的同义表达,那么它们必定导致相同的选择——即这种思考不存在异处;程序不变性要求不同方式的等价学说揭露相同的偏好次序;前后关系独立性指一项选择与其他替代方案互为独立的原则,它要求在给定Z而不提供有关X或Y 的新的信息的情况下,X与Y的优先权顺序不应该依赖于Z是否有效。

(4)行为人具备完备的计算和推理能力,可以像计算机一样在数秒内从事无穷尽的计算步骤,同时也不存在感性因素对选择的干扰。

(5)选择意味着在各种方案或选择集中进行比较和挑选,因此完全理性的行为人可以设计出所有的被选方案,以及各项方案所产生的全部后果。

(6)一个确定的报酬函数,即行为人可以确定地赋予每项行动结果一个具体的量化价值或效用。

(7)确定性的结果,也就是行为人町以实现效用最大化或最优目标(消费者效用最大化和企业利润最大化)。

在上述条件下,建立在完全理性假设的基础上的主流经济学的方法论,即行为人的选择或决策意味着在资源约束的条件下实现效用最大化或利润最大化。

行为人在选择过程中,可以遵循确定性原则、极大极小法则、边际原理以及概率法则(也就是主观期望原则)。

非合作博弈算法-概述说明以及解释

非合作博弈算法-概述说明以及解释

非合作博弈算法-概述说明以及解释1.引言1.1 概述非合作博弈算法是一种在博弈论中常见的算法,用于处理个体之间相互作用但不协作的情况。

在非合作博弈中,每个参与者都追求自身的利益最大化,而不考虑其他参与者的利益。

通过非合作博弈算法,可以模拟和分析各种实际情况下的竞争和冲突,从中找出最佳策略和结果。

非合作博弈算法通常涉及到博弈论、优化理论、数学建模等多个领域的知识,因此在实际应用中具有广泛的适用性。

这些算法已经被成功运用在经济学、管理学、计算机科学、工程学等多个领域,为决策者提供了重要的参考和帮助。

本文将对非合作博弈算法进行深入探讨,分析其原理、特点、应用领域以及优势和局限性,旨在为读者提供全面的了解和收益。

1.2 文章结构本文将围绕非合作博弈算法展开,首先将介绍非合作博弈算法的基本概念和原理,包括其与博弈论的关系以及算法的运行机制。

接着将探讨非合作博弈算法在不同领域的应用,例如经济学、计算机科学和社会科学等。

然后将分析非合作博弈算法的优势和局限性,深入探讨其在实际应用中可能面临的挑战和限制。

最后,通过总结现有研究成果,展望未来非合作博弈算法的发展方向和潜在的应用领域,为读者提供对该领域的深入了解和启发。

1.3 目的:本文旨在介绍非合作博弈算法的基本概念、应用领域、优势和局限性,从而让读者对该领域有一个清晰的认识。

通过对非合作博弈算法的介绍,读者能够了解该算法在实际应用中的重要性和作用,以及在不同领域中的具体应用情况。

同时,本文也旨在探讨非合作博弈算法的未来发展方向,为相关研究和实践提供一定的参考和指导。

通过本文的阐述,希望能够促进对非合作博弈算法的学习和研究,推动该领域的进一步发展和应用。

2.正文2.1 什么是非合作博弈算法非合作博弈算法是一种博弈论中的概念,它主要研究在博弈过程中各参与者之间的竞争和冲突。

相对于合作博弈算法,非合作博弈算法更侧重于个体之间的自利行为,每个参与者都追求自身的最大利益而不考虑其他参与者的利益。

博弈论3000字论文

博弈论3000字论文

博弈论3000字论文****2014~2015学年第二学期《博弈论》结课论文论文题目:博弈论与管理学任课教师:学院班级:学号:姓名:博弈论与管理学摘要现代管理的核心职能是激发人最大限度地发挥主观能动性,创造性地开展工作,这其中自然包含了管理者和被管理者之间的博弈。

本文从博弈论的基本概念出发,结合管理学基本理论,对博弈对管理学的作用做了简要阐述。

关键词博弈;管理;均衡;经济一、博弈论简介(一)博弈的起源和发展博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

近代对于博弈论的研究,开始于策梅洛(Zermelo),波莱尔(Borel)及冯?诺依曼(von Neumann)。

1928年,冯?诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯?诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系。

1950~1951年,约翰?福布斯?纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。

纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,莱因哈德?泽尔腾、约翰?海萨尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的学科。

(二)博弈论的基本概念博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用。

非合作博弈论的基本体系——博弈论简介(三)

非合作博弈论的基本体系——博弈论简介(三)
— 17 —
★理论探讨★
略 ,从而没有任何人有积极性打破这种均衡。
合。
2、完全 信息动态 博弈—— 子博 弈精练纳 什均衡
有 关非 合 作博 弈 论 的基 本 内容 的 介 绍 到此 结
( subgam e per fect Nash equilibrium): 这里先交代“子 束。从表面上看 ,我们似乎是对每一个类型博弈创造
中 , 参与人在 多节点信 息处 ,按 照贝叶斯 法则选择某 个 战略 ,而该 战略必 须使 参与 人的支 付或 期望 支付 最 大 (序列 理性 ) , 由这 样的混 合战 略组成 的战 略组
图 1. 1不同均衡概念之间的关系 (责任编辑: 薛金龙 )
— 18 —
他战略。
静态博弈和不完全信息动态博弈的范畴之内。
4、不 完全 信 息 动 态博 弈 —— 精 练 贝 叶 斯均 衡
这里 需要 指出 的一 点是: 博 弈分 析的 目的 是预
( Pe rfect Bayesia n Nash equilibrium ): 给定每 个人有 测博 弈的结果。一个 比较简单的 博弈中的 合理行为 关 其 他人类 型的 信念 (主观 观率 )的 情况下 ,他 的战 方式 在一 个较复 杂的 博弈中 可能 是完 全不 合理 的。
★理论探讨★
《江苏统计》 1998. 3
非合作博弈论的基本体系
— — 博 弈 论 简 介 (三 )
□文 /朱震葆
博弈论 , 在非特指情况下 ,通常都是 指非合作博
弈。根据 ( 1)由 于参与博弈的人行动有先后顺序 ; ( 2) 后行动者 在自己行 动之前对其 它参与人 的先前行为 是 否 完 全了 解 ; ( 3)参 与 人对 有关 其 他 参与 人 的特 征、战 略空 间及支 付函 数的知 识是 否完 全掌握 ; ( 4) 各参与人 是否存在 纯战略空间 等四个不 同的角度来 划分 , 可以构 造出至少 八种不同类 型的博弈问 题 ,这 就 是: 完 全信 息静态 博弈 ,完 全信 息动 态博 弈 , 不完 全信 息静态博弈 ,不完 全信息动态 博弈 , 完全且完美 信息 纯战略博弈 ,完全 且完美信息 混合战略博 弈 ,完 全 但不完 美信 息纯战 略博 弈 ,完全但 不完 美信 息混 合 战略博弈。与上 述八类博弈 相对应的 是八个均衡 概念 即纳什均衡、子博 弈精练纳什 均衡、贝叶斯纳什 均 衡、精 练贝 叶斯纳 什均 衡、纯战 略纳 什均 衡、混合 战略 纳什均衡、纯战略 完美贝叶斯 均衡、混合战略完 美贝叶斯均衡。

博弈论论文经济博弈论论文

博弈论论文经济博弈论论文

价值共识的经济博弈分析孔志学1吴育林2(1、广东药学院人文社科部副教授;2、中山大学教育学院教授、博士生导师,博士)[摘要]价值主体的利益和需要的一致性是达成价值共识的根本所在。

如果价值主体的利益和需要是根本对立或者不可调和的,那就不可能达成价值共识。

如果从利益主体之间对各自经济利益博弈的角度去分析价值共识问题,将给价值共识问题的解决带来新的思路和方法。

博弈论主要是研究理性的人在面对各种冲突行为如何选择的理论,它的一些理论和方法对于我们研究价值共识问题具有独特的借鉴作用。

可以从囚徒困境博弈、有限理性博弈和合作博弈理论的条件下如何形成价值共识三个方面进行分析。

按照博弈论的理论形成价值共识,一要认清达成价值共识的基础是什么;二要区分不同价值主体之间的合作性博弈和非合作性博弈等不同方式;三要认清博弈分析的核心不是博弈方的最优策略选择,而是有限理性博弈方组成的群体成员的策略调整过程、趋势和稳定性。

[关键词]价值共识;囚徒困境博弈;有限理性博弈;合作博弈[中图分类号]B82[文献标识码]A [文章编号]1003-7462(2010)06-0107-05此文系教育部人文社会科学研究2009年度一般项目课题(编号:07JA710014)和广州市2007年度社会科学规划课题《和谐社会视域的价值共识问题研究》(编号:07Z43)的阶段性研究成果之一。

马克斯·韦伯对所处的时代曾有个隐喻,即:我们处于一个祛魅后的诸神不和的时代。

这样的时代必然会出现生活多元化和价值差异。

随着日益开放并且加速分化的社会,诸神不和的矛盾更加突出。

在经济全球化已经成为事实的今天,人们在试图寻求某种价值共识,以解决诸神不和的主要矛盾,诸如华盛顿共识、北京共识等全球性质的盟约也随之诞生。

理论界对价值共识的问题几乎毫无例外是从哲学思辨的角度进行论述。

然而,正如马克思所指出,经济基础决定上层建筑;价值共识问题尽管是一个观念问题,但是观念问题归根到底取决于经济基础。

非合作博弈论

非合作博弈论

非合作博弈论
《非合作博弈论》是一门跨越经济学、决策理论和博弈论的核心理论,它为研究互利关系和竞争状况提供了一个重要的分析框架。

它首先是由美国经济学家威廉比诺德(William Vickrey)介绍的,他认为,这一理论能够帮助分析我们如何处理相互依赖的互利关系。

因此,他的理论已经受到了国际社会的广泛关注和评价。

非合作博弈论认为竞争性博弈的结果取决于参与者的决策策略。

在博弈过程中,参与者的决策者有一系列的收益矩阵,这些矩阵将决定最终的博弈结果。

另一方面,博弈还考虑了参与者可能会遵守或者违反约定,从而影响结果。

非合作博弈论的最重要结论是,参与者可以采取一种通过反复交换位置来最大化自身收益的策略,即所谓的“最优战略”。

看起来,如果参与者采取最优策略,那么这一理论没有反映出它自身的思想相互合作、协商、谈判和建立良好的信任关系。

然而,非合作博弈论也强调了个体之间可以通过互利协定达成共识,这些协定可以帮助所有参与者实现自身利益最大化。

此外,也可以让参与者相互间建立良好的信任关系,从而构建和谐的关系通过这种方式,可以更有效地实现双方的最大利益。

此外,非合作博弈论也是一种高效的决策工具。

它可以帮助管理者们采取最合适的措施,以最大限度地实现机构和个人的利益。

通过这种方式,它可以应用于多种不同的领域,如贸易谈判、政府决策、金融合同、政治决策等,以达到约定的目标。

总之,《非合作博弈论》是一个很重要的经济理论,它可以帮助我们更加有效地研究和分析互利关系和竞争状况。

通过对参与者可以采取的最优策略的深入研究和分析,它可以帮助我们更好地管理组织内部的决策,并且为达成积极结果奠定坚实的基础。

纳什博弈论论文集

纳什博弈论论文集

纳什博弈论论文集纳什博弈论论文集约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。

其研究成果见于题为《非合作博弈》(1950)的博士论文。

该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。

纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。

他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。

该解概念后来被称为纳什均衡。

在一种纳什均衡的情况下,所有局中人的预期都得到满足,他们所选择的策略都是最优的。

纳什提出了对该均衡概念的两种解释:一种基于理性;另一种基于统计总体。

据理性解释,局中人都被设想为是理性的,他们有关于博弈的结构,包括所有局中人有关可能结果的偏好的完全信息,在这种情况下,完全信息是常识。

既然所有局中人都有关于各自策略选择和偏好的完全信息,他们也就都能计算各自的有关每一组预期的最优策略选择。

假如所有局中人都预期同一纳什均衡的话,那么,对谁也不会有改变其策略的激励。

纳什的第二种解释--依据统计总体做出的解释适用于所谓的进化博弈。

这类博弈,为了了解自然淘汰原理在物种间和物种内策略上的相互影响上如何发挥作用,也已经在生物学中提出了。

纳什证明,在局中人人数有限的每一类博弈中都存在某种混合策略的均衡。

--1994年瑞典皇家科学院贺辞约翰·纳什(John Nash)1928年6月13日,约翰·纳什出生在西维吉尼亚州勃鲁费尔。

纳什在卡内基(现在的卡内基-梅隆大学)学习时,享有全额乔治·威斯汀豪斯奖学金。

但当了一学期化学工程学生后,他发现自己对机械制图之类课程不感兴趣而转入学习化学,但在学习化学短时间后又遇到定量分析的困难。

数学系教师也鼓励他改修数学,所以他又转为一名正式的数学系学生。

由此"最后我获得了科学学士和科学硕士"。

纳什毕业时,有两个学校的奖学金供他选择,哈佛大学和普林斯顿大学。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

非合作博弈论博弈论也叫对策论,是现代微观经济学的基础领域之一,主要研究在彼此互动的情形下个人是如何做决策的。

近年来它已经被广泛地应用于商业、政治、社会学等其他社会科学的分析中。

博弈的分类根据不同的基准也有不同的分类。

一般认为,博弈主要可以分为合作博弈和非合作博弈。

合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。

他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。

从而揭示了博弈均衡与经济均衡的内在联系。

纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。

1944年冯·诺依曼与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。

尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。

例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。

冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。

合作型博弈在20世纪50年代达到了巅峰期。

然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。

正是在这个时候,非合作博弈—“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。

据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。

斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。

于是,又走人了。

然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。

纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。

1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。

殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,妙笔生花。

其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。

纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。

1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。

说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”推到非合作博弈领域,找到了普遍化的方法和均衡点。

盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。

盖尔建议他马上整理出来发表,以免被别人捷足先登。

纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。

结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。

纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。

这一点也是值得我们深思的。

国内提一个教授,要求在“核心的刊物”上发表多少篇文章。

按照这个标准可能纳什还不一定够资格。

1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。

纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。

20岁出头已成为闻名世界的数学家。

特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。

他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。

后续的研究者对博弈论的贡献,都是建立在这一概念之上的。

由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

在博弈论中,含有占优战略均衡的一个著名例子是“囚徒困境”博弈模型。

该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。

假设有两个小偷A和B联合犯事、私入民宅被警察抓住。

警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。

如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

囚徒困境博弈我们来看看这个博弈可预测的均衡是什么。

对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。

显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。

但是,倘若他们都选择“抵赖”,每人只被判刑1年。

在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。

不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。

要了解纳什的贡献,首先要知道什么是非合作博弈问题。

现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。

博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。

好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。

其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。

博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。

所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。

话说有一天,一位富翁在家中被杀,财物被盗。

警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。

但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。

于是警方将两人隔离,分别关在不同的房间进行审讯。

由地方检察官分别和每个人单独谈话。

检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。

但是,我可以和你做个交易。

如果你单独坦白杀人的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。

如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。

但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。

”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择—坦白或抵赖。

显然最好的策略是双方都抵赖,结果是大家都只被判一年。

但是由于两人处于隔离的情况下无法串供。

所以,按照亚当·斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。

因为坦白交代可以期望得到很短的监禁—3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。

这种策略是损人利己的策略。

不仅如此,坦白还有更多的好处。

如果对方坦白了而自己抵赖了,那自己就得坐10年牢。

太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。

所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。

这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。

因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。

也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。

没有人会主动改变自己的策略以便使自己获得更大利益。

“囚徒的两难选择”有着广泛而深刻的意义。

个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。

他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。

只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。

“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。

按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。

不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。

”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。

两个囚徒的命运就是如此。

从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。

因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。

但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。

也就是中国人说的“己所不欲勿施于人”。

但前提是人所不欲勿施于我。

其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。

所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。

从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。

我们将例举出许多类似于“囚徒的两难处境”这样的例子。

如价格战、军备竞赛、污染等等。

一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。

其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。

所有的博弈问题都会遇到这三个要素。

相关文档
最新文档