3博弈论发展史
微分博弈理论[优质PPT]
经典案例:囚徒困境
• 一个案子的两个嫌疑 犯被分开审讯,警官 分别告诉两个囚犯, 如果你招供,而对方 不招供,则你将被立 即释放,而对方将被 判刑十年;如果两人 均招供,将均被判刑 两年。如果两人均不 招供,将最有利,只 被判刑半年。
经典案例:囚徒困境
• 两人同时陷入招供还 是不招供的两难处境。 但两人无法沟通,于 是从各自的利益角度 出发,都依据各自的 理性而选择了招供, 这种情况就称为纳氏 均衡点。
• 每一个局中人,不管他选 择什么方案,另一局中人 总希望使对方损失最大化, 也就是每个局中人将选择 使另一局中人把对方损失 最大化的企图最小化的策 略,这就是博弈论的最佳 策略准则。
纳什均衡点
• 纳什平衡,又称为非 合作赛局平衡,是博 弈论的一个重要概念, 以约翰·纳什命名。如 果某情况下无一参与 者可以独自行动而增 加收益,则此策略组 合被称为纳什均衡点。
• 方程(3)将这一微分博弈描述成最小最大值优化问题。
• L被设为在一个给定的仿真周期中,汽车侧翻角绝对值的 最大值,如方程(4)所示。
纳什均衡解
• 分析可得存在纳什均衡解(u*,w*),使得鞍点不等式 (5):
成立 • 纳什均衡解的含义是在最坏扰动W*(试图使L最大)
工况下,最好的控制器输入是U*(试图使L最小);反 之亦然。
纳什均衡解
• 其均衡解是通过进化遗传算 法得到的,对进化遗传算法 的适应性估计是在汽车仿真 软件Carsim上进行的。来自进化遗传算法的适应性估计
进化遗传算法流程图
数值仿真及结论
• 通过分析伯德图和在 Carsim中的仿真结 果,证明它设计的控 制器保证了在最坏的 转向角输入工况下最 坏防侧翻性能,同时 分别通过抵抗路面扰 动以及侧向加速度, 提供了良好的乘坐质 量以及防侧翻性能。
博弈论发展史上的重要人物
•
奥曼指出,竞争分配的核心和模式与厂商连 续统的市场相一致。奥曼通过精确表达完全竞争 观点的连续统模型,成功地使最初由埃奇沃思提 出,经许多其他模型改进的理论精确化,并从此 成为经济理论的基本准则之一。 完全竞争分析所获得的基本观点,使对完全 竞争之外的基本经济问题的研究成为可能并且更 加容易。在这方面,奥曼最重要的贡献和影响是 利用一个或更大的参与者的连续统建立的垄断和 寡头垄断竞争模型,以及公共经济学基于经济活 动和政治过程相互交织的税收模型,如表决、固 定价格模型等。
•
重复博弈论: 理论系统性的发展
• 重复博弈是指同样结构的博弈重复多 次,其中的每次博弈称为“阶段博弈”。 重复博弈是动态博弈中的重要内容,它可 以是完全信息的重复博弈,也可以是不完 全信息的重复博弈。奥曼对重复博弈的贡 献在于对理论系统性的发展起了一定的促 进作用。
•
完全信息的重复博弈的目的是解释 诸如合作、利他主义、报复、威胁(自 我破坏或其他)等现象。 • 而关于不完全信息的重复博弈的分 析被扩展至更一般的模型,即2人零和 博弈与非零和博弈。
合作与非合作博弈论: 非转移效用与理性的假设
• 非合作博弈论的重点是对个体的战略选 择,即每个参与者如何博弈,或者说选择 什么策略达到他的目标。与之不同,合作 博弈理论的重点则是对群体,并仅从更一 般的意义上阐述了每个联盟的赢得,而没 有说明如何赢得。
托马斯· 克罗姆比· 谢林
•
托马斯· 克罗姆比· 谢林 (Thomas Crombie 斯德哥尔摩宣布,将 2005年的诺贝尔经济学奖 授予美国马里兰大学的托马 斯· 谢林和以色列希伯莱大 学的罗伯特· 奥曼,以表彰 他们“通过博弈论分析,促 进了人们对冲突和合作的理 解”。
•
博弈论
2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。
博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。
简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。
1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。
20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。
在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。
1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。
博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。
它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。
正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。
正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。
微分博弈理论教材
Z
鞍点
Y X
马鞍面z=x2/4-y2/6
鞍点规划的数学模型
• 鞍点规划的数学模型:
• 上述鞍点规划模型中,决策变量x,y没有加任何限制。实 际上,x,y经常受到一定的约束,于是有以下约束鞍点规 划问题:
• 在数学中,把函数上具有上 述“极大一极小”性质的点 称为鞍点(Sadd了lePoint)。 把同鞍点有关的数学问题称 为鞍点问题。
形象地说,鞍点就是处于 “马鞍中央的点”,从纵向 看取极小值,从横向看取极 大值。
鞍点的含义
• 下面用二元函数z=f(x,y)来说明鞍点的含义: 对于二元函数z=f(x,y),(x*,y*)为其上一点。若 在邻域|x-x*|<£,|y-y*|<£内
博弈论
汇报人:张甲乐
什么是博弈论
• 博弈论亦称对策论, 运筹学的一个分支。 是研究有利害冲突的 双方在竞争性活动中, 如何制胜对方的最优 策略的数学理论和方 法。
博弈论的发展史
微分对策理论
《博弈·动态规划和计算机》
《博弈论和经济行为》
《战国策》 《孙子兵法》
古代产生了 朴素的博弈 论的思想
1944年美国 的J·冯诺意 曼和O·摩根 司坦发表了 巨著
• 这时,个体的理性利 益选择是与整体的理 性利益选择不一致的。
鞍点(Saddle point)
• 在微分方程中,沿着某一 方向是稳定的,另一条方 向是不稳定的奇点,叫做 鞍点。
• 在泛函中,既不是极大值 点也不是极小值点的临界 点,叫做鞍点。
• 在矩阵中,一个数在所在 行中是最大值,在所在列 中是最小值,则被称为鞍 点。
博弈论论文(囚徒困境案例纳什均衡案例完全信息静态博弈完全信息动态博弈)
二、博弈论的发展史 2.1中国传统文化中的博弈论
在我国,博弈论的思想源远流长,古代人民很早就认识了博弈问题,虽然没有形 成一套完整的理论体系和方法,但博弈论的思想和实践活动,则可以追溯到 2000 多年 前。著名的"齐王与田忌骞马"就是一经典事例。这里,田忌进行的是"在给定齐王策略 不变情况下如何取胜"这一策略选择,实际上就是现代博弈论中的完全信息条件下的两 人博弈问题。著名的《孙子兵法》一书对战争胜负的认识,以及胜负之间诸因素的相 互作用的深刻论述,和所提出的一系列军事对策等,都反映出其系统的博弈论思想。 而《三十六计》则可以称做是一部活生生的军事博弈论教科书。《孙子兵法》和《三
博弈论论文
摘要:在现实生活中,人们的利益冲突与一致具有普遍性。因此,几乎所有的决 策问题都可以认为是博弈。虽然博弈论是数学的一个分支,但其应用范围十分广泛, 在经济学、管理学、社会学、政治学、法律学、军事学等领域都有许多成功运用博弈 论的案例。本文对博弈论发展简史、博弈论基本概念进行阐述,对囚徒困境、纳什均 衡、完全信息静态博弈、完全信息动态博弈、进行解析与案例分析。 关键词:博弈论、博弈论发展简史、博弈论基本概念、囚徒困境案例、纳什均衡 案例、完全信息静态博弈、完全信息动态博弈。
一、在生活中广泛应用的博弈论
在高飞老师的带领下,经过一段时间的学习,我对博弈论有了一些肤浅的理解。 诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈, 有人说没有,那是因为缺少发现博弈现象的眼睛。 人生就是在弈棋,学会博弈。虽说 博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学 语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所 以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策 性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。目前在生 物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛 的应用。人们每天都面临着无数个选择,而博弈能运用具体的案例模型和相对应的决 策方法,让人们在最短的时间内作出最有利于自己的选择。 早在 1994 年,提出博弈均衡理论的纳什博士与他的伙伴哈尔萨尼教授、泽尔滕教 授就共同分享了当年的诺贝尔经济学奖和 93 万美元的奖金。2005 年,瑞典皇家科学 院再次把诺贝尔经济学奖颁给了有着以色列、美国双重国籍的罗伯特·奥曼和美国人托 马斯·谢林,以表彰他们在博弈论领域作出的贡献。纳什的贡献是在 1944 年与奥斯 卡·摩根斯特恩合著了《博弈论与经济行为》一书,标志着现代系统博弈理论的的初步 形成。而谢林和奥曼两位博弈论先驱在政治理论、社会学甚至生物学等方面成功运用 到了博弈学理论。奥曼用数学分析为博弈论列出了精确的公式,谢林则是想通过实践 来展示博弈论在社会各个领域的实际意义。他们两位利用博弈论对商业谈判、种族隔 离、武器控制等领域进行了实际分析,谢林教授认为博弈论运用的重要领域应该包括 核威慑和武器控制,同时还可以研究种族关系、有组织犯罪、雇员关系乃至自我管理 等方面。
博弈论发展史及主要著作
博弈论发展史及主要著作博弈论发展史及主要著作纳什(JohnNash)、泽尔腾(ReinhardSelten)和海萨尼(JohnHarsany)三位博弈理论家和经济学家。
第一阶段:1944年以前,早期思想和基本概念的形成。
1838年,法国经济学家奥古斯汀古诺(AugustinCournot)在分析生产者竞争时,就利用均衡概念研究了寡头市场的情况,并使用了解的概念,该概念实际上是后来的纳什均衡的一种严格说法。
1881年英国经济学家埃奇沃斯(FrancisY.Edgworth)提出了"契约曲线(ContractCurve)"作为决定个体之间交易结果题目的一个解。
1913年,博弈论中第一个定理--泽梅罗定理(ZermeloTheorm)断言,国际象棋是严格确定的,尽管泽梅罗定理的适用范围是具有完全信息的两人零和博弈,但它的影响是巨大的,在五六十年代曾引起很多博弈论专家和经济学家的广泛深进研究。
1921― 1927年间,波莱尔(EmileBorel)发表了四篇关于策略博弈的文章,第一次给出了一个混合策略的现代形式,并找到了有3个或多个可能策略的二人博弈的最小最大解。
1928年,冯诺伊曼(JohnvonNeumann)证实了最小最大定理,该定理被以为是博弈论的精华,博弈论中的很多概念都与该定理相联系。
1930年泽尤森(F.Zeuthen)的著作《垄断题目与经济竞争》出版,在书中他提出了一个关于讨价还价题目的解,该解后来被海萨尼证实与纳什的讨价还价解是等价的。
此外,这一阶段还提出了博弈的扩展形式、纯策略、策略形式、混合策略、个体理性等重要概念。
第二阶段:1944~1959年,现代博弈论的建立与理论体系的基本形成。
1944年,美国普林斯顿大学的著名数学家冯诺伊曼和经济学家摩根斯坦(OskarMorg enstern)合著的《博弈论与经济行为》一书出版。
该书在详述两人零和博弈理论的同时,在博弈论的诸多方面做出了开创性研究,如合作博弈、可转移效用、同盟形式以及冯诺伊曼--摩根斯坦稳定集等,该书还说明了导致后来在经济学中广泛应用的公理化效用理论。
简述博弈论产生与发展过程
博弈论的发展历程一、博弈论起源博弈论(Game Theory)起源于上世纪初的数学领域,最初是作为数学的一个分支被研究的。
它主要研究在策略性决策场景中,参与者的最优行为及其相互影响。
这一理论的诞生,可以追溯到1913年,Borel在一般集合论的基础上定义了对策论的基本概念。
二、经典博弈理论在博弈论的发展历程中,经典博弈理论在上世纪中叶占据主导地位。
这一阶段的主要代表人物包括John von Neumann和Oskar Morgenstern。
他们于1944年合作发表了《博弈论与经济行为》一书,提出了著名的“冯·诺依曼-摩根斯坦博弈模型”,为现代博弈论的发展奠定了基础。
三、非合作博弈理论非合作博弈理论(Non-cooperative Game Theory)是上世纪50年代后期发展起来的,代表人物包括Gerard Debreu和John Harsanyi。
他们提出了非合作博弈的纳什均衡概念,成为现代博弈论中的重要基石。
非合作博弈理论主要研究在信息不完全或不确定的情况下,参与者如何选择自己的最优策略。
四、合作博弈理论与非合作博弈理论相对,合作博弈理论强调参与者之间的合作可能性和最优策略的均衡。
这一理论在上世纪60年代逐渐发展起来,代表人物包括R.B. Myerson和Roger Wollenstein。
合作博弈理论主要研究如何通过合作实现各方的利益最大化,以及如何分配这些利益。
五、演化博弈理论演化博弈理论(Evolutionary Game Theory)是在上世纪70年代发展起来的,其代表人物包括John Maynard Smith和George R. Price。
这一理论从生物进化论的角度出发,研究参与者如何通过学习和适应环境,实现最优策略的选择。
演化博弈理论在经济学、生物学和心理学等领域得到了广泛应用。
六、动态博弈理论动态博弈理论(Dynamic Game Theory)是在上世纪80年代开始发展的,其代表人物包括Arrow Kenneth J.和Leslie Richard Stallings。
微分博弈理论ppt课件
鞍点(Saddle point)
• 在微分方程中,沿着某一 方向是稳定的,另一条方 向是不稳定的奇点,叫做 鞍点。
• 在泛函中,既不是极大值 点也不是极小值点的临界 点,叫做鞍点。
• 在矩阵中,一个数在所在 行中是最大值,在所在列 中是最小值,则被称为鞍 点。
• 方程(3)将这一微分博弈描述成最小最大值优化问题。
• L被设为在一个给定的仿真周期中,汽车侧翻角绝对值的 最大值,如方程(4)所示。
纳什均衡解
• 分析可得存在纳什均衡解(u*,w*),使得鞍点不等式 (5):
成立 • 纳什均衡解的含义是在最坏扰动W*(试图使L最大)
工况下,最好的控制器输入是U*(试图使L最小);反 之亦然。
• 在数学中,把函数上具有上 述“极大一极小”性质的点 称为鞍点(Sadd了lePoint)。 把同鞍点有关的数学问题称 为鞍点问题。
形象地说,鞍点就是处于 “马鞍中央的点”,从纵向 看取极小值,从横向看取极 大值。
鞍点的含义
• 下面用二元函数z=f(x,y)来说明鞍点的含义: 对于二元函数z=f(x,y),(x*,y*)为其上一点。若 在邻域|x-x*|<£,|y-y*|<£内
纳什均衡解
• 其均衡解是通过进化遗传算 法得到的,对进化遗传算法 的适应性估计是在汽车仿真 软件Carsim上进行的。
进化遗传算法的适应性估计
进化遗传算法流程图
数值仿真及结论
• 通过分析伯德图和在 Carsim中的仿真结 果,证明它设计的控 制器保证了在最坏的 转向角输入工况下最 坏防侧翻性能,同时 分别通过抵抗路面扰 动以及侧向加速度, 提供了良好的乘坐质 量以及防侧翻性能。
北京大学博弈论课件第1章博弈论概述
企业、社会团体、国家
博弈参与者可能多于两方,三方或多方博弈参与者
二、博弈策略(Strategy)
博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中,博弈参与者所能采取的博弈策略
均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中,博弈参与者所能采取的博弈策
博弈参与者:两个人 博弈过程:
两人在校门口集合,一起逛博物馆
博弈策略和结果
两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
博弈双方策略相互依赖,不独立。
其他博弈实例
棋类比赛:象棋、围棋等。古人“对弈”。 寡头市场:
遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为
“坦白”或“不坦白”
三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相
2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。
博弈论原理与方法分析
绪论-几个典型模型
猜方
正面
猜硬币游戏
分析:
盖方
反面
正面
-1, 1
1, -1
反面
1, -1
-1, 1
在本博弈中,双方的利益是严格对立的,取
胜的关键是不能让另一方猜到自己的策略而
同时自己又要尽可能猜出对方的策略。
在一次博弈中结果取决于机会,在多次重复
中,如果双方决策都正确,则我们可求得平
and William F. Sharpe金融经济学原理。
1994年John Harsanyi, John F. Nash and
Reinhard es A. Mirrless and William Vickery
不对称信息条件下激励机制问题
绪论-博弈论的历史沿革
费效用最大化决策中的各种商品的购买量。根
据该集合是有限的还是无限的,可分为有限博
弈和无限博弈。
2001年Jeorge Akerlof、Michael Spence and
Joseph Stiglitz非对称信息市场分析
2002年丹尼尔·卡尼曼和弗农·史密斯心理和实
验经济学方面
2005年Thomas Schelling and Robert
Aumann合作博弈方面
博弈论在构成了微观经济学的基础性方法。
坦白”);
– 支付(payoffs):参与人在所选策略(策略组合,
the strategy profile)上的效用
例如如果A坦白,而B不坦白,A得0,B得-9
绪论-什么是博弈论
得益矩阵
列参与者
坦白
不坦白
博弈论历史和发展简介
本章对博弈论 、发展等作一些介绍分析。目的让 读者更好地了解博弈论,找进一步学习研究方向。
第十章内容
博弈论的起源和形成 博弈论的成长和发展 博弈论的进一步发展
博弈论的起源和形成
一、博弈论的起源: 博弈论 没有公认答案。 博弈论并不是某些天才思想家的灵光闪现创造
博弈论在进化生物学(Evolutionary Biology)中的 公开应用也是在60年代初出现的。
塞尔腾(Selten)1965提出“子博弈完美纳什均 衡”(subgame perfect Nash equilibrium)
塞尔腾1975年提出“颤抖手均衡” (Trembling hand perfect equilibrium)
“共同知识”(Common knowledge)的重要性,因为奥曼 1976年的文章引起广泛的重视。
博弈论走向成熟的时期
(上世纪80、90年代)
1981(Elon Kohlberg) “顺推归纳法”(Forward induction) 克瑞泼斯(David M. kreps)和威尔孙(Robert Wilson)1982
的,是人类实践经验和古老智慧的结晶。 博弈是人们早在实践中不断运用的古老智慧。
最早的博弈思想
对具有策略依存特点决策问题的研究可上溯到 18世纪初甚至更早
2000年前我国古代的“齐威王田忌赛马”, 1500年前巴比伦犹太教法典“婚姻合同问题”, 1838年古诺寡头模型, 1883年伯特兰德寡头竞争模型。
年提出“序列均衡”(Sequential equilibria) 1982年斯密(John Maynard Smith)出版了《进化和博弈论》
博弈论产生与发展的过程
博弈论产生与发展的过程
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
以下是博弈论产生与发展的过程:
1.古代时期:博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。
2.20世纪初:博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
3.1944年:冯•诺依曼(Von Neumann)与摩根斯坦(Morgenstern)合作的《博弈论与经济行为》这本书,标志着博弈理论的正式诞生,不过,此书与现代博弈论关系不大。
4.1950年:纳什和夏普里的“讨价还价”模型以及“核”的概念,提出了合作博弈的概念。
5.20世纪60年代:纳什均衡被提出;泽尔腾(1965)引入动态分析,提出了“子博弈精练纳什均衡”;海萨尼(1967-1968)将不完全信息引入博弈论研究,这标志着博弈论的快速发展时期。
以上内容仅供参考,建议查阅专业书籍获取更全面和准确的信息。
微分博弈理论
《博弈论和经济行为》 美国的数学 家贝尔曼于 1951年又发 表了名著
《战国策》 《孙子兵法》
古代产生了 朴素的博弈 论的思想
1944年美国 的J· 冯诺意 曼和O· 摩根 司坦发表了 巨著
博弈论的基本要素
• 构博弈论由三个基本 要素成: 局中人(如竞争的 双方); 策略(每个局中人dle point)
• 在微分方程中,沿着某一 方向是稳定的,另一条方 向是不稳定的奇点,叫做 鞍点。 • 在泛函中,既不是极大值 点也不是极小值点的临界 点,叫做鞍点。 • 在矩阵中,一个数在所在 行中是最大值,在所在列 中是最小值,则被称为鞍 点。 • 在物理上要广泛一些,指 在一个方向是极大值,另 一个方向是极小值的点。
• 分析可得存在纳什均衡解(u*,w*),使得鞍点不等式 (5):
成立 • 纳什均衡解的含义是在最坏扰动W*(试图使L最大) 工况下,最好的控制器输入是U*(试图使L最小);反 之亦然。
纳什均衡解
• 其均衡解是通过进化遗传算 法得到的,对进化遗传算法 的适应性估计是在汽车仿真 软件Carsim上进行的。
Z
鞍点
Y X
马鞍面z=x2/4-y2/6
鞍点规划的数学模型
• 鞍点规划的数学模型:
• 上述鞍点规划模型中,决策变量x,y没有加任何限制。实 际上,x,y经常受到一定的约束,于是有以下约束鞍点规 划问题:
工程应用实例:防侧翻控制器设计
• 它给出了一种基于微分 博弈理论和进化遗传算 法的防侧翻控制器设计 方法。 • 将防侧翻问题描述为一 个非合作,零和,二人 微分博弈模型。 • 分别把驾驶员转向角输 入和主动防侧倾杆视为 扰动方和控制方。
进化遗传算法的适应性估计
进化遗传算法流程图
博弈论发展史
博弈论发展史一、起源与初步发展博弈论作为一门研究决策者在不确定环境下进行决策的数学理论,起源于20世纪初。
1901年,法国数学家埃米尔·博雷尔首次提出了博弈论的基本概念,并将其应用于两人零和博弈的分析中。
此后,博弈论逐渐在数学和经济学领域得到关注。
二、纳什均衡的提出20世纪50年代,美国数学家约翰·纳什提出了纳什均衡的概念,这是博弈论的重要发展。
纳什均衡指的是在一个博弈中,每个决策者选择的策略都是对方策略的最佳响应,不存在改变策略能够获得更好结果的情况。
纳什的这一理论为博弈论的进一步研究奠定了基础。
三、博弈论的应用博弈论的应用范围逐渐扩大,不仅仅局限于经济学领域。
在政治学、生物学、计算机科学等领域,博弈论都发挥了重要的作用。
例如,在政治学中,博弈论被用于分析选举策略和国际冲突;在生物学中,博弈论被用于研究进化和动物行为;在计算机科学中,博弈论被用于设计算法和解决优化问题。
四、博弈论的发展与深化随着研究的深入,博弈论的发展也愈加复杂和多样化。
20世纪70年代,约翰·霍普金斯提出了演化博弈论,用于研究动态的、非完全理性的决策过程。
此后,人们又逐渐将博弈论与信息论相结合,形成了信息博弈论,用于研究信息交流对决策结果的影响。
五、博弈论的现代发展随着计算机技术的进步,博弈论的研究也进入了一个全新的阶段。
计算机模拟和数值方法的应用使得博弈论的分析更加精确和实用。
同时,网络博弈的兴起也为博弈论的研究提供了更多的实例和数据。
六、博弈论的前景与挑战博弈论作为一门交叉学科,其前景非常广阔。
随着社会经济的发展和全球化的进程,博弈论的应用将更加广泛。
然而,博弈论的研究也面临一些挑战,如模型的简化和假设的限制等。
未来的研究需要更加注重实证分析和跨学科的合作,以更好地解决实际问题。
博弈论作为一门研究决策者在不确定环境下进行决策的数学理论,经过多年的发展与深化,已经在各个领域展现出巨大的潜力和应用价值。
博弈论的形成和发展
博弈论的形成和发展在西方社会科学中,博弈论被评为“纪念西方文明发展的十八座里程碑”奖章的第十七位荣膺者,也被认为是20世纪社会科学领域取得的最大成果。
有许多学者甚至认为博弈论有可能成为研究所有社会科学的统一方法。
一、博弈论的形成和发展1、博弈理论的早期研究。
一般认为,对于博弈理论的最早研究可以追溯到18世纪初。
瓦德格拉夫(Waldegrave)在1713年提出了两人博弈的极小化极大混合策略解。
古诺(Cournot)和伯特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型,两位学者分别从产量决策和价格决策分析垄断的双寡头竞争模型,确定了在竞争之下各自的最优反映函数。
这些都是关于博弈问题的早期的零星研究。
2、博弈论发展的不同阶段。
一般认为博弈论萌芽于20世纪20年代初。
博弈论创立的标志是冯·诺伊曼和奥·摩根斯坦(Morgenstern)在1944年的《博弈论与经济行为》这部著作,他们的贡献现在看来主要是创立了博弈论研究的基本概念、二人零和博弈的完全解决和对合作博弈的贡献。
现在应用更为普遍的非合作博弈理论的创立,则是以纳什(John Nash)1950年的博士论文《非合作博弈》为标志,该文的主要贡献是提出了纳什均衡的概念。
此后(20世纪70年代),美国海萨尼(Harsanyi)和德国塞尔顿(Selten)的不完全信息博弈理论工作进一步完善了非合作博弈理论。
当20世纪70年代经济学家开始将注意力由价格制度转向非价格制度时,博弈论逐渐成为经济学的基石。
1944年,冯·诺伊曼(V on Neumann)和奥·摩根斯坦(Morgenstern)合著的《博弈论与经济行为》被认为是博弈理论初步形成的标志。
该书在总结以往关于博弈的研究成果的基础上,提出了博弈论的概念术语、一般框架和表述方法,提出了较系统的博弈理论。
而且,在该书以前,博弈论主要是数学家们研究的课题,主要是一种数学理论而不是经济学理论。
博弈论
Player 2
Strategy a b c
A
12,11 11,10 10,15
B
11,12 10,11 10,13
C
14,13 12,12 13,14
Player 1
连续排除劣势策略
• 两者都没有优势策略,怎么办?
Player 2
Strategy a b c
A
100,100 110,40 120,30
B
90,110 80,80 50,35
C
50,120 45,50 40,40
Player 1
连续排除劣势策略(续)
• 两者都没有优势策略,怎么办?
Player 2
Strategy a b c
A
B
90,110 50,35
C
50,120 40,40
Player 1
Key Insights
• Look for dominant strategies
Normal Form Game
• A Normal Form Game consists of: – Players – Strategies or feasible actions – Payoffs
博弈问题的刻画与分类(续3)
战争与和平的博弈(或冷战博弈)
国家1
Peace
国家2
War
Peace War
• 优势行动与优势行动均衡(续)
(1)优势行动: 无论其他博弈者采取什么行动,博弈者i采取的行动aik总能获得最 大支付,则行动aik称为该博弈者的优势行动(dominant action) (2)优势行动均衡:所有博弈者优势行动组成的均衡(如果存在的话) (3)如何寻找优势行动和优势行动均衡 双方均存在优势行动
博弈实验对博弈论的方法论意义
博弈实验对博弈论的方法论意义摘要:博弈论是研究理性人的交互决策的理论。
研究者用实验研究博弈理论,而实验结果则揭示出博弈论预测有偏差,对博弈论的验证竟变成了质疑的来源。
进而研究者又针对这种偏差进行了一系列的实验研究,以寻求问题的根源和解决的方案。
实验在博弈论中具有很重要的方法论意义,是检验博弈论的平台和工具。
尽管博弈实验也存在局限性,但是这种局限性又为其发展提供了可能性。
本文通过分析博弈实验的产生及其特征,指出博弈实验对博弈论的方法论意义。
关键词:博弈论;博弈实验;局限性;方法论意义一、博弈实验的历史发展博弈论是研究理性人互动的理论,或者说是交互决策的理论。
其最初的思想产生于20世纪初,而真正获得发展是在50年代以后。
从1928年冯·诺依曼证明博弈论的基本原理,宣告其正式诞生至今,博弈论已发展成为一门具有较完善的理论体系的具有工具性质的演绎性学科,对社会、经济等诸多现象都具有强大的解释力。
正是由于博弈论这种“解析性的”强大解释力,往往又被普通大众神圣化为万能药方,似乎它应该也可以解决所有的理论映射到的决策问题。
然而现实中它的预测结果和现实情况有很大的差别,这使人对博弈论产生了质疑。
博弈论学者们为了解释和解决这个问题,做了一系列的研究,其中实验是最重要的研究方法。
最早的博弈实验产生于经济学实验。
而最早的真正意义上的博弈实验则产生于20世纪50年代。
1950年,约翰·纳什(John Nash)利用不动点定理证明了均衡点的存在,并将博弈论引进议价行为模型,进行了纯议价博弈实验。
1951年,莫斯特勒(Mosteller)和挪杰(Nogee)用实验研究了在不确定条件下的个人偏好(选择)问题。
1952年,美尔文·爵烁和莫莱尔·弗莱尔(Melvin Dresher and Merrill Flood)进行了著名的“囚徒困境”实验。
1957年,托马斯·谢林(Thomas Schelling)进行了信息对称下的博弈实验,发现暗示可能产生明显的在协商中起重要作用的因素。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.3.5 2005年罗伯特奥曼和托马斯谢林
3.3.6 2008年保罗克鲁格曼
3.4 博弈论研究的价值
�
3.3.2 子博弈完美纳什均衡和贝叶斯纳什均衡 (Subgame-Perfect Nash-Equilibrium; Bayes-Nash Equilibrium) 1965年和1975年兰哈德泽尔藤(Reinhard Selten)把 纳什均衡推广到动态博弈,并提出子博弈完美纳什均 衡; 1967-1968年间,约翰海萨尼(John Harsanyi)把纳 什思想推广到不完全信息模型,提出贝叶斯均衡; 他们与纳什一起分享1994年诺贝尔经济学奖
3.3.3 不对称信息条件下交易的对策 1996年诺贝尔经济学奖获得者詹姆斯莫里斯 教授和威廉姆维克瑞教授在20世纪60,70年 代提示不对称信息对交易带来的影响,并提出 相应对策.
3.3.4 信息经济 2001年诺贝尔经济学奖授予美国乔治阿克尔洛夫教 授,迈克尔斯彭斯教授,约瑟夫斯蒂格利茨教授. 20世纪70年代他们提示当代信息经济的核心,信息 是有价值的. 1970年阿克尔洛夫提出旧车市场模型并提出:市场 放开不能解决所有问题,信息是有价值的 1973年斯彭斯通过剖析人才市场盛行的造假行为指 出人才市场存在用人单位与应聘者之间的信息不对 称 ,造成"劣币"驱逐"良币"现象 斯蒂格利茨将信息不对称理论应用于保险和金融市场
(The theory of Games and Economic Behaviour)
被公认为是博弈论的开山之作.
以往的数学是在物理学的基础上发展起来的, 描述的是客观世界行为,而经济学研究的对象 更像是一场游戏中的参与者,相互之间预期对 方的行动,因此,描述,观察研究对象就需要 一系列的数学工具,这一套新的数学工具,被 他们命名为博弈论.
冯诺依曼和摩根斯坦的贡献
1,提出博弈的概念; 2,对效用理论给予公理依据; 3,零和博弈(Zero-sum Games)的最优解; 4,引进博弈论的一种形式,即合作博弈 (cooperative Games)
3.3 博弈论的发展
3.3.1 纳什均衡(Nash-Equilibrium) 1950年,约翰 纳什(John Nash)引入均衡(解) 的概念,即纳什均衡,将博弈论从零和博弈推 进到非零和博弈(即参与人会出现双赢或双输 的情况) 合作博弈中的讨价还价模型 定义非合作博弈及证明均衡解的存在 纳什获得1994年诺贝尔经济学奖
奥斯卡摩根斯坦( Oskar Morgenstern)
1902-1977,生于西里西亚的戈尔 利策.1944年加入美国籍.热心于将 数学应用于人类的各种战略问题(不 管是商业,战争,还是科学研究), 以便获得最大利益和尽可能地减少损失.他认 为 这些原理也同样适用于哪怕简单得象抛掷硬 币这样的游戏,因而提出了对策论(博弈 论).
3.2.2 早期突破 E策墨罗(EZermelo)于1913年对于象棋游戏 的研究.证明了象棋游戏总是有解,即在棋盘 的任何一种状态,两个参与者中的一个有赢的 策略.开创了求解一类博弈的技巧,即后退归 纳法
3.2.3 近代 (1) 约翰冯诺依曼(John von Neumann)于 1928发表的论文 (2) 1944年,科学家冯诺伊曼和经济学家奥斯 卡摩根斯坦合著《博弈与经济行为的理论》 《博弈与经济行为的理论》
第3章 博弈论发展历史
3.1 古代的博弈思想 3Байду номын сангаас2 博弈论的提出 3.3 博弈论的发展 3.4 博弈论研究的价值
3.1 古代的博弈思想
3.2 博弈论的提出
1.2.1 起源 法国经济学家奥古斯丁古诺(Augustin Cournot 1838)——古诺模型 英国经济学家弗朗西斯埃奇沃斯(Francis Edgeworth 1881) 伯川德(Bertrand)和斯坦克伯格(Stackelberg)
约翰冯诺依曼 ( John Von Neumann)
1903-1957,美藉匈牙利人.18岁与老师合作 发表第一篇数学论文,22岁获数学博士学位. 1927年一1929年冯诺依曼相继在柏林大学和汉堡 大学担任数学讲师.1931年成为美国普林斯顿大学 的第一批终身教授.1933年转到该校的高级研究所, 成为最初六位教授之一,并在那里工作了一生. 冯诺依曼是普 林斯顿大学,宾夕法尼亚大学,哈佛大学,伊斯坦堡大学,马 里兰大学,哥伦比亚大学和慕尼黑高等技术学院等校的荣誉博 士.是美国国家科学院,秘鲁国立自然科学院和意大利国立林 且学院等院的院士. 1954年任美国原子能委员会委员;1951年 至1953年任美国数学会主席."计算机之父""博弈论之父".