Non-Cooperative Games

合集下载

纪念阿尔弗雷德-诺贝尔经济学奖获奖者概览(中)

纪念阿尔弗雷德-诺贝尔经济学奖获奖者概览(中)

纪念阿尔弗雷德?诺贝尔经济学奖获奖者概览(中)[摘要]纪念阿尔弗雷德·诺贝尔经济学奖(中文译名在不引起歧义的前提下可简称为诺贝尔经济学奖)1969年由瑞典国家银行出资创设,它是举世公认的国际经济学界的最高荣誉和最大奖赏,其影响力在经济学领域是至高无上的。

本文详尽地介绍了诺贝尔经济学奖,并对迄今45届(1969—2013年)所有74位获奖者的基本情况进行了全方位的统计归类和分析,力求全面而精准。

文后还着重介绍了几个与诺贝尔经济学奖密切相关的其他经济学大奖和学术组织。

[关键词]瑞典国王;诺贝尔基金会;纪念阿尔弗雷德·诺贝尔经济学奖;瑞典皇家科学院;宏观经济学;微观经济学;一般均衡理论;计量经济学;美国经济学会(AEA);AEA沃克奖;AEA克拉克奖;AEA杰出资深会员奖5诺贝尔经济学奖颁奖概况在诺贝尔经济学奖的颁奖历史上,74位获奖者中现只有2位未出席颁奖典礼:1969年获奖的挪威计量经济学家(数理经济学家)弗里希(Ragnar Anton Kittil Frisch,1895.03.03—1973.01.31)因病未出席;1996年获奖的加拿大和美国(双重国籍)经济学家维克瑞(William Sp encer”Bill”Vickrey,1914.06.21—1996.10.11)在颁奖时已逝世。

除1979年是2位诺贝尔奖得主(舒尔茨和威廉·刘易斯)分别发表传统的晚宴致辞(Banquet Speech)以外,其余每届都只有1位发表晚宴致辞。

按照诺贝尔基金会的要求,诺贝尔奖得主唯一的义务是要在一定的时间内(对于经济学奖,1969—1976年一般安排在颁奖后3天以内,1977年起全部安排在颁奖前3天以内,1998年起已固定在12月8日进行)到斯德哥尔摩或奥斯陆(仅限和平奖)发表一次与自己获奖学术成果或工作贡献有关的演讲,通常称之为“诺贝尔演讲(5项传统诺贝尔奖采用Nobel Lecture,仅经济学奖采用Prize Lecture)”。

纳什平衡Nash Equilibrium

纳什平衡Nash Equilibrium

纳什平衡Nash Equilibrium2010-02-11 16:48:59纳什平衡(Nash Equilibrium),又称为非合作赛局平(Non-Cooperative Games),是博弈论的一个重要概念,以约翰•纳什命名。

定义:如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点。

例子:经典的例子就是囚徒困境,囚徒困境是一个非零和博弈。

大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。

如果两人均不招供,将最有利,只被判刑半年。

于是,两人同时陷入招供还是不招供的两难处境。

但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳氏均衡点。

这时,个体的理性利益选择是与整体的理性利益选择不一致的。

囚犯甲的博弈矩阵囚犯甲招供不招供囚犯乙招供判刑两年甲判刑十年;乙即时获释不招供甲即时获释;乙判刑十年判刑半年基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。

事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。

学术争议和批评:第一,纳什(Nash)的关于非合作(non-cooperative)博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。

这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下却找不到,因此仍不能解决问题。

信息与策略经济学(巫和懋)Part 2-1

信息与策略经济学(巫和懋)Part 2-1

信息与策略经济学第1章 完全信息静态博弈1.1 经济理论、信息与策略分析.....................................................................................1-1 1.2 完全信息静态博弈的表示与求解.............................................................................1-31.2.1静态博弈的策略式表示法...............................................................................1-3 1.2.2常见的几个博弈型态.......................................................................................1-4 1.2.3占优策略均衡...................................................................................................1-5 1.2.4纳什均衡...........................................................................................................1-6 1.3 混合策略均衡与均衡存在性.....................................................................................1-71.3.1混合策略的涵义...............................................................................................1-7 1.3.2一般的存在性定理...........................................................................................1-9 1.4 博弈分析在寡占市场之应用.....................................................................................1-111.4.1数量竞争...........................................................................................................1-11 1.4.2价格竞争...........................................................................................................1-14 1.5 定理证明.....................................................................................................................1-161.1 经济理论、信息与策略分析“经济理论”就是具体而微的经济模型(Model)。

约翰.纳什——精选推荐

约翰.纳什——精选推荐

约翰·纳什约翰·纳什(John F Nash),生于1928年6月13日。

任普林斯顿大学数学系教授。

1950,约翰·纳什获得美国普林斯顿高等研究院的博士学位,他那篇仅仅27页的博士论文中有一个重要发现,这就是后来被称为“纳什均衡”的博弈理论。

中文名:约翰·纳什外文名:John F Nash国籍:美国民族:美利坚民族出生地:美国西维吉尼亚州出生日期:1928年6月13日职业:普林斯顿大学数学系教授毕业院校:卡内基技术学院普林斯顿大学主要成就:1994年获得诺贝尔奖经济学奖纳什均衡点纳什嵌入定理代表作品:关于非合作博弈的均衡的论文,《实代数流形》目录简介个人信息个人生活生平介绍孤独的天才一笔优厚的奖学金其它研究领域获得Fields奖与Alicia结婚普林斯顿的幽灵传奇仍在继续政治理念学术成就两篇重要论文被誉为天才的数学家代表著作纳什均衡关于博弈论从事博弈论研究价格战博弈囚犯的两难处境污染博弈贸易自由与壁垒传记电影展开简介个人信息个人生活生平介绍孤独的天才一笔优厚的奖学金其它研究领域获得Fields奖与Alicia结婚普林斯顿的幽灵传奇仍在继续政治理念学术成就两篇重要论文被誉为天才的数学家代表著作纳什均衡关于博弈论从事博弈论研究价格战博弈囚犯的两难处境污染博弈贸易自由与壁垒传记电影展开约翰·纳什约翰·福布斯·纳什(英语:John Forbes Nash Jr),生于1928年6月13日。

父亲是电子工程师与教师,第一次世界大战的老兵,当时在法国担任负责后勤工作的中尉。

纳什小时孤独内向,虽然父母对他照顾有加,但老师认为他不合群不善社交。

美国数学家,前麻省理工学院助教,主要研究博弈论、微分几何学和偏微分方程。

他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论。

晚年为普林斯顿大学的资深研究数学家。

1950年,纳什获得美国普林斯顿大学的博士学位,他在那篇仅仅27页的博士论文中提出了一个重要概念,也就是后来被称为“纳什均衡”的博弈理论。

第五章演化博弈

第五章演化博弈
传统博弈的理性假设过于严格
有限理性的概念:
a Herbet Simon提出有限理性概念,是指:参与者 具有目标的理性,但是由于面对复杂的,多元化 的,不确定性的社会现实,其认知能力的有限性 造成参与者在决策时只能达到满意解,即缺少理 性的能力。
b 另一种观点:有限理性是由于Knight提出的内在 的不确定性造成的,即非线性系统固有的不可预 知性。
x(1 x)(61x 11)
复制动态进化博弈的结果 常常取决与带有很大偶然 性的初始状态。
11/16
1
x
5.3.4 鹰鸽博弈的复制动态和进化稳定策 略
博弈方2


vc
vc

2, 2
v, 0

0, v
v 2
,v
2
鹰鸽博弈
复制动态方程和相位图
dx F (x) x(1 x)[ x(v c) (1 x)v ]
5.3.1 签协议博弈的复制动态和进化稳定策略
经济活动中的各种合作都可以 用签协议博弈描述。特点 理性层次低,大规模群体 随机配对反复博弈。
同意 不同意
博弈方2 同意 不同意
1,1 0,0 0,0 0,0
假设群体中采用“同意”比 例x
则 得不益同为策:略期望得益和uy平均x 1 (1 x) 0 x
A
A
A
B
A
A
A
A
A
A
A
A
初次博弈相邻2个A
B
A
A
B
AB
AA
A
B
A
A
A
A
A
初次博弈相连3个A
A
A
B
A

北京大学博弈论课件第1章博弈论概述

北京大学博弈论课件第1章博弈论概述
博弈参与者可能是单个的个人,也可能是组织或集体
企业、社会团体、国家
博弈参与者可能多于两方,三方或多方博弈参与者
二、博弈策略(Strategy)
博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中,博弈参与者所能采取的博弈策略
均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中,博弈参与者所能采取的博弈策
博弈参与者:两个人 博弈过程:
两人在校门口集合,一起逛博物馆
博弈策略和结果
两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
博弈双方策略相互依赖,不独立。
其他博弈实例
棋类比赛:象棋、围棋等。古人“对弈”。 寡头市场:
遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为
“坦白”或“不坦白”
三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相
2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。

博弈论1:纯策略

博弈论1:纯策略
• 二者相结合将起到好结果
如何制定规则来约束
• 世界上有两种符合集体利益的正义: 实质正义与规则正义。实质正义必须通过 规则正义来实现,否则将被虚置。因此规 则正义最重要。
• 分蛋糕或分粥故事: 20个人的小集体, 每天吃粥。如果所有人抡吃,导致纳什悖 论:每人早早来等粥,成本极高,对谁都 不利。
• 纳什均衡:在完全信息静态 博弈中各方都实现个利益最 大化的策略组合状态
• 纯策略:假定每个参加者每 次只选择一个策略进行博弈
• 混合策略:每个参加者每次 按照各种几率选择不同策略 进行博弈,如监督博弈
二、博弈案例1:占优策略与劣策略
(dominant strategy and dominated strategy) 课本上译为“支配性策略”与“被支配策略”
完全信息静态博弈游戏各方在完全知道博弈过程的三大要素的情况下同时选择策略完全信息动态博弈走象棋围棋游戏各方的完全知识博弈过程的三大要素的情况下相继作出策略选择不完全信息动态博弈国际市场竞争10矩阵的每个位置显示每个参加者的每个策略组合此位置即一博弈格局每个博弈格局上列出每个参加者的利益函数于是得到payoffmatrix例如
• Since then game theory has be taken as the Foundation for Understanding Complex Economic Issues
一、博弈论的基本理论框架
1/博弈论的理论意义与特征
▪ 古典经济学:根据资源稀缺性配置资源 的科学,价格是资源稀缺性的信号,由 此对经济行为进行成本收益分析,MR= MC实现利润最大化 忽视了他人决策对彼此经济利益的影响
• 制度经济学:
科斯:对人之间的交易过程的成本收益分析 诺斯:对交易过程的制度环境进行分析,包括 制度约束与制度变迁与交易过程的关系

博弈论的分类

博弈论的分类

博弈论的分类博弈的分类博弈可以按照不同的分类方式进行分类,比如按照博弈者出招的顺序,博弈者对其他参与博弈者特征、策略空间和收益是否了解进行分类。

1、从按照博弈者出招的顺序、博弈持续时间和重复次数的角度,博弈可以分为静态博弈(Static Game)和动态博弈(Dynamic Game)。

静态博弈指的是参与博弈的各方同时采取策略,这些博弈者的收益取决于博弈者们不同的策略组合。

因此静态博弈又称为“同时行动的博弈”(Simultaneous-Move Games)。

有时候博弈方采取策略有先后,但是他们并不知道之前其他人做出的策略。

比如“囚徒困境”中罪犯1采取策略后,轮到罪犯2采取策略时他并不知道罪犯1所做出的策略。

动态博弈(序贯博弈)指的是在博弈中,参与博弈的博弈方所采取策略是有先后顺序的(Sequential-Move),且博弈者能够知道先采取策略者所选择的策略。

2、从博弈者对其他参与博弈者所了解的信息的完全程度,博弈可以分为完全信息博弈(Complete Information Game)与不完全信息博弈(Incomplete Information Game),以及完美信息博弈(Perfect Information Game)与不完美信息博弈(Imperfect Information Game),确定的博弈(Certainty Game)与不确定的博弈(Uncertain Game),对称信息博弈(Symmetric Game)与非对称信息博弈(Asymmetric Game)等等。

其中,完全信息是指博弈中每一个博弈者对其他博弈者的特征、策略空间和收益函数都了解,也就是博弈者的收益集(Pay offs)是所有博弈者都知道的。

完美信息是指博弈者完全知道在他采取策略时其他博弈者的所有策略信息。

完美信息是针对记忆而言,也就是他知道博弈已经发生过程的所有信息。

又或者说,如果博弈者在采取策略时观察到他所处的信息节点是唯一的,即他知道以前发生的所有事情,如果所处的信息节点不唯一,说明他对之前的信息没有完美的记忆(不知道博弈过程是怎么过来的)。

约翰纳什全文

约翰纳什全文

John Forbes Nash Jr. (born June 13, 1928) is an American mathematician and economist whose works in game theory, differential geometry, and partial differential equations have provided insight into the forces that govern chance and events inside complex systems in daily life. His theories are still used today in market economics, computing, artificial intelligence, accounting and military theory. Serving as a Senior Research Mathematician at Princeton University during the later part of his life, he shared the 1994 Nobel Memorial Prize in Economic Sciences with game theorists Reinhard Selten and John Harsanyi.Nash is also the subject of the Hollywood movie A Beautiful Mind, which was nominated for eight Oscars (winning four). The film, based very loosely on the biography of the same name, focuses on Nash's mathematical genius and his struggle with paranoid schizophrenia.Early lifeNash was born and raised in Bluefield, West Virginia. He was the son of electrical engineer John Forbes Nash Sr. and his wife Margaret Virginia Martin. He has one younger sister named Martha.Nash's younger sister wrote that "Johnny was always different. [My parents] knew he was different. And they knew he was bright. He always wanted to do things his way. Mother insisted I do things for him, that I include him in my friendships... but I wasn't too keen on showing off my somewhat odd brother."[3]At the age of 13, Nash carried out scientific experiments in his room. In his autobiography, Nash notes that E.T. Bell's book, Men of Mathematics —in particular, the essay on Fermat —first sparked his interest in mathematics. He attended classes at Bluefield College while still in high school at Bluefield High School. After graduating from high school in 1945, he enrolled at the Carnegie Institute of Technology (now Carnegie Mellon University) in Pittsburgh, Pennsylvania on a Westinghouse scholarship, where he studied chemical engineering and chemistry before switching to mathematics. He received both his bachelor's degree and his master's degree in 1948 while at Carnegie Tech.Nash also created two popular games: Hex in 1947 (independently created first in 1942 by Piet Hein), and So Long Sucker in 1950 with M. Hausner and Lloyd S. Shapley.After graduation, Nash took a summer job in White Oak, Maryland, working on a Navy research project being run by Clifford Truesdell.Post-graduate lifeIn 1948, in Nash's application to Princeton’s mathematics department, Nash's advisor and former Carnegie Tech professor, R.J. Duffin, wrote a letter of recommendation consisting of a single sentence: "This man is a genius."[4] Though Nash was accepted by Harvard University, the chairman of the mathematics department of Princeton, Solomon Lefschetz, offered him the John S. Kennedy fellowship, which was enough to convince him that Harvard valued him less.[5] Thus from White Oak, he went to Princeton, where he worked on his equilibrium theory. He earned a doctorate in 1950 with a 28 page dissertation on non-cooperative games.[6] The thesis, which was written under the supervision of AlbertW. Tucker, contained the definition and properties of what would later be called the "Nash Equilibrium". These studies led to four articles:"Equilibrium Points in N-person Games", Proceedings of the National Academy of Sciences 36 (1950), 48–49. MR0031701"The Bargaining Problem", Econometrica 18 (1950), 155–162. MR0035977"Two-person Cooperative Games", Econometrica 21 (1953), 128–140. MR0053471"Non-cooperative Games", Annals of Mathematics 54 (1951), 286–295.Nash also did ground-breaking work in the area of real algebraic geometry:"Real algebraic manifolds", Annals of Mathematics 56 (1952), 405–421. MR0050928 See also Proc. Internat. Congr. Math. (AMS, 1952, pp 516–517).His most famous work in pure mathematics is the Nash embedding theorem, which shows that any abstract Riemannian manifold can be isometrically realized as a submanifold of Euclidean space. He also made contributions to the theory of nonlinear parabolic partial differential equations, and to singularity theory.MarriageIn 1951, Nash went to the Massachusetts Institute of Technology as a C. L. E. Moore Instructor in the mathematics faculty. There, he met Alicia López-Harrison de Lardé (born January 1, 1933), a physics student from El Salvador, whom he married in February 1957. She admitted Nash to a mental hospital in 1959 for schizophrenia; their son, John Charles Martin Nash, was born soon afterward, but remained nameless for a year because his mother felt that her husband should have a say in the name.Nash and Lopez-Harrison de Lardé divorced in 1963, but reunited in 1970, in a nonromantic relationship that resembled that of two unrelated housemates. De Lardé referred to him as her "boarder" and said they lived "like two distantly related individuals under one roof," according to Sylvia Nasar's 1998 biography of Nash, A Beautiful Mind. The couple renewed their relationship after Nash won the Nobel Prize in Economics in 1994. They remarried June 1, 2001.SchizophreniaNash began to show signs of extreme paranoia and his wife later described his behavior as increasingly erratic, as he began speaking of characters who were putting him in danger. Nash seemed to believe that there was an organization chasing him, in which all men wore "red ties". Nash mailed letters to foreign embassies in Washington, D.C., declaring that he was establishing a world government.[citation needed]He was involuntarily committed to the McLean Hospital, April–May 1959, where he was diagnosed with paranoid schizophrenia and mild clinical depression.[3] Upon his release, Nash resigned from MIT, withdrew his pension, and went to Europe, unsuccessfully seeking political asylum in France and East Germany. He tried to renounce his U.S. citizenship. After a problematic stay in Paris and Geneva, he was arrested by the French police and deported back to the United States at the request of the U.S. government.In 1961, Nash was committed to the New Jersey State Hospital at Trenton. Over the next nine years, he was in and out of psychiatric hospitals, where besides receiving antipsychotic medications, he was administered insulin shock therapy.[3][7][8]Although prescribed medication, Nash wrote later that he only took it either involuntarily or under pressure, but after 1970, he was never committed to the hospital again and refused any medication. According to Nash, the film A Beautiful Mind inaccurately showed him taking new atypical antipsychotics during this period. He attributed the depiction to the screenwriter (whose mother, he notes, was a psychiatrist) who was worried about encouraging people with the disorder to stop taking their medication.[9] Others, however, have questioned whether the fabrication obscured a key question as to whether recovery from problems like Nash's can actually be hindered by such drugs[10] and Nash has said they are over-rated and the adverse effects are not given enough consideration once someone is considered mentally ill.[11][12][13] According to Nasar, Nash recovered gradually with the passage of time. Encouraged by his then former wife, De Lardé, Nash worked in a communitarian setting where his eccentricities were accepted. De Lardé also said for Nash, "it's just a question of living a quiet life".[14]Nash dates the start of what he terms "mental disturbances" to the early months of 1959 when his wife was pregnant. He has described a process of change "from scientific rationality of thinking into the delusional thinking characteristic of persons who are psychiatrically diagnosed as 'schizophrenic' or 'paranoid schizophrenic'"[15] including seeing himself as a messenger or having a special function in some way, and with supporters and opponents and hidden schemers, and a feeling of being persecuted, and looking for signs representing divine revelation.[16] Nash has suggested his delusional thinking was related to his unhappiness, and his striving to feel important and be recognized, and to his characteristic way of thinking such that "I wouldn't have had good scientific ideas if I had thought more normally." He has said that "If I felt completely pressureless I don't think I would have gone in this pattern".[17] He does not see a categorical distinction between terms such as schizophrenia and bipolar disorder.[18] Nash reports that he did not hear voices until around 1964, later engaging in a process of rejecting them.[19] Nash reports that he was always taken to hospital against his will, and only temporarily renounced his "dream-like delusional hypotheses" after being in hospital long enough to decide to superficially conform and behave normally or experience "enforced rationality". Only gradually on his own did he "intellectually reject" some of the "delusionally influenced" and "politically-oriented" thinking as a waste of effort. However, by 1995, he felt that although he was "thinking rationally again in the style that is characteristic of scientists", he felt more limited.Recognition and later careerIn Princeton campus legend, Nash became "The Phantom of Fine Hall" (Princeton's mathematics center), a shadowy figure who would scribble arcane equations on blackboards in the middle of the night. The legend appears in a work of fiction based on Princeton life, The Mind-Body Problem, by Rebecca Goldstein.In 1978, Nash was awarded the John von Neumann Theory Prize for his discovery of non-cooperative equilibria, now called Nash equilibria. He won the Leroy P. Steele Prize in 1999.In 1994, he received the Nobel Memorial Prize in Economic Sciences (along with two others), as a result of his game theory work as a Princeton graduate student. In the late 1980s, Nash had begun to use email to gradually link with working mathematicians who realized that he was the John Nash and that his new work had value. They formed part of the nucleus of a group that contacted the Bank of Sweden's Nobel award committee, and were able to vouch for Nash's mental health ability to receive the award in recognition of his early work.[citation needed]Nash's recent work involves ventures in advanced game theory, including partial agency, that show that, as in his early career, he prefers to select his own path and problems. Between 1945 and 1996, he published 23 scientific studies.Nash has suggested hypotheses on mental illness. He has compared not thinking in an acceptable manner, or being "insane" and not fitting into a usual social function, to being "on strike" from an economic point of view. He has advanced evolutionary psychology views about the value of human diversity and the potential benefits of apparently non-standard behaviors or roles.[21]Nash has also developed work on the role of money in society. In the context that people can be so controlled and motivated by money that they may not be able to reason rationally about it, he has criticized interest groups that promote quasi-doctrines based on Keynesian economics that permit manipulative short-term inflation and debt tactics that ultimately undermine currencies. He has suggested a global "industrial consumption price index" system that would support the development of more "ideal money" that people could trust, rather than more unstable "bad money". He notes that some of his thinking parallels economist and political philosopher Friedrich Hayek's thinking regarding money and a nontypical viewpoint of the function of the authorities.[22][23]Nash received an honorary degree in economics from the University of Naples Federico II on 19 March 2003.Film controversyIn 2002, aspects of Nash's personal life were brought to international attention when "mudslinging" ensued over screenwriter Akiva Goldsman's semifictional interpretation of Sylvia Nasar's biography of Nash's life in A Beautiful Mind in relation to the film of the same name.[24] The film, nominated for eight Oscars, credits Goldsman under "written by" rather than "screenplay by" which is a Writers Guild distinction meaning a significant departure from source material.[1][25] According to the Writer's Guild, Goldsman's "omissions are glaring and peculiar", including Nash's "extramarital sexual activities,[1][26] his racial attitudes and anti-Semitic remarks."[27] Nash later claimed any anti-Semitic remarks must have been made while he was delusional.[27]In the mid-1950s Nash was arrested in a Santa Monica restroom on a morals charge related to a homosexual encounter and "subsequently lost his post at the RAND Corporation along with his security clearance."[28][29] According to Nasar, "After this traumatic series of career-threatening events, he decided to marry."[29]Nasar stated that the filmmakers had "invented a narrative that, while far from a literal telling, is true to the spirit of Nash's story."[30] Others suggested that the material was "conveniently left out of the movie in order to make Nash more sympathetic,"[31] possibly in an effort to more fully focus on the "debilitating longevity" of living with paranoid schizophrenia on a day-to-day basis.[31]New York Times critic A. O. Scott pointed to a different perspective. Scott wrote of the Oscar scandal and the artistic choices made in the omissions as well as choices, such as casting actors, that have to be made that "the cold war in A Beautiful Mind in which the paranoia and uncertainty of McCarthy-era academic life is reduced to spy-movie clichés" smoothed over "and made palatable and familiar" a "difficult passage in American history."[32] Thus, the Cold War's effects on Nash's life and career were left unexplored.[32] Goldsman won the Academy Award for Best Adapted Screenplay.[27] The film also won Best Picture, Best Director (Ron Howard) and Best Supporting Actress (Jennifer Connelly).。

第9讲合作博弈论

第9讲合作博弈论

,则 ( N , v) 称作常和博弈。

则 ( N , v) 称作简单博弈。
例如在投票博弈中,每个参与人的权重 wi (wi Q),1 i n ,
0 v( S ) 1
w Q w Q
iS i iS i
• 如果 v(S ) v(T ) v(S T ) v(S T ) ,则 ( N , v) 称作凸 博弈。
根据纳什的这一界定条件,由于合作博弈中存在具有约 束力的协议,因此,每位博弈者都能够按自己的利益与其他 部分的博弈者组成一个小集团,彼此合作以谋求更大的总支 付。我们称这些小集团为联盟(coalition),而由所有博弈者 组成的联盟则称为总联盟(grand coalition)。因此,对有n 个局中人参与的博弈,即 N {1,2,, n} ,我们称集合 N 的任何一 个子集 S 为一个联盟。
v(S1 S2 ) v(S1 ) v(S2 )
S1 S 2 ,如果。
n
类型2, v 满足 v( N ) v(i) 。即大联盟的效用大于每 i 1 个参与人的效用之和。这说明通过联盟创造了新的合 作剩余,联盟有意义,这种联盟能否维持,取决于如 何分配合作剩余,使每个参与人的支付都有改善。这 种对策称为实质性对策。

函数 v 对集合 N 当中的每一个可能的非空子集 S 都会进 行赋值,其值为一个实数,我们用 N , v 来表示一个合作 博弈,而函数为每一个集合所赋的值则称为S的联盟值。 为了确保每位博弈者都愿意组成总联盟,合作博弈论 一般要求支付可转移的联盟型博弈为有结合力的: 定义1.4 一个支付可以转移的联盟型博弈 N , v 是有结 合力的,当且仅当,对于集合 N 的每个分割物,即{S1 , S 2 , S m }

博弈论及应用3

博弈论及应用3

Cont..
将式(1)代入企业1的的得益函数 u 1 (q1, q2) = 6 q1- q1 q2-q12 =3 q1 – q12 /2 max q1 (3 q1 – q12 /2) 一阶条件: 3 - q1*= 0 有 q1*=3 (单位), q2*=3 - q1* /2 = 1.5 (单位), 使 u 1= 4.5 , u 2 = 2.25 使市场总产量 Q =q1+q2=4.5, 得二企业总得益 U = u 1 + u 2 =4.5+2.25=6.75
子博弈完美纳什均衡能够排除均衡策略中不 可信的威胁和承诺,因此是真正稳定的。 逆推归纳法是求完美信息动态博弈子博弈完 美纳什均衡的基本方法。
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格(Stackelberg) 模型 3.4.2 讨价还价博弈 3.4.3 委托—代理理论 3.4.4委托—代理理论(续)
3.4.1 寡占的斯塔克博格(Stackelberg) 模型
假设市场上有两个厂商,决策内容是产量, 一个是领头(leader)企业,一个是跟随 (follower)企业。领头企业先选择自己的 产量,跟随企业根据领头企业的产量选择, 选择自己的产量。 显然,他们选择有先有后,所以是一个 动态博弈。
斯塔克博格(Stackelberg)模型
房地产开发( Ⅱ )
A
开发
如果B在决策时并不
不开发
N
需求大
N
需求小
知道自然的选择,那么其
信息集就由原来的四个减 少为两个。博弈过程如图 所示。
B
开发
B B
B
不开发
(4,4)
(8,0)(-3,-3) (1,0) (0,8) (0,0)(0,1) (0,0)

纳什均衡的定义和应用范围

纳什均衡的定义和应用范围

纳什均衡的定义和应用范围一、定义在不完全信息博弈当中,所有参与博弈的人策略构成一个策略组。

纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成,即在给定别人策略的情况下,没有人有足够理由打破这种均衡。

纳什均衡又称为非合作博弈均衡,由美国数学家约翰·纳什在1950年提出,他的论文《Non-cooperative Games》奠定了现代博弈论的基础。

1994年,纳什因在博弈论领域的杰出贡献获得诺贝尔经济学奖。

纳什均衡描述了一种策略组合,在这种组合中,任何一个参与者都无法通过单方面改变自己的策略来获得更好的结果。

换句话说,当每个玩家都在使用纳什均衡中的策略时,没有人有动力去偏离自己的策略。

具体来说,在一个包含多个参与者的博弈中,如果每个参与者的策略都是对其他参与者策略的最佳回应,则这个策略组合称为纳什均衡。

二、纳什均衡的应用纳什均衡的应用非常广泛。

在经济学中,可用于帮助解释和预测市场竞争、拍卖设计和定价策略等行为。

在政治学中,可用于分析选举策略、联盟形成和国际关系中的策略选择。

在生物学中,进化博弈理论通过运用纳什均衡来解释动物行为和进化稳定策略。

在社会科学中,纳什均衡用于研究社会规范、合作行为和冲突解决机制。

此外,纳什均衡还在计算机科学中的网络设计、算法博弈论和多代理系统中应用广泛。

纳什均衡作为博弈论中的重要概念,指导着决策制定者在互动环境中做出理性选择的策略。

纳什均衡的应用不仅帮助我们理解和解释了许多现实世界中的决策行为,同时也为我们提供了指导理性决策的思路和方法。

我们可以进一步探索纳什均衡的变种形式和扩展应用,以更好地解决互动决策问题。

博弈论的分类

博弈论的分类
22博弈按参与者信息的分类时间次序信息静态动态完全信息约翰纳什纳什均衡赛尔顿子博弈精炼纳什均衡不完全信息海萨尼贝叶斯纳什均衡赛尔顿精炼贝叶斯纳什均衡在合作博弈中每个博弈参与者采取的是一种合作的方式或者说是一种妥协目的是通过合作的方式使得每个博弈参与者及整个系统的收益都达到最优
须要求博弈方互相认识彼此的决策行为,即每个参与者都能预见其他参与者的均 衡策略。当一个博弈中的参与者达到纳什均衡状态时,任何一个参与者都不能独 自的改变本身的策略行为以增大自身的收益而不影响其他参与者的策略行为。因 此,纳什均衡表示的是博弈的稳态性,一旦达到纳什均衡状态,表明该博弈各个 参与者之间达到均衡状态,不再进行策略行为的选择。而纳什均衡也存在不足之 处,纳什均衡的状态并不一定是唯一的,在有些实际问题中会存在多个纳什均衡。 2.2.6 帕累托最优 帕累托最优(Pareto Optimality),也称为帕累托效率(Pareto Efficiency, PE)。 这个概念是由 意大利经济学家维弗雷多·帕累托在关于经济效率和收入分配的一篇论文中提出, 在经济学、 工程学和社会科学中有着广泛的应用。帕累托最优是博弈论中非常重要的概念, 指的是资源 分配的一种最优的状态,在不使任何参与者情况变坏的情况下,不可能再使某些 参与者的处 境变好。 在一个基本的博弈 { } 11 ,,;,, nn G = s s u u 中,由每个博弈方的策略行为组成的策略集合 () 11 1 ,, n s s ,如果不存在任何的策略行为集合 () 2 12 ,, n s s 使得: ()()
际效用随着其他博弈方策略行为的递增而增加。在博弈中,对最优反应的反应是 递增的,所以博弈参与者的策略行为是“策略互补”的。当有两个博弈方参与时, 对变量进行变化以后也可以采用超模博弈模型进行分析递减的最优反应的情况。 2.3 本章小结 功率控制技术作为认知无线电的关键技术,在保证接收端信干比的前提下,尽可 能的降低每个认知用户的发射功率,减少系统间的相互干扰,使系统容量最大化。 通过功率控制技术,使得网络中用户间的相互干扰达到最小,而且降低了终端的 能源消耗。本章首先介绍介绍了功率技术的分类,包括开环、闭环功率控制及集 中式、分布式功率控制技术等。然后,详细阐述了博弈论的基本知识,包括博弈 论的基本概念、分类及基本模型,并介绍了博弈论中的重要理论:纳什均衡及帕 累托最优,为研究基于博弈的认知无线电功率控制技术奠定了理论基础。 博弈论包含自身的博弈模型,其中,一个完整的博弈模型包含 3 个基本组成部 分,即博弈参与方(Player)、策略行为集合(Strategy set)及效用函数(Utility Function, UF)。由此,可以从 5 个方面来对博弈论的基本模型做详细的描述, 即 G={P,A,S,I,U}。 (1)P(player),博弈的参与者,也可称为“局中人”“博弈方”,是指在博弈 中独立决策、独立承担后果,并且使自身利益达到最好来选择策略行为的决策主 体。其中,博弈的参与者可以是个人也可以是团体组织。无论参与者是个人还是 团体,一旦参与博弈,各参与方互相平等,都必须按照一定的博弈规则确定自己 的策略行为。 (2)A(action),所有博弈参与者的策略行为组成部分。指在博弈过程中,每个 参与者在与其他参与者进行博弈时,可选择的行为策略。对于博弈局中人来说, 在不同的博弈过程中可以选择的策略行为是不同的,即使同属于一个博弈过程中, 可选择的策略行为也是不同的,可能是一种或是多种,甚至无限多种。 (3)S(strategies),博弈的次序。在实际的许许多多博弈决策中,当有许多博 弈局中人需要进行决策行为时,有时这些博弈参与者需要在同一时间做出决策行 为,以保证博弈方的公平性,而有时博弈参与者的决策行为要有不同的先后顺序, 而且有的博弈参与者需要做出多次决策行为。因此,在博弈中,需要定义博弈参 与者之间的次序,如果两个博弈仅仅次序不同,那么他们是不同的博弈。 (4)I(information),博弈信息。在博弈中,信息的掌握对于博弈方非常重要, 信息掌握的越多,博弈参与者的决策行为就越准确。因此,博弈参与者应尽可能 的掌握更多的博弈信息,在博弈选择决策行为时更为主动,从而确保决策行为的 准确性。

GAME THEORY

GAME THEORY
其次,剔除新博弈中某个参与人的严格劣策略; 重复上述过程,直到只剩下唯一的策略组合。 我们认为这个唯一所剩的策略组合是稳定的。
1.2.2 重复剔除的占优均衡
Definition:In a normal-form game, if for each player i , si" is i‟s dominant strategy, than we call the strategies profile (s1″, …, sn" ) the „dominantstrategy equilibrium‟.
1.2.1占优战略均衡
定义2:一个博弈G,若对博弈方i及所用s-i都有 ui (si*,s-i) > ui (si ‟,s-i),则称si*是si ‟的严格上 策, si ‟是si*的严格下策。 定义3:若在博弈G中对每个博弈方i都存在策 略si*是其它所有策略的严格上策,则称策略组 合s*=(s1*,s2*, … ,sn*)是G的上策均衡。
In the normal-form representation of a game ,each
player simultaneously chooses a strategy, and the combination of strategies chosen by the players determines a payoff for each player. Definition: The normal-form representation of an-n-player game specifies the players‟ strategy spaces S1 , … , Sn and their payoff functions u1 ,…, un. We denote this game

博弈论最全完整-讲解

博弈论最全完整-讲解

问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
正因为这样的博弈对所有参与者存在着或大 或小的潜在成本,如何达成和维护互利的合 作就成为一个值得探究的重要问题。
存在双赢的博弈吗?实用文档
6
例2:焦点博弈 “We Can’t Take the Exam,
获奖理由:在非合作博弈的均衡分析理 论方面做出了开创性的贡献,对博弈论 和经济学产生了重大影响 。
实用文档
17
约翰·纳什 1928年生于美国
莱因哈 德·泽 尔腾, 1930 年生于 德国
实用文档
约翰· 海萨尼 1920年 生于美 国
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
实用文档
19
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英 国
实用文档
20
2001年诺贝尔经济学奖获得者
实用文档
35
第一章 完全信息静态博弈
博弈论的基本概念及战略式表述 纳什均衡
纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性与多重性
实用文档
36
第一节 博弈论的基本概念
与战略式表述
Байду номын сангаас
实用文档
37
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行 为发生直接相互作用时候的决策以及这种 决策的均衡问题。

约翰·纳什:

约翰·纳什:
1957年,他们结婚了。之后 漫长的岁月证明,这也许正 是纳什一生中比获得诺贝尔 奖更重要的事。
11
就在事业爱情双双得意的时候,纳什也因为喜欢独来独往, 喜欢解决折磨人的数学问题而被人们称为"孤独的天才"。 他不是一个善于为人处世并受大多数人欢迎的人,他有着 天才们常有的骄傲、自我中心的毛病。他的同辈人基本认 为他不可理喻,他们说他"孤僻,傲慢,无情,幽灵一般, 古怪,沉醉于自己的隐秘世界,根本不能理解别人操心的 世俗事务。"婚后,1958年的纳什好像是脱胎换骨,精神 失常的症状显露出来了。他一身婴儿打扮,出现在新年晚 会上。两周之里,对人们宣称,他正通过手里的报纸收到 一些信息,要么来自宇宙里来的神秘力量,要么来自某些 外国政府,而只有他能够解读外星人的密码。当一个人问 他为何那么肯定是来自外星人的信息,他说,有关超自然 体的感悟就如同数学中的灵思,是没有理由和先兆的。
1
1928年,纳什·约翰出生在西弗吉尼亚。 纳什从小就显得内向而孤僻。他生长在一
个充满亲情温暖的家庭中,幼年大部分时 间是在母亲、外祖父母、姨妈和亲戚家的 孩子们的陪伴下度过,但比起和其他孩子 结伴玩耍,他总是偏爱一个人埋头看书或 躲在一边玩自己的玩具。
2
年轻时的纳什
3
小纳什虽然并没有表现出神童的特质,但却是 一个聪明、好奇的孩子,热爱阅读和学习。纳 什的母亲和他关系亲密,或许出于教师的职业 天性,她对纳什的教育格外关心,早在纳什进 入幼儿园前,就开始亲自教育、辅导他。而纳 什的父亲则喜欢和孩子们分享自己在科学技术 上面的兴趣,能够耐心地回答纳什提出的各种 自然和技术的问题,并且给了他很多的科普书 籍。少年时期的纳什还特别热衷做电学和化学 的实验,也爱在其他孩子面前表演。

博弈论介绍

博弈论介绍

博弈论介绍博弈论(Game Theory)是一门研究决策制定和策略选择的数学分支学科。

它最初由数学家约翰·冯·诺伊曼(John von Neumann)和经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)于20世纪40年代共同发展起来,用于研究各种竞争、协作和冲突情境下的决策问题。

博弈论的应用领域涵盖了经济学、政治学、社会学、生物学、计算机科学等多个领域。

以下是博弈论的详细介绍:基本概念:博弈(Game):博弈是一种决策情境,涉及多个决策者(玩家)之间的相互影响和策略选择。

每个玩家可以采取不同的策略,而策略的选择会影响每个玩家的收益或效用。

玩家(Player):博弈中的参与者被称为玩家,每个玩家都追求最大化其自身的收益或效用。

策略(Strategy):策略是玩家的行动方案或选择,玩家根据自己的目标和信息来选择策略。

收益(Payoff):每个玩家根据博弈的结果获得一定的收益或效用,这些收益可以是正数、负数或零,反映了玩家的利益。

博弈类型:合作博弈(Cooperative Games):在这种类型的博弈中,玩家可以合作以实现共同的目标,并分配获得的利益。

著名的合作博弈包括合作博弈理论和核心。

非合作博弈(Non-Cooperative Games):在非合作博弈中,玩家之间缺乏明确的合作机制,每个玩家根据自己的利益做出决策。

著名的非合作博弈包括纳什均衡等。

重要概念:纳什均衡(Nash Equilibrium):纳什均衡是非合作博弈中的一个重要概念,指的是在博弈中,每个玩家根据其他玩家的策略选择,不能通过改变自己的策略来提高自己的收益。

纳什均衡是博弈中可能的结果之一。

博弈矩阵(Game Matrix):博弈矩阵是一种表示博弈的方式,它列出了每个玩家在每个可能策略组合下的收益。

通常用于描述双人零和博弈。

博弈树(Game Tree):博弈树是一种表示多人博弈的方式,它展示了博弈中玩家的策略选择和博弈结果的演化过程。

决策

决策
美国学者林布隆提出:决策的实际过程并不 完全是一个理性过程,而是对以往政策行 为的不断修正过程。决策只能根据以往的 经验,在现有的政策基础上实现渐进变迁。 决策者要依据现有方案,通过与以往政策 的比较,考虑不断变化的环境需要,对以 往政策进行局部的、小范围的调整,逐渐 把一项旧的政策转变为一项新的政策。
八、决策的层次系统(目标手段系统)
为了实现较高层次的目标,必须通过一 定的手段,这一手段又成为较低层次的目 标。这样就形成了一个决策层次系统,也 称为目标手段系统。
九、决策的理性
• 完全理性(Perfect rationality)
问题清楚,目标单一 所有方案和结果已知 偏好清楚、一贯 不存在时间、成本上的约 束
• 目标选择:确定目标。 首先要具体,其次要恰当,再次要有可验证性。 • 方案选择:提出各种备选方案。 并非越多越好,但只有一个也不行。 霍布森选择:只有一种方案的选择。 当看上去只有一条路可走时,这条路往往是错误的。 当情况非常严重,无其他路可走时,霍布森选择也可能是 正确的。如破釜沉舟,置之死地而后生。但大多情况下, 它是错误的。
渐进模型的特点
• (1)要求决策者必须保留对以往政策的承 诺。 • (2)决策者不必过多分析与评估备选方案, 只注重其对现行政策的修改与补充。 • (3)强调目标与方案之间的相互调整。 • (4)注重减少现行政策的缺陷,不注重手 段和方案的重新选择。
渐进模型的优缺点
• 优点:有利于避免因决策严重失误所产生 的持久性结果。尤其是在政府公共政策的 制定过程中渐进模型的作用更大。 • 缺点:多适用于稳定发展的社会形势,有 很大的局限,保守主义倾向,尤其不适用 于突发形势。对发展中国家的改革不适用。
有限理性(Bounded rationality)

导论:博弈论与信息经济学

导论:博弈论与信息经济学

30,100 0,400
-10,140 0,400
市场进入: 表0.8 市场进入:低成本情况 江西财经大学信息管理学院陶长琪
“自然”不同于一般参与 人之处在于它在所有后果之是是无差异的。
自然首先行动----选择参与人的“类型” 自然首先行动 选择参与人的“类型”。被选择的参与 人知 选择参与人的 自己的真实类型, 道 自己的真实类型,而其他参与 人并不清楚这个被选择的参 与人的真实类型,自然知道各种可能的概率分布。 与人的真实类型,自然知道各种可能的概率分布。 另外, 人心目中的这个分布函数---另外,被选择的参与 人也知道 其他参与 人心目中的这个分布函数 -就是说分布函数是一种 共同知识” -就是说分布函数是一种“共同知识”(common knowledge)。 就是说分布函数是一种“ knowledge)。 他的上述工作被称为“海萨尼转换” 他的上述工作被称为“海萨尼转换”(the harsanyi transformation)。 。 通过这个转换,海萨尼把“不完全信息博弈”转换成“ 通过这个转换,海萨尼把“不完全信息博弈”转换成“完全但不完美 信息博弈” 信息博弈”(complete but imperfect information)。 。 在这个基础上,海萨尼定义了“贝叶斯纳什均衡” 在这个基础上,海萨尼定义了“贝叶斯纳什均衡”。——给定自己 给定自己 的类型和别人类型的概率分布的情况下, 的类型和别人类型的概率分布的情况下,每个参与人的期望效用达 到了最大化,也就是说,没有人有积极性选择其他战略。 到了最大化,也就是说,没有人有积极性选择其他战略。
江西财经大学信息管理学院陶长琪
0.2.2.完全信息动态博弈: .完全信息动态博弈: 子博弈精炼纳什均衡
泽尔腾(1965)通过对动态博弈的分析完善了纳什均衡的 概念, 定义 了“子博弈精炼纳什均衡”。 这个概念的中心意义是:将纳什均衡中包含的不可置信 的威胁战略剔除出去。 他要求参与人的决策在任何时点上都是最优的,决策都 要“随机应变”,“向前看”,而不是固守旧略。 博弈的另外一种表述形式:扩展型(extensive form),它 包含五个要素: 1,参与人,2,每个参与人选择行动的时点,3,每个 参与人在每次行动时可供选择的行动集合,4,每个参 与人在每次行动时可供选择的信息,5,支付函数。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Non-Cooperative Games
John Nash
The Annals of Mathematics,2nd Ser.,Vol.54,No.2.(Sep.,1951),pp.286-295.
Stable URL:
/sici?sici=0003-486X%28195109%292%3A54%3A2%3C286%3ANG%3E2.0.CO%3B2-G
The Annals of Mathematics is currently published by Annals of Mathematics.
Your use of the JSTOR archive indicates your acceptance of JSTOR's Terms and Conditions of Use,available at
/about/terms.html.JSTOR's Terms and Conditions of Use provides,in part,that unless you have obtained prior permission,you may not download an entire issue of a journal or multiple copies of articles,and you may use content in the JSTOR archive only for your personal,non-commercial use.
Please contact the publisher regarding any further use of this work.Publisher contact information may be obtained at
/journals/annals.html.
Each copy of any part of a JSTOR transmission must contain the same copyright notice that appears on the screen or printed page of such transmission.
The JSTOR Archive is a trusted digital repository providing for long-term preservation and access to leading academic journals and scholarly literature from around the world.The Archive is supported by libraries,scholarly societies,publishers, and foundations.It is an initiative of JSTOR,a not-for-profit organization with a mission to help the scholarly community take advantage of advances in technology.For more information regarding JSTOR,please contact support@.
Fri Oct1912:11:222007。

相关文档
最新文档