博弈论001
博弈论百度百科
博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
博弈论概要
博弈论概要1.研究背景及意义在现实生活中,人们的利益冲突与一致具有普遍性,因此,几乎所有的决策问题都可以认为是博弈。
博弈论在政治学、经济学等许多领域都有着广泛的应用。
在经济学中博弈论作为一种重要的分析方法已渗透到几乎所有的领域,每一领域的最新进展都应用了博弈论,博弈论已经成为主流经济学的一部分,对经济学理论与方法正产生越来越重要的影响。
虽然博弈论是数学的一个分支,但其应用范围十分广泛,在经济学、管理学、社会学、政治学、法律学、军事学等领域都有许多成功运用博弈论的案例。
早在1994年,提出博弈均衡理论的纳什博士与他的伙伴哈尔萨尼教授、泽尔滕教授就共同分享了当年的诺贝尔经济学奖和93万美元的奖金。
2005年,瑞典皇家科学院再次把诺贝尔经济学奖颁给了有着以色列、美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林,以表彰他们在博弈论领域作出的贡献。
纳什的贡献是在1944年与奥斯卡·摩根斯特恩合著了《博弈论与经济行为》一书,标志着现代系统博弈理论的的初步形成。
而谢林和奥曼两位博弈论先驱在政治理论、社会学甚至生物学等方面成功运用到了博弈学理论。
奥曼用数学分析为博弈论列出了精确的公式,谢林则是想通过实践来展示博弈论在社会各个领域的实际意义。
他们两位利用博弈论对商业谈判、种族隔离、武器控制等领域进行了实际分析,谢林教授认为博弈论运用的重要领域应该包括核威慑和武器控制,同时还可以研究种族关系、有组织犯罪、雇员关系乃至自我管理等方面。
2.博弈论相关概念与发展史综述2.1博弈论的概念2.1.1博弈论的定义博弈论(Game Theory,又称对策论)研究决策主体的行为在发生直接的相互作用时,人们如何进行决策以及这种决策的均衡问题。
博弈论是研究理性的决策者之间冲突与合作的理论。
在博弈论分析中,一定场合中的每个对弈者在决定采取何种行动时都策略地、有目的地行事,他考虑到他的决策行为对其他人的可能影响,以及其他人的行为对他的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。
博弈论知识简要
寻找混合策略纳什均衡的思路
• 令各博弈方随机选择纯策略的概率分布,满足使其 他博弈方采用不同策略的期望得益相同,从而计算 出各个博弈方随机选择各纯策略的概率。
• 在猜硬币博弈中,设盖硬币方出正面的概率为p, 出反面的概率为1-p。则猜硬币方猜正面的期望得 益为p·1+(1-p)·(-1)=2p-1,猜反面的期望得益 是p·(-1)+(1-p) ·1=1-2p,令二者相等,得p=1/2。 盖硬币方的混合策略是以(1/2,1/2)的概率随机 选择正面和反面。类似的,可以计算出猜硬币方的 混合策略。
S
i
1,2,...
表示 Si 中的某个特定策略。在静态博弈中,Si 中包含
的所有
S
i
就是第
i 个参与人的所有可选择的行动;ui
是第 i 个参与人的得益函数,它是所有参与人选择的
某个特定策略组合的函数,即
ui
ui
S1
,...,
S
i
,...,
S
n
。
•例 两寡头的产量博弈中,参与人就分别是编号为1和2的两个 企业;其各自的策略选择就是选择各自的产量;其各自的 策略空间就是其各自所能够生产的各种产量的集合。如果 假设两个企业,都能够生产大于0的任何数量的产量,那
下选择什么行动的预先安排; • 行动:参与人在博弈过程中轮到自己选择时所作的某个具体决策; • 得益:参与人从博弈中获得的效用,一般是所有参与人的策略
或行动的函数,这是每个参与人最关心的东西;
• 信息:参与人在博弈中所知道的关于自己以及其他参与人的行 动、策略及其得益函数等知识;
• 均衡:所有参与人的最优策略或行动的组合;
精炼贝叶斯均衡 泽尔腾等
博弈论完整版PPT课件
ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
博 弈 论
博
弈 论
第一章 导论
1.1什么是博弈论(Game Theory) 1.1.1 从游戏到博弈
Nash 均衡的哲学含义:设想n个参与人在 博弈前规定每一个参与人选择一个特定的策略。 s*=(si*,s-i*) 代表这个协议,要问在没有外力 强制的情况下,是否有任何参与人有积极性 不遵守该协议?如没有,则说明该协议是可以 自动实施的。能够自动实施的协议就可以看作 自动实施 能够自动实施的协议就可以看作 一个Nash 均衡。 均衡。 一个 例 求下列博弈的Nash 均衡:
一般用 G={S1,S2,…Sn;u1,u2,…un}表示策略式 博弈。 例 参 与 人B
L U 参 与 人A M 4,3 M 5,1 R 6,2
2,1 3,0
8,4
3,6 2,8
D
9,6
S1={U,M,D} , S2={L,M,R} 支付用矩阵表示,称为双矩阵博弈。
考虑三个参与人参加的一个策略型博弈,他们 例 考虑三个参与人参加的一个策略型博弈 他们 的策略空间为: 的策略空间为 S1=S2=S3=[0,1] 他们的支付函数分别为: 他们的支付函数分别为 u1=x+y+z u2=x-yz - u3=xy-z -
游戏都有一些共同的特点: 1.都具有一定的规则; 2.都有一个结果; 3.策略至关重要; 4.策略和利益有相互依存性
许多重要的人类活动,象经菅决策、市场竞争、 政治军事斗争、商业谈判、联合等都具有类似 的特性。 博弈论可以被定义为是对智能的理性 智能的理性决策者之 智能的理性 间冲突与合作的数学模型的研究,或“冲突分 析”、“相互影响的决策理论”或许是描述 博弈论更为准确的术语(Game一词太狭窄)。 (Game ) 近代博弈论始于Zermelo,Borel,Von Neumann的工作,特别是Von Neumann和 Morgenstern合著的伟大的奠基性的著作《博 弈和经济行为》
博弈论 Game Theory
• •
信息是博弈论中重要的内容。 完全博弈是指在博弈过程中,每一位博弈 者对其他博弈者的特征、策略空间及收益函数 有准确的信息。严格地讲,完全信息博弈是指 博弈者的策略空间及策略组合下的支付,是博 弈中所有博弈者的“公共知识”(Commom Knowledge)的博弈。 • 完美信息是指博弈者完全清楚到他决策时 为止时, 所有其他博弈者的所有决策信息,或者 说,了解博弈已进行过程的所有信息。
• 2 . 猜硬币游戏
猜方 正面 盖 正面 方 反面 -1,1 1,-1 反面 1,-1 -1,1
• 3. “田忌赛马” • “田忌赛马”是我国古代一个非常有名的故 事,讲的是发生在齐威王与大将田忌之间的赛 马的故事。田忌在谋士孙膑的帮助下,运用谋 略帮助田忌以弱胜强战胜了齐威王。这个故事 讲的其实是一个很典型的博弈问题。
田 上 中 下 上中下 上下中 齐 中上下 威 中下上 王 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上 下 中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 中 上 下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
忌 中 下 上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下 上 中 -1,1 1,-1 1,-1 1,-1 3,-3 1,-1 下 中 上 1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
•
动态博弈是指在博弈中,博弈者的行动有 先后顺序(Sequential-Move),且后行动者能 够观察到先行动者所选择的行动或策略,因此, 动态博弈又叫做序贯博弈。
•
2.如果按照博弈者对其他博弈者所掌握的 信息的完全与完备程度进行分类,博弈可以划 分为完全信息博弈(Game with Complete Information)与不完全信息的博弈(Game with Incomplete Information),以及完美信息的博弈 (Game with Perfect Information)与不完美信息 的博弈(Game with Imperfect Information),确定 的博弈(Game of Certainty)与不确定的博弈 (Game of Uncertainty),对称信息的博弈(Game of Symmetric Information)与非对称信息的博弈 (Game of Asymmetric Information)等。
耶鲁大学《博弈论》第一节课的游戏
耶鲁大学《博弈论》一
———课堂游戏
1、在不被同桌看到的情况下,在□中填写字母α或者字母β,吧这看成成绩的赌注,我会随机把你们分成两两一组,你们不知道会跟谁分到一组,按如下方法给出你们的成绩,如果选择而你的对手选择了α,那么你得A,你对手得C,如果你们都选择了α,那么你们都得B-,如果你选择β,你对选择α,你得C,你对手得A,如果你们都选择β,你们都得B+。
讲解表格:对手
αβ
我
β
注解:表格里的第一个选择是我做出选择后会遇到的结果,相对的,表格里的第二个是对方的结果。
课堂五个结论:1、不要选择劣势策略。
2、耶鲁大学的学生很自私(其实大多人的性格里都有自私的一面)。
3、理性选择导致次优的结果。
4、学会换为思考,站着别人的立场去分析对方想要得到的收益是什么,会做出怎样的选择,对方的优势策略与劣势策略是什么,当然做出选择的同时也要考虑到对方也回这样考虑你的立场,你的选择。
5、汝欲得之,必先知之,如果你想得到什么,必先要明白自己的动机及收益是什么,了解自己的目的。
2、从1到100之间选择一个数字填写到□内,不要让你们的同桌看到,我们会计算全班的平均数,谁选的数字最接近平均数的三分之二,谁就是赢家,赢家的奖金是5美元减去所选数和平均数三分之二差的百分数。
例:三个人分别选择数字,25、5、60。
他们的平均数是(25+5+60)÷3=30,平均数的三分之二等于:30÷3×2=20,在本本例题中最接近平均数三分之二的数字是25,那么相对而言奖金是5美元减去5美分,就是4美元95美分。
国际关系基础理论:博弈论
国际关系基础理论:博弈论博弈论博弈论是科学⾏为主义学派极为推崇的⼀种理论框架,它包含研究“合理⾏为”的策略和⽅法,是游戏规则和策略选择的统⼀。
博弈论萌芽于18世纪初,但其真正的发展还在20世纪。
“博弈”原本是数学中运筹学的⼀个重要概念。
20世纪20年代,法国数学家布莱尔⽤最佳策略法研究弈棋和其他问题,从数学⾓度作了尝试的可能性分析。
第⼆次世界⼤战期间,博弈论的思想⽅法、研究⼿段被运⽤到军事领域,显⽰出它的作⽤。
1944年约翰·纽曼和摩根斯合著的《博弈论与经济⾏为》⼀书的出版标志着博弈理论的初步形成。
博弈论的⽬的就在于向⾏为者表明:在所有理性参与者都想获胜或使收益最⼤化的情况下,他们可以根据博弈论的计算⽅法找到⼀种最有利的途径。
因此博弈论也被称为“对策理论”会“游戏理论”,它是基于数理分析和逻辑推理基础上的⼀种合理决策理论。
20世纪50年代以后,国际关系理论学者在运筹学的博弈概念基础上综合运⽤⼼理学、统计学、社会学和策略学等原理,逐步形成国际关系学的博弈论。
他们强调指出:博弈论即是研究国际冲突的策略理论,⼜是处理国际关系的实际⼿段,其⽬的是为⾏为者在⾯临冲突和危机时设计各种合理选择和理性⾏为。
⼀般来说,博弈论包括下列⼏个要素:(1)弈者,每场博弈都需要有两个以上弈者组成;(2)收益,由于⾏为体的价值体系不同,收益也不同;(3)规则,只有遵守规则才能使博弈正常进⾏;(4)信息条件,它决定每⼀⾏为体对博弈环境以及其他⾏为者的选择所掌握的信息数量和质量;(5)每⼀⾏为者⽤来达到⽬的的战略;(6)进⾏博弈的整体环境,不论⾏为者是否对此有充分的认识;(7)动态的相互作⽤,在这个过程中,⼀⽅的选择可能促使对⽅改变选择。
⼀.博弈模式博弈的形式多样⼜多变,但基本的形式有零和博弈和变数博弈两种,⼀般⼜分为两⽅零和博弈、多⽅零和博弈、两⽅变数博弈和多⽅变数博弈。
零和博弈⼜称为“谁是诺夫”,指⼀⽅所得即为他⽅所失,(-1)+(+1)=0;变数博弈⼜称为“囚犯困境”,指双⽅或各⽅得失不等。
博弈论入门
博弈论入门1 基础知识博弈论是一种独特的处于各学科之间的研究人类行为的方法。
与博弈论有关的学科包括数学、经济学以及其他社会科学和行为科学。
博弈论(如同计算科学理论和许多其他的贡献一样)是由约翰•冯•诺伊曼(John von Neumann)创立的。
博弈论领域第一本重要著作是诺伊曼与另一个伟大的数理经济学家奥斯卡•摩根斯坦(Oskar Morgenstern)共同写成的《博弈论与经济行为》(The Theory of Games and Economic Behavior)。
当然,摩根斯坦把新古典经济学的思想带入了合作中,但是诺伊曼也同样意识到那些思想并对新古典经济学做出了其他的贡献。
■一个科学的隐喻由于诺伊曼的工作,在更广阔的人类行为互动的范围内,“博弈”成为了一个科学的隐喻。
在人类的互动行为中,结局依赖于两个或更多的人们所采取的交互式的战略,这些人们具有相反的动机或者最好的组合动机(mixed motives)。
在博弈论中常常讨论的问题包括:1)当结局依赖于其他人所选择的战略以及信息是完全的时候,“理性地”选择战略意味着什么?2)在允许共同得益或者共同损失的“博弈”中,寻求合作以实现共同得益(或避免共同损失)是否“理性”?或者,采取侵略性的行动以寻求私人利益而不顾共同得益或共同损失,这是否是“理性”的?3)如果对2)的回答是“有时候是”,那么在什么样的环境下侵略是理性的,在什么样的情况下合作是理性的?4)在特定情况下,正在持续的关系与单方退出这种关系是不同的吗?5)在理性的自我主义者的行为互动中,合作的道德规则可以自然而然地出现吗?6)在这些情况下,真正的人类行为与“理性”行为是否相符?7)如果不符,在那些方面不符?相对于“理性”,人们更倾向于合作?或者更倾向于侵略?抑或二者皆是?因而,博弈论研究的“博弈”包括:破产门口的野蛮人(Barbarians at the Gate)网络战(Battle of the Networks)货物出门,概不退换(Caveat Emptor)征召(Conscription)协调(Coordination)逃避(Escape and Evasion)青蛙呼叫配偶(Frogs Call for Mates)鹰鸽博弈(Hawk versus Dove)Mutually Ass ured Destruction多数决定原则(Majority Rule)Market Niche共同防卫(Mutual Defense)囚徒困境(Prisoner's Dilemma)补贴小商业Subsidized Small Business公共地悲剧Tragedy of the Commons最后通牒Ultimatum视频系统协调Video System Coordination(以上列表摘取自Roy Gardner在《商业与经济学博弈》探讨过的一个博弈的索引)■理性新古典经济学与博弈论之间的关键链接就是理性。
博弈论——精选推荐
博弈论第1章博弈论基本模型1、在⼀个博弈中,所有的局中⼈都选择合作⾏为,该博弈是否为合作博弈?答:如果在⼀项活动中,参与⼈具有合作的意向,⽽合作的⾏为⼜能得到有⼒的保障,则称这种博弈活动为合作博弈。
存在有⼒的保障,实际上说明了合作博弈问题的博弈⽅之间既存在共同利益,但利益⼜不完全⼀致。
⽽事实上合作博弈协议的内容除了约定⾏为以外就是利益分配,达成协议的前提是通过讨价还价就利益分割达成⼀致。
因此,并不是所有局中⼈选择合作⾏为,就是合作博弈。
2、完全信息静态博弈问题必须⽤策略型博弈模型刻画,完全信息动态博弈模型必须⽤扩展型博弈模型刻画,是否正确?答:不正确。
博弈论模型从形式可分为策略型模型与扩展型模型。
扩展型模型完整地刻画了⼀项博弈活动。
策略型博弈模型的结构简单,但它忽略了博弈的时序与信息,其侧重点在于分析参与⼈的策略选择。
只不过是相对⽽⾔,对于信息完全静态博弈⽤策略型博弈刻画更为合适;对信息完全的动态博弈,⽤扩展型博弈模型描述更为合适。
3、⼀个博弈问题既可⽤策略型博弈模型刻画,也可⽤扩展型博弈模型刻画,是否正确?答:博弈论从形式可分为策略型和扩展型模型。
扩展型完全地刻画了⼀项博弈活动,⽽策略型则结构简单,忽略了博弈的时序与信息,重点在于分析参与⼈的策略选择。
因此,对于⼀个博弈问题,要视乎所要解决的问题是完整的还是只分析参与⼈的策略选择。
4、策略就是⾏动吗?答:○1称参与⼈i∈N在博弈中所有可能选择的⾏动构成的集合A i为局中⼈i的⾏动集合。
A i中的元素a i称为局中⼈i的⾏为。
○2局中⼈i=1,2,…,n的策略集合⽤Si表⽰,S i中的元素si称为局中⼈i的策略。
它定义为局中⼈i的信息集类I i到⾏动集Ai的映射:S i:I i→A i,S i(I ik)=a i∈A i,i=1,2,…,r i○3从以上的定义,清楚地表明了策略是信息集的映射,⾏动是映射值,两者是不同的。
5、策略与⾏动何时是⼀致的?答:在静态博弈模型中,局中⼈的策略与⾏动等同。
博弈论翟文明第一章博弈论入门
博弈论翟文明第一章博弈论入门博弈论是研究决策者在特定环境中做出选择的数学理论。
在这个数学理论中,决策者之间的互动是核心问题,他们根据对手的选择来优化自己的策略。
博弈论是一个多学科的领域,涉及数学、经济学、计算机科学和行为科学等多个学科。
在这篇文章中,我们将探讨博弈论的基本概念、应用和相关问题,希望能为读者提供一个深入了解博弈论的入门指南。
一、博弈论的基本概念博弈论研究的对象是决策者在特定环境中做出选择的数学理论。
在博弈论中,决策者被称为“玩家”,他们之间的互动构成了一个“博弈”。
在一个博弈中,每个玩家的选择都会影响其他玩家的利益,因此每个玩家都需要根据其他玩家的选择来优化自己的策略。
博弈可以分为合作博弈和非合作博弈两种类型。
合作博弈是指玩家之间可以合作来达到共同的目标,而非合作博弈是指玩家之间没有合作的可能性,每个玩家都要根据自己的利益来做出选择。
在合作博弈中,最著名的例子是合作博弈的核心概念即核心解概念,博弈的核心是指在合作博弈中所有玩家都能获得自己认为至少不亏损的结果。
而在非合作博弈中,最著名的例子是纳什均衡,即所有玩家都选取了最佳的策略,没有人会因为改变自己的策略而受益。
二、博弈论的应用博弈论在经济学、政治学、生物学、计算机科学等领域都有着重要的应用。
在经济学中,博弈论被广泛应用于研究市场竞争、价格形成和合作行为。
在政治学中,博弈论被用来研究政治决策和国际关系。
在生物学中,博弈论被应用于研究动物行为和进化论。
在计算机科学中,博弈论被用来解决博弈游戏和人工智能领域的问题。
博弈论还可以用来分析一些具体的博弈问题,例如囚徒困境、交易谈判、拍卖机制、合作博弈等等。
这些问题在现实生活中存在着,并且对人们的生活产生着重要的影响,因此博弈论的应用在现实生活中是非常广泛的。
三、博弈论的相关问题在博弈论中存在一些经典的问题,例如囚徒困境、拍卖问题、合作博弈和非合作博弈等等。
这些问题都是博弈论研究的核心内容,它们有着重要的理论意义和实际应用价值。
博弈论PPT课件
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
博弈论介绍及最优策略求解思路
博弈论介绍及最优策略求解思路博弈论,是一门研究决策制定和策略选择的学科。
它是应用数学的一部分,主要研究在多个参与者之间进行决策时的相互影响和最优策略选择。
博弈论广泛应用于经济学、社会科学、运筹学、计算机科学等领域,并在现实生活中有着重要的应用价值。
博弈论的基本概念包括参与者、策略和收益。
参与者是指参与博弈的个体或团体,策略是指他们在可选的行动中进行选择的方式,收益是指参与者在不同策略下获得的效益。
在博弈论中,参与者之间的决策是相互影响的。
每个参与者都希望通过选择最优策略来最大化自己的收益。
然而,参与者的决策会受到其他参与者决策的影响,从而形成一个相互作用的决策过程。
博弈论最常见的模型是博弈矩阵。
博弈矩阵是一个二维表格,其中每行代表一个参与者的策略,每列代表另一个参与者的策略。
矩阵中的每个元素表示对应参与者选择不同策略组合时的收益。
通过分析博弈矩阵,可以确定参与者的最优策略。
博弈论中,最优策略的求解可以采用多种方法,其中最常见的两种方法是纳什均衡和支配策略。
纳什均衡是指在一个博弈中,所有参与者都选择了最优策略,而且没有任何参与者能够通过单方面改变策略来获得更好的收益。
纳什均衡是博弈论中的核心概念,通过寻找纳什均衡可以确定博弈最优策略。
纳什均衡的求解可以通过数学方法,如线性规划、差分方程等,或借助计算机进行迭代计算。
支配策略是指在一个博弈中,存在一种策略可以在任何情况下都能获得更大的收益。
通过排除其他策略,可以找到支配策略,并将其作为最优策略。
当博弈存在支配策略时,求解最优策略变得相对简单。
除了纳什均衡和支配策略,还有其他的求解方法,如混合策略、演化博弈等。
混合策略是指参与者以一定的概率分配在不同的策略上进行选择,演化博弈是指通过模拟博弈过程中参与者的策略变化,寻找最优策略。
总结起来,博弈论是一门研究决策制定和策略选择的学科,通过分析博弈矩阵和采用不同的求解方法,可以确定最优策略。
纳什均衡和支配策略是最常用的求解方法,但也可以采用其他方法。
博弈理论知识讲义
第八章 博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互影响的问题。
本章讨论这个问题,建立复杂环境下的决策理论。
开展这种研究的的理论叫做博弈论,也称为对策论(Game Theory)。
最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。
大局部经济行为都可视作博弈的特殊情况,比方把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。
博弈论的思想精髓与方法,已成为经济分析根底的必要组成局部。
第一节 博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双方的目的都是要战胜对方,互不相容,互相影响,互相制约。
一般来讲,博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。
当所有当事人都拿定主意作出决策时,博弈的局势就暂时确定下来。
博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。
博弈论推广了标准的一人决策理论。
在每个局中人的收益都依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。
下面来举例说明。
例1.便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否正面朝上。
局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。
对于这个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。
当甲和乙都作出选择时,博弈的局势就确定了。
显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。
博弈论第一章答案
1.4 对 于 第 i个 厂 商 , 其 目 标 为 最 大 化 自 己 的 利 润 , 即 :
max πiqi
=
max(a qi ≥0
− qi
−
q−*i
− c)qi
;
由 一 阶 条 件 ∂π i / ∂qi = 0 , 可 得 : qi* = (a − q−*i − c) / 2 … … ( 1)
则 原 博 弈 的 混 合 战 略 纳 什 均 衡 为 : { (1/3, 2/3, 0), (2/3, 0, 1/3) }。 1.12 按 照 1.11 的 解 法 , 可 得 混 合 战 略 纳 什 均 衡 为 : { (2/3, 1/3), (3/4, 1/4) }。 过 程 略 。 1.13 此博弈有两个纯战略纳什均衡、一个混合战略纳什均衡。 纯 战 略 纳 什 均 衡 为 :( 向 企 业 1 申 请 , 向 企 业 2 申 请 );( 向 企 业 2 申 请 , 向 企 业 1 申 请 )。 混合战略纳什均衡为:
设 此 博 弈 的 纯 战 略 纳 什 均 衡 是 ( s1* , s2* )。
对于参与人
1来 说 ,
s1*
=
max{ max 0≤s1 ≤1−s*2
s1
,
max
1−s*2 <s1 ≤1
s1
}
=
max{1−
s2* , 0} = 1−
s2*
;
同 理 , s2* = 1− s1* 。
也 即 , 此 博 弈 的 纯 战 略 纳 什 均 衡 为 ( s1* , s2* ), 且 满 足 s1* + s2* = 1, 0 ≤ s1*, s2* ≤ 1。
c1 < c2 < a 且 2c2 > a + c1 时 , 纳 什 均 衡 解 为 角 点 解 , 即 q1* = (a − c1) / 2 , q2* = 0 。 此 题 目
好书推荐:《博弈论》
好书推荐:《博弈论》博弈论的思想在古代便产生了,只是它在初期仅研究象棋、赌博中的一些胜负问题,并未形成专业的理论系统。
当时的人们对于博弈的认识只停留在经验的认知和积累上,并未形成专业的理论基础,正式成为一门学科则是在20世纪初期。
20世纪20年代末期,约翰,冯.诺依曼正式证明了博弈的基础原理,在此基础上宣告博弈论诞生,因此,冯.诺依曼被称为“博弈论之父”。
再到20世纪40年代中期,一本跨越时代的巨著《博弈论与经济行为》问世,而作者正是冯.诺依曼和摩根斯坦。
这两位卓越的数学家经过不断研究,最终将最初的二人博弈理论推广到了n人博弈理论,还将博论成功应用到经济领域,他们莫定了博弈论的基础和理论体系。
假设现在有人能够让博弈行为接近野蛮,或者让人类之间的支善行为和凶残行为之间的差距无限大,那么谁就更容易在博弈中取胜。
这是(博弈圣经》中提到的一段话。
提起博弈论,便需要说起“孤独的天才”约翰.纳什,他更是博弈论的天才。
约翰、纳什在20世纪中期正式发表了一篇论文(n人博的均衡点》,对博弈论起到了良好的推荐作用。
除此之外,哈桑尼与赛尔顿对博弈论的研究和贡献,也为博部论的发展起到了催化作用。
再列(博弈圣经)问世,它与原有的博弈论有着极大的区刚、最大的差异在于《博弈圣经》中论述了博弈的文化理论,突出表现了人类博弈占据的优势。
事实上,(博弈圣经》最大的优点是,它能够将原有的博弈理论正式应用到现实中,还能帮助普通大众通过自身的学习和研究成为博弈的真正高手。
它还能将博弈论应用到政治、经济、文化等多个领城,对于个人的生活和发展也能起到促进和推动作用。
简单来说,博弈的基本构成要素分为决策人、对抗者、生物亲序、局中人、策略、得失、次序。
所谓决策人,指的是在博弈的赛局中率先做出选择的一方,决策人往往会根据自己的经验、自身在对局中的感受、自身的状态等,率先做出一种具有方向性的选择。
在二人博弈对局中的对抗者,往往是选择滞后的那个人,需要做出与决策人的行为相反的选择,而且这个对抗者不仅选择落后,连行为与动作也是落后的,而且他的选择几乎是默认的、被动的,但是这将成为他最后的优势。
耶鲁大学博弈论第一章答案
a a a a c
Now player 2 has strategy a weakly dominated by c and player 3 has b weakly dominated by c. The predicted outcome is that player 1,2 and 3 will choose strategy a,c and c respectively and finally winner is player candidate c.
Problem Set 1 Solution
Econ 159a/MGT522a, Yale University
M.Chen momotocmx@
1. Strictly and Weakly Dominated Strategies? A strategy si is a strictly dominated strategy if there exists a strategy si such that si always does strictly better than strategy si no matter what others do, that is ui (si , s−i ) > ui (si , s−i ) for all s−i A strategy si is a weakly dominated strategy if there exists a strategy si such that ui (si , s−i ) ≥ ui (si , s−i ) for all s−i ui (si , s−i ) > ui (si , s−i ) for some s−i ExampБайду номын сангаасe:
博弈论概论
博弈论概述由于现代经济活动的规模越来越大,对抗性、竞争性越来越强,特别是寡头垄断或垄断竞争市场,竞争和决策较量更是厂商经营活动的核心内容,这些都使得人们越来越重视经济活动的环境条件及其变化,越来越重视竞争者或合作者的反应,因此经济决策的“博弈性”越来越强。
而且,博弈论在许多情况下所得出的结论更加符合经济现实和更加具有应用性,对参与经济互动的各方或国家政府的决策互动有更强的指导作用。
所以,研究博弈论是很必要的。
一.基本概念博弈:即一些个人,队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各允许选择的行为或策略中进行选择并加以实施,各自取得相应的结果的过程。
从上述定义可以看出,规定或定义一个博弈需要设定下列四个方面。
(1)、博弈的参加者(Players)。
即在所定义的博弈中究竟有哪几个独立决策、独立承担结果的个人或组织.对我们来说,只要在一个博弈中统一决策,统一行动、统一承担结果,不管一个组织有多大,哪怕是一个国家,甚至是由许多国有组成的联合国,都可以作为博弈中的一个参加方。
并且,在博弈的规则确定之后,各参加方都是平等的,大家都必须严格按照规则办事。
(2)、各博弈方各自可选择的全部策略(Strategies)或行为(Actions)的集合。
即规定每个博弈方在进行决策时,可以选择的方法,做法或经济活动的水平,量值等。
在不同博弈中可供博弈方选择的策略或行为的数量很不相同,在同一个博弈中,不同博弈方的可选策略或行为的内容或数量也常不同,有时只有有限的几种,甚至只有一种,而有时又可能有许多种,甚至无限多种可选策略或行为。
(3)、进行博弈的次序(Order)。
在现实的各种决策活动中,当存在多个独立决策方进行决策时,有时候需要这些博弈方的决策又有先后之分,并且有时一个博弈方还要作不止一次的决策选择。
这就免不了有一个次序问题。
因此规定一个博弈必须规定其中的次序,次序不同一般就是不同的博弈,即使博弈的其他方面都相同。
博弈论知识点总结
博弈论知识总结博弈论概述:1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、 决策主体是理性的,最大化自己的收益。
2、 完全理性是共同知识3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。
完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主题所选择的行动的函数。
从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别:1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。
可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。
2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例3:为什么教授如此苛刻?
许多教授强硬地规定,不进行补考,不 允许迟交作业或论文。 教授们为何如此苛刻? 如果允许某种迟交,而且教授又不能辨 别真伪,那么学生就总是会迟交。 期限本身就毫无意义了。 避免这一“滑梯”通常只有一种办法, 就是“没有例外”的策略。
例3:为什么教授如此苛刻?
威廉· 维克瑞, 1914-1996, 生于美国
詹姆斯· 莫里斯 1936年生于英国
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz) 获奖理由:在“对充满不对称信息市场进 行分析”领域做出了重要贡献。
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information) 是关于动态博弈进行过程之中面临决策 或者行动的参与人对于博弈进行迄今的 历史是否清楚的一种刻划。 如果在博弈进行过程中的每一时刻,面 临决策或者行动的参与人,对于博弈进 行到这个时刻为止所有参与人曾经采取 的决策或者行动完全清楚,则称为完美 信息博弈;否则位不完美信息。
约翰· 海萨尼 1920年 生于美 国
约翰· 纳什 1928年生于美国
莱因哈 德· 泽尔 腾, 1930年 生于德 国
1996年诺贝尔经济学奖获得者
英国人詹姆斯· 莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey) 获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
课程主要内容
第一章 第二章 第三章 第四章 第五章 第六章 完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈 委托-代理理论 逆向选择与信号传递
第一章 完全信息静态博弈
博弈论的基本概念及战略式表述 纳什均衡 纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性与多重性
博弈论
Game Theory
博弈论基本思想
人们在日常生活中进行着博弈,与配偶, 朋友,陌生人,老板/员工,教授等。 类似的博弈也在商业活动、政治和外交事 务、战争中进行着——在任何一种情况下, 人们相互影响以达成彼此有利的协议或者 解决争端。 博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在博弈中获胜?
…… 真的能在博弈中(总是)获 胜吗? 对手和你一样聪明! 许多博弈相当复杂,博弈论并不 能提供万无一失的应对办法。
例1:无谓竞争(The GPA Rat Race)
你所注册的一门课程按照比例来给分:无论 卷面分数是多少,只有40%的人能够得优秀, 40%的人能得良好。 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。 问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。 正因为这样的博弈对所有参与者存在着或大 或小的潜在成本,如何达成和维护互利的合 作就成为一个值得探究的重要问题。 存在双赢的博弈吗?
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
两个学生想要推迟考试,谎称由于返校途中 轮胎漏气,未能很好地备考。 教授分别对他们提出了问题:“哪个轮胎漏 气?”如何应答? 他们本应该预计到教授的招数,提前准备好 答案。 在博弈中,参与者应该向前看到未来的行动, 然后通过向后推理,推算出目前的最佳行动。 如果双方都没有准备,他能够独立地编出一 个相互一致的谎言吗?
常和博弈与非常和博弈
(constant-sum game and variable-sum game)
如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为一个常数, 这个博弈就叫常和博弈; 相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为一 个常数,这个博弈就叫非常和博弈。 常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
Roger B. Myerson著:Game Theory(原 文版、译文版),中国经济出版社, 2001年版。 艾里克.拉斯缪森(Eric Rasmusen)著, 《博弈与信息:博弈论概论》,北京大 学出版社,2003年版。 因内思· 马可-斯达德勒,J.大卫· 佩雷斯卡斯特里罗著,《信息经济学引论:激 励与合约》,上海财经大学出版社,2004 年版。
一、占优战略均衡
占优战略:不管对手战略为何,该参 与人可找到一最佳战略。 定义:在博弈G={N,(Si)iN,(Ui)iN}中, 如果对所有的参与人i,si*是它的占优 战略,那么所有参与人选择的战略组 合(s1*,…,sn*)成为该对策的占优战 略均衡。
问题是,一个好心肠的教授如何维持如 此铁石心肠的承诺? 他必须找到某种使拒绝变得强硬和可信 的方法。 拿行政程序或者学校政策来做挡箭牌 在课程开始时做出明确和严格的宣布 通过几次严打来获得“冷面杀手”的声 誉
导论
博弈均衡与一般均衡 博弈论与诺贝尔经济学奖获得者 博弈论的基本概念与类型 主要参考文献
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
我们无法从所有这样的博弈的结构中找 到一般和本质的东西,来保证这样的收 敛。 某些博弈中,由于偶然的外因可以对策 略贴标签,或者参与者之间拥有某些共 同的知识体验,导致了焦点的存在。 没有某个这样的暗示,默契的合作就完 全不可能。
零和博弈与非零和博弈
(zero-sum game and non-zero-sum game)
如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为零,这个博 弈就叫零和博弈; 相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为零, 这个博弈就叫非零和博弈。 零和博弈是利益对抗程度最高的博弈。
完全信息 不完全信息
贝氏纳什均衡 (BNE) 完美贝氏纳什均衡 (PBNE)及序贯均 衡(SE)
静态
动态
纳什均衡(NE)
子博弈完美纳什 均衡(SPNE)
静态博弈与动态博弈
(static games and dynamic games)
同时决策或者同时行动的博弈属于静态 博弈;先后或序贯决策或者行动的博弈, 属于动态博弈 即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
如何在“博弈”中获胜?
பைடு நூலகம்
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球 How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。 它是对于如何最好地利用身体(物质)的技 巧的一种算计。
三、博弈论的基本类型
合作博弈与非合作博弈
合作博弈(cooperative game) 达成有约束力的协议(binding agreement),强调团体理性,强调效 率、公正、公平 非合作博弈(non-cooperative game) 强调个人理性,其结果可能有效率, 也可能无效率。
非合作博弈的基本分类
2005年诺贝尔经济学奖获得者
以罗伯特· 奥曼色列经济学家罗伯特 -奥曼(Robert J. Aumann)和美 国经济学家托马斯· 谢林(Thomas C. Schelling) 获奖原因:“通过博弈论分析加强了 我们对冲突和合作的理解”所作出 的贡献而获奖。
罗伯特· 奥曼
托马斯· 谢林
导论
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的 逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information) 按照大家是否清楚对局情况下每个 局中人的得益。 “各种对局情况下每个人的得益是 多少” 是所有局中人的共同知识 (common knowledge)。 据“共同知识”的掌握分为完全信 息与不完全信息博弈。
案例1:囚犯困境
支付 嫌疑人A 嫌疑 人B
抵赖
坦白
抵赖 坦白
-1,-1 0,-9
-9,0 -6,-6
均衡与均衡结果
均衡战略(坦白,坦白) 均衡支付(-6,-6)
第二节 纳什均衡
占优战略均衡 重复剔除的占优战略均衡 纳什均衡
完全信息静态博弈的几点特性
同时出招,出招一次; 知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的 承诺(非合作)
迈克尔· 斯彭斯 1948年生于美国的 新泽西,1972年获 美国哈佛大学博士 头衔,现兼任美国 哈佛和斯坦福两所 大学的教授。