博弈论game theory

合集下载

博弈论定义与主要思想

博弈论定义与主要思想

Selten and Harsanyi
泽尔腾(1965)将纳 而海萨尼则发展了刻
什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概念; 以及进一步刻画不完 全信息动态博弈的 “完备贝叶斯纳什均
画不完全信息静态博 弈的“贝叶斯纳什均 衡”(1967-1968)。 总之,他俩进一步将 纳什均衡动态化,加 入了接近实际的不完 全信息条件。他们的
著名经济学家保罗.萨缪尔森说:“要想在现代 社会做一个有文化的人,您必须对博弈论有一 个大致了解。”
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的 思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式 。
2005年诺奖授予有以色列和美国双重国籍的罗 伯特·奥曼和美国人托马斯·谢林,以表彰他们 在博弈论领域作出的贡献。
主要思想
博弈论并不是经济学的一个分支,它只是一种 方法,这也是为什么许多人将其看成数学的一 个分支的缘故。
在对参与者行为研究这一点上,博弈论和经济 学家的研究模式是完全一样的。经济学越来越 转向人与人关系的研究,特别是人与人之间行 为的相互影响和相互作用,人与人之间利益和 冲突、竞争与合作,而这正是博弈论的研究对 象。
4、信息指的是参与人在博弈中所知道的 关于自己以及其他参与人的行动、策略 及其得益函数等知识;
5、得益是参与人在博弈结束后从博弈中 获得的效用,一般是所有参与人的策略 或行动的函数,这是每个参与人最关心 的东西;

博弈论百度百科

博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。

在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。

所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。

不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。

博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

第七章 博奕论(Game Theory教材课程

第七章  博奕论(Game Theory教材课程

max

u1
即该博奕的纳什均衡解
max u 2
maxu1 maxu2
U1 Uq12
q2
6q2 6q1
2q1 2q2
0 0
的解,
求解上述方程组:
q 1 * q 2 * 2 , Q 4 u 1 1 , u 2 4 , u 1 u 2 8
标志着博奕论的初步形成。 50年代,合作博奕发展到鼎盛阶段,非合作博奕开始出现 纳什和夏普里的讨价还价模型, 塔克的“囚徒困境” 60年代以后,selten,Haysany,Krops,Wilseen
“信誉问题模型” (动态不完全信息博弈) 最近十多年,博弈论几乎贯穿了整个微观经济学,产业组
织理论和企业制度理论,并扩展到宏观经济学,环境、劳动、 福利经济学等领域。
新厂商的市场进入问题
B
打入
A
打击
(0,10)
和平共处
(-2,3)
(5,5)
6.博奕进程的信息
完美信息博奕:在动态博奕中,博弈方对博弈的进程, 即次此行为前各博奕方的行为完全了解
非完美信息博弈:
完全信息博弈:博奕各方完全了解所有博奕方各种策 略组合下得益情况 非完全信息博弈:
7.2.2博弈的主要分类
1 3、赢得(利益):参加博奕各方从博奕中所获得的 利
益 支付矩阵,博弈树
零和博奕:各博奕方赢得的代数和为零 非零和博奕:各博奕方赢得的代数和不为零
4.均衡:所有博奕方的最优策略的组合
博奕分析的目的是使用博奕规则决定均衡
5.得益的信息
完全信息博奕:博奕各方完全了解所有博奕方各种策略 组合下得益情况的博奕,如囚徒困境和田忌赛马。
7。3 完全信息静态博奕——纳什均衡

博弈论

博弈论

博弈论是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。

1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。

纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的学科。

博弈的分类根据不同的基准也有所不同。

一般认为,博弈主要可以分为合作博弈和非合作博弈。

它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

博弈论介绍 Game Theory

博弈论介绍 Game Theory

2. 生活中的“囚徒困境”例子
例子1 商家价格战 例子1
出售同类产品的商家之间本来可以 通过共同将价格维持在高位而获利,但 实际上却是相互杀价,结果都赚不到钱。 当一些商家共谋将价格抬高,消费 者实际上不用着急,因为商家联合维持 高价的垄断行为一般不会持久,可以等 待垄断的自身崩溃,价格就会掉下来。
表2 智猪博弈 小猪 按 按 大猪 等待 5,1 9, -1 等待 4,4 0,0
这个博弈大猪没有劣战略。但是,小猪有 一个劣战略“按”,因为无论大猪作何选择, 小猪选择“等待”是比选择“按”更好一些 的战略。 所以,小猪会剔除“按”,而选择“等 待”;大猪知道小猪会选择“等待”,从而 自己选择“按”,所以,可以预料博弈的结 果是(按,等待)。这称为“ 重复剔除劣战略 的占优战略均衡 ”,其中小猪的战略“等待” 占优于战略“按”,而给定小猪剔除了劣战 略“按”后,大猪的战略“按”又占优于战 略“等待”
表4 有补贴时的博弈 空中客车 开发 开发 波音 不开发 -10,10 0, 120 不开发 100,0 0,0
这时只有一个纳什均衡,即波音公司 不开发和空中客车公司开发的均衡(不 开发,开发),这有利于空中客车。 在这里,欧共体对空中客车的补贴就 是使空中客车一定要开发(无论波音是 否开发)的威胁变得可置信的一种“承 诺行动”。
类似的例子还有: 渤海中的鱼愈来愈少了,工业化中的大气 及河流污染,森林植被的破坏等。解决公共 资源过度利用的出路是政府制订相应的规制 政策加强管理,如我国政府规定海洋捕鱼中, 每年有一段时间的“休渔期”,此时禁止捕 鱼,让小鱼苗安安静静地生长,大鱼好好地 产卵,并对鱼网的网眼大小作出规定,禁用 过小网眼的捕网打鱼,保护幼鱼的生存。又 如在三峡库区,为了保护库区水体环境,关 闭了前些年泛滥成灾的许多小造纸厂等。 问题:1、为什么在城市中心道路上禁止汽车鸣 喇叭?

第三节博弈论(GameTheory)

第三节博弈论(GameTheory)

第三节博弈论(Game Theory)在国际关系的研究过程中,我们时常会运用到博弈论这样一个工具。

博弈论在英语中称之为“Game Theory”。

很多人会认为这是一种所谓的游戏理论,其实不然,我们不能把Games 与Fun 同论,而应该将博弈论称之为是一种“Strategic interaction”(策略性互动)。

“博弈”一词现如今在我们的生活中出现的已经很频繁,我们经常会听说各种类型的国家间博弈(如:中美博弈),“博弈论”已经深刻的影响了世界局势和地区局势的发展。

在iChange创设的危机联动体系中,博弈论将得到充分利用,代表也将有机会运用博弈论的知识来解决iChange 核心学术委员会设计的危机。

在这一节中,我将对博弈论进行一个初步的介绍与讨论,代表们可以从这一节中了解到博弈论的相关历史以及一些经典案例的剖析。

(请注意:博弈论的应用范围非常广泛,涵盖数学、经济学、生物学、计算机科学、国际关系、政治学及军事战略等多种学科,对博弈论案例的一些深入分析有时需要运用到高等数学知识,在本节中我们不会涉及较多的数学概念,仅会通过一些基本的数学分析和逻辑推理来方便理解将要讨论的经典博弈案例。

)3.1 从“叙利亚局势”到“零和博弈”在先前关于现实主义理论的讨论中,我们对国家间博弈已经有了初步的了解,那就是国家是有目的的行为体,他们总为了实现自己利益的最大化而选择对自己最有利的战略,其次,政治结果不仅仅只取决于一个国家的战略选择还取决于其他国家的战略选择,多种选择的互相作用,或者策略性互动会产生不同的结果。

因此,国家行为体在选择战略前会预判他国的战略。

在这样的条件下,让我们用一个简单的模型分析一下发生在2013年叙利亚局势1:叙利亚危机从2011年发展至今已经将进入第四个年头。

叙利亚危机从叙利亚政府军屠杀平民和儿童再到使用化学武器而骤然升级,以2013年8月底美国欲对叙利亚动武达到最为紧张的状态,同年9月中旬,叙利亚阿萨德政府以愿意向国际社会交出化学武器并同意立即加入《禁止化学武器公约》的态度而使得局势趋向缓和。

《产业经济学》第五章--(博弈1)讲解

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。

博弈论-game-theory-两人轮流进行游戏

博弈论-game-theory-两人轮流进行游戏
g(a(k+1))=0 !
当k∞时 x 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 …… g(x) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 …… 这有啥用
游戏的联合
定义:对于n个给定的公平组合博弈G1, G2, …, Gn,定义他 们集的合联 ;合对为于G一=个G1局+G面2+x…i属+G于n.X对i,于设游F戏i(xGi)i表Байду номын сангаас示设xXi的i为后它继的局局面面集 合对。于G那的么一G个的局局面面x集=合{x1X,x=2,X…1*,xXn2}*,…它*X的n(后其继中局*为面笛集卡合儿积);
gn(x1,x2,…,xn) = g(x1)⊕g(x2)⊕…⊕g(xn)
= x1⊕x2⊕…⊕xn
经典Nim游戏
图的游戏
3
0
2 0
1
3 ⊕0 ⊕0=3
0 0
1 0
1
Anti-Nim
有n堆石子,每堆ai个,两个人轮流游戏,每次游戏者 取走某一石碓中至少1枚,至多k枚的石子。谁取走最 后一颗石子算谁输。
一方算输 无论游戏如何进行,总可以在有限步之内结束。(the
Ending Condition)
N局面,P局面
N局面——先手必胜局面
winning for the Next player
P局面——后手必胜局面
winning for the Previous player
定义:
每一个最终局面都是P局面 对于一个局面,若至少有一种操作使它变成一个P局面,
还扩展
游戏4:游戏有n堆石子,第i堆有ai枚,两人轮流进行 游戏,每次游戏者可以从任意一堆取走任意多枚石子, 也可以将任意的一堆石子任意的分成两堆。谁取走最 后一颗石子为胜。

博弈论中的几个经典问题

博弈论中的几个经典问题

博弈论GameTheory;亦名“对策论”、“赛局理论”;属应用数学的一个分支;博弈论已经成为经济学的标准分析工具之一..目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用..博弈论主要研究公式化了的激励结构间的相互作用..是研究具有斗争或竞争性质现象的数学理论和方法..也是运筹学的一个重要学科..博弈论考虑游戏中的个体的预测行为和实际行为;并研究它们的优化策略..生物学家使用博弈理论来理解和预测进化论的某些结果..几个重要的概念1、策略strategies:一局博弈中;每个局中人都有选择实际可行的完整的行动方案;即方案不是某阶段的行动方案;而是指导整个行动的一个方案;一个局中人的一个可行的自始至终全局筹划的一个行动方案;称为这个局中人的一个策略..如果在一个博弈中局中人都总共有有限个策略;则称为“有限博弈”;否则称为“无限博弈”.. 2、得失payoffs:一局博弈结局时的结果称为得失..每个局中人在一局博弈结束时的得失;不仅与该局中人自身所选择的策略有关;而且与全局中人所取定的一组策略有关..所以;一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数;通常称为支付payoff函数..3、次序orders:各博弈方的决策有先后之分;且一个博弈方要作不止一次的决策选择;就出现了次序问题;其他要素相同次序不同;博弈就不同..4、博弈涉及到均衡:均衡是平衡的意思;在经济学中;均衡意即相关量处于稳定值..在供求关系中;某一商品市场如果在某一价格下;想以此价格买此商品的人均能买到;而想卖的人均能卖出;此时我们就说;该商品的供求达到了均衡..5、纳什均衡NashEquilibrium:在一策略组合中;所有的参与者面临这样一种情况;当其他人不改变策略时;他此时的策略是最好的..也就是说;此时如果他改变策略他的支付将会降低..在纳什均衡点上;每一个理性的参与者都不会有单独改变策略的冲动..纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出..所谓“均衡偶”是在二人零和博弈中;当局中人A采取其最优策略a;局中人B也采取其最优策略b;如果局中人B仍采取b;而局中人A却采取另一种策略a;那么局中人A的支付不会超过他采取原来的策略a的支付..这一结果对局中人B亦是如此..经典的博弈问题1、“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一..讲的是两个嫌疑犯A和B作案后被警察抓住;隔离审讯;警方的政策是"坦白从宽;抗拒从严";如果两人都坦白则各判8年;如果一人坦白另一人不坦白;坦白的放出去;不坦白的判10年;如果都不坦白则因证据不足各判1年..在这个例子里;博弈的参加者就是两个嫌疑犯A和B;他们每个人都有两个策略即坦白和不坦白;判刑的年数就是他们的支付..可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白;是博弈的结果..A和B均坦白是这个博弈的纳什均衡..这是因为;假定A选择坦白的话;B最好是选择坦白;因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话;B最好还是选择坦白;因为B坦白判不被判刑而抵赖确要被判刑1年..即是说;不管A坦白或抵赖;B的最佳选择都是坦白..反过来;同样地;不管B是坦白还是抵赖;A的最佳选择也是坦白..结果;两个人都选择了坦白;各判刑8年..在坦白、坦白这个组合中;A和B都不能通过单方面的改变行动增加自己的收益;于是谁也没有动力游离这个组合;因此这个组合是纳什均衡..囚徒困境反映了个人理性和集体理性的矛盾..如果A和B都选择抵赖;各判刑1年;显然比都选择坦白各判刑8年好得多..当然;A和B可以在被警察抓到之前订立一个"攻守同盟";但是这可能不会有用;因为它不构成纳什均衡;没有人有积极性遵守这个协定..2、海盗分金币问题在一座座荒岛上;有5个强盗掘出了100块非常珍贵的金币..他们商定了一个分配金币的规则:首先抽签决定每个人的次序;排列成强盗一至五..然后由强盗一先提出分配方案;经5人表决;如多数人同意;方案就被通过;否则强盗一将被扔入大海喂鲨鱼..如果强盗一被扔入大海;就由强盗二接着提出分配方案;如多数人同意方案就被通过;否则强盗二也要被扔入大海..以下依次类推..假定每个强盗都足够聪明;都能做出理性的选择;那么;强盗一提出什么样的分配方案;能够使自己得到最大的收益对于这个问题要采用方向推导方法:如果1至3号强盗都喂了鲨鱼;只剩4号和5号的话;5号一定投反对票让4号喂鲨鱼;以独吞全部金币..所以;4号惟有支持3号才能保命..3号知道这一点;就会提出“100;0;0”的分配方案;对4号、5号一毛不拔而将全部金币归为已有;因为他知道4号一无所获但还是会投赞成票;再加上自己一票;他的方案即可通过..不过;2号推知3号的方案;就会提出“98;0;1;1”的方案;即放弃3号;而给予4号和5号各一枚金币..由于该方案对于4号和5号来说比在3号分配时更为有利;他们将支持他而不希望他出局而由3号来分配..这样;2号将拿走98枚金币..同样;2号的方案也会被1号所洞悉;1号并将提出97;0;1;2;0或97;0;1;0;2的方案;即放弃2号;而给3号一枚金币;同时给4号或5号2枚金币..由于1号的这一方案对于3号和4号或5号来说;相比2号分配时更优;他们将投1号的赞成票;再加上1号自己的票;1号的方案可获通过;97枚金币可轻松落入囊中..这无疑是1号能够获取最大收益的方案了答案是:1号强盗分给3号1枚金币;分给4号或5号强盗2枚;自己独得97枚..分配方案可写成97;0;1;2;0或97;0;1;0;2..1号看起来最有可能喂鲨鱼;但他牢牢地把握住先发优势;结果不但消除了死亡威胁;还收益最大..而5号;看起来最安全;没有死亡的威胁;甚至还能坐收渔人之利;却因不得不看别人脸色行事而只能分得一小杯羹..在“海盗分金”中;任何“分配者”想让自己的方案获得通过的关键是;事先考虑清楚“挑战者”的分配方案是什么;并用最小的代价获取最大收益;拉拢“挑战者”分配方案中最不得意的人们..3、旅行者困境两个旅行者从一个以出产细瓷花瓶着称的地方旅行回来;他们都买了花瓶..提取行李的时候;发现花瓶被摔坏了;于是他们向航空公司索赔..航空公司知道花瓶的价格大概在八九十元的价位浮动;但是不知道两位旅客买的时候的确切价格是多少..于是;航空公司请两位旅客在100元以内自己写下花瓶的价格..如果两人写的一样;航空公司将认为他们讲真话;就按照他们写的数额赔偿;如果两人写的不一样;航空公司就认定写得低的旅客讲的是真话;并且原则上按这个低的价格赔偿;同时;航空公司对讲真话的旅客奖励2元;对讲假话的旅客罚款2元..为了获取最大赔偿而言;本来甲乙双方最好的策略;就是都写100元;这样两人都能够获赔100元..可是不;甲很聪明;他想:如果我少写1元变成99元;而乙会写100元;这样我将得到101元..何乐而不为所以他准备写99元..可是乙更聪明;他算计到甲要算计他写99元;于是他准备写98元..想不到甲还要更聪明一个层次;估计到乙要写98元来坑他;于是他准备写97元……大家知道;下象棋的时候;不是说要多“看”几步吗;“看”得越远;胜算越大.. 你多看两步;我比你更强多看三步;你多看四步;我比你更老谋深算多看五步..在花瓶索赔的例子中;如果两个人都“彻底理性”;都能看透十几步甚至几十步上百步;那么上面那样“精明比赛”的结果;最后落到每个人都只写一两元的地步..事实上;在彻底理性的假设之下;这个博弈唯一的纳什均衡..4、枪手博弈彼此痛恨的甲、乙、丙三个枪手准备决斗..甲枪法最好;十发八中;乙枪法次之;十发六中;丙枪法最差;十发四中..如果三人同时开枪;并且每人只发一枪;第一轮枪战后;谁活下来的机会大一些一般人认为甲的枪法好;活下来的可能性大一些..但合乎推理的结论是;枪法最糟糕的丙活下来的几率最大..我们来分析一下各个枪手的策略..枪手甲一定要对枪手乙先开枪..因为乙对甲的威胁要比丙对甲的威胁更大;甲应该首先干掉乙;这是甲的最佳策略..同样的道理;枪手乙的最佳策略是第一枪瞄准甲..乙一旦将甲干掉;乙和丙进行对决;乙胜算的概率自然大很多..枪手丙的最佳策略也是先对甲开枪..乙的枪法毕竟比甲差一些;丙先把甲干掉再与乙进行对决;丙的存活概率还是要高一些..我们计算一下三个枪手在上述情况下第一轮枪战中的存活几率:甲:24%被乙丙合射40%X60%=24%乙:20%被甲射100%-80%=20%丙:100%无人射丙第二轮枪战中甲乙丙存活的几率粗算如下:1假设甲丙对决:甲的存活率为60%;丙的存活率为20%..2假设乙丙对决:乙的存活率为60%;丙的存活率为40%..第一轮:甲射乙;乙射甲;丙射甲..甲的活率为24%40%X60%;乙的活率为20%100%-80%;丙的活率为100%无人射丙..第二轮:情况1:甲活乙死24%X80%=19.2%甲射丙;丙射甲──甲的活率为60%;丙的活率为20%..情况2:乙活甲死20%X76%=15.2%乙射丙;丙射乙──乙的活率为60%;丙的活率为40%..情况3:甲乙皆活24%X20%=4.8%重复第一轮..情况4:甲乙皆死76%X80%=60.8%枪战结束..甲的活率为12.672%19.2%X60%+4.8%X24%=12.672%乙的活率为10.08%15.2%X60%+4.8%X20%=10.08%丙的活率为75.52%19.2%X20%+15.2%X40%+4.8%X100%+60.8%X100%=75.52%通过对两轮枪战的详细概率计算;我们仍然发现枪法最差的丙存活的几率最大;枪法较好的甲和乙的存活几率仍远低于丙的存活几率..对于这样的例子;有人会发出“英雄创造历史;庸人繁衍子孙”的感叹..。

博弈论基本概念

博弈论基本概念

博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

在博弈论中,通常包括以下基本概念:
局中人:在一场竞赛或博弈中,具有决策权的参与者被称为“局中人”。

在一个博弈中,每个局中人都要做出选择。

行动:局中人在博弈中的每一个决策或选择被称为“行动”。

信息:局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。

策略:局中人基于可获得的信息,制定的决策方案或规则称为“策略”。

收益:局中人在博弈中的得失或输赢称为“收益”。

均衡:当所有局中人都认为自己的策略选择最优,并且其他局中人也认为该策略选择是最优时,这种状态被称为“均衡”。

结果:在一场博弈结束后,所有局中人的收益总和被称为“结果”。

博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。

其中,局中人、策略和收益是最基本要素。

发展过程方面,博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

目前,博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论简介

博弈论简介
பைடு நூலகம்
经济学
拍卖理论
1
• 博弈论可以用来解释不同拍卖机制下的拍 卖策略和价格形成。
寡头垄断竞争
2
• 研究寡头垄断企业如何制定竞争策略,以 实现自身利益最大化。
劳动力市场与产品市场
3
• 博弈论被用于分析劳动者和雇主在劳动力 市场上的博弈行为,以及企业在产品市场上
的竞争策略。
政治学
选举行为
01
• 研究选民、政党、候选人之间的策略互动,以及投票行
生态学
• 研究生态系统中的食物链、竞争、共生等关系,以及物种之间的博弈策略。
游戏与计算机科学
01
游戏设计
• 博弈论被用于设计具有挑战性和趣味性的游戏,如棋类游戏、策略游戏 等。
02
计算机科学
• 研究计算机在处理问题时的决策过程和算法设计,如人工智能、机器学
习等领域。
03
信息论
• 研究信息传递过程中的策略选择和最优信息传输,如密码学、信息编码
博弈论简介
contents
目录
• 博弈论的基本概念 • 博弈论的基本理论 • 博弈论的应用 • 博弈论的未来发展 • 结论
01
博弈论的基本概念
定义与特点
• 博弈论(Game Theory)是一门应用数学
1
分支,主要研究在特定情境下个体或团队如 何做出决策以及这些决策之间的相互作用。
• 博弈论的特点在于强调决策的互动性和策
3
,常用于研究长期竞争和合作关系。
合作博弈
• 合作博弈是指参与者可以通过达成协议或联盟来优化整
01
体利益的博弈。
02
• 在合作博弈中,参与者可能会放弃部分利益,以换取整

博弈论简介

博弈论简介
但是,并不是所有博弈的博弈方都像上面这些博弈问题中的那样,有关于 各博弈方得益或了解各博弈方得益所需要的全部信息的。典型的例子是在投标、 拍卖活动构成的博弈中,由于各博弈方(竞投、竞拍者)对其他博弈方关于标的 的估价很难了解,因此即使最后的成交价是大家都能看到的,各个博弈方仍然 无法知道其他博弈方中标、拍得标的物的真正得益究竟是多少。

但并不是所有重复博弈都有事先确定的重复次数,也就是停止重复时间的, 有些重复博弈似乎是会不断重复下去的。我们称这样的重复博弈为“无限次重 复博弈”(Infinitely Repeated Games)

14
(六)博弈的信息结构

所谓信息,是指关于事物运动的状态和规律的表征,也是关
于事物运动的知识。 信息就是用符号、信号或消息所包含的内容,来消除对客观 事物认识的不确定性。它普遍存在于自然界、人类社会和人 的思维之中。 信息的概念是人类社会实践的深刻概括,并随着科学技术的 发展而不断发展。 这里,我们博弈中的信息,是指在博弈中博弈方对其他博弈



方的特征、战略空间及得益函数等的知识。
15
1.关于得益的信息
博弈中最重要的信息之一是关于得益的信息,即每个博弈方 在每种结果(策略组合)下的得益情况。在许多博弈问题中,各 个博弈方不仅对自己的得益情况完全清楚,而且对其他博弈方 的得益也都很清楚。如在囚徒的困境博弈中,因为两囚徒所处 的地位是相同的,而且警察把他们双方的处境给他们都交代清 楚了,因此两个博弈方都对双方在每种情况下的得益非常清楚。
11
2.动态博弈
除了各博弈方同时决策的静态博弈以外,也有大量现实决
策活动构成的博弈中,各博弈方的选择和行动不仅有先后次序,
而且后选择、后行动的博弈方在自己选择、行动之前,可以看 到其他博弈方的选择、行动,甚至还包括自己的选择和行动。

经济博弈论

经济博弈论
3
非合作博弈强调个体理性
(individual rationality),就是
从个体的角度考虑策略选择,使得
个体收益最大。所以非合作博弈研
究的是参与者在利益相互影响的情
况下如何选策略使自己的收益最大,
即策略选择问题。
约翰·纳什 (J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。
1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体(可以是个人,也可以是团体);
2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策;
3、策略是指参与人选择行动的规则,即在博弈 进程中,什么情况下选择什么行动的预先安排;
第一节 引言
1
博弈理论简介
博弈论(Game Theory):研究具有斗争或竞争性质现象的理 论和方法。
三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集
分类: 合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈;
研究博弈论的意义:理解人类的经济行为;理解社会和生态 物种系统中的合作行为以及自自组织斑图。
13
从游戏到博弈
游戏的特点:下棋,打牌,赌博,田径, 球类等等,共同的特点是策略
策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略和 利益的依存性
14
想一想
假如你正跟恋人用手机通电话,突 然信号断了。这时,你会立即拨电话 过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,取 决于你的恋人是否会拨过来。如果你 们其中一方要拨,那么另一方最好是 等待;如果一方等待,那么另一方就 最好是拨过去。因为如果双方都拨, 那么就会出现线路忙;如果双方都等 待,那么时间就会在等待中流逝。

博弈论 Game Theory

博弈论  Game  Theory

• •
信息是博弈论中重要的内容。 完全博弈是指在博弈过程中,每一位博弈 者对其他博弈者的特征、策略空间及收益函数 有准确的信息。严格地讲,完全信息博弈是指 博弈者的策略空间及策略组合下的支付,是博 弈中所有博弈者的“公共知识”(Commom Knowledge)的博弈。 • 完美信息是指博弈者完全清楚到他决策时 为止时, 所有其他博弈者的所有决策信息,或者 说,了解博弈已进行过程的所有信息。
• 2 . 猜硬币游戏
猜方 正面 盖 正面 方 反面 -1,1 1,-1 反面 1,-1 -1,1
• 3. “田忌赛马” • “田忌赛马”是我国古代一个非常有名的故 事,讲的是发生在齐威王与大将田忌之间的赛 马的故事。田忌在谋士孙膑的帮助下,运用谋 略帮助田忌以弱胜强战胜了齐威王。这个故事 讲的其实是一个很典型的博弈问题。
田 上 中 下 上中下 上下中 齐 中上下 威 中下上 王 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上 下 中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 中 上 下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
忌 中 下 上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下 上 中 -1,1 1,-1 1,-1 1,-1 3,-3 1,-1 下 中 上 1,-1 -1,1 1,-1 1,-1 1,-1 3,-3

动态博弈是指在博弈中,博弈者的行动有 先后顺序(Sequential-Move),且后行动者能 够观察到先行动者所选择的行动或策略,因此, 动态博弈又叫做序贯博弈。

2.如果按照博弈者对其他博弈者所掌握的 信息的完全与完备程度进行分类,博弈可以划 分为完全信息博弈(Game with Complete Information)与不完全信息的博弈(Game with Incomplete Information),以及完美信息的博弈 (Game with Perfect Information)与不完美信息 的博弈(Game with Imperfect Information),确定 的博弈(Game of Certainty)与不确定的博弈 (Game of Uncertainty),对称信息的博弈(Game of Symmetric Information)与非对称信息的博弈 (Game of Asymmetric Information)等。

博弈论

博弈论

1.什么是博弈论?“博弈论”译自英文“Game Theory”,直译就是“游戏理论”。

博弈论是研究行为人在矛盾和对抗性关系中的行为决策中一般性规律规律的学科。

是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。

博弈:一些个人、组织,面对一定的环境条件,在一定的规律下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。

包括:博弈的参加者,各博弈方的全部策略或行为集合,进行博弈的次序,博弈方的得益四方面。

纳什均衡:设存在一个策略组合Bx’和By’,且Bx’∈Bx(Bx1,Bx2,……,BxN),By’∈By(By1,By2,……,ByN) ,当x选择Bx’时,y的最优策略选择是By’,同时,当y选择By’时,x的最优选择是Bx’,因此,x和y选择了Bx’和By’时,谁都不会再改变策略。

这种局面称为Nash均衡,是Nash最早提出并证明了它的存在。

1951年Nash提出了Nash均衡的概念,并证明了Nash均衡的存在——真正奠定了博弈论作为一门学科的基础。

之前,虽然有很多人致力于研究博弈对策的规律,但总没有得出有意义的成果,直到Nash。

n人博弈纳什均衡定⏹设:G={A1,A2,A3,…….,AN;U1,U2, U3,…………,UN}⏹如果存在一个策略组合{a1*, a2*,……,aN*},其中a1*∈A1,a2*∈A2,…….,aN*∈AN,使Ui*=Ui{a1*, a2*,…,aN*} ≥Ui{a1*,…,ai-1*,aij*,ai+1*…,aN*}⏹对任意i ∈N都成立,则{a1*, a2*,……,aN*}为Nash均衡。

囚徒困境坦白B不坦白A 坦白A 不坦白两个被捕的囚徒之间的一种特殊博弈,双方的利益不仅取决于他们自己的策略选择也取决于对方的策略选择。

博弈论

博弈论

ui ( si , s i ) ui ( si , s i ), s i,si si where s i ( s1 , , si 1 , si 1 , , sn ) 即s i S1 Si 1 Si 1 S n
称si*为局中人i的(严格)占优策略
各局中人先后、依次进行选择、行动 后出手者通常能观察到先出手者的选择 策略≠行动
按信息
信息是局中人关于博弈的知识,是实施决策的重要依据 完全信息(Complete Information):没有私人信息
局中人的策略集和支付函数均为共同知识
□ 策略集蕴含了行动集和出手时间
完全信息静态博弈是最简单的一种博弈类型。
中国科学技术大学管理学院 @ 2010
9
矩阵博弈与Maximin解(续)
矩阵博弈的Maximin解:
考虑到对方可能取使己方支付最小的策略(比如:对方通过各种渠道事先窥探 到己方策略),为稳健起见,选择纯策略的原则是:
让最小支付值尽可能大(取最差情况中最好的) ——悲观逻辑、最大最小原则 □ 考虑己方每个纯策略可能带来的最小支付(每行中的最小值) □ 比较这些最小支付,对应于最大的纯策略即为己方所选
对于矩阵博弈A=(aij)m×n,根据稳健的“最大最小原则”
己方Maximin策略: 对方Maximin策略:
i arg max

i{1,, m} j{1,, n}
min aij
1、逐行行内取小 2、小中取大 1、逐列列内取大 2、大中取小
j arg max
j{1,, n} i{1,, m}
合作博弈(Cooperative Game)
部分或全部局中人能够联合,达成一个具有约束力且可强制执行的协议的博弈 类型。 合作博弈强调的是集体理性,强调效率、公正、公平。 通过合作能带来“合作剩余” 合作博弈最重要的两个概念是联盟和分配。

博弈论介绍

博弈论介绍

博弈论介绍博弈论(Game Theory)是一门研究决策制定和策略选择的数学分支学科。

它最初由数学家约翰·冯·诺伊曼(John von Neumann)和经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)于20世纪40年代共同发展起来,用于研究各种竞争、协作和冲突情境下的决策问题。

博弈论的应用领域涵盖了经济学、政治学、社会学、生物学、计算机科学等多个领域。

以下是博弈论的详细介绍:基本概念:博弈(Game):博弈是一种决策情境,涉及多个决策者(玩家)之间的相互影响和策略选择。

每个玩家可以采取不同的策略,而策略的选择会影响每个玩家的收益或效用。

玩家(Player):博弈中的参与者被称为玩家,每个玩家都追求最大化其自身的收益或效用。

策略(Strategy):策略是玩家的行动方案或选择,玩家根据自己的目标和信息来选择策略。

收益(Payoff):每个玩家根据博弈的结果获得一定的收益或效用,这些收益可以是正数、负数或零,反映了玩家的利益。

博弈类型:合作博弈(Cooperative Games):在这种类型的博弈中,玩家可以合作以实现共同的目标,并分配获得的利益。

著名的合作博弈包括合作博弈理论和核心。

非合作博弈(Non-Cooperative Games):在非合作博弈中,玩家之间缺乏明确的合作机制,每个玩家根据自己的利益做出决策。

著名的非合作博弈包括纳什均衡等。

重要概念:纳什均衡(Nash Equilibrium):纳什均衡是非合作博弈中的一个重要概念,指的是在博弈中,每个玩家根据其他玩家的策略选择,不能通过改变自己的策略来提高自己的收益。

纳什均衡是博弈中可能的结果之一。

博弈矩阵(Game Matrix):博弈矩阵是一种表示博弈的方式,它列出了每个玩家在每个可能策略组合下的收益。

通常用于描述双人零和博弈。

博弈树(Game Tree):博弈树是一种表示多人博弈的方式,它展示了博弈中玩家的策略选择和博弈结果的演化过程。

博弈论的几个经典模型课件

博弈论的几个经典模型课件

02
在这个模型中,如果双方都抵赖,则各自获得2年的监禁;如果双方都坦白,则 各自获得3年的监禁;如果一方坦白而另一方抵赖,则坦白的一方获得1年的监 禁,抵赖的一方获得10年的监禁。
03
囚徒困境反映了人类在有限理性和不完全信息下的决策问题。
囚徒困境的策略和最优解
01
02
03
在囚徒困境中,每个参 与者都有两种策略:坦
博弈论的发展趋势和应用前景
发展趋势
随着计算机科学的发展,博弈论在人工智能、机器学 习等领域的应用逐渐增多。同时,博弈论也在生物学 、环境科学、社会学等多个学科中得到广泛应用和发 展。未来,博弈论将继续探索更为复杂和现实的模型 ,以解释和预测更为复杂的行为和现象。
应用前景
博弈论在经济学、政治学、军事等领域有着广泛的应 用前景。例如,博弈论可以帮助理解国际贸易中的策 略行为、国际政治中的权力均衡以及军事战略中的最 优攻击策略等。此外,博弈论也在社交网络分析、市 场机制设计等领域展现出强大的应用潜力。
政治学中的应用
投票悖论
投票悖论是指在某些情况下,多数投票的结 果可能导致无法达成一致意见或产生不合理 的结果。在政治学中,投票悖论被用于探讨 民主制度的缺陷和改进方法。
权力均衡
权力均衡是一种政治博弈模型,它描述了政 治权力在多个参与者之间的分配和转移。在 政治学中,权力均衡被用于分析权力斗争、
政治制度稳定性和政策制定等问题。
纳什均衡模型被广泛应用于市场均衡、产业组织、公共经济学
等领域。
生物学
02
纳什均衡模型也被用于解释生物种群竞争、生态系统平衡等问
题。
社会学
03
纳什均衡模型可以用来分析社会现象,如犯罪、婚姻、教育等
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.2.4石头、剪刀、布
A
石头 剪刀

石头 0,0 1,-1 -1,1
B
剪刀 -1,1 0,0 1,- 1

1,-1 -1,1 0,0
§1.3按局中人的数量对博弈分类
1.3.1单人博弈 退化为一般的最优化问题 (1)单人迷宫
入口
A左B左
0

A左B右
M
A
B

A右B左
0

出口(奖金M)
A右B右
0
单人迷宫
田忌 上中下 上下中 中上下 中下上 下上中 下中上 上中下 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 上下中 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1 齐 中上下 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 威 王 中下上 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 下上中 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 下中上 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
局中人的得益(payoffs)——支付 博弈结果的量化 局中人在博弈中得到的效用 策略组合的函数
博弈的次序(orders) 局中人决策是否同时
1.1.3博弈的表示方法 (1)正规型(策略型)——Payoff Matrix
A坦 B
白不 坦 白

白 -8,-8
0,-10
不 坦 白 -10,0
-1,-1
例子 三人决斗,开枪射杀对手,以保存自己。命中率和
每一轮的开枪次序如下。
命中率
次序
A
30%
1
B
70%
2
C
100%
3
A在第一轮的策略是什么?A最怕什么?首轮之后谁的存 活几率最高?
1.1.2 博弈的基本要素——非正式的定义
博弈的参加者——局中人(players) 独立决策、独立承担结果的个人或组织
策略(strategies)和行为集 一局博弈中,供局中人选用的若干方案
(1)两党制与多党制 两党政见会趋于中间立场,这是一个均衡。 三个政党就不存在均衡。
选民的分布
选民的政治倾向
(2)三厂商竞争优势博弈
厂商3 使用新技术
厂商3 使用旧技术
厂商2 新技术 旧技术
厂商1 新技术 旧技术
厂 商 1
新技术 旧技术
2,2,2 5,0,5
新技术 5,5,0 10,1,1

商2
0,5,5 1,1,10
解其他局中人的博弈支付。
§1.6按博弈的过程对博弈分类
1.6.1静态博弈和动态博弈
静态博弈 所有局中人 同时进行决策(选择策略)的 博弈。
动态博弈 局中人先后 依次进行选择,并且后选择的 局中人在选择之前可以看到此 前其他局中人选择的博弈。
注意:在动态博弈中,缺 失了对称性,策略区别于步骤。 打击
无限策略博弈,结果为无限,只能用数集或函数表示。
n
结果数量 ji i1
其中i 1,2, ,n;n是局中人的数量;ji是局中人i的策略数量。
§1.5按博弈中的得益(支付)对博弈分类
零和博弈、正和博弈、变和博弈
1.5.1 零和博弈:任意策略组合中,局中人的支付之和总为 零,局中人总是对立,在重复博弈中没有合作的机会。
博弈论
Game Theory
焦未然
目录
基本概念
完全信息静态博弈
完全且完美信息动态博弈
不完全信息静态博弈
重复博弈
进化博弈 合作博弈
完全但不完美信息动态博弈 不完全信息动态博弈
CH1基本概念
§1.1博弈和博弈论
1.1.1博弈的基本描述——博弈即游戏 游戏的基本特征:有规则、有结果、有策略、相互依赖性
1.6.3关于博弈进程的信息 具有完美信息的局中人:对历史有完美的知识。反之,
就是具有不完美信息的局中人。 若局中人全是完美信息局中人,则该动态博弈称为完美
信息动态博弈;否则就是不完美信息动态博弈。
CH2 完全信息静态博弈 §2.1 博弈的解法
2.1.1占优策略 局中人的最优策略不依赖于其他局中人的选择,则称该
(2)扩展型——博弈树 由棱和节点构成
B
A
root
outcome
§1.2一些典型博弈
1.2.1 Tucker的囚徒困境
B
A坦
白不 坦 白

白 -8,-8
0,-10
不 坦 白 -10,0
-1,-1
1.2.2抛硬币
猜硬币者 正
盖硬币者
面反 面

面 -1,1
1,-1

面 1,-1
-1,1
1.2.3田忌赛马
先来后到博弈
B

不进
A
(0,10)
和平共处
(-2,3) (5,5)
1.6.2重复博弈 同一个博弈反复进行的博弈过程称为重复博弈。构成重
复博弈的一次性博弈称为“原博弈”或“阶段博弈”。本教 程所指的重复博弈是指原博弈为静态博弈的博弈过程。
有限次重复博弈:原博弈重复的次数是确定的。 无限次重复博弈:没有事先确定的重复次数。 大多数情况下,无法在事前、事中验证博弈的次数是否 有限。局中人关心的不是原博弈的结果,而是整个博弈的总 体结果。所以,重复博弈是一种特殊的动态博弈。
局中人有占优策略。如果某策略组合中的每一个策略都是局 中人各自的占优策略,此策略组合称为占优均衡。
囚徒困境中的(坦白,坦白)就是占优均衡,坦白是每 个囚徒的占优策略。但并不是每个博弈,每个局中人都有占 优策略。
A坦 B
白不 坦 白

白 -8,-8
1.5.2 正和博弈:任意策略组合中,局中人的支付之和总为 非零常数,会产生合作的机会。
1.5.3 变和博弈:局中人的支付之和并非常数。支付之和有 大小排序的问题。
1.5.4 关于支付的信息可以是完全的,也可以是不完全的 具有完全信息的博弈——知道所有局中人的博弈支付。 具有不完全信息的博弈——至少有部分局中人不完全了
(2)运输商与自然的博弈
自然 好 天 气 坏 天 气
运输商
(75%) (25%)

路 -7000
-16000

路 -10000
-10000
从单人博弈的角度看,局中人拥有的信息越多,其所获得 的支付越多。这一规律在多人博弈中是不成立的。
1.3.2多人博弈 依存关系更复杂,存在“破坏者”——“损人不利己者”
旧技术 1,10,1 2,2,2
§1.4按照策略对博弈分类
1.4.1 根据策略多少,博弈可分为: 有限策略博弈和无限策略博弈。 有限策略博弈是指所有局中人的策略均为有限时的博弈。
1.4.2 局中人的策略数可能不一样。 有时,在同一博弈中,某些局中人存在有限的策略,而
另一些局中人有无限策略。 1.4.3 有限策略博弈的结果为有限个,用策略式或扩展式表示。
相关文档
最新文档