博弈论game Chap.5
波恩大学博弈论 讲义 GameT-5
manwomanBalletBoxingBallet 2 , 10 , 0Boxing0 , 0 1 , 2An additional mixed equilibrium??When player 2 mixes (1-β,β)player 1’s payoffs are:()Ballet : 21-=β+0β2-2β()Boxing: 01-β+1β=βBallet Boxing →→2-2ββ β>2>3manwomanBalletBoxingBallet 2 , 10 , 0Boxing0 , 0 1 , 2An additional mixed equilibrium??When player 1 mixes (1-α, α)player 2’s payoffs are:()Boxing : 01-α+2α=2α()Ballet : 11-α+0α=1-αBallet Boxing →→1-α>α α21>player 2’s mix β1Player 1’s Best Response: Ballet B Player g 1oxin →→2-2ββ β>2>3 Ballet Boxing Player 2:→→1-α>α α21>3Player 2’s Best ResponseMixd Nash equilibiumα= 1/3, β= 2/3Boxing, Boxing1/3Ballet2/3Boxing2/3 2 , 10 , 01/30 , 0 1 , 22/32/3Mixed Strategies and DominationA mix of these strategies dominates the middle one1/21/24.53.5x1 , 06 , 40 , 93 , 7 2 , 34 , 0A general notationLet G1be the matrix of the game describing player 1’s payoffsLet player 1use the mixed strategy ⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭12n p pp=•p and let player 2use the mixed strategy⎛⎫⎪⎪⎪=⎪⎪⎪⎝⎭12mqq q•qthen player 1’s payoff is given by:(),,⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪12t112n1q qp G q=p p晻p G•p,qLet G( , ) be a game, and letbe mixed strategies of the two players Define:()()G p,q p G q,p G q=t t12A pair of mixed strategies is a Nash equilibrium of a game G if**p ,q for all mixed strategies ≥*t*t*11p :p G q p G q:and for all mixed strate ies g ≥*t**t22q p G q p G qThe Inspection Game•An agency inspects pollution in one of n days.•A firm will pollute in one of these n days.•The agency wins if it catches the firm poluting, otherwise the firm wins.•Zero-sum game, agency wins = 1, agency loses = -1•Agency and firm decide each day whether to act or wait•If none has acted until the last day (day n), then on that day the agency wins.Let V k be the value of the game beginning on day k,V n = 1.Player 1’s payoff in an equilibriumFAF-1,11 ,-1-1,1actwaitwaitwaitactDay 1Day 2FAFwaitactDay 3If until day k none has acted, then the game on day k can be described by:act waitact 1-1wait-1V k+1If V k+1> -1, then:and there is no equilibrium in pure strategies V n = 1,by induction, we show that if V k+1> -1then so is V ??1-βact βwaitact 1-1wait-1V k+1To find a mixed equilibrium1-2β-1+β(1+V k+1)k+123+V Player 1’s best responseactwait1-1-1V k+1To find a mixed equilibriumk+123+V 1-2α-1+α(1+V k+1)k+123+V Player 2’s best response1-ααact wait1-1-1V k+1k+123+V k+123+V What is 1’s payoff in this equilibrium??EQUILIBRIUMk+13+V k+1k+13+V k+1k+1V -13+Vact wait1-α1-1α-1V k+1k+13+V k+1k+13+V k+1k+1V -13+V k+1k k+1V -1V =3+V ()k+1k+12V +1=-1+>-13+V So if V k+1> -1then V k > -1, hence for all j’s V j > -1.k+1k+1V -13+V To solve the difference equation()k+1k k+12V +11+V =3+V k+1k111+=1+V 21+V k k1w =1+V Change the variablek V =1++1k+1k1w +=w 2n n 11w ==1+V 2k+1k 1w +=w 2n n 11w ==1+V 2nk1n -10.511.5n -2w k0.5(n-k+1)n-k+1= remaining days on the morning of day k0.5n k n -k +1w =2()k 1-n -k V =n -k +1k+123+V k+1k+11+V 3+V act wait1-1-1V k+1On day k each player acts with prob.k+1k+11+V 3+V =k+1k+11+V 2+1+V =k+1k+11/w 2+1/w =k+112w +1=1n -k +1When there are s days left, each acts with probability 1/s .A simpler way to solve this gameEach of the players has n strategies.Strategy k: to act on day k12●●●n11-1-12-11-1●-11●1●1n-1-11 There is a unique mixed strategy equilibrium in12●●●n 11-1-12-11-1●-11●1●1n-1-111n1n 1n2-1n2-1nIf a player has not acted until period k , then he has equalReporting a CrimeA group of n people observes a crime.Each may report the crime or refrain fromreporting.The utility of having the crime reported is v, the cost of reporting is c, (v > c)If no one reports the utility is 0.There are Nash equilibria in which exactlyone person reports the crime.Is there a symmetric equilibrium?(an equilibrium in which all play the same strategy)Is there a symmetric equilibrium?(an equilibrium in which all play the same strategy)There are no symmetric pure strategy equilibria All report , or all not report are no equilibria !!!Look for a symmetric mixed strategy equilibrium in which each one reports with probability p If a player reports he getsv -cIf a player does not report he gets()()0⎡⎤⎣⎦n-1n-11-p +v 1-1-pv -c()()⎡⎤⎣⎦n-1n-1v -c =01-p +v 1-1-p reportnot reportIf this is an equilibrium, then:()()⎡⎤⎣⎦n-1n-101-p +v 1-1-p ()n-1c =1-p v⎛⎫ ⎪⎝⎭1n-1c p =1-v⎛⎫ ⎪⎝⎭1n-1c p =1-v ↑n ↓1n -1⎛⎫↑⎪⎝⎭1n-1c v 1⎛⎫-↓⎪⎝⎭1n-1c v ↑n ↓pMinimax & MaximinStrategiesGiven a game G( , ) and a strategy s of player 1:()min 1tG s,t is the worst that can happen to player 1when he plays strategy s.()max min 1G s,t He can now choose a strategy s for which this ‘worst scenario’ is the best()()min max min =ttsG s,t G s,t ()()min max min .=11t t σG s,t G σ,t ()()min min ⎛⎫ ⎪⎪⎪⎪⎪ ⎪ ⎪⎝⎭1t1tG s,t G s',t ()min 1tG s,t ()min 1tG s',t {{s s'maxs()()min max min =11t t sG s,t G s,t ()(min max min .=11ttσG s,t G σ,t These can be defined for mixed strategies as well.Similarly, one may define()min max 1tsG s,t If the game is strictly competitive then this is the best of the ‘worst case scenarios’ of player 2.max sup min inf=, =。
博弈论完整版PPT课件
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
第三节博弈论(GameTheory)
第三节博弈论(Game Theory)在国际关系的研究过程中,我们时常会运用到博弈论这样一个工具。
博弈论在英语中称之为“Game Theory”。
很多人会认为这是一种所谓的游戏理论,其实不然,我们不能把Games 与Fun 同论,而应该将博弈论称之为是一种“Strategic interaction”(策略性互动)。
“博弈”一词现如今在我们的生活中出现的已经很频繁,我们经常会听说各种类型的国家间博弈(如:中美博弈),“博弈论”已经深刻的影响了世界局势和地区局势的发展。
在iChange创设的危机联动体系中,博弈论将得到充分利用,代表也将有机会运用博弈论的知识来解决iChange 核心学术委员会设计的危机。
在这一节中,我将对博弈论进行一个初步的介绍与讨论,代表们可以从这一节中了解到博弈论的相关历史以及一些经典案例的剖析。
(请注意:博弈论的应用范围非常广泛,涵盖数学、经济学、生物学、计算机科学、国际关系、政治学及军事战略等多种学科,对博弈论案例的一些深入分析有时需要运用到高等数学知识,在本节中我们不会涉及较多的数学概念,仅会通过一些基本的数学分析和逻辑推理来方便理解将要讨论的经典博弈案例。
)3.1 从“叙利亚局势”到“零和博弈”在先前关于现实主义理论的讨论中,我们对国家间博弈已经有了初步的了解,那就是国家是有目的的行为体,他们总为了实现自己利益的最大化而选择对自己最有利的战略,其次,政治结果不仅仅只取决于一个国家的战略选择还取决于其他国家的战略选择,多种选择的互相作用,或者策略性互动会产生不同的结果。
因此,国家行为体在选择战略前会预判他国的战略。
在这样的条件下,让我们用一个简单的模型分析一下发生在2013年叙利亚局势1:叙利亚危机从2011年发展至今已经将进入第四个年头。
叙利亚危机从叙利亚政府军屠杀平民和儿童再到使用化学武器而骤然升级,以2013年8月底美国欲对叙利亚动武达到最为紧张的状态,同年9月中旬,叙利亚阿萨德政府以愿意向国际社会交出化学武器并同意立即加入《禁止化学武器公约》的态度而使得局势趋向缓和。
博弈理论——精选推荐
智猪博弈理论编辑本段介绍在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。
假设猪圈里有一头大猪、一头小猪。
猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4。
那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。
实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。
在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。
在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。
这时候有所不为才能有所为!高明的管理者善于利用各种有利的条件来为自己服务。
“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。
这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。
博弈与制度由智猪博弈故事得到的启示在这个例子中,对小猪而言,无论大猪是否踩动踏板,不去踩踏板总比踩踏板好。
反观大猪,明知小猪不会去踩踏板,但是去踩踏板总比不踩强,所以只好亲历亲为了。
这个案例令我们不得不思考——【博弈与制度】“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。
在博弈中,每一方都要想方设法攻击对方、保护自己,最终取得胜利;但同时,对方也是一个与你一样理性的人,他会这么做吗?这时就需要更高明的智慧。
博弈论ppt课件
15
➢ 扩展术语:
信息:信息集; 完全信息(complete); 完美信息(perfect)。
共同知识:双方可能获取的相同信息; 彼此都能算清楚。
博弈结果:均衡策略组合;均衡行动组合。 均衡:所有局中人最优策略的组合。
博弈论2009
精选ppt课件
16
3. 博弈描述
➢博弈的策略型(标准型、正则型)表述:
33
博弈论2009Leabharlann 精选ppt课件34
毕业后先后在兰德研究所、普林斯顿大 学、MIT工作。
1957年他与MIT学生爱莉西娅结婚。
在而立之年患上了妄想型精神分裂症,九 十年代逐渐恢复了正常。
1994年纳什博士获诺贝尔经济学奖。
2002年来北京参加 “国际数学家大会”
博弈论2009
精选ppt课件
35
博弈论2009
则,不开发。(?)
博弈论2009
精选ppt课件
22
关键问题: 对自然状态的概率估计; 不同时间决策(决策顺序); 对对方先验信息的估计(即估计对方对信
息的掌握程度)。
现实困难: 对市场了解程度不同; 对对方了解程度不同; 如何向对方暗示自己的行动。
博弈论2009
精选ppt课件
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
乙 甲
理性的人是自私自利的; 理性选择不是全局最优。
博弈论2009
精选ppt课件
6
➢经济合作:
乙 甲
诚信的价值; 一报还一报策略; 人类生存环境启示。
博弈论2009
精选ppt课件
7
➢长街上的超市 (海滩占位模型)
*********************
博弈论 Game theory (全)
博弈论 Game Theory博弈论亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学,经济学,国际关系,计算机科学, 政治学,军事战略和其他很多学科都有广泛的应用。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。
其中一个有名有趣的应用例子是囚徒困境(Prisoner's dilemma)。
具有竞争或对抗性质的行为称为博弈行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。
比如日常生活中的下棋,打牌等。
博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。
生物学家使用博弈理论来理解和预测演化(论)的某些结果。
例如,约翰·史密斯(John Maynard Smith)和乔治·普莱斯(George R. Price)在1973年发表于《自然》杂志上的论文中提出的“evolutionarily stable strategy”的这个概念就是使用了博弈理论。
其余可参见演化博弈理论(evolutionary game theory)和行为生态学(behavioral ecology)。
博弈论也应用于数学的其他分支,如概率,统计和线性规划等。
历史博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
game theory5 博弈论 英文
Summary
Games
Albert is considering opening a new supermarket across Tesco on Narodni trida. If it does, Tesco can either do nothing (accept - A) or start a price war to force Albert to close (fight - F)
Introduction to Game Theory
Lecture 5
Disclaimer: this presentation is only a supporting material and is not sufficient to master the topics covered during the lecture. Study of relevant books is strongly recommended.
4 / 26
Review
Dynamic Games
SPNE
Actions vs. Strategies
Summary
Games
Static games with complete and perfect info:
• Game: players, actions, preferences over outcomes
16 / 26
Review
Dynamic Games
SPNE
Actions vs. Strategies
Summary
Games
• Subgame • part of the game that follows after some actions were already taken
博弈论PPT资料整理
博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。
1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。
2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。
博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。
于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。
中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。
博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。
生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。
而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。
特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。
由此可见,博弈论是适合所有人的科学。
在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。
博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。
可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。
从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损如果势均力敌,则应考虑到对手的反击手段。
博弈论最全完整ppt-讲解
导论
二、博弈论与诺贝尔经济学奖获得者
1994年诺贝尔经济学奖获得者
美国人约翰-海萨尼(John C. Harsanyi) 和美国人 约翰-纳什(John F. Nash Jr.)以及德国人莱因 哈德-泽尔腾(Reinhard Selten)
获奖理由:在非合作博弈的均衡分析理论方面做 出了开创性的贡献,对博弈论和经济学产生了重 大影响 。
如果一个博弈在所有各种对局下全体参与人之得 益总和总是保持为一个常数,这个博弈就叫常和 博弈;
相反,如果一个博弈在所有各种对局下全体参与 人之得益总和不总是保持为一个常数,这个博弈 就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
课程主要内容
第一章 完全信息静态博弈 第二章 完全信息动态博弈 第三章 不完全信息静态博弈 第四章 不完全信息动态博弈 第五章 委托-代理理论 第六章 逆向选择与信号传递
第一章 完全信息静态博弈
博弈论的基本概念及战略式表述 纳什均衡
纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性与多重性
第一节 博弈论的基本概念
与战略式表述
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行为发生直 接相互作用时候的决策以及这种决策的均衡问题。
博弈的战略式表述:G={N,(Si)iN,(Ui)iN} 有三个基本要素: (1)参与人(players)iN={1,2,…,n} ; (2)战略(strategies),siSi(战略空间); (3)支付(payoffs),ui=ui(s-i,si)。
Because We Had a Flat Tire”
game theory博弈论
game theory博弈论
游戏理论,也被称为博弈论,是一种研究人类决策和行为的数学框架。
它旨在理解在人类决策中存在的不确定性和竞争条件下,每个参与者的决策如何影响整个系统的结果。
从二战后的经济学开始,游戏理论已经成为经济学、政治学、心理学、哲学和博弈理论的重要研究领域。
它也成为了解决现实生活中许多社会问题的一种有力工具,例如市场竞争、调解博弈、投票、拍卖、国际贸易等。
游戏理论中的核心概念包括博弈、策略、收益和均衡等。
博弈是指参与者之间的相互作用,策略是指参与者制定的行动计划,收益是指参与者对于结果的评价,均衡是指没有参与者有动机改变他们的策略的状态。
在游戏理论中,有许多不同的博弈模型,例如零和博弈、合作博弈、非合作博弈等。
在每种模型中,参与者的决策和行为都会受到不同的影响和限制。
通过了解游戏理论,我们可以更好地理解许多人类行为的原理和动机,同时也可以更好地理解和预测许多社会问题的发展趋势。
- 1 -。
博弈论
Day 1
Day 2
Day 3
分析
如果是情况(2),2红1黑
那么在第一天,红头发的人会看到1红1黑,他会考虑如果自己头发颜色是黑的, 那么为情况(1),他所见的红发人会在第一天黄昏自杀,如果他头发为红, 为情况(2),他所见的红发人不会自杀。黑头发人看到2红,那么可排除情况 (1),如果他头发为黑,则为情况(2),否则为情况(3)。到了第二天, 没有人自杀。那么两个红发人都认定此为情况(2),知道自己头发为红,于 第二天晚自杀。黑发人第三天发现这是情况(2),知道自己头发为黑,于当 晚自杀。
分析
我们从1个海盗的情况开始讨论。 (1)如果只有1个海盗,那么他显然会把 10个金币都分给自己。此时最佳方案为{10}。
分析
(2)如果有2个海盗,那么2号来制定方案。 但是他无论怎么制定,1号海盗都投反对票, 根据规则2号海盗会被丢入大海,并且金币 被1号海盗独享。最佳方案为{死,10}。
2 1
分析
(3)如果有3个海盗,那么3号无论怎么制定方 案,2号必同意(因为如果只剩2人了那么2号必 死,他保命要紧),而1号必反对(因为如果只剩 2人,他将独享10金币并搞死2号)。所以3号可 以给自己分10个,依然能通过。最佳方案为{10, 0,0}。 3 2 1
分析
(4)如果有4个海盗,那么4号除自己需要2票,此时3号必反 对提议(因为如果到3海盗情况他将得10金币,就算现在给他 10金币他也反对因为他还想搞死4号),那么此时需要1、2号 各一票。如果到3海盗情况,那么1、2号会颗粒无收。若不给 他们金币让他们同样颗粒无收,他们将反对(同样都一无所获 那为什么不让你死),但若给他们1人1金币,他们就会同意。 所以最佳方案为{8,0,1,1}。
博弈论知识点总结完整版
博弈论知识点总结完整版博弈论是研究决策者在互相影响的情况下做出最佳决策的数学模型和方法。
在博弈论中,决策者被称为玩家,他们的决策会受到其他玩家的影响。
以下是博弈论的一些重要知识点的总结:1.资料和约定-玩家:博弈论中的决策者。
-策略:玩家可以采取的行动。
-支付:玩家根据博弈结果获得的效用或价值。
-最优策略:在给定博弈条件下,可以使玩家获得最大效用的策略。
-纯策略和混合策略:纯策略是指玩家在每次博弈中都采取相同的行动;混合策略是指玩家以一定概率采取不同的行动。
2.标准形博弈-扩展形式:博弈者按照时间次序做出决策,每个决策节点有多个玩家可以选择的动作。
-纳什均衡:在标准形博弈中,如果所有玩家都不愿意单方面改变他们的策略,则该策略组合是纳什均衡。
-最优反应函数:针对每个玩家的策略组合,最优反应函数给出了该玩家的最佳策略。
-支配策略:一个策略在任何情况下都能够给出玩家更好的结果,那么我们可以说这个策略是支配的。
3.矩阵博弈-矩阵:博弈论中描述玩家策略和效用的表格。
-矩阵博弈的解:通过找到纳什均衡,我们可以得出矩阵博弈的解决方案。
-互动博弈:双方玩家的效用都取决于对方的策略选择。
4.博弈树-博弈树:根据博弈的时间顺序和玩家之间的相互影响,构建的树形结构。
-极小极大算法:用于确定博弈树上的最佳策略。
- alpha-beta剪枝:通过剪枝,减少博弈树的节点数量,从而提高效率。
5.进化博弈论-重复博弈:博弈过程被连续重复进行,玩家可以根据之前的结果来调整策略。
-演化稳定策略:一个策略集合中的策略,在当前环境下被所有玩家采纳并且难以被其他策略取代。
6.合作博弈论-合作博弈:玩家可以自由选择与其他玩家联合合作,并共享所获得的效用。
-特征函数:描述合作博弈的效用分配。
-核心:合作博弈中所有合法的效用分配的集合。
- Shafer值:一种用于将效用分配给个体的方法,使得每个个体的效用都能够得到公平分配。
博弈论是多学科交叉的研究领域,应用广泛,涉及经济、管理、政治等多个领域。
博弈论
○ 什么是博弈?
→ 博弈:理性个人或其他组织,面对一定条件,按一定规划同 时或先后,一次或多次,从各自允许选择的行为或策略中进 行选择和实施,进而取得相应结果的过程。
○ 什么是共同知识?
→ 共同知识涉及一群体对某事实知道的结构;一般在 n人组成 的群体 Q中,如果群体中每个人知道 p,且每个人知道其他 人都知道 p ,每个人都知道其他人都知道自己知道 p ……则 称p是群体Q的公共知识。 → 共同知识是每个参与人进行推理的前提,也是博弈逻辑的基 本假定;博弈的共同知识主要有参与人特征、策略空间等。
→ 序贯博弈,即动态博弈,参与人行动有先有后,后行动者可 观察到先行动的选择。 → 动态斗鸡博弈中,“甲前进乙也前进”的威胁不可信,拥有 先动优势的甲会先选择“前进”,其后乙只能选择“后退”。 → 增加威胁的可信性:证明自己非理性、增加自己妥协的损失、 破“破釜沉舟”式的自断后路、证明自己无妥协的权限。
厂商的“囚徒困境”——价格战
乙 甲 降价 不降价 降价抵赖
坦白 -8,-8 -10,0
抵赖 0,-10 -1,-1
乙 甲 坦白 抵赖
坦白 0,0 -10,0
抵赖 0,-10 1,1
→ 走出囚犯困境的途径有二:一是改变收益矩阵;二是通过重 复博弈建立诚信,鼓励合作。
乙
甲 拨打
等待
拨打
等待
乙
甲 坦白
抵赖
坦白
抵赖
0,0
1,1
1,1
0,0
0,0
-10,0
0,-10
1,1
○ 协调博弈与信任博弈如何才能实现社会最优的结果? → 信任博弈属于协调博弈,需要参与双方协调各自的行动才 能获得集体最优的结果;与电话协调博弈两个纳什均衡不 存在差异不能,信任博弈两个纳什均衡中有一个更优;能 否实现集体最优的结果,取决于参与双方的互相信任。
博弈论完整浙江大学GAMECha最新课件
下面给出有限次重复博弈的定义
Definition Given a stage game G,let G(T)(T<∞) denote the finitely repeated game in which G is played T times, with the outcomes of all preceding plays observed before the next play begins. The payoffs for G(T) are simply the sum of the payoffs from the T stage games.
第一阶段的行动组合是(M,M),则第二阶段的行动组 合将是(R,R);第一阶段的行动组合是(M,X)或(X, M),则第二阶段的行动组合将是(P,P)或(Q,Q);第 一阶段的行动组合博为弈论其完整[它浙江大,学]G则AME第_Cha二阶段还是(R,R)。
最新
参与人2 LM R P Q
L 4 , 4 5.5 , 4 3 , 3 3 , 3 3 , 3 参
行动组合 Stage 1 Stage 2
支付向量 总支付 平均支付
(A,B) (2,8) (1,4) (A,B)
(B,A) (5,5) (2.5,2.5)
(A,B) (5,5) (2.5,2.5) (B,A)
(B,A) (8,2) (4,1)
博弈论完整[浙江大学]GAME_Cha 最新
☺路径的支付采用平均支付与采用总支付相比的 优点:平均支付可以与阶段博弈的支付相比较。
博弈论完整[浙江大学]GAME_Cha 最新
回忆第二章第四节的“有同时选择的两阶段动 态博弈”。
两阶段囚徒困境其实属于这种类型博弈。无非这 里的参与人3、4与参与人1、2是相同的,行动空 间A3、A4 也与A1 、A2相同,并且总收益 μi(a1,a2, a3, a4)等于第一阶段结果(a1,a2)的收益与 第二阶段结果 (a3, a4)的收益简单相加。 ☺在“有同时选择的两阶段动态博弈”中第二阶 段参与人3和4的稳定行动依赖于第一阶段的可 行结果(a1,a2),表示为(a3*(a1,a2), a4*(a1,a2)),而 不是简单的(a3*, a4*)(关税博弈中第二阶段企业的 均衡产量依赖于博政弈论府完整第[浙江一大学阶]GAM段E_Ch所a 选择的关税).
博弈论介绍 Introduction of Game Theory
但是,尽管政府当时无力制止这种事 情,公众也不必担心彩电价格会上涨。 这是因为,“彩电厂商自律联盟”只不 过是一种“囚徒困境”,彩电价格不会 上涨。在高峰会议之后不到二周,国内 彩电价格不是上涨而是一路下跌。这是 因为厂商们都有这样一种心态:无论其 他厂商是否降价,我自己降价是 有利于自己的市场份额扩 大的。
Binmore教授与其同事(特别是牛津大学的 Paul Klemperer教授)一道提出了一种相当别 致的拍卖机制设计——盎格鲁-荷兰式拍卖。 这实际上是一种融合了开放的英国式拍卖与 密封的荷兰式拍卖的优点的三阶段混合型拍 卖机制,它保留了英国式拍卖通过动态竞价 揭示私人信息的优势,同时借助密封拍卖特 有的不确定性增加对新进入者的吸引力。但 是,这种在经济学理论上具有潜在优势的新 机制的实际表现究竟如何呢?为了低成本地 检验这种新机制的绩效,同时也为了说服英 国电讯部门的官员们采纳这种复杂的机制, Binmore教授所领导的拍卖设计团队决定借助 实验经济学的方法,并且邀请官员们亲身参 与拍卖实验。
2、为什么要成立WTO? 为什么要成立WTO? WTO
英国3G 牌照拍卖案例 现执教于英国伦敦大学学院(UCL)的著名 博弈论大师、英国第三代(3G)移动通讯频 谱牌照拍卖市场设计团队的领导者Kenneth Binmore 教授 教授,接受英国政府的咨询委托并了 解了英国2G频谱市场的竞争格局以后,他和 同事们很快就意识到了拷贝美国联邦通讯委 员会(FCC)的英式拍卖机制的潜在危险性。 当时,英国2G拍卖市场有4个在位的电讯运营 商,正好与英国政府决定发放的牌照数量相 等。在这样的背景下,采用纯粹的英式拍卖 机制将无法吸引潜在的新运营商参与拍卖, 其结局很可能是由4个在位运营商按照低价瓜 分未来的3G移动通讯市场。
Game05纳什均衡应用 博弈论。课件
12
(三)古诺双Βιβλιοθήκη 头模型(Cournot Duopoly)
• 经典的博弈论案例,是博弈论在不完全竞争市 场上的应用;
• 经济学特点:
– 寡头市场:介于完全竞争和垄断两个极端市场之间; – 19世纪欧美一个市场往往只有两家企业;
• 研究两个问题:
– 初始状态会影响结果(如果最初有93%的人投资,则最 终结果可能会最优;);
– 自我实施的预测会阻止你投资; • 自我实施的预测总指导你针对其他人的做法的预测 来做出最佳应对; • 如果你认为其他人越可能投资,那么你投资的概率 也越大;否则相反。
6
• 投资博弈属于协调博弈(coordination game): – 如果协调成功,大家都投资; – 但协调博弈常会出现协调失败的结果。
• 每个企业目标是利润最大化,问如何找出该博弈 的NE?
14
• 通过求最大化得两企业的最佳反应函数:(参见图示)
– BR1(q2)=(a-c)/2b-q2/2; – BR2(q1)=(a-c)/2b-q1/2; – NE: q*1= q*2=(a-c)/3b(古诺产量)
• 博弈特点: – 不是一个策略互补博弈; • 一个企业的产量越多,另一个企业的产量相应要越 少; – 而是策略替代(strategic substitutes)博弈; • 指你的策略时我的策略的一种替代策略; • 即我的策略实施越多,你的策略实施就越少;反之 亦然。
完全信息静态博弈
LEC5 纳什均衡的应用分析
博弈分析:
• 选择投资的理由: – 不差钱; – 计算预期收益; – 只有投资,才有收益;
• 该博弈的NE是什么? – 两个NE: • 无人投资; • 都投资; – 两个NE完全不同;但都很合理。
博弈论完整课件浙江大学Game Chapter5博弈论经典
Definition 满足要求1-4的策略和推断构成博弈 的完美贝叶斯均衡〔PBE〕。Gibbons
PBE:Consider a strategy profile for the players, As well as beliefs over the nodes at all informa -tion sets.These are called a perfect Bayesian equilibrium(PBE) if:(1)each player’s strategy specifies optimal actions, given his beliefs and the strategies of the other players and (2)the
“萨摩亚岛居民以文身的好差作为挑选武士 的标准〞
在波纳佩岛上,谁能种出特别大的山药,谁 的社会地位就高,谁就能赢得人们的尊敬并可 担任公共职务。
Signals:经济或其他活动中具有信息传递作用 的行为。
Signaling Mechanism:通过信号传递信息的过程。
Pooling-strategy separating-strategy Hybrid-strategy
Game Theory(5)
Dynamic Games of Incomplete Information PERFECT BAYESIAN EQUILIBRIUM
PBE<BNE <SNE<NE
在完全信息静态博弈中,有 PBE=BNE=SNE=NE
一、Introduction to PBE
如果一个博弈没有子博弈,那么子博弈精炼 的要求〔参与人的策略在每一个子博弈中 君构成NE的要求〕自然就得到满足,从 而在任何没有子博弈的博弈中,SNE=NE。
博弈论在谈判中的应用剖析
他招供还是不招 供?
如果他降价我也降 价吗? 降多少?
囚徒
商务谈判者
谈判模型
• 王二有一辆修理一新的旧车,假定对他 来讲此车的使用价值为3000元,假设有一个 李五的人渴望买一辆旧车,现在他手头上有 5000元现金,当他看到王二的车时,认为这 辆车价值4000
现在让我们在这里使用博弈论的假定,即把上 例中的结果假定成一个“合作解”和一个“不合作 解“。所谓合作解就是指王二和李五在成交价格上 达成了一致意见,从而使旧车交易顺利完成。不合 作解则是指两人在价格上讨价还价,相持不下,未 能达成一致协议。如果两人未能合作,王二仍保留 他的旧车,其利益仍为3000元,李五依旧拥有他的 5000元,王二的风险值为3000元,李五的为4000元, 所以,不合作解的总值为3000+4000=7000元。从合 作解来看,如果王二将车买给了李五,对李五来说, 这辆车值4000元,另外,双方还有一个分享的利益。 如3500是交易价格,王二赚得了500元,李五会节 余500元,合作解的总值是 4000+500+3000+500=8000元,显然,这比不合作增 加了1000元的价值。
游戏中字母所代表的意义
• • • • C:合作响应 D:代表不合作(即坦白) R :代表双方进行合作时的回报 S:一方合作而另一方坦白的情况下受骗一
方的支付
• T :代表坦白的诱惑 • P : 双方都坦白时的惩罚 • T>R>P>S , T’>R’>P’>S’
囚徒困境的矛盾特点
• 对个体来说是理性的行为而对双方来说却 是非理性的 • 从个体角度来看,D选择优于C选择 • 假如双方都选择D,双方则都落到DD格里, 这一结果显然比双方都落得CC格更糟糕 • 现实生活中的案例: 两个农民, 两个卖方
博弈论game theory
CH2 完全信息静态博弈 §2.1 博弈的解法
2.1.1占优策略 局中人的最优策略不依赖于其他局中人的选择,则称该 局中人有占优策略。如果某策略组合中的每一个策略都是局 中人各自的占优策略,此策略组合称为占优均衡。 囚徒困境中的(坦白,坦白)就是占优均衡,坦白是每 个囚徒的占优策略。但并不是每个博弈,每个局中人都有占 优策略。
博弈论
Game Theory
焦未然
目
完全信息静态博弈 不完全信息静态博弈
录
完全且完美信息动态博弈
重 复 博 弈
基本概念
进化博弈
合作博弈
完全但不完美信息动态博弈
不完全信息动态博弈
1.1.1博弈的基本描述——博弈即游戏 游戏的基本特征:有规则、有结果、有策略、相互依赖性 例子 三人决斗,开枪射杀对手,以保存自己。命中率和 每一轮的开枪次序如下。 命中率 次序 A 30% 1 B 70% 2 C 100% 3 A在第一轮的策略是什么?A最怕什么?首轮之后谁的存 活几率最高?
2.3.3反应函数 对于其他局中人的每一个可能的决策,局中人i都选定 自己的最佳决策。建立这种最佳决策与其他局中人的每一个 可能的决策的映射关系,我们称之为反应函数。局中人反应 函数的交点就是NE。
q2
a b a 2b
a bq 2 q1 2b
E
q2
R1 q2
a bq1 q2 2b a 2b a b
按钮 4,8
0
2.1.3划线法
A B 坦 白
坦
白不 坦 白
猜硬币者 正 盖硬币者 面 反 面
-8,-8 -10,0
0,-10 -1,-1
正
反
面
面
-1,1
博弈论在谈判中的应用..
合作目标的直接决定因素
• 获益结果的不平等
–当合作给另一方带来的利益大于己方时,合作 的愿望会逐渐消失
博弈论研究的是理性 的博弈者,在独立决 策但其决策又相互影 响其各自收益的情况 下该如何行动。
博弈论的思维方式为我们 解决谈判中的问题提供了 强有力的分析工具。它使 我们的思想集中在谈判另 一方的想法和可能采取的 行动,帮助我们考虑谈判 另一方对我们的建议作何 反应,以及我们的行为可 能产生的意想不到的效果。
游戏中字母所代表的意义
• • • • C:合作响应 D:代表不合作(即坦白) R :代表双方进行合作时的回报 S:一方合作而另一方坦白的情况下受骗一
方的支付
• T :代表坦白的诱惑 • P : 双方都坦白时的惩罚 • T>R>P>S , T’>R’>P’>S’
囚徒困境的矛盾特点
• 对个体来说是理性的行为而对双方来说却 是非理性的 • 从个体角度来看,D选择优于C选择 • 假如双方都选择D,双方则都落到DD格里, 这一结果显然比双方都落得CC格更糟糕 • 现实生活中的案例: 两个农民0
下
12,
8
5,
4
对C 来说 左优 于右
对R来说下优于上
占优 (2)
C 左 右
上
0,
2
5,
4
R
下
10, 3
3, 8
均衡
只要另一方不变,双方进行任何改变都不会使自己的状况更优
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Two questions about Nash equilibrium
Existence. (When) Do we know that every game has a Nash equilibrium? Uniqueness. (When) Do we know that a given game will have exactly one Nash equilibrium?
5.1.2 Nash Parables
Play Prescription
One can think of a Nash Equilibrium s* as a prescription for play. If this strategy vector is proposed to the players, then it is a stable prescription in the sense that no one has an incentive to play otherwise.
5.2 Examples
Example 1: Battle of the Sexes Husband \Wife Football (F) Opera (O) Football (F) 3, 1 0, 0 Opera (O) 0, 0 1, 3
Prisoners’ Dilemma Game
Chapter 5 Nash Equilibrium
The third—and by far the most popular— solution concept for strategic form games. A set of strategies, one for each player, such that each player’s strategy is a best response to others’ strategies.
Best Response
The strategy that maximizes my payoff given others’ strategies. Definition(p64). A strategy sj*is a best response to a strategy vector s*-j of the other players if, for all si i (si*,s-i*) i (si,s-i*) Definition(p64). The strategy vector (s1*, s2*,…,sN*) , , is a Nash equilibrium if i (si*,s-i*) i (si,s-i*) for all si, for all i This one condition includes the two requirements of Nash equilibrium that were intuitively discussed earlier:
dominant strategy solution, IEDS, and Nash equilibrium
5.1 The Concept
5.1.1 Intuition and Definition
Suppose you actually have some idea about the other player's intentions. In that case, you would choose a provided it does better than b given what the other player is going to do. You don't need to know that a performs better than b against all strategies of the other player; you simply need to know that it performs better against the specific strategy of your opponent. a is called a best response against the other player's known strategy if it does better than any of your other strategies against this known strategy. To play a best response against that strategy which you believe your opponent is about to play.
Preplay Communication
How would the players in a game find their way to a Nash equilibrium? One answer that has been proposed is that they could coordinate on a Nash equilibrium by way of preplay communication;
Rational Introspection each player could ask himself what he expects will be the outcome to a game. Some candidate outcomes will appear unreasonable in that there are players who could do better than they are doing; that is, there will be players not playing a best response. Focal Point Nash equilibrium forms a focal point for the players in a game, because it has the distinguishing characteristic that each player plays a best response under that strategy vector. Trial and Error
Summary
1. A strategy choice of player i is a best response to his opponents' strategy choice if it yields him the highest payoff possible against that choice. 2. A strategy combination is a Nash equilibrium if each player's strategy choice is a best response against her opponents' choices in that combination. 3. Nash equilibrium is the most popular solution concept in all of game theory. It can be motivated in a variety of ways. 4. Nash equilibrium has been used to explain observable behavior patterns among animals living in the wild. 5. Any IEDS solution has to be a Nash equilibrium. However, there may be Nash equilibria that are not IEDS solutions. 6. The same thing is true of a dominant strategy solution; it must be a Nash equilibrium, but the reverse implication need not hold.
The answer to this question is a lot less satisfactory; in many games there are many Nash equilibria. And then The (third) question becomeБайду номын сангаас: Which one of them is the most reasonable?
Felix \ Oscar 3 hours 3 hours -13, -8 6 hours -4, -1 9 hours 1, 2
6 hours -1, -4 4, -1 1, -1
9 hours 7, -4 4, -4 1, -4
5.4
Relation Between The Solution Concepts
Each player must be playing a best response against a conjecture. The conjectures must be correct.
Nash equilibrium solves ui =max ui (s1*, …, si, …, sn*)
5.1.2 Nash Parables
There are various other ways in which the Nash equilibrium concept has been motivated within game theory. These motivations are parables in the sense that we will only offer a verbal description of each one. Some of these motivations have been precisely worked out in mathematical models; some others have turned out to be simple and intuitive verbally but virtually impossible to analyze formally.