简明博弈论教程(11)分析

合集下载

简单博弈论总结

简单博弈论总结

简单博弈论总结简单博弈论本次简单博弈论讲解五个知识点:1:bash博弈;2:nim博弈;3:威佐夫博弈;4:Fibonacci博弈;5:sg函数;⾸先介绍博弈论问题有如下⼏个特点1:博弈模型为两⼈轮流决策的博弈。

并且两⼈都使⽤最优策略来取得胜利。

两个玩家,都会采取最优的决策,那么如果存在⼀个局⾯为必胜局⾯,某玩家位于此局⾯。

只要⾃⼰⽆失误,则必胜。

那么同样⼜⼀个局⾯为必败局⾯,某玩家位于此局⾯。

只要对⼿⽆失误,则必败。

那也就是说,针对这样的游戏,我们关注点应该在局⾯上。

2:博弈是有限的。

即⽆论两⼈如何决策,都会在有限步决出胜负。

3:博弈是公平的。

即两⼈进⾏决策的规则相同。

相关概念:先⼿必胜状态:先⼿可以从这个状态⾛到某⼀个必败状态。

先⼿必败状态:先⼿⾛不到任何⼀个必败状态。

也就是说先⼿必胜状态,那么先⼿⼀定能采取某些操作,让后⼿⾯对必败态。

如果是先⼿必败态,⽆论先⼿怎么操作,都⽆法让后⼿⾯对必败态。

bash博弈假设⼀堆⽯⼦有n个,每次最多取m个,甲⼄两个玩家轮流取⽯⼦,最后把⽯⼦取完的⼈获胜,保证甲⼄每⼀步的决策都是最优的,请问给定n和m,问甲胜还是⼄胜。

不妨假设刚刚开始n = m + 1,那么后⼿必胜,有如下结论:令n = ( m + 1 ) * r + s其中(r > 1,0 <= s < m + 1)。

如果s=0的话,先⼿每次取k个,后⼿只要取(m+1-k)个即可,后⼿必赢。

如果s!=0的话,先⼿者第⼀次取s个,后⼿第⼀次取k个,接下来先⼿只要取(m + 1 - k)个即可,先⼿必赢。

所以只需考虑是否为0就可以判定结果。

余为0,先⼿必败,反之必胜。

例题:hdu_2188hdu_1846hdu_1847Nim游戏假设有n堆⽯⼦,每堆⽯⼦分别有\(a_1, a_2,…,a_n\)个,每次可以选择任意⼀堆且⾄少取1枚⽯⼦,甲⼄两个玩家轮流取⽯⼦, 最后把⽯⼦取完的⼈获胜, 保证甲⼄每⼀步的决策都是最优的, 甲为先⼿操作, 问甲胜还是⼄胜。

十章博弈论课件

十章博弈论课件

无新品
无新品 4 ,
厂商1
4
有新品 厂商2的最小收益 63,3
有新品 3, 6
2 2
, 2
25
威胁信号?
➢公司之间经常相互发出信号以表明他们的意图、动机 和目标。有些信号是威胁性的。
➢例如, A公司宣布,如果谁挑起价格战,它将坚决奉陪 到底,并宣称其规模在本行业中名列前茅,最有降价 的实力。
➢是否所有的威胁都是可信的?
33
重复博奕
在下图的价格博弈中,如果是静态博弈,厂商很容易陷 入囚徒的困境(低价,低价)。但如果博弈可以无限 重复下去,则厂商的最佳策略是“以牙还牙”。这样, 考虑到对手会以牙还牙,从长远和整体来看,降低价 格不会有什么好处,博弈可能达到合作的结果。
厂商2
低价
高价
低价 10, 10
100 ,-50
第十章 博奕论
通过前面分析可知,寡头想达到垄断 的结果,需要进行合作,而合作往往 难以维持。其均衡是博弈的结果。 博弈论:研究人们在各种战略情况下 如何行事。
1
囚犯的两难处境
李四
坦白
抵赖
张三 坦白 -8 ,-8
抵赖 -20 ,0
0 ,-20 -1 ,-1
2
红与黑的游戏
MAX:profit
红,红 -3, -3 黑,黑 +3,+3 红,黑 +5,-5
• 全部相互了解即为完全信息博弈; • 否则是不完全信息博弈
13
五、博弈的均衡概念
• 博弈方的不同策略将导致各种不同的均衡,而均 衡的特征又与博弈方的行为假设有密切关系。
• 首先分析静态的非合作的博弈,并且对博弈双方 的行为作出以下假设: ①假定博弈双方是理性的 ②假定博弈双方具有完全的信息 ③假定博弈双方独立地进行决策

博弈论讲义完整PPT课件

博弈论讲义完整PPT课件
• 两个寡头企业选择产量的博弈:
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页

博弈论最全完整-讲解PPT课件

博弈论最全完整-讲解PPT课件

王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
.
32
导论
四、主要参考文献
.
33
张维迎著,《博弈论与信息经济学》,上海三联书店、 上海人民出版社,1996年版。
Roger B. Myerson著:Game Theory(原文版、译文 版),中国经济出版社,2001年版。
是关于动态博弈进行过程之中面临决策 或者行动的参与人对于博弈进行迄今的 历史是否清楚的一种刻划。
如果在博弈进行过程中的每一时刻,面 临决策或者行动的参与人,对于博弈进 行到这个时刻为止所有参与人曾经采取 的决策或者行动完全清楚,则称为完美 信息博弈;否则位不完美信息。
.
30
零和博弈与非零和博弈
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
.
4
如何在博弈中获胜?
…… 真的能在博弈中(总是)获 胜吗?
对手和你一样聪明! 许多博弈相当复杂,博弈论并不
施锡铨编著,《博弈论》上海财大出版社,2000年版。
谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。
谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。

博弈论知识点总结推荐文档

博弈论知识点总结推荐文档

博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。

2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。

行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。

信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。

完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。

不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。

支付:决策主体在博弈中的收益。

在博弈中支付是所有决策主题所选择的行动的函数。

从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别:3、博弈论与传统决策的区别:1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。

可表示为:maxU(Pi),其中P为市场价格,I为消费者可支配收入。

2、其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。

但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。

4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。

战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

博弈论教程

博弈论教程
囚徒A 坦白 不坦白
-5,-5
-10,0
0,-10
-1,-1
2.1.2 严格下策反复消去法(逐步剔除严格劣战略) 例
L M R
U M 8,3 2,1 5,1 8,4 6,2 3,6
D
3,0
9,6
2,8
可以预测该博弈的合理结局为(U,L),即参与人A
选择策略U,而参与人B选择策略L。
2.2 Nash 均 衡 2.2.1 Nash 均 衡 的 定 义 Nash 均衡是指这样的策略组合(或剖面): 为 了 极大化自己的收益(或效用), 每一个参与 人所 采取的策略一定应该是关于其他参与人 所采 取的策略的最佳反应. 因此没有一个参 与人会 轻率地偏离这个策略组合而使自己蒙 受损失。



第一章 导论
1.1什么是博弈论(Game Theory) 1.1.1 从游戏到博弈
游戏都有一些共同的特点:
1.都具有一定的规则; 2.都有一个结果; 3.策略至关重要; 4.策略和利益有相互依存性
一、博弈论概述
1.1.1 博弈论的定义
博弈论研究的是人与人之间利益相互制约下策略选择时的 理性行为及相应结局。 豪尔绍尼(John C.Harsanyi)1994年诺贝尔经济学奖获 奖致词:博弈论是关于策略相互作用的理论。 博弈论研究人与人之间“斗智”的形式和后果,当人 们利益存在冲突时,每个人所获得的利益不仅取决于自己 所获取的行动,还依赖于其他人采取的行动,每个人都需 要针对对方的行为选择作出对自己最有利的反应。
定 义 在有n个参与人的博弈 G={S1,S2…Sn;u1,u2,…un)中,策略组合 s*=(s1 *,s2 *,…sn *)是一个Nash均衡,如果对于每一 个i, si*是给定其他参与人的选择: S-i*=(s1*,…si-1*,si+1*,…sn*)的情况下,第i个人的最 优策略,即 ui(si*,s-i*)≥ui(si,s-i*) ,对所有的i∈Γ 或者用另一种表示方式,si*是下述最大化问题的 解: si*∈arg ui(s1*,…si-1*,si,si+1*,…sn*),i=1,2,…n S *∈Si 因此,当且仅当没有一个参与人能从单方面背离 某个策略组合的预见中增加自己的得益时,这 个策略组合就是Nash均衡。

博弈论分析

博弈论分析

中美军备竞赛的博弈分析1.理论介绍1.1博弈论的概念博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。

目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

1.2博弈论的主要特点博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。

其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。

具有竞争或对抗性质的行为成为博弈行为。

在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。

为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。

比如日常生活中的下棋,打牌等。

博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。

1.3博弈的分类博弈的分类根据不同的基准也有不同的分类。

一般认为,博弈主要可以分为合作博弈和非合作博弈。

合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。

博弈论简明教材

博弈论简明教材

博弈论第一节博弈问题概述一、博弈的基本概念博弈论是近年经济学中发展得很快的一个分支。

博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的。

换句话说,博弈论研究当某一经济主体的决策既受到其它经济主体决策的影响,而且该经济主体的相应决策又反过来影响到其它经济主体时的决策问题和均衡问题。

在前面几讲中,除了寡头市场外,消费者的效用或厂商的利润都只依赖于他自己的选择,而与其他人的选择无关。

在这里,经济作为一个整体,各个经济主体的选择是相互影响的。

但对于单个的消费者或厂商来说,所有其它经济主体的行为都被包括在一个参数里。

这个参数就是价格。

除此以外,经济主体在决策时,面临的似乎是一个非人格化的东西。

经济主体既不需要考虑他人的选择对自己选择的影响,也何必需要考虑自己的选择对他人的影响。

而在本讲所介绍的博弈论中,消费者的效用或厂商的利润不仅依赖于自己的选择,而且依赖于具体的某一个或某一些其它经济主体的选择。

在经济学中,博弈论通常是放在寡头市场的分析中,因为在寡头市场上,某一寡头企业在决策时,不得不考虑其他寡头企业的反应。

但事实上,博弈行为是广泛存在的。

博弈分析的目的是使用博弈规则决定均衡。

博弈论的基本概念包括:参与人、行动、战略、博弈规则、信息、报偿、均衡。

参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。

行动是指参与人作的决策。

战略是指参与人选择行动的规则,它告诉参与人在什么情况下选择什么行动。

例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。

这里,“犯”与“不犯”是两种不同的行动。

战略规定了什么时候选择“犯”,什么时候选择“不犯”。

博弈规则是指参与人共同接受的不同情况下的最优战略。

信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。

报偿是参与人从博弈中获得的结果,它取决于所有参与人的行动或战略。

博弈分析PPT教案学习

博弈分析PPT教案学习

Max
Min(3,2,4) 2
2
Min(9,-1,-10) -10
所以,有均衡点 a22=2
Min(-3,0,6)
-3 Min
Max(-6,3,9,-3) 9 Max(1,2,-1,0) 2
2
局中人Ⅱ Max(-8,4,-10,6) 6
第13页/共32页
2021/4/27
14
以上分析表明,局中人Ⅰ和Ⅱ的 “理智行为”是分别选纯策略 a2 和 b2 ,这时局中人Ⅰ的赢得值和局中人Ⅱ的所失值绝对值相等 ,局中人Ⅰ得
第4页/共32页
2021/4/27
5
如在”齐王赛马”中,齐王和田忌的策略集合分别为S1 (a1, a2 ,..., a6 ) 和 S2 (b1 , b2 ,...,b6 ) .这样,齐王的任一策略 ai 和田忌的任一策略 bj 就
S
构成了一个局势 ij 。如两人分别采用策略 a1 和 b1 , 则齐王的赢得为 H1(S11) =3,田忌的赢得为H1(S11) -3 。在二人有限零和博弈中,每一
己的策略集合中选出一个策略,则全部的局势数
n
S Si

i 1
比如田忌赛马问题中,就总共有 6×6=36 个局势。当一个局势出现后 ,必
然会有一个竞争结局 ,把这种竞争结局用数量来表示,就称作赢得函数或
s
支付函数,用 H (i) ( ) 表示。一个局势实际就是一次较量,而赢得也
就是较量一次的结果。
王和田忌各自都有六个策略 (3!个):(上、中、下)、(上、下、中 )(, 中、
上、下)、(中、下、上)、(下、上、中)、(下、中、上)、
三、赢得函数
(支付函数)
一个博弈中,每位局中人所出策略形成的一博弈略称作一个局势。对

尹伯成《西方经济学简明教程》(第8版)课后习题详解(博弈论和信息经济学)

尹伯成《西方经济学简明教程》(第8版)课后习题详解(博弈论和信息经济学)

第8章博弈论和信息经济学1.简释下列概念:(1)上策均衡答:上策均衡又称占优策略均衡,是由博弈中的所有参与者的占优策略组合所构成的均衡。

因为在一个博弈里,如果所有参与人都有占优策略存在,那么,占优策略均衡是可以预测到的唯一均衡,因为没有一个理性的参与人会选择劣策略。

应该指出的是,占优策略均衡只要求每个参与人是理性的,而并不要求每个参与人知道其他参与人是理性的(也就是说,不要求“理性”是共同知识),这是因为,不论其他参与人是否是理性的,占优策略总是理性参与人的最优选择。

(2)纳什均衡答:纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。

纳什均衡是由所有参与人的最优策略所组成的一个策略组合。

也就是说,给定其他人的策略,任何个人都没有积极性去选择其他策略,从而没有人有积极性去打破这个均衡。

(3)静态博弈答:静态博弈指局中人同时决策或虽非同时决策,但后决策者不知道先决策者采取什么策略的博弈。

在静态博弈中,局中人同时选择行动,或者虽然不是同时,但后行动者并不知道先行动者采取了何种具体行动,从而不能根据先行动者的行动来选择自己的行动。

(4)动态博弈答:动态博弈指局中人决策有先有后,后决策者能观察到先决策者决策情况下的博弈。

在动态博弈中,局中人的行动有先后顺序,并且后行动者能够观察到先行动者所选择的行动,从而可以根据先行动者的行动来决定自己的行动。

相应地,先行动者知道其行动会影响后行动者的行动选择,从而在决定自己的行动时会把这种影响考虑进去。

(5)极大极小化策略答:极大极小化策略指参与者所采取的使自己能够获得的极小收入极大化的策略。

极小收入是指采取某一种策略所能获得的最小收入。

以表8-1的支付矩阵为例,A采取守的策略所能获得的最小收入是2,而采取攻的策略所能获得的最小收入是-500。

表8-1 极大极小策略就表8-1所显示的策略而言,若A、B两人都采取极大极小化策略,均衡的结果是守与退的策略,两人都分别获得2的支付。

博弈论(第十一讲 重复博弈与声誉)PPT课件

博弈论(第十一讲 重复博弈与声誉)PPT课件
16
11.2 有限次重复博弈
11.2.1 有限次重复博弈——阶段博弈只有一个纳什均衡 假设重复博弈要经历T个阶段而此时是T-1阶段,总支付为各 个独立阶段的支付之和。在阶段T都会选择击中。用AT-2和GT-2 分别表示盟军与德军从阶段1到阶段T-2的各阶段支付之和,T 阶段的子博弈如下所示:
可以看出,AT-2和GT-2对求解 过程不产生任何影响。
17
11.2 有限次重复博弈
11.2.1 有限次重复博弈——阶段博弈只有一个纳什均衡
对于阶段博弈而言,有一个纳什均衡的重要性在于它 能够明确最后一个阶段中参与者如何选择。 因此,对于重复博弈而言,倒数第二阶段的行为不会 影响最后一个阶段,并且这一逻辑可以重复地应用到 任何阶段直至初始阶段。
如果阶段博弈有唯一的纳什均衡,对于有限次重复 博弈而言,唯一的子博弈精炼纳什均衡就是阶段博 弈纳什均衡的重复。
9
11.1 基本概念
阶段博弈的支付在重复博弈中仅表现为一个阶段的支付 。重复博弈中参与者的支付受到每一个独立阶段支付流 的影响。 假设T=5,重复博弈的历史为(不击中,不击中),(击 中,不击中),(不击中,不击中),(不击中,击中 ),(击中,击中),第一个行动为协约国士兵的选择 ,则协约国士兵的独立阶段支付流为4,6,4,0,2。 在重复博弈中参与者会选择能够产生最高支付的策略作 为最终策略。 支付流{4,6,4,0,2}劣于{6,6,6,0,2},但是,很难比较 支付流{6,4,4,2,6}与{4,6,4,0,2}。
10
11.1 基本概念
为了对不同的支付流进行比较,需要确定一个标准。 一个标准就是对支付流进行加总,求得各阶段支付之和 。这样做不仅因为简单,而且当单一阶段的支付增加时 ,总和也随之增加。 对于上述三个支付流有:

《博弈论教程》课件

《博弈论教程》课件

博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。

博弈论最全完整-讲解

博弈论最全完整-讲解

问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
正因为这样的博弈对所有参与者存在着或大 或小的潜在成本,如何达成和维护互利的合 作就成为一个值得探究的重要问题。
存在双赢的博弈吗?实用文档
6
例2:焦点博弈 “We Can’t Take the Exam,
获奖理由:在非合作博弈的均衡分析理 论方面做出了开创性的贡献,对博弈论 和经济学产生了重大影响 。
实用文档
17
约翰·纳什 1928年生于美国
莱因哈 德·泽 尔腾, 1930 年生于 德国
实用文档
约翰· 海萨尼 1920年 生于美 国
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
实用文档
19
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英 国
实用文档
20
2001年诺贝尔经济学奖获得者
实用文档
35
第一章 完全信息静态博弈
博弈论的基本概念及战略式表述 纳什均衡
纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性与多重性
实用文档
36
第一节 博弈论的基本概念
与战略式表述
Байду номын сангаас
实用文档
37
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行 为发生直接相互作用时候的决策以及这种 决策的均衡问题。

简单的博弈论

简单的博弈论

博弈论也也称为对策论或赛局理论,是研究具有斗争或竞争性质现象的数学理论和方法。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

表面上不同的相互作用可能表现出相似的激励结构,所以它们是同一个游戏的特例。

其中一个著名有趣的应用例子是囚徒困境。

具有竞争或对抗性质的行为称为博弈行为。

在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。

为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。

博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案,以及如何找到这个合理的行为方案的数学理论和方法。

约翰·冯·诺伊曼是个超级跨界牛人——他同时在“数学、物理学、经济学、计算机”等多个领域作出了划时代的贡献,并留下一大堆以他命名的东西,比如程序员应该都听说过“冯诺依曼体系”,比如数学领域有“冯诺依曼代数、冯诺依曼遍历定理……”,理论物理领域有“冯诺依曼量子测量、冯诺依曼熵、冯诺依曼方程……”。

另外还有很多东西,虽没有以他命名,也是他先搞出来的,比如:量子力学的公理化表述、希尔伯特第5问题、连续几何(其空间维数不是整数)、蒙特卡洛方法、归并排序算法1944年,他与奥斯卡·摩根斯坦合作发表了《博弈论与经济行为》一举奠定博弈论体系的基础,所以他也被称作博弈论之父。

合作博弈& 非合作博弈不论是合作博弈与非合作博弈,在博弈过程中都可能会出现合作的现象。

差别在于——对于合作博弈,存在某种外部约束力,使得背叛的行为会受到这种外部约束力的惩罚。

对于非合作博弈,没有上述这种外部约束力,对背叛的惩罚只能依靠博弈过程的其它参与者。

通常所说的博弈大都指非合作博弈。

同时博弈& 顺序博弈同时博弈有时也称作静态博弈,指的是——博弈的任何一个参与者在选择自己的行为之前,并不知道其它参与者的行为信息。

顺序博弈有时也称作动态博弈。

博弈论通讲

博弈论通讲
目 录
第一章 博弈论概述

第一篇 非合作博弈理论
第二章 第三章 第四章 第五章
完全信息静态信息博弈-纳什均衡 完全信息动态搏弈-子博弈精炼纳什均衡 不完全信息静态博弈-贝叶斯纳什均衡 不完全信息动态博弈-精练贝叶斯纳什均衡
第一章 博弈论概述-人生处处皆博弈
博弈论(game theory,又译为对策论,游 戏论)
4000,4000 0,8000 8000,0 0 ,0
开发商B 开发 不开发
1000,0 0 ,0 -3000,-3000 0,1000
A严格 劣战 略
开发商A
博弈的战略式表述
战略式表述给出: 1、博弈的参与人集合: i N , N (1,2, , n); 2、每个参与人的战略空 间:Si,i 1,2,, n; 3、每个参与人的支付函 数:ui ( s1 , , si , , sn ), i 1,2, , n) 用G S1, ,S n ; u1 , , un 代表战略式表述博弈。

从拥有信息角度:



8.博弈的划分:
静态 动态
行动顺序 信息
完全信息
完全信息静态博弈 纳什均衡
纳什(1950,1951)
完全信息动态博弈 子博弈精练纳什均衡 泽尔腾(1965) 不完全信息动态博弈 精练贝叶斯纳什均衡 泽尔腾(1965) Kreps 和Wilson(1982) Fudenberg 和Tirole(1991)
4.博弈论的要素
支付函数是参与人从博弈中获得的效用 水平,它是所有参与人战略或行动的函 数,是每个参与人真正关心的东西。 结果是指博弈者感兴趣的要素的集合。 均衡是所有参与人的最优战略或行动的 组合 博弈分析目的是使用博弈规则(参,行, 结)决定均衡。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档