博弈论ch7

合集下载

浙大微观经济学ch7博弈论

浙大微观经济学ch7博弈论
第七章 博弈论与决策行为

博弈论:又称对策论,是研究理性的决策主体 之间的行为相互作用时的决策以及这种决策的 均衡问题。 博弈论的应用是微观经济学的重要发展。

2013/6/13
2
博弈论
1944 年美藉匈牙利数学家冯 · 诺依曼( John Von Neuman )和美藉奥地利经济学家摩根斯顿 ( Morgenstern )出版经典著作《博弈论与经济行 为》,为现代博弈论的发展奠定了基础。 纳什 美国的数学家、经济学家纳什(John Nash),美籍匈牙利经济学家海萨尼 (John C. Harsanyi)和德国经济学 家泽尔滕(R.Selten)因对博弈论的卓越贡 献而获得1994年度的诺贝尔经济学奖。 海萨尼 泽尔滕
可信的威胁
2013/6/13 11
思考题

赌徒分钱?
2013/6/13
12
囚徒B 不招供 不招供 囚徒A 招供 (0,-8) (-5,-5) 招供 揿 大猪 等待 (9,-1) (0,0) 揿 (5,1) 小猪 等待 (4,4)
(-1,-1) (-8,0)
囚徒困境
智猪博弈
2013/6/13
7
博弈论相关概念

重复博弈:一个结构相同的博弈被重复多次。



在一次性静态博弈的情况下,结成共谋的每个寡头面临着 “囚徒困境”,但在重复博弈中,情况会有所不同。 若是无限次重复博弈,通过“以牙还牙”策略,寡头厂商有望 走出“囚徒困境”,取得合作解。 若是有限次重复博弈,则取得非合作均衡解。但在不能确定 终止期的有限次重复博弈中,合作解是可以存在的。 当且仅当局中人的策略组合在每个子博弈都构成纳什均衡 时,才会形成子博弈精练纳什均衡。
2013/6/13 3

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。

它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。

下面是博弈论中的一些重要知识点的总结。

1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。

-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。

-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。

2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。

-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。

3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。

-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。

-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。

4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。

-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。

-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。

5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。

-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。

-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。

6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。

-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。

-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。

7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。

-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。

博弈论PPT课件

博弈论PPT课件

第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳博弈论是研究决策者之间相互作出决策时,通过考虑对方的行动和可能的结果来进行决策的一门学科。

它主要关注对策略的选择与分析,以及对方可能的反应。

下面我们来对博弈论的知识点进行总结归纳。

1.普通博弈和扩展博弈:博弈论分为两类,即普通博弈和扩展博弈。

普通博弈是指参与者在同一时间同时做出决策的博弈,扩展博弈是指参与者在不同的时间节点上做出决策的博弈。

2.博弈的组成要素:博弈论研究的关键要素包括博弈参与者、参与者的策略、参与者的支付、参与者的效用等。

博弈论的目标是通过合理的策略选择来实现最优的支付和效用。

3.纳什均衡:纳什均衡是博弈论中一个重要的概念,指的是当每个参与者都选择了最优的策略后,没有人会改变自己的策略来获得更好的支付。

纳什均衡是博弈的稳定状态。

4.博弈的分类:根据参与者的合作与否,博弈可以分为合作博弈和非合作博弈。

合作博弈中,参与者可以通过合作与其他参与者达成协议,而非合作博弈中,参与者彼此之间没有合作关系。

5.零和博弈和非零和博弈:零和博弈是指所有参与者的支付之和为零的博弈,即一方获利就意味着其他方会损失相应的支付。

非零和博弈是指所有参与者的支付之和不为零的博弈,即所有参与者都有可能获得一定的支付。

6.博弈的解析方法:解析方法是通过分析博弈的特性和参与者的策略来研究博弈的方法。

解析方法包括主要包括支配策略法、混合策略法、最佳反应函数等。

7.博弈的策略选择:博弈论研究的核心问题之一是参与者在博弈中如何选择最优的策略。

策略选择可以通过分析博弈的收益矩阵和参与者的目标来实现。

8.博弈的应用领域:博弈论的应用十分广泛,包括经济学、政治学、生物学、社会学等多个领域。

在经济学中,博弈论被用来研究市场竞争、价格形成等问题,在政治学中,博弈论被用来分析政治决策与合作等问题。

9.孤立型博弈和重复博弈:孤立型博弈是指只进行一轮博弈的情况,参与者只能根据当下的情况来做出决策。

重复博弈是指进行多轮博弈的情况,参与者可以根据之前的决策和结果来进行策略的调整。

第八章博弈论简要课件

第八章博弈论简要课件

11
第八章 博弈论
四、重复博弈和序列博弈
➢静态博弈是指局中人同时决策或虽非同时 决策,但后决策者不知道先决策者采取什么 策略的博弈。 ➢动态博弈是指局中人决策有先有后,后决 策者能观察到先决策者决策情况下的博弈。
12
第八章 博弈论
动态博弈的例子
进入
在位者甲
合作 斗争
进入者乙
(400 ,500) ( -100 ,100)
6
第八章 博弈论
3、策略集合: 是指所有局中人可能采取 的行动方案总和。例如:都坦白,都抵赖, 坦白与抵赖,抵赖与坦白 4、收益: 是指在每种组合情况下,局中 人采取特定策略得到的结果。例如:判3年, 6年,释放等
7
第八章 博弈论
三、上策均衡和纳什均衡
1、上策: 是指不管其他局中人采取什么策 略,某一局中人都采取自认为对自己最有 利的策略。 2、均衡: 是指博弈中所有局中人都不想改 变自己策略的一种相对静止状态。
1
第八章 博弈论
博弈论字面的意思是游戏策略,及用类 似游戏中解决问题的方法,揭示解决社会、 经济及其他领域问题的策略、对策,因此有 的还把博弈论译成对策论。准确的说博弈论 是在给定的条件下寻求最优策略,这里给定 的条件包含其他人的策略以及本人的决策对 其他决策主体的影响。
2
第八章 博弈论
策略性活动在社会、经济、政治生活中 大量存在,也可以说,整个社会、经济、政 治生活都是博弈行为。因此,博弈论作为一 种方法,广泛的应用在经济、政治、军事、 外交中,只是博弈论在经济学中应用的最广 泛、最成功。如前面介绍过的古诺均衡,就 属于经济学中的博弈过程。
8
第八章 博弈论
3、上策均衡: 不管其他局众人采取什么策 略,每个局中人都选择了对自己最有利的策 略所构成的一个策略组合。 4、纳什均衡: 是指参与博弈的每一局中人 在给定其他局中人策略的条件下选择上策所 构成的一种策略组合。 注:所有上策均衡都是纳什均衡,但不能反 过来说所有纳什均衡都是上策均衡。

第六章博弈论

第六章博弈论

一般认为,1944年美国数学家冯•诺依曼(John Von Neumann)和经济学家奥斯卡•摩根斯坦 (Oskar Morgenstern)合著的《博弈论与经济 行为》(The Game Theory and Economic Behavior) 一书的出版,标志着系统的博弈理 论的形成。
❖该书详尽地讨论了二人零和博弈, 并对合作博弈作了深入探讨,开辟 了一些新的研究领域。更重要的是 将博弈论加以空前广泛的应用,尤 其是在经济学上,由于博弈论数学 上的严整性与经济学应用上的广泛 性,一些经济学家将该巨著的出版 视为数理经济学确立的里程碑。
“保证最低价格”策略
❖ “保证最低价格”条款。
❖ 该条款一般规定:“顾客在本 商店购买这种商品一段时间内,如 果发现其他任何商店以更低的价格 出售同样的商品,本店将退还差价, 并补偿差额的10%。”
❖ 一、单项选择题:
❖ 分析下列的报酬矩阵,回答问题:
John的 开业长时间 咖啡 馆 开业短时间
✓ 第一,不能让对方事先知道自己可 能采取的策略。
✓ 第二,必须采取随机选择的原则。 ✓ 第三,选择策略的概率一定要使对
方无机可乘。
动态博弈
➢重复博弈 ➢序列博弈
重复博弈
❖ 对重复博奕的研究结果证明有一种 最好的策略:只需将一个原则贯穿始终, 即“以牙还牙”(Tit-for-tat)。
❖ 以牙还牙策略的获胜有一个十分重 要的条件,即博弈是无限次重复的。
❖王则柯 :《新编博弈论平话》 中信出版社 ❖ 王则柯主编:《21世纪经济学教材:博弈论
教程》中国人民大学出版社
❖ 《美丽心灵》(A Beautiful Mind )是一部关于一个 真实天才的极富人性的剧情片。故事的原型是数学家 小约翰-福布斯-纳什(Jr.John Forbes Nash)。英俊而又 十分古怪的纳什早年就作出了惊人的数学发现,开始 享有国际声誉。但纳什出众的直觉受到了精神分裂症 的困扰,使他向学术上最高层次进军的辉煌历程发生 了巨大改变。面对这个曾经击毁了许多人的挑战,纳 什在深爱着的妻子艾丽西亚(Alicia)的相助下,毫不畏 惧,顽强抗争。经过了几十年的艰难努力,他终于战 胜了这个不幸,并于1994年获得诺贝尔奖。这是一个 真人真事的传奇故事,今天纳什继续在他的领域中耕 耘着。

博弈论7

博弈论7
2013-5-12 18
例2 有限次重复削价竞争博弈
• • • 高价 • 寡头1 • 低价 寡头2
高价
100,100
低价
20,150
150,20
70,70
• 一次博弈中,(低价,低价)是唯一的纯策略纳 什均衡。
2013-5-12 19
分析
• 原博弈中纳什均衡是低效率的,双方有合作的愿 望。在一个市场上,双方长期竞争,可以看作重 复博弈。如果这一竞争将持续5年,双方是合作 还是不断价格战呢? • 用上面的定理即可知道不论次数多少,都将采取 原博弈的纳什均衡策略。 • 类似的还有古诺模型的重复博弈。在每次博弈中, 各博弈方都会采取古诺产量。
分析
• 这一博弈中的两个纳什均衡都不是高效率的。重 复博弈是否会出现高效率的结果呢? • 首先,两次重复使结果增加了很多,达到了81 个路径。如果再考虑混合策略,路径就更多了。 双方可以在同一阶段使用同一的纳什均衡策略, 也可以使用不同的纳什均衡策略。也可以使用混 合策略。但重要的是,两次重复确实存在第一阶 段采用(h,h)的子博弈完美纳什均衡。双方的 策略是:
2013-5-12 20
3.多个纯策略纳什均衡博弈的有限次重复博弈
• (1)三价博弈的重复博弈 • 厂商2 • h m 5,5 • h 0,6 6,0 3,3 • 厂商1 m • l 2,0 2,0
l
0,2 0,2 1,1
• 这个三价博弈有两个纯策略纳什均衡: • (m,m)和(l, l).
2013-5-12 21
双方都知道后一阶段的结果不论怎么选择最后得益都是在第一阶段的得益基础上加6因此这与下面的博弈是相同的??囚徒2坦白不坦白坦白?囚徒1?不坦白121261515677201420149920201717?因此博弈的结果仍是坦白坦白?可以看出无论进行多少次双方都会采取和原博弈相同的纳什均衡策略这是这种有唯一纯策略纳什均衡的子博弈完美纳什均衡路径

博弈论课件

博弈论课件

脚的看牌人、看棋人,企业的顾问等。
对参与人的决策来说,最重要的是
必须有可供选择的行动集(策略集)和
一个很好定义 的支付函数。
自然被当作虚拟参与人。
清华诚志
10
(2)策略(strategies ):博弈中有两种策略
概念,一种为纯策略(pure strategy ), 简称策略, 指参与人在博弈中可以选择采用的行动(actions or moves)方案,是参与人在给定信息结构的情况 下的行动规则,它规定参与人在什么时候的什么情
囚徒困境反映了个人理性和集体理性的矛盾。如果 A和B都选择抵赖,各判刑1年,显然比都选择坦 白各判刑8年好得多。当然,A和B可以在被警察 抓到之前订立一个"攻守同盟",但是这可能不会有 用,因为它不构成纳什均衡,没有人有积极性遵守 这个协定,显然最好的策略是双方都抵赖.
清华诚志
5
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到自己,这样他 们必然要服长的刑期。只有当他们都首先替 对方着想时,或者相互合谋(串供)时,才可 以得到最短时间的监禁的结果。
清华诚志
26
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的思想, 每个个体都是理性的,所以必须了解竞争对手的思 想。商业关系被认为是一种相互作用。但博弈论并 不是疗法,并不是处方,它并不告诉你该付多少钱 买东西,这是计算机或者字典的任务。博弈论只是 提供一些关系的例证,一些有用的解决问题的方法。 这种思维方法也许是企业家应该学习的。对于经济 学家,也许需要学习它的理论模型,它的实验方式 。

博弈论知识点总结

博弈论知识点总结

博弈论知识点总结博弈论是一门研究决策与策略的数学理论,主要涉及博弈参与者之间的冲突、竞争和合作,并通过数学模型和方法来分析博弈参与者的最佳决策和最优策略。

下面是博弈论的一些基本概念和重要知识点的总结。

1. 标准形博弈(Normal Form Game):标准形博弈是博弈论中最常见的形式,参与者同时选择策略,并根据选择产生相应的收益或损失。

标准形博弈由参与者的策略集合、收益函数和参与者的收益组成。

2. 纳什均衡(Nash Equilibrium):纳什均衡是指在一个博弈中,参与者选择的策略组合使得没有任何一个参与者单方面改变自己的策略能够获得更高的收益。

纳什均衡是博弈论的核心概念,用来描述博弈中的稳定状态。

3. 零和博弈(Zero-sum Game):零和博弈是指当其中一个参与者获得了收益,另一个参与者就会产生相应的损失,总收益为零。

在零和博弈中,参与者之间的利益完全相反,他们的决策是对立的。

4. 混合策略(Mixed Strategy):混合策略是指在博弈中,参与者以一定概率选择不同的纯策略。

混合策略在博弈论中用来描述参与者的随机决策,可以通过计算期望收益来确定最优混合策略。

5. 博弈树(Game Tree):博弈树是用来表示博弈过程的树状结构,每个节点代表一个博弈的状态,边代表参与者的策略选择。

博弈树可以用来推导纳什均衡策略和分析博弈过程。

6. 合作博弈(Cooperative Game):合作博弈是指参与者之间可以合作达到更好的结果的博弈形式。

在合作博弈中,参与者通过互相合作,在利益最大化和成本最小化之间进行协商和决策。

7. 非合作博弈(Non-cooperative Game):非合作博弈是指参与者之间独立地做决策,不进行合作和协商的博弈形式。

在非合作博弈中,参与者根据自身利益进行策略选择,涉及策略选择和对手的预测。

8. 进化博弈(Evolutionary Game):进化博弈是将生物进化的概念引入博弈论中的一种模型。

博弈论基础知识汇总

博弈论基础知识汇总

博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。

一种是“进化博弈论方法”。

它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。

另一种新方法是“重复博弈论方法”,它运用更精细的均衡概念,如“子博弈精炼均衡”来分析历史与现实中的制度选择与变迁过程。

基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。

其中局中人、策略和收益是最基本要素。

局中人、行动和结果被统称为博弈规则。

博弈主要可以分为合作博弈和非合作博弈。

合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈、从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。

完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

博弈论看法博弈论的基本假设:参与人追求利润最大化。

博弈论概述

博弈论概述

博弈论概述博弈论是研究决策制定者之间相互作用的一门学科。

在博弈论中,决策者被称为"玩家",他们的决策会影响其他玩家的利益。

博弈论的目标是研究玩家在不同情境下的最佳决策策略,以及这些策略对整体结果的影响。

以下是博弈论的一些基本概念和要点:1.玩家(Players):博弈中的参与者被称为玩家。

这可以是个体、公司、国家等。

2.策略(Strategies):玩家在博弈中采取的行动或决策被称为策略。

每个玩家可以有多种可能的策略。

3.支付(Payoffs):博弈的结果被称为支付,它反映了每个玩家在博弈结束时的效用或利润。

4.博弈矩阵(Game Matrix):通过博弈矩阵,可以清晰地表示玩家的策略选择和相应的支付。

博弈矩阵通常用于描述二人零和博弈。

5.纳什均衡(Nash Equilibrium):纳什均衡是指在博弈中,每个玩家都选择了最优的策略,给定其他玩家的选择,没有一个玩家有动机单方面改变自己的策略。

6.博弈形式(Normal Form)和博弈扩展形式(Extensive Form):博弈形式描述了一次性的、同步进行的博弈,而博弈扩展形式描述了具有序列和时间概念的博弈。

7.博弈的分类:博弈可以分为合作博弈和非合作博弈、零和博弈和非零和博弈、完全信息博弈和不完全信息博弈等。

8.博弈的应用领域:博弈论在经济学、政治学、社会学、生物学、计算机科学等多个领域都有广泛应用。

博弈论提供了一种分析人们在决策过程中相互作用的方式,它的应用范围涵盖了众多领域。

在博弈中,每个玩家都追求自己的最大利益,因此博弈论可以帮助人们更好地理解和预测复杂的决策场景。

博弈论

博弈论

博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。

目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

生物学家使用博弈理论来理解和预测进化论的某些结果。

参见:行为生态学(behavioral ecology)。

理论历史约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。

1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。

纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

博弈论原理

博弈论原理
(4)支付(payoffs):是指一个特定战略组合下参与人 得到的确定效用水平,或者是他得到的期望效用水平。


(5)均衡:在经济学中,均衡意即相关量 处于稳定值。所谓纳什均衡,它是一稳 定的博弈结果,是所有参与人的最优战略 的组合。
4、博弈的分类

合作博弈和非合作博弈

完全信息博弈和不完全信息博弈
补充章 博弈论 (Game Theory)
在博弈论研究获诺贝尔奖经济学奖的大师
Adam Smith was wrong!
第一节 博弈论形成与发展




1944年约翰· 冯· 诺依曼与奥斯卡· 摩根斯 坦合著的《博弈论与经济行为》 当代博弈论的“三大家”和“四君子”: “三大家”:约翰· 福布斯· 纳什、约 翰· C· 海萨尼,以及莱因哈德· 泽尔腾。三 人同时获得1994年的诺贝尔经济学奖。 “四君子”:罗伯特· J· 奥曼、肯· 宾摩尔、 戴维· 克瑞普斯,以及阿里尔· 鲁宾斯坦

次序(orders):各博弈方的决策有先后 之分,且一个博弈方要作不止一次的决 策选择,就出现了次序问题;所有其他 要素相同,但次序不同,博弈就可能会 不同。
他国
犯我
不犯我
我国 我国 ● 不犯人 犯人 犯人 ● 不犯人
(1,4)
(3 ,0 )
(0 ,2 )
(3 ,3 )
毛泽东的对外政治军事战略
斯坦克尔伯格寡头竞争模型

企业1为领头企业,他首先来选择产量 q1>0,企业2是尾随企业,在观测到企 业1的选择后,再来选择自己的产量 q2>0。



逆需求函数P(Q)=a-q1-q2 利润函数为:兀i=qi[P(Q)-c] 给定q1,企业2的最优选择是:max兀2=q2(aq1-q2-c) 利润最大化:q2=1/2(a-q1-c) 代入q2 ,得企业1的收益: max兀1=q1[a-q11/2(a-q1-c)-c] 企业1利润最大化:q1=1/2(a-c) 企业2利润最大化: q2=1/4(a-c).

博弈论公式大全

博弈论公式大全

博弈论公式大全全文共四篇示例,供读者参考第一篇示例:博弈论是一门研究各种博弈策略与结果的学科,它是数学、经济学和博弈理论的交叉学科。

在博弈论中,有一些常见的公式和概念,对于理解博弈过程和制定博弈策略十分重要。

本文将介绍一些常见的博弈论公式,帮助读者更深入地了解博弈论。

1. 最大最小定理最大最小定理是博弈论中最基础的定理之一,它表明在一个零和博弈中,每个博弈者都希望最大限度地提高自己的得分,同时也要对手的得分降到最低。

根据最大最小定理,博弈的解是博弈者选择的一个策略组合,使得每个博弈者都采取最佳策略,且不能通过改变自己的策略来改善自己的结果。

2. 纳什均衡纳什均衡是美国数学家约翰·纳什提出的一个概念,指的是博弈中每个参与者都已知对手的策略,且每个参与者都非常清楚地知道自己的最佳策略。

在纳什均衡下,每个参与者都做出了最优的选择,没有人可以通过改变自己的策略来改善自己的得分。

3. 迭代删除劣势策略迭代删除劣势策略是一种通过迭代过程来删除劣势策略的方法。

在一个有限次重复的博弈中,通过反复删除每位博弈者的劣势策略,最终可以找到一个稳定的策略组合。

这种方法可以帮助博弈者消除策略中的一些不必要的选择,从而简化博弈的分析过程。

4. 马甘定理马甘定理是博弈论中一个非常有用的定理,它用来判断一个零和博弈的解是否达到最优值。

根据马甘定理,一个零和博弈的最优解是通过分析每个参与者可能的最优策略来确定的。

马甘定理可以帮助博弈者找到一个最佳的策略组合,从而实现自己的最大利益。

5. 概率博弈概率博弈是博弈论中的一种特殊类型,它涉及到瞬时决策和不确定性因素。

在概率博弈中,每位博弈者都可以对自己的策略进行概率分配,从而增加博弈的不确定性。

对于概率博弈来说,博弈者需要考虑概率分配对于结果的影响,以便制定最佳的策略。

6. 必胜策略在一些博弈中,存在着一种称为必胜策略的策略,它可以确保博弈者取得胜利。

通过分析博弈的规则和对手的可能策略,博弈者可以找到一种必胜策略,并从而确保自己在博弈中取得胜利。

博弈论第7讲

博弈论第7讲
一些不完全信息的例子
与一个陌生人打交道 购买一幅艺术品 一个企业想进入某个市场 参与投标的各个厂商 消费者不知道企业产品的真正质量 用人单位不知道应聘者的真正水平和能力 二手车市场,买家不知道旧车的真正状况。。。。
一个简例:市场进入博弈
一个企业决定是否进入一个新的产业, 但不知道在位企业的成本函数,也不知 道一旦进入,在位者决定默许还是斗争。
海萨尼(Harsanyi)转换
我们将一个参与人所拥有的所有个人信 息称为他的类型(Types)
不完全信息意味着,至少有一个参与人 有多个类型(否则就成为完全信息博 弈)。
海萨尼(Harsanyi)转换
一般地,用θi表示参与人 的一个特定类 i 型,Θi表示参与人i的所有类型的集合, 即θi∈ Θi
应用举例1:不完全信息古诺 模型
E Z1=(1/2) q1(1- q1- q2L) + (1/2)q1(1-q1- q2H)
解最优化一阶条件,得企业1的反应函数为:
q1*=(1/2)(1-(1/2) q2L-(1/2) q2H)=(1/2)(1-E q2)
均衡意味着两个反应函数同时成立,解两个 反应函数,可得到贝叶斯均衡为 q1*=1/3; q2L*=11/24; q2H=5/24 作为练习,请与完全信息下的古诺模型产量 进行对比。
海萨尼通过引入虚拟的参与人——”自 然”(Nature),将不完全信息博弈转换 为完全但不完美信息的博弈,从而可用 完全信息博弈论进行处理,这就是著名 的“海萨尼转换”(Harsanyi Transformation)
海萨尼(Harsanyi)转换
图4.1就是市场进入博弈问题,经过海萨尼转换后,得 到的博弈树。 0 高 低 [P] [1-P] 进入者 不进入 进入 进入 不进入 (0, 300) (0, 400) 合作 斗争 斗争 合作 (40, 50) (-10, 0) (30, 80) (-10, 100) 图3-1 市场进入博弈

博弈论

博弈论

1. 混合扩充
g ( g ij ) mn 甲和乙的收益矩阵分别为: f ( f ij ) mn ~ ~ ~ 博弈G的混合扩充为博弈 G ( X , Ef ; Y , Eg) :
m n m n T Ef ( p , q ) p i q j f ij pi q j f ij p f q ~ i 1 j 1 i 1 j 1 ( p, q) S m n m n Eg( p, q) pi q j g ij pi q j g ij p g q T i 1 j 1 i 1 j 1 ~ 博弈G = (X, f ; Y, g)为常和博弈当且仅当G 的混合扩充 G 为常和博 ~ 弈。当G 是常和博弈时,G 与G 具有相同的收入常和。 ~ G的混合扩充 G 的古诺均衡(最优解)叫做G的混合均衡(混合最 优解)。换句话说,G的混合局势( p*,q*)叫做的混合均衡(混合最优 解),是指( p*,q*)满足如下条件: ~ ~ max{ Ef ( p, q*) : p X } Ef ( p*,q*) min{Ef ( p*,q) : qY }
Ef ( p*, q*) p 2(2q* 1) 0 p* 0.5 p* (0.5, 0.5) Ef ( p*, q*) q 2(2 p* 1) 0 q* 0.5 i.e. q* (0.5, 0.5)
博弈的标准形式与分类
博弈的基本要素:局中人 (玩家,players)、策略(strategies)、收 益(payoff)。局中人以策略定胜负,目标是收益最大化。 策略博弈(game of strategies):以策略定胜负的博弈。 博弈的标准形式(normal form of a game):G = (Xi, fi)n,其中 n 为局 中人人数,用 Xi 为局中人 i 的策略集合,S = X1 X2 Xn 为 G 的 局势集合,fi : S R 为局中人 i 的收益函数。 局势:当每个局中人 i 都确定了自己的策略 xiXi 时, (x1, x2,, xn) 就代表着博弈G的一种局势。 按照博弈的三大基本要素,可以对博弈进行如下分类。 按局中人数分:二人博弈、多人博弈; 按策略集合分:有限博弈、无限博弈 按收益函数分:常和(零和)博弈、非常和(非零和)博弈 按博弈性质分:非合作博弈、合作博弈 按行动次序分:同时移动博弈、先后移动博弈 (序贯博弈) 以上分类可以结合起来,从而产生更加仔细的分类。比如,二人 零和有限博弈(矩阵博弈)、多人非合作无限博弈等等。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
规则:提议者提出分配方案, 对手同意,就按此方案分配, 否则双方皆为零。
均衡:给对方略大于零。
公平观念对最后通牒博弈的影响:
在100元的最后通牒博弈中:
大多数提议人将分配给回应者40~50元之间; 分配给回应者50~70元之间的情况极少; 分配给回应者小于20元的方案被拒绝的概率很高(约40~
a+b<V;S=V-a-b是合作带来的剩余。
双人谈判局势
y c
谈判的最终结局需要 符合两种理性前提:
① 个体理性
b
P
d ② 联合理性
F
——是谈判达成理性
a
x 结局的基本条件
谈判的结局是哪一个帕累托最优点?
纳什(1950,1953)运用运用公理化方法得到 谈判的解(纳什解)应该满足4条公理:
① 有效性公理:谈判解应满足个体理性和联合理性的要求, 最后达成的协议应该是帕累托最优的,也就是说,不应该 有没有被分配的剩余。
安迪生产微芯片,他可以以900美元的价格卖给任何一 家计算机制造商。
比尔的软件包可以以100美元的价格进行零售。
两个人凑在一起,发现他们如果生产一个软硬件 的联合产品,可以卖到3,000美元。
他们之间如何分配这3000美元?
他们之间如何分配这3000美元?
如果两人直接面对面地谈判,最终的协议取决于 二人的倔强和耐心。
纳什解图示
y
谈判的纳什解实际上是协商集与以冲突
v
点(a,b)为原点的双曲线的切点。
Q b
P
(x-a)h(y-b)k=c3
(x-a)h(y-b)k=c2 (x-a)h(y-b)k=c1
y=f(x)
a
v
x
分配规则
x表示A得到的价值,y表示B得到的价值, 假定A和B分别从剩余价值S中得到h和k的 份额,则
50之间),而且结果相当稳定承受住了来自各方的质疑。
比如,有人认为,这一结果可能跟不同国家和地区的文化 传统、道德习俗有关,而来自欧洲、美洲、亚洲许多国家的研 究依然得到了大致相同的结果。
公平观念对独裁博弈的影响:
在100元的独裁博弈中:
分给对手0的极端情况仅占20%; 0~50元的提议占80%; 50元以上的几乎没有。
非合作博弈思路
谈判实际上是一个讨价还价的过 程,一个动态博弈;
用非合作博弈的方法更合理。
三、轮流出价的谈判
基本特征:两人,A和B,分1元钱;A先出价,B决 定接受还是拒绝:
如果接受,按照A提出的方案分配,谈判结束; 如果不接受,再由B提出方案;如此等等
A
B
A
B
A
提议
不同意/提议 不同意/提议 不同意/提议
简单的利益分割谈判
谈判问题等同于利益分割问题。 一种最简单的利益分割问题是,将一块蛋糕在2个人之间进 行分配,如果2个人有相同的谈判力,据点均衡是各一半(有 无穷多个NE)。 但如果附加上不同的信息,均衡可能不一样,姐弟分可能 3:7,或4:6。因此,在简单利益分割谈判中,双方都充分掌握 对手的信息,在谈判达成过程中有非常重要的作用。
两个同学谈判分100元,如果双方能达成协议, 根据协议分配:如果达不成协议,按下面的方案 分配:
0:0 0:10 10:30 10:40 20:20 30:60
两种思路
合作博弈思路:把讨价还价 看成合作博弈。各方共同寻找 和实施一个解决方案,可能找 一个中立的第三方来作为执行 的仲裁者。协议对双方具有约 束力,强调的是集体理性。








谈判结束
谈判结束
谈判结束
谈判结束
决定结果的关键因素
谁先出价? 谈判有无最后时限? 谁最有耐心(时间偏好)? 谈判的成本多大?
序贯讨价还价分有限回合和无限回合两种 情况。对于有限回合的情况不管多少次, 都可以用逆向归纳法来推导其均衡结果。
规范化谈判由两部分组成:
① 可行集——谈判的所有可能结局的集 合;
② 冲突点——双方不能达成一致,即不 能产生协议约定而出现的一种谈判结 局;
设想两个人,A和B,他们之间要就总价值 等于V的分配问题讨价还价;
如果他们之间能达成协议,V按照协议规定分配。 如果不能达成协议,A得到a, B得到b。
(a, b) 被称‘冲突点’或非合作状态, 是不能达成 协议时的最好选择。
这说明与最后通牒博弈相比,独裁博弈中由于提 议者不用担心对手的回绝,他们倾向分配给回应者更 少的份额,但他们并不是极端自利地一点也不给对 手,——尽管他们可以这么做。
谈判的最终目的在于促成合作的达成:
把谈判看作是一个经营合 作的事业,而不是当成一场 争夺利益的斗争。
课堂试验——谈判能力对结果的影响
max (x-a)h(y-b)k ——纳什福利函数
s.t. x+y=V(x,y) ——y=f ( x ) 就
是该讨价还价问
h+k=1
题的效率边界。
纳什解图示
N
b
P
a
(1)协议一定
在边界上;
W3 (2)效用度量
单位的改变不
W2 W1
会影响最后的 协议;
(3)去掉没有
被选择的部分
也不会影响最
后的协议。
非合作博弈思路: 每个参与人独立决 策,协议是一个纳 什均衡,没有约束 力,强调的是个人 理性;
注意:这里‘合作’与‘非合作’指的是‘联合 决策’(joint action) 和‘独立决策’ (separate action).
二、讨价还价问题的解(合作博弈思路)
考虑两家硅谷的企业,安迪和比尔
这一不利于双方的结果,以及双方都要避 免它的愿望,为威胁(明显的或隐含的)创 造了可能,这就使得讨价还价成为一个策略 问题。
抛பைடு நூலகம்分类,直面问题
简单的利益分割谈判;
谈判力相同——聚点均衡(平均分配);
谈判力不同—— 独裁谈判; 最后通牒谈判
大多数提议人将分给回应者40~ 50元之间; 分给回应者50~70元之间的情况 极少; 分给回应者小于20元的方案被拒 绝的概率很高(约40~50%)
纳什解:如果两个人是对称的,(即可分配价值以过(a,b) 点45°线对称)。h=k=1/2。
这样一个解如何及为何产生
它可能来自一个我们尚未详述的谈判过程。 那么h和k代表了双方的相对讨价还价能力。 纳什将谈判建成一个合作博弈的模型,双方可以联
合行动,不要求是一个独立行动的均衡结果。 该理论将合作博弈的结果按照某种看起来合理的一
非对称谈判能力与公平观念
公平分配无疑是谈判中达成合作的重要保障。因为面对一个 具有公平观念的谈判对手,不公平的分配常常带来他的抗拒行 为——即使他处于谈判的劣势。
非对称谈判力的典型情况。
独裁博弈
规则:提议者具有绝对的谈 判优势,回应者只能无条件 接受。
均衡:提议者全部保留,对 手为零。
最后通牒博弈
② 对称性公理:双方势均力敌
③ 线性不变性公理: 如果对谈判的效用函数做保序性线性变 换,即,au+b,其中a>0,则谈判解不变。
④ 无关选择公理:如果原来可行的选择没有被选择,去掉这 些‘无关’选择并不会影响讨价还价的结果。
对称性谈判局势
y
b 45o
e P F
谈判唯一的理性结局
a
x
纳什解——谈判唯一的理性解
可以将第一阶段的模型视为非合作博弈,每个人独 立地选择最优的a或b。
图示
yb k
y
xa h
N
P
N’
b P3
P1 P2
y b k x a h
x+y=v x
砝码的相对性
决定结果的是相对砝码b-a;
如果A的砝码a不变,B增加自己的砝码b就 可以使得自己在谈判中占优势。
非合作博弈意味着每一方独立增加砝码可 能是‘囚徒困境’博弈:如果砝码同比例增 加,谈判结果不会改变。
般原理或性质来定义。 纳什将谈判建立成一个合作博弈的模型,双方可以
联合行动,不要求是一个独立行动的均衡结果。
改变谈判砝码
谈判砝码对达成什么样的分配协议具有决定性的意 义。如果双方预期分配是纳什解,他们可以通过在 谈判前的阶段以非合作博弈的方式改变(a,b)。从而 改变在第二阶段谈判时的相对优势。
x=a+h(v-a-b) y=b+k(v-a-b)
x-a=h(v-a-b) y-b=k(v-a-b)
将这些表达式称为纳什公式。
yb k
xa h
图示
y
v
yb k
xa h
Q
b
P
x+y=v
a
v
x
在我们的例子中
效率边界为,x+y=v, or y=v-x. 解最大化问题得到: (x-a)/h=(y-b)/k,即
他们之间如何分配这3000元?
① 该合作博弈的表述:B=(S,d;u1,u2)
参与人——画家、拍卖商 S——局中人共有的策略集(利润的分配方案) d——谈判破裂的结果,d∈S; ui——定义在S上的局中人i的效用函数,满足
对任意的s∈S,u1(s)≥ u1(d), u2(s)≥ u2(d); 至少存在一个s∈S,u1(s)> u1(d), u2(s)> u2(d);
S 500
0
1000
3000 s1
③ 讨价还价问题的K-S解法
两个参与人的效用函数分别是他们从合作所带来的增值中所 获得的分额,如何进行分配?
s2
3000
s1 1000 s2 500
1000 500
s1
2s2
1000 500 0
S S
K-S线
1000 2000 3000 s1
相关文档
最新文档