博弈论ch5

合集下载

博弈论5

博弈论5

流浪汉 寻找工作 政府 救济 不救济 3,2 1,1 游荡 -1,3 0,0
2
而另一些博弈却有多于一个没有哪个博弈方愿意单独 改变策略的纳什均衡策略组合,如夫妻之争博弈。 改变策略的纳什均衡策略组合,如夫妻之争博弈。
丈 夫 妻子 时装表演 足球 时装表演 2,1 0,0 足球 0,0 1,3
♦ 这两类博弈如果只进行一次,实际结果如何确实取决于机会和 这两类博弈如果只进行一次,
10
博弈方2 博弈方 博弈方1 博弈方 A B C 2,3 3,1 D 5,2 1,5
设博弈方1选 的概率为 的概率为p 的概率为p 博弈方2选 的概 设博弈方 选A的概率为 A,选B的概率为 B,博弈方 选C的概 的概率为 率为p 的概率为p 根据上述第二个原则,博弈方1选 率为 C,选D的概率为 D。根据上述第二个原则,博弈方 选A 的概率为 的概率p 一定要使博弈方2选 的期望得益和选 的期望得益和选D的期 和 B的概率 A和pB一定要使博弈方 选 C的期望得益和选 的期 的概率 望得益相等,即 望得益相等 即: pA×3+pB×1=pA×2+pB×5 + 简 化 后 可 得 pA=4pB 。 又 因 为 pA 十 pB=1 , 因 此 pA=0.8 , pB=0.2,这就是博弈方 应该选择的混合策略。 同理, 博弈方 应该选择的混合策略。 ,这就是博弈方1应该选择的混合策略 同理, 2选择 和D的概率 c和pD也应使博弈方 选择 的期望得益和选 选择C和 的概率 的概率p 也应使博弈方1选择 选择A的期望得益和选 选择 的期望得益相等, 择B的期望得益相等,即 的期望得益相等 pc×2+pD×5=pc×3+pD×1 + 简化后得4p 因为p 简化后得 D=pC。因为 D+pC =1,因此 C=0.8,pD=0.2, ,因此p , , 11 这是博弈方2的混合策略 的混合策略。 这是博弈方 的混合策略。

博弈论第五章同时博弈与序贯博弈

博弈论第五章同时博弈与序贯博弈

乙 借
甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
注意
1、子博弈不能从第一个阶段开始,因为原来的博 弈(母博弈)本身不能称为子博弈,即子博弈集 合是一个真子集合。
2、子博弈不能分割原来博弈(母博弈)的信息集。
D

B

A

C

E

F●

G

H


D、E、F、 G点以后

◆ 都不能构
大投入
联想 小投入
3,
大投入
4,4
方正
小投入
4,3
5,
该博弈的结果为:两个公司都在第一个阶段采取小投入(帕累 优势原则),在第二个阶段采取低价格。但纳什均衡有16个 (过程略),因为很多策略导致同一个结果。
该博弈的展开型表述见P173页 注意: 1、非单点信息集代表什么? 2、为什么两个决策点会用虚线联系起来?
信息集
案例:情侣博弈
丈夫
足球
芭蕾

足球
子 芭蕾
2, 1 0, 0
0, 0 1, 2
夫妻之争
信息集
根据同时博弈的定义,每个局中人决策时不知道别 人的策略,即每个局中人在做自己的行动选择时, 并不知道自己处在哪个决策节点上。例如妻子在选 芭蕾时,并不知道丈夫选的是芭蕾还是足球。
局中人不能是别人对方“已经”做出的行动或决策, 就等于同时行动或决策。

◆ 该虚线罩住的不是信
息集。
◆ ◆
其必须满足:同集同
注,即从各个决策点
◆ 出发的策略选择数目
相同,名称也相同。

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳博弈论是研究决策者之间相互作出决策时,通过考虑对方的行动和可能的结果来进行决策的一门学科。

它主要关注对策略的选择与分析,以及对方可能的反应。

下面我们来对博弈论的知识点进行总结归纳。

1.普通博弈和扩展博弈:博弈论分为两类,即普通博弈和扩展博弈。

普通博弈是指参与者在同一时间同时做出决策的博弈,扩展博弈是指参与者在不同的时间节点上做出决策的博弈。

2.博弈的组成要素:博弈论研究的关键要素包括博弈参与者、参与者的策略、参与者的支付、参与者的效用等。

博弈论的目标是通过合理的策略选择来实现最优的支付和效用。

3.纳什均衡:纳什均衡是博弈论中一个重要的概念,指的是当每个参与者都选择了最优的策略后,没有人会改变自己的策略来获得更好的支付。

纳什均衡是博弈的稳定状态。

4.博弈的分类:根据参与者的合作与否,博弈可以分为合作博弈和非合作博弈。

合作博弈中,参与者可以通过合作与其他参与者达成协议,而非合作博弈中,参与者彼此之间没有合作关系。

5.零和博弈和非零和博弈:零和博弈是指所有参与者的支付之和为零的博弈,即一方获利就意味着其他方会损失相应的支付。

非零和博弈是指所有参与者的支付之和不为零的博弈,即所有参与者都有可能获得一定的支付。

6.博弈的解析方法:解析方法是通过分析博弈的特性和参与者的策略来研究博弈的方法。

解析方法包括主要包括支配策略法、混合策略法、最佳反应函数等。

7.博弈的策略选择:博弈论研究的核心问题之一是参与者在博弈中如何选择最优的策略。

策略选择可以通过分析博弈的收益矩阵和参与者的目标来实现。

8.博弈的应用领域:博弈论的应用十分广泛,包括经济学、政治学、生物学、社会学等多个领域。

在经济学中,博弈论被用来研究市场竞争、价格形成等问题,在政治学中,博弈论被用来分析政治决策与合作等问题。

9.孤立型博弈和重复博弈:孤立型博弈是指只进行一轮博弈的情况,参与者只能根据当下的情况来做出决策。

重复博弈是指进行多轮博弈的情况,参与者可以根据之前的决策和结果来进行策略的调整。

博弈论PPT资料整理

博弈论PPT资料整理

博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。

1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。

2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。

博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。

于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。

中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。

博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。

生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。

而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。

特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。

由此可见,博弈论是适合所有人的科学。

在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。

博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。

可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。

从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损如果势均力敌,则应考虑到对手的反击手段。

博弈论Chapter 05

博弈论Chapter 05

6
Continued
This game is readily illustrated in a diagram.
7
Continued
Thus the set of all actions available to the player who moves
after h is
For example, for the game in last slide, the histories are∅, In,
Out, (In, Acquiesce), and (In, Fight). The set of actions available to the player who moves at the start of the game, namely the challenger, is A(∅) = {In, Out}, and the set of actions available to the player who moves after the history In, namely the incumbent, is A(In) = {Acquiesce, Fight}.
5
Example
EXAMPLE 153.2 (Entry game) suppose that the best outcome for
the challenger is that it enters and the incumbent acquiesces, and the worst outcome is that it enters and the incumbent fights, whereas the best outcome for the incumbent is that the challenger stays out, and the worst outcome is that it enters and there is a fight. Then the situation may be modeled as the following extensive game with perfect information.

博弈论5 有限理性和进化博弈共75页文档

博弈论5 有限理性和进化博弈共75页文档

谢谢
11、越是没有本领的就越加自命不凡。——邓拓 12、越是无能的人,越喜欢挑剔别人的错儿。——爱尔兰 13、知人者智,自知者明。胜人者有力,自胜者强。——老子 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。——歌德 15、最具挑战性的挑战莫过于提升自我。——迈克尔·F·斯特利
33、如果惧怕前面跌宕的山岩,生命 就永远 只能是 死水一 潭。 34、当你眼泪忍不住要流出来的时候 ,睁大 眼睛, 千万别 眨眼!你会看到 世界由 清晰变 模糊的 全过程 ,心会 在你泪 水落下 的那一 刻变得 清澈明 晰。盐 。注定 要融化 的,也 许是用 眼泪的 方式。
35、不要以为自己成功一次就可以了 ,也不 要以为 过去的 光荣可
31、别人笑我太疯癫,我笑他人看不 穿。(名 言网) 32、我不想听失意者的哭泣,抱怨者 的牢骚 ,这是 羊群中 的瘟疫 ,我不 能被它 传染。 我要尽 量避免 绝望, 辛勤耕 耘,忍 受苦楚 。我一 试再试 ,争取 每天的 成功, 避免以 失败收 常在别 人停滞 不前时 ,我继 续拼搏 。

Ch5 对抗搜索

Ch5 对抗搜索

博弈:对抗性搜索主讲人:刘宏志liuhz@博弈•多Agent竞争(对抗)的环境•博弈论是经济学的一个分支•博弈问题的主要元素:S0: 初始状态Player(s): 定义在状态s下该谁行动Action(s): 定义在状态s下的合法移动集合Result(s, a): 转移模型,定义在状态s下行动a的结果Terminal-Test(s): 终止测试Utility(s, p): 效用函数,定义游戏者p在终止状态s下的效用有完整信息的、确定的、轮流行动的、两个游戏者的零和游戏Two Players: MAX & MIN极小极大决策•极小极大值:MINIMAX(s)对应节点状态的效用值假设:两个游戏者始终按照最优策略行棋•最优决策:选择能够导致最高极小极大值的行动Utility of MAX极小极大值决策算法•深度优先探索•时间复杂度: O(b m)m:树的最大深度b:在每个节点的合法行动数•空间复杂度: O(bm)α-β剪枝•基本思想:剪掉部分不影响最终决策的分枝,以降低搜索的复杂度α剪枝:针对MAX节点α值:•到目前为止路径上发现的MAX的最佳(极大值)选择•例:左图根节点α=15剪枝:•当某节点的值比目前α值更小时,裁剪此节点剩余分枝α-β剪枝•基本思想:剪掉部分不影响最终决策的分枝,以降低搜索的复杂度β剪枝:针对MIN节点β值:•到目前为止路径上发现的MIN的最佳(极小值)选择•例:左图节点1 β =10剪枝:•当某节点的值比目前β值更大时,裁剪此节点剩余分枝α-β剪枝•基本思想:剪掉部分不影响最终决策的分枝,以降低搜索的复杂度•α值:到目前为止路径上发现的MAX的最佳(极大值)选择•β值:到目前为止路径上发现的MIN的最佳(极小值)选择•实现:搜索过程中不断更新α和β值当某节点的值分别比目前MAX的α值或者MIN的β值更差时,裁剪此节点剩下的分枝α-β剪枝:实例α-β剪枝:实例α-β剪枝:实例α-β剪枝:实例α-β剪枝:实例α-β剪枝:实例α-β剪枝:实例Q & A。

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是研究决策者在互相影响的情况下做出最佳决策的数学模型和方法。

在博弈论中,决策者被称为玩家,他们的决策会受到其他玩家的影响。

以下是博弈论的一些重要知识点的总结:1.资料和约定-玩家:博弈论中的决策者。

-策略:玩家可以采取的行动。

-支付:玩家根据博弈结果获得的效用或价值。

-最优策略:在给定博弈条件下,可以使玩家获得最大效用的策略。

-纯策略和混合策略:纯策略是指玩家在每次博弈中都采取相同的行动;混合策略是指玩家以一定概率采取不同的行动。

2.标准形博弈-扩展形式:博弈者按照时间次序做出决策,每个决策节点有多个玩家可以选择的动作。

-纳什均衡:在标准形博弈中,如果所有玩家都不愿意单方面改变他们的策略,则该策略组合是纳什均衡。

-最优反应函数:针对每个玩家的策略组合,最优反应函数给出了该玩家的最佳策略。

-支配策略:一个策略在任何情况下都能够给出玩家更好的结果,那么我们可以说这个策略是支配的。

3.矩阵博弈-矩阵:博弈论中描述玩家策略和效用的表格。

-矩阵博弈的解:通过找到纳什均衡,我们可以得出矩阵博弈的解决方案。

-互动博弈:双方玩家的效用都取决于对方的策略选择。

4.博弈树-博弈树:根据博弈的时间顺序和玩家之间的相互影响,构建的树形结构。

-极小极大算法:用于确定博弈树上的最佳策略。

- alpha-beta剪枝:通过剪枝,减少博弈树的节点数量,从而提高效率。

5.进化博弈论-重复博弈:博弈过程被连续重复进行,玩家可以根据之前的结果来调整策略。

-演化稳定策略:一个策略集合中的策略,在当前环境下被所有玩家采纳并且难以被其他策略取代。

6.合作博弈论-合作博弈:玩家可以自由选择与其他玩家联合合作,并共享所获得的效用。

-特征函数:描述合作博弈的效用分配。

-核心:合作博弈中所有合法的效用分配的集合。

- Shafer值:一种用于将效用分配给个体的方法,使得每个个体的效用都能够得到公平分配。

博弈论是多学科交叉的研究领域,应用广泛,涉及经济、管理、政治等多个领域。

博弈论-哈佛大学-第五节

博弈论-哈佛大学-第五节

Acquiesce Fight
Incumbent
1
In
ø
Out
Spend
Save
Fight 2
1
Acquiesce
Spend 1 Save
Challenger
ø
In
Out
Incumbent
Acquiesce
Fight
Challenger Hit Back
Back out
Extensive Games w/ Perfect Info
(1, 2)
• In a strategic game, NE rationale is that in steady state, each player’s experience playing the game leads her belief about the other players’ actions to be correct.
– The strategic setting – Two-round, 3 candidate closed rule game – Two-round, n-candidate closed rule game – Infinite-round, 3 candidate closed rule game – Open-rule games – Endogenizing the rules
• Terminal History: (In, Acquiesce), (In, Fight), and (Out)
• Player Function: P(ø) = challenger , P(In) = incumbent
• Preferences for the Players:

博弈论第五章

博弈论第五章

• 假定连锁店有高成本、低成本两种情况,就单期博弈看,
面对新厂商进入,高成本厂商最佳反应为容忍,低成本 厂商最佳反应为斗争,那么高成本厂商在博弈的前期阶 段选择斗争,仍是可信的威胁。
有限次重复博弈的民间定理
厂商2 厂商 A 厂 A 商 1 B 3,3 4,1 B 1,4 0,0
• 个体理性得益 个体理性得益:不管其
无名氏定理举例
支付 甲 利己 利他

利己
利他
1, 1 0, 4
4, 0 3, 3
• 以“利己、利他”为例,其博弈中唯一的纳什
均衡为(利己,利己),两个局中人在此均衡 下所得支付都是1;所以,只要无穷重复博弈 中局中人可行的平均单期支付不小于1,这样 的支付就是一个可能的均衡支付。
• 无穷重复博弈能够导致帕累托改进。
重复博弈的基本特征
阶段博弈之间没有“物质上”的联系, 阶段博弈之间没有“物质上”的联系,即 前一阶段的博弈不改变后一阶段博弈的结 构; 所有博弈方都观测到博弈过去的历史; 所有博弈方都观测到博弈过去的历史; 博弈方的总支付是所有阶段博弈支付的贴 现值之和或加权平均值。 现值之和或加权平均值。
有限次重复博弈: 有限次重复博弈:连锁店悖论
进入者
在位者 ห้องสมุดไป่ตู้许 斗争
不进入 进入 在位者
策略式 进入者 进入 40,50
(0,300)
默许 斗争
-10,0 0,300
不进入
0,300
(40,50)
(-10,0)
Nash均衡为(进入,默许) Nash均衡为(进入,默许)和 均衡为 不进入,斗争) (不进入,斗争)但后者不是 子博弈完美Nash均衡。 均衡。 子博弈完美 均衡

博弈论公式大全

博弈论公式大全

博弈论公式大全全文共四篇示例,供读者参考第一篇示例:博弈论是一门研究各种博弈策略与结果的学科,它是数学、经济学和博弈理论的交叉学科。

在博弈论中,有一些常见的公式和概念,对于理解博弈过程和制定博弈策略十分重要。

本文将介绍一些常见的博弈论公式,帮助读者更深入地了解博弈论。

1. 最大最小定理最大最小定理是博弈论中最基础的定理之一,它表明在一个零和博弈中,每个博弈者都希望最大限度地提高自己的得分,同时也要对手的得分降到最低。

根据最大最小定理,博弈的解是博弈者选择的一个策略组合,使得每个博弈者都采取最佳策略,且不能通过改变自己的策略来改善自己的结果。

2. 纳什均衡纳什均衡是美国数学家约翰·纳什提出的一个概念,指的是博弈中每个参与者都已知对手的策略,且每个参与者都非常清楚地知道自己的最佳策略。

在纳什均衡下,每个参与者都做出了最优的选择,没有人可以通过改变自己的策略来改善自己的得分。

3. 迭代删除劣势策略迭代删除劣势策略是一种通过迭代过程来删除劣势策略的方法。

在一个有限次重复的博弈中,通过反复删除每位博弈者的劣势策略,最终可以找到一个稳定的策略组合。

这种方法可以帮助博弈者消除策略中的一些不必要的选择,从而简化博弈的分析过程。

4. 马甘定理马甘定理是博弈论中一个非常有用的定理,它用来判断一个零和博弈的解是否达到最优值。

根据马甘定理,一个零和博弈的最优解是通过分析每个参与者可能的最优策略来确定的。

马甘定理可以帮助博弈者找到一个最佳的策略组合,从而实现自己的最大利益。

5. 概率博弈概率博弈是博弈论中的一种特殊类型,它涉及到瞬时决策和不确定性因素。

在概率博弈中,每位博弈者都可以对自己的策略进行概率分配,从而增加博弈的不确定性。

对于概率博弈来说,博弈者需要考虑概率分配对于结果的影响,以便制定最佳的策略。

6. 必胜策略在一些博弈中,存在着一种称为必胜策略的策略,它可以确保博弈者取得胜利。

通过分析博弈的规则和对手的可能策略,博弈者可以找到一种必胜策略,并从而确保自己在博弈中取得胜利。

博弈论

博弈论

1. 混合扩充
g ( g ij ) mn 甲和乙的收益矩阵分别为: f ( f ij ) mn ~ ~ ~ 博弈G的混合扩充为博弈 G ( X , Ef ; Y , Eg) :
m n m n T Ef ( p , q ) p i q j f ij pi q j f ij p f q ~ i 1 j 1 i 1 j 1 ( p, q) S m n m n Eg( p, q) pi q j g ij pi q j g ij p g q T i 1 j 1 i 1 j 1 ~ 博弈G = (X, f ; Y, g)为常和博弈当且仅当G 的混合扩充 G 为常和博 ~ 弈。当G 是常和博弈时,G 与G 具有相同的收入常和。 ~ G的混合扩充 G 的古诺均衡(最优解)叫做G的混合均衡(混合最 优解)。换句话说,G的混合局势( p*,q*)叫做的混合均衡(混合最优 解),是指( p*,q*)满足如下条件: ~ ~ max{ Ef ( p, q*) : p X } Ef ( p*,q*) min{Ef ( p*,q) : qY }
Ef ( p*, q*) p 2(2q* 1) 0 p* 0.5 p* (0.5, 0.5) Ef ( p*, q*) q 2(2 p* 1) 0 q* 0.5 i.e. q* (0.5, 0.5)
博弈的标准形式与分类
博弈的基本要素:局中人 (玩家,players)、策略(strategies)、收 益(payoff)。局中人以策略定胜负,目标是收益最大化。 策略博弈(game of strategies):以策略定胜负的博弈。 博弈的标准形式(normal form of a game):G = (Xi, fi)n,其中 n 为局 中人人数,用 Xi 为局中人 i 的策略集合,S = X1 X2 Xn 为 G 的 局势集合,fi : S R 为局中人 i 的收益函数。 局势:当每个局中人 i 都确定了自己的策略 xiXi 时, (x1, x2,, xn) 就代表着博弈G的一种局势。 按照博弈的三大基本要素,可以对博弈进行如下分类。 按局中人数分:二人博弈、多人博弈; 按策略集合分:有限博弈、无限博弈 按收益函数分:常和(零和)博弈、非常和(非零和)博弈 按博弈性质分:非合作博弈、合作博弈 按行动次序分:同时移动博弈、先后移动博弈 (序贯博弈) 以上分类可以结合起来,从而产生更加仔细的分类。比如,二人 零和有限博弈(矩阵博弈)、多人非合作无限博弈等等。

博弈论的五条结论

博弈论的五条结论

博弈论的五条结论
博弈论是研究决策制定和行为策略的数学分析工具。

在博弈论中,有五个重要的结论:
1.最小最大原则:在零和博弈中,每个参与者都会采取最优策略,以最大程度地最小化对手的收益。

2.纳什均衡:纳什均衡是指在一个博弈中,每个参与者选择自己的策略后,无法通过单方面改变策略来改善自己的收益。

换句话说,没有参与者能够通过单独行动获得更好的结果。

3.最优反应函数:最优反应函数是指在多人博弈中,每个参与者根据其他参与者的策略选择自己的最优策略。

最优反应函数反映了每个参与者对其他参与者行为的反应。

4.支配策略:支配策略是指在博弈中存在一种策略,无论其他参与者选择什么策略,该策略都能保证自己获得更高的收益。

因此,支配策略是明显优于其他策略的选择。

5.合作困境:合作困境是指在博弈中,每个参与者选择自己的最优策略可能会导致整体收益较低,而如果大家能够合作,整体收益会更高。

然而,由于缺乏合作保证或个人利益冲突,参与者可能更倾向于选择非合作策略,导致整体收益减少。

这些结论是博弈论中的重要概念,对于理解和分析各种博弈情境具有重要意义。

博弈论博弈论

博弈论博弈论

博弈论博弈论?
答:博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

在博弈论中,有几个重要的术语和概念:
1.参与人:指的是博弈中选择行动以最大化自己利益的决策主体(可能是个人或团体)。

2.行动:是参与人在博弈的某个时点的决策变量。

3.信息:是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。

4.策略:是参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。

5.收益:在博弈论中,收益或者支付是指在特定的策略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用水平。

6.均衡:是所有参与人的最优策略组合,通常记为s*=(s1*,…,si*,…,sn*)。

此外,博弈论的基本假设包括认知理性和行为理性。

认知理性要求人是自我利益的判断者,具有偏好的完备性和传递性;行为理性则要求人是自我利益的追求者,追求利益最大化。

博弈论的应用非常广泛,不仅应用于经济学的标准分析工具之一,还在金融学、证券学、生物学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有重要的应用。

博弈论5

博弈论5

子博弈完美纳什均衡
• 1965年塞尔顿(Selten)给出了子博弈完美纳什 均衡的概念。它需要包含两点:1.是纳什均衡.2. 不包含不可信的承诺和威胁。 • 定义:若动态博弈中各博弈方的策略在动态博弈 本身和所有子博弈中都构成纳什均衡,则该策略 组合称为子博弈完美纳什均衡。 • 用这个概念来看前面的借钱投资问题。在前面的 那个问题中,乙选借(不分就打)、甲选分是子 博弈完美纳什均衡。而当乙打官司成本提高后, 打的威胁不可信时,在从甲开始的子博弈中不是 纳什均衡。因此,(借,分)不是稳定的。 • 就是说,在静态博弈中要用纳什均衡,在动态博 弈中要用子博弈完美纳什均衡概念。二者是同等 2013-5-12 22 重要的。
2013-5-12 15
子博弈和逆推归纳法

为了把动态博弈问题简化,或分析的方便, 我们把动态博弈的某一阶段开始的后续所有阶段 构成的博弈称为子博弈。比如,在借钱投资问题 中,乙选择借以后,从甲开始决策起的博弈,就 称为原博弈的子博弈。当然,当甲选择不分时, 乙又开始决策,从这时起的博弈既是原博弈的子 博弈,也是从甲开始的子博弈的子博弈。 • 原博弈并不作为特殊的子博弈。也并不是每一个 博弈方开始决策时都能形成子博弈。
2013-5-12 19
• 再看法律保障不足时的借钱投资问题:
乙 借 不借
甲 不分 分 乙
(1,0)
(2,2)
打 不打
(-1,0)
2013-5-12
(0,4)
20
分析
• 只是稍微改动,结果却大不相同。甲不分时, 乙的打官司威胁变为是不可信的。因此,乙第 一阶段应该选不借,博弈结束。但是,用静态 博弈中纳什均衡概念对照,发现(借(不分则 打),分)仍是纳什均衡。因为谁单独离开这 个组合将不会增加收益。这两种分析的结论是 矛盾的。原因在于,实现(借(不分则打), 分)的纳什均衡策略包含一个不可信的威胁— 即乙在第三阶段选打。就是说,一般的纳什均 衡概念在分析动态博弈时,不能排除不可信的 承诺和威胁。纳什均衡概念不能完全照搬。21 2013-5-12

博弈论概述

博弈论概述

博弈论概述博弈论是研究决策制定者之间相互作用的一门学科。

在博弈论中,决策者被称为"玩家",他们的决策会影响其他玩家的利益。

博弈论的目标是研究玩家在不同情境下的最佳决策策略,以及这些策略对整体结果的影响。

以下是博弈论的一些基本概念和要点:1.玩家(Players):博弈中的参与者被称为玩家。

这可以是个体、公司、国家等。

2.策略(Strategies):玩家在博弈中采取的行动或决策被称为策略。

每个玩家可以有多种可能的策略。

3.支付(Payoffs):博弈的结果被称为支付,它反映了每个玩家在博弈结束时的效用或利润。

4.博弈矩阵(Game Matrix):通过博弈矩阵,可以清晰地表示玩家的策略选择和相应的支付。

博弈矩阵通常用于描述二人零和博弈。

5.纳什均衡(Nash Equilibrium):纳什均衡是指在博弈中,每个玩家都选择了最优的策略,给定其他玩家的选择,没有一个玩家有动机单方面改变自己的策略。

6.博弈形式(Normal Form)和博弈扩展形式(Extensive Form):博弈形式描述了一次性的、同步进行的博弈,而博弈扩展形式描述了具有序列和时间概念的博弈。

7.博弈的分类:博弈可以分为合作博弈和非合作博弈、零和博弈和非零和博弈、完全信息博弈和不完全信息博弈等。

8.博弈的应用领域:博弈论在经济学、政治学、社会学、生物学、计算机科学等多个领域都有广泛应用。

博弈论提供了一种分析人们在决策过程中相互作用的方式,它的应用范围涵盖了众多领域。

在博弈中,每个玩家都追求自己的最大利益,因此博弈论可以帮助人们更好地理解和预测复杂的决策场景。

博弈论ch5

博弈论ch5
重复剔除劣战略的方 法得到; 但如何实施劣战略的 消除,对于最终会留 下哪个均衡至关重要
经济学上把结果依赖于路径的现象叫——路径依赖
路径依赖就是人们陷入一种情况而发现从此难以 脱身;
如果博弈参与人很多,达成协议的成本很高,最
初的非帕累托均衡可能被锁定,导致路径依赖:
森林探险
找工作
C2 3, 10 2, 11 1, 8
C1 R1 4, 12 R2 0, 12 R3 3, 12
C2 3, 10 2, 11 1, 8
C3 2, 12 1, 11 2, 13
C3 2, 12 1, 11 2, 13
这个博弈有三个纳什 均衡:
(4, 12) (2, 12) (2, 13) 这些纳什均衡可以用
婚姻
改革 新产品
键盘的预言 VHS 与Betamax MAC与IBM
经济学上把结果依赖于路径的现象叫——路径依赖
如果博弈参与人很多,达成协议的成本很高,最初的非帕 累托均衡可能被锁定,导致路径依赖:
每个人多偏好于新产品(或标准) ,如果其他人都选择新 产品的话;但每个人都预期其他人不会选择新产品,所以 每个人的最优选择不是转向新产品,结果是整个社会被锁 定在现有的产品(标准)(非帕累托最优)
CH5 多重均衡与制度和文化
多重纳什均衡 如何协调 聚点均衡 帕累托最优均衡 风险优势标准 相关均衡 锁定效应与路径依赖 文化的冲突与协调
纳什均衡的多重性
许多博弈往往有不止一 个纳什均衡
— 麦琪的礼物 — 懦夫博弈
市场进入博弈
一个垄断者已在市场上,另一个企业虎视眈眈想进入
靠右行 -1,-1 B 1,1
约会博弈

博弈论基础知识汇总

博弈论基础知识汇总

博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。

一种是“进化博弈论方法”。

它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。

另一种新方法是“重复博弈论方法”,它运用更精细的均衡概念,如“子博弈精炼均衡”来分析历史与现实中的制度选择与变迁过程。

基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。

其中局中人、策略和收益是最基本要素。

局中人、行动和结果被统称为博弈规则。

博弈主要可以分为合作博弈和非合作博弈。

合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈、从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。

完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

博弈论看法博弈论的基本假设:参与人追求利润最大化。

博弈论导论课程设计

博弈论导论课程设计

博弈论导论课程设计简介博弈论是研究人类决策行为的一门学科。

博弈论是一个分析决策问题的方法工具,它最初用于研究两个参与者之间的互动,后来发展到多方面和对称的游戏。

本课程设计将围绕博弈论的概念、理论和应用展开,让学生更深入地了解博弈论的相关知识和基本方法。

课程目标本课程的主要目标是:•掌握博弈论的基本概念和原理•理解博弈论的应用场景以及实际意义•了解博弈论在社会、经济、科技等领域的应用•掌握博弈论的数学方法和分析技巧课程内容本课程分为以下几个部分:第一部分:博弈论概述1.1 什么是博弈论?1.2 博弈论的历史和发展1.3 博弈论的应用场景第二部分:基础概念和理论2.1 博弈论的基本概念2.2 博弈的标准形式和扩展形式2.3 纳什均衡和博弈的解第三部分:博弈论的应用3.1 博弈论在社会科学中的应用3.2 博弈论在经济学中的应用3.3 博弈论在计算机科学中的应用第四部分:博弈论的分析方法4.1 博弈论的数学方法4.2 博弈论的实用分析技巧课程流程时间内容第一周什么是博弈论?第二周博弈论的基本概念第三周博弈的标准形式和扩展形式第四周纳什均衡和博弈的解第五周博弈论在社会科学中的应用第六周博弈论在经济学中的应用时间内容第七周博弈论在计算机科学中的应用第八周博弈论的数学方法第九周博弈论的实用分析技巧第十周课程总结与答疑总结本课程设计的目的是让学生了解博弈论的基本概念、理论和应用,掌握博弈论的数学方法和分析技巧,从而更加深入地理解决策过程的本质和规律。

通过本课程的学习,学生将会在这一领域获得进一步的知识和技能,为未来的研究和应用提供更好的基础。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

C2 3, 10 2, 11 1, 8
C1 R1 4, 12 R2 0, 12 R3 3, 12
C2 3, 10 2, 11 1, 8
C3 2, 12 1, 11 2, 13
C3 2, 12 1, 11 2, 13
这个博弈有三个纳什 均衡:
(4, 12) (2, 12) (2, 13) 这些纳什均衡可以用
— 文化与制度 — 行业组织 — Cheap talking 帕累托最优均衡:可以通过协商选择一个 纳什均衡:
聚点均衡 (Schelling(1960) )
谢林指出: 在现实生活中,参与人可能使用某些被博弈模
型抽象掉的信息来达到一个“聚点”均衡。这些 信息可能与社会文化习惯、参与人过去博弈的历 史有关。比如
文化的冲突与协调
为什么欧洲大陆的交通规则收敛于一致?
英国将如何办?
文化冲突,无论是组织和组织之间的还是国家与 国家之间的,大部分不过是游戏规则----社会规范 和法律的冲突,用博弈论的话来说,是一个均衡选 择问题:
全球化意味着资源的重新分配。
解决规则冲突的三个方式
一个规则取代其他的规则,让一部分人改变行为规 范适应另一部分人,也就是所谓的‘接轨’,如前面 讲的欧洲大陆交通规则的演变所显示的。
靠右行 -1,-1 B 1,1
约会博弈
男 芭蕾舞 足球场
女 芭蕾舞
1,2 0, 0
足球场 0, 0 2,1
进门博弈

先进
后进

先进
-1, -1
2, 1
后进
1, 2
-1, -1
分蛋糕博弈
X1
1
在任何满足
X1+X2=1 的点都是纳什均衡
1
X2
实验:选数博弈
规 则:
参与人:2人; 每 人 可 以 从 1 ~ 10 这 十 个 数 字 中 任
社会规范是通过习惯、长期的交互博弈产生的行为规则; 法律是立法机关制定的行为规则;
无论是法律还是社会规范,他们的功能都是协调 预期。
制度是为了稳定预期,频繁的变化会打乱人们的 预期。
交通规则的演变
在多个纳什均衡之间不存在有劣之分时,偶然事件 对选择具有重要意义: 从历史上来考察,许多交通规则一开始并不体现为 法律,而是长期演化而来的。 现在欧洲大陆的靠右走的规则是在法国兴起的。 随着拿破仑对欧洲大陆的征服,拿破仑将法国的规则 带给了欧洲,也包括靠右行驶的规则。
CH5 多重均衡与制度和文化
多重纳什均衡 如何协调 聚点均衡 帕累托最优均衡 风险优势标准 相关均衡 锁定效应与路径依赖 文化的冲突与协调
纳什均衡的多重性
许多博弈往往有不止一 个纳什均衡
— 麦琪的礼物 — 懦夫博弈
市场进入博弈
一个垄断者已在市场上,另一个企业虎视眈眈想进入
在“约会博弈”中,如果今天是男友的生日,(足球, 足球)可能是一个聚点均衡;
在“分蛋糕博弈”中,(1/2,1/2)可能是一个聚点 均衡,如果每个参与人都有某种公平意识的话;
Cheap talking
在“麦琪的礼物”中,如果事前先告诉对方自己 的想法,非纳什均衡的结果就不会出现;
在下面的博弈中,如果两个参与人在博弈前相遇,
建立全新的规则,如中国人和德国人在一起交流始 都用英语,而不是中文,也不时德文;
建立协调规则的规则,如‘入乡随俗’,‘客随主 便’。
究竟那一中,与规则要解决的问题有关,也与其他 因素有关。
文化既解决冲突又协调预期
尊老爱幼 妇幼保护 尊师重教 先来后到 社会分层与非对称权力(排位 问题;黑社会组织); 公平观念(如分蛋糕博弈) 抓阄
只能猎到1只兔子,够自己吃4天。
猎人乙
猎鹿 猎兔
猎人甲 猎鹿 10,10
猎兔 4,0
0,4 4,4
有两个纯战略纳 什均衡,一个混合 战略均衡;
哪一个将出现呢?
(猎鹿,猎鹿 )帕累托优于(猎兔,猎兔 ) Cheap talking可以帮助协调到帕累托最优均衡
如何协调
仅仅“理性”是不够的: FOCAL POINT (Schelling(1960) ):
重复剔除劣战略的方 法得到; 但如何实施劣战略的 消除,对于最终会留 下哪个均衡至关重要
经济学上把结果依赖于路径的现象叫——路径依赖
路径依赖就是人们陷入一种情况而发现从此难以 脱身;
如果博弈参与人很多,达成协议的成本很高,最
初的非帕累托均衡可能被锁定,导致路径依赖:
森林探险
找工作
A上 下
左 8,10 7,4
B 右
-1000,9 6,5
只要B有1‰的概率错误地选择右,A将选择下; 如果B怀疑A怀疑自己可能犯错误,B将选择右;
所以出现的不是帕累托最优的纳什均衡
偏离损失比较法
可以考虑不同纳 什均衡之间的风险状 况,风险小的优先。

甲 上 A 9,9 下 8,0
乙 右
0,8 B 7,7
少数人不遵守规则并不会导致规则的消失;
但如果规则总是偏向于某一组特定的人群,受到不公正对 待的人并不会蔑视不守规则的人,规则就容易被违反。
关于论资排辈问题
容易被个人操纵的信息是没有 价值的; 当缺乏其他有效的信息时,资 历可以成为协调博弈的信息;
作业
1. 一群赌徒围成一圈赌博,每个人将自己的钱放在身边的地上(每个人都知道 自己有多少钱),突然一阵风吹来,将所有的钱混在一起,使得他们无法分辨哪 些钱是属于自己的,他们为此而发生争执,最后请来一位律师。律师宣布了 这样的规则:
乙告诉甲“我将选择左”,(上,左)极有可能
会出现。 乙


甲上 下
9,9 3,0
0,3 7,7
为什么要相信?
甲上 下
乙 左 9,9 8,0
右 0,8 7,7
无论乙选择什么,他都有积极性告诉甲 他将选择左:
所以没有理由认为甲应该相信乙的话。
风险优势标准
由于纳什均衡要求理性共识和一致预期,当人们 有可能犯小小的错误时,纳什均衡不一定被选择。
婚姻
改革 新产品
键盘的预言 VHS 与Betamax MAC与IBM
经济学上把结果依赖于路径的现象叫——路径依赖
如果博弈参与人很多,达成协议的成本很高,最初的非帕 累托均衡可能被锁定,导致路径依赖:
每个人多偏好于新产品(或标准) ,如果其他人都选择新 产品的话;但每个人都预期其他人不会选择新产品,所以 每个人的最优选择不是转向新产品,结果是整个社会被锁 定在现有的产品(标准)(非帕累托最优)
哪个纳什均衡具有风险优势?
进入者
在位者
默许
斗争
进入 A 40,50 不进入 0,300
-10,0 B 0,300
没有帕累托最优均衡 偏离损失比较法
无帕累托最优均衡
进入者
在位者
默许
斗争
进入 A 40,50 不进入 0,300
-10,0 B 0,300
进入者偏离A损失40,偏离B损失10 在位者偏离A损失50,偏离B损失0 进入者偏离A的损失×在位者偏离A的损失 >进入者偏离B损失×在位者偏离B损失
在位者
默许
斗争
进入者 进入
不进入
40,50 0,300
-10,0 0,300
—(进入,默许)是一个强纳什均衡 —(不进入,斗争)是一个弱纳什均衡 — 斗争是在位者的弱劣战略 — 混合战略Nash均衡为:{(4/5,1/5),(1/5,4/5)}
交通博弈

靠左行
靠右行
甲 靠左行 A 1,1
-1,-1
这常被用来作为市场失灵的理论证据; 经验证据:QWERT vs Dvorak键盘;Beta vs VSH 录象
机;MAC与IBM计算机软件; பைடு நூலகம்最新的研究似乎正在推翻这些广泛流传的结论。
法律和社会规范如何协调预期
法律和社会规范就是协调预期的规则,帮助人们 在多个纳什均衡中筛选一个特定的纳什均衡。
选五个; 如果两个人的选择没有重复,每人
得到50元; 否则各得0元。
令人棘手的问题
博弈结果究竟能否出现纳什均衡? 出现哪一个纳什均衡? 纳什均衡本身不能给出回答 约定俗成的观念与机制
“狩猎博弈”
猎人有2种猎物可猎——鹿和兔子。只有2个人一起合作
才能猎获1只鹿, 1只鹿够2人吃10天;如果1个人单独狩猎,
➢ 每个人将自己的钱数写在纸条上,然后将纸条交给律师
➢ 如果所有人要求的加总不大于钱的总数,每个人得到自己要求的部分(如果有剩 余的话,剩余归律师);
➢ 如果所有人要求的加总大于钱的总数,所有的钱都归律师所有;
写出这个每个参与人的战略空间和支付函数,并给出纳什均衡。纳什均衡是 唯一的吗?
2. 构造一个例子说明在博弈中可能存在如下情况:一个参与人的选择空间 越大,他的处境越糟糕。
甲偏离A损失1,偏离B损失7 乙偏离A损失1,偏离B损失7
甲偏离A的损失×乙偏离A的损失<甲偏离B损失×乙偏离B损失
均衡B比均衡A具有风险优势
但均衡B却不是一个帕累托均衡!
帕累托均衡与风险优势的关系
人是会犯错误的 绝大多数人都是风险规避者
经济学家的结论
在帕累托标准和风险标准之间,理论给帕累托优势 以优先权,而风险标准只有在局中人不知道选哪个均 衡好的不确定的时候,才变得重要。当一个均衡具有 帕累托优势的时候,居中人一定选择这个均衡,不确 定性就不存在了。
选择混合战略,各自获得的收益为2.5 假设甲、乙在博弈前一天商量,双方同意根据明天天气 的情况选择行动,比如说
相关文档
最新文档