博弈论第4讲

合集下载

博弈论完整版PPT课件

博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。

lecture4(博弈论讲义(Carnegie Mellon University))

lecture4(博弈论讲义(Carnegie Mellon University))
May 22, 2003 73-347 Game Theory--Lecture 4 8
Cournot model of duopoly
A product is produced by only two firms: firm
1 and firm 2. The quantities are denoted by q1 and q2, respectively. Each firm chooses the quantity without knowing the other firm has chosen. The market priced is P(Q)=a-Q, where a is a constant number and Q=q1+q2. The cost to firm i of producing quantity qi is Ci(qi)=cqi.
May 22, 2003
73-347 Game Theory--Lecture 4
3
Review: iterated elimination of strictly dominated strategies
If a strategy is strictly dominated, eliminate it The size and complexity of the game is
May 22, 2003 73-347 Game Theory--Lecture 4 9
Cournot model of duopoly
The normal-form representation:
Set of players: { Firm 1, Firm 2} Sets of strategies: S1=[0, +∞), S2=[0, +∞) Payoff functions: u1(q1, q2)=q1(a-(q1+q2)-c) u2(q1, q2)=q2(a-(q1+q2)-c)

博弈论课件第四章

博弈论课件第四章

3
合作博弈
参与者之间可以合作并制定共同策略,追求更大的利益。
纳什均衡理论
纳什均衡是博弈论中的一个重要概念,指的是当参与者根据对手的选择来选 择自己的策略时,不存在更好的选择。这种均衡状态具有稳定性和可持续性。
混合策略的应用
硬币翻转
混合策略可以应用于硬币翻转等 概率性决策中,以平衡风险。
剪刀石头布
博弈理论在法律
博弈论可在法律领域中应用于博弈模型的构建和法律决策的优化。
博弈论的应用领域
经济学
博弈论在经济学中用于研究市场竞争、拍卖和价格形成等问题。
政治学
博弈论在政治学中用于分析选举、合作和冲突等政治策略。
生物学
博弈论在生物学中用于研究进化和动物行为等领域。
博弈论中的主要模型
1
零和游戏
参与者的收益总和为零,一方的利益损失即为另一方的利益增益。
2
非合作博弈
参与者之间缺乏合作,每个参与者根据自身利益进行决策。
博弈论课件第四章
博弈论是研究决策制定和互动模型的学科,第四章将介绍博弈论的基本概念、 应用领域、主要模型以及纳什均衡理论和混合策略的应用,同时提供实际应 用案例。
博弈论的基本概念
1 参与者
博弈论研究多人决策制定过程中的参与者之间的互动。
2 策略
参与者在决策过程中可选择参与者根据他们的行动所获得的支付或效益。
混合策略可用于剪刀石头布等多 次对局中,通过随机选择策略以 增加不可预测性。
扑克筹码
混合策略可应用于扑克中的下注 决策,以提高筹码的价值和战略 性。
博弈论在实际问题中的应用案例
商业竞争
博弈论可用于分析企业在市场竞争中的策略选择和定价决策。
军事战略

第四讲 动态博弈

第四讲 动态博弈

R (0,0)
2
U
1
L (3,1) (2,2)
D
修改的市场进入博弈
试说明上述不可置信的威胁是什么? 现实生活中的例子:父亲坚决不同意女儿 的婚事,威胁说,如果女儿不与相爱的人 断绝关系,他就与女儿断绝父女关系。
逆向归纳法
逆向归纳法可以排除不可置信的威胁。之 所以可以如此,根本原因在于采用了一种 分析动态博弈的有效方法——逆向归纳法, 即从动态博弈的最后一个阶段博弈方的行 为开始分析,逐步倒推回前一个阶段相应 博弈方的行为选择,一直到第一个阶段的 分析方法。一般方法是:从最后一阶段开 始分析,每一次确定出所分析阶段博弈方 的选择和路径,然后再确定前一阶段的博 弈方选择和路径。
(L/L,L/S) (L/L,S/S) (S/L,L/S) (S/L,S/S)
(若史密斯选择大则选择大;若其选择小则选择大) (若史密斯选择大则选择大;若其选择小则选择小) (若史密斯选择大则选择小;若其选择小则选择大) (若史密斯选择大则选择小;若其选择小则选择小)
跟随领头羊Ⅰ表明只要添加一点复杂性,就 使得策略式表述变得晦涩难懂,几无用武之 地。策略式如下。
威胁是指一个参与人承诺一旦其他参与人 偏离均衡,他将采取的某种行动,威胁是 有 一定影响力的,尽管可能它从未被实施 过。
在位者
默许 斗争 进入 40,50 -10,0 进入者 不进入 0,300 0,300 市场进入博弈中,如若进入者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润,所以 斗争就是一种不可置信的威胁。但纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)就成为一个纳 什均衡。
例如,一个模型不能在一开始就说德国相信它打 赢一场与法国的战争的概率是0.8,而法国相信这 一概率只有0.4,因此它们急欲一战。恰恰相反, 它必须假定信念(先验概率)开始时是一致的, 随后因为私人信息而产生分歧。例如两个参与人 都认为德国获胜的概率是0.4,但若德国的将军是 个军事天才,则这一概率就是0.8,而且随后德国 人发现德国的将军确实是个天才。如果是法国抢 先宣战,那么法国的错误信念可能会导致一场战 争,而若德国能令人信服它对德国将军天才的私 人信息,则这场战争本可避免。

博弈论第4讲

博弈论第4讲

39
Mixed Strategy NE
A mixed strategy (P1*, P2*, … PN*), is a mixed strategy Nash Equilibriuat player's mixed strategy Pi* is a best response for Player i to the strategies everyone else is picking P -i*
豪太林(Hotelling)价格竞争模型
模型描述
假定有一个长度为1的线性城市,消费者均匀地分 布在[0,1]区间上。假定有两个商店,分别位于城市 的两端,商店1在x=0处,商店2在x=1处,出售完 全相同的产品 每个商店提供单位产品的成本为c,消费者购买商 品的旅行成本与离商店的距离成正比,单位距离 的成本为t 假定消费者有单位需求:要么消费1单位,要么消 费0个单位(如住房消费)。消费者从消费中得到 的消费者剩余为s。
利用生活经验不难知道,分别以1/3的概率出 招是最佳决策
这就引出了用概率来确定采用何种策略的方 法,这就是混合策略(mixed strategies)概念 的由来
在此之前所说的策略,实质上是以概率1选取 某个确定的策略或行动,我们称之为纯策略 (pure strategies)
29
A mixed strategy Pi is a randomization over i's pure strategies.
求出最优的产量值
1 2 * * Q* (a c) q1 q2 (a c) 2 3
垄断条件下的最优利润为
最优纳什 均衡总产 量
1 2 2 (a c) (a c) 2 4 9

博弈论张维迎经典课件

博弈论张维迎经典课件

( )
∈ Θ ,信号 m ∈ M ,行动 a ∈ A ,参 与人i获得支付 u i (m, a, θ ) ,i = 1,2 。
ps
。若 p b
≥ p s ,则以价格
p = 0.5( pb + p s ) 成交,否则不成交。设买方对货物的估价为 vb
卖方的估价为 v s ,并设相互知道对方的估价标准分布于[0,1]区 为 p − v s 。若没成交,双方得益为0。求贝叶斯NE。 间上。若双方以价格p成交,则买方的得益为 vb − p ,卖方的得益
求贝叶斯均衡。
8
例4 不完全信息古诺模型 例5 不完全信息下公共品的提供问题 例6 消耗战 有两种动物为一个目标展开争斗,各自在单位时间内由于争斗 而付出的成本均为1。若其中一个首先停止争斗,另一个将获得 该目标。若同时停止争斗,谁也不能获得该目标。两博弈方应 如何选择争斗停止时间?即两个局中人同时选择一个停止时间
任意博弈方i和他的每一种可能的类型 t i ∈ Ti ,s i* (t i ) 所选择的 行动 a i 都能满足: * max ∑ {u i s1* (t1 ), L , s i*−1 (t i −1 ), a i , s i*+1 (t i +1 ), L , s n (t n ); t i , t − i p i (t − i t i )}
时装

足球 0,0 1,3+th
16
时装 足球
2+tw,1 0,0
第五章 不完全信息动态博弈
一、精炼贝叶斯NE 要求1:在各个信息集,轮到选择的博弈方必须具有一个关于 要求 博弈达到该信息集中每个节点可能性的判断。对多节点信息集, 一个判断就是博弈达到该信息集中各个节点可能性的概率分布, 对单节点信息集,则可理解为判断达到该节点的概率为1。 要求2:给定各博弈方的判断,局中人的策略必须是序列理性 要求 的。即在各个信息集,给定轮到选择博弈方的判断和其它博 弈方的后续策略,该博弈方的行为及以后阶段的后续策略, 必须使自己的得益或期望得益最大。此处所谓后续策略即相 应的博弈方在所讨论的信息集以后阶段中,针对所有可能情 况如何行为的完整计划。

博弈论最全完整-讲解课件

博弈论最全完整-讲解课件
(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。

第四篇博弈论PPT课件

第四篇博弈论PPT课件
• 此情况下由于博弈没有可预测的明确的博弈结果,所以就不能 确定博弈方的策略。但是是否在这样的博弈中,各博弈方选择 任何策略都是一样的,因此可以随意选择吗?
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈

硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式

哈工大《博弈论》课件PPT:第4讲

哈工大《博弈论》课件PPT:第4讲
纳什均衡是博弈将会如何进行的“一致” (consistent)预测,这意指,如果所有参与人预 测特定纳什均衡会出现,那么没有参与人有动力
采用与均衡不同的行动。因此纳什均衡(也只有 纳什均衡)能具有性质使得参与人能预测到它,
预测到他们的对手也会预测到它,如此继续。与 之相反,任何固定的非纳什均衡如果出现就意味 着至少有一个参与人“犯了错”,或者是对对手行 动的预测上犯了错,或者是(给定那种预测)在 最大化自己的收益时犯了错。
被保留下来的唯一一个策略组合。 20
两个定理的证明
按照严劣策略的定义,有 u1 (s1*,…,si*,…,sn*)< u1 (s1’,…,si*,…,sn*) 比较左右两式,可以得出矛盾…
21
纳什均衡的存在性
“每一个有限博弈都至少有一个纳什均 衡。”现实中的博弈都是可以当作有限 博弈来解决。这样纳什均衡的存在就是 普遍的。纳什均衡的普遍存在性是纳什 均衡概念最重要的性质。
任何非纳什均衡的预测都不是一致预测,因 此一致预测正是纳什均衡的本质属性。
9
纳什均衡的一致预测性质有两个推论:
推论1,各博弈方可以预测它,可以预测他们的对 手预测它,还可以预测他们的对手会预测自己会预 测它……。
推论2,预测到了任何非纳什均衡策略组合是博弈的 最终结果,则意味着要么各博弈方的预测其实并不 相同(预测不同的纳什均衡会出现等),要么至少 一个博弈方要“犯错误”,包括对博弈结构理解的 错误,对其他博弈方的策略预测错误,其信息结构、 理性或计算能力有问题,或者是实施策略时会出现 差错等。因此在假设各博弈方预测的策略组合相同, 以及各博弈方都有完全的理性,也就是不会犯错误 的情况下,不可能预测任何非纳什均衡是博弈的结
2 是这样的一种稳定的策略组合:当所 有参与人的选择公开以后,每个人都满 意自己作出了正确的选择;没有人能得 到更好的结果了。在博弈论中这种结果 被称为NE。

第4讲 不完全信息静态博弈

第4讲 不完全信息静态博弈

第4讲 不完全信息静态博弈
上述定义包含一种可能:参与人j可能具有参与人i类型的某种信息。进一 步,如果所有参与人的类型空间只包含一个元素,即对于所有的i, i ,不完全信息静态博弈就退化为完全信息静态博弈。换言之,完全 信息静态博弈可以理解为不完全信息静态博弈的一个特例(即分布函数P 是退化的)。另外,如果参与人的类型是完全相关的(perfectly correlated) ,当参与人i观测到自己的类型时也就知道了其他参与人的类型,博弈也是 完全信息的。不过,一般假定参与人的类型是相互独立的。
这样上述不完全信息博弈就转换为如下图所示的完全但不完美信息博弈可以使用标准的分析技术进行分析这就是所谓的海萨尼转化进入者进入不进入在位者在位者进入不进入斗争合作斗争合作030040501000400308010100海萨尼转换后的市场进入阻挠博弈1p在上述例子中我们假定自然选择的只是在位者是高成本还是低成本
第4讲 不完全信息静态博弈
在位者 高成本情况 低成本情况
默许
进入者 进入 不进入
斗争
默许
斗争
40,50 0,300
-10,0 0,300
30,80 0,400
-10,100 0,400
市场进入阻挠博弈:不完全信息
第4讲 不完全信息静态博弈
• 在这个例子中,进入者有关在位者的成本信息是 不完全的,但在位者知道进入者的成本函数。 • 从支付矩阵可以看出,如果在位者是高成本,给 定进入者进入,在位者的最优选择是默许;如果 在位者是低成本,给定进入者进入,在位者的最 优选择是斗争。因此,在完全信息情况下,如果 在位者是高成本,进入者的最优选择是进入,如 果在位者是低成本,进入者的最优选择是不进入。
第4讲 不完全信息静态博弈

波恩大学博弈论 讲义 GameT-4

波恩大学博弈论 讲义 GameT-4

Some (classical) examples of simultaneous gamesC CooperateD defectC cooperate 3 , 3 0 , 6D defect 6 , 0 1 , 1Prisoners’ DilemmaThe ‘D strategy strictly dominates the C strategyStrategy s 1strictly dominates strategy s 2if for all strategies t of the other playerG 1(s 1,t)> G 1(s 2,t)Strategy s 1weakly dominates strategy s 2if for all strategies t of the other playerG 1(s 1,t)≥ G 1(s 2,t)and for some tG 1(s 1,t)> G 1(s 2,t)weakly1, 52, 3 7, 4 3, 34 , 75, 2XXNash EquilibriumSuccessive deletion of dominated strategies example of strict dominance1 , 0 1 , 4 1 , 0 1 , 41 ,2 1 , 20 , 30 , 32 ,3 1 ,4 2 , 3 1 , 41 , 2 1 , 20 , 30 , 3weak dominanceX?????an exampleSuccessive deletion of dominated strategies And Sub-game Perfectness21210 , 31 , 41 , 21 , 02 , 3Examplerl121221210 , 31 , 41 , 21 , 02 , 3rl 1212rr 1 , 0 1 , 4 1 , 0 1 , 4lr 1 , 2 1 , 20 , 30 , 3rl 2 , 3 1 , 4 2 , 3 1 , 4ll 1 , 2 1 , 20 , 30 , 321210 , 31 , 41 , 21 , 02 , 3rl1212Sub-game perfect equiibrium( r,l )( l,l )rr 1 , 0 1 , 4 1 , 0 1 , 4lr 1 , 2 1 , 20 , 30 , 3rl 2 , 3 1 , 4 2 , 3 1 , 4ll 1 , 2 1 , 20 , 30 , 321210 , 31 , 41 , 21 , 02 , 3rl1212( x , l )X X ( x , l )XXweakly dominatingXrr rr lr rl ll1 , 0 1 , 4 1 , 0 1 , 4lr1 ,2 1 , 20 , 30 , 3rl 2 , 3 1 , 4 2 , 3 1 , 4ll 1 , 2 1 , 20 , 30 , 3Another example of a simultaneous game The Stag HuntStag HareStag 2 , 20 , 1Hare 1 , 0 1 , 1A generalization to n person game:There are n types of stocks. Stock of type k yields payoff k if at least k individuals chose it,Another example of a simultaneous gameThe Stag HuntStag HareStag 2 , 20 , 1EquilibriaHare 1 , 0 1 , 1payoff dominant equilibriumrisk dominant equilibriumChange of payoffsStag Hare Stag 2 , 20 , 1.99Hare 1.99 , 0 1.99 ,1.99Battle of the sexesman womanBach or Stravinsky (BOS)Ballet BoxingBallet 2 , 10 , 0Boxing0 , 0 1 , 2 EquilibriaBattle of the sexesmanwomanBallet Boxing Ballet 2 , 10 , 0 Boxing0 , 0 1 , 2A generalization to a bargaining situationTwo players divide a Dollar.Each demands an amount ≥ 0.Each receives his demand if the total amount demanded is ≤ 1.Otherwise they both get 0.e m a n d of p l a y e r 2e m a n d of p l a y e r 2equilibriaa continuum of equilibriaMatching Pennieshead tailshead1 , -1-1 , 1tails-1 , 1 1 , -1 no pure strategies equilibrium existsMatching Pennieshead tailshead1 , -1-1 , 1tails-1 , 1 1 , -1 no pure strategies equilibrium existsMatching Penniesheadtailshead 1 , -1-1 , 1tails-1 , 1 1 , -1no pure strategies equilibrium existsMixed strategiesA player may choosehead with probabilityand tails with probability 1-Matching PenniesMixed strategiestails 1-headtailshead 1 , -1-1 , 1tails-1 , 1 1 , -1player 2mixes:if player 1plays ‘head’his payoff is the lottery:⎛⎫ ⎪⎝⎭1-ββ1-1if the payoffs are in terms of his vN-M utility then his utility from the lottery is()()()β-1+1-β1=1-2β21Matching PenniesMixed strategiestails 1-headtailshead 1 , -1-1 , 1tails-1 , 1 1 , -1player 2mixes:1-2βSimilarly, if player 1 plays ‘tails’ his payoff is …….2β-1⎛⎫ ⎪⎝⎭1-ββ-1122Matching PenniesMixed strategies1-headtailshead 1 , -1-1 , 1tails-1 , 1 1 , -1player 2mixes:1-2β2β-1He prefers to play ‘head’ if:1-2β>2β-10.5>βHe prefers to play ‘tails’ if:2β-1>1-2ββ>0.5When β= 0.5player 1 is indifferentbetween the two strategies and any mix of the two23player 1’s mix player 2’s mixα(1-α, α)β11headtails Player 1 prefers to play ‘head’ if:0.5>ββ>0.5Player 1 prefers to play ‘tails’ if:Player 1 is indifferent when β=0.5Player 1’s Best ResponsefunctionPlayer 2’s Best Response function ??24player 1’s mix player 2’s mixαβ11Player 1’s Best ResponsefunctionPlayer 2’s function ??When player 1 plays ‘head’ often Player 2 prefers to play ‘tails’Best Response function Nash equilibiumα= β= 0251/2head1/2tailshead 1 , -1-1 , 1tails-1 , 1 1 , -100。

博弈论第四章PPT课件

博弈论第四章PPT课件
• 完全承诺,如破釜沉舟、军事博弈
不完全承诺,增加行动成本
承诺行动与博弈结果
• 春节前夕,某小镇上两个商铺主甲和乙同时看到一个
赚钱机会:去城里贩一批鞭炮回来零售,购货款加上 运输费用共5000元,如果没有竞争对手,这批货在小 镇上能卖6000元;但如果另一家商铺同时在小镇上卖 鞭炮,价格下跌使得这批鞭炮只能卖4000元。纳什均 衡是什么?
• 假设甲先行动,商铺乙看到对方的选择后再决定是否
进货,子博弈精炼纳什均衡是什么?
承诺行动与博弈结果
如果甲先行动,但在博弈开始前商铺主乙有一次行动A的 机会,利用子博弈精炼均衡概念分析下述两种情况下的 博弈结果: (1)A:商铺主乙逢人便说自己一定要进货,无论对方如 何行动他都不会改变这个决定; (2)A:商铺主乙与某个嘲笑他说大话的第三者丙打赌: 如果自己到时不进货,向丙支付1500元;如果自己到时 候进货,丙向他支付100元。并且,乙将这个赌局通知甲。
分配给不同的局中人,并赋予行动时可选的策略; (4)局中人行动时的信息集合I; (5)对应局中人可能选择策略,各局中人在终结环节所得到
的报酬U。
战略式与扩展式
战略式表述 (strategic form representation) 多用矩阵
2
L
L
2,2
S -1,-1
1
-1,-1
1,1
S
(2,2) L
-10,0 0,300
不进入 (0,300)
进入者 进入
默许 (40,50) 在位者
斗争 (-10,0)
四、承诺行动(commitment)与 子博弈精炼纳什均衡
• 纳什均衡之所以不是精炼均衡,是因为不可置信的
威胁存在,如父母与子女之间的博弈。

博弈论讲义4

博弈论讲义4
16
γ * = 0 .2
六 混合战略纳什均衡
混合战略纳什均衡的含义:
纳什均衡要求每个参与人的混合战略是给定对方的混 合战略下的最优选择。因此在社会福利博弈 γ θ 中, * = 0.2 , *=0.5是唯一的混合战略纳什均衡。 从反面来说,如果政府认为流浪汉选择寻找工作的概 率严格小于0.2,那么政府的唯一最优选择是纯战略: 不救济; 如果政府以1的概率选择不救济,流浪汉的最优选择是 寻找工作,这又将导致政府选择救济的战略,流浪汉 则选择游荡。如此等等。
8
六 混合战略纳什均衡
混合战略:如果一个战略规定参与人在给定信息情况 混合战略: 下以某种概率分布随机地选择不同的行动, 以某种概率分布随机地选择不同的行动, 则该战略为混合战略。 则该战略为混合战略。
G = {S1, S 2, , S n; u1 , u 2 , L , u n } L 中, 在 n 个参与人博弈的战略式 表述:
男 足球 芭蕾 女 足球 2,1 0,0 芭蕾 0,0 1,2
26
七 纳什均衡存在性及相关讨论
如何保证均衡出现: 1、“聚点”均衡:参与人可以使用某些被 抽象掉的信息达到一个“聚点均衡”。 两个人分蛋糕; 性别战中的博弈; 两人同时给对方打电话 ……
27
七 纳什均衡存在性及相关讨论
2、廉价磋商-“协调博弈”
2
六、混合战略纳什均衡
社会福利博弈
流浪汉 寻找工作 政府 2 救济 3, 1 不救济 -1, 0, -游戏
三毛、一休 各拿一枚硬币 若同时正面 或反面出现, 三毛给一休 1 元钱, 若一正面和 一反面,一休 给三毛 1元钱。
零和博弈
博弈参与者有 输有赢,但结 果永远是0。 正面 1 正面 反面 -1, -1 1, -1,

博弈论理性是共同知识时的博弈求解

博弈论理性是共同知识时的博弈求解

4.1 基本概念
4.1.3基本概念——混合策略 一个参与人的混合策略是指这个参与人根据一个概率分
布来随机选择策略的行为。参与人i的混合策略用σi表示, σi ∈ ΔSi, ΔSi为参与人i的混合策略集合。 比如,一个参与人可以在U和D两种策略之间进行选择, 他选择U的概率为1/2,选择D的概率也为1/2,则他的混 合策略为(1/2,1/2)。 σi 性质: σi中的每个元素不小于0,各元素之和为1. 混合策略包括了纯策略,纯策略是混合策略的一种特殊 情况。
严格优于(strictly dominates):无论其他对手 的策略是什么,若策略s产生的支付(收益)严 格高于s’产生的收益,那么策略s为严格优于策 略s’。
4.2 博弈求解:参与者是理性的
4.2.2 博弈求解:参与者是理性的 ——弱优于
弱优于(weakly dominates):无论其他对手的策 略是什么,若策略s产生的支付(收益)不低于s’产 生的收益,那么策略s为弱优于策略s’。
4.1 基本概念
基本概念——期望效用 (下)
当在博弈中有参与人使用混合策略时,参与人的支付也 使用期望效用来计算。
仍以右图所示的博弈为例,假设参 与人2选择M,参与人1采取混合策略 (1/3,1/3,1/3),那么参与人1的支 付为: u1(σ,M)=(1/3)*0+(1/3)*1+(1/3)*2=1 参与人2的支付为: u2(σ,M)=((1/3)*2+(1/3)*2+(1/3)*3=7/3
【小练习】试计算参与人1采取混合策略 (1/3,1/3,1/3),参与人2采取混合策略(0,1/2,1/2) 时,双方的支付情况。
4.1 基本概念
基本概念——最优反应(上)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
按照纳什均衡的定义,图上的三个交点既 是参与人1的最优反应函数上的点,同时也 是参与人2最优反应函数上的点
r 1 3/4 r=R1(q) q=R2(r)
——
0 图1-19
1/3
1
q
q
性别战的图解法
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
2×2双矩阵博弈的图解法
这三个点的坐标为(0, 0), (1/3, 3/4),(1, 1)。对应 的三个策略分别是:(足球,足球);妻子、丈 夫分别以1/3、3/4的概率选择时装;(时装,时 装)。 r
L
U M D 4,3 2,1 3,0
M
5,1 8,4 9,6
R
6,2 3,6 2,8
——
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
纳什均衡求解:画线法(练习)
——
B 左 中 右 A
B L C R
A
上 1,0 1,3 0,1
下 0,4 0,2 2,3
T M
D
2,0 1,1 4,2 3,4 1,2 2,3
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
图解法:古诺模型
这里考虑连续形式的古诺模型
两个企业,分别表示为企业1、企业2 每个企业的策略是选择产量(用qi表示), 支付是利润(用πi表示),它是两个企业产 量的函数,生产成本与产量有关,用Ci(qi) 表示,市场出清价格为P=P(q1+q2) 第i个企业的利润函数为: πi=qi P(q1+q2) – Ci (qi), i=1, 2
1 3/4 r=R1(q) q=R2(r)
——
0 图1-19
1/3
1
q
q
性别战的图解法
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
求解重复剔除劣战略均衡练习1
小猪 按 按 等待 5, 1 9,-1 等待 4, 4 0, 0
——
大猪
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
求解重复剔除劣战略均衡练习2
纳什定理的主要内容为:在一个有n个 参与人的策略式博弈G={S1,…,Sn; u1,…,un}中,如果n是有限的,且Si是有 限集(i=1,…,n),则该博弈至少存在 一个纳什均衡(在混合策略意义下)
——
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
纳什定理的一些说明
纳什定理的证明要用到不动点定理。
图1-18
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
2×2双矩阵博弈的图解法
将这两张图合并,得到图1-19
——
r 1 r
1
3Hale Waihona Puke 4q=R2(r)r=R1(q)
0 图1-17
1/3
1
q
0 图1-18
1/3
1
q
妻子的反应函数
丈夫的反应函数
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
2×2双矩阵博弈的图解法
丈 夫
——
时装
妻 子
足球 0, 0
1, 3
时装
足球 图1-16
2, 1
0, 0 性别战
1 2q 2 1(1 q)
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
2×2双矩阵博弈的图解法
比较π1与π2可知
当q<1/3时,妻子选 择看时装的支付为2q, 小于看足球的支付, 因此,应选择看足球; 妻 当q=1/3时,选择看 子 时装和足球支付情况 没有差异; 当q>1/3时,则选择 看时装表演
——
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
图解法:古诺模型
q2
R1 NE R2 q1 图1-9 古诺模型的纳什均衡
——
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
2×2双矩阵博弈的图解法
一对夫妻要决定去看时 装表演还是看足球赛。 有关纯策略及相应支付 情况如图1-16所示
设妻子的混合策略为 (r,1-r),丈夫的策略为 (q,1-q)。这里的r,q分别 表示妻子或丈夫观看时 装表演的概率 为便于分析,将混合策 略列于右上角 妻 子
{(r,1-r), (q,1-q)}
丈 夫
——
时装 时装
足球 图1-16
足球 0, 0
1, 3
2, 1
0, 0 性别战
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
2×2双矩阵博弈的图解法
若丈夫以q的概率选 择去看时装表演 (以1-q的概率去看 足球),则妻子选 择时装和观看足球 的期望收益分别为 {(r,1-r), (q,1-q)}
所谓不动点定理,是指
一个定义在X X上的函数f(x),
集合X是非空的、闭的、有界的和凸的
——
函数f是连续的
则至少存在一个x,使得f(x)=x, x 被称为不 动点
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
纳什定理的一些说明
运用不动点定理证明纳什定理的主要步 骤是
设计一个策略组合空间上的一个映射,说 明该映射的任何不动点都是一个纳什均衡 使用不动点定理证明这个映射一定存在一 个不动点
{(r,1-r), (q,1-q)}
丈 夫
——
时装 时装
足球 图1-16
足球 0, 0
1, 3
2, 1
0, 0 性别战
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
2×2双矩阵博弈的图解法
可用图1-17表示妻子的 上述情况反映了妻子针 反应函数 对丈夫不同策略下的最 佳反应,称为(妻子的) 反应函数.
——
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
图解法:古诺模型
(q1*, q2*)是均衡产量意味着:
q1*∈argmaxπ1(q1, q2*) q2*∈argmaxπ2(q1*, q2) 根据上面两个式子可以得出反应函数(reaction function): q1*=R1(q2) q2*=R2(q1) 两个反应函数的交叉点就是纳什均衡(q1*, q2*), 见图1-9
1,3 0,2 3,0
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
纳什均衡求解:图解法(练习)
——
B 左 A 上 3,2 右 -1,3
参 与 人 1 B A
参与人2
C 2, 3 3, 1 D 5, 2 1, 5
下 -1,1
0,0
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
纳什定理
纳什于1950年提出并证明了纳什定理
r 1
——
r=R1(q)
0 图1-17
1/3
1
q
妻子的反应函数
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
2×2双矩阵博弈的图解法
同理,可绘出丈夫的反 应函数,见图1-18
——
r 1 3/4 r=R1(q) r
1
q=R2(r)
0 图1-17
1/3
1
q
0
1/3
1 丈夫的反应函数
q
妻子的反应函数
相关文档
最新文档