第4章 Nash均衡解的特性

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Department of Mathematics
Northwest University
• 因此,传统的博弈论研究的问题或许并不 是如何找到博弈的Nash均衡(即存在性问 题),而是在博弈的多个Nash均衡中选择 一个合理的均衡(即多重性问题)。 • 事实上,当在一个博弈中存在多个Nash均 衡时,目前还没有一个一般的理论能证明 哪个Nash均衡结果一定会出现。
第一部分: 完全信息静态博弈
第四章 Nash均衡解的特性
主要内容: 一、Nash均衡的意义 二、Nash均衡解的存在性 三、Nash均衡解的多重性
第四章 Nash均衡解的特性
主要内容: 一、Nash均衡的意义 二、Nash均衡解的存在性 三、Nash均衡解的多重性
Department of Mathematics
Department of Mathematics Northwest University
第四章 Nash均衡解的特性
主要内容: 一、Nash均衡的意义 二、Nash均衡解的存在性 三、Nash均衡解的多重性
Department of Mathematics
Northwest University
1. 焦点效应 2. 相关均衡
Department of Mathematics
Northwest University
焦点效应
• 在某些存在多个Nash均衡的博弈中,往 往会出现这样的现象:所有的参与人都 会相互预期博弈中某一特定的均衡将会 出现,从而选择执行这个特定的均衡。
Department of Mathematics
L
1
2
R
0, -1 -1, 3
3 1 1 1 (( , ), ( , )) 4 4 2 2
U D
0, 0 1, 0
• 博弈有惟一的Nash均衡—— • 两个参与人在均衡中的期望收益都为0。
Department of Mathematics
Northwest University

况下,纯战略是参与人1的最优反应; 3 1 ( 而在参与人1选择均衡战略 1 4 , 4 ) 的 情况下,纯战略 L是参与人2的最优反 应; • 在参与人1选择纯战略U而参与人2选择 纯战略 L的情况下,双方的收益都为0, 与均衡中的期望收益相同。
Department of Mathematics
Northwest University
• 对于Nash均衡的多重性问题,目前解决 的思路主要有两种: • 第一种:规范式方法(均衡精炼); • 第二种:非规范式方法(焦点效应、相 关均衡)。
Department of Mathematics
Northwest University
• Nash均衡具有作为博弈一致性预测的特点—— 所有参与人的自我肯定。 • 一个博弈结果 ( si , si ) (或 ( i , i ) )如果不是Nash均 衡,那么就意味着:至少有一个参与人i,在给 定其他参与人的选择 si (或 i )的情况下,会 偏离 si (或 i )。因此,( si , si )(或 ( i , i ) )不可能 成为博弈的一致性预测。也就是说,一个非Na sh均衡的预测将会被参与人(至少一个参与人) 自我否定。
Northwest University
一、Nash均衡的意义
• 观点:Nash均衡是博弈的一种一致性预 测——如果所有参与人预测一个特定的N ash均衡会出现,那么所有参与人都不会 偏离,这个Nash均衡将会出现。
Department of Mathematics
Northwest University
Northwest University
Department of Mathematics
Northwest University
• 例如,在“斗鸡博弈”中,虽然存在两个 纯战略的Nash均衡(U,D)和(D,U)(即一个人 冲上去,另一个人退下来),但是,如果 用它们作为一致性的预测话,就会面临这 样的问题:在博弈中,到底谁冲上去,谁 又该退下来?如果两个参与人对“两个均 衡到底哪一个会出现”的预测不一致的话, 就可能会出现问题。
Department of Mathematics
Northwest University
• 给定一个博弈G,R是G中参与人如何行动的数 学描述的某个值域,用 (G ) R 表示博弈的解。 (G )应满足如下两个条件: 作为博弈的解, • (1) G , (G) ,都存在一个环境能使π成 为参与人在这个博弈G中将如何行动的准确预测; • (2) 不存在一个环境能使π成为 参与人在这个博弈 G G, R \ (G ) 中将如何行动的准确预测;
Department of Mathematics
Northwest University
• 在博弈论中Nash均衡是作为博弈的解— —一致性的预测而引入的。 • 在一个博弈问题中,如果博弈只存在一 个Nash均衡,那么Nash均衡作为一致性 的预测,应该说是相当有效的。但是, 如果博弈中存在多个Nash均衡,那么Nas h均衡作为博弈解的意义也就相对弱化了。
Department of Mathematics
Northwest University
2
U
1
D
1, -1 0, 0
U D
-4, -4 -1, 1
• 存在两个纯战略Nash均衡——(U,D)和(D,U), 也就是一个人上去,另一个就必须退下来。
Department of Mathematics Northwest University
Department of Mathematics
Northwest University
• 这是因为,如果参与人预测 (U, U) 会 出现,那么在行动时他不会选择U,因 为相对于选择 U 实现预测的结果 ,参 与人选择 D 可以使自己的支付变好, 从而导致预测的行动和实际的行动不 符,这也就意味着这个预测被参与人 自我否定。
均衡精炼的主要思路
• 从博弈解的定义入手,在Nash均衡的基 础上,通过定义更加精炼的博弈解如子 博弈精炼Nash均衡、精炼贝叶斯Nash均 衡等,剔除Nash均衡中不合理的均衡。 这种解决Nash均衡多重性的思路具有普 遍性,对所有的博弈问题都适用;如果 均衡精炼的方法可以称为规范式的方法 的话,
Department of Mathematics
Northwest University
• 任何一个满足以上两性质的解,我们称 之为博弈的一个精确解(exact solution)。 精确解要求对所有可能情况下参与人将 如何行动进行预测,并且其对参与人在 各种情况下将如何行动的预测是准确预 测,也就是一致性预测。
Department of Mathematics Northwest University
• 参与人1预测博弈的解为:自己上去,对 方退下来(即均衡(U,D)),而参与人2则预 测博弈的解为:对方退下来,自己上去 (即均衡(D,U)),那么博弈真正的结果就 会既不是Nash均衡(U,D)也不是(D,U)( Na sh均衡,而是非Nash均衡——双方都冲 上去,出现两败俱伤的情形。
Department of Mathematics
Northwest University
• 一般情况下,同时满足以上两条性质的解难以 找到。 • 将满足第一条性质的解,称为博弈的下解(lower solution)。下解排除了所有不合理的预测,但也 可能排除了合理的预测; • 将满足第二条性质的解,称为博弈的上解(upper solution)。上解包含了所有合理的预测,但也可 能包含了不合理的预测。显然,Nash均衡是上 解。
Nash均衡的存在性定理
每一个有限的战略式博弈至少存在 一个Nash均衡(包括纯战略和混合战略Na sh均衡)。
Department of Mathematics
Northwest University
第四章 Nash均衡解的特性
主要内容: 一、Nash均衡的意义 二、Nash均衡解的存在性 三、Nash均衡解的多重性
i i
i
i
i
i
Department of Mathematics
Northwest University
Nash均衡的特点:
• 对任一个参与人i,在给定其他参与人选 择的情况下,均衡战略是自己的最优战 略。
Department of Mathematics
Northwest University
( , • 将 (si , s ( 或 ) i i ) )作为博弈的一致性预测,那 i 么 (s , s ) (或 ( i , i ) )就应具有这样的特点:对于 博弈中的任一个参与人 i,如果他预测到 (si , s i) (或 ( i , i ))将作为博弈结果出现,那么在他预测 s 到其他参与人的选择为 i (或 )的情况下,自 己的选择 si (或 )必须使自己的收益最大化(否 则他就不是理性的),即 si arg max ui ( si , s i) 。 s S
Department of Mathematics Northwest University
非规范式方法的特点
• 针对一些特定情形下的特定博弈问题, 给出具体的解决Nash均衡多重性问题的 方法。
Department of Mathematics
Northwest University
非规范的方法的方式
Department of Mathematics
Northwest University
• 非Nash均衡的(U, U)不可能成为一个一致 性预测。基于同样的原因, (D, D)也不是 一个一致性预测。
Department of Mathematics
Northwest Unt of Mathematics Northwest University
1 1 在参与人2选择均衡战略 2 ( 2 , 2 ) 的情
• 但是,作为非Nash均衡的战略组合(U, L) 却不能成为博弈的一致性预测。 • 这是因为,如果预测到参与人2选择纯战 略L的话,参与人1的最优选择又应该是 D,此时,参与人1会偏离而选择D 。
Department of Mathematics
Northwest University
例子:斗鸡博弈
• 两个所谓的勇士举着长枪,准备从独木桥的 两端冲上桥中央进行决斗。每位勇士都有两 种选择:冲上去(用U表示),或退下来(用D表 示)。若两人都冲上去,则两败俱伤;若一方 上去而另一方退下来,冲上去者取得胜利(至 少心理上是这样的),退下来的丢了面子;若 两人都退下来,两人都丢面子。
Northwest University
焦点效应
• 2005年诺贝尔经济学奖获得者Schelling对 这种现象进行了详尽的探讨并且证明:在 一个具有多重均衡的博弈中,趋向于将参 与人的注意力集中到一个均衡的任何事情, 都可能使参与人全都预期并随之实行这个 均衡,就像一个自行应验的预言一样。
Department of Mathematics
• 当一个理性的参与人预测到对方将会冲上 去时,明智的选择就是退下来; • 而当预测到对方将会选择退却时,就应该 大胆地冲上去。所以,我们可以将Nash均 衡作为“斗鸡博弈”的一致性预测。
Department of Mathematics
Northwest University
• (U, U)和(D, D),也就是两人同时冲上去 或同时退下来,不是Nash均衡,也不能 成为博弈的一致性预测。
Northwest University
焦点效应
• Schelling将这种现象称之为“焦点效应” (focal-point effect),在焦点效应中具有某 种使它显著地区别于所有其它均衡之性质 的均衡,被称为“焦点均衡”(focal equilib rium)。
Department of Mathematics
相关文档
最新文档