博弈论3
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、纳什均衡
1.纳什均衡:是完全信息静态博弈解的一般概念, 构成纳什均衡的战略一定是重复剔除严格劣战略 过程中不能被剔除的战略,就是说,没有任何一 个战略严格优于纳什均衡战略,当然逆定理不一 定成立;更为重要的是,许多不存在占优战略均 衡或重复剔除的占优均衡的博弈,却存在纳什均 衡。
7
定义(纳什均衡的正式定义)有n个参与人的战略式表述博 弈 G = { S1 , … , Sn ; u1, … , un } , 战 略 组 合 s* = (s1*,…,sn*)是一个纳什均衡,如果对于每一个i,si*是 给定其他参与人s -i* =(s1*,…,si-1* ,si+1*…,sn* )的情况 下第i个参与人的最优战略,即: ∀ ui(si*,s-i*)≥ui(si,s-i*) si∈Si, i ∀ 或者用另一种表述方式,si*是下述最大化问题的解: * * * * si*∈arg max ui (s1 ,L si −1 , si , si +1 L sn ) i=1,2,…n s ∈S 考虑战略组合s’=(s1’,…,sn’),说s’不是G的一个纳什均衡等价 于说至少对于某些i而言,si’不是i的最优战略(给定s-i’)换 言之,至少存在一个si”∈Si,使得 ui(si’,s-i’)<ui(si”,s-i’) 就是说,如果我们预测s’=(s1’,…,sn’)是博弈的一个结果但 这个结果不是一个纳什均衡,那么,至少存在某些参与人 有积极性偏离这个结果。(例1)
类似的情况在公共产品的提供上也可能出现。比 如说,村里住两户人家,一户富,一户穷,有一 条路年久失修。这时候,富户一般会承担起修路 的责任,穷户则很少这样干,因为富户家常常是 高朋满座,坐车坐轿的都来,而穷户家只是自己 穿着破鞋走路,路修好了他走起来舒服,路修不 好他也无所谓。 改革中也有类似的情况。同样的改革带给一部分 人的好处可能比另一部分人大得多。这时候,前 一部分人比后一部分人更有积极性改革,改革往 往就是由这些“大猪”推动的。如改革能创造出 更多的“大猪”来,改革的速度就会加快。(返回)
10
4.纳什均衡与占优战略均衡及重 复剔除的占优均衡之间的关系。
(1)每一个占优战略均衡、重复剔除的占优均衡 一定是纳什均衡,但并非每一个纳什均衡都是占 优战略均衡或重复剔除的占优均衡。(例6) (2)纳什均衡一定是在重复剔除严格劣战略过程 中没有被剔除掉的战略组合,但没有被剔除掉的 战略组合不一定是纳什均衡,除非它是唯一的。 注意:上述(2)的前一句话并不适用于弱劣战略 剔除的情况。即弱劣战略剔除可能剔除掉纳什均 衡。(见例7)
例5 在上表给出的博弈中(U,L)是重复剔除的占优均衡, 但如果我们做一个实验,相当一部分人可能会选择D而不 是U。这是因为,尽管如果参与人A百分之百地确信B是理 性的因而会选择L,U是A的最优选择,但是,即使有千分 之一的概率B会选择R,D就优于U。当然,如果(U,R) 的支付值不那么极端,比如说损失只是-1而不是-1000, 我们几乎可以肯定A会选择U。(返回) 返回
这个纳什均衡也有许多应用的例子。比如说,股份公司中, 股东承担着监督经理的职能,但股东中有大股东和小股东 之分,他们从监督中得到的收益并不一样。监督经理需要 搜集信息,花费时间。在监督成本相同的情况下,大股东 从监督中得到的好处显然多于小股东。这里,大股东类似 “大猪”,小股东类似“小猪”。纳什均衡是,大股东担 当起搜集信息、监督经理的责任,小股东则搭大股东的便 车。 股票市场上炒股票也是如此。股市上有大户,也有小户, 大户类似“大猪”,小户类似“小猪”。这时候,对小户 而言,“跟大户”是最优选择,而大户则必须自己搜集信 息,进行分析。 还有市场中大企业与小企业之间的关系。进行研究开发, 为新产品做广告,对大企业是值得的,对小企业则得不偿 失。所以,一种可能的情况是,小企业把精力花在模仿上, 或等待大企业用广告打开市场后出售廉价产品。 14
一、占优战略均衡
占优战略:如果一个参与人的最优战略不依赖于 其他参与人的战略选择,即不论其他参与人选择 什么战略,他的最优战略是唯一的,这样的最优 战略被称为“占优战略”(例1) 占优战略、劣战略:一般地,si*称为参与人i的 (严格)占优战略,如果对应所有的s-i,si*是i的 严格最优选择,即: ∀ si’≠si* ui(si*,s-i)>ui(si’,s-i) ∀ s-i 对应地,所有的si’≠si*被称为“劣战略”。
3
例1:囚徒困境问题
(返回) 返回2 返回3
囚徒2 不坦白 坦白 -8,0 -5,-5
囚徒1
不坦白 坦白
-1,-1 0,-8
Fra Baidu bibliotek
4
二、重复剔除的占优均衡
“重复剔除严格劣战略”的思路:首先找出某个参与人的 重复剔除严格劣战略”的思路: 重复剔除严格劣战略 劣战略(假定存在),把这个劣战略剔除掉,重新构造一 个不包含已剔除战略的新的博弈;然后再剔除这个新的博 弈中的某个参与人的劣战略;继续这个过程,一直到只剩 下一个唯一的战略组合为至。这个唯一剩下的战略组合就 是这个博弈的均衡解,称为“重复剔除的占优均衡” (例2) 定义: 令si’和si”是参与人i可选择的两个战略(即si’∈Si 定义 : si” ∈Si)。如果对于任意的其他参与人的战略组合s-i,参 与人i从选择si’得到的支付严格小于从si”选择得到的支付, ∀ 即:ui(si’,s-i)<ui(si”,s-i) s-i 我们说战略si’严格劣于战略si”。通常,si’称为相对于si”的 劣战略;对应地,si”称为相对于si’的占优战略。占优战略 均衡中的占优战略si*是相对于所有si’≠si*的占优战略。
18
例7 有一个垄断者已在市场上(称为“在位者”),另一 个企业虎视眈眈想进入(称为“进入者”)。进入者有两 个战略可以选择:(进入,不进入)。在位者也有两个战 略:(默许,斗争)。假定进入之前的垄断利润为300, 进入之后寡头利润为100,进入成本为10。各种战略组合 下的支付矩阵如下表 在位者 默许 进入者 进入 不进入 40,50 0,300 斗争 -10,0 0,300
11
纳什均衡是一致性预测
纳什均衡是参与人将如何博弈的“一致性”预测: 如果所有参与人预测一个特定的纳什均衡将会出 现,那么,没有人有兴趣作不同的选择。从而, 纳什均衡且只有纳什均衡具有这样的特征:参与 人预测到均衡,参与人预测到其他参与人预测到 均衡,等等。 注意:说纳什均衡是一致性预测并不意味着纳什 均衡一定是一个好的预测。
第二章 完全信息静态博弈
第一节 基本概念 所谓完全信息静态博弈即各博弈方同时决策, 所谓完全信息静态博弈即各博弈方同时决策,且所有博弈方 对博弈中的各种情况下的得益都完全了解的博弈问题。 对博弈中的各种情况下的得益都完全了解的博弈问题。 完全信息:是指每个参与人对所有其他参与人的特征( 完全信息:是指每个参与人对所有其他参与人的特征(包括 战略空间、支付函数等)有完全的了解, 战略空间、支付函数等)有完全的了解, 静态:指的是所有参与人“同时”选择行动且只选择一次。 静态:指的是所有参与人“同时”选择行动且只选择一次。 纳什均衡:是完全信息静态博弈解的一般概念。 纳什均衡:是完全信息静态博弈解的一般概念。 博弈分析的目的:是预测博弈的均衡结果, 博弈分析的目的:是预测博弈的均衡结果,即给定每个参与 人都是理性的,每个参与人都知道每个参与人都是理性的, 人都是理性的,每个参与人都知道每个参与人都是理性的, 每个参与人的最优战略是什么? 每个参与人的最优战略是什么?所有参与人的最优战略组合 是什么? 是什么? 1
2
定义:(占优战略均衡)在博弈的战略式表述中,如果对 于所有的i,si*是i的占优战略,那么,战略组合s*= (s1*,…,sn*)称为占优战略均衡。 注意:(1)在一个博弈里,如果所有参与人都有占优战 略存在,那么,占优战略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣战略。 (2)占优战略均衡只要求每个参与人是理性的,而并不 要求每个参与人知道其他参与人是理性的(也就是说,不 要求“理性”是共同知识),这是因为,不论其他参与人 是否是理性的,占优战略总是一个理性参与人的最优选择。 (3)个人理性与团体理性的冲突
i i
8
2.求解博弈的几种方法:
(1)划线法:在两人有限战略博弈中,解纳什均衡的一 个简单方法:首先考虑A的战略,对于每一个B的给定的 战略,找出A的最优战略,在其对应的支付下划一横杆, 然后再用类似的方法找出B的最优战略。在完成这个过程 后,如果某个支付格的两个数字下都有杆,这个数字格对 应的战略组合就是一个纳什均衡。( 例1 ,例2 ,例3 , 例4 ,例5 ) (2)箭头法:箭头法的思路是对博弈中的每个策略组合, 判断各博弈方能否通过单独改变自己的策略而改善自己的 得益,如能,则从所考察的策略组合的得益引一箭头到改 变策略后的策略组合对应的得益。这样对每个可能的策略 组合都考察过以后,根据箭头反映的情况来判断博弈的结 果。我们仍用划线法所用的几个博弈作为例子。 9
5
定义: 定义:si’弱劣于战略 si”,如果对于所有的s-i ui(si’,s-i)≤ui(si”,s-i),且对于某些s-i严格不等式成立。si”称 为相对于 si’的弱占优战略。 重复剔除的占优均衡: 重复剔除的占优均衡:战略组合s*=(s1*,…,sn*)称为重 复剔除的占优均衡,如果它是重复剔除劣战略后剩下的唯一 的战略组合。如果这种唯一的战略组合是存在的,我们说该 博弈是重复剔除占优可解的。(例3) 注意:(1)均衡结果与劣战略的剔除顺序有关。如果每次 剔除的是严格劣战略,均衡结果与剔除的顺序无关;如果剔 除的是弱劣战略,均衡结果可能与剔除顺序有关。(见例4) (2)重复剔除的占优均衡不仅要求每个参与人是理性的, 而且要求“理性”是参与人的共同知识。而占优战略均衡不 要求“理性”是参与人的共同知识。 (3)博弈的结果对行为的不确定性是很敏感的,即使只是 很小的不确定性。(见例5) (4)占优战略均衡一定是重复剔除上占优均衡,反之不真。 6
17
在这个博弈里,如果剔除按V、R、M、D进行,(U,L) 是剩下的战略组合;另一方面,如果剔除按M、D、L、V 的顺序进行,(U,R)是剩下的战略组合。由于这个原 因,我们一般使用严格劣战略剔除。用严格劣战略剔除的 办法,这个博弈是不可解的。 (返回) 返回
参与人B L 参与人A U D 8,10 7,6 R -1000,9 6,5
15
例3(重复剔除的占优均衡的例子)
参与人B L 参与人A U D 1,0 0,3 M 1,2 0,1 R 0,1 2,0
(U,M)是剔除的占优均衡
16
(返回) 返回
例4(重复剔除的占优均衡的例子)
参与人B L 参与人A A U D V 2,12 0,12 0,12 M 1,10 0,10 0,10 R 1,12 0,11 0,13
12
例2(重复剔除的占优均衡的例子)“智猪博 弈”。
猪圈里圈着两头猪,一头大猪,一头小猪,猪圈的一头有 一个猪食槽,另一头安装着一个按钮,控制着猪食的供应。 按一下按钮,8个单位的猪食进槽,但需要支出2个单位的 成本。若大猪先到,大猪吃到7个单位,小猪只能吃到1个 单位;若小猪先到,大猪和小猪各吃到4个单位;若两猪 同时到,大猪吃到5个单位,小猪吃到3个单位。试求该博 弈的均衡解。(返回2) 小猪 按 大猪 按 等待 13 3,1 7,-1 等待 2,4 0,0
3.纳什均衡有强弱之分。
上述定义给出的是弱纳什均衡的概念。一个纳什 均衡是强的,如果给定其他参与人的战略,每一 个参与人的最优选择是唯一的。就是说,s*是一 个强纳什均衡,当只当对于所有的i,si’≠si*, ui(si*,s-i*)>ui(si’,s-i*)。如果一个纳什均衡是强的, 没有任何参与人在均衡战略与某些其他战略之间 是无差异的;对比之下,在弱纳什均衡的情况下, 有些参与人可能在均衡战略与非均衡战略之间是 无差异的。强纳什均衡对博弈支付矩阵的小小变 化并不敏感。