博弈论讲义2

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
13
尽管许多博弈中重复剔除的占优均衡是一个合理 的预测,但并不总是如此,尤其是大概支付是某 些极端值的时候。
参与人B
L
参与人A
R -1000,9
U
8,10
D
7, 6
6, 5
U是A的最优选择,但是,只要有1/1000的概率B选R, A就会选D
14
斗鸡博弈
进 A 独木桥 纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
30
●标准式表述
1、players:厂商1和厂商2 向市场提供无差 异的同质的产品;面临的决策是 qi=? qi Q p ui, 博弈
p是市场出清价格,假设是市场供应量Q的减函数: p=p(Q)=a-Q=a-(qi + qj)
31
2、策略:产出水平qi ,策略集Si={qi : qi ≥0} 3、支付函数: ui(si,sj)= ui(qi,qj) = qip – cqi =qi[a-(qi+qj)] – cqi =- qi2+(a-c- qj) qi 假定两厂商均无固定 成本,只有常数边际 成本c。
M优于L 列先生 L M R
1,0
0,3
1,2
0,1
0,1 2,0
行:没有占优战略
D
列:M严格优于R
剔除 R
行:U优于D
列:无占优战略 剔除 D
(U,M)是重复剔 除的占优均衡,但不 是上策均衡
10
练习:在下列战略式表达中,找出重复剔除的占 优均衡
C1 R1 R2
4,3 2,1 3,0
C2
5,1 8,4 9,6
第二章
完全信息静态博弈
2.1 基本分析思路和方法 2.2 纳什均衡
2.3 无限策略博弈分析和反应函数
2.4 混合策略和混合策略纳什均衡
2.5 纳什均衡的存在性
2.6 纳什均衡的选择和分析方法扩展
1
完全信息静态博弈
完全信息:每个参与人对所有其他参与人的特
征(包括战略空间、支付函数等)完全了解
2,2 0,-6
死了
-6,0 0,0
妻子
活着
相互仇恨夫妻丈夫 活着 死了
0,0 0,6
Biblioteka Baidu死了
6,0 0,0
26
一群赌徒在赌钱,每个 人将钱放在自己身边 (每个人都知道自己的 钱有多少),忽然吹来 一阵风将所有的钱都混 在一起,使他们无法分 辨哪些钱是自己的,纳 什均衡为他们解决这个 问题。
27
纳什均衡与占优战略均衡及重复剔除的占优均衡:

B
退 2,0
进 退
-3,-3
0,2
0,0
为了找出这些博弈的均衡解,需要引入纳什均衡。
15
3、划线法
L U 行先生 D 1,0 0,3
列先生 M 1,2 0,1
夫 妻 之 争
R 0,1 2,0
囚 徒 困 境 猜 硬 币
-5, -5 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 2
22
通俗地说,纳什均衡的含义就是:
给定你的策略,我的策略是最好的策略; 给定我的策略,你的策略也是你的最好的 策略。即双方在给定的策略下不愿意调整 自己的策略。
23
需求大的情况 开发商A 开发 不开发 需求小的情况
开发商B 开发 不开发
4000,4000 8000,0
0,8000
0,0
开发商B 开发 不开发
32
●无限策略博弈NE的求解
按NE定义的条件,如果策略组合( qi* ,qj*) 是NE,那么对于qj*, qi*是下列优化问题的解:
Max ui(qi ,qj*) =Max [-q 2 +(a-c-q *)q ] i j i qi∈Si qi∈Si
d ui d qi
-2qi+ (a-c-qj*)
上述均衡概念是1951年由数学家约翰· 纳什 (John Nash)首先解释清楚的,所以将他 所解释的均衡称为纳什均衡。
20
定 义 3.6
对 于 n 人 战 略 式 表 述 博 弈 G {S1 ,, S n ; u1 ,, un } , 若 战 略 组 合
* s * (s1* ,, sn ) 满足如下条件,则称 s * 是一个纳什均衡:
u i ( s1*…, sn-1* , si* , sn+1*
,…, sn* )
≥ u (i s1*…, sn-1* , si , sn+1* ,…, sn* ) ……………………………………….(NE)
19
for every feasible strategy si in Si; That is , si*solves max ui( s1*…, sn-1* , si, sn+1* ,…, sn* ). si∈Si
7
注意:
与占优战略均衡中的占优战略和劣战略不同,
这里的占优战略或劣战略可能只是相对于另一个
特定战略而言。
8
案例1-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 4大于1
0,0
0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
9
案例2
U 行先生
静态:所有参与人同时选择行动且只选择一次。
同时:只要每个参与人在选择自己的行动时不
知道其他参与人的选择,就是同时行动
博弈分析的目的是预测均衡结果
2
2.1 基本思路和方法
1、上策均衡(占优战略均衡)
案例1-囚徒困境
囚徒A
坦白
囚徒 B
抵赖
坦白
-5,-5
0,-8
-5大于-8 0大于-1
抵赖
-8,0
s * 是一个纳什均衡: 或者用另一种表达方式: 当且仅当 si* 是下述最大化问题的解时,
* si* argmaxui (s1* ,, si*1 , si , si*1 ,, sn ) , i 1,, n
si S i
21
假设n个参与人在博弈之前达成一个协议, 规定每一个参与人选择一个特定的战略, * * * * s ( s , , s , , s 另 1 i n ) 代表这个协议,在没有 外在强制力的情况下,如果没有任何人有 积极性破坏这个协议,则这个协议是自动 实施的。这个协议就构成了一个纳什均衡。
组合肯定是所有博弈方愿意选择的,是一个比较稳 定的结果,这样的策略组合为该博弈的一个“上策
均衡” ( dominant strategy Equilibrium) 。
4
注意: 如果所有人都有(严格)占优战略存在,那么占 优战略均衡就是可以预测的唯一均衡。 占优战略只要求每个参与人是理性的,而不要求 每个参与人知道其他参与人是理性的(也就是说, 不要求理性是共同知识)。为什么? 占优战略均衡要求每个局中人的战略在任何情况 下都是最优的,但有时不一定存在。有时存在另 一种占优均衡。
-1, 1 1, -1
1, -1 -1, 1
16
请用上述划线法寻找下列纳什均衡
C1 R1
2,12 0,12 0,12
C2
1,10 0,10 0,10
C3
1,12 0,11 0,13
R2
R3
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3) 剔除顺序:R3、C3、C2、R2,战略组合(R1,C1)
-5大于-8 0大于-1
-1,-1
抵赖是A的严 格劣战略
3
抵赖是B的严格劣战略
上策(占优战略):不论其他人选择什么战略,
参与人的最优战略是唯一的,这样的最优战略称为
“上策或占优战略”(dominant strategy)。
上策均衡:如果一个博弈的某个策略组合中的所
有策略都是各个博弈方各自的上策,那么这个策略
* * ) ui (si* , s ) u ( s , s i i i i ) , si S i , i 1,, n (符号“ ”表示“任意的”
即 是 说 如 果 对 于 每 一 个 i 1,, n , si* 是 给 定 其 他 局 中 人 选 择
* * * * * i s ( s , , s , s , , s i 1 i 1 i 1 n ) 的情况下第 个局中人的最优战略。
开发商A
开发
不开发
-3000,-3000 0,1000
1000,0 0,0
博弈的战略式表述
24
寻找纳什均衡
参与人B C1 R1 参与人A R2 R3
0,4 4,0
C2
4,0 0,4
C3
5 ,3 5 ,3
3,5
3,5
6,6
(R3,C3)是纳什均衡
25
练习: 找出下列两对夫妻的纳什均衡
妻子 活着 恩爱夫妻 丈夫 活着 死了
5
案例2-智猪博弈
小猪 按 大猪 等待 4,4 4大于1 0大于-1

5,1
等待 9,-1
0,0
等待是小猪的严 格占优战略
大猪有无严格占优战略?
6
2、严格下策反复消去法 (重复剔除的占优均衡)
思路:首先找到某个参与人的劣战略(假定存 在),把这个劣战略剔除掉,重新构造一个不包 含已剔除战略的新的博弈,然后再剔除这个新的 博弈中的某个参与人的劣战略,一直重复这个过 程,直到只剩下唯一的战略组合为止。 这个唯一剩下的战略组合就是这个博弈的均 衡解,称为“重复剔除的占优均衡”。
33
令:-2qi+ (a-c-qj*) = 0 得:qi*= (a-c-qj*) /2
于是有方程组:q1*= (a-c-q2*) /2 q2*= (a-c-q1*) /2
q1* = q2*= (a-c) /3 此时, u1*=u2*=(a-c)2 /9
34
考虑关系式:qi*= (a-c-qj*) /2 无论qj是否最优,由 qi= (a-c-qj) /2决定的qi总是 厂商i针对厂商j产出水平的最优反应;我们称 关系式qi= (a-c-qj) /2为厂商i针对厂商j的策略的 反应函数,并记为:qi*= Ri(qj)= (a-c-qj) /2.由此 NE( qi* , qj* )必须是方程组: q1= (a-c-q2) /2 q2= (a-c-q1) /2 的解。-------------------------反应函数法
17
4、箭头法
1, 0 0, 3 1, 2 0, 1 0, 1 2, 0
囚 徒 困 境 猜 硬 币
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 2
-1, 1 1, -1
1, -1 -1, 1
18
2.2 纳什均衡
Definition
In the n-player normal-form game * G={S1 ,… ,Sn ; u1, … , un}, the strategies( S1* …, Sn ) are a Nash equilibrium, if for each player i, si* is (at least tied for (至少不劣于)) player i’s best response to the strategies specified for the n-1 other players, ( s1*…, sn-1* , sn+1* ,…, sn* ):
(1)每一个占优战略均衡及重复剔除的占优均衡一定是 纳什均衡,但并非每一个纳什均衡都是占优战略均衡或重 复剔除的占优均衡; (2)纳什均衡一定是在重复剔除严格劣战略过程中没有 被剔除掉的战略组合,但没有被剔除掉的组合不一定是纳 什均衡,除非它是唯一的(不适用于严格弱劣战略的情况)
28
2.3 无限策略博弈分析和反应函数
1、Cournot Model of Duopoly
按竞争程度划分的市场类型(就卖方来说):
A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场
29
市场类型不同,厂商之间行为特征不同,A与C 类型中,厂商的决策都是个体优化决策,而B类 型中寡头垄断竞争的本质就构成博弈,他们都 是理性的决策者,他们的行为既影响自身,又 影响对方。尽管两寡头由于垄断能给他们带来 一些共同的利益,但是他们的根本利益并不是 完全一致的。如果两寡头之间可以签定有约束 力的协议,彼此之间达成合作,形成完全垄断, 此时的博弈是一种合作博弈。然而在大多数情 况下,彼此之间很难达成有约束力的协议,这 样就是非合作博弈。
12
举例:
剔除顺序:R3、C3、C2、R2,战略组合(R1,C1)
C1
R1
2,12
C2
1,10
C3
1,12
R2
R3
0,12
0,12
0,10
0,10
0,11
0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
故一般使用严格劣战略剔除,可以看到,(R1,C3) (R1,C1)都是纳什均衡,但在这里是不可解的。
C3
6,2 3,6 2,8
R3
11
注意:
1、重复剔除的占优均衡结果与劣战略的剔除顺 序是否有关取决于剔除的是否是严格劣战略。 2、重复剔除的占优均衡要求每个参与人是理性 的,而且要求“理性”是参与人的共同知识。 即:所有参与人知道所有参与是理性的,所有参 与人知道所有参与人知道所有参与是理性的
相关文档
最新文档