《博弈论基础》
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
外部协调机制
●内部协调不能达到 Pareto 最优(如:Cartel 不能维 持) ●由外部协调机制来解决,如黑社会: 囚犯 B C C 囚犯 A
01-3-2
DC
-∞ -∞ -∞ -2 -10 -2
-∞ -10
DC
19
例 2:航空价格战 中 陆 ¥380 ¥380 8 法航 ¥490 4 NE: (8,8) 例 3:性别战 ●新婚夫妇: 2 个 NE: (Opera,Opera)(Football,Football) ;
01-3-2
17
2、NE的求解
例 1:囚犯困境 C C 囚犯 A DC
-10 0 -2 -2 -5 -5 0
囚犯 B DC
-10
●验证:{s*1=(C,C) 2=(C,C)}为 NE 战略 ;s* ●但 Pareto 改进(-2,-2)未能自发达到——外部性 ●个人理性与集体理性产生冲突
01-3-2 18
01-3-2 33
反之,给定 S1*,S(t21)=L;S(t22)=R 分别是 t21 与 t22 类 型的参与人 2 的最优战略 2.Static B.G 的定义: {I;{Si};{ui(· )};Θ ;F(· )} ●Si 为 i 的战略空间,si∈Si 为 i 的战略(类型依存的) ●Θ =Θ 1×Θ 2×…×Θ I,而θ i∈Θ i 为 i 的类型 ●Ui(si;s-I;θ i) ●F(θ )=F(θ 1,θ 2,…,θ I)为联合分布函数;密度 函数 P(θ 1,θ 2,…,θ I)与条件概率 Pi(θ -i/θ i)为 共同知识(K.N)
例:囚犯两难(困境)矩阵博弈与博弈树的转换
(-5,-5) C B○ C A○ DC B○ DC (-2,-2) C (-10,0) DC (0,-10)
01-3-2
15
五、均衡(Equilibrium)
静态 完全信息 不完全信息
NE
动态
SPNE
BNE
PBNE
01-3-2
16
纳什均衡(NE)
1、定义: ●战略 S*=(s*1,s*2,…,s*n)为 NE 战略等价 于 对 k=1,2,…,n,有 s*k∈arg〃Max{Uk(s*k,s*-k)} ●也就是说, 在均衡战略下, 如果他人不改变战略, 任意参与人不会单方面改变战略
01-3-2 8
2、博弈规则(续)
●“兵来将挡、水来土掩” ●“以不变应万变”“以静制动” 、 ●毛主席语录: “人不犯我,我不犯人;人若犯我,我 必犯人”—这里, 人的行动集:{犯;不犯}; 人的战略集:{犯;不犯} 我的行动集: {犯;不犯}
01-3-2 9
2、博弈规则(续)
而我的战略集合:{s1,s2,s3,s4} 其中,s1=(犯,犯) 2=(犯,不犯) ;s s3=(不犯,犯) 4=(不犯,不犯) ;s 上述例子,我的战略为 s2 (6)支付(Payoff) : UK(s1,s2,…,sn)=UK(sk,s-k)
01-3-2
则,VG(σG,σL)=θVG(1,γ)+(1-θ)VG(0,γ)
=-γ(2θ-1)+3θ
22
●由 VG(σG,σL)=θ[5γ-1]-γ 得到政府的反应对应: θ=0,当γ<0.2;θ∈[0,1],当γ=0.2;θ=1,当 γ>0.2 ●由 VL(σG,σ L)=-γ[2θ-1]+3θ 得到流浪汉的反应 对应:γ=1,当θ<0.5;γ∈[0,1],当θ=0.5;γ =0,当θ>0.5 ● NE: (σ*G,σL*) σ*G=(0.5,0.5) σL*=(0.2,0.8)
01-3-2
¥490
13 10 4 10
8 13
●百年夫妻:纯战略 NE 不存在
20
3、NE 战略存在性定理(Nash,1950) :
每个有限博弈至少存在一个 NE(纯战略或混合战略) ●混合战略(Mixed Strategy) :关于纯战略集的概率向量 σk=(σk,1,σk,2,…,σk,nk) ●例:社会福利博弈 寻找工作 救济 政府 不救济
01-3-2
10
2、博弈规则(续)
●博弈:规定谁在什么时候行动;行动时知道了什么; 有什么可供选择;得到多少 ●有限博弈:参与人有限;行动集合有限 ●博弈规则为共同知识的博弈称为完全信息博弈 ●所有参与人在行动时均知道其他参与人之前的行动 的博弈称为完美信息博弈 ●完美→完全;不完全→不完美
01-3-2 11
01-3-2 34
3.BNE: {Si*(· iI=1 满足:对任意的θ i∈Θ i,有: )} Si*(θ i)∈ arg.Maxsi(θ i){∑ui(si,s-i;θ i)P(θ -i/θ i)} i=1,2,…,I
01-3-2
35
例 1:Duopoly Cournot Model 反需求函数:Pi=a-qi-qj,i、j=1,2 利润函数:п
01-3-2 4
三、非合作博弈
1.引例 (1)零和博弈(对抗性) ●猜拳 ●打牌、下棋 (2)非零和博弈 ●囚犯困境 ●体育比赛
01-3-2
●航空公司价格战
5
2、博弈规则
(1)参与人(Players) : ●k=1,2,…,n(虚拟参与人——自然) ●参与人是理性的(即谋求效用最大化) (2)参与人的行动集(Action Set) : ●行动 ak∈AK(行动集合) ,k=1,2,…,n ●行动组合(Profile) : a=(a1,a2,…,an)=(ak,a-k)∈∏Ak
01-3-2
31
(贝叶斯纳什均衡)BNE
1.引例 t21 2 1 1 U D
01-3-2
t22 R 0 2 3 0 4 0 0 4
32
L
L 0
R 1 2 1
3 1 0
● 参与人 2 有两种类型:t21 与 t22,其战略为类型依存的, S2(t2) :从类型空间到战略空间的映照 ● 参与人 1 对参与人 2 的类型有先验概率 P 2)(1/2, (t : 1/2) ● 验证: 1*,S2*)为 NE,其中 S1*=U; (S S2*(t2)=L,若 t2=t21;S2*(t2)=R,若 t2=t22 证明:给定 S2*,求参与人 1 的期望效用: 若 S1=U,则п 1=1/2×3+1/2×2=5/2 若 S1=D,则п 1=1/2×0+1/2×2=2 所以,给定 S2*,S1*=U 为参与人 1 的最优战略
01-3-2
24
SPNE
1.引例:市场进入博弈 Entrant (E) Out I (Incumbent) (0,2) F (-3,-1)
01-3-2
A (2,1)
25
●2 个纯战略 NE: {Out;Fight If In};{In;Accommodate If In} ●NE{Out;F If In}在均衡路径上最优;但在非均衡路径上 (右枝)非最优:若 E 真的 In,I 的选择将是 A ●{Out;F If In}是不合理的;I 的威胁是不可臵信的(InCredible) ●那么,如何剔除基于不可臵信威胁的不合理的 NE? ●Selten(1975)引进 子博弈精练纳什均衡(SPNE)的概 念
01-3-2
30
求解的一般过程 ● Maxa2∈A2{U2(a1,a2)}→反应函数 a2=R2(a1) ● Maxa1∈A1{U1(a1,a2(a1) )}→反应函数 a*1 ● 得到:SPNE (a1;R2(a1); ) 均衡结果(Outcome)(a*1;R2(a*1) : ) 例:Stackelberg(1934) :Leader-Follower Model
01-3-2 23
●另解(支付最大法) : 一阶条件(FOC) : dVG/dθ=0;dVL/dγ=0 γ*=0.2;θ*=0.5 ●为什么 VG 对θ求偏导,却得到γ? ●流浪汉的混合战略如何直观理解?(HarSanyi)— 设有 100 个流浪汉,则大约 20 个在寻找工作;另 外的 80 个在游荡
第六讲 博弈论基础
一.博弈论的发展阶段
1.传统阶段: ●Theory of Oligopoly: Cournot(1838) Betrand(1883) ●Theory of Bargaining: Edgeworth(1887) Hicks(1932) 2.现代阶段: ●Von Neumann & Morgenstern (1944)
四、博弈的表示方式
1.矩阵博弈 例:囚犯困境 囚犯 B C
囚 犯 C A -5 -5 0 -2 0 -2
DC
-10
DC -10
01-3-2
12
例:性别战(Battle of
●新婚夫妇: Opera Opera Sandy Football ●百年夫妻: Opera Opera Sandy Football
01-3-2 6
2、博弈规则(续)
(3)行动的先后顺序 ●静态(Static 同时) ●动态(Dynamic 先后) (4)信息结构:参与人在行动时知道了什么 (5)战略(Strategy) S=(s1,s2,…,sk)=(sk,s-k) ∈∏Sk
01-3-2 7
2、博弈规则(续)
●参与人 k 的战略应说明 k 在各种可能情况下的行动 方针,如:胡荣华与赵国荣下一盘象棋,胡自始至 终的行动计划称为“战略” ;而每一步棋称为“行 动” ●静态时,战略=行动 ●动态时,战略≠行动
01-3-2
Sexes)
Paul Football
1 0 Hale Waihona Puke Baidu 1 0 2
2 0
Paul Football
0 1 0 1 2 0
2 0
13
2、博弈树
例:欧盟航空公司空中争夺战 中陆 ¥380 法航 380 490 380 ¥490 法航 490
(8,8) (13,4) (4,13) (10,10)
01-3-2 14
<The Theory of Games & Economic Behavior> ●John Harsanyi & John Nash & Reinhard Selten
01-3-2 1
3、应用阶段
(1)宏观经济学:●政策动态一致性(SPNE) ●劳动力市场 ●(金融)信贷市场 (2)微观经济学 ●外部性 ●公共产品的投资激励 ●工资(薪酬)决定
01-3-2 26
2、子博弈(Sub-Game) : ●始于单结点信息集的决策结点 ●包括该决策结点的所有后续结点与终结结点 ●不能切割信息集 例: 2 ○ 3○
01-3-2
1 ○ ○2 3○ ○3
27
3○
3、SPNE:原博弈的 NE;且在每个子博弈上均构成 NE 4、SPNE 的求解: 例 1.市场进入:SPNE: (In;A If In) 例2. 3○ l 2 0 1
01-3-2
○1 2○ r a l 0 -1 7 b ○3 r -2 2 28 0 -1 3○ 5 l r 6 3 5 1 4 2 4
① L (-1,5,6) a (5,4,4) L 1○ R
01-3-2
R ② b (0,-1,7)
(-1,5,6)
(5,4,4)
29
● SPNE(s1,s2,s3) 1={R};s2:a If 1 Plays R; :s s3:=r,If 1 Plays L; =r,If L Plays R and 2 Plays a; =l,If L Plays R and2 Plays b ● 均衡结果: (R;a;r)
01-3-2 2
应用阶段(续)
(3)市场营销 ●Sales Force Mgt. ● Channel Mgt. ● Pricing Startegy (4)产业组织理论 ● 市场竞争与 R&D 竞争 ● 市场进入与反进入 ● 广告方法选择
01-3-2
● 产业规制
3
二、合作博弈
● Cartel (OPEC) ● RJVs ● 合作讨价还价模型(Nash,1950) : Max{(X1-D1) 2-D2)} (X S.T. X1+X2≤1 其中, 1、 2 分别为 1 与 2 的初始禀赋, D D 成为威胁点 (Threat Point) ,产权配臵改变 D1、D2。 当 D1=D2,X1=X2=1/2
01-3-2
流浪汉 游荡
-1 3
3
2
-1
1
0
0
21
●纯战略 NE 不存在 ●求混合战略 NE: 设政府的混合战略 σG=(θ,1-θ) 设流浪汉的混合战略 σL=(γ,1-γ) =θ[3γ+(-1) (1-γ)]+(1-θ)[-γ+0(1-γ)] =θ(5γ-1)-γ VL(σG,σL)=γVL(θ,1)+(1-γ)VL(θ,0) =γ[2θ+(1-θ)]+(1-γ)[3θ+0(1-θ)]