经济博弈论3
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
原告 不指控
(0,0)
指控
若rx<p
要求S
被告 拒绝 原告 接受
(s-c,-s)
起诉
(rx-c-p,-rx-d)
放弃
(-c,0)
要挟诉讼:rx <p 子博弈完美纳什均衡: 原告选择(不指控, 要求,放弃) 被告选择(拒绝) 均衡结果:原告不指 控。
原告 不指控
若rx<p
指控 要求S 被告
(0,0)
例3:炸弹引爆
1
不给 给 (-1,1) 炸 (-∞,-∞)
2
不炸
(0,0)
3.2.2 逆推归纳法
定义:从动态博弈的最后 一个阶段博弈方的行为开 始分析,逐步倒推回前一 个阶段相应博弈方的行为 选择,一直到第一个阶段 的分析方法,称为“逆推 归纳法”。
乙
借
甲 分 不分
不借
(1,0)
逆推归纳法是动态博弈分 (2,2) 析最重要、最基本的方法。
c1 c2 2
2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12 u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2 6q2 q1q2 q2
厂商1 厂商2 产量 3单位 1.5单位 得益 4.5 2.25
可信度的建立
雇 用 谈 判 代 理 人
通 过 团 队 合 作 建 立 可 信 度
小 步 前 进
让 后 果 超 出 你 的 控 制
破 釜 沉 舟
切 断 沟 通
写 下 合 同
建 立 和 利 用 一 种 信 誉
建 立 可 信 承 诺 的 八 种 方 法 :
称或可要 为从信想 承属,使 诺的必一 。行须个 动采策 。取略 这一行 种个动 行附变 动加得
3.4 几个经典动态博弈模型
3.4.1 3.4.2 3.4.3 3.4.4 寡占的斯塔克博格模型 劳资博弈 讨价还价博弈 委托人—代理人理论
3.4.1 寡占的斯塔克博格模型
先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而非同 时选择即可。
Q q1 q2 , P P(Q) 8 Q
(0,4)
3.3 子博弈和子博弈完美纳什均衡
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡 3.3.3 承诺行动
3.3.1 子博弈
由一个动态博弈第一阶段以外的某 阶段开始的后续博弈阶段构成的, 有初始信息集和进行博弈所需要的 全部信息,能够自成一个博弈的原 博弈的一部分,称为原动态博弈的 一个“子博弈”。 子博弈是一个对于所有参 与人的信息集来说都是单 结的结,由这个结的后续 结、终点结以及在相应的 终点结处的支付这三个要 素所组成的博弈。
接受
不接受,出S
[S2 , (1 S2 )]
[ 2 S , 2 (1 S )]
无限回合讨价还价博弈
思路: 对于一个无限阶段博弈而言,无论博弈从第三阶 段开始(假如能达到)还是从第一阶段开始,博弈 结果完全一样。
无限阶段讨价还价博弈中, 1 S* 1方第一阶段出价
(10,4)
3.1.2 动态博弈的基本特点
策略是完整的行动计划
策略是行动的规则而不是行动 本身; 静态博弈中,策略与行动是相 同的
仿冒 B 制止 仿冒 (-2,5) B
A 不仿冒 不制止 (0,10) A 不仿冒
结果是一个策略组合,构成 一条路径
制止
(2,2)
不制止 (5,5) (10,4)
第一阶段:工会决定工资率; 第二阶段:厂商决定雇用多少劳动力 逆推归纳法分析: 先分析第二阶段厂商 的选择。
max ( w, L) max [ R( L) wL ]
L0 L 0
R 斜率为W R(L) WL
厂商利润最大化一阶条件:
R( L* ) w* 0
0
L* (W )
厂商的反应函数
3.1 动态博弈的表示法和特点
3.1.1 阶段和扩展型表示 3.1.2 动态博弈的基本特点
3.1.1 阶段和扩展型表示
阶段:动态博弈中一个博弈方的一次选择行为 例子:仿冒和反仿冒博弈
A 仿冒 B 制止 仿冒 (-2,5) 制止 (2,2) B 不仿冒 不制止 (0,10) A 不仿冒
不制止 (5,5)
每组得益对应每条路径,而 不是对应每步选择、行为
3.2 可信性和逆推归纳法
3.2.1 可信性问题 3.2.2 逆推归纳法
3.2.1 可信性—动态博弈中心问题
例1:开金矿博弈——分钱和打官司的可信性
借 甲 乙 不借 不分 (1,0) 乙 借 甲 不借 乙 借 甲 不借
分
(2,2)
分
(2,2)
(1,0) 不分 乙 不打 (0,4)
阻止市场进入与剩余生产能力
容纳 (900,300) 进入
B
商战 (-200,600)
A
不进入 (0,2200)
最低价格保证
保证最低价格:顾客在本店购货后一 个月内,若发现同一商品在其他商店 价格更低,本店保证退还差价,并补 偿差额的10% 广告法规定厂商必须履行其广告中的 声明,即最低保证条款是可以通过法 律强制执行的合同 最低价格保证的实质
第三章 完全且完美信息动态博弈
本章讨论完全且完美信息动态博 弈。本章将对动态博弈分析的概念和 方法,特别是子博弈完美均衡和逆推 归纳法作系统介绍,并介绍几类经典 的动态博弈模型。
3.1 3.2 3.3 3.4 3.5 3.6
动态博弈的表示法和特点 可信性和逆推归纳法 子博弈和子博弈完美纳什均衡 几个经典动态博弈模型 有同时选择的动态博弈模型 动态博弈分析的问题和扩展讨论
原告 不指控
(-p,0)
指控
若rx<p
要求S
被告 拒绝 原告 接受
(s-c-p,-s)
起诉
(rx-c-p,-rx-d)
放弃
(-c-p,0)
从被告角度考虑:大企业或大人物也可 通过承诺行动使自己避免遭受无端指控, 如提前支付律师费y。此时赔偿区域为 [rx,rx+d-y],可能使原告提出指控的条 件不成立。即,即使有rx+d/2>c+p,但 rx+(d-y)/2>c+p也可能不满足。
三回合讨价还价: 第一回合,甲提出自己得S1,乙得10000-S1,乙 可以接受或者拒绝。乙若接受双方得益分别为S1和 10000-S1,谈判结束,若乙不接受,进入下一回 合; 第二回合,乙提出方案为甲得S2,自己得10000S2,甲选择是否接受,接受则双方得益分别为δS2 和δ(10000-S2),谈判结束,若甲不接受则进入下 一回合; 第三回合,甲提出自己得S,乙得10000-S,这时 乙必须接受,双方实际得益分别为δ2S和δ2(10000S)
(0,4)
打
(1,0) 开金矿博弈
(1,0) 不分 分 乙 (2,2) 不打 打 (-1,0) (0,4)
有法律保障的开金矿博弈 ——分钱打官司都可信
法律保障不足的开金矿博弈 ——分钱打官司都不可信
例2:进入博弈
容纳 进入
(900,1100)
B
商战
(-200,600)
A
不进入 (0, 3000)
3.3.2 承诺行动
包含不可信策略的纳什均衡不再是 子博弈完美纳什均衡,如果参与人 在博弈之前采取某措施改变自己行 动空间或支付函数,将原来不可信 的威胁或许诺变为可信,则博弈均 衡相应改变。这些为改变博弈结果 而采取的措施称为“承诺行动”。
例:要挟诉讼(nuisance suits)
要挟诉讼是指这样一类诉讼,原告胜诉的可能性非常 小,目的是希望通过法庭外和解,从被告那里得到补 偿。 此类博弈有两个博弈方:原告和被告 行动顺序 - 原告决定是否指控被告,指控成本c; - 如果决定指控,原告要求被告支付s>0,私了; - 被告决定接受还是拒绝原告要求; - 如果被告拒绝,原告决定是放弃还是向法庭起诉,原 告的起诉成本(包括律师费用)为p,被告的辩护成本 为d; - 如果案子到了法庭,原告将以r的概率赢得x的支付。
先行优势
先行优势与后动优势
例一
左 上 甲 下 4, 12 3,12
乙 中 3,10 2,10 右 2,12 1,11 甲有后动优势
例二
左 上 甲 下 10,0 10,100
乙 右 5,4 5,0 甲有先行优势 乙有后动优势
3.4.2 劳资博弈
背景:在一个劳动力市场上存在一个垄断性质 的工会,工会决定工资率,而厂商根据工资来 决定需要雇佣多少工人。工会的效用函数为 U(w,L),w为工会提出的工资水平,L为雇佣人 数。 工会得益为效用函数U(w,L),为w和L的增函数; 厂商利润函数为π(w,L)=R(L)-wL,R(L)为企业 雇佣L名工人可获得的收入,R(L)为凹函数, 即R’(L)>0, R”(L)<0
甲 分 (2,2)
子博弈本身就 是一个博弈!
乙
借
不借
(1,0) 不分 乙 (0,4)
(-1,0)
1
1
2
2
2
2
1
1
1
包括本身,存在5个子博弈
只有3个子博弈
纳什均衡的问题
在第三种开金矿博弈中, (不借-不打,不分) 和(借-打,分)都是纳什均衡。但后者不可信, 不可能实现或稳定。
结论:纳什均衡在动态博弈可能缺乏稳定性,也就 是说,在完全信息静态博弈中稳定的纳什均衡,在 动态博弈中可能是不稳定的
根源:纳什均衡本身不能排除博弈方策略中包含的 不可信的行为设定,不能解ห้องสมุดไป่ตู้动态博弈中的可信性 问题
3.3.2 子博弈完美纳什均衡
定义: 如果一个完美信息的动态博弈中,各 博弈方的策略构成的一个策略组合满 足在整个动态博弈及它的所有子博弈 中都构成纳什均衡,那么这个策略组 合称为该动态博弈的一个“子博弈完 美纳什均衡”。
子博弈完美纳什均衡是适合动态博弈的 新的均衡概念: (1)它是纳什均衡,具有策略稳定性; (2)不能包含任何不可信的威胁或许 诺(在每个子博弈上都是纳什均衡)
结论: (1)该均衡本身也为纳什均衡,且为比 纳什均衡更强的均衡概念; (2)求解动态博弈最基本方法:逆推归 纳法。 此法可消除不可信的威胁或许诺,所 得到的策略组合不存在不可信行为。
三回合讨价还价
S1 1 2 S
甲 提议S1
S2 S 乙
接受
不接受,出S2
S
接受
甲 不接受,出S
本博弈关键: 第一,在第三回合甲提出的 方案(S:10000-S) 有强制 力,即此时乙必须接受,且 这一点双方都知道; 第二,该博弈多进行一个回 合总得益就下降一个比例, 因此让谈判拖得越长对双方 都可能越不利。 假设任一博弈方只要得益不 小于下一回合自己能得到的 得益,会接受对方出价。
L
逆推归纳法: 第二步,回到第一阶 段工会的选择。 工会的最优选择为使 它的无差异曲线与L(w) 曲线相切,(w*,L*)为子 博弈完美纳什均衡
max u[ w, L* ( w)]
W 0
W
w*
0
L* (w* )
L* (w)
u3 u2 u1 u0
L
工会的无差异曲线
3.4.3 讨价还价博弈
拒绝 原告 起诉
接受 (s-c,-s) 放弃
(rx-c-p,-rx-d)
(-c,0)
考虑承诺行动。 从原告角度考虑:如果原告将诉讼费p提前支 付给律师,那么在博弈的最后阶段,只要 rx-c-p>-c-p,即只要胜诉的概率大于0,原告 将起诉。 若s<rx+d,被告将接受原告赔偿请求。s的范 围[rx,rx+d]。假定双方讨价还价能力相同,赔 偿结果为rx+d/2; 如果rx+d/2>c+p,原告提出指控;即使 rx<c+p,由于d值大,rx+d/2>c+p仍有可能。 最后的得益结果(rx+d/2-c-p,-rx-d/2),案件私 了。
结论
作为博弈方你不应该仅仅是个被动的参与人,满 足于接受别人制定的博弈规则,而应该设法改变 博弈使其尽量对自己有利 可置信的承诺能够促进长期利润,但承诺方也确 实因此而对自己的行动施加了严格的限制。这种 通过限制自己行动来获取竞争优势的做法被称为 策略性行为 “一种策略性行为就是某人通过影响其他人对自 己行为的预期,来促使其他人选择对自己有利的 策略,是某人通过限制自己的行为来限制其对局 者的选择”(2005年诺贝尔经济学奖得主托马 斯·谢林)
(S1 ,1 S1 )
[S2 , (1 S2 )]
[ 2 S , 2 (1 S )]
当0.5 1时,越大,
1
提议S1 2 接受 1 不接受,出S2
1方得益越大, 2方得益越小 当0 0.5时,越大, 1方得益越小, 2方得益越大
(S1 ,1 S1 )