金融数学博弈课件第二章1

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
q2 0 q2 0源自文库
a q1 c R2 (q1 ) 2 已知 q1 a c, 这与同时行动的古诺模型中得出的结 果相同. 但两者不同之处在于这里的R2 (q1 )是企业2对 企业1 已观测到的产量的真实反应, 而在古诺模型中 R2 (q1 )是企业2对假定的企业1的产量的最优反应. 且 企业1的产量选择是和企业2同时作出的. 由于企业1也 和企业2一样解出企业2的最优反应, 企业1就可以预测 到他如选择 q1, 企业2将根据 R2 (q1 )选择产量. 那么在 在博弈的第一阶段,企业1的问题就可表示为 max 1 (q1, R2 (q1 )) max q1 [a q1 R2 (q1 ) c] q 0 q 0
第二章 完全信息动态博弈
( Dynamic Games of Complete Information ) 在第一章完全信息静态博弈( Static Games of Com plete Information )中,要求参与者同时选择战略或行 动,且只能选择一次. 但很多博弈参与者的行动选择 并非同时,而是有先后顺序的. 而且参与者的行动选择 并非一次,甚至可以有无限次. 这种博弈就是动态博弈 完全信息:参与者的收益函数是共同知识. 完全且完美信息: 博弈进行的每一步当中,要选择 行动的参与者都知道这一步之前博弈进行的整个过程. “动态博弈具体描述参与人在战略情形中所遇到的序列 结构. 该模型允许我们研究这样的解,即每个参与人不 仅可以在博弈开始时考虑他的行动计划,且在任何一个
1
由上式可得
a q1 c max q1 q1 0 2
1
ac ac q , q2 R2 (q1 ) 2 4 这就是斯塔克尔贝里双头垄断博弈的逆向归纳解. 斯塔克尔贝里模型解与古诺模型解的比较 1)古诺博弈纳什均衡产量 3 ac ac 2 * * q1 q2 (a c) (a c). 4 3 3 3 从而在斯塔克尔贝里博弈里相应的市场出清价格就比 较低. 3 1 3 2 1 2 * * PS a (a c) a c, PC a (a c) a c, 4 4 4 3 3 3 1 * PS PC (c a) 0, PS* PC . 12 不过在斯塔克尔贝里博弈中,企业1完全可以选择
企业1在斯塔克尔贝里博弈中利润的增加必定意味着企 业2利润的减少. 而在古诺博弈中两个企业的利润相等. 这一结果揭示了单人决策问题和多人决策问题的一个 重要不同之处. 在单人决策理论中,占有更多信息的绝 不会对决策者带来不利,然而在博弈论中, 了解更多信 息 (或者更为准确地说,是让其他参与者知道一个人掌 握更多信息)却可以让一个参与者受损. 在斯塔克尔贝里博弈中,存在问题的信息是企业的 产量:企业2知道 q1 , 并且(重要的是)企业1知道企业2知 道 q1. 于是企业1可以利用先动优势对企业2用诈! 也即 企业1可以事先让企业2知道一个虚假产量,如果企业2 相信企业1的虚假产量,则企业2将会选择对虚假产量的 最优反应产量,而企业1实际上选择的产量却是对企业2
(3) 在第三阶段的开始,参与人1得到1美元的S 参 与人2 得到1-S. 这里 0 S 1. 下面求解此三阶段博弈的逆向归纳解: 首先计算如果博弈进行到第二阶段,参与人2 可能 提供的最优条件, 参与人1拒绝参与人2 在这一阶段的 条件S2 ,可以在第三阶段得到S,但下一阶段的S 在当 期的价值为 S , 那么当且仅当 S2 S 参与人会1才接受 S2(我们假定当接受和拒绝无差异时,参与人总是选择接 受条件). 从而参与人2 在第二阶段的决策问题就可归于 在本阶段收入 1 S (通过向参与人1提出条件,给他 S2 S ) 和下阶段收入1 S(通过向参与人1提条件,给 他任意 S2 S ) 之间作出选择. 后一选择的贴现值为 (1 S ), 小于前一选择可得的1 S , 于是参与人2在第
P(Q) a Q (市场出清价格) Q q1 q2 (市场上的总产量) c是生产的边际成本(固定成本为0). 为求解此博弈的逆向归纳解, 首先计算企2 对企业1 任意产量的最优反应 R 2 (q1 ) 应满足: max 2 (q, q2 ) max q2 [a q1 q2 c],
弈中的“同时行动”不一定指时间意义上的, 只要双反 没有信息交流即可. (2.1C自己阅读) 2· 1· D 讨价还价博弈(分钱博弈)— 序贯谈判 三阶段谈判:参与人1和2 就一美元的分配进行谈 判. 他们轮流提出方案: 首先参与人1 提出一个分配建 议,参与人1提出一个分配建议,参与人2可以接受或 拒绝;如果参与人2 拒绝,就由参与人2 提出分配建 议,参与人1选择接受或拒绝; 如此一直进行下去. 一 个条件一旦被拒绝,它就不再有任何约束力,并和博 弈下面的进行不相关. 每个条件都代表一个阶段. 参与人都没有足够的 耐心: 他们对后面阶段得到的收益进行贴现,每一 个 阶段的贴现因子为 , 0 1.
两个参与者如何选择呢? 如果参与者1相信这一威胁,他的最优反应是支付 1000美元给参与者2, 参与者2 接受,博弈结束. 但参 与者1却不会对这一威胁信以为真,它不可臵信. 所有 动态博弈的中心问题是可信任性. 完全且完美信息动态博弈 手雷博弈属于下面简单类型的完全且完美信息动 态博弈:(两人两阶段动态博弈) 1. 参与者1 从可行集A1中选择一个行动a1, 2. 参与者2观察到a1后,从可行集A2中选择一个行 动a2, 3 两人的收益分别为 u1 (a1 , a2 ) 和 u2 (a1 , a2 ). 逆向归纳法( backward induction )求解此博弈如下:
a2 A2
max u1 (a1 , R2 (a1 ))
a1A1
假定参与者1的这一最优化问题也有唯一解, 表示为 a , 我们称 (a1 , R(a1 ))是这一博弈的逆向归纳解.此逆向归纳
1
解不含有不可臵信的威胁: 参与者1预测参与者2将对 1的可能选择的任何行动a1 做出最优反应, 选择行动 R2(a1) ;这一预测排除了参与者2不可臵信的威胁,即 参与者2 将在第二阶段到来时做出不符合自身利益的反 应. 例子:逆向归纳法背后的理性假设. 考虑下例三 阶段两个参与者的动态博弈, 其中参与者1有两次行动. 博弈的解或博弈的结果: 1 R 参与者选择L,博弈结束. L 2 R1 L1 博弈的逆向归纳解表示为 1 (2 , 0) R2 (L,X). L (1 , 1) 2 结论:参与者是理性的是“共同 (3 , 0) (0 , 2) 知识”是逆向归纳法背后假设.
关于他的虚假产量最优反应产量的最优反应产量, 使 企业2受损. 因为企业2的产量不是对企业1的最优反应. 但是,企业2未必一定上当! 另一个角度,假设企业1先选择产量 q1 , 之后企业2 选择产量 q2 , 但事先并没有观测到q1. 如果企业2 相信 q 企业1选择了它的斯塔克尔贝里产量 1 (a c) 2 , 则 ) (a c) 4. 但是,如 企业2的最优反应产量仍是 R2 (q1 果企业1预测到企业2将持有这一推断并选择这一产量, 企业1就会倾向于它对 (a c) 4的最优反应产量3(a c) 8 而不愿意去选择斯塔克尔贝里产量(a c) 2 , 那么企业 2就不会相信企业1选择了斯塔克尔贝里产量. 于是,此 时动态博弈的唯一纳什均衡产量是古诺博弈时的纳什 均衡产量. 也就是静态博弈同时行动的. 这说明静态博
(2, 2) (0, 4) 易知此博弈的逆向归纳解为: 乙选择不借,博弈结束. 博弈的逆向归纳解: (不借,X ) 直观解释为:乙没有理由相信甲的“承诺”.
版本2:法律保障不 借 不借 充足的开金矿博弈 甲 还 博弈逆向归纳解: 不还 (1, 0) 乙 (不借,X ) 起诉 放弃 (2, 2) (-1, 0) (0, 4) 版本2:法律保障 借 充足的开金矿博弈 不借 甲 博弈逆向归纳解: 还 不还 (1, 0) (借,还) 乙 起诉 放弃 (2, 2) (1, 0) (0, 4) 乙
下面是对三阶段谈判博弈时序的更为详细的描述: (1a)在第一阶段时.参与人1建议他分走1美元的S1, 留给参与人2 的份额为1-S1. (1b) 参与人2或者接受这一条件(此时博弈结束, 参与者1的收益为S1,参与人2 的收益为1-S1,都可立 即拿到)或者拒绝这一条件(博弈将继续进行,进入第 二阶段) (2a)在第二阶段的开始,参与人2 提议参与人1分得 1美元的S2 ,留给参与人2 的为1-S2.(请注意在阶段 t , St 总是表示分给参与人1的,而不论是谁提出的条件) (2b) 参与人1 或者接受条件(此时博弈结束,参与人 1的收益为S2,参与人2 的收益为1-S2 都可立即拿走) 或者拒绝这一条件(此时博弈继续进行,进入第三阶段)
1
于是
古诺均衡产量 (a c) 3 , 这时企业2的最优反应产量同 样是古诺均衡产量,但企业1却选择了其它产量 ,那 么企业1在斯塔克尔贝里博弈中的利润 一定高于其在古 诺均衡中的利润. 但斯塔克尔贝里博弈中的市场出清价 格降低了,从而总利润水平也会下降. 2 1 2 1 2 1 * C a c c (a c) a c (a c) 3 3 3 3 3 3 2 6 2 2 (a c) (a c) . (古诺纳什均衡时的总利润) 9 27 1 3 3 1 3 1 * S a c c (a c) a c (a c) 4 4 4 4 4 4 3 6 2 (a c) (a c) 2 . (斯塔纳什均衡时的总利润) 16 32
不得不做决策的时点上,他都可以考虑他的行动计划 . 与此相反,静态博弈限于这样的解,即每个参与者选 择且仅选择一次他的行动计划,这个计划可包纳无数 的变数,但静态博弈在博弈中的某些事件已知后则不 允许参与者去重新考虑他的行动计划.”(马丁 J. 奥斯 本博弈论教程87页) 动态博弈分为 完美信息和非完美信息动态博弈. 2.1 完全且完美信息动态博弈 2.1. A 理论:逆向归纳法 一个两步博弈例子. 第一,参与者1选择支付1000 美元给参与者2 还是 一分不给;第二,参与者2观察到参与者1的选择,然 后决定是否引爆一颗手雷把两个人一块炸死.
当在博弈的第二阶段参与者2行动时,由于其前参 与者1已选择行动a1,他面临的决策问题可用下式表示 为 max u2 (a1 , a2 )
假定对A1中的每一个a1,参与者2的最优化问题只 有唯一解, 用R2(a1) 表示. 这就是参与者2对参与者1行 动的最优反应函数. 由于参与者1能和参与者2一样解出 2的问题, 参与者1可以预测到参与者2对1每一个可能的 这样1在第一阶段要解决的问题可 行动a1所做出的反应, 归结为:
“开金矿博弈”(3个版本)(经济博弈论基础) 甲欲开发一个价值4万元的金矿,缺少1万元资金, 乙有1万元的资金可以投资. 甲想说服乙借给他,并答 应分给乙2万元,乙是否应该借给他? 可将此问题看作一个 两个阶段两个参与者的动态 博弈. 乙 借 版本1:无法律保障 不借 甲 的开金矿博弈 还 不还 (1, 0)

2· 1· B 斯塔克尔贝里(Stackelberg)双头垄断模型 博弈的时间顺序如下 (1) 企业1选择产量 q1 ; (2) 企业2观察到 q1以后, 然后选择产量 q2 ; (3) 企业i 的收益由下面的利润函数给出:
i (q1 , q2 ) qi [ P(Q) c] , i 1, 2.
相关文档
最新文档