博弈论及应用3
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 完全且完美信息动态博弈
本章讨论动态博弈,所有博弈方都对博 弈过程和得益完全了解的完全且完美信息动 态博弈。这类博弈也是现实中常见的基本博 弈类型。由于动态博弈中博弈方的选择、行 为有先后次序,因此在表示方法、利益关系、 分析方法和均衡概念等方面,都与静态博弈 有很大区别。
3.1 阶段和扩展性表示
Cont..
将式(1)代入企业1的的得益函数 u 1 (q1, q2) = 6 q1- q1 q2-q12 =3 q1 – q12 /2 max q1 (3 q1 – q12 /2) 一阶条件: 3 - q1*= 0 有 q1*=3 (单位), q2*=3 - q1* /2 = 1.5 (单位), 使 u 1= 4.5 , u 2 = 2.25 使市场总产量 Q =q1+q2=4.5, 得二企业总得益 U = u 1 + u 2 =4.5+2.25=6.75
Cont..
例1中,仿冒和反仿冒博弈的博弈方的“策略”(略) 二、动态博弈的结果 指各博弈方在上面类型的策略构成的策略组合下,各博弈 方的策略组合形成的一条联结各个阶段的“路径”的结果。 即:得益对应每条路径,而不是对应每步选择、行为 例1,例2中的“结果” 。 三、动态博弈的非对称性 先后次序决定动态博弈必然是非对称的。 先选择、行为的博弈方常常更有利,有“先行优势”。
不开发
N
需求大
N
需求小
A的选择,那么其信息集
虽然也是两个,但却与前 述的不同。博弈过程如图 所示。
B
开发
B B
B
不开发
(4,4)
(8,0)(-3,-3) (1,0) (0,8) (0,0)(0,1) (0,0)
举例:房地产开发(Ⅰ):另一种表述
在博弈中,自然的信息集 总是假定是单结的。因为自然 是随机行动的,自然在参与人
子博弈完美纳什均衡能够排除均衡策略中不 可信的威胁和承诺,因此是真正稳定的。 逆推归纳法是求完美信息动态博弈子博弈完 美纳什均衡的基本方法。
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格(Stackelberg) 模型 3.4.2 讨价还价博弈 3.4.3 委托—代理理论 3.4.4委托—代理理论(续)
(1,0)
乙
不投资
(1,0) 不分 乙 不打 (0,4)
乙的完整策略:第一阶段 有法律保障的开金矿博弈 选择“投资”,若第二阶段甲 ——分钱打官司都可信 选择“不分”,第三阶段选择“打” 甲的完整策略:第二阶段选择“分”。——动态博弈的解。
三、法律保障不足的开金矿博弈III的扩展形
不可信的空头威胁 乙在第三个阶段 “打官司”的威胁 是一种不可信的 空头威胁 (incredible empty threats)
用逆推归纳法 求子博弈完美纳什均衡
在第2个阶段,企业2是在企业1选择定 q1下求解: max q2 u 2 (q1, q2) = max q2 (6 q2- q1 q2- q22) 一阶条件: 6- q1 - 2q2=0 有企业2对企业1产量的反应函数: q2= ( 6 - q1 ) /2 = 3 - q1 /2 … (1)
注: (1)并不是任何博弈都有子 博弈 分 (2)博弈本身不是子博弈 (2,2) (3)必须有一个明确 的初始的信息集
乙 投资 甲 不分 乙
不投资
(1,0)
(-1,0)
(0,4)
3.3.2 子博弈完美纳什均衡——1965年selton
定义:如果一个完美信息的动态博弈中, 各博弈方的策略构成的一个策略组合 满足,在整个动态博弈及它的所有子 博弈中都构成纳什均衡,那么这个策 略组合称为该动态博弈的一个“子博 弈完美纳什均衡”。
根源纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定不能解决动态博弈的相机选择引起的可信性问题323逆推归纳法定义从动态博弈的最后一个阶段博弈方的行为开始分析逐步倒推回前一个阶段相应博弈方的行为选择一直到第一个阶段的分析方法称为逆推归纳法逻辑基础动态博弈中先行为的理性的博弈方在前面阶段选择行为时必然会考虑后行为博弈方在后面阶段中将会怎样选择行为只有在博弈方的最后一个阶段选择的不再有后续阶段牵制的博弈方才能直接做出明确选择
分 (2,2) 打
(1,0) 不分 乙 不打 (0,4)
(-1,0)
法律保障不足的开金矿博弈 结论:纳什均衡在动态博弈 ——分钱打官司都不可信 可能缺乏稳定性,也就是说, 在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能 是不稳定的,不能作为预测的基础。
Cont..
根源:纳什均衡本身不能排除博弈方策略中包含 的不可信的行为设定,不能解决动态博弈的相机选 择引起的可信性问题
3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
3.2.1 相机选择和策略中的可信性问题
动态博弈中博弈方的策略是他们自己预先设定的, 在各个博弈阶段,针对各种情况的相应行为选择 的计划。这些策略实施没有强制力,在实施中, 只要符合自己的利益就可以在博弈过程中改变计 划。这种问题称为“相机选择”(Contingent play) “相机选择”的存在,使得博弈方在各个阶段、 各种情况下会采取行为的“可信性”产生怀疑?
二、有法律保障的开金矿博弈II的扩展形
确实可信的威胁——通过法律武器 确实可信的威胁(credible threat) 投资 是指,博弈的参与人通过某种行动改 变自己的支付函数,从而使得自己的 甲 威胁显得可信。参与人为改变博弈结 分 果而采取的措施称为承诺 (2,2) (commitment) 打
3.1.2 动态博弈的基本特点
一、动态博弈的策略 1、完全信息静态博弈的策略和结果(略) 2、动态博弈的策略特点: 各博弈方的选择和行为 (1)行为有先后之分(2)博弈方要多次选择且每次选 择有内在联系,是不能分割的整体。 注:各博弈方在整个博弈中轮到选择的每个阶段,针对 以及由不同博弈方的这种计划构成的组合。这种计划就 是动态博弈的博弈方的策略
一、开金矿博弈I的扩展形
模型描述:
投资
乙 不投资
甲开采一价值4亿元的金矿 甲 不分 (1,0) 时缺1亿元资金,乙有1亿元可 分 投资资金。甲希望乙能投资自 (0,4) (2,2) 己1亿元资金用于开矿, 开金矿博弈 并许诺在采到金子后与乙对半分成 问题:乙是否该将钱投资给甲呢? 可信性 (Credibility)问题
3.2.3 逆推归纳法
乙 定义:从动态博弈的最后一个阶段博弈 投资 不投资 方的行为开始分析,逐步倒推回前一个 甲 不分 (1,0) 阶段相应博弈方的行为选择,一直到第 分 一个阶段的分析方法,称为“逆推归纳法” (0,4) (2,2) 逻辑基础:动态博弈中先行为的理性的博 开金矿博弈 弈方,在前面阶段选择行为时必然会考虑 后行为博弈方在后面阶段中将会怎样选择行为,只有在博弈方 的最后一个阶段选择的,不再有后续阶段牵制的博弈方,才能 直接做出明确选择。
房地产开发( Ⅱ )
A
开发
如果B在决策时并不
不开发
N
需求大
N
需求小
知道自然的选择,那么其
信息集就由原来的四个减 少为两个。博弈过程如图 所示。
B
开发
B B
B
不开发
(4,4)
(8,0)(-3,-3) (1,0) (0,8) (0,0)(0,1) (0,0)
房地产开发( Ⅲ )
A
开发
2) 打
不投资
(1,0) 不分 乙 不打 (0,4)
(-1,0)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
3.2.2 纳什均衡的问题
博弈中(不投资-不打,不分)和 (投资-打,分)都是纳什均衡。 但后者不可信,不可能实现或
稳定。为什么会出现这种情 况呢?
乙
投资
不投资
甲
N
需求大 需求小
A
开发
A
不开发
决策之后行动等价于自然在参
与人之前行动,但参与人不能 观测到自然的行动。博弈过程 也可以如图所示。
B
开发
B B
B
不开发
(4,4)
(8,0)(-3,-3) (1,0) (0,8) (0,0)(0,1) (0,0)
3.1.1动态博弈的表示法和特点
动态博弈 (Dynamic Games)的定义: 各博弈方的策略选择和行动有先后次序,而且后选择、后 行动的博弈方在自己选择、行动之前,可以看到其他博弈方 的选择、行动,甚至还包括自己的选择、行动的博弈. 注:动态博弈各个博弈方的选择行动有先后次序,每个 博弈方的选择行为会形成依次相连的时间阶段,因此博弈方 的一次选择称为一个“阶段”。也有可能存在几个博弈方同时 选择的情况,这些博弈方的一次选择也构成一个“阶段” 。一 个动态博弈至少有两个阶段。因此态博弈又称为多阶段博弈 (Multistage Games)
模型的均衡解
Stackelberg寡头竞争模型的子博弈完美纳什 均衡解: 企业1在第1个阶段选择产量q1为3 单位, 企业2在第2个阶段选择产量q2为1.5单位
产量 3单位 1.5单位 得益 4.5 2.25
先行优势
厂商1 厂商2
与Cournot模型的比较
与Cournot静态博弈模型的比较 Qs=3+1.5=4.5 > Qc=2+2=4 Ps=8 - Qs=3.5 < Pc=8 - Qc=4 Us= us1 + us2 =4.5+2.25=6.75 < Uc= uc1 + uc2 =4 + 4 = 8
(3)信息集
房地产开发(Ⅰ)
A
开发
两个房地产公司A和B一
不开发
个城市里开发房产,他们可以
分别选择是否开发,首先是A 决定是否开发,然后B决定是 否开发,同时,他们可能面临 不同的市场需求状况(大和 小)。
N
需求大
N
需求小
B
开发
B B
B
不开发
(4,4)
(8,0)(-3,-3) (1,0) (0,8) (0,0)(0,1) (0,0)
信息的悖论
在Stackelberg模型中企业1与2得益: u1= 4.5 > u2 = 2.25 信息不对称的博弈中,信息较多的博弈方有可 能吃亏 即是:尽管跟随企业看到了领头企业的决策, 掌握了更多的信息,但最终收益反而低。
假设条件: 1. 在一个寡头市场上两企业生产销售同质产品, 市场总产量Q =q1+q2 ,企业1是领头(leader)企业, 企业2是追随(follower)企业. 2. 市场出清价格 P=8 - Q 3. 生产无固定成本,边际成本 c=c1=c2=2 4. 二企业先后决定各自的产量q1≥0, q2 ≥ 0 问题:两个企业应如何决策? 该动态的寡头市场产量博弈是一无限策略动态 博弈
3.4.1 寡占的斯塔克博格(Stackelberg) 模型
假设市场上有两个厂商,决策内容是产量, 一个是领头(leader)企业,一个是跟随 (follower)企业。领头企业先选择自己的 产量,跟随企业根据领头企业的产量选择, 选择自己的产量。 显然,他们选择有先有后,所以是一个 动态博弈。
斯塔克博格(Stackelberg)模型
阶段:动态博弈中一个博弈方的一次选择行为
例 1:仿冒和反仿冒博弈
模型描述:略 扩展式表示:
制止 仿冒 B
A 不仿冒
不制止 (0,10)
A 不仿冒
仿冒
(-2,5) 制止 (2,2) B
不制止 (5,5) (10,4)
例2:市场进入阻挠(动态博弈)
假设条件: 企业A、企业B经营同样产品 企业A已占领市场;企业B想打进该市场 企业A完全知道企业B的行为 分析: 企业A与企业B对市场的占领有先有后,因此 该 博弈又称为:“先来后到"博弈
市场进入阻挠博弈的扩展形
Cont…
圈B与圈A分别是 企业B与企业A的 打进 决策结或选择节 点 (又称决策信 企业A 息集或选择信息 打击 集), 即两博弈方 各自轮到选择 (-2, 3) 的位置.
企业B
不进 (0, 10)
和平 (5, 5)
A
博弈树
(1)结 (2)枝
B A A A
B A
注:逆推归纳法是动态博弈分析最重要、基本的方法。
3.3 子博弈和子博弈完美纳什均衡 3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
3.3.1 子博弈
定义:由一个动态博弈第一阶段以外的 某阶段开始的后续博弈阶段构成 的,有初始信息集和进行博弈所 需要的全部信息,能够自成一个 博弈的原博弈的一部分,称为原 动态博弈的一个“子博弈”。
Stackelberg模型分析 企业1的得益(利润): u 1 (q1, q2) = P×q1 – c1×q1 = (8-Q) ×q1 - 2q1 = 6 q1- q1 q2- q12 企业2的得益: u 2 (q1, q2) = P×q2 – c2×q2 = (8-Q) ×q2 - 2q2 = 6 q2- q1 q2- q22
本章讨论动态博弈,所有博弈方都对博 弈过程和得益完全了解的完全且完美信息动 态博弈。这类博弈也是现实中常见的基本博 弈类型。由于动态博弈中博弈方的选择、行 为有先后次序,因此在表示方法、利益关系、 分析方法和均衡概念等方面,都与静态博弈 有很大区别。
3.1 阶段和扩展性表示
Cont..
将式(1)代入企业1的的得益函数 u 1 (q1, q2) = 6 q1- q1 q2-q12 =3 q1 – q12 /2 max q1 (3 q1 – q12 /2) 一阶条件: 3 - q1*= 0 有 q1*=3 (单位), q2*=3 - q1* /2 = 1.5 (单位), 使 u 1= 4.5 , u 2 = 2.25 使市场总产量 Q =q1+q2=4.5, 得二企业总得益 U = u 1 + u 2 =4.5+2.25=6.75
Cont..
例1中,仿冒和反仿冒博弈的博弈方的“策略”(略) 二、动态博弈的结果 指各博弈方在上面类型的策略构成的策略组合下,各博弈 方的策略组合形成的一条联结各个阶段的“路径”的结果。 即:得益对应每条路径,而不是对应每步选择、行为 例1,例2中的“结果” 。 三、动态博弈的非对称性 先后次序决定动态博弈必然是非对称的。 先选择、行为的博弈方常常更有利,有“先行优势”。
不开发
N
需求大
N
需求小
A的选择,那么其信息集
虽然也是两个,但却与前 述的不同。博弈过程如图 所示。
B
开发
B B
B
不开发
(4,4)
(8,0)(-3,-3) (1,0) (0,8) (0,0)(0,1) (0,0)
举例:房地产开发(Ⅰ):另一种表述
在博弈中,自然的信息集 总是假定是单结的。因为自然 是随机行动的,自然在参与人
子博弈完美纳什均衡能够排除均衡策略中不 可信的威胁和承诺,因此是真正稳定的。 逆推归纳法是求完美信息动态博弈子博弈完 美纳什均衡的基本方法。
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格(Stackelberg) 模型 3.4.2 讨价还价博弈 3.4.3 委托—代理理论 3.4.4委托—代理理论(续)
(1,0)
乙
不投资
(1,0) 不分 乙 不打 (0,4)
乙的完整策略:第一阶段 有法律保障的开金矿博弈 选择“投资”,若第二阶段甲 ——分钱打官司都可信 选择“不分”,第三阶段选择“打” 甲的完整策略:第二阶段选择“分”。——动态博弈的解。
三、法律保障不足的开金矿博弈III的扩展形
不可信的空头威胁 乙在第三个阶段 “打官司”的威胁 是一种不可信的 空头威胁 (incredible empty threats)
用逆推归纳法 求子博弈完美纳什均衡
在第2个阶段,企业2是在企业1选择定 q1下求解: max q2 u 2 (q1, q2) = max q2 (6 q2- q1 q2- q22) 一阶条件: 6- q1 - 2q2=0 有企业2对企业1产量的反应函数: q2= ( 6 - q1 ) /2 = 3 - q1 /2 … (1)
注: (1)并不是任何博弈都有子 博弈 分 (2)博弈本身不是子博弈 (2,2) (3)必须有一个明确 的初始的信息集
乙 投资 甲 不分 乙
不投资
(1,0)
(-1,0)
(0,4)
3.3.2 子博弈完美纳什均衡——1965年selton
定义:如果一个完美信息的动态博弈中, 各博弈方的策略构成的一个策略组合 满足,在整个动态博弈及它的所有子 博弈中都构成纳什均衡,那么这个策 略组合称为该动态博弈的一个“子博 弈完美纳什均衡”。
根源纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定不能解决动态博弈的相机选择引起的可信性问题323逆推归纳法定义从动态博弈的最后一个阶段博弈方的行为开始分析逐步倒推回前一个阶段相应博弈方的行为选择一直到第一个阶段的分析方法称为逆推归纳法逻辑基础动态博弈中先行为的理性的博弈方在前面阶段选择行为时必然会考虑后行为博弈方在后面阶段中将会怎样选择行为只有在博弈方的最后一个阶段选择的不再有后续阶段牵制的博弈方才能直接做出明确选择
分 (2,2) 打
(1,0) 不分 乙 不打 (0,4)
(-1,0)
法律保障不足的开金矿博弈 结论:纳什均衡在动态博弈 ——分钱打官司都不可信 可能缺乏稳定性,也就是说, 在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能 是不稳定的,不能作为预测的基础。
Cont..
根源:纳什均衡本身不能排除博弈方策略中包含 的不可信的行为设定,不能解决动态博弈的相机选 择引起的可信性问题
3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
3.2.1 相机选择和策略中的可信性问题
动态博弈中博弈方的策略是他们自己预先设定的, 在各个博弈阶段,针对各种情况的相应行为选择 的计划。这些策略实施没有强制力,在实施中, 只要符合自己的利益就可以在博弈过程中改变计 划。这种问题称为“相机选择”(Contingent play) “相机选择”的存在,使得博弈方在各个阶段、 各种情况下会采取行为的“可信性”产生怀疑?
二、有法律保障的开金矿博弈II的扩展形
确实可信的威胁——通过法律武器 确实可信的威胁(credible threat) 投资 是指,博弈的参与人通过某种行动改 变自己的支付函数,从而使得自己的 甲 威胁显得可信。参与人为改变博弈结 分 果而采取的措施称为承诺 (2,2) (commitment) 打
3.1.2 动态博弈的基本特点
一、动态博弈的策略 1、完全信息静态博弈的策略和结果(略) 2、动态博弈的策略特点: 各博弈方的选择和行为 (1)行为有先后之分(2)博弈方要多次选择且每次选 择有内在联系,是不能分割的整体。 注:各博弈方在整个博弈中轮到选择的每个阶段,针对 以及由不同博弈方的这种计划构成的组合。这种计划就 是动态博弈的博弈方的策略
一、开金矿博弈I的扩展形
模型描述:
投资
乙 不投资
甲开采一价值4亿元的金矿 甲 不分 (1,0) 时缺1亿元资金,乙有1亿元可 分 投资资金。甲希望乙能投资自 (0,4) (2,2) 己1亿元资金用于开矿, 开金矿博弈 并许诺在采到金子后与乙对半分成 问题:乙是否该将钱投资给甲呢? 可信性 (Credibility)问题
3.2.3 逆推归纳法
乙 定义:从动态博弈的最后一个阶段博弈 投资 不投资 方的行为开始分析,逐步倒推回前一个 甲 不分 (1,0) 阶段相应博弈方的行为选择,一直到第 分 一个阶段的分析方法,称为“逆推归纳法” (0,4) (2,2) 逻辑基础:动态博弈中先行为的理性的博 开金矿博弈 弈方,在前面阶段选择行为时必然会考虑 后行为博弈方在后面阶段中将会怎样选择行为,只有在博弈方 的最后一个阶段选择的,不再有后续阶段牵制的博弈方,才能 直接做出明确选择。
房地产开发( Ⅱ )
A
开发
如果B在决策时并不
不开发
N
需求大
N
需求小
知道自然的选择,那么其
信息集就由原来的四个减 少为两个。博弈过程如图 所示。
B
开发
B B
B
不开发
(4,4)
(8,0)(-3,-3) (1,0) (0,8) (0,0)(0,1) (0,0)
房地产开发( Ⅲ )
A
开发
2) 打
不投资
(1,0) 不分 乙 不打 (0,4)
(-1,0)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
3.2.2 纳什均衡的问题
博弈中(不投资-不打,不分)和 (投资-打,分)都是纳什均衡。 但后者不可信,不可能实现或
稳定。为什么会出现这种情 况呢?
乙
投资
不投资
甲
N
需求大 需求小
A
开发
A
不开发
决策之后行动等价于自然在参
与人之前行动,但参与人不能 观测到自然的行动。博弈过程 也可以如图所示。
B
开发
B B
B
不开发
(4,4)
(8,0)(-3,-3) (1,0) (0,8) (0,0)(0,1) (0,0)
3.1.1动态博弈的表示法和特点
动态博弈 (Dynamic Games)的定义: 各博弈方的策略选择和行动有先后次序,而且后选择、后 行动的博弈方在自己选择、行动之前,可以看到其他博弈方 的选择、行动,甚至还包括自己的选择、行动的博弈. 注:动态博弈各个博弈方的选择行动有先后次序,每个 博弈方的选择行为会形成依次相连的时间阶段,因此博弈方 的一次选择称为一个“阶段”。也有可能存在几个博弈方同时 选择的情况,这些博弈方的一次选择也构成一个“阶段” 。一 个动态博弈至少有两个阶段。因此态博弈又称为多阶段博弈 (Multistage Games)
模型的均衡解
Stackelberg寡头竞争模型的子博弈完美纳什 均衡解: 企业1在第1个阶段选择产量q1为3 单位, 企业2在第2个阶段选择产量q2为1.5单位
产量 3单位 1.5单位 得益 4.5 2.25
先行优势
厂商1 厂商2
与Cournot模型的比较
与Cournot静态博弈模型的比较 Qs=3+1.5=4.5 > Qc=2+2=4 Ps=8 - Qs=3.5 < Pc=8 - Qc=4 Us= us1 + us2 =4.5+2.25=6.75 < Uc= uc1 + uc2 =4 + 4 = 8
(3)信息集
房地产开发(Ⅰ)
A
开发
两个房地产公司A和B一
不开发
个城市里开发房产,他们可以
分别选择是否开发,首先是A 决定是否开发,然后B决定是 否开发,同时,他们可能面临 不同的市场需求状况(大和 小)。
N
需求大
N
需求小
B
开发
B B
B
不开发
(4,4)
(8,0)(-3,-3) (1,0) (0,8) (0,0)(0,1) (0,0)
信息的悖论
在Stackelberg模型中企业1与2得益: u1= 4.5 > u2 = 2.25 信息不对称的博弈中,信息较多的博弈方有可 能吃亏 即是:尽管跟随企业看到了领头企业的决策, 掌握了更多的信息,但最终收益反而低。
假设条件: 1. 在一个寡头市场上两企业生产销售同质产品, 市场总产量Q =q1+q2 ,企业1是领头(leader)企业, 企业2是追随(follower)企业. 2. 市场出清价格 P=8 - Q 3. 生产无固定成本,边际成本 c=c1=c2=2 4. 二企业先后决定各自的产量q1≥0, q2 ≥ 0 问题:两个企业应如何决策? 该动态的寡头市场产量博弈是一无限策略动态 博弈
3.4.1 寡占的斯塔克博格(Stackelberg) 模型
假设市场上有两个厂商,决策内容是产量, 一个是领头(leader)企业,一个是跟随 (follower)企业。领头企业先选择自己的 产量,跟随企业根据领头企业的产量选择, 选择自己的产量。 显然,他们选择有先有后,所以是一个 动态博弈。
斯塔克博格(Stackelberg)模型
阶段:动态博弈中一个博弈方的一次选择行为
例 1:仿冒和反仿冒博弈
模型描述:略 扩展式表示:
制止 仿冒 B
A 不仿冒
不制止 (0,10)
A 不仿冒
仿冒
(-2,5) 制止 (2,2) B
不制止 (5,5) (10,4)
例2:市场进入阻挠(动态博弈)
假设条件: 企业A、企业B经营同样产品 企业A已占领市场;企业B想打进该市场 企业A完全知道企业B的行为 分析: 企业A与企业B对市场的占领有先有后,因此 该 博弈又称为:“先来后到"博弈
市场进入阻挠博弈的扩展形
Cont…
圈B与圈A分别是 企业B与企业A的 打进 决策结或选择节 点 (又称决策信 企业A 息集或选择信息 打击 集), 即两博弈方 各自轮到选择 (-2, 3) 的位置.
企业B
不进 (0, 10)
和平 (5, 5)
A
博弈树
(1)结 (2)枝
B A A A
B A
注:逆推归纳法是动态博弈分析最重要、基本的方法。
3.3 子博弈和子博弈完美纳什均衡 3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
3.3.1 子博弈
定义:由一个动态博弈第一阶段以外的 某阶段开始的后续博弈阶段构成 的,有初始信息集和进行博弈所 需要的全部信息,能够自成一个 博弈的原博弈的一部分,称为原 动态博弈的一个“子博弈”。
Stackelberg模型分析 企业1的得益(利润): u 1 (q1, q2) = P×q1 – c1×q1 = (8-Q) ×q1 - 2q1 = 6 q1- q1 q2- q12 企业2的得益: u 2 (q1, q2) = P×q2 – c2×q2 = (8-Q) ×q2 - 2q2 = 6 q2- q1 q2- q22