博弈论与信息经济学讲义6
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5,0
注:w表示最差均衡得益数组.
例2
重复博弈和无名氏定理
有限次重复博弈—连锁店悖论
进入 在位者
默许
进入者
假定同样的市场上有 20个(可以理解为在位者 有20个连锁店),进入者 每次进入一个市场,博弈 就变成了20次重复博弈。
不进入
x
斗争
在位者
默许
x’
斗争
假定进入者进入第1个 市场,在位者应该如何反 应呢?
两次一样。同样的道理,这也是子博弈完美纳什均衡路径。双方平
均得益都等于 (99×3十l十4)/101=2.99,非常接近于最优结果(3,3)。
定理2:有限次重复博弈的民间定理
个体理性得益:不管其它博弈方的行为如何,一博弈方在某个博弈中 只要自己采取某种特定的策略,最低限度保证能获得的得益。 可实现得益:博弈中所有纯策略组合得益的加权平均数组。 定理:设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的 多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子 博弈完美纳什均衡的极限的平均得益来实现它们。
A 厂 A 商 1 B
(4,1)
厂商1得益
厂商2
B
(2.5,2.5) (2,2) (3,1.5)
3,3 4,1
1,4 0,0
两市场博弈
进一步,我们可把二次重复两市场博弈推广到任意有限次重 复,就说l 01次。这时,厂商1的策略是在前99次中都选A,但一旦 发现哪次出现结果(A,B),则改选并坚持B到底,最后二次与二次 重复的后两次一样;厂商2的策略也是前99次都选A,但一旦发现哪 次出现结果(B,A),则以后每次都选B,最后二次与二次重复的后
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
• • • •
一 博弈扩展式表述 二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 子博弈精练纳什均衡 用逆向归纳法求子搏弈精练纳什均衡 承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问题
多个参与人的情况 蜈蚣博弈
平均得益:如果一常数 作为重复博弈(有限次 重复博弈或 无限次重复博弈)各个 阶段的得益,能产生与 得益序列
1, 2 ,相同的现在值,则称 为 1, 2 ,的平均得益
有限次重复博弈不一定 考虑贴现因素 无限次重复博弈必须考 虑贴现问题 (1 ) t 1 t
均衡结果。
影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的 完备性。 博弈重复的次数的重要性来源于参与人在短期利益和长远利益
之间的权衡。
信息的完备性:当一个参与人的支付函数不为其他参与人知道 时,该参与人可能有积极性建立一个“好”的声誉以换取长远利益。
有限次重复博弈
相关概念
重复博弈的得益
四 重复博弈和无名氏定理 五 应用举例
逆向归纳法与子搏弈精练纳什均衡的 存在问题
逆向归纳法要求“所有参与人是理性的”是 所有参与人的共同知识。因此,在有多个参与人 或每个参与人有多次行动机会的情况下,逆向归 纳法的结果可能并非如此。
1
D
A
2
D
A
…
i
D
A
…
n
D
A
(2,…,2)
(1,…,1) (1/2,…,1/2) (1/i,…,1/i)
(1/n,…,1/n)
如果n很小,逆向 归纳法的结果
多个参与人的情况
逆向归纳法与子搏弈精练纳什均衡的 存在问题
如果n很大,结果又如何呢?
1
D
A
2
D
A
…
i
D
A
…
n
D
A (2,…,2)
(1,…,1) (1/2,…,1/2) (1/i,…,1/i)
(1/n,…,1/n)
如果n很大
多个参与人的情况
对于参与人1,获得2单位支付前提是所有n-1个参与人都选A,否则就要 考虑是否应该选择D以保证1的支付。如果给定一个参与人选择A的概率是p<1, 所有n-1个参与人选择A的概率是pn-1,如果n很大,这个值就很小;
无限次重复博弈
囚徒A 坦白 坦白 -8,-8 抵赖 0,-10
无限次重复博弈
囚徒 B 抵赖
囚徒困境博弈重复无 穷次,结果如何? 证明得出,如果参与 人有足够的耐心, (抵赖,抵赖)是一 个子博弈精练纳什均 衡结果)。 冷酷战略 (1)开始选择抵赖; (2)选择抵赖一直到有 一方选择了坦白,然 后永远选择坦白。
下例中就包含这一战略。
触发策略:第一阶段采用H,如果前t-1阶段的结 果都是(H,H),则继续采用H,否则采用L 如果博弈方2采用L,总得益现值为
5 1 1 2 5
1
H L H L
如果博弈方2采用H,总得益现值为
V 4 V
4,4
阶段的最后一次重复。
(2)分析无限次重复博弈的难点 一是普通的逆推归纳法无法直接运用; 二是在无限次重复中,各博弈方的各阶段得益的 总和常常是趋向无穷大的,在分析无限次重复博弈
时该用什么作判断依据。
(3)无限次重复博弈及得益的定义
可实现得益
可实现得益实际上就是阶段博弈各种纯战略组 合得益的加权平均所构成的得益组合,其中权数非
负且总和为1。我们用(x1, x2,… xn)来记一个可实 现得益。不同的权数结构就可构成不同的可实现得 益,一博弈的全体可实现得益组合对应的坐标平面 (两个以上博弈方时就是空间的区域)上的点构成一 定的面积。
例:
可实现得益
平均得益
(4)无名氏定理
设G是一个完全信息的静态博弃。用(e1,…, en)
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
• • •
一 博弈扩展式表述 二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 四 重复博弈 有限次重复博弈 无限次重复博弈 参与人不固定时的重复博弈
五 应用举例
重复博弈
一次动态博弈也称为“序贯博弈”。 重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为“阶段 博弈”。如囚徒困境。 重复博弈的特征: 1、阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变 后一阶段的结构 ; 2、所有参与人都观测到博弈过去的历史;
H 8,8 7,1 3,1
L 1,3 1,3 2,2
三种可选战略博弈
两次重复三种可选战略博弈的等价模型
触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复 博弈方1:第一次选h;如第一次结果为(H,H),则第二次选M,否则选L 博弈方2:同博弈方1
例2
两市场博弈的重复博弈(重复两次)
-10,0
-1,-1
无限次重复博弈使其走出了囚徒困境, 背后的原因是:
如果博弈重复无穷次而且每个人有足够 的耐心,任何短期机会主义行为的所得都是 微不足道的,参与人有积极性为自己建立一 个乐于合作的声誉,同时也有积极性惩罚对 方的机会主义的行为。
无限次重复博弈
(1)特征 无限次重复博弈的特征是不存在可作为最后一
用逆向归纳法求子搏弈精练纳什均衡
承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问题
多个参与人的情况
蜈蚣博弈
四 重复博弈和无名氏定理
五 应用举例
1、2进行游戏决策,如果1在第一轮决策,得1,2 得0,否则进入第二轮,2决策得2,A得0……
1
D
A
2
D
A
1
D
A
2
D
A
…
A
1 A
D
(A,B)+(A,B) OR (B,A)+(B,A)——(1,4)(4,1) 连续两次采用混合策略——(2,2) (A,B)+(B,A) OR (B,A)+(A,B)——(2.2,2.5)轮换策略 一次纯策略+一次混合策略——(1.5,3)(3,1.5)
(1,4)
(1.5,3)
厂商2 得益
(3,3)
3、参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均 值。
贴现因子: 下一期的一单位支付在这一期的价值。
注意:在每个阶段,参与人可同时行动,也可不同时行动。
重复博弈
因为其他参与人过去的历史总是可以观测到的,因此,一个参与 人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动 历史,因此,参与人在重复博弈中的战略空间远远大于和复杂于每 一阶段的战略空间,这意味着,重复博弈可能带来一些“额外”的
逆向归纳法与子搏弈精练纳什均衡的 存在问题
逆向归纳法理论没有为当某些未预料到的事情出现时参与人如何 形成他们的预期提供解释,这使得逆向归纳法的解释受到怀疑。 弗德伯格等人将偏离行为解释为是由于有关“支付函数”信息的 不确定性造成的,即实际的支付函数不同于原来认为的支付函数, 从而参与人在观测到未曾预料到的行为时应该修正有关支付函数 的信息。 他们认为,任何一个有关博弈行为的理论应该是“完备的”,即 理论应该对任何可能的行为赋予正的概率,从而当某件事情出现 时,参与人对随后的博弈行为的条件预测总是很好定义的。 泽尔藤将偏离行为解释为参与人在博弈过程中犯的错误,或者说 均衡的“颤抖”,即在扩展式博弈隐含了参与人犯错误的可能, 如果参与人在每个信息集上犯错误的概率是独立的(因而参与人 不会犯系统性的错误),那么,不论过去的行为与逆向归纳法的 预测如何不同,参与人应该继续使用逆向归纳法预测从现在开始 子博弈的行为。
低价 低价 3,3 高价 1,6
高价 6,1 5,5
价格大战中的囚徒困境
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
• • •
一 博弈扩展式表述 二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 四 重复博弈 有限次重复博弈 无限次重复博弈 参与人不固定时的重复博弈
五 应用举例
t 1
定理1
在G中得益的T倍,平均每阶段得益等于原博弈G中的得 益。
例:有限次重复囚徒困境博弈
多个纯策略纳什均衡博弈的有限次重复博弈 例1
厂商2 厂商2 M 1,7 4,4 3,1
厂 商 1
H M L
H 5,5 6,0 2,0
M 0,6 3,3 2,0
L 0,2 0,2 1,1
厂 H 商 M 1 L
记G的一个纳什均衡取得的得益,用(x1,…, xn)表示
的任意可实现得益.如果xi>ei,对任意博弈方i都成
立,而δ足够接近1,那么无限重复博弈G(∞, δ)中 一定存在一个子博弈完美的纳什均衡路径能实现各博
弈方的平均得益为(x1,…, xn) 。
无名氏定理
(5)触发策略——冷酷战略(grim strategy) 博弈各方首先试探合作,一旦发觉对方不合作则 也用不合作相报复,利用有后续阶段博弈的制约作用 达成均衡的策略称为“触发策略”。因此博弈方的这 种触发策略是一个完整的计划,博弃方一旦设定了这 样的策略,就会坚持到底,因此其中的报复威胁是可 以相信的会信守的,因此所构成的均衡都是子博弈精 炼的。
1
D
A? 2
D
A
1
D
A
2
D
A
…
1 A
D
2 A
D
1 A
D
2
D
A
(100,100)
(1,1)
(0,3)
(2,2)
(1,4)
(98,98)
(97,100) (99,99) (98,101)
逆向归纳法的结果: 一开始,就结束!
另一种蜈蚣博弈
但是,当你没有预料的事情发生时,比如参与人选择了A,你 该如何选择?你的选择应该依赖于其他参与人未来的行为。特别 是,你如何修正你对参与人理性程度的评价。
2
D
A (0,N+1)
(1,0)
(0,2)
(3,0)
(0,4)
(0,N-1) (N,0)
逆向归纳法的结果: 一开始,就结束!
每个参与人有多个行动机会的蜈蚣博弈
有两个参与人1、2,若第一次1决策结束,1、2都得n, 若2决策结束,1得n-1,B得n+2,下一轮从1、1都是n+1开 始,共100次,每个参与人有100个决策结。
另外,即使参与人1确信所有n-1个参与人都选A,他也可能怀疑是否第2 个参与人相信所有n-2个参与人都选A。
这个链越长,共同知识的要求就越难满足。
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
• • • •
一 博弈扩展式表述 二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 子博弈精练纳什均衡
(40,50) (-10,0) (0,300)
(0,300)
重复博弈和无名氏定理
这个博弈的纳什均衡是什么? 假定博弈共进行10次,结果会如何? 为什么会出现这个结果? 倒推论证法
企业乙ቤተ መጻሕፍቲ ባይዱ
假定现在是第十次,结果和一 次博弈一样。第九次,即倒数第二 次,局中人已经很清楚,最后一次 企业甲 博弈对方肯定要实行低价,因此, 现在如何对他施行好心都不会在下 一次得到好报,所以,理性人的 “我”没有理由实施高价使对方获 益。依次类推。
注:w表示最差均衡得益数组.
例2
重复博弈和无名氏定理
有限次重复博弈—连锁店悖论
进入 在位者
默许
进入者
假定同样的市场上有 20个(可以理解为在位者 有20个连锁店),进入者 每次进入一个市场,博弈 就变成了20次重复博弈。
不进入
x
斗争
在位者
默许
x’
斗争
假定进入者进入第1个 市场,在位者应该如何反 应呢?
两次一样。同样的道理,这也是子博弈完美纳什均衡路径。双方平
均得益都等于 (99×3十l十4)/101=2.99,非常接近于最优结果(3,3)。
定理2:有限次重复博弈的民间定理
个体理性得益:不管其它博弈方的行为如何,一博弈方在某个博弈中 只要自己采取某种特定的策略,最低限度保证能获得的得益。 可实现得益:博弈中所有纯策略组合得益的加权平均数组。 定理:设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的 多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子 博弈完美纳什均衡的极限的平均得益来实现它们。
A 厂 A 商 1 B
(4,1)
厂商1得益
厂商2
B
(2.5,2.5) (2,2) (3,1.5)
3,3 4,1
1,4 0,0
两市场博弈
进一步,我们可把二次重复两市场博弈推广到任意有限次重 复,就说l 01次。这时,厂商1的策略是在前99次中都选A,但一旦 发现哪次出现结果(A,B),则改选并坚持B到底,最后二次与二次 重复的后两次一样;厂商2的策略也是前99次都选A,但一旦发现哪 次出现结果(B,A),则以后每次都选B,最后二次与二次重复的后
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
• • • •
一 博弈扩展式表述 二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 子博弈精练纳什均衡 用逆向归纳法求子搏弈精练纳什均衡 承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问题
多个参与人的情况 蜈蚣博弈
平均得益:如果一常数 作为重复博弈(有限次 重复博弈或 无限次重复博弈)各个 阶段的得益,能产生与 得益序列
1, 2 ,相同的现在值,则称 为 1, 2 ,的平均得益
有限次重复博弈不一定 考虑贴现因素 无限次重复博弈必须考 虑贴现问题 (1 ) t 1 t
均衡结果。
影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的 完备性。 博弈重复的次数的重要性来源于参与人在短期利益和长远利益
之间的权衡。
信息的完备性:当一个参与人的支付函数不为其他参与人知道 时,该参与人可能有积极性建立一个“好”的声誉以换取长远利益。
有限次重复博弈
相关概念
重复博弈的得益
四 重复博弈和无名氏定理 五 应用举例
逆向归纳法与子搏弈精练纳什均衡的 存在问题
逆向归纳法要求“所有参与人是理性的”是 所有参与人的共同知识。因此,在有多个参与人 或每个参与人有多次行动机会的情况下,逆向归 纳法的结果可能并非如此。
1
D
A
2
D
A
…
i
D
A
…
n
D
A
(2,…,2)
(1,…,1) (1/2,…,1/2) (1/i,…,1/i)
(1/n,…,1/n)
如果n很小,逆向 归纳法的结果
多个参与人的情况
逆向归纳法与子搏弈精练纳什均衡的 存在问题
如果n很大,结果又如何呢?
1
D
A
2
D
A
…
i
D
A
…
n
D
A (2,…,2)
(1,…,1) (1/2,…,1/2) (1/i,…,1/i)
(1/n,…,1/n)
如果n很大
多个参与人的情况
对于参与人1,获得2单位支付前提是所有n-1个参与人都选A,否则就要 考虑是否应该选择D以保证1的支付。如果给定一个参与人选择A的概率是p<1, 所有n-1个参与人选择A的概率是pn-1,如果n很大,这个值就很小;
无限次重复博弈
囚徒A 坦白 坦白 -8,-8 抵赖 0,-10
无限次重复博弈
囚徒 B 抵赖
囚徒困境博弈重复无 穷次,结果如何? 证明得出,如果参与 人有足够的耐心, (抵赖,抵赖)是一 个子博弈精练纳什均 衡结果)。 冷酷战略 (1)开始选择抵赖; (2)选择抵赖一直到有 一方选择了坦白,然 后永远选择坦白。
下例中就包含这一战略。
触发策略:第一阶段采用H,如果前t-1阶段的结 果都是(H,H),则继续采用H,否则采用L 如果博弈方2采用L,总得益现值为
5 1 1 2 5
1
H L H L
如果博弈方2采用H,总得益现值为
V 4 V
4,4
阶段的最后一次重复。
(2)分析无限次重复博弈的难点 一是普通的逆推归纳法无法直接运用; 二是在无限次重复中,各博弈方的各阶段得益的 总和常常是趋向无穷大的,在分析无限次重复博弈
时该用什么作判断依据。
(3)无限次重复博弈及得益的定义
可实现得益
可实现得益实际上就是阶段博弈各种纯战略组 合得益的加权平均所构成的得益组合,其中权数非
负且总和为1。我们用(x1, x2,… xn)来记一个可实 现得益。不同的权数结构就可构成不同的可实现得 益,一博弈的全体可实现得益组合对应的坐标平面 (两个以上博弈方时就是空间的区域)上的点构成一 定的面积。
例:
可实现得益
平均得益
(4)无名氏定理
设G是一个完全信息的静态博弃。用(e1,…, en)
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
• • •
一 博弈扩展式表述 二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 四 重复博弈 有限次重复博弈 无限次重复博弈 参与人不固定时的重复博弈
五 应用举例
重复博弈
一次动态博弈也称为“序贯博弈”。 重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为“阶段 博弈”。如囚徒困境。 重复博弈的特征: 1、阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变 后一阶段的结构 ; 2、所有参与人都观测到博弈过去的历史;
H 8,8 7,1 3,1
L 1,3 1,3 2,2
三种可选战略博弈
两次重复三种可选战略博弈的等价模型
触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复 博弈方1:第一次选h;如第一次结果为(H,H),则第二次选M,否则选L 博弈方2:同博弈方1
例2
两市场博弈的重复博弈(重复两次)
-10,0
-1,-1
无限次重复博弈使其走出了囚徒困境, 背后的原因是:
如果博弈重复无穷次而且每个人有足够 的耐心,任何短期机会主义行为的所得都是 微不足道的,参与人有积极性为自己建立一 个乐于合作的声誉,同时也有积极性惩罚对 方的机会主义的行为。
无限次重复博弈
(1)特征 无限次重复博弈的特征是不存在可作为最后一
用逆向归纳法求子搏弈精练纳什均衡
承诺行动与子搏弈精练纳什均衡 逆向归纳法与子搏弈精练纳什均衡的存在问题
多个参与人的情况
蜈蚣博弈
四 重复博弈和无名氏定理
五 应用举例
1、2进行游戏决策,如果1在第一轮决策,得1,2 得0,否则进入第二轮,2决策得2,A得0……
1
D
A
2
D
A
1
D
A
2
D
A
…
A
1 A
D
(A,B)+(A,B) OR (B,A)+(B,A)——(1,4)(4,1) 连续两次采用混合策略——(2,2) (A,B)+(B,A) OR (B,A)+(A,B)——(2.2,2.5)轮换策略 一次纯策略+一次混合策略——(1.5,3)(3,1.5)
(1,4)
(1.5,3)
厂商2 得益
(3,3)
3、参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均 值。
贴现因子: 下一期的一单位支付在这一期的价值。
注意:在每个阶段,参与人可同时行动,也可不同时行动。
重复博弈
因为其他参与人过去的历史总是可以观测到的,因此,一个参与 人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动 历史,因此,参与人在重复博弈中的战略空间远远大于和复杂于每 一阶段的战略空间,这意味着,重复博弈可能带来一些“额外”的
逆向归纳法与子搏弈精练纳什均衡的 存在问题
逆向归纳法理论没有为当某些未预料到的事情出现时参与人如何 形成他们的预期提供解释,这使得逆向归纳法的解释受到怀疑。 弗德伯格等人将偏离行为解释为是由于有关“支付函数”信息的 不确定性造成的,即实际的支付函数不同于原来认为的支付函数, 从而参与人在观测到未曾预料到的行为时应该修正有关支付函数 的信息。 他们认为,任何一个有关博弈行为的理论应该是“完备的”,即 理论应该对任何可能的行为赋予正的概率,从而当某件事情出现 时,参与人对随后的博弈行为的条件预测总是很好定义的。 泽尔藤将偏离行为解释为参与人在博弈过程中犯的错误,或者说 均衡的“颤抖”,即在扩展式博弈隐含了参与人犯错误的可能, 如果参与人在每个信息集上犯错误的概率是独立的(因而参与人 不会犯系统性的错误),那么,不论过去的行为与逆向归纳法的 预测如何不同,参与人应该继续使用逆向归纳法预测从现在开始 子博弈的行为。
低价 低价 3,3 高价 1,6
高价 6,1 5,5
价格大战中的囚徒困境
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
• • •
一 博弈扩展式表述 二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 四 重复博弈 有限次重复博弈 无限次重复博弈 参与人不固定时的重复博弈
五 应用举例
t 1
定理1
在G中得益的T倍,平均每阶段得益等于原博弈G中的得 益。
例:有限次重复囚徒困境博弈
多个纯策略纳什均衡博弈的有限次重复博弈 例1
厂商2 厂商2 M 1,7 4,4 3,1
厂 商 1
H M L
H 5,5 6,0 2,0
M 0,6 3,3 2,0
L 0,2 0,2 1,1
厂 H 商 M 1 L
记G的一个纳什均衡取得的得益,用(x1,…, xn)表示
的任意可实现得益.如果xi>ei,对任意博弈方i都成
立,而δ足够接近1,那么无限重复博弈G(∞, δ)中 一定存在一个子博弈完美的纳什均衡路径能实现各博
弈方的平均得益为(x1,…, xn) 。
无名氏定理
(5)触发策略——冷酷战略(grim strategy) 博弈各方首先试探合作,一旦发觉对方不合作则 也用不合作相报复,利用有后续阶段博弈的制约作用 达成均衡的策略称为“触发策略”。因此博弈方的这 种触发策略是一个完整的计划,博弃方一旦设定了这 样的策略,就会坚持到底,因此其中的报复威胁是可 以相信的会信守的,因此所构成的均衡都是子博弈精 炼的。
1
D
A? 2
D
A
1
D
A
2
D
A
…
1 A
D
2 A
D
1 A
D
2
D
A
(100,100)
(1,1)
(0,3)
(2,2)
(1,4)
(98,98)
(97,100) (99,99) (98,101)
逆向归纳法的结果: 一开始,就结束!
另一种蜈蚣博弈
但是,当你没有预料的事情发生时,比如参与人选择了A,你 该如何选择?你的选择应该依赖于其他参与人未来的行为。特别 是,你如何修正你对参与人理性程度的评价。
2
D
A (0,N+1)
(1,0)
(0,2)
(3,0)
(0,4)
(0,N-1) (N,0)
逆向归纳法的结果: 一开始,就结束!
每个参与人有多个行动机会的蜈蚣博弈
有两个参与人1、2,若第一次1决策结束,1、2都得n, 若2决策结束,1得n-1,B得n+2,下一轮从1、1都是n+1开 始,共100次,每个参与人有100个决策结。
另外,即使参与人1确信所有n-1个参与人都选A,他也可能怀疑是否第2 个参与人相信所有n-2个参与人都选A。
这个链越长,共同知识的要求就越难满足。
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
• • • •
一 博弈扩展式表述 二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 子博弈精练纳什均衡
(40,50) (-10,0) (0,300)
(0,300)
重复博弈和无名氏定理
这个博弈的纳什均衡是什么? 假定博弈共进行10次,结果会如何? 为什么会出现这个结果? 倒推论证法
企业乙ቤተ መጻሕፍቲ ባይዱ
假定现在是第十次,结果和一 次博弈一样。第九次,即倒数第二 次,局中人已经很清楚,最后一次 企业甲 博弈对方肯定要实行低价,因此, 现在如何对他施行好心都不会在下 一次得到好报,所以,理性人的 “我”没有理由实施高价使对方获 益。依次类推。