博弈论-完全且完美信息动态博弈

合集下载

北京大学博弈论课件第3章-完全信息动态博弈

❖ 路径用线段表示。在线段旁注明相应的策略。 ❖ 在“市场争夺战”博弈中，首先行动的潜在进入者可以采取两种策略：“不进入”
和“进入”。因此，从初始节点处引出两条线段，在两条线段旁分别标识“不进入”和“进入”。 ❖ 当潜在进入者选择结束后，达到在位者的节点。 ❖ 在位者有两个选择：“斗争”和“默许”。 ❖ 因此，从在位者的节点处引出两条线段，在两条线段旁分别标识“斗争”和“默许”。
❖ 博弈树中每个节点都独立构成一个信息集，没有虚线连接两个或多个博弈树节点。 ❖ 求解完全且完美信息动态博弈的重要方法之一是：逆向归纳法。 ❖ 可以通过“海盗分宝博弈”这个生动有趣的故事对“逆向归纳法”进行一个直观
介绍。
一、海盗分宝博弈
❖ 1．海盗分宝博弈的规则 ❖ 五个海盗首先进行抽签，确定决策顺序。 ❖ 五个海盗按照决策顺序依次提出对 100 个金币的分配方案。 ❖ 第一个海盗提出一个分配方案，如超过半数的海盗（包括提出分配方案的海盗）
2021/8/1
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第三章 POWERPOINT TEMPLATE
❖ 在完全信息动态博弈中，博弈参与者的行动存在先后顺序。 ❖ 可以用博弈树表示完全信息动态博弈。 ❖ 可以通过逆向归纳法求解完全信息动态博弈的子博弈精炼纳什
均衡，剔除不可置信的威胁。
第一节完全信息动态博弈概述
❖ 一、完全信息动态博弈的定义在完全信息静态博弈中，博弈参与者同时采取行动。但在完全信息动态博弈中，博弈参与者的行动存在先后顺序。从信息角度上，完全信息动态博弈与完全信息静态博弈类似，博弈参与者对博弈结构、博弈顺序、双方收益等信息都具备完全了解。

完全完美信息动态博弈

• 子博弈完美纳什均衡本身也是纳什均衡，不过它是比纳什均衡更强的解。
• 子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺，因此是真正稳定的。
• 子博弈是倒着看的，从最小的子博弈开始我们就找稳定策略组合，直至最开始的节点，那么当然是稳定的了。大家会发展这正是逆推归纳法。
• 逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。
• 战略空间是连续函数：产量。
（-2，5）制止
仿冒
A 不仿冒
B 不制止（5，5）
（2，2）
（10，4）
4.1.2 动态博弈的基本特点
• 策略是在整个博弈中所有选择、行为的计划，不能分割。 • 结果是上述“计划型”策略的策略组合，构成一条路径. • 得益对应每条路径，而不是对应每步选择、行为.
• 动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。先选择、行为的博弈方常常更有利，有“先行优势”。
动)开始。这里参与者1面临的选择是L’’。那么在第二阶段，参与者2预测到一旦博弈进入到第三阶段，则参与者1会选择L’’ ，这会使2的收益为0，从而参与者2在第二阶段的选择为:L‘可得收益1, R“可得收益0，于是 L‘是最优的。
• 这样在第一阶段，参与者1预测到如果博弈进入到第二阶段，2将选择L’，使参与者1的收益为1，从而参与者1在第一阶段的选择是:L收益为2, R收益为1,于是L是最优的。
乙
借
不借
甲
分
（2，2）打
（1，0）不分
乙
不打
（-1，0）
（0，4）
法律保障不足的开金矿博弈 ——分钱打官司都不可信
• 第一个图中，通过法律手段使乙的利益得到保障，这样乙的完整策略： “第一阶段借，如果第二阶段甲不分，第三阶段打官司。”甲的完整策略是：“第二阶段分。”这是这个3阶段动态博弈的解。

博弈论完全信息动态博弈.ppt

4、工会、雇主与中央银行的经济博弈
考虑工资、物价、就业的宏观经济模型：
• 中央银行：选择货币供应量，在其效用函数中关注通货膨胀率与就业水平；
• 企业：选择就业数量，使企业利润最大化 (受工人的工资影响)；
• 就业者：要求工资水平，使自身福利最大化(受通货膨胀率影响)。
• 由于劳动合同和工资刚性，博弈顺序为：
• 企业1首先选择产量q1，企业2观察到企业1的产量后选择自己的产量q2，令： P(Q)=a-q1-q2代表逆需求函数 Ci(qi)=cqi代表成本函数则第i企业的利润函数为：
i(q1，q2)=qiP(q1+q2)-Ci(qi)
企业1 q1
企业2 q2
市场
i=1，2
P(Q)
企业利润：
i(q1，q2)
• 若T=1，在T=1时，参与人1出价，如果他提出 x1=1，参与人2只能接受。
两阶段博弈（T＝2）
• 若T=2，在T=2时，参与人2出价，如果他提出x2=0，参与人1只能接受；
• 由于参与人2在T=2时的1单位支付相当于在 t=1时δ2单位，如果参与人在t=1时出价1-x1≥δ2，则参与人2会接受。
承诺价值
• 在该博弈中，拥有信息优势反而使参与人处于劣势，企业1称为领导者，企业2称为随从。
• 现在考察完全信息静态情形下：如果企业1 承信诺呢？(威协)生产q1*=(a-c)/2，企业2是否会相
• 若优信企选企业择业将21选的是择威qq1胁*2=*，=3((唯aa--一cc))//的48，，纳则因什此此均时企衡企业是业2不1会的相最 q1*=q2*=(a-c)/3。
企业1 q1
企业2 q2
市场
P(Q)

博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理

博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理博弈论与信息经济学第6章完全且完美信息动态博弈——重复/超级博弈-连锁店悖论-无名氏定理经济学院丁言强内容提要重复博弈与战略空间有限次重复博弈：连锁店悖论无限次重复博弈冷酷战略与针锋相对战略无名氏定理阿伯罗定理: 两期战略序贯博弈与重复博弈序贯博弈的特征是，参与人在前一个阶段的行动选择决定随后的子博弈的结构，因此，从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈，或者说，同样结构的子博弈只出现一次。

动态博弈的另一种特殊但是非常重要的类型是所谓的“重复博弈”，就是同样结构的博弈重复多次，其中的每次博弈称为“阶段博弈”。

在每个阶段博弈，参与人可能同时行动，也可能不同时行动，在后一种情况下，每个阶段博弈本身就是一个动态博弈。

重复博弈的3个基本特征重复博弈可能是不完美信息博弈，也可能是完美信息博弈，但在博弈论中一般指的是前一种情况。

(1)阶段博弈之间没有“物质上”的联系，即前一阶段的博弈不改变后一阶段博弈的结构；(2)所有参与人都观测到博弈过去的历史；(3)参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。

重复博弈的战略空间战略是一套完备的相机行动规则，它必须说明在每一种可能的状态下参与人的行动选择，即使参与人并不预期这种状态真的会出现。

因为可以观察到其他参与人过去行动的历史，一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史。

所以，参与人在重复博弈中的战略是定义在博弈历史上的每个阶段博弈中的行动选择规则，即从博弈历史到行动空间的映射。

重复博弈的战略空间参与人在重复博弈中的战略空间远远大于且复杂于在每一个阶段博弈中的战略空间。

比如说，即使囚徒困境博弈只重复5次，每个囚徒的纯战略数量大于20亿个，战略组合的数量更多。

所以，重复博弈可能带来一些“额外的”均衡结果，这些均衡结果在一次博弈中是从来不会出现的。

博弈论原理第3讲完全且完美信息动态博弈

引入一个“自然”的外部参与人，随机性事件被假定为一个称为自然的参与人来控制
3.1动态博弈的表示法和特点
工商管理学院
School .Busi Admin
注意：支付向量的顺序与博弈树上行动顺序是对应的！
A
行动顺序：A——自然—— B在观察到A的行动和自然的行动后进行决策
开发
N
不开发
N
“自然”：虚拟参与人

若美国“犯我”，中国“犯人”，则支付向量为 (-2,-2)；若美国“犯我”，中国“不犯人”，则支付向量为 (2,-4)；若美国“不犯我”，中国“犯人”，则支付向量为 (3,-5)；若美国“不犯我”，中国“不犯人”，则支付向量为 (1,1)。
6
3.1动态博弈的表示法和特点
7
工商管理学院
School .Busi Admin
不开发
x’ 不论A开发不开发，我开发——{开发，开发} 追随策略：A开发我开发，A不开发我不开发——{开发，不开发} ；对抗策略：A开发我不开发，A不开发我开发——{不开发，开发} ；不开发策略:不论A开发不开发我不开发）——{不开发，不开发}； {开发，开发}、{开发，不开发}
3.2 可信性和纳什均衡的问题
21
工商管理学院
School .Busi Admin
一、动态博弈中的可信性（Credibility）问题 “破釜沉舟” 秦朝末年，秦国大将章邯率领数10万人攻打赵国的都城巨鹿。赵国向楚国求援，楚王派项羽率兵救赵。项羽带领人马渡过漳河后，马上命令弄沉渡船，每人只带三天的粮食。将士们知道后退的路没有了，个个奋勇杀敌，终于解了赵国之危。

美中军事博弈
美国犯我

第三章完全且完美信息动态博弈

第三章完全且完美信息动态博弈在动态博弈中，参与者需要根据对手的行为和策略来调整自己的行动，以便达到最佳的结果。

动态博弈可以分为完全信息动态博弈和不完全信息动态博弈。

完全信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数，而不完全信息动态博弈则是指参与者不知道其他参与者的策略和收益函数。

在完全信息动态博弈中，参与者可以通过观察对手的行为来推断出对手的策略和收益函数。

这种博弈可以通过逆向归纳法来求解，即从博弈的阶段开始，逐步向前推导出每个阶段的最佳策略。

逆向归纳法是一种有效的求解完全信息动态博弈的方法，它可以帮助参与者找到最佳策略，从而实现最佳的结果。

然而，在现实世界中，完全信息动态博弈并不常见。

大多数博弈都是不完全信息动态博弈，参与者无法知道其他参与者的策略和收益函数。

在这种情况下，参与者需要通过观察对手的行为和策略来推断出对手的类型和收益函数。

这种博弈可以通过贝叶斯纳什均衡来求解，即参与者根据对手的类型和收益函数来选择自己的策略，以达到最佳的结果。

完全且完美信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数，并且参与者能够观察到其他参与者的行为和策略。

这种博弈可以通过逆向归纳法和贝叶斯纳什均衡来求解，从而帮助参与者找到最佳策略，实现最佳的结果。

在完全且完美信息动态博弈中，参与者可以通过观察对手的行为和策略来推断出对手的类型和收益函数，从而调整自己的策略，以实现最佳的结果。

在完全且完美信息动态博弈中，参与者之间的互动是基于透明和预知性的。

每个参与者不仅清楚自己的策略选择和可能的收益，同时也了解其他参与者将如何根据这些信息做出反应。

这种透明度使得参与者能够做出更加精确的决策，因为他们能够预测对手的行动并据此调整自己的策略。

这种博弈的一个关键特点是，参与者之间的信息是对称的。

这意味着没有参与者拥有其他参与者所不知道的信息优势。

这种信息对称性使得博弈变得更加公平，因为它消除了信息不对称带来的不确定性。

博弈论——完全信息动态博弈

博弈论——完全信息动态博弈2 完全信息的动态博弈2.1完全和完美信息的动态博弈动态博弈(dynamic game)：参与⼈在不同的时间选择⾏动。

完全信息动态博弈指的是各博弈⽅先后⾏动，后⾏动者知道先⾏动者的具体⾏动是什么且各博弈⽅对博弈中各种策略组合下所有参与⼈相应的得益都完全了解的博弈静态博弈习惯⽤战略式(Strategic form representation)表述，动态博弈习惯⽤扩展式（Extensive form representation）表述。

战略式表述的三要素：参与⼈集合、每个参与⼈的战略集合、由战略组合决定的每个参与⼈的⽀付。

扩展式表述的要素包括：参与⼈集合、参与⼈的⾏动顺序、参与⼈的⾏动空间、参与⼈的信息集、参与⼈的⽀付函数、外⽣事件（⾃然的选择）的概率分布。

n⼈有限战略博弈的扩展式表述⽤博弈树来表⽰1(1,2) (0,3)①结：包括决策结和终点结。

决策结是参与⼈采取⾏动的时点，终点结是博弈⾏动路径的终点。

第⼀个⾏动选择对应的决策结为“初始结”，⽤空⼼圆表⽰，其它决策结⽤实⼼圆表⽰。

X表⽰结的集合，x X表⽰某个特定的结。

z表⽰终点结，Z表⽰终点结集合。

表⽰结之间的顺序关系，x x′表⽰x在x′之前。

x之前所有结的集合称为x的前列集，x之后所有结的集合称为x的后续集。

以下两种情况不允许：前者违背了传递性和反对称性；后者违背了前列节必须是全排序的。

在以上两个假设之下，每个终点结都完全决定了博弈树的某个路径。

②枝：博弈树上，枝是从⼀个决策结到其直接后续结的连线，每⼀个枝代表参与⼈的⼀个⾏动选择。

在每⼀个枝旁标注该具体⾏动的代号。

⼀般地，每个决策结下有多个枝，给出每次⾏动时参与⼈的⾏动空间，即此时有哪些⾏动可供选择。

③信息集（information sets）：博弈树中某⼀决策者在某⼀⾏动阶段具有相同信息的所有决策结集合称为⼀个信息集。

博弈树上的所有决策结分割成不同的信息集。

每⼀个信息集是决策结集合的⼀个⼦集(信息集是由决策结构成的集合)，该⼦集包括所有满⾜下列条件的决策结：(1)每⼀个决策结都是同⼀个参与⼈的决策结。

博弈论以及应用之3完全且完美信息动态博弈[1].pptx

3.8 空头承诺II
回顾
在前述产品开发博弈中，均衡结果(不开发，(开发，开发)) 就是企业A的空头承诺，是不可置信的。
生活中的空头承诺
学生对老师的承诺
老师，这回让我过吧，以后我会好好学习的老师，先发表一篇达到毕业要求，以后一定会写核心期刊的
山盟海誓
爱你一万年海枯石烂
1，0 0，0
纳什均衡
企业A开发B不开发
➢ (开发，(不开发，开发)) ➢ (开发，(不开发，不开发))
企业A 不开发B开发
➢ (不开发，(开发，开发))
2020/3/4
9
3.3 动态博弈中的行为与战略VII
总结：动态博弈的矩阵描述存在的问题
战略空间复杂
后行动者的战略空间随局中人的数量和每一阶段局中人的行动选择数量而急剧增大
25
3.9 承诺行动IV
绑架与劫持中的承诺行动
对峙中的谈判
拒绝谈判
➢ 历史上拒绝谈判曾是一种高效方法，汉武帝和曹操都用过 ➢ 实际生活中拒绝谈判也是一种重要策略 ➢ 交出控制权是拒绝谈判的一种具体形式
谈判中的承诺
➢ 歹徒的承诺可信吗？
职业歹徒的承诺是可信的，因为他们在树立和维护自己的声誉非职业歹徒的承诺可能也是可信的，因为他们可能不想罪加一等
先行者：美国后行者：中国
2020/3/4
4
3.3 动态博弈中的行为与战略II
模型描述
战略空间
美国——先行者
➢ 战略就是行动
中国——后行者
➢ 战略是针对先行者各种可能行动而制定的行动方案，包括美国犯我，我犯人；美国不犯我，我犯人美国犯我，我不犯人；美国不犯我，我不犯人美国犯我，我犯人；美国不犯我，我不犯人美国犯我，我不犯人；美国不犯我，我犯人

博弈论完全且完美信息动态博弈.ppt

甲分（2，2）
不分乙
不借（1，0）
（-1，0）（0，4）
能否找到子博弈?
好1差
1 不卖
1
卖
卖
不卖
2
(0,0) (0,0)
买不买
买不买
(2,1)
(0,0)
(1,-1)
(-1,0)
二手车交易扩展形
结论:
(1)子博弈不能包括原博弈的第一阶段, 即动态博弈本身不会是它自己的子博弈;
(2)子博弈必须有一个明确的初始信息集, 以及必须包含初始阶段之后的所有博弈阶段,即子博弈不能分割任何信息集或在有多节点信息集的不完美信息博弈中可能不存在子博弈。
3.3 子博弈和子博弈完美纳什均衡
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
3.3.1 子博弈
定义：由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个 “子博弈”。
乙借
第三种开金矿博弈中，（不借-不打，不分）和（借-打，分）都是纳什均衡。但后者不可信，不可能实现或稳定。
结论：纳什均衡在动态博弈可能缺乏稳定性，也就是说，在完全信息静态博弈中稳定的纳什均衡，在动态博弈中可能是不稳定的，不能作为预测的基础。
根源：纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定，不能解决动态博弈的相机选择引起的可信性问题
《博弈论与信息经济学》
第三章
完全且完美信息动态博弈
本章讨论动态博弈，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。

博弈论第四章完全且完美信息动态博弈

0，0
需求小的情况开发商A
开发商B 开发不开发
开发 -3000，-3000 1000，0
不开发 0，1000
0，0
精的扩展式表述包括四个要素:
✓ 参与人集合（Player） ✓ 每个参与人的战略集合（Strategy） ✓ 博弈的顺序（Order） ✓ 由战略组合决定的每个参与人的支付（Payoff）
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
精选PPT
12
动态博弈的战略
精选PPT
13
动态博弈的战略的表述
✓ 战略：参与人在给定信息集的情况下选择行动的规则，它规定参与人在什么情况下选择什么行动，是参与人的“相机行动方案”。
si表示第i个参与人的特定战略
Si si代表第i个参与人所有可选战择略的集合
如果n个参与人每人选择战一略个， n维向量s （s1，s2，，si，，sn）称为一个战略组合 si表示第i个人选择的战略
精选PPT
6
扩展式表示的一个例子
精选PPT
7
博弈树始于局中人1 的一个决策结点，这时1
要从L和R中作出选择，如果局中人1选择L，其后就
到达局中人2 的一个决策结点，这时，局中人2要
从L′和R′中作出选择。类似地，如果局中人1选择R，则将到达局中人2的另一个决策结点。
这时局中人2从L′和R′中选择行动。无论局中人2 选择了哪一个，都将到达终结点 (即博弈结束)且两局中人分别得到相应终点节下面的收益。

exfd经济博弈论3—完全且完美信息动态博弈

动态博弈中博弈方的策略是他们自己预先设定
的，在各个博弈阶段针对各种情况的相应行为选择的计划。
这些策略实际上并没有强制力，而且实施起来有一个过程，因此只要符合博弈方自己的利益，他们完全可以在博弈过程中改变计划。我们称这种问题为动态博弈中的“相机选择（Contingent Play）”。
（-1，0）（0，4）
法律保障不足的开金矿博弈 ——分钱打官司都不可信
稳定。为什么会出现这种情
况呢？
其实，该博弈中（不借-不打，不分）和（借-打，分）都是纳什
均衡。但后者不可信，不可能实现或稳定。
上述纳什均衡不稳定的原因，主要在于如果甲在第二阶段选择了 “不分”而不是“分”，乙策略中设定的第三阶段“打”是不可信的，不可能真正实施，理由是该行为对乙自身也是不利的，追求自身利益最大化的乙的理性不允许他这么做。甲只要稍作分析就可以掌握乙的这个弱点，因此不可能理睬乙策略中的“打”官司威胁，在第二阶段不会选择“分”。反过来，乙也不会愚蠢到想靠一个明显不可信的威胁撑腰，冒险将资金借给甲，因此他在第一阶段也不可能“借”。
第三章完全且完美信息动态博弈
本章讨论动态博弈(Dynamic Games)，所
有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常
见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈的概念和分析方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。
所以，在一个动态博弈中，博弈的结果包括双
方（或多方）采用的策略组合，实现的博弈路径和各博弈方的得益。

博弈论第三章.ppt

谢富纪 2009年3月
25
2.子博弈和逆推归纳法
W
W*
E
L*(W)
L*(W*)
L
谢富纪 2009年3月
26
2.子博弈和逆推归纳法
讨价还价模型
两人就如何分割1万元进行谈判，并且按以下规则进行：首先由甲提出一个分割的比例，对此乙可以接受也可以拒绝；如果乙拒绝甲的方案，则他自己应该提出另一个方案，让甲选择接受与否。如此循环。在这个循环过程中，只要有任何一方接受对方的方案博弈就告结束。而如果方案被拒绝，被拒绝的方案就与以后的讨价还价过程不再有关系。每次一方提出一个方案和另一方选择接受与否为一个回合。讨价还价每多进行一个回合，双方的得益就要打一个折扣，折扣系数为δ （0<δ<1 ）。如果限定讨价还价最多只能进行三个回合，到第三回合乙必须接受甲的方案，这就构成一个三回合的讨价还价博弈。
8
1.可信性
先来后到（打击的威胁是可信的）
1 进
不进
（20 ）打击
不打击
（ 0， 10）
（ -3， 6）
（ 5， 5）
谢富纪 2009年3月
9
1.可信性
先来后到（打击的威胁不可信）
1 进
不进
（20 ）打击
不打击
（ 0， 10）
（ -3， 6）
（ 5， 8）
谢富纪 2009年3月
10
1.可信性
L 0
L 0
得
R(L)W0
经济意义：厂商增加雇佣的边际收益等于工资率（边际成本）。
谢富纪 2009年3月
23
2.子博弈和逆推归纳法
在收益函数R（L）的图形上反应出来就是使厂商取得最大利润的雇佣数L*（W）对应的总收益线R（L）上的点处的切线的斜率一定等于工资率。

博弈论-完全且完美信息动态博弈

美国不犯我我国
犯人
不犯人
A 注意：支付向量的顺序与博弈树上行动顺序是对应的！
开发
不开发
N
大小
1/2
N
大
小
1/2 1/2 1/2
B
不开发开发
B
不开发开发
B
不开发开发
B
开发
不开发
(4,4 )
(8,0 )
(-3,-3)
(1,0 )
(0,8 )
(0,0 )
(0,1 )
(0,0 )
房地产开发博弈
B
不开发开发
B
不开发开发
B
开发
不开发
(4,4 )
(8,0 )
(-3,-3)
(1,0 )
(0,8 )
(0,0 )
(0,1 )
(0,0 )
房地产开发博弈
三、策略式转化为扩展式
案例-囚徒困境
囚徒 B 坦白抵赖
囚徒A 坦白抵赖
-8，-8 0，-10 -10，0 -1，-1
扩展式表述的要素

参与人集合： i 1, , n 然” ；
，此外，虚拟参与人“自

参与人的行动顺序（the order of moves）：谁在什么时候行动；参与人的行动空间（action set）：在每次行动时，参与人有些什么选择。参与人的信息集（information set）：每次行动时，参与人知道些什么；参与人的支付函数；外生事件（即自然的选择）的概率分布
(1,5)
(-2,2) (0,10)
(0,10)
垄断者
抵抗
二、博弈树求解方法——逆推归纳法

博弈论_完全信息动态博弈

完全且完美信息动态博弈的子博弈
在完全且完美信息的动态博弈里，由于在每一个阶段需行动的局中人对该阶段以前的行动组合是完全了解的，所以在它的扩展式表述中，该节点一定是单信息节点。也就是说，每个信息集都是单节点信息集，因此在完全且完美信息的动态博弈里，从任何一个节点（不包括顶部节点和底部的终节点）出发，都存在一个子博弈对于取数游戏，若修改规则，可有更多子博弈
例子：私奔博弈
需看到的是，私奔决策是由卓文君做出的。她需要做出这样的选择，是因为她已经知道她父亲卓王孙反对把她嫁给穷书生司马相如。卓王孙甚至不惜以断绝父女关系作为威胁，让她断掉念头。可以用一个完全且完美信息的动态博弈来描述卓文君与其父亲之间的博弈。第一步，卓文君在“私奔”与“断绝想法”中选择第二步，父亲在“默认”与“断绝父女关系”选择
动态博弈的特征
收益函数
因行动组合的个数小于策略组合的个数，而且更为直观，所以在动态博弈中，出于分析的方便，局中人的支付函数是从行动组合到实数集的映射当有n个局中人时，每个行动组合对应一个n维的实数向量但如果动态博弈仍然用策略式来表述的话，其支付函数也仍然是从策略组合到实数集的映射对于完全信息的动态博弈，支付函数对各方而言，都是共同知识
例子
① 甲 ② 左右左乙 ② 右
(2, 0)
(2, -1)
(1, 0)
(3, 1)
13
① 左 ② 甲 ① (-1, 2) 前 (0, 4) 后 (1, 0) (0, 0) 前 (4, -1) 后 (3, 3) 乙甲
右
② 乙 ①
(3, 0, 0)
⑴
(1, 0, 3)
⑹
(2, 3, 1)
⑽
(3, 2, 9)

博弈论：3完全且完美信息动态博弈

31 3.3 子博弈和子博弈完美纳什均衡
例3：博弈3
1
2 3
3
3
2 3
博弈方2的两个决策结能开始子博弈吗？
32 3.3 子博弈和子博弈完美纳什均衡
例4：博弈4
1
2
4
5
8
9 10
11
3
6
12
13 14
7
15
存在几个子博弈？
33 3.3 子博弈和子博弈完美纳什均衡
例5：开金矿博弈
乙
借
不借
甲
分
不分
乙 (3,3) 打不打
例：开金矿博弈
甲在开采一价值6万元的金矿时缺2万元资金，而乙正好有2万元资金。甲希望乙把2万元资金借给自己，并许诺在采到金子后与乙对半分。乙是否应该将钱借给甲呢？
乙
借
不借
甲
分
不分
(2,0)
(3, 3)
(0,6) 许诺是“可信”的吗？
23 3.2 可信性和纳什均衡问题
假定乙威胁在甲违约时将采用法律武器“打官司”来保护自己的利益。假设打官司的结果是使乙收回本钱2万元，甲失去全部采金收入。
29 3.3 子博弈和子博弈完美纳什均衡
例1：房地产开发博弈
A
开发
不开发
B x x' B
开发
不开发开发不开发
(-3,-3) (1,0) 子博弈I
(0,1) (0,0) 子博弈II
30 3.3 子博弈和子博弈完美纳什均衡
例2：囚徒困境甲
坦白
乙x
坦白抵赖
抵赖
x' 乙
坦白抵赖
(-3,-3) (0,-5) (-5,0) (-1,-1)

博弈论5

子博弈完美纳什均衡
• 1965年塞尔顿（Selten)给出了子博弈完美纳什均衡的概念。它需要包含两点：1.是纳什均衡.2. 不包含不可信的承诺和威胁。 • 定义：若动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成纳什均衡，则该策略组合称为子博弈完美纳什均衡。 • 用这个概念来看前面的借钱投资问题。在前面的那个问题中，乙选借（不分就打）、甲选分是子博弈完美纳什均衡。而当乙打官司成本提高后，打的威胁不可信时，在从甲开始的子博弈中不是纳什均衡。因此，（借，分）不是稳定的。 • 就是说，在静态博弈中要用纳什均衡，在动态博弈中要用子博弈完美纳什均衡概念。二者是同等 2013-5-12 22 重要的。
2013-5-12 15
子博弈和逆推归纳法
•
为了把动态博弈问题简化，或分析的方便，我们把动态博弈的某一阶段开始的后续所有阶段构成的博弈称为子博弈。比如，在借钱投资问题中，乙选择借以后，从甲开始决策起的博弈，就称为原博弈的子博弈。当然，当甲选择不分时，乙又开始决策，从这时起的博弈既是原博弈的子博弈，也是从甲开始的子博弈的子博弈。 • 原博弈并不作为特殊的子博弈。也并不是每一个博弈方开始决策时都能形成子博弈。
2013-5-12 19
• 再看法律保障不足时的借钱投资问题：
乙借不借
甲不分分乙
（1，0）
（2，2）
打不打
（-1，0）
2013-5-12
（0，4）
20
分析
• 只是稍微改动，结果却大不相同。甲不分时，乙的打官司威胁变为是不可信的。因此，乙第一阶段应该选不借，博弈结束。但是，用静态博弈中纳什均衡概念对照，发现（借（不分则打），分）仍是纳什均衡。因为谁单独离开这个组合将不会增加收益。这两种分析的结论是矛盾的。原因在于，实现（借（不分则打），分）的纳什均衡策略包含一个不可信的威胁— 即乙在第三阶段选打。就是说，一般的纳什均衡概念在分析动态博弈时，不能排除不可信的承诺和威胁。纳什均衡概念不能完全照搬。21 2013-5-12

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

完全信息动态博弈
动态博弈：参与人的行动有先后顺序，且后行动者能够观察到先行动者的行动。先行动者的选择影响后行动者的选择空间，后行动者可以观察到先行动者做了什么选择，因此，为了做出最优的行动选择，每个参与人都必须这样思考问题：如果我如此选择，对方将如何应对？给定他的应对，什么是我的最优选择？
房地产开发博弈
例2：两个房地产商A、B进行房地产开发博弈。市场需求大、小的概率各占50%。投入：1亿。假定市场上有两栋楼出售：需求大时，每栋售价1.4亿，需求小时，售价7千万；如果市场上只有一栋楼需求大时，可卖1.8亿需求小时，可卖1.1亿行动顺序：(1)开发商A首先行动，选择开发或不开发； (2)在A决策后，自然选择市场需求的大小； (3)开发商B在观测到A的决策和市场需求后，决定是否开发
B
不开发开发
B
不开发开发
B
开发
不开发
(4,4 )
(8,0 )
(-3,-3)
(1,0 )
(0,8 )
(0,0 )
(0,1 )
(0,0 )
房地产开发博弈
三、策略式转化为扩展式
案例-囚徒困境
囚徒 B 坦白抵赖
囚徒A 坦白抵赖
-8，-8 0，-10 -10，0 -1，-1
博弈论（Game Theory)
ห้องสมุดไป่ตู้
第三章
完全且完美信息动态博弈

扩展型博弈表述

扩展型博弈的策略及纳什均衡
子博弈精炼纳什均衡
“海盗分金”模型

话说5个海盗抢得100枚金币，他们按抽签的顺序依次提方案：首先由1 号提出分配方案，然后5人表决，半数同意方案才被通过，否则他将被扔入大海喂鲨鱼，依此类推。求第一个海盗的最优策略。
练习
（2，0）
U
1 D 2 R 1
U’
（5，0）
D’ （4，2） L
（1，1）
例2：
U
1 D
（2，0） U’ 1 R 2 （5，0）
D’ （4，2） L
（1，1）
均衡为（{U,U’}；L）,均衡结果为1选择U。
房地产开发博弈 A 开发 B 不开发 B
开发
不开发
开发
不开发
（-3，-3）
（1，0）（0，1）

只包含一个决策结的信息集称为单结信息集，如果博弈树的所有信息都是单结的，该博弈称为完美信息博弈。（博弈中没有任何参与人同时行动，且后行动者能观察到先行动者的行动，且所有参与人观察到N的行动）
B在决策时不确切地知道自然的选择; B的决策结由4个变为 2个
B
不开发开发
A
开发
(1,5)
(-2,2) (0,10)
(0,10)
垄断者
抵抗
二、博弈树求解方法——逆推归纳法
从动态博弈的最后一个阶段博弈方的行为开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第一个阶段的分析方法，称为“逆推归纳法”。
逆向归纳法只适用于完美信息博弈。
我国犯我
犯人不犯人
(-2,-2) (2,-4) (3,-5) (1,1)

老师问我：“你确定了吗?” 我慢慢地咬紧着嘴唇回答：“Yes”，而且拉了很长的音。老师接着说：“好，既然你确定了，我们就把这个目标倒着算回来。十年以后，你28岁，那时你是一个红透半边天的大明星，同时出了一张专辑。”
“那么你27岁的时候，除了接拍各种名导演的戏以外，一定还要有一个完整的音乐作品，可以拿给很多很多的唱片公司听，对不对?” “25岁的时候，在演艺事业上你就要不断进行学习和思考。另外在音乐方面一定要有很棒的作品开始录音了。” “23岁就必须接受各种培训和训练，包括音乐上和肢体上的。”
女足球芭蕾男芭蕾足球足球 (2,1)
(0,0) (0,0)
(1,2)
女
芭蕾
如果女的先行动，则
男足球芭蕾女芭蕾足球足球 (1,2)
(0,0) (0,0)
(2,1)
男
芭蕾
不是先行动者得益比后行动者得益多
女足球芭蕾男芭蕾足球足球 (2,10)
(0,0) (0,0)
(1,20)

“20岁的时候就要开始作曲，作词。在演戏方面就要接拍大一点的角色了。” 老师的话说得很轻松，但是我却感到一阵恐惧。这样推下来，我应该马上着手为自己的理想做准备了，可是我现在却什么都不会，什么都没想过，仍然为小丫鬟小舞女之类的角色沾沾自喜。我觉得有一种强大的压力忽然朝自己袭来。老师平静地笑着说：“周迅，你是一棵好苗子，但是你对人生缺少规划，散漫而且混乱。我希望你能在空闲的时候，想想十年以后的自己，到底要过什么样的生活，到底要实现什么样的目标。如果你确定了目标，那么希望你从现在就开始做。”
枝
(-2,-2)
不犯人
犯人
(2,-4) (3,-5)
(1,1)
终点结
我国
决策结：行动的时点
不犯人
博弈树的结构

结(nodes)：包括决策结和终点结。决策结是参与人采取行动的时点；终点结是博弈行动路径的终点。枝(branches)：枝是从一个决策结到它的直接后续结的连线，每一个枝代表参与人的一个行动选择。信息集：

一年以后，我从艺校毕业了，老师的话从那天开始一直刻在了我的心底：想想十年后的自己。是的，当我意识到这是一个问题的时候，我发现我整个人都觉醒了。从学校毕业后，我忙于接拍各种各样的影视剧。我始终记得，十年后我要做最成功的明星，所以对角色我开始很认真地筛选。后来我拍了《那时花开》，拍了《大明宫词》，我渐渐被大家接受，也慢慢地尝到了成功的快乐。
先动优势与后动优势
足球男芭蕾
女足球芭蕾 2，1 0，0 0，0 1，2
如果男的先行动，则
女足球芭蕾男芭蕾足球足球 (2,1)
(0,0) (0,0)
(1,2)
女
芭蕾
如果女的先行动，则
男足球芭蕾女芭蕾足球足球 (1,2)
(0,0) (0,0)
(2,1)
男
芭蕾
如果男的先行动，则
不开发
N
大小
1/2
N
大
小
1/2 1/2 1/2
B
不开发开发
B
不开发开发
B
开发
不开发
(4,4 )
(8,0 )
(-3,-3)
(1,0 )
(0,8 )
(0,0 )
(0,1 )
(0,0 )
房地产开发博弈
B知道自然的选择;但不知道A的选择(或A、 B同时决策)
N
大
A
开发
不开发
N
小
1/2
大
小
1/2

那是1993年5月的一天，教我专业课的赵老师突然找我谈话：“周迅，你能告诉我，你对于未来的打算吗?” 我愣住了。我不明白老师怎么突然问我如此严肃的问题，更不知道该怎么回答。老师问我：“现在的生活你满意吗?”我摇摇头。老师笑了：“不满意的话证明你还有救。你现在就想想，十年以后你会是什么样?” 老师的话音很轻，但是落在我心里却变得很沉重。我脑海里顿时开始风起云涌。沉默许久，我看着老师的眼睛，忽然就很坚定地说：“我希望十年后的自己成为最好的女演员，同时可以发行一张属于自己的音乐专辑。”

根据博弈方是否相互了解得益情况，有 “完全信息动态博弈”和“不完全信息动态博弈”之分；根据是否所有博弈方都对自己选择前的博弃过程完全了解，有“完美信息动态博弈”和“不完美信息动态博弈”之分。
一、动态博弈的扩展式表述
如何用扩展式表述（extensive form representation）来描述序贯行动博弈？例1：中美博弈解放初，美国总是寻找各种机会来侵犯我国。对此，毛主席提出了“人不犯我、我不犯人，人若犯我、我必犯人”的战略方针。
扩展式表述的要素

参与人集合： i 1, , n 然” ；
，此外，虚拟参与人“自

参与人的行动顺序（the order of moves）：谁在什么时候行动；参与人的行动空间（action set）：在每次行动时，参与人有些什么选择。参与人的信息集（information set）：每次行动时，参与人知道些什么；参与人的支付函数；外生事件（即自然的选择）的概率分布
5
第五人 100
4
0
3
1
2
0
1
1
第四人
第三人
100
0
99
1
0
0
1
第二人
第一人
98
0
98

如果是同意方案的人数超过半数就有效呢？如果是要求提议海盗之外的半数海盗同意呢？
想想十年后的自己

十八岁之前，我是个不知道自己想要什么的人，那时我每天就在浙江艺术学校里跟着同学唱唱歌，跳跳舞。偶尔有导演来找我拍戏，我就会很兴奋地去拍，无论多小的角色。如果没有老师跟我的那次谈话，那么也许直到今天，仍然没有人知道周迅是谁。
1/2
1/2
B
不开发开发
B
不开发开发
B
不开发开发
B
开发
不开发
(4,4 )
(8,0 )
(-3,-3)
(1,0 )
(0,8 )
(0,0 )
(0,1 )
(0,0 )
房地产开发博弈

博弈论-完全且完美信息动态博弈

北京大学博弈论课件第3章-完全信息动态博弈

完全完美信息动态博弈

博弈论 完全信息动态博弈.ppt

博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理

博弈论原理 第3讲 完全且完美信息动态博弈

第三章完全且完美信息动态博弈

博弈论——完全信息动态博弈

博弈论以及应用之3完全且完美信息动态博弈[1].pptx

博弈论完全且完美信息动态博弈.ppt

博弈论第四章 完全且完美信息动态博弈

exfd经济博弈论3—完全且完美信息动态博弈

博弈论第三章.ppt

博弈论-完全且完美信息动态博弈

博弈论_完全信息动态博弈

博弈论：3完全且完美信息动态博弈

博弈论5

博弈论完全信息动态博弈.ppt

博弈论原理第3讲完全且完美信息动态博弈

博弈论第四章完全且完美信息动态博弈