北京大学博弈论课件完全信息动态博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关系。
2.博弈树的结构
(1)博弈树的构造方法
首先行动的一方位于博弈树的最上端,根据动态博弈过程中各方的行 动顺序,博弈数自上至下延展。也有学者习惯自左至右构造博弈树。
斗争 不进入 潜在进入者 进入 在位者 默许 (5, 5) 默许 斗争 (0, 15) (-10, -10) (0, 20)
横向博弈树
第一,保证超过半数的海盗同意第一个海盗的分配方案。 第二:第一个海盗最大化自己能分到的金币。
如果直接从第一个海盗的决策策略入手,此问题相对复杂。 不妨从第五个海盗入手,然后按照从后向前的顺序依次逆向考察
海盗的策略选择。
2.求解海盗分宝博弈的均衡
通过逆向归纳法推导出的财宝分配方案
轮次 最后一轮 倒数第二轮 倒数第三轮 分配方案提出者 海盗5 海盗4 海盗3 分配方案 自己独吞全部100个金币 任何分配方案都得不到通过
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
(2, 0, 2) (2, 2, 0)
(1, 1, 1)
员工 3 不能观察到员工 2 的决策策略
1 H O 2 O 信息集 1 3 O H O H 3 O 信息集 2 (2, 0, 2) (2, 2, 0) (1, 1, 1) H H O 3 O
分配给第三个海盗 100个金币,第四个海 盗0个金币,第五个海盗0个金币。
分配给自己 98个金币,第三个海盗 0个金 币,第四个海盗 1个金币、第5个海盗 1个 金币。
倒数第四轮
海盗2
第一个海盗将提出怎样的分配方案?此分配方案在保证能得到超
过半数海盗同意的前提下应最大化第一个海盗的利益。
(2)博弈树与博弈顺序
博弈树各节点之间存在顺序关系,博弈树由上至下的节点顺序表示各 博弈参与者进行决策的顺序。
参与者 1 S1 S2 参与者 2 T1 T2 参与者 3 (a2, b2, c2) U1 U2 (a4, b4, c4)
(a1, b1, c1)
(a3, b3, c3)
从博弈树的节点可以引出多条线段,但不能从博弈树多个节点共同到达
(2, 0, 2) (2, 2, 0)
(1, 1, 1)
员工 3 不知道员工 1 和员工 2 的决策策略
1 H O 2 O 3 O H O H 3 O H H O 3 O
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
(2, 0, 2) (2, 2, 0)
第二节 完全且完美信息动态博弈概述
在完全且完美信息动态博弈(Dynamic Game with Perfect and Complete Information)中,每个博弈参与 者均知道在自己之前进行决策的参与者选择的策略和博弈结构。 博弈树中每个节点都独立构成一个信息集,没有虚线连接两个或 多个博弈树节点。 求解完全且完美信息动态博弈的重要方法之一是:逆向归纳法。
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
员工 3 不知道员工 1 的决策策略
1 H O 2 O 3 O H O H 3 O H H O 3 O
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
二、博弈树
在动态博弈中,由于博弈参与者的行动存在先后顺序,因
此可以用更形象的方法来表示动态博弈:博弈树(Game
Tree)。
通过支付矩阵的形式表示的博弈通常被称为策略型或正则
型博弈(Normal Form Game)。
通过博弈树表示的博弈通常被称为扩展型博弈
(Extensive Form Game)。
POWERPOINT 金融 TEMPLATE
在完全信息动态博弈中,博弈参与者的行动存在先 后顺序。 可以用博弈树表示完全信息动态博弈。
可以通过逆向归纳法求解完全信息动态博弈的子博
弈精炼纳什均衡,剔除不可置信的威胁。
第一节 完全信息动态博弈概述
一、完全信息动态博弈的定义 在完全信息静态博弈中,博弈参与者同时采取行动。但 在完全信息动态博弈中,博弈参与者的行动存在先后顺序。 从信息角度上,完全信息动态博弈与完全信息静态博弈类 似,博弈参与者对博弈结构、博弈顺序、双方收益等信息 都具备完全了解。
动态市场争夺战博弈的扩展型表达方式如图所示
潜在进入者 不进入 在位者 斗争
(0, 20)
进入 在位者
默许
(0, 15)
百度文库
斗争
(-10, -10)
默许
(5, 5)
“市场争夺战”博弈的扩展型表达形式
1.博弈树的构成要素
(1)博弈参与者
(2)行动顺序:在动态博弈中,博弈参与者的行动存在先后次序。 (3)行动策略空间(Action Set):指博弈参与者可以采取的所 有可能策略。 (4)信息集(Information Set):指博弈参与者在博弈过程中 所知道的信息。 (5)支付函数指博弈参与者采用特定策略与所能得到的收益之间的
(a3, b3, c3) (a4, b4, c4) (a5, b5, c5)
(a6, b6, c6)
正确的博弈树构造方法
构造博弈树时只能按照由上至下的路径,而不能存在由下 向上的路径,也不能形成循环路径。 回溯路径唯一性在求解完全信息动态博弈时非常重要。 因为在求解动态博弈均衡时,一个很重要的方法是“逆向 归纳法(Backward Induction)”。 只有首先确保从博弈树任何最终节点向上回溯时路径唯一, 才能确保逆向归纳法的可操作性。
博弈树下方同一个后续节点。
参与者 1 S1 参与者 2 V1 (a1, b1, c1) V2 参与者 3 U1 (a3, b3, c3) U2 (a4, b4, c4) V1 S2 参与者 2 V2 (a2, b2, c2)
错误的博弈树构造方法
正确的博弈树构造方法
参与者 1 S1 参与者 2 V1 (a1, b1, c1) U1 V2 参与者 3 U2 U1 V1 参与者 3 U2 S2 参与者 2 V2 (a2, b2, c2)
当博弈不再有后续节点时,需要将博弈的收益标识在博弈
树末端。
将博弈参与者的收益放在括号里。
需要注意的是:各博弈参与者的收益需要按照各参与者行
动顺序进行排列。 先行动的博弈参与者的收益写在左边,依次类推,从左到 右,最后行动的博弈参与者的收益写在最右边。 各个博弈参与者的收益之间用逗号分割。
正确的博弈树构造方法
参与者 1 S1 (a1, b1, c1) T1 (a2, b2, c2) S1 (a3, b3, c3) S2 参与者 2 T2 参与者 1 S2 (a4, b4, c4)
正确的博弈树构造方法
错误的博弈树构造方法
参与者 1 S1 (a1, b1, c1) S2
参与者 2
博弈树中包含若干“节点”,节点用小圆圈表示。
位于博弈树最上端的节点称为“初始节点”。 初始节点用空心小圆圈表示,其他节点均用实心小圆圈表示。 在每个节点处均对应某个博弈参与者,将节点对应的博弈参与者标识在 节点旁边。
例如:在“市场争夺战”博弈中,因为潜在进入者先行动,因此初始节
那么第三个海盗也将被扔到海里喂鲨鱼。
接下来由第四个海盗提出分配方案。如果超过半数的海盗同意第 四个海盗的分配方案时,那么该方案被通过,博弈结束。
如果第四个海盗提出的分配方案没有得到超过半数海盗的同意, 那么第四个海盗也将被扔到海里喂鲨鱼。 这时就只剩下第五个海盗了,第五个海盗将独吞抢劫来的100个 金币,博弈结束。 在这种分配规则下,第一个海盗将提出怎样的分配方案? 第一个海盗提出的分配方案需要满足两个条件。
第三章
完全信息动态博弈
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
1/15/2019
(1, 1, 1)
三名员工都只有一个信息集的博弈
四、博弈树与静态博弈
博弈树的方法不仅能表示动态博弈,还能表示静态博弈。
嫌疑人甲 坦白 嫌疑人乙 坦白 (5, 5) 不坦白 (1, 10) 坦白 (10, 1) 不坦白 嫌疑人乙 不坦白 (2, 2)
用博弈树表示囚徒困境
所谓的“博弈先后顺序”,它主要是一个信息的概念,而不 是一个纯时间先后的概念。
1 H O 2 O 3 O H O H 3 O H H O 3 O
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
(2, 0, 2) (2, 2, 0)
(1, 1, 1)
员工 2 只有一个信息集的博弈树
1 H O 2 O 信息集 1 O H 3 O H 3 O H 信息集 2 H O 3 O
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
可以通过“海盗分宝博弈”这个生动有趣的故事对“逆向归纳法”
进行一个直观介绍。
一、海盗分宝博弈
1.海盗分宝博弈的规则 五个海盗首先进行抽签,确定决策顺序。 五个海盗按照决策顺序依次提出对 100 个金币的分配方案。 第一个海盗提出一个分配方案,如超过半数的海盗(包括提出分 配方案的海盗)同意第一个海盗的分配方案,即大于等于 3 名海 盗同意第一个海盗的分配方案时,那么该方案被通过,博弈结束。 如果第一个海盗提出的分配方案没有得到超过半数海盗的同意,
点处对应的博弈参与者为潜在进入者。 将潜在进入者标识在博弈树初始节点旁边。
当潜在进入者决策之后,轮到在位者进行决策。
在位者所在的节点称为“后续节点”。在位者位于两个后续节点上。 在位者都有两种策略选择:“斗争”和“默许”。
如果初始节点处的博弈参与者存在 N 种策略,那么就从初始节点
T1 (a2, b2, c2)
错误的博弈树构造方法
T2
三、信息集与三人罢工博弈
在完全信息动态博弈中,如果将博弈树的多个节点用虚线 连接起来,表明这多个节点位于同一个博弈信息集中。 也就是说:博弈参与者不知道自己位于同一个信息中的哪 个博弈节点上。 可以通过“三人罢工博弈”来说明信息集的含义以及信息 集在动态博弈中的重要性。
那么第一个海盗将被扔到海里喂鲨鱼。
接下来由第二个海盗提出分配方案,如果超过半数的海盗同意第 二个海盗的分配方案时,那么该方案被通过,博弈结束。
如果第二个海盗提出的分配方案没有得到超过半数海盗的同意,
那么第二个海盗也将被扔到海里喂鲨鱼。
接下来由第三个海盗提出分配方案,如果超过半数的海盗,即大 于等于 2 名海盗,同意第三个海盗的分配方案时,那么该方案被 通过,博弈结束。 如果第三个海盗提出的分配方案没有得到超过半数海盗的同意,
处分出 N 条路径。 路径用线段表示。在线段旁注明相应的策略。 在“市场争夺战”博弈中,首先行动的潜在进入者可以采取两种策 略:“不进入”和“进入”。因此,从初始节点处引出两条线段,
在两条线段旁分别标识“不进入”和“进入”。
当潜在进入者选择结束后,达到在位者的节点。 在位者有两个选择:“斗争”和“默许”。 因此,从在位者的节点处引出两条线段,在两条线段旁分别标识 “斗争”和“默许”。
1.三人罢工博弈的定义
1 H O 2 O 3 O H O H 3 O H H O 3 O
2 H 3 H (6, 6, 6)
(3, 3, 8) (3, 8, 3)
(0, 2, 2) (8, 3, 3)
(2, 0, 2) (2, 2, 0)
(1, 1, 1)
三人罢工博弈的博弈树
2.三人罢工博弈的策略选择与信息