完全且完美信息动态博弈

合集下载

第三讲非合作博弈的解:(4)

第三讲非合作博弈的解:(4)

例子:斯坦伯尔伯模型。两个厂商垄断某个市场,其中厂商 1处于支配地位,它先行动,然后从属企业2后行动。假定 市场需求函数为p=a-Q。厂商的单位产品的成本c。这些是 企业1和2的公共知识。问:厂商1和2是如解。
假定厂商1和2所决定的产量分别为q1,q2。 企业2后行动,对于企业1的任何行动,即任意给定的产量,
• 例子:假定甲在开采一个价值4万元的金矿时需要1万元 资金,乙有1万元资金。甲向乙借钱来开金矿。在这个 博弈的第一阶段,甲向乙承诺: 如果乙借钱给他的话, 那么他就会将采到的金子与乙对半分成,即(2,3)—— 乙得到2万元的金子,同时收回自己的1万元投资。对于 甲的承诺,乙如果不借钱给甲的话,那么博弈到此为止, 双方收益为(0,1)。如果乙借钱给甲的话,那么博弈进 入第二个阶段。在第二阶段中,若甲遵守他的承诺,分 给乙一半的金子,这样两人的收益为(2,3),其中1万 元为投资成本。然而,若甲违背自己的承诺,博弈就会 进入到第三个阶段: 如果乙同甲打官司,那么由于打官 司费时费力, 两个人的收益为(0,1);若乙不打官司, 那么两个人的收益就为(5,0)。
安娜
2 1
鲍伯
1 4
安娜
4 3 蜈蚣博弈
鲍伯 2n+1
3 6
安娜 鲍伯
2n+2
2n 2n-1
2 n-1 2 n+2
• 这个博弈有两个参与人安娜和鲍伯。该博弈从安娜开始,她有两 个策略“合作”和“不合作”,若她选择“不合作”,博弈即刻 终止,安娜得到2,鲍伯得到1;若她选择“合作”,那么博弈继 续进行,由鲍伯开始选择。鲍伯同样有“合作”和“不合作”两 种策略。在这第二轮选择中,若鲍伯选择“不合作”,博弈终止, 选择“合作”,博弈继续进行……在这个博弈最后一轮,即第2n 轮,若鲍伯选择“不合作”,他所得2n+1,安娜得2n-1;若他选 择“合作”,鲍伯得2n+1安娜得2n+2。

北京大学博弈论课件第3章-完全信息动态博弈

北京大学博弈论课件第3章-完全信息动态博弈
❖ 路径用线段表示。在线段旁注明相应的策略。 ❖ 在“市场争夺战”博弈中,首先行动的潜在进入者可以采取两种策略:“不进入”
和“进入”。因此,从初始节点处引出两条线段,在两条线段旁分别标识“不进 入”和“进入”。 ❖ 当潜在进入者选择结束后,达到在位者的节点。 ❖ 在位者有两个选择:“斗争”和“默许”。 ❖ 因此,从在位者的节点处引出两条线段,在两条线段旁分别标识“斗争”和“默 许”。
❖ 博弈树中每个节点都独立构成一个信息集,没有虚线连接两个或多个博弈树节点。 ❖ 求解完全且完美信息动态博弈的重要方法之一是:逆向归纳法。 ❖ 可以通过“海盗分宝博弈”这个生动有趣的故事对“逆向归纳法”进行一个直观
介绍。
一、海盗分宝博弈
❖ 1.海盗分宝博弈的规则 ❖ 五个海盗首先进行抽签,确定决策顺序。 ❖ 五个海盗按照决策顺序依次提出对 100 个金币的分配方案。 ❖ 第一个海盗提出一个分配方案,如超过半数的海盗(包括提出分配方案的海盗)
2021/8/1
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第三章 POWERPOINT TEMPLATE
❖ 在完全信息动态博弈中,博弈参与者的行动存在先后顺序。 ❖ 可以用博弈树表示完全信息动态博弈。 ❖ 可以通过逆向归纳法求解完全信息动态博弈的子博弈精炼纳什
均衡,剔除不可置信的威胁。
第一节 完全信息动态博弈概述
❖ 一、完全信息动态博弈的定义 在完全信息静态博弈中,博弈参与者同时采取行动。但在完全信息动 态博弈中,博弈参与者的行动存在先后顺序。从信息角度上,完全信息 动态博弈与完全信息静态博弈类似,博弈参与者对博弈结构、博弈顺序、 双方收益等信息都具备完全了解。

完全信息动态博弈模型

完全信息动态博弈模型

完全信息动态博弈模型
完全信息动态博弈是指在博弈中进行的每一步,参与人都拥有完整的信息,并做出最优决策。

这种博弈模型通常用于分析市场博弈、合作与竞争、决策制定等领域。

在完全信息动态博弈中,每个参与者都知道其他参与者的决策和状态,并且可以立即观察到它们的结果。

完全信息动态博弈模型可以使用逆向归纳法求解。

当参与者 2 行动时,它面临的决策问题是最大化收益。

参与者 1 可以预测参与者 2 对参与者 1 的每一个可能行动的反应,即参与者 2 的最优反应。

参与者 1 在第一阶段要解决的问题是最大化自身收益,即求解u1(a1,R2(a1))。

如果参与者 1 的问题有唯一解 a1star,那么称(a1star,R2(a1star)) 是这一博弈的逆向归纳解。

完全信息动态博弈通常包含多个阶段,每个阶段中参与者可以在知道前面所有阶段的行动后做出决策。

在阶段内的同时行动意味着博弈包含不完美信息。

这种博弈模型可以用于分析市场动态、合作与竞争、决策制定等领域。

博弈论 完全信息动态博弈.ppt

博弈论 完全信息动态博弈.ppt

4、工会、雇主与中央银行的经济博弈
考虑工资、物价、就业的宏观经济模型:
• 中央银行:选择货币供应量,在其效用函 数中关注通货膨胀率与就业水平;
• 企业:选择就业数量,使企业利润最大化 (受工人的工资影响);
• 就业者:要求工资水平,使自身福利最大 化(受通货膨胀率影响)。
• 由于劳动合同和工资刚性,博弈顺序为:
• 企业1首先选择产量q1,企业2观察到企业1的产量 后选择自己的产量q2,令: P(Q)=a-q1-q2代表逆需求函数 Ci(qi)=cqi代表成本函数 则第i企业的利润函数为:
i(q1,q2)=qiP(q1+q2)-Ci(qi)
企业1 q1
企业2 q2
市场
i=1,2
P(Q)
企业利润:
i(q1,q2)
• 若T=1,在T=1时,参与人1出价,如果他提出 x1=1,参与人2只能接受。
两阶段博弈(T=2)
• 若T=2,在T=2时,参与人2出价,如果他提 出x2=0,参与人1只能接受;
• 由于参与人2在T=2时的1单位支付相当于在 t=1时δ2单位,如果参与人在t=1时出价1-x1≥δ2, 则参与人2会接受。
承诺价值
• 在该博弈中,拥有信息优势反而使参与人处 于劣势,企业1称为领导者,企业2称为随从。
• 现在考察完全信息静态情形下:如果企业1 承 信诺呢?(威协)生产q1*=(a-c)/2,企业2是否会相
• 若 优 信企选企业择业将21选的是择威qq1胁*2=*,=3((唯aa--一cc))//的48, ,纳则 因什此 此均时企衡企业是业2不1会的相最 q1*=q2*=(a-c)/3。
企业1 q1
企业2 q2
市场
P(Q)

博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理

博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理

博弈论与信息经济学第6章完全且完美信息动态博弈——重复超级博弈-连锁店悖论-无名氏定理博弈论与信息经济学第6章完全且完美信息动态博弈——重复/超级博弈-连锁店悖论-无名氏定理经济学院丁言强内容提要重复博弈与战略空间有限次重复博弈:连锁店悖论无限次重复博弈冷酷战略与针锋相对战略无名氏定理阿伯罗定理: 两期战略序贯博弈与重复博弈序贯博弈的特征是,参与人在前一个阶段的行动选择决定随后的子博弈的结构,因此,从后一个决策结开始的子博弈不同于从前一个决策结开始的子博弈,或者说,同样结构的子博弈只出现一次。

动态博弈的另一种特殊但是非常重要的类型是所谓的“重复博弈”,就是同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。

在每个阶段博弈,参与人可能同时行动,也可能不同时行动,在后一种情况下,每个阶段博弈本身就是一个动态博弈。

重复博弈的3个基本特征重复博弈可能是不完美信息博弈,也可能是完美信息博弈,但在博弈论中一般指的是前一种情况。

(1)阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变后一阶段博弈的结构;(2)所有参与人都观测到博弈过去的历史;(3)参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。

重复博弈的战略空间战略是一套完备的相机行动规则,它必须说明在每一种可能的状态下参与人的行动选择,即使参与人并不预期这种状态真的会出现。

因为可以观察到其他参与人过去行动的历史,一个参与人可以使自己在某个阶段博弈的选择依赖于其他参与人过去的行动历史。

所以,参与人在重复博弈中的战略是定义在博弈历史上的每个阶段博弈中的行动选择规则,即从博弈历史到行动空间的映射。

重复博弈的战略空间参与人在重复博弈中的战略空间远远大于且复杂于在每一个阶段博弈中的战略空间。

比如说,即使囚徒困境博弈只重复5次,每个囚徒的纯战略数量大于20亿个,战略组合的数量更多。

所以,重复博弈可能带来一些“额外的”均衡结果,这些均衡结果在一次博弈中是从来不会出现的。

第三章完全且完美信息动态博弈

第三章完全且完美信息动态博弈

第三章完全且完美信息动态博弈在动态博弈中,参与者需要根据对手的行为和策略来调整自己的行动,以便达到最佳的结果。

动态博弈可以分为完全信息动态博弈和不完全信息动态博弈。

完全信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,而不完全信息动态博弈则是指参与者不知道其他参与者的策略和收益函数。

在完全信息动态博弈中,参与者可以通过观察对手的行为来推断出对手的策略和收益函数。

这种博弈可以通过逆向归纳法来求解,即从博弈的阶段开始,逐步向前推导出每个阶段的最佳策略。

逆向归纳法是一种有效的求解完全信息动态博弈的方法,它可以帮助参与者找到最佳策略,从而实现最佳的结果。

然而,在现实世界中,完全信息动态博弈并不常见。

大多数博弈都是不完全信息动态博弈,参与者无法知道其他参与者的策略和收益函数。

在这种情况下,参与者需要通过观察对手的行为和策略来推断出对手的类型和收益函数。

这种博弈可以通过贝叶斯纳什均衡来求解,即参与者根据对手的类型和收益函数来选择自己的策略,以达到最佳的结果。

完全且完美信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,并且参与者能够观察到其他参与者的行为和策略。

这种博弈可以通过逆向归纳法和贝叶斯纳什均衡来求解,从而帮助参与者找到最佳策略,实现最佳的结果。

在完全且完美信息动态博弈中,参与者可以通过观察对手的行为和策略来推断出对手的类型和收益函数,从而调整自己的策略,以实现最佳的结果。

在完全且完美信息动态博弈中,参与者之间的互动是基于透明和预知性的。

每个参与者不仅清楚自己的策略选择和可能的收益,同时也了解其他参与者将如何根据这些信息做出反应。

这种透明度使得参与者能够做出更加精确的决策,因为他们能够预测对手的行动并据此调整自己的策略。

这种博弈的一个关键特点是,参与者之间的信息是对称的。

这意味着没有参与者拥有其他参与者所不知道的信息优势。

这种信息对称性使得博弈变得更加公平,因为它消除了信息不对称带来的不确定性。

博弈论——完全信息动态博弈

博弈论——完全信息动态博弈

博弈论——完全信息动态博弈2 完全信息的动态博弈2.1完全和完美信息的动态博弈动态博弈(dynamic game):参与⼈在不同的时间选择⾏动。

完全信息动态博弈指的是各博弈⽅先后⾏动,后⾏动者知道先⾏动者的具体⾏动是什么且各博弈⽅对博弈中各种策略组合下所有参与⼈相应的得益都完全了解的博弈静态博弈习惯⽤战略式(Strategic form representation)表述,动态博弈习惯⽤扩展式(Extensive form representation)表述。

战略式表述的三要素:参与⼈集合、每个参与⼈的战略集合、由战略组合决定的每个参与⼈的⽀付。

扩展式表述的要素包括:参与⼈集合、参与⼈的⾏动顺序、参与⼈的⾏动空间、参与⼈的信息集、参与⼈的⽀付函数、外⽣事件(⾃然的选择)的概率分布。

n⼈有限战略博弈的扩展式表述⽤博弈树来表⽰1(1,2) (0,3)①结:包括决策结和终点结。

决策结是参与⼈采取⾏动的时点,终点结是博弈⾏动路径的终点。

第⼀个⾏动选择对应的决策结为“初始结”,⽤空⼼圆表⽰,其它决策结⽤实⼼圆表⽰。

X表⽰结的集合,x X表⽰某个特定的结。

z表⽰终点结,Z表⽰终点结集合。

表⽰结之间的顺序关系,x x′表⽰x在x′之前。

x之前所有结的集合称为x的前列集,x之后所有结的集合称为x的后续集。

以下两种情况不允许:前者违背了传递性和反对称性;后者违背了前列节必须是全排序的。

在以上两个假设之下,每个终点结都完全决定了博弈树的某个路径。

②枝:博弈树上,枝是从⼀个决策结到其直接后续结的连线,每⼀个枝代表参与⼈的⼀个⾏动选择。

在每⼀个枝旁标注该具体⾏动的代号。

⼀般地,每个决策结下有多个枝,给出每次⾏动时参与⼈的⾏动空间,即此时有哪些⾏动可供选择。

③信息集(information sets):博弈树中某⼀决策者在某⼀⾏动阶段具有相同信息的所有决策结集合称为⼀个信息集。

博弈树上的所有决策结分割成不同的信息集。

每⼀个信息集是决策结集合的⼀个⼦集(信息集是由决策结构成的集合),该⼦集包括所有满⾜下列条件的决策结:(1)每⼀个决策结都是同⼀个参与⼈的决策结。

博弈论的几个经典模型

博弈论的几个经典模型

诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔
奖的理性主义学派的领袖卢卡斯
(Lukas),其理论与博
弈论都有着较深的联系。现在博弈论正渗透到各门社会科学,
更重要的是它正深刻地改变着人们的思
• 汪贤裕、肖玉明编著,博弈论及其应用,科学出版社,2008 年2月
第四章 博弈论的几个经典模型
讲授人 谭建国
引言
博弈论又被称为对策论(Game Theory),按照2005年因对博 弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法, 博弈论就是研究互动决策的理论。所谓互动决策,即各行动方 (即局中人[player])的决策是相互影响的,每个人在决策的时 候必须将他人的决策纳入自己的决策考虑之中,当然也需要把 别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情 形进行决策,选择最有利于自己的战略(strategy)。
博弈论的几个经典模型
引言
你的选择必须考虑其他人的选择,而其他人的选择也考虑 你的选择。你的结果——博弈论称之为支付,不仅取决于你的 行动选择——博弈论称之为策略选择,同时取决于他人的策略 选择。你和这群人构成一个博弈(game)。
上述博弈是一个叫张翼成的中国人在1997年提出的一个博 弈 论 模 型 , 被 称 之 为 少 数 者 博 弈 或 少 数 派 博 弈 ( Minority Game)。
协调互动合作互动协调互动是指一个参与人获得的支付依赖于其他参与人是否选择了相同行动如左行右行博弈如果两个相对而行的参与人选择不同的方向行进那么他们会相碰而选择相同方向则可以顺利通合作互动是指既存在协调又存在冲突的博弈协调是因为两个参与同时改变行动可以变得更好冲突是因为尽管其他参与人承诺行动也不一定有利于该参与人支付的增加前者可能引起无效率后者则意意味着无效率状态会成为均衡猎鹿类型协调博弈由策略不确定性所引起的均衡结果依赖于参与人之间的行为预期博弈支付与策略风险

3.2完全且完美信息动态博弈

3.2完全且完美信息动态博弈

动态博弈的一个中心问题是“可信性”问题。 所谓可信性是指动态博弈中先行为的 参与人是否该相信后行为的参与人会 采取对自己有利的或不利的行为。因为后行 为方将来会采取对先行为方有利的行为相当 于一种“许诺”,而将来会采取对先行为方 不利的行为相当于一种“威胁”,因此我们 可将可信性分为“许诺的可信性”和 “威胁的可信性”
我们以“开金矿博弈”为例来讨论可信性问题
甲要开采一价值4万元的金矿,缺1万元的资金, 向乙借1万元,许诺采到金子后与乙平分。 乙是否借钱给甲呢?
乙最需要关心的就是甲采到金子后是否会履行诺 言跟自己平分,因为万一甲采到金子后不但不跟 乙平分,而且还赖帐或卷款潜逃,则乙连自己的 本钱都收不回来。关键的是要判断的许诺是否可 信!以自身利益最大化原则,甲必然选择不分! 乙清楚甲的行为准则,最好的选择是不借!对乙 来说,甲的许诺是不可信的! 要想使甲的许诺成为可信的,加上第三阶段,让 乙在甲违约时采用法律手段---“打官司”,乙的利 益受到法律保护,甲的许诺是可信的。乙在第一 阶段选择借,甲在第二阶段选择分。
行动有先后顺序,不同的参与人在不同时
点行动,先行动者的选择影响后行动者的 选择空间,后行动者可以观察到先行动者 做了什么选择。 因此,为了做出最优的行动选择,每个参 与人都必须这样思考问题: 如果我如此选择,对方将如何应对?如果 我是他,我将会如何行动?给定他的应对, 什么是我的最优选择?

动态博弈的有效分析概念,除了要符合纳什
均衡的基本要求以外,还必须满足另一个关 键的要求,那就是它(或者它们)必须能够 排除博弈方策略中不可信的行为设定,也就 是各种不可信的威胁和承诺。 只有满足这样要求的均衡概念在动态博弈分 析中才有真正的稳定性,才能对动态博弈作 出有效的分析和预测。

博弈论第四章 完全且完美信息动态博弈

博弈论第四章 完全且完美信息动态博弈

0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
精的扩展式表述包括四个要素:
✓ 参与人集合(Player) ✓ 每个参与人的战略集合(Strategy) ✓ 博弈的顺序(Order) ✓ 由战略组合决定的每个参与人的支付(Payoff)
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
精选PPT
12
动态博弈的 战略
精选PPT
13
动态博弈的战略的表述
✓ 战略:参与人在给定信息集的情况下选择行动的规则,它规定参 与人在什么情况下选择什么行动,是参与人的“相机行动方案”。
si表示第i个参与人的特定战略
Si si代表第i个参与人所有可选战 择略 的集合
如果n个参与人每人选择战 一略 个, n维向量s (s1,s2, ,si, ,sn)称为一个战略组合 si表示第i个人选择的战略
精选PPT
6
扩展式表示的一个例子
精选PPT
7
博弈树始于 局中人1 的一个决策结点,这时1
要从L和R中作出选择,如果局中人1选择L,其后就
到达 局中人2 的一个决策结点,这时,局中人2要
从L′和R′中作出选择。类似地,如果局中人1选择R, 则将到达局中人2的另一个决策结点。
这时局中人2从L′和R′中选择行动。无论局中人2 选择了哪一个,都将到达终结点 (即博弈结束)且两 局中人分别得到相应终点节下面的收益。

第三章完全且完美信息动态博弈一

第三章完全且完美信息动态博弈一
➢ 在某个阶段,可能存在几个博弈方同时选择的情况
3.1.2 动态博弈(DG)的特征
动态博弈的策略及结果
➢ 策略:各博弈方在整个博弈中轮到选择的每个阶段, 针对前面阶段的各种情况做作相应选择和行为的完 整计划。
➢ 例如:“仿冒企业A在第一阶段选择仿冒,如果第 二阶段B制止,第三阶段就不仿冒,否则第三阶段 继续仿冒” “被仿冒企业B,当第一阶段A仿冒时 第二阶段不制止,第三阶段A继续仿冒时第四阶段 制止”
3.1.2 动态博弈(DG)的特征
动态博弈的策略及结果
➢ 策略组合:由不同博弈方的这种计划组成的组合。 各博弈方的策略组合可能会形成一条联结各个阶 段的路径。
➢ 动态博弈的结果:各个博弈方的策略及策略组合、 实现的博弈路径和各博弈方的得益。
3.1.2 动态博弈(DG)的特征
动态博弈中博弈方地位的非对称性

乙 借 不借
(0,4) (0,0)
(c)

借 不借
甲 (0,0)

不分
(2,2) (-1,4)
(b)

不借
甲 (0,0)

不分
(2,2) 打
乙 不打
(-2,0)
(-1,4)
3.3 子博弈完美纳什均衡分析
一个值得关注的地方
➢ 开金矿博弈中,子博弈完美纳什均衡组合包含 第二、三阶段的选择,而实际上博弈不会进行 到第二、第三阶段,这称为“不在均衡路径上 的选择”
缺乏稳定性的根源在于不能排除“不可信”行为设 定,不能解决相机选择引起的可信性问题。所以需 要引入更强的均衡,除了满足纳什均衡,还要排除 不可信设定。
3.2.3逆推归纳法
逆推归纳法(Backwards Induction)

exfd经济博弈论3—完全且完美信息动态博弈

exfd经济博弈论3—完全且完美信息动态博弈

动态博弈中博弈方的策略是他们自己预先设定
的,在各个博弈阶段针对各种情况的相应行为 选择的计划。
这些策略实际上并没有强制力,而且实施起来 有一个过程,因此只要符合博弈方自己的利益, 他们完全可以在博弈过程中改变计划。我们称 这种问题为动态博弈中的“相机选择 (Contingent Play)”。
(-1,0) (0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
稳定。为什么会出现这种情
况呢?
其实,该博弈中 (不借-不打,不分)和(借-打,分)都是纳什
均衡。但后者不可信,不可能实现或稳定。
上述纳什均衡不稳定的原因,主要在于如果甲在第二阶段选择了 “不分”而不是“分”,乙策略中设定的第三阶段“打”是不可 信的,不可能真正实施,理由是该行为对乙自身也是不利的,追 求自身利益最大化的乙的理性不允许他这么做。甲只要稍作分析 就可以掌握乙的这个弱点,因此不可能理睬乙策略中的“打”官 司威胁,在第二阶段不会选择“分”。反过来,乙也不会愚蠢到 想靠一个明显不可信的威胁撑腰,冒险将资金借给甲,因此他在 第一阶段也不可能“借”。
第三章 完全且完美信息动态博弈
本章讨论动态博弈(Dynamic Games),所
有博弈方都对博弈过程和得益完全了解的完全 且完美信息动态博弈。这类博弈也是现实中常
见的基本博弈类型。由于动态博弈中博弈方的 选择、行为有先后次序,因此在表示方法、利 益关系、分析方法和均衡概念等方面,都与静 态博弈有很大区别。本章对动态博弈的概念和 分析方法,特别是子博弈完美均衡和逆推归纳 法作系统介绍,并介绍各种经典的动态博弈模 型。
所以,在一个动态博弈中,博弈的结果包括双
方(或多方)采用的策略组合,实现的博弈路 径和各博弈方的得益。

3 完全且完美信息动态博弈 博弈论

3 完全且完美信息动态博弈 博弈论

3.2 子博弈完美纳什均衡
3.2.1 子博弈
某个动态博弈从其 某个阶段开始的后 续阶段,可以自成 一个博弈。
条件:有初始信息集
和进行博弈所需要的 全部信息。


不借


(2,2) 打
(1,0) 不分

不打
(1,0)
(0,4)
3.2.2 逆推归纳法
从动态博弈的最后一个阶段或最后一 个子博弈开始,逐步向前倒推以求解 动态博弈的方法。
3 完全且完美信息动态博弈
开金矿
甲欲开采价值4万元的金矿,缺1万资金。甲向 乙借1万,许诺采到金后对半分成。乙是否该借 钱给甲呢?
分析: 乙借不借依赖于甲守不守信 甲为不可信承诺 乙选不借
3 完全且完美信息动态博弈
3.1 动态博弈的表示法和特点 3.2 子博弈完美纳什均衡 3.3 几个经典的动态博弈模型
法律制度应满足两方面的要求
一是对人们正当权益保护力度足够大 二是对侵害他人利益者有足够的震慑
IBM公司的可信威胁
IBM公司曾经对市场公开承诺,对一些刚刚推向市场的新型电脑将在 二、三年后以很低的价格销售。这似乎不可思议,因为既然二、三 年后会降价,许多人就可能推迟购买,这将降低IBM的销量。但实际 上,IBM公司这样做是为了阻止其他电脑公司模仿它的产品。
不开发
子博弈完美开纳发什商均B 衡:
(开发,{不开开发 发,开发不}开)发 开发
(-3,-3)
(1,0) (0,1)
开发商B
不开发 (0,0)
A的策略集合:{开发,不开发} B的策略集合:{{开发,开发},{开发,不开发}
{不开发,开发},{不开发,不开发}}
均衡路径equilibrium path

博弈论_完全信息动态博弈

博弈论_完全信息动态博弈

完全且完美信息动态博弈的子博弈
在完全且完美信息的动态博弈里,由于在每一 个阶段需行动的局中人对该阶段以前的行动组 合是完全了解的,所以在它的扩展式表述中, 该节点一定是单信息节点。 也就是说,每个信息集都是单节点信息集,因 此在完全且完美信息的动态博弈里,从任何一 个节点(不包括顶部节点和底部的终节点)出 发,都存在一个子博弈 对于取数游戏,若修改规则,可有更多子博弈
例子:私奔博弈
需看到的是,私奔决策是由卓文君做出的。她 需要做出这样的选择,是因为她已经知道她父 亲卓王孙反对把她嫁给穷书生司马相如。卓王 孙甚至不惜以断绝父女关系作为威胁,让她断 掉念头。 可以用一个完全且完美信息的动态博弈来描述 卓文君与其父亲之间的博弈。 第一步,卓文君在“私奔”与“断绝想法”中选择 第二步,父亲在“默认”与“断绝父女关系”选择
动态博弈的特征
收益函数
因行动组合的个数小于策略组合的个数,而且更为 直观,所以在动态博弈中,出于分析的方便,局中 人的支付函数是从行动组合到实数集的映射 当有n个局中人时,每个行动组合对应一个n维的实 数向量 但如果动态博弈仍然用策略式来表述的话,其支付 函数也仍然是从策略组合到实数集的映射 对于完全信息的动态博弈,支付函数对各方而言, 都是共同知识
例子
① 甲 ② 左 右 左 乙 ② 右
(2, 0)
(2, -1)
(1, 0)
(3, 1)
13
① 左 ② 甲 ① (-1, 2) 前 (0, 4) 后 (1, 0) (0, 0) 前 (4, -1) 后 (3, 3) 乙 甲

② 乙 ①
(3, 0, 0)

(1, 0, 3)

(2, 3, 1)

(3, 2, 9)

第三章完全且完美信息动态博弈

第三章完全且完美信息动态博弈

工会的无差异曲线
u3 u2 u1 u0
L
第十五页,编辑于星期一:十七点 三十八分。
3.4.3 讨价还价博弈
三回合讨价还价
消耗系数
接受
(S1,10000 S1)
1 出S1
2
接受
不接受,出S2
S1 10000 10000 2S
S2 S S
1 不接受,出S
[S2, (10000 S2 )] [ 2S, 2 (10000 S)]
乙决策的关键:判断
甲许诺的可信性
甲 分
(2,2) 打
(1,0) 不分 乙
不打
(1,0) (0,4)
有法律保障的开金矿博弈 ——分钱打官司都可信

(1,0)

不分
(2,2) 打

不打
(-1,0) (0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
第七页,编辑于星期一:十七点 三十八分。
3.2.2 纳什均衡的问题
第十三页,编辑于星期一:十七点 三十八分。
3.4.1 寡占的斯塔克博格模型
先后选择产量的产量竞争博弈
把古诺模型改为厂商1先选择,厂商2后选择,而非同时选 择即可。
Q q1 q2 , P P(Q) 8 Q u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2 6q2 q1q2 q22
(0,4)
第九页,编辑于星期一:十七点 三十八分。
3.3 子博弈和子博弈完美纳什均衡
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
第十页,编辑于星期一:十七点 三十八分。
3.3.1 子博弈
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

不同的博弈树可以代表相同的博弈,但是有一个 基本规则:一个参与人在决策之前知道的事情, 必须出现在该参与人决策结之前。
13
进入障碍例子:
它有时是自然形成的,如规模经济、专利和许 可证,或者关键投入品的得到都能造成进入障 碍。不过厂商有时也能通过采取适当的策略阻 止潜在竞争者的进入。
为了阻止进入,厂商必须使任何潜在的竞争者 确信进入是无利可图的。 采取蕴涵可信威胁的策略。
3
3.1 动态博弈的表示法和特点
1、Extensive-Form Representation of games 扩展式表述
4
博弈的战略表述
案例- 房地产开发项目
假设有A、B两家开发商市场需求:可能大,也可能
小,双方如果选择开发需要投入:1亿 假定市场有两栋楼出售:
需求大时,每栋售价1.4亿 需求小时,售价7千万
B
开发
A
开发 不开发
N
大 小
1/2
N
大 小
1/2 1/2 1/2
不开发
B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4)
(8,0) (-3,-3) (1,0) (0,8) (0,0)
(0,1)
(0,0)
房地产开发博弈
11
B知道自 然的选择; 但不知道A 的选择(或A、 B同时决策)
N

A
开发
不开发
A
开发
参与人(A,B,N)
结,初始结 不开发
战略 N
外生事件的概率分布
N
大 小
1/2
结,决策结



1/2
1/2
1/2
信息集
B
不开发 开发
B
不开发 开发

B
不开发 开发
B
开发
不开发
结,终 点 结
(4,4)
(8,0) (-3,-3) (1,0) (0,8) (0,0)
(0,1)
(0,0)
房地产开发博弈
支付
22
a11=容忍,a12=阻挠
扩展式表述博弈的纳什均衡
什么是参与人的战略?
A
开发
不开发
B
开发 (-3,-3)
x
不开发 (1,0)
B
开发
x’
不开发
(0,1)
(0,0)
23
若A先行动,B在知道A的行动后行动,则A有一个 信息集,两个可选择的行动,战略空间为:(开发, 不开发); B有两个信息集,四个可选择的行动,B有四个纯 战略: 开发策略:不论A开发不开发,我开发; 追随策略:A开发我开发,A不开发我不开发; 对抗策略:A开发我不开发,A不开发我开发; 不开发策略:不论A开发不开发,我不开发;
25
处在一个策略中的“行动”,可称为“策略性行 动”。
策略性行动:一个策略性行动就是某人通过影响 其他人对自己会如何行为的预期,以促使其他人 采取对自己有利的选择的行动。(相机选择) 这种“影响”具体有两种:威胁或承诺
26
3、Threat 、 Commitment and Credibility 后行动的参与人将会采取的策略性行动对先行 动的参与人是不利的,那么这一“策略性行动” 对后行动的参与人来说就是一种威胁;后行动 的参与人将会采取的策略性行动对先行动的参 与人是有利的,那么这一“策略性行动”对后 行动的参与人来说就是一种承诺。
24
再对策略下一个定义: A strategy for a player is a complete plan of action---it specifies a feasible action for the player in every contingency in which the player might be called on to act.
威胁或承诺是否可信,对动态博弈的进行 十分重要。“The central issue in all dynamic games is credibility.”
在上例中,潜在进入者究竟是否会进入,取决于 在位者的“只要进入就阻挠”的威胁是否可信:
若不可信,即潜在进入者认为他进入后在位者会容忍,
他将会发觉进入有利可图(净赚1000万元)并就会这 么做; 若可信,即潜在进入者认为他进入后在位者一定会阻 挠,就不会进入,因为进入将会损失1000万元。
29
事实上这个威胁是不可信的,因为理性的在位 者知道(如同潜在进入者所知),一旦进入已 经发生了,容忍并保持高价是符合自己利益的。 容忍得5000万元,阻挠得3000万元。
稳定的结果是(进入,容忍)
30
青蛙与蝎子
一只蝎子到了河边想过河,但不可以,因为它不能下水, 之后他见到了一只青蛙,就问青蛙:“你可以背我过河 吗?” 青蛙说:“当然不行了!如果我背你,你就会在我背上攻 击我.” 蝎子说: “不!我一定不会那样做.如果我那样做,我们两个都 会死的.因为我不会游泳”青蛙听到了,就说:“好!”于是答应
(2c)the information of history:
轮到在位者行动时,他已观察到企图进入者是 否已经进入 信息完美 17
(3)about payoffs: 每一种可能行动组合下的支付是共同知识 ——如果企图进入者不进入,则在位者独享 10000万元利润; ——如果进入而在位者容忍,则在位者得 5000万元,进入者利润1000万元; ——如果进入并且在位者阻挠,则在位者利润 3000万元而进入者-1000万元。 信息完全
● (1000,5000)
● (-1000,3000)
19
他国
犯我 不犯我
我国
A 不犯人 犯人
B
我国 不犯人
犯人
(1,4)
(3,2)
(0,2)
(2,3)
20
2、动态博弈的行动和策略
在讨论静态博弈时,我们把策略和行动等同看待,因 为参与人“同时”进行决策,没有观察到其他参与人 采取了什么行动,所以实施行动时没有针对性。而在
8
博弈扩展式表述
博弈树的基本构造 结: 包括决策结和终点结两类;决策结是参与人行 动的始点,终点结是决策人行动的终点. 结满足传递性和非对称性 x之前的所有结的集合,称为x的前列集P(x),x
之后的所有结的集合称为x的后续集T(x)。
9
枝: 枝是从一个决策结到它的直接后续结的连线,
本4000万元。
The extensive-form representation of this Game:
16
(1)players:
一个在位者Ⅰ和一个进入者Ⅱ;
(2a)the order of moves: 进入者先行动,在位者后行动; (2b)the moves sets: AⅠ = {容忍,阻挠} , AⅡ = {进入,不进入} ; AⅠ={a11,a12} , AⅡ={a21,a22}
s1=“如果有人进入,就阻挠,没人进入则容忍 ”对应 于局中人2选“进入”和“不进入”的应对策略:(阻 扰,容忍) s2=“如果没人进入,就阻挠,有人进入则容忍” (容 忍,阻扰) s3=“无论是否有没有人进入,都阻挠”; (阻扰,阻扰)
s4=“无论是否有没有人进入,都不阻挠”; (容 忍,容 忍)
N



1/2
1/2
1/2
1/2
B
不开发 开发
B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4)
(8,0) (-3,-3) (1,0) (0,8) (0,0)
(0,1)
(0,0)
房地产开发博弈
12
博弈扩展式表述
只包含一个决策结的信息集称为单结信息集,如 果博弈树的所有信息都是单结的,该博弈称为完 美信息博弈。 自然总是假定是单结的,因为自然在参与人决策 之后行动等价于自然在参与人之前行动,但参与 人不能观测到自然的行动。
进入者将赚到1000万元的净利润:5000万元减去4000万
元的建厂成本。
15
不过在位者也可以增加自己的生产能力,生产更
多,并把价格压低。显然,增加生产能力代价很大,
而降低价格也意味着减少收益。这种商战导致双方 的低利润: 在位者的利润下降到3000万元,进入者将有1000 万元的净损失:来自于销售的3000万元减掉建厂成
33
新的博弈格局: 进入 Ⅱ 不进入 ● (0,7000) 阻挠 ● (-1000,3000)
第三章
完全且完美信息动态博弈
3.1 动态博弈的表示法和特点 3.2 可信性和纳什均衡的问题
3.3 子博弈和子博弈完美纳什均衡
3.4 几个经典动态博弈模型
3.5 有同选择的动态博弈模型
3.6 动态博弈分析的问题和扩展讨论
1
第三章
完全且完美信息动态博弈
•本章将引入博弈顺序于博弈模型之中,并 对不同博弈顺序对博弈均衡的影响作出评估。 •所谓“动态”博弈模型,就是指在博弈中 局中人的“出招”顺序对均衡的形成有实质 性影响的博弈模型。
如果市场上只有一栋楼:
需求大时,可卖1.8亿
需求小时,可卖1.1亿
5
博弈战略表述
需求大的情况 开发商B 开发 不开发 开发
4000,4000 0,8000 8000,0 0,0
开发商A
不开发 需求小的情况
开发
开发商B 开发
-3000,-3000 0,1000
不开发
1000,0 0,0
开发商A
了蝎子背它过河了,在过河途中,蝎子就袭击了青蛙,当
他们沉进水的时侯,青蛙就问蝎子了,为什么那样做?! 蝎子回答:“对不起,因为那个是我的本性。”
相关文档
最新文档