4 完全信息动态博弈

合集下载

博弈论“囚徒困境”的四种形式

博弈论“囚徒困境”的四种形式

博弈论中的“囚徒困境”摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。

其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。

本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。

关键词:博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。

它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。

为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。

当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。

用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) :囚徒2囚徒1(表1)假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。

容易看出,由于对于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。

二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。

而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。

下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。

首先观察“囚徒困境”的有限博弈,以T记基本博弈的重复次数。

信息经济学考试名词解释

信息经济学考试名词解释

名词解释和简答二、名词解释题1、信息甄别:委托人实现预订一套策略或设计多种合同,根据代理人的不同选择,可以将代理人区分为不同的类别2、不确定性:指经济主体队状态这一不可控制变量的产生与否不具备完全知识3、道德风险:指经济代理热在使自身效用最大化的同时,损害委托人或其他代理人效用的行为4、完全信息动态博弈:指每个局中人都有关于各方收益的全部知识,但局中人的行动有先后,且后行动者在行动之前可以观察到此前其他局中人的行动5、完全信息静态博弈:就是所有局中人同时决策,并且所有局中人对全体局中人在不同条件下的策略空间或收益函数完理解的博弈问题6、对称信息:指相互对应的经济主义之间作对称分布的有关事件的知识和概率分布7、公共产品:指能够在消费互相独立的利益主体之间棉纺地直接转让的产品,并且这些产品在总体上是针对全体或部分效益主体而存在的8、信息价格:是通过货币形式表现的信息价值9、经济人假设:是指经济决策主体(消费者、生产者等)的经济行为都是理性的或合乎理性的,他们在经济活动中不会感情用事,而是精于频段核技术,总是以利己为动机,力图以最小的经济代价去追逐和获得自身的最大效益10、风险:就是不能确定地知道,但能够预测到的状态11、预期效用:是指取决于各种情况出现的概率和相应的概率下可享受的收入或消费的效用12、支配性策略:在一个博弈过程中,无论对方的策略现在如何让,局中人依法都会选择某个确定的策略。

则该策略被称为支配性策略13、共同知识:是指博弈的所有局中人都知道局中人知道的信息,并且所有局中人都知道局中人知道局中人知道的信息14、同质信息:是具有同等性质并将导致同样经济结构的信息15、纳什均衡:如果两个博弈的局中人的策略组合分布构成各自的支配性策略,那么,这个组合就被定义为纳什均衡16、英式拍卖:(价格形式上拍卖),又称增价拍卖,它是指拍卖价的竞价由低向高依次递增直到以最高价击槌成交的一种拍卖方式三、简答题1、简述信号发送一般模型的基本假设条件有哪些?答:首先,假设高生产力组所需要的教育成本相对较低。

完全信息动态博弈和演化博弈的关系

完全信息动态博弈和演化博弈的关系

完全信息动态博弈和演化博弈的关系在博弈论的研究领域中,完全信息动态博弈和演化博弈是两个重要的分支。

它们分别从不同的角度研究博弈现象,但二者之间也存在一定的联系和关系。

本文将探讨完全信息动态博弈和演化博弈的关系,并对它们的特点和应用进行分析。

1. 完全信息动态博弈的定义和特点完全信息动态博弈是指博弈参与者在博弈过程中具备完全信息的情况下,根据先后顺序依次做出决策,随着时间的推移,博弈过程也在不断变化。

在完全信息动态博弈中,博弈参与者对于其他参与者的行动和策略都有准确的了解,能够全面考虑对手的决策,以此来优化自己的策略选择。

完全信息动态博弈的特点包括:首先,信息对称,每个博弈者都能了解其他博弈者的策略和收益函数;其次,决策按照时间顺序依次进行,每个博弈者的行动会对其他人的决策产生影响;最后,完全信息动态博弈具有策略的时序性,参与者需要根据他们观察到的其他人的决策来选择自己的策略。

2. 演化博弈的定义和特点演化博弈是指博弈参与者根据其在群体中的优势来选择策略,并通过遗传和选择机制在演化过程中逐步改变策略的过程。

演化博弈考虑的不是个体之间的完全信息,而是从整体出发,通过个体之间的相互作用和进化选择来探讨不同策略之间的稳定性和最终结果。

演化博弈的特点包括:首先,演化博弈关注的是群体中不同策略的相对频率和进化趋势,而不是个体行动的绝对收益;其次,演化博弈中存在着演化稳定策略,即一旦某种策略在群体中形成,就会对其他策略形成一种稳定的威胁;最后,演化博弈的结果依赖于演化的时间尺度和环境的改变。

3. 完全信息动态博弈与演化博弈的关系完全信息动态博弈和演化博弈虽然从不同的角度出发,但也存在一定的联系和关系。

首先,完全信息动态博弈可以看作演化博弈的一种特殊情况,即当演化博弈的时间尺度趋于无穷时,完全信息动态博弈的结果可以看作是演化博弈的极限情况。

因此,完全信息动态博弈可以为演化博弈提供一种基础理论框架。

其次,演化博弈可以用来解释完全信息动态博弈中出现的某些稳定策略。

第4章 完全信息动态博弈

第4章 完全信息动态博弈

• 我们也可以这样来理解参与者 的行动,参与者2之所以威胁当 我们也可以这样来理解参与者2的行动,参与者 之所以威胁当 的行动 参与者1出 时 他要选择c1,目的在于通过威胁使参与者1选 参与者 出L时,他要选择 ,目的在于通过威胁使参与者 选 择有利于参与者2的 ,因为在参与者1选择 选择R下 参与者2通过 择有利于参与者 的R,因为在参与者 选择 下,参与者 通过 选择d2,能得到3的报酬 明显好于当参与者1选 ,参与者2 的报酬, 选择 ,能得到 的报酬,明显好于当参与者 选L,参与者 时的收益2。但我们要问的是,如果参与者1不顾参与者 不顾参与者2 选d1时的收益 。但我们要问的是,如果参与者 不顾参与者 时的收益 的威胁而选择了L,参与者2可能会出 可能会出c1吗 在参与者2为理性 的威胁而选择了 ,参与者 可能会出 吗?在参与者 为理性 是公共信息的条件下,参与者2选择 的报酬为1,而选择d1 选择c1的报酬为 是公共信息的条件下,参与者 选择 的报酬为 ,而选择 的报酬为2。由于d1要优于 要优于c1,因而参与者1没有理由相信参 的报酬为 。由于 要优于 ,因而参与者 没有理由相信参 与者2会实施他的威胁 也就是说,参与者2的策略 会实施他的威胁, 的策略c1d2是一 与者 会实施他的威胁,也就是说,参与者 的策略 是一 个不可置信的威胁。如果威胁成真, 个不可置信的威胁。如果威胁成真,c1d2就是一个动态不一致 就是一个动态不一致 的策略,因为参与者2事前是理性的 但在博弈进行到(L)时 事前是理性的, 的策略,因为参与者 事前是理性的,但在博弈进行到 时, 他却成了一个非理性的人(选择了c1,而不是d1)。 )。出现上述 他却成了一个非理性的人(选择了 ,而不是 )。出现上述 问题的原因,在于一个纳什均衡只要求在博弈的总体上, 问题的原因,在于一个纳什均衡只要求在博弈的总体上,参与 者的策略须为均衡, 者的策略须为均衡,而对博弈进行到某个部分时是否仍为均衡 没有要求,这就可能导致总体和局部的冲突, 没有要求,这就可能导致总体和局部的冲突,产生不合理的结 果。

完全信息动态博弈

完全信息动态博弈

-3 1
-3, 0,
-3 0
1, 0,
0 1
1, 0,
0 0
这里有3个纯战略Nash均衡,分别是 {开发,{不开发,开发}} (均衡结果:A
14
开发,B不开发) {开发,{不开发,不开发}} {不开发,{开发,开发}} 在每一个均衡,给定对方的战略,自己 的战略是最优的(效用最大) 均衡结果是(开,不开) , (开,不开) , (不开,开) 。注意均衡与均衡结果不同。 一般定义:扩展式博弈的战略 令 H i 为第 i 个参与人的信息集的集合,
1
选择什么行动, 而不是简单的, 与环境无关的 行动选择。 为了说明,我们考虑房地产开发博弈的 例子。有两个开发商A和B,互为竞争对手,决 定是否进行房地产开发。但他们不是同时行 动,且后行动者可以观察到先行动者的行动。 假定博弈的行动顺序如下: (1)开发商A先行 动,选择开发或不开发; (2)在A决策后,自 然选择市场需求大小; (3) 开发商B在观察到A 的决策和市场需求(自然的行动)后,决定开 发或不开发。 如图是房地产开发博弈的博弈树。
4
路径: (path)从初始结到终点结,由结 和枝所组成的系列。 扩展式 (extensive form) 是对博弈的一种描述,满足以下条件: (1)由结和枝组成的整体结构,由单个 起始结开始到终点结, 中间无闭合的圈。 即没 有以下结构

11
1
(所有前列结全排序) (2)必须说明每个结点属于某个参与人。 (3)在自然选择的结上,有自然选择不同 枝的概率。 (4)有划分每个参与人的结的信息集。 (每个信息集是决策结集合的一个子集, 满足 (a)每个决策结都是同一个参与人的决
11
1
U 2 L R L R 1 D

完全信息动态博弈模型

完全信息动态博弈模型

完全信息动态博弈模型完全信息动态博弈模型是博弈论中一种重要的博弈模型,它描述了一组参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。

下面将详细介绍完全信息动态博弈模型的相关内容。

一、博弈的参与者:完全信息动态博弈模型中,通常包括两个或多个参与者,每个参与者都可以做出自己的决策和行动。

参与者可以是个人、组织、公司等,他们之间存在着相互竞争和合作的关系。

二、博弈的信息:完全信息动态博弈模型中的参与者拥有完全信息,即每个参与者都能够获得关于其他参与者的决策和行动的完整信息。

通过完全信息,参与者能够准确地评估自己的决策和行动对其他参与者的影响,并作出最优化的决策。

三、博弈的行动和策略:在完全信息动态博弈中,参与者可以选择不同的行动和策略来达到自己的目标。

每个参与者根据自己对其他参与者行动和策略的评估,以及自己的目标和利益,选择最优化的行动和策略。

四、博弈的时间顺序:完全信息动态博弈是一个时间序列上的博弈模型,参与者的决策和行动是有序进行的。

参与者按照一定的时间顺序依次进行决策和行动,每个参与者都会考虑前面参与者的行动和决策对自己的影响,进而作出自己的决策。

五、博弈的结果和收益:完全信息动态博弈模型的结果是参与者的收益和利益。

通过多轮反复的博弈过程,参与者根据自己的决策和行动可以获得不同的结果和收益。

每个参与者的最终目标是通过优化自己的决策和行动,获得最大的收益和利益。

完全信息动态博弈模型是博弈论中一种重要的模型,它能够帮助我们分析和理解多方参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。

通过对博弈的参与者、信息、行动和策略、时间顺序以及结果和收益的分析,可以更好地理解和应用完全信息动态博弈模型。

完全信息动态博弈名词解释

完全信息动态博弈名词解释

完全信息动态博弈名词解释完全信息动态博弈是经济学和博弈论的一个重要概念,它是一种自上而下的模型,用来描述多个经济参与者之间的博弈行为。

完全信息动态博弈模型可以用来分析不同参与者之间在时间和空间上进行博弈,以求取共同利益最大化。

它允许模型解决者预测策略,分析每个参与者在某个时间点采取的不同策略所带来的结果,以此来帮助其他参与者制定最佳战略。

完全信息动态博弈的核心概念是状态和行动,也就是描述参与者在每一轮有多少种可能的策略。

它在一定的时间框架内,由描述参与者现在的状态,观察他们如何根据当前状态下每个参与者的行动,以及每个行动产生的结果,来描述某一具体策略下的最终结果。

参与者首先通过观察彼此之间的博弈行为,体会状态和行动,从而确定自己的策略,并计划未来可能出现的状态和行动,从而获得最大的利益。

例如,在一款棋类游戏中,两个对手可以通过对对方进行攻击,或者保护自己的棋子,以及改变棋局,来表明他们的能力。

在这种情况下,两个玩家拥有相同的完全信息,他们可以根据当前的棋局和自己可能采取的每一步棋,确定最优的策略,从而提高自己赢得游戏的几率。

许多实际问题也是基于完全信息动态博弈模型构建的,如政府向公司提出经济问题的解决案,或是在双方同意的情况下进行谈判等。

在这些情况下,参与者不仅需要观察当前的状态和行动,还要考虑未来的可能性,用完全信息动态博弈模型来解决问题,才能更有效地取得共同利益最大化。

完全信息动态博弈是经济学和博弈论研究中一个基本模型,它可以有效的模拟由多个经济参与者之间进行的博弈,利用状态和行动的概念,可以很好的帮助参与者制定最优策略,以达到共同利益最大化的目的。

另外,它也可以用来解决政府和公司之间的实际问题。

完全信息动态博弈是一个对经济学和博弈论有着深远作用的概念,它也被广泛应用于实践。

1博弈论概述2完全信息静态博弈3完全信息动态博弈4

1博弈论概述2完全信息静态博弈3完全信息动态博弈4

②从局中人行动的先后顺序可划分为静 态博弈(Static game)和动态博弈 (dynamic game)。静态博弈是指在博弈中, 局中人同时选择行动或虽非同时行动但后行 动者并不知道先行动者采取了什么具体行动。 动态博弈是指局中人的行动有先后顺序,且 后行动者能够观察到先行动者所选择的行动。
③从局中人是否具有有关其他参与人 (对手)的特征、策略空间及支付函数方面 的知识的角度,可划分为完全信息博弈
合作博弈和非合作博弈的区别在于人们的行动为相互 作用时,当事人能否达成一个具有约束力(binding agreement)的协议。若有,就是合作博弈;否则就是非合 作博弈。例如,两个寡头企业,如果他们之间达成一个协议, 联合最大化垄断利润,且各自按该协议生产,即是合作博弈。 其面临的问题是如何分享合作带来的剩余。但若两个企业间 的协议不具有约束力,即没有哪一方能强制另一方遵守该协 议,每个企业都只选择自己的最优产量(或价格),则是非 合作博弈。另外,合作博弈强调的是团体理性、效率、公正 和公平。非合作博弈强调的是个人理性、个人最优决策,其 结果可能是有效率的,也可能是无效率的。
一、占优策略均衡
通常情况下,每个局中人的支付是博弈中所有参与 人策略的函数,故每个局中人的最优策略选择依赖于所 有其他参与人的策略选择。但在一些特殊博弈中,一个 参与人的最优策略选择可能并不依赖于其他参与人的策 略选择,即无论其他参与人选择什么策略,他的最优策 略是唯一的,这种最优策略被称为“占优策略” (dominant strategy)。 例:“囚徒困境” 囚徒困境是博弈论中的经典案例。该故事讲的是,两 个嫌疑犯作案后被警察抓住,分别被关在不同的房间里 进行审讯。警察知道两人有罪,但缺乏有力的证据,除 非两人之中有一个坦白。警察告诉每个人,他们的可选 择的策略与支付如下表:

博弈论“囚徒困境”的四种形式

博弈论“囚徒困境”的四种形式

博弈论中的“囚徒困境”摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。

其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。

本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。

关键词:博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。

它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。

为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。

当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。

用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) :囚徒2囚徒1(表1)假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。

容易看出,由于对于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。

二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。

而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。

下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。

首先观察“囚徒困境”的有限博弈,以T记基本博弈的重复次数。

博弈论第四章 完全且完美信息动态博弈

博弈论第四章 完全且完美信息动态博弈

0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
精的扩展式表述包括四个要素:
✓ 参与人集合(Player) ✓ 每个参与人的战略集合(Strategy) ✓ 博弈的顺序(Order) ✓ 由战略组合决定的每个参与人的支付(Payoff)
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
精选PPT
12
动态博弈的 战略
精选PPT
13
动态博弈的战略的表述
✓ 战略:参与人在给定信息集的情况下选择行动的规则,它规定参 与人在什么情况下选择什么行动,是参与人的“相机行动方案”。
si表示第i个参与人的特定战略
Si si代表第i个参与人所有可选战 择略 的集合
如果n个参与人每人选择战 一略 个, n维向量s (s1,s2, ,si, ,sn)称为一个战略组合 si表示第i个人选择的战略
精选PPT
6
扩展式表示的一个例子
精选PPT
7
博弈树始于 局中人1 的一个决策结点,这时1
要从L和R中作出选择,如果局中人1选择L,其后就
到达 局中人2 的一个决策结点,这时,局中人2要
从L′和R′中作出选择。类似地,如果局中人1选择R, 则将到达局中人2的另一个决策结点。
这时局中人2从L′和R′中选择行动。无论局中人2 选择了哪一个,都将到达终结点 (即博弈结束)且两 局中人分别得到相应终点节下面的收益。

lec4_完全信息动态博弈

lec4_完全信息动态博弈

博 弈 论 讲 义 —— 完 全 信 息 动 态 博 弈
动态博弈的概念
由于动态博弈各参与人进行决策具有明 显的阶段性、行动次序性,通常用扩展 式(extensive form)表述法描述这些信息。
博 弈 论 讲 义 —— 完 全 信 息 动 态 博 弈
博弈的扩展式表示
参与人集合:i=1, … ,N。此外,用0表 示虚拟参与人“自然”;
A 不 能 区 分 (D,L)和(D,R) 是正常的,因 为参与人1可能 没有观察到B是 选择了L还是选 择了R。
博 弈 论 讲 义 —— 完 全 信 息 动 态 博 弈
一些说明
“完美回忆”的数学描述
若x’和x’’属于同一个信息集,即x’∈h(x’’),y’ 是x’的前列结(排在x’前面的决策结),且 均属于同一参与人i。 那么,存在一个y’’(可能是y’本身),满足y’’ ∈h(x’), y’’是x’’的前列结。 在y’到达x’的行动与y’’到达x’’的行动完全一 致。
(4,4)
扩展式表述简例
图2-2是包括自然选择的博弈扩展式表述
A
开发 大(1/2) 不开发
0
小(1/2) 大(1/2)
0
小(1/2)
B
B
B
B
(8,0)
(-3,-3)
(1,0) (0,8) (0,0) (0,1)
(0,0)
图2-2 房地产开发博弈
博 弈 论 讲 义 —— 完 全 信 息 动 态 博 弈
(-3,-3)
图2-8 房地产开发博弈
博 弈 论 讲 义 —— 完 全 信 息 动 态 博 弈
动态博弈的策略式表述
若把B的信息集从左 到右排列,上述四个 纯战略可以简单记为

完全信息动态博弈模型

完全信息动态博弈模型

完全信息动态博弈模型完全信息动态博弈模型是博弈论中的一种重要模型,它描述了参与者具有完全信息(即对所有相关信息都有准确了解)的情况下进行的博弈过程。

在该模型中,参与者能够观察其他人的行为和选择,并根据这些观察作出自己的决策。

在完全信息动态博弈模型中,博弈过程分为多个阶段。

每个参与者在每个阶段都必须做出自己的决策,而后续的决策将依赖于先前的决策。

参与者可以根据观察到的其他人的行为和选择来调整自己的策略。

这种博弈模型特别适用于描述多个参与者之间具有时间序列关系的情况,如竞价拍卖、价格战等。

完全信息动态博弈模型可以用博弈树来表示。

博弈树由一系列节点和边组成,每个节点表示参与者的决策点,边表示参与者的决策选择。

根节点表示博弈的初始状态,而叶节点表示博弈的终止状态。

在每个节点上,参与者根据其他人的选择和观察到的信息来做出决策。

通过沿着博弈树的边一步一步向下移动,参与者可以在每个阶段根据观察到的信息进行反应和调整。

完全信息动态博弈模型需要考虑的核心概念是策略和均衡。

策略是参与者通过决策选择在每个节点上的行为规则,决定了参与者在每个阶段应该如何行动。

而均衡是一种状态,其中所有的参与者都无法通过单方行动来改善自己的收益。

在完全信息动态博弈模型中,通常存在多个均衡解,其中每个参与者都选择出使自己获得最大收益的策略。

通过建立完全信息动态博弈模型,我们可以分析不同参与者的决策行为和相应结果的演化过程。

通过求解均衡解,我们可以预测在不同情况下各参与者的最佳策略选择,从而为参与者提供决策依据。

此外,完全信息动态博弈模型也可以用于研究不同决策因素对博弈结果的影响,并为参与者提供制定最优策略的指导。

总之,完全信息动态博弈模型是博弈论中重要的一个模型,它描述了参与者具有完全信息的情况下进行的博弈过程。

通过建立博弈树、分析策略和求解均衡解,我们可以预测参与者的决策行为和相应结果的演化,并提供决策指导。

这种模型对于研究多个参与者之间具有时间序列关系的博弈情况非常有用,为决策者提供了重要的参考和指导。

完全信息动态博弈

完全信息动态博弈
动态博弈中各博弈方的行动有先后次序,且后行为者能观察 到此前选择行动博弈方的行动,因此动态博弈中各博弈方的 地位是不对称的。
一般来说,由于后行动的博弈方有更多的信息帮助自己选择 行动,可减少决策的盲目性,因此处于较有利的地位。不过, 后行动和具有较多信息并不总是有利的。




上 4,12 3,10 2,12 甲 下 3,12 2,10 1,11
注意:当博弈方按上述子博弈精炼纳什均衡策略组合行动时, 实际上不会进行到博弈的第二、三阶段,两博弈方在第二、 三阶段的行为实际上不会发生。但作为完整策略的表达,在 描述子博弈精炼纳什均衡的策略选择时,必须将其给出。
例 市场进入博弈
进入者

● 不进
默许
x ● 在位者
x ' ● 在位者
打击 默许
打击



(0,0) (-1,-1) (1,2)
男方策略是两个:足球,芭蕾。女方是在知道男方决策后才 行动的,其策略可以归纳为四个:追随策略(他选什么我就 选什么)、对抗策略(他选什么我偏不选什么)、芭蕾策略 (无论他选什么我都选芭蕾)、足球策略(无论他选什么我 都选他喜欢的足球)。
动态博弈的非对称性
静态博弈下,各参与人同时选择,既无法知道别人的选择, 也无暇对此作出反应。但动态博弈中,后行动者会根据先行 动者的选择来调整自己的选择,而先行动者也会预期到这一 点,所以会考虑自己的选择对其他参与人有什么影响,从而 调整自己的策略。
纳什均衡不能排除不可信的威胁(或承诺),因此在分析动 态博弈时不能往往不能做出可靠的判断。
不打
(1,0)
(0,4)
当博弈进行到第三阶段即甲选择“不分”时,乙的合理选择 是“打”官司,这一威胁是可信的;则甲在第二阶段的合理 选择是“分”,这一许诺是可信的;乙在第一阶段选择“借” 是合理的。因此,乙的完整策略是“第一阶段选择‘借’ ,

博弈论四种博弈类型

博弈论四种博弈类型

华为在阿根廷电信设备市场上的竞争博弈华为技术冇限公司是一家总部位于中国广东省除圳市的生产销售电信设备的员工持股 的民营科技公司,经过数十年的发展,成为全球最人的电信网络解决方案提供商,全球第二 人电信基站设备供应商,同时也是全球第六人手机厂商,其海外市场的利润占到其总利润的 75%:在华为进入阿根廷电信设备市场之前,阿根廷的电信设备市场山岌鼻信、阿尔卡特- 朗讯以及阿根廷本土设备供应商三家共同分享市场份额,接下來,我们将分析其不同条件下 的博弈结果: 1、完全信息情况下的静态轉弈A 、纳什均衡:我们将上述三家公司统称为原有垄断者•,华为称为虎视眈眈的潜在进入 者,原冇垄断者想要保住自己现冇的垄断地位,就会想要阻止潜在进入者进入,在这个博弈 中,原有垄断者有两种选择:一是进行斗争,打价格战;二是不斗争,默许其进入从而共同 竞争,具体的支付矩阵结果表示如下:不斗争 斗争根据纳什均衡的定义:各个参与者所做的是在给定其他参与者的策略是所能够做出的瑕 好的一组策略。

当潜在进入者选择进入时,原有垄断者的最优选择是不斗争,获彳'J 70单位 的利润;同样的,原有垄断者选择不斗争的情况2潜在进入者的最优选择是进入,获得 20单位的利润,从而获得一个要求纳什均衡的均衡(进入,不斗争),同理可以得出另一个 纳什均衡(不进入,斗争)。

B 、占优策略:现假设华为公司已经获得了阿根廷电信集团的经营许町证,在严格管制 情况下二者都不能以低于成本的价格进行价格战,同时禁止出现单一寡头垄断的情形,(各 自均有止的利润)在这两种情况卜考虎两者是否进行价格战的情况,具体支付矩阵如卜•所示: 原有垄断者对于潜在进入者而言,不论原有垄断者是否进行价格战,潜在进入者的占优策略都是进 行价格战,因为在原有垄断者定低价时,潜在进入者定低价可以获得额外的20单位利润, 在原有垄断者定高价时,潜在进入者定低价町以获得额外的10单位利润,从而确定华为必 将进行价格战,在完全信息情况卜,原何垄断者会将自己豐于潜在进入者的位豐进行决策, 从而决定自己也要进行价格战,否则会失去更多的利润。

博弈的四种基本类型

博弈的四种基本类型

博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。

例如,囚徒困境。

2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。

例如,斯坦科尔伯格寡头竞争。

3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。

例如,性别战博弈。

4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。

例如,信号传递博弈。

每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。

例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。

完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。

例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。

不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。

例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。

不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。

例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。

博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。

举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。

你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。

二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。

举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。

完全信息动态博弈

完全信息动态博弈

乙 借 不借 甲 借

不借
甲 (1,0)
(1,0)

不分

不分
(2,2) (2,2) (0,4) 打
乙 不打 (0,4)
不可信的许诺 (1,0)
可信的威胁
先来后到博弈
在市场经济活动中常常有这样一种现象,当某个厂商先行开 拓或占领了某个市场以后,其他厂商为丰厚的利润所吸引也 会随后跟进。这时,先占领市场者大多都不会无动于衷,而 是利用自己先行一步的优势对后来者进行打击。但这种打击 往往需要付出一定代价,当然如果能够达到挤走后来者的目 的,它就会长期地独占或垄断市场,所以长期地看先到者还 是合算的。那么,当一个先到者面临一个后来者争夺市场的 威胁时,空间应该如何抉择呢?
* A t A n n * Bi t Bi i 1 i 1
(a v c) 2 (2n 1)(a v c) 2 , ] 解得: t [ 2 4n(n 1)b 4n(n 1) b
(a bQ v c)Q n(a w v)[a v nw (n 1)c] b(n 1) 2
Bi qi a bQ w v bqi 0 awv qi ( n 1)b Q qi
i 1 n
n( a w v ) ( n 1)b
子博弈精炼纳什均衡的应用举例
斯坦克尔伯格(Stackelberg)寡头竞争模型 如同在库诺特模型中一样,在斯坦克尔伯格模型中,企业的行动也 是选择产量。不同的是,在斯坦克尔伯格模型中,企业1(称为领头 企业,leader)首先选择产量q1,企业2(称为尾随企业,follower) 观测到q1,然后选择自己的产量q2,此时他们选择的产量以及所得 利润分别是多少?

完全信息动态博弈 经典例子

完全信息动态博弈 经典例子

完全信息动态博弈经典例子完全信息动态博弈是博弈论中的一个重要概念,指的是博弈参与者在做决策时拥有完全的信息。

下面是符合要求的10个完全信息动态博弈的经典例子:1. 拍卖场景:假设有两个竞拍者参与一场拍卖,他们都知道对方的出价和拍卖物品的价值,他们需要根据对方的出价和自己对拍卖物品价值的估计来决定自己的出价。

2. 囚徒困境:两名囚犯被关押在不同的牢房中,检察官给他们一个选择,如果他们都保持沉默,那么都只会被判轻罪;如果其中一个人供出另一个人,供出者会被判轻罪,而另一个人则会被判重罪;如果两人都供出对方,那么都会被判重罪。

囚犯在做出决策时,都知道对方的选择和可能的后果。

3. 企业竞争:两家竞争对手企业同时决定是否要进入一个新市场。

如果只有一家企业进入市场,它将获得垄断地位,赢得较高的利润;如果两家企业都进入市场,将会有激烈的竞争,利润都会下降。

两家企业在做出决策时,了解对方的行动和可能的后果。

4. 汽车悖论:假设有两辆车同时行驶在一条单行道上,它们需要决定是否要超车。

如果只有一辆车超车,它将获得更快的到达目的地的时间;如果两辆车同时超车,将会导致交通堵塞,两辆车的到达时间都会延长。

两辆车在做出决策时,了解对方的行动和可能的后果。

5. 资源分配:假设有两个人需要共同分配一笔资源,他们都知道对方对资源的需求和自己对资源的评估。

他们需要根据对方的需求和自己的评估来决定如何分配资源。

6. 股票交易:假设有两个投资者同时决定是否要买入或卖出某只股票。

他们都知道对方的交易意向和市场的情况,他们需要根据对方的交易意向和市场情况来决定自己的交易策略。

7. 网络安全攻防:假设有两个黑客分别掌握了对方的攻击技术和防御技术。

他们需要根据对方的技术和自己的技术来决定如何进行攻击或防御。

8. 购物决策:假设有两个消费者同时决定是否要购买某个商品。

他们都知道对方的购买意向和商品的价格,他们需要根据对方的购买意向和商品的价格来决定自己的购买策略。

完全信息动态博弈

完全信息动态博弈
开 不开 开 不开
开发 不开发 开 不开 开 不开 开 不开
(4,4) (8,0) (0,8) (0,0) (-3,-3) (1,0) (0,1) (0,0)
信息集:房地产博弈II
A
开发 不开发
大 小 大 小
开发 不开发 开 不开 开 不开 开 不开
2.3 完全信息动态博弈
博弈的战略表述
假定市场上有两栋楼出售: 需求大时,每栋售价1.4亿, 需求小时,售价7千万; 如果市场上只有一栋楼 需求大时,可卖1.8亿 需求小时,可卖1.1亿
案例- 房地产开发项目-假设有A、B两家开发商 市场需求:可能大,也可能小 投入:1亿
博弈战略表述
4000,4000
(8,0)
(-3,-3)
(1,0)
(0,8)
(0,0)
(0,1)
(0,0)
战略
支付
房地产开发博弈
结, 终点结

结,初始结
信息集
枝: 枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择.
信息集: 每个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结: 1 每个决策结都是同一个参与人的决策结; 2 该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结.
A
开发
不开发
B
B
开发
不开发
开发
(1,0)
(0,1)
(0,0)
不开发
x
x’
什么是参与人的战略?
扩展式
-3, -3
-3, -3
1, 0
1, 0
0, 1
0, 0
0, 1
0, 0
{开发,开发}
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完全信息动态博弈
Complete Information Dynamic Game
主要内容
博弈的扩展式表述 子博弈精练Nash均衡 应用举例
2

扩展式表述(博弈树)一般需确定的要素 参与人集合 参与人行动顺序 参与人的行动空间(集合) 参与人的信息集 参与人的支付函数 外生事件的发生概率/概率分布 扩展式表述的三个基本要素 参与人的集合 每个参与人的策略集合 由策略组合决定的每个参与人的支付
B 坦白 (0,-10) (-10,0) (-1,-1)
坦白
(-8,-8)
17
子博弈精练纳什均衡
定义:扩展式博弈的战略组合是一个子博弈精练纳什均衡,如果: 它是原博弈的纳什均衡; 它在每一个子博弈上都是纳什均衡。 战略是参与人行动规则的完备描述,它要告诉参与人在每一种可预 见的情况下(即每一个决策结)上选择什么行动,即使这种情况实 际上没有发生(甚至参与人并不预期它会发生)。 只有当一个战略规定的行动规则在所有可能的情况下都是最优的, 它才是一个合理的可置信的战略,子博弈精练纳什均衡就是要剔除 那些只在特定情况下是合理的而在其他情况下不合理的行动规则。
子博弈的信息集和支付向量都直接继承自原博弈。
习惯上,任何博弈的本身称为自身的一个子博弈。
15
一个例子
A
开发
不开发
X
大 小
1/2
X
大 小
1/2
1/2
1/2
B
不开发
开发
B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8)
(0,0)
(0,1)
(0,0)
(-1,-1)
10
智猪博弈的扩展式表述(练习)
小猪
按 大猪 按 等待
5,1 9,-1
等待
4,4 0,0
11
主要内容
博弈的扩展式表述 子博弈精练Nash均衡 应用举例
12
思考问题:为什么需要“子博弈精炼纳什均衡”?
对完全信息动态博弈,考虑以下问题: 一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更 合理? 纳什均衡假定每一个参与人在选择自己的最优战略时假定所有 其他参与人的战略是给定的,但是如果参与人的行动有先有后, 后行动者的选择空间依赖于前行动者的选择,前行动者在选择 时不可能不考虑自己的行动对后行动者的影响。 子博弈精练纳什均衡的一个重要改进是将“合理纳什均衡”与 “不合理纳什均衡”分开。
21
先动优势的例子
沃尔马是山姆·华尔顿于1969年创立的一家很庞大的也是很成功的折扣零售 连锁店公司。上世纪70—80年代,其它类似的公司纷纷倒闭时,沃尔马却保 持快速增长,从1976年的153家分店发展到1986年的1009家,且盈利性更强。 到1985年末,山姆·华尔顿已是美国最富有的人之一。 沃尔马成功的关键在于其市场进入与市场扩张策略。在60年代,人们通常都 认为折扣店只能在10万或以上人口的城市中才能成功经营,但山姆·华尔顿 不同意这种看法并决定在美国西南部的小镇上开店,到1970年已经有30家沃 尔马店开设在阿肯色、密苏里和俄克拉荷马的小镇上。一个10万人口以下的 小镇所具有的市场容量并不太大,但却足够容纳下一个大型折扣店,并能让 它获得一定的利润。 到70年代中期,当其它连锁店的经营者意识到这一点时,沃尔马已经大 量占领了这样的市场。对于小镇来说,开出一家折扣连锁店可以盈利。如果 开出两家来,有限的市场容量会使两家都亏损。沃尔马的策略就是先发制人, 力图抢先一步,在其他小镇开设分店。到1986年,它每年赚取4.5亿美元利 润。到1993年,它已有1800多家分店并赚取15亿美元的年利润。
博弈的基本类型:完全信息、不完全信息博弈 静态博弈、动态博弈
13
子博弈精炼纳什均衡
一个纳什均衡称为精练纳什均衡,当只当参与人的战略在每个子博 弈中都构成纳什均衡,也就是说,组成精练纳什均衡的战略必须在 每一个子博弈中都是最优的。 一个精练纳什均衡首先必须是一个纳什均衡,但纳什均衡不一定是 精练纳什均衡。
B
开发
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8)
(0,0)
(0,1)
(0,0)
7
博弈数表述(2)
B知道自然的选 择;但不知道A的 选 择 (或 A、 B同 时决策)
A
开发
不开发
N
大 小
1/2
N


1/2 1/2 1/2
B
不开发 开发
B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4)
不同的博弈树可以代表相同的博弈,但是有一个基本规则:一个参 与人在决策之前知道的事情,必须出现在该参与人决策结之前。
9
囚徒困境博弈的扩展式表述
A
坦白
抵赖 坦白
B
抵赖
B
抵赖 坦白
B
坦白
A
抵赖 坦白
A
抵赖
坦白 抵赖
(-8,-8)
(0,-10)
(-10,0) (-1,-1) (-8,-8) (0,-10) (-10,0)
参与人集合 参与人行动顺序 参与人的行动空间 参与人的信息集 参与人的支付函数 外生事件的概率分布
A
开发
参与人(A,B,N) 初始结 不开发
N

1/2
结,决策结 小
N


1/2 1/2
1/2
信息集
B
不开发 开发

B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8)
22
几点说明

逆向归纳法求解子博弈精练纳什均衡的过程,实质上是重复剔除劣 战略的过程:从最后一个决策结依次剔除每个子博弈的劣战略,最 后生存下来的战略构成精练纳什均衡。
用逆向归纳法求解的子博弈精练纳什均衡也要求“所有的参与人是 理性的”是共同知识。 如果博弈由多个阶段组成,则从逆向归纳法得到的均衡可能并不非 常令人信服。
泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威 胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的 预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则 在每一个信息集上是最优的。
14
子博弈(sub-game)
子博弈:是原博弈的一部分,它本身也可以作为一个独立的博弈进 行分析: 子博弈必须从一个单结信息点开始:只有决策者在原博弈中确切地 知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈 的初始结。如果信息集包含两个以上的决策结,则这两个都不可以 作为子博弈的初始结。
23
作业
请将“囚徒困境”、“斗鸡博弈”用博弈树来表示,并找出它们的均衡。
坦白
坦白 -5,-5
抵赖
0,-8 进

-3,-3
退
2,0
抵赖
-8,0
-1,-1
退
0,2
0,0
24
主要内容
博弈的扩展式表述 子博弈精练Nash均衡——承诺与威胁 应用举例
25
承诺威胁的可信性
承诺与威胁:参与人在博弈前,对另一博弈说“不管你怎么选择,我一定选 择X策略”。这种承诺或威胁可能影响对手的选择。如情侣博弈中,如女生 在博弈前对男生说:“只要你不陪我去看芭蕾,则我们分手”,如果男生相 信女生说的话,而又不愿意分手,则他只好去看芭蕾,尽管他可能很想去看 足球。 承诺与威胁的可信性:承诺与威胁可能是不可信的,如女生说“如果你不陪 我去看芭蕾,我就去自杀”,男生就可能不相信。不可信的承诺对博弈均衡 是没有影响的。 不可信的威胁的例子:小孩不听话,父母说要打死他等。 可信的威胁或承诺:要改变均衡,必须要让威胁或承诺可信。如美国打伊拉 克,阿富汗前,先派遣大批军舰前往该地区,因为这种威胁需要成本。如市 场博弈,不管对方什么策略,先做广告或建厂房,也是一种可信的承诺。 思考:为什么老师要让部分学生考试不及格;罪犯违法,为什么要刑罚,甚 至死刑?
不完全承诺:承诺只是增加了某个行动的成本而不是使该活动完全没 有可能.
27
完全承诺
完全承诺:使自己选择某一行动的成本无穷大(对方看到后,肯定 相信你,因为你付出这么大成本,假如你实施,你的损失也很大);
赌徒坎下自己的手指,以示以后不赌了,因为即使想赌,没有手指也不方便。 婚姻中的承诺:彩礼、昂贵的婚礼可以理解为一种对婚姻的承诺; 订金、抵押物做为对交易的承诺; “安营扎寨”; 固定资产投资可以作为承诺; 所有权的承诺作用; 假定企业一开始定价80,如果前两个消费者购买了,企业将有积极性在50的 价格下向第三个顾客出售。预期到这一点,前两个顾客将不会购买。如果企 业向保证,任何降价的差额将返还顾客,前两个顾客将会购买。因为企业事 实上不会降价了。
5
(0,0)
(0,1)
(0,0)
博弈数的基本结构
结: 包括决策结和终点结两类;决策结是参与人行动的始点,终点结 是决策人行动的终点. 结满足传递性和非对称性 x之前的所有结的集合,称为x的前列集P(x),x之后的所有结的集 合称为x的后续集T(x)。 枝: 枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与 人的一个行动选择. 信息集: 每个信息集是决策结集合的一个子集,该子集包括所有满足 下列条件的决策结:
(8,0) (-3,-3)
(1,0) (0,8)
8
(0,0)
(0,1)
(0,0)
相关文档
最新文档