5 同时博弈与序贯博弈

合集下载

连续博弈的概念

连续博弈的概念

连续博弈的概念全文共四篇示例,供读者参考第一篇示例:连续博弈是博弈论中一个重要的概念,它描述了博弈的一种特定形式,即游戏在一系列连续的回合中进行,每一回合的决策都受前一回合的结果影响。

这种博弈形式不同于一次性的单次博弈,而是存在连续的互动和反复博弈。

在连续博弈中,参与者可以根据前一回合的结果来调整自己的策略,以获得更好的回报。

这种互动性和动态性使得连续博弈更具挑战性和复杂性,同时也更贴近现实生活中的许多实际情况。

在连续博弈中,参与者的决策往往受到对手的策略选择和游戏规则的限制。

他们需要不断地分析对手可能的行为,同时也要考虑自己的利益和目标,以在长期的博弈过程中取得最优的结果。

连续博弈的一个重要特点是信誉的建立和维持。

在多次互动中,参与者的决策会反映他们之前的行为和信誉,这会影响其他玩家对他们的看法和态度。

在连续博弈中,建立良好的信誉是非常重要的,它可以帮助玩家取得更好的结果和更大的收益。

另一个重要的概念是策略的演化和博弈的稳定性。

在连续博弈中,参与者的策略选择往往会随着时间的推移而发生变化,他们可能会根据对手的行为和游戏的胜率来调整自己的策略。

这种策略的变化和演化会导致博弈的稳定性出现变化,有些策略可能会变得稳定,而有些策略可能会被淘汰。

在现实生活中,连续博弈的概念可以应用于许多领域,如商业竞争、政治博弈、社会互动等。

人们可以通过分析对手的行为和不断优化自己的策略,来取得更好的效果和获得更大的利益。

连续博弈也提醒我们,与他人的互动是一个长期的过程,需要不断地学习和适应,才能在竞争中取得优势。

连续博弈是博弈论中一个重要的概念,它描述了一种具有动态性和互动性的博弈形式。

在连续博弈中,参与者需要不断地分析对手的行为和调整自己的策略,以获得最优的结果。

这种博弈形式不仅具有理论意义,也可以应用于现实生活中的各种情况,为人们提供有益的参考和启示。

第二篇示例:连续博弈是博弈论中一个重要的分支,它描述了博弈在一个连续时间内进行的情况。

博弈论第五章同时博弈与序贯博弈

博弈论第五章同时博弈与序贯博弈

乙 借
甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
注意
1、子博弈不能从第一个阶段开始,因为原来的博 弈(母博弈)本身不能称为子博弈,即子博弈集 合是一个真子集合。
2、子博弈不能分割原来博弈(母博弈)的信息集。
D

B

A

C

E

F●

G

H


D、E、F、 G点以后

◆ 都不能构
大投入
联想 小投入
3,
大投入
4,4
方正
小投入
4,3
5,
该博弈的结果为:两个公司都在第一个阶段采取小投入(帕累 优势原则),在第二个阶段采取低价格。但纳什均衡有16个 (过程略),因为很多策略导致同一个结果。
该博弈的展开型表述见P173页 注意: 1、非单点信息集代表什么? 2、为什么两个决策点会用虚线联系起来?
信息集
案例:情侣博弈
丈夫
足球
芭蕾

足球
子 芭蕾
2, 1 0, 0
0, 0 1, 2
夫妻之争
信息集
根据同时博弈的定义,每个局中人决策时不知道别 人的策略,即每个局中人在做自己的行动选择时, 并不知道自己处在哪个决策节点上。例如妻子在选 芭蕾时,并不知道丈夫选的是芭蕾还是足球。
局中人不能是别人对方“已经”做出的行动或决策, 就等于同时行动或决策。

◆ 该虚线罩住的不是信
息集。
◆ ◆
其必须满足:同集同
注,即从各个决策点
◆ 出发的策略选择数目
相同,名称也相同。

10章博弈论

10章博弈论
解题思路:由Q=QS+Qb, QS=49p, p=300-Q得出支配型厂商的需求 曲线,再对总收益求导得出MRb; 令MRb=MCb,得出利润最大化产量、价格;行业产量=Qb+49p
寡头厂商之间的博弈: 博弈论初步 •博弈论的基本概念及其分类; •完全信息静态博弈 •完全信息的动态博弈;
•不完全信息的静态博弈
思考:子博弈精练纳什均衡的特点是什么?
•参与人在前一个阶段的选择将决 定随后的子博弈的结构。
•子博弈精练纳什均衡:若A开发,B
不开发;若A不开发,B开发;若A 先开发,B的子博弈已就被排除了, B只能选择不开发。
思考:为什么序列博弈中,厂商 成功的关键是先行者优势? •在房地产开发的案例中纳什均衡是: 若A开发,B不开发;若A不开发,B 开发;

博弈的分类1 ——合作博弈与非合作博弈
如果各博弈方能达成某种有约束力的契约或默契, 以选择共同的策略,此种博弈就是合作博弈。 反之,就属于非合作博弈。 企业之间的联合定价就属于合作博弈,而经常挑起 价格战的企业采用的便主要是非合作博弈。 在合作博弈中往往包含着非合作博弈,如石油输出 国组织是合作博弈的产物,但其中为了各自利益的 超产和争吵又属于非合作博弈。
在智猪博弈中,先剔除小猪的严格 劣战略“按按纽”,在这一选择后的新 博弈中,小猪只有“等待”一个战略, 而大猪有两个战略可供选择。再剔除新 博弈中大猪的严格劣战略“等待”,从 而达到重复剔除的占优战略均衡: 小猪等待,大猪按按纽。
严格劣战略是指无论其他参与者采取什么 战略,该战略是对自己严格不利的战略。
实行承诺后的阻止市场进入博弈
垄断者
商战 默许 900,300
潜 在 进入 进 不进入 入 者

博弈树例题

博弈树例题

博弈树例题(原创实用版)目录1.博弈树的概念和基本结构2.博弈树的分类和应用场景3.博弈树的例题解析4.博弈树的解题技巧和策略5.博弈树在人工智能和决策制定中的作用正文一、博弈树的概念和基本结构博弈树(Game Tree)是一种用于表示博弈过程的树形结构,主要用于分析和解决两人或多人之间的互动决策问题。

博弈树由节点、边和叶子组成,每个节点表示一个决策,边表示决策之间的概率转移,叶子表示最终的结果。

在博弈树中,每个参与者的决策对应着一棵子树,通过对比子树之间的胜率,可以找到最优的决策策略。

二、博弈树的分类和应用场景1.分类:博弈树根据参与者决策的顺序可以分为序贯博弈树和同时博弈树。

序贯博弈树表示参与者按照一定顺序依次做出决策,而同时博弈树则表示参与者在同一时间做出决策。

2.应用场景:博弈树广泛应用于经济学、社会学、政治学、军事战略等领域。

典型的应用场景包括价格博弈、拍卖、选举、战争策略等。

三、博弈树的例题解析例题:两人零和博弈假设甲乙两人进行零和博弈,甲方有策略 A 和策略 B,乙方有策略 X和策略 Y。

甲方选择策略 A 时,乙方选择策略 X 的概率为 0.6,选择策略 Y 的概率为 0.4;甲方选择策略 B 时,乙方选择策略 X 的概率为0.3,选择策略 Y 的概率为 0.7。

求甲方在两种策略下的最优选择。

解析:通过构建博弈树,可以发现甲方选择策略 A 时,期望收益为0.6*(-1)+0.4*0=-0.2;选择策略 B 时,期望收益为0.3*(-1)+0.7*0=-0.3。

因此,甲方应选择策略 A,乙方应选择策略 Y,才能达到最大收益。

四、博弈树的解题技巧和策略1.剪枝:在博弈过程中,可以对胜率较低的子树进行剪枝,以降低搜索空间,提高计算效率。

2.引入随机因素:在博弈树中,可以通过引入随机因素来模拟不确定性,从而提高模型的泛化能力。

3.采用启发式算法:对于复杂的博弈问题,可以采用启发式算法如Alpha-Beta 剪枝、Min-Max 算法等,来加速搜索过程。

5 同时博弈与序贯博弈

5 同时博弈与序贯博弈

第五章同时博弈与序贯博弈目录•5-1 正规型表示与展开型表示–树型表示转化为矩阵表示–矩阵表示转化为树型表示:信息集•5-2 同时决策与序贯决策的混合博弈•5-3 树型博弈的子博弈•5-4 子博弈精炼纳什均衡•5-6 连续支付情形的序贯博弈5-1 正规型表示与展开型表示•1.树型表示转化为矩阵表示•“进入者”只有一个决策节点,他有两个纯策略可以选择:进入和不进入。

•“垄断者”有四个可能的纯策略:–{容忍,容忍}、{对抗,对抗}、{对抗,容忍}、{容忍,对抗}。

•把首先行动的局中人放在行局中人的位置,后行动的局中人放在列局中人的位置。

•垄断者有不止一个纯策略可以导致相同的博弈结果。

•步骤:首先确定好可供每个局中人选择的纯策略的总数目,从而把表格的大小确定下来,然后在每个策略组合所对应的格子中,按照约定的规格填入相应的支付向量。

•2.矩阵表示转化为树型表示•问题:树型如何能够表达出局中人同时进行博弈的情况。

信息集•处理方法:用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集,并约定如下的理解:所论局中人只知道博弈是否进行到了他的这个信息集,但是在他知道博弈已经进行到他的这个信息集的情况下。

他不知道博弈究竟进行到这个信息集中的哪个决策节点。

注意•一个信息集罩住的必须首先是同一个局中人的决策节点。

•一个信息集罩住的必须是同一个局中人在同一个时点的决策节点。

•给予不被扁椭圆虚线罩住的每个决策节点以信息集的地位,是单点集的信息集。

•每一个决策位置都是一个信息集。

•在同一个信息集上,大自然、老天爷或者虚拟局中人必须给位于该信息集内的每个决策节点规定相同的行动选择集合。

(数量,内容均相同)•当博弈走到一个单点集的信息集时,面临决策的局中人对于博弈迄今的历史是清楚的,他清楚博弈具体走到了他的这个决策节点而不是别的决策节点。

但是当博弈走到一个非单点集的信息集时,面临决策的局中人对于博弈迄今的历史是不清楚的,他不清楚博弃具体走到了他的这个信息集里面的哪个决策节点。

西方经济学微观部分第十章博弈论初步

西方经济学微观部分第十章博弈论初步

策略1 策略2
b p 1 ( b 1 1 b 1 ) 2 ( 1 p 1 )b 2 ( 1 b 2 )2
b11

参 p1 略
A的p1 条件010,1混 合aaa策 000略为与人A p:2 策略12
a11 b21
a21
b12 a12
b22 a22
[习题] 博弈论初步
[习题] 博弈论 初步
p1
单击添加副标题
第十章 博弈论初 步
西方经济学 (微观部分)
*自嘲* 一介学究,惶惶似狗。 东拼西凑,闲来插柳。 或存疏漏,等着挨揍。 钱财无有,知识半斗。 交流携手,相逢美酒。 余望何求?潮起云收。
第十章 博弈论初步 目录
目 录 /CONTENTS
1
第一节 ○
博弈论和

策略行为
2
第二节
3
0 q10.7 1 p10.5 7
1
9– 8–
2
第三节 混合策略均衡 二、混合策略的纳什均衡
第三节 混合策 略均衡
二 混合策略的纳什均衡
❖ 即使纯策略的纳什均衡不存在,相应的混合策
略纳什均衡总会存在。
❖ 纯策略纳什均衡作为 ·q1 1 特例被包括在混合策 略纳什均衡之中。 0.7·
❖ 混合策略博弈的均衡
[案例] “华容 道”里的纳什
均衡(1)
小 道
孔 明
大 路
[案例]“华容道”里的纳什均衡(1)
[案例] “华容道”里的纳什均衡(1)
曹操 小道 大路
被擒
逃脱
擒住 逃脱
空等 被擒
空等
擒住
❖ 孔明曰:“亮夜观乾象,操贼未合身亡。 留这人情, 教云长做了,亦是美事。” 玄德曰:“先生神算,世所罕及!”

Chapter06序贯博弈和同时博弈的结合

Chapter06序贯博弈和同时博弈的结合

Chapter06序贯博弈和同时博弈的结合序贯博弈和同时博弈的结合Combining Sequential and Simultaneous Moves第6章Chapter 6序贯博弈和同时博弈的结合Combining Sequential and Simultaneous Moves博弈类型Game Type概念Concepts分析技术Techniques of Analysis博弈树(扩展形式) Game Trees (Extensive form)收益表(策略形式) Payoff tables (Strategic form) 纯粹序贯博弈反转均衡Purely Sequential- Rollback move games equilibrium纯粹同时博弈Purely Simultaneousmove games纳什均衡Nash equilibriumSlide 2序贯博弈和同时博弈的结合Combining Sequential and Simultaneous Moves在现实中,许多策略环境包含了这两种相互作用的成分。

In reality, many strategic situations contain elements of both types of interaction.而且,我们还可以使用扩展形式或策略形式分析任何一种博弈(可以交叉使用)。

Also, we can use either extensive form or strategic form for any type of game.Slide 3内容提要Outline兼具同时和序贯行动的博弈Games with both simultaneous and sequential moves改变博弈中的行动顺序Changing the order of moves in a game !改变分析方法Change in the method of analysis *三人博弈Three-player gamesSlide 4 兼具同时和序贯行动的博弈Games with Both Simultaneous and Sequential Moves典型的例子一般都是博弈者在一段比较长的时间内相互作用。

3(2)同时博弈与序贯博弈

3(2)同时博弈与序贯博弈

也即πi(ti, tj, hi,ei, hj, ej)=
[a-(hi+ej)]hi -chi +

企业i在市场的最优化问题就可拆为一对问题, 在每个市场分别求解

企业的收益为其利润πi: [a-(hj+ei)]ei-cei-tjei
πi(ti, tj, hi,ei, hj, ej)=
[a-(hi+ej)]hi -chi +

企业的收益为其利润πi:
+ [a-(hj+ei)]ei-c(hi+ei)-tjei
πi(ti, tj, hi,ei, hj, ej)= [a-(hi+ej)]hi
ei*必须满足:maxei[a-(ei+hj*)-c]-tjei ei≧0

企业的收益为其利润πi:
+ [a-(hj+ei)]ei-c(hi+ei)-tjei
企业i在市场的最优
化问题就可拆为一对 问题,在每个市场分 别求解

企业的收益为其利润πi:
πi(ti, tj, hi,ei, hj, ej)= [a-(hi+ej)]hi -chi + [a-(hj+ei)]ei-cei-tjei

hi*须满足: max hi[a-(hi+ej*)-c], hi ≧ 0
银行挤兑(1)
王则柯“银行挤兑的成因和预防”
对客户来说,抽回存款的日期也有两种:一是在银行投资 两客户在同一银行各存有100元,银行将 项目到期之前,称日期 1;一是在到期之后,称日期2。 这200元投资于一个长期项目。如果在项
假定如果两客户在日期 1要求抽回资金则各得70元;如果只 目到期前银行要抽回资金,则只能收回 有一个客户在日期1要抽回资金则该客户得100元,另一客 140元;但如果到期后再收回投资,则可 户只能得到剩余的 40元。

博弈论讲义_05_同时博弈与序贯博弈

博弈论讲义_05_同时博弈与序贯博弈

第三节
子博弈精炼纳什均衡
三、纳什均衡的存在性:库恩定理 完全信息的有限序贯博弈都存在纳 什均衡
2013年9月6日
博弈论第四章 第二讲子博弈精炼纳什均衡
29
第六节 连续支付情形的序贯博弈
复习:完全信息静态博弈
古诺模型:同质产品、产量竞争、合作博弈 两家企业 市场总需求:q=a-p,a>0 企业i的成本:cqi,c>0 企业i的利润:i(q1, q2)=pqi-cqi=(a-q1-q2-c)qi 行为原则:勾结起来象一个垄断企业一样决定市场总产量 max (q)=pq-cq=(a-q-c)q f.o.c. / q 0 纳什均衡产量 均衡利润
高价 高投入 低投入 低价 高价 低价
3,4 1,2 4,3 2,1
第二节
混和博弈
案例:研发投入与定价博弈 (三)第二阶段:根据对方研发投入定价 4.(低投入,低投入)
高价 低投入 低投入 低价 高价 低价
6,6 3,7 7,3 5,5
第二节
混和博弈
案例:研发投入与定价博弈 (四)简化形式与纳什均衡 联想 1. 简化表述
子博弈:指向(2,1) 子博弈精炼纳什均衡 的策略组合——女方 无单独偏离激励
是子博弈精炼 纳什均衡
( 2, 1)
( 0, 0)
(-1, -1) ( 1, 2)
芭蕾
子博弈:指向(1,2) 的策略组合——女方 无单独偏离激励
第三节
例:情侣博弈 三个纳什均衡 (芭蕾,{芭蕾,芭蕾})
女 男 进入 芭蕾 女 进入 芭蕾 进入
(a c) ac * q* 4 2 双方在上述总产量的条件下通过讨价还价来决定各自生产多少, 这是一个零和博弈的问题

博弈论的分类

博弈论的分类

博弈论的分类博弈的分类博弈可以按照不同的分类方式进行分类,比如按照博弈者出招的顺序,博弈者对其他参与博弈者特征、策略空间和收益是否了解进行分类。

1、从按照博弈者出招的顺序、博弈持续时间和重复次数的角度,博弈可以分为静态博弈(Static Game)和动态博弈(Dynamic Game)。

静态博弈指的是参与博弈的各方同时采取策略,这些博弈者的收益取决于博弈者们不同的策略组合。

因此静态博弈又称为“同时行动的博弈”(Simultaneous-Move Games)。

有时候博弈方采取策略有先后,但是他们并不知道之前其他人做出的策略。

比如“囚徒困境”中罪犯1采取策略后,轮到罪犯2采取策略时他并不知道罪犯1所做出的策略。

动态博弈(序贯博弈)指的是在博弈中,参与博弈的博弈方所采取策略是有先后顺序的(Sequential-Move),且博弈者能够知道先采取策略者所选择的策略。

2、从博弈者对其他参与博弈者所了解的信息的完全程度,博弈可以分为完全信息博弈(Complete Information Game)与不完全信息博弈(Incomplete Information Game),以及完美信息博弈(Perfect Information Game)与不完美信息博弈(Imperfect Information Game),确定的博弈(Certainty Game)与不确定的博弈(Uncertain Game),对称信息博弈(Symmetric Game)与非对称信息博弈(Asymmetric Game)等等。

其中,完全信息是指博弈中每一个博弈者对其他博弈者的特征、策略空间和收益函数都了解,也就是博弈者的收益集(Pay offs)是所有博弈者都知道的。

完美信息是指博弈者完全知道在他采取策略时其他博弈者的所有策略信息。

完美信息是针对记忆而言,也就是他知道博弈已经发生过程的所有信息。

又或者说,如果博弈者在采取策略时观察到他所处的信息节点是唯一的,即他知道以前发生的所有事情,如果所处的信息节点不唯一,说明他对之前的信息没有完美的记忆(不知道博弈过程是怎么过来的)。

同时博弈与序贯博弈(2)

同时博弈与序贯博弈(2)

同时博弈与序贯博弈深圳大学中国经济特区研究中心 章平题1•有两个参与人,A和B,他们轮流选择一个介于2和10之间的整数(可以重复)。

A先选。

随着博弈的进行,不断将两个所选的数字合起来累加。

当累计总和达到100的时候,博弈结束。

这时候判所选数字恰好使累计总和达到100的局中人为胜者。

请问:•谁将赢得这场博弈?•完整行动计划是什么?•根据逆推归纳法,当累计接近100时,得到88[100-(3+9)]的人会赢,问题变为抢 88。

•同理,问题可变为抢76,64,52,40,28,16,4,继续逆推(100-12n,当n=8时余4),就是先抢到4的人会赢。

•A,先选4,则A胜出。

•子博弈精炼纳什均衡为上述报法。

•有两个参与人,A和B,他们轮流选择一个介于2和10之间的整数(可以重复)。

A先选。

随着博弈的进行,不断将两个所选的数字合起来累加。

当累计总和达到或者超过100的时候,博弈结束。

这时候判所选数字首先使累计总和达到或者超过100的参与人为输家。

请问:•谁将赢得这场博弈?•完整的行动计划是什么?•根据逆推归纳法,当累计接近100时,得到97[100-3]的人会赢,问题变为抢 97。

•同理,问题可变为抢85,73,61,49,37,25,13,1继续逆推,就是先抢到1,会赢。

•A,先选1,则A胜出。

•子博弈精炼纳什均衡。

博弈树转换成矩阵型表述•确定可供参与人选择的纯策略数目,从而确定表格大小•每个策略组合对应的个子中,按照约定填入收益题2•考虑下面两个超级大国争霸的博弈:有两个超级大国,1和2。

在第一阶段,1首先行动,它可以选择发展核武器或不发展核武器。

在第二阶段,2观察到1的选择后,决定自己是发展核武器还是不发展核武器。

这个博弈的具体支付情况如下:如果双方都发展核武器,则双方都不会获得额外的好处,我们用0和0来表示这种情形。

如果一方发展而另一方不发展,则发展的一方会赢得军备优势,从而称霸世界。

我们用发展的一方得5,不发展的一方的—1来表示这种情形。

第五章 同时博弈与序贯博弈

第五章  同时博弈与序贯博弈

(给,{不实施,实施}) (不给,{不实施,不实施})

3.用倒推法找到子博弈完美纳什均衡:
(不给,{不实施,不实施}),而(给,{不实施, 实施})这个策略组合里乙在甲不给情况下实施是 个不可信的威胁,所以这个纳什均衡不是子博弈完 美纳什均衡,它的稳定性比子博弈完美纳什均衡要 差一些.
第五节 几个经典动态博弈模型
一、寡占的斯塔克尔博格模型 二、劳资博弈 补充: 三、讨价还价博弈 四、委托-代理博弈
一、寡占的斯塔克尔博格模型


先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选 择,而非同时选择即可。 用倒推法,因此从分析厂商2的产量选择开 始,再分析上一阶段的厂商1的产量选择。

A
不仿冒 (5,5)
不制止Leabharlann (2,2)(10,4)
注 意

同时,即使是同一个人在同一时点进行决策,也 不一定构成一个信息集,他还必须满足:在每一 个决策点他的行动选择集合必须是相同的。因为 局中人在做行动选择时并不知道自己位于哪个决 策点,因此,他不可能做出不同的行动选择。
B
A


◆ ◆

B

● ◆

假设博弈过程是这样的:先由工会决定工资率, 再由厂商根据提出的工资率决定雇佣多少劳动。 我们用倒推法分析这个博弈。第一步先分析第二 阶段厂商的选择,也就是厂商对工会选择的工资 率W的反应函数L(W)。设工会提出的工资率为W, 那么厂商实现自己最大利益的雇佣数L,就是最大 值问题。
max (W , L) max[ R( L) WL ]
二、劳资博弈

里昂惕夫提出的,分别代表劳资双方的工会和厂商 之间的博弈模型。

王则柯博弈论5同时博弈与序贯博弈

王则柯博弈论5同时博弈与序贯博弈

• 用 q1( q1 ≥ 0 )表示企业1的产量选择; • 用 q( q2 ≥ 0)表示 企业2在观测到 q1 后所选择 2 的产量; • 用 p(q) = A − q 表示当市场总产量为 q 时的市场 出清价格,其中 q = q1 + q2 • 企业 i 的利润是 π i (q1 , q2 ) = qi [ p (q ) − ci )], i = 1,2 • 每个企业的利润可写为:
π i (q1 , q2 ) = qi ( A − q1 − q2 − ci )
q2 = q2 (q1 )
max q2 ≥0 π 2 (q1 , q2 ) max q2 ≥0 q2 ( A − q1 − q2 − c2 )
π 2 (q1 , q2 ) = −(q2 ) + ( A − q1 − c2 )q2
• 策略组合?纳什均衡?子博弈精炼纳什均衡?
5-5 完美博弈的库恩定理
• 是否每个树型表示的动态博弈都有纳什均 衡呢? • 库恩定理 完美信息的有限序贯博弈 (sequential game of perfect information)都 有纳什均衡。
课堂练习
• 用策略组合的粗线表示法和纳什均衡的虚线排除法画出并 讨论全部可能的对局或者策略组合,以虚线标示不是纳什 均衡的那些对局。 • 用虚线圈住的子博弈和相应的标示具有偏离激励策略的箭 头,排除那些不是子博弈精炼均衡的纳什均衡,得到子博 弈精炼的纳什均衡。
– 每一个决策位置都是一个信息集。
• 同集同注
• 当博弈走到一个单点集的信息集时,面临决策的 局中人对于博弈迄今的历史是清楚的,他清楚博 弈具体走到了他的这个决策节点而不是别的决策 节点。 • 当博弈走到一个非单点集的信息集时,面临决策 的局中人对于博弈迄今的历史是不清楚的,他不 清楚博弃具体走到了他的这个信息集里面的哪个 决策节点。

序贯博弈名词解释

序贯博弈名词解释

序贯博弈名词解释
嘿,你知道啥是序贯博弈不?序贯博弈啊,就好比是一场精彩的棋局!想象一下,两个人在下棋,一个人先走一步,然后另一个人再根
据对方的走法来决定自己的下一步。

这就是序贯博弈啦!比如说,你
和朋友玩猜拳游戏,你先出拳,这就是序贯博弈中的第一步呀。

序贯博弈可不简单哦!它涉及到很多策略和决策呢。

就好像你在走
一条充满选择的路,每一步都得深思熟虑。

比如说在商业竞争中,一
家公司先推出一款产品,另一家公司就得根据这个来决定自己要不要
跟进,推出类似的产品或者采取其他策略,这多有意思啊!
它也像是一场心理战呢!你得去猜对方会怎么做,然后根据这个来
调整自己的行动。

比如你和小伙伴玩捉迷藏,你找的时候,就得想想
他可能会藏在哪里,这就是在进行序贯博弈呀!
而且哦,序贯博弈中先后顺序很重要呢!先行动的一方可能会有一
些优势,但也不一定哦,后行动的一方也可能通过观察和分析来找到
更好的策略。

这就好像跑步比赛,先跑的人不一定就能赢,后面的人
也可能奋起直追呢!
在生活中,序贯博弈无处不在呀!找工作面试的时候,你先展示自己,然后面试官根据你的表现来决定要不要录用你,这也是序贯博弈呀!还有谈恋爱的时候,你先表达自己的感情,对方再决定怎么回应,这同样是序贯博弈。

序贯博弈就是这样,充满了策略、智慧和不确定性。

它让我们的生活变得更加丰富多彩,也让我们不断地去思考和决策。

所以啊,可别小瞧了序贯博弈哦,它真的很重要呢!我的观点就是,序贯博弈就像生活中的一场大冒险,每一步都充满挑战和惊喜,我们要好好去感受和应对它呀!。

博弈的分类方法和主要类型

博弈的分类方法和主要类型

博弈的分类方法和主要类型以下是 7 条关于博弈的分类方法和主要类型的内容:1. 合作博弈和非合作博弈呀!合作博弈就好比一群小伙伴一起搭积木,大家商量着怎么搭才能最高最稳,每个人都为了共同的目标努力,例子就是公司同事们合作完成一个大项目。

而非合作博弈呢,就像两个人抢玩具,都想着自己怎么才能拿到手,比如在商业竞争中,各个企业为了自己的利益争夺市场份额。

2. 静态博弈和动态博弈哦!静态博弈就如同一场拔河比赛,双方站定了位置就开始较劲儿,谁也不能临时改变策略,下棋就是一个典型的例子。

而动态博弈呀,就好像是玩躲猫猫,一方行动了,另一方根据对方的行动再做出反应,然后情况不断变化,谈恋爱时双方的互动就有点像动态博弈呢!3. 完全信息博弈和不完全信息博弈呀。

完全信息博弈就像是玩明牌的扑克牌,你清楚地知道所有的情况,比如考试时知道所有的题目和答案。

不完全信息博弈呢,则像蒙着眼猜东西,你只能知道一部分,那可就刺激啦!像在商业谈判中,双方可能并不完全了解对方的底线。

4. 零和博弈和非零和博弈呢!零和博弈不就是那种“不是你死就是我活”的局面嘛,就像两个人分一个苹果,一个人多了另一个人就少了,赌博有时候就是这样。

而非零和博弈可有意思了,像一起做蛋糕,大家一起努力把蛋糕做大,每个人都能分到更多,合作伙伴共同开拓市场就是这样呀!5. 连续博弈和离散博弈哟!连续博弈就好像是跑马拉松,一直跑一直跑,过程很漫长,股市里的长期投资就像这样。

离散博弈呢,就像短跑比赛,一下子就结束了,比如一次抽奖活动。

6. 对称博弈和非对称博弈呀。

对称博弈好比大家起点都一样,条件都相同,就像两个人进行公平的掰手腕比赛。

但非对称博弈可就不一样啦,可能一方强一方弱,这不就像拳击比赛中重量级别不同的选手对决嘛!7. 策略博弈和随机博弈呢!策略博弈就是要精心谋划,想好每一步怎么走,下象棋就是这样的例子呀。

随机博弈呢,有时候运气成分很大,就像抽奖,全看运气咯!我觉得博弈真的很神奇,不同的分类展现出不同的特点和魅力,在生活中到处都能看到博弈的影子,难道不是吗?让我们多去观察、多去思考,感受博弈带来的乐趣和挑战吧!。

管理学经济学综合考试大纲

管理学经济学综合考试大纲

管理学经济学综合考试大纲科目代码:818适用专业:(1202)工商管理管理学经济学综合由管理学、微观经济学两部分组成,管理学占90分,微观经济学占60分,满分150分。

第一部分管理学一、考试范围1、管理概述:管理的概念与内涵、管理者与管理技能、管理职能、管理中的常用原理、管理的两重性、人性假设等。

2、管理思想演进:古典管理思想时期、行为科学(人际关系学说)时期、管理丛林时期的管理思想等。

3、环境分析:一般环境、具体环境、内部环境的常用分析方法(PEST、五力模型、SWOT、价值链模型、资源分析等)。

4、计划:计划的制定、完备计划的要素、计划的层次、计划的类型、保障计划实施的方法(如滚动计划法、目标管理法等)、目标、基本竞争战略等。

5、决策:决策的概念、类型、方法(如头脑风暴法、德尔菲法、波士顿矩阵等),常用决策理论。

6、组织:组织设计原则及影响因素、部门化类型、常见组织结构类型、管理人员选聘、管理幅度与管理层次、组织中的权力类型、集权与分权、组织变革、组织文化等。

7、领导:领导的本质、常见领导理论。

8、激励:激励的作用模式、激励原则、激励的类型、常见激励理论。

9、沟通:沟通的过程、沟通的目的、沟通类型、组织中的沟通网络、有效沟通的障碍及其克服。

10、控制:控制的类型与目的、控制过程与方式。

二、题型与分值名词解释(20分)简答题(30分)论述题(20分)案例分析(20分)三、推荐书目斯蒂芬·P·罗宾斯、玛丽·库尔特,《管理学》(第13版),中国人民大学出版社,2017年1月。

第二部分微观经济学一、考试范围1、供给与需求:经济学的基本概念、微观经济学的基本假设、需求与供给及影响因素、各种需求与供给弹性及应用。

2、消费者理论:基数效用论与序数效用论;消费者均衡;无差异曲线和预算约束线;边际效用与边际替代率递减规律;收入与价格变化效应;消费者剩余。

3、生产论与成本论:厂商的性质、生产函数与生产成本;短期、长期最优要素投入组合;要素报酬递减规律、规模报酬。

博弈论读后感

博弈论读后感

博弈论读后感博弈论读后感(一)博弈小术语:收益矩阵、均衡、纳什均衡、零和博弈论,也称互动的决策论。

它的基本假设之一是人是理性的。

但现实并非如此,人不可能具有完备的知识也不可能时时理性。

尽管如此,人们仍然乐意用博弈论的方法来解释和分析现实社会现象。

每一次的人际交往都可以简化成两个基本选择:合作或背叛。

比如在前面的日志里提到的囚徒困境,在人际交往中普遍存在囚徒困境:双方明知合作能带来双赢,却因为理性的自私和信任的缺乏而导致合作难以形成。

当一次性博弈出现时,人们往往会选择背叛。

这在现实生活中也有很多例子,比如飞机场,为什么食品价格敢定那么高呢?因为它知道候机的乘客不会是它的长期客户。

而当博弈的终点不可知时,就又是另一回事了。

在多次博弈中,背叛仍不可避免,但合作的几率会相比一次博弈有提高。

至于如何更加有效地减少背叛,一种办法是引入惩罚机制,可以是带剑的法律或温和些的道德约束。

现实中的集体活动等候上车问题就是个例子,让那些迟到的人自己负责任就是一种惩罚措施。

当然,如果在开头就有一些善意的人出来表明合作态度对提高合作机会也是有帮助的,不管这些善意的人是出于何种目的。

一旦合作开始,人们就能体验到合作的好处,并乐于坚持一段时间。

至于时间的长短,关键是看博弈的终点是否明确。

这在上面也提到了,如果终点明确,人们就会倾向于在最后一次背叛。

而当大家都知道对方会这样想时,倒数第二次就会成为新的终点,新的背叛。

如此反复推演,合作从一开始就很难形成。

注意上面的论述是基于没有惩罚机制的基础。

有一个很有意思的实验,是由爱克斯罗德完成的。

这是一个计算机模拟竞赛,参赛的62位科学家递交了自己写的关于博弈策略的代码,同时加上爱克斯罗德本人写的一个随即策略代码,共63个。

结果表明,前15名中只有第8名是非善意的程序,最后15名只有一个善意的,夺魁的是一报还一报策略。

这个实力不凡的一报还一报策略就是对方选择什么我就回应什么,你合作我就合作,你背叛我也背叛。

第十章---博弈论初步精选全文完整版

第十章---博弈论初步精选全文完整版
由于p1,p2和q1,q2的取值有无限多的可能,
甲 (式乙)
p.61
p.42
A B
混合策略组合及其支付也就有无限多的可能。
q.31 C 4,6 7,3

.q72 D 9,1 2,8 9
不存在纯策略均衡时的混合策略均衡3
• 条件混合策略:参与人在假定其他参与人按某一概率选择某一策略
的条件下设计的对自己而言具有相对优势的(即期望支付最大的)混合 策略,称为“条件混合策略”。
• 对乙而言,如果假定甲合作,那么乙合作的支付为6,比不合作的支付 多1,因此合作是甲合作条件下乙的条件策略;假定甲不合作,那么乙的 条件策略是也不合作,乙若合作支付只有1,不合作则可得到3。
• 条件策略组合:参与人以其他参与人选择某一策略为条件的条件策略与
作为它的条件的对方策略之间的组合,称为“条件优势策略组合”或
• 假q2=定1-(q1p代1,入p甲2)与、乙(各q自1,的q2期)望的支取付值表从达0到式1有无,限经多整可理能可,得把:p2=1-p1和 E甲= p1(7-10q1)+5q1+2(式1); E乙= 5q1(2p1-1)-7p1+8(式2)
• 每个参与人需要确定,在另一参与人为其混合策略选择某个概率值时, 己方混合策略的概率向量应怎样取值,才能使自己的期望支付最大。
e点的坐标是p1=0.5,q1=0.7,则纳什均衡 时p2=0.5,q2=0.3 。
q1 1
本题中混合策略的纳什均衡还可表示为:
((p1 , p2),(q1 ,q2) )= ((0.5 , 0.5),(0.7 , 0.3) )。 0.7 本题中,只有唯一的这个纳什均衡点。
1
q1<0.7
p1= [0,1] q1 = 0.7

信息经济学-先动优势、序贯博弈和同时博弈

信息经济学-先动优势、序贯博弈和同时博弈

信息经济学作业:P157第16、17、18、20、、21、23题 16、1、该游戏有先动优势,又A 先选择,故A 将赢得这场博弈。

2、A 将赢得这场博弈,故A 有最优策略为:A 先选择数字4或者5,之后A 根据B 的选择,每次使得其选择数字与B 选择数字之和为12,按照此策略,A 将赢得最终博弈,具体如下图——按照理论B 将没有可能在该比赛规则下赢得比赛,但博弈中存在颤抖手现象,B 唯一获胜的希望即在A 出现颤抖手——失误时。

17、1、该游戏依旧具有先动优势,又A 先选择,故A 仍赢得这场博弈。

2、A 将赢得这场博弈,故A 有最优策略为:A 先选择数字2或者3,之后A 根据B 的选择,每次使得其选择数字与B 选择数字之和为12,按照此策略,A 将赢得最终博弈,具体如下图——按照理论B 将没有可能在该比赛规则下赢得比赛,但博弈中存在颤抖手现象,B 唯一获胜的希望即在A 出现颤抖手——失误时。

18、 将条件“轮流选择一个介于2和10之间的整数”改为“轮流选择一个介于1和5之间的整数”后,对整体最有策略思路没有影响,依旧是最终A 赢得博弈。

只是影响了博弈次数和数字选择。

如图——AB B B A A A 84=12*7 96=12*8A A AB B B20、按照倒推法,B 最后选择结束的收益为100,选择不结束的收益也100,对B 而言结束不结束收益相等,可以合理假设B 选择结束不结束的概率为50%,50%,倒退一步,A 选择结束的收为99,选择不结束的收益50%可能为98,50%的可能为100(其选择不结束的期望收益=98*50%+100*50%=99)。

A 的选择有赖于对B 的推断,而B 的选择有赖于 推断A 是一个冒险者还是一个保守者 若A 是冒险者,A 会推断B 不结束,A 也选择继续,此时A 、B 的收益分别为100、100。

若A 是保守者,A 会推断B 结束,A 也选择结束,以此类推,A 、B 收益分别为1、1. 21、A B B B AA A 90=6*15 96=6*16A A AB B B (99,99) (98,100)(1,1) (0,3) (2,2) (1,4) (3,3)如上图所示,A 先选择收益最大为(2,0),B 先选择收益最大为(1,1) 对A 而言,先动收益2大于后动收益1,故A 具有先动优势;同理,对B 而言,先动收益1,大于后动收益0,故B 也具有后动优势。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章同时博弈与序贯博弈
目录
•5-1 正规型表示与展开型表示–树型表示转化为矩阵表示
–矩阵表示转化为树型表示:信息集•5-2 同时决策与序贯决策的混合博弈•5-3 树型博弈的子博弈
•5-4 子博弈精炼纳什均衡
•5-6 连续支付情形的序贯博弈
5-1 正规型表示与展开型表示•1.树型表示转化为矩阵表示
•“进入者”只有一个决策节点,他有两个纯策略可以选择:进入和不进入。

•“垄断者”有四个可能的纯策略:
–{容忍,容忍}、{对抗,对抗}、{对抗,容忍}、{容忍,对抗}。

•把首先行动的局中人放在行局中人的位置,后行动的局中人放在列局中人的位置。

•垄断者有不止一个纯策略可以导致相同的博弈结果。

•步骤:首先确定好可供每个局中人选择的纯策略的总数目,从而把表格的大小确定下来,然后在每个策略组合所对应的格子中,按照约定的规格填入相应的支付向量。

•2.矩阵表示转化为树型表示
•问题:树型如何能够表达出局中人同时进行博弈的情况。

信息集
•处理方法:用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集,并约定如下的理解:所论局中人只知道博弈是否进行到了他的这个信息集,但是在他知道博弈已经进行到他的这个信息集的情况下。

他不知道博弈究竟进行到这个信息集中的哪个决策节点。

注意
•一个信息集罩住的必须首先是同一个局中人的决策节点。

•一个信息集罩住的必须是同一个局中人在同一个时点的决策节点。

•给予不被扁椭圆虚线罩住的每个决策节点以信息集的地位,是单点集的信息集。

•每一个决策位置都是一个信息集。

•在同一个信息集上,大自然、老天爷或者虚拟局中人必须给位于该信息集内的每个决策节点规定相同的行动选择集合。

(数量,内容均相同)
•当博弈走到一个单点集的信息集时,面临决策的局中人对于博弈迄今的历史是清楚的,他清楚博弈具体走到了他的这个决策节点而不是别的决策节点。

但是当博弈走到一个非单点集的信息集时,面临决策的局中人对于博弈迄今的历史是不清楚的,他不清楚博弃具体走到了他的这个信息集里面的哪个决策节点。

完美和不完美
•历史,也是一种信息。

历史清楚的博弈,叫做完美信息的博弈,历史不清楚的博弈,叫做不完美信息的博弈。

•非单点集的信息集的作用,在于说明所论局中人在决策时面对不完美信息的局面,即他不能根据自己现有的信息对位于信息集内的决策节点进行区分,他不知道自己现在究竟位于这个信息集的哪个决策节点上。

定义
•定义:如果一个序贯博弈的每个信息集都是一个单点集,那么么该序贯博弈就是完美信息博弈。

否则,它就是不完美信息博弈。

•同集同注
例子
•女方不清楚男方“先前做出”
的策略选择。

女方必须要么
在两个决策节点上都选择足
球,要么在两个决策节点上
都选择芭蕾,她不能在一个
决策节点上选择足球,而在
另一个决策节点上选择芭蕾。

•女方的选择也可以放在博弈树的初始决策节点上,这时候男方的两个决策节点就位于同一个信息集内。

此时,男方受到的限制是,他必须在位于信息集内的两个决策节点上作出相同的策略选择。

5-2 同时决策与序贯决策的混合博弈•混合博弈:包含同时决策行动和序贯决策行动的博弈。

例子
•假定有两家计算机公司,彼此就新产品的研发展开博弈竞争。

博弈持续的时间为一年。

•在这一年里,这两家公司为能在市场上推出新产品而需要各自私下确定对研发的投入。

•假设两家公司致力推出的新产品类型相同,并且双方都知道对方要这样做,但他们都没有向公众公布他们的研发预算。

•了解对手研发投入决策的唯一方法,是通过在产业年度交易展上观察其产品的性能来推断最终产品的情况。

•在交易展上观察到对手的新产品后。

双方必须分别对各自的新产品定价。

•假定公司的研发投入只有低预算和高预算两种选择。

低预算的结果是新产品只是旧产品的部分改良,而高预算的结果则是推出一个完全不同于旧产品而且质量高很多的全新产品。

低预算策略用“小”或者“小投人”表示,高预算策略用“大”或者“大投入”表示。

•假定方正和联想在看到对手的新产品后的唯一决策问题就是对自己的新产品进行定价,定价只有“高”和“低”两种选择。

•两阶段同时博弈的序贯结构
研发预算和定价博弈的矩阵型表述
•研发预算和定价博
弈的展开表述•每家公司各有32个
纯策略;共有64个纯策略。

•结果只有16个。

5-3 树型博弈的子博弈
支和棱
•一个支可以包含许多条棱。

支必须包含从它的每个决策节点往后直到末端节点的所有棱。

子博弈
•定义:在一个n人展开型博弈T中,满足如下3个条的一个博弈S称为博弈T的一个子博弈:
1.S的博弈树是T的博弈树的一支;
2.博弈S不能分割博弈T的信息集.具体来说,只要博
弈T的某个情息集的任何一个决策节点是博弈S的一
个决策节点,那么T的这个信息集的每一个决策节点
都必须是博弈S决策节点;
3.博弈S的末端节点处的支付向量,与博弈T在这些末
端节点的支付向量的有关部分重合。

z母博弈
•子博弈的根前断开标示法
注意
•任何博弈树必须从一个初始决策节点(根)开始,那么,子博弈的根必须组成母博弈的单点信息集。

•子博弈的信息集和不包含在它这个支内的母博弈的信息集不相交。

一共有几个子博弈?
5-4 子博弈精炼纳什均衡•策略组合的粗线表示法和纳什均衡的虚线排除确定法可知,8个策略组合,有3个是纳什均衡。

•哪个均衡是最有可能发生的并且具有最好稳定性的结果?
子博弈精炼纳什均衡
•定义(泽尔滕):在一个博弈的所有作为纳什均衡的策略组合当中,那些局限在每个子博弈上都仍然是那个子博弈的纳什均衡的策略组合,叫做子博弈精炼纳什均衡。

•子博弈精练纳什均衡本身也是纳什均衡,但却是比纳什均衡更强的均衡概念。

•利用博弈树考察一个纳什均衡的时,只要局限于某一个子博弈上它不再是纳什均衡,所考察的纳什均衡就不是子博弈精炼纳什均衡。

•(足球,{足球,足球})对局虽然是博弈的纳什均衡,但不是博弈的子博弈精炼纳什均衡,因为局限在根前断开的那支子树所标示的子博弈上,指向(-1,-1)的策略选择有单独偏离的激励,用弯曲箭头表示箭尾的策略成分有向箭头的方向偏离的激励(偏离方向的箭头标示法)。

•如果一个策略组合的某个策略成分有偏离的激励,可以说这个策略组合缺乏局部稳定性。

•子博弈精炼纳什均衡,应该是经得起每个子博弈均衡检验的纳什均衡
•包含不可信威胁的纳什均衡,不是子博弈精炼的纳什均衡。

•这个策略组合,无论从全局看还是从每个局部看,都符合稳定性的要求,符合最优性的要求。

所以,序贯情侣博弈的(足球,{足球,芭蕾})对局,是博弈的子博弈精炼的纳什均衡。

5-5 完美博弈的库恩定理•是否每个树型表示的动态博弈都有纳什均衡呢?
•库恩定理完美信息的有限序贯博弈(sequential game of perfect information)都有纳什均衡。

课堂练习
•用策略组合的粗线表示法和纳什均衡的虚线排除法画出并讨论全部可能的对局或者策略组合,以虚线标示不是纳什均衡的那些对局。

•用虚线圈住的子博弈和相应的标示具有偏离激励策略的箭头,排除那些不是子博弈精炼均衡的纳什均衡,得到子博弈精炼的纳什均衡。

5-6 连续支付情形的序贯博弈•斯坦克尔伯格模型
–与古诺竞争模型一样,斯坦克尔伯格寡头竞争模型也是同质产品的产量竞争模型。

–与古诺模型所不同的是,斯坦克尔伯格模型是一个序贯决策模型,博弈的其中一方具有较强的实力,称之为企业1;而另一方的实力相对
较弱,称之为企业2。

–博弈首先由实力比较强的企业1选择自己的产
量,实力比较弱的企业2在观察到企业1所作出的产量决策后,再确定自己的产量水平。

是一个两阶段的序贯决策博弈。

•用()表示企业1的产量选择;•用(
)表示企业2在观测到后所选择的产量;•用表示当市场总产量为时的市场出清价格,其中•企业的利润是
•每个企业的利润可写为:
1q 01≥q 2q 02≥q 1q q A q p −=)(q 21q q q +=i 2,1)],)([),(21=−=i c q p q q q i i i π)(),(2121i i i c q q A q q q −−−=π。

相关文档
最新文档