第五章同时博弈与序贯博弈转换

合集下载

基于同时博弈和序贯博弈的寡头市场古诺均衡比较分析

基于同时博弈和序贯博弈的寡头市场古诺均衡比较分析

基于同时博弈和序贯博弈的寡头市场古诺均衡比较分析作者:王贵民来源:《经济研究导刊》2014年第21期摘要:根据国内外在古诺模型研究上的缺陷,分别从古诺假定、产品差异、成本差异以及非线性市场需求等方面对垄断市场结构中厂商之间同时博弈与序贯博弈两种情况的均衡状况进行比较分析,得出寡头垄断市场中厂商之间的均衡与产品质量、成本状况、市场需求以及博弈的顺序等因素有关的结论,从而为中国相关行业的决策提供理论依据。

关键词:古诺均衡;同时博弈;序贯博弈;寡头垄断市场中图分类号:F0 文献标志码:A 文章编号:1673-291X(2014)21-0003-06引言古诺模型作为分析寡头市场的一种理论结构,假定两家企业的产品完全相同、二者的边际成本都等于0,并且需求函数也是一样的线性函数。

同时,还假定企业在考虑产量时都把其他企业有可能的反应考虑在内。

自从1938年法国经济学家古诺提出该模型以后,国内外理论界对此模型展开了多种多样的扩展。

如Bischi等人加进了线性成本的条件,Agiza等人引入了非线性成本,Terrance等加进了信息不对称的前提,Scherer等研究了产品差别的情况。

中国学者张明善、闫安等人引入了动态分析的多头垄断,聂规划等研究了无限重复博弈,李天政等加进了需求价格弹性为常数的条件,而秦玉峰则对古诺均衡与斯塔克里贝格均衡进行了比较分析。

这些成果对古诺模型的发展做出了积极贡献,但它们缺乏对寡头企业之间博弈顺序不同所造成的均衡状态差异进行比较分析。

因此,本文试图从同时博弈和序贯博弈两个方面对古诺模型的均衡及其扩展进行比较分析。

一、基于初始假定的同时博弈和序贯博弈均衡比较如前所述,古诺在研究双寡头垄断市场结构时,假定市场上两企业生产完全相同的产品,它们面临共同的线性需求曲线,并且它们的边际成本相等。

下面首先对在这种假定条件下企业间博弈顺序不同造成的均衡结果进行分析。

(一)同时博弈条件下的均衡分析如果某一市场存在A、B两家企业,其生产的产品完全相同,产量用qA、qB表示,它们面临的需求函数是相同的,P=a-bQ。

第五章同时博弈与序贯博弈转换

第五章同时博弈与序贯博弈转换
2015年12月6日
博弈论 第五章形式转换
14
启示
博弈本身: 既包含同时决策, 又包括序贯决策
2015年12月6日
博弈论 第五章形式转换
15
第二节 混和博弈
一、定义 既包含同时决策行动又包含序贯决 策行动的博弈(mixed game) 二、存在原因 博弈双方存在相当长时期的策略互 动过程
高价 低投入 高投入 低价
2015年12月6日
低价
高价
4,3 3,4 2,1 1,2
20
博弈论 第五章形式转换
第二节
混和博弈
三、案例:研发投入与定价博弈 (三)第二阶段:根据对方研发投入 定价 3.(低投入,高投入)
高价 高投入 低投入 低价
2015年12月6日
低价
高价
3,4 1,2 4,3 2,1
2015年12月6日
博弈论 第五章形式转换
11
第一节 表现形式的相互转换
二、矩阵(正规型)→树型(展开型) (二)转换过程 1.任意选定某参与人“先行” 2.另一参与人“后行”:同时决策,不 完美信息
用椭圆形虚线圈“罩住”两个决策节点
3.给出相应支付向量
2015年12月6日
博弈论 第五章形式转换
2015年12月6日
博弈论 第五章形式转换
16
第二节 混和博弈
三、案例:研发投入与定价博弈 (一)第一阶段:同时决策(不完全 信息)——新产品的研发投入 联想 高投入 低投入 高投入 索尼 低投入
2015年12月6日
博弈论 第五章形式转换
17
第二节
混和博弈
三、案例:研发投入与定价博弈 (二)插曲 产业年度交易展→ 互相观察对方产品性能→ 推测对方研发投入

高级微观经济学教案08-序贯博弈

高级微观经济学教案08-序贯博弈

7.3.7序贯博弈本节逻辑:子博弈完美均衡并不能排除不可信的威胁和承诺。

如图:考虑博弈(L,m),给定参与人2选择m,参与任1的最优选择是L;给定参与人1选择L,参与人2选择其他策略和选择m的支付是一样的,也是最优的,但选择m是保证参与人1选择L的“威胁”,因而(L,m)是一个纳什均衡,而且这个博弈只有自身一个子博弈, 因而也是子博弈完美均衡。

但这不是博弈的真实结果,因为参与人2选择m 不是一个可信的威胁。

考虑参与人1没有选择L 。

这样参与人2对于博弈进行到x,y 的信念分别是p(x),p(y),p(x)+p(y)=1.这时,选择纯策略m 的期望收益是:p(x)*1+p(y)*1=1。

混合策略(0.5,0.5)选择(l,r )的期望收益是: p(x)(0.5*0+0.5*4)+p(y)(0.5*4+0.5*0)=2>1。

因而如果参与人1真的没有选择L ,那么参与人1也不会选择m ,威胁是不可信的,(L,m )不是真实的博弈结果。

那么,如何排除m 这些不可信的威胁或承诺?方法:1、引进完美贝叶斯均衡;2、引进序贯均衡概念。

7.3.7.1信念信念体系p (x )是指在在信息集I(x)上的一个概率分布,该概率分布描述了该信息集上的参与人)(x 关于博弈进入该信息集上每一个决策结的的概率(后验概率)。

显然,这些概率和=1。

如上例里p(x)+p(y)=1。

判断/状态(p,b )是一对信念体系/行为策略有序组合,给定状态(p,b ),信念p 可解释为给定行为策略b 已被采取时,参与人所持有的信念。

在一个合理的状态中,信念体系p 应当是应用贝叶斯法则从既定的行为策略b 中推导出来的——当这样做是可行的,也就是在信息集在均衡路径上:∈=Iy b x P b x P x p )()()( 如图7.283/115/515/115/315/3)(=++=αP 。

贝叶斯法则:信念必定是利用贝叶斯法则由策略中推出的——当这样做是可行的。

Chapter06序贯博弈和同时博弈的结合

Chapter06序贯博弈和同时博弈的结合

Chapter06序贯博弈和同时博弈的结合序贯博弈和同时博弈的结合Combining Sequential and Simultaneous Moves第6章Chapter 6序贯博弈和同时博弈的结合Combining Sequential and Simultaneous Moves博弈类型Game Type概念Concepts分析技术Techniques of Analysis博弈树(扩展形式) Game Trees (Extensive form)收益表(策略形式) Payoff tables (Strategic form) 纯粹序贯博弈反转均衡Purely Sequential- Rollback move games equilibrium纯粹同时博弈Purely Simultaneousmove games纳什均衡Nash equilibriumSlide 2序贯博弈和同时博弈的结合Combining Sequential and Simultaneous Moves在现实中,许多策略环境包含了这两种相互作用的成分。

In reality, many strategic situations contain elements of both types of interaction.而且,我们还可以使用扩展形式或策略形式分析任何一种博弈(可以交叉使用)。

Also, we can use either extensive form or strategic form for any type of game.Slide 3内容提要Outline兼具同时和序贯行动的博弈Games with both simultaneous and sequential moves改变博弈中的行动顺序Changing the order of moves in a game !改变分析方法Change in the method of analysis *三人博弈Three-player gamesSlide 4 兼具同时和序贯行动的博弈Games with Both Simultaneous and Sequential Moves典型的例子一般都是博弈者在一段比较长的时间内相互作用。

博弈论系列教程 (5)

博弈论系列教程 (5)
同时博弈与序贯博弈的转换
给碗饭吃吧
Байду номын сангаас
Ø
城管
Ø
突击清查
Ø
出摊
Ø小贩
Ø 不出摊
-2,2 0,-1
不清查
4,0 0,0
特征:(1)同 时决策;(2)
矩阵形式
核心企业与外包企业
Ø合作?不合作?
特征:(1)一 前一后决策; (2)博弈树形

思考
ØQ:两种表现形式是否分别专属于某 一种博弈?
ØA:No. ØA:同时决策博弈——矩阵型、展开型 ØA:序贯博弈——矩阵型、展开型
Ø3.给出相应支付向量
公用地悲剧的展开型
Ø要致富,多养羊

甲 少

(10,10)
乙 少
(30,0)


(0,30)

(20,20)
停顿
Ø结论:某些博弈可以在两种表现形式 之间相互转换
Ø延伸:某些博弈本身既包含同时决策, 又包括序贯决策
第二节 混和博弈
Ø一、定义 Ø既包含同时决策行动又包含序贯决 策行动的博弈
Ø(一)案例:公用地悲剧——同时决策
Ø
牧民乙
Ø
过度放牧
适度放牧
Ø 过度放牧 Ø甲 Ø 适度放牧
10,10 0,30
30,0 20,20
第一节 表现形式的相互转换
Ø二、矩阵(正规型)→树型(展开型) Ø(二)转换过程 Ø1.任意选定某参与人“先行” Ø2.另一参与人“后行”:同时决策,不
完美信息
Ø用椭圆形虚线圈“罩住”两个决策节点
第一节 表现形式的相互转换
Ø一、树型(展开型)→矩阵(正规型)
Ø(二)转换过程

第5章_不完全信息动态博弈

第5章_不完全信息动态博弈
与者 2 必然会选择策略 U。 所以,作为一个动态博弈,博弈路径必然是:参与者 1 选择策
略 L,参与者 2 选择策略 U。 博弈参与者 2 最希望看到的结果是:参与者 1 选择策略 M,从
而博弈结束。在这种情况下参与者 2 可以获得收益 10。但是, 怎样才能让参与者 1 选择策略 M 呢?
完全信息动态博弈中 纳什均衡是完全信息静态博弈的均衡。 子博弈精炼纳什均衡是完全信息动态博弈的均衡。 子博弈精炼纳什均衡是对纳什均衡的一种“精炼”。
不完全信息动态博弈中 贝叶斯纳什均衡是不完全信息静态博弈的均衡。 精炼贝叶斯纳什均衡(Perfect Bayesian Nash Equilibrium) 是不完全信息动态博弈的均衡。 精炼贝叶斯纳什均衡是对贝叶斯纳什均衡的“精炼”。
理性的参与者 1 可以预期到:如果自己不选策略 M,而是选择 策略 L 或者策略 R,那么参与者 2 必然选择策略 U。
在这种序贯理性条件下,参与者 1 会选择策略 L,参与者 1 得 到收益 2,参与者 2 得到收益 3。
如果参与者 1 选择策略 M,那么参与者 1 仅能得到收益 1。 所以先行动参与者 1 不会选择策略 M。 尽管参与者 2 不知道参与者 1 选择了策略 L 还是策略 R,但参
2.不可置信的威胁
参与者 2 如果放出这样的威胁:“如果参与者 1 没有选择策 略 M,而是选择了策略 L 或策略 R,那么参与者 2 必然选择 策略 V”。
参与者 2 的这种威胁如果成立,那么不管参与者 1 选择策略 L 还是策略 R,参与者 1 的收益都只有 0。如果选择策略 M, 参与者 1 可以得到收益 1。
迈克尔 ·斯宾塞(Michael Spence)教授研究了劳动力市 场上的不完全信息、信号传递及均衡问题,为信息经济学的发 展奠定了重要基础。

博弈论基础5

博弈论基础5

27
4
第一节 矩阵型表示与展开型表示
垄断者
{容忍,容忍} {抵抗,抵抗} {抵抗,容忍} {容忍,抵抗}
进 入 者
进入
5 1 -2 10 0 0
2 -2 4 0
2 1 10 0
5 4
不进
5
第一节 矩阵型表示与展开型表示
矩阵型表示→ 矩阵型表示→展开型表示
囚徒困境中分开关押的囚犯决策 把参与者1、2之间的同时行动博弈表示如下:
13
第二节 同时决策 与序贯决策的混合博弈
例:联想和方正两家计算机公司,彼此就新产品研发展开 联想和方正两家计算机公司, 两家计算机公司 博弈竞争。博弈持续时间为一年。假设两家公司致力 博弈竞争。博弈持续时间为一年。 推出的新产品类型相同,并且双方都知道对方要这样 推出的新产品类型相同, 做,但他们没有向公众公开他们的研发预算。了解研 但他们没有向公众公开他们的研发预算。 发投入决策的唯一方法,是通过在产业年度交易展商 发投入决策的唯一方法, 观察其产品的性能来推断最终产品情况。在交易展上 观察其产品的性能来推断最终产品情况。 观察到对手的新产品后,双方对各自新产品进行定价。 观察到对手的新产品后,双方对各自新产品进行定价。 假定两家公司的研发决策有大投入和小投入两种,定 假定两家公司的研发决策有大投入和小投入两种, 价决策有高价和低价两种。 价决策有高价和低价两种。
I.
始于单节信息集的决策节点n(不包括博弈的初始决策 节点); 包含博一书中n之下所有的决策节点和末端节点(不在 n下的节点除外); 没有对任何信息集形成分割。
II.
III.
21
第三节 展开型博弈的子博弈
1 D 2 B E A F C G 3 4 5 6 7 8

同时博弈与序贯博弈(2)

同时博弈与序贯博弈(2)

同时博弈与序贯博弈深圳大学中国经济特区研究中心 章平题1•有两个参与人,A和B,他们轮流选择一个介于2和10之间的整数(可以重复)。

A先选。

随着博弈的进行,不断将两个所选的数字合起来累加。

当累计总和达到100的时候,博弈结束。

这时候判所选数字恰好使累计总和达到100的局中人为胜者。

请问:•谁将赢得这场博弈?•完整行动计划是什么?•根据逆推归纳法,当累计接近100时,得到88[100-(3+9)]的人会赢,问题变为抢 88。

•同理,问题可变为抢76,64,52,40,28,16,4,继续逆推(100-12n,当n=8时余4),就是先抢到4的人会赢。

•A,先选4,则A胜出。

•子博弈精炼纳什均衡为上述报法。

•有两个参与人,A和B,他们轮流选择一个介于2和10之间的整数(可以重复)。

A先选。

随着博弈的进行,不断将两个所选的数字合起来累加。

当累计总和达到或者超过100的时候,博弈结束。

这时候判所选数字首先使累计总和达到或者超过100的参与人为输家。

请问:•谁将赢得这场博弈?•完整的行动计划是什么?•根据逆推归纳法,当累计接近100时,得到97[100-3]的人会赢,问题变为抢 97。

•同理,问题可变为抢85,73,61,49,37,25,13,1继续逆推,就是先抢到1,会赢。

•A,先选1,则A胜出。

•子博弈精炼纳什均衡。

博弈树转换成矩阵型表述•确定可供参与人选择的纯策略数目,从而确定表格大小•每个策略组合对应的个子中,按照约定填入收益题2•考虑下面两个超级大国争霸的博弈:有两个超级大国,1和2。

在第一阶段,1首先行动,它可以选择发展核武器或不发展核武器。

在第二阶段,2观察到1的选择后,决定自己是发展核武器还是不发展核武器。

这个博弈的具体支付情况如下:如果双方都发展核武器,则双方都不会获得额外的好处,我们用0和0来表示这种情形。

如果一方发展而另一方不发展,则发展的一方会赢得军备优势,从而称霸世界。

我们用发展的一方得5,不发展的一方的—1来表示这种情形。

第五章 同时博弈与序贯博弈

第五章  同时博弈与序贯博弈

(给,{不实施,实施}) (不给,{不实施,不实施})

3.用倒推法找到子博弈完美纳什均衡:
(不给,{不实施,不实施}),而(给,{不实施, 实施})这个策略组合里乙在甲不给情况下实施是 个不可信的威胁,所以这个纳什均衡不是子博弈完 美纳什均衡,它的稳定性比子博弈完美纳什均衡要 差一些.
第五节 几个经典动态博弈模型
一、寡占的斯塔克尔博格模型 二、劳资博弈 补充: 三、讨价还价博弈 四、委托-代理博弈
一、寡占的斯塔克尔博格模型


先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选 择,而非同时选择即可。 用倒推法,因此从分析厂商2的产量选择开 始,再分析上一阶段的厂商1的产量选择。

A
不仿冒 (5,5)
不制止Leabharlann (2,2)(10,4)
注 意

同时,即使是同一个人在同一时点进行决策,也 不一定构成一个信息集,他还必须满足:在每一 个决策点他的行动选择集合必须是相同的。因为 局中人在做行动选择时并不知道自己位于哪个决 策点,因此,他不可能做出不同的行动选择。
B
A


◆ ◆

B

● ◆

假设博弈过程是这样的:先由工会决定工资率, 再由厂商根据提出的工资率决定雇佣多少劳动。 我们用倒推法分析这个博弈。第一步先分析第二 阶段厂商的选择,也就是厂商对工会选择的工资 率W的反应函数L(W)。设工会提出的工资率为W, 那么厂商实现自己最大利益的雇佣数L,就是最大 值问题。
max (W , L) max[ R( L) WL ]
二、劳资博弈

里昂惕夫提出的,分别代表劳资双方的工会和厂商 之间的博弈模型。

第九讲(序贯博弈)

第九讲(序贯博弈)

反击
• 然而,美军可以通过调整在西德的部署来改变这 个结果。 • 假设美军增加西德的军队,会出现怎样的结果?
增加部署不是为了能打败苏军。 事实上,其数量无法战胜苏军。 同时还会增加美国的开销。 然而,苏军进攻后,如果美军 选择反击,还是能够救援一部 分的部队。这比全军覆没要好。 从左图可以看出,最终结果对 美军来说是变好了。
纳什均衡与子博弈完美均衡
• 再看金雀与蓝鸟的案例:
– 纳什均衡为蓝鸟进入,金雀接受;和蓝鸟不进入,而 金雀威胁展开价格战。 – 通过对扩展式的简化,两个纳什均衡中只有一个是子 博弈完美均衡。即蓝鸟进入,金雀容纳。 – 价格战的威胁是不可信的。
金雀与蓝鸟的收益矩阵:
金雀 如果蓝鸟进 如果蓝鸟进入, 入,就接受 就展开价格战 3,5 -5,2 0,10 0,10
一个商业案例 – 解答
3 PDF 文件使用 "pdfFactory Pro" 试用版本创建
一个商业案例 – 解答
Exercise – 离婚诉讼费
• 琼斯夫人因为先生外遇要与琼斯先生离婚。 根据婚前协定,如果琼斯夫人能够证明她 先生有外遇就能得到10万美元,否则只能 得到5万美元。她的律师只有雇佣私家侦探 才能证明琼斯先生有外遇,所需费用为1万 美元,包含在律师费中。琼斯夫人有两个 选择:无论诉讼结果是什么,都支付2万美 元的律师费用,或者支付诉讼收入的1/3。 • 琼斯夫人该如何选择呢?
序贯博弈有一定的承诺结构commitmentstructure囚徒困境中由于一方在不知道另即谁先做出战略承诺这使序贯博弈拥有一个或多个一方具体会做出怎样的决策下进行的适当子博弈
序贯博弈
• 序贯博弈 (sequential game):
第九讲 序贯博弈

王则柯博弈论5同时博弈与序贯博弈

王则柯博弈论5同时博弈与序贯博弈

• 用 q1( q1 ≥ 0 )表示企业1的产量选择; • 用 q( q2 ≥ 0)表示 企业2在观测到 q1 后所选择 2 的产量; • 用 p(q) = A − q 表示当市场总产量为 q 时的市场 出清价格,其中 q = q1 + q2 • 企业 i 的利润是 π i (q1 , q2 ) = qi [ p (q ) − ci )], i = 1,2 • 每个企业的利润可写为:
π i (q1 , q2 ) = qi ( A − q1 − q2 − ci )
q2 = q2 (q1 )
max q2 ≥0 π 2 (q1 , q2 ) max q2 ≥0 q2 ( A − q1 − q2 − c2 )
π 2 (q1 , q2 ) = −(q2 ) + ( A − q1 − c2 )q2
• 策略组合?纳什均衡?子博弈精炼纳什均衡?
5-5 完美博弈的库恩定理
• 是否每个树型表示的动态博弈都有纳什均 衡呢? • 库恩定理 完美信息的有限序贯博弈 (sequential game of perfect information)都 有纳什均衡。
课堂练习
• 用策略组合的粗线表示法和纳什均衡的虚线排除法画出并 讨论全部可能的对局或者策略组合,以虚线标示不是纳什 均衡的那些对局。 • 用虚线圈住的子博弈和相应的标示具有偏离激励策略的箭 头,排除那些不是子博弈精炼均衡的纳什均衡,得到子博 弈精炼的纳什均衡。
– 每一个决策位置都是一个信息集。
• 同集同注
• 当博弈走到一个单点集的信息集时,面临决策的 局中人对于博弈迄今的历史是清楚的,他清楚博 弈具体走到了他的这个决策节点而不是别的决策 节点。 • 当博弈走到一个非单点集的信息集时,面临决策 的局中人对于博弈迄今的历史是不清楚的,他不 清楚博弃具体走到了他的这个信息集里面的哪个 决策节点。

博弈论第五章

博弈论第五章

• 假定连锁店有高成本、低成本两种情况,就单期博弈看,
面对新厂商进入,高成本厂商最佳反应为容忍,低成本 厂商最佳反应为斗争,那么高成本厂商在博弈的前期阶 段选择斗争,仍是可信的威胁。
有限次重复博弈的民间定理
厂商2 厂商 A 厂 A 商 1 B 3,3 4,1 B 1,4 0,0
• 个体理性得益 个体理性得益:不管其
无名氏定理举例
支付 甲 利己 利他

利己
利他
1, 1 0, 4
4, 0 3, 3
• 以“利己、利他”为例,其博弈中唯一的纳什
均衡为(利己,利己),两个局中人在此均衡 下所得支付都是1;所以,只要无穷重复博弈 中局中人可行的平均单期支付不小于1,这样 的支付就是一个可能的均衡支付。
• 无穷重复博弈能够导致帕累托改进。
重复博弈的基本特征
阶段博弈之间没有“物质上”的联系, 阶段博弈之间没有“物质上”的联系,即 前一阶段的博弈不改变后一阶段博弈的结 构; 所有博弈方都观测到博弈过去的历史; 所有博弈方都观测到博弈过去的历史; 博弈方的总支付是所有阶段博弈支付的贴 现值之和或加权平均值。 现值之和或加权平均值。
有限次重复博弈: 有限次重复博弈:连锁店悖论
进入者
在位者 ห้องสมุดไป่ตู้许 斗争
不进入 进入 在位者
策略式 进入者 进入 40,50
(0,300)
默许 斗争
-10,0 0,300
不进入
0,300
(40,50)
(-10,0)
Nash均衡为(进入,默许) Nash均衡为(进入,默许)和 均衡为 不进入,斗争) (不进入,斗争)但后者不是 子博弈完美Nash均衡。 均衡。 子博弈完美 均衡

序贯博弈名词解释

序贯博弈名词解释

序贯博弈名词解释
嘿,你知道啥是序贯博弈不?序贯博弈啊,就好比是一场精彩的棋局!想象一下,两个人在下棋,一个人先走一步,然后另一个人再根
据对方的走法来决定自己的下一步。

这就是序贯博弈啦!比如说,你
和朋友玩猜拳游戏,你先出拳,这就是序贯博弈中的第一步呀。

序贯博弈可不简单哦!它涉及到很多策略和决策呢。

就好像你在走
一条充满选择的路,每一步都得深思熟虑。

比如说在商业竞争中,一
家公司先推出一款产品,另一家公司就得根据这个来决定自己要不要
跟进,推出类似的产品或者采取其他策略,这多有意思啊!
它也像是一场心理战呢!你得去猜对方会怎么做,然后根据这个来
调整自己的行动。

比如你和小伙伴玩捉迷藏,你找的时候,就得想想
他可能会藏在哪里,这就是在进行序贯博弈呀!
而且哦,序贯博弈中先后顺序很重要呢!先行动的一方可能会有一
些优势,但也不一定哦,后行动的一方也可能通过观察和分析来找到
更好的策略。

这就好像跑步比赛,先跑的人不一定就能赢,后面的人
也可能奋起直追呢!
在生活中,序贯博弈无处不在呀!找工作面试的时候,你先展示自己,然后面试官根据你的表现来决定要不要录用你,这也是序贯博弈呀!还有谈恋爱的时候,你先表达自己的感情,对方再决定怎么回应,这同样是序贯博弈。

序贯博弈就是这样,充满了策略、智慧和不确定性。

它让我们的生活变得更加丰富多彩,也让我们不断地去思考和决策。

所以啊,可别小瞧了序贯博弈哦,它真的很重要呢!我的观点就是,序贯博弈就像生活中的一场大冒险,每一步都充满挑战和惊喜,我们要好好去感受和应对它呀!。

7第五章 同时博弈与序贯博弈[70页]

7第五章 同时博弈与序贯博弈[70页]

信息集与三人罢工博弈
某公司总共雇佣了三名员工,年底公司老板宣 布明年不涨工资,消息引起了三名员工的不满。因 此,三名员工考虑第二天是否罢工。
✓ 情况0:完美信息 ✓ 情况1:2不知道1 ✓ 情况2:3不知道2 ✓ 情况3:3不知道1 ✓ 情况4:3不知道1,也不知道2 ✓ 情况5:互相都不知 • 写出各种情况下所有人策略集。
• 举例:房地产开发
– B的一个行为策略:如 果A选择开发,那么我 以40%的概率选择开发, 60%的概率选择不开发; A 如果A选择不开发,那 么,我以70%的概率选 择开发,以30%的概率 选择不开发。
B不 不

不 开B

(30%) (70%) (60%) (40%)
序贯决策博弈的纳什均衡
• 展开型博弈的行为策略与策略型博弈的混合策略 有什么区别? – 混合策略是针对所有纯战略而言的; – 行为策略则与信息集密切联系,规定了每一个 信息集上的行动的概率分布。 – 行为策略也是一种相机行动规则,只不过在这 种行动规则指导下参与人的行动选择带有随机 性。
2.矩阵表示转化为树型表示
• 问题:树型如何能够表达出局中人同时进 行博弈的情况?
信息集
• 处理方法: 用一个扁椭圆形的虚线的圈,把所论局
中人的若干决策节点罩起来,成为他的一个信 息集,并约定如下的理解:
– 所论局中人只知道博弈是否进行到了他的这个 信息集,但是在他知道博弈已经进行到他的这 个信息集的情况下。他不知道博弈究竟进行到 这个信息集中的哪个决策节点。
–每一个决策位置都是一个信息集。
• 同集同注:就是从同一个信息集的各个决策节
点出发的策略选择,不仅数目相同,而且名称相同
• 当博弈走到一个单点集的信息集时,面临决策的 局中人对于博弈迄今的历史是清楚的,他清楚博 弈具体走到了他的这个决策节点而不是别的决策 节点。

序贯决策博弈

序贯决策博弈
1 每个决策节点都是同一个参与人的决策节点; 2 该参与人知道博弈进入该集合的某个决策节点,但不知道自 己究竟处于哪一个决策节点.
• 任何博弈的本身可以称为自身的一个子博弈。
1
2013-3-27
承诺博弈
承诺博弈(commitment game):事先承诺 (commitment)通常是解决同时博弈中信 息不充分的一个重要策略。一旦博弈一方 作出承诺,博弈双方的决策时间就有了先 后,同时博弈就变成了序贯博弈,承诺方 是领头者,另一方是跟从者。
案例讨论:三方对决
• 设有A、B、C三个仇家决斗,每人有两粒子弹,每次可发 射一枪(两个回合)。由于A的技术最差(射中概率为0.3), 让A先发射;B的技术次之(射中概率为0.8),因此B第二发 射;C是一位神枪手(射中概率为1.0),因此他第三发射。 如此依序发射,两轮后对决结束。 • 每次轮到某位发射时,他可以选择向两个对手之一开枪, 或者对空放枪(因此不会伤害任何人)。死亡的射手不允许 对人发射也不允许对空发射。另假定,任何射手一旦被其 他射手射中便会立即毙命。 • 在这样一场博弈中,A的最优策略是什么?
• 再以“不转换选择 ”为策略进行同样 多次数(如50次) 的实验
5
青蛙与蝎子博弈树 但是,蝎子在渡江途中还是忍不住叮了 青蛙,于是蝎子与青蛙都沉入江底。 那么,青蛙犯了什么错误呢? 青蛙的错误是轻信了蝎子的承诺。 因为对蝎子来说,叮青蛙是它的本能, 叮青蛙所带来的效用大于其生命的价值 (见下页图)。如果青蛙了解到这一点 ,就不会送蝎子过江。
Sting
(-10,5)
蝎子
Carry Don’t
青蛙
Refuse(5,3) (来自,0)22013-3-27
承诺机制设计

信息经济学-先动优势、序贯博弈和同时博弈

信息经济学-先动优势、序贯博弈和同时博弈

信息经济学作业:P157第16、17、18、20、、21、23题 16、1、该游戏有先动优势,又A 先选择,故A 将赢得这场博弈。

2、A 将赢得这场博弈,故A 有最优策略为:A 先选择数字4或者5,之后A 根据B 的选择,每次使得其选择数字与B 选择数字之和为12,按照此策略,A 将赢得最终博弈,具体如下图——按照理论B 将没有可能在该比赛规则下赢得比赛,但博弈中存在颤抖手现象,B 唯一获胜的希望即在A 出现颤抖手——失误时。

17、1、该游戏依旧具有先动优势,又A 先选择,故A 仍赢得这场博弈。

2、A 将赢得这场博弈,故A 有最优策略为:A 先选择数字2或者3,之后A 根据B 的选择,每次使得其选择数字与B 选择数字之和为12,按照此策略,A 将赢得最终博弈,具体如下图——按照理论B 将没有可能在该比赛规则下赢得比赛,但博弈中存在颤抖手现象,B 唯一获胜的希望即在A 出现颤抖手——失误时。

18、 将条件“轮流选择一个介于2和10之间的整数”改为“轮流选择一个介于1和5之间的整数”后,对整体最有策略思路没有影响,依旧是最终A 赢得博弈。

只是影响了博弈次数和数字选择。

如图——AB B B A A A 84=12*7 96=12*8A A AB B B20、按照倒推法,B 最后选择结束的收益为100,选择不结束的收益也100,对B 而言结束不结束收益相等,可以合理假设B 选择结束不结束的概率为50%,50%,倒退一步,A 选择结束的收为99,选择不结束的收益50%可能为98,50%的可能为100(其选择不结束的期望收益=98*50%+100*50%=99)。

A 的选择有赖于对B 的推断,而B 的选择有赖于 推断A 是一个冒险者还是一个保守者 若A 是冒险者,A 会推断B 不结束,A 也选择继续,此时A 、B 的收益分别为100、100。

若A 是保守者,A 会推断B 结束,A 也选择结束,以此类推,A 、B 收益分别为1、1. 21、A B B B AA A 90=6*15 96=6*16A A AB B B (99,99) (98,100)(1,1) (0,3) (2,2) (1,4) (3,3)如上图所示,A 先选择收益最大为(2,0),B 先选择收益最大为(1,1) 对A 而言,先动收益2大于后动收益1,故A 具有先动优势;同理,对B 而言,先动收益1,大于后动收益0,故B 也具有后动优势。

关于博弈论的课程设计

关于博弈论的课程设计

关于博弈论的课程设计一、课程目标知识目标:1. 学生能理解博弈论的基本概念,掌握博弈论的基本原理。

2. 学生能运用博弈论分析日常生活中的竞争与合作问题,解释相关现象。

3. 学生了解博弈论在不同领域中的应用,如经济学、政治学、心理学等。

技能目标:1. 学生具备运用博弈论模型进行问题分析和解决的能力。

2. 学生能通过小组讨论、案例分析等形式,提高团队协作和沟通能力。

3. 学生掌握运用博弈论软件进行简单模拟实验的方法。

情感态度价值观目标:1. 学生认识到竞争与合作的重要性,树立正确的竞争观念。

2. 学生在团队协作中学会尊重他人,培养合作精神。

3. 学生通过博弈论的学习,提高对社会现象的观察和思考能力,培养批判性思维。

课程性质:本课程为选修课程,旨在帮助学生运用博弈论分析现实生活中的问题,提高问题解决能力。

学生特点:高中生具备一定的逻辑思维能力和自主学习能力,对新鲜事物充满好奇心。

教学要求:结合学生特点,注重理论与实践相结合,鼓励学生积极参与讨论,培养实际操作能力。

通过本课程的学习,使学生能够将博弈论知识运用到实际生活中,提高分析问题和解决问题的能力。

同时,注重培养学生的团队协作和沟通能力,提升其情感态度价值观。

教学过程中,将目标分解为具体的学习成果,以便进行教学设计和评估。

二、教学内容1. 博弈论基本概念:博弈、博弈论、博弈参与者、博弈策略、支付函数等。

2. 博弈论基本类型:静态博弈、动态博弈、完全信息博弈、不完全信息博弈等。

3. 博弈论分析方法:均衡分析、序贯均衡、重复博弈、贝叶斯均衡等。

4. 博弈论应用实例:囚徒困境、鹰鸽博弈、公共物品供给问题、市场竞争等。

5. 博弈论软件操作:介绍博弈论软件的使用方法,进行简单模拟实验。

教学大纲安排:第一周:博弈论基本概念及分类第二周:博弈论分析方法(一)第三周:博弈论分析方法(二)第四周:博弈论应用实例分析第五周:博弈论软件操作与实践第六周:课程总结与拓展教材章节关联:第一章:博弈论导论第二章:静态博弈分析第三章:动态博弈分析第四章:不完全信息博弈第五章:博弈论应用实例第六章:博弈论软件操作教学内容注重科学性和系统性,结合课程目标,按照教学大纲安排,有序进行。

序贯博弈问题

序贯博弈问题

序贯博弈问题一、序贯博弈到底是什么?你有没有听过“博弈”这个词?不是打牌那种博弈,指的是一种决策上的游戏,参与者之间的互动决定了每个人的选择与结果。

这就好比你和朋友去吃火锅,火锅店菜单上有各种菜品。

你点了一个菜,等着对方点菜。

可对方不急,先看你点了啥,准备做出反应。

这个过程中,谁先动手,谁后行动,都得影响到最终结果。

大家都在试图猜测对方的想法,自己能得到什么好处。

你以为自己点的牛肉最划算,结果对方一看,“牛肉不行,还是羊肉好”,再调整策略。

你们俩这一来一回的“反应”,就构成了一个典型的序贯博弈。

再想象一下,假设你和朋友去参加一个选秀节目。

节目组规定,选手只能按照先后顺序选择道具,先选的选手能占得先机,但后选的可以看到前面选了什么,再做决定。

这个就类似于序贯博弈的模式。

每一位参与者的决策,都不仅仅是独立的,而是会受到前一个人决策的影响。

在这样的情况下,谁先动手,谁就能占得先机,这个先后顺序决定了最后的胜负。

二、谁先出手更有利?在序贯博弈中,先出手的玩家不一定就能稳赢,但他们肯定比后出手的更占优势。

为什么呢?因为先出手的人往往能掌控局面,虽然选择的范围有限,但可以设置一些“陷阱”,让后出手的人不得不按自己的节奏来。

有点像是你在打麻将时,摸到一张牌,感觉对自己有利,但是如果你不出这个牌,对方可能会“碰”了,结果变得一团乱。

所以,谁先出手,谁就能为自己争取更多的空间。

想象一下,如果你是第一个选择道具的人,你可以挑选最适合自己或者最具战略性的道具,不管其他选手怎么选,你都可以稍微有些预判。

而如果你是第二个选手,虽然知道了对方的选择,但你却没法直接“修正”自己的策略,因为对方的选择可能已经给你造成了一些限制。

这种情况放到生活中也一样。

比如你想约一个朋友去看电影,如果你是先提出邀请的人,你可以选择一部自己感兴趣的电影。

如果对方是先出手的,他就能决定电影的类型,虽然你可以根据他的选择做出反应,但你心里总有些“被动”的感觉。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2015年12月6日
博弈论 第五章形式转换
16
第二节 混和博弈
三、案例:研发投入与定价博弈 (一)第一阶段:同时决策(不完全 信息)——新产品的研发投入 联想 高投入 低投入 高投入 索尼 低投入
2015年12月6日
博弈论 第五章形式转换
17
第二节
混和博弈
三、案例:研发投入与定价博弈 (二)插曲 产业年度交易展→ 互相观察对方产品性能→ 推测对方研发投入
2015年12月6日
博弈论 第五章形式转换
11
第一节 表现形式的相互转换
二、矩阵(正规型)→树型(展开型) (二)转换过程 1.任意选定某参与人“先行” 2.另一参与人“后行”:同时决策,不 完美信息
用椭圆形虚线圈“罩住”两个决策节点
3.给出相应支付向量
2015年12月6日
博弈论 第五章形式转换
2015年12月6日
博弈论 第五章形式转换
18
第二节
混和博弈
三、案例:研发投入与定价博弈 (三)第二阶段:根据对方研发投入 定价 1.(高投入,高投入)
高价 高投入 高投入 低价
2015年12月6日
低价
高价
5,5 2,6 6,2 4,4
19
博弈论 第五章形式转换
第二节
混和博弈
三、案例:研发投入与定价博弈 (三)第二阶段:根据对方研发投入 定价 2.(高投入,低投入)
21
博弈论 第五章形式转换
第二节
混和博弈
三、案例:研发投入与定价博弈 (三)第二阶段:根据对方研发投入 定价 4.(低投入,低投入)
高价 低投入 低投入 低价
2015年12月6日
低价
高价
6,6 3,7 7,3 5,5
22
博弈论 第五章形式转换
第二节
混和博弈
三、案例:研发投入与定价博弈 (四)简化形式与纳什均衡 联想 1.简化表述
第五章 同时博弈与序贯博弈的 转换
2015年12月6日
博弈论 第五章形式转换
6
第一节 表现形式的相互转换
一、树型→矩阵 (一)案例 市场进入阻挠——序贯博弈
容忍 进驻 进驻者 不进驻 在位者 斗
2015年12月6日
(1,5) (-2,2) 忍
在位者 斗争
(0,10)
(0,4)
7
博弈论 第五章形式转换
我行我素策略:{忍,忍}{斗,斗} 对抗策略:{斗,忍} 追随策略:{忍,斗}
2015年12月6日
博弈论 第五章形式转换
9
第一节 表现形式的相互转换
一、树型→矩阵 第一策略对应第一策略 (二)转换过程 2.在表格中填入相应支付向量 在位者
{忍,忍}{斗,斗} {斗,忍} {忍,斗}
一、树型→矩阵 (二)转换过程 1.确定参与人的纯策略数目 (1)进驻者(行参与人)
策略:2个——进驻、不进驻 表格:2行
2015年12月6日
博弈论 第五章形式转换
8
第一节 表现形式的相互转换
一、树型→矩阵 (二)转换过程 1.确定参与人的纯策略数目 表格:4列 (2)在位者:针对进驻者策略,制定 完整行动计划(充分准备)
高投入 低投入
高投入
低价
索尼
低投入
低价
低价 4, 4 高价 4, 3
高价 低价
低价 3, 4 低价 5, 5
23
2015年12月6日
博弈论 第五章形式转换
第二节
混和博弈
三、案例:研发投入与定价博弈 (四)简化形式与纳什均衡 2.纳什均衡 第一阶段:(低投入,低投入) 第二阶段:(低价,低价)
2015年12月6日
博弈论 第五章形式转换
14
启示
博弈本身: 既包含同时决策, 又包括序贯决策
2015年12月6日
博弈论 第五章形式转换
15
第二节 混和博弈
一、定义 既包含同时决策行动又包含序贯决 策行动的博弈(mixed game) 二、存在原因 博弈双方存在相当长时期的策略互 动过程
高价 低投入 高投入 低价
2015年12月6日
低价
高价
4,3 3,4 2,1 1,2
20
博弈论 第五章形式转换
第二节
混和博弈
三、案例:研发投入与定价博弈 (三)第二阶段:根据对方研发投入 定价 3.(低投入,高投入)
高价 高投入 低投入 低价
2015年12月6日
低价
高价
3,4 1,2 4,3 2,1
2015年12月6日
博弈论 第五章形式转换
24

2015年12月6日
1, 5 0,10
-2,2 0, 4
-2,2 0,10
1, 5 0, 4
不进
博弈论 第五章形式转换
10
第一节 表现形式的相互转换
二、矩阵→树型 (一)案例:公用地悲剧——同时决策 牧民乙 过度放牧 适度放牧 过度放牧 10,10 30,0 甲 0,30 20,20 适度放牧
12
公用地悲剧的展开型
要致富,多养羊

多 甲 少 乙
(10,10)


(30,0) (0,30) 少 (20,20)
13

2015年12月6日
博弈论 第五章形式转换
另一话题:点名博弈
第一堂课:同时决策 以后每堂课 点名 最痛苦的事情:没去上课,老师点名! 不点名 最最痛苦的事情:去上课了,老师没点名! 点名 最最最痛苦的事情:第一堂课去了老师没点名, 第二堂课走了老师点名了…… 不点名
给碗饭吃吧
城管 突击清查 不清查 出摊 -2,2 4,0 小贩 0,-1 0,0 不出摊
特征:(1)同 时决策;(2) 矩阵形式。
2015年12月6日
博弈论 第五章形式转换
1
信息化困局
特征:(1)一 前一后决策; (2)博弈树形 式 2015年12月6日
博弈论 第五章形式转换
2
思考
Q:两种表现形式分别专属于某种博 弈? A:No. A:同时决策博弈——矩阵型、展开型 A:序贯博弈——矩阵型、展开型
2015年12月6日
博弈论 第五章形式转换
3
静态博弈的展开型
2015年12月6日
博弈论 第五章形式转换
4
两种形式的转换
2015年12月6日
博弈论 第五章形式转换
5
博弈论
相关文档
最新文档