经典动态博弈模型
博弈论 第 三 章 完全信息动态博弈讲解
房地产开发博弈
开发
A hA(1) 不开发
h表示信息集
N hN(1)
需求大
需求小
N hN(2)
需求大
需求小
B hB(1)
开发
不开发
B hB(2)
B hB(3)
开发
不开发 开发 不开发 开发
B hB(4)
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8) (0,0) (0,1) 单 位:百万元
定 义 一 个 展 开 式 博 弈 的 子 博 弈G 由 一 个 决 策 结x 和 所 有 该 决 策 结 的 后继结T(x)( 包 括终点结0 组 成, 它 满 足 下 列 条 件:⑴x 是 一 个 单 点 信 息 结即h(x)={x};⑵对于所有的 x′∈T(x),如果x″∈h(x′),则x″∈T(x)。
(3)
N
1/3
2/3
1
Y1
z1
1
x1
w1
(2,6) (5,6)
2
2
a2 (9,0)
b2 (0,3)
a2 (9,5)
b2 (0,3)
3.3 子 博 弈 与 子 博 弈 完 美
Nash 均衡在原则上适用所有的博弈,但对于预 测 参与人的行为来说,Nash均衡可能并不是 一个 合理的预测, 如房地产博弈:
A
开发
不开 发
A
开发
不开发
B
B
B
B
开发 不开发 开发 不开发 开发 不开发 开发
不开发
有了信息集的概念, 展开式表示也可以用来表 示静态博弈, 如“囚徒的困境 ”博弈可以表 示为:
1
坦白
2
数学建模博弈模型
博弈模型在实际问题中的应用前景
政策制定
01
利用博弈模型分析政策制定中的利益关系和策略选择,为政策
制定提供科学依据。
企业竞争策略
02
利用博弈模型分析企业竞争中的策略选择和预期行为,为企业
制定合理的竞争策略。
国际关系
03
利用博弈模型分析国际关系中的利益关系和冲突解决机制,为
国际关系管理提供理论支持。
THANKS
猎鹿博弈
总结词
描述两个猎人合作与竞争的关系,揭示了合作与背叛的平衡。
详细描述
在猎鹿博弈中,两个猎人一起打猎,猎物可以平分。如果一个猎人选择合作而另一个选择背叛,则背叛者可以独 吞猎物。但如果两个猎人都不合作,则都没有猎物可吃。最佳策略是合作,但个体理性可能导致两个猎人都不合 作,造成双输的结果。
03
智猪博弈
总结词
描述大猪与小猪在食槽竞争中的策略,揭示了合作与竞 争的平衡。
详细描述
在智猪博弈中,一个大猪和一个小猪共同生活在一个猪 圈里。每天都有一桶食物放在食槽中,大猪和小猪需要 竞争才能吃到食物。如果大猪和小猪同时到达食槽,大 猪会因为体型优势占据更多食物。但如果小猪先到食槽 等待,大猪到来时已经没有食物可吃。最佳策略是小猪 等待,大猪先吃,然后小猪再吃剩下的食物。
博弈模型的基本要素
参与者
在博弈中作出决策和行动的个体或组织。
策略
参与者为达到目标而采取的行动或决策。
支付
参与者从博弈中获得的收益或损失。
均衡
在博弈中,当所有参与者都选择最优策略时,达到的一种稳定状态。
博弈模型的建立过程
策略空间
确定每个参与者的所有可能采 取的策略。
均衡分析
通过分析收益函数和策略空间 ,找出博弈的均衡点。
聊聊四种经典的博弈论模型
聊聊四种经典的博弈论模型展开全文1、囚徒困境:为什么两个犯人都选择坐牢官差破获了一宗盗窃案,抓住了两名犯罪嫌疑人。
但在审讯过程中,被关在一处的二人始终矢口否认盗窃罪名,说东西不是我们偷的。
为了避免两人达成默契,结成攻守同盟,官差决定对他们进行单独审讯。
官差表示,如果两人中有一人坦白认罪,则可立即释放,另一个不认罪的人判5年徒刑;如果两人都坦白罪刑,则他们将各判2年徒刑。
但还有一种情况,那就是两个人都拒绝坦白,由于缺乏证据,他们只会以扰乱公共场合为名判处3个月拘役。
这就是两名罪犯面临的困境中,他们会做出怎样的选择呢?首先,他们互相之间都不清楚对方是否会坦白,其次,二人都希望将自己的刑期缩至最短。
如此考虑,最终,两名犯人都会选择坦白交代。
上面的案例就是博弈论所说的“囚徒困境”。
犯人们如果彼此合作,可为集体带来最佳利益(刑期最短);但当二人面对同样的情况且不知道对方如何选择时,在理性思考后,双方都会得出相同的结论(坦白交代),以便达到个人利益的最大化。
囚徒困境是博弈论的“非零和博弈”中具代表性的例子,反映的是个人的最佳选择并非是团体的最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
2、智猪博弈:赢的总是小猪猪圈里有大小两头猪,它们在同一个食槽里进食。
为了保持饲料的新鲜,在远离猪食槽的另一边有一个踏板,大猪或小猪跑过去,每按动一次踏板,投食口就会掉落10个单位的食物。
于是,在大猪和小猪每次进食前,就会形成这样一种局面:如果小猪跑去按踏板,大猪守在食槽边,则大猪小猪吃到的食物比是9:1;反之,如果大猪去按而小猪守在食槽边,则吃食比例是6:4。
如果二猪同时到食槽边,则吃食比是7:3。
这样一来,从纯收益的角度考虑,小猪就更愿意选择在食槽边等待食物落出,因为“等待优于行动”,而大猪只能被迫奔忙在踏板和食槽之间。
上述“智猪博弈”的案例是经济学家的假设论证模型,这个博弈的结果,用经济学视角看待,可以解释为:谁占有更多资源,谁就必须承担更多义务。
《动态博弈模型》课件
子博弈精炼纳什均 衡
在完全信息动态博弈中,子博 弈精炼纳什均衡是指通过剔除 不可置信威胁和承诺的策略, 得到的均衡结果。
不完全信息动态博弈
不完全信息
在不完全信息动态博弈中,至少有一个参与者不拥有关于博弈 的所有信息,包括其他参与者的类型、策略和支付函数。
贝叶斯纳什均衡
在不完全信息动态博弈中,贝叶斯纳什均衡是一个重要的概念, 它是指所有参与者在给定自己类型和概率分布的条件下,采取的
劳动力市场
经典动态博弈模型用于研究劳动力市场的工 资和就业问题,分析雇主和雇员之间的博弈 关系。
在政治学中的应用
选举博弈
经典动态博弈模型用于分析选举中的竞选策略,如候 选人如何制定竞选纲领、如何进行宣传等。
国际关系
该模型用于研究国家间的外交政策和国际合作,分析 各国在利益冲突下的博弈行为。
立法博弈
触发战略
在重复博弈中,触发战略是指一种报复机制,如果某个参与者在某个阶段采取了不合作 的策略,其他参与者会在未来的阶段采取报复措施。
04
动态博弈模型的求解方法
逆向归纳法
逆向归纳法是一种求解动态博弈的方法,通过逆向推理,从博弈的最后阶段开始分析,逐步向前推导 ,最终得出每个参与者的最优策略。
在求解过程中,逆向归纳法假设每个参与者都了解其他参与者的策略选择,并在此基础上选择自己的最 优策略。
02
经典动态博弈模型介绍
囚徒困境
总结词
描述两个囚犯因相互背叛而导致双方都不利的结果。
详细描述
囚徒困境是一个经典的动态博弈模型,描述了两个囚 犯因被警方逮捕而面临指控的情况。如果两个囚犯都 保持沉默,他们都将得到较轻的刑罚;但如果其中一 个囚犯背叛另一个,他将得到更轻的刑罚,而另一个 囚犯将得到更重的刑罚。然而,如果两个囚犯都背叛 彼此,他们都将得到更重的刑罚。因此,尽管合作是 最佳策略,但每个囚犯都有动机背叛对方,导致双方 都不利的结果。
博弈论3-4经典动态博弈模型
3.4 几个经典动态博弈模型453.4.1 寡占的斯塔克博格模型46动态的寡头产量竞争博弈厂商1先选择,厂商2后选择。
21q q Q +=121111112)](8[)(q q q q q c Q P q u -+-=-=221222222)](8[)(q q q q q c Q P q u -+-=-=策略空间:[0,Q max ]中所有实数。
Q max 为不至于使价格降到亏本的最大限度的产量。
Q Q P P -==8)(价格函数:边际生产成本:无固定成本得益函数:221==c c 2121116q q q q u --=2221226q q q q u --=47两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
1 、第二阶段厂商2的选择目标:得益最大化。
求使自己得益最大化下的产量值,即最大化时的一阶条件:得益函数:2221226q q q q u --=用逆推归纳法进行分析:02602122=--⇒=∂∂q q q u 112213)6(21q q q -=-=求出厂商2对厂商1产量的反应函数:48两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
2 、第一阶段厂商1的选择。
用逆推归纳法进行分析:12213q q -=厂商1可直接求出使自己得益最大化时的产量:厂商1知道2的决策思路:直接将上式代入厂商1的得益函数,得到:2112111121*211*211213)213(66),(q q q q q q q q q q q q u -=---=--=3030*1*111=⇒=-⇒=∂∂q q q u厂商1的最佳产量是生产3单位。
将之代入厂商2的反应函数,得到厂商2的最佳产量5.15.13*2=-=q 此时市场价格为3.5,双方的得益别为4.5和2.25单位。
3*1=q 12213q q -=用逆推归纳法分析得出,该动态博弈的唯一的子博弈完美纳什均衡:厂商1在第一阶段生产3单位产量,厂商2第二阶段生产1.5单位产量。
动态博弈的例子
动态博弈的例子
动态博弈的例子
动态博弈是一种模型,它可以模拟博弈双方的双边行为,以了解两个不同的博弈设置如何产生更有利的结果。
下面给出一些例子。
1)赌博博弈:一对赌徒两人分别在两个桌子前把下注。
他们都有一定的钱数,并且每次赌注都会有变化。
他们可以根据形势来决定赌注数额,以此来获取最大的奖励,类似的还有一个公平的概率,但是未必能立即获胜。
2)资源配置博弈:两家企业各自拥有一定的资源。
他们要根据彼此的期望,把资源配置至最有利的位置上,以此来获取最大的收益。
此类博弈在经济和金融领域中应用很广泛,例如国际市场或者可持续发展。
3)时间博弈:两个人分别有不同的时间限制,必须完成某项任务,在有限的时间内实现最大的收益。
他们必须根据自身的实际情况来决定每个环节的时间限制,以此以最快的时间来完成任务。
4)决策博弈:两家企业各自有不同的增长策略。
他们必须根据彼此的期望和情况,把资源配置到最有利的位置上,以此以最快的速度来达到最优的增长结果。
此类博弈在公司管理领域广泛应用,用来模拟协商、谈判、合作或者竞争等等的情况。
- 1 -。
博弈论第四章 完全且完美信息动态博弈
0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
精的扩展式表述包括四个要素:
✓ 参与人集合(Player) ✓ 每个参与人的战略集合(Strategy) ✓ 博弈的顺序(Order) ✓ 由战略组合决定的每个参与人的支付(Payoff)
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
精选PPT
12
动态博弈的 战略
精选PPT
13
动态博弈的战略的表述
✓ 战略:参与人在给定信息集的情况下选择行动的规则,它规定参 与人在什么情况下选择什么行动,是参与人的“相机行动方案”。
si表示第i个参与人的特定战略
Si si代表第i个参与人所有可选战 择略 的集合
如果n个参与人每人选择战 一略 个, n维向量s (s1,s2, ,si, ,sn)称为一个战略组合 si表示第i个人选择的战略
精选PPT
6
扩展式表示的一个例子
精选PPT
7
博弈树始于 局中人1 的一个决策结点,这时1
要从L和R中作出选择,如果局中人1选择L,其后就
到达 局中人2 的一个决策结点,这时,局中人2要
从L′和R′中作出选择。类似地,如果局中人1选择R, 则将到达局中人2的另一个决策结点。
这时局中人2从L′和R′中选择行动。无论局中人2 选择了哪一个,都将到达终结点 (即博弈结束)且两 局中人分别得到相应终点节下面的收益。
博弈论的几个经典模型
.
模型二、囚徒困境/非合作博弈
囚徒困境可以用来说明许多现象。 ➢寡头定价 ➢拍卖出价 ➢推销员的努力 ➢政治上的讨价还价 ➢军备竞赛等(冲突中出现两败俱伤的情况, 往往要考虑到囚徒困境)
*(纯策略)纳什均衡
博弈论的几个经典模型
.
问题与思考
• 什么是博弈论?试举两个你生活中的例子说明。 • 某年在荷兰召开了一次“合作及社会两难困境研讨
博弈论的几个经典模型
.
引言
博弈论的应用领域十分广泛,在经济学、 政治科学(国内的以及国际的)、军事战略问 题、进化生物学以及当代的计算机科学等领域 都已成为重要的研究和分析工具。此外,它还与 会计学、统计学、数学基础、社会心理学以及 诸如认识论与伦理学等哲学分支有重要联系。
博弈论的几个经典模型
.
引言
投食仅原来的一半分量,但同时将投食口移到 踏板附近。结果呢,小猪和大猪都在拼命地 抢着踩踏板。等待者不得食,而多劳者多得。 每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。 成本不高,但收获最大。
博弈论的几个经典模型
.
模型二、囚徒困境/非合作博弈
在博弈论中,含有占优战略均衡的一个 著名例子是由塔克给出的“囚徒困境” ( prisoners’dilemma ) 博 弈 模 型 。 该 模 型 用 一种特别的方式为我们讲述了一个警察与小 偷的故事。
博弈论的几个经典模型
.
博弈的类型
博弈又可分静态博弈和动态博弈。 • 静态博弈:指参与者同时采取行动,或者尽
管参与者行动的采取有先后顺序,但后行动 的人不知道先采取行动的人采取的是什么行 动。 • 动态博弈:指参与者的行动有先后顺序,并 且后采取行动的人可以知道先采取行动的人 所采取的行动。
博弈论的几个经典模型
模型二、囚徒困境/非合作博 弈
囚徒困境可以用来说明许多现象。
寡头定价 拍卖出价 推销员的努力 政治上的讨价还价 军备竞赛等(冲突中出现两败俱伤的情况,
往往要考虑到囚徒困境)
*(纯策略)纳什均衡
问题与思考
• 什么是博弈论?试举两个你生活中的例子说明。
• 某年在荷兰召开了一次“合作及社会两难困境研讨 会”,与会者都是博弈论的专家。
基本术语
• 博弈涉及哪些内容呢?
博弈涉及至少两个独立的博弈参与者 (player)。
博弈涉及行动者存在着策略(strategy)选 择的可能,博弈论用策略空间来表示参与 者可以选择的策略。
参与者在不同策略组合下会得到一定的支 付(payoff)。
对于博弈参与者来说,存在着一博弈结果。
对于游戏设计者,这是一个最好的
模型二、囚徒困境/非合作博 弈
在博弈论中,含有占优战略均衡的 一个著名例子是由塔克给出的“囚徒困 境” (prisoners’dilemma)博弈模 型。该模型用一种特别的方式为我们讲 述了一个警察与小偷的故事。
模型二、囚徒困境/非合作博 假设:有两个小偷A弈和B联合犯事、私入
第四章 博弈论的几个经典模 型
讲授人 谭建国
引言
博 弈 论 又 被 称 为 对 策 论 ( Game Theory),按照2005年因对博弈论的贡献 而获得诺贝尔经济学奖的Robert Aumann 教授的说法,博弈论就是研究互动决策 的理论。所谓互动决策,即各行动方 (即局中人[player])的决策是相互影响 的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也 需要把别人对于自己的考虑也要纳入考 虑之中……在如此迭代考虑情形进行决
经典动态博弈模型
3.4.3委托人—代理人理论
此时,代理人的利益也受到了不确定性的影 响。委托代理模型的主要问题就是如何激励 代理人努力工作。
此时,促使代理人选择努力工作的激励相容 约束、参与约束、委托条件?
3.4.3委托人—代理人理论
四、选择报酬和连续努力水平的委托代理模型 (不是选择是否委托,而是选择报酬的水平, 并且努力程度是可以连续变化的)
博弈过程相同,但是成果由自然来选择。
3.4.3委托人—代理人理论
有20和10单位两种产出,代理人努力时产出 为20单位的概率为0.9,产出为10的概率为0.1; 代理人偷懒时,产出为20的概率为0.1,产出 为10的概率为0.9。R(0)=0.
此时引入自然(N)反映不确定性。 此时的激励相容约束、参与约束、委托条件?
3.4.3委托人—代理人理论
根据松散程度、委托内容、监督难易等不同, 委托人—代理人关系有多个不同的情况,其 中最为关键的差异是监督的难易。有些可以 直接从工作成果来监督,比如流水线上的工 人的工作,而有些难以监督,比如:律师、 教练等
委托人如何促使代理人的行为符合委托人的 利益,是委托—代理理论的重要课题。
努力成果不确定,而且不可监督。考虑代理 人有正的机会成本(U1),假设努力的负效应是 努力水平的单调递增凸函数C=C(e)
产出R是努力水平e的随机函数,R=R(e)。 w=w(R)这意味着薪酬至少一部分是利润提成
3.4.3委托人—代理人理论
w与e有关,w=w(R)=w[R(e)]。 委托人与代理人的得益分别为:
3.4.3 讨价还价(Bargaining)博弈
该模型有许多原型:利润分割、债务纠纷, 或财产继承权的争执。第一、第二回合相当 于纠纷的各方以不同形式调解的过程,而第 三回合则相当于最后提交各司法或仲裁机构 进行裁决。而消耗系数则相当于经济纠纷中, 相关各方花费在谈判和诉讼等方面的时间和 金钱代价。
14-动态博弈经典模型1详解
厂商A 先决定产量 q1,
厂商B根据厂商A的行为再决定产量 q2, 厂商A在决策时会考虑厂商B的反应。
求解方法: Backward induction
第二阶段厂商B的最优选择:
max 2 (q1, q2 ) q2 (120 q1 q2 )
2 (q1 , q2 ) 120 q1 2q2 0 q2 q ,q ) * 1 12 120 q 2q 0 FOC:q2 ( (120 q1 )1 2 2 q2 2 q1为厂商A在第一阶 * 1 q2 (120 q1 ) 2 段的实际产量选择
例题2
斯塔伯格均衡求解
假设
市场的需求函数为: Q=a-P
反需求函数为: 边际成本 : P=a-Q=a-q1-q2 AC1= AC2=MC1=MC2=c
厂商A先决定产量 q1 厂商B根据厂商A的行为再决定 q2
ห้องสมุดไป่ตู้
厂商的利润函数为:
1 (q1 , q2 ) q1[ P(Q) MC ] q1 (a q1 q2 c) 1 (q1 , q2 ) q1[ P(Q) MC ] q1 (a q1 q2 c) 2 (q1 , q2 ) q2 [ P(Q) MC ] q2 (a q1 q2 c) 2 (q1 , q2 ) q2 [ P(Q) MC ] q2 (a q1 q2 c)
max 1 (q1 , q2* ) q1 (a q1 q2* c)
1 其中: q2 2 (a q1 c)
*
即:
max 1 (q1 , q ) q1[a q1 1 (a q1 c) c] 2
博弈论的经典模型
博弈论的经典模型在自然界和人类社会中广泛存在合作与竞争,而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory),也称对策论。
它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论,研究个体之间行为的相互影响和相互作用规律,它可以描述现实生活中参与者面对有限资源的合作与竞争行为。
令人惊奇的是,有三次诺贝尔奖获得者是博弈论研究方面的杰出科学家,他们是1985年获得诺贝尔经济学奖的公共选择学派的领导者布坎南,1994年获奖的美国普林斯顿大学的纳什、塞尔屯、哈桑尼3位博弈论专家以及1995年获奖的理性主义学派的领袖卢卡斯。
博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。
进入20世纪末,随着复杂网络科学的一些新的发现,博弈论也成为网络时代人们的一种思维、竞争与合作的模式。
博弈论对人有一个最基本假定:人是理性的,人在具体策略选择的目的全是使自己的利益最大化。
博弈论就是研究理性的人之间如何进行策略选择的,因此博弈论也称为对策论。
博弈论就凭这么一条最简单的假定可以展开广泛的研究,并获得了丰富多彩的结果,利用博弈论可以解读人类的社会行动或集体行动,更易理解人类社会的复杂性和特殊性。
为了刻画个体间利益的冲突对整个系统的影响,人们已经提出和发展了许多博弈模型,比较著名的有三个模型:囚徒困境、"雪堆"博弈和"少数者"博弈模型,下面笔者通过对这三个模型进行简单而通俗的介绍,让大家来了解博弈论及其应用概况。
斗鸡模型斗鸡博弈(Chicken Game).在西方,鸡是胆小的象征,斗鸡博弈指在竞争关系中,谁的胆小,谁先失败。
现在假设,有两个人要过一条独木桥,这条桥一次只能过一个人,两个人同时相向而进,在河中间碰上了。
这个博弈的结果第一种就是如果两个人继续前进,双方都会掉水里,双方丢面子,这是一种组合。
动态博弈分析经典实例
43
2013-7-14
44
工作竞赛
2013-7-14
45
2013-7-14
46
2013-7-14
47
2013-7-14
48
2013-7-14
49
2013-7-14
50
2013-7-14
51
2013-7-14
52
2013-7-14
53
2013-7-14
11
图 2 . 1 . 3 描述了工会的无差异曲线,若令 L 不变, 当 w 提高时工会的福利就会增加,于是较高的无 差异曲线代表了工会较高的效用水平。
2013-7-14
12
2013-7-14
13
表现在图 2 .1.3 的无差异曲线上就是,工 会希望选择一个工资水平w ,由此得到的 结果(w , L *(w))处于可能达到的最高的无差 异线上。 这一最优化问题的解为 w*,这样一个工资 要求将使得工会通过(w*,L*(w*)) 的无差异 曲线与 L*(w)相切于该点,如图 2 . 1 . 4 所 示。 从而, (w*,L*(w*))就是这一工资与就业博 弈的逆向归纳解。
2013-7-14
8
2013-7-14
9
图 2 . 1 . 2 把 L *(w)表示为 w 的函数(但坐标 轴经过旋转,以便于和以后的数据相比较),并表 示出它和企业每条等利润线交于其最高点。
2013-7-14
10
若令L 保持不变, w 降低时企业的利润就会提高, 于是较低的等利润曲线代表了较高的利润水平。
2
2013-7-14
2013-7-14
3
2013-7-14
4
斯塔克伯格模型
成为先行者意味着2点: 1.企业可以赚取比古诺状态下更多的利润,否则没 有动机成为先行者; 2.追随企业没有办法威胁先行企业; 如果另一企业成为先行者,该企业可以成功威胁另 一企业。
7
课堂总结
斯塔克博格模型——动态的寡头市场产量博弈模型
这是一个完全且完美信息的动态博弈。
假设:寡头市场上有两个厂商,决策内容为产量,厂商 A主导,厂商B追随。由A首先确定产量,B观察到A的 选择后再确定自己的产量。
斯塔克博格模型--动态的寡头市场产量博弈模型
背景介绍:
斯塔克博格模型由德国经济学家斯塔克博格(H.Von Stackelberg) 在上世纪30年代提出。
什么是斯塔克博格竞争模型?
事实上,在有些市场,竞争厂商之间的地位并不是对称的,市场地 位的不对称引起了决策次序的不对称,通常,小企业先观察到大企 业的行为,再决定自己的对策。德国经济学家斯塔克尔博格建立的 模型就反映了这种不对称的竞争。 在斯塔克尔博格的寡头理论中,提出了将寡头厂商的角色定位为 “领导者”与“追随者”的分析范式。一般来说,古诺模型中互为 追随者的两个厂商势均力敌。而斯塔克尔伯格的寡头厂商模型中, 一个是实力雄厚的领导者,一个是实力相对较弱的追随者。
该模型的假定是:
主导企业知道跟随企业一定会对它的产量作出反应,因 而当它在确定产量时,把跟随企业的反应也考虑进去了。 因此这个模型也被称为“主导企业模型”。 假设条件:
假设厂商1先决定它的产量,然后厂商2知道厂商1的产量后 再作出它的产量决策。 因此,在确定自己产量时,厂商1必须考虑厂商2将如何作出 反应。 其他假设与古诺模型相同。
书本例题 市场有1,2两家厂商生产同质产品, 厂商1的产量为q1,
厂商2的产量为q2,
经典动态博弈模型
由于囚徒无法信任对方,最终都选择坦白,导致集体利益受损。
斗鸡博弈
描述
两只斗鸡在狭路相逢,每只斗鸡都有前 进和后退两种选择。如果一只斗鸡前进 ,另一只后退,则前进的斗鸡获胜;如 果两只都前进,则两败俱伤;如果两只 都后退,则均无损失。
VS
博弈策略
由于存在两败俱伤的风险,双方更倾向于 选择后退以避免损失。
予相应的奖励。
结论
智猪博弈表明,合理的激励 机制和任务分配可以激发员 工的积极性和创造力。
案例四:猎鹿博弈在国际政治中的影响
猎鹿博弈概述
猎鹿博弈描述了两个猎人合作与不合作对收益的影响,强 调了合作的重要性。
国际政治中的影响
在国际关系中,国家间的合作与竞争往往受到猎鹿博弈的影响。 合作可以带来共同利益,但也需要克服信任和利益冲突的问题。
02
03
公共品供给
在公共品供给中,政府可运用动态博 弈模型分析不同主体之间的互动关系, 提高公共品供给效率。
国际关系
贸易摩擦
在国际贸易中,国家之间可以通过动态博弈模型分析贸易摩擦的起 因和解决方案,促进国际贸易的稳定发展。
地缘政治
在国际政治中,国家可以利用动态博弈模型分析地缘政治格局的变 化趋势,制定合适的国际战略。
结论
斗鸡博弈表明,在竞争激烈的 市场环境中,适当的妥协和沟
通对于避免损失至关重要。
案例三:智猪博弈在企业管理中的运用
智猪博弈概述
智猪博弈描述了大猪和小猪 在同一个猪圈里抢食物的情 况,强调了策略选择的重要
性。
企业管理中的运用
在企业中,智猪博弈可以应 用于激励机制设计、项目管 理等方面。例如,让有能力 的人承担更多责任,同时给
经典动态博弈模型
博弈模型
人质困境此为博弈模型之一,人质困境:多个人的囚徒困境要理解这个定义,我们可以从这样一个童话故事开始:老鼠们意识到,假如可以在猫脖子上系一个铃铛,那么,他们的安全就会有保障。
问题在于,谁会愿意冒赔上小命的风险给猫系上铃铛呢?老鼠所面临的这个问题同样摆在人类面前:人们在直接面对威胁或损失时,也面临同样的心理困境。
在一群人面对威胁或损失时,“第一个采取行动”的决定是很难做出的,因为它意味着将付出惨重代价。
这个困境便就叫做人质困境。
酒吧博弈2008年04月11日星期五 23:16美国著名的经济学专家阿瑟教授于1994年提出了少数人博弈这个理论。
其理论模型是这样的:有100个人很喜欢泡酒吧。
这些人在每个周末,都要决定是去酒吧活动还是待在家里休息。
酒吧的容量是有限的,也就是说座位是有限的。
如果去的人多了,去酒吧的人会感到不舒服。
此时,他们留在家中比去酒吧更舒服。
假定酒吧的容量是60人,如果某人预测去酒吧的人数超过60人,他的决定是不去,反之则去。
这100人如何作出去还是不去的决定呢?这个博弈的前提条件做了如下限制:每一个参与者面临的信息只是以前去酒吧的人数,因此,他们只能根据以前的历史数据,归纳出此次行动的策略,没有其他的信息可以参考,他们之间更没有信息交流。
这就是著名的"酒吧问题",即少数人博弈。
"酒吧问题"所模拟的情况,非常接近于一个赌博者下注时面临的情景,比如股票选择、足球博彩。
这个博弈的每个参与者,都面临着这样一个困惑:如果许多人预测去的人数超过60,而决定不去,那么酒吧的人数会很少,这时候作出的这些预测就错了。
反过来,如果有很大一部分人预测去的人数少于60,他们因而去了酒吧,则去的人会很多,超过了60,此时他们的预测也错了。
因而一个作出正确预测的人应该是,他能知道其他人如何作出预测。
但是在这个问题中每个人预测时面临的信息来源都是一样的,即过去的历史,同时每个人无法知道别人如何作出预测,因此所谓正确的预测几乎不可能存在。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.4.3委托人—代理人理论
有20和10单位两种产出,代理人努力时产出 为20单位的概率为0.9,产出为10的概率为0.1; 代理人偷懒时,产出为20的概率为0.1,产出 为10的概率为0.9。R(0)=0.
此时引入自然(N)反映不确定性。 此时的激励相容约束、参与约束、委托条件?
3.4.3委托人—代理人理论
一、无不确定性的委托代理模型(委托人不需要 监督,工作成果完全反映代理人的努力程度)
代理人的产出是努力程度的确定性函数,委 托人可以根据成果掌握代理人的工作情况
博弈过程如下:第一阶段委托人选择委托或 不委托,如果委托,第二阶段代理人选择是 否接受,如果接受则进入第三阶段,选择是 否努力工作。
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格模型 3.4.2 劳资博弈 3.4.3 讨价还价(Bargaining)博弈 3.4.4 委托人—代理人理论
3.4.2 劳资博弈
里昂惕夫(Leontief)1946年提出了一个分别 代表劳资双方的工会和厂商之间的博弈
模型假设工人工资完全由工会决定,而厂 商则根据工会要求的工资高低决定雇佣工 人的数量
五、委托代理模型的一个数值例子 店主与店员 R为商店利润,e为店员努力,利润取决于店
员努力与随机因素,R=R(e)=4e+η,店员的负 效用函数为C=C(e)=e*e,机会成本为U1=1
3.4.3委托人—代理人理论
R为商店利润,e为店员努力,利润取决于店 员努力与随机因素,R=R(e)=4e+η,店员的负 效用函数为C=C(e)=e*e,机会成本为U1=1
3.4.3委托人—代理人理论
此时,代理人的利益也受到了不确定性的影 响。委托代理模型的主要问题就是如何激励 代理人努力工作。
此时,促使代理人选择努力工作的激励相容 约束、参与约束、委托条件?
3.4.3委托人—代理人理论
四、选择报酬和连续努力水平的委托代理模型 (不是选择是否委托,而是选择报酬的水平, 并且努力程度是可以连续变化的)
店主采用的报酬计算公式: w=A+B[R(e)],其中A、B为参数
这是一种典型的基本工资加提成的形式。 通过分析店主的最优激励工资计算公式为:
w=-3+R
3.4.3委托人—代理人理论
根据松散程度、委托内容、监督难易等不同, 委托人—代理人关系有多个不同的情况,其 中最为关键的差异是监督的难易。有些可以 直接从工作成果来监督,比如流水线上的工 人的工作,而有些难以监督,比如:律师、 教练等
委托人如何促使代理人的行为符合委托人的 利益,是委托—代理理论的重要课题。
3.4.3 讨价还价(Bargaining)博弈
假设每一次一方提出一个方案和另一方选择 是否接受为一个回合,讨价还价每多进行一 个回合,由于谈判费用和利息损失等,双方 的利益都要打一个折扣δ(0<δ<1),δ称为 “消耗系数”。
如果假设讨价还价最多只进行三个回合,到 第三回合乙必须接受甲的方案。
假设工会和厂商的博弈过程为:先由工会决 定工资率,然后厂商根据工资率决定雇佣的 员工数量
3.4.3 讨价还价(Bargaining)博弈
讨价还价(Bargaining)是典型的动态博弈 讨论三回合的讨价还价 假设有两个人就如何分享1万元现金进行谈
判,并且已经定下如下规则:首先由甲提出 一个分割方案比例,对甲提出的比例乙可以 接受也可以拒绝;如果乙拒绝甲的方案,则 他自己应提出另一个方案,让甲选择接受与 否…,如果有一方接受,则博弈结束
3.4.3 讨价还价(Bargaining)博弈
逆向归纳法求解。最终甲、乙双方得益分别 为:10000-10000 δ+ δ*δ*S 10000 δ- δ*δ*S
假设S=10000,则双方得益取决于δ- δ*δ 乙仗义讨价还价的筹码是可以与甲拖时间,
虽然甲可以争得全部利益,但拖延时间给甲 会给甲造成损失。除非δ=1或δ=0
努力水平为2单位,偷懒时努力水平为1单 位。努力的负效应为努力水平,即E=2,S=1. 另外,w(E)=4,w(S)=2.分析数值例子。
3.4.3委托人—代理人理论
二、有不确定性但可以监督的委托代理模型(代 理人的工作成果不确定,且委托人可以完全 监督代理人)
代理人努力与工作成果之间不再一致,存在 根据代理人的工作情况还是成果来支付报酬, 一般地,根据代理人的工作情况而不是成果 来支付。
努力成果不确定,而且不可监督。考虑代理 人有正的机会成本(U1),假设努力的负效应是 努力水平的单调递增凸函数C=C(e)
产出R是努力水平e的随机函数,R=R(e)。 w=w(R)这意味着薪酬至少一部分是利润提成
3.4.3委托人—代理人理论
w与e有关,w=w(R)=w[R(e)]。 委托人与代理人的得益分别为:
R-w=R(e)-w[R(e)] w-C=w[R(e)]-C(e) 参与约束:w[R(e)]-C(e)>=U1 实际上: w[R(e)]=C(e)+U1 委托人得益函数: R(e)-w[R(e)]= R(e)- C(e)-U1
3.4.3委托人—代理人理论
选择努力水平e,使得委托人得益函数最大: max{R(e)-w[R(e)]= R(e)- C(e)-U1} e>0
3.4.3 讨价还价(Bargaining)博弈
第三回合,甲的方案是自己得S,乙得10000S,而乙必须选择接受,双方得益分别为 δ*δ*S2 , δ* δ*(10000 - S2 ) 。
该博弈的两个特点:第一,第三回合甲的方 案具有强制力;第二,每多进行一个回合总 得益就会下降一个比例,因此谈判越长对双 方都可能不利,如果必须让对方得的数额不 如早点让其得到。
3.4.3委托人—代理人理论努力接受委托 1 2拒绝
不委托
[R(0),0]
2
偷懒
[R(0),0]
[R(E)-w (E) , w (E)-E ]
[R(S)-w (S) , w (S)-S ]
无不确定性的委托代理模型
3.4.3委托人—代理人理论
激励相容约束 参与约束 数值例子:假设R(e)=10e-e*e,代理人努力时
在e=e*时,委托人的得益最大。 在满足参与约束时,代理人愿意接受委托,
但努力水平不一定为e*。要激励代理人自觉 选择e*,必须符合代理人自身利益最大化, 即满足:w[R(e*)]-C(e*)>=w[R(e)]-C(e)
3.4.3委托人—代理人理论
这便是激励相容约束,此时代理人与委托人 利益完全一致,代理人的行为就会符合委托 人的最大利益。
3.4.3委托人—代理人理论
三、有不确定性且不可监督的委托代理模型(代 理人的工作成果不确定,且委托人不能监督 代理人)
此时,委托人不可能根据代理人的工作情况 支付报酬,只能根据成果支付报酬。因为委 托人无法判断工作成果是代理人努力或偷懒 的结果还是随机因素影响的结果。
博弈过程相同,但是报酬变为成果的函数。
3.4.3 讨价还价(Bargaining)博弈
第一回合,甲的方案是自己得S1,乙得10000S1,而乙如果选择接受,则博弈结束,如果 不接受,则博弈进入下一个阶段。
第二回合,乙的方案是自己得S2,乙得10000S2,而甲如果选择接受,则博弈结束,而且 双方得益分别为δ*S2 ,δ*(10000 - S2 ) 。如果 不接受,则博弈进入下一个阶段。
工会所代表的劳动力方效用是工资率和雇 佣人数的函数,即 u = u( W, L)
3.4.2 劳资博弈
厂商关心的根本目标是利润,用利润可以直 接代表厂商的效用。
假设收益是劳动力雇佣数量的函数R( L ), 并假设厂商仅有劳动力成本,所以利润函数 为π=π(W , L)= R( L ) – W×L
3.4.3委托人—代理人理论
委托人(Principle)—代理人(Agents)之间博弈 关系的核心内容是两人动态博弈
委托人—代理人关系的特征:双方关系密切, 但委托方不能直接控制被委托方的行为,甚 至对被委托方工作的监督也有困难,只能通 过报酬等间接影响被委托方的行为
不一定双方之间一定存在合同
3.4.3 讨价还价(Bargaining)博弈
该模型有许多原型:利润分割、债务纠纷, 或财产继承权的争执。第一、第二回合相当 于纠纷的各方以不同形式调解的过程,而第 三回合则相当于最后提交各司法或仲裁机构 进行裁决。而消耗系数则相当于经济纠纷中, 相关各方花费在谈判和诉讼等方面的时间和 金钱代价。