动态博弈经典模型
博弈论 第 三 章 完全信息动态博弈讲解
![博弈论 第 三 章 完全信息动态博弈讲解](https://img.taocdn.com/s3/m/04dcaf903186bceb19e8bb5a.png)
房地产开发博弈
开发
A hA(1) 不开发
h表示信息集
N hN(1)
需求大
需求小
N hN(2)
需求大
需求小
B hB(1)
开发
不开发
B hB(2)
B hB(3)
开发
不开发 开发 不开发 开发
B hB(4)
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8) (0,0) (0,1) 单 位:百万元
定 义 一 个 展 开 式 博 弈 的 子 博 弈G 由 一 个 决 策 结x 和 所 有 该 决 策 结 的 后继结T(x)( 包 括终点结0 组 成, 它 满 足 下 列 条 件:⑴x 是 一 个 单 点 信 息 结即h(x)={x};⑵对于所有的 x′∈T(x),如果x″∈h(x′),则x″∈T(x)。
(3)
N
1/3
2/3
1
Y1
z1
1
x1
w1
(2,6) (5,6)
2
2
a2 (9,0)
b2 (0,3)
a2 (9,5)
b2 (0,3)
3.3 子 博 弈 与 子 博 弈 完 美
Nash 均衡在原则上适用所有的博弈,但对于预 测 参与人的行为来说,Nash均衡可能并不是 一个 合理的预测, 如房地产博弈:
A
开发
不开 发
A
开发
不开发
B
B
B
B
开发 不开发 开发 不开发 开发 不开发 开发
不开发
有了信息集的概念, 展开式表示也可以用来表 示静态博弈, 如“囚徒的困境 ”博弈可以表 示为:
1
坦白
2
数学建模博弈模型
![数学建模博弈模型](https://img.taocdn.com/s3/m/d6ef44ab4bfe04a1b0717fd5360cba1aa8118cba.png)
博弈模型在实际问题中的应用前景
政策制定
01
利用博弈模型分析政策制定中的利益关系和策略选择,为政策
制定提供科学依据。
企业竞争策略
02
利用博弈模型分析企业竞争中的策略选择和预期行为,为企业
制定合理的竞争策略。
国际关系
03
利用博弈模型分析国际关系中的利益关系和冲突解决机制,为
国际关系管理提供理论支持。
THANKS
猎鹿博弈
总结词
描述两个猎人合作与竞争的关系,揭示了合作与背叛的平衡。
详细描述
在猎鹿博弈中,两个猎人一起打猎,猎物可以平分。如果一个猎人选择合作而另一个选择背叛,则背叛者可以独 吞猎物。但如果两个猎人都不合作,则都没有猎物可吃。最佳策略是合作,但个体理性可能导致两个猎人都不合 作,造成双输的结果。
03
智猪博弈
总结词
描述大猪与小猪在食槽竞争中的策略,揭示了合作与竞 争的平衡。
详细描述
在智猪博弈中,一个大猪和一个小猪共同生活在一个猪 圈里。每天都有一桶食物放在食槽中,大猪和小猪需要 竞争才能吃到食物。如果大猪和小猪同时到达食槽,大 猪会因为体型优势占据更多食物。但如果小猪先到食槽 等待,大猪到来时已经没有食物可吃。最佳策略是小猪 等待,大猪先吃,然后小猪再吃剩下的食物。
博弈模型的基本要素
参与者
在博弈中作出决策和行动的个体或组织。
策略
参与者为达到目标而采取的行动或决策。
支付
参与者从博弈中获得的收益或损失。
均衡
在博弈中,当所有参与者都选择最优策略时,达到的一种稳定状态。
博弈模型的建立过程
策略空间
确定每个参与者的所有可能采 取的策略。
均衡分析
通过分析收益函数和策略空间 ,找出博弈的均衡点。
15-斯塔克伯格模型
![15-斯塔克伯格模型](https://img.taocdn.com/s3/m/34716ec476a20029bc642d03.png)
博弈论教学/双寡头垄断的斯塔克伯格模型出自MyKnowledgeBase< 博弈论教学Bread crumbs:教学工作 > 博弈论教学 > 博弈论教学/双寡头垄断的斯塔克伯格模型目录■1 一般模型■1.1 背景■1.2 博弈模型■1.3 后退归纳法分析■2 不变单位成本和线性逆需求函数的双寡头垄断斯塔克伯格模型■2.1 参数分析■2.2 后退归纳法求解最优反应函数■3 子博弈完美均衡的性质■4 模型推广■5 延伸阅读1 一般模型1.1 背景Stackelberg(1934)提出了一个双寡头垄断的动态博弈模型,其中领导者先行动,然后追随者行动。
1.个厂商生产同样的商品;厂商i的生产成本为;当总产量为时,产品出售价格为2.每个厂商的策略为产量;3.两个厂商相继行动:一个厂商选择它的产量,然后另一厂商在知道了第一个厂商已选择的产量后选择自己的产量。
1.2 博弈模型1.局中人:两个厂商2.终端历史:厂商所有产量序列的集合(非负数)3.局中人函数:,并且对所有的,有4.偏好:厂商关于终端历史的盈利是它的利润1.3 后退归纳法分析1.厂商1(博弈起点)的策略是一个产量;厂商2的策略是将厂商2的产量与厂商1的每个可能产量相关联的一个函数。
的任何产量,求厂商的产量为,厂商利润最大化的产量为的子博弈:在给定厂商2的策略下,求厂商1极大化自己利润的产量。
当厂商择产量,厂商2选择产量,则总产量为,价格为,厂的利润为。
利润达到最大值时的厂商1的产量记为给定了厂商1的均衡选择,厂商2的选择的产量为,那么子博弈完美均衡点为成本函数:线性逆需求函数:;, (,)的每一个产量,厂商有唯一的最优反应,为:,如果;,如果厂商2的策略(产量)是,厂商1的利润是:,厂商最大化时的产量,求导数得的最优产量为的利润为,厂商2的利润为注意区别古诺模型的同时行动:产量都为,利润都为二次成本函数的斯塔克伯格双寡头垄断博弈:,成立,以及对于所有的有,且对于有,求斯塔克伯格双寡头垄断博弈的子博弈完美均衡。
《动态博弈模型》课件
![《动态博弈模型》课件](https://img.taocdn.com/s3/m/10d082a44bfe04a1b0717fd5360cba1aa8118cb4.png)
子博弈精炼纳什均 衡
在完全信息动态博弈中,子博 弈精炼纳什均衡是指通过剔除 不可置信威胁和承诺的策略, 得到的均衡结果。
不完全信息动态博弈
不完全信息
在不完全信息动态博弈中,至少有一个参与者不拥有关于博弈 的所有信息,包括其他参与者的类型、策略和支付函数。
贝叶斯纳什均衡
在不完全信息动态博弈中,贝叶斯纳什均衡是一个重要的概念, 它是指所有参与者在给定自己类型和概率分布的条件下,采取的
劳动力市场
经典动态博弈模型用于研究劳动力市场的工 资和就业问题,分析雇主和雇员之间的博弈 关系。
在政治学中的应用
选举博弈
经典动态博弈模型用于分析选举中的竞选策略,如候 选人如何制定竞选纲领、如何进行宣传等。
国际关系
该模型用于研究国家间的外交政策和国际合作,分析 各国在利益冲突下的博弈行为。
立法博弈
触发战略
在重复博弈中,触发战略是指一种报复机制,如果某个参与者在某个阶段采取了不合作 的策略,其他参与者会在未来的阶段采取报复措施。
04
动态博弈模型的求解方法
逆向归纳法
逆向归纳法是一种求解动态博弈的方法,通过逆向推理,从博弈的最后阶段开始分析,逐步向前推导 ,最终得出每个参与者的最优策略。
在求解过程中,逆向归纳法假设每个参与者都了解其他参与者的策略选择,并在此基础上选择自己的最 优策略。
02
经典动态博弈模型介绍
囚徒困境
总结词
描述两个囚犯因相互背叛而导致双方都不利的结果。
详细描述
囚徒困境是一个经典的动态博弈模型,描述了两个囚 犯因被警方逮捕而面临指控的情况。如果两个囚犯都 保持沉默,他们都将得到较轻的刑罚;但如果其中一 个囚犯背叛另一个,他将得到更轻的刑罚,而另一个 囚犯将得到更重的刑罚。然而,如果两个囚犯都背叛 彼此,他们都将得到更重的刑罚。因此,尽管合作是 最佳策略,但每个囚犯都有动机背叛对方,导致双方 都不利的结果。
博弈论3-4经典动态博弈模型
![博弈论3-4经典动态博弈模型](https://img.taocdn.com/s3/m/2540c154326c1eb91a37f111f18583d049640f18.png)
3.4 几个经典动态博弈模型453.4.1 寡占的斯塔克博格模型46动态的寡头产量竞争博弈厂商1先选择,厂商2后选择。
21q q Q +=121111112)](8[)(q q q q q c Q P q u -+-=-=221222222)](8[)(q q q q q c Q P q u -+-=-=策略空间:[0,Q max ]中所有实数。
Q max 为不至于使价格降到亏本的最大限度的产量。
Q Q P P -==8)(价格函数:边际生产成本:无固定成本得益函数:221==c c 2121116q q q q u --=2221226q q q q u --=47两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
1 、第二阶段厂商2的选择目标:得益最大化。
求使自己得益最大化下的产量值,即最大化时的一阶条件:得益函数:2221226q q q q u --=用逆推归纳法进行分析:02602122=--⇒=∂∂q q q u 112213)6(21q q q -=-=求出厂商2对厂商1产量的反应函数:48两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
2 、第一阶段厂商1的选择。
用逆推归纳法进行分析:12213q q -=厂商1可直接求出使自己得益最大化时的产量:厂商1知道2的决策思路:直接将上式代入厂商1的得益函数,得到:2112111121*211*211213)213(66),(q q q q q q q q q q q q u -=---=--=3030*1*111=⇒=-⇒=∂∂q q q u厂商1的最佳产量是生产3单位。
将之代入厂商2的反应函数,得到厂商2的最佳产量5.15.13*2=-=q 此时市场价格为3.5,双方的得益别为4.5和2.25单位。
3*1=q 12213q q -=用逆推归纳法分析得出,该动态博弈的唯一的子博弈完美纳什均衡:厂商1在第一阶段生产3单位产量,厂商2第二阶段生产1.5单位产量。
十大经典博弈论模型
![十大经典博弈论模型](https://img.taocdn.com/s3/m/b87f683abb1aa8114431b90d6c85ec3a87c28bb0.png)
十大经典博弈论模型博弈论是一门研究决策者之间互动的学科,其应用范围广泛,涉及到经济、政治、生物学等领域。
在博弈论中,经典博弈论模型是基础和核心,以下是介绍十大经典博弈论模型:1. 囚徒困境博弈模型囚徒困境博弈模型是博弈论中最为著名的模型之一,也是最为典型的非合作博弈模型。
该模型主要讲述的是两个囚犯被抓后面临的选择问题,如果两个人都招供,那么都将受到较重的惩罚;如果两个人都不招供,那么都将受到轻微的惩罚;如果一个人招供而另一个人不招供,那么招供的人将受到宽大处理,而另一个人将受到较重的惩罚。
2. 零和博弈模型零和博弈模型是博弈论中最为简单的模型之一,其特点是参与者之间的利益完全相反,即一方获得利益就意味着另一方的利益受到损失。
在这种情况下,参与者之间的互动往往是竞争和对抗的。
3. 博弈树模型博弈树模型是一种用于描述博弈过程的图形模型,它可以清晰地展示出参与者在不同阶段的选择和决策,以及每个选择所带来的收益和风险。
4. 纳什均衡模型纳什均衡模型是博弈论中最为重要的概念之一,它指的是一个博弈中所有参与者都采取了最优策略的状态。
换句话说,如果所有参与者都遵循纳什均衡,那么任何一个人单方面改变策略都将无法获得更多的利益。
5. 最小最大化模型最小最大化模型是一种解决零和博弈问题的方法,其思想是在所有可能的情况中,选择让对手收益最小的情况,从而实现自己的最大化收益。
6. 帕累托最优解模型帕累托最优解模型是一种解决多人博弈问题的方法,其核心思想是通过合作和协商,使得所有参与者都能获得最大的收益,而不是只有某个人获得了最大的收益。
7. 博弈矩阵模型博弈矩阵模型是一种常用的博弈论分析工具,它可以清晰地展示出参与者在不同策略下的收益和风险,从而帮助参与者做出最优决策。
8. 拍卖模型拍卖模型是博弈论中的一个重要应用领域,其目的是通过竞价的方式,让参与者以最低的价格获得所需的商品或服务。
9. 逆向选择模型逆向选择模型是一种解决信息不对称问题的方法,其核心思想是通过知道对方的信息,来预测对方的行为和决策,从而做出最优策略。
第二章完全信息动态博弈篇章
![第二章完全信息动态博弈篇章](https://img.taocdn.com/s3/m/4f3f97b9dd3383c4bb4cd270.png)
i (q1, q2 ) qi ( P(Q) c),i 1,2
斯坦克尔伯的寡头竞争模型
用逆向归纳法求解,首先考虑给定q1的情况下,企业2 的最优选择。企业2的问题是:
Max 2 (q1 , q2 ) q2 (a q1 q2 c)
最优化一阶条件意味着:
轮流出价的讨价还价模型
一般来说,如果 0 i 1, i 1, 2均衡结果不 仅依赖于贴现因子的相对比率,而且依赖于博 弈时间长度T和谁在最后阶段出价。然而这种 依存关系随T的变大而变小;当T趋于无穷大时 ,我们得到“先动优势”:即如果 1 2 唯 一的均衡是 x 1 (1 ). 定理(Rubinstein 1982):在无限期轮流出价 博弈中,唯一的子博弈精炼纳什均衡结果是: 1 2 1 * * x (if 1 2 x ) 1 1 2 1
典型的旅行者困境收益矩阵 (仅考虑整数)
100 100 99 98 97 96 95 …… 5 4 3 2
100,100 101,97 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
99
97,101 99,99 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
•
一 博弈扩展式表述
二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 四 应用举例 斯坦克尔伯的寡头竞争模型
•
• •
轮流出价的讨价还价模型
囚徒的救赎 旅行者困境 五 重复博弈
轮流出价的讨价还价模型(1)
博弈论的几个经典模型
![博弈论的几个经典模型](https://img.taocdn.com/s3/m/1d65892bc850ad02df804120.png)
模型二、囚徒困境/非合作博 弈
囚徒困境可以用来说明许多现象。
寡头定价 拍卖出价 推销员的努力 政治上的讨价还价 军备竞赛等(冲突中出现两败俱伤的情况,
往往要考虑到囚徒困境)
*(纯策略)纳什均衡
问题与思考
• 什么是博弈论?试举两个你生活中的例子说明。
• 某年在荷兰召开了一次“合作及社会两难困境研讨 会”,与会者都是博弈论的专家。
基本术语
• 博弈涉及哪些内容呢?
博弈涉及至少两个独立的博弈参与者 (player)。
博弈涉及行动者存在着策略(strategy)选 择的可能,博弈论用策略空间来表示参与 者可以选择的策略。
参与者在不同策略组合下会得到一定的支 付(payoff)。
对于博弈参与者来说,存在着一博弈结果。
对于游戏设计者,这是一个最好的
模型二、囚徒困境/非合作博 弈
在博弈论中,含有占优战略均衡的 一个著名例子是由塔克给出的“囚徒困 境” (prisoners’dilemma)博弈模 型。该模型用一种特别的方式为我们讲 述了一个警察与小偷的故事。
模型二、囚徒困境/非合作博 假设:有两个小偷A弈和B联合犯事、私入
第四章 博弈论的几个经典模 型
讲授人 谭建国
引言
博 弈 论 又 被 称 为 对 策 论 ( Game Theory),按照2005年因对博弈论的贡献 而获得诺贝尔经济学奖的Robert Aumann 教授的说法,博弈论就是研究互动决策 的理论。所谓互动决策,即各行动方 (即局中人[player])的决策是相互影响 的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也 需要把别人对于自己的考虑也要纳入考 虑之中……在如此迭代考虑情形进行决
经济博弈论基第五章动态贝叶斯博弈
![经济博弈论基第五章动态贝叶斯博弈](https://img.taocdn.com/s3/m/2f81f5964028915f814dc215.png)
s i
i
(B)Pi ( i
a
h i
)
是局中人
i观测到
a
h
和最优策略
i
s
*
i
(
)
后,使
用贝叶斯法则从先验概P率i (i i ) 得到的。
六、不完美信息博弈的完美贝叶斯纳什均衡
例1:完美贝叶斯纳什均衡是{M, U; p=1}
1
L (1, 3)
U
M [p] R [1-p]
2
1、Milgrom-Roberts (1982)垄断限价模型
传统解释的问题:价格作为一种承诺是不可置信的,因 为无论垄断者现在索取什么价格,一旦其他企业进入,垄断者 就会改变价格,因此,靠低价格是不可阻止进入的。
Milgrom-Roberts (1982)提出的解释:垄断限价可能反映 了这样一个事实,即其他企业不知道垄断者的生产成本,垄断 者试图用低价格来告诉其他企业自己是低成本,进入是无利可 图的。
一、KMRW声誉模型
如果下列条件满足,囚徒2将选择X=不坦白: 11p-14≥5p-12 p ≥1/3
即如果囚徒1属于非理性的概率不小于1/3,囚 徒2将在第一阶段选择“不坦白”(合作)。
一、KMRW声誉模型
下面考虑博弈重复三次(T=3)的情况:
给定p≥1/3,如果理性囚徒1和囚徒2在第一阶段都选择 “不坦白”(合作),那么第二、三阶段的均衡路径与前表相 同(X=不坦白),总的均衡路径如下表:
2、博弈顺序
(1)自然首先选择囚徒1的类型,囚徒1知道自己的类型, 囚徒2只知道囚徒1属于理性的概率是1-p,非理性的概率是p;
(2)2个囚徒进行第一阶段的博弈;
(3)观察到第一阶段博弈结果后,进行第二阶段博弈; 观察到第二阶段博弈结果后,进行第三阶段博弈;如此等等。
经典动态博弈模型
![经典动态博弈模型](https://img.taocdn.com/s3/m/1a6582cbbdeb19e8b8f67c1cfad6195f302be850.png)
3.4.3委托人—代理人理论
此时,代理人的利益也受到了不确定性的影 响。委托代理模型的主要问题就是如何激励 代理人努力工作。
此时,促使代理人选择努力工作的激励相容 约束、参与约束、委托条件?
3.4.3委托人—代理人理论
四、选择报酬和连续努力水平的委托代理模型 (不是选择是否委托,而是选择报酬的水平, 并且努力程度是可以连续变化的)
博弈过程相同,但是成果由自然来选择。
3.4.3委托人—代理人理论
有20和10单位两种产出,代理人努力时产出 为20单位的概率为0.9,产出为10的概率为0.1; 代理人偷懒时,产出为20的概率为0.1,产出 为10的概率为0.9。R(0)=0.
此时引入自然(N)反映不确定性。 此时的激励相容约束、参与约束、委托条件?
3.4.3委托人—代理人理论
根据松散程度、委托内容、监督难易等不同, 委托人—代理人关系有多个不同的情况,其 中最为关键的差异是监督的难易。有些可以 直接从工作成果来监督,比如流水线上的工 人的工作,而有些难以监督,比如:律师、 教练等
委托人如何促使代理人的行为符合委托人的 利益,是委托—代理理论的重要课题。
努力成果不确定,而且不可监督。考虑代理 人有正的机会成本(U1),假设努力的负效应是 努力水平的单调递增凸函数C=C(e)
产出R是努力水平e的随机函数,R=R(e)。 w=w(R)这意味着薪酬至少一部分是利润提成
3.4.3委托人—代理人理论
w与e有关,w=w(R)=w[R(e)]。 委托人与代理人的得益分别为:
3.4.3 讨价还价(Bargaining)博弈
该模型有许多原型:利润分割、债务纠纷, 或财产继承权的争执。第一、第二回合相当 于纠纷的各方以不同形式调解的过程,而第 三回合则相当于最后提交各司法或仲裁机构 进行裁决。而消耗系数则相当于经济纠纷中, 相关各方花费在谈判和诉讼等方面的时间和 金钱代价。
14-动态博弈经典模型1详解
![14-动态博弈经典模型1详解](https://img.taocdn.com/s3/m/9a2a8ff30975f46527d3e1da.png)
厂商A 先决定产量 q1,
厂商B根据厂商A的行为再决定产量 q2, 厂商A在决策时会考虑厂商B的反应。
求解方法: Backward induction
第二阶段厂商B的最优选择:
max 2 (q1, q2 ) q2 (120 q1 q2 )
2 (q1 , q2 ) 120 q1 2q2 0 q2 q ,q ) * 1 12 120 q 2q 0 FOC:q2 ( (120 q1 )1 2 2 q2 2 q1为厂商A在第一阶 * 1 q2 (120 q1 ) 2 段的实际产量选择
例题2
斯塔伯格均衡求解
假设
市场的需求函数为: Q=a-P
反需求函数为: 边际成本 : P=a-Q=a-q1-q2 AC1= AC2=MC1=MC2=c
厂商A先决定产量 q1 厂商B根据厂商A的行为再决定 q2
ห้องสมุดไป่ตู้
厂商的利润函数为:
1 (q1 , q2 ) q1[ P(Q) MC ] q1 (a q1 q2 c) 1 (q1 , q2 ) q1[ P(Q) MC ] q1 (a q1 q2 c) 2 (q1 , q2 ) q2 [ P(Q) MC ] q2 (a q1 q2 c) 2 (q1 , q2 ) q2 [ P(Q) MC ] q2 (a q1 q2 c)
max 1 (q1 , q2* ) q1 (a q1 q2* c)
1 其中: q2 2 (a q1 c)
*
即:
max 1 (q1 , q ) q1[a q1 1 (a q1 c) c] 2
动态博弈分析经典实例
![动态博弈分析经典实例](https://img.taocdn.com/s3/m/b7423ec6bb4cf7ec4afed071.png)
43
2013-7-14
44
工作竞赛
2013-7-14
45
2013-7-14
46
2013-7-14
47
2013-7-14
48
2013-7-14
49
2013-7-14
50
2013-7-14
51
2013-7-14
52
2013-7-14
53
2013-7-14
11
图 2 . 1 . 3 描述了工会的无差异曲线,若令 L 不变, 当 w 提高时工会的福利就会增加,于是较高的无 差异曲线代表了工会较高的效用水平。
2013-7-14
12
2013-7-14
13
表现在图 2 .1.3 的无差异曲线上就是,工 会希望选择一个工资水平w ,由此得到的 结果(w , L *(w))处于可能达到的最高的无差 异线上。 这一最优化问题的解为 w*,这样一个工资 要求将使得工会通过(w*,L*(w*)) 的无差异 曲线与 L*(w)相切于该点,如图 2 . 1 . 4 所 示。 从而, (w*,L*(w*))就是这一工资与就业博 弈的逆向归纳解。
2013-7-14
8
2013-7-14
9
图 2 . 1 . 2 把 L *(w)表示为 w 的函数(但坐标 轴经过旋转,以便于和以后的数据相比较),并表 示出它和企业每条等利润线交于其最高点。
2013-7-14
10
若令L 保持不变, w 降低时企业的利润就会提高, 于是较低的等利润曲线代表了较高的利润水平。
2
2013-7-14
2013-7-14
3
2013-7-14
4
复旦大学谢识予经济博弈论
![复旦大学谢识予经济博弈论](https://img.taocdn.com/s3/m/48daaac46429647d27284b73f242336c1fb9304e.png)
0.1*[20-w(S)] +0.9*[10-w(S)]<0
23
四、有不确定性且不可监督的 委托人—代理人博弈
1
委托
不委托
只能根据成果付酬,w是成果函数, 而非努力程度函数。不确定性对 代理人利益、选择有影响。
2
接受
[0,0]
拒绝
高产 (0.9)
2
努力
偷懒
0
低产 高产 (0.1) (0.1)
[10-w(10), w(10)-E]
[R(S)-w(S), w(S)-S] [R(0),0]
委托: R(S)-w(S) > R(0) 不委托: R(S)-w(S) < R(0)
21
数值例子
R(E)10EE2
E=2, S=1, W(E)=4, w(S)=2
1
委托
不委托
2
接受
[0,0] 拒绝
2
努力
[0,0] 偷懒
[12, 2]
[7,1]
第二阶段是博弈方3和博弈方4的选择阶段,他们在看到 博弈方1和博弈方2的选择 a 1 和 a 2 以后,同时在各自的
可选策略(行为)集合 A3 和 A4 中分别选择 a 3 和 a 4
各博弈方的得益都取决于所有博弈方的策略 a1,a2,a3,a4 即博弈方i的得益是各个博弈方所选择策略的多元函数 ui ui(a1,a2,a3,a4)
30
3.5.2 间接融资和挤兑风险
客 不存 户 1 存款
客户2 不存 存款 1, 1 1, 1 1, 1 第1下.2二一,阶阶1段段.2
第一阶段
客户2 提前 到期 客 提前 0.8,0.8 1,0.6 户 1 到期 0.6,1 1.2,1.2
exfd经济博弈论3—完全且完美信息动态博弈
![exfd经济博弈论3—完全且完美信息动态博弈](https://img.taocdn.com/s3/m/d1d0ff5ea0116c175f0e48d8.png)
2021/2/4
1
18
二、有法律保障的开金矿博弈II的扩 展形
确实可信的威胁——通过法律武器 乙
确实可信的威胁
投资
不投资
(credible threat)
甲
(1,0)
是指,博弈的参与人通过 分
问题:乙是否该将钱投资给甲呢?
2021/2/4
1
17
一般假设博弈方都是以自身利益(得益)最大 化为目标的,即他们不考虑道德因素。在这样 的原则下,甲轮到行为时的选择必然是“不 分”。乙当然清楚甲的行为准则,因此他最终 合理的选择是“不借”。对乙来说,本博弈中 甲有一个不可信的许诺。
有不可信的许诺,使得甲、乙的合作最终成为 不可能,这样开金矿的3万元社会净利益无法 实现。
2021/2/4
1
8
3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
2021/2/4
1
9
3.2.1 相机选择和策略中的可信性问题
动态博弈仍然是具有策略和利益相互依存性的 决策问题。
静态博弈分析中针对具有策略和利益相互依存 特性决策问题的核心分析方法——纳什均衡分 析,在动态博弈分析中适用吗?
乙非常清楚在第一阶段选择不借才是保 险的。
2021/2/4
1
借
乙 不借
甲 分 (2,2)
打
(1,0) 不分
乙 不打
(-1,0) (0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
25
三、法律保障不足的开金矿博弈 III的扩展形
经典动态博弈模型
![经典动态博弈模型](https://img.taocdn.com/s3/m/24b83c163a3567ec102de2bd960590c69fc3d86c.png)
由于囚徒无法信任对方,最终都选择坦白,导致集体利益受损。
斗鸡博弈
描述
两只斗鸡在狭路相逢,每只斗鸡都有前 进和后退两种选择。如果一只斗鸡前进 ,另一只后退,则前进的斗鸡获胜;如 果两只都前进,则两败俱伤;如果两只 都后退,则均无损失。
VS
博弈策略
由于存在两败俱伤的风险,双方更倾向于 选择后退以避免损失。
予相应的奖励。
结论
智猪博弈表明,合理的激励 机制和任务分配可以激发员 工的积极性和创造力。
案例四:猎鹿博弈在国际政治中的影响
猎鹿博弈概述
猎鹿博弈描述了两个猎人合作与不合作对收益的影响,强 调了合作的重要性。
国际政治中的影响
在国际关系中,国家间的合作与竞争往往受到猎鹿博弈的影响。 合作可以带来共同利益,但也需要克服信任和利益冲突的问题。
02
03
公共品供给
在公共品供给中,政府可运用动态博 弈模型分析不同主体之间的互动关系, 提高公共品供给效率。
国际关系
贸易摩擦
在国际贸易中,国家之间可以通过动态博弈模型分析贸易摩擦的起 因和解决方案,促进国际贸易的稳定发展。
地缘政治
在国际政治中,国家可以利用动态博弈模型分析地缘政治格局的变 化趋势,制定合适的国际战略。
结论
斗鸡博弈表明,在竞争激烈的 市场环境中,适当的妥协和沟
通对于避免损失至关重要。
案例三:智猪博弈在企业管理中的运用
智猪博弈概述
智猪博弈描述了大猪和小猪 在同一个猪圈里抢食物的情 况,强调了策略选择的重要
性。
企业管理中的运用
在企业中,智猪博弈可以应 用于激励机制设计、项目管 理等方面。例如,让有能力 的人承担更多责任,同时给
经典动态博弈模型
博弈论的几个经典模型PPT课件
![博弈论的几个经典模型PPT课件](https://img.taocdn.com/s3/m/b72ea09704a1b0717ed5dd29.png)
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
N
高成本
低成本
A
默许
阻挠
A
默许
阻挠
B
B
B
B
进入 不进入 进入 不进入 进入 不进入 进入 不进入
(50,40)(300,0)(0,-10)(300,0)(100,30)(400,0)(140,-10)(400,0)
*贝叶斯纳什均衡
模型二、囚徒困境/非合作博弈
有两个小偷A和B联合犯事、私入民宅被 警察抓住。警方将两人分别置于不同的两个 房间内进行审讯,对每一个犯罪嫌疑人,警 方给出的政策是:如果一个犯罪嫌疑人坦白 了罪行,交出了赃物,于是证据确凿,两人 都被判有罪。如果另一个犯罪嫌疑人也作了 坦白,则两人各被判刑8年;如果另一个犯罪 嫌人没有坦白而是抵赖,则以妨碍公务罪(因 已有证据表明其有罪)再加刑2年,而坦白者 有功被减刑8年,立即释放。如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪,但 可以私入民宅的罪名将两人各判入狱1年。
为个人)他自己的最好策略,还是采用(作为集 体的一员)他们共同的最好策略?前者导致均衡 策略(坦白,坦白),支付为(-8,-8);后者的最 好策略是(抵赖,抵赖),支付为(-1,-1)。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
四,杀鸡给猴看。其实猴子是没有思维的,它们 有一定的群体意识,但没有社会意识,人们关 于它们的故事其实是说人自己的。我们这里也 讲一个猴子的故事……。
博弈论的几个经典模型课件
![博弈论的几个经典模型课件](https://img.taocdn.com/s3/m/4ed561ad5ff7ba0d4a7302768e9951e79b8969d9.png)
02
在这个模型中,如果双方都抵赖,则各自获得2年的监禁;如果双方都坦白,则 各自获得3年的监禁;如果一方坦白而另一方抵赖,则坦白的一方获得1年的监 禁,抵赖的一方获得10年的监禁。
03
囚徒困境反映了人类在有限理性和不完全信息下的决策问题。
囚徒困境的策略和最优解
01
02
03
在囚徒困境中,每个参 与者都有两种策略:坦
博弈论的发展趋势和应用前景
发展趋势
随着计算机科学的发展,博弈论在人工智能、机器学 习等领域的应用逐渐增多。同时,博弈论也在生物学 、环境科学、社会学等多个学科中得到广泛应用和发 展。未来,博弈论将继续探索更为复杂和现实的模型 ,以解释和预测更为复杂的行为和现象。
应用前景
博弈论在经济学、政治学、军事等领域有着广泛的应 用前景。例如,博弈论可以帮助理解国际贸易中的策 略行为、国际政治中的权力均衡以及军事战略中的最 优攻击策略等。此外,博弈论也在社交网络分析、市 场机制设计等领域展现出强大的应用潜力。
政治学中的应用
投票悖论
投票悖论是指在某些情况下,多数投票的结 果可能导致无法达成一致意见或产生不合理 的结果。在政治学中,投票悖论被用于探讨 民主制度的缺陷和改进方法。
权力均衡
权力均衡是一种政治博弈模型,它描述了政 治权力在多个参与者之间的分配和转移。在 政治学中,权力均衡被用于分析权力斗争、
政治制度稳定性和政策制定等问题。
纳什均衡模型被广泛应用于市场均衡、产业组织、公共经济学
等领域。
生物学
02
纳什均衡模型也被用于解释生物种群竞争、生态系统平衡等问
题。
社会学
03
纳什均衡模型可以用来分析社会现象,如犯罪、婚姻、教育等
博弈论的几个经典模型
![博弈论的几个经典模型](https://img.taocdn.com/s3/m/436b4a6cfab069dc5022019e.png)
博弈论的几个经典模型
a
2
引言
博弈论的应用领域十分广泛,在经济学、 政治科学(国内的以及国际的)、军事战略问 题、进化生物学以及当代的计算机科学等领域 都已成为重要的研究和分析工具。此外,它还与 会计学、统计学、数学基础、社会心理学以及 诸如认识论与伦理学等哲学分支有重要联系。
博弈论的几个经典模型
a
博弈论的几个经典模型
a
12
博弈的类型
根据参与者能否形成约束性的协议,以便 集体行动,博弈可分为合作性博弈和非合作 性博弈。纳什等博弈论专家研究得更多的是 非合作性博弈。
• 合作性博弈:是指参与者从自己的利益出发 与其他参与者谈判达成协议或形成联盟,其 结果对联盟方均有利;
• 非合作性博弈:是指参与者在行动选择时无 法达成约束性的协议。人们分工与交换的经 济活动就是合作性的博弈,而囚徒困境则是 非合作性的博弈。
博弈论的几个经典模型
a
7
引言
博弈论的出现只有60多年的历史。博弈 论的开创者为诺意曼与摩根斯坦,他们1944 年出版了《博弈论与经济行为》。博弈论天 才纳什(Nash)的开创性论文《n人博弈 的均衡点》(1950)、《非合作博弈》(1951)等 等,给出了纳什均衡的概念和均衡存在定理。 今天博弈论已发展成一个较完善的学科。
第四章 博弈论的几个经典模型
讲授人 谭建国
a
1
引言
博弈论又被称为对策论(Game Theory), 按照2005年因对博弈论的贡献而获得诺贝尔经 济学奖的Robert Aumann教授的说法,博弈论 就是研究互动决策的理论。所谓互动决策, 即各行动方(即局中人[player])的决策是相互 影响的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也需要 把别人对于自己的考虑也要纳入考虑之 中……在如此迭代考虑情形进行决策,选择 最有利于自己的战略(strategy)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
支付:政府 —— 社会福利 Welfare
消费者剩余
社会福利
本国企业的利润 政府的关税收入
2 2 1 i国政府 Wi 1 2 Q t e ( h e ) t i ie Wi 1 2 Qii ii tii e jj 1 2 (hii e jj ) 2 t e jj i i 2 2 2 2 1 1 W Q t e ( h e ) t 2 j je j国政府 W jj 1 2 Q jj jj t jj eii 1 2 (h jj eii ) 2 t eii j j 2 2
国内市场利润 国外市场利润
max e j [a (e j hi* ) c] ti e j
e j 0
1 (a e* c) h* j i 2 1 ( a h* c t ) e* j i i 2
四个方程联立
hi* 1 (a e* j c) 2 ei* 1 (a h* j c tj) 2 1 (a e* c) h* j i 2 1 ( a h* c t ) e* j i i 2
ei 0 hi 0
国内市场利润 国外市场利润
hi* 1 (a e* c) j 2 ei* 1 (a h* c tj) j 2
第二阶段企业的选择
j国企业的目标:
max h j [a (h j ei* ) c]
h j 0
h j ,e j 0
max j (t j , ti , h j , hi* , e j , ei* )
w j (t j , ti* )
[2(a c) t j ]2 18
(a c t j ) 2 9 t j (a c 2t j ) 3
(a c C:
ti 4(a c) 2ti 2(a c) 2ti (a c) 4ti 0 18 9 3
* * * * max wi (ti , t * , h , e , h j i i j , ej ) ti 0
wi 1 Qi 2 i ti e j 1 (hi e j ) 2 i ti e j 2 2 2 W j 1 Q j 2 j t j ei 1 (h*j *ei ) * * ) j t j ei ( h , e , h , e 2 2 将两国企业的均衡产量 i i j j 代入得:
4(a c) 2t j 18 2(a c) 2t j 9 (a c) 4t j 3 0
1 1 * 解得:h 3 (a c ti ) ei 3 (a c 2t j ) 1 1 * * h j (a c t j ) e j (a c 2ti ) 3 3
* i
ti tj为政府 在第一阶 段的实际 关税税率
第一阶段政府的选择
i国政府的目标:
两国企业的边际成本都为 c,且没有固定成本, 总成本为 Ci= c ( hi + ei )
企业i 对j 国出口,j 国的关税税率为 tj 企业i 的关税负担为 ei tj
最优关税 Optimum Tariff
参与者: 两国政府和两国企业 i , j 战略:关税税率 ti tj 和企业的产量hi ei hj ej 支付:企业 —— 利润
两阶段动态博弈的应用 —— 最优关税
W
C B
最优关税 Optimum tariff
使一国贸易条件改善 相对于其贸易量减少的负 面影响的净所得最大化的 税率。
A
0
t*
t
H
t
最优关税 Optimum Tariff
假设
两个国家 i / j , 每个国家有一个政府,选定一个关税 税率 ti tj
2 2 [2( a c ) t ] ( a c t ) i i wi (ti , t * ) j 18 9 2 (a c 2t * ) ti (a c 2ti ) j 9 3
第一阶段政府的选择
j国政府的目标:
* max w j (t j , ti* , hi* , ei* , h* , e j j) t j 0
第二阶段企业的选择
i国企业的目标:
max i (ti , t j , hi , h , ei , e )
hi , ei 0 * j * j
max hi [a (hi e* j ) c] max ei [a (ei h* j ) c ] t j ei
i国企业
i [a (hi e j )]hi [a (h j ei )]ei
c(hi ei ) eit j
j国企业
j [a (h j ei )]h j [a (hi e j )]e j
c(h j e j ) e j ti
最优关税 Optimum Tariff
每个国家有一个企业i / j, 产品都在国内和国外销售
每个国家的消费者都消费国内和国外产品
政府首先确定关税税率,企业再在既定关税水平上 进行产量选择
最优关税 Optimum Tariff
国家i 的市场需求为 P = a - Qi i 国企业生产hi 供内需,ei 供出口 i 国市场的总销售量为 hi + ej = Qi
wi 1 Qi 2 i ti e j 1 (hi e j ) 2 i ti e j 2 2 2 W j 1 Q j 2 j t j ei 1 (h*j *ei ) * * ) j t j ei ( h , e , h , e 2 2 将两国企业的均衡产量 i i j j 代入得: