经济博弈论3

合集下载

经济博弈论3

经济博弈论3

不借
最大利益为重,甲有一个 不可信承诺,正因为此所 以使得甲乙合作最成为了

甲 不分
(1,0)
不可能
(2,2)
(0,4)
开金矿博弈
在本博弈中,如果已打官

司是可信的,则甲在第二

阶段一定会选择分,则乙
在第一阶段一定会选择借, 分
所以最终(借,分)。此
例也说明晚上的法律制度 (2,2)
制度,不仅哪呢过保障社
乙 借
初始信息集和进行博弈所

需要的全部信息,能够自 成一个博弈的原博弈的一 分
不分
部分,称为原动态博弈的 (2,2)

一个“子博弈”。
不借 (1,0)
子博弈:即动态博弈中满足 一定要求的局部所构成的 次级博弈
(-1,0) (0,4)
二级子博弈
三级子博弈
仿冒
A 不仿冒
B
不制止 (0,10)
制止
(-2,5) 制止
(-1,0) (0,4)
衡路上的节点。
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格模型 3.4.2 劳资博弈 3.4.3 讨价还价博弈 3.4.4 委托人—代理人理论
3.4.1 寡占的斯塔克博格模型
斯塔克博格模型是动态的寡头产量博弈模型。 先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而
不委托 委托人的利益,R(E)是指较 高的产出, R(S)较低的产出,
2
接受
[R(0),0] 拒绝
w(E)是较高的报酬,代理人 要得到较高的报酬但有较高 的负效用-S, w(S)是较低的
2
[R(0),0]
报酬
代理人的选择

基于经济学博弈论对“小三”现象的比较静态分析

基于经济学博弈论对“小三”现象的比较静态分析
理论 视野
基于经济学博弈论对 ‘ 小三’ 现 象的比较静态分析
李晓 龙
( 北京 邮电大学经济管理学院, 北京 1 0 0 8 7 6 )
【 摘 要 】现如今 ,婚姻 生活 中的 问题越 来越 多,离婚 率持续上升。“ 小三” 的出现是婚姻破裂的重要原因。本文通过建立模
型 ,利 用博弈论 以及 比较静 态分析方法对婚姻 生活 中存在 “ 小 ’的 男女Байду номын сангаас方的收益和行 为进行分析,通过分析 可知 ,女方对 男 方好 与不好 ,男方是 否选择 出轨 ,主要 与 “ 小三” 给男方的情感收益 、女方对男方好 时男方的情感收益 、女方不对男方好 时男方
1其他条件不越大也就是说男方从小三那里获取的情变rc越大感收益越高女方对男方好的概率也就越大为了更好的理解我们可以来动态的考虑一种情况比如他很专一很重感情看不上别的异性这时实际上也就是rc很小那么女方对他好的概率也会很低假设有一天另外一个女子跟他关系越来越密切他对这个女子也越来越有好感这时也就是rc逐渐增加的过程此时婚姻关系中的女方也会开始增加对他好的概率也就是我们所谓的挽回她的婚姻因为她知道这时rgrc的但是如果有一天rc大到超过了rg了那么女方的态度会出现一个大逆转从一个很高的对男方好的概率突然变成了不对他好了这是因为此时已经从情况3变为了情况1了


引 言
婚姻,作为 人类 一种基本 的社会制度 ,与每个人的生活息 息相关。法律上对婚姻 的定义为 :男女双方 以永久共同生活为 目的,以夫妻的权利义务为内容的合法结合 。现如今 ,婚姻 生 活中的 问题越来越 多,一部分人选择放弃与配偶永久的共 同生
婚姻经济学研究框架 ,他提 出了双重合约的概念 。婚姻中男女

经济博弈论_谢识予_2_完全信息动态博弈0.1

经济博弈论_谢识予_2_完全信息动态博弈0.1

单结信息集:只包含一个决策结的信息集 完美(Perfect)信息:博弈树的所有信息都是单结的。 ——博弈中没有任何参与人同时行动,且后行动者能观察到先 行动者的行动,且所有参与人观察到N的行动)
1 动态博弈的扩展式表述

静态博弈用扩展式表述 A
坦白 抵赖 坦白
Q:何为完 全信息? B
抵赖
囚 徒 困 境 博 弈
-3,-3 -4,-3
-3,-3 0,0
1,-2 -4,-3 割耳
1,-2 0,0 (-3,-3) (1,-2) 默认 割耳 (-4,-3) (0,0)
三个NE: (不画,{割耳,默认}) (画,{默认,割耳}) (画,{默认,默认})
画 小孩 不画
父亲
父亲
默认
4 NE的缺陷——不可置信的威胁
换句话说,与抽烟有关决策不是单人在中性环境中 的决定,而是一种博弈。“今日卡门”和不同偏好的卡 门自己,即“未来卡门”间的博弈。


5 逆向归纳法
继续抽 未来的 卡门 不抽 今天的卡门
-1,1
1,-1
0,0 两个“卡门”如何行事? 未来卡门如何行事? 考虑到未来卡门的未来行动,今日卡门今日如何行事?

2 动态博弈中的策略

博弈树中参与人在结点上所选择的单个行动—— 一步/招 (move)
美中军事博弈

但是,参与人可以制定一个行动计划,将每个决策结上 的选择都事先规定好,即使这个决策点实际上不会出 美国 现。——策略
中国 中国
策略: 人不犯我、我不犯人; 人若犯我、我必犯人
不犯人
(-2,-2) (2,-4) (3,-5) (0,0)
4 NE的缺陷——不可置信的威胁

论经济博弈论

论经济博弈论

论经济博弈论“博弈即一些个人、对组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。

”博弈由英文“game”翻译过来,过去每每听到博弈一词.都觉得这是一个高深莫测、充满神秘色彩的领域,如今通过了系统的学习,才终于可以对“博弈”有一些粗浅的理解。

博弈论的英文名称为Gm,ne Theory,也翻译为对策论、游戏论。

作为一门现代学科体系,博弈论早在半个世纪以前就已经出现,但长期以来并没有受到足够重视,除了少数博弈论专家以外,很少有人知道它。

可是,近年来却受到高度的重视和青睐。

1994 年三位致力于博弈论基础理论研究的经济学家共同获得了诺贝尔经济学奖,使得博弈论作为重要的经济学分支学科的地位和作用得到了最具权威性的肯定。

此后1996年,诺贝尔经济学奖又由博弈论和信息经济学家莫里斯和维克瑞获得,这进一步肯定了博弈论在经济学中的重要地位,同时也从一个侧面体现出博弈理论已经渡过了成长期,步人了成熟期。

一、博弈论的发展进程博弈论思想虽然有着悠久的历史,但是作为一门系统的学科来说还相当的年轻。

近代以来,在学术研究的过程中许多学者逐渐认识到了博弈论的重要作用,对博弈理论进行了探索研究。

一般认为,对于博弈理论的最早研究可以追溯到18世纪初。

瓦德格拉夫(W aldegrave)在1713年提出了两人博弈的极小化极大混合策略解。

古诺(Coumot)和波特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型,两位学者分别从产茸决策和价格决策分析垄断的双寡头竞争模型,确定了在竞争之下各自的最优反应函数。

但是作为一种理论来说,1944年,冯·诺依曼(VonNeumann)和奥·摩根斯坦(Morgenstem)合著了《博弈论与经济行为》在总结了以往关于博弈的研究成果的基础上,提出了博弈论的概念术语、一般框架和表述方法,提较系统的博弈理论,因此这被认为是博弈理论初步形成的标志。

经济博弈论(第三版)复习题及答案%20谢识予著

经济博弈论(第三版)复习题及答案%20谢识予著
5
L 2,0 3,4
R
7、我们用反应函数法来分析这个博弈。先讨论博弈方 1 的选择。根据问题 的假设,如果博弈方 2 选择金额 s2(0≤s2≤10000) ,则博弈方 1 选择 s1 的利益 为: s1 u(s1)= 0
当 S1≤10000 -s2 当 S1≤10000 -s2
因此博弈方 1 采用 s1=1000—s2 时,能实现自己的最大利益 u(s1)= s1=1000— s2。因此 s1=1000—s2 就是博弈方 1 的反应函数。 博弈方 2 与博弈方 1 的利益函数和策略选择是完全相似的,因此对博弈方 1 所选择的任意金额 s1, 博弈方 2 的最优反应策略, 也就是反应函数是 s2=1000- s1。 显然, 上述博弈方 1 的反应函数与博弈方 2 的反应函数是完全重合的,因此 本博弈有无穷多个纳什均衡,所有满足该反应函数,也就是 s1+ s2=10000 的数组 (s1 ,s2)都是本博弈的纯策略纳什均衡。 如果我是两个博弈方中的一个,那么我会要求得到 5000 元。理由是在该博 弈的无穷多个纯策略纳什均衡中, (5000,5000)既是比较公平和容易被双方接 受的,也是容易被双方同时想到的一个,因此是一个聚点均衡。 9、 (1)两个厂商的利润函数为: πi=pqi-ciqi=(a-qi-qj)qi-ciqi 将利润函数对产量求导并令其为 0 得: ∂π i =a-qj-ci-2qi=0 ∂qi 解得两个厂商的反应函数为: qj=(a- qj-ci)/2 或具体写成: q1=(a-q2-c1)/2 q2=(a-q1-c2)/2 (2)当 0<ci<a/2 时, 我们根据上述两个厂商的反应函数,直接求出两个厂商 的纳什均衡产量分别为: a − 2c1 + c 2 3 a + c1 − 2c 2 q2= 3 (3)当 c1<c2<a,但 2c2>a+ c1 时,根据反应函数求出来的厂商 2 产量 q2<0。 这意味着厂商 2 不会生产, 这时厂商 1 成了垄断厂商,厂商 1 的了优产量选择是 利润最大化的垄断产量 a − c1 q1=q* = 2 因此这种情况下的纳什均衡为[(a- c1)/2, 0]。 q1=

经济博弈论Chapter03_331007283

经济博弈论Chapter03_331007283

描求扩证序境。

of play.参无论何时采取行动,参与者都需要考虑他们当前的行动会如何影响未来的行动,包括对手和博它动,指出了博弈的所有可能结果。

决所有的连续决策点。

decision maker in a 博策树。

博节分每一分支都从博弈树上的一个决策点指向另一个决策点或终结点。

terminal node.在一个分支;不过,仅允许有一个分支指向任何一个决将引收益。

终结点并不是所有博弈必需的;一些博弈理论上可以永远进行下去on forever我参Anode is called a 参安均会发生什么?一个名叫卡门的少女正在决定是否要吸烟。

A teenager named Carmen is deciding whether to smoke.首如不一带给她不同的感受和收益。

taste, as well as different payoffs.单门分析一开始,考虑与终结点直接相连的那些行动点。

Start analysis by considering those action nodes that lead directly to terminal nodes.在利在通沿着贯穿整个博弈树的标出的唯一路径,就知道了当所有参与者在正确预测了所有的未来后果下做出最优选择时,这当由The outcome that arises from playing these在在会,甚至根本就没出现!但是,它的可能的出现和潜在的策略在决定今日卡门的招术时发挥了作用。

三每捐但为的所有结果进行赋值(排序)。

可3不多少种?如我均参不However, the equilibrium path of play is complete specification of the rollback equilibrium.它反略得到的。

艾尼塔根在街道花园博弈的反转均衡中,艾米丽得到了最好的结果(the opportunity to make the first move.先不后当这些操纵的招术就是Tactics for such manipulation are第第第第第第第三步:反转求解Step 3: Rollback第一它Slide 47一但一国然对实考有人拿出下。

经济学博弈论

经济学博弈论

⒉策略式表述的博弈举例 在掷币游戏中,每个参与人的支付直接用其赢得或输
掉的硬币数量来表示:赢得一枚硬币的支付为1,输掉一 枚硬币的支付为-1。掷币游戏的支付矩阵见表10-3所示。
小孩A
表10-3 掷币游戏
小孩B
正面 反面
正面 反面
1,-1 -1,1
-1,1 1,-1
16 合肥学院 章 蕾
再如下面的斗鸡博弈。试想有两只公鸡遇到一起,每 只公鸡有两个行动选择:一是进攻,一是撤退。如果一只 公鸡撤退,一只公鸡进攻,则进攻的公鸡获得胜利,撤退 的公鸡很丢面子;如果两只公鸡都撤退则打个平手;如果 两只公鸡都进攻,那么两败俱伤。设其支付矩阵见表10-4 所示。
参与人A 合肥学院 章 蕾
U
0,2 1,4
M
3,4
2,3
D
1,1 3,1
2,1 1,0
4,2 23
通过对纳什均衡与占优策略均衡以及重复剔除的占优 均衡的分析,可知它们之间的关系如下:每一个占优策略 均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一 个纳什均衡都是占优策略均衡或重复剔除的占优均衡。
9 合肥学院 章 蕾
③信息是参与人在博弈中的知识,特别是有关其他 参与人(对手)的特征和行动的知识。在囚徒困境模型 中,两囚徒的信息是都知道自己和另一囚徒在选择坦白 和抵赖的不同组合时面对的处罚。
④策略:是参与人在拥有既定信息情况下的行动规 则,它规定参与人在什么时候选择什么行动。一个参与 人的所有可选择的策略的集合就是这个参与人的策略空 间。如果每个参与人选择一个策略,就构成一个策略组 合。
贝叶斯纳什均衡
精炼贝叶斯纳什均衡
12 合肥学院 章 蕾
第二节 完全信息静态博弈
每一个参与人对所有其他参与人(对手)的特征、 策略空间及支付函数有准确的知识,而且博弈的参与人 同时选择行动或虽非同时但后行动者并不知道前行动者 采取了什么具体行动,这种情况下参与人的决策就是完 全信息静态博弈。

《博弈论与信息经济学讲义》第3章多重均衡与制度和文化

《博弈论与信息经济学讲义》第3章多重均衡与制度和文化

交通规则的演变
• 在法国大革命以前,贵族的马车习惯上是靠左行的, 穷人在路上看到富人的马车来了,要站在马路的右边。 因此,靠左行与“特权阶级”相联系,而靠右行被认 为更为“民主”。随着法国大革命,作为一个革命的 象征,规定所有的车都要靠右走。随着拿破仑对欧洲 大陆的征服,拿破仑将法国的规则带给了欧洲,也包 括靠右行驶的规则。当然,在地域上这个规则的转变 也是从西到东逐步完成的。比如说,与靠右行的西班 牙接壤的葡萄牙是在一战之后才转为靠右行,奥地利 是从西到东一个省一个省逐步转变的,匈牙利、捷克 和德国是在二战前才由左行转向右行的。瑞典,一直 到1967年,才通过法律宣布从靠左行改为靠右行。
资源争夺博弈(chicken)
Hawk Dove
Hawk -1,-1 0,10
Dove 10,0 5,5
产权的先占规则
• 人们为什么遵守这个规则? • 人们希望得到别人认可的愿望: • 一旦规则建立,每个人都预期其他人会遵守规则;给定这个预期,
每个人发现遵守规则是自己的利益所在,也希望别人能遵守这个 规则。任何不守规则的行为都会使守规则的人受到损害或者感到 威胁,从而引起后者的愤怒;任何其他人也因此会觉得自己未来 的利益受到威胁,对此种行为表示不满,对受害人表示同情; • 少数人不守规则并不会导致规则的消失; • 但如果规则总是偏向于某一组特定的人群,受到不公正对待的人 并不会蔑视不守规则的人,规则就容易被违反。 • 罗尔斯(Rawls)的正义论
纳什均衡。
1
x1
资源争夺博弈(chicken)
Hawk Dove
Hawk -1,-1 0,10
Dove 10,0 5,5
如何协调?
• 仅仅“理性”是不够的; • FOCAL POINT(PROMINENCE):

博弈论与经济生活(3)

博弈论与经济生活(3)
安徽农业大学理学院 ·张成堂
例题: 重复剔除的占优均衡
行先生
M优于L 列先生
L
M
R 行:没有占优战略
U
1,0
1,2
0,1
列:M严格优于R
D 0,3
这里的占优战略或劣战略可能只是相对于另一 个特定战略而言。 ➢ 如果重复剔除后的战略组合不唯一,该博弈就 不是重复剔除的方法可解的。
安徽农业大学理学院 ·张成堂
例子 重复剔除的占优战略均衡

L
M
R
U 甲
S
1,0 0,2
1,3 0,1
3,0 3,0
D 0,2
2,4
5,3
安徽农业大学理学院 ·张成堂
智猪博弈(Boxed Pig Game)
安徽农业大学理学院 ·张成堂
“智猪博弈”的启示
原版的“智猪博弈”故事给了竞争中的弱者 (小猪)以等待为最佳策略的启发。但是对于社 会而言,因为小猪未能参与竞争,小猪搭便车时 的社会资源配置的并不是最佳状态。为使资源最 有效配置,规则的设计者是不愿看见有人搭便车 的,政府如此,公司的老板也是如此。而能否完 全杜绝“搭便车”现象,就要看游戏规则的核心 指标设置是否合适了。
猪圈中有一头大猪和一头小猪,在猪圈的一 端设有一个按钮,每按一下,位于猪圈另一端 的食槽中就会有10单位的猪食进槽,但每按一 下按钮会耗去相当于2单位猪食的成本。
如果大猪先到食槽,则大猪吃到9单位食物, 小猪仅能吃到1单位食位食物;
如果小猪先到,大猪吃6单位而小猪吃4单位 食物。表5给出这个博弈的支付矩阵。
入大量资金进行技术创新,开发新产品,而中 小企业是小猪,不会进行大规模技术创新,而 是等待大企业的新产品形成新的市场后生产模 仿大企业的新产品的产品去销售。

经济博弈论(第三章)

经济博弈论(第三章)

第三章完全信息动态博弈上一章介绍了完全信息静态博弈,本章在前面的基础上探讨完全信息动态博弈。

现实社会经济活动的决策大多数是有先后顺序的行为而不是同时选择的行为,而且后行者能够看到先行者的决策内容,在先行者的决策结果之后再定夺自己的策略。

这样的经济行为比比皆是,如商业活动中的讨价还价,拍卖活动中的轮流竞价,资本市场上的收购兼并和反收购兼并都是如此。

依次选择与一次性同时选择有很大的差异,因此这种决策问题构成的博弈也是从时间序列上有别于静态博弈的,我们称之为“动态博弈”(Dynamic Games)。

例如下象棋通常需要两个参与人,我们定义为红方和黑方,红方先走,黑方后走,这是一个典型的完全信息动态博弈。

动态博弈由于添加了时间因素,因而更加贴近现实。

根据博弈方是否相互了解得益情况,可分为“完全信息动态博弈”和“不完全信息动态博弈”,根据是否所有博弈方都对自己选择前的博弈过程完全了解,可分为“完美信息动态博弈”和“不完美信息动态博弈”。

在本章中,我们首先对博弈的扩展式表达给出完整的定义,为动态博弈的分析奠定基础;其次,我们从扩展式表述博弈的纳什均衡分析逐步深入到子博弈精炼纳什均衡,为动态博弈的分析提供可行的方法,接下来介绍两种完全信息动态博弈经典模型;最后,分析具有无穷次的重复博弈,推导出无名氏定理。

3.1 博弈的扩展式表述在动态博弈中,博弈方的行动是有先后次序的,且后行动者在自己行动之前能够观测到先行动者的行动,每个博弈方的一次选择行为常称为一个“阶段”(Stage )。

动态博弈中也可能存在几个博弈方同时选择的情况,这时博弈方的同时选择构成一个阶段。

一个动态博弈至少有两个阶段,因此动态博弈有时也称为“多阶段博弈”(Multistage Games )。

此外,也有把动态博弈称为“序列博弈”(Sequential Games )的,这也是由动态博弈中的次序特征引出来的。

设有一个商人要从A 地向B 地运输一批货物。

exfd经济博弈论3—完全且完美信息动态博弈

exfd经济博弈论3—完全且完美信息动态博弈

动态博弈中博弈方的策略是他们自己预先设定
的,在各个博弈阶段针对各种情况的相应行为 选择的计划。
这些策略实际上并没有强制力,而且实施起来 有一个过程,因此只要符合博弈方自己的利益, 他们完全可以在博弈过程中改变计划。我们称 这种问题为动态博弈中的“相机选择 (Contingent Play)”。
(-1,0) (0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
稳定。为什么会出现这种情
况呢?
其实,该博弈中 (不借-不打,不分)和(借-打,分)都是纳什
均衡。但后者不可信,不可能实现或稳定。
上述纳什均衡不稳定的原因,主要在于如果甲在第二阶段选择了 “不分”而不是“分”,乙策略中设定的第三阶段“打”是不可 信的,不可能真正实施,理由是该行为对乙自身也是不利的,追 求自身利益最大化的乙的理性不允许他这么做。甲只要稍作分析 就可以掌握乙的这个弱点,因此不可能理睬乙策略中的“打”官 司威胁,在第二阶段不会选择“分”。反过来,乙也不会愚蠢到 想靠一个明显不可信的威胁撑腰,冒险将资金借给甲,因此他在 第一阶段也不可能“借”。
第三章 完全且完美信息动态博弈
本章讨论动态博弈(Dynamic Games),所
有博弈方都对博弈过程和得益完全了解的完全 且完美信息动态博弈。这类博弈也是现实中常
见的基本博弈类型。由于动态博弈中博弈方的 选择、行为有先后次序,因此在表示方法、利 益关系、分析方法和均衡概念等方面,都与静 态博弈有很大区别。本章对动态博弈的概念和 分析方法,特别是子博弈完美均衡和逆推归纳 法作系统介绍,并介绍各种经典的动态博弈模 型。
所以,在一个动态博弈中,博弈的结果包括双
方(或多方)采用的策略组合,实现的博弈路 径和各博弈方的得益。

经济博弈论

经济博弈论
3
非合作博弈强调个体理性
(individual rationality),就是
从个体的角度考虑策略选择,使得
个体收益最大。所以非合作博弈研
究的是参与者在利益相互影响的情
况下如何选策略使自己的收益最大,
即策略选择问题。
约翰·纳什 (J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。
1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体(可以是个人,也可以是团体);
2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策;
3、策略是指参与人选择行动的规则,即在博弈 进程中,什么情况下选择什么行动的预先安排;
第一节 引言
1
博弈理论简介
博弈论(Game Theory):研究具有斗争或竞争性质现象的理 论和方法。
三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集
分类: 合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈;
研究博弈论的意义:理解人类的经济行为;理解社会和生态 物种系统中的合作行为以及自自组织斑图。
13
从游戏到博弈
游戏的特点:下棋,打牌,赌博,田径, 球类等等,共同的特点是策略
策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略和 利益的依存性
14
想一想
假如你正跟恋人用手机通电话,突 然信号断了。这时,你会立即拨电话 过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,取 决于你的恋人是否会拨过来。如果你 们其中一方要拨,那么另一方最好是 等待;如果一方等待,那么另一方就 最好是拨过去。因为如果双方都拨, 那么就会出现线路忙;如果双方都等 待,那么时间就会在等待中流逝。

博弈论 经济学

博弈论 经济学

博弈论经济学
博弈论是现代经济学中重要的分支之一,主要研究人们在互相作
用的场景中所做的决策,这些场景中包括市场竞争、战略合作和纳什
均衡等。

博弈论对于深入理解市场运作、战略合作以及政府政策制定
起着至关重要的作用。

在市场竞争场景中,博弈论告诉我们,每个参与者都会基于自身
的利益来做出决策,并在不断的博弈中最终寻求达成最优解。

比如,
在一个两家公司之间的市场中,如果两家公司都以降价来争取顾客,
那么他们最终可能在价格战中损失惨重。

但是,如果他们能够通过谈
判或者合并来达成协议,那么双方都可以获得更好的投资回报,这就
是博弈论的合作战略所能带来的动力。

在战略合作场景中,博弈论告诉我们,通过深思熟虑并不断调整
既可实现理想目标。

比如,在军队领导者的战争中,策略方案一般是
经过博弈论的思考而确定的,同时在完善策略过程中还会不断地修正,以适应不断变化的战争环境。

又如,在企业合作或合作投资中,博弈
论的思想也是非常重要的,只有在强调企业共赢和良好合作基础上,
企业才可能获得更大收益。

在政府政策制定场景中,博弈论告诉我们,如何在不同利益方之
间制定协调点才是最关键的。

比如,在制定税收政策的过程中,政府
需考虑公民和企业的利益,以及公共财政预算的平衡等因素。

这种复
杂的应用场景中,博弈论的策略思维和模型方法很好地应用了进来。

总之,博弈论对于现代经济学的发展起到了重要的作用,它不仅让我们更好地理解市场、战略、政策等方面问题的本质,更是为我们提供了一种有效的决策方法,使我们更具有创造力和竞争力,更好地适应不同的环境。

博弈论中的三个经济学模型

博弈论中的三个经济学模型
q1* = q2*= (a-c) /3 此时, u1*=u2*=(a-c)2 /9
考虑关系式:qi*= (a-c-qj*) /2 无论qj是否最优,由 qi= (a-c-qj) /2决定的qi总是 厂商i针对厂商j产出水平的最优反应;我们称 关系式qi= (a-c-qj) /2为厂商i针对厂商j的策略的 反应函数,并记为:qi*= Ri(qj)= (a-c-qj) /2.由此 NE( qi* , qj* )必须是方程组: q1= (a-c-q2) /2 q2= (a-c-q1) /2 的解。-------------------------反应函数法
q2 a-c
R1(q2) =(a-c- q2)/2
(a-c)/2 (a-c)/3 NE R2(q1)=(a-c- q1)/2 (a-c) 3 q1
0
(a-c) 2
a-c
(二)Bertrand Model of Duopoly
*两厂商决策的相互影响在于需求函数 Di(pi ,pj)=a- pi +b pj 两厂商的产品具有一定的差异性;b是厂商i 的产品对厂商j的产品的替代系数。 ●标准式表述 1、参与人:厂商1与厂商2;他们生产同类但 存在一定差异的产品。
2、他们选择价格,Si={pi: pi≥0}; 3、他们的支付函数就是他们的利润函数: ui= ui(pi,pj) 假定两厂商 =Di(pi ,pj) pi - Di(pi ,pj) c 均无固定成本, 只有常数边际 =(a- pi +b pj) (pi-c) 成本c。 厂商i的反应函数: a+c+bpj Ri(pj) = 2
Max ui(qi ,qj*) =Max [-q 2 +(a-c-q *)q ] i j i qi∈Si qi∈Si

博弈论中的三个经济学模型

博弈论中的三个经济学模型

q2≥0
q2≥0
= maxq2[a-q1- q2 -c],
q2≥0
which yields
R2(q1) =
a- q1 -c 2
,
Provided q1< a – c. The same equation for
R2(q1) appeared in our analysis of the simultaneous -move Cournot game in Chapter 1. The difference
“重复剔除严格劣策略(iterated elimination of strictly dominated strategies)”的思路:
首先,找出某个参与人的严格劣策略,并 把它从他的策略空间中剔除,重新构造一个已 不包含该严格劣策略的博弈;
其次,剔除新博弈中某个参与人的严格劣 策略;
重复上述过程,直到只剩下唯一的策略组 合。 ——我们认为这个唯一所剩的策略组合是稳定 的。
b﹤2
思考:在Bertrand的模型中,如果两厂商的 产品是同质的,那么NE会是什么?
将是: P1*= p2*= c
Bertrand paradox
子博弈完美NE应用举例
(一)Stackelberg Mondel of Duopoly
Stackelberg(1934)proposed a dynamic model of duopoly in which a dominant(leader) firm moves first and a subordinate(or follower) firm moves second(比如在美国汽车产业发展史中的 某些阶段,通用汽车就扮演过这种领导者的角色, 只不过跟随者不只一个,如福特、克莱斯勒等). Following Stackelberg,we will develop the model under the assumption that the firms’ choose quantities, as in the Cournot model(where the fires’ choices are simultaneous,father than sequential as here ). P86
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.1 动态博弈的表示法和特点
3.1.1 阶段和扩展型表示 3.1.2 动态博弈的基本特点
3.1.1 阶段和扩展型表示

阶段:动态博弈中一个博弈方的一次选择行为 例子:仿冒和反仿冒博弈
A 仿冒 B 制止 仿冒 (-2,5) 制止 (2,2) B 不仿冒 不制止 (0,10) A 不仿冒
不制止 (5,5)
(0,4)
3.3 子博弈和子博弈完美纳什均衡
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡 3.3.3 承诺行动
3.3.1 子博弈

由一个动态博弈第一阶段以外的某 阶段开始的后续博弈阶段构成的, 有初始信息集和进行博弈所需要的 全部信息,能够自成一个博弈的原 博弈的一部分,称为原动态博弈的 一个“子博弈”。 子博弈是一个对于所有参 与人的信息集来说都是单 结的结,由这个结的后续 结、终点结以及在相应的 终点结处的支付这三个要 素所组成的博弈。
三回合讨价还价
S1 1 2 S
甲 提议S1

S2 S 乙
接受
不接受,出S2

S
接受
甲 不接受,出S

本博弈关键: 第一,在第三回合甲提出的 方案(S:10000-S) 有强制 力,即此时乙必须接受,且 这一点双方都知道; 第二,该博弈多进行一个回 合总得益就下降一个比例, 因此让谈判拖得越长对双方 都可能越不利。 假设任一博弈方只要得益不 小于下一回合自己能得到的 得益,会接受对方出价。
L
逆推归纳法: 第二步,回到第一阶 段工会的选择。 工会的最优选择为使 它的无差异曲线与L(w) 曲线相切,(w*,L*)为子 博弈完美纳什均衡
max u[ w, L* ( w)]
W 0
W
w*
0
L* (w* )
L* (w)
u3 u2 u1 u0
L
工会的无差异曲线
3.4.3 讨价还价博弈



例3:炸弹引爆
1
不给 给 (-1,1) 炸 (-∞,-∞)
2
不炸
(0,0)
3.2.2 逆推归纳法

定义:从动态博弈的最后 一个阶段博弈方的行为开 始分析,逐步倒推回前一 个阶段相应博弈方的行为 选择,一直到第一个阶段 的分析方法,称为“逆推 归纳法”。


甲 分 不分
不借
(1,0)

逆推归纳法是动态博弈分 (2,2) 析最重要、最基本的方法。
(S1 ,1 S1 )
[S2 , (1 S2 )]
[ 2 S , 2 (1 S )]
当0.5 1时,越大,
1
提议S1 2 接受 1 不接受,出S2
1方得益越大, 2方得益越小 当0 0.5时,越大, 1方得益越小, 2方得益越大
(S1 ,1 S1 )
拒绝 原告 起诉
接受 (s-c,-s) 放弃
(rx-c-p,-rx-d)
(-c,0)



考虑承诺行动。 从原告角度考虑:如果原告将诉讼费p提前支 付给律师,那么在博弈的最后阶段,只要 rx-c-p>-c-p,即只要胜诉的概率大于0,原告 将起诉。 若s<rx+d,被告将接受原告赔偿请求。s的范 围[rx,rx+d]。假定双方讨价还价能力相同,赔 偿结果为rx+d/2; 如果rx+d/2>c+p,原告提出指控;即使 rx<c+p,由于d值大,rx+d/2>c+p仍有可能。 最后的得益结果(rx+d/2-c-p,-rx-d/2),案件私 了。

子博弈完美纳什均衡是适合动态博弈的 新的均衡概念: (1)它是纳什均衡,具有策略稳定性; (2)不能包含任何不可信的威胁或许 诺(在每个子博弈上都是纳什均衡)

结论: (1)该均衡本身也为纳什均衡,且为比 纳什均衡更强的均衡概念; (2)求解动态博弈最基本方法:逆推归 纳法。 此法可消除不可信的威胁或许诺,所 得到的策略组合不存在不可信行为。
甲 分 (2,2)
子博弈本身就 是一个博弈!


不借
(1,0) 不分 乙 (0,4)

(-1,0)
1
1
2
2
2
2
1
1
1
包括本身,存在5个子博弈
只有3个子博弈
纳什均衡的问题
在第三种开金矿博弈中, (不借-不打,不分) 和(借-打,分)都是纳什均衡。但后者不可信, 不可能实现或稳定。

结论:纳什均衡在动态博弈可能缺乏稳定性,也就 是说,在完全信息静态博弈中稳定的纳什均衡,在 动态博弈中可能是不稳定的
根源:纳什均衡本身不能排除博弈方策略中包含的 不可信的行为设定,不能解决动态博弈中的可信性 问题

3.3.2 子博弈完美纳什均衡
定义: 如果一个完美信息的动态博弈中,各 博弈方的策略构成的一个策略组合满 足在整个动态博弈及它的所有子博弈 中都构成纳什均衡,那么这个策略组 合称为该动态博弈的一个“子博弈完 美纳什均衡”。
接受
不接受,出S
[S2 , (1 S2 )]
[ 2 S , 2 (1 S )]
无限回合讨价还价博弈

思路: 对于一个无限阶段博弈而言,无论博弈从第三阶 段开始(假如能达到)还是从第一阶段开始,博弈 结果完全一样。
无限阶段讨价还价博弈中, 1 S* 1方第一阶段出价
3.4 几个经典动态博弈模型
3.4.1 3.4.2 3.4.3 3.4.4 寡占的斯塔克博格模型 劳资博弈 讨价还价博弈 委托人—代理人理论
3.4.1 寡占的斯塔克博格模型


先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而非同 时选择即可。
Q q1 q2 , P P(Q) 8 Q
先行优势
先行优势与后动优势

例一
左 上 甲 下 4, 12 3,12
乙 中 3,10 2,10 右 2,12 1,11 甲有后动优势

例二
左 上 甲 下 10,0 10,100
乙 右 5,4 5,0 甲有先行优势 乙有后动优势
3.4.2 劳资博弈


背景:在一个劳动力市场上存在一个垄断性质 的工会,工会决定工资率,而厂商根据工资来 决定需要雇佣多少工人。工会的效用函数为 U(w,L),w为工会提出的工资水平,L为雇佣人 数。 工会得益为效用函数U(w,L),为w和L的增函数; 厂商利润函数为π(w,L)=R(L)-wL,R(L)为企业 雇佣L名工人可获得的收入,R(L)为凹函数, 即R’(L)>0, R”(L)<0

三回合讨价还价: 第一回合,甲提出自己得S1,乙得10000-S1,乙 可以接受或者拒绝。乙若接受双方得益分别为S1和 10000-S1,谈判结束,若乙不接受,进入下一回 合; 第二回合,乙提出方案为甲得S2,自己得10000S2,甲选择是否接受,接受则双方得益分别为δS2 和δ(10000-S2),谈判结束,若甲不接受则进入下 一回合; 第三回合,甲提出自己得S,乙得10000-S,这时 乙必须接受,双方实际得益分别为δ2S和δ2(10000S)

原告 不指控
(0,0)
指控
若rx<p
要求S
被告 拒绝 原告 接受
(s-c,-s)
起诉
(rx-c-p,-rx-d)
放弃
(-c,0)


要挟诉讼:rx <p 子博弈完美纳什均衡: 原告选择(不指控, 要求,放弃) 被告选择(拒绝) 均衡结果:原告不指 控。
原告 不指控
若rx<p
指控 要求S 被告
(0,0)
3.3.2 承诺行动

包含不可信策略的纳什均衡不再是 子博弈完美纳什均衡,如果参与人 在博弈之前采取某措施改变自己行 动空间或支付函数,将原来不可信 的威胁或许诺变为可信,则博弈均 衡相应改变。这些为改变博弈结果 而采取的措施称为“承诺行动”。
例:要挟诉讼(nuisance suits)
要挟诉讼是指这样一类诉讼,原告胜诉的可能性非常 小,目的是希望通过法庭外和解,从被告那里得到补 偿。 此类博弈有两个博弈方:原告和被告 行动顺序 - 原告决定是否指控被告,指控成本c; - 如果决定指控,原告要求被告支付s>0,私了; - 被告决定接受还是拒绝原告要求; - 如果被告拒绝,原告决定是放弃还是向法庭起诉,原 告的起诉成本(包括律师费用)为p,被告的辩护成本 为d; - 如果案子到了法庭,原告将以r的概率赢得x的支付。
(0,4)

(1,0) 开金矿博弈
(1,0) 不分 分 乙 (2,2) 不打 打 (-1,0) (0,4)
有法律保障的开金矿博弈 ——分钱打官司都可信
法律保障不足的开金矿博弈 ——分钱打官司都不可信

例2:进入博弈
容纳 进入
(900,1100)
B
商战
(-200,600)
A
不进入 (0, 3000)


阻止市场进入与剩余生产能力
容纳 (900,300) 进入
B
商战 (-200,600)
A
不进入 (0,2200)
最低价格保证



保证最低价格:顾客在本店购货后一 个月内,若发现同一商品在其他商店 价格更低,本店保证退还差价,并补 偿差额的10% 广告法规定厂商必须履行其广告中的 声明,即最低保证条款是可以通过法 律强制执行的合同 最低价格保证的实质
原告;p
要求S
被告 拒绝 原告 接受
(s-c-p,-s)
起诉
(rx-c-p,-rx-d)
放弃
相关文档
最新文档