经济博弈论(第三章)

合集下载

第三章信息经济学的研究方法—博弈论

第三章信息经济学的研究方法—博弈论

第一节 概述-人生处处皆博弈
人生是永不停歇的博弈过程,博弈意 略达到合意的结果。
作为博弈者,最佳策略是最大限度地 利用游戏规则,最大化自己的利益;
作为社会最佳策略,是通过规则使社 会整体福利增加。
一、博弈论的定义
博弈论(game theory,又译为对策论,游戏论)
定义:研究决策主体的行为在直接相互作用时,人们如 何进行决策、以及这种决策如何达到均衡。
五、博弈论与信息经济学
博弈论是给定信息结构求均衡结果,它实际上是一种均衡理论, 我们最终要找的是一个均衡的结果,博弈论是方法论导向的, 它实际上是一种解决问题的方法。它是一个实证的方法。
信息经济学是给定信息结构求契约的安排。它实际上是一种契 约设计理论,它是问题导向的。它是一个规范的方法。
石匠的决策与拳击手的决策的区别
一、博弈论的定义
2、理性人假设 理性人是指一个很好定义的偏好,在面临给定的约束条件下
最大化自己的偏好。
博弈论说起来有些绕嘴,但理解起来很好理解,那就是 每个对弈者在决定采取哪种行动时,不但要根据自身的利益 和目的行事,而且要考虑到他的决策行为对其他人可能的影 响,通过选择最佳行动计划,来寻求收益或效用的最大化。
(一)囚徒困境
假定: (1)每个局中人都知道博弈规则和博弈结果的支付
矩阵; (2)每个局中人都是理性的(个人理性和个人最优
决策); (3)不能“串通”
(一)囚徒困境——纳什均衡
囚徒A
坦白
坦白 囚徒 B
-8,-8
抵赖 -10,0
抵赖 0,-10 -1,-1
-8大于-10 0大于-1
(坦白,坦白)是纳什均衡
第三章 信息经济学的研究方法 ——博弈论

经济博弈论_谢识予_2_完全信息动态博弈0.1

经济博弈论_谢识予_2_完全信息动态博弈0.1

单结信息集:只包含一个决策结的信息集 完美(Perfect)信息:博弈树的所有信息都是单结的。 ——博弈中没有任何参与人同时行动,且后行动者能观察到先 行动者的行动,且所有参与人观察到N的行动)
1 动态博弈的扩展式表述

静态博弈用扩展式表述 A
坦白 抵赖 坦白
Q:何为完 全信息? B
抵赖
囚 徒 困 境 博 弈
-3,-3 -4,-3
-3,-3 0,0
1,-2 -4,-3 割耳
1,-2 0,0 (-3,-3) (1,-2) 默认 割耳 (-4,-3) (0,0)
三个NE: (不画,{割耳,默认}) (画,{默认,割耳}) (画,{默认,默认})
画 小孩 不画
父亲
父亲
默认
4 NE的缺陷——不可置信的威胁
换句话说,与抽烟有关决策不是单人在中性环境中 的决定,而是一种博弈。“今日卡门”和不同偏好的卡 门自己,即“未来卡门”间的博弈。


5 逆向归纳法
继续抽 未来的 卡门 不抽 今天的卡门
-1,1
1,-1
0,0 两个“卡门”如何行事? 未来卡门如何行事? 考虑到未来卡门的未来行动,今日卡门今日如何行事?

2 动态博弈中的策略

博弈树中参与人在结点上所选择的单个行动—— 一步/招 (move)
美中军事博弈

但是,参与人可以制定一个行动计划,将每个决策结上 的选择都事先规定好,即使这个决策点实际上不会出 美国 现。——策略
中国 中国
策略: 人不犯我、我不犯人; 人若犯我、我必犯人
不犯人
(-2,-2) (2,-4) (3,-5) (0,0)
4 NE的缺陷——不可置信的威胁

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料第一章导论1.博弈的概念:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。

它包括四个要素:参与者,策略,次序和得益。

2.一个博弈的构成要素:博弈模型有下列要素:(1)博弈方。

即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。

即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。

各博弈方的策略选择范围称策略空间。

每个博弈方各选一个策略构成一个策略组合。

(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。

(4)得益。

各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。

3.合作博弈和非合作博弈的区别:合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。

主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。

假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。

如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。

合作博弈:团体理性(效率高,公正,公平)非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率)4.完全理性和有限理性:完全理性:有完美的分析判断能力和不会犯选择行为的错误。

有限理性:博弈方的判断选择能力有缺陷。

区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。

所以不能简单地假设各博弈方都完全理性。

5.个体理性和集体理性:个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。

第一章课后题:2、4、56.设定一个博弈模型必须确定哪几个方面?设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。

《经济博弈论》期末考试复习解析

《经济博弈论》期末考试复习解析

《经济博弈论》期末考试复习资料第一章导论1.博弈的概念:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。

它包括四个要素:参与者,策略,次序和得益。

2.一个博弈的构成要素:博弈模型有下列要素:(1)博弈方。

即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。

即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。

各博弈方的策略选择范围称策略空间。

每个博弈方各选一个策略构成一个策略组合。

(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。

(4)得益。

各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。

3.合作博弈和非合作博弈的区别:合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。

主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。

假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。

如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。

合作博弈:团体理性(效率高,公正,公平)非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率)4.完全理性和有限理性:完全理性:有完美的分析判断能力和不会犯选择行为的错误。

有限理性:博弈方的判断选择能力有缺陷。

区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。

所以不能简单地假设各博弈方都完全理性。

5.个体理性和集体理性:个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。

第一章课后题:2、4、52.设定一个博弈模型必须确定哪几个方面?设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。

经济博弈论Chapter03_331007283

经济博弈论Chapter03_331007283

描求扩证序境。

of play.参无论何时采取行动,参与者都需要考虑他们当前的行动会如何影响未来的行动,包括对手和博它动,指出了博弈的所有可能结果。

决所有的连续决策点。

decision maker in a 博策树。

博节分每一分支都从博弈树上的一个决策点指向另一个决策点或终结点。

terminal node.在一个分支;不过,仅允许有一个分支指向任何一个决将引收益。

终结点并不是所有博弈必需的;一些博弈理论上可以永远进行下去on forever我参Anode is called a 参安均会发生什么?一个名叫卡门的少女正在决定是否要吸烟。

A teenager named Carmen is deciding whether to smoke.首如不一带给她不同的感受和收益。

taste, as well as different payoffs.单门分析一开始,考虑与终结点直接相连的那些行动点。

Start analysis by considering those action nodes that lead directly to terminal nodes.在利在通沿着贯穿整个博弈树的标出的唯一路径,就知道了当所有参与者在正确预测了所有的未来后果下做出最优选择时,这当由The outcome that arises from playing these在在会,甚至根本就没出现!但是,它的可能的出现和潜在的策略在决定今日卡门的招术时发挥了作用。

三每捐但为的所有结果进行赋值(排序)。

可3不多少种?如我均参不However, the equilibrium path of play is complete specification of the rollback equilibrium.它反略得到的。

艾尼塔根在街道花园博弈的反转均衡中,艾米丽得到了最好的结果(the opportunity to make the first move.先不后当这些操纵的招术就是Tactics for such manipulation are第第第第第第第三步:反转求解Step 3: Rollback第一它Slide 47一但一国然对实考有人拿出下。

经济博弈论第三章

经济博弈论第三章
第三章 完全且完美信息动态博弈
本章讨论完全且完美信息动态博弈。
本章对动态博弈分析的概念和方法, 特别是子博弈完美均衡和逆推归纳法作系 统介绍,并介绍各种经典的动态博弈模型。
本章分六节
3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5有同时选择的动态博弈模型 3.6动态博弈分析的问题和扩展讨论
斯塔克博 格模型 先后
> < < 厂商1 >;厂商2 <
古诺模型
同时
选择次序 总产量 价格 总利润 各自利润
3.4.2 劳资博弈
先由工会决定工资率,再由厂商决定雇用多少劳动力。 工会效用:u(W,L),厂商得意:∏(W,L)=R(L)- W×L
max (W , L) max [ R ( L) WL]
不制止 (5,5)
(10,4)
3.1.2 动态博弈的基本特点

策略是在整个博弈中所有选择、行为 得益对应一条路径
动态博弈的非对称性——先后次序决定动 态博弈必然是非对称的。 先选择、行为的博弈方常常更有利,有 “先行优势”。


3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
3.4.1 寡占的斯塔克博格模型


先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而非同 时选择即可。
Q q1 q2 , P P(Q) 8 Q
c1 c2 2
2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12 u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2 6q2 q1q2 q2

复旦大学经济博弈论课件--经济博弈论536页

复旦大学经济博弈论课件--经济博弈论536页
以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
d d x tx ( u y u ) x (x x 2 ) x 2 ( 1 x ) x 2 x 3
22.03.2020
课件
14
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
22.03.2020
其中abcd可以是任何得益,根据问题设定。
22.03.2020
课件
17
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
d d x tx(u 1 u )x[u 1x1u (1x)u 2] x(1x)u (u) x(1x)x[(ac)(1x)b (d)]
复制动态 相位图
22.03.2020
x 课件
1
x
18
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
d x F (x ) x (1 x )x [ (a c ) (1 x )b ( d )] dt
22.03.2020
课件
3
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群0
课件
4
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型

经济博弈论_Chapter03

经济博弈论_Chapter03
Slide 6
博弈树:一个例子 Game Trees: An Example
ANN Branches BOB Stop ANN Go 1 2 3 Up Down DEB High Low (10,7,1,1) (2,7,4,1) ( , , , ) (1,-2,3,0) (1.3,2,-11,3) (0,-2.718,0,0) (0, 8,0,0) Terminal nodes (6,3,4,0) (2,8,-1,2) node节点 branch分支
证据 Evidences de ces
Slide 2
序贯博弈 Sequential-move Games
序贯博弈要求一个有严格博弈顺序的策略环境。 Sequential-move Sequential move games entail strategic situations in which there is a strict order of play. p y 参与者按顺序出招,并且知道在他们之前的那 些参与者都干了什么。 参与者都干了什么 Players take turns making their moves, and they know what players who have gone before them have done.
Slide 9
博弈树 Game Trees
分支代表从任一决策点出发的可能采取的行动。 分支代表从任 决策点出发的可能采取的行动 The branches represent the possible actions that t at can ca be taken ta e from o any a y decision dec s o node. ode 每一分支都从博弈树上的一个决策点指向另一个决策 点或终结点。 E hb Each branch hl leads d f from a d decision i i node d on th the tree either to another decision node, or to a terminal node. 在任何一个博弈中,从每一个决策点出发,至少要有 一个分支;不过,仅允许有一个分支指向任何一个决 策点。 策点 In any game, there must be at least one branch leading from each decision node. However, every decision node can have only Slide 10 one branch leading to it.

经济博弈论ppt课件

经济博弈论ppt课件
• 例二:黔馿之技
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling

经济博弈论潘

经济博弈论潘


1.1.2 定义
博弈-----个人、队组或其他组织,面对一定的环境条件,在一定的 规则下,同时或先后,一次或多次,从各自允许选择的行为或策 略中进行选择并加以买施,并从中各自取得相应结果的过程。
一个博弈需要设定下列4个方面: (1)博弈的参加者 (2)各博弈方各自可选择的全部策略或行为的集合。 (3)进行博弈的次序。 (4)博弈方的得益。
而“非合作博弈”则是指在各博弈方之间不能存在任何有约束力的协 议,也就是说各博弈方不能公然“串通”、“共谋”的博弈问题。
1.1.3 博弈论研究的历史和发展述评
产量决策的古诺(Cournot)模型
价格决策的伯特兰德(Bertrand)模型
本世纪20年代,法国数学家波雷尔(Borel)用最佳策略的概念研究了下 棋和其他许多具体的决策问题,并试图把它们作为应用数学的分支加 以系统研究 1944年诺依曼(Neumann)和摩根斯坦(Morgensten)合著的《博弈论和 经济行为》一书的出版标志着系统的博弈理论的初步形成。

1.2.2齐威王与田忌赛马
传说齐威王经常要大将田忌与他赛马,赛马的规则是这样的:每次双 方各出三匹马,一对一比赛三场,每一场的输方要赔一千斤铜给赢方。 齐威王的三匹马和田忌的三匹马按实力都可分为上、中、下三等。由 于齐威王的上、中、下三匹马都分别比田忌的上、中、下三匹马略胜
一筹,因此田忌每次都是连输三场,要输掉三千斤铜。实际上,田忌 的上马虽不如齐威王的上马,却比齐威王的中马和下马都要好,同样, 田忌的中马则比齐威王的下马要好一些,田忌每次都连输三场是有些 冤枉的。后来田忌的谋士孙膑给田忌出了个主意,即让田忌不要用自 己的上马去对抗齐威王的上马,而是用下马去对抗齐威王的上马,上 马则去对抗齐威王的中马,中马去对抗齐威王的下马。 田忌的谋士孙膑给田忌出了个主意,即让田忌不要用自己的上马去对 抗齐威王的上马,而是用下马去对抗齐威王的上马,上马则去对抗齐 威王的中马,中马去对抗齐威王的下马。这样,虽然第一场田忌必输 无疑,但后两场田忌却都能赢,二胜一负,田忌反而能赢齐威王一千 斤铜。 这个著名的故事生动地告诉我们巧用策略是多么的重要,在实力、条 件一定的情况下,对已方力量和有利条件的巧妙调度和运用常会起到 意想不到的效果。

经济博弈论第三讲混合博弈PPT课件

经济博弈论第三讲混合博弈PPT课件

混合策略的定义:在博弈G={s1,s2, …,sn}中,博弈方i的策 略空间为Si=(si1,si2, …,sik),则博弈方以pi=(pi1,pi2, …,pik) 随机选择k个可选策略称为一个混合策略。其中,0≤pik≤1, k=1,2, …,k,且pi1+pi2+…+pik=1
相对于这种以一定概率分布在一些策略中随机选择,原来的 确定性的具体的策略称为纯策略,原来的纳什均衡也称为 纯策略纳什均衡。纯策略也可看作特殊的混合策略。
2020/10/13
11
• 同样,设乙的混合策略为(q,1-q) ,则乙的纳什 均衡策略也必须使甲无论选A还是选B的期望收益 相等。即:

q×2+(1-q) ×5=q×3+(1-q) ×1
• 解得 q=0.8 即乙的混合策略也是(0.8,0.2)
• 容易算出在这个混合策略纳什均衡下,甲乙各自 的得益都是2.6.它的意义是说,虽然在一次博弈
2020/10/13
10
• 例 某博弈的得益矩阵为



C

A
2,3
•甲

B
3,1
D 5,2
1,5
• 这个博弈没有纯策略纳什均衡。要计算混合策略纳什均衡, 设甲的混合策略为(p,1-p),
• 则甲的选择必须使乙选C和选D的期望得益相等,即: p×3+(1-p) ×1=p×2+(1-p) ×5
• 解得p=0.8。即甲的混合策略是(0.8,0.2)
我们把纳什均衡的概念也作相应的扩大:对一个策略组合, 无论它是纯策略还是混合策略,只要满足各博弈方都不想 单独偏离它,就称其为纳什均衡。
2020/10/13

exfd经济博弈论3—完全且完美信息动态博弈

exfd经济博弈论3—完全且完美信息动态博弈

动态博弈中博弈方的策略是他们自己预先设定
的,在各个博弈阶段针对各种情况的相应行为 选择的计划。
这些策略实际上并没有强制力,而且实施起来 有一个过程,因此只要符合博弈方自己的利益, 他们完全可以在博弈过程中改变计划。我们称 这种问题为动态博弈中的“相机选择 (Contingent Play)”。
(-1,0) (0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
稳定。为什么会出现这种情
况呢?
其实,该博弈中 (不借-不打,不分)和(借-打,分)都是纳什
均衡。但后者不可信,不可能实现或稳定。
上述纳什均衡不稳定的原因,主要在于如果甲在第二阶段选择了 “不分”而不是“分”,乙策略中设定的第三阶段“打”是不可 信的,不可能真正实施,理由是该行为对乙自身也是不利的,追 求自身利益最大化的乙的理性不允许他这么做。甲只要稍作分析 就可以掌握乙的这个弱点,因此不可能理睬乙策略中的“打”官 司威胁,在第二阶段不会选择“分”。反过来,乙也不会愚蠢到 想靠一个明显不可信的威胁撑腰,冒险将资金借给甲,因此他在 第一阶段也不可能“借”。
第三章 完全且完美信息动态博弈
本章讨论动态博弈(Dynamic Games),所
有博弈方都对博弈过程和得益完全了解的完全 且完美信息动态博弈。这类博弈也是现实中常
见的基本博弈类型。由于动态博弈中博弈方的 选择、行为有先后次序,因此在表示方法、利 益关系、分析方法和均衡概念等方面,都与静 态博弈有很大区别。本章对动态博弈的概念和 分析方法,特别是子博弈完美均衡和逆推归纳 法作系统介绍,并介绍各种经典的动态博弈模 型。
所以,在一个动态博弈中,博弈的结果包括双
方(或多方)采用的策略组合,实现的博弈路 径和各博弈方的得益。

博弈论与信息经济学不完全信息静态博弈

博弈论与信息经济学不完全信息静态博弈
A11,..., An n ,和类型依存支付函数u1(a1,, an ;1),...,un (a1,, an ;n )
参加人i懂得自己旳类型 i i ,条件概率 pi pi (i i ) 描述 给定自己属于 i 旳情况下,参加人i有关其他参加人类型 i i旳不拟定性。我们用 G {A1,, An ;1,,n ; p1,, pn ;u1,,un} 代表这个博弈。
j
bi
aj cj
bi
aj cj
ui (vi bi ) P bi b j v j
1 2 (vi
bi ) P
bi
bj
vj
(vi
bi )
bi
aj cj
求导得:bi vi
1 2
vi
1 2
aj
由于bi vi
ci vi
ai
ci
1 2 , ai
1 2 aj
0
综上所述,bi vi
贝叶斯均衡是一组战略组合源自(a1.,a
2
.)
,使得对于每一

i
和每一种可能旳 ci
,战略
a
i
(.)最大化参加人
i
旳期望
效用函数
Ec
j
ui
(ai
,
a
j
ci
,
ci
)
。令
z
j
Pa j c j 1为均衡状
态下参加人 j 提供旳概率。最大化行为意味着,只有当参加
人 i 预期参加人 j 不提供时,参加人 i 才会考虑自己是否提
懂得(成本ci 是参加人 i 旳类型)。 c1和 c2 具有相同旳、独立旳定义在[c, c]
上旳分布函数,且是共同知识。

经济博弈论(山东联盟) 智慧树知到网课章节测试答案

经济博弈论(山东联盟) 智慧树知到网课章节测试答案

1、选择题:设定博弈模型必须确定的方面包括选项:A:博弈方B:策略C:得益D:博弈次序E:信息结构F:行为逻辑和理性程度答案: 【博弈方,策略,得益,博弈次序,信息结构,行为逻辑和理性程度】2、选择题:“囚徒困境”的内在根源是个体理性与集体理性的矛盾。

选项:A:对B:错答案: 【对】3、选择题:根据博弈过程,博弈可以分为选项:A:静态博弈B:动态博弈C:进化博弈D:重复博弈答案: 【静态博弈,动态博弈,重复博弈】4、选择题:根据博弈方的行为逻辑,是否允许存在有约束力协议,博弈可以分为选项:A:零和博弈B:非合作博弈C:变和博弈D:合作博弈答案: 【非合作博弈,合作博弈】5、选择题:单人博弈就是个人最优化决策,与典型的博弈选择题有本质区别。

选项:A:对B:错答案: 【对】1、选择题:重复剔除劣战略的计算步骤依次是(A)→(B)→(C)→(D)A、找出某个参与人的劣战略,把这个劣战略剔除掉B、重新构造一个不包含已剔除战略的新的博弈C、然后再剔除这个新的博弈中的某个参与人的劣战略D、继续这个过程,一直到只剩下一个唯一的战略组合为止选项:A:对B:错答案: 【对】2、选择题:对于参与人A和B构成的静态博弈,采用划线法求纳什均衡的计算步骤依次是(C)→(B)→(A)A、首先考虑A的战略,对于每一个B的给定的战略,找出A的最优战略,在其对应的支付下划一横杠,B、然后再用类似的方法找出B的最优战略。

C、在完成这个过程后,如果某个支付格的两个数字下都有杠,这个数字格对应的战略组合就是一个纳什均衡。

选项:A:对B:错答案: 【错】5、选择题:中、日两国对东海主权存在争议。

设想中国石油与日本石油这两家石油公司同时决定是否开发东海油气资源,双方在各种情况下的收益(单位:亿元)如下表所示。

该博弈的纯策略纳什均衡为选项:A:(开发,不开发)B:(不开发,开发)C:(开发,开发)D:(不开发,不开发)答案: 【(开发,不开发),(不开发,开发)】1、选择题:设一四阶段两博弈方之间的动态博弈如下图所示,子博弈完美纳什均衡策略组合双方的收益是选项:A:(5,2)B:(5,3)C:(4,2)D:(4,3)答案: 【(5,3)】5、选择题:在下列的囚徒的困境博弈的重复博弈中,如果贴现因子为1,问两博弈方都采用“开始时不坦白,在第t阶段则采用对方第t-1阶段策略”的“以牙还牙”策略,无限次重复博弈情况下,可以构成子博弈完美纳什均衡。

第3章 博弈论与信息经济学--完全信息动态博弈

第3章 博弈论与信息经济学--完全信息动态博弈
©&® by H. Q. Feng, CUFE 17/58
二、子博弈精炼纳什均衡
第三,由于不考虑自己选择对别人选择的影响,纳 均衡允许了不可置信威胁的存在。如“市场阻挠博 弈”中,如果进入者者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润, 斗争则将预期的利润化为乌有。所以,斗争是一种 不可置信的威胁,
©&® by H. Q. Feng, CUFE 21/58
二、子博弈精炼纳什均衡
泽尔腾的“子博弈精炼纳什均衡”
一个纳什均衡称为精炼纳什均衡,当且仅当参与 人的战略在每一个子博弈中都构成纳什均衡。
就是说,组成精炼纳什均衡的战略必须在每一个 子博弈中都是最优的。
©&® by H. Q. Feng, CUFE
就是说,如果在位企业摆出一副“你进入我斗争”的 架势,那么进入企业不应该被这种威胁所吓倒。因 为它是不可置信的。但是,纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)便成为 一个纳什均衡。
©&® by H. Q. Feng, CUFE 18/58
子博弈精炼纳什均衡-不可置信威胁
美国普林斯顿大学古尔教授1997年在《经济学透视》里发表文 章,提出一个例子说明威胁的可信性问题: 两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦 的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告 状,我都把你们两个关起来,关起来比没有玩具更可怕。现 在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说: 快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告 诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而 告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你 不会告状,因此哥哥对弟弟的警告置之不理。 的确,如果弟弟是会算计自己利益的理性人,在这样的环境下, 还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可 置信的。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三章完全信息动态博弈上一章介绍了完全信息静态博弈,本章在前面的基础上探讨完全信息动态博弈。

现实社会经济活动的决策大多数是有先后顺序的行为而不是同时选择的行为,而且后行者能够看到先行者的决策内容,在先行者的决策结果之后再定夺自己的策略。

这样的经济行为比比皆是,如商业活动中的讨价还价,拍卖活动中的轮流竞价,资本市场上的收购兼并和反收购兼并都是如此。

依次选择与一次性同时选择有很大的差异,因此这种决策问题构成的博弈也是从时间序列上有别于静态博弈的,我们称之为“动态博弈”(Dynamic Games)。

例如下象棋通常需要两个参与人,我们定义为红方和黑方,红方先走,黑方后走,这是一个典型的完全信息动态博弈。

动态博弈由于添加了时间因素,因而更加贴近现实。

根据博弈方是否相互了解得益情况,可分为“完全信息动态博弈”和“不完全信息动态博弈”,根据是否所有博弈方都对自己选择前的博弈过程完全了解,可分为“完美信息动态博弈”和“不完美信息动态博弈”。

在本章中,我们首先对博弈的扩展式表达给出完整的定义,为动态博弈的分析奠定基础;其次,我们从扩展式表述博弈的纳什均衡分析逐步深入到子博弈精炼纳什均衡,为动态博弈的分析提供可行的方法,接下来介绍两种完全信息动态博弈经典模型;最后,分析具有无穷次的重复博弈,推导出无名氏定理。

3.1 博弈的扩展式表述在动态博弈中,博弈方的行动是有先后次序的,且后行动者在自己行动之前能够观测到先行动者的行动,每个博弈方的一次选择行为常称为一个“阶段”(Stage )。

动态博弈中也可能存在几个博弈方同时选择的情况,这时博弈方的同时选择构成一个阶段。

一个动态博弈至少有两个阶段,因此动态博弈有时也称为“多阶段博弈”(Multistage Games )。

此外,也有把动态博弈称为“序列博弈”(Sequential Games )的,这也是由动态博弈中的次序特征引出来的。

设有一个商人要从A 地向B 地运输一批货物。

假设从A 地到B 地有水、陆两条路线,走陆路运输成本为10000元,而走水路的运输成本为7000元。

不过走陆路比较安全,而走水路有一定的风险,即可能会遇到恶劣的暴风雨天气会造成相当于这批货物总价值10%的损失。

再假设已知该批货物的总价值为90000元,运输期间出现暴风雨天气的概率为1/4,问该商人应选择哪条运输路线?该博弈中博弈方在面临决策时面临的条件中有一个不确定因素,即商人不知道运输期间的实际天气情况会怎样,所知道的只是出现坏天气、好天气的概率分布。

对这个博弈我们同样可用得益矩阵和扩展式两种方法来表示,只是为了把天气因素放进博弈中加以考虑,我们可以引进一个代表随机选择作用的博弈方,这个博弈方就是“大自然”(Nature ),我们常常称它为“博弈方0”,在该博弈中,决策者商人称为“博弈方1”。

上述博弈方0的任务就是分别以3/4的概率和1/4的概率随机选择好天气和坏天气。

博弈方0不会有追求“自身利益”的愿望,不用我们去考虑它的得益。

因此这个博弈方0与一般博弈方是不同的,也是我们称它为“博弈方0”的原因所在。

如果我们以商人的运输成本或者加上损失的负值作为商人的得益,则可以用图3.1中的得益矩阵表示该博弈。

自 然好天气75% 坏天气25%商 水路人 陆路图3.1 运输路线得益矩阵图3.1中商人和自然为两个博弈方;商人有水路、陆路两种可选策略,自然则有好天气、坏天气两种可能的选择;由于商人决策时不知道未来天气的实际情况(即自然对天气的选择可以被看作在商人决策前早就做出的),而自然在选择天气时当然更不会去管商人做了怎样的决策,因此该博弈中的两博弈方可以看作是同时决策的;矩阵中的四个元素分别代表商人在四种可能情况下的得益(成本和损失的负值),自然的得益则不用考虑。

如果用扩展行来表示博弈,则如图3.2所示。

-7000 -16000 -10000 -10000图3.2 运输路线扩展行 图3.2中第一个信息集为博弈方0,即自然的选择节点。

因为博弈方1决策时无法知道自然的选择有两条路径,分别到达两个不同的节点,但博弈方1却仍然只作一个选择,而不是针对两个节点分别作选择。

当然,对应博弈方1的两种策略,事实上仍然有四种不同的结果,即他的两种策略与两个不同的节点(对应自然的不同选择)组合。

如图3.2中四个黑点表示终端所示,每个终端的数字表示沿相应的决策路径到达终端时,博弈方1(商人)的得益。

我们已经用得益矩阵和扩展式两种方法,将商人关于运输路线的决策问题表示为一个实质上的单人博弈,形式上两人博弈。

那么这个博弈如何解法,商人应如何决策,最后他的得益(成本和损失之和的负值)结果又如何呢?实际上,由于该问题本身带有外生的不确定因素,因此最终的结果不一定能预先确定。

不过,如果商人根据一般解决带概率分布,具有不确定性的问题常用数学期望值进行决策,而不是盲目冒险碰运气或一味害怕、躲避风险,我们还是可以确定商人的选择的。

本例中,商人走水路时,得益为-7000的概率为75%(好天气),得益为-16000的概率为25%(坏天气),因此走水路的期望收益为(-7000)×75%+(-16000) ×25%=-9250;走陆路时,得益是确定的-10000。

因为-9250﹥-10000,即走水路的期望费用9250小于走陆路的10000,所以该商人还是选择走水路。

若多次碰到同样的决策选择并每次都做这样的选择,则平均每次的运输成本应接近9250。

下面我们再来看一个用兵打仗的博弈——空城计。

公元29年,蜀国丞相诸葛亮出兵攻打祁山,因为错用马谡失了战略要地街亭,只好撤兵。

这时魏国大将军司马懿带领15万人马来反击,诸葛亮只有2500兵士,此时撤退已经来不及了,诸葛亮于是唱起了空城计,镇定自若地走上城墙,羽扇纶巾,焚香弹琴,命令老弱兵士洒扫街道,并且打开城门。

这个时候,诸葛亮的谋略是在掌握对司马懿作战经验的信息基础之上的,他料定司马定会知道自己是一个谨慎的人,不会打无准备的帐,这样自己虚张声势就会有效。

司马懿作战经验颇丰,而且与诸葛交过手,以他对诸葛的了解,认为他是谨慎不会冒险的军事家,根据这些信息,立即判断出城里有埋伏,于是后军作前军,前军变后队,迅速撤退。

这给诸葛留出了足够的时间带领小队人马撤退。

坏天气(25%)好天气(75%) 1(-7000)(-10000)(-16000)(-10000)通过以上例子我们可以看出,用扩展式表述(extensive form representation)能够更好地描述和分析动态博弈。

相对于我们前面分析的静态博弈来说,这里的扩展主要是对博弈人的战略空间而言:谁在什么时候行动,每次行动时有些什么具体行动可供选择,以及知道些什么。

简单地说,在扩展式表述中,战略对应于参与人的相机行动规则(contingent action plan ),即什么情况下选择什么行动,而不是简单的、与环境无关的行动选择。

如我们空城计的例子,就是在特定的环境下理性的选择,但这里存在着不可置信的因素,所以导致了理性选择结果并非理想的情况。

博弈的扩展式实际上就是对博弈树的节点(node )和枝(branch )做出严格的规范和定义。

因而博弈的扩展式与博弈树是同义词。

与博弈的基本式相比,博弈的扩展式特别善于描述复杂的博弈,博弈越复杂,博弈扩展式的优点就越突出。

博弈树给出了有限博弈的几乎所有信息。

结合上面的例子,我们给出博弈树的构造。

博弈树的基本建筑材料(building block )包括结(node )、枝(branch )和信息集(information set )。

1.结(node ):结包括决策结(decision node )和终点结(terminal node )两类。

决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。

例如图3.2中,决策结包括空心圆和椭圆中博弈方1的两个实心圆。

终点结包括对应4个支付向量的点。

2.枝(branches ):在博弈树上,枝是从一个决策结到它的直接后续连线(有时候用箭头表示),每一个枝代表参与人的一个行动选择。

例如在图3.3中,魏国司马懿有两种选择,分别用反击和不反击两个枝来表示。

3.信息集(information set ):博弈树上的所有决策结分割成不同的信息集。

每一个信息集市决策结集合的一个子集,该子集包括所有满足下列条件的决策结:⑴每一个决策结都是同一参与人的决策结;⑵该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。

引入信息集目的是描述下列情况:当一个参与人要做出决策时他可能并不知道“之前”发生的所有事情(这里我们将之前放在引号内,因为博弈树中的决策结的排列并不一定与行动的时间顺序相一致)。

前面给出的例子相对来说比较简单,只有两阶段。

事实上,用扩展式完全可以表示更复杂的动态博弈。

这里给出一个“仿冒和反仿冒”博弈的例子。

设有一家企业A 生产一种畅销产品,被另一家企业B 仿冒,如果被仿冒企业采取措施制止,仿冒企业就会停止仿冒,如果被仿冒企业不采取措施制止,仿冒企业就继续仿冒。

对被仿冒企业来说,被仿冒当然会带来产品销售和声誉受损等经济损失,因此采取措施制止是符合自身利益的,但同时采取措施也是要付出成本的,因此遭到仿冒的时候是否应该制止是需要研究的问题。

对于仿冒企业来说,仿冒不被制止有很大的收益,但如果被制止就会血本无归,还要赔偿对方一定的损失。

因此是否仿冒也是需要仔细推敲的。

所以,这两个企业在仿冒和制止仿冒的问题上,存在着一个行为和利益相互依存的博弈问题。

由于只有在已经遭到仿冒的情况下被仿冒企业才需要考虑是否加以制止的问题,因此,这必然是一个动态博弈的问题。

蜀国(2500, 0) (0, 150000)蜀攻 (失街亭) 魏不反击蜀撤魏反击 图3.3 空城计蜀汉博弈图为了简单起见,我们假设仿冒最多进行两次,再假设第一次不仿冒、仿冒被制止,以及在第一次仿冒没制止的情况下,第二次不仿冒、仿冒被制止、仿冒不被制止这几种情况下,仿冒和被仿冒企业的得益分别为0和10、-2和5、5和5、2和2、10和4,那么该动态博弈可以用图3.4中扩展形来表示。

图中得益数组的第一个数字是仿冒企业的得益,第二个数字为被仿冒企业的得益。

当然,也不是所有动态博弈都可以用扩展形表示。

因为有些动态博弈的阶段很多,或者博弈方在一个阶段有许多可选择的行为,这些时候扩展式表示动态博弈就会很困难,或者根本不可能。

如,下象棋这种动态博弈,它不仅博弈阶段很多,而且每个阶段的可能选择也很多,因此很难用扩展式来表示。

此外,两个生产寡头先后决定产量的定产博弈也是动态博弈,但因为每个寡头可以选择的产量都是无穷多种,因此也无法用只能描述有限种行为选择的扩展式表示。

相关文档
最新文档