博弈论(二)—讲义
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
9.2 完全信息静态博弈
9.2.1 博弈的战略式表述
Definition A normal (strategic) form game G consists of: (1) a finite set of agent s . {1,2,,}D n = (2) strategy sets .
12,,,n S S S (3) payoff functions . 12:(1,2,,)i n u S S S R i n ⨯⨯⨯→=
囚徒B
囚徒A
完全信息静态博弈是一种最简单的博弈,在这种博弈中,战略和行动是一回事。 博弈分析的目的是预测博弈的均衡结果,即给定每个参与人都是理性的,什么是每个参与人的最优战略?什么是所有参与人的最优战略组合?
纳什均衡是完全信息静态博弈解的一般概念,也是所有其他类型博弈解的基本要求。
下面,我们先讨论纳什均衡的特殊情况,然后讨论其一般概念。
9.2.2 占优战略(Dominated Strategies )均衡
一般说来,由于每个参与人的效用(支付)是博弈中所有参与人的战略的函数,因此,
每个参与人的最优战略选择依赖于所有其他参与人的战略选择。但是在一些特殊的博弈中,一个参与人的最优战略可能并不依赖于其他参与人的战略选择。也就是说,不管其他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”。
Definition Strategy s i is strictly dominated for player i if there is some such that i i s S '∈ for al .
(,)(,)i i i i i i u s s u s s --'>i i s S --∈
Proposition a rational player will not play a strictly dominated strategy.
抵赖 is a dominated strategy. A rational player would therefore never 抵赖. This solves the game since every player will 坦白. Notice that I don't have to know anything about the other player . 囚徒困境:个人理性与集体理性之间的矛盾。
This result highlights the value of commitment in the Prisoner's dilemma – commitment consists of credibly playing strategy 抵赖.
囚徒困境的广泛应用:军备竞赛、卡特尔、公共品的供给。
9.2.3 Iterated Deletion of Dominated Strategies (重复剔除劣战略)
智猪博弈(boxed pigs )
小猪
按 大猪
等待
此博弈没有占优战略均衡。因为尽管“等待”是小猪的占优战略,但是大猪没有占优战略。大猪的最优战略依赖于小猪的占略: ---。
大猪会正确地预测到小猪会选择“等待”;给定此预测,大猪的最优选择只能是“按”。这样,(按,等待)就是唯一的均衡。
重复剔除的占优均衡:先剔除某个参与人的劣策略,重新构造新的博弈,再剔除,---。
应用:大股东监督经理,小股东搭便车;大企业研发,小企业模仿。
9.2.4 Nash equilibrium
性别战博弈(battle of the sexes ):
女
足球赛 演唱会 足球赛 2,1 0,0 男
演唱会
0,0
1,2
在上面的博弈中,两个参与者都没有占优策略,每个参与者的最优策略都依赖于另一个参与人的战略。所以,没有重复剔除的占优均衡。
Definition A strategy profile s * is a pure strategy Nash equilibrium of G if and only if
for all players i and all
***(,)(,)i i i i i i u s s u s s --≥i i s S ∈
求解Nash 均衡的方法。
A Nash equilibrium captures the idea of equilibrium : Both players know what strategy the other player is going to choose, and no player has an incentive to deviate from equilibrium play because her strategy is a best response to her belief about the other player's strategy.
对纳什均衡的理解:设想所有参与者在博弈之前达成一个(没有约束力的)协议,规定每个参与人选择一个特定的战略。那么,给定其他参与人都遵守此协议,是否有人不愿意遵守此协议?如果没有参与人有积极性单方面背离此协议,我们说这个协议是可以自动实施的(self-enforcing ),这个协议就构成一个纳什均衡。否则,它就不是一个纳什均衡。
问题:纳什均衡与重复剔除(严格)劣战略均衡之间的关系。
9.2.5 Cournot Competition (古诺竞争)
This game has an infinite strategy space .
Two firms choose output levels q i ,cost function c i (q i ) = cq i .
market demand determines a price :the products of 1212()()p f q q q q αβ=+=-+both firms are perfect substitutes, i.e. they are homogenous products.
D = {1; 2} S 1 = S 2 = R +
u 1 (q 1, q 2) = q 1 f (q 1 + q 2) -c 1 (q 1) u 2 (q 1, q 2) = q 2 f (q 1 + q 2) - c 2 (q 2)
the 'best-response' function BR (q j ) of each firm i to the quantity choice q j of the other firm: 由,得FOC: 11121[()]q q q cq παβ=-+-
;又。因 21211()0 22q c q q q c q ααβββ--+--=⇒=
-120 c
q q αβ
-≥⇒≤
, ()220, otherwise j j
i j q c c if q BR q ααββ⎧---≤⎪=⎨⎪⎩
q 1
q 2
BR 1(q 2)
BR 2(q 1)
(q 1*,q 2* )
()(2)
c αβ-()c αβ
-
The best-response function is decreasing in my belief of the other firm's action.
Using our new result it is easy to see that the unique Nash equilibrium of the Cournot game is the intersection of the two BR functions.
Because of symmetry we know that q 1 = q 2 = q*.
Hence we obtain , This gives us the solution .
*
*
2
c q q αβ-=-2()*3c q αβ-=问题:将寡头竞争的古诺均衡与垄断企业的最优产量和利润进行比较。
9.2.6 Bertrand Competition (伯特兰竞争)