产业经济学2(s)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Chapter 2: Basic Concept in Noncooperative Game Theory
Game 分合作的Game 与非合作的Game 。

本课程所用的Game 理论限于非合作的Game 。

Game 有两种表达方式。

一种是标准形式的Game (normal form game ),另一种是扩展形式的Game (extensive form game )。

信息问题:信息对于博弈是重要的。

有完备信息的博弈(Perfect Information Game )与不完备信息的博弈(Imperfect Information Game )。

2.1 Normal Form Games
2.1.1 Definition of Game(定义)
定义:标准形式的Game 描述如下:
1、 N 个博弈者(player ),表示为集合I={1,2,…,N}。

2、 每个博弈者i, I i ∈有一行动集(Action set )A i ,A i 是博弈者i 的所有行动的可能集合。

令i i A a ∈表示i 所采取的特定的行动。

因此博弈者i 的行动集
},...,,{21k i i i i a a a A =,其中,k 是i 所有可能行动的数目。

令a a a a a i n ≡(,,...,,...,)12为一组由每一位博弈者i 所选择的行动。

我们称之为该Game 的一个结果(Outcome )。

3、每一位博弈者i 有一个支付函数πi 。

对于该Game 的每一结果,该函数取一实数值πi a ()*。

简单表示为:
a a a a a i n ≡(,,...,,...,)12
),...,,...,{11n n s s G ππ= ,
标准型game 定义可用下面的例子说明。

第一,N=2,
}
,...,;,...,{11n n A A G ππ=
第二,},{21war peace A A ==,该game 有四个结果(P ,P ),(P ,W ),(W ,P ),(W ,W )。

第三,支付矩阵中带数字的四个方格表示四种结果下每个博弈者的支付。

若结果为),(w p a =,则2),()(11-==war peace a ππ
2.1.2 均衡的概念(equilibrium concepts)
有的game 存在唯一均衡解。

有的game 存在多个均衡解。

有的game 不存在均衡解。

为了简化讨论。

我们将博弈的一种结果表示为a a a i i =-(,)
其中),...,,,...(111n i i i a a a a a +--≡
1优势行动中的均衡(equilibrium in dominant actions)。

1、优势行动(策略)与优势行动(策略)均衡
(1)优势行动(策略)
优势行动(策略)的定义:如果无论其他所有博弈者采取什么行动(策略),
博弈者i 总是由于采取行动i a ~(策略i s ~)而获得最大得分,则行动A a i
∈~(策略S s i ∈~)是博弈者i 的优势行动(dominant action )(优势策略dominant strategy)
可以将优势行动(策略)进一步划分为严格优势行动(策略)与弱优势行动(策略)。

(2)严格优势行动(策略)与弱优势行动(策略)
严格优势行动(策略)。

定义如下:对于所有的A a a i i ∈-),((S s s i i ∈-),(),且i i a a ≠*(i i s s ≠*),如果),(),(i i i i i i a a a a --*>ππ(),(),(i i i i i i s s s s --*>ππ)成立,那么,博弈者i 的行动*i a (策略*i s )是严格优势行动(策略)。

上表中,war a =1是1的严格优势行动。

证明如下。

),(21),(11war peace war war ππ=->-==
),(23),(11peace peace peace war ππ=>==
同样,war a =2是2的严格优势行动。

弱优势行动(策略)。

定义如下:对于所有的i i A a --∈(i i S s --∈),如果),(),(i i i i i i a a a a --*≥ππ(),(),(i i i i i i s s s s --*≥ππ),并且至少一个严格的不等式成立,
那么,博弈者i 的行动*i a (策略*i s )弱优于他的其他行动i a (策略i s )。

*i a (策略*i s )是i 的弱优势行动(策略)。

例如下表2—3中,u 是博弈者1的弱优势策略,
l 是博弈者2的弱优势策略。

表2—3 弱优势策略
(3)严格劣势行动(策略)与弱劣势行动(策略)
对于所有的A a a i i ∈-),((S s s i i ∈-),(),且i i a a ≠(i i s s ≠),如果),(),(i i i i i i a a a a -->ππ(),(),(i i i i i i s s s s -->ππ)成立,那么,博弈者i 的行动i a (策略i s )是严格劣势行动(策略)。

在表2—2中,peace 对于两个国家而言都是严格的劣势行动。

如果),(),(i i i i i i a a a a --≥ππ(),(),(i i i i i i s s s s --≥ππ),其中至少一个严格的不等式成立,那么,博弈者i 的行动i a (策略i s )是弱劣势行动(策略)。

通过删除劣势策略或者删除弱劣势策略,而保持优势策略或者弱优势策略,可以达到优势策略均衡。

(4)优势行动均衡
定义:An outcome (~,~,...,~)a a a N
12is said to be an equilibrium in dominant action for each player i if i a ~ is a dominant action for each player i .) 如果i
a ~是博弈者i 的优势行动,则结果)~,...,~,~(21n a a a 是一个优势行动均衡(其中,对于任意的n i ,...,2,1=,~a A i i
∈)。

显然(,)(,)a a war war 1
2=是一个优势行动均衡。

许多game 不存在优势策略均衡。

例如下列的battle of the sex game 不存在优势行动均衡。

2、纳什均衡(Nash Equilibrium )(NE )
定义:结果)ˆ,...,ˆ(ˆ1N i a a a
=(其中,对于每一个N i ,...,2,1=,i i A a ∈ˆ)称为纳什均衡,如果假定在所有其他人不背离其纳什结果的策略条件下,没有任何人可以通过背离纳什结果而获益。

正规表述如下:对于每个N i i ,...,2,1,=,
for every player i i=1,2,…,N,
)ˆ,()ˆ,ˆ(i i i i i i a a a a
--≥ππ,for every i i A a ∈。

用Best response function 解NE 。

2.1.3 福利比较
定义:
(1), 如果a ˆ是一个纳什均衡结果,则结果a
ˆ帕累托优于结果a (a ˆ Pareto dominates the outcome a ),若
(a),对于任一 i , )()ˆ(a a
i i ππ≥, 且 (b), 存在至少一个博弈者j ,对于j 而言, )()ˆ(a a
j j ππ> (2), 结果*
a 称为帕累托有效(Pareto efficient )(也称为帕累托最优(Pareto optimal )) ,如果不存在任何其它帕累托优于结果*a 的结果(An outcome *a is called Pareto
efficient(also called Pareto optimal) if there dose not exist any outcome which Pareto dominates the outcome *a ) (3), 结果a
~和结果a 称为帕累托非可比(Pareto noncomparable ),如果对于某些博弈者i , )~()(a a i i ππ>;但是对于另外一些博弈者j, )()~(a a j j ππ>。

)()~(a a j
j ππ>。

2.2 Extensive Form Game
EFG 可以描述不同时间决策的Game 。

考虑下列Game 。

πP P P P 2
πH =-1 πH =1 πH =-1 πH =0
Definition: An extensive form game is: (定义:扩展形式的game 定义如下:)
(1)、该种game 包含一个始结点(starting node ),其他决策结点(decision nodes ),终结点,以及连接每个决策结点与相继结点的支线(branches )。

(2)、N 个博弈者,表示为N i ,...,2,1=。

(3)、在每个决策结点,位于该结点上的博弈者选择决策行动。

(4)、对于每个博弈者i ,在其必须要作决策的每个结点上,i 有一组特定的行动集。

(5)、每个终结点,每个博弈者有一个特定的支付。

2.2.1 EFG 中的策略与结果。

Defining strategies and outcomes in extensive form game.
strategy(关于策略的定义。

)
A strategy is a complete plan of actions, one action for each decision node that the player is entitled to choose an action.
博弈者i 的一个策略(表示为i s )是i 的一组完整的行动计划,其中,一个行动对应着该博弈者须要选择其行动的每个决策结点。

重要的是要明白:一个策略不是某博弈者在位于某单个特定结点上的所为,而是当该博弈者必须选择其行动时,该博弈者在每个结点上的所为。

2..2.2 A normal form representation for extensive form game(EFG 的NFG 表示。

)
2.2.3 Subgame and subgame perfect equilibrium (SPE).
定义:subgame 是产生于原game 的一个决策结点,以及在该结点之后并与该结点紧密相连的其他决策结点和终结点。

若某个subgame 不同于原game ,则称之为proper subgame (恰当子博弈)。

在飞行员与劫机者game 中,有三个subgame 。

一个是原game 自身。

另外两个是proper subgame 。

πp p
πH =-1 πH =1
π
p p
π
H =-1π
H
=0
定义(SPE):A Nash equilibrium is subgame-perfect if the player’s strategy constitutes a Nash equilibrium in every subgame.(若博弈者的策略在每个subgame都构成一个纳什均衡,则称该纳什均衡为subgame perfect equilibrium(SPE)。

)(Selten,1965)。

或者:若某一结果导致原game下每个subgame的一个纳什均衡,则称这一结果为subgame perfect equilibrium(SPE)。

上述定义表明,SPE是这样一组策略(每个博弈者一个策略),该组策略由在每一subgame都构成一个NE 的博弈者行动所组成。

特别的,SPE 必须是原game 的一个NE 。

因为game 是其自身的一个subgame。

寻找SPE的方法。

使用后向归纳法(backward induction)。

也可以将EFG表示成NFG形式,找出所有的NE,在从中选择SPE。

2.3 重复博弈(Repeated Game )
重复博弈是一次博弈(one shot game )的多次重复。

重复博弈是某种特定“种类”的扩展形式的博弈。

该博弈中,每一期每个博弈者同时行动。

每个博弈者都观察到了前期所有博弈者的行动。

在和平与战争一例中,假定game 重复T 次,假定T 为有限的正整数。

假定每个博弈者的时间的贴现因子(time discount parameter )为ρ,01<<ρ。

令a i t 表示博弈者i 在t 期所采取的行动,i t T ==1212,,
,,...,。

令πi t t t a a (,)12为t 期对i 的支付。

其中,πi t 由前面的表给出。

因此,当game 重复了T 次以后,i 的支付为:

+++==∏-=-∑〈T if a a a a a a a a T T T i T i i t t t i T t t i ),(),(),(),(21122212121112111πρ
ρπππρ 或 ∞=++==∏∑=-T a a a a a a i i t t t i T t t i if ),(),(),(22212121112111 ρπππρ
2.3.1.有限期重复的game (finitely repeated game )
假定和平与战争的game 重复有限次。

在一次性game 中,(war war )是唯一NE 。

对于任何有限的、整数期的game 而言,重复T 期的和平-战争game 具有唯一的SPE ,即每一国家每一期都是选择战争。

(war ,war )是SPE 。

证:使用backward induction ,假定已经进行了T-1期的game ,并打算进行T 期的game 由于T 期是最后一期,因此(W ,W )是一个NE 。

再考虑T-1期的game ,由于考虑T 期战争是最优行动,本期战争也是优势策略。

…直至到第一期。

2.3.2.无限期重复game (infinitely repeated game )
假定∞=T 。

无限期重复的Game 与有限期重复的game 的区别在于,前者不可以利用backward induction 的方法,因为不存在可以开始backward induction 过程的最后时期。

Trigger strategy :在Trigger strategy 中,只要所有的博弈者在1-τ期是合作的,那么,博弈者i 在t 期就采取合作策略。

但是,如果任一博弈者在1-τ是不合作的,那么,博弈者i 从τ期开始并且将永远采取不合作策略。

定义(Trigger strategy ):博弈者i 被称为采取Trigger strategy ,如果对任一期,...,2,1,=ττ
⎪⎩
⎪⎨⎧====1-1,..., t all for peace as long as peace otherwise.war i a ττt j a t i a
2.4 混合行动的博弈(Games with Mixed Actions )
混合行动的博弈是这样一种博弈,博弈者在其可能的行动集中随机地选取行动。

我们知道上述game 不存在纯策略的NE 。

是否存在混合策略的NE ?
假定有X 、Y 两种类型的博弈者。

每一个博弈者有两种策略可供选择。

X 可供选择的行动集是s s 12,。

Y 可供选择的行动集是t t 12,。

定义:
1、 博弈者X 的混合行动是在选择a s x =1行动与选择a s x =2行动之间的一种概率分布。

正规地讲,博弈者X 的混合行动是一种概率α,(01≤≤α),博弈者采取s 1行动的概率是α,采取s 2行动的概率是1-α。

博弈者Y 的混合行动是一种概率β,(01≤≤β),博弈者采取t 1行动的概率是β,采取t 2行动的概率是1-β。

2、 混合行动博弈的行动组合(action profile )是一组(α,β),即由每个博弈者所选择的一组混合行动。

3、 混合行动博弈的结果是一组实现了的由每个博弈者所采取的行动。

上述定义中引进了新的概念“行动组合”(action profile ),用此取代了NFG 中的结果。

之所以如此,是因为在混合行动的game 中,博弈者选择的仅仅是采取其策略的概率。

因此结果本身也取决于所选策略的概率。

在纯行动的game 中,action profile 一词与outcome 一词是指同样的事,因为不存在不确定性。

但在混合行动的game 中,action profile 一词用于描述一组由博弈者选择的行动的概率分布。

而结果一词是特指在概率分布确定性后,由博弈者采取的一组行动。

定义(Payoff ):混合行动博弈中博弈者的支付函数是该博弈在纯策略下博弈者支付的期望值。

正规表示如下:对于任意给定的行动组合(α,β),博弈者i (i X Y =,)的期望支付由下式给出。

E s t s t s t s t i i i i i παβαβπαβπαβπαβπ(,)(,)()(,)()(,)()()(,)
≡+-+-+--111221221111定义(NE ):一行动组合( α
, β)(其中[] , ,αβ∈01)称为混合行动中的一个纳什均衡,如果给定在其他博弈者不背离其混合行动情况下,没有任何博弈者会通过背离自己的混合行动而获益。

正规表示如下:
)ˆ,()ˆ,ˆ(βαπβαπx
x E E ≥ 对于任意的[]α∈01, ),ˆ()ˆ,ˆ(βαπβαπy
y E E ≥ 对于任意的[]β∈01,
求解下列game混合行动的均衡。

Best response:
2.5 不完全、不完备信息条件下的博弈
(Games with incomplete information or imperfect information)
完全信息的静态Game 用标准形式来表示,用dominant strategy, NE mixed strategy NE 求解,完全、完备信息下的动态博弈利用Backword induction 求均衡解 SPE ,任何一种博弈既可以用标准形式表示,也可以用扩展形式表示。

回忆一下完全信息条件下的静态game(Static Game with Complete Information) 完全信息是指所有博弈者对于其他博弈者的支付是确知的(common knowledge)
在完全信息条件下的静态game 可以简单表示为:
NE: N-player NFG ),...,,...,{11n n s s G ππ= 中,策略),...,(1n s s ∧∧为NE ,
如果对任意i 和任意可行策略i i S in s , )ˆ()ˆ,ˆ(_,i i i i i i s s s s
ππ≥- 即∧
i s 是问题)ˆ,(max i i i S s s s i i -∈π的解。

不完全信息与不完备信息的博弈
Eric Rasmusen, "In a game of perfect information each information set is a singleton. Otherwise the game is one of imperfect information". Game and information, p45, second edition, Blackwell, 1998.
"In a game of incomplete information, Nature moves first and is unobserved by at least one of the players. Otherwise the game is one of complete information.", ibid., p47.
Tirole, “当一个博弈者不知道其他参与者事先采取什么行动时,他的信息是不完备的;当一个博弈者不知道其对手的精确特征(偏好、策略空间)时,他的信息是不完全的。


2.5.1不完全信息条件下的静态博弈(Static Game with incomplete information)
从支付的角度讲,不完全信息是指至少有一个博弈者对于博弈对手的支付是不确知的(uncertain),例如,两寡头博弈者中一方对另一方的利润不确知,不完全信息博弈也称为Bayesian Game
(1) 静态不完全信息Game 的标准型表达方式
每个博弈者只知道自己的支付函数,但不知道其他博弈者的支付函数
}
,...,;,...,{11n n S S G ππ=,...,;,...,{11n
n A A G ππ=
令i 可能的支付函数表示为),,...,(1i n i k a a π
其中i k 称为博弈者i 的类型(i’s type), 属于i 的类型集(Type Set)K , 每一个i k 对应i 可能获得的一个不同的支付函数
假定i 有两种类型 21,i i k k
则i 的类型集为},{21i i i k k k =
i 的两个支付函数为)
;,...();,...(2111i n i i n i k a a k a a ππ i 有两组可行行动,一组可行行动是{a,b,c},其概率是P, 另一组可行行动是{a,b,c,d},其概率是1-P
于是我们说i 有两种类型(two types)),(21i i k k ,其中1i k 的概率是P, 2i k 的概率是1-P i 可行的行动集为{a,b,c,d}包含了i 两种类型的可行行动, 对于类型1i k , 其采取行动d 获得的支付为-∝
给出博弈者类型(type )的定义后,我们知道,当我们说i 知道自己的支付函数的时候,等同于说i 知道自己的类型;
同理,我们说i 不能确知其他博弈者的支付函数,等同于说i 不能够确知其他博弈者的类型;其他博弈者的类型表示为:),...,,,...,(111n i i i k k k k k +--=, 我们用i K -表示所有i k -可能值的集合
用)/(i i i k k -μ表示在给定i 关于自己本人类型i k 条件下对于其他博弈者类型i k -的信念的概率分布。

博弈者的类型往往是独立的,此种情况下)()/(i i i i k k k --=μμ
但是有时两者相关(correlated), 例如, 一家企业发明成功会导致他认为另一家企业也会成功。

N 个博弈者静态bayesian Game 的标准形式表达式表示为:
},...,;,...,;,...,;,...,{1111n n n n K K A A G ππμμ= 。

这一标准表达式设定了博弈者的行动集},...,{1n A A 、其类型集},...,{1n K K 、其信念集},...,{1n μμ 、其支付函数集},...,{1n ππ。

博弈者i 的类型i k 只有i 自己知道,它是类型集i K 的一个元素,并且决定i 的支付函数 ),,...,(1i n i k a a π。

在给定i 自己类型条件下,i 的信念)/(i i i k k -μ刻画i 对n-1个其他博弈者可能类型的不确知性。

Harsanyi(1967)“Game with incomplete information played by Bayesian player parts Ⅰ、Ⅱand Ⅲ”描述了Bayesian Game 的时径(timing)
①Nature 设定 (draws)类型向量( type vector )),...,(1n k k k =,其中i i K k ∈ ②Nature 向i 而不向其他博弈者揭示(reveal) i k
③博弈者同时采取行动i i i A a a ∈,
④),,...,{1i n i k a a π为i 支付。

①、②步骤的引进使不完全信息变为不完备信息(在轮到i 行动时不了解博弈者的全部历史)
两点重要说明:
第一、有些Game 中,博弈者不仅依赖自己的行动与类型,也依赖于别人的类型,此种
情况下支付表示为),...,;,...,{1n i n i k k a a π;
第二、关于)/(i i i k k -μ。

我们假定,在Bayesian Game 时径中的步骤1,Nature 按照prior
distribution 先验的概率分布)(k μ设定类型向量),...,(1n k k k =
,这是一个常识(common knowledge )当Nature 将i k 揭示给i,i 可以使用Bayes ’ rule 计算信念)/(i i i k k -μ,∑--∈----==i i K k i
i i i i i i i i i i i i k k k k k k k k k ),(),()
(),()/(μμμμμ 其他博弈者也可以计算i 信念 )/(i i i k k -μ
尽管我们经常假定)(i i k -μ不依赖于i ,但我们仍然从先验分布)(k μ导出)(i k -μ,此种情况下,我们说其他博弈者知道i 有关他们类型的信念。

(2)Bayesian Game 中的策略
定义:在静态Bayesian Game },...,;,...,;,...,;,...,{1111n n n n K K A A G ππμμ=中,i 的策略是一个函数 )(i i k s ,其中,对于每个类型 i k 属于i K ,)(i i k s 特指类型i k 将从可行集合i A 中选择的行动,i k 由Nature 设定
与完全信息的Game 不同,在 Bayesian Game 中,策略集没有在 Game 的标准形式表述中给出。

在静态 Bayesian Game 中策略集在类型与行动的基础上构建;i 的可能(纯)策略集i s 是具有定义域(domain)i K 与值域(range)i A 的所有可能的函数集。

例如:在一个Separating strategy 中,i K 中的每个从i A 中选择一个不同的行动i a ,在相反Pooling strategy 中,所有类型选择同样的行动。

(3) Bayesian Nash Equilibrium (BNE)
定义:在静态Bayesian Game },...,;,...,;,...,;,...,{1111n n n n K K A A G ππμμ= 中,策略),...,(1∧
∧∧=n s s s 为一个(纯策略)的Bayesian Nash Equilibrium ,若对于每个player i 以及对于i K 中的每个i 的类型(types)i k , )(i i k s ∧是下列问题的解。

)/());(),...,(,),(),...,((11111
1i i i n n i i i i i K k i A a k k k k s k s a k s k s i
i i i Max -∧
++∧--∧∈∧∈∑-∏μ ))/();(),...,(),(ˆ),(),...,((11111
1i i i n n i i i i i i K k i k k k k s k s k s k s k s i i -∧++∧--∧∈∧∑-∏μ )/());(),...,(,),(),...,((11111;1i i i n n i i i i i K k A a i k k k k s k s a k s k s i i i -∧
++∧--∧∈∈∧∑-∏≥
μ 也就是说,即使变化仅包括一个类型的一种行动,也没有任何博弈者想改变其策略。

2.5.2不完全信息下的混合策略(Bayesian Game )的应用
Harsany(1973)年曾指出,j 的混合策略表明i 对于j 选择的不确知性.
更形象地说,混合策略的Nash equilibrium 不是j 随机地选择策略,而是i 对j 的选择不确知。

这种不确知性,可能是由于随机性,但更可能是由于不完全信息,例如,在第一个性别大战中,混合策略的NE 是李小姐以1/3的可能性看球赛,张先生有3/4的可能性看球赛。

原Game 为:
该Game 有三个NE,两个Pure,一个Mixed, Mixed 为α=1/3,β=3/4
βααβαββααββαβαβααβπ333433333)1)(1(0)1(0)1(1--+=+--+=⨯--+⨯-+⨯-+⨯=L E
310134303413121
)1)(1(0)1(0)1(2⇒=⇒=-=∂∂⇒=⇒=-=∂∂--+=+--+=⨯--+⨯-+⨯-+⨯=ααβπββα
πβ
ααβαββααββαβαβααβπZ L Z E
假定信息不完全Game 为:
李小姐与张先生对于对方的支付不完全确知。

当双方都看球赛时,张的支付为z k +2其中z k 为张的私人信息。

当双方都看电影时,李小姐的支付为l k +3,l k 为李小姐私人信息。

z k 与l k 都是[0,x]区间的均匀分布(uniform distribution)。

均匀分布的假定并不重要,z k ,l k 只是原Game 支付的微小扰动,因此,x 取值范围很小。

所有其他支付相同。

用抽象的标准型的Bayesian Static Game 讲
},;,;;,{,z l z l z l z l K K A A G ∏∏=μμ行动集},{F B A A z l == , 类型集],0[x K K z l ∈=, 信念为x k k l z z l /1)()(==μμ 对所有l k ,z k ,支付矩阵为:
由于l k z k 为[0,x]的均匀分布,所以 x k p k P z l /1)()(==。

我们看当不确定性消除时,即x →0时, L 与Z 的均衡策略,结果与混合策略的均衡相同。

2.5.3 不完备信息下的博弈(Game with imperfect information)
(1)不完备信息:
定义:在扩展型Game中,若其中一个信息集包括两个或两个以上的结点(node), 则称之为不完备信息的Game。

若每个信息集只包括单一的结点,则称之为完备信息的博弈。

信息集(information set)
某博弈者的一个信息集是该博弈者必须采取行动的决策点的集成体(collection)。

当一个博弈者到达一个信息集时,该博弈者知道自己已经到达某一特定的信息集,但如果该信息集包含一个以上的结点,该博弈者不知道自己到达了该信息集的哪一个结点。

例:Pilot与Hijacker例中
π
P P P P
2
π
H =-1π
H
=1π
H
=-1π
H
=0
1有一个信息集singleton
2有一个信息集,有两个nodes
(D,NB)为NE(SPE)
Strategy:在不完备信息博弈中,博弈者的一个策略是在该博弈者必须决策的一个信息集上,他所选择的一组行动。

注意,与完备信息博弈不同的是在每一个信息集上,而不是在每一决策点上,决策者的一组行动。

因为完备信息下的信息集是一个单元素集(Singleton)
关于Subgame:
定义:扩展式Game中的一个Subgame是这样一种Game
①该Subgame从一个决策结点n开始,该决策结点是一个单元素信息集
(singleton information set)
②包括了随n之后决策树中所有决策点(decision nodes)与终点terminal
nodes),但不包括不随n之后的结点
③该Subgame不与其他信息集相交(do not cut any information sets)(即若决
策结点n’是随n后的Game tree, 则所有包含n’的信息集的其他结点也必须与n相随,因此必须包含在该Subgame中。

proper Subgame定义与前面相同。

可以看到上述Pilot与Hijacker Game中没有proper Subgame
例:下列Game中,
该Game中只有一个proper Subgame:即从3的决策点开始(该决策是随1选择R,2选择R’以后开始
结果:outcome
在Pilot-Hijacker Game中,结果是4个而不是原来的8个,即(F,B), (F,NB), (D,B), (D,NB),(因为Hijacker只在一个信息集上决策)
解的概念:
由于该Game没有proper Subgame 因此任何NE也是SPE。

因此NE与SPE一致了。

可以知道(D,NB) 为NE(SPE)
(2)、完备贝叶斯均衡(perfect Bayesian equilibrium)
这里用继续博弈(continuation game)观念替换子博弈观念。

根据子博弈观念,子博弈开始于单元素结点信息集,而根据继续博弈观念,博弈可以开始于任意一个完全的信息集。

这里仿照定义子博弈完备均衡的做法,如果博弈者的策略是完备贝叶斯均衡,那么这些策略不仅对于整个博弈是一个贝叶斯均衡,而且在每一个继续博弈中也必须是一个贝叶斯均衡。

完备贝叶斯均衡的几个条件。

条件1:在每个信息集,轮到其行动的博弈者拥有一个信念,该信念表示他到达该信息集的哪个结点。

对于非单结点信息集,一个信念是该信息集上各结点的概率分布。

对于单结点信息集,博弈者的信念是在该单结点的概率是1。

条件2:给定其信念,博弈者的策略必须是连贯理性的。

即在每一个信息集,在给定此信息集上该博弈者信念以及其他博弈者随后策略的条件下,轮到其行动的该博弈者所所采取的行动(以及该博弈者随后的策略)必须是最优的(其中,“随后策略”是在给定信息集已经达到以后,包括各种可能出现的情况下的一组完整的行动计划)。

条件3:在均衡路径上的信息集,信念由贝叶斯规则和均衡策略决定。

条件4:不在均衡路径上的信息集,信念由贝叶斯规则和博弈者可能的均衡策略决定。

完备贝叶斯均衡由满足以上4个条件的策略和信念决定。

条件5:如果可能,不在均衡路径上的每一个博弈者的信念应该赋予具有以下特征的那些结点以零的概率:这些结点只有在其他博弈者采取一种在某些信息集的开始严格处于劣势的策略情况下才能达到。

(If possible, each player’s beliefs off the equilibrium path should place zero probability on nodes that are reached only if another player plays a strategy that is strictly dominated at some information set.)
定义(在均衡路径上的信息集与不在均衡化路径上的信息集):对于给定的扩展形式的Game 中给定的均衡,在均衡路径上的信息集是指,如果Game 按照均衡策略进
行,将会以正的概率达到该信息集。

可以确定不会达到该信息集。

如果Game 按照均衡策略进行。

可以确定不会达到该信息集,则该信息集不再均衡路径上。

(其中均衡可以指NE, SPE, BNE, PBE )。

(3)、连贯均衡(Sequential Equilibrium)
SPE 必须在Game 的所有部分是一个NE ,包括不在博弈路径上的部分(off the path of play )
以上的例子中,博弈可以到达每个博弈者的信息集,有些博弈则不能达到。

但是作为SPE ,必须在博弈的每一个部分都是一个NE 。

该Game 其中两个NE 是:D-a-L ,A-a-R.
我们需用新的概念对 NE 作进一步的改进(Refinement )
Sequential Equilibrium :
定义:连贯均衡是这样一种策略组合(Strategy Profile ) w 和一系列信念μ(a system of belief),这种策略组合与信念相互一致,并且在每一信息集上满足连贯理性(sequential rationality)
这里涉及几个概念:Strategy profile 、 belief 、 consistent 、 sequential rationality
strategy profile (从行为策略角度考虑):为每一个信息集设定了i 可能行动的概率分布。

用w 表示典型的策略集,i w 表示i 的策略组合
),...,(1n w w w =
belief: 用μ表示:信念为Game 中的每一信息集h 设定了结点(nodes)t ∈h 的概率分布;解释为,给定i 已达到信息集h ,这些信念是player i 关于自己位于其信息集何处的信念。

μ是t 的函数。

对于任意的 h ∈H 1)(=∑∈h
t t μ
概略地讲,Sequential Equilibrium 是一策略组合w 与信念μ,它使得从Game tree 的每一信息集h 开始,在给定先前已发生过的事(由μ(h )给定)与随后属于其他player 的结点上将要发生的事(由w 给定)的条件下,player i(i=i(h))从此将进行最优博弈(plays optimally )。

该条件称为 Sequential Rationality 。

Sequential Rationality :在每个信息集h ,在给定 player i 信念μ以及在随 h 之后的结点上所有其他players 选择策略的条件下,i 进行了理性选择。

Bayes consistency:
对任意的h 以及 t ∈h, )(Pr /)(Pr )(h ob t ob t w w =μ。

相关文档
最新文档