金融数学博弈论第一章4-1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
p1 j p2 k u1 ( s1 j , s2 k )
j 1 k 1 j 1 J K
k 1
J
K
(1. 3. 3)
如果参与者1的混合战略 P ( p , , p 1 11 1J ) 是对参与 者2的混合战略P2 的最优反应,则
p
j 1 k 1
J
K
K k 1 k 1
K
j 都成立. (因为当参与者1选择 s1 j时, 对S1中每一个 s1 )这表明,一个混合战略P1要成为P2 的最优反 p1 j 1 应,混合战略P1中每一个概率大于0的纯战略本身也必 须是对P2 的最优反应. Conversely, if player 1 has several pure stratregies that are best responses to P2 , then any mixed strategy that puts all its probability on some or all of pure stratregies best response(and zero probability on all other pure stratregies ) is also a best response player 1 to P2 . 反之,如果参与者1有一些纯战略都是P2 的最优应,那 么对于赋予这些或部分是最优反应的纯战略正的概率 (其它的纯战略0 概率)的混合战略一定也是参与者1 对P2的最优反应.(补证)
1· 3 理论发展:混合战略和均衡的存在性 1· 3· A 混合战略 纳什均衡不存在的例子 正面 反面
正面 反面
-1 ,1 1 ,-1
1 ,-1 -1 , 1
“猜硬币”博弈不存在纳什均衡. 猜硬币博弈一个非常突出的特点是 每个参与者都 试图能先猜中对方的战略. 在博弈中, 一旦每个参与者 都竭力猜测其他参与者的战略选择, 就不存在纳什均衡 (至少不存在第 1· 1· C 节所定义的所定义的纳什均衡),
l 1 k 1
l
l
m
K
m
K
l 1 k 1
所以,
p1 j p2 k u1 (s1 j , s2k ) p1 j p2 k u1 (s1 j , s2k )
j 1 k 1 j 1 k 1
J
K
J
K
所以混合战略 (0,, p1i1 , p1i 2 ,, p1im ,,0)是对P2 的最 优反应. 可以证明: 对于n个参与者的情形,以上结论也成立. 类似地可以得出参与者2在混合战略P1和P2下的期 K J 望收益. v2 ( P 1, P 2 ) p2 k [ p1 j u 2 ( s1 j , s2 k ) ]
混合战略 (1, 0) 表示参与者的一个纯战略,即选择正 面. 而混合战略 (1 3 , 2 3)表示以概率1/3选择正面,以 概率2/3选择反面. 一般地,假设参与者i有K个纯战略:Si {si1 ,, siK }, 则参与者i 的一个混合战略是一个概率分布 ( pi1 , piK ), 其中 pik 表示对所有k 1, 2, K , 参与者i 选择战略sik的概 率,且 pi1 piK 1, 0 pik 1, i 1, 2, K . 我们用 其中包含了参 pi 表示基于Si 的任意一个混合战略组合, 与者选择的每一个纯战略. 正如我们用si 表示Si 内任意 一个纯战略. 定义 对标准式博弈 G S1,, Sn ; u1,, un , 假设 Si {si1 ,, si K }, 那么参与者i 的一个混合战略为概率分 布 pi ( pi1 , piK ). 其中对所有 i 1, 2,, K , 0 pik 1,
参与者2
T 3,— 0,—
参与者1 M 0,— 3,—
B 2,— 2,—
图 1.3.2
类似于对图 1.3.1的分析,对图 1.3.2分析可以得出 一个给定的纯战略可能会严格优于一个混合战略, 即使 这个纯战略并不严格劣于其他任何一个纯战略. 1· 3· B 纳什均衡的存在性 参与者混合战略的使用,使得参与者的战略选择带 有不确定性, 因此参与者的收益必然也不确定. 纯战略情况下,参与者i 的收益ui 是纯战略组合的函
G S1 ,, Sn ; u1,, un
max
sS
(
sS j 1
n
j
( s j ))ui ( s )
对于所有的i =1, 2, …, n 以及所有的 s S 都成立.
两个参与者博弈混合战略下的纳什均衡. 假设参与者1和2的战略空间分别为 S1 {s11 ,, s1J } 和 S2 {s21 ,, s2 K }, 用 s1 j , s2 k 分别表示 S1 , S2 中的任意 一个纯战略. 如果参与者1推断参与者2将以 P2 ( p21 ,, p2 K ) 的 概率选择战略 (s21 ,, s2 K ), 则参与者1选择纯战略 s1 j 的期望收益为: K (1. 3. 2) p2 k u1 (s1 j , s2k )
k 1
j 1
p1 j p2 k u2 ( s1 j , s2 k )
k 1 j 1
k
J
类似于纯战略意义下纳什均衡, 定义:在两个参与者博弈 G S1 ,, Sn ; u1,, un 中,混和战略组合 P ( P 是一个纳什均衡的充 , P 1 2 ) 要条件为:每一个参与者的混合战略是另一个参与者 混合战略的最优反应. 即在参与者期望收益的意义下, v1 ( P , P ) v ( P , P (1. 3. 4) 1 2 1 1 2 ) 对S1中战略所有可能的概率分布P1 都成立. 并且 P2 必 须满足 v2 ( P (1. 3. 5) 1 , P 2 ) v2 ( P 1 , P 2 ) 对S2中战略所有可能的概率分布P2 都成立.
证明: 不妨假设参与者1有m个概率大于0 的纯战略 s1i1 , s1i 2 ,, s1im , m K 是对P2 的最优反应,且它们对应 的概率 p1il 0, l 1, 2,, m. 其它纯战略对应的概率为0, 则纯战略 s1i1 , s1i 2 , , s1im 形成的混合战略 (0,, p1i1 , p1i 2 ,, p1im ,,0) 一定是对P2 的最优反应.
因为这时参与者的最优行为是不确定的, 而博弈的结 果必然包含这种不确定性. 混合战略可以解释为 一个参与者对其他参与者行 为的不确定性. 规范的表述,参与者i 的一个混合战略是在其战略 空间Si 上的一些或全部战略的概率分布. 以后我们称Si 中的战略为参与者i 的纯战略. 对完全信息静态同时行动博弈来说, 一个参与者 的纯战略就是他可以选择的不同行动. 例如, 在猜硬币 分别为正面和反面,这时 博弈中Si 内含有两个纯战略, 参与者i 的一个混合战略为概率分布 (q , 1 q), 其中q为 出现正面的概率, 1-q为出现反面的概率,而且 例如, 0 q 1. 另外,混合战略也可以表示纯战略,
vi ( i , i ) ( j ( s j ))ui ( s)
sS j 1
n
其中 s (s1 , s2 ,, sn ), S 表示参与者i 的纯战略组合空 间, j ( s j ) 是参与者j 选择纯战略 s j 的概率. 定义:在n个参与者博弈的战略式表述
中,混和战略组合 ( 1 ,, i , n ) 是一个纳什均 衡. 如果对于所有的i =1, 2, …, n ,下式 vi ( i , i ) vi ( i , i ), i i 成立. i表示参与者i 的混合战略空间. 等价地, ( 1 ,, i , n ) 是下列最优化问题的解
且 pi1 piK 1. 混合战略的一个应用 前面讲到,如果战略si 为严格劣战略,那么参与者 i 的最优反应战略不会是 si . 如果引入混合战略,就可 以证明其逆命题:如果(针对其他参与者的战略选择)参 与者i 都不可能作出这样的推断,即其战略 s i 会成为最 优反应战略,则一定存在另一个战略严格优于 si . 参与者2 (证明的说明参见课本 25页脚注) T 3,— 0,—
k 1
且参与者1选择混合战略 P 1 ( p11 ,, p1J )的期望收益为:
p p u1 ( s1 j , s2 k ) ] v1 ( P 1, P 2 ) 1 j [ 2k
j 1
k 1
J
K
p p u1 ( s1 j , s2 k ) ] v1 ( P 1, P 2 ) 1 j [ 2k
k 1
l
K
il , s2 k ) p2 k u1 ( s1il , s2 k ) p1il p2 k u1 ( s1
k 1
K
k 1
由于除了l 1, 2,, m, 其它纯战略对应的概率 p1 j 0,
j il , l 1, 2,, m, 所以,
u ( s , s2 k ) p p p p 1 1 i u ( s , s ) 1 i 2 k 1 i 2 k l l 1 1i 2k
参与者1 M 0,— 3,—
B 1,— 1,—
图 1.3.1
图1.3.1显示出,一个给定的纯战略可能会严格劣 于一个混合战略, 即使这个纯战略并不严格劣于其他 任何一个纯战略. 对于参与者2的任何一个混合战略 ( , 1 ), 参与 者2选择L的概率为 , 选择R 的概率为1 . 可以断言: 参与者1的最优反应要么是T,要么是M,但不会 是B. 注意:此时参与者关心的是期望收益. 参与者1选 择T 的期望收益为 3 0 (1 ), 选择M 的期望收益为 0 3(1 ). 容易得出当 1 2 时,参与者1选择T ;当 1 2 时,参与者1选择M . 当 1 2时, 选择T,M无差异. 由此说明T 和M 的混合战略 严格优于纯战略 B.
数,混合战略情况下, 参与者i 的收益ui 是混合战略 组合的函数,也就是纯战略情况下期望收益. 假设博弈是有限的. 参与者i 在纯战略组合 s (s1 , s2 ,, sn ),i 1, 2, n, 其中 s j是参与者j 的纯战略, j 1, 2,n 下的收益函数为ui ,即 ui ui (s1 , s2 ,, sn ), 参与者i 在混合战略情况下的期望收益用 vi ( ) v( i , i ) 表示. 其中 (1,, 2 ,, n )表示 混合战略组合, k 是参与者k 的混合战略,k 1, 2,n i ( 1 ,, i 1 , i 1 , n ) 表示除i 之外的混合战略组 合,参与者i 期望收益可以定义为:
事实上, p2 k u1 ( s1i , s2 k ) p2 k u1 ( s1 il , s2 k ) l
k 1 k 1
K
K
对于 l 1, 2,, m 都成立,所以,
K
p1i
k 1
K
Fra Baidu bibliotek
il , s2 k ) p1il p2 k u1 ( s1il , s2 k ) p1il p2 k u1 ( s1
1j
p u1 ( s1 j , s2 k )
2k
j 1 k 1
J
K
p1 j p2 k u1 ( s1 j , s2 k )
对p1中每一个 p1 j 都成立. 特别地,对其中任何大于0 的 p1 j 相对应的纯战略 s1 j 必须满足:
u ( s , s ) p u ( s , s ) p 1 1 j 2 k 2 k 2k 1 1 j 2k
j 1 k 1 j 1 J K
k 1
J
K
(1. 3. 3)
如果参与者1的混合战略 P ( p , , p 1 11 1J ) 是对参与 者2的混合战略P2 的最优反应,则
p
j 1 k 1
J
K
K k 1 k 1
K
j 都成立. (因为当参与者1选择 s1 j时, 对S1中每一个 s1 )这表明,一个混合战略P1要成为P2 的最优反 p1 j 1 应,混合战略P1中每一个概率大于0的纯战略本身也必 须是对P2 的最优反应. Conversely, if player 1 has several pure stratregies that are best responses to P2 , then any mixed strategy that puts all its probability on some or all of pure stratregies best response(and zero probability on all other pure stratregies ) is also a best response player 1 to P2 . 反之,如果参与者1有一些纯战略都是P2 的最优应,那 么对于赋予这些或部分是最优反应的纯战略正的概率 (其它的纯战略0 概率)的混合战略一定也是参与者1 对P2的最优反应.(补证)
1· 3 理论发展:混合战略和均衡的存在性 1· 3· A 混合战略 纳什均衡不存在的例子 正面 反面
正面 反面
-1 ,1 1 ,-1
1 ,-1 -1 , 1
“猜硬币”博弈不存在纳什均衡. 猜硬币博弈一个非常突出的特点是 每个参与者都 试图能先猜中对方的战略. 在博弈中, 一旦每个参与者 都竭力猜测其他参与者的战略选择, 就不存在纳什均衡 (至少不存在第 1· 1· C 节所定义的所定义的纳什均衡),
l 1 k 1
l
l
m
K
m
K
l 1 k 1
所以,
p1 j p2 k u1 (s1 j , s2k ) p1 j p2 k u1 (s1 j , s2k )
j 1 k 1 j 1 k 1
J
K
J
K
所以混合战略 (0,, p1i1 , p1i 2 ,, p1im ,,0)是对P2 的最 优反应. 可以证明: 对于n个参与者的情形,以上结论也成立. 类似地可以得出参与者2在混合战略P1和P2下的期 K J 望收益. v2 ( P 1, P 2 ) p2 k [ p1 j u 2 ( s1 j , s2 k ) ]
混合战略 (1, 0) 表示参与者的一个纯战略,即选择正 面. 而混合战略 (1 3 , 2 3)表示以概率1/3选择正面,以 概率2/3选择反面. 一般地,假设参与者i有K个纯战略:Si {si1 ,, siK }, 则参与者i 的一个混合战略是一个概率分布 ( pi1 , piK ), 其中 pik 表示对所有k 1, 2, K , 参与者i 选择战略sik的概 率,且 pi1 piK 1, 0 pik 1, i 1, 2, K . 我们用 其中包含了参 pi 表示基于Si 的任意一个混合战略组合, 与者选择的每一个纯战略. 正如我们用si 表示Si 内任意 一个纯战略. 定义 对标准式博弈 G S1,, Sn ; u1,, un , 假设 Si {si1 ,, si K }, 那么参与者i 的一个混合战略为概率分 布 pi ( pi1 , piK ). 其中对所有 i 1, 2,, K , 0 pik 1,
参与者2
T 3,— 0,—
参与者1 M 0,— 3,—
B 2,— 2,—
图 1.3.2
类似于对图 1.3.1的分析,对图 1.3.2分析可以得出 一个给定的纯战略可能会严格优于一个混合战略, 即使 这个纯战略并不严格劣于其他任何一个纯战略. 1· 3· B 纳什均衡的存在性 参与者混合战略的使用,使得参与者的战略选择带 有不确定性, 因此参与者的收益必然也不确定. 纯战略情况下,参与者i 的收益ui 是纯战略组合的函
G S1 ,, Sn ; u1,, un
max
sS
(
sS j 1
n
j
( s j ))ui ( s )
对于所有的i =1, 2, …, n 以及所有的 s S 都成立.
两个参与者博弈混合战略下的纳什均衡. 假设参与者1和2的战略空间分别为 S1 {s11 ,, s1J } 和 S2 {s21 ,, s2 K }, 用 s1 j , s2 k 分别表示 S1 , S2 中的任意 一个纯战略. 如果参与者1推断参与者2将以 P2 ( p21 ,, p2 K ) 的 概率选择战略 (s21 ,, s2 K ), 则参与者1选择纯战略 s1 j 的期望收益为: K (1. 3. 2) p2 k u1 (s1 j , s2k )
k 1
j 1
p1 j p2 k u2 ( s1 j , s2 k )
k 1 j 1
k
J
类似于纯战略意义下纳什均衡, 定义:在两个参与者博弈 G S1 ,, Sn ; u1,, un 中,混和战略组合 P ( P 是一个纳什均衡的充 , P 1 2 ) 要条件为:每一个参与者的混合战略是另一个参与者 混合战略的最优反应. 即在参与者期望收益的意义下, v1 ( P , P ) v ( P , P (1. 3. 4) 1 2 1 1 2 ) 对S1中战略所有可能的概率分布P1 都成立. 并且 P2 必 须满足 v2 ( P (1. 3. 5) 1 , P 2 ) v2 ( P 1 , P 2 ) 对S2中战略所有可能的概率分布P2 都成立.
证明: 不妨假设参与者1有m个概率大于0 的纯战略 s1i1 , s1i 2 ,, s1im , m K 是对P2 的最优反应,且它们对应 的概率 p1il 0, l 1, 2,, m. 其它纯战略对应的概率为0, 则纯战略 s1i1 , s1i 2 , , s1im 形成的混合战略 (0,, p1i1 , p1i 2 ,, p1im ,,0) 一定是对P2 的最优反应.
因为这时参与者的最优行为是不确定的, 而博弈的结 果必然包含这种不确定性. 混合战略可以解释为 一个参与者对其他参与者行 为的不确定性. 规范的表述,参与者i 的一个混合战略是在其战略 空间Si 上的一些或全部战略的概率分布. 以后我们称Si 中的战略为参与者i 的纯战略. 对完全信息静态同时行动博弈来说, 一个参与者 的纯战略就是他可以选择的不同行动. 例如, 在猜硬币 分别为正面和反面,这时 博弈中Si 内含有两个纯战略, 参与者i 的一个混合战略为概率分布 (q , 1 q), 其中q为 出现正面的概率, 1-q为出现反面的概率,而且 例如, 0 q 1. 另外,混合战略也可以表示纯战略,
vi ( i , i ) ( j ( s j ))ui ( s)
sS j 1
n
其中 s (s1 , s2 ,, sn ), S 表示参与者i 的纯战略组合空 间, j ( s j ) 是参与者j 选择纯战略 s j 的概率. 定义:在n个参与者博弈的战略式表述
中,混和战略组合 ( 1 ,, i , n ) 是一个纳什均 衡. 如果对于所有的i =1, 2, …, n ,下式 vi ( i , i ) vi ( i , i ), i i 成立. i表示参与者i 的混合战略空间. 等价地, ( 1 ,, i , n ) 是下列最优化问题的解
且 pi1 piK 1. 混合战略的一个应用 前面讲到,如果战略si 为严格劣战略,那么参与者 i 的最优反应战略不会是 si . 如果引入混合战略,就可 以证明其逆命题:如果(针对其他参与者的战略选择)参 与者i 都不可能作出这样的推断,即其战略 s i 会成为最 优反应战略,则一定存在另一个战略严格优于 si . 参与者2 (证明的说明参见课本 25页脚注) T 3,— 0,—
k 1
且参与者1选择混合战略 P 1 ( p11 ,, p1J )的期望收益为:
p p u1 ( s1 j , s2 k ) ] v1 ( P 1, P 2 ) 1 j [ 2k
j 1
k 1
J
K
p p u1 ( s1 j , s2 k ) ] v1 ( P 1, P 2 ) 1 j [ 2k
k 1
l
K
il , s2 k ) p2 k u1 ( s1il , s2 k ) p1il p2 k u1 ( s1
k 1
K
k 1
由于除了l 1, 2,, m, 其它纯战略对应的概率 p1 j 0,
j il , l 1, 2,, m, 所以,
u ( s , s2 k ) p p p p 1 1 i u ( s , s ) 1 i 2 k 1 i 2 k l l 1 1i 2k
参与者1 M 0,— 3,—
B 1,— 1,—
图 1.3.1
图1.3.1显示出,一个给定的纯战略可能会严格劣 于一个混合战略, 即使这个纯战略并不严格劣于其他 任何一个纯战略. 对于参与者2的任何一个混合战略 ( , 1 ), 参与 者2选择L的概率为 , 选择R 的概率为1 . 可以断言: 参与者1的最优反应要么是T,要么是M,但不会 是B. 注意:此时参与者关心的是期望收益. 参与者1选 择T 的期望收益为 3 0 (1 ), 选择M 的期望收益为 0 3(1 ). 容易得出当 1 2 时,参与者1选择T ;当 1 2 时,参与者1选择M . 当 1 2时, 选择T,M无差异. 由此说明T 和M 的混合战略 严格优于纯战略 B.
数,混合战略情况下, 参与者i 的收益ui 是混合战略 组合的函数,也就是纯战略情况下期望收益. 假设博弈是有限的. 参与者i 在纯战略组合 s (s1 , s2 ,, sn ),i 1, 2, n, 其中 s j是参与者j 的纯战略, j 1, 2,n 下的收益函数为ui ,即 ui ui (s1 , s2 ,, sn ), 参与者i 在混合战略情况下的期望收益用 vi ( ) v( i , i ) 表示. 其中 (1,, 2 ,, n )表示 混合战略组合, k 是参与者k 的混合战略,k 1, 2,n i ( 1 ,, i 1 , i 1 , n ) 表示除i 之外的混合战略组 合,参与者i 期望收益可以定义为:
事实上, p2 k u1 ( s1i , s2 k ) p2 k u1 ( s1 il , s2 k ) l
k 1 k 1
K
K
对于 l 1, 2,, m 都成立,所以,
K
p1i
k 1
K
Fra Baidu bibliotek
il , s2 k ) p1il p2 k u1 ( s1il , s2 k ) p1il p2 k u1 ( s1
1j
p u1 ( s1 j , s2 k )
2k
j 1 k 1
J
K
p1 j p2 k u1 ( s1 j , s2 k )
对p1中每一个 p1 j 都成立. 特别地,对其中任何大于0 的 p1 j 相对应的纯战略 s1 j 必须满足:
u ( s , s ) p u ( s , s ) p 1 1 j 2 k 2 k 2k 1 1 j 2k