金融数学博弈论第一章3

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

s1 s2 100, 则该笔钱就被没收. 求该博弈的纳什
因为在该博弈的无穷个纳什均衡中,(50, 50)是比较公平容易被双方接受的. (50, 50) 这个均衡称为“聚点”均衡. 例6 考虑一个有 N 个人参加的游戏:每个人可以放最多100元钱到一部可以生钱的机器里, 机器把所有人放进去的钱的总和增加到原来的3倍，然后再平均分给这N 个人. 求此博弈的纳什均衡. 解:容易得出当N =1, 2 时,此博弈有唯一的纳什均衡. 双方都放进100元钱, 即(100, 100)为纳什均衡. 当N =3时的情况如何? 参与者i 的收益函数为 3 ui (m n p) m n p . i 1,2,3 3
G S1,, Sn ; u1, un
G S1,, Sn ; u1,Βιβλιοθήκη Baiduun
且假设 ( s , s , , s 的一个纳什均衡, 1 2 n )被剔除掉了，由重复剔除严格劣战略过程，该战略组合中一定有不妨假设第i个战略 si首先被一个战略首先被剔除，剔除，则在第i个参与者的战略空间 S i 中一定存在另一个尚未被剔除的战略 si 严格优于si .代如(DS) 公式，得到（1· 1· 1）
什均衡的略组合，否则至少有一个参与者不遵守协议. 看下面几个例子：囚徒2 例一 “囚徒困境” 沉默招认
沉默 -1， -1 -9， 0
囚徒1
招认
0， -9
-6， -6
对于囚徒1来讲，如果囚徒2选择战略“沉默”, 那么，囚徒1选择“沉默”的收益为-1,选择“招认” 的收益为0, 当然选择“招认”.同理可得囚徒2的略选择也是“招认”.因此，此博弈的纳什均衡解战 (招认，招认). 此时双方的收益为 (-6, -6), 为
均衡,若你是其中一个博弈方, 你会选择什么数额, 为什么？解参与者1的效用函数为 s1 当 s1 100 s2 u1 0 当 s1 100 s2 因此,参与者1的最优选择是 s1 100 s2 , 此为1的最优反应函数. 由对称性2的最优反应函数为 s2 100 s1.由于双方的反应函数完全相同，方程 s1 s2 100 有无数解，所以该博弈有无数个纳什均衡解 ( s1 , s2 ). 其中 s1 , s2 为 s1 s2 100 的解. 如果我是其中的一个参与者,我会选择得到50 .
1· 2） ui ( s1 , si1, si , si1, sn ) ui ( s1 , si1, si, si1,, sn )（1·
但是（1· 1· 2）和公式（NE）显然是矛盾的. s 根据(NE), i 必须是针对( s1 ,, si1, si1,, sn ) 的最优反应, 那么就不可能存在一个战略 si 严格优于 si . 这一矛盾证明了原命题成立. 下证命题1,在证命题2的过程中,实际上已证明了1的一部分.所需证明的只是如果重复剔除严格劣战略剔除了除(s1 , s2 ,, sn ) 之外的所有战略，该战略组合是纳什均衡.由命题2任何其它纳什均衡必定同样未被剔除，这已证明了在该博弈中均衡的唯一性. 下面只需证明余下的战略组合是纳什均衡即可. 为简单假设博弈G 是有限博弈. 用反证法
例3—性别战博弈歌剧歌剧
克里斯 2 , 1
帕特
拳击
0 ,0
1， 2 0 , 0 拳击易知此博弈有两个纳什均衡,(歌剧, 歌剧); （拳击, 拳击)结果到底是那一个呢? 不得而知.此为纳什均衡解的多重性，是纳什均衡的缺陷之一, 也是博弈论的一大难题.
例4 —猜硬币博弈参与人2 正面反面正面 -1 ，1 1 ， -1 参与人1 反 1 ，-1 -1 ， 1 面此博弈无纳什均衡（纯战略）. 例5 博弈双方1和2就如何分100元钱进行讨价还价. 假设确定了以下规则：双方同时提出自己的要求的数额 s1和 s2 , 0 s1 , s2 100, 如果 s1 s2 100 , 则博弈双方的要求都能得到满足, 即分别得到 s1 和 s2 , 但如果
假设通过重复剔除严格劣战略剔除掉除 (s1 , s2 ,, sn ) 外的所有战略，该战略不是纳什均衡，那么一定有某一参与者i ,在他的战略集中存在 s i 使公式（NE）不成立，但同时 s i 又必须是在剔除过程中某一阶段的严格劣战略. Si 中存在 s i 使得上述两点的正规表述为：
左上 0 ，4 例2 中 4 ，0 下 3 ，5
中 4 ，0
右 5 ，3
0 ，4 3 ，5
5 ，3 6 ，6
对于参与者1,如果参与者2选择左,则参与者1选择中(4＞3＞0),此时参与者1的收益为4,在4下面划一横线, 同理可以求出参与者2选择中、右时, 1的选择和收益. 对于参与者2可用同样的方法求解. 格子内数字都划线的对应的双方的战略组合(下，中) 即为博弈的纳什均衡解.
1 i 1 i i 1 n
并且在参与者i 的战略集中存在 s i ,在剔除过程中的某一阶段有 ) 1· u i (s1, , si1, si , s i1, , s n ) u i (s1, si1, si, si1, , sn（ 1· 4）对所有其他参与者在该阶段剩余战略可能的战略组合 (s1 ,, si , si 1 ,, sn ) 都成立. 由于其他参与
猪”，小股东类似于“小猪”. 纳什均衡是，大股东担当起监督经理的责任，小股东则搭大股东的便车. 股票市场上炒股票的大户和小户的关系，市场上大企业和小企业的关系也是如此.
两个重要的命题：命题1 在n个参与者的标准式博弈
中,如果重复剔除严格劣战略剔除掉除( s1 , s2 , , sn ) 外的所有战略，那么这一战略组合为该博弈的唯一纳什均衡. 命题2 在n个参与者的标准式博弈中，如果战略组合( s1 , s2 , , sn )是一个纳什均衡，那么它一定不会被重复剔除严格劣战略所剔除. 首证命题2 (反证法). 假设战略组合证明： ( s1 , s2 ,, sn ) 是标准式博弈 G S1,, Sn ;u1,un
ui (s1,, si1, s , si1, , sn ) ui (s1,, si1, si, si1,, sn )
i
对每一个其他参与者尚未被剔除的战略空间中可能形成的战略组合(s1 ,, si 1 , si 1 ,, sn ) 都成立. 由于 si 是纳什均衡战略 ( s1 , s2 , , sn )中第一个被剔除的战略，以上纳什均衡战略组合中其它参与人的战略尚未被剔除，于是上面不等式的特例，下式成立.
1 由于 m 0 , 所以参与者i 的最优选择是: m =0. 4 所以任何一个参与者都不放钱到机器里.此时博弈有唯一的纳什均衡: (0, 0, 0, 0). 例7 “智猪博弈” 猪圈里有两头猪. 一头大猪，一头小猪，猪圈一头有一个猪食槽，另一头安装一个按钮控制着猪食的供应. 按一下按钮会有10个单位的猪食进槽，但谁按按钮谁需要付出2个单位的的成本. 若大猪先到，大猪吃到9个单位，小猪只能吃到1 个单位；若同时到，大猪吃7个单位,小猪吃3个单位；若小猪先到，大猪吃6个单位，小猪吃4个单位. 求此博弈的纳什均衡. 解此博弈的收益矩阵：
其中m, n, p分别为三个参与者放进机器里的钱数， m为参与者i 放进机器里的钱数，n, p分别为其他两个参与者放进机器里的钱数，由 u i 可以看出, i 的最优选择是: 0 m 100. 中的任意一个数. 同理可分析另外两个参与者的选择. 因此博弈有无数个纳什均衡. 当N=4时情况如何? 参与者 i 的收益函数为: 3 1 3 ui ( m n p Q ) m ( n p Q ) m . 4 4 4 其中m, n, p, Q 分别为四个参与者放进机器里的钱数，m为参与者i 放进机器里的钱数，n, p, Q 分别其他三个参与者放进机器里的钱数，
小猪大猪按等待
按 5， 1
9，-1
等待 4， 4
0， 0
容易求出此博弈的纳什均衡为:（按，等待）. 此纳什均衡显然是不合理的. 现实中类似的现象. 例如：股份公司中，股东承担着监督经理的职能，但股东中有大股东和小股东之分，他们从监督中得到的收益并不一样，因监督经理是要有成本的. 在监督成本相同的情况下，大股东从监督中得到的收益显然小于小股东. 大股东类似于“大
定义:在n 个参与者的标准式博弈 G S1, S2 ,Sn ; u1, u2 ,, un 中,如果战略组合 (s1 , s2 ,, sn ) 满足对每一个参与者i , si 是(至少不劣于)他针对其他(n-1)个参与 ( s , s , , s , , s 的最优反应战者所选战略 1 i 1 i 1 n) ( s , s , , s 略，则称战略组合 1 2 n ) 是该博弈的一个 ( NE ) 纳什均衡(纯战略).即：
1· 3） ui (s , s , s , s , s ) ui (s , s , si , s , s )（1·
i 1
i 1
n

, si , s
, s

, s2 ,, sn ) 不是博弈反之，如果战略组合 (s1 G 的纳什均衡，就意味着至少存在一个参与人 i，参与人 i 的战略选择 s i 不是针对其他参与人战略选 ,, si1 , si1 ,, sn ) 的最优反应战略, 即在择 (s1 Si中存在另外一个战略 si 使得
很明显(-1, -1) 的收益好于(-6, -6). 但纳什均衡的结果是达不到的，此所谓的“囚徒困境”. 这也正是博弈论的有趣之处, “囚徒困境”纳什均衡的结果告诉我们一个很重要的结论: 个体理性和集体理性的矛盾, 每个个体都追求个体收益最优, 其结果可能是都达不到最优, 相反, 集体利益可能也受到损害. 注:亚当.斯密: 每个个体追求最优,结果集体最优. 纳什认为亚当. 斯密忽略了个体选择时的相互影响.
u (s ,, s , si , s , sn ) u (s ,, s , si , s , sn )
max ui s , s
si Si
i 1
i 1

i 1

i 1
亦即 s 对所有S i中的 s i 都成立，的解：

1
i 1
i 是以下最优化问题
i 1
则至少有一个参与者有动因偏不是纳什均衡的解，使得博弈进行和理论预测不一致. 离理论的预测，和纳什均衡推导密切相关的是协议的理念：如果参与者之间要商定一个协议决定博弈如何进行，那么一个有效的协议中的战略组合必须是纳
,, si1 , si, si1 ,, sn ) ui ( s1 ,, si1 , si, si1 ,, sn ) ui ( s1 , s2 ,, sn ) 如果博弈论提供的战略组合解 (s1
纳什均衡的思想
设想在博弈论预测的博弈结果中, 给每个参与者选定各自的战略, 为使该预测是正确的,必须使参与者自愿选择理论给它推导出的战略.这样, 每一个参与者要选择的战略必须是针对其他参与者选择战略的最优反应, 这种理论推测的结果可以叫做“战略稳定”或“自动实施”的因为没有参与者 , 愿意独自离弃他所选定的战略, 这一状态称做纳什均衡（Nash Equilibrium）.