金融数学博弈论第一章3
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
s1 s2 100, 则该笔钱就被没收. 求该博弈的纳什
因为在该博弈的无穷个纳什均衡中,(50, 50)是比较 公平容易被双方接受的. (50, 50) 这个均衡称为“聚点”均衡. 例6 考虑一个有 N 个人参加的游戏:每个人可 以放最多100元钱到一部可以生钱的机器里, 机器 把所有人放进去的钱的总和增加到原来的3倍,然 后再平均分给这N 个人. 求此博弈的纳什均衡. 解:容易得出当N =1, 2 时,此博弈有唯一的纳什 均衡. 双方都放进100元钱, 即(100, 100)为纳什均衡. 当N =3时的情况如何? 参与者i 的收益函数为 3 ui (m n p) m n p . i 1,2,3 3
G S1,, Sn ; u1, un
G S1,, Sn ; u1,Βιβλιοθήκη Baiduun
且假设 ( s , s , , s 的一个纳什均衡, 1 2 n )被剔除掉了, 由重复剔除严格劣战略过程, 该战略组合中一定有 不妨假设第i个战略 si首先被 一个战略 首先被剔除, 剔除,则在第i个参与者的战略空间 S i 中一定存在 另一个尚未被剔除的战略 si 严格优于si .代如(DS) 公式,得到 (1· 1· 1)
什均衡的略组合, 否则至少有一个参与者不遵守协 议. 看下面几个例子: 囚徒2 例一 “囚徒困境” 沉默 招认
沉默 -1, -1 -9, 0
囚徒1
招认
0, -9
-6, -6
对于囚徒1来讲,如果囚徒2选择战略“沉默”, 那么,囚徒1选择“沉默”的收益为-1,选择“招认” 的收益为0, 当然选择“招认”.同理可得囚徒2的 略选择也是“招认”.因此,此博弈的纳什均衡解 战 (招认,招认). 此时双方的收益为 (-6, -6), 为
均衡,若你是其中一个博弈方, 你会选择什么数额, 为什么? 解 参与者1的效用函数为 s1 当 s1 100 s2 u1 0 当 s1 100 s2 因此,参与者1的最优选择是 s1 100 s2 , 此为1的 最优反应函数. 由对称性2的最优反应函数为 s2 100 s1.由于双方的反应函数完全相同,方程 s1 s2 100 有无数解,所以该博弈有无数个纳什 均衡解 ( s1 , s2 ). 其中 s1 , s2 为 s1 s2 100 的解. 如果我是其中的一个参与者,我会选择得到50 .
1· 2) ui ( s1 , si1, si , si1, sn ) ui ( s1 , si1, si, si1,, sn )(1·
但是(1· 1· 2)和公式(NE)显然是矛盾的. s 根据(NE), i 必须是针对( s1 ,, si1, si1,, sn ) 的最优 反应, 那么就不可能存在一个战略 si 严格优于 si . 这一矛盾证明了原命题成立. 下证命题1,在证命题2的过程中,实际上已证明 了1的一部分.所需证明的只是如果重复剔除严格 劣战略剔除了除(s1 , s2 ,, sn ) 之外的所有战略, 该战略组合是纳什均衡.由命题2任何其它纳什均衡 必定同样未被剔除,这已证明了在该博弈中均衡 的唯一性. 下面只需证明余下的战略组合是纳什均 衡即可. 为简单假设博弈G 是有限博弈. 用反证法
例3—性别战博弈 歌剧 歌 剧
克里斯 2 , 1
帕特
拳击
0 ,0
1, 2 0 , 0 拳 击 易知此博弈有两个纳什均衡,(歌剧, 歌剧); (拳击, 拳击)结果到底是那一个呢? 不得而知.此 为纳什均衡解的多重性,是纳什均衡的缺陷之一, 也是博弈论的一大难题.
例4 —猜硬币博弈 参与人2 正面 反面 正 面 -1 ,1 1 , -1 参与人1 反 1 ,-1 -1 , 1 面 此博弈无纳什均衡(纯战略). 例5 博弈双方1和2就如何分100元钱进行讨价 还价. 假设确定了以下规则: 双方同时提出自己的要求的数额 s1和 s2 , 0 s1 , s2 100, 如果 s1 s2 100 , 则博弈双方的 要求都能得到满足, 即分别得到 s1 和 s2 , 但如果
假设通过重复剔除严格劣战略剔除掉除 (s1 , s2 ,, sn ) 外的所有战略,该战略不是纳什均 衡,那么一定有某一参与者i ,在他的战略集中存 在 s i 使公式(NE)不成立,但同时 s i 又必须是在 剔除过程中某一阶段的严格劣战略. Si 中存在 s i 使得 上述两点的正规表述为:
左 上 0 ,4 例2 中 4 ,0 下 3 ,5
中 4 ,0
右 5 ,3
0 ,4 3 ,5
5 ,3 6 ,6
对于参与者1,如果参与者2选择左,则参与者1选择 中(4>3>0),此时参与者1的收益为4,在4下面划 一横线, 同理可以求出参与者2选择中、右时, 1的 选择和收益. 对于参与者2可用同样的方法求解. 格 子内数字都划线的对应的双方的战略组合(下,中) 即为博弈的纳什均衡解.
1 i 1 i i 1 n
并且在参与者i 的战略集中存在 s i ,在剔除过程中 的某一阶段有 ) 1· u i (s1, , si1, si , s i1, , s n ) u i (s1, si1, si, si1, , sn( 1· 4) 对所有其他参与者在该阶段剩余战略可能的战略 组合 (s1 ,, si , si 1 ,, sn ) 都成立. 由于其他参与
猪”,小股东类似于“小猪”. 纳什均衡是,大股东担当起监督经理的责任, 小股东则搭大股东的便车. 股票市场上炒股票的大户和小户的关系,市场 上大企业和小企业的关系也是如此.
两个重要的命题: 命题1 在n个参与者的标准式博弈
中,如果重复剔除严格劣战略剔除掉除( s1 , s2 , , sn ) 外的所有战略,那么这一战略组合为该博弈的唯一 纳什均衡. 命题2 在n个参与者的标准式博弈 中,如果战略组合( s1 , s2 , , sn )是一个纳什均衡, 那么它一定不会被重复剔除严格劣战略所剔除. 首证命题2 (反证法). 假设战略组合 证明: ( s1 , s2 ,, sn ) 是标准式博弈 G S1,, Sn ;u1,un
ui (s1,, si1, s , si1, , sn ) ui (s1,, si1, si, si1,, sn )
i
对每一个其他参与者尚未被剔除的战略空间中可能 形成的战略组合(s1 ,, si 1 , si 1 ,, sn ) 都成立. 由于 si 是纳什均衡战略 ( s1 , s2 , , sn )中第一个被剔除的战 略,以上纳什均衡战略组合中其它参与人的战略尚 未被剔除, 于是上面不等式的特例,下式成立.
1 由于 m 0 , 所以参与者i 的最优选择是: m =0. 4 所以任何一个参与者都不放钱到机器里.此时博弈 有唯一的纳什均衡: (0, 0, 0, 0). 例7 “智猪博弈” 猪圈里有两头猪. 一头大猪,一头小猪,猪 圈一头有一个猪食槽,另一头安装一个按钮控制 着猪食的供应. 按一下按钮会有10个单位的猪食 进槽,但谁按按钮谁需要付出2个单位的的成本. 若大猪先到,大猪吃到9个单位,小猪只能吃到1 个单位;若同时到,大猪吃7个单位,小猪吃3个单 位;若小猪先到,大猪吃6个单位,小猪吃4个单 位. 求此博弈的纳什均衡. 解 此博弈的收益矩阵:
其中m, n, p分别为三个参与者放进机器里的钱数, m为参与者i 放进机器里的钱数,n, p分别为其他 两个参与者放进机器里的钱数, 由 u i 可以看出, i 的最优选择是: 0 m 100. 中的任意一个数. 同理可分析另外两个参与者的 选择. 因此博弈有无数个纳什均衡. 当N=4时情况如何? 参与者 i 的收益函数为: 3 1 3 ui ( m n p Q ) m ( n p Q ) m . 4 4 4 其中m, n, p, Q 分别为四个参与者放进机器里的钱 数,m为参与者i 放进机器里的钱数,n, p, Q 分别 其他三个参与者放进机器里的钱数,
小猪 大猪 按 等待
按 5, 1
9,-1
等待 4, 4
0, 0
容易求出此博弈的纳什均衡为:(按,等待). 此 纳什均衡显然是不合理的. 现实中类似的现象. 例如:股份公司中,股东承担着监督经理的 职能,但股东中有大股东和小股东之分,他们从 监督中得到的收益并不一样,因监督经理是要有 成本的. 在监督成本相同的情况下,大股东从监督 中得到的收益显然小于小股东. 大股东类似于“大
定义:在n 个参与者的标准式博弈 G S1, S2 ,Sn ; u1, u2 ,, un 中,如果战略组合 (s1 , s2 ,, sn ) 满足对每一个参 与者i , si 是(至少不劣于)他针对其他(n-1)个参与 ( s , s , , s , , s 的最优反应战 者所选战略 1 i 1 i 1 n) ( s , s , , s 略,则称战略组合 1 2 n ) 是该博弈的一个 ( NE ) 纳什均衡(纯战略).即:
1· 3) ui (s , s , s , s , s ) ui (s , s , si , s , s )(1·
i 1
i 1
n
, si , s
, s
, s2 ,, sn ) 不是博弈 反之,如果战略组合 (s1 G 的纳什均衡,就意味着至少存在一个参与人 i, 参与人 i 的战略选择 s i 不是针对其他参与人战略选 ,, si1 , si1 ,, sn ) 的最优反应战略, 即在 择 (s1 Si中存在另外一个战略 si 使得
很明显(-1, -1) 的收益好于(-6, -6). 但纳什均衡 的结果是达不到的,此所谓的“囚徒困境”. 这也正是博弈论的有趣之处, “囚徒困境”纳什 均衡的结果告诉我们一个很重要的结论: 个体理性和集体理性的矛盾, 每个个体都追求个体收益最优, 其结果可能是 都达不到最优, 相反, 集体利益可能也受到损害. 注:亚当.斯密: 每个个体追求最优,结果集体最优. 纳什认为亚当. 斯密忽略了个体选择时的相互 影响.
u (s ,, s , si , s , sn ) u (s ,, s , si , s , sn )
max ui s , s
si Si
i 1
i 1
i 1
i 1
亦即 s 对所有S i中的 s i 都成立, 的解:
1
i 1
i 是以下最优化问题
i 1
则至少有一个参与者有动因偏 不是纳什均衡的解, 使得博弈进行和理论预测不一致. 离理论的预测, 和纳什均衡推导密切相关的是协议的理念: 如果参与者之间要商定一个协议决定博弈如何 进行, 那么一个有效的协议中的战略组合必须是纳
,, si1 , si, si1 ,, sn ) ui ( s1 ,, si1 , si, si1 ,, sn ) ui ( s1 , s2 ,, sn ) 如果博弈论提供的战略组合解 (s1
纳什均衡的思想
设想在博弈论预测的博弈结果中, 给每个参 与者选定各自的战略, 为使该预测是正确的,必须 使参与者自愿选择理论给它推导出的战略.这样, 每一个参与者要选择的战略必须是针对其他参与 者选择战略的最优反应, 这种理论推测的结果可以 叫做“战略稳定”或“自动实施”的 因为没有参与者 , 愿意独自离弃他所选定的战略, 这一状态称做纳 什均衡(Nash Equilibrium).