金融博弈论第一章2
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定义:在n 个参与者的标准式博弈 G S1, S2 ,Sn ; u1, u2 ,, un 中,如果战略组合 (s1 , s2 ,, sn ) 满足对每一个参 与者i , si 是(至少不劣于)他针对其他(n-1)个参与 ( s , s , , s , , s 的最优反应战 者所选战略 1 i 1 i 1 n) ( s , s , , s 略,则称战略组合 1 2 n ) 是该博弈的一个 ( NE ) 纳什均衡(纯战略).即:
Байду номын сангаас
例3—性别战博弈 歌剧 歌 剧
克里斯 2 , 1
帕特
拳击
0 ,0
1, 2 0 , 0 拳 击 易知此博弈有两个纳什均衡,(歌剧, 歌剧); (拳击, 拳击)结果到底是那一个呢? 不得而知.此 为纳什均衡解的多重性,是纳什均衡的缺陷之一, 也是博弈论的一大难题.
例4 —猜硬币博弈 参与人2 正面 反面 正 面 -1 ,1 1 , -1 参与人1 反 1 ,-1 -1 , 1 面 此博弈无纳什均衡(纯战略). 例5 博弈双方1和2就如何分100元钱进行讨价 还价. 假设确定了以下规则: 双方同时提出自己的要求的数额 s1和 s2 , 0 s1 , s2 100, 如果 s1 s2 100 , 则博弈双方的 要求都能得到满足, 即分别得到 s1 和 s2 , 但如果
亦即 s 对所有S i中的 s i 都成立,
u (s ,, s , si , s , sn ) u (s ,, s , si , s , sn )
max ui s1 , si1 , si , si1 , sn si Si
i 1
i 1
i 1
i 1
max ui s , s
si Si
1
i 1
, si , s
i 1
, s
n
s
s
s ,
这样就会得到n 个等式或方程, 2. 解以上n 个方程联立的方程组, 3. 如果以上方程组有解, 即得纳什均衡解.
, s2 ,, sn ) 不是博弈 反之,如果战略组合 (s1 G 的纳什均衡,就意味着至少存在一个参与人 i, 参与人 i 的战略选择 s i 不是针对其他参与人战略选 ,, si1 , si1 ,, sn ) 的最优反应战略, 即在 择 (s1 Si中存在另外一个战略 si 使得
在两个数字中放在前面,列代表的参与者2 的收益 放在后面 . 一般情况下,博弈的标准式包括 : (1)博弈的参与者, (2)每一参与者的战略集 , (3)针对所有参与者可能选择的战略组合, 每一个参与者获得的收益. 一般来讲, 我们只考虑n 个参与者的博弈,其 中参与者从1到n 排序, 设其中任一参与者的序号 为i , 令Si 代表参与者i 可以选择的战略集合(称为 i 的战略空间),其中任意一个特定的战略用si 表示 ( 有时写成 si Si 表示战略si 是战略集Si中的要素)
博弈论经典例子
--------“囚徒困境” 两个犯罪嫌疑人被捕并受到指控,但除非 至少一个人招人犯罪,警方并无充足证据将其 按罪判刑. 警方把他们关入不同的牢室,并对他 们说明不同行动带来的后果. 如果两个人都不坦 白,将均被判为轻度犯罪,入狱一个月;如果 两人都坦白招认,都将被判入狱6个月;最后, 如果一人招认而另一人拒不坦白,招认的一方 将马上获释,而另一人将判入狱9个月.
ui ui (s1 , s2 ,, sn ) ui (si , si )
1· 1· B 重复剔除严格劣战略 定义在标准式的博弈 G S1, S2 ,Sn ; u1, u2 ,un 中,令 si 和 si 代表参与者 i的两个可行战略,如果 对其他参与者每一个可能的战略组合, 参与者i 选择 s i 的收益都小于其选择 si的收益, 则称战略 si 相对于si是严格劣战略,或者si 相对与 si是严 格占优战略,即:
则至少有一个参与者有动因偏 不是纳什均衡的解, 使得博弈进行和理论预测不一致. 离理论的预测, 和纳什均衡推导密切相关的是协议的理念: 如果参与者之间要商定一个协议决定博弈如何 进行, 那么一个有效的协议中的战略组合必须是纳
,, si1 , si, si1 ,, sn ) ui ( s1 ,, si1 , si, si1 ,, sn ) ui ( s1 , s2 ,, sn ) 如果博弈论提供的战略组合解 (s1
什均衡的略组合, 否则至少有一个参与者不遵守协 议. 看下面几个例子: 囚徒2 例一 “囚徒困境” 沉默 招认
沉默 -1, -1 -9, 0
囚徒1
招认
0, -9
-6, -6
对于囚徒1来讲,如果囚徒2选择战略“沉默”, 那么,囚徒1选择“沉默”的收益为-1,选择“招认” 的收益为0, 当然选择“招认”.同理可得囚徒2的 略选择也是“招认”.因此,此博弈的纳什均衡解 战 (招认,招认). 此时双方的收益为 (-6, -6), 为
令( s1 , s 2 , s n )表示每个参与者选定一个战略 后形成的战略组合.所有战略组合构成战略组合空 间,表示为 S S1 S2 Sn . ui 表示第i个参与者选 择战略si 时,i 的收益函数,即
定义 在一个n 人博弈的标准表达式中,参与者 的战略空间为 S1, S2 Sn , 收益函数为 u1 , u2 , , un , 我们用 G S1, S2 ,Sn ; u1, u2 ,, un 表示此博弈. 注意: 参与者同时选择战略(行动)并不意味着 各方行动必须是同时的, 只要每一个参与者在选 择行动时没有信息交流即可. 参与者永远是理性的! 博弈模型已经构建,我们的任务是 如何预知 博弈的结果(?) , 换言之,如何寻找博弈的解.
与者2不会选择右的. 那么如果参与人1 知道参与 人2是理性的,他就可以把右从参与人2的战略空 间中剔除掉,即如果参与人1知道参与人2是理性 的,他就可以把图1.1.1所示博弈视同为图1· 1· 2所 示的博弈: 参与人2 左 上 1, 0 下 0, 3 中 1, 2 0, 1
参与人1
图1· 1· 2
在图1· 1· 2中,对于参与人1来讲,下就成了上的严 格劣战略,于是如果参与人1是理性的,(并且参与 人1知道参与人2是理性的,这样才能把原博弈化
为图1.1.2所示的博弈),参与人1就可以把下从参 与人1的战略空间中剔除,余下图1· 1· 3所示博弈. 但这时对参与人2, 左又成为中的严格劣战略,参 与人2可以剔除左,得博弈的解为 (上,中). 参与人2 左 中 1, 2 参与人1 上 1,0
左 上 0 ,4 例2 中 4 ,0 下 3 ,5
中 4 ,0
右 5 ,3
0 ,4 3 ,5
5 ,3 6 ,6
对于参与者1,如果参与者2选择左,则参与者1选择 中(4>3>0),此时参与者1的收益为4,在4下面划 一横线, 同理可以求出参与者2选择中、右时, 1的 选择和收益. 对于参与者2可用同样的方法求解. 格 子内数字都划线的对应的双方的战略组合(下,中) 即为博弈的纳什均衡解.
此博弈就不能用以上方法求解. 由此引出纳 什均衡的概念. 纳什均衡概念是博弈理论的基石! 它为博弈理论提供了分析框架. 它的思想是: 设想在博弈论预测的博弈结果中, 给每个参与 者选定各自的战略, 为使该预测是正确的,必须使 参与者自愿选择理论给它推导出的战略. 这样每一 个参与者要选择的战略必须是针对其他参与者选择 战略的最优反应, 这种理论推测的结果可以叫做 “战略稳定”或“自动实施”的 , 因为没有参与者愿意 独自离弃他所选定的战略, 这一状态称做纳什均衡 (Nash Equilibrium).
i 是以下最优化问题
i 1
i 1
的解:
关于纳什均衡解求解方法的说明: 纳什均衡(纯战略)的定义提供好了求解纳什 均衡的思路: 1. 假如最优化问题
对每一个参与者i 都有最大值点 i i 1, 2, , n, 则 i 为其他参与者选定战略的函数,即 i si ( s1 , s2 , si 1 , si 1 , , sn ), i 1, 2, , n,
1.1· A 博弈的标准式表述 经典例子;“囚徒困境”(prisoner,s dilemma) 囚徒2 沉默 招认 沉默 囚徒1 招认 0 -9 -1 -1 -9 0
-6
-6
在此博弈中,每个囚徒有两个可供选择的战略: 坦白, 沉默. 在一组特定的战略被选定后,两人的收益由上表 中的数字给出,习惯上横行代表的参与者1的收益
图1· 1· 3
上面的过程可称为“重复剔除严格劣战略”. 注意此过程建立在理性参与者不会选择严格劣 战略的原则之上,但它仍有两个缺陷: 第一 每一步剔除都需要参与者间相互了解的
更进一步假设,如果我们要把这一过程应用到任 意多步就需要假定“参与者是理性”是共同知识. 这意味着,我们不仅需要假定所有参与人是理性 的还要假定所有参与人都知道所有参与人是理性 的如此等等,以至无穷. 第二 对博弈预测的结果经常是不精确的. 或者此方法根本不能使用. 例如: 左 中 右 上 0,4 4,0 5,3 中 4, 0 0, 4 5, 3 下 3, 5 3, 5 6, 6
很明显(-1, -1) 的收益好于(-6, -6). 但纳什均衡 的结果是达不到的,此所谓的“囚徒困境”. 这也正是博弈论的有趣之处, “囚徒困境”纳什 均衡的结果告诉我们一个很重要的结论: 个体理性和集体理性的矛盾, 每个个体都追求个体收益最优, 其结果可能是 都达不到最优, 相反, 集体利益可能也受到损害. 注:亚当.斯密: 每个个体追求最优,结果集体最优. 纳什认为亚当. 斯密忽略了个体选择时的相互 影响.
ui (s1 , s2 , si 1 , si, si 1 , sn ) ui (s1 , s2 , si 1 , si, si 1 , sn ) ( DS )
对其他参与者在其战略空间S1 ,, Si 1 , Si 1 ,, Sn中的 每一组可能的战略组合(s1,si 1, si 1,sn )都成立. 理由:理性的参与者不可能选择严格劣战略,
第1章 完全信息静态博弈
( Static Games of Complete Information )
第1章 完全信息静态博弈
一个博弈由三部分构成 : 参与者 ,参与者的 战略(空间),参与者的收益构成. 参与者的战略空间是参与者可选择的战略(行 动)构成的集合. 参与者的收益是参与者在博弈中的 得益. 完全信息是指: 所有参与者的收益函数是每个 参与者的“共同知识 ”. 静态博弈 是指所有参与者同时选择行动或战 略. 同时:(彼此没有信息交流). 假设每个参与者选 择且仅选择一次战略(行动). 参与者是理性的. 参与者是理性的是指参与者 总是追求收益最大(参与者唯一的目标).
下面再看一个二人博弈的例子: 参与人 2 左 中 右
上 1 ,0 参与人1 下 0 ,3
1 ,2 0 ,1
图1.1.1
0 ,1 2 ,0
参与人1有两个可选战略,参与人2 有三个 可选战略 S1={上,下},S2={左, 中,右}, 如果2选择左,上优于下(1大于0),但如果2 选择右,下就会优于上(因为2>0). 但对参与人2 来讲,右严格劣于中(2>1且1>0),因此理性的参
用重复剔除严格劣战略方法解决 “囚徒困境” “囚徒困境”(prisoner,s dilemma) 囚徒2 沉默 招认 沉默 囚徒1 招认 0 -9 -1 -1 -9 0
-6
-6
不难验证,在囚徒困境中,对每一个参与者, 沉默和招认相比是 严格劣战略. 因此每一个囚徒都 会选择招认. 故“囚徒困境”博弈的重复剔除严格劣 战略解是(招认,招认).