博弈论第一章2
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 个人理性与集体理性的冲突,各人追求利己行 为而导致的最终结局是一个“纳什均衡”,也 是对所有人都不利的结局。 • 从“纳什均衡”引出“看不见的手” 的一个悖 论:从利己目的出发,结果损人不利己。“纳 什均衡”提出的悖论动摇了经济学的基石。 • 从“纳什均衡”还可以悟出:合作是有利的 “利己策略”,但它必须符合以下黄金律:按 照你愿意别人对你的方式来对别人,但只有他 们也按同样方式行事才行。也就是 “己所不欲 勿施于人”。
例2
左
中
4 ,0 0 ,4 3 ,5
右
5 ,3 5 ,3 6 ,6
上 0 ,4 中 4 ,0 下 3 ,5
对于参与者1,如果参与者2选择左,则参与者1 选择中(4>3>0), 此时参与者1的收益为4,在 4下面划一横线同理可以求出参与者2选择中, 右时,1的选择和收益.对于参与者2可用同样的 方法求解. 格子内数字都划线的对应的双方的 战略选择(下,右)即为博弈的纳什均衡解.
生活中的“囚徒困境”例子
例子1 商家价格战出售同类产品的商家 之间本来可以通过共同将价格维持在高位而 获利,但实际上却是相互杀价,结果都赚不 到钱。当一些商家共谋将价格抬高,消费者 实际上不用着急,因为商家联合维持高价的 垄断行为一般不会持久,可以等待垄断的自 身崩溃,价格就会掉下来。 譬如,2000年我国几家生产彩电的大厂 商合谋将彩电价格维持高位,他们搞了一个 “彩电厂家价格自律联盟”,并在深圳举行了 由多家彩电厂商首脑参加的“彩电厂商自律联
ui (s1 ,, si1 , si, si1 ,, sn ) ui (s1 ,, si1 , si, si1 ,, sn )
如果博弈论提供的战略组合解 (s1 , s2 ,, sn ) 不是纳什均衡的解, 则至少有一个参与者有动 因偏离理论的预测,使得博弈进行和理论预测 不一致. 和纳什均衡推导密切相关的是协议的理念.
如何呢? 设参与者i 的收益函数为: 3 ui (m n p) m n p , i 1, 2, 3. 3 其中,m, n, p分别为三个参与者放进机器里的 钱数. m为参与者i 放进机器里的钱数. 由 u i 可以看出,i 的最优选择是: 0 m 100 中的任意一个数.同理可分析另外两个参与者 的选择. 此时博弈有无数个纳什均衡. 当 N 4 时情况如何? 设参与者 i 的收益函数为: 3 N 3 3 m. ui ( m n p Q ) m ( n p Q ) N N N
ui=Di pi-Dic(i =1, 2)
注:设两家商店商品的单位成本相同为c. Di
N 3 m 0, 所以参与者i 的最优选择是 由于 N
到,大猪吃6个单位,小猪吃4个单位. 求此博弈的纳什均衡. 小猪 解 此博弈的收益矩阵: 按 等待 按 5,1 4,4 大猪 0,0 等待 9,-1
容易求出此博弈的纳什均衡为 (按,等待) 此纳什均衡显然是不合理的! 现实生活中的类似现象. 例如:股份公司中,股东承担着监督经理 的职能,但股东中有大股东和小股东之分,他 们从监督中得到的收益并不一样.
对于囚徒1来讲,如果囚徒2选择战略“沉默” 那么, 囚徒1选择“沉默”的收益为-1,选择“招认” 的收益为0, 当然选择“招认”.同理可得囚徒2的 战略选择也是“招认”. 因此,此博弈的纳什均衡 解为 (招认,招认). 此时双方的收益为 (-6, -6), 很明显(-1, -1)的收益好于(-6, -6). 但是纳什均衡 的结果是达不到的, 此所谓的“囚徒困境”. 这也正是博弈论的有趣之处,“囚徒困境” 纳什均衡的结果告诉我们一个很重要的结论: 个体理性和集体理性的矛盾, 每个个体都 追求个体收益最优, 其结果可能都达不到最优, 相反, 集体利益可能也受到损害.
s i 都成立,亦即 si是以下最优化 对所有S i中的
问题的解:
si Si maxui s1 , , si1 , si , si1 , , sn
如果 (s1 , s2 ,, sn ) 不是G 的纳什均衡,就意味着 存在一些参与人 i , s i 不是针对 (s1 ,, si1 , si1 ,, sn ) 的最优反应战略, 即在 Si 中存在 s 使得 i
性别战博弈
性别战博弈的传统表述(20世纪50年代开始使 用),一男一女试图安排一个晚上的娱乐活动内容, 不在同一地方工作的帕特和克里斯必须就去听歌剧 和看拳击选择其一,帕特和克里斯都希望两人能在 一起 度过一个夜晚,而不愿意分开,但帕特更希望看拳 击比赛,克里斯则希望在一起欣赏歌剧.
帕特
歌剧
歌 剧 克里斯 拳 击 2 , 1 0 1,
盟高峰会议”。当时,国家有关部门还未出台 相关的反垄断法律,对于这种在发达国家明显 属于违法行为的所谓“自律联盟”,国家在法律 上暂时还是无能为力的。寡头厂商在光天化日 之下进行价格合谋,并且还通过媒体大肆炒作, 这在发达国家是不可思议的。 但是,尽管政府当时无力制止这种事情, 公众也不必担心彩电价格会上涨。这是因为, “彩电厂商自律联盟”只不过是一种“囚徒困境”, 彩电价格不会上涨在高峰会议之后不到二周, 国内彩电价格不是上涨而是一路下跌。这是因 为厂商们都有这样一种心态:无论其他厂商是
其中, m, n, p, Q 分别为四个参与者放进机器里的钱数.
m为参与者i 放进机器里的钱数.
任何一个参与者都不放钱到机器里. 此时博弈 有唯一的纳什均衡: (0, 0, 0, 0) . 例7 “智猪博弈” 猪圈里有两头猪. 一头大猪,一头小猪, 猪圈一头有一个猪食槽,另一头安装一个按钮, 控制着猪食的供应. 按一下按钮会有10 个单位的猪食进槽,但谁按按钮谁需要付出 2个单位的的成本. 若大猪先到,大猪吃到9 个单位,小猪只能吃到1 个单位;若同时到 大猪吃7 个单位小猪吃 3 个单位;若小猪先
监督经理是要付出成本. 在监督成本相同的情况 大股东从监督中得到的收益显然大于小股东. 大股东类似于“大猪”,小股东类似于“小猪” 纳什均衡是,大股东担当起监督经理的责任, 小股东则搭大股东的便车. 股票市场上炒股票的大户和小户的关系, 市场上大企业和小企业的关系也是如此. 在公共产品的提供上也是如此. 例如,对 于某村庄修路问题上富人和穷人的关系.
如果我是其中的一个参与者,我会选择得到 50. 原因: 在该博弈的无穷个纳什均衡中(50, 50) 是比较公平的,容易被双方接受. (50, 50)这个均衡称为“聚点”均衡. 例6 考虑一个有N个人参加的游戏:每个人 可以放最多100 元钱到一部可以生钱的机器里, 机器把所有人放进去的钱的总和增加到原来的 3倍,然后再平均分给这 N 个人. 求此博弈的纳什均衡. 解:容易得出当N =1, 2时,此博弈有唯一的 的纳什均衡. N =2时双方都放进100元钱, 即 (100, 100)这个博弈的纳什均衡.当N =3 时情况
纳什均衡的思想是: 设想在博弈论预测的博弈结果中, 给每个参 与者选定各自的战略, 为使该预测是正确的,必须 使参与者自愿选择理论给它推导出的战略.这样, 每一个参与者要选择的战略必须是针对其他参与 者选择战略的最优反应, 这种理论推测的结果可以 叫做“战略稳定”或“自动实施”的, 因为没有参与者 这一状态称做纳什 愿意独自离弃他所选定的战略, 均衡(Nash Equilibrium).
拳击
,0 2
0
, 0源自文库
例3—性别战博弈 歌剧
歌 剧 克里斯 拳 击 2 , 1
帕特
拳击
0 1, ,0 2
0
, 0
易知此博弈有两个纳什均衡,(歌剧, 歌剧); (拳击, 拳击), 结果到底是那一个呢? 不得而知. 此为博弈解的多重性, 是纳什均衡的缺陷之一, 也是博弈论的一大难题.
例4—猜硬币博弈
正 面
否降价,我自己降价是有利于自己的市场份额 扩大的。 彩电价格战 企业乙 不降价 不降价 降价 0,0 降价 -100,80
企业甲
80,-100 -50,-50
• 例子2 为什么政府要负责修建公共设施,因 为私人没有积极性出资修建公共设施设想有两 户相居为邻的农家,十分需要有一条好路从居 住地通往公路。修一条路的成本为4,每个农 家从修好的好路上获得的好处为3。如果两户 居民共同出资联合修路,并平均分摊修路成本, 则每户居民获得净的好处(支付)为3-4/2=1; 当只有一户人家单独出资修路时,修路的居民 获得的支付为3-4=-1(亏损), “搭便车” 不出资但仍然可以使用修好的路的另一户人家 获得支付3-0=3,见表2。
表2 修 修 甲
修路博弈
乙
不修 1, 1 3, -1 -1, 3 0, 0
不修
我们看到,对甲和乙两家居民来说,“修路”都 是劣战略,因而他们都不会出资修路。这里,
为了解决这条新路的建设问题,需要政府强制 性地分别向每家征税2单位,然后投入4单位资 金修好这条对大家都有好处的路,并使两家居 民的生活水平都得到改善。这就是我们看到的 为什么大多数路、桥等公共设施都是由政府出资 修建的原因。 同样的道理,国防、教育、社会保障,环境 卫生等都由政府承担资金投入,私人一般没有积 极性承担这方面服务的积极性和能力。
定义:在n个参与者的标准式博弈
G S1, S2 ,, Sn ; u1, u2 ,, un
1 2 n
中,如果战略组合 (s , s ,, s )满足对每一个 参与者 i , si 是(至少不劣于)他针对其他n-1个 (s1 , si1,, si1 ,, sn ) 的最优 参与者所选战略 反应战略, 则称战略组合 ( s1 , s2 , , sn )是该博 弈的一个纳什均衡(纯战略).即: u i (s1 ,, si1 , si , si 1 , sn ) u i (s1 ,, si1 , si , si1 , sn )
豪泰林(Hotelling,1929)的价格竞争模型 在该模型中,产品在物质形态上无差异, 但在空间上处于不同的位臵. 标准式表述式 1、参与人:商店1与商店2. 他们分别位于 一线性城市的两端,出售同质的商品; 2、他们要决定的是各自商品的售价 pi, S i ={ pi : pi≥0}; 3、他们的支付函数就是利润函数:
如果参与者之间要商定一个协议决定博弈 如何进行, 那么一个有效的协议中的战略组合 必须是纳什均衡的略组合, 否则, 至少有一个参 与者不遵守协议. 为了更准确的理解这一概念, 看下面几个 例子: 例一 “囚徒困境” 囚徒2 沉默 招认 沉默 囚徒1 招认 -1,-1 0, -9 -9, 0 -6, -6
参与人2
正面
-1 , -1
反面
1 , -1
参与人1
反 1 , -1 -1 , 1 面 此博弈无纳什均衡(纯战略). 例5:博弈双方1和2就如何分100元钱进行 讨价还价.假设确定了以下规则:双方同时提 出自己的要求的数额S1和S2 , 0 s1 , s2 100 , 如果 s1 s2 100, 则博弈双方的要求都能得 到满足, 即分别得到S1和S2,但如果 s1 s2 100,则该笔钱就被没收. 求该博弈的纯战略
纳什均衡?若你是其中一个博弈方, 你会选择 什么数额, 为什么? 解 :参与者1的效用函数为 s1 当 s1 100 s2 u1 0 当 s1 100 s2 因此,参与者1的最优选择是 s1 100 s2 , 此为 1的最优反应函数.由对称性,2的最优反应函数 为 s2 100 s1. 由于, 双方的反应函数完全相同. 都满足方程 s1 s2 100, 该方程有无数解 , 所以该博弈有无数纳什均衡解 ( s1 , s2 ). 其中 s1 , s2 为 s1 s2 100 的解.