博弈论 第六章市场合作博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•
托马斯.谢林(1921-)
• • • • • • 主要著作包括: 《冲突的战略》(1960年) 《战略与军控》(与摩尔顿· H· 哈尔佩林合著,1961年) 《武器的影响力》(1966年) 《微观动机与宏观行为》(1978年)。 《承诺的战略及其他文论》 (2006年)。
• 在其经典著作《冲突的战略》(1960年出版)一书中,谢林首次 定义并阐明了威慑、强制性威胁与承诺、战略移动等概念开始把 关于博弈论的洞察力作为一个统一的分析框架来研究社会科学问 题,并对讨价还价和冲突管理理论作了非常细致的分析。 • 他发表了涉及许多领域的研究成果,包括军事战略和军备控制、 能源和环境政策、气候变化、恐怖主义、团体犯罪、外交援助和 国际贸易、冲突和讨价还价理论、种族隔离和种族融合、军事计 划、健康政策、烟草制品和毒品走私政策以及与公共事务和公共 政策相关的伦理学问题等。
• 试验一:初步实验 • 第一轮游戏有14个程序参加,再加上艾克斯罗德自 己的一个随机程序(即以50%的概率选取合作或不合 作),运转了300次。结果得分最高的程序是加拿大 学者罗伯布写的"一报还一报"(tit for tat)。这个程 序的特点是,第一次对局采用合作的策略,以后每 一步都跟随对方上一步的策略,你上一次合作,我 这一次就合作,你上一次不合作,我这一次就不合 作。艾克斯罗德还发现,得分排在前面的程序有三 个特点: • 第一,从不首先背叛,即"善良的"; • 第二,对于对方的背叛行为一定要报复,不能总是 合作,即" 可激怒的"; • 第三,不能人家一次背叛,你就没完没了的报复, 以后人家只要改为合作,你也要合作,即"宽容性"。
ห้องสมุดไป่ตู้
★若你接受他的建议的话,可以说你是不理智的,
你作了一个错误的决策。因为你的地位并不是 看起来那么好,实际上你也是很有优势的,所 以你应该拒绝他的报价,让游戏继续下去,五 五分成可能是最后的结果。
附加值概念——合作博弈游戏
★现在你也许明白了,通过等待,你可以用你手 中的红牌换得50美元,A教授是得不到任何好 处的。这场游戏实际上可以分解成26个单独的 谈判,因为每个个人的谈判不影响任何别人的 谈判。这样,为了完成每一个谈判,A教授和 学生的地位是对等的。 ★假如现在A教授的黑牌丢失了3张,现在游戏的 总价值已经变为2300美元,那么A教授和他的 学生的谈判结果又将是什么样呢? ★ 如果A教授原意出20美元向你要求交换你的红 牌,你如何决策呢?是同意还是不同意呢?
★由于有3个学生什么都得不到得预期,
附加值概念——合作博弈游戏
★ 认清楚每个游戏当中谁拥有主动权的关
键就在于如何确定每个参与者的“附加值”。
★ 附加值用来测量每个参与者给游戏所带
来的价值增加量,其定义是这样的:首先确定 你和其它参与者在整个活动中的市场整体价值 是多少,然后测定没有你参与其中的时候,整 个市场价值是多少,两者之差就是你的附加值。 你的附加值
《艾克斯罗德游戏》讨论(三)
你觉得这个游戏困难的地方在哪里? 在整个游戏过程中,你们团结吗? 你们是怎么解决意见冲突的? 在这个游戏中,你觉得信任与合作 是怎样的?与现实中的状况相比怎 么样? 要想真的双赢困难吗?
《艾克斯罗德游戏》介绍(一)
美国科学院院士、著名的行为分析 和国际关系专家罗伯特.艾克斯罗 德搞了一场关于重复“囚犯困境” 的游戏。 目的是研究无限次的对局游戏中: 人为什么要合作? 人什么时候是合作的,什么时候又 是不合作? 如何使别人与你合作?
《艾克斯罗德游戏》介绍(二)
在《艾克斯罗德游戏》开始之前,
他设定了两个前提: 每个人都是自私的; 没有权威干预个人决策。也就是说, 个人可以完全按照自己利益最大化 的企图进行决策。
《艾克斯罗德游戏》介绍(三)
艾克斯罗德位邀请了来自经济界、
心理学、社会学、政治学和数学领 域的14位专家参与这一游戏。 每个参与者每一步都要写出个体选 择合作与不合作的程序。
愿地进行谈判。假定你是这26人中的一员,如 果A教授愿意出20美元向你要求交换你的红牌, 你如何决策呢?是同意还是不同意呢?
附加值概念——合作博弈游戏
★通常认为:A教授具有绝对的优势和力量,没
有任何学生可以和他抗衡;从学生的角度看, 他拥有所有黑色的纸牌,如果你想获得那100美 元,你就必须去找教授A,和他进行交易,所以 说,他的地位是极其有利的。
你参与整个活动时 市场的整个价值 没有你参与整个 活动时市场的 整个价值
夏普里值 ——合作博弈中的重要概念
合作中如何分配利益呢? 1 有一个三人财产分配问题。假定财产为 100,A拥有50%的票力(决定权), B拥有40%的票力,C拥有10%的票力。 2 规则规定,当超过50%的票认可了某 种方案时,才能分配整个财产,否则三 人将一无所获。 3 为了分配财产,必须进行联合,如何联 合呢?
附加值概念——一个合作博弈游戏
★一个教授A和他的26名学生一起玩一种纸牌
游戏,规则相当简单。就是A教授手中有26张 黑色纸牌,另外26张红牌由26名学生分得, 并且现在有2600美元,不管是谁,只要他能 够凑够一对牌:一张红与黑色的牌,这样他就 能够得到100美元的收入。
★这是一个简单的游戏,A教授可以和学生们自
嫌疑人A
坦白 不坦白
嫌 疑 人 B
坦白 不坦白
-8,-8 -10,0
0,-10
-1,-1
斗鸡博弈
• 斗鸡博弈(Chicken Game) • 试想有两人(鸡)狭路相逢,每人有两个行 动选择:一是退下来,一是进攻。如果一方退 下来,而对方没有退下来,对方获得胜利,这 人就很丢面子;如果一方退下来,对方也退下 来,双方则打个平手,则双方都很丢面子;如 果自己没退下来,而对方退下来,自己则胜利, 对方则失败;如果两人都前进,那么则两败俱 伤。假设两败俱伤为-2,赢的一方为1,输的 一方为-1。请用战略式和扩展式写出他们的表 达方式。并说明纳什均衡点。
——(冲突与合作理论)
1
博弈论简史——诺贝尔经济学奖
• 2005年由拥有以色列和美国双重国籍的经济学家罗伯特•奥曼 (Robert. J. Aumann)和美国经济学家托马斯•谢林(Thomas. C. Schelling)分享——(冲突与合作理论)。 • 一般认为,博弈论始于1944年。数学家约翰· 冯· 诺伊曼(John Von Neumann)和经济学家奥斯卡· 摩根斯坦(Oskar Morgenstern)合作出 版了《博弈论与经济行为》一书,概括了经济主体的典型行为特征, 提出了策略型与广义型(扩展型)等基本的博弈模型、解的概念和分析 方法,奠定了博弈论大厦的基石,也标志着经济博弈论的创立。 • 1994年诺贝尔经济学奖获得者纳什(John Nash)、泽尔腾(Reinhard Selten)、海萨尼(John Harsanyi)在非合作博弈方面的贡献进一步增 加了博弈论的适用范围和预测能力。 • 在谢林和奥曼这两位学者的工作又进一步发展了非合作博弈理论, 并开始涉及社会学领域中的一些主要问题。他们分别从两个不同的 角度——奥曼从数学的角度、谢林从经济学的角度,都感到从博弈 论入手有可能重新塑造关于人类交互作用的分析范式。
战略式表达
Chicken B
纯策略 纳什均 衡! 2个均衡 点!
前进
后退
Chicken A
前进 后退
-2,-2 -1,1
1,-1 -1,-1
如何避免输的更惨?
情侣博弈
王菲
足球
两个纳什 均衡点!
演唱会
李 亚 鹏
足球
2,1 -1,-1
0,0
1,2
演唱会
双赢,虽然可能别人收益更多!
模型2-合作博弈
合争 (co-opetition) 合作:创造价值
主要内容
• 第一节 纯策略与混合策略 • 第二节 合作博弈
• 第三节 重复博弈与合作策略
纯策略与混合策略博弈
如果一个博弈有有限个博 弈人,每个博弈人有有限的纯 策略,那么这个博弈至少有一 个纯策略纳什均衡。 如果这个博弈没有纯策略 纳什均衡,至少有一个混合策 略纳什均衡。
囚徒困境
一个纳什均衡 点!纯策略纳 什均衡
Game的规则 甲、乙小组均举红桃的,甲、乙小组各 记3分; 甲小组举红桃、乙小组举黑桃的,甲小 组记0分、乙小组记5分。反之相同; 甲、乙小组均举黑桃的,甲、乙小组各 记1分。 第三局开始改变记分办法,记小组分的 同时,并记大组分数。 团队的分数是所有团队成员分数的总和, 分数高的是冠军。
与顾客 合作 与供应 商合作 与替代 者合作 与互补 者合作
竞争:分配价值
与顾客 竞争 与供应 商竞争 与替代 者竞争 与互补 者竞争
图1
合争机制
弱者与强者
• • • •
情感联盟: • 弱者需要联盟以抗 三国演义(赤壁之战) 桃园结义; 联姻 衡强者 投资联盟 : ——联盟稳 秦国与六国 定吗? 国民党与共产党 • 联盟的方式有哪些? 微软公司与苹果的 • 强者如何打破联盟? 合作 • 如何使合作更稳定?
附加值概念——合作博弈游戏
学生们很乐意接受教授的建议,而对教授 A 来说, 2300 美元的 80 %要比 2600 美元 的50%要好的多。 ★ 那三张纸牌是教授 A 故意丢掉的, 因为他知道三张纸牌的丢失会巨大地改变 市场价值的分配,改变了交易双方的力量 对比,他知道获得显著的份额将会弥补市 场价值的缩小。
• • • •
托马斯.谢林(1921-)
• • • • • • • • • • • 人生经历 1921年出生于美国加利福尼亚州的奥克兰市; 1944年获伯克利加利福尼亚大学文学学士学位; 1948年获得哈佛大学文学硕士学位; 1951年在哈佛大学获哲学博士学位; 1948年到1953年,先后为马歇尔计划、白宫和总统行政办公室工作; 1953到1958年任耶鲁大学经济学教授; 1958年被聘为哈佛大学经济学教授; 1969年到哈佛大学肯尼迪研究生院兼职,是该院知名的政治经济学教授; 1978年,他从哈佛大学辗转来到马里兰学院研究公共事务; 1992年当选为美国经济学联合会会长。他是政治经济学领域著名的“弗兰 克·赛德曼奖”的获得者;凭借对预防核战争的相关行为的研究,他成为 “国家自然科学奖”的获得者; 1988年美国经济学联合会将其评为“杰出资深会员”。他曾为美国军备控制 与裁军署、国务院、国防部、参谋长联席会议、耶鲁大学和兰德公司等机构 工作或担任顾问,并作为经济学家为美国政府工作过。
附加值概念——合作博弈游戏
★ 如果你沿用以前的策略,你将 发现结果将完全出乎你的预料,你将 为悲惨的结果而吃惊,你犯了一个愚 蠢的错误。 • ★ 因为A教授具有选择学生派对的 权力,只有23名幸运的学生得到20 美元,而剩下的3名将一无所得,所 以,如果A教授向你出价20美元的话, 你应该毫不犹豫的接受它。
2005年诺贝尔经济学奖
奥曼 (1930-) 谢林 (1921-)
• The prize was awarded jointly to
Robert J. Aumann, Thomas C. Schelling
for their pioneering analysis on game theory, which can help resolve conflicts. (经济、政治、军事冲突等)
《艾克斯罗德游戏》讨论(一)
你们一开始是怎么考虑要出红/黑 牌的? 第一局结束,你们比分落后/领先 的情况下,你们打算怎么出? 第二局结束,改变Game的规则时, 你们是如何研究出牌策略的,如何 进行小组之间的沟通的?
《艾克斯罗德游戏》讨论(二)
你们谈判主要内容是什么?达成了 哪些协 议? 你们回到了小组之后,小组成员是 按照你们达成的协议出下面的牌吗? 你对这个分数满意吗?如果下一次 再做,你会怎么出牌?
罗伯特.奥曼(1930-)
• • • • • • • • 经历 1930年生于德国美因河畔法兰克福。 1938年因逃避纳粹迫害,随全家迁到美国纽约。 1950年获得纽约城市学院数学学士。 1955年获得麻省理工学院纯数学博士学位(Knot Theory)。 1956年至今,耶路撒冷希伯来大学教授。 主要成就 第一个定义了博弈论中的相关均衡概念,这是一种非协作型博 弈中的均衡,比经典纳什均衡更加灵活。 交易者连续统市场经济模型。 交互环境中代理人之间通识的数学公式表示。 重复博弈的连续交互模型。 使用博弈论分析犹太法典中的塔木德难题,解决了长期悬而未 决的遗产分割问题。
夏普里值 ——合作博弈中的重要概念
夏普里(L.S.Shapley)提出了一种计算权 重的度量,叫夏普里值:在各种可能的方案中, 参与者对方案的边际贡献之和除以各种可能的 方案组合。
A的夏普里值为 B的夏普里值为 C的夏普里值为
4 1 1
6 6 6
2 1 1
3 6 6
《艾克斯罗德游戏》