博弈论第7讲

合集下载

博弈论讲义完整版

博弈论讲义完整版


第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”

石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
你 接受 求爱博弈: 品德优良者求爱 求爱者 求爱
100,100
不接受
-50,0 0,0
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱者 接受 求爱 不求爱 0,0 你 不接受
问题:什么叫“完全而不完美信息博弈”?
第二章 完全信息静态博弈

一 博弈的基本概念及战略表述 二 占优战略(上策)均衡


三 重复剔除的占优均衡(严格下策反复消去法)
四 划线法
五 箭头法
六 纳什均衡
完全信息静态博弈

完全信息:每个参与人对所有其他参与人的特 征(包括战略空间、支付函数等)完全了解
同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境

囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的“最优策略”使整个“系统”处于不利 的状态。

思考:为什么会造成囚徒困境 是否由于“通讯”问题造成了囚徒困境? “要害”是否在于“利己主义”即“个人理 性”?

大学mooc博弈论(首师大)满分章节测验答案

大学mooc博弈论(首师大)满分章节测验答案

第一讲认识博弈论1单选(10分)博弈论的基本要素以下内容,除了()。

A.策略与策略集B.均衡C.支付与支付函数D.局中人正确答案:B你选对了2单选(10分)博弈论的基本假设是强调()。

A.均衡状态B.利益最大化C.个人理性D.集体理性正确答案:C你选对了3单选(10分)哪种表述模型更适合表示二人博弈()。

A.特征函数式B.标准式C.扩展式D.以上都不适合正确答案:B你选对了4单选(10分)根据人们行动为相互作用时,参与人能否达成一个具有约束力的协议,可将博弈分为( )。

A.静态博弈与动态博弈B.常和博弈与非常和博弈C.完全信息博弈与不完全信息博弈D.合作博弈与非合作博弈正确答案:D你选对了5单选(10分)“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”出自哪位诺贝尔经济学奖获得者的名言( )。

A.1994年诺贝尔经济学奖获得者John·NashB.2012年诺贝尔经济学奖获得者Lloyd S. ShapleyC.2005年诺贝尔经济学奖获得者Robert·AumannD.1970年诺贝尔经济学奖获得者Paul A. Samuelson正确答案:D你选对了6多选(15分)博弈论的研究特点包括()。

A.博弈论存在信息的对称性B.博弈论涉及的决策者至少为两人C.博弈论存在信息的不对称性D.博弈论需要考虑其他决策者的决策对自身利益的影响正确答案:B、C、D你选对了7多选(15分)“囚徒困境”反映了()。

A.“看不见的手”是有力的,但不是万能的B.个人理性通过市场机制导致社会福利最优的结论并不总是成立的C.个体理性与集体理性的冲突D.以自我利益为目标的“理性”行为,最终导致了两个囚徒得到相对较劣的收益正确答案:A、B、C、D你选对了8判断(5分)博弈论是一种以数学为基础、研究发生对抗与冲突时如何选择最优策略的一门学问。

正确答案:√你选对了9判断(5分)博弈论是单向的理性决策。

管理经济学10博弈论详解

管理经济学10博弈论详解

定义1: 给定其它局中人的策略s,局中人i的最优反应 记为s,是指能给他带来最大收益的策略,即
ui (s , si ) ui (s , si ) s s
* i ' i ' i
* i
当每个局中人都选择了自己的最优反应策略,并 且这些最优反应形成一个策略组合,便形成了纳什均 衡。
博弈论和对策行为
设局中人a使用混合策略x局中人b使用最优混合策略y这时局中人b的期望支付若局中人b使用某种混合策略而局中人a使用最优混合策略这时局中人a的收益的期望值为博弈论和对策行为混合策略和重复性博弈这说明当局中人a使用最优策略时不管局中人b使用何种策略他的收入的期望值不变从而保持有利的竞争地位
10 讲
博奕论和对策行为
博弈论和对策行为
策略型博弈的实例和解(性别战)
例2. 性别战(battle of the sexes)
一男一女恋爱,有些业余活动要安排,或者去看 足球比赛,或者去看芭蕾舞演出。男的偏好足球,女 的则更喜欢芭蕾舞,但他们都宁愿在一起,不愿分开 。下表给出收益矩阵: 女 足球 芭蕾 足球 2,1 0,0 男 芭蕾 0,0 1,2
纳什均衡
定义2: 一个策略组合s*=(s1*,s2*,…,sn*)被称为纳什均 衡是指,对于所有 的 i,
ui (s , s ) ui (s , s ) s Si
* i * i ' i * i ' i
纳什均衡的思想就是,博奕的理性结局是这样一 种策略组合,其中每个局中人选择的策略都已是对其 它局中人所选策略的最优反应,所以,谁也没有积极 性去选择其它策略。因为每一个局中人均不能因为单 方面改变自己的策略而获利,于是谁也没有兴趣主动 打破这种均衡。

酒吧博弈专题知识讲座

酒吧博弈专题知识讲座

19日),意大利经济学家、社
会学家,对经济学,社会学和 伦理学做出了诸多主要旳贡献,
尤其是在收入分配旳研究和个 人选择旳分析中。 他提出了帕
累托最优旳概念。他旳理论影 响了墨索里尼和意大利法西斯
主义旳发展。
本章要点
1、要不要去酒吧? 2、股市旳钱都被谁赚走了? 3、水滴石穿 4、少数人策略 5、独树一帜 6、破窗理论 7、分段实现人生目旳 8、机会只留给有准备旳人 9、莫做刀口舔血旳狼
• 比起(4,4)来,(10,10)不但是总额旳改善,而且 每个人都得到很大旳改善。这就是(10,10)对于(4, 4)具有帕累托优势旳意思。关键是每个人都得到了改善。
• 从帕累托效率准则中,我们能够看到: • 一、帕累托改善是一种双方都认同旳改善,所以我们要想方
法进行帕累托改善,提升资源利用率。
“多米诺效应”。

头上掉一根头发,很正常;再掉一根,也不用紧张;还掉一 根,依旧不必忧虑……长此以往,一根根头发掉下去,最终秃 头出现了。哲学上叫这种现象为“秃头论证”。
往一匹强健旳骏马身上放一根稻草,马毫无反应;再添加 一根稻草,马还是丝毫没有感觉;又添加一根……一直往马儿 身上添稻草,当最终一根轻飘飘旳稻草放到了马身上后,骏马 竟不堪重负瘫倒在地。这在社会研究学里,取名为“稻草原 理”。
第七章 酒吧博弈 Bar Problem
复习
猎人乙 猎人甲
猎兔
猎鹿
猎兔 (4,4) (0,4)
猎鹿 (4,0) (10,10)
帕累托优势:两人一起去猎鹿旳获利比各自去打兔子旳获利 要大得多猎鹿博弈旳结局,最大可能是具有帕累托优势旳那 个纳什均衡:甲乙一起去猎鹿(10,10)。
• 帕累托效率:经济旳效率体现于配置社会资源以改善人们

管理经济学讲义(新)管理经济学第七章博弈论与竞争策略

管理经济学讲义(新)管理经济学第七章博弈论与竞争策略

四.博弈的分类
• (1)合作博弈与非合作博弈根据参与者之间能否通过谈判达成
具有约束力的协议或合同来划分。
• 可以达成协议的为合作博弈cooperative game,合作博弈强调集 体理性和整体最优。如买卖双方讨价还价后成交。
• 不能达成协议的为非合作博弈non-cooperative game,非合作博 弈强调个体理性和局部最优。如寡头之间的竞争博弈,双方的 利益和目标有冲突,难以达成可以实施的协议,双方都有欺骗 和违约的冲动。博弈论在经济学中的应用主要在非合作博弈领 域。
• 在有些情况下,为了避免陷入被动,采取最大最小策略十分 必要。在下图的博弈中,乙方采取“右”是一个支配性策略。
因为不管甲方选什么,乙方采取右的策略都比左的策略好,
可以得到1的收益。在期望乙方采取右的情况下,甲方应该采
取“下”,并得到2的收益。这样,支配性策略均衡为(下,
右)。
• 如果甲方比较慎重,考虑到乙方可能不一定理性,或者可能 故意捉弄甲方,则应该采取最大最小策略,形成(上,右) 的博弈结果。
甜 20,10 -8,-8
2.对社会有害的合作,设法制止
• 在囚徒的困境博弈中,如果两个囚徒可以互相协商, 并形成攻守同盟,则罪犯得到好处,对社会不利。 例如在寡头厂商的定价博弈中,勾结定高价对双方 都有好处,但对社会不利,因此受到反垄断法的严 密监控。
• 寡头厂商的价格博弈收益矩阵如下:
厂商2
高价
二.支配性策略dominant strategy均衡
• 支配性策略均衡也称上策均衡或优势策略均衡。在博弈中,对 有些参与者来说,不管对手采取什么策略,他的策略都保持不 变。这种不取决于对手选择的最优策略称为支配性策略(上策 或优势策略)。

博弈论蒋文华浙江大学

博弈论蒋文华浙江大学

第一讲、博弈论概述献给诸位知人者智,自知者明;胜人者力,自胜者强;小胜者术,大胜者德。

第一章何为“博弈”博:博览全局弈:对弈棋局→谋定而动是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。

第一节从一个简单的故事说起博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。

特别提示:博弈既可以是竞争,也可以是合作!特别提示:博弈,必须学会换位思考!特别提示:博弈,只需领先一步,高人一筹!博弈就是你中有我,我中有你。

由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。

博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。

特别提示:站在别人的立场上想一想,就是为自己未来的遭遇着想。

——米兰·昆德拉特别提示:如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚)特别提示:请不要在一个充分竞争的市场去追求成功!特别提示:选对市场(对手)比选对策略更重要!特别提示:在博弈之前,博弈就已经开始了!第二节博弈的渊源一、中国的理解博+弈=下围棋略观围棋,法于用兵,怯者无功,贪者先亡。

----汉代刘向,《围棋赋》二、西方的理解game(规则)费厄泼赖(fair play)第三节学习博弈论的收益一、当局者清更有利的选择更快速的反应二、旁观者更清理解历史与现实预测未来的发展三、提出完善游戏规则(制度)的建议第二章发展简史第一节最初的探索和应用一、古诺模型参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。

二、伯川德模型该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。

《博弈论》精品讲义

《博弈论》精品讲义
指定n个局中人,以及他们各自的纯策略空间
Si,i1 ,2, ,n
和这些局中人各自的支付(盈利)函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为:
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明 公正無私
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
20
策略型表述: (两人有限博弈;Fra bibliotek阵形式)高需求情况
B
A
低需求情况?
博弈论20092009
正大光明 公正無私
21
➢房地产博弈分析
假设:同时决策;市场需求双方已知
若市场需求大,双方开发,各得0.4万元。 若市场需求小,依赖于对方行动。 若市场不确定,依赖对市场的判断及对方行动。
博弈论20092009
正大光明 公正無私
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
意5个数。如果不重复则得奖;否则受罚。 获胜的秘诀是什么?
博弈论20092009

博弈论最全完整ppt-讲解

博弈论最全完整ppt-讲解

迈克尔·斯彭斯 1948年生于美国的新泽 西,1972年获美国哈佛 大学博士头衔,现兼任 美国哈佛和斯坦福两所 大学的教授。
乔治·阿克尔洛夫 1940年生于美国的纽黑 文,1966年获美国麻省 理工学院博士头衔,现 为美国加利福尼亚州大 学经济学教授。
约瑟夫·斯蒂格利茨, 1943年生于美国的印第 安纳州,1967年获美国 麻省理工学院博士头衔, 曾担任世界银行的首席 经济学家,现任美国哥 伦比亚大学经济学教授
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的逻辑,或者
认为这一选择同样显然。并且是否你认为这一选择是否 对他同样显然;反之,是否她认为这一选择对你同样显 然。……以此类推。 也就是说,需要的是对这样的情况下该选什么的预期的 收敛。这一使得参与者能够成功合作的共同预期的策略 被称为焦点。心有灵犀一点通。
何最好地利用身体(物质)的技巧的一种算计。
什么是策略博弈?
What is a Game of Strategy?
• 策略思考本质上涉及到与他人的相互影响。其他人在同一时间、 对同一情形也在进行类似的思考。
• 博弈论就是用来分析这样交互式的决策的。 • 理性的行为指的是:明白自己的目的和偏好,同时了解自己行
如果一个博弈在所有各种对局下全体参与人之得 益总和总是保持为一个常数,这个博弈就叫常和 博弈;
相反,如果一个博弈在所有各种对局下全体参与 人之得益总和不总是保持为一个常数,这个博弈 就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
没有某个这样的暗示,默契的合作就完全不可能。

博弈论讲义

博弈论讲义
L(A)=2rc+1(1-r)(1-c) dL(A)/dr =3c-1=0 L(B)=rc+2(1-r)(1-c) dL(B)/dc =3r-2=0 r=2/3 c=1/3
A:(2/3,1/3),B:(1/3,2/3)是本博弈的 混合策略纳什均衡
完全信息动态博弈
参与人先后行动 每个参与人对每个参与人的得益具有完全信 息 博弈树 参与人的行动顺序(when to move,谁在 什么时候行动) 参与人的信息集(what known,每次行动 时参与人知道些什么)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
如果A 选U,其期望收益为
1 L 0 (1 L ) L .
策略组合
策略组合:(s1,…,si,…,sn) ui=ui(s1,…,si,…sn) 一个参与人的支付不仅取决于自己的策略选择, 而且取决于其他参与人的策略选择 Max ui=ui(s1,…,si,…sn)
囚徒困境博弈的标准式表述
B
抵赖 坦白
抵赖
-1,-1 0,-10
-10,0 -8,-8
ui ( s ,...,s ) 0 si
* 1 * n
囚徒困境的纳什均衡
(坦白,坦白)构成本博弈的纳什均衡
抵赖
B
坦白
抵赖
-1,-1 0,-10
-10,0 -8 -8
A

博弈论全套课件

博弈论全套课件

三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论,流传最广的是一个叫做“囚 徒 困 境 ” 的 故 事 。 这 个 博 弈 是 1950 年 图 克 (Tucker)提出的,这个博弈模型提出后曾引 发了大量的相关研究,也有许多关于“囚徒困 境”的版本。“囚徒困境”对博弈论的发展起 到了巨大的推动作用。可以说凡是讲博弈论, 都会说到这个经典的博弈模型。
在过去二三十年中,博弈论已成为社会科 学研究的一个重要方法。有人说,如果未来社 会科学还有纯理论的话,那就是博弈论。无论 是合作博弈还是非合作博弈都给我们提供了一 种系统的分析方法,使人们在其命运取决于他 人的行为时制定出相应的战略。特别是当许多 相互依赖的因素共存,没有任何决策能独立于 其它许多决策之外时,博弈论更是价值巨大。
最近十几年来,博弈论在经济学尤其是微 观经济学中得到了广泛的运用, 博弈论在许多 方面改写了微观经济学的基础,经济学家们已经 把研究策略相互作用的博弈论当作最合适的分 析工具来分析各类经济问题,诸如公共经济、 国际贸易、自然资源、企业管理等。在现代经 济学里,博弈论已经成为十分标准的分析工具。 除经济学以外, 博弈论目前在生物学、管理学 、国际关系、计算机科学、政治学、军事战略 和其他很多学科都有广泛的应用。现在已经有 愈来愈多的人开始关注、了解并学习博弈理论 。
博弈论(Game Theory)是一种关于游戏的 理论, 又叫做对策论, 是一门以数学为基础的、 研究对抗冲突中最优解问题的学科。事实上, 博弈论也正是衍生于古老的游戏,如象棋、围 棋、扑克等。
博弈论作为一门学科,是在20世纪50~60 年代发展起来的,当非零和博弈理论、特别是 不完全信息博弈理论获得充分发展时,才成为 现实。到20世纪70年代,博弈论正式成为主流 经济学研究的主要方法之一。1994年诺贝尔经 济学奖同时授予了纳什、泽尔腾、海萨尼三位 博弈论专家。2005年诺贝尔经济学奖又授予了 美国经济学家托马斯.谢林(Thomas Schelling)和以色列经济学家罗伯特.奥曼 (Robert Aumann),以表彰他们在合作博弈 方面的巨大贡献。

博弈论的总结-博弈论总结

博弈论的总结-博弈论总结

博弈论的总结|博弈论总结博弈论学习的个人总结刘艳丽第一局部:根本情况视频耶鲁公开课《博弈论》1----5讲,人人影视参考资料:耶鲁校园网《博弈论--战略分析^p 入门》,美,罗杰A麦凯恩,原毅军译,机械工业出版社,2022,42元《策略博弈》,阿维纳什迪克西特,蒲勇健译,中国人民大学出版社,第二版,2022,65元班级:工商,人力08级学生课时:8节我的时间投入:视频26个小时;书籍,25小时;上网时间,无法统计。

第二局部:知识层面一、The five lessons:五个根本的结论1、Don"t play a strictly dominated strategy2、Rational choices can lead to bad outes3、You can"t get what you want4、Put yourself in other people"s shoes5、Yale students are evil二、Game 2: "pick a number."数字游戏Without showing your neighbor what you"re doing, put in the box below a whole number between 1 and a 100 [whole number between 1 and 100--integer.] We will calculate the average number chosen in the class. The winner in this game is the person whose number is closest to two-thirds times the average in the class.三、The Prisoners" Dilemma:some exles囚徒困境A joint projectPrice petitionA mon resourceGlobal warming and carbon emissionsmunication,contracts,treaties betweencountries,regulation,education cannot work Solutions OF The Prisoners" Dilemma: changing payoffs.改变收益构造四、The ingredients of a game:博弈的根本构造Players:i 、jStrategies:"si" to be a particular strategy of Player iSi" to be the set of alternatives."s" to mean a particular play of the gamePayoffs:"U" for utile, to be Player i"s payoff.the way up to Player N"s choices.profileS-i" to mean a strategy choice for everybody except person "i."Assume that everybody knows the possible strategies everyone else could choose and everyone knows everyone else"s payoffs五、如何寻找博弈平衡解1、成绩案例-----求解方法,如存在最优策略,那么选择最优。

《博弈论》精品讲义

《博弈论》精品讲义

7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
5
1.博弈现象
➢田忌赛马:正确的策略可以反败为胜。 ➢囚徒困境:
乙 甲
理性的人是自私自利的; 理性选择不是全局最优。
博弈论20092009
正大光明 公正無私
6
➢经济合作:
乙 甲
诚信的价值; 一报还一报策略; 人类生存环境启示。
博弈论20092009
正大光明 公正無私
如两人写的一样, 就 认为他们讲真话, 并 按 所 写数额赔偿;如果两人写的不一样,就认定低 者讲真话,并照此价格赔偿。同时,对讲真话的 旅客奖励2元钱,对讲假话的旅客罚款2元。
理性原则下,他们会写多少价格呢?
博弈论20092009
正大光明 公正無私
11
2. 博弈概念
➢什么是博弈:
个人或团体间在依存和对抗、合作和冲突 中的决策问题。
正大光明 公正無私
43
∴I的最优混合策略为
(1,2)
(1, 4
3) 4
同理,II的最优混合策略为
G=8
(1,2)
(1, 2
1) 2

博弈论最全完整-讲解

博弈论最全完整-讲解

问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
正因为这样的博弈对所有参与者存在着或大 或小的潜在成本,如何达成和维护互利的合 作就成为一个值得探究的重要问题。
存在双赢的博弈吗?实用文档
6
例2:焦点博弈 “We Can’t Take the Exam,
获奖理由:在非合作博弈的均衡分析理 论方面做出了开创性的贡献,对博弈论 和经济学产生了重大影响 。
实用文档
17
约翰·纳什 1928年生于美国
莱因哈 德·泽 尔腾, 1930 年生于 德国
实用文档
约翰· 海萨尼 1920年 生于美 国
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
实用文档
19
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英 国
实用文档
20
2001年诺贝尔经济学奖获得者
实用文档
35
第一章 完全信息静态博弈
博弈论的基本概念及战略式表述 纳什均衡
纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性与多重性
实用文档
36
第一节 博弈论的基本概念
与战略式表述
Байду номын сангаас
实用文档
37
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行 为发生直接相互作用时候的决策以及这种 决策的均衡问题。

数学建模博弈论

数学建模博弈论

数学建模博弈论在前一讲中,我们讨论了决策论,其中决策者面对的结果和支付只依赖于他本人的决策,而不依赖一个或者多个其他参与者的决策。

决策论最后决定的结果可能存在机会和风险,但不会与另一个参与者的决策有关系。

比如假定两个国家在军备竞赛而希望裁军,如果一方裁军,这个国家的结果不仅依赖于该国的决策,也依赖于第二个国家的决策。

如果只依赖于一个参与者,我们把这类决策模型称为决策论;如果结果依赖于多于一个参与者的决策,我们把这类决策模型称为博弈论;10.1:博弈论:完全冲突:按照参与者之间的冲突是完全冲突还是部分冲突对博弈论进行分类。

进一步把完全冲突的博弈按照最优策略是纯策略还是混合策略进行分类。

举例1:一个有纯策略的完全冲突博弈:例如有两家连锁店,都同时想在两个城市开连锁店,假设为A,B两地,如图所示是两个连锁店所占的市场份额:从上图可以发现两家连锁店其中一家每得到一点份额都是需要另一家失去一点份额,而市场总额是1,并且两家连锁店的决策结果不仅取决于自身还取决与对手的策略。

这个博弈是完全冲突的。

定义:纯策略是参与者可采取的行动的集合,每个参与者选定的策略共同决定博弈的结果以及每个参与者的花费。

通过图中数据我们也可以发现,无论甲连锁店开在何处,乙连锁店只需要开在A地就可以始终占优。

占优策略:定义:策略A占优与策略B,是指策略A的每一个结果至少和B的对应结果一样好,并且至少A的某一个结果严格优于B的对应结果。

占优原理:在严格冲突博弈中,一个理性的参与者应该永远不要采用被占优的策略。

同时也可以发现结果(A,A)即两个连锁店都开在A地时,此时没有任何一个参与者可以单方面改变策略而使得自己获得改善,这种情况我们称为纳什均衡:表示这样一个结果,任何一个参与者都不能通过单方面更改策略而获得好处。

同时由于这些每个结果和是1,完全冲突博弈也称作常数和博弈:如果对每一个可能的结果,每个参与者的支付之和是同一个常数,这个博弈称为完全冲突博弈。

博弈理论知识讲义

博弈理论知识讲义

第八章 博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互影响的问题。

本章讨论这个问题,建立复杂环境下的决策理论。

开展这种研究的的理论叫做博弈论,也称为对策论(Game Theory)。

最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。

大局部经济行为都可视作博弈的特殊情况,比方把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。

博弈论的思想精髓与方法,已成为经济分析根底的必要组成局部。

第一节 博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双方的目的都是要战胜对方,互不相容,互相影响,互相制约。

一般来讲,博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。

当所有当事人都拿定主意作出决策时,博弈的局势就暂时确定下来。

博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。

博弈论推广了标准的一人决策理论。

在每个局中人的收益都依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。

下面来举例说明。

例1.便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否正面朝上。

局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。

对于这个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。

当甲和乙都作出选择时,博弈的局势就确定了。

显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
客户2 提 前 客 户 1 提 前 到 期 0.8, 0.8 0.6, 1 到 期 1, 0.6 1.2, 1.2
37
第二阶段
多阶段静态博弈简例:挤兑博弈
其中,风险占优均衡就是“挤兑”现象, 而帕雷托占优则是金融健康的经济现象。 若采用风险占优策略的客户比例较大,超 出了银行承受能力,就可能会造成金融危 机。
36
图2-20 银行挤兑风险
多阶段静态博弈简例:挤兑博弈
用逆推归纳法来分析该博弈。 在第二个阶段的博弈。这是一个二人完全信息静 态博弈,可以得出该博弈有两个纯策略纳什均衡 (提前,提前)和(到期,到期)。 对应的支付情况分别为(0.8,0.8)和(1.2,1.2)。 分别为风险占优均衡和帕雷托占优均衡。
*
23
经典案例(2):讨价还价博弈
无限阶段讨价还价问 题
罗宾斯坦恩 (Rubinstein, 1982): 在无限期轮流出价博 弈中,唯一的子博弈 精炼纳什均衡结果是 如果δ1=δ2=δ,则1 2 Fra bibliotek 1 1 2
*
1 x 1
*
24
经典案例(2):讨价还价博弈
34
多阶段静态博弈简例:挤兑博弈
在两个客户都存款,从而银行给上述企业提供贷 款的情况下,如果银行满1年收回贷款,企业就 能完成一笔生意,银行可收回贷款本息,并可支 付存款客户的存款本息。
如果在不到1年的时候,其中任何一个客户单独 或同时要求提前取出存款,银行就不得不提前收 回贷款。假设银行只能收回80%的本钱。 若只有一个客户要求提前取款,则银行会偿还其 全部本金,余款则属于另一客户;若两客户同时 要求提前取款,则平分回收的资金。
多阶段静态博弈
有同时选择的动态博弈问题
如国际竞争中最优关税博弈问题,两个制 定关税的国家可看成标准模型中的参与人1 与2;两国各自的一个相互进行产量竞争的 企业就是模型中的参与人3于4。 上述标准模型的变形,如某个阶段只有一 个参与人;第二阶段的参与人3于4与第一 阶段的参与人1与2相同等,也属于同时选 择的动态博弈问题。
由于参与人1能得到的最 大份额和最小份额相同, 均衡结果是唯一的,为
1 2 m 1 1 2
1 2 1 1 2
M
1 2 x 1 1 2
29
多阶段静态博弈
该类模型中至少在某个阶段参与人同时 选择其决策。
30
多阶段静态博弈
模型一例
博弈中有四个参与人,分别用参与人1~4表示。 第一阶段是参与人1与2的决策选择阶段,他们同 时在各自的策略集A1和A2中分别选择a1和a2。 第二阶段是参与人3与4决策选择阶段,他们看到 参与人1和2的决策a1和a2后,同时在各自的策略 集A3, A4中分别选择a3和a4。 各参与人的支付函数是参与人的策略a1, a2, a3, a4 的函数,记为ui = ui (a1, a2, a3, a4) 31
3
讨价还价实例
假设两人就冰激凌的分配讨价还价。冰 激凌会随时间而融化。
假设冰激凌重量为100克,每一回合融 化10克(即10个回合全部融化)。 假设甲先提议,然后是乙。
4
讨价还价实例
两回合谈判的均衡结果推导过程:
第二回合乙提议之后博弈结束,因此相当于他 面临独裁博弈。此时,他会将全部冰激凌分 给自己(比例为1)。由于已经化掉1/10,因 此,尽管乙得到了全部,但实际上是90克; 甲什么也没得到。再回溯到第一回合,为了 不使乙反对,甲必须使得乙所获得的冰激凌 实际额不低于其第二回合的数量。 因此,均衡结果是甲10克,乙90克
20
经典案例(2):讨价还价博弈
如果δ1=δ2=1, 即双方都有无限耐心,那么, 如果T=1,3,5,…,均衡结果是x=1;如果 T=2,4,6,…,均衡结果是x=0。 这里的结果可以称之为“后动优势” (last-mover advantage)
21
经典案例(2):讨价还价博弈
一般说来,如果0<δi<1, i=1,2,均衡结果 不仅依赖于贴现因子的相对比率,而且还 依赖于博弈时期T和谁在最后阶段出价。然 而,这种依存关系随着T的变大而变小
因此,子博弈精炼均衡结果是x=1- δ2(1-δ1) 19
经典案例(2):讨价还价博弈
当T=4, 5, …等有限整数值时,仿照前述方法, 可以推导出任何给定的T的子博弈精炼纳什均 衡。
如果δ1=δ2=0,不论T为多少,子博弈精炼均衡的结 果是 x =1;就是说,如果两个参与人都是绝对无耐 心的,第一个出价的人得到整个蛋糕; 如果δ2=0,不论δ1为多少,子博弈精炼均衡结果仍 然是x=1; 如果δ1=0, δ2>0, 子博弈精炼均衡结果是x=1-δ2
35
多阶段静态博弈简例:挤兑博弈
根据上述假设,可以用图2-20的两个矩阵表 示该问题。
客户2 不 存 存 款 1, 1 下一阶段 客 户 1 提 前 客户2 提 前 到 期 1, 0.6
客 户 1
不 存 存 款
1, 1 1, 1
第一阶段
0.8, 0.8
到 期
0.6, 1
1.2, 1.2
第二阶段
假定参与人1和参与人2的贴现因子分别为δ1 和δ2,如果博弈在时期t结束,t是参与人i的出 价阶段,则参与人1支付的贴现值是π1= δ1t-1xi, 参与人2支付的贴现值是π2= δ2t-1(1-xi)
13
经典案例(2):讨价还价博弈
结合切蛋糕问题,贴现值既可以理解为
资金的时间价值
由于蛋糕由于未被分割出去所造成的自然 缩减。
5
讨价还价实例
三回合谈判的均衡结果推导过程:
第三回合甲提议之后博弈结束,因此相当于他面临独裁 博弈。此时,他会将全部冰激凌分给自己(比例为 1)。由于已经化掉2/10,因此,尽管甲得到了全部, 但实际上是80克;第二回合中,为了不使甲反对,乙 必须使得甲所获得的冰激凌实际额不低于其第三回合 的数量,即甲80克,乙10克;再回溯到第一回合,为 了不使乙反对,甲必须使得乙所获得的冰激凌实际额 不低于其第二回合的数量,即乙10克,甲90克。 因此,均衡结果是甲90克,乙10克 6
当T趋于无穷时,我们得到“先动优势”: 如果δ1=δ2=δ,唯一的纳什均衡结果为 x=1/(1+δ)
22
经典案例(2):讨价还价博弈
无限阶段讨价还价问 题
罗宾斯坦恩 (Rubinstein, 1982): 在无限期轮流出价博 弈中,唯一的子博弈 精炼纳什均衡结果是
1 2 x 1 1 2
讨价还价实例
同学们可以自己推导一下,第9回合和第 十回合的均衡结果是多少?
7
讨价还价实例
第9回合,甲60克,乙40克;
第10回合,甲乙各50克。
推导过程9和10回合.doc
8
讨价还价实例
结论:
1,低于10回合外,谁最后提议,谁有优 势。 2,谈判的回合越多,两人的利益分享额 越接近平均分配。 3,回合足够多得话,平均分配合作利益。
27
经典案例(2):讨价还价博弈
x=1- δ2 (1- δ1M)
x=δ1M t=2
x=M t=3
… t=k
t=1
因此有 x=1- δ2 (1- δ1M)=M 进而求得
M 1 2 1 1 2
28
经典案例(2):讨价还价博弈
与此类似,可求出参与人 1能够获得的最小份额m, 为
上述定理的证明
由于T=∞,博弈没有最后阶段,不可能使用 逆推归纳法。
但根据Shaked, Sutton(1984),因为从参 与人1出价的任何一个阶段开始的子博弈等 价于从T=1开始的整个博弈,因此可转换为 有限阶段讨价还价问题。
见图2-19。
25
经典案例(2):讨价还价博弈
t=1
t=2
t=3

t=k

从t=1阶段开始的整个博弈
从任一阶段开始的子博 弈(t为奇数)
图2-19 无限阶段讨价还价问题 26
经典案例(2):讨价还价博弈
x=1- δ2 (1- δ1M)
x=δ1M t=2
x=M t=3
… t=k
t=1
假定在时期t≥3时参与人1出价,参与人1能得到的最大份额 是M; 对参与人1而言,t期的M等价于t-1期的δ1M,参与人2知道在 t-1时期的任何x2≥δ1M的出价将被参与人1接受,因此参与人 出价x2= δ1M,自己获得1- δ1M; 对于参与人2而言,t-1期的1- δ1M等价于t-2期的δ2 (1- δ1M), 参与人知道在t-2期的任何x1<=1- δ2 (1- δ1M)出价将被参与人 2接受,因此参与人1出价x1=1- δ2 (1- δ1M)
11
经典案例(2):讨价还价博弈
上述过程反复进行,直到一个参与人的 出价被另一个参与人接受为止。
这是一个无限期完美信息博弈,参与人 1在1, 3, 5,…出价,参与人2在时期 2,4,6,…出价。
12
经典案例(2):讨价还价博弈
若用x表示参与人1的份额,(1-x)表示参与人2 的份额,x1和(1-x1)分别是参与人1出价时参与 人1和参与人2的份额,x2和1-x2分别是参与人 2出价时参与人1和参与人2的份额。
上次内容回顾
动态博弈的概念
完美信息和完全信息(信息集)
扩展式表示(博弈树)
动态博弈的策略式表示
逆向归纳法(Back Induction) 承诺的置信(反国家分裂法) 子博弈完美均衡 斯塔克博格(Stackelberg)模型
1
子博弈完美均衡与BI
2
先动优势?后动优势
NIM
Step or throw
32
多阶段静态博弈
这类模型实质上就是完美信息动态博弈, 因此仍然可以采用逆推归纳法进行分析。
相关文档
最新文档