博弈论基本模型
浅析古诺模型的纳什均衡及应用
浅析古诺模型的纳什均衡及应用【摘要】古诺模型是博弈论中的经典模型之一,通过分析双方角色和策略的选择,可以得出纳什均衡的解。
纳什均衡是指在博弈中每个参与者采取最佳应对策略的状态,使得没有一个参与者可以通过改变自身策略来获得更高的收益。
通过计算纳什均衡,可以确定在古诺模型中各方的最优策略选择。
古诺模型在博弈论中有着广泛的应用,能够描述各种决策情形,并帮助分析各方的利益冲突。
古诺模型也存在局限性,例如假设信息完全对称等问题。
纳什均衡的意义和应用前景则在于帮助理解博弈中的策略选择规律,为实际决策提供理论指导。
通过深入研究古诺模型和纳什均衡的概念与应用,可以更好地理解博弈论在现实中的应用。
【关键词】关键词:古诺模型、纳什均衡、博弈论、角色与策略、计算方法、局限性、意义和应用前景。
1. 引言1.1 古诺模型的基本概念古诺模型的基本概念是现代博弈论的基础之一。
古诺模型是由约翰·冯·诺依曼和奥斯卡·摩根斯特恩在20世纪40年代提出的博弈论模型,被广泛应用于经济学、政治学、生物学等领域。
古诺模型主要研究多方参与的博弈中的决策问题,其基本假设是参与者都具有理性并追求最大化自身利益。
在古诺模型中,参与者被称为玩家,每个玩家有自己的策略空间和支付函数。
策略空间是玩家可以选择的所有可能行动,支付函数则是描述了每个玩家在不同策略组合下所获得的收益。
古诺模型中的策略可以是纯策略,即玩家直接选择一个确定的行动,也可以是混合策略,即以一定概率选择不同的纯策略。
通过分析古诺模型中各个玩家的策略选择和收益情况,可以得到博弈的纳什均衡。
纳什均衡即在一个博弈中,每个玩家选择的策略都是最优的,给定其他玩家的策略时,自己没有动机单方面改变策略。
纳什均衡是古诺模型中的一个重要概念,也是博弈论中的核心内容之一。
1.2 纳什均衡的概念纳什均衡是博弈论中一个重要的概念,它由约翰·纳什于1950年提出。
在一个博弈中,如果每个参与者都选择了最优的策略,且已知其他人的选择情况下仍然坚持自己的选择,那么这种情况就被称为纳什均衡。
数学建模博弈模型
博弈模型在实际问题中的应用前景
政策制定
01
利用博弈模型分析政策制定中的利益关系和策略选择,为政策
制定提供科学依据。
企业竞争策略
02
利用博弈模型分析企业竞争中的策略选择和预期行为,为企业
制定合理的竞争策略。
国际关系
03
利用博弈模型分析国际关系中的利益关系和冲突解决机制,为
国际关系管理提供理论支持。
THANKS
猎鹿博弈
总结词
描述两个猎人合作与竞争的关系,揭示了合作与背叛的平衡。
详细描述
在猎鹿博弈中,两个猎人一起打猎,猎物可以平分。如果一个猎人选择合作而另一个选择背叛,则背叛者可以独 吞猎物。但如果两个猎人都不合作,则都没有猎物可吃。最佳策略是合作,但个体理性可能导致两个猎人都不合 作,造成双输的结果。
03
智猪博弈
总结词
描述大猪与小猪在食槽竞争中的策略,揭示了合作与竞 争的平衡。
详细描述
在智猪博弈中,一个大猪和一个小猪共同生活在一个猪 圈里。每天都有一桶食物放在食槽中,大猪和小猪需要 竞争才能吃到食物。如果大猪和小猪同时到达食槽,大 猪会因为体型优势占据更多食物。但如果小猪先到食槽 等待,大猪到来时已经没有食物可吃。最佳策略是小猪 等待,大猪先吃,然后小猪再吃剩下的食物。
博弈模型的基本要素
参与者
在博弈中作出决策和行动的个体或组织。
策略
参与者为达到目标而采取的行动或决策。
支付
参与者从博弈中获得的收益或损失。
均衡
在博弈中,当所有参与者都选择最优策略时,达到的一种稳定状态。
博弈模型的建立过程
策略空间
确定每个参与者的所有可能采 取的策略。
均衡分析
通过分析收益函数和策略空间 ,找出博弈的均衡点。
聊聊四种经典的博弈论模型
聊聊四种经典的博弈论模型展开全文1、囚徒困境:为什么两个犯人都选择坐牢官差破获了一宗盗窃案,抓住了两名犯罪嫌疑人。
但在审讯过程中,被关在一处的二人始终矢口否认盗窃罪名,说东西不是我们偷的。
为了避免两人达成默契,结成攻守同盟,官差决定对他们进行单独审讯。
官差表示,如果两人中有一人坦白认罪,则可立即释放,另一个不认罪的人判5年徒刑;如果两人都坦白罪刑,则他们将各判2年徒刑。
但还有一种情况,那就是两个人都拒绝坦白,由于缺乏证据,他们只会以扰乱公共场合为名判处3个月拘役。
这就是两名罪犯面临的困境中,他们会做出怎样的选择呢?首先,他们互相之间都不清楚对方是否会坦白,其次,二人都希望将自己的刑期缩至最短。
如此考虑,最终,两名犯人都会选择坦白交代。
上面的案例就是博弈论所说的“囚徒困境”。
犯人们如果彼此合作,可为集体带来最佳利益(刑期最短);但当二人面对同样的情况且不知道对方如何选择时,在理性思考后,双方都会得出相同的结论(坦白交代),以便达到个人利益的最大化。
囚徒困境是博弈论的“非零和博弈”中具代表性的例子,反映的是个人的最佳选择并非是团体的最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
2、智猪博弈:赢的总是小猪猪圈里有大小两头猪,它们在同一个食槽里进食。
为了保持饲料的新鲜,在远离猪食槽的另一边有一个踏板,大猪或小猪跑过去,每按动一次踏板,投食口就会掉落10个单位的食物。
于是,在大猪和小猪每次进食前,就会形成这样一种局面:如果小猪跑去按踏板,大猪守在食槽边,则大猪小猪吃到的食物比是9:1;反之,如果大猪去按而小猪守在食槽边,则吃食比例是6:4。
如果二猪同时到食槽边,则吃食比是7:3。
这样一来,从纯收益的角度考虑,小猪就更愿意选择在食槽边等待食物落出,因为“等待优于行动”,而大猪只能被迫奔忙在踏板和食槽之间。
上述“智猪博弈”的案例是经济学家的假设论证模型,这个博弈的结果,用经济学视角看待,可以解释为:谁占有更多资源,谁就必须承担更多义务。
第1章博弈论基本模型
为什么学习?
从学习中获得心灵的提高,获得心灵的享受。
学习,其实就为自己创造一个美丽的心灵世界的过程。
有人说,我也没什么追求,就学一点实用知识就行,但问题是, 你没有那些“无用”的知识,你怎么驾驭哪些实用的知识呢? “世人只知有用之用,而不知无用只用”。
很多人30岁后就不再读书,到60岁还是30年前的思维;很多人 感慨“现在一读书就头痛”;农村现在不要为生存而挣扎了,那 做什么呢?“我不打牌又做什么呢?”
齐 田忌策略:
上马 ∨
中马 ∨
下马 ∨
田
上马
中马
下马
结 果:
田忌将军每次输掉三千金
谋士孙膑 策略:
结 果:
齐
上马
中马
下马
∨
∧
∧
田
下马
上马
中马
田忌将军胜二负一赢一千金
博弈论的创立与发展
2、博弈论的发展阶段 第一阶段:萌芽期(20世纪40年代前)。利益冲突的研究是分散和初
步的、带有很大程度的随意性。 孙子兵法:古诺(Cournot,1883)—古诺的“双寡头垄断”模型;艾
专业学习:谋职、谋生(身无长物、何以生存)。 事理学习:明白事理、懂得分析生活中的很多问题。(崔琦:
明白这个世界是一个什么样子,这很重要)。一个人,其实只 要懂得了加减乘除四则运算,就可以挣到钱买房买车,在物质 世界中生活的很好。但这只是像一个盲人一样在生活,“春天 来了,但我却看不到” 。(明明德) 人生学习:充实人生、提高人生的境界、把学习融入人的生活 中。人不是做事和挣钱的工具,而是宇宙中的有血有肉的生灵, 需要提高生活的趣味,享受趣味化的人生,这就需要学习。一 个人,不会欣赏《二泉映月》,不会感受过禅宗的静谧,从来 也不思考什么是天行健,好像也是在生活。看看很多人下班后 在做什么?打牌、或者歌厅洗脚房等,当衣食住行解决了之后, 就不知怎么过了,只有赌博和玩乐,却找不到真正的趣味。 (身体在成长、心灵也在成长吗?)(新民) 仰望星空
博弈论模型简介
博弈论的基本概念
(二)博弈的组成要素
• • •
•
一个博弈一般由以下几个要素组成,包括:参与 人、行动、信息、策略、得益、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体; 2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策; 3、策略是指参与人选择行动的规则,即在博弈 进程中,什么情况下选择什么行动的预先安排;
案例模型构建
要素
4)效用函数:参与人i的效用函数不但受其自身的行动影响, 还取决于对方的行动选择,U=(U1,U2,U3)为参与人 的效用函数组合。参与人1,即地方政府的效用U1主要取 决于集体建设用地交易过程中取得的收益.参与人2和3的 效用U2和U3也主要取决于三方面因素:一是集体建设用 地交易过程中取得的收益R;二是集体建设用地地下交易 的风险成本CR,即违反法律受到惩罚的风险;三是交易成 本CT。
案例-地方政府的战略选择
其二,建立集体建设用地公开流转市场,地方政府获得级差地租Ⅱ 和部分级差地租Ⅰ。(略)
博弈论在旅游学的应用
1.旅游企业之间博弈
张亚明、陈亮(2008) 以博弈论为视角分析网络经济下旅游企业 间的“竞—合”模式,通过运用博弈论对旅游企业间的合作竞争 策略进行了分析,进而确定对合作和竞争策略的选择以及实施次 序的活动运作战略。
案例-地下市场交易下的三方博弈分析
集体建设用地地下市场交易的动力来源
1
2
由于现行征地制度不 健全,造成农村集体组 织的权益受到侵害,农 民集体组织为了获取比 征地补偿更高的收益或 者说规避土地征收带收 的“产权侵害”问题,就 私下进行了集体建设用 地的各种流转
由于现行的征地上市 交易模式手续多、周期 长、成本高,往往出现 用地企业拿到土地时已 经错失投资良机的情况 ,而通过地下市场交易 获得土地的成本低,周 期短,成为用地企业获 取土地的一个捷径 。
十大经典博弈论模型
十大经典博弈论模型博弈论是一门研究决策者之间互动的学科,其应用范围广泛,涉及到经济、政治、生物学等领域。
在博弈论中,经典博弈论模型是基础和核心,以下是介绍十大经典博弈论模型:1. 囚徒困境博弈模型囚徒困境博弈模型是博弈论中最为著名的模型之一,也是最为典型的非合作博弈模型。
该模型主要讲述的是两个囚犯被抓后面临的选择问题,如果两个人都招供,那么都将受到较重的惩罚;如果两个人都不招供,那么都将受到轻微的惩罚;如果一个人招供而另一个人不招供,那么招供的人将受到宽大处理,而另一个人将受到较重的惩罚。
2. 零和博弈模型零和博弈模型是博弈论中最为简单的模型之一,其特点是参与者之间的利益完全相反,即一方获得利益就意味着另一方的利益受到损失。
在这种情况下,参与者之间的互动往往是竞争和对抗的。
3. 博弈树模型博弈树模型是一种用于描述博弈过程的图形模型,它可以清晰地展示出参与者在不同阶段的选择和决策,以及每个选择所带来的收益和风险。
4. 纳什均衡模型纳什均衡模型是博弈论中最为重要的概念之一,它指的是一个博弈中所有参与者都采取了最优策略的状态。
换句话说,如果所有参与者都遵循纳什均衡,那么任何一个人单方面改变策略都将无法获得更多的利益。
5. 最小最大化模型最小最大化模型是一种解决零和博弈问题的方法,其思想是在所有可能的情况中,选择让对手收益最小的情况,从而实现自己的最大化收益。
6. 帕累托最优解模型帕累托最优解模型是一种解决多人博弈问题的方法,其核心思想是通过合作和协商,使得所有参与者都能获得最大的收益,而不是只有某个人获得了最大的收益。
7. 博弈矩阵模型博弈矩阵模型是一种常用的博弈论分析工具,它可以清晰地展示出参与者在不同策略下的收益和风险,从而帮助参与者做出最优决策。
8. 拍卖模型拍卖模型是博弈论中的一个重要应用领域,其目的是通过竞价的方式,让参与者以最低的价格获得所需的商品或服务。
9. 逆向选择模型逆向选择模型是一种解决信息不对称问题的方法,其核心思想是通过知道对方的信息,来预测对方的行为和决策,从而做出最优策略。
博弈模型汇总
博弈模型汇总博弈模型是博弈论的重要工具,用于描述博弈参与者之间的策略和利益关系。
在博弈论中,通过建立合适的博弈模型,可以帮助我们分析和理解各种不同类型的博弈情境,并预测博弈参与者的行为和可能的结果。
下面将对几种常见的博弈模型进行汇总和介绍。
1. 零和博弈模型:零和博弈模型是博弈论中最简单和最基本的模型之一。
在零和博弈中,博弈参与者的利益完全相反,一方的利益的增加必然导致另一方的利益的减少。
这种博弈模型常常用于描述双方的冲突和竞争情境。
常见的零和博弈模型有二人零和博弈和多人零和博弈。
2. 非合作博弈模型:非合作博弈模型是博弈论中较为常见的模型之一。
在非合作博弈中,博弈参与者之间的行动和决策是相互独立的,每个博弈参与者都追求自身的最大利益。
在非合作博弈模型中,博弈参与者可以选择不同的策略,根据对手的行动做出最优的响应。
常见的非合作博弈模型有纳什均衡模型和博弈树模型。
3. 合作博弈模型:合作博弈模型是博弈论中另一个重要的模型。
在合作博弈中,博弈参与者之间可以进行协作和合作,共同追求最大化整体利益。
合作博弈模型通常用于描述多个博弈参与者之间的联盟和合作情境。
常见的合作博弈模型有核心模型和合作博弈解。
4. 演化博弈模型:演化博弈模型是博弈论中较为新颖和有趣的模型之一。
在演化博弈中,博弈参与者的行动和策略可以随时间变化和演化。
演化博弈模型通常用于描述博弈参与者之间的适应性和进化过程。
常见的演化博弈模型有进化博弈动力学模型和演化博弈解。
博弈模型的应用广泛,不仅在经济学中有重要的地位,也在其他学科领域得到广泛运用。
博弈模型可以帮助我们分析和解决各种决策和策略问题,对于理解社会、经济和生物系统中的行为和演化具有重要意义。
总结起来,博弈模型是博弈论的核心工具之一,用于描述和分析博弈参与者之间的策略和利益关系。
常见的博弈模型包括零和博弈模型、非合作博弈模型、合作博弈模型和演化博弈模型。
这些模型在各个领域中都有广泛的应用,对于理解和解决各种决策和策略问题具有重要意义。
博弈论的几个经典模型
模型二、囚徒困境/非合作博 弈
囚徒困境可以用来说明许多现象。
寡头定价 拍卖出价 推销员的努力 政治上的讨价还价 军备竞赛等(冲突中出现两败俱伤的情况,
往往要考虑到囚徒困境)
*(纯策略)纳什均衡
问题与思考
• 什么是博弈论?试举两个你生活中的例子说明。
• 某年在荷兰召开了一次“合作及社会两难困境研讨 会”,与会者都是博弈论的专家。
基本术语
• 博弈涉及哪些内容呢?
博弈涉及至少两个独立的博弈参与者 (player)。
博弈涉及行动者存在着策略(strategy)选 择的可能,博弈论用策略空间来表示参与 者可以选择的策略。
参与者在不同策略组合下会得到一定的支 付(payoff)。
对于博弈参与者来说,存在着一博弈结果。
对于游戏设计者,这是一个最好的
模型二、囚徒困境/非合作博 弈
在博弈论中,含有占优战略均衡的 一个著名例子是由塔克给出的“囚徒困 境” (prisoners’dilemma)博弈模 型。该模型用一种特别的方式为我们讲 述了一个警察与小偷的故事。
模型二、囚徒困境/非合作博 假设:有两个小偷A弈和B联合犯事、私入
第四章 博弈论的几个经典模 型
讲授人 谭建国
引言
博 弈 论 又 被 称 为 对 策 论 ( Game Theory),按照2005年因对博弈论的贡献 而获得诺贝尔经济学奖的Robert Aumann 教授的说法,博弈论就是研究互动决策 的理论。所谓互动决策,即各行动方 (即局中人[player])的决策是相互影响 的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也 需要把别人对于自己的考虑也要纳入考 虑之中……在如此迭代考虑情形进行决
博弈论简介
双方都没有占优策略 存在两个稳定的状态(纳什均衡):(-1,1);(1,-1) 纳什均衡):( ,1);(1,):(- ;(1,
双方都避免两败俱伤,斗鸡博弈有两个纳什均衡, 双方都避免两败俱伤,斗鸡博弈有两个纳什均衡,一方 前进,另一方后退。由于有两个均衡点,结果无法预知。 前进,另一方后退。由于有两个均衡点,结果无法预知。 20世纪 年代苏美间的古巴导弹危机就是一个斗鸡博弈的 世纪60年代苏美间的古巴导弹危机就是一个斗鸡博弈的 世纪 很好例子 。 古巴导弹危机是冷战时期苏美之间最严重的一次危机, 古巴导弹危机是冷战时期苏美之间最严重的一次危机, 赫鲁晓夫1962年偷偷将导弹运到古巴对付美国,被美国 年偷偷将导弹运到古巴对付美国, 赫鲁晓夫 年偷偷将导弹运到古巴对付美国 U2飞机侦察到,美国派出携带核武器的战机、航母,威 飞机侦察到, 飞机侦察到 美国派出携带核武器的战机、航母, 胁苏联限期从古巴撤出导弹。苏美这两只大公鸡均在考虑 胁苏联限期从古巴撤出导弹。 进还是退? 进还是退? 战争的结果当然是两败俱伤, 战争的结果当然是两败俱伤,但任何一方退下来则是很 不光彩的事。博弈结果是苏联从古巴撤回了导弹, 不光彩的事。博弈结果是苏联从古巴撤回了导弹,做了丢 面子的“撤退的鸡” 而美国坚持了自己的策略, 面子的“撤退的鸡”,而美国坚持了自己的策略,做了 不退的鸡” 当然为了给苏联面子,同时也担心战争, “不退的鸡”。当然为了给苏联面子,同时也担心战争, 美国也从土耳其撤了一些导弹。 美国也从土耳其撤了一些导弹。
☺中国人研究博弈论是有优势的☺
三国演义》 孙子兵法》 三十六计》 《三国演义》、《孙子兵法》、《三十六计》、 厚黑学》都是博弈论教材, 《厚黑学》都是博弈论教材,如何在人与人的博 弈中取得成功。 弈中取得成功。
博弈模型扩展式 -回复
博弈模型扩展式-回复什么是博弈模型扩展式?博弈模型扩展式是指在传统的博弈模型基础上,通过增加相关规则、参与者或策略等因素,对博弈模型进行扩展和延伸的一种理论框架。
扩展式的博弈模型可以更好地描述现实世界中的复杂决策场景,使得博弈论在经济学、管理学、政治学等领域的应用更为广泛。
一、基础的博弈模型在介绍博弈模型扩展式之前,我们先简要回顾一下基础的博弈模型。
基础的博弈模型主要由参与者、策略和收益函数构成。
参与者根据收益函数和其他参与者的策略来选择自己的策略,并且最终根据收益函数来分配收益。
传统的博弈模型包括纳什均衡、博弈矩阵和博弈树等。
但是这些模型在描述现实中一些复杂情况时存在局限性。
二、增加的参与者在博弈模型中,我们可以通过增加参与者的数量来扩展博弈模型。
通常,博弈模型中的参与者被视为独立决策实体,他们根据自己的利益来选择策略。
然而,在现实生活中,存在许多博弈模型中没有考虑到的共同利益或合作关系。
因此,将更多的参与者纳入博弈模型可以更好地反映出现实情况中的决策情景。
例如,在环境保护领域的博弈中,传统模型只考虑了公司在追求利润最大化的同时对环境的影响。
然而,在现实中,政府和非政府组织等参与者对环境保护同样关注。
因此,我们可以通过增加政府和非政府组织等参与者,构建一个多参与者博弈模型,以更好地分析环境保护政策的制定和实施。
三、引入动态策略除了增加参与者,我们还可以通过引入动态策略来扩展博弈模型。
在传统的博弈模型中,参与者只能在某个时刻选择自己的策略,并且这个选择是一次性的,不可更改的。
然而,在现实生活中,很多决策是连续的,参与者可以根据其他参与者的策略变化来调整自己的策略。
例如,在股市投资中,投资者的决策往往是连续的,他们会根据市场走势和其他投资者的行为来调整自己的投资策略。
因此,我们可以通过引入动态策略,构建一个连续时间博弈模型,以更好地分析股市中的投资决策。
四、考虑不完全信息博弈模型扩展式还可以考虑参与者之间的信息不对称问题。
博弈论中的三个经济学模型
考虑关系式:qi*= (a-c-qj*) /2 无论qj是否最优,由 qi= (a-c-qj) /2决定的qi总是 厂商i针对厂商j产出水平的最优反应;我们称 关系式qi= (a-c-qj) /2为厂商i针对厂商j的策略的 反应函数,并记为:qi*= Ri(qj)= (a-c-qj) /2.由此 NE( qi* , qj* )必须是方程组: q1= (a-c-q2) /2 q2= (a-c-q1) /2 的解。-------------------------反应函数法
q2 a-c
R1(q2) =(a-c- q2)/2
(a-c)/2 (a-c)/3 NE R2(q1)=(a-c- q1)/2 (a-c) 3 q1
0
(a-c) 2
a-c
(二)Bertrand Model of Duopoly
*两厂商决策的相互影响在于需求函数 Di(pi ,pj)=a- pi +b pj 两厂商的产品具有一定的差异性;b是厂商i 的产品对厂商j的产品的替代系数。 ●标准式表述 1、参与人:厂商1与厂商2;他们生产同类但 存在一定差异的产品。
2、他们选择价格,Si={pi: pi≥0}; 3、他们的支付函数就是他们的利润函数: ui= ui(pi,pj) 假定两厂商 =Di(pi ,pj) pi - Di(pi ,pj) c 均无固定成本, 只有常数边际 =(a- pi +b pj) (pi-c) 成本c。 厂商i的反应函数: a+c+bpj Ri(pj) = 2
Max ui(qi ,qj*) =Max [-q 2 +(a-c-q *)q ] i j i qi∈Si qi∈Si
博弈论的经典模型
博弈论的经典模型在自然界和人类社会中广泛存在合作与竞争,而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory),也称对策论。
它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论,研究个体之间行为的相互影响和相互作用规律,它可以描述现实生活中参与者面对有限资源的合作与竞争行为。
令人惊奇的是,有三次诺贝尔奖获得者是博弈论研究方面的杰出科学家,他们是1985年获得诺贝尔经济学奖的公共选择学派的领导者布坎南,1994年获奖的美国普林斯顿大学的纳什、塞尔屯、哈桑尼3位博弈论专家以及1995年获奖的理性主义学派的领袖卢卡斯。
博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。
进入20世纪末,随着复杂网络科学的一些新的发现,博弈论也成为网络时代人们的一种思维、竞争与合作的模式。
博弈论对人有一个最基本假定:人是理性的,人在具体策略选择的目的全是使自己的利益最大化。
博弈论就是研究理性的人之间如何进行策略选择的,因此博弈论也称为对策论。
博弈论就凭这么一条最简单的假定可以展开广泛的研究,并获得了丰富多彩的结果,利用博弈论可以解读人类的社会行动或集体行动,更易理解人类社会的复杂性和特殊性。
为了刻画个体间利益的冲突对整个系统的影响,人们已经提出和发展了许多博弈模型,比较著名的有三个模型:囚徒困境、"雪堆"博弈和"少数者"博弈模型,下面笔者通过对这三个模型进行简单而通俗的介绍,让大家来了解博弈论及其应用概况。
斗鸡模型斗鸡博弈(Chicken Game).在西方,鸡是胆小的象征,斗鸡博弈指在竞争关系中,谁的胆小,谁先失败。
现在假设,有两个人要过一条独木桥,这条桥一次只能过一个人,两个人同时相向而进,在河中间碰上了。
这个博弈的结果第一种就是如果两个人继续前进,双方都会掉水里,双方丢面子,这是一种组合。
博弈论中的三个经济学模型
q2≥0
q2≥0
= maxq2[a-q1- q2 -c],
q2≥0
which yields
R2(q1) =
a- q1 -c 2
,
Provided q1< a – c. The same equation for
R2(q1) appeared in our analysis of the simultaneous -move Cournot game in Chapter 1. The difference
“重复剔除严格劣策略(iterated elimination of strictly dominated strategies)”的思路:
首先,找出某个参与人的严格劣策略,并 把它从他的策略空间中剔除,重新构造一个已 不包含该严格劣策略的博弈;
其次,剔除新博弈中某个参与人的严格劣 策略;
重复上述过程,直到只剩下唯一的策略组 合。 ——我们认为这个唯一所剩的策略组合是稳定 的。
b﹤2
思考:在Bertrand的模型中,如果两厂商的 产品是同质的,那么NE会是什么?
将是: P1*= p2*= c
Bertrand paradox
子博弈完美NE应用举例
(一)Stackelberg Mondel of Duopoly
Stackelberg(1934)proposed a dynamic model of duopoly in which a dominant(leader) firm moves first and a subordinate(or follower) firm moves second(比如在美国汽车产业发展史中的 某些阶段,通用汽车就扮演过这种领导者的角色, 只不过跟随者不只一个,如福特、克莱斯勒等). Following Stackelberg,we will develop the model under the assumption that the firms’ choose quantities, as in the Cournot model(where the fires’ choices are simultaneous,father than sequential as here ). P86
博弈论的数学模型
博弈论的数学模型作者:竺可桢学院01混合班王大方何霈邹铭摘要博弈论现在得到了广泛的应用,涉及到人的决策问题都可以用博弈论的模型加以解释。
本文首先用数学的方法表述实际生活中的博弈行为,并导出一般情况下的博弈的结果,进而讨论一些不同的外部约束条件对博弈过程的影响。
我们用经济学中的垄断竞争现象作为博弈问题的一个实例,讨论生产者在不同状态下的决策,进而分析双方共谋的动机和可能性。
(一)基本博弈模型的建立一, 博弈行为的表述博弈的标准式包括:1.1.博弈的参与者。
2.2.每一个参与者可供选择的战略集。
3.3.针对所有参与者可能选择的战略组合,每一个参与者获得的利益在n人博弈中,用Si为参与者i的可以选择战略空间,其中任意一个特定的纯战略为s i,其中任意特定的纯战略为s i,s i∈Si,n元函数u i(s1,s2,……s n), 当n个博弈者的决策为s1,s2,……s n时,表示第I各参与者的收益函数。
二, 博弈的解当博弈进入一个稳定状态时,参与者选择的战略必然是针对其他参与者既定战略的最优反应,在此状态下没有人愿意单独背离当前的局势。
这个局势叫纳什均衡:在n个参与者标准式博弈,G={ S1,S2,……S n;u1,u2,……u n}中,若战略组合{s1*,s2*,……s n*}满足对每一个参与者i,s i*是针对{ s1*,s2*,……s i-1*,s i+1*……s n*}的最优反应战略,,目标战略组合{s1*,s2*,……s n*}为该博弈的纳什均衡。
即:u i { s1*,s2*,……s i-1*,s i*,s i+1*……s n*}≥u i { s1*,s2*,……s i-1*,s i,s i+1*……s n*},对一切s i∈Si均成立。
纳什于1950年证明在任何有限个参与者,且每个参与者可选择的纯战略为有限个的博弈中,均存在纳什均衡。
(包括混合战略)混合战略指认某种概率分布来取一个战略空间中的战略,在本文中不加讨论。
博弈论的几个经典模型
博弈论的几个经典模型
a
2
引言
博弈论的应用领域十分广泛,在经济学、 政治科学(国内的以及国际的)、军事战略问 题、进化生物学以及当代的计算机科学等领域 都已成为重要的研究和分析工具。此外,它还与 会计学、统计学、数学基础、社会心理学以及 诸如认识论与伦理学等哲学分支有重要联系。
博弈论的几个经典模型
a
博弈论的几个经典模型
a
12
博弈的类型
根据参与者能否形成约束性的协议,以便 集体行动,博弈可分为合作性博弈和非合作 性博弈。纳什等博弈论专家研究得更多的是 非合作性博弈。
• 合作性博弈:是指参与者从自己的利益出发 与其他参与者谈判达成协议或形成联盟,其 结果对联盟方均有利;
• 非合作性博弈:是指参与者在行动选择时无 法达成约束性的协议。人们分工与交换的经 济活动就是合作性的博弈,而囚徒困境则是 非合作性的博弈。
博弈论的几个经典模型
a
7
引言
博弈论的出现只有60多年的历史。博弈 论的开创者为诺意曼与摩根斯坦,他们1944 年出版了《博弈论与经济行为》。博弈论天 才纳什(Nash)的开创性论文《n人博弈 的均衡点》(1950)、《非合作博弈》(1951)等 等,给出了纳什均衡的概念和均衡存在定理。 今天博弈论已发展成一个较完善的学科。
第四章 博弈论的几个经典模型
讲授人 谭建国
a
1
引言
博弈论又被称为对策论(Game Theory), 按照2005年因对博弈论的贡献而获得诺贝尔经 济学奖的Robert Aumann教授的说法,博弈论 就是研究互动决策的理论。所谓互动决策, 即各行动方(即局中人[player])的决策是相互 影响的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也需要 把别人对于自己的考虑也要纳入考虑之 中……在如此迭代考虑情形进行决策,选择 最有利于自己的战略(strategy)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
U : Z R n , U ( z ) (u1 ( z ),u 2 ( z ), , u n ( z )), z Z
5. 信息集与信息集分割 信息集由同一个局中人、在相同的时点上的具有相同信息 的决策节点组成。用 I ik (i 0,1,2, , n, k 0,1,2, , ri )表示局中 人i的第k个信息集。它满足 I (1) ik ( 表示空集); (2)从博弈起始点到任一终点的路径至多与 I ik 交一点 (描写同一信息集中的节点处于同一时点上); (3)从 I ik 中的任一节点出发,局中人i可能选择的行动集 合都相同(因为局中人在同一信息集的不同节点上具有相 同的信息)。 在博弈树上,将属于同一信息集的节点用虚线框在一起。 称 I i {I i1 , I i 2 , ,I ir } 为局中人 i( 0,1,2, , n) 的信息集类(在数 学上,称以集合为元素的集合为类)。 称 I {I 0 , I1 , I 2 , ,I n } 为信息集分割。
为什么学习?
从学习中获得心灵的提高,获得心灵的享受。 学习,其实就为自己创造一个美丽的心灵世界的过程。 有人说,我也没什么追求,就学一点实用知识就行,但问题是, 你没有那些“无用”的知识,你怎么驾驭哪些实用的知识呢? “世人只知有用之用,而不知无用只用”。 很多人30岁后就不再读书,到60岁还是30年前的思维;很多人感 慨“现在一读书就头痛”;农村现在不要为生存而挣扎了,那做 什么呢?“我不打牌又做什么呢?” 每个人都生活在现实的物质世界和心灵的精神世界中,但很多人 只知现实世界的繁华,却不知心灵世界的清新和高远。行万里路、 读万卷书,就是为追求心灵世界。这些年我深刻体会到:生活的 基础是衣食住行,但生活的重点在于文化和精神。我不知道文化 有什么用,我只知道一个人没有了文化还有什么用呢? 教师的功能:催化剂(使学生更快速更深入地学习) 大医医心:能医心者,才是大医。
4.局中人所能选择的行动;
5. 局中人在选择行动时所了解的信息。 6.局中人的支付。
构造博弈模型所需要的要素
1.局中人集合
N 0,1,2,, n ,称 N 为局中人或参与人集合。N 中元素称为参与人或局 中人。参与人不专指人,它泛指参与博弈活动的政府、企业、地区、国家、 个人……等决策主体。通常用“0”表示虚拟局中人,它的行为是以确定的 概率分布进行随机选择, i 1,2, , n 表示实际参与人。
例1.1 考虑按以下步骤进行的博弈活动。 第1步 局中人1从字母T,H中选一个; 第2步 局中人2不知第1步的选择,再从H,T中选一字母; 第3步 局中人知道1,2两步的选择,又从T,H中选一字母; 第4步 局中人2不知第3步的选择,但知1,2两步的选择,最后 从T,H中选一字母,博弈结束。按照每步选择的结果,每个局 中人各得一笔报酬(略)。 该博弈的局中人集合 N {1,2.} 该博弈的信息集合分别为I {I1 , I 2 } ,其中 I1 {I11, I12 , I13,I14 , I15}, I 2 {I 21, I 22 , I 23,I 24 , I 25} 。
3.博弈树
对于有限博弈,可用博弈树直观地刻画它,市场进入问题的博弈树如图1-1 所示(见p2上的例子)。
旺 盛
I ① 01
疲软
①
进 入② 容 许 不 进 容 许 进 入② 抵 制
①
不 进
图1-1 市场进入博弈树
4. 支付向量 博弈树中终点Z下面的向量 u (u1,u 2 , , u n ) 称为支付向 i( 1,2, , n) 个分量表示博弈结束于Z时,局中 量,它的第 人i所得的支付。支付可表示参与人的某种收益或损失。本书 中的支付指收益、效用、利润等。正式地,支付向量是终点 集合Z到n维向量集合R n 的映射。
第1章 博弈论基本模型
(Game Theory)
华侨大学商学院
什么是学习?
学习的三个层次(大学之道,在明明德,在亲民,在止于至善)
专业学习:谋职、谋生(身无长物、何以生存)。 事理学习:明白事理、懂得分析生活中的很多问题。(崔琦: 明白这个世界是一个什么样子,这很重要)。一个人,其实只 要懂得了加减乘除四则运算,就可以挣到钱买房买车,在物质 世界中生活的很好。但这只是像一个盲人一样在生活,“春天 来了,但我却看不到” 。(明明德) 人生学习:充实人生、提高人生的境界、把学习融入人的生活 中。人不是做事和挣钱的工具,而是宇宙中的有血有肉的生灵, 需要提高生活的趣味,享受趣味化的人生,这就需要学习。一 个人,不会欣赏《二泉映月》,不会感受过禅宗的静谧,从来 也不思考什么是天行健,好像也是在生活。看看很多人下班后 在做什么?打牌、或者歌厅洗脚房等,当衣食住行解决了之后, 就不知怎么过了,只有赌博和玩乐,却找不到真正的趣味。 (身体在成长、心灵也在成长吗?)(新民) 仰望星空
T ② T ① I12 T ② I 22 T H T H ② HT T ② H H ① ①
I11
H ② T H ① I15 T ② H T ② I 25 H T H ② H
I 21
I13
H T ② T H ② T
① I14 H
I 23
I 24
H T
图1-2
信息集可以告诉我们以下4点 1.在一个信息集上应由哪个参与人选择行动。 2.从一个信息集出发,局中人可能选择哪些行动。 3.局中人在一个信息集上选择行动时已知道了哪些信息。 4.单点信息集表明相应的局中人完全了解博弈从开始到该信息 集的博弈历程。 完美信息博弈 如果G的每个信息集都是单点信息集。表明博弈的每个参与人 在选择行动时对博弈到现在为止的历程都完全了解,这时称G 为完美信息博弈。 扩展型博弈不仅能刻画动态博弈,也能刻画静态博弈
2.行动集合
称参与人 i N在博弈中所有可能选择的行动构成的集合 A i 为局中人i的行 动集合。 A i中的元素 a i 称为局中人i 的行动。 局中人的行动集合可能是有限集,也可能是无限集。如果博弈活动中每个 局中人的行动集合都是有限集,且每个局中人行动的次数也是有限的,称 该博弈为有限博弈。
博弈论的创立与发展
第三阶段:大发展期(20世纪50’s—90’s)。非合作博弈以及合作博弈的理论获得了 空前的发展。 纳什(Nash,1950)——n人非合作博弈及提出博弈均衡的定义 塔克(A Tucker)——提出“囚徒困境”(prisoner’s dilemma)模型 泽尔腾(Selten,1965)——提出精练子博弈纳什均衡概念,并把这一概念引入到了 动态分析之中 海萨尼(J.Harsnyi,1967~1986)——提出贝叶斯纳什均衡概念,并把这一概念引入 不完全信息博弈模型研究 泽尔腾(Selten ,1975),克瑞普斯(Kreps,1982)和威尔森(Wilson,1982)。 弗得伯格(Fudenberg,1991)和泰勒尔(Tirole,1991)研究了精练贝叶斯纳什均衡, 解决动态不完全信息博弈。泽尔腾定义了“颤抖手均衡”(trembling hand equilibrium); 克瑞普斯和威尔森定义了“序贯均衡”(Sequential equilibrium)并提出了著名的“信誉” 问题模型;弗得伯格和泰勒尔给出了“精练贝叶斯均衡”的正式定义。 颤抖手均衡>序贯均衡>精练贝叶斯均衡(但在许多情况下,三个概念是一致的) 博弈论近期发展:除了博弈论与信息经济学的结合外,还出现了新的理论与应用分 支诸如博弈学习理论、进化(演化)博弈论、博弈论与新制度经济学、博弈论与行为科学、 博弈论与实验经济学、博弈论与组织管理的结合。
囚徒困境(Prisoner’s dilemma)
博弈论的创立与发展
1、博弈论思想最早产生于我国古代
2000多年前的春秋时期孙武在《孙子兵法》中论述的军事思想和治 国策略,就蕴育了丰富和深刻的博弈论思想。 田忌赛马:齐威王的上、中、下马分别优于大将田忌的上、中、下, 但田忌上马、中马分别优于齐威王的中、下马。比赛规则:每次双方各 出三匹马,一对一比赛三场,第一场的输方要赔一千金给赢方。 齐 田忌策略: 田 结 果: 齐 谋士孙膑 策略: 田 结 果: 上马 ∨ 上马 中马 ∨ 中马 下马 ∨ 下马
静态扩展型博弈的例子
例1.2 两个参与人同时从字母T,H中选择一个,博弈结束时 两个参与人各得一笔支付,该博弈的博弈树如图1-3所示。 练习:写出剪刀-石头-布的博弈树。
T ② T H 图1-3 ①
I11
H ② T H
I 21
囚徒困境问题:p11 例1.6 完全信息:博弈各方对各个节点的 支付都很明了. 完美信息:博弈各方对博弈进行的路 径都很明了,完美信息这一概念只用 于动态博弈。
1.1 有限扩展型博弈模型
博弈模型的构建 应用博弈论方法分析研究问题,首先要构造出博弈模型来,因 而需要从大量的博弈活动中抽象出博弈模型的基本要素,对这 些要素进行严格、准确的刻画后,形成博弈模型。 将博弈活动构造成博弈模型,需要了解以下6个方面的情况:
1.局中人;
2.外生事件的概率分布; 3.局中人选择行动的次序;
田忌将军每次输掉三千金 上马 ∨ 下马 中马 ∧ 上马 下马 ∧ 中马
田忌将军胜二负一赢一千金
博弈论的创立与发展
2、博弈论的发展阶段 第一阶段:萌芽期(20世纪40年代前)。利益冲突的研究是分散和初 步的、带有很大程度的随意性。 孙子兵法:古诺(Cournot,1883)—古诺的“双寡头垄断”模型;艾 奇 沃 思 (F.Y.Edgeworth , 1925)——“ 双 寡 头 等 分 市 场 ” ; 霍 特 林 (H.Hotelling,1929)——产品差异而引起的“价格竞争”模型;斯塔克 尔伯格(H.V.Stackelberg,1934)——“领导——跟随(leader—follower)” 模 型 ; 斯 威 齐 (P.M.Sweezy , 1939)——“ 折 弯 的 需 求 曲 线 (Kinky Demand Curve)”模型等等。 第二阶段:创立期(20世纪40年代)。博弈论首次系统地被引入经济 学。 1944年冯· 诺依曼(Von.Neuman)和摩根斯坦恩(Morgen Stlern)合作 出版了《对策论与经济行为》,从而奠定了合作博弈的理论与方法。