海滩占位模型博弈论
博弈论(第一、二章)
游戏2:摘柿子
甲 跑
摇 跑
乙
摇 跑
甲
摇
乙 跑
摇 跑
甲
不跑 (2,2)
(0,0)
(0,1) (2,0)
(0,3) (4,0)
游戏3:免费彩票博弈
每个人可以免费购买任意数量彩票,随机 抽取1张彩票中奖,奖金总额为1000万元/n,n 为彩票数量。
博弈论:研究理性人行为选择的理论
博弈论作用:帮助个人、组织等决策主 体深刻理解策略并明智的选择行动。
第二章 完全信息静态博弈
� 基本分析思路和方法 � 纳什均衡 � 混合策略 � 纳什均衡的选择
第一节 基本分析思路和方法
行动或策略(acቤተ መጻሕፍቲ ባይዱion or strategy)
si:局中人i的一个特定策略 Si:局中人i的策略集(strategy set)或策略空间 (strategy space),可以是离散的或连续的。
纳什的基本贡献是证明了非合作博弈均衡解 及其存在性,建立了作为博弈论基础的“纳 什均衡”概念;海萨尼则把不完全信息纳入 到博弈论方法体系中;泽尔腾的贡献在于将 博弈论由静态向动态的扩展,建立了“子博 弈精练纳什均衡”的概念。
1996莫里斯(James A.Mirrlees)和维克瑞(William Vickrey)
游戏1:军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1
C -1 +1 +1
游戏1:军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1
大学课程《博弈论及其应用》PPT课件:第一章
• 博弈方:两个嫌疑犯A和 B。 • 策略: 每个嫌疑犯的行动集是(坦白,不坦白)。 • 收益:对应于每种策略组合,有相应的收益结果。 • 策略组合:嫌疑犯A和B从可以选择的策略中选择并实施,有四种
情况(括号中前面是A的策略,后面是B的策略)。 • 每个策略组合对应下的A的结果,从优到劣,依次为: • (坦白,不坦白),结果是A被释放; • (不坦白,不坦白),A被判刑1年; • (坦白,坦白),各被判5年; • (不坦白,坦白),A被判8年。 • 同理,每个策略组合对应下的B的结果,从优到劣,依次为: • (不坦白,坦白)、(不坦白,不坦白)、(坦白,坦白)、(坦白,不坦
第一章 博弈概述
2021/11/19
第一节 海滩占位问题
我们来到海滩。夏天很多游客喜欢在在海边晒太阳,游泳。海滩有 月牙形,弧形,绵延数公里。为了研究问题方便,我们姑且把海滩 的长度抽象定为1,[0,1]区间就表示海滩的长度。 A和B是两个小商 贩,出售无差异的补给品,同质同价,同一品牌的矿泉水,面包等 。“*”表示游客均匀的分布在海滩上,游客就近购买补给品。在 沙滩上应该如何分布两个小商贩的位置呢?
• A猎兔,B猎兔,鹿逃掉,A收益一只兔子,B收益一只兔子。
• 可见,每个猎人的期望,不能由自己决定,要看对方的策略选择 ,是能够捉得到鹿,依赖对方的选择,如果对方选择捉兔子,而 你选择猎鹿,这个策略组合,对你而言,是最差的选择,也是最 坏的策略。
2021/11/19
第三节 博弈论是什么
• 博弈论:就是关于包含相互依存情况中理性行为的研究。 • 博弈的三要素: • 博弈方----参与博弈但利益不完全一致者。有二人博弈与多人博弈
的故事,它的重要性在大量情形中体现,参与者面临着与故事中嫌 疑犯面临的同样的动机。
十大经典博弈论模型
十大经典博弈论模型博弈论是一门研究决策者之间互动的学科,其应用范围广泛,涉及到经济、政治、生物学等领域。
在博弈论中,经典博弈论模型是基础和核心,以下是介绍十大经典博弈论模型:1. 囚徒困境博弈模型囚徒困境博弈模型是博弈论中最为著名的模型之一,也是最为典型的非合作博弈模型。
该模型主要讲述的是两个囚犯被抓后面临的选择问题,如果两个人都招供,那么都将受到较重的惩罚;如果两个人都不招供,那么都将受到轻微的惩罚;如果一个人招供而另一个人不招供,那么招供的人将受到宽大处理,而另一个人将受到较重的惩罚。
2. 零和博弈模型零和博弈模型是博弈论中最为简单的模型之一,其特点是参与者之间的利益完全相反,即一方获得利益就意味着另一方的利益受到损失。
在这种情况下,参与者之间的互动往往是竞争和对抗的。
3. 博弈树模型博弈树模型是一种用于描述博弈过程的图形模型,它可以清晰地展示出参与者在不同阶段的选择和决策,以及每个选择所带来的收益和风险。
4. 纳什均衡模型纳什均衡模型是博弈论中最为重要的概念之一,它指的是一个博弈中所有参与者都采取了最优策略的状态。
换句话说,如果所有参与者都遵循纳什均衡,那么任何一个人单方面改变策略都将无法获得更多的利益。
5. 最小最大化模型最小最大化模型是一种解决零和博弈问题的方法,其思想是在所有可能的情况中,选择让对手收益最小的情况,从而实现自己的最大化收益。
6. 帕累托最优解模型帕累托最优解模型是一种解决多人博弈问题的方法,其核心思想是通过合作和协商,使得所有参与者都能获得最大的收益,而不是只有某个人获得了最大的收益。
7. 博弈矩阵模型博弈矩阵模型是一种常用的博弈论分析工具,它可以清晰地展示出参与者在不同策略下的收益和风险,从而帮助参与者做出最优决策。
8. 拍卖模型拍卖模型是博弈论中的一个重要应用领域,其目的是通过竞价的方式,让参与者以最低的价格获得所需的商品或服务。
9. 逆向选择模型逆向选择模型是一种解决信息不对称问题的方法,其核心思想是通过知道对方的信息,来预测对方的行为和决策,从而做出最优策略。
博弈模型解决方案
博弈模型解决方案
《博弈模型解决方案》
博弈模型是一种用于分析决策制定和竞争情景的数学工具。
在许多领域,例如经济学、政治学和生物学中,博弈模型都被广泛应用。
通过建立数学模型来描述各方的利益和策略选择,博弈模型可以帮助决策者做出最佳的决策。
博弈模型解决方案是一种利用博弈论原理来解决实际问题的方法。
在博弈模型中,各方的利益和对策都会被建模,并且通过计算和分析来找到最优的策略。
这种方法可以应用到很多领域,例如竞争策略、投资决策和资源分配等问题中。
在博弈模型解决方案中,常用的方法包括纳什均衡、博弈树和博弈矩阵等。
纳什均衡是指在博弈中各方选择的策略是最优的,并且在互相了解对方策略的情况下不会改变。
博弈树是一种图形化工具,用于描述博弈过程和各方的决策路径。
博弈矩阵则用来清晰地展示各种情景下各方的策略选择和最终结果。
通过这些方法,博弈模型解决方案可以帮助人们更清晰地分析和理解各种竞争和决策情景。
通过对各方利益和策略的深入分析,我们可以更好地做出决策,最大化自己的利益并且减少风险。
因此,博弈模型解决方案是一种重要的工具,可以帮助我们更好地应对各种决策和竞争情景。
博弈模型分析范文
博弈模型分析范文博弈模型分析是研究博弈论的一种方法,通过分析参与博弈的各方的利益和策略选择,来推断博弈的结果及其影响因素。
博弈模型能够帮助了解决策者的行为动机,预测博弈结果以及寻找策略的改进空间。
下面将详细介绍博弈模型分析的步骤和应用。
第一步:定义博弈参与者,即博弈的主体。
参与者可以是个人、团队、企业或国家等。
第二步:确定参与者的策略空间。
策略是参与者在博弈中可以采取的行动。
策略空间则是所有参与者可能的策略组合。
在确定策略空间时,需要考虑参与者的限制条件和能力。
第三步:建立效用函数。
效用函数是博弈参与者对不同结果和策略的偏好程度的量化表示。
通过建立效用函数,可以分析参与者的动机、目标和行为。
第四步:制定收益矩阵。
收益矩阵是对博弈参与者在不同策略组合下可能的收益或成本进行展示的矩阵。
收益矩阵可以帮助分析博弈参与者选择不同策略的概率。
第五步:找到均衡解。
均衡解是指在博弈中不存在任何参与者可以改变自己的策略来获得更好收益的状态。
常见的均衡概念包括纳什均衡、帕累托最优解等。
通过寻找均衡解,可以预测博弈的结果和可能出现的情况。
1.经济领域:博弈模型可以应用于市场竞争、定价策略、合作与竞争等经济问题的分析。
例如,博弈模型可以用于分析企业之间的定价策略,预测市场价格的稳定性,同时帮助企业制定合理的竞争策略。
2.政治领域:博弈模型可以应用于政治家、政党及国家之间的决策分析。
例如,博弈模型可以用于分析选举策略、政府决策的权衡及外交策略的选择。
3.环境领域:博弈模型可以应用于环境保护、资源分配、排放管理等环境问题的研究。
例如,博弈模型可以用于分析各方在资源分配中的决策行为,预测不同策略对环境的影响,并提出合理的管理政策。
4.决策分析:博弈模型可以应用于决策分析中,帮助决策者理解和预测各方行为,并制定最优决策策略。
例如,在商业决策中,博弈模型可以用于分析市场竞争、产品定价等问题,帮助企业做出最优的决策。
总结来说,博弈模型分析是一种重要的决策分析工具,通过对博弈参与者的动机和策略选择进行细致分析,可以帮助理解和预测博弈的结果,并为决策者提供策略改进的空间。
博弈论和企业策略行为
科 威 特
什均衡
增产 保持
沙特 增产 保持 (5, 5) (7, 4) (4, 7) (6, 6)
同步行动和纳什均衡
纳什均衡旳关键:无人乐意打破僵局 给定一种状态,是否有人单独乐意去变化?
沙特
纳什均衡点
科
增产 保持
威 增产 (5, 5) (7, 4) 特
保持 (4, 7) (6, 6)
大小猪博弈
企业1
扩大 不变
-500,-500 0,1000
1000,0 0,0
2.价格竞争:伯川德模型和动态
价格博弈模型
假定两个企业生产旳产品相同,边际成本都是10元。 两个企业都只存在1期(静态旳含义),两个企业 同步行动来决定各自旳产品价格。因为两个企业旳 产品完全相同,能够完全替代,所以消费者就会购 置价格低旳产品。这意味着,两家企业谁旳价格低 就会赢得整个市场。在这种情况下,两家企业将把 价格都定为10元这一边际成本水平。这使得企业最 多只能取得零水平旳利润,假如前期有沉淀投入旳 话,那么还将造成损失。
第二个原则:不让代理承人担过多其本身难以控制 旳风险。
第三个原则:尽量使委托人和代理人旳目旳相一致。 也就是说,应该使代理人旳自利行为同步也是委托 人希望代理人采用旳行为。所以,这一原则又被称 为是鼓励相容原则。
三、企业治理构造
一般来说,企业不是由出资人个人,而是由 一种企业治理构造(corporate governance) 来经营和管理旳。所谓企业治理构造,是指 由全部者、董事会和高级经理人员三者形成 旳一种组织构造。在这一构造中,上述三者 之间形成一定旳制衡关系。
北京新兴医院旳例子
三、 既有企业和新进入者之间旳博 弈——进入和退出
1. 构造性旳进入障碍 关键资源旳控制 规模经济 既有企业旳指企业经过收取低于进入 发生时旳价格来防范进入。
博弈模型-数模
* * * s s ( s , s 优战略是 =坦白。因此,囚徒困境问题的解是 1 2 ) =(坦白,坦白)。
* 2
注释:这正是囚徒困境的“困境”两个字的体现,如果用经济学中的“有效” 的术语的意思来讲,(沉默,沉默)是一个有效结局。有效结局并不是囚 徒问题的博弈解。这体现了个人利益和全体利益的矛盾。
* * * * s ( s , , s , , s 的解,则战略组合 1 i n ) 称为博弈 G 的一个解或纳什均
衡。
注释:研究博弈问题就是建立博弈模型,求解博弈的纳什均衡,下面我们用实例来说明我们的理论及应用
信息
信息指的是参与者在博弈过程中能了解到和观察到的知识。这些知识包括 “自然”的选择,其他参与者的特征和行动等。信息对参与者是至关重要 的,因为一个参与者在每一次进行决策之前,必须根据观察到的其他参与 者的行动和了解的有关情况作出自己的最佳选择。 由于信息内涵的不同,派生出各种有关信息的概念将博弈论划分成不同的 类型,因此寻求博弈间的方法也不同。这里只就信息有关的两个基本的、 重要的概念进行讨论。 首先,关于“共同知识”的概念。一个博弈问题所涉及的“自然”的不同 选择、参与者的行动以及相应产生的效用(效果、收益)都是一种知识( 信息)。博弈论所谓的共同知识指的是“所有参与者知道,所有参与者知 道所有参与者知道,所有参与者知道所有参与者知道所有参与者知道 ……”的知识。
(1)参与者
参与者指的是一个博弈中的决策主体,通常又称为参与人或局中 人。 参与者参加博弈的目的是通过合理选择自己的行动,以期取得最大化自己的收 益(或效用)水平。参与者可以是自然人,也可以是企业、团体、国家,甚至 是国家组成的集团(如欧盟、OPEC等)。对参与者而言,在博弈过程中,他 必须有不同的行动可作应对选择。在博弈的结局中,他能知道或计算出各参与 者不同的行动组合产生的效益(或效用)。 博弈参与者集合一般表示为 {1, 2,, n}
《博弈论》精品讲义
Si,i1 ,2, ,n
和这些局中人各自的支付(盈利)函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为:
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明 公正無私
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
20
策略型表述: (两人有限博弈;Fra bibliotek阵形式)高需求情况
B
A
低需求情况?
博弈论20092009
正大光明 公正無私
21
➢房地产博弈分析
假设:同时决策;市场需求双方已知
若市场需求大,双方开发,各得0.4万元。 若市场需求小,依赖于对方行动。 若市场不确定,依赖对市场的判断及对方行动。
博弈论20092009
正大光明 公正無私
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
意5个数。如果不重复则得奖;否则受罚。 获胜的秘诀是什么?
博弈论20092009
博弈论简单支付矩阵
(1)田忌赛马 一等马 二等马 三等马
二等马
三等马 一等马
输
输 未知
未知
输 赢
赢
未知 赢
正确的博弈策略可以反败为胜。
(2)合纵连横
2000多年前,雄才大略的秦始皇第一次统一了中国大地,并创建了当时世界上 最庞大的帝国,得以名垂青史。从当时的历史条件来看,秦国虽然在商鞅变法之后 实力大增,但其经济、政治、军事实力是远远不能与六国总和相匹敌的。七国之中, 只有齐国实力比秦国稍逊一筹,成为六国军事同盟的核心。
小猪 踩 不踩
踩
大 猪 不踩
7,3
9,1
6,4
0,0
小猪
踩 不踩 3,4 0,0
大 猪
踩 不踩
4,0 9,-2
4、斗鸡博弈
B 进 进 A 退 -3,-3 -1 ,2 退 2, -1 -1 , -1
B 直驶 直驶 A 转弯 撞车,撞车 转弯 男子汉, 胆小鬼
胆小鬼 ,男子汉 胆小鬼 , 胆小鬼
5、军备竞赛
2001:阿克洛夫(Akerlof)、斯宾塞(Spence)、斯蒂格利茨
这三位作为不对称信息市场理论的奠基人被授予诺 贝尔经济学奖,以表彰他们分别在柠檬品市场等不 对称信息理论研究领域做出的基础性贡献。这些贡 献发展了博弈论的方法体系,拓宽了其经济解释范 围。
2002:弗农史密斯(Smith)
贡献主要在于通过实验室实验来测试根据经济学理 论而做出预测的未知或不确定性。是对以博弈论为 基础构建的理论模型进行实证证伪工作的一大创举 。
(3)、旅行者困境
两个旅行者花瓶被摔坏,向航空公司索赔。航空公司知道价 格约为八九十元,但不知道确切价格。于是请两位旅客在 100元 以内自己写下花瓶的价格。 如两人写的一样,就认为他们讲真话,并按所写数额赔偿; 如果两人写的不一样,就认定低者讲真话,并照此价格赔偿。同 时,对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。 理性原则下,他们会写多少价格呢?
博弈论的几个经典模型PPT课件
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
N
高成本
低成本
A
默许
阻挠
A
默许
阻挠
B
B
B
B
进入 不进入 进入 不进入 进入 不进入 进入 不进入
(50,40)(300,0)(0,-10)(300,0)(100,30)(400,0)(140,-10)(400,0)
*贝叶斯纳什均衡
模型二、囚徒困境/非合作博弈
有两个小偷A和B联合犯事、私入民宅被 警察抓住。警方将两人分别置于不同的两个 房间内进行审讯,对每一个犯罪嫌疑人,警 方给出的政策是:如果一个犯罪嫌疑人坦白 了罪行,交出了赃物,于是证据确凿,两人 都被判有罪。如果另一个犯罪嫌疑人也作了 坦白,则两人各被判刑8年;如果另一个犯罪 嫌人没有坦白而是抵赖,则以妨碍公务罪(因 已有证据表明其有罪)再加刑2年,而坦白者 有功被减刑8年,立即释放。如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪,但 可以私入民宅的罪名将两人各判入狱1年。
为个人)他自己的最好策略,还是采用(作为集 体的一员)他们共同的最好策略?前者导致均衡 策略(坦白,坦白),支付为(-8,-8);后者的最 好策略是(抵赖,抵赖),支付为(-1,-1)。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
四,杀鸡给猴看。其实猴子是没有思维的,它们 有一定的群体意识,但没有社会意识,人们关 于它们的故事其实是说人自己的。我们这里也 讲一个猴子的故事……。
博弈论的几个经典模型课件
02
在这个模型中,如果双方都抵赖,则各自获得2年的监禁;如果双方都坦白,则 各自获得3年的监禁;如果一方坦白而另一方抵赖,则坦白的一方获得1年的监 禁,抵赖的一方获得10年的监禁。
03
囚徒困境反映了人类在有限理性和不完全信息下的决策问题。
囚徒困境的策略和最优解
01
02
03
在囚徒困境中,每个参 与者都有两种策略:坦
博弈论的发展趋势和应用前景
发展趋势
随着计算机科学的发展,博弈论在人工智能、机器学 习等领域的应用逐渐增多。同时,博弈论也在生物学 、环境科学、社会学等多个学科中得到广泛应用和发 展。未来,博弈论将继续探索更为复杂和现实的模型 ,以解释和预测更为复杂的行为和现象。
应用前景
博弈论在经济学、政治学、军事等领域有着广泛的应 用前景。例如,博弈论可以帮助理解国际贸易中的策 略行为、国际政治中的权力均衡以及军事战略中的最 优攻击策略等。此外,博弈论也在社交网络分析、市 场机制设计等领域展现出强大的应用潜力。
政治学中的应用
投票悖论
投票悖论是指在某些情况下,多数投票的结 果可能导致无法达成一致意见或产生不合理 的结果。在政治学中,投票悖论被用于探讨 民主制度的缺陷和改进方法。
权力均衡
权力均衡是一种政治博弈模型,它描述了政 治权力在多个参与者之间的分配和转移。在 政治学中,权力均衡被用于分析权力斗争、
政治制度稳定性和政策制定等问题。
纳什均衡模型被广泛应用于市场均衡、产业组织、公共经济学
等领域。
生物学
02
纳什均衡模型也被用于解释生物种群竞争、生态系统平衡等问
题。
社会学
03
纳什均衡模型可以用来分析社会现象,如犯罪、婚姻、教育等
博弈模型-数模
* * * s s ( s , s 优战略是 =坦白。因此,囚徒困境问题的解是 1 2 ) =(坦白,坦白)。
* 2
注释:这正是囚徒困境的“困境”两个字的体现,如果用经济学中的“有效” 的术语的意思来讲,(沉默,沉默)是一个有效结局。有效结局并不是囚 徒问题的博弈解。这体现了个人利益和全体利益的矛盾。
现在,让我们试问一下,这个传教徒告诉了这些丈夫们他们所不知 道的什么?每个丈夫都已经知道了99个不贞的妻子,故这对任何人来 说都不是新闻。但“这个传教徒对所有男人做了一个声明”是共同知 识,从而这个传教徒所声明的内容,即有一个不贞的妻子,也就成了 所有男人中间的共同知识。在传教徒宣告之前,每个形如“(每个丈 夫知道)有一个不贞的妻子”的判断对于99都是正确的,但对100就 不正确了。
(3)收益函数
在博弈论中,收益指的是在一个特定的战略组合下参与者得到的确定效 用或期望效用。效用通常表现为博弈结果中输赢、得失、盈亏。效用必 须能用数值刻画其大小。收益是博弈参与者真正关心的问题 。 注释:博弈论的一个基本特征是一个参与者的收益不仅取决于自己的战略选 择,而且取决于所有参与者的战略选择。或者说,收益是所有参与者各选 定一个战略形成的战略组合的函数。 在博弈论中,通常用ui表示参与者i的收益,一个战略组合是,每个参与者 的收益可以表示为
* * * * s ( s , , s , , s 的解,则战略组合 1 i n ) 称为博弈 G 的一个解或纳什均
衡。
注释:研究博弈问题就是建立博弈模型,求解博弈的纳什均衡,下面我们用实例来说明我们的理论及应用
信息
博弈模型扩展式
博弈模型扩展式博弈论是研究决策者在竞争、合作或冲突情境下的决策和行为的数学模型。
博弈模型的应用广泛,涉及经济学、政治学、生态学、社会学等多个领域。
在博弈论中,研究者通过建立数学模型来描述不同参与者之间的策略选择和行为结果,以揭示他们之间的互动和决策规律。
在此基础上,博弈模型的扩展式不仅包括了传统的零和博弈、非合作博弈等模型,还融入了更多实际情境下的因素和特征,使得博弈模型更加贴近实际、具有更强的预测和分析能力。
本文将对博弈模型扩展式进行探讨,旨在深入了解博弈论在不同领域的应用以及未来的发展方向。
一、博弈模型扩展式的基本原理博弈模型扩展式基于博弈论的基本原理,强调了在模型建立过程中,需要考虑更多的实际情境和因素,使得模型更加贴合实际场景。
传统的博弈模型通常建立在完全信息和理性参与者的假设基础上,但在实际情况中,参与者可能存在信息不对称、有限理性等情况,因此博弈模型扩展式需要考虑这些因素对决策和结果的影响。
博弈模型扩展式还需要考虑时间因素、空间因素、不确定性、复杂性等实际情境中常见的特征,从而使模型更加全面和有效。
二、博弈模型扩展式的应用领域1. 经济学领域博弈模型在经济学领域的应用非常广泛,涉及到市场竞争、定价策略、合作博弈等多个方面。
博弈模型扩展式将传统的利润最大化或效用最大化的假设融合了更多的实际市场情境因素,如不完全信息、交易成本、市场结构等,使得模型更贴合实际市场竞争情景,对企业和政府的决策提供了更准确的指导。
2. 政治学领域在政治学领域,博弈模型扩展式被广泛应用于描述国际关系、政治决策、游说活动等方面。
通过考虑领导人的政策选择、外交策略、冲突协调等情形,博弈模型扩展式为研究者提供了更多的分析工具,帮助理解国际政治事件及国际关系的发展。
3. 生态学领域生态学领域的研究者也开始利用博弈模型扩展式来研究物种协作、资源分配、环境保护等问题。
考虑到自然环境的复杂性和不确定性,博弈模型扩展式可以更好地描述物种之间的相互作用、资源竞争的演化规律,对生态系统的保护和管理具有重要的指导意义。
最新运筹学第13章-博弈论(1202版)教学讲义ppt课件
第1节 博弈论概论│什么是博弈论
1.1.2 引例 海滩选址博弈
海洋
海滩
0
B
C
A
200码
两个竞争者Y和C销售软饮料 日光裕者均匀分布在海滩上 Y和C价格相等 消费者从较近的售点购买饮料
第1节 博弈论概论│什么是博弈论
1.1.2 引例 海滩选址博弈
在中国的大城市里,你会发现一个有意思的现象,当你在街边看到一个肯德基后,相距不太远的距 离你会发现一个麦当劳
1.3.1 博弈论的两种表示方法
L 2
S
1
L
S
5, 1
4, 4
9, -1
0, 0
战略式表述 (strategic form representation) 多用矩阵
(2,2) L
L 1
S
2 S
L 2
S
(-1,-1) (-1,-1)
(1,1)
扩展式表述 (extensive form representation) 多用博弈树
B在决策时不确切地知道自然的选择;B的决策结由4个变为2个
A
开发
不开发
B
开发
N
大
1/2
不开发
小
1/2
B
B
开发
不开发 开发
大
1/2 不开发
N
小 1/2
不完全信息 博弈
B
开发
不开发
(4,4)
(8,0) (-3,-3) (1,0) (0,8)
第1节 博弈论概论│博弈论表示方法
1.2.2 博弈论的表示方法示例
案例:房地产开发项目,假设有A、B两家开发商,市场需求可能大,也可能小,投入需要1亿。 假定市场上有两栋楼出售:需求大时,每栋售价1.4亿;需求小时,每栋售价7千万 如果市场上有一栋楼出售:需求大时,每栋售价1.8亿;需求小时,每栋售价1.1亿
博弈论海滩问题证明题
博弈论海滩问题证明题
著名的沙滩博弈,两个人在一条均匀的沙滩上设店,其中纳什均衡是两个人都在中点。
如果这个时候,有三个人要开店,那要怎么求这个题目?书上说了没有纳什均衡,但是要怎么去解这个思路?
关键点在于三个人是完全相同的且全部足够理性,只有保证每个人平均能覆盖三分之一的顾客的解才可能是纳什均衡,所以没有纳什均衡,完全相同是说三个人是对称的,不分顺序的,这就导致最后的解只能有两种可能:
1.三个人在同一点开店
2.三个点的地址都不同
这样就排除了两个店在同一点第三个店在另一点的情况
第一种情况不可能因为只要一个店稍微偏离一点就可以获得更高的利润,第二种情况也不可能,由对称性很容易可以解出此种情况下的三者位置分别为六分之一,二分之一,六分之五。
但是很容易验证,这不是纳什均衡。
(完整word版)经典的博弈论分析案例——“海盗分金”问题
经典的博弈论分析案例一一“海盗分金”问题5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。
“海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。
在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。
假设前提假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。
所以,4号惟有支持3号才能保命。
3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。
不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3 号,而给予4号和5号各一枚金币。
由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。
这样,2号将拿走98枚金币。
同样,2号的方案也会被1号所洞悉,1号并将提出(97, 0,1, 2, 0)或(97, 0,1, 0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。
由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。
这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。
分配方案可写成(97, 0, 1, 2, 0)或(97, 0, 1, 0, 2)。
分析1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。
海滩占位模型博弈论
8
示例
3、四年一度的美国总统竞选中,无论是民主党, 还是共和党,其总统候选人花费很大功夫推 出的竞选纲领,目的都在争取尽可能多的中 间立场的选民的现象。
9
示例
竞争性政党意识形态中间化
例如: 英国的工党和保守党 加拿大的自由党和进步党之间 美国的共和党和民主党
10
示例
英国两大政党
二十世纪五十年代, 保守党在看到工党提出的主 张、政策为人们所认可时, 在重新执政后立刻 毫不犹豫地把工党的主张接了过来, 接受凯恩 斯主义, 也大搞起国有化和社会福利来。同样, 工党对保守党的有益的主张也毫不客气地实 行“拿来主义”。 为反映这一特点, 人们索性把保守党理论家巴特 勒和工党领导人盖茨克尔的名字拼组在一起, 创造了一个新的名词“巴茨克尔主义”
13
示例
非均匀分布的海滩占位模型研究
去掉均匀分布这一假设 下面以两党政治问题为例 :
选民政治主张服从[0, 1] 区间上概率密度函数为f(x)的 分布 设X1为政党1的政治主张 X2为政党2的政治主张
14
示例
党派1 的收益函数u1 (x1, x2) 为:
党派2 的收益函数u2 (x1, x2) 为:
15
示例
两个党派都力求它的收益最大化。设党派2的最优策略为x2(0<x2<1) , 显然党派1 的最优策略 就是使得u1(x1, x2) , 达到最大值的点, 为此u1 (x1, x2) 对x1 求导得到:
在x1 = x2处, 通过运算我们会发现: u1(x1, x2) 在x1 = x2处的左导数为1/2 f(x2) , 而 在x1 = x2处的右导数却为-1/2f(x2),即u1(x1, x2) 在x1 = x2处不可导。因f(x) 为概 率密度函数, 它总是大于等于0 的, 所以,当x1<x2时党派1 的收益u1 (x1, x2)是单 调递增的,即当x1 <x2时, 当x1越大越接近x2时,党派1的收益也就越大; 当x1> x2 时,党派1 的收益函数u1(x1, x2) 是单调递减的, 即当x1 >x2时,x1越大越偏离x2,党 派1的收益也就越小。恰恰在x1=x2处, 党派1的收益函数u1(x1,x2)不可导,且在x1 = x2处左导大于0而在x1 =x2处的右导数小于0。故如果党派2 的最优等略为x2, 在完全信息条件下,党派1的最优等略也必为x2,即有x1= x2 ,也就是说在完全信息 条件下, 两个党派的最优策略是相同的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
15
示例
两个党派都力求它的收益最大化。设党派2的最优策略为x2(0<x2<1) , 显然党派1 的最优策略 就是使得u1(x1, x2) , 达到最大值的点, 为此u1 (x1, x2) 对x1 求导得到:
在x1 = x2处, 通过运算我们会发现: u1(x1, x2) 在x1 = x2处的左导数为1/2 f(x2) , 而 在x1 = x2处的右导数却为-1/2f(x2),即u1(x1, x2) 在x1 = x2处不可导。因f(x) 为概 率密度函数, 它总是大于等于0 的, 所以,当x1<x2时党派1 的收益u1 (x1, x2)是单 调递增的,即当x1 <x2时, 当x1越大越接近x2时,党派1的收益也就越大; 当x1> x2 时,党派1 的收益函数u1(x1, x2) 是单调递减的, 即当x1 >x2时,x1越大越偏离x2,党 派1的收益也就越小。恰恰在x1=x2处, 党派1的收益函数u1(x1,x2)不可导,且在x1 = x2处左导大于0而在x1 =x2处的右导数小于0。故如果党派2 的最优等略为x2, 在完全信息条件下,党派1的最优等略也必为x2,即有x1= x2 ,也就是说在完全信息 条件下, 两个党派的最优策略是相同的。
6
示例
现在回到超市的位置博弈问题,没有一家超市 会将自己安置于长街的一头, 只要条件许可, 超市将几乎趋向于相依为邻 。 例如: 杨家坪步行街的家乐福和永辉 李家沱的新世纪与永辉 学校中门外的那两家超市
7
示例
应用上述对“海滩占位模型”的逻辑分析, 应用上述对“海滩占位模型”的逻辑分析,可 对下列现象进行分析: 对下列现象进行分析: 1、同一城市的两家航空公司开辟飞往同一目的 地的航班,常常出现他们各自的起飞时刻被 安排在几乎同一时间的现象。 2、不少电视台常将黄金播放时段的文艺节目定 位与中等趣味以提高自己的收视率的现象。
为 什 么 会 出 现 这 样 的 情 况 呢 ?
2
示例
海滩占位博弈
模型假设: a较长的海滩上比较均匀地散布着许多 日光浴者 b甲乙两个小贩 卖同质同价的矿泉水 c所以人都是完全理性的
3
示例
海滩占位博弈分析
对该模型作一个合乎逻辑的假定: 通常情况下,日光浴者总是乐意到距自己最近的摊位购买 矿泉水 ********************************************** 0 ¼ ½ ¾ 1 为便于阐述问题, 可将海滩表示成长度为1 的线段[ 0, 1] ,“*”表 示日光浴者, 具体见上图
示例
海滩占位博弈及其应用
小组成员: 10902010114 10902010115 10902010126 10902010127 10902010133 10902010112
兰渚 李航 孙利娟 藤小花 杨俊 黄建祥
1
示例
日常生活中, 我们常常会看到 这样一种现象, 如果在一条街 上有两至三个超市的话, 这几 家超市经常性地会“相依为 邻”, 选址离得很近。人们会 说, 倘若超市稍微分散地布置 于街上, 无疑对市民的购物提 供相当的便利, 而它们“拥挤” 在一起属于资源浪费。
8
示例
3、四年一度的美国总统竞选中,无论是民主党, 还是共和党,其总统候选人花费很大功夫推 出的竞选纲领,目的都在争取尽可能多的中 间立场的选民的现象。
9
示例
竞争性政党意识形态中间化
例如: 英国的工党和保守党 加拿大的自由党和进步党之间 美国的共和党和民主党
10
示例
英国两大政党
二十世纪五十年代, 保守党在看到工党提出的主 张、政策为人们所认可时, 在重新执政后立刻 毫不犹豫地把工党的主张接了过来, 接受凯恩 斯主义, 也大搞起国有化和社会福利来。同样, 工党对保守党的有益的主张也毫不客气地实 行“拿来主义”。 为反映这一特点, 人们索性把保守党理论家巴特 勒和工党领导人盖茨克尔的名字拼组在一起, 创造了一个新的名词“巴茨克尔主义”
11
示例
借用海滩占位博弈模型来对此进行分析
海滩的线段改为由左、中、右三点连成的一条意识形态横轴 把两个小贩改为甲乙两个政党 把比较均匀地散布着的许多日光浴者改为选民
12
示例
对该模型作一个合乎逻辑的假定: 通常情况下,选民总是乐意选择意识形态与自己思想观 念、信仰最相接近的政党。 根据这个原则, 如果按人们所希望的那样“便于选民辨 识”, 甲乙两党分别把自己意识形态取向定位于1/ 4 与3/ 4 点是最合理不过的, 因为他们将获取几乎一样多的选民支持, 得到几乎同样多的执政机会。 甲政党:1/4 D 1/2 乙政党:3/4 C 1/2
13
示例
非均匀分布的海滩占位模型研究
去掉均匀分布这一假设 下面以两党政治问题为例 :
选民政治主张服从[0, 1] 区间上概率密度函数为f(x)的 分布 设X1为政党1的政治主张 X2为政党2的政治主张
14
示例
党派1 的收益函数u1 (x1, x2) 为:
党派2 的收益函数u2 (x1, x2) 为:
16
示例
174示例源自小贩甲: ¼ D ½ 小贩乙: ¾ C ½ 双方斗智博弈的结果将使他们的摊位设置在l/ 2 点附 近, 甲乙两人相依为邻且相安无事地做起矿泉水的 生意。 NE(1/2,1/2)
5
示例
海滩占位博弈支付矩阵
1/4点与3/4点的均衡只是一个资源 最合理利用的均衡点 我们同样可以把1/4点改成 [0,1/2]上任一点D,只要D点到 中间点距离与乙商贩的选址C点 到中点的距离一样则达到均衡, 但是这种均衡只是暂时的,经过 有限次重复博弈后他们各自都会 选址在中间点1/2处。此时达到 纳什均衡NE(1/2,1/2)