博弈模型汇总

合集下载

博弈模型

这一节主要是列举博弈模型中的几种比较特殊的博弈论模型，它们具有一些特殊的性质。

这几种模型分别为超模、潜在以及重复博弈模型。

(1) 超模博弈模型。

假设在博弈模型中，其效用函数呈现出超模性，那么这个博弈模型即为超模博弈模型。

下面先给出超模性的定义：在一个偏序集 X ，如果在这个集合中的任意 a ,b ∈ X，都存在着a ∧ b ∈ X 及a ∨ b ∈ X，其中a ∨ b = sup { a ,b}， a ∧ b = inf { a ,b}，则这个函数称之为超模的。

博弈模型超模性的判定：从定义可以推导出，只要在博弈模型中的所有博弈方的策略为紧集合，并且收益表示式都满足式(2-8)，满足以上两点则这个博弈过程就可以称之为超模博弈。

2( )ii jU aa a≥j ≠ i ∈ N(2-8)并且超模博弈具有纳什均衡，而且肯定是唯一的纳什均衡点。

(2) 潜在博弈模型。

潜在博弈是一个特殊的类型。

定义函数V :A → R。

ΔV 代表博弈整体的效用改变，iΔu 表示用户 i 的效用改变，当任意用户 i 进行策略的改变，都有iΔu = Δ V，如果所有的任意博弈参与者都单方面的策略改变，都存在iΔV = Δu ，则称该博弈模型为潜在博弈。

否则，如果sgn sgniΔV = Δu ，则这样的博弈模型称之为顺序的潜在博弈已模型。

模型的判定：只要在博弈模型中的所有博弈方的策略为紧集合，并且收益表示式都满足式(2-9)，满足以上两点则这个博弈过程就可以称之为潜在博弈模型。

22( )( )jii j i jU aU aa a a a=j ≠ i ∈ N ,a ∈ A(2-9)并且潜在博弈具有纳什均衡，而且肯定是唯一的纳什均衡点。

(3) 重复博弈模型。

这种博弈模型表示 N 多相同的“阶段博弈”组成的博弈模型的整体，参与者在博弈过程中，可以根据过去的策略的了解，以及对未来的形式的估计，和根据当时的情况来实时的调整选用的策略组合。

数学建模博弈模型

博弈模型在实际问题中的应用前景
政策制定
01
利用博弈模型分析政策制定中的利益关系和策略选择，为政策
制定提供科学依据。
企业竞争策略
02
利用博弈模型分析企业竞争中的策略选择和预期行为，为企业
制定合理的竞争策略。
国际关系
03
利用博弈模型分析国际关系中的利益关系和冲突解决机制，为
国际关系管理提供理论支持。
THANKS
猎鹿博弈
总结词
描述两个猎人合作与竞争的关系，揭示了合作与背叛的平衡。
详细描述
在猎鹿博弈中，两个猎人一起打猎，猎物可以平分。如果一个猎人选择合作而另一个选择背叛，则背叛者可以独吞猎物。但如果两个猎人都不合作，则都没有猎物可吃。最佳策略是合作，但个体理性可能导致两个猎人都不合作，造成双输的结果。
03
智猪博弈
总结词
描述大猪与小猪在食槽竞争中的策略，揭示了合作与竞争的平衡。
详细描述
在智猪博弈中，一个大猪和一个小猪共同生活在一个猪圈里。每天都有一桶食物放在食槽中，大猪和小猪需要竞争才能吃到食物。如果大猪和小猪同时到达食槽，大猪会因为体型优势占据更多食物。但如果小猪先到食槽等待，大猪到来时已经没有食物可吃。最佳策略是小猪等待，大猪先吃，然后小猪再吃剩下的食物。
博弈模型的基本要素
参与者
在博弈中作出决策和行动的个体或组织。
策略
参与者为达到目标而采取的行动或决策。
支付
参与者从博弈中获得的收益或损失。
均衡
在博弈中，当所有参与者都选择最优策略时，达到的一种稳定状态。
博弈模型的建立过程
策略空间
确定每个参与者的所有可能采取的策略。
均衡分析
通过分析收益函数和策略空间，找出博弈的均衡点。

博弈模型-数模

5、模型求解囚徒 1 对 i＝1,有 u1(坦白, 坦白)＝－6＝－6＝u1(坦白, 坦白) u1(坦白, 坦白)＝－6>－9＝u1(沉默，坦白)
对 i＝2，有 u2(坦白,坦白)＝－6＝－6＝u2(坦白,坦白) u2(坦白,坦白)＝－6>－9＝u2(坦白,沉默)
囚徒 2 坦白沉默坦白沉默 -6，-6 -9, 0 图 1-1 0，-9 -1，-1
* * * * ui ( s1 ,, si*1 , si* , si*1 ,, sn ) ui ( s1 ,, si*1 , si , si*1 ,, sn ), si Si
--------------（NE）亦即 si*是最优问题
* * max ui ( s1 ,, si*1 , si , si*1 ,, sn ), i 1, 2, , n si Si
二、囚徒困境博弈模型分析
1、问题的提出
两个共同作案的犯罪嫌疑人被捕，并受到指控。除非至少一个人招认犯罪，否则警方无充分证据将他们按罪判刑。警方把他们关入不同的牢室，并对他们说明不同行动带来的后果。如果两人都采取沉默的抗拒态度，因警方证据不足，两人将均被判为轻度犯罪入狱1个月；如果双方都坦白，根据案情两人将被判入狱6个月；如果一个招供而另一个拒不坦白，招认者因有主动认罪立功表现将立即释放，而另一人将被判入狱9个月（所犯罪行判6个月，干扰司法加判3个月）。
所以 s*＝(s1*,s2*)＝(坦白,坦白)满足定义不等式（NE）的条件，故 s* ＝(坦白,坦白)是囚徒困境博弈的一个纳什均衡，即此问题的解。
6、结果分析
战略组合（沉默，沉默），即如果两个人都不坦白，各人只判刑一个月，不是比战略组合（坦白，坦白）带来的各判刑 6个月要好吗？

完全信息博弈和不完全信息博弈例子

完全信息博弈和不完全信息博弈例子完全信息博弈和不完全信息博弈是博弈论中常见的两种博弈模型。

在完全信息博弈中，参与者对对手的策略和利益有完全了解，而在不完全信息博弈中，参与者对对手的策略和利益了解不完全。

下面将给出10个例子来说明这两种博弈模型。

1. 完全信息博弈：象棋对局象棋是一种典型的完全信息博弈。

在游戏开始之前，双方玩家对对手的棋子摆放和可能的走法有全面的了解。

每一个棋子的能力和走法都是公开的，玩家可以根据对手的走法进行推理和决策。

双方都可以清楚地看到棋盘上的所有信息，这使得象棋成为一个完全信息博弈的范例。

2. 完全信息博弈：扑克牌游戏扑克牌游戏是另一个典型的完全信息博弈。

在游戏开始之前，玩家可以看到自己的牌和公共牌，可以推断其他玩家手中可能的牌型。

玩家可以根据对手的表情、下注行为和牌型推断对手的策略，并做出相应的决策。

3. 完全信息博弈：国际象棋比赛国际象棋比赛是另一个典型的完全信息博弈。

在比赛开始之前，双方选手可以看到对手的棋子摆放和可能的走法，可以根据对手的走法进行推理和决策。

选手可以通过分析对手的行为和棋局的发展，制定出相应的策略。

4. 完全信息博弈：囚徒困境囚徒困境是博弈论中著名的例子。

在这个博弈中，两个囚犯被关押在不同的牢房中，检察官给每个囚犯提供了一个交代罪行的机会。

如果两个囚犯都选择交代，那么他们都会被判刑。

如果两个囚犯都选择保持沉默，那么他们都会被判轻刑。

如果一个囚犯交代而另一个保持沉默，那么前者将获得豁免，后者将被判重刑。

这个博弈的特点是，双方玩家知道对方的利益和策略，并可以根据对方的策略做出自己的决策。

5. 完全信息博弈：足球比赛足球比赛是一种典型的完全信息博弈。

在比赛开始之前，双方球队都可以看到对方的阵容和战术，可以根据对手的策略进行相应的调整。

球队可以根据比赛的进展和对手的表现，调整自己的战术和策略。

6. 不完全信息博弈：扑克牌对局尽管扑克牌游戏可以被看作是完全信息博弈的例子，但在某些情况下，扑克牌对局也可以被看作是不完全信息博弈。

聊聊四种经典的博弈论模型

聊聊四种经典的博弈论模型展开全文1、囚徒困境：为什么两个犯人都选择坐牢官差破获了一宗盗窃案，抓住了两名犯罪嫌疑人。

但在审讯过程中，被关在一处的二人始终矢口否认盗窃罪名，说东西不是我们偷的。

为了避免两人达成默契，结成攻守同盟，官差决定对他们进行单独审讯。

官差表示，如果两人中有一人坦白认罪，则可立即释放，另一个不认罪的人判5年徒刑；如果两人都坦白罪刑，则他们将各判2年徒刑。

但还有一种情况，那就是两个人都拒绝坦白，由于缺乏证据，他们只会以扰乱公共场合为名判处3个月拘役。

这就是两名罪犯面临的困境中，他们会做出怎样的选择呢？首先，他们互相之间都不清楚对方是否会坦白，其次，二人都希望将自己的刑期缩至最短。

如此考虑，最终，两名犯人都会选择坦白交代。

上面的案例就是博弈论所说的“囚徒困境”。

犯人们如果彼此合作，可为集体带来最佳利益（刑期最短）；但当二人面对同样的情况且不知道对方如何选择时，在理性思考后，双方都会得出相同的结论（坦白交代），以便达到个人利益的最大化。

囚徒困境是博弈论的“非零和博弈”中具代表性的例子，反映的是个人的最佳选择并非是团体的最佳选择。

虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

2、智猪博弈：赢的总是小猪猪圈里有大小两头猪，它们在同一个食槽里进食。

为了保持饲料的新鲜，在远离猪食槽的另一边有一个踏板，大猪或小猪跑过去，每按动一次踏板，投食口就会掉落10个单位的食物。

于是，在大猪和小猪每次进食前，就会形成这样一种局面:如果小猪跑去按踏板，大猪守在食槽边，则大猪小猪吃到的食物比是9:1；反之，如果大猪去按而小猪守在食槽边，则吃食比例是6:4。

如果二猪同时到食槽边，则吃食比是7:3。

这样一来，从纯收益的角度考虑，小猪就更愿意选择在食槽边等待食物落出，因为“等待优于行动”，而大猪只能被迫奔忙在踏板和食槽之间。

上述“智猪博弈”的案例是经济学家的假设论证模型，这个博弈的结果，用经济学视角看待，可以解释为：谁占有更多资源，谁就必须承担更多义务。

博弈均衡模型及其举例

博弈联均衡模型博弈论模型图示博弈可划分为合作博弈和非合作博弈，1人们一般讲到的都是指非合作博弈，它有四种不同类型的博弈，即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈，与上述相对应的是纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。

这四种均衡中最为基本的是纳什均衡。

2完全信息静态博弈——纳什均衡、完全信息动态博弈——子博弈精炼纳什均衡不完全信息静态博弈——贝叶斯纳什均衡、、不完全信息动态博弈——精炼贝叶斯纳什均衡，与上述相对应的是、、、。

这四种均衡中最为基本的是纳什均衡。

完全信息静态博弈（纳什均衡）债务人强硬妥协1这两者的区别主要在于人们的行为相互作用时，当事人能否达成一个有约束力的协议：如能达成就是合作博弈；反之就是非合作博弈。

合作博弈强调团体理性，强调效率和公平，非合作博弈强调理性个人的最优决策，其结果是否有效率则是不确定的。

2所谓纳什均衡，指的是所有参与人最优选择的一种组合，在这种组合下，给定其他人的选择，没有任何人有积极性做出新的选择。

纳什均衡的哲学思想是：给定别人遵守协议的情况下，没有人有积极性偏离协议规定的自己的行为规则。

换言之，如果一个协议不构成纳什均衡，它就不可能自动实施，因为至少有一个参与人会违背这个协议，不满足纳什均衡要求的协议是没有意义的。

当博弈中的所有参与人事先达成一项协议，给出每个人的行为规则。

在没有外在强制力约束时，当事人是否会自觉地遵守这个协议？或者说这个协议是否可以自动实施？如果当事人会自觉遵守这个协议，等于说这个协议构成一个纳什均衡。

参见张维迎：“经济学家看法律、文化与历史”，载张维迎《产权、政府与信誉》，三联书店2001年版。

囚徒困境□ 文/柯华庆“囚徒困境”最早是由美国普林斯顿大学数学家曾克1950年提出来的。

他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论。

这个故事后来成为博弈论最经典的案例。

故事的内容如下：两个犯罪嫌疑人被捕并受到指控，但除非至少其中至少有一个人供认犯罪，警方缺乏足够的证据指证他们所犯的罪行，从而将他们按罪判刑。

行业市场竞争的博弈模型

行业市场竞争的博弈模型当谈到市场竞争时，我们不可避免地想到博弈论。

博弈论是一门研究决策者在不同策略下相互影响的数学理论。

运用博弈模型来分析行业市场竞争，可以帮助我们更好地理解竞争者之间的策略选择、互动以及最终的市场结果。

本文将介绍几种常见的行业市场竞争的博弈模型，以期能够深入探讨这一领域。

首先，我们来讨论非合作博弈模型。

在非合作博弈中，每个竞争者都追求自身的最大利益，不考虑其他竞争者的影响。

最著名的非合作博弈模型之一是纳什均衡模型。

在这个模型中，每个竞争者都选择了最优的策略，使得没有一个竞争者单方面改变策略能够改善自己的利益。

非合作博弈模型的一个经典例子是俘虏困境。

在俘虏困境中，两名犯罪嫌疑人被关押在不同的牢房中，警察需要他们的供词。

如果两名嫌疑人都保持沉默，他们将分别面临一年的监禁。

然而，如果其中一人坦白，而另一人保持沉默，坦白的人将获得缓刑，而另一人将面临十年的监禁。

如果两人都坦白，那么他们将各面临六年的监禁。

在这个例子中，无论另一人选择什么策略，每个人都认为坦白是最好的选择，最终导致了一个不利于两个人的结果。

除了非合作博弈模型，合作博弈模型也是研究行业市场竞争的重要工具。

在合作博弈模型中，竞争者之间可以通过合作实现共同利益。

合作博弈模型的一个例子是合作博弈矩阵。

在合作博弈矩阵中，每个竞争者都面临着多种策略选择，而选择的最终结果可以通过博弈矩阵显示出来。

例如，假设有两家电信公司A和B，他们可以选择降低价格来吸引更多的用户。

然而，如果两家公司都选择降价，他们可能会陷入价格战，导致收入减少。

因此，通过合作博弈矩阵，他们可以找到一个平衡点，选择一个双赢的策略。

除了非合作博弈和合作博弈模型，我们还需要考虑到动态博弈模型。

在动态博弈模型中，竞争者的决策不仅取决于当前的情况，还取决于之前的决策和未来的预期。

一个经典的动态博弈模型是重复博弈。

在重复博弈中，竞争者之间会进行一系列的博弈，他们的决策不仅影响当前的结果，还影响未来的博弈结果。

博弈论究竟讲什么？一文读懂11种经典博弈论模型

博弈论究竟讲什么？一文读懂11种经典博弈论模型先说一个小故事：美国第34任总统艾森豪威尔，在他年轻的时候，有一次吃过晚饭后他跟家人一起玩纸牌，一连六盘，他拿到的都是最坏的牌。

于是他变得不高兴起来，嘴里开始不停地埋怨。

他的母亲停了下来，对他说道：“如果你要继续玩下去，就不要埋怨手中的牌怎么样。

不管怎样的牌发到手中，你都得拿着。

你唯一能做的就是尽你所能，打好手里的每一张牌，求得最好的结果。

”在城主的上一篇文章中，谈到了德鲁克在《创新与企业家精神》中提到的几种竞争战略，制定战略的过程是决策的过程，推进战略落地则是执行的过程。

无论是决策还是执行，其本质都是一次次博弈的组合。

那么，究竟什么是博弈？大到国与国之间的制衡，小到一个人的一生，博弈都是无处不在，无论是商业竞争中，还是日常工作中，生活中，甚至子女教育，两性爱情。

因为每个人都在时时刻刻想着与他人竞争，每时每刻都把自己放在局中人的位置上。

这就是俗话说的“人生如戏，戏如人生”，充分运用游戏规则，做好自己人生的演员，就是博弈思维能力的体现。

专门研究相互依赖、相互影响的人群，其理性决策行为及这些决策的均衡结果的理论，就是博弈论。

博弈是有技巧的，博弈论的主体则是规定的若干博弈模型，通俗的说就是人们常说的“套路”。

但博弈论是严肃的科学，如果有人非要像剥洋葱一样地剥开博弈思维，看看各种博弈技巧的核心是什么，那么他将会看到两个字——理性。

从博弈论衍生出来的博弈思维，体现了人的理性思维，也就是说我们的任何结果均是采取某种决策和行动的结果。

这体现了博弈思维奉行的“因果论”，正所谓“种瓜得瓜，种豆得豆”。

想要得到理想的结果，除了依靠我们的理性分析，采取正确的决策，并付诸行动外，别无他法。

正因为博弈思维是一种理性思维，所以冲动是魔鬼，更是博弈思维的大敌。

这里，我们要认清“理性”的几个误区。

1.理性的人一定是自利的，但世界上又有多少纯粹的“大公无私”呢？2.理性和道德不是一回事，在追求的自利的同时，产生出来的利他才有可能持久。

经典博弈论模型

经典博弈论模型
博弈论是一门研究决策策略的学科，也是一种数学方法，涉及到多个参与者之间的相互作用。

在博弈论中，每个参与者都会根据自己的利益来做出决策，同时必须考虑其他参与者的决策。

经典博弈论模型包括一些常见的策略和规则，其中最基本的是零和博弈。

在零和博弈中，每个参与者的互动关系类似于赢家通吃的形式，即一个人的利润等于另一个人的损失。

零和博弈的典型例子是两个人玩扑克牌，他们的利益总和为零。

除了零和博弈，还存在非零和博弈。

在非零和博弈中，参与者可以通过合作而获得共同的利益，因此不是每个人都赢或每个人都输。

一个非零和博弈的例子是两个公司进行竞争，虽然他们都想赢得市场份额，但他们可能会达成某些协议来共同获得更大的市场份额。

最著名的博弈论策略是纳什均衡，它是一种理论概念，指出在博弈中参与者的所有决策产生的结果都是最优的。

在纳什均衡中，每个参与者都会假设其他参与者采取的是最优策略，并基于此做出自己的决策。

除了纳什均衡，还有其他一些重要的决策规则。

例如，最小最大原则，参与者会选择一种策略，使得他们的最小利润等于其他参与者的最大利润。

这种情况通常发生在两个竞争对手面临一项业务或项目时。

此时，两个对手可能会选择不退出，而是尝试尽可能给对方带来最小的收益。

博弈论在许多领域都有广泛的应用，包括经济学、政治学、心理学和计算机科学等等。

它可以帮助人们更好地理解人类决策过程，以及如何在许多不同的情况下做出最优的决策。

掌握博弈论的基础知识将使我们更好地理解并解决日常生活和工作中的问题。

数学建模博弈模型

λ↑，报童利润↑ ，报社利润↓ 利润的任意分配比例都可达到
回收协议模型
模型一回收价格协议回收价b (p>w>b>v) 整体最优
pw F (Qr ) p b
原订货量
pw F (Qr ) pv
pc F (Q ) pv
*
达到协调
pc pw p v p b
cv w wb (b) b ( p b) pv
• 双方总能成交吗？（效率估计）
模型假设与建立
• 卖方知道物品对自己的价值，但买方不知道. • 买方知道物品对自己的价值，但卖方不知道. • 双方都知道（如猜出）对方价值的分布信息. 卖方价值vs, 买方价值vb, 均服从 [0,1] 上的均匀分布
卖方报价ps, 买方报价pb, pb ≥ ps时成交价p＝ (pb+ps)/2 成交效用：卖方U1=p- vs, 买方U2= vb –p; 不成交: 0
0 0
xF ( x) |0 F ( x)dx Q (1 F (Q )) Q F ( x)dx
期望存货量
I (Q) Q S (Q) F ( x)dx
0
Q
期望利润 G(Q) pS(Q) vI (Q) wQ ( p v)S (Q) (w v)Q 最优订购量Qr
pc 假设报社与报童联合，整体利润最大 F (Q ) pv pw *>c Q (w*) <Q* F (Qr ) 一般w r pv 整体利润有损失能否改善(协调)？
*
价格折扣协议模型
折扣方案wd(Q) 下，报童效用(期望利润)
U r ( wd (Q)) ( p v)S (Q) ( wd (Q) v)Q

博弈论3-4经典动态博弈模型

3.4 几个经典动态博弈模型453.4.1 寡占的斯塔克博格模型46动态的寡头产量竞争博弈厂商1先选择，厂商2后选择。

21q q Q +=121111112)](8[)(q q q q q c Q P q u -+-=-=221222222)](8[)(q q q q q c Q P q u -+-=-=策略空间：[0，Q max ]中所有实数。

Q max 为不至于使价格降到亏本的最大限度的产量。

Q Q P P -==8)(价格函数：边际生产成本：无固定成本得益函数：221==c c 2121116q q q q u --=2221226q q q q u --=47两阶段动态博弈。

第一阶段，厂商1选择产量；第二阶段，厂商2选择产量。

1 、第二阶段厂商2的选择目标：得益最大化。

求使自己得益最大化下的产量值，即最大化时的一阶条件：得益函数：2221226q q q q u --=用逆推归纳法进行分析：02602122=--⇒=∂∂q q q u 112213)6(21q q q -=-=求出厂商2对厂商1产量的反应函数：48两阶段动态博弈。

第一阶段，厂商1选择产量；第二阶段，厂商2选择产量。

2 、第一阶段厂商1的选择。

用逆推归纳法进行分析：12213q q -=厂商1可直接求出使自己得益最大化时的产量：厂商1知道2的决策思路：直接将上式代入厂商1的得益函数，得到：2112111121*211*211213)213(66),(q q q q q q q q q q q q u -=---=--=3030*1*111=⇒=-⇒=∂∂q q q u厂商1的最佳产量是生产3单位。

将之代入厂商2的反应函数，得到厂商2的最佳产量5.15.13*2=-=q 此时市场价格为3.5，双方的得益别为4.5和2.25单位。

3*1=q 12213q q -=用逆推归纳法分析得出，该动态博弈的唯一的子博弈完美纳什均衡：厂商1在第一阶段生产3单位产量，厂商2第二阶段生产1.5单位产量。

博弈论的几个经典模型

诺贝尔奖的公共选择学派的领导者布坎南，1995年获得诺贝尔
奖的理性主义学派的领袖卢卡斯
（Lukas），其理论与博
弈论都有着较深的联系。现在博弈论正渗透到各门社会科学，
更重要的是它正深刻地改变着人们的思
• 汪贤裕、肖玉明编著，博弈论及其应用，科学出版社，2008 年2月
第四章博弈论的几个经典模型
讲授人谭建国
引言
博弈论又被称为对策论（Game Theory)，按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法，博弈论就是研究互动决策的理论。所谓互动决策，即各行动方（即局中人[player]）的决策是相互影响的，每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策，选择最有利于自己的战略(strategy)。
博弈论的几个经典模型
引言
你的选择必须考虑其他人的选择，而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付，不仅取决于你的行动选择——博弈论称之为策略选择，同时取决于他人的策略选择。你和这群人构成一个博弈（game）。
上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型，被称之为少数者博弈或少数派博弈（ Minority Game）。
协调互动合作互动协调互动是指一个参与人获得的支付依赖于其他参与人是否选择了相同行动如左行右行博弈如果两个相对而行的参与人选择不同的方向行进那么他们会相碰而选择相同方向则可以顺利通合作互动是指既存在协调又存在冲突的博弈协调是因为两个参与同时改变行动可以变得更好冲突是因为尽管其他参与人承诺行动也不一定有利于该参与人支付的增加前者可能引起无效率后者则意意味着无效率状态会成为均衡猎鹿类型协调博弈由策略不确定性所引起的均衡结果依赖于参与人之间的行为预期博弈支付与策略风险

博弈论模型——精选推荐

有趣味的博弈论模型在自然界和人类社会经济等领域中广泛存在合作与竞争，而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论（Game Theory），也称对策论，它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论，研究个体之间行为的相互影响和相互作用规律，它可以描述现实生活中参与者面对有限资源的合作与竞争行为。

令人惊奇的是，有三次诺贝尔获奖者是博弈论的杰出科学家，他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南，1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家，1995年获奖的理性主义学派的领袖卢卡斯。

博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。

进入20世纪末，随着复杂网络科学的一些新的发现，博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。

博弈论对人有一个最基本假定：人是理性的，人在具体策略选择的目的全是使自己的利益最大化。

博弈论就是研究理性的人之间如何进行策略选择的，因此博弈论也称为对策论。

博弈论就凭这么一条最简单的假定可以展开广泛的研究，并获得了丰富多彩的结果，利用博弈论可以解读人类的社会行动或集体行动，更易理解人类社会的复杂性和特殊性。

为了刻画个体间利益的冲突对整个系统的影响，人们已经提出和研究了许多博弈模型，比较著名的有三个模型：囚徒困境、“雪堆”博弈和“少数者”博弈，下面笔者通过对这三个模型进行简单而通俗的介绍，让大家了解博弈论及其应用概况。

“囚徒困境”模型囚徒困境作为一个经典的博弈模型受到广泛关注。

这个博弈模型假设两个小偷合伙作案时被捕，分别关在不同的屋子里，如果双方都拒绝承认同伴的罪行，则由于证据不足两人都会被轻判（收益为R）；为此，警方设计了一个机制：如果一方出卖同伴，而另一方保持忠诚，则背叛者将无罪释放（收益为T）；坚持忠诚的一方将被重判（收益为S）；如果双方都背叛了对方，则双方都会被判刑（收益为P）。

经典动态博弈模型

委托人—代理人理论
R为商店利润，e为店员努力，利润取决于店员努力与随机因素，R=R(e)=4e+η,店员的负效用函数为C=C(e)=e*e，机会成本为U1=1
店主采用的报酬计算公式： w=A+B[R(e)]，其中A、B为参数
这是一种典型的基本工资加提成的形式。通过分析店主的最优激励工资计算公式为：
3.4.3 讨价还价(Bargaining)博弈
第三回合，甲的方案是自己得S，乙得10000-S，而乙必须选择接受，双方得益分别为δ*δ*S2 , δ* δ*(10000 - S2 ) 。
该博弈的两个特点：第一，第三回合甲的方案具有强制力；第二，每多进行一个回合总得益就会下降一个比例，因此谈判越长对双方都可能不利，如果必须让对方得的数额不如早点让其得到。
✓ 工会所代表的劳动力方效用是工资率和雇佣人数的函数，即 u = u( W, L)
劳资博弈
✓ 厂商关心的根本目标是利润，用利润可以直接代表厂商的效用。
✓ 假设收益是劳动力雇佣数量的函数R( L )，并假设厂商仅有劳动力成本，所以利润函数为π=π(W , L)= R( L ) – W×L
✓ 假设工会和厂商的博弈过程为：先由工会决定工资率，然后厂商根据工资率决定雇佣的员工数量
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格模型劳资博弈讨价还价(Bargaining)博弈 3.4.4 委托人—代理人理论
劳资博弈
✓ 里昂惕夫(Leontief)1946年提出了一个分别代表劳资双方的工会和厂商之间的博弈
✓ 模型假设工人工资完全由工会决定，而厂商则根据工会要求的工资高低决定雇佣工人的数量
w=-3+R

博弈论的几个经典模型

博弈论的几个经典模型
.
模型二、囚徒困境/非合作博弈
囚徒困境可以用来说明许多现象。 ➢寡头定价 ➢拍卖出价 ➢推销员的努力 ➢政治上的讨价还价 ➢军备竞赛等（冲突中出现两败俱伤的情况, 往往要考虑到囚徒困境）
*（纯策略）纳什均衡
博弈论的几个经典模型
.
问题与思考
• 什么是博弈论？试举两个你生活中的例子说明。 • 某年在荷兰召开了一次“合作及社会两难困境研讨
博弈论的几个经典模型
.
引言
博弈论的应用领域十分广泛，在经济学、政治科学（国内的以及国际的）、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
博弈论的几个经典模型
.
引言
投食仅原来的一半分量，但同时将投食口移到踏板附近。结果呢，小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
对于游戏设计者，这是一个最好的方案。成本不高，但收获最大。
博弈论的几个经典模型
.
模型二、囚徒困境/非合作博弈
在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境” （ prisoners’dilemma ）博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。
博弈论的几个经典模型
.
博弈的类型
博弈又可分静态博弈和动态博弈。 • 静态博弈：指参与者同时采取行动，或者尽
管参与者行动的采取有先后顺序，但后行动的人不知道先采取行动的人采取的是什么行动。 • 动态博弈：指参与者的行动有先后顺序，并且后采取行动的人可以知道先采取行动的人所采取的行动。

第十一章博弈模型

• 用u1(a1，a2)表示对盟军产生的结果，即净胜场次，称为盟军的效用函数.
盟军德军强化缺口原地待命
向西进攻盟军胜1场盟军胜2场
向东撤退无战斗无战斗
1 0 M {mij}32 2 0
支付矩阵 2 1
东进盟军败2场盟军胜1场（Payoff Matrix）
完全竞争: 零和博弈 (常数和博弈) u2(a1，a2)对应 –M
习题
• P411 ex1，ex3
11.5 效益的合理分配(合作对策)
例甲乙丙三人合作经商，若甲乙合作获利7元，甲丙合作获利5元，乙丙合作获利4元，三人合作获利11元. 又知每人单干获利1元. 问三人合作时如何分配获利？
记甲乙丙三人分配为
x (x ,x ,x ) 123
x1 x2 x3 11
解不唯一
x1 x2 7 x1 x3 5
(5，3，3) (4，4，3)
x2 x3 4
(5，4，2)
x1, x2 , x3 1
……
怎样分配更合理？
(1) Shapley合作对策
集合I {1,2, , n} 子集s I，实函数v(s)满足
v( ) 0 v(s1 s2 ) v(s1 ) v(s2 ), s1 s2
sSi (n s )!( s 1)!
1
w( s )
n!
nC|s|1
n1
s~子集 s中的元素数目， Si ~包含i的所有子集
[v(s) v(s \ i)] ~ i 对合作s 的“贡献” (i s)
w( s ) ~由s决定的“贡献”的权重
权重构成：|s|可能取值1~n, 先按此n等分；|s|=k的含有i的子
集个数有
C k 1 n 1

合作与冲突数学模型

合作与冲突数学模型
合作和冲突是人类社会交往中常见的行为模式。

数学模型可以用来描述和分析这些行为。

以下是一些主要的合作和冲突数学模型。

1. 合作博弈模型：合作博弈模型研究合作参与者如何在共同利益下分配资源。

最著名的合作博弈模型是合作博弈的核（core）概念，即一组策略组合，对于任何联盟中的参与者，他们无法通过自己单独行动来获得更好的回报。

合作博弈模型还包括合作稳定性概念，即在一个联盟中，没有参与者有动机离开联盟加入其他联盟。

2. 零和博弈模型：零和博弈模型描述的是一种互相对立的情况，其中一个参与者的利益的增加必然导致另一个参与者的利益减少。

在零和博弈模型中，冲突是不可避免的，参与者的目标是最大化自身利益。

著名的零和博弈模型包括囚徒困境、斯塔格亚博弈等。

3. 博弈论模型：博弈论是研究决策者如何在相互依赖的环境中做出决策的数学模型。

博弈论模型可以用来描述合作和冲突的情况。

博弈论模型包括非合作博弈模型和合作博弈模型。

非合作博弈模型研究个体决策者如何在没有互相协商的情况下做出理性决策。

合作博弈模型研究个体如何通过协商和合作来达到共同目标。

这些数学模型可以用来研究合作和冲突的策略，分析参与者的
收益和决策，从而更好地理解和解决实际生活中的合作和冲突问题。

博弈论的几个经典模型课件

02
在这个模型中，如果双方都抵赖，则各自获得2年的监禁；如果双方都坦白，则各自获得3年的监禁；如果一方坦白而另一方抵赖，则坦白的一方获得1年的监禁，抵赖的一方获得10年的监禁。
03
囚徒困境反映了人类在有限理性和不完全信息下的决策问题。
囚徒困境的策略和最优解
01
02
03
在囚徒困境中，每个参与者都有两种策略：坦
博弈论的发展趋势和应用前景
发展趋势
随着计算机科学的发展，博弈论在人工智能、机器学习等领域的应用逐渐增多。同时，博弈论也在生物学、环境科学、社会学等多个学科中得到广泛应用和发展。未来，博弈论将继续探索更为复杂和现实的模型，以解释和预测更为复杂的行为和现象。
应用前景
博弈论在经济学、政治学、军事等领域有着广泛的应用前景。例如，博弈论可以帮助理解国际贸易中的策略行为、国际政治中的权力均衡以及军事战略中的最优攻击策略等。此外，博弈论也在社交网络分析、市场机制设计等领域展现出强大的应用潜力。
政治学中的应用
投票悖论
投票悖论是指在某些情况下，多数投票的结果可能导致无法达成一致意见或产生不合理的结果。在政治学中，投票悖论被用于探讨民主制度的缺陷和改进方法。
权力均衡
权力均衡是一种政治博弈模型，它描述了政治权力在多个参与者之间的分配和转移。在政治学中，权力均衡被用于分析权力斗争、
政治制度稳定性和政策制定等问题。
纳什均衡模型被广泛应用于市场均衡、产业组织、公共经济学
等领域。
生物学
02
纳什均衡模型也被用于解释生物种群竞争、生态系统平衡等问
题。
社会学
03
纳什均衡模型可以用来分析社会现象，如犯罪、婚姻、教育等

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈模型汇总如下：
1.合作博弈与非合作博弈：这是根据参与者之间是否可以达成具
有约束力的协议来划分的。

合作博弈强调团队合作和协作，目标是达成共赢；而非合作博弈则强调个人利益最大化，不考虑其他参与者的利益。

2.静态博弈与动态博弈：这是根据参与者做出决策的时间顺序来
划分的。

静态博弈是指所有参与者同时做出决策，或者决策顺序没有影响；动态博弈是指参与者的决策有先后顺序，后行动者可以观察到先行动者的决策。

3.完全信息博弈与不完全信息博弈：这是根据参与者对其他参与
者的偏好、策略和支付函数了解的程度来划分的。

完全信息博弈是指所有参与者都拥有完全的信息，能够准确判断其他参与者的策略和支付函数；不完全信息博弈则是指参与者只拥有部分信息，无法准确判断其他参与者的策略和支付函数。

4.零和博弈与非零和博弈：这是根据所有参与者的总收益是否为
零来划分的。

零和博弈是指所有参与者的总收益为零，一方的收益等于另一方的损失；非零和博弈则是指所有参与者的总收益不为零，各方的收益和损失不一定相关。

5.竞争博弈与合作博弈：这是根据参与者之间是否存在竞争或合
作关系来划分的。

竞争博弈是指参与者之间存在竞争关系，目标是追求个人利益最大化；合作博弈则是指参与者之间存在合作关系，目标是追求共同利益最大化。

6.微分博弈与离散博弈：这是根据决策变量的连续性来划分的。

微分博弈是指决策变量是连续变化的，需要考虑时间、速度等因素；离散博弈则是指决策变量只有有限个可能的取值，通常只考虑状态的变化而不考虑时间、速度等因素。