第七章博弈的三个模型2

合集下载

《西方经济学》第七章博弈论

21
第五节
不完全信息动态博弈
对应于不完全信息动态博弈的均衡概念是精炼精炼贝叶斯均衡(perfect Bayesian equilibrium). 贝叶斯均衡这个概念是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态均衡的贝叶斯纳什均衡的结合.具体来说,精炼贝叶斯均衡是所有参与人战略和信念的一种结合.它满足如下条件:第一,在给定每个参与人有关其他参与人类型的信念的条件下,该参与人的战略选择是最优的.第二,每个参与人关于其他参与人所属类型的信念,都是使用贝叶斯法则从所观察到的行为中获得的.
22
贝叶斯法则贝叶斯法则是概率统计中的应用所观察到的现象对有关概率分布的主观判断 (即先验概率)进行修正的标准方法.
23
习
题
1. 什么是占优策略均衡?什么是重复剔除的占优策略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为 0.两寡头所进行的是产量竞争.对于寡头产品的市场需求曲线为P=30-Q,其中Q=Q1+ Q2.Q1是寡头1的产量,Q2是寡头2的产量. (1)假定两个寡头所进行的是一次性博弈. 如果两寡头同时进行产量决策,两个寡头各生产多少产量?各获得多少利润?
25
�
第七章
第一节第三节第四节第五节
博弈论
完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈
第一节博弈问题概述
一,博弈的基本概念二,博弈的分类
2
一,博弈的基本概念
博弈论博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的. 博弈论的基本概念包括:参与人行动参与人,行动参与人行动, 战略,信息支付函数,结果均衡. 信息,支付函数结果,均衡战略信息支付函数结果均衡

博弈模型汇总

博弈模型汇总如下：
1.合作博弈与非合作博弈：这是根据参与者之间是否可以达成具
有约束力的协议来划分的。

合作博弈强调团队合作和协作，目标是达成共赢；而非合作博弈则强调个人利益最大化，不考虑其他参与者的利益。

2.静态博弈与动态博弈：这是根据参与者做出决策的时间顺序来
划分的。

静态博弈是指所有参与者同时做出决策，或者决策顺序没有影响；动态博弈是指参与者的决策有先后顺序，后行动者可以观察到先行动者的决策。

3.完全信息博弈与不完全信息博弈：这是根据参与者对其他参与
者的偏好、策略和支付函数了解的程度来划分的。

完全信息博弈是指所有参与者都拥有完全的信息，能够准确判断其他参与者的策略和支付函数；不完全信息博弈则是指参与者只拥有部分信息，无法准确判断其他参与者的策略和支付函数。

4.零和博弈与非零和博弈：这是根据所有参与者的总收益是否为
零来划分的。

零和博弈是指所有参与者的总收益为零，一方的收益等于另一方的损失；非零和博弈则是指所有参与者的总收益不为零，各方的收益和损失不一定相关。

5.竞争博弈与合作博弈：这是根据参与者之间是否存在竞争或合
作关系来划分的。

竞争博弈是指参与者之间存在竞争关系，目标是追求个人利益最大化；合作博弈则是指参与者之间存在合作关系，目标是追求共同利益最大化。

6.微分博弈与离散博弈：这是根据决策变量的连续性来划分的。

微分博弈是指决策变量是连续变化的，需要考虑时间、速度等因素；离散博弈则是指决策变量只有有限个可能的取值，通常只考虑状态的变化而不考虑时间、速度等因素。

数学建模博弈模型

博弈模型在实际问题中的应用前景
政策制定
01
利用博弈模型分析政策制定中的利益关系和策略选择，为政策
制定提供科学依据。
企业竞争策略
02
利用博弈模型分析企业竞争中的策略选择和预期行为，为企业
制定合理的竞争策略。
国际关系
03
利用博弈模型分析国际关系中的利益关系和冲突解决机制，为
国际关系管理提供理论支持。
THANKS
猎鹿博弈
总结词
描述两个猎人合作与竞争的关系，揭示了合作与背叛的平衡。
详细描述
在猎鹿博弈中，两个猎人一起打猎，猎物可以平分。如果一个猎人选择合作而另一个选择背叛，则背叛者可以独吞猎物。但如果两个猎人都不合作，则都没有猎物可吃。最佳策略是合作，但个体理性可能导致两个猎人都不合作，造成双输的结果。
03
智猪博弈
总结词
描述大猪与小猪在食槽竞争中的策略，揭示了合作与竞争的平衡。
详细描述
在智猪博弈中，一个大猪和一个小猪共同生活在一个猪圈里。每天都有一桶食物放在食槽中，大猪和小猪需要竞争才能吃到食物。如果大猪和小猪同时到达食槽，大猪会因为体型优势占据更多食物。但如果小猪先到食槽等待，大猪到来时已经没有食物可吃。最佳策略是小猪等待，大猪先吃，然后小猪再吃剩下的食物。
博弈模型的基本要素
参与者
在博弈中作出决策和行动的个体或组织。
策略
参与者为达到目标而采取的行动或决策。
支付
参与者从博弈中获得的收益或损失。
均衡
在博弈中，当所有参与者都选择最优策略时，达到的一种稳定状态。
博弈模型的建立过程
策略空间
确定每个参与者的所有可能采取的策略。
均衡分析
通过分析收益函数和策略空间，找出博弈的均衡点。

博弈模型与竞争策略(ppt 63页)

博弈模型与竞争策略
26
完全信息静态对策
2. 最小得益最大化策略（Maxmin Strategy)
博弈的策略不仅取决于自己的理性，而且取决于对手的理性。
如某电力局在考虑要不要在江边建一座火力发电站，港务局在考虑要不要在江边扩建一个煤码头。
他们的得益矩阵为：
24.11.2019
博弈模型与竞争策略
2.市场需求对双方都是已知的。 • 结果： 1.市场需求大，双方都会开发，各得利润4千万；
2.市场需求小，一方要依赖对方的决策，如果A 认为B会开发，A最好不开发，结果获利均为零；
3.如果市场需求不确定，就要通过概率计算。
24.11.2019
博弈模型与竞争策略
8
二、博弈的基本要素
1、参与人（player）参与博弈的直接当事人，博弈的决策主体
30
不完全信息静态对策
3. 混合策略在有些博弈中，不存在所谓纯策略的纳
什均衡。在任一个纯策略组合下，都有一个博弈方可单方改变策略而得到更好的得益。但有一个混合策略，就是博弈方根据一组选定的概率，在可能的行为中随机选择的策略。
例如博弈硬币的正反面，
24.11.2019
博弈模型与竞争策略
31
策略组合（strategy combination）一局对策中，各参与人所选定的策略组成一个策略组合，或称一个局势。
S=(s1i，s2j，……)
24.11.2019
博弈模型与竞争策略
10
博弈的基本要素
3、支付（或收益）函数（payoff matrix）当所有参与人，确定所采取的策略以后，
他们各自会得到相应的收益（或支付），它是测量组合的函数。令Uk 为第k个参与人的收益函数：

第七章零和博弈(博弈论教程-石家庄经济学院,于振英)

2014-1-9
第七章零和博弈最小最大方法
20
第二节零和博弈的研究方法
一、最小最大方法（四）纳什均衡 Maximin=minimax=3 Maximin值与minimax值形成的策略组合:（中，右）
2014-1-9
第七章零和博弈最小最大方法
21
用最小最大方法寻找纳什均衡
甲的支付单矩阵乙不可行！原因：石头剪刀 Maximin≠minimax 其他方法？ 1 0 石头 -1 0 甲剪刀 1 -1 布
2014-1-9
博弈论第七章零和博弈
11
第一节
基本概念
四、零和博弈的表示方法：单矩阵 1.猜硬币者的支付单矩阵抛硬币者正面反面正面 1 -1 猜硬币者 -1 1 反面
2014-1-9
博弈论第七章零和博弈
12
第一节
基本概念
四、零和博弈的表示方法：单矩阵 2.抛硬币者的支付单矩阵抛硬币者正面反面正面 -1 1 猜硬币者 1 -1 反面
2014-1-9
第七章零和博弈最小最大方法
19
第二节零和博弈的研究方法
一、最小最大方法（三）乙（列参与人）的思想与行动 2.乙的行动：追求自身利益最大从每列max值中寻找min值（甲的min 值，对乙有利）→ 从最大中寻找最小，minimax→ 结果：“右”列， minimax =3
2014-1-9
第七章零和博弈最小最大方法
24
若John的期望支付相等？
p-(1-p) = -p+(1-p)→ p*=0.5 若p<0.5 John翻黑牌→预期Candy翻红牌若p>0.5 John翻红牌→预期Candy翻黑牌

博弈模型及竞争策略简介

博弈模型及竞争策略简介博弈模型是用来分析决策者之间相互作用关系的数学工具。

在经济学中，博弈模型被广泛应用于研究市场竞争和企业策略等问题。

本文将介绍博弈模型的基本概念和基本原理，并介绍一些常见的博弈模型和竞争策略。

博弈模型的基本概念和基本原理：博弈模型是一种描述决策者行为和相互作用的数学工具。

博弈模型主要包括决策者、行动、支付函数和解的概念。

决策者是指参与博弈的个体或组织，他们根据自身利益和目标做出决策。

行动是指决策者可以选择的各种行为方式。

支付函数是用来衡量每个决策者在不同行动组合下的效用或收益。

解是指在博弈中各个参与者都做出最佳决策的状态。

博弈模型的基本原理包括理性选择、均衡和解的概念。

理性选择是指决策者根据自己的目标和利益做出决策，不会做出明显损害自己利益的决策。

均衡是指在博弈中各个决策者做出的决策组合是相互一致的，没有一个决策者可以通过改变自己的决策而提高自己的效用。

解是指在博弈中各个参与者都做出最佳决策的状态，也就是说没有一个决策者可以通过改变自己的决策而提高自己的效用。

博弈模型有多种解的概念，例如纳什均衡、帕累托最优、卓亚定理等。

常见的博弈模型和竞争策略：最常见的博弈模型是纳什均衡模型。

纳什均衡是指在博弈中各个决策者做出的决策组合是相互一致的，没有一个决策者可以通过改变自己的决策而提高自己的效用。

在纳什均衡下，每个决策者都采取了最优的个体策略，而无法通过改变策略来获得更高的效用。

博弈模型还包括零和博弈模型和非零和博弈模型。

零和博弈模型是指在博弈中各个决策者的利益是完全相反的，一个决策者的收益就是另一个决策者的损失。

非零和博弈模型是指在博弈中各个决策者的利益不完全相反，存在一定的合作和竞争关系。

在实际应用中，博弈模型常常用于研究市场竞争和企业策略问题。

市场竞争模型是一种描述市场中企业之间相互作用关系的博弈模型，它可以用于研究市场价格形成、市场份额分配等问题。

企业策略模型是一种描述企业之间相互作用关系的博弈模型，它可以用于研究企业的定价、产品开发、市场推广等问题。

第七章、非对称信息博弈《经济博弈论基础》PPT课件

2.信贷配给的传统解释
经济学家或者将信贷配给解释为由外部振动引起的一种暂时的非均衡现象，或者将其解释为政府干预的结果（如政府人为地规定利率上限导致需求大于供给）。
3. Stiglitz & Weiss 的解释
银行（放款人）的期望收益取决于贷款利率和贷款人还款的概率两个方面，因此，银行不仅关心利率水平，而且关心贷款人的风险。如果贷款风险独立于利率水平，在资金的需求大于供给时，通过提高利率，银行可以增加自己的收益，不会出现信贷配给问题。
Stiglitz & Weiss 的解释
问题是：当银行不能观察借款人的投资风险时，提高利率将使低风险的借款人退出市场（逆向选择行为），或者诱使借款人选择更高风险的项目（道德风险行为），从而使得银行放款的平均风险上升。
Stiglitz & Weiss 的解释
原因是：那些愿意支付较高利息的借款人正是那些预期还款可能性低的人。结果，利率的提高可能降低而不是增加银行的预期收益，银行宁愿选择在相对低的利率水平上拒绝一部分贷款要求，而不愿意选择在高利率水平上满足所有贷款人的申请，信贷配给就出现了。
三、激励机制设计模型
2、分布函数的参数化方法:
max v( s(x)) f (x, , a)dx
a,s(x)
s.t.(IR) u(s(x)) f (x, , a)dx c(a) u (IC) u(s(x)) f (x, , a)dx c(a) u(s(x)) f (x, , a)dx c(a),a A
二.信号传递：Spence（1974）劳动力市场模型
雇员的教育程度可以作为信号向雇主传递有关雇员能力的信息，因为接受教育的成本与能力成反比，不同能力的人的最优教育程度是不同的。

博弈模型汇总

博弈模型汇总博弈模型是博弈论的重要工具，用于描述博弈参与者之间的策略和利益关系。

在博弈论中，通过建立合适的博弈模型，可以帮助我们分析和理解各种不同类型的博弈情境，并预测博弈参与者的行为和可能的结果。

下面将对几种常见的博弈模型进行汇总和介绍。

1. 零和博弈模型：零和博弈模型是博弈论中最简单和最基本的模型之一。

在零和博弈中，博弈参与者的利益完全相反，一方的利益的增加必然导致另一方的利益的减少。

这种博弈模型常常用于描述双方的冲突和竞争情境。

常见的零和博弈模型有二人零和博弈和多人零和博弈。

2. 非合作博弈模型：非合作博弈模型是博弈论中较为常见的模型之一。

在非合作博弈中，博弈参与者之间的行动和决策是相互独立的，每个博弈参与者都追求自身的最大利益。

在非合作博弈模型中，博弈参与者可以选择不同的策略，根据对手的行动做出最优的响应。

常见的非合作博弈模型有纳什均衡模型和博弈树模型。

3. 合作博弈模型：合作博弈模型是博弈论中另一个重要的模型。

在合作博弈中，博弈参与者之间可以进行协作和合作，共同追求最大化整体利益。

合作博弈模型通常用于描述多个博弈参与者之间的联盟和合作情境。

常见的合作博弈模型有核心模型和合作博弈解。

4. 演化博弈模型：演化博弈模型是博弈论中较为新颖和有趣的模型之一。

在演化博弈中，博弈参与者的行动和策略可以随时间变化和演化。

演化博弈模型通常用于描述博弈参与者之间的适应性和进化过程。

常见的演化博弈模型有进化博弈动力学模型和演化博弈解。

博弈模型的应用广泛，不仅在经济学中有重要的地位，也在其他学科领域得到广泛运用。

博弈模型可以帮助我们分析和解决各种决策和策略问题，对于理解社会、经济和生物系统中的行为和演化具有重要意义。

总结起来，博弈模型是博弈论的核心工具之一，用于描述和分析博弈参与者之间的策略和利益关系。

常见的博弈模型包括零和博弈模型、非合作博弈模型、合作博弈模型和演化博弈模型。

这些模型在各个领域中都有广泛的应用，对于理解和解决各种决策和策略问题具有重要意义。

博弈模型构建

博弈模型构建一、博弈模型的种类博弈模型可以根据不同的分类标准进行划分。

根据参与人的数量，博弈可以分为单人博弈、双人博弈和多人博弈。

根据参与人之间是否有合作的可能性，博弈可以分为合作博弈和非合作博弈。

根据信息是否完全，博弈可以分为完全信息博弈和不完全信息博弈。

此外，根据决策结构的不同，博弈还可以分为静态博弈和动态博弈。

二、博弈模型的要素一个完整的博弈模型通常包括以下要素：参与人、行动、信息、策略、支付函数和均衡。

参与人是指参与博弈的个人或组织；行动是指参与人在博弈中可以采取的行动或决策；信息是指参与人在博弈中所掌握的知识和数据；策略是指参与人在给定信息和对手策略的条件下所选择的行动方案；支付函数是指参与人在博弈中所获得的收益或效用；均衡是指博弈达到的一种状态，其中每个参与人的策略都是最优的。

三、博弈模型的建立过程建立博弈模型的过程可以分为以下几个步骤：1.确定参与人：确定博弈中的参与人，包括个人、组织、国家等。

2.确定行动空间：确定每个参与人在博弈中可以选择的行动或决策。

3.确定信息集：确定每个参与人在博弈中所掌握的知识和数据，即每个参与人的信息集。

4.确定策略空间：在给定信息和对手策略的条件下，确定每个参与人可以选择的行动方案，即每个参与人的策略空间。

5.确定支付函数：根据各方的利益关系及均衡结果，为每个参与人设定一个效用水平，并使各方的支付函数相互制约、相互影响。

6.寻找均衡：通过逻辑推理和分析，找出均衡状态，即每个参与人的最优策略组合。

7.评估和比较：对不同均衡状态下各方的收益进行评估和比较，以选择最有利的策略组合。

8.调整和优化：根据实际情况和需要，不断调整和优化模型参数和假设条件，以提高模型的预测准确性和应用价值。

四、案例研究：公共资源博弈模型公共资源博弈是一种典型的资源分配博弈，其中资源是公共的，所有参与者都可以使用这些资源来最大化自己的利益。

然而，如果每个参与者都只考虑自己的利益，就可能会导致资源的过度使用和破坏。

管理经济学讲义(新)管理经济学第七章博弈论与竞争策略

四．博弈的分类
• （1）合作博弈与非合作博弈根据参与者之间能否通过谈判达成
具有约束力的协议或合同来划分。
• 可以达成协议的为合作博弈cooperative game，合作博弈强调集体理性和整体最优。如买卖双方讨价还价后成交。
• 不能达成协议的为非合作博弈non-cooperative game，非合作博弈强调个体理性和局部最优。如寡头之间的竞争博弈，双方的利益和目标有冲突，难以达成可以实施的协议，双方都有欺骗和违约的冲动。博弈论在经济学中的应用主要在非合作博弈领域。
• 在有些情况下，为了避免陷入被动，采取最大最小策略十分必要。在下图的博弈中，乙方采取“右”是一个支配性策略。
因为不管甲方选什么，乙方采取右的策略都比左的策略好，
可以得到1的收益。在期望乙方采取右的情况下，甲方应该采
取“下”，并得到2的收益。这样，支配性策略均衡为（下，
右）。
• 如果甲方比较慎重，考虑到乙方可能不一定理性，或者可能故意捉弄甲方，则应该采取最大最小策略，形成（上，右）的博弈结果。
甜 20，10 -8，-8
2．对社会有害的合作，设法制止
• 在囚徒的困境博弈中，如果两个囚徒可以互相协商，并形成攻守同盟，则罪犯得到好处，对社会不利。例如在寡头厂商的定价博弈中，勾结定高价对双方都有好处，但对社会不利，因此受到反垄断法的严密监控。
• 寡头厂商的价格博弈收益矩阵如下：
厂商2
高价
二．支配性策略dominant strategy均衡
• 支配性策略均衡也称上策均衡或优势策略均衡。在博弈中，对有些参与者来说，不管对手采取什么策略，他的策略都保持不变。这种不取决于对手选择的最优策略称为支配性策略（上策或优势策略）。

第七章不完全信息动态博弈

第七章不完全信息动态博弈本章将在动态博弈中引入信息不对称因素，其博弈的内容被称为不完全信息动态博弈（uncomplete information dynamic game ）。

不完全信息动态博弈就其基本要素来看是前面引入的不完全信息概念与博弈的动态性质的一种综合。

譬如，我们在处理不完全信息要素时是通过将某些局中人“类型”的不确定性作为信息不完全性的一种表征，这种方法将继续在本章中得以采用，即博弈中局中人面临的信息不完全性（无论它是指何种信息）将完全由某些局中人的“类型”的不确定性加以刻画。

同时，作为动态博弈，正如我们在第五章中所指出的那样，“序贯理性”的思想将一直得到贯彻。

我们将第五章中引入的“子博弈精炼均衡”的思想作类似的推广于不完全信息动态博弈。

这种延续在逻辑上是必需的，因为一旦我们在不完全信息动态博弈中将信息不完全程度削减到零，则不完全信息动态博弈就自然应退化成一种完全信息动态博弈，其相应的精炼均衡概念就应回到子博弈精炼均衡。

从这种意义上来看，不完全信息动态博弈的精炼均衡概念是子博弈精炼均衡概念的一种推广，正如不完全信息动态博弈应被视作完全信息动态博弈的一种推广一样。

7.1 精炼贝叶斯均衡在本小节中，我们来构造不完全信息动态博弈的均衡概念，特别是贯彻了“序贯理性”原则的精炼均衡概念。

首先，博弈的纳什均衡是一种“僵持”状态的战略组合，当所有的局中人都选择该战略组合中给出的相应战略时，任何一个局中人都不会有单方面偏离这一选择的动机。

作为动态博弈，一个战略是局中人在其可能进行行动选择的所有信息集上将作何选择的一整套规定或计划，而作为不完全信息博弈，这种规定或计划还是“类型依存”的，即不同类型的局中人将选择不同的战略规定。

因此，一个不完全信息动态博弈的纳什均衡将是指这样的一种类型依存性的战略组合（或战略组合的族），当给定其他局中人的战略时（其他局中人的战略是类型依存的，所以，说给定其他局中人的战略即指给定其他局中人的战略与类型的依存关系），任一局中人在其任何类型下由该组合给出的类型依存战略给出的战略是其最优的。

博弈论三大典型模型

博弈论三大典型模型1.囚徒困境“囚徒困境”说的是两个囚犯的故事。

这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。

在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙，或者保持沉默。

这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。

但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。

而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。

当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。

那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。

但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。

这种想法的诱惑力实在太大了。

但他也意识到，他的同伙也不是傻子，也会这样来设想他。

所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。

而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。

所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。

企业在信息化过程中需要与咨询企业、软件供应商打交道的。

在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。

在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。

博弈模型要素

博弈模型要素
博弈模型是用于描述在策略互动中理性参与者如何决策的数学框架。

其构成要素主要包括以下几个方面：
参与者（Players）：博弈中的决策主体，他们可以是个人、组织或国家等。

每个参与者都有自己的利益和目标，并会根据自己的利益和目标进行决策。

策略（Strategies）：参与者可选择的行动方案，策略的选择直接影响到参与者的收益。

每个参与者都有自己的策略集，即可以选择的所有策略的集合。

信息（Information）：参与者在进行决策时所依赖的知识，包括关于其他参与者身份、策略和历史数据等方面的知识。

信息的完整性、准确性和及时性对博弈的结果具有重要影响。

收益（Payoffs）：参与者从博弈中获得的利益或损失。

收益通常取决于参与者的策略选择以及对手的策略。

在非零和博弈中，各方的收益之和可能大于或小于零，体现了各方利益的相互影响。

结果（Outcome）：博弈结束时各方的状态和利益分配情况。

每个结果都对应于一定的策略组合，是所有参与者策略选择的综合体现。

均衡（Equilibrium）：当所有参与者都选择最优策略，并且该策略组合不再发生变化时，就达到了博弈的均衡状态。

均衡是博弈分析的重要概念，它描述了在给定他方策略的情况下，每个参与者的最优选择。

理解这些要素是建立和分析博弈模型的基础，有助于深入理解不同策略和信息条件下参与者的行为模式和博弈结果。

博弈论中的三个经济学模型

q2≥0
q2≥0
= maxq2[a-q1- q2 -c],
q2≥0
which yields
R2(q1) =
a- q1 -c 2
,
Provided q1＜ a – c. The same equation for
R2(q1) appeared in our analysis of the simultaneous -move Cournot game in Chapter 1. The difference
“重复剔除严格劣策略（iterated elimination of strictly dominated strategies）”的思路：
首先，找出某个参与人的严格劣策略，并把它从他的策略空间中剔除，重新构造一个已不包含该严格劣策略的博弈；
其次，剔除新博弈中某个参与人的严格劣策略；
重复上述过程，直到只剩下唯一的策略组合。 ——我们认为这个唯一所剩的策略组合是稳定的。
b﹤2
思考：在Bertrand的模型中，如果两厂商的产品是同质的，那么NE会是什么？
将是： P1*= p2*= c
Bertrand paradox
子博弈完美NE应用举例
（一）Stackelberg Mondel of Duopoly
Stackelberg(1934)proposed a dynamic model of duopoly in which a dominant(leader) firm moves first and a subordinate(or follower) firm moves second(比如在美国汽车产业发展史中的某些阶段，通用汽车就扮演过这种领导者的角色，只不过跟随者不只一个，如福特、克莱斯勒等). Following Stackelberg,we will develop the model under the assumption that the firms’ choose quantities, as in the Cournot model(where the fires’ choices are simultaneous,father than sequential as here ). P86

数学建模-博弈模型-2

的战略组合 s = ( s1 , L , si , L , sn ) ，收益函数 ui ( s1 ,L , si ,L , sn ) 均可取一个确定的值。均可取一个确定的值。
由于混合战略是纯战略空间的一个概率分布，由于混合战略是纯战略空间的一个概率分布，合战略是纯战略空间的一个概率分布这就使得与参与者对战略选择的不确定性（随机性）就使得与参与者对战略选择的不确定性（随机性）相伴的是收益的不确定性。概率论提供的平均意义上的伴的是收益的不确定性。期望值的概念可以用来衡量混合战略的效果，构造期期望值的概念可以用来衡量混合战略的效果，望收益函数就可以比较两个不同混合战略的优劣。望收益函数就可以比较两个不同混合战略的优劣。设 p = ( p1 ,L , pn ) 是一个混合战略组合，其中
为了区分,s 就称为纯战略。为了区分 i 就称为纯战略。对完全信息静态博弈来说，来说，一个参与者的纯战略就是他可以选择的一种特定的行动。例如在猜硬币博弈中，每个人的战略空间 Si 的行动。例如在猜硬币博弈中，中含有两个纯战略，分别是“正面正面”和背面一个参与背面”。中含有两个纯战略，分别是正面和“背面。者的混合战略就是规定他以某种概率分布随机去选择不同的行动。例如在猜硬币博弈中，不同的行动。例如在猜硬币博弈中，参与人 1 的一个混为出正面的概率，合战略是概率分布 ( p,1 − p) ，其中 p 为出正面的概率，战略是概率分布而且可以看到，战略是概率分布 (q ,1 − q ) , 且 0 ≤ q ≤ 1 。而且可以看到，混合战略（）表示参与人的一个纯战略，即选择“正混合战略（1,0）表示参与人的一个纯战略，即选择正背面”的纯战面”。类似地，混合战略（0,1）表示选择背面的纯战。类似地，混合战略（）表示选择“背面略。

07博弈论与企业策略性行为_产业经济学(王俊豪版)

第四节合作策略性行为
（二）冷酷策略冷酷策略(grim strategy)是指在重复博弈中，只要所有的人都采取合作的策略，那么就一直合作下去，如果有一方背叛了合作，那么合作就永远终止，所有的人对此行为加以惩罚。
第四节合作策略性行为
（三）胡萝卜加大棒策略胡萝卜加大棒策略则是一个较为温和的策略。开始所有的垄断企业都生产一个合作的低产量，相应地利润也比较高，但是一旦有某个企业背离了这个策略生产高产量时，所有的企业都调整为高产量去惩罚他。如果任何一个企业在惩罚期不惩罚(对于不执行惩罚策略的人给予惩罚是给予惩罚者的一个胡萝卜)，惩罚期重新开始。如果没有企业在惩罚期不惩罚，合作期又重新开始。
第四节合作策略性行为
三、明确合作策略性行为
明确合作策略性行为是指寡头企业通过公开或秘密的协议（书面或秘密会谈）来协调行为以使合作组织利润最大化的一种行为。
（一）共同成本手册与多产品定价公式（二）转售价格维持（RPM）（三）基点定价
第四节合作策略性行为
（四）一致-竞争条款（五）价格领导（六）预告价格变动（七）最惠国待遇条款（八）行业协会（九）交换信息（十）分割市场与固定市场份额
小约翰纳什（John Forbes Nash）是20 世纪最有才华的数学家之一。他在22 岁的时候所写的一篇只有20 多页的论文奠定了博弈论的基础， 1994 年和另外两位经济学家一起获得了诺贝尔经济学奖。
第一节博弈与博弈论
到60年代，出现了一些重要人物，泽尔滕 (Selten)将纳什均衡的概念引入动态分析提出了 “精炼纳什均衡”的概念；海萨尼(Harsanyi)把不完全信息引入博弈论研究。
掠夺性定价是指原有企业将价格削减至对手平均成本之下，以便将对手驱逐出市场或者遏制进入，即使遭受短期损失。一旦对手离开市场，原有企业就会提高价格以补偿掠夺期损失(Schmalensee; Rosenbaum; Romano and Berg)。

博弈论的几个经典模型PPT课件

博弈论的几个经典模型
模型三、独立私人价值下的一级密封拍卖/不完全信息静态博弈
N
高成本
低成本
A
默许
阻挠
A
默许
阻挠
B
B
B
B
进入不进入进入不进入进入不进入进入不进入
(50,40)(300,0)(0,-10)(300,0)(100,30)(400,0)(140,-10)(400,0)
*贝叶斯纳什均衡
模型二、囚徒困境/非合作博弈
有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果一个犯罪嫌疑人坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白，则两人各被判刑8年；如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。
为个人)他自己的最好策略，还是采用(作为集体的一员)他们共同的最好策略？前者导致均衡策略(坦白，坦白)，支付为(-8，-8)；后者的最好策略是(抵赖，抵赖)，支付为(-1，-1)。这里反映了个体理性行为与集体理性行为之间的矛盾、冲突。 • 此博弈只进行一次还是重复进行？如果博弈只进行一次，参与人似乎只有坦白才是最好的策略，因为没有理由相信对手会对你有信心，他总认为你自己会坦白；因此，双方都采取坦白策略。然而，若博弈进行多次，则结论将会发生变化。
四，杀鸡给猴看。其实猴子是没有思维的,它们有一定的群体意识，但没有社会意识，人们关于它们的故事其实是说人自己的。我们这里也讲一个猴子的故事……。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

（2）
• 从式(1)、(2)可以看到，企业1和企业2选择自己的利润最大的行动
必须依赖于对方的行为。我们把这种反映厂商间相互关系的方程
式成为最佳反应函数，更一般地表示为：qi=R(qj)。从(1)和(2)我们可以求解得：
• q*1=(a-c)/3b • 因为q*是实现两企业利润最大的产量。因此，他们都将生产q*，
我们此时两家厂商的利润u1=u2=4，两厂商利润总和为8；市场出清价格P=4。
我们再从另外一个角度来考察这个问题。如果两家厂商联合起来像一个垄断者一样在市场上行动，以总体利益最大化为目标来考虑市场的最佳产量，容易求出使得总得益最大
的总产量Q*=3，最大总得益u*=9。将此结果与两厂商独立决
古诺模型在现实中有很多例子。如在一个偏远的农产品市场上的两大西瓜垄断种植商之间的产量竞争。另一个很好的例子就是石油输出国组织(OPEC)的限额被突破。
伯特兰德模型
古诺模型有力的解释了厂商间的数量均衡，但是市场价格究竟是由谁来决定这个问题却没有得到说明。下面介绍的模型解释假定厂商现在选取的决策变量不再是产量而是价格时的博弈均衡。
• 为便于分析，古诺模型里还假定： • （1）市场上只有两个厂商，企业1和企业2，不会有别
的企业进入； • （2）产品同质，即两家厂商的产品完全相同。那么，
市场的总产量Q=q1+q2； • （3）厂商的成本只表现为变动成本，并且边际成本都
等于固定数量的C，即MC1=MC2=C； • （4）市场只存在一个时期，那么厂商之间的博弈也将
是单期的； • （5）市场的需求为P=a-bQ。
• 那么，企业1和企业2的利润π1和π2分别为：
• π1=（P-C）q1=（a-b(q1+q2)-c）q1
• π2=（P-C）q2=（a-b(q1+q2)-c）q2
• 为实现利润最大化，一阶条件为：
• q1=(a-c)/2b-q2/2
（1）
• q2=(a-c)/2b-q1/2
在静态竞争的情况下，寡头们同时作出决策并且互不知道对方的选择；而在现实中，更多的情况是参与竞争者的行动是有先后的，且后行动者一般都能在自己的行动之前或多或少地观察到竞争对手在此之前的行动信息并以此为依据来修正自己的决策，所以这种竞争情况的模型必须用动态博弈的语言来描述。
在动态博弈中各博弈方在关于博弈进程方面的信息是不对称的，后行动者有更多的信息来帮助自己作出选择。一般来说，这是后行动者的有利条件，此即所谓后动优势或后发制人；但有时先行动者能够利用后行动者的“理性”，采取一些行动并发出一定的信号让后行动者知晓，迫使后行动者不得不作出一些在不知道这些信号前不会作出的选择，此即先动优势或先发制人。
而不会选择其他。因而，q*成为市场的均衡产量，一般称之为古诺均衡。此时的均衡价格P*=(a+2c)/3。
结果分析:
这是两厂商根据自身利益最大化原则同时独立作出产量决策的古诺模型均衡结果。这个结果有没有使两厂商真正实现自身利益的最大化?从社会总体的角度来看效率又如何?
• 下面可以分析古诺均衡下的社会福利情况。因为市场的需求曲线是 P=a-bQ，因此，a是消费者愿意支付的最高价格。那么，我们有理由相信a＞c，否则，企业将不会选择生产，因为生产就意味着亏损。我们从而得到：（a+2c）/3＞c。这意味着，古诺模型中的均衡价格 P要高于完全竞争均衡中价格等于边际成本的水平。
商是同时决策的。
两博弈方的得益： u１=u１(p１,p２)=p１q１-c１q１=(p１-c１)q１=(p１-c１)(a１-b１p１+d１p２) u2=u2(p１,p２)=p2q2-c2q2=(p2-c2)q2=(p2-c2)(a2-b2p2+d2p1)
伯特兰德博弈的唯一纳什均衡解：
p1*=
d1(a2+b2c2)+2b2(a1+b1c1) 4b1b2-d1d2
对“伯特兰德悖论”的解释
• 主要有三种理论：
生产能力约束理论产品差别理论动态竞争理论。
• 1）生产能力约束理论(埃奇沃思解法) • 在伯特兰德模型中，他是假定厂商能随时无限供应市场需求的。
但是在现实中，生产能力的约束是存在的。埃奇沃思在1897年就用生产能力约束条件来解开伯特兰德悖论。 • 假定企业1设计的生产能力为q1，市场需求为D，一般地q1＜D。q1 一般为多大？按照古诺模型的结论，即使市场是完全垄断的，企业愿意供应的产量也只有(a-c)/2b。因此，我们可以假定企业1原先设计的生产能力最大为(a-c)/2b。若企业1让P1=C，他将面对整个市场需求，需要供应数量为(a-c)/b的商品，但是它实际只能提供(a-c)/2b，无法满足整个市场的需求。那么，对另一场上企业2 来说，他就面临正的剩余需求（(a-c)/b-(a-c)/2b）=(a-c)/2b。其实，对任意价格P，企业2都可以让企业1先提供(a-c)/2b数量，然后他来满足剩下的需求。那么其剩余需求曲线为：P=(a+c)/2bq2。对这些需求，企业2具有垄断能力，那么，它可以实行垄断价格，从而获得真的经济利润。
设在一个市场上，厂商1和厂商2的产品标价分别为p1和p2，此
时，他们各自的需求函数分别为：
q１=q１(p１,p２)=a１-b１p１+d１p２
q2=q2(p1,p２)=a2-b2p2+d2p1
其中d１,d２＞0表示两厂商产品有一定替代性的替代系数。我们同样假定两厂商无固定成本，边际生产成本分别为c1和c2，两厂
斯坦克尔伯格模型
在动态竞争中，产业市场上的两个寡头往往一强一弱，无论是决定产量还是制定价格，弱者往往跟在强者后面，观察强者的实际行动，随后决定自己的策略。我们称先行动者为领导者，而后行动者为跟随者。由于整个产业市场的大小在一定时间内总是一定的，跟随者的加入，要改变整个产业市场的供应，故对领导者的收益也是有影响的。所以领导者在决定自己的策略时要充分考虑到跟随者可能有的策略，将之包括到自己的最优化策略中，否则会造成两败俱伤。对产业市场上这种行为的分析最早是由斯坦克尔伯格作出的，以后就称此类市场竞争的模型为斯坦克尔伯格模型。
古诺模型
• 古诺模型是法国数学家奥古斯汀·古诺于1838年首先建立的。这是有关博弈论思想的第一个较为成熟的模型。虽然模型提出较早，但至今仍被广泛应用。该模型最早用于分析双寡头垄断市场，后来被应用于分析任意数量厂商的市场均衡。我们先分析双寡头垄断市场的古诺均衡。
• 古诺模型假定厂商独立行动，并首先选择产量作为决策变量，以实现利润最大化。
• 但是，如果市场是完全垄断的话，从需求曲线得到边际收益MR为： • MR=a-2bQ • 那么，按照MC=MR得： • Q*=(a-c)/2b • 那么，P*=(a+c)/2 • 因为a＞c，那么，(a+c)/2-(a+2c)/3=(a-c)/6＞0 • 这意味着古诺均衡的价格要比垄断市场的价格低，但是比完全竞争
• 因为产品同质，完全可替代，那么对消费者来说，购买时只考察产品的价格，谁出价更低，就购买谁的商品。所以，对企业A和企业B来讲，价格更低的厂商将得到全部市场，而价格高的企业市场需求为零。当两者价格相等时，他们均分市场。所以，企业A的需求函数为：
DPi , PA PB
DA PAPB
时的均衡价格要高。因此，古诺均衡的社会福利水平比垄断市场有所改善，但不如完全竞争市场实现的福利，处于两者之间。
古诺模型
问题举例: 设在市场上有代号为1、2的两个寡头垄断厂商，他们
生产相同的产品，消费者从中察觉不出任何差异。市场出
清价格由两家厂商的总产量决定。设厂商1的产量为q1，厂商2的产量为q2，则市场的总产量Q=q1+q2。设P为市场出清价格，则P是市场总产量Q的函数，即反需求函数。在本例中，我们假定反需求函数为：P=P(Q)=8-Q 。
静态竞争，是指在寡头垄断市场上，各竞争参与人只竞争一次，同时作出决策且对各参与人可能有的策略和相应的得益都完全了解的竞争模式。
对本节中所分析的模型先作五个比较强的假设： 1.消费者是价格接受者。 2.所有厂商生产同质的(完全相同的)产品，消费者从中察觉不任何差异。 3.没有其他厂商进入该行业，这样在观察期内厂商数目保持不变。在本章分析中一般假设市场上只有两个厂商。 4.厂商集体地拥有市场力量，它们能将价格设定于边际成本之上。 5.每一厂商仅设定其价格或产量。在特定的具体模型中，我们将放松其中的某些假定。
• 2、若是二者联合垄断则收益最大时候的产量是多少，最大收益是多少？
• 3、若一个合作(产量为1.5)，另一个则不合作把自己的产量定在3--1.5/2的水平上 (1.5,1.5不是个纳什均衡 )会是什么结果。
• 1、 (Q=4)， (P=4) • 2、 (Q=3) (R=9) • 3、U1=3.375;U2=5.06
产品差别化
• 伯川德模型有个重要的假定就是个企业生产的产品同质，他们具有完全的替代性。在这种情况下，消费者只关心价格。但是，如果产品存在一定的差别的话，即使对方价格更低，某一企业也不至于失去所有的消费者，这意味着它面临的需求曲线是正斜率的曲线。该企业可以收取一个较高的价格。因此，只要存在产品差别，p=c就不是均衡的价格，市场不会实现均衡。

1

2
DPA ,
PA

PB
0, PA PB
• 企业A和企业B为实现利润最大化都希望自己的价格能比对方更低，从而获取全部的市场销量。又因为是单期博弈，没有纠错和报复的机会，因为对每一个厂商来说，最优选择就是价格等于边际成本C。所以，当且仅当PA=PB=C时，两厂商不再有变动价格动机，市场实现均衡。
p2*=
d2(a1+b1c1)+2b1(a2+b2c2) 4b1b2-d1d2

第七章博弈的三个模型2

《西方经济学》第七章 博弈论

博弈模型汇总

数学建模博弈模型

博弈模型与竞争策略(ppt 63页)

第七章 零和博弈(博弈论教程-石家庄经济学院,于振英)

博弈模型及竞争策略简介

第七章、非对称信息博弈 《经济博弈论基础》PPT课件

博弈模型汇总

博弈模型构建

管理经济学讲义(新)管理经济学第七章博弈论与竞争策略

第七章 不完全信息动态博弈

博弈论三大典型模型

博弈模型要素

博弈论中的三个经济学模型

数学建模-博弈模型-2

07博弈论与企业策略性行为_产业经济学(王俊豪版)

博弈论的几个经典模型PPT课件

《西方经济学》第七章博弈论

第七章零和博弈(博弈论教程-石家庄经济学院,于振英)

第七章、非对称信息博弈《经济博弈论基础》PPT课件

第七章不完全信息动态博弈