第六章(1)博弈论

合集下载

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

第六章第一讲重复博弈的类型解读

感谢室友不杀之恩重复博弈
2020年11月18日
博弈论第六章
1
重复博弈的类型
“宽容”OR“不好惹”？
A家长教育孩子A的原则：宽容
A的选择：及时还击，培养“不好惹”的声誉—— “他打你，你就打他”
C家长教育孩子C的原则：好斗
若A与C之间的博弈重复进行？
要与人为善
2020年11月18日
博弈论第六章
1
1 r r 市场利率
1 2 2 3 T 1T
T
2020年11月18日
t 1 博t 弈论第六章
13
t 1
重复博弈的类型
第一节重复博弈的类型
➢二、无限次重复
➢（一）案例：寡头削价竞争
➢1.案例
➢
寡头1
➢
高价
低价
➢
高价
➢寡头2
4，4
➢
低价 5，0
0，5 1，1
2020年11月18日
重复博弈的类型
第一节重复博弈的类型
➢二、无限次重复 ➢（一）案例：寡头削价竞争 ➢2.无限次重复博弈策略分析 ➢（3）以后各期
A、if寡头2合作，“高价”→ 寡头1坚持“高价”
2020年11月18日
B、 if寡头2不合作，“低价”→ 寡头1报复，永远低价
博弈论第六章
16
重复博弈的类型
第一节重复博弈的类型
9
重复博弈的类型
第一节重复博弈的类型
➢一、有限次重复
➢（二）定理：有限次重复博弈的均衡
G（T）：有限次重复博弈 G：博弈 T：重复次数 G：阶段博弈，T<∞
2020年11月18日
若G有唯一的纳什均衡，
则G（T）的唯一子博弈精炼

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支，研究决策制度下的相互作用和决策策略。

它是通过数学模型来描述和分析不同参与者的决策行为和决策结果，并找到最优的决策策略。

下面是博弈论中的一些重要知识点的总结。

1.博弈的定义和基本概念：-博弈是指参与者在一定的规则下做出决策，并根据其他参与者的决策结果来确定自己的收益或损失。

-参与者称为博弈者，他们的决策称为策略，策略的组合称为策略组合。

-博弈可以是合作博弈或非合作博弈，合作博弈强调协作，非合作博弈强调竞争。

2.标准博弈：-标准博弈是博弈论中最基础的形式，参与者之间的策略和收益都是确定的。

-标准博弈可以是零和博弈（总收益为零）或非零和博弈（总收益不为零）。

3.纳什均衡：-纳什均衡是指在博弈中，不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。

-纳什均衡是博弈论中的核心概念，它描述了博弈中的稳定状态。

-一个博弈可能有一个或多个纳什均衡，也可能没有纳什均衡。

4.基本博弈：-二人零和博弈是一种特殊的博弈，其中一个参与者的利益是另一个参与者的损失。

-石头、剪刀、布是一个典型的二人零和博弈，存在一个纳什均衡策略。

-行棋游戏如国际象棋、围棋也是二人零和博弈，但策略空间较复杂。

5.博弈理论的扩展：-广义博弈是对博弈理论的扩展，考虑了更复杂的情况，如多人博弈、不完全信息博弈等。

-多人博弈是指博弈中有多个参与者，每个参与者都会影响其他参与者的决策。

-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。

6.博弈论在经济学中的应用：-博弈论在经济学中有广泛的应用，如市场竞争、拍卖等。

-例如，决定定价策略的厂商可以使用博弈论来确定最优的定价策略。

-拍卖是一种常见的博弈形式，在博弈过程中参与者可以选择不同的竞标策略。

7.演化博弈：-演化博弈是博弈论的一个重要分支，研究博弈在一定的演化过程中的演化规律。

-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。

博弈论第六章不完全信息静态博弈题库

博弈论第六章不完全信息静态博弈题库【原创版】目录一、引言二、不完全信息静态博弈的概述1.不完全信息的定义2.静态博弈的定义三、不完全信息静态博弈的解题方法1.严格优势策略2.纳什讨价还价解3.轴向讨价还价解四、应用案例分析五、总结正文一、引言在博弈论中，不完全信息静态博弈是一个重要的研究领域。

由于参与者在博弈过程中所拥有的信息不完全，这使得博弈过程变得更加复杂和有趣。

本文将介绍不完全信息静态博弈的概述，以及探讨如何解决这类问题。

二、不完全信息静态博弈的概述1.不完全信息的定义不完全信息指的是参与者在博弈过程中，无法完全了解其他参与者的策略或支付函数。

这种情况下，参与者需要根据自己所掌握的信息，来猜测其他参与者可能采取的策略。

2.静态博弈的定义静态博弈是指参与者在一定时间内，一次性地选择策略并完成博弈的过程。

静态博弈中，参与者不需要考虑时间顺序，只需关注当前状态下的最优策略。

三、不完全信息静态博弈的解题方法1.严格优势策略在完全信息静态博弈中，如果一个策略对某个参与者来说是严格优势的，那么他会选择这个策略。

在不完全信息静态博弈中，同样可以利用严格优势策略来求解。

即通过分析其他参与者可能采取的策略，找到一个对某个参与者来说严格优势的策略。

2.纳什讨价还价解纳什讨价还价解是解决不完全信息静态博弈问题的一种方法。

通过设计一种讨价还价机制，使得参与者可以在不完全信息的情况下，达成一种合作解。

纳什讨价还价解的关键是让参与者在博弈过程中，有动力去揭示自己的真实支付函数。

3.轴向讨价还价解轴向讨价还价解是另一种解决不完全信息静态博弈问题的方法。

它通过让参与者在博弈过程中，根据其他参与者的策略选择，来调整自己的策略，从而实现一种合作解。

轴向讨价还价解的优势在于，它可以在不完全信息的情况下，使得参与者的收益达到最大。

四、应用案例分析以寡头垄断市场为例，市场中有两个寡头企业，它们需要决定是否进行价格战。

在这个过程中，每个企业都需要考虑对方的策略选择。

博弈论基本概念

博弈论，又称为对策论（Game Theory）、赛局理论等，既是现代数学的一个新分支，也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用，是研究具有斗争或竞争性质现象的数学理论和方法。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

在博弈论中，通常包括以下基本概念：
局中人：在一场竞赛或博弈中，具有决策权的参与者被称为“局中人”。

在一个博弈中，每个局中人都要做出选择。

行动：局中人在博弈中的每一个决策或选择被称为“行动”。

信息：局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。

策略：局中人基于可获得的信息，制定的决策方案或规则称为“策略”。

收益：局中人在博弈中的得失或输赢称为“收益”。

均衡：当所有局中人都认为自己的策略选择最优，并且其他局中人也认为该策略选择是最优时，这种状态被称为“均衡”。

结果：在一场博弈结束后，所有局中人的收益总和被称为“结果”。

博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。

其中，局中人、策略和收益是最基本要素。

发展过程方面，博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。

目前，博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

第六章博弈论

一般认为，1944年美国数学家冯•诺依曼(John Von Neumann)和经济学家奥斯卡•摩根斯坦 (Oskar Morgenstern)合著的《博弈论与经济行为》(The Game Theory and Economic Behavior) 一书的出版，标志着系统的博弈理论的形成。
❖该书详尽地讨论了二人零和博弈，并对合作博弈作了深入探讨，开辟了一些新的研究领域。更重要的是将博弈论加以空前广泛的应用，尤其是在经济学上，由于博弈论数学上的严整性与经济学应用上的广泛性，一些经济学家将该巨著的出版视为数理经济学确立的里程碑。
“保证最低价格”策略
❖ “保证最低价格”条款。
❖ 该条款一般规定：“顾客在本商店购买这种商品一段时间内，如果发现其他任何商店以更低的价格出售同样的商品，本店将退还差价，并补偿差额的10％。”
❖ 一、单项选择题：
❖ 分析下列的报酬矩阵，回答问题：
John的开业长时间咖啡馆开业短时间
✓ 第一，不能让对方事先知道自己可能采取的策略。
✓ 第二，必须采取随机选择的原则。 ✓ 第三，选择策略的概率一定要使对
方无机可乘。
动态博弈
➢重复博弈 ➢序列博弈
重复博弈
❖ 对重复博奕的研究结果证明有一种最好的策略：只需将一个原则贯穿始终，即“以牙还牙”（Tit-for-tat）。
❖ 以牙还牙策略的获胜有一个十分重要的条件，即博弈是无限次重复的。
❖王则柯：《新编博弈论平话》中信出版社 ❖ 王则柯主编：《21世纪经济学教材：博弈论
教程》中国人民大学出版社
❖ 《美丽心灵》（A Beautiful Mind ）是一部关于一个真实天才的极富人性的剧情片。故事的原型是数学家小约翰-福布斯-纳什(Jr.John Forbes Nash)。英俊而又十分古怪的纳什早年就作出了惊人的数学发现，开始享有国际声誉。但纳什出众的直觉受到了精神分裂症的困扰，使他向学术上最高层次进军的辉煌历程发生了巨大改变。面对这个曾经击毁了许多人的挑战，纳什在深爱着的妻子艾丽西亚(Alicia)的相助下，毫不畏惧，顽强抗争。经过了几十年的艰难努力，他终于战胜了这个不幸，并于1994年获得诺贝尔奖。这是一个真人真事的传奇故事，今天纳什继续在他的领域中耕耘着。

《博弈论》

博弈论在大数据分析中的应用
数据挖掘
博弈论可以应用于数据挖掘中的关联规则挖掘、分类和聚类等问题，如基于博弈论的关联规则挖掘算法等。
异常检测
博弈论可以应用于异常检测中的异常值识别和分类等问题，如基于博弈论的异常检测算法等。
推荐系统
博弈论可以应用于推荐系统中的用户行为预测和个性化推荐等问题，如基于博弈论的推荐算法等。
04
博弈论的应用领域
经济领域
价格竞争
博弈论可以用来分析企业之间的价格竞争，研究竞争对手的反应和策略，以制定更有效的定价策略。
寡头市场
博弈论可以用来研究寡头市场的均衡和稳定性，分析不同寡头企业的策略和相互影响。
拍卖理论
博弈论可以用来研究拍卖机制的设计和优化，以提高拍卖的效率和公平性。
政治领域
线性方程组
02
求解博弈中的均衡策略通常需要解线性方程组。
特征值与特征向量
03
一些博弈问题可以通过分析矩阵的特征值和特征向量来得到解
决。
概率论与数理统计基础
概率分布
在博弈中，支付通常被假设为随机变量，其分布可以通过概率分布来描述。
期望与方差
支付的期望和方差是博弈论中常用的概念，它们可以用来衡量支付的不确定性。
弈。
特点
混合博弈既强调参与者的合作与协商，又强调参与者的竞争与对抗，通过综合运用两种策略实现自身利益最大化。
应用领域
混合博弈在经济学、政治学、社会学等领域都有广泛的应用，尤其是在现实世界中，很多博弈都可以被视为混合博弈。
03
博弈论的数学基础
线性代数基础
向量与矩阵
01
博弈论中经常使用向量和矩阵来表示策略和支付。

博弈论课件

脚的看牌人、看棋人，企业的顾问等。
对参与人的决策来说，最重要的是
必须有可供选择的行动集（策略集）和
一个很好定义的支付函数。
自然被当作虚拟参与人。
清华诚志
10
（2）策略（strategies ）:博弈中有两种策略
概念，一种为纯策略（pure strategy ）, 简称策略，指参与人在博弈中可以选择采用的行动（actions or moves）方案，是参与人在给定信息结构的情况下的行动规则，它规定参与人在什么时候的什么情
囚徒困境反映了个人理性和集体理性的矛盾。如果Ａ和Ｂ都选择抵赖，各判刑１年，显然比都选择坦白各判刑８年好得多。当然，Ａ和Ｂ可以在被警察抓到之前订立一个"攻守同盟"，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定,显然最好的策略是双方都抵赖.
清华诚志
5
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。
清华诚志
26
我们从博弈中学习什么
博弈论告诉人们，要学会理解他人都有自己的思想，每个个体都是理性的，所以必须了解竞争对手的思想。商业关系被认为是一种相互作用。但博弈论并不是疗法，并不是处方，它并不告诉你该付多少钱买东西，这是计算机或者字典的任务。博弈论只是提供一些关系的例证，一些有用的解决问题的方法。这种思维方法也许是企业家应该学习的。对于经济学家，也许需要学习它的理论模型，它的实验方式。

研究生-第六章博弈论与信息经济学

逆向选择
3.逆向选择与信贷市场信贷配给是信贷市场上存在的一种典型现象,原因在于逆向选择现象存在,高风险的项目驱赶了低风险的项目. 信贷市场中,一般高风险与高收益成正比,银行不了解贷款者的类型,厂商知道自己的信息.导致贷款利率与银行期望收益之间的变化如图所示,利率上升的(直接的) 收益效应大于(间接的)风险效应,π随r上升而上升; 当r>r*时,利率上升的(间接的)风险效应超过(直接的)收益效应,π随r的上升而下降,银行期望收益最大化的利率为r*.
隐藏行动事前隐藏信息逆向选择模型信号传递模型信息筛选模型隐藏信号的道德风险模型
事后
隐藏行动的道德风险模型
第一节逆向选择
1.逆向选择与旧货市场(Akerlof,the market for lemons) 逆向选择:在鉴定交易契约前,进行市场交易的一方可能因为占据信息优势,做出对自己有利,对另一方有害的事情,从而降低了市场效率,甚至可能导致这一市场的萎缩. 在旧货市场,卖者拥有信息,买者缺乏信息,买者以平均质量的价格购买旧商品,将质量较高的旧商品逐出市场,质量较差的旧商品留在市场,并最终成交. 即为旧货市场的逆向选择行为.
第三节完全信息静态博弈(二) ——混合策略(mixed strategies) ——混合策略(mixed strategies)
1.混合策略定义:σ*=(σ1*,…,σn*)=(σi*,σ-i *)是一纳什混合策略均衡,当且仅当对所有局中人而言, σi* 是σ-i*的最适反应,ui(σi*,σ-i *)≥ ui(σI',σ-i *), σ σ σ ≥ σ σ 对所有σi'∈∑i成立). 持混合策略的前提是在均衡时两种策略的报酬会相等,是预期支付最大化的推导结果. 2.案例分析掷硬币

博弈论知识点总结完整版

博弈论（一）：基本知识1.1定义:博弈论，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。

即，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间的均衡。

1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数，是博弈最重要的基本要素。

1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。

两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议（binding agreement）。

倘若不能，则称非合作博弈（Non-cooperative game）。

合作博弈强调的是集体主义，团体理性，是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果有时有效率，有时则不然。

目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益的最大化，最后达到力量均衡。

博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。

把两个角度结合就得到了4种博弈：a、完全信息静态博弈，纳什均衡，Nash(1950)b、完全信息动态博弈，子博弈精炼纳什均衡，泽尔腾（1965）c、不完全信息静态博弈，贝叶斯纳什均衡，海萨尼（1967-1968）d、不完全信息动态博弈，精炼贝叶斯纳什均衡，泽尔腾（1975）Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式：策略式表述(Strategic form), 扩展式表述（Extensive form）1.6占优均衡：a、占优策略：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。

第六章、合作博弈《经济博弈论基础》PPT课件

与摩根斯特恩提出来的概念，有时被记为VN-M解。记所有可能分配组成的集合为E(V)，则稳定集定义如下：
• 定义4：对于n人合作博弈(N,V)，分配集 W E(V )为稳定集，则W满足:
(1)（内部稳定性）不存在 x, y W ，满足 x y； (2)（外部稳定性）对 y W ,x W，使得 x y 。
(N,V)，有 i[U V ] i[U] i[V ]
4、夏普利值（Shapley value）
• 公理 (S1)反映了帕累托最优性的要求，表示分配收益时，不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法，主要的批评是：它忽略了联盟外局中人使联盟面临最坏处境时，自己也将付出代价（有时代价很高）。
Harsayni认为，特征函数的取值应该由联盟与其对立联盟（联盟外所有局中人形成的联盟）之间的一次谈判而决定。
第二节合作博弈解
一、合作博弈求解思路合作博弈理论求解的目的：得到博弈的“理性”最终分配，主要方法有两种：优超与赋值。
(2) 分配：合作博弈的一个分配是指对n个局中人来说，存
在一个向量 x (x1,, xn ) ，满足：
(1) xi V (N) ；(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益，V(i)表示局中人i不与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性，说明个人分配的收益和正好是各种联盟形式总的最大收益；
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0，没有人的联盟是不会有任何收益的;
V(1)=0，局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
，局中人1将不得不在0与-1之间选择。

第六章博弈论初步详解

An Example of a Two-Player Game
The players are called A and B. Player A has two strategies, called “Up” and “Down”. Player B has two strategies, called “Left” and “Right”. The table showing the payoffs to both players for each of the four possible strategy combinations is the game’s payoff matrix.
The Prisoner’s Dilemma
Clyde S S Bonnie (-5,-5) C (-30,-1)
C (-1,-30) (-10,-10)
What plays are we likely to see for this game?
The Prisoner’s Dilemma
Clyde
Player B L R U (1,2) (0,4)
Player A
D
(0,5)
(3,2)
Pure Strategies
Player B L R
U Player A
(1,2)
(0,5)
(0,4)
(3,2)
D
ห้องสมุดไป่ตู้
Is (U,L) a Nash equilibrium? No. Is (U,R) a Nash equilibrium? No. Is (D,L) a Nash equilibrium? No.
Player B L R U
(3,9) (1,8)

博弈论概述

博弈论概述博弈论是研究决策制定者之间相互作用的一门学科。

在博弈论中，决策者被称为"玩家"，他们的决策会影响其他玩家的利益。

博弈论的目标是研究玩家在不同情境下的最佳决策策略，以及这些策略对整体结果的影响。

以下是博弈论的一些基本概念和要点：1.玩家（Players）：博弈中的参与者被称为玩家。

这可以是个体、公司、国家等。

2.策略（Strategies）：玩家在博弈中采取的行动或决策被称为策略。

每个玩家可以有多种可能的策略。

3.支付（Payoffs）：博弈的结果被称为支付，它反映了每个玩家在博弈结束时的效用或利润。

4.博弈矩阵（Game Matrix）：通过博弈矩阵，可以清晰地表示玩家的策略选择和相应的支付。

博弈矩阵通常用于描述二人零和博弈。

5.纳什均衡（Nash Equilibrium）：纳什均衡是指在博弈中，每个玩家都选择了最优的策略，给定其他玩家的选择，没有一个玩家有动机单方面改变自己的策略。

6.博弈形式（Normal Form）和博弈扩展形式（Extensive Form）：博弈形式描述了一次性的、同步进行的博弈，而博弈扩展形式描述了具有序列和时间概念的博弈。

7.博弈的分类：博弈可以分为合作博弈和非合作博弈、零和博弈和非零和博弈、完全信息博弈和不完全信息博弈等。

8.博弈的应用领域：博弈论在经济学、政治学、社会学、生物学、计算机科学等多个领域都有广泛应用。

博弈论提供了一种分析人们在决策过程中相互作用的方式，它的应用范围涵盖了众多领域。

在博弈中，每个玩家都追求自己的最大利益，因此博弈论可以帮助人们更好地理解和预测复杂的决策场景。

管理经济学第六章博弈论和策略行为

可能存在纳什均衡。
案例6－2：性别之战两个谈恋爱的人准备在周末晚上一起出去。男的喜欢听音乐会，但女的喜欢看电影。当然，两个人都不愿意分开活动。不同的选择给他们带来的满足由表 2表示。
女
音乐会电影
音乐会
2 , 1 －1 , －1
男
电影－1 , －1 1 , 2
在这样一个对局中，男的和女的都没有支配性策略。实际上，他们的最优策略依赖于对方的选择，一旦对方选定了某一项活动，另一个人选择同样的活动就是最好的策略。两个纳什均衡解。
四、顺序性博弈
序列博弈
现实生活中，还存在另一种博弈状态，即对局者
选择策略有时间先后的顺序，某些对局者可能率先采
取行动，这种博弈称为顺序性博弈。重复博弈和序列
博弈都是动态博弈。
先行动的参与者往往会有一定的优势。
案例6－6：双寡头垄断的两家企业都打算推出一种新产品。四种可能的策略组合的利润结果见表 6，单位是百万美元。
1、在一次性博弈中任何欺骗和违约行为都不会遭到报复，囚犯困境的不合作解通常是难以避免的。
2、在无限期重复博弈中，报复的机会总是存在的，所以，每一个参与者都不会采取违约或欺骗的行为，囚犯困境合作均衡解是存在的。
3、在有限期重复博弈中，囚犯困境博弈的纳什均衡是参与者的不合作。
4、在不能确定终止期的有限期重复博弈的囚犯困境模型中，纳什均衡的合作解是可以存在的。
无新产品有新产品
企业 B
无新产品有新产品
4,4
3,6
6,3
2,2
1、如果企业谋求最大利润，本例存在两个纳什均衡。
两个纳什均衡：（无新产品，有新产品）和（有新产品，无新产品）
2、按照最大最小决策准则，均衡解是：（无新产品，无新产品）

《运筹学》课件第六章博弈论

§1 基本概念
一、博弈论的定义二、博弈理论的历史三、博弈问题举例四、博弈的分类
三、
1. 囚犯困境（Prisoners’ dilemma
囚犯困境是图克（Tucker）1950年提出的；该博弈是博奕论最经典、著名的博弈；该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题，但可以扩展到许多经济问题，以及各种社会问题，可以揭示市场经济的根本缺陷。
所有局中人的策略组成的向量。)
s (s1,, si,, sn ) 表示n个局中人达成的
一个协议，当这个协议可以自动实施（Self-enforcing）时，即没有任何局中人有积极性破坏这个协议，那么这个协议就构成纳什均衡。
否则，若至少存在某些局中人有积极性偏离这个协议，就构不成纳什均衡。
例：囚犯困境问题：
但是，尽管政府当时无力制止这种事情，公众也不必担心彩电价格会上涨。这是因为，“彩电厂商自律联盟”只不过是一种“囚徒困境”，彩电价格不会上涨。在高峰会议之后不到二周，国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态：无论其他厂商是否降价，我自己降价是有利于自己的市场份额扩大的。
Ⅱ
坦白抵赖
坦白
Ⅰ
-9，-9
0，-10
抵赖 -10，0 -1，-1
均衡解：二人均坦白
相关概念介绍
➢博弈分析的基本假设（1）个人理性假设当事人在决策时能够充分考虑他所面临的局势，并能做出合乎理性的选择。
（2）最大化自己的收益假设当事人在决策时通常选择使自己收益最
大化的策略。
坦白抵赖
➢ 博弈问题的基本要素（1）局中人（Players）
现代博弈论主要指非合作博弈理论。非合作博弈更受重视的原因：主导人们行为的主要还是个体理性，而非集体理性；即，竞争是一切社会、经济关系的根本基础，不合作是基本的，合作是有条件和暂时的。

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述：1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论研究的假设：1、决策主体是理性的，最大化自己的收益。

2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。

行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。

信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。

完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。

不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。

支付：决策主体在博弈中的收益。

在博弈中支付是所有决策主题所选择的行动的函数。

从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别：3、博弈论与传统决策的区别：1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。

可表示为：maxU(P,l),其中P为市场价格，丨为消费者可支配收入。

2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。

但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。

4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。

战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

《博弈论教程》第六章课后习题整理

《博弈论教程》第六章课后习题整理，仅供参考！6—1这句话不对，根据定理6.1可知，只要博弈重复的次数有限，重复本身并不改变囚徒困境原来的均衡结果。

具体的博弈可参见p229-p230的例子。

6—2若N>L ，则min{N,L}=L,到了第N 阶段，当对手在N-L-1到N 阶段的最近连续L 次博弈中采取合作的策略，则我方继续合作，当对手在N-1阶段的博弈中采取背叛策略，则我方在N 到N+K 的连续K 次博弈中采取背叛策略，K 可能大于，等于或小于L ，K 和L 没有必然的关系；若N=L ，则min{N,L}=N=L,到了第N 阶段，当对手在1到N 的连续N 次博弈中采取合作的策略，则我方继续合作，当对手在N-1阶段的博弈中采取背叛策略，则我方在N 到N+K 的连续K 次博弈中采取背叛策略，K 可能大于，等于或小于L ，K 和L 没有必然的关系；若N<L ，则min{N,L}=N,到了第N 阶段，当对手在1到N 的连续N 次博弈中采取合作的策略，则我方继续合作，当对手在N-1阶段的博弈中采取背叛策略，则我方在N 到N+K 的连续K 次博弈中采取背叛策略，N+K 可能大于，等于或小于L ，K 和L 没有必然的关系；综上，K 和L 没有必然的关系。

写min{N,L}而不是简单的L 是因为不清楚背叛是发生在第N 阶段之前还是之后，这样写有利于做一个简明的判断。

6—3从今年的100元在明年的价值角度来看，在通货紧缩的年份，实际利率大于0（实际利率=名义利率-通货膨胀率，名义利率为正，通货膨胀率在通货紧缩时为负，），今年的100元到明年的价值大于100元，所以今年的100元比明年的100元好。

从货币的购买力角度来看，今年的100元的购买力大于明年的100元的购买力，那明年的100元更好。

6—4两公司都不做广告的收益大于纳什均衡的收益，故该博弈是囚徒困境博弈。

该博弈的合作策略是不广告，背叛策略是广告。

什么是博弈,

第六章博弈论
（1）什么是博弈
（2）完全信息静态博弈、纳什均衡
（3）完全信息动态博弈
（4）*不完全信息的静态和动态博弈
§6—1博弈论的基本概念与分类
一、博弈论的基本概念
（一）什么是博弈论？
博弈论（game theory），又译为对策论，就是研
究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
类似问题在许多情况下都会出现，如寡头竞争、军备竞赛、团队生产中的劳动供给、公共产品的供给等等。同时，囚犯困境反映了一个深刻问题，这就是个人理性与团体理性的冲突。
市场机制这只“看不见的手”，在人人追求自身利益最大化的基础上可以达到全社会资源的最优配置。囚犯困境对此提出了新的挑战。
（二）重复剔除的占优策略均衡
•
•
者并不知道先行动者采取了什么具体行动。动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。第二个角度是按照参与人对其他参与人的了解程度进行分类。从这个角度，博弈可以划分为完全信息博弈和不完全信息博弈。
完全信息博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈：如果参与人对其他参与人
（三）纳什均衡
纳什均衡是指在均衡中，每个博弈参与人都确信，在给定其他参与人选择的策略的情况下，该参与人选择了最优策略以回应对手的策略。纳什均衡是完全信息静态
博弈解的一般概念。
构成纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略。也就是说，没有一种策略严格优于纳什均衡策略（注意：其逆定理不一定成立），许多不存在占优策略均衡或重复剔除的占优策略均衡的博弈，却存在纳什均衡
实际上，博弈是一种日常现象。在经济学中，博弈论是研究当某一经济主体的决策受到其他经济主体决策的影响，同时，该经济主体的相应决策又反过来影响其他经济主体选择时的决策问题和均衡问题。

博弈论的方法

15
博弈的分类及对应的均衡
静态
完全信息完全信息静态博弈；纳什均衡； Nash(1950) 不完全信息静态博弈；贝叶斯纳什均衡；海萨尼（1967-1968）
动态
完全信息动态博弈；子博弈精炼纳什均衡；泽尔腾（1965）不完全信息动态博弈，精炼贝叶斯纳什均衡；泽尔腾（1975） Kreps,Wilson(1982), Fudenberg,Tirole(1991)
16
不完全信息
纳什均衡

纳什均衡的定义纳什均衡的一致预测性纳什均衡与严格下策反复消去法
17
纳什均衡的定义
各博弈方都不愿或不会单独改变自己策略的策略组合，只要这种策略组合存在且是唯一的，博弈就有绝对确定的解。这种各博弈方都不愿单独改变策略的策略组合就是博弈论中最重要的一个概念——“纳什均衡”。
29
混合策略纳什均衡

混合策略混合策略博弈混合策略纳什均衡混合策略和严格下策反复消去法
30
许多现实中决策问题构成的博弈中根本不存在具有稳定性的各博弈方都接受的纳什均衡策略组合如猜硬币博弈和齐威王田忌赛马，而另一些博弈却有多于一个的纳什均衡策略组合，如夫妻之争博弈。这两类博弈如果只进行一次，实际结果如何确实取决于机会和运气，如果多次独立反复进行这些博弈，这样博弈方决策的好坏就会从平均得益上反映出来，策略运用得当平均收益会较理想，至少是不吃亏，否则平均得益就会很差。
13
博弈的关键
局中人理性地采取或选择自己的策略行为，在相互制约相互影响的依存关系中，尽可能的提高自己的利益所得，这样，博弈论就是关于包含相互依存情况中理性行为的研究。相互依存理性行为

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

二、理论模型——二手汽车市场原理假设存在一个二手汽车市场，有两种质量的汽车，低质量和高质量，它们各占比例为λ 和1- λ 。卖主：了解每辆所卖的车，对低质量车的评价是VL元，对高质量车的评价是VH元（VH >VL）买主：属于风险中性，对低质量车的预期支付价格为
WL元，对高质量车的预期支付价格为WH元（WH >WL）
5
“逆向选择”—逆淘汰：是指由交易双方信息不对称和市场价格下降产生的劣质品驱逐优质品，进而出现市场交易产品平均质量下降的现象。
经济生活中向选择 ——“平均主义”的逆向选择
6
基本思想：
“柠檬”在美国俚语中表示次品、不中用的东西，由阿克洛夫首先引入经济学著作。信息经济学将由于非对称信息而导致交易一方面临不利的选择环境，称为“逆向选择”。二手产品市场中，低质量产品将高质量产品排挤出市场的主要原因是
案例1：兰州百合的市场均衡
兰州百合是中国四大百合系中唯一可食用的品种，质量上乘，还可作为药用。市场价格较高，最高达26元/公斤，而普通百合的价格仅为5-6 元/公斤。因此，大量次品充斥市场，消费者难辨真伪，最终，次品将正品逐出了市场。
P D1 S1 D2 S2
Q
16
案例2：劳动市场的性别歧视问题
量汽车被排挤出市场（如图表3-1所示）。
11
概率密度
第二轮选择后的质量分布第一轮选择后的质量分布
选择前质量分布质量
S
图表 3-1：旧汽车市场的变化
12
平均质量
价格
质量曲线
需求曲线供给曲线
价格 A 图表 3-2：旧汽车市场均衡 B
数量
不完全信息对旧市场均衡的影响可由图表3-2表示。图表3-2A表示旧汽车的平均质量随着价格的上升而提高，图表3-2B表示由于买主了解到旧汽车价格越低，其质量就越低，即所谓“便宜没好货”，因此，当旧汽车价格下降时，购买量反而会相应减少，故旧汽车需求曲线将会向后弯曲。这表明旧汽车市场的需求不仅依赖于价格，而且依赖于质量。供给曲线由于价格上升，市出售的旧汽车将会增加，故将会照常向上倾斜。 13
的旧汽车，同时又有100人想买旧汽车，买主和卖主都知道这
些旧汽车中高质量与低质量的汽车各占50%。拥有最高质量和最低质量旧汽车的卖主的预期售价分别为2000和1000美元，而最高质量和最低质量旧汽车的潜在买主的预期支付价格则分别为2400和1200美元。
如果信息对称且充分，买主不难确定旧汽车的质量，该
第六章不完全信息博弈
一、概论二、逆向选择三、道德风险四、信号博弈
1
第1节概述
1、不完全信息：博弈方中至少有一方不完全清楚其它某些博弈方的特征，以及收益分布等信息。
2
2、不完全信息的基本模型分类：
隐蔽行为
隐蔽信息 3. 逆向选择模型
事前
4. 信号传递模型
5. 信号甑别模型
事后
1. 隐蔽行为的道德风险模型
2. 隐蔽信息的道德风险模型
3
3、逆向选择与道德风险分析
简单模型一般模型逆向选择
解决方法抵消性规则
应用
保险市场的委托代理关系
二手车市场劳动力市场信贷市场保险市场
简单模型道德风险应用
一般模型
人才雇用信贷市场基金管理
4
第2节逆向选择
Akerlof与逆向选择理论：美国加利福尼亚大学经济学教授，2001年诺贝尔经济学奖得主，其主要成就在于“对非对称信息条件下的市场理论”做出了奠基性的贡献。 1970年在《经济学季刊》上发表著名论文“柠檬市场：质量不确定性和市场机制”（ The Market for Lemons: Quality Uncertainty and the Market Mechanism）
歧视倾向（不排除存在实质上性别歧视的可能），但
出现这种结果的内在原因在于，由于信息非对称，每
个女性了解自己的真实生产率，而雇主并不能够从各
种生产率组合的人群中选择出高生产率的雇员。面临
这种不利选择的局面时，理性的雇主将会选择预期招工成本最小的方法来选择员工。
18
假设全体劳动力总数为N，其劳动生产率服从均值为En的正态分布（图表3-6）。由经验和统计分析可知，男性劳动生产率平均高于女性（这对于雇主来说属于公共信息），这种劳动生产率的分布结构如图表3-7所示。
W*。
对卖主而言，高质量旧车的卖主因为W*< VH ，如果出售的话，不能弥补其效用损失，因此会退出市场。结果只剩下低质量旧车在市场
上交易。
15
三、案例分析
逆向选择是在签定委托—代理合同前常见的隐蔽信息环境，它大量出现在商品销售市场、保险市场、劳动市场、借贷市场、旅游等服务市场，以及金融风险和古董名画等文化市场上。
者保证产品的质量。
——广告：向消费者提供产品信息和品质承诺。
——连锁经营：与品牌具有类似的作用，如连锁旅店和连锁餐厅。
——许可制度：可以减少质量的不确定性。如医师许可证、律师许
可证等。
23
讨论：为什么保险公司不愿给超过65岁的人提供医疗保险？
在保险市场上，如果信息对称，那么，保险公司可以很
容易按照投保者的不同风险类别给予不同价格的保险单。
现假设保险市场有高风险和低风险两类投保者，假设高风险投保者面临的损失概率为H，低风险投保者的损失概率为L（H >L ）。保险公司如何确定保险费？如果保险公司不断提高保险费，则只有更高风险的人愿意投保，最终，将无法在任何保险费水平上签订保险合同。
交易发生的条件为：WL >VL WH > VH
14
交易过程
对称信息情况：买主能有效地区分每辆车的质量，只要满足WL >VL和WH > VH，双方就能够成交。不对称信息情况：
买主不能区分每辆旧车具体的质量情况，只能推测出市场上每辆
旧车的平均质量，因而对所有旧车作出一个平均的评价W*（W*< VH ）。 W*＝λ WL ＋（1－λ ）WH，在购买旧车时，其愿意支付的价格不超过
8
不同类型的产品，逆向选择的程度往往不同。标准化产品： ——煤炭、钢铁、木材（可进行期货交易）一般产品： ——化妆品、家具、装饰材料二手产品： ——旧汽车、旧家电、旧房子
一般而言，市场上拥有信息较多的一方可以利用信息不对称 “剥削”另一方，当不对称严重时，就会导致“逆向选择”的出
现。
9
一、基本模型：二手汽车市场行为假设存在这样一个二手汽车市场，有100人希望出售他们
差），凭关系介绍（需承担感情投资风险），等等。
当雇主不愿意在招工上花费太多的成本时，最优且最简单的方法是根据图表3-7的劳动生产率分布，全部招收男职员，这种做法的基本根据是，从10个男性中招收到5名高生产率的概率，平均要高于从男女各5名中招收到5名高生产率的概率，即使这样做可能会招收到2名甚至低于女性平均劳动生产率的男性（如图表3-7中A位置上的男性），但从整体效率上讲还是值得的。这种有效的招工政策对位于图表3-7中D位置上的女性最不公平，即
社会为维持劳动市场的效率而牺牲了她们的利益。
20
如果雇主完全不进行歧视，则他支付给雇员的平均工资将不会超过全体劳动力生产率的平均值En。如果他支付En的工资，则高生产率的劳动力将不会来应聘，最后，该雇主将只能聘用到低生产率的劳动力，从而将由于工资高于劳动生产率水平而面临亏损和破产。
21
案例3：保险市场中的逆向选择
市场不存在什么问题。低质量旧汽车将按1000～1200美元之间的价格出售，高质量旧汽车将按2000～2400美元之间的价
格交易。
10
在信息不对称的情况下，买主无法了解每辆汽车的质量，只能进行推测。因此，典型的买主将以预期值购买旧汽车，即愿意支付： 1/2×1200＋1/2×2400＝1800美元这样，拥有高质量汽车的卖主将不愿意出售汽车，会退出市场。假
22
四、逆向选择的解决方法 ——信号发送和信号甄别 ——保证书：大多数耐用消费品附带保证书以向买者保证产品具有某
些预期的质量，即卖方承担了风险而不是买方。
——品牌效应：不仅可以显示产品的质量，而且可以在产品质量与
预期不符时向消费者提供一种报复的手段，即消费者可以减少未来的消
费。新产品也经常与老品牌相关联，因此，品牌也可以向它的潜在消费
定最高质量的旧汽车退出市场后，旧汽车市场上高质量与低质量旧汽车
的比例变为2：3。买主也会感觉到旧汽车市场质量分布的变化，他们将不会再以1800美元作为预期价格，而是以 3/5×1200＋2/5×2400=1680美元作为预期价格，结果，又会有部分次高质量的旧汽车退出市场。
这一过程不断发生，最后，市场上将只剩下最低质量的汽车，高质
人数人数
女性男性
． A B En 劳动生产率图表 3-6：社会劳动生产率分布 C D 劳动生产率图表 3-7：男女劳动生产率分布
19
雇主考察员工劳动生产率的常见办法有：到原单位调查（需支付调查成本），给一个试用期（需支付监督和考察成本，且并非所有职位都适用），应聘测试（如笔试和面试，需支付测试成本，同时会存在偏
——它们都在相同的价格水平上出售。
7
阿克洛夫创造的旧汽车（柠檬）市场模型，提出了
三个重要结论：
1）在非对称信息市场中，同种商品的质量依赖于价
格。这是“便宜没好货”的标准经济学解释；
2）非对称信息导致市场上买主和卖主的数量要比完
全信息结构下少得多，甚至非常少，因而交易市场的运
行是低效率的；
3）逆向选择可能导致市场失灵。
歧视与理想的经济制度格格不入，但是现实生活中却大量存在，如种族歧视、性别歧视等。数据表明：在美国，在企业管理人员、政府官员、自由职业者等高薪职业中，有色人种和女性的比例大大低于白种男性比例。在中国，在政府官员、企业管理人员、专业技术人员等

第六章(1)博弈论

博弈论完整版PPT课件

第六章第一讲重复博弈的类型解读

博弈论知识点总结完整版

博弈论第六章不完全信息静态博弈题库

博弈论基本概念

第六章博弈论

《博弈论》

博弈论课件

研究生-第六章 博弈论与信息经济学

博弈论知识点总结完整版

第六章、合作博弈 《经济博弈论基础》PPT课件

第六章博弈论初步详解

博弈论概述

管理经济学第六章博弈论和策略行为

《运筹学》课件 第六章 博弈论

(完整版)博弈论知识点总结

《博弈论教程》第六章课后习题整理

什么是博弈,

博弈论的方法

研究生-第六章博弈论与信息经济学

第六章、合作博弈《经济博弈论基础》PPT课件

《运筹学》课件第六章博弈论