博弈论教材2013-2

合集下载

最新运筹学第13章-博弈论(1202版)教学讲义ppt课件

最新运筹学第13章-博弈论(1202版)教学讲义ppt课件

第1节 博弈论概论│什么是博弈论
1.1.2 引例 海滩选址博弈
海洋
海滩
0
B
C
A
200码
两个竞争者Y和C销售软饮料 日光裕者均匀分布在海滩上 Y和C价格相等 消费者从较近的售点购买饮料
第1节 博弈论概论│什么是博弈论
1.1.2 引例 海滩选址博弈
在中国的大城市里,你会发现一个有意思的现象,当你在街边看到一个肯德基后,相距不太远的距 离你会发现一个麦当劳
1.3.1 博弈论的两种表示方法
L 2
S
1
L
S
5, 1
4, 4
9, -1
0, 0
战略式表述 (strategic form representation) 多用矩阵
(2,2) L
L 1
S
2 S
L 2
S
(-1,-1) (-1,-1)
(1,1)
扩展式表述 (extensive form representation) 多用博弈树
B在决策时不确切地知道自然的选择;B的决策结由4个变为2个
A
开发
不开发
B
开发
N

1/2
不开发

1/2
B
B
开发
不开发 开发

1/2 不开发
N
小 1/2
不完全信息 博弈
B
开发
不开发
(4,4)
(8,0) (-3,-3) (1,0) (0,8)
第1节 博弈论概论│博弈论表示方法
1.2.2 博弈论的表示方法示例
案例:房地产开发项目,假设有A、B两家开发商,市场需求可能大,也可能小,投入需要1亿。 假定市场上有两栋楼出售:需求大时,每栋售价1.4亿;需求小时,每栋售价7千万 如果市场上有一栋楼出售:需求大时,每栋售价1.8亿;需求小时,每栋售价1.1亿

博弈论讲义入门 slides2

博弈论讲义入门 slides2

学生的成绩就是 其中, 是学生报出的数字。
VNM公理
• 公理A2(独立性):对任意p,q,r∈P,和 任意a∈(0,1],
VNM公理
• 公里A3(连续性):对任意p,q,r∈P,如 果 p > q > r,那么存在a,b∈(0,1) 使
定理—VNM表示
• P上的关系≥可用VNM效用函数u:Z→R 表示的充分必要条件是它满足公理A1-A3。 • u和v表示≥的充分必要条件是 其中a>0,b∈R
习题
• 考虑一正实数上可用VNM效用函数 u(x)=x2表示的关系≥。 这种关系可用VNM函数 表 示吗? 用 表示又如何呢?
对风险的态度
• 公平赌博:
• 参与者是风险中性的 iff 他对所有公平赌博无 所谓。 • 他是(严格)厌恶风险的 iff 他从不想参与公平赌 博。 • 他是(严格)追逐风险的 iff 他总是想参与公平赌 博。
基本概念:偏好 • 关系≥ (X上)是X×X上的任一子集 • 例如, • T≥C≡(T,C)∈≥ • ≥是完全的iff 要么X≥Y,要么Y≥X • ≥是传递的iff [X≥Y和Y≥Z]
偏好关系
• 定义:一种关系是偏好关系的充分必要 条件是,它是完全和传递的。
实例
• 在本班学生中定义下列关系 • xTy表示x至少和y一样高; • xMy表示x在课程14.04的期末成绩至少和 y一样高; • xHy表示x和y 上的同一所中学; • xYy表示x比y年龄小; • xSy表示x与y 同龄;
实例
可由函数u**表示,其中
练习
• 设想一群学生围绕一张圆桌坐下。定义 一种关系R,写成xRy,表示x坐在y的右 边。你能用一效用函数表示R吗? • 考虑一在正实数上以u表示的关系≥,其 中u(x)=x2。 • 这种关系可表示为 吗? • u**(x)=1/x 又 如何呢?

《博弈论》课程ppt课件

《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。

《博弈论》

《博弈论》

《博弈论》入车。

太专业需要数学功底,大师作品,参考书级。

经济学必读。

《博弈论》是2015年中国人民大学出版社出版的一本图书,作者是朱·弗登博格、让·梯若尔。

作品名称博弈论作者朱·弗登博格、让·梯若尔创作年代当代类别经济学图书购买更多购买博弈论朱·弗登博格,黄涛著中国人民大学出版社【正版旧书,下单咨询在线客服】¥17.14¥30.75服务由当当网提供去购买博弈论朱弗登博格,黄涛著¥21服务由京东提供去购买博弈论朱·弗登博格、黄涛【稀缺旧书】¥23.74¥191.38服务由当当网提供去购买快速导航作品目录版本信息作者简介内容简介《博弈论》是博弈领域的两位领军人物——包括2014年新科诺贝尔经济学奖获得者让梯若尔教授——的集大成之作,囊括了迄今为止除演化博弈之外的所有博弈论的理论和方法、代表了博弈论发展的最高水平。

它不仅涵盖了博弈论的方方面面。

而且几乎对每一个论题都给出了严密的数学推导和证明。

《博弈论》具有以下几个特点:第一,覆盖面广,几乎涵盖了博弈论的各个领域。

第二,有丰富的实例、精心构思的习题以及广泛的可扩展性。

第三,深入浅出,既可以满足一般读者对博弈论的了解,也可以满足爱好技术性证明的读者对于博弈论精髓的把握。

《博弈论》是经济学研究生和高年级本科生学习博弈论的最好教材,也是其他对博弈论有兴趣的读者的必备参考书[1]。

作品目录第1篇完全信息的静态博弈第1章策略式博弈和纳什均衡1.1 策略式博弈和重复严格优势的介绍1.2 纳什均衡1.3 纳什均衡的存在性和性质(技术性)参考文献第2章重复严格优势、可理性化和相关均衡2.1 重复严格优势和可理性化2.2 相关均衡2.3 可理性化和主观相关均衡参考文献第2篇完全信息的动态博弈第3章扩展式博弈3.1 引言3.2 多阶段可观察行为博弈中的承诺和精炼3.3 扩展式3.4 扩展式博弈中的策略及均衡3.5 逆向递归法与子博弈完美3.6 对逆向递归法和子博弈完美均衡的批评参考文献第4章多阶段可观察行动博弈的应用4.1 引言4.2 优化条件和子博弈完美性4.3 重复博弈初步4.4 鲁宾斯坦恩斯塔尔议价模型4.5 简单终止博弈4.6 重复剔除条件优势与鲁宾斯坦恩斯塔尔议价博弈4.7 开环和闭环均衡4.8 有限期和无限期均衡(技术性)参考文献第5章重复博弈5.1 可观察行动的重复博弈5.2 有限重复博弈5.3 和不同的对手重复博弈5.4 帕累托完美和重复博弈中的抗重新谈判5.5 具有不完美公共信息的重复博弈5.6 含有不完美公共信息的无名氏定理5.7 通过改变时期来改变信息结构参考文献第3篇不完全信息的静态博弈第6章贝叶斯博弈与贝叶斯均衡6.1 不完全信息6.2 例6.1:不完全信息下的公共产品供给博弈6.3 策略和类型6.4 贝叶斯均衡6.5 贝叶斯均衡:另一个例子6.6 剔除严格优势策略6.7 用贝叶斯均衡来解释混合均衡6.8 分布方法(技术类)参考文献第7章贝叶斯博弈与机制设计7.1 机制设计的两个例子7.2 机制设计和显示原理7.3 单个代理人的机制设计7.4 具有多个代理人的机制设计:可行配置、预算平衡、效率7.5 多代理人的机制设计:优化问题7.6 机制设计的其他问题附录[2]。

博弈论课件

博弈论课件

博弈论强调参与者之间的互动关系,通过数学模型和理论分析来研究 策略选择和均衡结果。
博弈论的发展历程
博弈论的起源可以追溯到20世纪初,当时数学家和经 济学家开始研究游戏中的策略和均衡。
1944年,冯·诺依曼和摩根斯坦合著的《博弈论与经济 行为》标志着博弈论的诞生。
随后,纳什、泽尔腾和哈萨尼等学者进一步发展了博弈 论,形成了现代博弈论的基础。
商业竞争与合作
商业竞争
博弈论可以用于分析商业竞争中的策略和行为,例如价格战、广告战等。通过 博弈论,企业可以更好地理解竞争对手的策略,制定出更有效的竞争策略。
商业合作
博弈论也可以用于分析商业合作中的策略和行为,例如供应链管理、合资企业 等。通过博弈论,企业可以更好地理解合作伙伴的需求和期望,制定出更有效 的合作策略。
贝叶斯纳什均衡
在不完全信息博弈中,如果所有参与 者都根据自己掌握的信息选择最优策 略,则所有参与者都能获得最大收益 。
静态博弈与动态博弈
01
静态博弈
02
动态博弈
所有参与者在同一时间点选择策略并获得收益。
参与者的选择有先后顺序,后选择的参与者可以观察到先选择的参与 者的策略和收益。
03
纳什均衡
纳什均衡的定义
博弈优化方法
线性规划
线性规划是一种数学优化方法, 用于找到在满足一组约束条件下 最大化或最小化目标函数的最优
解。
非线性规划
非线性规划是数学优化的一种方 法,用于找到一组变量的最优值 ,使得一个或多个目标函数达到
最优。
动态规划
动态规划是一种通过将问题分解 为相互重叠的子问题来解决问题 的方法,每个子问题的解被保存
博弈论课件
汇报人:
汇报时间:202X-01-04

《博弈论》

《博弈论》

博弈论在大数据分析中的应用
数据挖掘
博弈论可以应用于数据挖掘中的关联规则挖掘、分类和聚类等问 题,如基于博弈论的关联规则挖掘算法等。
异常检测
博弈论可以应用于异常检测中的异常值识别和分类等问题,如基 于博弈论的异常检测算法等。
推荐系统
博弈论可以应用于推荐系统中的用户行为预测和个性化推荐等问 题,如基于博弈论的推荐算法等。
04
博弈论的应用领域
经济领域
价格竞争
博弈论可以用来分析企业之间的价格竞争,研究竞争对手的反应 和策略,以制定更有效的定价策略。
寡头市场
博弈论可以用来研究寡头市场的均衡和稳定性,分析不同寡头企业 的策略和相互影响。
拍卖理论
博弈论可以用来研究拍卖机制的设计和优化,以提高拍卖的效率和 公平性。
政治领域
线性方程组
02
求解博弈中的均衡策略通常需要解线性方程组。
特征值与特征向量
03
一些博弈问题可以通过分析矩阵的特征值和特征向量来得到解
决。
概率论与数理统计基础
概率分布
在博弈中,支付通常被假 设为随机变量,其分布可 以通过概率分布来描述。
期望与方差
支付的期望和方差是博弈 论中常用的概念,它们可 以用来衡量支付的不确定 性。
弈。
特点
混合博弈既强调参与者的合作与协 商,又强调参与者的竞争与对抗, 通过综合运用两种策略实现自身利 益最大化。
应用领域
混合博弈在经济学、政治学、社会 学等领域都有广泛的应用,尤其是 在现实世界中,很多博弈都可以被 视为混合博弈。
03
博弈论的数学基础
线性代数基础
向量与矩阵
01
博弈论中经常使用向量和矩阵来表示策略和支付。

博弈论4

博弈论4
2013-7-13 24
聚点均衡和相关均衡

聚点均衡 例 城市博弈 两个人把上海、哈尔滨、南京、长春分为 两组,每组两个城市。规定两人相同则都 得100元,两人不同则什么都没有。怎么 分组? 夫妻博弈中双方的生日、性格特点、重要 节日等都可以作为聚点的根据。
2013-7-13 25



V
小偷得益 (偷)
0
Pg* Pg
*’
1
Pt守卫睡的概率
-p
-p1
2013-7-13
11
用横坐标表示小偷偷的概率,纵坐标
表示保安的期望得益,则S到-D的连 线与横轴的交点就是小偷的混合策略。 另一个图形中V和-P的连线与横轴的 交点就是保安的混合策略。 我们还会发现如下有趣的现象。为了 减少偷窃,加重对小偷的惩罚会奏效 吗?加重惩罚→暂时小偷减少偷窃→ 保安提高睡觉的概率→小偷偷窃的期 望得益增加→小偷继续偷窃
2013-7-13 18
战争与和平博弈
国家2
战争 战争
国家1 和平 -5,-5 -10,8
和平
8,-10 10,10
(战争,战争)、(和平,和平)是两个纯 策略纳什均衡,双方和平具有帕累托优势。
2013-7-13 19


上述分析仍然有疑问,既然理性的国家之间不 会选择战争,那么世界历史上为什么会有那么 多战争呢?答案是决策者考虑短期利益、个人 或小集团利益更多;决策者缺乏理性;局部或 特定时期的战争的利益比上述博弈假设的大等。 还有先发制人对自己较为有利,对方选择战争 时自己还击比不还击损失小等都使得战争的机 会增大。 寡头市场的价格竞争与两国之间的战争与和平 的选择很相似。企业之间的价格竞争有时就是 一场战争。

博弈论课件

博弈论课件

脚的看牌人、看棋人,企业的顾问等。
对参与人的决策来说,最重要的是
必须有可供选择的行动集(策略集)和
一个很好定义 的支付函数。
自然被当作虚拟参与人。
清华诚志
10
(2)策略(strategies ):博弈中有两种策略
概念,一种为纯策略(pure strategy ), 简称策略, 指参与人在博弈中可以选择采用的行动(actions or moves)方案,是参与人在给定信息结构的情况 下的行动规则,它规定参与人在什么时候的什么情
囚徒困境反映了个人理性和集体理性的矛盾。如果 A和B都选择抵赖,各判刑1年,显然比都选择坦 白各判刑8年好得多。当然,A和B可以在被警察 抓到之前订立一个"攻守同盟",但是这可能不会有 用,因为它不构成纳什均衡,没有人有积极性遵守 这个协定,显然最好的策略是双方都抵赖.
清华诚志
5
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到自己,这样他 们必然要服长的刑期。只有当他们都首先替 对方着想时,或者相互合谋(串供)时,才可 以得到最短时间的监禁的结果。
清华诚志
26
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的思想, 每个个体都是理性的,所以必须了解竞争对手的思 想。商业关系被认为是一种相互作用。但博弈论并 不是疗法,并不是处方,它并不告诉你该付多少钱 买东西,这是计算机或者字典的任务。博弈论只是 提供一些关系的例证,一些有用的解决问题的方法。 这种思维方法也许是企业家应该学习的。对于经济 学家,也许需要学习它的理论模型,它的实验方式 。

博弈与策略培训教材

博弈与策略培训教材

博弈与策略培训教材引言博弈论是一门研究决策和战略互动的学科,它涉及到多个领域,如经济学、社会学和政治学等。

博弈论的核心是研究个体或集体在不完全信息和相互依赖的情况下做出决策的策略选择问题。

本教材旨在介绍博弈论的基本概念,并提供实际案例和练习,帮助读者更好地理解博弈论的原理,并掌握博弈策略的分析和决策方法。

本教材适用于经济学、管理学、金融学等相关专业的学生,也适用于希望了解博弈论的自学者。

第一章博弈论的基本概念1.1 博弈论的定义与起源博弈论是一门研究决策和战略互动的学科,它起源于20世纪40年代,由约翰·冯·诺伊曼和奥斯卡·摩根斯特恩共同发展和建立。

博弈论的研究对象是玩家、策略和支付。

1.2 博弈论的应用领域博弈论有广泛的应用领域,包括经济学、社会学、政治学、生物学等。

在经济学中,博弈论可以用来分析市场竞争、合作与冲突等问题。

1.3 博弈论的基本概念博弈论的基本概念包括玩家、策略、支付和均衡解等。

玩家是博弈的参与者,策略是玩家的决策方案,支付是玩家根据策略选择所获得的利益或损失。

均衡解是一组策略,当玩家选择这组策略时,没有玩家有动机改变自己的策略。

2.1 零和博弈零和博弈是一种非合作博弈形式,即参与者的收益之和为零。

本节将介绍零和博弈的基本概念、标准形式、最优策略等。

2.2 囚徒困境囚徒困境是一个经典的非合作博弈问题,用来解释为什么有时候人们在互利的选择上会陷入不合作的情况。

本节将介绍囚徒困境的定义、解决方法以及囚徒困境在现实生活中的应用。

2.3 博弈树博弈树是用来表示非合作博弈过程的图形工具。

本节将介绍博弈树的定义、表示方法以及如何通过博弈树分析并确定最优策略。

3.1 特征函数博弈特征函数博弈是一种合作博弈形式,参与者通过合作来分配生成的收益。

本节将介绍特征函数博弈的定义、核心解、稳定策略等。

3.2 谈判博弈谈判博弈是一种合作博弈形式,参与者通过协商来达成最终决策。

博弈论教学课件(全)

博弈论教学课件(全)

二、博弈论的经济学渊源
经济学的一些思想为博弈论提供了基础,其中最 重要的就是所谓的“理性人”。
描述理性人的工具就是所谓的理性偏好。为了方便, 我们又用效用函数(在博弈论中称为收益函数)来 表示偏好。
构成博弈论基础的一个重要的经济定理就是所谓的 理性选择原理:如果决策主体的偏好是理性的,那 么(有限)选择集中就一定存在最优选择,这个选 择可能是唯一的,也可能是多个。
定义2.1 博弈表达的基本式(或策略式)由博弈的参 与者N,策略空间S和收益函数u三个要素组成,即G = {N, S, u}。
这里需要注意的是,完全信息静态博弈在多数情况 下,策略就等同于行动,所以G={ A,u}。但严格来 讲,策略并不是行动。
我们可以通过一个例子来加以说明。
[例1] 进攻与防守
对称博弈和对称均衡能够大大节省工作量,这也是博弈论中所举例子通常为对 称博弈的原因。
对称博弈通俗说就是代表参与者身份的下标,在分析中可以省略掉而没有关系。
四、混合策略
博弈论里面最根本的问题是什么?就是均衡 的存在性。如果均衡不存在,所有的工作都 成了无用功,之所以引入混合策略,意义就 在这里,因为如果仅仅限制在纯策略的范围 内讨论博弈的话,均衡有可能是不存在的。
双方争夺一个据点,有两条进攻路线X和Y,攻方有 两个军,而防守方也有两个军,只有当守方的兵力 不少于攻方时,才能击退进攻,否则据点将会失守。
首先可知守方的防守方案(即策略)为(0,2),(1,1),(2,0),即在X线路和Y线路驻扎 军队数,同样可以到的攻方的进攻方案(0,2),(1,1)和(2,0)。容易看出,行动并非策 略,策略是行动方案。
需要注意的几个问题:
(1)表达同一个偏好的收益函数不唯一,但在 单调变换下却是唯一的。

博弈论课件

博弈论课件

扩展一:不完全信息博弈
不完全信息博弈的定义
01
在博弈中,参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度,可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略,研究候选人如何 制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调,分析政策 制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作,分析国家如何通过 外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡 。
特点
纳什均衡是一种稳定的状态,任何参 与者单方面改变自己的策略都不会获 得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略, 该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略,该 策略都能为参与者带来更低的收益 。
特点
在优势策略下,参与者没有理由改 变自己的策略;在劣势策略下,参 与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降,还可能引发市场恶性竞争,破坏市场秩序。此外,价格战还可能导致产品质量 下降,损害消费者利益。
案例二:国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中,各国之间往往存在着复杂的博弈关系。为了维护自身利益,各 国会采取不同的博弈策略,如通过外交手段、经济制裁、军事威胁等方式来达 到自己的目的。

博弈论全套课件

博弈论全套课件

三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论,流传最广的是一个叫做“囚 徒 困 境 ” 的 故 事 。 这 个 博 弈 是 1950 年 图 克 (Tucker)提出的,这个博弈模型提出后曾引 发了大量的相关研究,也有许多关于“囚徒困 境”的版本。“囚徒困境”对博弈论的发展起 到了巨大的推动作用。可以说凡是讲博弈论, 都会说到这个经典的博弈模型。
在过去二三十年中,博弈论已成为社会科 学研究的一个重要方法。有人说,如果未来社 会科学还有纯理论的话,那就是博弈论。无论 是合作博弈还是非合作博弈都给我们提供了一 种系统的分析方法,使人们在其命运取决于他 人的行为时制定出相应的战略。特别是当许多 相互依赖的因素共存,没有任何决策能独立于 其它许多决策之外时,博弈论更是价值巨大。
最近十几年来,博弈论在经济学尤其是微 观经济学中得到了广泛的运用, 博弈论在许多 方面改写了微观经济学的基础,经济学家们已经 把研究策略相互作用的博弈论当作最合适的分 析工具来分析各类经济问题,诸如公共经济、 国际贸易、自然资源、企业管理等。在现代经 济学里,博弈论已经成为十分标准的分析工具。 除经济学以外, 博弈论目前在生物学、管理学 、国际关系、计算机科学、政治学、军事战略 和其他很多学科都有广泛的应用。现在已经有 愈来愈多的人开始关注、了解并学习博弈理论 。
博弈论(Game Theory)是一种关于游戏的 理论, 又叫做对策论, 是一门以数学为基础的、 研究对抗冲突中最优解问题的学科。事实上, 博弈论也正是衍生于古老的游戏,如象棋、围 棋、扑克等。
博弈论作为一门学科,是在20世纪50~60 年代发展起来的,当非零和博弈理论、特别是 不完全信息博弈理论获得充分发展时,才成为 现实。到20世纪70年代,博弈论正式成为主流 经济学研究的主要方法之一。1994年诺贝尔经 济学奖同时授予了纳什、泽尔腾、海萨尼三位 博弈论专家。2005年诺贝尔经济学奖又授予了 美国经济学家托马斯.谢林(Thomas Schelling)和以色列经济学家罗伯特.奥曼 (Robert Aumann),以表彰他们在合作博弈 方面的巨大贡献。

博弈论

博弈论

博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。

目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

生物学家使用博弈理论来理解和预测进化论的某些结果。

参见:行为生态学(behavioral ecology)。

理论历史约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。

1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。

纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

博弈论1 (2)全篇

博弈论1 (2)全篇
6.据得益特征:零和博弈;常和博弈;变和博弈
6
四、古典博弈论的三个基本假设:参与人是理性的;他们有 这些理性的共同知识;他们知道博弈规则。
理性的三个基本内涵:理性的局中人具有关于博弈的完全知 识;可以确切知道整个状态空间;具有相对无限的逻辑能力。
五、博弈的典型例子
1 .囚徒困境 坦白
坦白
不坦白
-6,-6 -1,-8
3
2、博弈与一般决策的区别
二、博弈模型要素
1、参与人:博弈中的决策主体。他的目的是通过选择策 略以最大化自己的支付(效用)水平。
虚拟参与人(自然):指决定外生的随机变量的概率分布 的机制。自然作为虚拟参与人没有自己的支付与目标函数, 即所有的结果对它都是无差异的。
2、策略:参与人在给定信息集(信息集包含了一个参与人有关 其他参与人之前行动的知识,可理解为参与人在特定时刻有关 变量值的知识。一个参与人无法准确知道的变量全体属于一个 信息集)的情况下的行动规则。它规定参与人在什么时候选择 什么行动。[策略是可供局中人选择对付其它局中人的完整行动 方案。]
21
例 某个地方的居民均匀地环绕一个圆形湖居 住。两小贩来此地推销商品。1)若居民都选 择离自己较近的小贩购买商品,问小贩选择推 销地点博弈的NE是什么?2)若有三个小贩同 时到此地推销商品,则推销地点博弈的NE又是 什么?3)若圆形湖的周长是1(千米),居民 的购买量是Q=1-D,D为居民与小贩推销点距 离,则两个和三个小贩博弈的NE各是什么?
14
例6 设 s1 [10,0] s2 [3,0]
u1 (s) 10s1 7s1s2 s12
u2 s 15s2 5s1s2 s22
求NE。
15
例7 设 s1 [10,0] s2 [3,0]

2013博弈论

2013博弈论

三、纳什均衡与上策均衡
上策均衡:我所做的是不管你做什么我所能做的最好的 你所做的是不管我做什么你所能做的最好的 纳什均衡:我所做的是给定你所做的我所能做的最好的 你所做的是给定我所做的你所能做的最好的 容易看出,上策均衡是纳什均衡的特例
第二节 重复博弈与序列博弈
一、重复博弈—价格战
两个企业的经理想最大化利润 策略是低价活动 同步博弈 一次博弈 无限重复博弈 有限重复博弈
囚犯B 囚 犯 A 认罪 不认罪 认罪 -10,-10 -20,-1 不认罪 -1,-20 -3,-3
4、广告战
厂商A和B销售相互竞争的产品,并正在决定是否 采取广告计划。各个厂商会受到竞争者的决定的影 响。其报酬矩阵为下表。其中的数字表示A、B厂 商的利润。 各个厂商应该选择什么策略?
厂商B
做广告 不做广告
博弈论导论
标准式博弈与扩展式博弈 : 矩阵 树形
同步博弈与序列博弈 : 每个参与方不知对方决策情况下作出决策; 参与方先观察对方行动,自己再行动 一次博弈与重复博弈:基本博弈只进行一次;基本博弈重复进行,包 括有限重复和无限重复 零和博弈与非零和博弈 : 一方的情况只有当另一方情况变得更差时才 能变得更好;另外一方情况不必变得更差,一方的情况就能变得更好 静态博弈与动态博弈 : 参与人同时选择行动或虽非同时但后行动者并 不知道前行动者采取什么行动;参与人的行动有先后顺序,且后行动 者能够观察到先行动者所选择的行动
(一)囚徒困境 1、报酬矩阵
囚犯B 认罪 认罪 囚 犯 A 不认 罪 -10,-10 -20,-1 不认罪 -1,-20 -3,-3
占优策略
不管囚犯B是选择认罪还是不认罪, 囚犯A都会选择认罪! 认罪 是囚犯A的占优策略! 占优策略(上策) 不管对手做什么,对一个参与者都能获得最高得益的策略
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三章 纳什均衡及其应用3.1 混合策略纳什均衡1 鹰鸽博弈我们知道老鹰具有攻击性,而鸽子爱好和平。

在原始社会里有两个部落,可以做出两个行动:一是进攻一是和平,分别用鹰和鸽表示。

表1 鹰鸽博弈乙甲鹰 鸽该博弈的那是均衡为(鹰,鸽),(鸽,鹰)。

一些学者研究发现,在同一个地域内,“鹰”和“鸽”的比例为0.36:0.64。

事实上,设鹰鸽比为:1z z -,可以得出如下结果:()2514(1)1439E e z z z =-+-=-; ()95(1)514E d z z z =-+-=-90.3625z == 聪明的做法是:当鹰鸽比小雨0.36时,选择鹰策略;否则选择鸽策略。

使用混合策略方法分析:第一步:混合策略型表示:乙 鹰 鸽甲鹰 p 鸽 1-p第二步:计算期望效用:(925)514(259)514E p q q E q p p=-+-=++-甲乙第三步:作出最优反应函数91 259[0,1] 2590 25q p q q ⎧<⎪⎪⎪==⎨⎪⎪>⎪⎩若若若, 90 259[0,1] 259 1 25p q p p ⎧<⎪⎪⎪==⎨⎪⎪>⎪⎩如果如果如果第四步:作出反应函数的图像第五步:根据交点,找出纳什均衡:其中(99,2525)是混合策略纳什均衡。

2 斗鸡博弈我的老家地处安徽最北部,苏鲁豫皖四省交界之处,东北处有条小河。

河边的棉花地里,经常有鹌鹑栖息在其间。

秋末冬初的农闲时节,小鹌鹑刚好长成。

村民结网捕鹌鹑把玩、斗鸟儿为乐。

每天早晨4点多钟出发,大约7点钟回来,雄性的鹌鹑留起来先要整夜整夜的熬鹌鹑、放在手里把鹌鹑,真正熟练了,才拿出来和别人的相斗。

设想两只鹌鹑要在场子里一决雌雄。

每只鹌鹑都有两个策略:攻击或逃跑。

由于两只鹌鹑实力相当,若同时选择进攻会两败俱伤;若一只进攻,一只逃跑,进攻者胜利。

逃跑的鹌鹑算是玩完了,以后再也没胆量进场子,主人也不回在把玩它,会用一块黑布把它的笼子蒙起来,培养成“叫子”,以后后捕鹌鹑的时候拎出去吸引同伴。

若同时逃跑不会败掉,以后还能斗,但是都会挨饿一天。

1pq表2-10 斗鸡博弈猛英雄攻击逃跑大将军攻击逃跑3 猜币博弈(matching pennies)甲、乙两个人各持有一枚硬币,同时决定显示正面(数字)朝上还是反面(国徽或花纹)朝上,若两人朝上的一面相同甲输给乙10元钱,若不同,则乙输给甲10元钱。

表2-1 猜币博弈乙正反甲正反我们观察表2-1可以发现,甲与乙效用之和为零,这种博弈称为零和博弈,是你死我活的博弈,双方有着激烈的冲突,不存在合作的可能。

4 足球比赛中的点球大战同学们,请你找出这个博弈的纳什均衡。

是不是发现没有纯策略纳什均衡呢?如果确定性策略无法奏效,就要果断引入不确定性。

它将使两难问题不再是难题:5 流浪汉问题在社会保障体系比较完善的国家,总会或多或少的存在流浪汉的问题。

这些依靠政府的失业救济过活的无业游民,虽然可以成为某些正科口中标榜的民主生活的佐证。

但是他毕竟是高度发达的经济社会无法根治的一块牛皮癣。

参与人是政府和一个流浪汉,流浪汉有两个选择:寻找工作和终日游荡,政府在对流浪汉的管理上也有两个策略:救济和不救济。

政府想帮助流浪汉摆脱这种难堪的生活,但前提是后者必须试图寻找工作,否则帮助失效。

但是,流浪汉可不认为这种生活难堪,除非没有办法生存,他们不会去寻找工作的。

流浪汉找工作 q流浪 1-q 政府 救济p不救济1-p请你使用混合策略纳什均衡的求法,找出该博弈的纳什均衡。

6 有限博弈的纳什均衡存在定理与奇数定理定理1 一个有限博弈至少存在一个纳什均衡,一般而言,纳什均衡的个数是奇数个。

定理2 在n 人策略式博弈中,若参与人的纯策略空间i S 是欧式空间上的一个非空闭集,且是有界的凸集,支付函数是连续的,对i S 是拟凹的,那么存在一个纯策略纳什均衡。

定理3在n 人策略式博弈中,若参与人的纯策略空间i S 在欧式空间上世连续的,则存在一个混合策略纳什均衡。

3.2 反应函数法学一点数学 极大值与极小值 1 库诺特寡头竞争理论库诺特(Cournot,1838)寡头竞争模型可以说是纳什均衡的最早版本,它比纳什(Nash,1950)本人的定义早了100多年。

在库诺特模型里有两个参与人,分别称为企业1,企业2;每个企业的策略是选择产量。

效用是利润,它是两个企业产量的函数。

我们用[0,]i q ∈∞表示第i 个企业的产量。

()i i c q 代表成本函数,12()p p q q =+代表逆需求函数。

第i 个企业的利润函数为1212(,)()(),1,2i i i i q q q p q q c q i π=+-=。

**12(,)q q 是纳什均衡产量意味着:***111211211argmax (,)()()q q q q p q q c q π∈=+-, ***221221222argmax (,)()()q q q q p q q c q π∈=+-。

求解上述关系式找出纳什均衡的一个步骤是对每一个企业的利润函数求一阶导数并令其等于零,即112112111()()()0p q q q p q q c q q π∂''=+++-=∂ 212212222()()()0p q q q p q q c q q π∂''=+++-=∂ 上述两个一阶条件分别定义了两个反应函数,解之可得:**112221(),()q R q q R q ==。

若两条曲线仅有唯一交点,则该点处取纳什均衡图2-3反应函数交点图【例2】 考虑库诺特模型的简单情况,假定两个企业具有相同的不变单位成本,即111222(),()c q q c c q q c ==。

逆需求函数取如下的线性形式:12()p a q q =-+。

解:最优化的一阶条件为:11211()0a q q q c q π∂=-+--=∂反应函数为:**21112221(),()22a q c a q cq R q q R q ----====。

解之得:**123a c q q -==。

每个企业的利润为****21122121(,)(,)()9q q q q a c ππ==-。

下面将之与垄断情况作比较,垄断企业的问题是:max ()qq a q c π=--。

容易得出21222()0a q q q c q π∂=-+--=∂*2()23a c q a c -=<-;2212()()49m a c a c π=->-。

2 豪泰林模型假定有一个长度为1的线性城市,消费者均匀地分布在[0,1]区间内,分布密度为1。

假定有两个商店,分别位于城市两端,商店1在0x =,商店2在1x =,出售物质性能相同的产品。

每个商店提供单位产品的成本为c 。

消费者购买商品的交通成本与距商店的距离成比例,单位距离的成本为t 。

这样,住在x 的消费者如果在商店1采购,需花费tx 的交通成本,如果在商店2采购需要花费(1)t x -的成本。

假定消费者得到的消费者剩余为s ,且s 相对于产品成本和交通成本足够大,从而每个消费者消费者都购买1个单位的产品。

令i p 为商店i 的价格,12(,)i D p p 为需求函数,1,2i =。

如果住在x 的消费者在两个商店之间买商品无差异,那么住在x 左边的都在商店1购买,住在x 右边的都在2x 购买。

需求分别为12,1D x D x ==-。

这里,x 满足12(1)p tx p t x +=+-,综合需求函数的定义可得:211122,212p p tD x tp p tD x t -+==-+=-=利润函数为:112111211(,)()()()2p p p c D p c p p t t π=-=--+ 212222121(,)()()()2p p p c D p c p p t tπ=-=--+商店i 选择自己的价格i p ,通过求驻点最大化利润i π:12111(2)02p p c t q tπ∂=-++=∂21221(2)02p p c t q tπ∂=-++=∂ **12p p c t ==+ **122tππ==3 公共地悲剧设某村庄有n 个农户,该村有一块大家都可以自由放牧羊群的草地。

这片草地只能让不超过一定数量的羊吃饱。

超过这个限度,则每只羊都无法吃饱,从而降低了每只羊的产出,草地也遭到破坏。

假设这些农户决定养羊数是同时决策的,而且农户知道这片草地的最大养羊数及不同养羊数下每只羊的产出。

这就构成了n 个农户的一个完全信息静态博弈问题。

此博弈的参与人有n 个农户,其策略空间是各自养羊数, 1,2,...,i q i n =。

养羊总数12...n Q q q q =+++。

每只羊的产出()V Q 是减函数。

假设购买和照料每只羊的成本相同,设为c 。

则农户i 养i q 只羊的效用函数为()i i i u qV Q q c =-。

为方便起见,设3n =,()100V Q Q =-,4c =。

则111231(100)4u q q q q q =---- 221232(100)4u q q q q q =---- 331233(100)4u q q q q q =----尽管羊的数量是整数,我们仍然可以将之视为连续函数,根据极值的条件得到最优解之后圆整。

反应函数为:1123231(,)48()2q R q q q q ==-+2213131(,)48()2q R q q q q ==-+3312121(,)48()2q R q q q q ==-+三个反应函数的交点为:(24,24,24),相应的效用为(576,576,576)。

但是,如果12316q q q ===,则效用组合为(768,768,768)。

因此纳什均衡可能是低效率的,一般而言,公共性质的物品,都有类似的结论,达到的稳定结果效率较低,称之为公共地悲剧。

3 重复博弈3.4 应用1 社会福利博弈在这个博弈里,参与人是政府和一个流浪汉,流浪汉有两个选择:寻找工作和终日游荡,政府在对流浪汉的管理上也有两个策略:救济和不救济。

政府想帮助流浪汉摆脱这种难堪的生活,但前提是后者必须试图寻找工作,否则帮助失效。

但是,流浪汉可不认为这种生活难堪,除非没有办法生存,他们不会去寻找工作的。

表4 社会福利博弈流浪汉政 府救济 不救济2 努力困境张三和李四一起做一份工作,他们可以选择勤奋和偷懒,如果两人都勤奋工作,会得到一份奖金,每人的效用为2单位。

如果张三勤奋,李四偷懒,张三的效用为0单位,李四的效用为3单位,反之亦然。

如果两人都偷懒,只能得到一份很低的报酬,效用为0.5单位。

于是有下面的支付矩阵:表4努力困境李四张 三勤奋 偷懒3 军备竞赛模型在1950s ,美国和前苏联展开了疯狂的军备竞赛,最终拖垮了苏联的经济。

相关文档
最新文档