《经济博弈论(第三版)》 谢识予 PPT课件
合集下载
博弈论讲义完整PPT课件
• 两个寡头企业选择产量的博弈:
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
经济博弈论.PPT谢识予46页PPT
26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。——卢梭
▪
27、只有把抱怨环境的心情,化为上进的力量,才是成功的保证。——罗曼·罗兰
▪
28、知之者不如好之者,好之者不如乐之者。——孔子
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇
▪
30、意志是一个强壮的盲人,倚靠在明眼的跛子复何如。 42、夏日长抱饥,寒夜无被眠。 43、不戚戚于贫贱,不汲汲于富贵。 44、欲言无予和,挥杯劝孤影。 45、盛年不重来,一日难再晨。及时 当勉励 ,岁月 不待人 。
▪
谢谢!
46
复旦大学-谢识予-经济博弈论3
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
3.3.1 子博弈
定义:由一个动态博弈 第一阶段以外的某阶段 开始的后续博弈阶段构 成的,有初始信息集和 进行博弈所需要的全部 信息,能够自成一个博 弈的原博弈的一部分, 称为原动态博弈的一个 “子博弈”。
乙 借
甲 分 (2,2)
不分 乙
不借 (1,0)
2
接受
[0,0]
拒绝
努力
委托:
2
努力
偷懒 [0,0]
0.9*[20-w(E)]+0.1*[10-w(E)]>0
不委托:
0 低产
高产
(0.1)
(0.9)
高产 (0.1)
[10-w(E), w(E)-E]
0
低产
0.9*[20-w(E)]+0.1*[10-w(E)]<0
(0.9)
偷懒:
[10-w(S), w(S)-S] 委托:
阶段:动态博弈中一个博弈方的一次选择行为 例子:仿冒和反仿冒博弈
仿冒
A 不仿冒
制止
(-2,5) 制止
B 不制止(0,10) 仿冒 A 不仿冒 B 不制止 (5,5)
(2,2)
(10,4)
3.1.2 动态博弈的基本特点
策略是在整个博弈中所有选择、行为的计划 结果是上述“计划型”策略的策略组合,构成一
第二阶段是博弈方3和博弈方4的选择阶段,他们在看到 博弈方1和博弈方2的选择 a 1 和 a 2 以后,同时在各自的
可选策略(行为)集合 A 3 和 A4 中分别选择 a 3 和 a 4
各博弈方的得益都取决于所有博弈方的策略 a1,a2,a3,a4 即博弈方i的得益是各个博弈方所选择策略的多元函数 ui ui(a1,a2,a3,a4)
3.3.1 子博弈
定义:由一个动态博弈 第一阶段以外的某阶段 开始的后续博弈阶段构 成的,有初始信息集和 进行博弈所需要的全部 信息,能够自成一个博 弈的原博弈的一部分, 称为原动态博弈的一个 “子博弈”。
乙 借
甲 分 (2,2)
不分 乙
不借 (1,0)
2
接受
[0,0]
拒绝
努力
委托:
2
努力
偷懒 [0,0]
0.9*[20-w(E)]+0.1*[10-w(E)]>0
不委托:
0 低产
高产
(0.1)
(0.9)
高产 (0.1)
[10-w(E), w(E)-E]
0
低产
0.9*[20-w(E)]+0.1*[10-w(E)]<0
(0.9)
偷懒:
[10-w(S), w(S)-S] 委托:
阶段:动态博弈中一个博弈方的一次选择行为 例子:仿冒和反仿冒博弈
仿冒
A 不仿冒
制止
(-2,5) 制止
B 不制止(0,10) 仿冒 A 不仿冒 B 不制止 (5,5)
(2,2)
(10,4)
3.1.2 动态博弈的基本特点
策略是在整个博弈中所有选择、行为的计划 结果是上述“计划型”策略的策略组合,构成一
第二阶段是博弈方3和博弈方4的选择阶段,他们在看到 博弈方1和博弈方2的选择 a 1 和 a 2 以后,同时在各自的
可选策略(行为)集合 A 3 和 A4 中分别选择 a 3 和 a 4
各博弈方的得益都取决于所有博弈方的策略 a1,a2,a3,a4 即博弈方i的得益是各个博弈方所选择策略的多元函数 ui ui(a1,a2,a3,a4)
博弈论引论优质获奖课件
(1)参加人:博弈中旳决策主体,他旳目旳是经过选择行为 (或战略)以最大化自己旳收益(支付)。
自然(Nature)作虚拟参加人处理,即决定外生旳随机变量 旳概率分布旳机制。
根据参加人数量分 单人博弈 两人博弈 多人博弈
最常见旳是两人博弈,单人博弈是退化旳博弈
(2) 博弈中旳策略
策略:博弈中各博弈方旳选择内容 策略有定性定量、简朴复杂之分 不同博弈方之间不但可选策略不同,而且可选策略
—囚徒困境、产量博弈等
(4) 博弈旳过程
博弈过程:博弈方选择行为旳顺序,涉及是否屡次 反复选择行为。
博弈过程对博弈成果也有主要影响。 根据博弈旳过程,博弈可分为静态博弈、动态博
弈、反复博弈。
静态博弈:全部博弈方同步或可看作同步选择策略旳 博弈
—田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方旳选择和行动又先后顺序且后选 择、后行动旳博弈方在自己选择、行动之前能够看 到其他博弈方旳选择和行动
曹操败走华容道
在《三国演义》中,曹操在赤壁大战中一败涂地,率残兵败将向许都方向 逃窜。诸葛亮命关羽率兵在途中阻截曹军。当初,第一批拦截大军是赵云带 领旳,第二批拦截大军是张飞带队旳,第三批才是关羽率部伏击。因为曹军 兵多将广,前二批伏击军不能逮住曹操,只是抢劫某些军械马匹之类。
待曹军冲过赵云、张飞两道关后,进入关羽旳伏击地带。但是,当初关羽 与曹操相遇旳地方有两条道,一条是华容道,除另外还有另一条道。诸葛亮 令关羽伏兵于华容道,而且要求关羽在华容道上点燃树枝冒出烟雾引曹操到 来。当初关羽不解,问诸葛亮,“假如在伏兵之处点火,岂不令曹兵看见而 改走另一条道逃脱?”诸荀亮叫关羽不要再问,只如此照办即可。
动态博弈中轮到行为旳参加人不完全了解此前全部 博弈旳进程时,称为具有“不完美信息”(Imperfect Information) 旳参加人,有这种参加人旳动态博弈则称为 “不完美信息旳动态博弈”。
《经济博弈论》PPT课件
13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
经济博弈论的
n 人类自私的天性,使他们陷入“囚徒困境”,难以自 拔。如何走出“囚徒困境”?
PPT文档演模板
经济博弈论的
1.2.2 赌胜博弈
n 赌博、竞技等构成的博弈问题,在经济中 也有许多应用,赌胜博弈也是一类重要的 博弈问题,对经济竞争和合作也有很大启 示
n 赌胜博弈的特点是一方得等于另一方失, 不可能双赢,属于“零和博弈”
PPT文档演模板
经济博弈论的
1.1.1 从游戏到博弈
n 人生处处皆博弈,人生是永不停歇的博弈过程。 n 作为博弈者,最佳策略是最大限度地利用游戏规则,
最大化自己的利益; n 作为社会最佳策略,是通过规则使社会整体福利增加。
PPT文档演模板
经济博弈论的
1.1.2 一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定 的环境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。
济和博弈分析本身都有重要价值
PPT文档演模板
经济博弈论的
一、三厂商离散产量
PPT文档演模板
•{
•0
•P
•4
•8
•6
•2
•8
•16
•12
•4
•5
•6
•5
•20
•25
•30
•5
•5
•6
•4
•20
•20
•24
•5
•5
•5
•5
•25
•25
•25
•3
•43
•3
•11
•33
•33
•33
•7
•3
•3
•7
•49
PPT文档演模板
经济博弈论的
1.2.2 赌胜博弈
n 赌博、竞技等构成的博弈问题,在经济中 也有许多应用,赌胜博弈也是一类重要的 博弈问题,对经济竞争和合作也有很大启 示
n 赌胜博弈的特点是一方得等于另一方失, 不可能双赢,属于“零和博弈”
PPT文档演模板
经济博弈论的
1.1.1 从游戏到博弈
n 人生处处皆博弈,人生是永不停歇的博弈过程。 n 作为博弈者,最佳策略是最大限度地利用游戏规则,
最大化自己的利益; n 作为社会最佳策略,是通过规则使社会整体福利增加。
PPT文档演模板
经济博弈论的
1.1.2 一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定 的环境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。
济和博弈分析本身都有重要价值
PPT文档演模板
经济博弈论的
一、三厂商离散产量
PPT文档演模板
•{
•0
•P
•4
•8
•6
•2
•8
•16
•12
•4
•5
•6
•5
•20
•25
•30
•5
•5
•6
•4
•20
•20
•24
•5
•5
•5
•5
•25
•25
•25
•3
•43
•3
•11
•33
•33
•33
•7
•3
•3
•7
•49
经济博弈论概述(ppt 242页)
著名经济学家泰勒尔(Jean Tirole)说: “正 如理性预期使宏观经济学发生革命一 样,博弈论广泛而深远地改变了经济学 家的思维方式”
如果情况确实如此,对今天的经济学家来说 ,不懂得博弈论显然是不行了。
博弈论为何如此热门?
诺贝尔经济学奖偏爱博弈论研究
1994年诺贝尔经济学授予 约翰·纳什 约翰·海萨尼 莱因哈德·泽尔腾
如个体厂商为了获得更高利润,期待通过集团形成卖方 垄断;
消费者为了寻求更低的价格,期待通过集团形成买方垄 断;
工人们为了得到更高的工资待遇,期待通过工会形成讨 价还价的势力等等。
以夏普利值为例来看合作问题
例题1
假定某议会共有100个席位,议员分属4个党派 :红党43席,蓝党33席,绿党16席,白党8席;
2012年:诺贝尔经济学奖授予 埃尔文·罗斯(Alvin Roth) 罗伊德·夏普利(Lloyd Shapley)。
埃尔文·罗斯(Alvin E.Roth) 罗伊德·夏普利(Lloyd S.Shapley)
他们的贡献:
稳定的匹配理论与市场设计的实践
经济学是研究资源最优配置问题的,而真实世界 里配置资源的方式多种多样,市场、价格机制是 经济学研究最多的。
一般观点认为合作博弈理论要比非合作博弈理论更为重要, 因为,如果人们的合作是有利可图的,参与博弈的理性人怎 么会放弃合作而采取非合作态度呢?
我们知道,在任何真实的博弈局势中,无论合 作博弈还是非合作博弈,如果我们仔细地考察 人们为达成一个协议而能做什么的话,那么原 则上我们就应该有可能把它模型化,然后通过 分析这个博弈的均衡(解)来预测其结果。
1996年诺贝尔经济学授予
威廉·维克瑞 詹姆斯·莫里斯
2001年诺贝尔经济学授予
经济博弈论谢识予
同犯罪指控时的策略选择。
策略
每个囚犯都有坦白和抵赖两种策略。 在给定对方策略的情况下,每个囚 犯都追求自身利益最大化。
结果
最终的结果往往是两个囚犯都选择 坦白,这并不是最优解。
智猪博弈
描述
智猪博弈描述了两个实力不同的 大猪在猪圈里抢食的情况。
策略
大猪可以选择主动去踩踏板,小 猪可以选择等待。
结果
最优策略是小猪等待,大猪踩踏 板。
有多个参与者,如市场结构、政策制 定等。
双人博弈
有两个参与者,如商业竞争、合作、 贸易关系等。
博弈的策略与行动
01
02
03
纯策略
指参与者采取的明确行动 方案,不涉及概率。
混合策略
指参与者以一定概率采取 不同行动,以达到最佳预 期结果。
反应函数
描述参与者如何根据对手 的策略选择自己的最优策 略。
博弈的结果与均衡
可以更全面地分析经济问题。
跨学科研究
借鉴其他学科的研究方法和成果,如心理 学、社会学和政治学等,可以丰富博弈论
的应用领域和解释力。
实证研究
通过实证研究来检验博弈论的预测和结论, 不断完善和发展博弈论在经济领域的应用。
提高政策制定水平
通过应用博弈论分析政策制定中的利益关 系和策略互动,可以提高政策制定的科学 性和有效性。
动态博弈和演化博弈
多智能体系统
研究将更加关注博弈的动态性和演化性, 以更好地解释现实世界中的长期策略互动 和变化。
结合人工智能和博弈论,构建多智能体系 统,模拟更复杂的策略互动和集体行为。
06
结论
博弈论对经济分析的贡献
解释经济行为
博弈论通过分析参与者的策略互动,能够解释市场中的竞争行为、 合作行为以及经济主体的决策过程。
策略
每个囚犯都有坦白和抵赖两种策略。 在给定对方策略的情况下,每个囚 犯都追求自身利益最大化。
结果
最终的结果往往是两个囚犯都选择 坦白,这并不是最优解。
智猪博弈
描述
智猪博弈描述了两个实力不同的 大猪在猪圈里抢食的情况。
策略
大猪可以选择主动去踩踏板,小 猪可以选择等待。
结果
最优策略是小猪等待,大猪踩踏 板。
有多个参与者,如市场结构、政策制 定等。
双人博弈
有两个参与者,如商业竞争、合作、 贸易关系等。
博弈的策略与行动
01
02
03
纯策略
指参与者采取的明确行动 方案,不涉及概率。
混合策略
指参与者以一定概率采取 不同行动,以达到最佳预 期结果。
反应函数
描述参与者如何根据对手 的策略选择自己的最优策 略。
博弈的结果与均衡
可以更全面地分析经济问题。
跨学科研究
借鉴其他学科的研究方法和成果,如心理 学、社会学和政治学等,可以丰富博弈论
的应用领域和解释力。
实证研究
通过实证研究来检验博弈论的预测和结论, 不断完善和发展博弈论在经济领域的应用。
提高政策制定水平
通过应用博弈论分析政策制定中的利益关 系和策略互动,可以提高政策制定的科学 性和有效性。
动态博弈和演化博弈
多智能体系统
研究将更加关注博弈的动态性和演化性, 以更好地解释现实世界中的长期策略互动 和变化。
结合人工智能和博弈论,构建多智能体系 统,模拟更复杂的策略互动和集体行为。
06
结论
博弈论对经济分析的贡献
解释经济行为
博弈论通过分析参与者的策略互动,能够解释市场中的竞争行为、 合作行为以及经济主体的决策过程。
《经济博弈论(第三版)》 谢识予 PPT课件
24
5
5
5
5
25
25
25
3
43
3
11
33
33
33
7
3
3
7
49
21
21
二、n个厂商连续产量
n
Q qi i 1
n
P P(Q) P( qi ) i 1
n
qi P qi P( qi ) i 1
n
n
qi P( qi ) cqi qi[P( qi ) c]
i 1
i 1
1.3 博弈结构和博弈分类
1.4 博弈论历史和发展简述
1.4.1博弈论的早期研究 1.4.2博弈论的形成 1.4.3博弈论的成长和发展 1.4.4博弈论的成熟及与主流经济
学的融合
1.4.1博弈论的早期研究
博弈论历史没有公认答案 对具有策略依存特点决策问题的研究可上溯
到18世纪初甚至更早 博弈论真正的发展在本世纪 博弈论总体上仍然是发展中的学科
1.3.6 博弈方的能力和理性
完全理性和有限理性
完全理性:有完美的分析判断能力和不会犯选择行为 的错误
有限理性:博弈方的判断选择能力有缺陷
个体理性和集体理性
个体理性:一个体利益最大为目标 集体理性:追求集体利益最大化 合作博弈:允许存在有约束力协议的博弈 非合作博弈:不允许存在有约束力协议的博弈
2000年前我国古代的“齐威王田忌赛马” 1500年前巴比伦犹太教法典“婚姻合同问题”
等。
1838年古诺寡头模型。 1883年伯特兰德寡头竞争模型。 1913年齐默罗象棋博弈定理 、“逆推归纳法” 1921-1927年波雷尔混合策略的第一个现代表述,
有数种策略两人博弈的极小化极大解
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
策略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
1.1.2 一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定 的环境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。
1.4.2博弈论的形成
冯.诺伊曼和摩根斯坦《博弈论和经济行为》
Theory of Games and Economic Behavior 1944 引进扩展形(extensive form)表示和正规形
(normal form)或称策略形(strategy form)、 矩阵形(matrix form)表示 提出稳定集(stable sets)解概念 正式提出创造博弈论一般理论的主意 给出博弈论研究的一般框架、概念术语和表述 方法
-7000 -10000
-16000 -10000
运输路线得益矩阵
好天气 (75%)
0
坏天气 (25%)
1
单人博弈实质 个体最优化问题
-7000 -10000 -16000 -10000 运输路线扩展形
二、两人博弈
两人博弈即有两个博弈方的博弈 两人博弈最常见,研究最多,是最基本和有用
的博弈类型 囚徒困境、猜硬币、齐威王田忌赛马等都是两
1.4 博弈论历史和发展简述
1.4.1博弈论的早期研究 1.4.2博弈论的形成 1.4.3博弈论的成长和发展 1.4.4博弈论的成熟及与主流经济
学的融合
1.4.1博弈论的早期研究
博弈论历史没有公认答案 对具有策略依存特点决策问题的研究可上溯
到18世纪初甚至更早 博弈论真正的发展在本世纪 博弈论总体上仍然是发展中的学科
二、50年代中后期一直到70年代博弈论发展的青年期
1954-1955年提出了“微分博弈”(Differential games) 的概念。
奥曼则在1959年提出了“强均衡”(Strong equilibrium) 的概念。
“重复博弈”(Repeated games)也是在50年代末开始 研究的,这自然引出了关于重复博弈的“民间定理” (Folk theorem)。
1.3.7 博弈的分类和博弈理论的结构
非合作博弈和合作博弈 非合作博弈范围内:完全理性博弈和有限理性
博弈(进化博弈) 静态博弈,动态博弈,重复博弈 完全信息静态博弈,不完全信息静态博弈,完
全且完美信息动态博弈,完全但不完美信息动 态博弈,不完全信息动态博弈 零和博弈和非零和博弈,单人博弈和多人博弈
1952-1953年期间(L. S. Shapley)和(D. B. Gillies)提 出“核”(Core)作为合作博弈的一般解概念
Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。
奥曼(R. J. Aumann)“40年代末50年代初是博弈论历 史上令人振奋的时期,原理已经破茧而出,正在试飞 它们的双翅,活跃着一批巨人。”
1.3.1 博弈中的博弈方 1.3.2 博弈中的策略 1.3.3 博弈中的得益 1.3.4 博弈的过程 1.3.5 博弈的信息结构 1.3.6 博弈方的能力和理性 1.3.7 博弈的分类和博弈理论的结构
1.3.1 博弈中的博弈方
博弈方:独立决策、独立承担博弈结果的个 人或组织
博弈规则面前博弈方之间平等,不因博弈 方之间权利、地位的差异而改变
略的组合 得益是各博弈方追求的根本目标及行为和
判断的主要依据 根据得益的博弈分类:零和博弈、常和博
弈、变和博弈
零和博弈:也称“严格竞争博弈”。博弈方之 间利益始终对立,偏好通常不同
—猜硬币,田忌赛马,石头-剪刀-布
常和博弈:博弈方之间利益的总和为常数。博 弈方之间的利益是对立的且是竞争关系
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
济和博弈分析本身都有重要价值
一、三厂商离散产量
Q q1 q2 q3
P P(Q) 20 Q {
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
Q 20 Q 20
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
12
4
5
6
5
20
25
30
5
5
6
4
20
20
1.3.2 博弈中的策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限
多个
1.3.3 博弈中的得益
得益:各博弈方从博弈中所获得的利益 得益对应博弈的结果,也就是各博弈方策
24
5
5
5
5
25
25
25
3
43
3
11
33
33
33
7
3
3
7
49
21
21
二、n个厂商连续产量
n
Q qi i 1
n
P P(Q) P( qi ) i 1
n
qi P qi P( qi ) i 1
n
n
qi P( qi ) cqi qi[P( qi ) c]
i 1
i 1
1.3 博弈结构和博弈分类
四个核心方面 博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行为(Actions) 博弈的次序(Order) 博弈方的得益(Payoffs)
1.2 几个经典博弈模型
1.2.1 囚徒的困境 1.2.2 赌胜博弈 1.2.3 产量决策的古诺模型
1.2.1 囚徒的困境
2000年前我国古代的“齐威王田忌赛马” 1500年前巴比伦犹太教法典“婚姻合同问题”
等。
1838年古诺寡头模型。 1883年伯特兰德寡头竞争模型。 1913年齐默罗象棋博弈定理 、“逆推归纳法” 1921-1927年波雷尔混合策略的第一个现代表述,
有数种策略两人博弈的极小化极大解
1928年诺伊曼和摩根斯坦扩展形博弈定义,证 明有限策略两人零和博弈有确定结果
1.3.6 博弈方的能力和理性
完全理性和有限理性
完全理性:有完美的分析判断能力和不会犯选择行为 的错误
有限理性:博弈方的判断选择能力有缺陷
个体理性和集体理性
个体理性:一个体利益最大为目标 集体理性:追求集体利益最大化 合作博弈:允许存在有约束力协议的博弈 非合作博弈:不允许存在有约束力协议的博弈
有限次重复博弈 无限次重复博弈
1.3.5 博弈的信息结构
完全信息博弈:各博弈方都完全了解所有博弈 方各种情况下的得益
不完全信息博弈:至少部分博弈方不完全了解 其他博弈方得益的情况的博弈,也称为“不对 称信息博弈”
完美信息博弈:每个轮到行为的博弈方对博弈 的进程完全了解的博弈
不完美信息博弈:至少某些博弈方在轮到行动 时不完全了解此前全部博弈的进程的博弈
人博弈 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
0, -8
-8, 0
-1, -1
两个罪犯的得益矩阵
二、双寡头削价竞争
寡 高价 头 1 低价
寡头2
高价
低价
100,100
20,105
150,20
70,70
双寡头的得益矩阵
寡头1:低价(70) 寡头2:低价(70)
政府组织协调的 必要性和重要性
1.2.2 赌胜博弈
赌博、竞技等构成的博弈问题,在经济中 也有许多应用,赌胜博弈也是一类重要的 博弈问题,对经济竞争和合作也有很大启 示
《经济博弈论》教材
教学课件
主编:谢识予
出版:复旦大学出版社
教材:
《经济博弈论(第二版)》 复旦大学出版社,2002年1月
《经济博弈论习题指南》 复旦大学出版社,2003年1月
第一章 导论
本章介绍博弈论的基本概念,包括什么是 博弈和博弈论,给出一些经典博弈例子。对博 弈分类和博弈理论的结构作一些讨论,对博弈 论的发展历史等作简单介绍。目标是让读对博 弈论的内容和博弈模型有更直观的概念和印象, 本教材的基本内容,以及博弈分析的基本思想 方法等形成初步的认识,为后面各章展开详细 分析作好铺垫和准备。
正面
反面
-1, 1
1, -1
1, -1
-1, 1
三、石头、剪子、布
博弈方2
石头
博
石头
0, 0
弈
剪子
方
1Hale Waihona Puke 布-1, 1 1, -1
剪子
1, -1 0, 0 -1, 1
布
-1, 1 1, -1 0, 0
1.2.3 产量决策的古诺模型
古诺模型是寡头产量竞争,是市场经济中 最常见的问题之一
1.1.2 一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定 的环境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。
1.4.2博弈论的形成
冯.诺伊曼和摩根斯坦《博弈论和经济行为》
Theory of Games and Economic Behavior 1944 引进扩展形(extensive form)表示和正规形
(normal form)或称策略形(strategy form)、 矩阵形(matrix form)表示 提出稳定集(stable sets)解概念 正式提出创造博弈论一般理论的主意 给出博弈论研究的一般框架、概念术语和表述 方法
-7000 -10000
-16000 -10000
运输路线得益矩阵
好天气 (75%)
0
坏天气 (25%)
1
单人博弈实质 个体最优化问题
-7000 -10000 -16000 -10000 运输路线扩展形
二、两人博弈
两人博弈即有两个博弈方的博弈 两人博弈最常见,研究最多,是最基本和有用
的博弈类型 囚徒困境、猜硬币、齐威王田忌赛马等都是两
1.4 博弈论历史和发展简述
1.4.1博弈论的早期研究 1.4.2博弈论的形成 1.4.3博弈论的成长和发展 1.4.4博弈论的成熟及与主流经济
学的融合
1.4.1博弈论的早期研究
博弈论历史没有公认答案 对具有策略依存特点决策问题的研究可上溯
到18世纪初甚至更早 博弈论真正的发展在本世纪 博弈论总体上仍然是发展中的学科
二、50年代中后期一直到70年代博弈论发展的青年期
1954-1955年提出了“微分博弈”(Differential games) 的概念。
奥曼则在1959年提出了“强均衡”(Strong equilibrium) 的概念。
“重复博弈”(Repeated games)也是在50年代末开始 研究的,这自然引出了关于重复博弈的“民间定理” (Folk theorem)。
1.3.7 博弈的分类和博弈理论的结构
非合作博弈和合作博弈 非合作博弈范围内:完全理性博弈和有限理性
博弈(进化博弈) 静态博弈,动态博弈,重复博弈 完全信息静态博弈,不完全信息静态博弈,完
全且完美信息动态博弈,完全但不完美信息动 态博弈,不完全信息动态博弈 零和博弈和非零和博弈,单人博弈和多人博弈
1952-1953年期间(L. S. Shapley)和(D. B. Gillies)提 出“核”(Core)作为合作博弈的一般解概念
Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。
奥曼(R. J. Aumann)“40年代末50年代初是博弈论历 史上令人振奋的时期,原理已经破茧而出,正在试飞 它们的双翅,活跃着一批巨人。”
1.3.1 博弈中的博弈方 1.3.2 博弈中的策略 1.3.3 博弈中的得益 1.3.4 博弈的过程 1.3.5 博弈的信息结构 1.3.6 博弈方的能力和理性 1.3.7 博弈的分类和博弈理论的结构
1.3.1 博弈中的博弈方
博弈方:独立决策、独立承担博弈结果的个 人或组织
博弈规则面前博弈方之间平等,不因博弈 方之间权利、地位的差异而改变
略的组合 得益是各博弈方追求的根本目标及行为和
判断的主要依据 根据得益的博弈分类:零和博弈、常和博
弈、变和博弈
零和博弈:也称“严格竞争博弈”。博弈方之 间利益始终对立,偏好通常不同
—猜硬币,田忌赛马,石头-剪刀-布
常和博弈:博弈方之间利益的总和为常数。博 弈方之间的利益是对立的且是竞争关系
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
济和博弈分析本身都有重要价值
一、三厂商离散产量
Q q1 q2 q3
P P(Q) 20 Q {
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
Q 20 Q 20
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
12
4
5
6
5
20
25
30
5
5
6
4
20
20
1.3.2 博弈中的策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限
多个
1.3.3 博弈中的得益
得益:各博弈方从博弈中所获得的利益 得益对应博弈的结果,也就是各博弈方策
24
5
5
5
5
25
25
25
3
43
3
11
33
33
33
7
3
3
7
49
21
21
二、n个厂商连续产量
n
Q qi i 1
n
P P(Q) P( qi ) i 1
n
qi P qi P( qi ) i 1
n
n
qi P( qi ) cqi qi[P( qi ) c]
i 1
i 1
1.3 博弈结构和博弈分类
四个核心方面 博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行为(Actions) 博弈的次序(Order) 博弈方的得益(Payoffs)
1.2 几个经典博弈模型
1.2.1 囚徒的困境 1.2.2 赌胜博弈 1.2.3 产量决策的古诺模型
1.2.1 囚徒的困境
2000年前我国古代的“齐威王田忌赛马” 1500年前巴比伦犹太教法典“婚姻合同问题”
等。
1838年古诺寡头模型。 1883年伯特兰德寡头竞争模型。 1913年齐默罗象棋博弈定理 、“逆推归纳法” 1921-1927年波雷尔混合策略的第一个现代表述,
有数种策略两人博弈的极小化极大解
1928年诺伊曼和摩根斯坦扩展形博弈定义,证 明有限策略两人零和博弈有确定结果
1.3.6 博弈方的能力和理性
完全理性和有限理性
完全理性:有完美的分析判断能力和不会犯选择行为 的错误
有限理性:博弈方的判断选择能力有缺陷
个体理性和集体理性
个体理性:一个体利益最大为目标 集体理性:追求集体利益最大化 合作博弈:允许存在有约束力协议的博弈 非合作博弈:不允许存在有约束力协议的博弈
有限次重复博弈 无限次重复博弈
1.3.5 博弈的信息结构
完全信息博弈:各博弈方都完全了解所有博弈 方各种情况下的得益
不完全信息博弈:至少部分博弈方不完全了解 其他博弈方得益的情况的博弈,也称为“不对 称信息博弈”
完美信息博弈:每个轮到行为的博弈方对博弈 的进程完全了解的博弈
不完美信息博弈:至少某些博弈方在轮到行动 时不完全了解此前全部博弈的进程的博弈
人博弈 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
0, -8
-8, 0
-1, -1
两个罪犯的得益矩阵
二、双寡头削价竞争
寡 高价 头 1 低价
寡头2
高价
低价
100,100
20,105
150,20
70,70
双寡头的得益矩阵
寡头1:低价(70) 寡头2:低价(70)
政府组织协调的 必要性和重要性
1.2.2 赌胜博弈
赌博、竞技等构成的博弈问题,在经济中 也有许多应用,赌胜博弈也是一类重要的 博弈问题,对经济竞争和合作也有很大启 示
《经济博弈论》教材
教学课件
主编:谢识予
出版:复旦大学出版社
教材:
《经济博弈论(第二版)》 复旦大学出版社,2002年1月
《经济博弈论习题指南》 复旦大学出版社,2003年1月
第一章 导论
本章介绍博弈论的基本概念,包括什么是 博弈和博弈论,给出一些经典博弈例子。对博 弈分类和博弈理论的结构作一些讨论,对博弈 论的发展历史等作简单介绍。目标是让读对博 弈论的内容和博弈模型有更直观的概念和印象, 本教材的基本内容,以及博弈分析的基本思想 方法等形成初步的认识,为后面各章展开详细 分析作好铺垫和准备。
正面
反面
-1, 1
1, -1
1, -1
-1, 1
三、石头、剪子、布
博弈方2
石头
博
石头
0, 0
弈
剪子
方
1Hale Waihona Puke 布-1, 1 1, -1
剪子
1, -1 0, 0 -1, 1
布
-1, 1 1, -1 0, 0
1.2.3 产量决策的古诺模型
古诺模型是寡头产量竞争,是市场经济中 最常见的问题之一