博弈论讲义

合集下载

博弈论讲义完整版

博弈论讲义完整版

同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境

囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的‚最优策略‛使整个‚系统‛处于不利 的状态。

思考:为什么会造成囚徒困境 是否由于‚通讯‛问题造成了囚徒困境? ‚要害‛是否在于‚利己主义‛即‚个人理 性‛?
第一章 导论-囚徒困境
通俗地讲:
纳什均衡的含义是:给定别人战略情况下,没有 任何单个参与人有积性选择其他战略,从而没有人 有积极性打破这种均衡。
第一章 导论-囚徒困境 一只河蚌正张开壳晒太阳,不料,飞来了 一只鸟,张嘴去啄他的肉,河蚌连忙合起两张 壳,紧紧钳住鸟的嘴巴,鸟说:‚今天不下雨, 明天不下雨,就会有死蚌肉。‛河蚌说:‚今 天不放你,明天不放你,就会有死鸟。‛谁也 不肯松口,有一个渔夫看见了,便过来把他们 一起捉走了。
不开发
1000,0 0,0
开发商A
博弈的战略式表述
一 、博弈的基本概念及战略表述

需求小时,售价7千万;
如果市场上只有一栋楼 需求大时,可卖1.8亿 需求小时,可卖1.1亿
一 、博弈的基本概念及战略表述
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 不开发
开发商B 开发 不开发
4000,4000 0,8000 8000,0 0,0
开发商B
开发
-3000,-3000 0,1000

第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了‚星期五‛

石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。

博弈论本科讲义

博弈论本科讲义

在中观经济研究中,劳动力经济学和金融理 论都有关于企业要素投入品市场的博弈模型, 即使在一个企业内部也存在博弈问题:工人之 间会为同一个升迁机会勾心斗角,不同部门之 间为争取公司的资金投入相互竞争;从宏观角 度看,国际经济学中有关于国家间的相互竞争 或相互串谋、选择关税或其他贸易政策的模型; 至于产业组织理论更是大量应用博弈论的方法 (见Jean Tirole的《产业组织理论》)。
如果n个参与人每人从自己的Si中选择一个策略 siategy profile),参与人i之外的其他参 与人的策略组合可记为s-i=( s1,s2,﹍,si-1 , si+1 ,﹍, sn)。
例如田忌的某个策略s田忌=上中下,或中下上, 等等;S田忌={上中下,上下中,中上下,中下 上 ,下上中,下中上}
贷市场的过高利息。此外,阿克尔洛夫还把信 息不对称运用于解释各种社会问题,比如因为信 息不对称,医疗保险市场上,老年人、个体劳动 者的医疗保险利益得不到保障。
三、基本概念
1、参与人Players:一个博弈中的决策主体, 他们各自的目的是通过选择行动(策略)以最 大化自己的目标函数/效用水平/支付函数。他们 可以是自然人或团体或法人,如企业、国家、 地区、社团、欧盟、北约等。 那些不作决策或虽做决策但不直接承担决 策后果的被动主体不是参与人,而只能当做环 境参数来处理。如指手划脚的看牌人、看棋人, 企业的顾问等。 对参与人的决策来说,最重要的是必须有
教材——P5 博弈论就是系统研究各种各 样博弈中参与人的合理选择及其 均衡的理论。
关于“经济博弈论”:
博弈论是研究人们在利益相互影响的格局 中的策略选择问题、是研究多人决策问题的理 论。而策略选择是人们经济行为的核心内容, 此外,经济学和博弈论的研究模式是一样的: 即强调个人理性,也就是在给定的约束条件下 追求效用最大化。可见,经济学和博弈论具 有内在的联系。在经济学和博弈论具有的这 种天然联系的基础上产生了经济博弈论。

第六讲博弈论课件

第六讲博弈论课件
❖ 对于矩阵博弈,其主要的任务就是求出矩阵 博弈的Nash均衡解-----双方尽可能满意的结 果。
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪

踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。

博弈论(第二章)讲义

博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2



上 博弈方1

1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0

博弈论讲义共125页PPT

博弈论讲义共125页PPT
13
3、信息(Information):信息是参与人有关博 弈的知识,特别是有关自然的选择、其他参与 人的特征和行动的知识。
完全信息:每一个参与人对所有其他参与人 (包括自然)的特征、策略空间及支付函数有 准确的知识。否则,就是不完全信息。
共同知识:指的是所有参与人知道,而且所 有参与人知道所有参与人知道……的知识。 共同知识是一个非常强的假定。
案例
房地产开发项目-假设有A、B两家开发商 市场需求:可能大,也可能小 投入:1亿
❖假定市场上有两栋楼出售: ✓需求大时,每栋售价1.4亿, ✓需求小时,售价7千万; ❖如果市场上只有一栋楼 ✓需求大时,可卖1.8亿 ✓需求小时,可卖1.1亿
一 、博弈的基本概念及策略表述
博弈论的基本概念包括:
如果另一个犯罪嫌疑人也作了坦白,则两人 各被判刑8年;如果另一个犯罪嫌人没有坦 白而是抵赖,则以妨碍公务罪(因已有证据 表明其有罪)再加刑2年,而坦白者有功被 减刑8年,立即释放。如果两人都抵赖,则 警方因证据不足不能判两人的偷窃罪,但可 以私入民宅的罪名将两人各判入狱1年。
如何描述这个博弈? 他们将如何选择?
用博弈规则决定均衡。
1、参与人(Players):在博弈中独立决策、 独立承担博弈结果的个人或组织。也称局中 人。参与人的目的是通过选择行动或策略( 策略)以最大化自己的支付(效用)水平。 特殊的虚拟参与人-自然,其实质是决定 外生的环境参数的概率分布的一种机制。 i=1, ……, n代表参与人;N代表自然。
一 、博弈的基本概念及策略表述
博弈的策略式表述:
战略式表述给出: 1、博弈的参与人集合i:, (1,2,,n); 2、每个参与人的战略间空:Si,i 1,2,,n; 3、每个参与人的支付数函:ui (s1,, si,, sn),i 1,2,,n)

博弈论讲义2

博弈论讲义2
13
尽管许多博弈中重复剔除的占优均衡是一个合理 的预测,但并不总是如此,尤其是大概支付是某 些极端值的时候。
参与人B
L
参与人A
R -1000,9
U
8,10
D
7, 6
6, 5
U是A的最优选择,但是,只要有1/1000的概率B选R, A就会选D
14
斗鸡博弈
进 A 独木桥 纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
1、Cournot Model of Duopoly
按竞争程度划分的市场类型(就卖方来说):
A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场
29
市场类型不同,厂商之间行为特征不同,A与C 类型中,厂商的决策都是个体优化决策,而B类 型中寡头垄断竞争的本质就构成博弈,他们都 是理性的决策者,他们的行为既影响自身,又 影响对方。尽管两寡头由于垄断能给他们带来 一些共同的利益,但是他们的根本利益并不是 完全一致的。如果两寡头之间可以签定有约束 力的协议,彼此之间达成合作,形成完全垄断, 此时的博弈是一种合作博弈。然而在大多数情 况下,彼此之间很难达成有约束力的协议,这 样就是非合作博弈。
7
注意:
与占优战略均衡中的占优战略和劣战略不同,
这里的占优战略或劣战略可能只是相对于另一个
特定战略而言。
8
案例1-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 4大于1
0,0
0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
9
案例2
U 行先生
s * 是一个纳什均衡: 或者用另一种表达方式: 当且仅当 si* 是下述最大化问题的解时,

博弈论完整版PPT课件

博弈论完整版PPT课件

ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战

博弈论算法讲义范文

博弈论算法讲义范文

博弈论算法讲义范文
一、对局(Game)
1、定义:对局(Game)是由一个或多个策略者参与构成的有决策过程
的系统,一步步进行的,并且,策略者的行为往往会影响后续的行为。

2、基本假设:
(1)策略者相互独立,没有彼此通讯的机会;
(2)策略者在做出行动时都是理性的,也就是说,他们都认为能够
获得的利益最大化。

3、类型:
(1)博弈:指在决策过程中,双方的目标是相互对抗,差异方案最
大化,最终谁都不赢;
(2)友好博弈:指在决策过程中,双方的目标是协同合作,以共同
获利和最优解。

二、博弈论(Game Theory)
1、定义:博弈论(Game Theory)是用来研究博弈应用问题的数学理论,旨在分析和研究在对局中各个策略者互相作用对抗的结果。

2、组成:
(1)博弈模型:它是由一组策略者的全部可能行动和他们的后果,
以及他们的信息和有关产生的报酬及其图像,构成的决策系统;
(2)决策分析:根据博弈模型,分析不同攻击者使用的不同策略以及各自的收益;
(3)决策算法:根据系统的状况,实施一系列有效的决策算法,达到博弈模型期望的最优解;
(4)实验结果:实验的结果,通过比较和分析,证明博弈模型具有较高的准确性和有效性。

三、Nash均衡。

博弈论最全完整-讲解课件

博弈论最全完整-讲解课件
(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。

第四篇博弈论PPT课件

第四篇博弈论PPT课件
• 此情况下由于博弈没有可预测的明确的博弈结果,所以就不能 确定博弈方的策略。但是是否在这样的博弈中,各博弈方选择 任何策略都是一样的,因此可以随意选择吗?
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈

硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式

博弈论讲义2

博弈论讲义2

三 重复剔除的占优均衡
重复剔除严格劣策略:
思路:首先找到某个参与人的劣策略(假定存 在),把这个劣策略剔除掉,重新构造一个不包 含已剔除策略的新的博弈,然后再剔除这个新的 博弈中的某个参与人的劣策略,一直重复这个过 程,直到只剩下唯一的策略组合为止。 这个唯一剩下的策略组合就是这个博弈的均衡 解,称为“重复剔除的占优均衡”。
独木桥

A
退
B
进退 -3,-3 2,0
0,2 0,0
纳什均衡:A进,B退;A退,B进
斗鸡博弈
村子里有两户富户,有两种可能:一家修,另 一家就不修;一家不修,另一家就得修。
冷战期间美苏抢占地盘:一方抢占一块地盘, 另一方就占另一块。
夫妻吵架,一方厉害,另一方就出去躲躲。
注意:在混合策略纳什均衡条件下,也可能两 败俱伤。
注意: 如果所有人都有(严格)占优策略存在,
那么占优策略均衡就是可以预测的唯一 均衡。 占优策略只要求每个参与人是理性的, 而不要求每个参与人知道其他参与人是 理性的(也就是说,不要求理性是共同 知识)。为什么?
二 占优策略均衡
案例-囚徒困境
囚徒A
囚徒 B
坦白
坦白 -8,-8
抵赖
0,-10 -8大于-10
相安无事;第二天,相安无事……;直到第100天 ,突然,每个妻子都把丈夫杀了。为什么会这样?
这是一个推理和行动的过程。如果她的丈夫不忠的话,她就杀 死他;如果没有证据证明她的丈夫不忠的话,她便相信他,不 杀死他。

如果村里只有一个男人是不忠的话,在老太太作了宣布之
后的第一天,这个男人的妻子在老太太宣布之后马上就能知道
两只猪一起去按,然后一起回槽边进食, 由于大猪吃得快可吃下8个单位的食物, 小猪只能吃到2个单位食物。

《博弈论》精品讲义

《博弈论》精品讲义
指定n个局中人,以及他们各自的纯策略空间
Si,i1 ,2, ,n
和这些局中人各自的支付(盈利)函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为:
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明 公正無私
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
20
策略型表述: (两人有限博弈;Fra bibliotek阵形式)高需求情况
B
A
低需求情况?
博弈论20092009
正大光明 公正無私
21
➢房地产博弈分析
假设:同时决策;市场需求双方已知
若市场需求大,双方开发,各得0.4万元。 若市场需求小,依赖于对方行动。 若市场不确定,依赖对市场的判断及对方行动。
博弈论20092009
正大光明 公正無私
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
意5个数。如果不重复则得奖;否则受罚。 获胜的秘诀是什么?
博弈论20092009

博弈论讲义

博弈论讲义
L(A)=2rc+1(1-r)(1-c) dL(A)/dr =3c-1=0 L(B)=rc+2(1-r)(1-c) dL(B)/dc =3r-2=0 r=2/3 c=1/3
A:(2/3,1/3),B:(1/3,2/3)是本博弈的 混合策略纳什均衡
完全信息动态博弈
参与人先后行动 每个参与人对每个参与人的得益具有完全信 息 博弈树 参与人的行动顺序(when to move,谁在 什么时候行动) 参与人的信息集(what known,每次行动 时参与人知道些什么)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
如果A 选U,其期望收益为
1 L 0 (1 L ) L .
策略组合
策略组合:(s1,…,si,…,sn) ui=ui(s1,…,si,…sn) 一个参与人的支付不仅取决于自己的策略选择, 而且取决于其他参与人的策略选择 Max ui=ui(s1,…,si,…sn)
囚徒困境博弈的标准式表述
B
抵赖 坦白
抵赖
-1,-1 0,-10
-10,0 -8,-8
ui ( s ,...,s ) 0 si
* 1 * n
囚徒困境的纳什均衡
(坦白,坦白)构成本博弈的纳什均衡
抵赖
B
坦白
抵赖
-1,-1 0,-10
-10,0 -8 -8
A

博弈论 讲义

博弈论  讲义
博弈顺序: ✓ 1、“自然”首先选择参与人1的类型,参与人1知道,
但参与人2不知道。只知道1属于该类型x的先验概率。 ✓ 2、参与人1观测到类型x后发出信号 ✓ 3、参与人2观测到参与人1发出的信号,使用贝叶斯法
则从先验概率得到后验概率,然后选择行动。
精练贝叶斯纳什均衡
信号传递博弈的所有可能的精练贝叶斯均 衡可以划分为3类:
不完全信息动态博弈过程不仅是参与人选择行动的过程, 而且是参与人不断修正信念的过程。
精练贝叶斯均衡是泽尔腾不完全信息动态博弈子博弈精练 纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。
一个不完全信息动态博弈
N
0.5
0.5
1(T12)
L
R
L
h
2
a b a ba
1(T12)
R
2 f
ba
b
(1,3) (4,0) (2,1) (0,0)(2,4) (0,1)(1,0) (1,2)
第六章 不完全信息动态博弈-精练 贝叶斯纳什均衡
一 精练贝叶斯纳什均衡
✓ 基本思路 ✓ 贝叶斯法则 ✓ 精练贝叶斯纳什均衡 ✓ 不完美信息博弈的精练贝叶斯均衡
二 信号传递博弈及其应用举例 三 博弈论概念简要总结
看一个男人的品味,要看他的袜子。 看一个女人是否养尊处优,要看她的手。 看一个人的气血,要看他的头发。 看一个人的心术,要看他的眼神。 看一个人的身价,要看他的对手。 看一个人的底牌.要看他身边的好友。 看一个人的性格,要看他的字写得怎样。 看一个人是否快乐,不要看笑容,要看清晨梦醒时的一刹那
基本思路-不完全信息动态博弈
成语故事:黔之驴-驴虎博弈
老虎通过不断试探来修正对毛驴的看法, 每一步行动都是给定它的信念下最优的, 毛驴也是如此。最终老虎将毛驴吃掉。

博弈论讲义

博弈论讲义

3、麦穗理论 、
“麦穗理论”来源于这样一个故事。古希腊 麦穗理论”来源于这样一个故事。 麦穗理论 哲学导师苏格拉底的三个弟子曾求教老师, 哲学导师苏格拉底的三个弟子曾求教老师, 怎样才能找到理想的伴侣。 怎样才能找到理想的伴侣。 苏格拉底没有直接回答, 苏格拉底没有直接回答,却让他们走麦田 只许前进, 埂,只许前进,且仅给一次机会选摘一支 最最大的麦穗。 最最大的麦穗。
第一个弟子走几步看见一支又大又漂 亮的麦穗,高兴地摘下了。 亮的麦穗,高兴地摘下了。但是他继 续前进时, 续前进时,发现前面有许多比他摘的 那支大,只得遗憾地走完了全程。 遗憾地走完了全程 那支大,只得遗憾地走完了全程。
第二个弟子吸取了教训. 第二个弟子吸取了教训.每当他要摘 总是提醒自己,后面还有更好的。 时,总是提醒自己,后面还有更好的。 当他快到终点时才发现,机会全错过 当他快到终点时才发现,机会全错过 了。
应用: 应用:约会理论
看来对于一个人来说, 看来对于一个人来说,在众多的追求者中 选择最合适的异性, 选择最合适的异性,这是关乎终生幸福的 大事。 大事。 不妨假设有20个合适的单身男子都有意追 不妨假设有 个合适的单身男子都有意追 求某个女孩,这个女孩的任务就是, 求某个女孩,这个女孩的任务就是,从他 们当中挑选最好的一位作为结婚对象, 们当中挑选最好的一位作为结婚对象,决 定跟谁结婚。从这20个里面选出最好的一 定跟谁结婚。从这 个里面选出最好的一 个并非易事, 个并非易事,该怎么做才能争取到这个结 果?
何时"妥协 ?怎样妥协? 何时 妥协"?怎样妥协? 妥协
第二,要看“妥协”的条件。 第二,要看“妥协”的条件。 如果你占据优势,可以提出要求, 如果你占据优势,可以提出要求,但不必 把对方弄得无路可退, 把对方弄得无路可退,这不是为了道德正 而是避免逼虎伤人 是有利害权衡的。 逼虎伤人, 义,而是避免逼虎伤人,是有利害权衡的。 如果你是提出妥协的弱势者, 如果你是提出妥协的弱势者,且有不惜玉 石俱焚的决心,相信对方会接受你的条件。 石俱焚的决心,相信对方会接受你的条件。

博弈理论知识讲义

博弈理论知识讲义

第八章 博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互影响的问题。

本章讨论这个问题,建立复杂环境下的决策理论。

开展这种研究的的理论叫做博弈论,也称为对策论(Game Theory)。

最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。

大局部经济行为都可视作博弈的特殊情况,比方把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。

博弈论的思想精髓与方法,已成为经济分析根底的必要组成局部。

第一节 博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双方的目的都是要战胜对方,互不相容,互相影响,互相制约。

一般来讲,博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。

当所有当事人都拿定主意作出决策时,博弈的局势就暂时确定下来。

博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。

博弈论推广了标准的一人决策理论。

在每个局中人的收益都依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。

下面来举例说明。

例1.便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否正面朝上。

局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。

对于这个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。

当甲和乙都作出选择时,博弈的局势就确定了。

显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Behavior and learning in the “dirty faces‟ game
Roberto A. Weber Experimental Economics, 2001
理性是一个学习的过程 ADAPTIVE BEHAVIOR AND COORDINATION FAILURE
John B. Van Huyck, Joseph P. Cook, and Raymond C. Battalio,1996, Journal of Economic Behavior
Other Reference
• 陈学彬(1999),宏观金融博弈分析。上海财经大学出版社。 • Avish Dixit与Susan Skeath(2002),策略的赛局。弘智文化事 业有限公司 • [美]肯.宾默尔(2003),博弈论与社会契约-公平博弈。上海财经 大学出版社。 • 王则柯(2003),新编博弈论平话。中信出版社 • 白波(2004),博弈游戏。哈尔滨出版社 • 马广奇(2006),资本市场博弈论。上海财经大学出版社 • [ 美]罗杰 A.麦凯恩(2006),博弈论:战略分析入门。机械工业 出版社 • 王永春(2007),博弈论的诡计:日常生活中的博弈策略。中国发 展出版社 • James Miller(2003), GAME THEORY AT WORK: How to Use Game Theory to Outthink and Outmaneuver Your Competition. McGraw-Hill • 李维(2007),博弈全书。中央翻译出版社 • , an excellent web resource for game theory
“Continental Divide” Games 分水岭实验
• In coordination games, players want to conform to what others do (although they may have different ideas about which conformist convention is best). • 奇数个参与者从 1~14 中选个数字,然后算出他 们的中值,后面列出他们的损益。
博弈论 Game Theory
上海财经大学金融学院 韩其恒 hqheng@
参考书籍
• Herbert Ginis(2009), The Bounds of Reasons Game Theory and the Unification of the Behavioral Sciences, Prinston University Press • Ken Binmore(2007): Does Game Theory Work? The Bargaining Challenge, The MIT Press, London, England • Colin F. Camerer(2006) , Behavior Game Therory: experiments in Strategic Interaction. 中国人民大学出版社。 • 谢始予(2002),第二版,经济博弈论。复旦大学出版社 • [美 ]罗伯特 • 吉本斯(1999),博弈论基础。中国社会科学出版 社 • 张维迎(1996 ),博弈论与信息经济学。上海人民出版社,上海 三联书店 • [美]普拉伊特• K •杜塔(2005),策略与博弈:理论与实践。上 海财经大学出版社。 • 施锡铨(2002),博弈论。上海财经大学出版社。 • [美]朱•弗登博格,[法]让•梯若尔(2003),博弈论。中国人民大 学出版社 • Martin J.Osborne(2005),博弈入门。上海财经大学出版社。
背景
• 最早的前身是不完美竞争市场的经济分析:法 国经济学家古诺( Augustin Cournot 1838) 模型;英国经济学家伯川德( Bertrand)和斯 坦克伯格(Stackelberg)所做的工作。
The Brute Force Approach
(Simon Singh, Fermat’s last theorem)
153
-1,1 -3,3 -1,1 -1,1 -1,1 1,-1
315
-1,1 1,-1 -3,3 -1,1 -1,1 -1,1
351
1,-1 -1,1 -1,1 -3,3 -1,1 -1,1
513
-1,1 -1,1 -1,1 1,-1 -3,3 -1,1
531
-1,1 -1,1 1,-1 -1,1 -1,1 -3,3
3 M (e) 86 (e , M (e)) 26M (e) 40 e i i 2
• 10 组实验: 5 组从 7 或以下的中位数开始,无一例外的流 向了低支付均衡3。另外5组从8或以上开始,并流向了高 支付均衡12。 • 在水壶里出发时两滴紧紧相靠的水滴却最终分开了数千 英里。 • 历史趋势是强大的,造成了对”初试形势的极端敏感”。
这个故事对于理性行为假设的适用性提出 了警告。
理性: CKR (Common Knowledge of Rationality)
• Dirty faces game (Littlewood, 1953): the game suddenly. Three people in the house, not allowed to speak. Beautiful women come in, said: at least one of you is a dirty face. Three ring of view, there was no response. Beauty said: you know what? • the beginning of the common knowledge, and truth: the three faces are dirty, all blushed.
A Truel
• Rule: Mr Black, Mr Grey, Mr White • Question: where should Mr Black aim at his first shot? • 这个故事告诉我们:在多人博弈中常常由于复 杂关系的存在,而导致出人意料的结局。
• 《博弈论和经济行为》标志着博弈理论的初步 形成。三大贡献:效用理论;零和博弈( Zerosum Games,一个局中人赢当且仅当另一个局中 人 输 的 两 人 博 弈 ) ; 合 作 博 弈 ( Cooperative Games)。 • Nash(1950,1951)两篇关于非合作博弈的重 要文章,在非常一般的意义下。定义了非合作 博弈及其均衡解,并证明了均衡解的存在。基 本上奠定了现代非合作博弈论的基石。
264
426 462 624 642
2、相互依存
• 博弈:动态的决策过程 • 有限性与具体问题具体分析 • 本质上一般均衡应当是博弈均衡的一 个特例。
3. 理性
• • Players: rational, no mercy or compassion, only self-interest. 理性人的假设是斯密提出来的,他并不是赞 扬这种利己性,只是承认它是无法更改的人 性。 理性行为并不表示局中人是自私的,局中人 或许重视他人的福利,而将之考虑在报酬之 中,理性行为也不代表局中人对未来不重视, 事实上,对未来的考虑是策略盈利的重要环 节。另外,价值体系也是要考虑的重要环节。
主要内容
• • • • • • • • 导论 Nash均衡 进化博弈 有限重复博弈 无限重复博弈 拍卖与Bayes均衡 机制设计 信号博弈
人生是永不பைடு நூலகம்息的博弈过程
• 经济学家梯若尔 (Jean Tirole): “正如理性 预期使宏观经济学发生革命一样,博弈论广泛 而深远的改变了经济学家的思维方式。” • 如果情况确实如此,对今天的经济学家来说, 不懂得博弈论显然是不行了。 • 保罗. 萨缪尔森:要想在现代社会做一个有文 化的人,你必须对博弈论有一个大致的了解。
• In 1944 John von Neumann cowrote the book The Theory of Games and Economic Behavior, in which he coined the term game theory. Game theory was von Neumann’s attempt to use mathematics to describe the structure of games and how humans play them. • After Second World War the RAND corporation realized the potential of von Neumann’s ideas and hired him to work on developing Cold War strategies. From that point on, mathematical game theory has become a basic tool for generals to test their military strategies by treating battles as complex games as chess. A simple illustration of the application of game theory in battles is the story of the truel.
导论
1. 什么是博弈论 • 定义:关于包含相互依存情况中理性行为的研 究。 • 诺贝尔经济学奖得主奥曼在权威的《帕尔格雷 夫大词典》中,对“博弈论”词条的解释十分 精辟和凝练。他认为,博弈论描述性的名称应 是“互动的决策论”。 • 决策的决策
决策与博弈:田忌赛马
135 246
-3,3 -1,1 -1,1 -1,1 1,-1 -1,1
相关文档
最新文档