博弈论讲义完整版

合集下载

博弈论讲义完整版

博弈论讲义完整版


第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”

石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
你 接受 求爱博弈: 品德优良者求爱 求爱者 求爱
100,100
不接受
-50,0 0,0
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱者 接受 求爱 不求爱 0,0 你 不接受
问题:什么叫“完全而不完美信息博弈”?
第二章 完全信息静态博弈

一 博弈的基本概念及战略表述 二 占优战略(上策)均衡


三 重复剔除的占优均衡(严格下策反复消去法)
四 划线法
五 箭头法
六 纳什均衡
完全信息静态博弈

完全信息:每个参与人对所有其他参与人的特 征(包括战略空间、支付函数等)完全了解
同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境

囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的“最优策略”使整个“系统”处于不利 的状态。

思考:为什么会造成囚徒困境 是否由于“通讯”问题造成了囚徒困境? “要害”是否在于“利己主义”即“个人理 性”?

博弈论本科讲义

博弈论本科讲义

在中观经济研究中,劳动力经济学和金融理 论都有关于企业要素投入品市场的博弈模型, 即使在一个企业内部也存在博弈问题:工人之 间会为同一个升迁机会勾心斗角,不同部门之 间为争取公司的资金投入相互竞争;从宏观角 度看,国际经济学中有关于国家间的相互竞争 或相互串谋、选择关税或其他贸易政策的模型; 至于产业组织理论更是大量应用博弈论的方法 (见Jean Tirole的《产业组织理论》)。
如果n个参与人每人从自己的Si中选择一个策略 siategy profile),参与人i之外的其他参 与人的策略组合可记为s-i=( s1,s2,﹍,si-1 , si+1 ,﹍, sn)。
例如田忌的某个策略s田忌=上中下,或中下上, 等等;S田忌={上中下,上下中,中上下,中下 上 ,下上中,下中上}
贷市场的过高利息。此外,阿克尔洛夫还把信 息不对称运用于解释各种社会问题,比如因为信 息不对称,医疗保险市场上,老年人、个体劳动 者的医疗保险利益得不到保障。
三、基本概念
1、参与人Players:一个博弈中的决策主体, 他们各自的目的是通过选择行动(策略)以最 大化自己的目标函数/效用水平/支付函数。他们 可以是自然人或团体或法人,如企业、国家、 地区、社团、欧盟、北约等。 那些不作决策或虽做决策但不直接承担决 策后果的被动主体不是参与人,而只能当做环 境参数来处理。如指手划脚的看牌人、看棋人, 企业的顾问等。 对参与人的决策来说,最重要的是必须有
教材——P5 博弈论就是系统研究各种各 样博弈中参与人的合理选择及其 均衡的理论。
关于“经济博弈论”:
博弈论是研究人们在利益相互影响的格局 中的策略选择问题、是研究多人决策问题的理 论。而策略选择是人们经济行为的核心内容, 此外,经济学和博弈论的研究模式是一样的: 即强调个人理性,也就是在给定的约束条件下 追求效用最大化。可见,经济学和博弈论具 有内在的联系。在经济学和博弈论具有的这 种天然联系的基础上产生了经济博弈论。

博弈论(第二章)讲义

博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2



上 博弈方1

1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0

博弈论基础讲义-第四章

博弈论基础讲义-第四章

第四章动态不完全信息博弈第一节. 序贯均衡的内涵一.问题的提出1.序贯理性2.一致信念二.序贯均衡的内涵1.例子2.定义a.行为战略b.序贯理性c.一致信念3.存在性三.序贯均衡的计算1.例子:一般计算2.例子:分析应用第二节. 序贯均衡的应用一.教育和信号传递1.假设2.分析二.垄断限价模型1.假设2.分析三.声誉模型1.假设2.分析四.序贯均衡之再精炼1.剔除劣弱战略2.直观标准3.垄断限价模型第四章不完全信息动态博弈第一节.序贯均衡的内涵一.问题的提出1.序贯理性——参与人在所有情况决策都是理性的,即在给定信念的条件下,以及其他参与人的选择条件下,自身选择是最优的例1:子博弈最优——纳什均衡(,)L l是否合理?——如果参与人2有机会选择,肯定选r而不是l;——(,)L l不是子博弈精炼纳什均衡。

例2:单点信息集最优——纳什均衡(,,)D a l是子博弈纳什均衡;——但如果参与人2有机会选择,但肯定选择d;——(,,)D a l不满足单点信息集理性。

例3:多点信息集最优——纳什均衡(,)A r是子博弈精炼纳什均衡;——(,)A r不满足多点信息集理性。

2.一致信念例1:与客观事实一致u=是否合理?——参与人2的信念2/3——2/3u=是不合理的,因为任何到达参与人2信息集都不可能产生此后验概率;——后验信念必须与先念信念保持一致。

例2:前后信念一致——参与人2的第2个信息集上的信念,是否合理?——不合理,给定参与人战略和第1个信息集的信念,利用贝叶斯法则计算信念与此不一致;——参与人前后信念保持一致。

例3:独立偏离——参与人3的信念0.9u =是否合理?——参与人1和参与人3的偏离是独立的,所以参与人3的合理信念为0.1u =;——不同参与人之间的偏离是独立的总结,一致信念要求:参与人偏离最小化,,参与人之间偏离是独立的;二.序贯均衡的定义1.例子——定义参与人1在信息集1.1和1.3以及参与人2在2.2上的序贯理性;——定义信息集1.3和2.2的信念?2.定义a.行为战略:参与人在某个信息集到行动集映射,——如果某个状态真正发生,参与人如何决策;——序贯理性是否满足?b.序贯理性:在任何信息集上,参与人在给定信念和所有后续行为战略,选择自身行为战略最大化预期效用。

(最新经营)博弈理论知识讲义

(最新经营)博弈理论知识讲义

第八章博弈论前面章节对经济人最优决策的讨论,是于简单环境下进行的,没有考虑经济人之间决策相互影响的问题。

本章讨论这个问题,建立复杂环境下的决策理论。

开展这种研究的的理论叫做博弈论,也称为对策论(GameTheory)。

最近十几年来,博弈论于经济学中得到了广泛应用,于揭示经济行为相互制约性质方面取得了重大进展。

大部分经济行为均可视作博弈的特殊情况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。

博弈论的思想精髓与方法,已成为经济分析基础的必要组成部分。

第一节博弈事例博弈是一种日常现象,例如棋手下棋,双方均要根据对方的行动来决定自己的行动,双方的目的均是要战胜对方,互不相容,互相影响,互相制约。

一般来讲,博弈现象的特征表现为两个或两个之上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益均取决于所有当事人的行动。

当所有当事人均拿定主意作出决策时,博弈的局势就暂时确定下来。

博弈论就是研究这种不相容现象的一种理论,且把当事人叫做局中人(player)。

博弈论推广了标准的一人决策理论。

于每个局中人的收益均依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人均必须考虑其他局中人面临的问题。

下面来举例说明。

例1.便士匹配(MatchingPennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人均有一块硬币,且且各自独立安排硬币是否正面朝上。

局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。

对于这个博弈,正面朝上和反面朝上,即甲和乙的策略集合均是{正面,反面}。

当甲和乙均作出选择时,博弈的局势就确定了。

显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。

博弈论(二)—讲义

博弈论(二)—讲义

9.2 完全信息静态博弈9.2.1 博弈的战略式表述Definition A normal (strategic) form game G consists of: (1) a finite set of agent s . {1,2,,}D n = (2) strategy sets .12,,,n S S S (3) payoff functions . 12:(1,2,,)i n u S S S R i n ⨯⨯⨯→=囚徒B囚徒A完全信息静态博弈是一种最简单的博弈,在这种博弈中,战略和行动是一回事。

博弈分析的目的是预测博弈的均衡结果,即给定每个参与人都是理性的,什么是每个参与人的最优战略?什么是所有参与人的最优战略组合?纳什均衡是完全信息静态博弈解的一般概念,也是所有其他类型博弈解的基本要求。

下面,我们先讨论纳什均衡的特殊情况,然后讨论其一般概念。

9.2.2 占优战略(Dominated Strategies )均衡一般说来,由于每个参与人的效用(支付)是博弈中所有参与人的战略的函数,因此,每个参与人的最优战略选择依赖于所有其他参与人的战略选择。

但是在一些特殊的博弈中,一个参与人的最优战略可能并不依赖于其他参与人的战略选择。

也就是说,不管其他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”。

Definition Strategy s i is strictly dominated for player i if there is some such that i i s S '∈ for al .(,)(,)i i i i i i u s s u s s --'>i i s S --∈Proposition a rational player will not play a strictly dominated strategy.抵赖 is a dominated strategy. A rational player would therefore never 抵赖. This solves the game since every player will 坦白. Notice that I don't have to know anything about the other player . 囚徒困境:个人理性与集体理性之间的矛盾。

博弈论讲义07 策略性行动:承诺与威胁

博弈论讲义07 策略性行动:承诺与威胁

不威胁
美 国 关闭 日本 关闭
威胁
(4, 3) 新均衡:(开放,开放) (3)结论:比较之后,美国选择“威胁” 威胁可置信的条件 (1)威胁收益>威胁成本 (2)实施威胁的参与人具有承担威胁成本的心理准备
开放
第四~六节 策略行动与可信性
企业乙 二、策略行动的可信性 低价 高价 (三)允诺的可信性 3 1 低价 企 3 6 例:价格战的囚徒困境 业 6 5 甲 高价 1 5 美国做出威胁 (1)企业乙的允诺 如果企业甲“高价”,我则 “高价” 隐含的允诺:如果企业甲“低价”,我则 “低价”。 企业乙 (2)两阶段博弈:博弈树 低价 高价 企业乙 不允诺
二、策略行动的可信性 (一)承诺的可信性 不严格 老 例:同时行动的师生博弈 师 严格 老师做出承诺 (1)老师的承诺(无条件策略行动) (2)两阶段博弈:博弈树 学生
老师 不承诺 不严格 4 老 师 严格 3 学生
第四~六节 策略行动与可信性 学生
按时 3 4 2 3 我的野 蛮老师 1 2 1 迟交 4
第四~六节 策略行动与可信性
二、策略行动的可信性 (二)威胁的可信性 例:日美贸易博弈
日本 开放 开放 3 关闭 4 美 国 关闭
4
1
3
2
2 1 美国做出威胁 (1)美国的威胁 如果你关闭本国市场的话,我也将关闭本国市场。 隐含的允诺:如果你方保持本国市场开放,则我方也会保持本 国市场开放。 日本 开放 关闭 (2)两阶段博弈:博弈树 美国 不威胁 美 国 关闭 日本 开放
第四~六节 策略行动与可信性
二、策略行动的可信性 例:进入威慑P182 环境设定
参与人:两个公司,进入者和在位者 博弈顺序:(1)进入者决定进入或不进入; (2)如果进入者进入,在 位者可以容忍,或用大降价来对抗 支付:在位者的垄断利润为4。当进入者进入,如果在位者容忍, 则进入者得2,在位者得1,如果在位者对抗,各自损失1。

博弈论讲义3-不完美信息静态博弈

博弈论讲义3-不完美信息静态博弈
随机变量ti在Ti的概率分布假定是已知的。
不完全信息博弈中,至少有一个参与者i有多个可能的 类型,其他参与者虽然知道ti∈Ti,但都无法确知ti在 Ti中的具体取值。
如果只有虚拟参与人具有多个类型,则是不完全信息
如果有虚拟参与人以外的某些参与人有多个类型,则属于信息 不对称。
版权所有余向华源自12信息问题与市场的建立
“柠檬”市场现象(Akerlof):
由于信息问题引发逆向选择(劣币驱逐良币),
导致有效的市场可能建立不起来,或发展慢。
普遍存在于产品市场、劳动力市场(包括教师市场的问
题)、保险市场、信贷市场等上
“碟猫”市场现象:
本能不存在的市场,由于信息的不完全反给创
造出来了。比如赌石市场、彩票市场
第3篇 不完全信息静态博弈
3.1 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈 海萨尼转换 不完全信息静态博弈的策略式表述和贝叶斯纳什均衡
3.2 贝叶斯纳什均衡与混合策略均衡的纯化 3.3 贝叶斯纳什均衡应用举例 3.4 非对称信息下的机制设计问题
版权所有
余向华
1
信息问题与现实生活
爱心困惑:面对一个个乞丐向你行乞,你会如何决定呢? 佛心者:宁可被骗一千次,绝不放过一次帮助需要帮助者。 人心者:宁可错过千次帮助需要帮助的人,绝不愿被骗一次?
不帮、或者收集信息再决定?
婚恋困惑:知人知面与知心问题 食品安全中的信息问题 信息与法律举证问题 …
版权所有
余向华
2
信息问题与市场运行
在信息不完美的情况下,博弈参与者的收益为期望收益: 被求者
接受 不接受
求爱博弈:
求爱 100,100
品德优良者求爱 求爱者 不求爱 0,0

《博弈论》精品讲义

《博弈论》精品讲义
指定n个局中人,以及他们各自的纯策略空间
Si,i1 ,2, ,n
和这些局中人各自的支付(盈利)函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为:
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明 公正無私
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
20
策略型表述: (两人有限博弈;Fra bibliotek阵形式)高需求情况
B
A
低需求情况?
博弈论20092009
正大光明 公正無私
21
➢房地产博弈分析
假设:同时决策;市场需求双方已知
若市场需求大,双方开发,各得0.4万元。 若市场需求小,依赖于对方行动。 若市场不确定,依赖对市场的判断及对方行动。
博弈论20092009
正大光明 公正無私
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
意5个数。如果不重复则得奖;否则受罚。 获胜的秘诀是什么?
博弈论20092009

博弈论讲义

博弈论讲义
L(A)=2rc+1(1-r)(1-c) dL(A)/dr =3c-1=0 L(B)=rc+2(1-r)(1-c) dL(B)/dc =3r-2=0 r=2/3 c=1/3
A:(2/3,1/3),B:(1/3,2/3)是本博弈的 混合策略纳什均衡
完全信息动态博弈
参与人先后行动 每个参与人对每个参与人的得益具有完全信 息 博弈树 参与人的行动顺序(when to move,谁在 什么时候行动) 参与人的信息集(what known,每次行动 时参与人知道些什么)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
如果A 选U,其期望收益为
1 L 0 (1 L ) L .
策略组合
策略组合:(s1,…,si,…,sn) ui=ui(s1,…,si,…sn) 一个参与人的支付不仅取决于自己的策略选择, 而且取决于其他参与人的策略选择 Max ui=ui(s1,…,si,…sn)
囚徒困境博弈的标准式表述
B
抵赖 坦白
抵赖
-1,-1 0,-10
-10,0 -8,-8
ui ( s ,...,s ) 0 si
* 1 * n
囚徒困境的纳什均衡
(坦白,坦白)构成本博弈的纳什均衡
抵赖
B
坦白
抵赖
-1,-1 0,-10
-10,0 -8 -8
A

博弈论全套课件

博弈论全套课件

三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论,流传最广的是一个叫做“囚 徒 困 境 ” 的 故 事 。 这 个 博 弈 是 1950 年 图 克 (Tucker)提出的,这个博弈模型提出后曾引 发了大量的相关研究,也有许多关于“囚徒困 境”的版本。“囚徒困境”对博弈论的发展起 到了巨大的推动作用。可以说凡是讲博弈论, 都会说到这个经典的博弈模型。
在过去二三十年中,博弈论已成为社会科 学研究的一个重要方法。有人说,如果未来社 会科学还有纯理论的话,那就是博弈论。无论 是合作博弈还是非合作博弈都给我们提供了一 种系统的分析方法,使人们在其命运取决于他 人的行为时制定出相应的战略。特别是当许多 相互依赖的因素共存,没有任何决策能独立于 其它许多决策之外时,博弈论更是价值巨大。
最近十几年来,博弈论在经济学尤其是微 观经济学中得到了广泛的运用, 博弈论在许多 方面改写了微观经济学的基础,经济学家们已经 把研究策略相互作用的博弈论当作最合适的分 析工具来分析各类经济问题,诸如公共经济、 国际贸易、自然资源、企业管理等。在现代经 济学里,博弈论已经成为十分标准的分析工具。 除经济学以外, 博弈论目前在生物学、管理学 、国际关系、计算机科学、政治学、军事战略 和其他很多学科都有广泛的应用。现在已经有 愈来愈多的人开始关注、了解并学习博弈理论 。
博弈论(Game Theory)是一种关于游戏的 理论, 又叫做对策论, 是一门以数学为基础的、 研究对抗冲突中最优解问题的学科。事实上, 博弈论也正是衍生于古老的游戏,如象棋、围 棋、扑克等。
博弈论作为一门学科,是在20世纪50~60 年代发展起来的,当非零和博弈理论、特别是 不完全信息博弈理论获得充分发展时,才成为 现实。到20世纪70年代,博弈论正式成为主流 经济学研究的主要方法之一。1994年诺贝尔经 济学奖同时授予了纳什、泽尔腾、海萨尼三位 博弈论专家。2005年诺贝尔经济学奖又授予了 美国经济学家托马斯.谢林(Thomas Schelling)和以色列经济学家罗伯特.奥曼 (Robert Aumann),以表彰他们在合作博弈 方面的巨大贡献。

博弈论最全完整-讲解

博弈论最全完整-讲解
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的
逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
例3:为什么教授如此苛刻?
问题是,一个好心肠的教授如何维持如 此铁石心肠的承诺?
他必须找到某种使拒绝变得强硬和可信 的方法。
拿行政程序或者学校政策来做挡箭牌 在课程开始时做出明确和严格的宣布 通过几次严打来获得“冷面杀手”的声

导论
博弈均衡与一般均衡 博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型 主要参考文献
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
按照大家是否清楚对局情况下每个 局中人的得益。
“各种对局情况下每个人的得益是 多少” 是所有局中人的共同知识 (common knowledge)。
据“共同知识”的掌握分为完全信 息与不完全信息博弈。
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information)
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。

博弈论 讲义[精]

博弈论  讲义[精]
博弈论(Game Theory)
第六章 不完全信息动态博弈-精练 贝叶斯纳什均衡
一 精练贝叶斯纳什均衡
基本思路 贝叶斯法则 精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡
二 信号传递博弈及其应用举例 三 博弈论概念简要总结
思维体操:

张同学、李同学都具有足够的推理能力。某天,他们正
所罗门王断案
两个女人为争夺一个孩子吵到所罗门王那里。一个女人说:“陛下, 我和这妇人同住一个房间。我生了一个孩子,三天以后这妇人也生 了一个孩子,房间里再没有别的人。夜里这妇人睡觉的时候,把自 己的孩子压死了。她半夜醒来,趁我睡着,把我的孩子抱去,把她 已经死了的孩子放在我的怀里。天亮要喂奶的时候,我才发现怀里 的孩子是死的,仔细察看,并不是我生的孩子。”另一个女人赶紧 说:“不对,活孩子是我的,死孩子才是她的。”吵得不可开交。
→唯一的均衡价格是P=2000,只有低质量的车成交, 高质量的车退出市场。 若假设车的质量θ∈[2000 ,6000]连续分布,均衡结 果为?
高质量的车退出市场,低质量的旧车充斥市场,结 果买者买到低质量车的现象。——逆向选择( adverse-selection)。
旧车市场的逆向选择来自买卖双方的信息不对称。
完全信息条件下,均衡价格P=6000(高质量)或 P=2000(低质量)。
买者不知道车的真实质量,如果两类车都进入市场, 车的平均质量Eθ =4000→买者愿出的最高价格 P=4000。 →高质量车的卖者将退出市场,只有低量 车θ= 2000的卖者愿意出售。
→买者知道高质量的车退出,市场上剩下的一定是 低质量的卖者。买者愿出的最高价格为P=2000
在接受推理面试。他们知道桌子的抽屉里有如下16张扑克牌:

博弈讲稿.ppt

博弈讲稿.ppt

委托人
代理商 s
I 0, – h
N w, - w
盈利函数(payoff function)
博弈的三个要素:
1.局中人 以i=1,2,…,表示
2.每个局中人一般有若干个策略(strategies) 可供选择,它们构成了该局中人的纯策略空间。 局 纯中策人略构i的成纯,策则略有空S间i 用=(Sis表i1,示s,i2,倘…若,Ssi i由k)ki。个
第一章 引 论
§1.1 长街上的超市
******************************
0
A A’
1 2
C
B
1
B
§1.2 共同投资问题
§1.3 什么是博弈论
博弈论:就是关于包含相互依存情况中理性 行为的研究。
相互依存 :通常是指博弈中的任何一个局 中人受到其他局中人的行为的影响,反过来, 他的行为也影响到其他局中人
例2.1 二人博弈的盈利矩阵如下:
局中人 1
局中人2
L
M
U 4,3 5,1
M 2,1 8,4
D 3,0 9,6
R 6,2 3,6 2,8
§2. 3 累次严优 (iterated strict dominancຫໍສະໝຸດ )U 局中人1 MD
局中人2
L
R
4, 3 6, 2
2, 1 3, 6
3, 0 2,8
每一个局中人舍弃自己的劣策略或条件劣策 略的做法从逻辑上说是令人信服的。从某 一个局中人的角度出发排除该局中人的劣 策略,然后在“缩小了的”“条件”博弈 中,从另一个局中人角度出发,剔除此人 的劣策略,这样一步一步地进行下去,除 非到某一步不存在所谓的劣策略,否则可 以一直剔除下去,最后幸存下来的结局合 乎逻辑地成为博弈的预测结局。我们称这 个过程为累次取优(iterated dominance), 更精确地,应称为累次严优(iterated strict dominance)。

博弈论讲义9

博弈论讲义9
作“吊诡” , 悖论 也被译作“吊诡”),简单说就是自相 也被译作 矛盾的说法。 矛盾的说法。 有时似乎无懈可击的推理和论证把你送进 了死胡同。 了死胡同。 启示:一个具有天才的人, 启示:一个具有天才的人,必具有超人的 性格,绝不遵循常人的思想和途径。 司汤 性格,绝不遵循常人的思想和途径。--司汤 达
实例1: 实例 :珍稀动物保护问题
比如: 比如:藏羚羊 如此珍稀的资源, 如此珍稀的资源,当然禁不起物欲横流的 消耗,藏羚羊的生存岌岌可危。 消耗,藏羚羊的生存岌岌可危。政府禁止 猎杀,严惩盗猎者,当然是正确之举。 猎杀,严惩盗猎者,当然是正确之举。 但是同时有什么效应?! 但是同时有什么效应?!
结果不想陷入困境, 结果不想陷入困境,只能同时写出原价最 好。 启示:人们在为私利考虑的时候不要太"精 启示:人们在为私利考虑的时候不要太 精 明",告诫人们精明不等于高明,太精明往 ,告诫人们精明不等于高明, 往会坏事;但是另一方面, 往会坏事;但是另一方面,它对于理性行 为假设的适用性提出了警告。 为假设的适用性提出了警告。
毒品之害,人所公认,可是在荷兰等国家, 毒品之害,人所公认,可是在荷兰等国家, 买卖轻度麻醉品却是合法的。 买卖轻度麻醉品却是合法的。 想想原因? 想想原因?
原因
1、没有权利阻止和惩罚自愿服用毒品的人 、 2、麻醉品合法化后,“被迫”食用麻醉品 、麻醉品合法化后, 被迫” 的人数肯定会下降。 的人数肯定会下降。 3、由于麻醉品只能在地下买卖,所以品质 、由于麻醉品只能在地下买卖, 得不到保证, 得不到保证,瘾君子的身体会受到更严重 的损害。 的损害。 4、管制之下,麻醉品的价格极高,这会诱 、管制之下,麻醉品的价格极高, 使瘾君子从事其他犯罪活动。 使瘾君子从事其他犯罪活动。

博弈论 讲义

博弈论  讲义
博弈顺序: ✓ 1、“自然”首先选择参与人1的类型,参与人1知道,
但参与人2不知道。只知道1属于该类型x的先验概率。 ✓ 2、参与人1观测到类型x后发出信号 ✓ 3、参与人2观测到参与人1发出的信号,使用贝叶斯法
则从先验概率得到后验概率,然后选择行动。
精练贝叶斯纳什均衡
信号传递博弈的所有可能的精练贝叶斯均 衡可以划分为3类:
不完全信息动态博弈过程不仅是参与人选择行动的过程, 而且是参与人不断修正信念的过程。
精练贝叶斯均衡是泽尔腾不完全信息动态博弈子博弈精练 纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。
一个不完全信息动态博弈
N
0.5
0.5
1(T12)
L
R
L
h
2
a b a ba
1(T12)
R
2 f
ba
b
(1,3) (4,0) (2,1) (0,0)(2,4) (0,1)(1,0) (1,2)
第六章 不完全信息动态博弈-精练 贝叶斯纳什均衡
一 精练贝叶斯纳什均衡
✓ 基本思路 ✓ 贝叶斯法则 ✓ 精练贝叶斯纳什均衡 ✓ 不完美信息博弈的精练贝叶斯均衡
二 信号传递博弈及其应用举例 三 博弈论概念简要总结
看一个男人的品味,要看他的袜子。 看一个女人是否养尊处优,要看她的手。 看一个人的气血,要看他的头发。 看一个人的心术,要看他的眼神。 看一个人的身价,要看他的对手。 看一个人的底牌.要看他身边的好友。 看一个人的性格,要看他的字写得怎样。 看一个人是否快乐,不要看笑容,要看清晨梦醒时的一刹那
基本思路-不完全信息动态博弈
成语故事:黔之驴-驴虎博弈
老虎通过不断试探来修正对毛驴的看法, 每一步行动都是给定它的信念下最优的, 毛驴也是如此。最终老虎将毛驴吃掉。

博弈理论知识讲义

博弈理论知识讲义

第八章 博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互影响的问题。

本章讨论这个问题,建立复杂环境下的决策理论。

开展这种研究的的理论叫做博弈论,也称为对策论(Game Theory)。

最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。

大局部经济行为都可视作博弈的特殊情况,比方把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。

博弈论的思想精髓与方法,已成为经济分析根底的必要组成局部。

第一节 博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双方的目的都是要战胜对方,互不相容,互相影响,互相制约。

一般来讲,博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。

当所有当事人都拿定主意作出决策时,博弈的局势就暂时确定下来。

博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。

博弈论推广了标准的一人决策理论。

在每个局中人的收益都依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。

下面来举例说明。

例1.便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否正面朝上。

局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。

对于这个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。

当甲和乙都作出选择时,博弈的局势就确定了。

显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境

囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的‚最优策略‛使整个‚系统‛处于不利 的状态。

思考:为什么会造成囚徒困境 是否由于‚通讯‛问题造成了囚徒困境? ‚要害‛是否在于‚利己主义‛即‚个人理 性‛?
第一章 导论-囚徒困境
通俗地讲:
纳什均衡的含义是:给定别人战略情况下,没有 任何单个参与人有积性选择其他战略,从而没有人 有积极性打破这种均衡。
第一章 导论-囚徒困境 一只河蚌正张开壳晒太阳,不料,飞来了 一只鸟,张嘴去啄他的肉,河蚌连忙合起两张 壳,紧紧钳住鸟的嘴巴,鸟说:‚今天不下雨, 明天不下雨,就会有死蚌肉。‛河蚌说:‚今 天不放你,明天不放你,就会有死鸟。‛谁也 不肯松口,有一个渔夫看见了,便过来把他们 一起捉走了。
不开发
1000,0 0,0
开发商A
博弈的战略式表述
一 、博弈的基本概念及战略表述

需求小时,售价7千万;
如果市场上只有一栋楼 需求大时,可卖1.8亿 需求小时,可卖1.1亿
一 、博弈的基本概念及战略表述
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 不开发
开发商B 开发 不开发
4000,4000 0,8000 8000,0 0,0
开发商B
开发
-3000,-3000 0,1000

第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了‚星期五‛

石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。

适用于多个参与人的动态博弈
完全信息动态博弈-子博弈精练纳什均衡 (举例)泽尔腾(1965)
行动
进入
进入者
在位者
合作(40,50) 斗争(-10,0)
不可置信威胁
不进入(0,300)
市场进入阻挠博弈树
特点:剔除博弈中包含的不可置信威胁;
支付函数
承诺行动-破釜沉舟
给定进入者进入,剔除(进入,斗争),(进入,默许) 是唯一的子博弈精练纳什均衡-举例(结婚-反对)
博弈论
(Game Theory)
前言

本课程的教学安排 本课程的主要内容 博弈论概述 本课程的教学目的
讲课及考核方式

学时/学分:32/2 预修课程:微观经济学
考核方式
作业:30分 答卷:70分 共计:100分
预期时间安排

时间安排:4月27日开始 每周四节 课时:32学时
教材及参考书
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
你 接受 求爱博弈: 品德优良者求爱 求爱者 求爱
100,100
不接受
-50,0 0,0
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱者 接受 求爱 不求爱 0,0 你 不接受
囚徒困境
第一章 导论-囚徒困境
案例1-囚徒困境-纳什均衡
囚徒A
坦白
囚徒 B
抵赖
坦白
-8,-8 -10,0
0,-10 -1,-1
-8大于-10 0大于-1
抵赖
(坦白,坦白)是纳什均衡
第一章 导论-囚徒困境
设定: (1)每个局中人都知道博弈规则和博弈结 果的支付矩阵; (2)每个局中人都是理性的(个人理性和 个人最优决策); (3)不能‚串通‛
教材:
谢识予,经济博弈论,复旦大学出版社
主要参考书:
1.张维迎,博弈论与信息经济学,上海三联书 店,上海人民出版社.1996. 2.Jean Tirole,博弈论,中国人民大学出版 社
第一章 导论

博弈论与经济学
1.1经济学(新古典经济学) (1)研究内容:稀缺资源的有效配臵的;人的经济行为。 (2)理性人 (3)研究对象:价格制度 (4)两个基本假定:市场参与者的数量足够多从而市场 是竞争性的;参与人之间不存在信息不对称问题。
第一章 导论-基本概念

博弈的划分:
静态 完全信息静态博弈 纳什均衡
纳什(1950,1951)
行动顺序 信息 完全信息
动态 完全信息动态博弈 子博弈精练纳什均衡 泽尔腾(1965)
不完全信息动态博弈 精练贝叶斯纳什均衡 泽尔腾(1965) Kreps 和Wilson(1982) Fudenberg 和Tirole(1991)
第一章 导论-囚徒困境

两个寡头企业选择产量的博弈:
如果两个企业联合起来形成卡特尔,选择垄断利 润最大化的产量,每个企业都可以得到更多的利润。 给定对方遵守协议的情况下,每个企业都想增加产量, 结果是,每个企业都只得到纳什均衡产量的利润,它 严格小于卡特而产量下的利润。

请举几个囚徒困境的例子
第一章 导论-囚徒困境


静态:所有参与人同时选择行动且只选择一次。
同时:只要每个参与人在选择自己的行动时不 知道其他参与人的选择,就是同时行动 博弈分析的目的是预测均衡结果

一 博弈的基本概念及战略表述
案例- 房地产开发项目-假设有A、B两家开发商
市场需求:可能大,也可能小
投入:1亿
假定市场上有两栋楼出售: 需求大时,每栋售价1.4亿,
小股东
穷人
监督
修路
纳什均衡:大股东担当监督经理的责任,小股东搭便车

纳什均衡:大户修路


改革中得到好处多的 股市的大户
少的 小户
改革 炒股
纳什均衡:大户搜集信息,小户跟大户
第一章 导论-性别战
案例3-性别战
女 足球 男 足球 芭蕾 2,1 0,0 芭蕾 0,0 1,2
纳什均衡: 足球,足球;芭蕾,芭蕾 先动优势

第一章 导论-斗鸡博弈

案例5-市场进入阻挠
在位者 默许 斗争 进入者 进入 40,50 -10,0 0,300 不进入 0,300
纳什均衡:进入,默许;不进入,斗争
第一章 导论



人生是永不停歇的博弈过程, 博弈意略达到合意的结果。 作为博弈者,最佳策略是最 大限度地利用游戏规则,最 大化自己的利益; 作为社会最佳策略,是通过 规则使社会整体福利增加。
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡 海萨尼(1967-1968)
博弈的表述形式
1.博弈的标准型表述 标准型表述三个要素:

参与人 每个参与人可选择的战略 支付函数

适用于3个以下参与人的静态博弈
博弈的表述形式
1.博弈的扩展型表述 标准型表述五个要素:


参与人 每个参与人选择行动的时点 每个参与人在每次行动是可选择的战略集 每个参与人在每次行动时有关对手过去行动选择的 信息 支付函数
问题:什么叫‚完全而不完美信息博弈‛?
第二章 完全信息静态博弈

一 博弈的基本概念及战略表述 二 占优战略(上策)均衡


三 重复剔除的占优均衡(严格下策反复消去法)
四 划线法
五 箭头法
六 纳什均衡
完全信息静态博弈

完全信息:每个参与人对所有其他参与人的特 征(包括战略空间、支付函数等)完全了解

第一章 导论-囚徒困境

人类自私的天性,使他们陷入‚囚徒困境‛,难以自拔。
解决囚徒困境问题的“出路”

‚解决个人理性和集体理性之间冲突的办法不是否认个人 理性,而是设计一种机制,在满足个人理性的前提下达到 集体理性‛; ‚一种制度安排,要发生效力,必须是一种纳什均衡。否 则,这种制度安排便不能成立‛。 囚徒困境的效果在不同情况下对社会而言可能是‚负面‛ 的,也可能是‚正面‛的。
第一章 导论 博弈论(game theory)

定义:研究决策主体的行为在直接相互作用时,人们 如何进行决策、以及这种决策如何达到均衡。 开始于-冯.诺曼(Von Neumann)与摩根斯坦 (Morgenstern)在1944年合作的《博弈论与经济行为》 (The Theory of Games and Economic Behaciour)
第一章 导论
1.2 博弈论
现实环境往往不能满足上述两个基本假定。不完 全竞争市场和信息不对称使得博弈论逐渐成为经济学 的基石。
第一章 导论
1.2.1 博弈论的发展历史 (1)一般认为,博弈论始于1944年冯.诺依曼(Von Neumann)和摩根斯坦恩(Morgenstern)的《博弈论 和经济行为》; (2)50年代,合作博弈发展到顶峰,代表性的研究成果 是Nash(1950)和Shapley(1953)的‚讨价还价‛模 型; (3)Nash在1950年和1951年发表的两篇文章代表着非合 作博弈的兴起。其间Tucker(1950)定义了‚囚徒困 境‛(prisoners’ dilemma); (4)泽尔腾(selten)(1965)提出了‚子博弈精炼纳 什均衡‛概念,把动态分析方法应用于博弈论中;
第一章 导论-基本概念




博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动:参与人的决策变量 战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和 行动的知识 支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合 均衡:所有参与人的最优战略的组合 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈 规则决定均衡。
相关文档
最新文档