博弈论第3次课——博弈信息
博弈论 第 三 章 完全信息动态博弈讲解
房地产开发博弈
开发
A hA(1) 不开发
h表示信息集
N hN(1)
需求大
需求小
N hN(2)
需求大
需求小
B hB(1)
开发
不开发
B hB(2)
B hB(3)
开发
不开发 开发 不开发 开发
B hB(4)
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8) (0,0) (0,1) 单 位:百万元
定 义 一 个 展 开 式 博 弈 的 子 博 弈G 由 一 个 决 策 结x 和 所 有 该 决 策 结 的 后继结T(x)( 包 括终点结0 组 成, 它 满 足 下 列 条 件:⑴x 是 一 个 单 点 信 息 结即h(x)={x};⑵对于所有的 x′∈T(x),如果x″∈h(x′),则x″∈T(x)。
(3)
N
1/3
2/3
1
Y1
z1
1
x1
w1
(2,6) (5,6)
2
2
a2 (9,0)
b2 (0,3)
a2 (9,5)
b2 (0,3)
3.3 子 博 弈 与 子 博 弈 完 美
Nash 均衡在原则上适用所有的博弈,但对于预 测 参与人的行为来说,Nash均衡可能并不是 一个 合理的预测, 如房地产博弈:
A
开发
不开 发
A
开发
不开发
B
B
B
B
开发 不开发 开发 不开发 开发 不开发 开发
不开发
有了信息集的概念, 展开式表示也可以用来表 示静态博弈, 如“囚徒的困境 ”博弈可以表 示为:
1
坦白
2
博弈与信息博弈论概论
博弈与信息博弈论概论博弈论是一门研究决策制定的数学理论,它主要关注决策者在相互关联的环境中做出最优决策的问题。
而信息博弈论则是博弈论的一个分支,它探讨了博弈双方对彼此信息的了解程度对决策结果的影响。
博弈论的起源可以追溯到20世纪早期,由经济学家冯·诺依曼和数学家默顿·默根斯特恩共同创立。
他们的研究成果奠定了博弈论的基础,为后来的研究提供了框架和方法。
博弈论的研究对象是博弈,也就是决策者之间的相互作用。
在博弈中,每个决策者都会根据自己的利益和目标做出决策,同时也会考虑其他决策者的行为和可能的反应。
博弈论的目标就是找到每个决策者的最优策略,以达到最有利的结果。
信息博弈论在博弈论的基础上引入了信息的概念。
在现实生活中,决策者通常无法获得完全准确的信息,他们只能根据已有的信息做出决策。
信息博弈论研究的是在不完全信息的情况下,决策者如何利用已有的信息做出最优决策。
信息博弈论中的一个重要概念是信息的对称性与非对称性。
在对称信息的情况下,博弈双方拥有相同的信息,他们可以相互了解对方的策略和利益。
而在非对称信息的情况下,博弈双方的信息不对称,其中一方拥有更多的信息,另一方则只能根据已有的信息做出决策。
信息的对称性与非对称性对决策结果有着重要的影响,它会改变决策者的策略选择和结果的分配。
信息博弈论中的另一个重要概念是策略与均衡。
在博弈中,每个决策者都会根据自己的目标和利益选择一个策略。
而均衡则是指所有决策者选择的策略达到一种稳定状态,任何决策者都没有动力改变自己的策略。
均衡是博弈论中的一个核心概念,它描述了博弈的稳定状态和可能的结果。
信息博弈论的研究应用非常广泛,不仅在经济学领域有着重要的应用,也在政治学、社会学、生物学等领域发挥着重要的作用。
在市场竞争中,企业根据竞争对手的行为做出决策;在政治竞选中,候选人根据选民的反应制定竞选策略;在动物社会中,个体根据其他个体的行为做出决策。
信息博弈论的研究成果为这些领域提供了理论依据,帮助决策者做出更明智和有效的决策。
信息经济学第三章博弈论
目录
• 博弈论基本概念 • 完全信息静态博弈 • 完全信息动态博弈 • 不完全信息静态博弈 • 不完全信息动态博弈 • 博弈论在信息经济学中应用
01
博弈论基本概念
博弈论定义与特点
博弈论是研究决策过程中参与者之间 相互作用和影响的理论。
博弈论的特点包括:参与者之间的相 互影响、策略的选择和收益的分配。
混合策略在静态博弈中应用
混合策略定义
在静态博弈中,参与人选择以一定的概率分布随机选择不同策略的 行为。
应用场景
当参与人无法确定对手的策略选择时,采用混合策略可以增加对手 的不确定性,从而提高自身的期望收益。
示例
在石头、剪刀、布游戏中,每个参与人随机选择出拳的策略就是一 种混合策略的应用。
信号传递机制在静态博弈中作用
如环保税、碳交易制度等。
案例:拍卖、招标等经济活动中的博弈论应用
拍卖中的博弈论
拍卖是一种典型的博弈论应用场景,通过竞价机制实现资源的有效配 置。常见的拍卖方式有英式拍卖、荷兰式拍卖、密封拍卖等。
招标中的博弈论
招标是一种采购方式,通过竞争机制引导供应商提供优质的商品和服务。招标 过程中需要考虑价格、质量、信誉等多个因素,博弈论可以帮助制定有效的招 标策略。
机制设计原理及其在信息经济学中应用
机制设计原理
01
通过设计合理的规则和制度,引导参与者的行为,实现资源的
有效配置和社会福利最大化。
信息经济学中的应用
02
在信息不对称的情况下,通过机制设计实现信息的有效传递和
资源的优化配置,如价格机制、竞争机制等。
激励机制设计
03
通过设计合理的激励机制,引导参与者的行为符合社会目标,
博弈论 第 三 章 完全信息动态博弈讲解
不坦白
坦白
不坦白
(-5,-5)
(0,-8) (-8,0)
(-1,-1)
注 意: 得 益 向 量 的 次 序 与 参 与 人 决 策 的 顺 序 一 致。
同样地,展开型博弈也可以用策略式来表示, 如
展开型博弈:
1
T
B
2
L
R
2
L
R
(2,2)
(4,0) ((1,0)
可以表示为:
T
参 与 人1
B
参 与 人2
注意:行为策略是在A(hi)上随机化,而混合策 略则是在Si( 即A(hi) 的乘积 空 间)上的随机化
定 理 (Kuhn,1953) 在完美回忆博弈中,混合 策略与行为策略是等价的。
完美回忆指没有参与人会忘记以前知道的信息。
例 下列展开型博弈不具备完美回忆:
A 2
1
B
2
L
R
L
R
1
C
D
1
CD
1
C
D
如果博弈树的所有信息集都是单结的, 则称该 博弈为完美(perfect)息 博弈。(无虚线连接), 而完全(complete)信息博弈是指得益函数和纯 策略空间均为博弈各方的共同知识。完全信息 可以是完美的也可以是不完美的。
3.2 展开型博弈的策略与均衡
一、 行 为 策 略 在策略型博弈中, 参与人的策略是进行博
定 义 一 个 展 开 式 博 弈 的 子 博 弈G 由 一 个 决 策 结x 和 所 有 该 决 策 结 的 后继结T(x)( 包 括终点结0 组 成, 它 满 足 下 列 条 件:⑴x 是 一 个 单 点 信 息 结即h(x)={x}; ⑵对于所有的 x′ ∈T(x), 如果x″ ∈h(x′), 则x″ ∈T(x) 。
博弈论与信息经济学不完全信息静态博弈
参加人i懂得自己旳类型 i i ,条件概率 pi pi (i i ) 描述 给定自己属于 i 旳情况下,参加人i有关其他参加人类型 i i旳不拟定性。我们用 G {A1,, An ;1,,n ; p1,, pn ;u1,,un} 代表这个博弈。
j
bi
aj cj
bi
aj cj
ui (vi bi ) P bi b j v j
1 2 (vi
bi ) P
bi
bj
vj
(vi
bi )
bi
aj cj
求导得:bi vi
1 2
vi
1 2
aj
由于bi vi
ci vi
ai
ci
1 2 , ai
1 2 aj
0
综上所述,bi vi
贝叶斯均衡是一组战略组合源自(a1.,a
2
.)
,使得对于每一
种
i
和每一种可能旳 ci
,战略
a
i
(.)最大化参加人
i
旳期望
效用函数
Ec
j
ui
(ai
,
a
j
ci
,
ci
)
。令
z
j
Pa j c j 1为均衡状
态下参加人 j 提供旳概率。最大化行为意味着,只有当参加
人 i 预期参加人 j 不提供时,参加人 i 才会考虑自己是否提
懂得(成本ci 是参加人 i 旳类型)。 c1和 c2 具有相同旳、独立旳定义在[c, c]
上旳分布函数,且是共同知识。
exfd经济博弈论3—完全且完美信息动态博弈
2021/2/4
1
18
二、有法律保障的开金矿博弈II的扩 展形
确实可信的威胁——通过法律武器 乙
确实可信的威胁
投资
不投资
(credible threat)
甲
(1,0)
是指,博弈的参与人通过 分
问题:乙是否该将钱投资给甲呢?
2021/2/4
1
17
一般假设博弈方都是以自身利益(得益)最大 化为目标的,即他们不考虑道德因素。在这样 的原则下,甲轮到行为时的选择必然是“不 分”。乙当然清楚甲的行为准则,因此他最终 合理的选择是“不借”。对乙来说,本博弈中 甲有一个不可信的许诺。
有不可信的许诺,使得甲、乙的合作最终成为 不可能,这样开金矿的3万元社会净利益无法 实现。
2021/2/4
1
8
3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
2021/2/4
1
9
3.2.1 相机选择和策略中的可信性问题
动态博弈仍然是具有策略和利益相互依存性的 决策问题。
静态博弈分析中针对具有策略和利益相互依存 特性决策问题的核心分析方法——纳什均衡分 析,在动态博弈分析中适用吗?
乙非常清楚在第一阶段选择不借才是保 险的。
2021/2/4
1
借
乙 不借
甲 分 (2,2)
打
(1,0) 不分
乙 不打
(-1,0) (0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
25
三、法律保障不足的开金矿博弈 III的扩展形
第3章 博弈论与信息经济学--完全信息动态博弈
二、子博弈精炼纳什均衡
第三,由于不考虑自己选择对别人选择的影响,纳 均衡允许了不可置信威胁的存在。如“市场阻挠博 弈”中,如果进入者者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润, 斗争则将预期的利润化为乌有。所以,斗争是一种 不可置信的威胁,
©&® by H. Q. Feng, CUFE 21/58
二、子博弈精炼纳什均衡
泽尔腾的“子博弈精炼纳什均衡”
一个纳什均衡称为精炼纳什均衡,当且仅当参与 人的战略在每一个子博弈中都构成纳什均衡。
就是说,组成精炼纳什均衡的战略必须在每一个 子博弈中都是最优的。
©&® by H. Q. Feng, CUFE
就是说,如果在位企业摆出一副“你进入我斗争”的 架势,那么进入企业不应该被这种威胁所吓倒。因 为它是不可置信的。但是,纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)便成为 一个纳什均衡。
©&® by H. Q. Feng, CUFE 18/58
子博弈精炼纳什均衡-不可置信威胁
美国普林斯顿大学古尔教授1997年在《经济学透视》里发表文 章,提出一个例子说明威胁的可信性问题: 两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦 的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告 状,我都把你们两个关起来,关起来比没有玩具更可怕。现 在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说: 快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告 诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而 告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你 不会告状,因此哥哥对弟弟的警告置之不理。 的确,如果弟弟是会算计自己利益的理性人,在这样的环境下, 还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可 置信的。
《博弈论与信息经济学》博弈论的基本概念 PPT
开发 (0,8)
不
(0,0) 开发 (0,1)
不
▪ (5)共同知识:每一个局中人都知道博弈的规则,(0,0并) 且这一现象是众所周
知的。
2020/2/20
13
博弈论与信息经济学
信息类型 完美 确定 对称 完全
含义 每个信息集都是单结的 自然不在任一参与人行动之后行动(是否拥有优势私人信息) 没有参与人在行动时或在终点结处有与其他参与人不同的信息 自然不首先行动,或自然的最初行动能被每个参与人观察到
▪ (2)自然:是一种虚拟参与人,它在博弈的特定时点上以特定的概率随机 选择行动。
• 例:一个房地产市场有大小两个房产开发商A和B。
B 开发
A
开发
等待
等待
开发 等待
在这个博弈中,A和B的是否 开发,开发的结局如何,与市 场的大小有密切的关系。“市 场容量”在这里就是自然,它 以某种概率分而存在。
2020/2/20
4
博弈论与信息经济学
❖ 2.行动(action)
• 在智猪博弈中,大猪可选的决策有两个(按,等),小猪也是同样的两个。
• 在攻城博弈中,我方有三个行动可供选择(a,b,c),敌方有四个行动可供选择 (A,B,C,D)。
2020/2/20
大猪/ 小猪
大按 猪等
小猪
按
等
31 7 -1
24 00
我方/
敌方
• 例如,在攻城博弈中,敌方的策略集为:{A,B,C,D}。
2020/2/20
我方/
敌方
敌方
A
B
C
D
a -,+ -,+ +,- +,-
我 方
博弈论——不完全信息静态博弈讲义
3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。
不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。
如在拍卖商品或工程招投标中。
信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。
不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。
但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。
在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。
3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。
Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。
N 首先行动,决定每个局中人的特征。
每个局中人知道自己的特征,但不知道其他局中人特征。
这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。
这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。
局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。
用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。
博弈论与信息经济学课件 (3)
假定我们原来认为他是个好人,大突然发现他干了一件好事,
我们如何看待呢?
Pr
ob{BP
GT}
q
p1/ 2 0 p1
1
第五章 不完全信息动态博弈-精 练贝叶斯纳什均衡
n 一 精练贝叶斯纳什均衡
ü 基本思路 ü 贝叶斯法则 ü 精练贝叶斯纳什均衡 ü 不完美信息博弈的精练贝叶斯均衡
n 二 信号传递博弈及其应用举例 n 三 博弈论概念简要总结
基本思路-不完全信息动态博弈
完全信息动态博弈中引入了子博弈精练纳什均衡 的概念概念剔除那些不可置信的威胁,但是不完全信 息动态博弈中,只有一个子博弈,不能将上述方法直 接用于求不完全信息动态博弈的均衡解,但可以借用 这一方法逻辑。
将每个信息集开始的博弈的剩余部分称为一个 “后续博弈”,一个“合理”的均衡应该满足如下要 求:给定每一个参与人有关其他参与人类型的后验信 念,参与人的战略组合在每一个后续博弈上构成贝叶 斯均衡。
Pr ob{GP GT} p(GT GP) p(GP) Pr ob{GT}
贝叶斯法则
Pr ob{GP GT} p(GT GP) p(GP) Pr ob{GT}
假定我们认为这个人是好人的先验概率是1/2,观测到他干了好 事之后如何修正他的先验概率依赖于他干的好事好到什么程度:
1、是一件非常好的好事,坏人绝对不可能干,则p(GT|GP)=1 p
n 问题的核心是:不同的价格如何影响进入者的后验 概率从而影响进入者的进入决策。
基本思路-不完全信息动态博弈
n 一个非单阶段最优价格会减少现期利润,但如果它能 阻止进入者进入,从而使在位者在第二阶段得到的是 垄断利润而不是库诺特均衡利润,如果垄断利润与库 诺特均衡利润的差距足够大,如果在位者有足够的信 心选择一个非单阶段最优价格可能是最优的。
北京大学博弈论课件第3章-完全信息动态博弈
和“进入”。因此,从初始节点处引出两条线段,在两条线段旁分别标识“不进 入”和“进入”。 ❖ 当潜在进入者选择结束后,达到在位者的节点。 ❖ 在位者有两个选择:“斗争”和“默许”。 ❖ 因此,从在位者的节点处引出两条线段,在两条线段旁分别标识“斗争”和“默 许”。
❖ 博弈树中每个节点都独立构成一个信息集,没有虚线连接两个或多个博弈树节点。 ❖ 求解完全且完美信息动态博弈的重要方法之一是:逆向归纳法。 ❖ 可以通过“海盗分宝博弈”这个生动有趣的故事对“逆向归纳法”进行一个直观
介绍。
一、海盗分宝博弈
❖ 1.海盗分宝博弈的规则 ❖ 五个海盗首先进行抽签,确定决策顺序。 ❖ 五个海盗按照决策顺序依次提出对 100 个金币的分配方案。 ❖ 第一个海盗提出一个分配方案,如超过半数的海盗(包括提出分配方案的海盗)
2021/8/1
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第三章 POWERPOINT TEMPLATE
❖ 在完全信息动态博弈中,博弈参与者的行动存在先后顺序。 ❖ 可以用博弈树表示完全信息动态博弈。 ❖ 可以通过逆向归纳法求解完全信息动态博弈的子博弈精炼纳什
均衡,剔除不可置信的威胁。
第一节 完全信息动态博弈概述
❖ 一、完全信息动态博弈的定义 在完全信息静态博弈中,博弈参与者同时采取行动。但在完全信息动 态博弈中,博弈参与者的行动存在先后顺序。从信息角度上,完全信息 动态博弈与完全信息静态博弈类似,博弈参与者对博弈结构、博弈顺序、 双方收益等信息都具备完全了解。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
不开
(0,0)
几个符号的意义
第i个人的信息集为Hi,其中某特定信息集 为hi,在hi的情况下会有A(hi)的行动。他的 所有信息集所对应的所有行动A(hi)的集合 为Ai,∪表示聚合。
Ai hi Hi A(hi )
Si : H i Ai
第i个人有信息H,乃有行动A 此时的战略是S(而且是纯战略, 以后用其他字母表示“不纯”战略) →maps into
为了分析方便,自然nature被当作虚拟参与 人。 自然代表决定外生随机变量的概率分布的机 制。比如房地产开发中市场需求的大小。
行动 ACTIONS OR MOVES
参与人在博弈的某个时点的决策变量。 (坦白) N个参与人的行动的有序集称为行动组合 (坦白,抵赖)。
行动的顺序
对于博弈的结果非常重要。有关静态和动态 博弈的区分就是基于行动的顺序做出的。 同样的行动集合,行动的顺序不同,每个参 与人的最有决策就不同,博弈的结果也不 同。尤其在不完全信息博弈中,后行动者 依赖观察先行动者的行动来获取信息。
博弈的分类及对应的均衡
静态 完全 信息 完全信息静态博弈; 纳什均衡; Nash(1950) 不完全信息静态博弈; 贝叶斯纳什均衡; 海萨尼(1967-1968) 动态 完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾(1965) 不完全信息动态博弈, 精炼贝叶斯纳什均衡; 泽尔腾(1975) Kreps,Wilson(1982), Fudenberg,Tirole(199 1)
顺序和信息
博弈论非常强调时间和信息的重要性,认为时 间和信息是影响博弈均衡的主要因素。在博弈过 程中,参与者之间的信息传递决定了其行动空间 和最优战略的选择;同时,博弈过程中始终存在 一个先后问题 Sequence order 参与人的行动次序对博弈最后的均衡有直接的 影响。
分类
博弈的划分可以从参与人行动的次序 和参与人对其它参与人的特征、战略空间 和支付的知识、信息,是否了解两个角度 进行。把两个角度结合就得到了4种博弈: 完全信息静态博弈,完全信息动态博弈, 不完全信息静态博弈,不完全信息动态博 弈.
均衡equilibrium
指所有参与人的最优战略的组合。
博弈分类和主要思想
博弈论根据其所采用的假设不同而分为合作博弈理论 和非合作博弈理论。两者的区别在于参与人在博弈过程
中是否能够达成一个具有约束力的协议。倘若不能,则
称非合作博弈 Not-cooperative Game 。
合作博弈强调的是集体主义,团体理性 Collective rationality
战略strategies
参与人在给定信息集的情况下的行动规则, 它规定参与人在什么时候选择什么行动。 战略与行动:战略是行动的规则而不是行动 本身。 在静态博弈中,战略和行动是相同的。 战略必须是完备的,要给出参与人在每一种 可想象得到的情况下的行动选择。
支付payoff(效用utility)
在一个特定的战略组合下参与人得到的 确定效用水平,或是指参与人得到的期望 效用水平。
信息 information
参与人有关博弈的知识,特别是有关自然的 选择,其他参与人的特征和行动的知识。 完美信息perfect information:指一个参与人 对其他参与人的行动选择有准确的理解, 即每个信息集只包含一个值。
共同知识common knowledge
所有参与人知道每一步的信息集。
(-3,-3) (1,0) (0,1) (0,0)
A
效率、公平、公正
非合作博弈
非合作博弈则主要研究人们在利益相互影响 的局势中如何选择策略使得自己的收益最大,强 调个人理性、个人最优决策,其结果是有时有效 率,有时则不然。目前经济学家谈到博弈论主要 指的是非合作博弈,也就是各方在给定的约束条 件下如何追求各自利益最大化,最后达到力量均 衡。
例子
比如两家企业A、B合作建设一条VCD的生 产线,协议由A方提供生产VCD的技术,B方则 提供厂房和设备。在对技术和设备进行资产评估 时就形成非合作博弈,因为每一方都试图最大化 己方的评估值,这时B方如果能够获得A方关于 技术的真实估价或参考报价这类竞争情报,则可 以使自己在评估中获得优势;同理,A方也是一 样。至于自己的资产评估是否会影响合作企业的 总体运行效率这样的"集体利益",则不会非常重 视。这就是非合作博弈,参与人在选择自己的行 动时,优先考虑的是如何维护自己的利益。
博弈论与信息经济学
博弈论——博弈信息
郝 海 天津工程师范学院经济管理
博弈论的要素
博弈论的提法可能太过于学术化,容易让人们 退避三舍。其实它有一个非常通俗的名字--游戏理 论(博弈论的英文名字叫做"Game Theor y",如果直译,就是"游戏理论")。博弈论在我国 还有一个名字,叫对策论。这些名字都很好理解, 博弈字面意思就是赌博、下棋,赌博和下棋当然是 游戏了,赌博和下棋的时候常常要千方百计地应付 对手,自然是要讲究对策了。
(4,4) (Biblioteka ,4)(8,0) (-3,-3) (8,0) (-3,-3)
(1,0) (0,8) (1,0) (0,8)
(0,0) (0,1) (0,0) (0,1)
(0,0) (0,0)
逆向归纳法p157
房地产开发:需求小
逆向归纳法就是从动态博弈的最 开 不开 后一个阶段或最后一个子博弈开始, B B 逐步向前倒推以求解动态博弈的方 开 不开 开 不开 法。
不完 全信 息
博弈的扩展式表述
扩展式表述所“扩展”的主要是参与人的战 略空间 战略式表述简单地给出参与人有些什么战略 可以选择,而扩展式表述要给出每个战略 的动态描述:谁在什么时候行动,每次行 动时有些什么具体行动方案可供选择,以 及知道些什么 此时的战略:如果你这样,我将怎样
博弈的扩展式表述
要素:
开发
不开发 开
不开 开
不开 开
(0,0) (0,1)
不开
(0,0)
(1,0) (0,8)
博弈树:不允许的情形
博弈树的结构
结(nodes): 枝(branches): 包括决策结和终点结。决策结是参 信息集(information sets): 与人采取行动的时点;终点结是博 枝是从一个决策结到它的直接后续 一个信息集是决策结集合的一个子集(信息集 弈行动路径的终点。 结的连线,每一个枝代表参与人的 是由决策结构成的集合),该子集包括所有满 足下列条件的决策结: 一个行动选择。 (1)每一个决策结都是同一个参与人的决策结 (2)该参与人知道博弈进入该集合的某个决策 结,但不知道自己究竟处于哪一个决策结。
参与人 players
一个博弈中的决策主体,他的目的是通过选 择行动(或战略)以最大化自己的支付 (效用水平)。参与人可能是自然人,也 可能是团体,如企业,国家等。 重要的是:每个参与人必须有可供选择的行 动和一个很好定义的偏好函数。不做决策 的被动主体只能被当作环境参数。
虚拟参与人pseudo-player
博弈的扩展式表述
如果博弈树的所有信息集都是单结的,则称为 “完美信息博弈”,没有任何两个决策结是 用虚线连起来的 自然信息集总是假设为单结的 博弈树上是否出现连接不同决策结的虚线取决 于如何划决策结的顺序p145 一个参与人在决策之前所适当的事情必须出现 在该参与人的决策结之前 有了信息集的概念,扩展式表述也可用来表述 静态博弈
参见谢识予p128
开金矿I——无法律的博弈
乙
借
甲
不借
(1,0)
分
(2,2)
不分
(0,4)
开金矿II——有法律保障的博弈
乙 借 甲 分 (2,2) 打 (1,0) 不分 不借
(1,0)
不打 (0,4)
子博弈
开发 不开发 子博弈由一个决策结x和所有该决策结 开发 不开发 开发 不开发 条件1说的是一个子博弈必需从一个单结信息集开 N1 N2 的后续结T(x)(包括终点结)组成,它满足 条件2说的是,子博弈的信息集和支付 N1 N2 始。即:(1)当且仅当决策者在原博弈中确切地知 N1 N2 大 小 大 小 下列条件: 向量都直接继承自原博弈,并不会发生 大 小 大 小 道博弈进入一个特定的决策结时,该决策结才能 大 小 大 小 B1 B3 B4 作为一个子博弈的开始。(2)如果一个信息集包含 任何变化。 B2 B2 B1 B3 B4 (1)x是一个单结信息集; B1 B2 B3 B4 两个以上决策结,没有任何一个决策结可以作为 开发 不开发 开 不开 开 不开 开 不开 开发 不开发 开 不开 开 不开 开 不开 (2)子博弈不改变原博弈的信息集和支 子博弈的初始结。开 开发 不开发 不开 开 不开 开 不开 这意味着子博弈不能分割原博弈的信息 付向量 集。 (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) (4,4) A A A
完美信息博弈&不完美信息博弈
一个信息集可能包含多个决策结,也可 能只包含一个决策结。只包含一个决策结 的信息集称为单结信息集; 如果博弈树的所有信息集都是单结的, 该博弈称为完美信息博弈(Game of perfect information);否则就是不完美信 息博弈。
可信性:开金矿博弈
甲在开采一价值4万元的金矿时缺1万元 资金,而乙正好有1万元资金可以投资。甲 希望乙能将1万元资金借给自己用于开矿, 并许诺在采到金子后与乙对半分成,乙是 否该将钱借给甲呢?
参与人集合 参与人的行动顺序 参与人的行动空间 参与人的信息集 参与人的支付函数 外生事件(即“自然”的选择)的概率分布
博弈的扩展式表述
博弈树的基本元素:
结、枝、信息集 需要注意的概念:前列集、后续集;初始结、 决策结、终点结;直接前列结、直接后续结。 以及相应的符号 信息集:某个参与人都知道些什么 信息集是用来标注某个人知道些什么信息的, 不同的标注表示这个人知道不同的信息