经济博弈论第六章不完全信息静态博弈共39页

合集下载

经济博弈论6

经济博弈论6

6.1.2 不完美信息动态博弈的表示
1

0 1



1 不卖

1
不卖 (0,0) (0,0)
2 (-7000) (-10000) (-16000) (-10000)
买 (2,1) 不买 (0,0) 买 不买 (-1,0)
运输路线宽展形
(1,-1)
二手车交易扩展形
6.1.3 不完美信息动态博弈的子博弈
6.3.4 模型的混合策略完美贝叶斯均衡
卖方在车好时选卖,车差时以0.5概率随机选择 卖或不卖 买方以0.5概率随机选择买或不买 买方的判断为
2 1 p(g | s) = , p (b | s ) = 3 3
市场类型归纳
Pg (V P ) + Pb (W P )
市场 部分 成功 市场 完全 成功
0
市场接 近失败 或完全 失败
P
市场 完全 成功
C
单一价格二手车交易的解
6.4 双价二手车交易
6.4.1
双价二手车交易和均衡

完美贝叶斯均衡
1

卖方在车好时要高价,车差时要低价 1 买方买下卖方出售车 高价 买方的判断是
低价 高价
1
低价
p ( g | h) = 1, p (b | h) = 0 p ( g | l ) = 0, p (b | l ) = 1
因为原博弈本身不会成为原博 弈的后续阶段,因此子博弈不 能从原博弈的第一个节点开始, 即原博弈不是自己的子博弈 包含所有在初始节点和终点, 但不包含不跟在此初始节点之 后的节点 不分割任何的信息集.
Ll
1
R L
R
2
L

经济博弈论6 不完全信息静态博弈

经济博弈论6 不完全信息静态博弈

Si* (ti )所选择的行动ai都能满足
不完全信息静态博弈 -贝叶斯纳什均衡
在不完全信息静态博弈中,所有参与人同时行动,其战略空间 等于行动空间,但是参与人i的行动空间可能依赖于其 类型,也就是行动空间是类型依存的。类似的,其支 付函数也是类型依存的。如企业能选择什么产量依赖于它的成 本函数。
6.1 6.2 6.3 6.4 6.5
不完全信息博弈与海萨尼转换 混合策略和不完全信息 暗标拍卖 双方报价拍卖 拍卖规则设计问题和揭示原理
6.1 不完全信息博弈与海萨尼转换
6.1.1 6.1.2 6.1.3 6.1.4 不完全信息博弈 静态贝叶斯博弈的例子与表示 海萨尼转换 贝叶斯纳什均衡
6.1.1 不完全信息博弈-无法避免的不确定性
司马懿 进攻 撤退 不被擒,?
弃城
诸葛亮 守城
被擒,?
司马懿关于自 己策略的支付的 信息是不完全的。
被擒,?
不被擒,?
司马懿:兵多将广,但不知道自己和对方在不同行动策略下的支付;
诸葛亮:处于劣势,但知道博弈的结构,比对方掌握更多的信息。
计策:使用各种手段迷惑司马懿,为的是不让对方知道其策略的结果(支 付)。迫使其认为,撤退比进攻好,降低其进攻的预期收益。 如用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主 观概率,使司马懿认为进攻的期望收益小于撤退的期望收益。
贝叶斯纳什均衡定义
在静态贝叶斯博弈 G { A1 ,, An ; T1 ,, Tn ; p1 ,, pn ; u1 ,, un } 中,如果对任意博弈方i和他的每一种可能的类型ti Ti,
* max {ui [ S1* (t1 ), , Si*1 ti 1 , ai , Si*1 (ti 1 ), , S n (t n ),t i ] p(t i | ti )} ai Ai t i * 则称策略组合S * ( S1* ,, S n )为G的一个(纯策略)贝叶斯纳什均衡

不完全信息静态博弈

不完全信息静态博弈

练习
自然”以均等的概率决定得益是下述得益矩阵1的 (1)若“自然”以均等的概率决定得益是下述得益矩阵 的 ) 情况还是得益矩阵2的情况 并让博弈方1知道而不让博弈方 的情况, 情况还是得益矩阵 的情况,并让博弈方 知道而不让博弈方 2知道;( )博弈方 在T和B中选择,同时博弈方 在L和R 知道;( 中选择, 知道;(2)博弈方1在 和 中选择 同时博弈方2在 和 中进行选择。找出贝叶斯纳什均衡。 中进行选择。找出贝叶斯纳什均衡。 L T B 1,1 0,0 1 R 0,0 0,0 T B L 0,0 0,0 2 R 0,0 2,2
如果在位者是高成本的,则均衡是进入者进入, 如果在位者是高成本的,则均衡是进入者进入,在 位者默许;如果在位者是低成本的, 位者默许;如果在位者是低成本的,均衡是进入者 不进入,在位者打击。 不进入,在位者打击。 因此,如果在完全信息情况下, 因此,如果在完全信息情况下,知道在位者是高成 则进入者进入;知道在位者是低成本, 本,则进入者进入;知道在位者是低成本,则进入 者不进入。 者不进入。 但现在进入者并不知道在位者究竟是高成本还是低 成本,因此很难进行选择。 成本,因此很难进行选择。
暗标拍卖
拍卖和招投标是经济活动中普遍采用的重要交易工具, 拍卖和招投标是经济活动中普遍采用的重要交易工具,有许 多不同的方式。暗标拍卖是典型的不完全信息静态博弈。 多不同的方式。暗标拍卖是典型的不完全信息静态博弈。 暗标拍卖的基本特征:密封递交标书;统一时间公证开标; 暗标拍卖的基本特征:密封递交标书;统一时间公证开标; 标价最高者以所报标价中标。 标价最高者以所报标价中标。 这种博弈的博弈方就是所有投标人; 这种博弈的博弈方就是所有投标人;各个博弈方的策略就是 他们各自提出的标价;中标博弈方的得益是其对拍卖标的的 他们各自提出的标价; 估价与成交价格之差,未中标博弈方的得益为0.由于各博弈 估价与成交价格之差,未中标博弈方的得益为 由于各博弈 方的标书是密封递交和同时开标的, 方的标书是密封递交和同时开标的,各博弈方在选择自己的 策略之前都无法知道其他博弈方的策略, 策略之前都无法知道其他博弈方的策略,而且这是一个一次 性选择问题,所以是静态博弈问题。 性选择问题,所以是静态博弈问题。

博弈论与信息经济学GameTheoryandInformationEconomics课件

博弈论与信息经济学GameTheoryandInformationEconomics课件
经济学家提炼出信息不对称的概念,挖 出一批“柠檬市场”,并解剖的是一大 贡献;
而提出改造世界的方案,设计出各种在 信息不对称情况下保障市场有效运转的 机制是另一大贡献,甚至认为是更大的 贡献。
一 博弈论与信息经济学
博弈论
给定信息结构,求均 衡结果 均衡理论 方法论导向 实证的
信息经济学
给定信息结构,求契 约安排 契约设计理论 问题导向 规范的
模型
隐藏行动的道德 风险
隐藏信息的道德 风险
逆向选择风险
信号传递和信息 甄别
委托人
地主 股东 住户 公民 社会 雇主 股东 原告/被告 雇主 保险公司
雇主 买方投资
代理人
佃农 经理 房东 政府官员 犯罪 雇员 经理 代理律师 雇员 投保人
工人 卖方
行动、类型或信号
耕作努力 工作努力 房屋修缮 廉洁或贪污 偷盗的次数 任务的难易/工作努力 市场需求/投资决策 赢的概率/办案努力 工作技能 感染爱滋病病毒
险模型

非对称发生在事前(签约前),逆向选择模型;

非对称发生在事后(签约后),道德风险模型。
研究不可观测行动的模型称为隐藏行动模型;
研究不可观测信息的模型称为隐藏信息(或知识)模型
隐藏行动的道德风险
签约时信息是对称的

接受
选择行动
提供合同
努力或不 自然
努力
代理人

委托人
代理人 不接受
某些可 观测的 结果
作为博弈者,最佳策略是最大限度地利 用游戏规则,最大化自己的利益;
作为社会最佳策略,是通过规则使社会 整体福利增加。
第六章 委托-代理理论(I)
一 博弈论与信息经济学 二 信息经济学的分类 三 委托-代理理论的分析思路和框架 四 对称信息下的最优合同

博弈论_不完全信息静态博弈

博弈论_不完全信息静态博弈

贝叶斯纳什均衡的存在性
贝叶斯纳什均衡的存在性定理 定理3.1.2,见书上第62页,不讲定理的证明 它与第24页的定理2.2.3的比较。定理3.1.2所
要用到的前提条件更强,其原因在于: 在贝叶斯博弈中,局中人i的收益是纯策略下
的期望收益。或,局中人i的收益函数ui(s-i, si, ti)可以随着类型的变化而变化;当ui是si的凹函 数时,其凸组合“∑pi(t-i|ti)×ui(s-i(t-i), si, ti), t-i∈T-I”也是si的凹函数;若拟凹则不成立
义3.1.2做比较 此定义是对纯策略下贝叶斯纳什均衡定义的一
个直接扩展,其中E(ui)是局中人i在混合策略 组合下,对其收益函数ui的数学期望 定理3.1.3:混合策略组合是贝叶斯纳什均衡 的充分必要条件 定理3.1.4:贝叶斯纳什均衡的存在性定理
求解行业博弈的贝叶斯纳什均衡
条件概率 标记混合策略的符号 标记期望收益的符号 计算不同类型下的期望收益 书上的方法:由混合策略下贝叶斯纳什均衡的
对局中人2的计算
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 , -4/3 , 0 建厂 , -4/3 , 0
不建厂 , 1 , 0 不建厂 , 1 , 0
合成后的支付矩阵
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 0, -4/3 2, 0 建厂 1.5, -4/3 3.5, 0
混合策略
在贝叶斯博弈G=[N, {Ti}, P, {Si(ti)}, {ui}]中,局中人i 在类型ti∈Ti下,为每一个纯策略以概率进行选择,则 xi(ti) =(x1(i)(ti), x2(i)(ti), ···, xm_i(i)(ti))称为局中人i在类型 ti下的一个混合策略。有时简写为xi。

完全信息静态博弈论模型

完全信息静态博弈论模型

完全信息静态博弈论模型引言:博弈论是研究决策制定者在不同利益冲突场景下的行为和策略选择的数学模型。

在博弈论中,静态博弈是指参与者在同一时间点做出决策的情况。

完全信息表示每个参与者对于其他参与者的行为和策略选择都有完全的了解。

本文将介绍完全信息静态博弈论模型的基本概念、解决方法以及应用领域。

一、基本概念1.1 参与者完全信息静态博弈中,有两个或多个参与者,每个参与者可以是个体、团体或国家等。

参与者通过制定决策来追求自身的利益。

1.2 策略每个参与者在博弈中可以选择的行动方案称为策略。

策略可以是纯策略,即只选择一个确定的行动;也可以是混合策略,即以一定概率选择不同的行动。

1.3 支付函数支付函数是衡量参与者在不同策略组合下所获得效用或利益的函数。

支付函数可以表示为参与者的收益、成本或效用。

1.4 纳什均衡纳什均衡是指在博弈中,每个参与者选择的策略组合使得没有参与者有动机改变自己的策略。

换言之,每个参与者都在给定其他参与者的策略下做出最优的决策。

二、解决方法2.1 支付矩阵为了描述参与者之间的策略选择和支付函数之间的关系,可以使用支付矩阵。

支付矩阵是一个二维矩阵,行表示一个参与者的策略选择,列表示其他参与者的策略选择,每个元素表示对应策略组合下的支付函数。

2.2 最优响应最优响应是指在其他参与者的策略下,参与者能够选择的最优策略。

通过计算每个参与者的最优响应,可以找到纳什均衡。

2.3 前瞻性在完全信息静态博弈中,参与者可以通过推断其他参与者的策略和支付函数来做出决策。

前瞻性是指参与者能够预测其他参与者的行为并做出相应的反应。

三、应用领域完全信息静态博弈论模型广泛应用于经济学、政治学、生物学等领域。

3.1 经济学博弈论在经济学中有广泛应用,如市场竞争、定价策略、拍卖等。

完全信息静态博弈模型可以帮助分析参与者的决策行为,预测市场的走势和结果。

3.2 政治学在政治学中,博弈论可以用于分析选举、政策制定和国际关系等问题。

经济博弈论ppt课件

经济博弈论ppt课件
• 例二:黔馿之技
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling

经济博弈论

经济博弈论
3
非合作博弈强调个体理性
(individual rationality),就是
从个体的角度考虑策略选择,使得
个体收益最大。所以非合作博弈研
究的是参与者在利益相互影响的情
况下如何选策略使自己的收益最大,
即策略选择问题。
约翰·纳什 (J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。
1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体(可以是个人,也可以是团体);
2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策;
3、策略是指参与人选择行动的规则,即在博弈 进程中,什么情况下选择什么行动的预先安排;
第一节 引言
1
博弈理论简介
博弈论(Game Theory):研究具有斗争或竞争性质现象的理 论和方法。
三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集
分类: 合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈;
研究博弈论的意义:理解人类的经济行为;理解社会和生态 物种系统中的合作行为以及自自组织斑图。
13
从游戏到博弈
游戏的特点:下棋,打牌,赌博,田径, 球类等等,共同的特点是策略
策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略和 利益的依存性
14
想一想
假如你正跟恋人用手机通电话,突 然信号断了。这时,你会立即拨电话 过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,取 决于你的恋人是否会拨过来。如果你 们其中一方要拨,那么另一方最好是 等待;如果一方等待,那么另一方就 最好是拨过去。因为如果双方都拨, 那么就会出现线路忙;如果双方都等 待,那么时间就会在等待中流逝。

复旦大学经济博弈论经济博弈论6

复旦大学经济博弈论经济博弈论6

2020/4/4
课件
4
6.1.2 不完美信息动态博弈的表示
多节点信息集扩展形表示
0 1
(-7000) (-10000) (-16000) (-10000)
好1差
1 不卖 1


不卖
2
(0,0) (0,0)
买 不买 买 不买
运输路线扩展形
(2,1) (0,0) (1,-1) (-1,0)
二手车交易扩展形
课件
6
6.2 完美贝叶斯均衡
6.2.1 完美贝叶斯均衡定义 6.2.2 均衡要求的初步解释 6.2.3 关于判断形成的进一步解释
2020/4/4
课件
7
6.2.1 完美贝叶斯均衡定义
在不完美信息动态博弈中纳什均衡和子博弈完 美纳什均衡都不能解决问题,需要引进新的均 衡概念
纳什均衡和子博弈完美纳什均衡分析方法,反 应函数和逆推归纳法等同样也要改进、变化
2020/4/4

课件
8
一个策略组合和相应的判断满足下列4个要求, 称为一个“完美贝叶斯均衡”:
要求1:在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到 该信息集中每个节点可能性的“判断”。对非单节点信息集,一个“判 断”就是博弈达到该信息集中各个节点可能性的概率分布,对单节点信 息集,则可理解为“判断达到该节点的概率为1”
p(s | g) 1 p(s b) 0.5
p(g) p(b) 0.5
p(g | s) p(g) p(s | g)
p(g) p(s | g)
0.51
2
p(s)
p(g) p(s | g) p(b) p(s | b) 0.51 0.5 0.5 3

经济博弈论6 不完全信息静态博弈

经济博弈论6 不完全信息静态博弈
密封递交标书 统一时间公正开标 标价最高者以所报标价中标 中标博弈方的得益不仅取决于标价,还取决于
他对拍卖标的物的带有很大主观性的估计 每个博弈方的估价通常是自己的私人信息
二、不完全信息的古诺模型
不完全信息表现在:
厂商2的成本有两种可能,是 厂商2的私人信息,厂商1只知道可 能性(概率分布),因此厂商1对厂 商2的得益不完全清楚。
不完全信息博弈
求爱博弈: 品德优良者求爱 求爱者
求爱 不求爱
被求爱者对于
求爱者的品德的 信息是不完全的。
你 接受 不接受
100,100 -50,0
0,0
0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱
你 接受 不接受
求爱博弈:
求爱 100,-100 -50,0
品德恶劣者求爱 求爱者 不求爱 0,0
P(Q) a Q
Q q1 q2 C1 c1q1
C2 cH q2 C2 cLq2 1
不完全信息古诺模型直接分析
max [( a q2

q1*
q2
)
cH
]q2或者
max q2
[(a
q1*
q2
)
cL
]q2
max{ q1
[a
q1
q2*
(cH
)
c1 ]q1
(1
)[a
q1
q2*
(cL
)
c1 ]q1}
完全信息静态博弈的一般表达式:
司马懿说:“亮平生谨慎,不曾弄险,今大 开城门,必有埋伏,我兵若进,必中计也。”
孔明见魏军退去,抚掌而笑,众官无不骇然。 诸葛亮说,司马懿“料吾生平谨慎,必不弄险, 疑有伏兵,所以退去。吾非行险,盖因不得已而 用之,弃城而去,必为之所擒。”

第六章非完全信息静态博弈博弈论张醒洲.ppt

第六章非完全信息静态博弈博弈论张醒洲.ppt

2021/3/29
张醒洲,大连
9
支付函数 vs. 参与人类型
在这样定义参与人的类型之后,说参与人 i知道自己的收益函数也就 等同于说参与人 i知道自己的类型,类似地,说参与人 i可能不确定其他 参与人的收益函数,也就等同于说参与人 i不能确定其他参与人的类型, 我们用 t-i={t1, …,ti-1,ti+1, …,tn}表示,并用 T-i表示 t-i所有可能的值的集合, 用概率 pi( t-i| ti)表示参与人在知道自己的类型是 ti的前提下,对其他参与 人类型(即 t-i)的信念(belief)。
非完全信息醒洲,大连
1
概要:静态贝叶斯博弈和贝叶斯纳什均衡
• 理论: 贝叶斯博弈
– 非对称信息下的古诺竞争
– 静态贝叶斯博弈的标准式表述 – 贝叶斯纳什均衡的定义
• 应用
– 双向拍卖
2021/3/29
张醒洲,大连
2
非对称信息下的古诺竞争
考虑如下的古诺双头模型
vs<3/4
p
vb>1/4
2021/3/29
张醒洲,大连
24
双向拍卖: 线性贝叶斯纳什均衡-5
• 双向拍卖中当且仅当pb≥ps时,交易才会发生。
• 在线性贝叶斯纳什均衡中,当且仅当vb﹥vs+1/4时,交
易才会发生,如图3.2.3所示。
图 3.2.3
2021/3/29
张醒洲,大连
25
Assignment
➢ 市场反需求函数由P(Q)=a-Q给出,这里Q=q1+q2为市场中的总产
量。企业1的成本函数为C1(q1)=cq1,不过企业2的成本函数以
的概率为 C2(q2)=cHq2 ,以 1 的概率为C2(q2)=cLq2,这里cL< cH。

第六章-不完全信息静态博弈

第六章-不完全信息静态博弈

3)博弈方i的得益
ui
ui (b1, b2 , v1, v2 )
(vivi bib)i,/ 2,当当bi bi
bj
bj
0,当bi bj
❖ 要找贝叶斯纳什均衡,必须先找两博弈方的策略空间。
他们的策略是根据类型决定行为的函数关系。即是 bi (vi )
如果[b1(v1),b2 (v2 )] 是贝叶斯纳什均衡,那么bi (vi ) 是对方的最
❖ 定义中将信息不了解转为博弈方类型的不了解。 ❖ 例如:不完全信息的古诺模型中
A1 {q1}, A2 {q2}; T1 {c1},T2 {cL , cH } u1 {q1, q2 , t1}, u2 {q1, q2 , t2}
G {A1, A2;T1,T2;u1, u2}
❖ 目前,还不能进行分析。
空间,即有 ti Ti ,用 ui ui (a1, a2 , , an , ti )
这个得益函数含有一个反应类型变量 ti ,其取值 只是博弈方 i 自己知道的而其它博弈方并不清楚, 从而反应了不完全信息特征。
❖ 于是:静态贝叶斯博弈的一般表示为:
G {A1, , An;T1, ,Tn;u1, , un}
❖ 一级密封价格拍卖(first price sealed bid)
❖ 二级密封价格拍卖(second price sealed bid)
❖ 英式拍卖(English auctions)
❖ 荷兰式拍卖(Dutch auctions)
❖ 英式拍卖最为常见,也被称为一级公开叫价(first price open cry)拍卖,许多物品都采用此种方式竞标。在英式拍 卖中,参加竞标者可以不断地开出更高的价格,当没有其他 对手愿意再出更高的价格时,最后出价的那个竞标者就得到 竞标物。

博弈论与信息经济学不完全信息静态博弈

博弈论与信息经济学不完全信息静态博弈
A11,..., An n ,和类型依存支付函数u1(a1,, an ;1),...,un (a1,, an ;n )
参加人i懂得自己旳类型 i i ,条件概率 pi pi (i i ) 描述 给定自己属于 i 旳情况下,参加人i有关其他参加人类型 i i旳不拟定性。我们用 G {A1,, An ;1,,n ; p1,, pn ;u1,,un} 代表这个博弈。
j
bi
aj cj
bi
aj cj
ui (vi bi ) P bi b j v j
1 2 (vi
bi ) P
bi
bj
vj
(vi
bi )
bi
aj cj
求导得:bi vi
1 2
vi
1 2
aj
由于bi vi
ci vi
ai
ci
1 2 , ai
1 2 aj
0
综上所述,bi vi
贝叶斯均衡是一组战略组合源自(a1.,a
2
.)
,使得对于每一

i
和每一种可能旳 ci
,战略
a
i
(.)最大化参加人
i
旳期望
效用函数
Ec
j
ui
(ai
,
a
j
ci
,
ci
)
。令
z
j
Pa j c j 1为均衡状
态下参加人 j 提供旳概率。最大化行为意味着,只有当参加
人 i 预期参加人 j 不提供时,参加人 i 才会考虑自己是否提
懂得(成本ci 是参加人 i 旳类型)。 c1和 c2 具有相同旳、独立旳定义在[c, c]
上旳分布函数,且是共同知识。

讲义6-不完全信息动态博弈.讲义

讲义6-不完全信息动态博弈.讲义
管理博弈论
(Management Game Theory)
第六讲 不完全信息动态博弈 主讲人:张成科 博士 广东工业大学经济与贸易学院
zhangck@
第五章 不完全信息动态博弈精练贝叶斯纳什均衡


一 精练贝叶斯纳什均衡
基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡
基本思路图示
在不完全信息动态博弈中,由于信息不完全,故子博弈的概念不能精确细致 地描述动态博弈中的各个阶段,从而就不能剔除那些包含“不合理信念”的 Nash均衡。但是其推理逻辑可用,即“新均衡”不仅在整个博弈上构成Bayes 均衡,而且从每一个信息集开始的“后续博弈”上也构成Bayes均衡。但还不 能剔除“总是认为先验概率不变”这样的不合理行为。而实际上,参与人都 是依据他们的观测信息对自己的先验概率进行修正的-------这需要用精练Bayes 均衡。 给定别人的战略,自己的战略是最优的,即没人愿独自偏离 Nash均衡 在完全信息动态博弈中无法剔除不可置信威胁战略 子博弈精练Nash均衡 不仅是整个博弈的Nash均衡,而且是每个子博弈的 Nash均衡



修正之后的判断称为“后验概率”
贝叶斯法则就是人们根据新的信息从先验概率 得到后验概率的基本方法。
贝叶斯法则


以不完全信息博弈为例说明贝叶斯法则:假定 参与人的类型是独立分布的,参与人i有K个类 型,有H个可能的行动,θk和ah分别代表一个特 定的类型和一个特定的行动。 如果我们观察到i选择了ah,我们要问i属于θk的 后验概率是多少?


二 信号传递博弈及其应用举例
三 博弈论概念简要总结
不完全信息动态博弈引例

博弈论——不完全信息静态博弈讲义

博弈论——不完全信息静态博弈讲义

3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。

不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。

如在拍卖商品或工程招投标中。

信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。

不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。

但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。

在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。

3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。

Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。

N 首先行动,决定每个局中人的特征。

每个局中人知道自己的特征,但不知道其他局中人特征。

这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。

这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。

局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。

用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

11
27.04.2020
6.1.3 海萨尼转换
基本思路:将静态博弈转化为动态博弈 (1)假设有一个名为“自然”的博弈方0,该博弈
方的作用是先为其他每个博弈方抽取他们的类型, 抽取的这些类型构成类型向量
t=(t1,…,tn),其中t i T i ,i=1,…,n。
(2)“自然”让每个博弈方知道到自己的类型, 但却不让其他博弈方知道。
10
27.04.2020
6.1.2 静态贝叶斯博弈的一般表示
静态贝叶斯博弈的一般表达式为: G={A1,…,An ;T1,…,Tn;u1,…,un}
其中Ai为博弈方i的行为空间(策略空间), Ti是博弈方i的类型空间,博弈方i的得益 ui=ui(a1,…,an,ti)为策略组合(a1,…,an ) 和类型ti的函数。
q1*a2C1C3 H(1)CL)
6
27.04.2020
6.1.1 不完全信息的古诺模型
与完全信息古诺模型比较 完全信息古诺模型中的的产量
q1*
a2C1 3
C2
q2*
a2C2 3
C1
CH C2 q2*(CH)q2*
CL C2 q2*(CL)q2*
ቤተ መጻሕፍቲ ባይዱ
7
27.04.2020
6.1.2 静态贝叶斯博弈的一般表示
厂商1只知道有两种可能性,一种是C2= C2(q2) = CH q2概率为θ另一种是C2= C2(q2)= C Lq2, 概率为1-θ,而CH>CL,也即边际成本有高、低两 种可能。
3
27.04.2020
6.1.1 不完全信息的古诺模型
厂商2在边际成本是较高的CH时会选择较低的产 量,而在边际成本为较低的CL时会选择较高的产 量。
6.1.1 不完全信息的古诺模型
q2*(CL)满足: q1*满足:
m qa2x[(aq1*q2)CL]q2
m q a 1 x { [ a q 1 q 2 * ( C H ) C 1 ] q 1 ( 1 ) [ a q 1 q 2 * ( C L ) C 1 ] q 1 }
即厂商2是在不同边际成本下分别根据q1*求出使自 己取得最大得益的产量。而厂商1则根据q2*(CH) 和q2*(CL)及它们出现的概率求出使自己获得最 大期望得益的产量。
6.1 静态贝叶斯博弈和贝叶斯纳什均衡
不完全信息的古诺模型 静态贝叶斯博弈的一般表示 海萨尼转换 贝叶斯纳什均衡
1
27.04.2020
6.1.1 不完全信息的古诺模型
定义:假定在古诺模型中,各个厂商对彼此的 得益不是共识的,则该模型称为“不完全信息 古诺模型”。由于模型中的两个厂商在信息方 面是不平等,不对称的,因此有时也称其为 “不对称信息的古诺模型”。
的集合),则完全信息静态博弈可表达为
G A 1 ,L,A n;u 1 ,K ,u n其中 u
知道的,即当 a i 确定后,u
且是公开的信息和知识。
i
i
为各博弈方都相互 就随之确定了,并
8
27.04.2020
6.1.2 静态贝叶斯博弈的一般表示
在静态贝叶斯博弈中,关于得益的信息是不公开 的,如何表示这种特征呢? 将博弈中某些博弈方对其他博弈方得益的不 了解转化成对这些博弈方“类型”的不了解,是 一种“追根溯源”的方法。这里的类型是相应的 博弈方自己清楚而他人无法肯定的私人内部信息、 有关情况或数据等。
5
27.04.2020
6.1.1 不完全信息的古诺模型
上述三个最大值问题的一阶条件为:
q2*(CH)aq12*CH
q2*(CL)aq12*CL
q 1 * 1 2 { [ a q 2 * ( C H ) C 1 ] ( 1 ) [ a q 2 * ( C H ) C 1 ] }
解由这三个方程构成的方程组得: q 2 *(C H )a 2 C 3 H C 1 1 6(C H C L ) q2*(C L)a2 C 3 LC 16(C HC L)
13
27.04.2020
6.1.3 海萨尼转换
(1)-(4)所描述的是一个完全但不完美信 息的有同时选择的动态博弈。但是,容易看出 (1)-(4)表达的博弈问题与一般不完全信 息静态博弈G={A1,…,An ;T1,…,Tn;u1,…,un} 所表达的博弈问题是完全一样的。也就是说通 过(1)和(2)引进的“自然”这个假设的博 弈方0的行动(随机选择n个博弈方的类型), 把一个不完全信息静态博弈(即静态贝叶斯博 弈)转化成了一个完全但不完美信息的动态博 弈问题。此即所谓的“海萨尼转换”。
12
27.04.2020
6.1.3 海萨尼转换
(3)除了“自然”以外的其他博弈方同时从自己 的行为空间中选择行动方案a1,…,an.
(4)除了博弈方0,即“自然”以外,其余博弈方 各自取得收益ui=ui(a1,…,an,ti)其中i=1,2,.., n.
这个博弈就是一个完全但不完美的动态博弈, 不过它是带有同时选择的。
2
27.04.2020
6.1.1 不完全信息的古诺模型
描述:市场需求为P(Q)=a-Q,其中Q为市场总产
量,为两厂商产量q1和q2之和,即Q= q1+q2。厂 商1的成本函数为C1= C1( q1)= C1 q1,即无固 定成本,边际成本为C1,它是两个厂商都清楚的。 而厂商2的成本函数却只有厂商2自己完全清楚,
9
27.04.2020
6.1.2 静态贝叶斯博弈的一般表示
用ti表示博弈方i的类型,并用Ti表示博弈方i的 类型空间(全部可能类型的集合),则 t i T i 。 用ui(a1,…an,ti)来表示博弈方i在策略组合 (a1,…,an)下的得益,因为这个得益函数中 含有一个反应该博弈方类型的变量ti,并且该变 量的取值是博弈方i自己知道而其他博弈方并不 清楚的,因为正好可以反应静态贝叶斯博弈中 的信息不完全的特征。
完全信息博弈的一般表达式为G S 1 ,L,S n;u 1 ,K ,u n
S i 为博弈方i的策略空间,即他的全体可选策略集
合态博,弈而中u i 为,博一弈个方博i弈的方得的益一函个数策。略在就完是全一信次息选静
择或一个行为,用a i 表示博弈方i的一个行为, 而用A i 表示他的行为空间(全部可能的a i 构成
厂商1在做出自己的产量决策时当然会考虑厂 商2的这种行为特点。设厂商1的最佳产量为q1* ,
厂商2的边际成本为CH时的最佳产量为q2*(CH), 边际成本为CL时的最佳产量为q2*( C L ),根据上 面的假设, q2*(CH)满足下式:
m qa 2x[(aq1*q2)C H]q2
4
27.04.2020
相关文档
最新文档