博弈论与信息经济学 第三章 不完全信息静态博弈

合集下载

不完全信息静态博弈

不完全信息静态博弈

由于θi在[-ε,+ε]上是均匀分布的,因而θi ≥ 0和θi < 0的概率各为1/2。可认 为每个参与人认为对方选择抓与不抓的概率各为1/2。 当ε 0时,该纯策略贝叶斯均衡就收敛为一个完全信息博弈的混合策 略纳什均衡。
因而,海萨尼说,完全信息博弈的混合策略均衡可以解释为不完全信息 情况下纯策略均衡的极限。
策略贝叶斯均衡是一个类型依存战略组合
{ai* (i )}in,满足: 1
* ai* (i ) arg max pi (i | i )ui (ai , ai (i );i ,i ) ai
1、不完全信息古诺模型(板书)
• 在这个模型中,参与人的类型是成本函数。逆需求函数为
荷兰式拍卖:从一个非常高的初始标价逐步降低到有一个买者接受报价。 一级密封价格拍卖:出价最高的投标者获得拍卖品,并支付自己的出价 给卖者; 二级密封价格拍卖:出价最高的投标者获得拍卖品,并支付次最高出价。
1)
2)
英式拍卖:投标者按照递增的顺序宣布他们的出价,直到没有人愿意出更
高的价格,出价最高的投标者获得拍卖品; 荷兰式拍卖:从一个非常高的初始标价逐步降低到有一个买者接受报价。
看,一开始应采取“不合作”的策略。究竟是直觉正确,还是逻辑正
确? 博弈论专家Ken Binmore实验发现,不会出现一开始选择“不合作”
策略而使双方收益为1的情况。双方会主动选择“合作”策略,从而 走向合作。但逆向归纳法在某一步肯定会起作用。只要逆向归纳法在 起作用,“合作”便不能进行下去。
这个悖论在现实中的对应情况是,参与人不会在开始时确定他的策略
现在考虑同样的博弈但具有不完全信息:每个参与人有相同的支付结
构,但如果他赢了的话,他的利润为(1+θi),这里θi是每个参与人的 类型,是私人信息。但θi在[-ε,+ε]上均匀分布,这是公共知识。

不完全信息静态博弈

不完全信息静态博弈
不完全信息博弈
不完全信息静态博弈
海萨尼转换 现实中的贝叶斯博弈和均衡 机制设计
不完全信息静态博弈概述
在不完全信息静态博弈中,博弈参与者同时进行决策,但
博弈一方或多方并不了解博弈的全部信息。
只要在博弈中包含不完全信息,那么这样的博弈通常也被
称为贝叶斯博弈(Bayesian Game)。
不完全信息静态博弈的均衡通常被称为贝叶斯纳什均衡 (Bayesian Nash Equilibrium)
A cH q1 H q2 2 A cL q1 L q 2 2 H L A * q2 (1 ) * q2 c q1 2
不完全信息条件下的古诺寡头博弈均衡为:
A 2c ( * cH (1 ) * cL ) q1 3 H 2 A 2c (3 ) * cH (1 ) * cL q2 6 2 A 2c * cH (4 ) * cL L q2 6
贝叶斯对概率论和数理统计理论的早期发展做出了杰出的奠
基性贡献
贝叶斯对统计理论的主要贡献的“贝叶斯公式
(Bayesian Law)” 全概公式 设试验 E 的样本空间为
,事件
A1 , A2 ,..., An 构成样本空间的一
一、不完全信息与“市场争夺战”博弈
假设市场中有一个在位者和一个潜在进入者。 潜在进入者有两个策略可以选择:“进入”或者“不进入”。 在位者有两个策略可以选择:“斗争”或者“默许”。 在位者可能是“高效型”企业,也可能是“低效型”企业。 在位者不同类型对应不同博弈情况。
别。
厂商 2 将厂商 1 的产量看作给定。
当厂商 2 的成本函数为 C(q2) = cHq2 ,厂商 2 的产量为:

不完全信息静态博弈

不完全信息静态博弈

• (3)、信念不同出现的均衡的答案也会不同。 )、信念不同出现的均衡的答案也会不同 )、信念不同出现的均衡的答案也会不同。 • • • • (4)、由于参与者的收益函数具有不确定性,因而不可能通过 )、由于参与者的收益函数具有不确定性, )、由于参与者的收益函数具有不确定性 求解最大化的方式找到最优策略,换句话说, 求解最大化的方式找到最优策略,换句话说,就是什么策略都可 能成为最优策略,任何结果都有可能是博弈的均衡解。 能成为最优策略,任何结果都有可能是博弈的均衡解。这样得不 出结果。 出结果。
囚徒因境2 囚徒因境2的扩展式表达
2、囚徒因境2的扩展式的理解 、囚徒因境2
)、该博弈有两个开始点 行动的时候, • (1)、该博弈有两个开始点 )、该博弈有两个开始点(X1和X2),在囚徒 行动的时候, 和 ,在囚徒1行动的时候 囚 • 徒1分不清他到底位于哪一个节点,是X3、X4、X5,还是 。 分不清他到底位于哪一个节点, 分不清他到底位于哪一个节点 、 、 ,还是X6。 • (2)、博弈的扩展式有三个信息集,它们分别 )、博弈的扩展式有三个信息集 )、博弈的扩展式有三个信息集,它们分别{X1},{X2}和 , 和 • {X3,X4,X5,X6}。 , , , 。 • • • • )、由于该博弈有两个开始点 (3)、由于该博弈有两个开始点、可以理解为两个不同的博 )、由于该博弈有两个开始点、 但关键是,这两个博弈被一条虚线连接起来, 弈,但关键是,这两个博弈被一条虚线连接起来,因而它又是一 个博弈。它既是两个博弈又是一个博弈, 个博弈。它既是两个博弈又是一个博弈,从逻辑上来说这是矛盾 因而我们不可能直接分析它。 的,因而我们不可能直接分析它。
• 豪尔绍尼转换的主要思路 • 以类型概念构造对不完全信息的招述, 在此基础上构造统一的模型来描述局中人 在博弈中对不完全信息的处理,从而将不 完全信息博弈转化为不完美信息的完全信 息博弈。

经济博弈论 谢识予 3不完全信息静态博弈

经济博弈论 谢识予 3不完全信息静态博弈

进入者似乎在与两个在位者博弈:高成本和低成本的在位 者;如果在位者有T种不同的成本函数在位者就相当于与T个 不同的在位者博弈。
3 海萨尼转换
Harsanyi(1967)

N

不完全信息博弈转化 为不完美信息博弈; 而完全信息和完美信 息之间的区别显得不 再重要 [1-P]
进入
[ -50,0 0,0
不求爱 0,0
2 不完全信息
信息与收益
博弈中研究的信息是指能够影响局中人收益的信息 影响局中人收益的信息 完全或对称信息意味着局中人的收益(效用)函数是共同知 识 不完全信息则意味着不知道对方的效用函数 不完全信息博弈:至少有一个参与人不知道其他参与人的 支付函数。 不完全静态博弈=静态贝叶斯博弈:至少有一个参与人不 知道其他参与人支付的静态博弈
一个参与人拥有的所有的私有信息(即所有不是共同 知识的信息)称为他的类型。
2 不完全信息
不完全信息博弈与不完美信息博弈 私人信息:在博弈中(开始博弈前或博弈中),参与者i 知道,但不是所有参与者的共同知识。 不完全信息博弈:在参与人开始计划自己的策略行动前, 部分参与人具有其他人不知道的与博弈相关的私人信息 (初始私人信息) 完美(perfect)信息:在博弈中,每个参与人行动时, 都能够观察到在她(他)之前其他参与者的行动。 不完美信息博弈:在博弈中,至少有一个参与人行动时 不能观察到在她(他)之前某些参与人的行动。
孔明 冒险 司 马 懿 进攻 后退 守城 获胜,被擒 不胜不败,逃 脱 弃城 获胜,被擒 不胜不败,逃 脱 守城 被伏击,逃脱 不胜不败,逃 脱 谨慎 弃城 获胜,被擒 不胜不败,逃 脱
2 不完全信息
空城计
孔明可以选择的策略是“弃城”或“守城”,如果司 马懿判断孔明是“冒险”的,无论是“弃”还是“守”, 那么孔明均要被其所擒。 所以孔明就用空城计“于城上敌楼前凭栏而坐,焚香操 琴”,增大了司马懿判断自己是“谨慎”类型的主观概率。 正如孔明所料,司马懿认为孔明是“谨慎”的,在“理 性的”司马懿看来,进攻失败的可能性较大,而退兵的期 望效用大于进攻的期望效用。故最终司马懿选择了退兵, 孔明则得以逃脱。

博弈论——不完全信息静态博弈.讲义

博弈论——不完全信息静态博弈.讲义

3 不完全信息静态博弈3。

1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。

不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。

如在拍卖商品或工程招投标中.信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。

不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。

但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息"(private information)。

在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。

3。

2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。

Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人--“自然N "。

N 首先行动,决定每个局中人的特征.每个局中人知道自己的特征,但不知道其他局中人特征.这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈.这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。

局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。

用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。

博弈论——不完全信息静态博弈

博弈论——不完全信息静态博弈

3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。

不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。

如在拍卖商品或工程招投标中。

信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。

不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。

但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。

在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。

3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。

Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。

N 首先行动,决定每个局中人的特征。

每个局中人知道自己的特征,但不知道其他局中人特征。

这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。

这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。

局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。

用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。

第3章不完全信息静态博弈详解

第3章不完全信息静态博弈详解
共产品供给区域。
博弈论与信息经济学 江西财经大学 陶长琪
3.2.3 一级密封价格拍卖(招标)

拍卖或招标(auction)有两个基本功能,一是揭示信息,二是减少代理 成本。

一级密封价格拍卖(the first-price sealed auction)是许多 拍卖方式
中的一种。在这种拍卖中,投标人(bidders)同时将自己的出价写下来 装入一个信封,密封后交给拍卖人,拍卖人打开信封,出价最高者是 赢者,按他的出价支付价格,拿走被拍卖的物品。
定义:n人静态贝叶斯博弈的战略式表述包括:参与人的类型空 间 , 1 n 条件概率 p1 ,, pn ,类型依存战略空间 A 和类型依存支 1 (1 ), An ( n ), 付函数 u1 (a1 ,an ;1 ),, un (a1 ,an ;n ) 。 参与人i知道自己的类型i i 条件概率 pi pi (i | i ) 描述给定自己属于 i 的情况下,人i有关其他 参与人类型 i i 的不确定性。我们用 G {A1, An ;1,n ; p1,, pn ; u1,, un } 代表这个博弈。
k [0,1], Pr ob( k ) k
)
maxui (v b) P r ob(b j b) (v b)(b)
b
最优化的一阶条件是: 如果
(b) (v b)' (b) 0
b* (.) 是投标人i的最优战略, (b) v 。
(b) ((b) b)' (b)
给定参与人i只知道自己的类型 i 而不知道其他参与人的类型 i ,参与人 ai (i ) 最大化自己的期望效用。参与人i期望效用函数定义如下: i将选择
博弈论与信息经济学 江西财经大学 陶长琪

第3章 不完全信息静态博弈

第3章  不完全信息静态博弈

贝叶斯纳什均衡


有了上述概念,贝叶斯纳什均衡可以定义为, n人不完全信息静态博弈G={A1,…,An;1,…,n; P;u1,…,un}的纯战略贝叶斯纳什均衡是一个类 型依存战略组合{ai*( i )},i=1,…,n,其中每 个参与人i在给定自己的类型i和其他参与人类 型依存战略{a-i*( -i )}的情况下,选择行动 ai*(i)最大化自己的期望效用函i。 贝叶斯纳什均衡是完全信息静态博弈纳什均衡 概念在不完全信息静态博弈上的扩展。
3.1-3不完全信息静态博弈的战略 式表述和贝叶斯纳什均衡


不完全信息静态博弈又称为静态贝叶斯博弈。 不完全信息静态博弈的参与人也称为贝叶斯参 与人。如同在完全信息静态博弈中一样,在不 完全信息静态博弈中,所有参与人同时行动, 参与人i的战略空间Si等同于他的行动空间Ai。 但是,与完全信息静态博弈不同的是,在不完 全信息静态博弈中,参与人i的行动空间Ai可能 依赖于他的类型i ,换句话说,行动空间是类 型依存的(type contingent)。
不完全信息与参与人的类型



不完全信息意味着,至少有一个参与人有多个 类型(否则,就成为完全信息博弈)。 我们用 i 表示参与人i的一个特定类型, i 表 示参与人i所有可能类型的集合,i i。 我们假定,={i},i=1,…,n,取自某个客观的 分布函数P(1,…,n)。 为了简单起见,我们假定只有参与人i观测到 自己的类型i,除i之外的其他参与人都不能观 测到i。
N
高成本 低成本
[p]
在位者 默许 进入者 进入 不进入 进入 不进入 进入 斗争
[1-p]
默许
斗争
不进入 进入
不进入
(50,40) (300,0) (0,-10) (300,0) (80,30) (400,0) (100,-10) (400,0)

博弈论_不完全信息静态博弈

博弈论_不完全信息静态博弈

贝叶斯纳什均衡的存在性
贝叶斯纳什均衡的存在性定理 定理3.1.2,见书上第62页,不讲定理的证明 它与第24页的定理2.2.3的比较。定理3.1.2所
要用到的前提条件更强,其原因在于: 在贝叶斯博弈中,局中人i的收益是纯策略下
的期望收益。或,局中人i的收益函数ui(s-i, si, ti)可以随着类型的变化而变化;当ui是si的凹函 数时,其凸组合“∑pi(t-i|ti)×ui(s-i(t-i), si, ti), t-i∈T-I”也是si的凹函数;若拟凹则不成立
义3.1.2做比较 此定义是对纯策略下贝叶斯纳什均衡定义的一
个直接扩展,其中E(ui)是局中人i在混合策略 组合下,对其收益函数ui的数学期望 定理3.1.3:混合策略组合是贝叶斯纳什均衡 的充分必要条件 定理3.1.4:贝叶斯纳什均衡的存在性定理
求解行业博弈的贝叶斯纳什均衡
条件概率 标记混合策略的符号 标记期望收益的符号 计算不同类型下的期望收益 书上的方法:由混合策略下贝叶斯纳什均衡的
对局中人2的计算
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 , -4/3 , 0 建厂 , -4/3 , 0
不建厂 , 1 , 0 不建厂 , 1 , 0
合成后的支付矩阵
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 0, -4/3 2, 0 建厂 1.5, -4/3 3.5, 0
混合策略
在贝叶斯博弈G=[N, {Ti}, P, {Si(ti)}, {ui}]中,局中人i 在类型ti∈Ti下,为每一个纯策略以概率进行选择,则 xi(ti) =(x1(i)(ti), x2(i)(ti), ···, xm_i(i)(ti))称为局中人i在类型 ti下的一个混合策略。有时简写为xi。

博弈论与信息经济学 不完全信息静态博弈

博弈论与信息经济学  不完全信息静态博弈

不完全信息和贝叶斯纳什均衡
定义:在静态贝叶斯G {A1, , An ; 1, , n ; p1, , pn ;u1, , un}博弈中, 纯策略贝叶斯纳什均衡是一个类型依存策略组
合a (θ) (a1 (1 ),
,
a
n
(
n
)),其中,每个参与人
i
在给定自己的类

i
和其他参与人依存策略
a
i
(θ i
不完全信息和贝叶斯纳什均衡
n 人不完全信息静态博弈的时间顺序为:
⑴自然给定类型向量θ 察到 i ,但参与人
(1, ,
j( i
n ) ,其中,i )只知道 p j
(θ j
i
|
,参与人 i 观 j ),观察不
到 i;
⑵参与人同时选择行动,参与人 i 从可行集 Ai (i )中选择行
动 a i,n 人的行动组合为a (a1, , an );
p(i ,i ) p(i )
p(i ,i ) p(i ,i )
ii
这里,p(i ) 是边缘概率。如果类型的分布是独立的,pi (i i ) p(i )
不完全信息和贝叶斯纳什均衡
贝叶斯纳什均衡是完全信息静态博弈纳什均衡概念在不完 全信息静态博弈上的扩展。不完全信息静态博弈又称为静 态贝叶斯博弈。 ◆定义:n人静态贝叶斯博弈的战略式表述包括:参与人的类 型空间 1, , n,条件概率 p1 ,..., pn ,类型依存战略空间
A11,..., An n ,和类型依存支付函数u1(a1, , an ;1),..., un (a1, , an ;n )
参与人i知道自己的类型 i i ,条件概率 pi pi (i i ) 描述 给定自己属于 i 的情况下,参与人i有关其他参与人类型 i i的不确定性。我们用 G {A1, , An ;1, ,n ; p1, , pn ;u1, ,un} 代表这个博弈。

不完全信息静态博弈

不完全信息静态博弈
13
手无知无畏) , 自己的成本较高时或可获利 (对 手无知生畏) 。
14
L
H
=
L c2 的可能性为 µ ,
H 的可能性为 (1 − µ ) ;µ 是共同知识。 c2 = c2
因此企业 1 只有一个类型,企业 2 有 2 个类 型。进一步假定:
L H = a 2, = c1 1,= c2 c2 = µ 1/ 2 3/ 4,= ห้องสมุดไป่ตู้ / 5,
企业 2 将选择 q2 最大化利润函数
p ,那么进入者选
p) ,
择进入的期望效用是 40 p + ( −10)(1 −
选择不进入的期望利润是 0. 那么,进入者的 最优选择是:如果
p ≥ 1/ 5 , 进 入 ; 如 果
p < 1/ 5,不进入;如果 p = 1/ 5 ,则进入者
3
在进入与不进入之间没有差别。 那么如何描述纳什均衡呢 (贝叶斯纳什均 衡)? 首先,我们把在位企业的战略表述为 ,这里θ 是在位 a2 (θ ) (称为类型依存战略) 企业的类型,即它自己是高成本还是低成本, 这是它的私人信息(不是共同知识的信息) , 。称 a (θ ) 是企业自身类型(θ )的“函数” ( ( a1, a2 (θ )) 是一个纳什均衡,如果每个参 与者在给定对方战略的情况下自己的战略能 最大化自己的期望效用。这里进入者不知道θ
i , ai* (θi ) 使自身效用:
* vi = ∑ p (θ −i / θi ) ui (ai (θi ), a− i (θ − i );θ i ,θ − i )
θ−i
最大。 在这里,静态博弈的时间顺序如下: (1) 自然决定参与人类型向量θ
= (θ1,,θ n ) ,

第三章不完全信息静态博弈

第三章不完全信息静态博弈
类似上述情况称为不完全信息博弈,即在不完 全信息博弈中,至少有一个参与人不知道其他 参与人的支付函数。

第三章 不完全信息静态博弈 -贝叶斯纳什均衡


一 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈
海萨尼转换
不完全信息静态博弈的战略式表述和贝叶斯纳什均衡

二 贝叶斯纳什均衡应用举例

被求爱者对于 求爱者的品德的 信息是不完全的。
不完全信息博弈
求爱博弈: 品德优良者求爱 求爱
被求爱者 接受 不接受
100,100 -50,0 0,0
求爱者
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱者 求爱
被求爱者 接受 不接受
100,-100 -50,0 0,0
海萨尼转换

例如:市场进入博弈:在位者不知道进入者是否知道 自己是高成本还是低成本,只知道进入者有p的概率知 道自己的成本函数,(1-p)的概率不知道自己的成本 函数。 这种情况下,进入者也有两种类型:知道(在位者的 成本)或不知道(在位者的成本)。即参与人的类型 是其个人特征的一个完备描述。
例如:在谈判中,甲方知道自己是强硬派或妥协派, 乙方知道自己是否知道甲方是强硬派或妥协派,但甲 方不知道乙方是否知道自己是强硬派还是妥协派,则 甲方有两种类型:强硬派或妥协派,乙方有两种类型: 知道或不知道。 不完全信息意味着,至少有一个参与人有多个类型。
进入者关于 在位者成本信息 是不完全的。
市场进入博弈:不完全信息 在位者 低成本情况 高成本情况
默许
斗争 默许 斗争 进入 不进入
进入者
40, 50 0, 300

不完全信息静态博弈

不完全信息静态博弈

假设我们观察到一个人干了一件好事,那么,这个人 是好人的后验概率为: P(GP |GT)= P(GT|GP定张三是好人的先验概率是0.5, 那么, 在观察到张三干了一就好事后,我们如何修正他是好 人的先验概率依赖于我们认为这间好事好到什么程度. 1,这是一件非常好的好事,好人一定干,坏人决不可能 干,即P(GT|GP)=1, P(GT|BP)=0
进入者似乎是与两个不同的在位者博弈, 一个是高成本的在位者,一个是低成本的 在位者.
不完全信息古诺模型 参与人的类型是成本函数.假设逆需求函数 为P = a-q1-q2,每个企业的单位成本不变, 为ci,则企业的利润函数为: πi = qi (a-q1-q2-ci), i=1,2
假设企业1的单位成本c1是共同知识,企 业2的单位成本可能是高的也可能是低的, 企业2知道自己的成本类型,但企业1只 知道企业2属于这两种类型的概率分布 和1-,是共同知识. 进一步假设 a = 2, h c 2 = 1.25, = 0.5 c1 = 1, l c2 = 0.75,
不完全信息静态博弈: 不完全信息静态博弈:贝叶斯纳什均衡
完全信息博弈的基本假设是所有的参与人都知 道博弈的结构,博弈的规则,和博弈的支付函 数.例如在"市场进入"博弈中,进入者知道 在位者的偏好,战略空间和各种战略组合下的 利润水平,反之亦然.当然,这个假设在许多 情况下是不成立的.
哈桑尼( 哈桑尼(Harsanyi)定义了"贝叶斯纳什均衡": )定义了"贝叶斯纳什均衡" 贝叶斯均衡是纳什均衡在不完全信息博弈中的 扩展:
在静态不完全信息博弈中,参与人同时行动,没有机 会观察到其他人的选择; 每个参与人仅知道其他参与人类型的概率分布而不知 道其真实类型; 他不可能准确地知道其他参与人实际上会选择什么战 略,但是,他能正确地预测到其他参与人的选择是如 何依赖于其各自的类型的 决策目标就是在给定自己的类型和别人的类型依从战 略的情况下,最大化自己的期望效用.

博弈论讲义3-不完美信息静态博弈

博弈论讲义3-不完美信息静态博弈
随机变量ti在Ti的概率分布假定是已知的。
不完全信息博弈中,至少有一个参与者i有多个可能的 类型,其他参与者虽然知道ti∈Ti,但都无法确知ti在 Ti中的具体取值。
如果只有虚拟参与人具有多个类型,则是不完全信息
如果有虚拟参与人以外的某些参与人有多个类型,则属于信息 不对称。
版权所有余向华源自12信息问题与市场的建立
“柠檬”市场现象(Akerlof):
由于信息问题引发逆向选择(劣币驱逐良币),
导致有效的市场可能建立不起来,或发展慢。
普遍存在于产品市场、劳动力市场(包括教师市场的问
题)、保险市场、信贷市场等上
“碟猫”市场现象:
本能不存在的市场,由于信息的不完全反给创
造出来了。比如赌石市场、彩票市场
第3篇 不完全信息静态博弈
3.1 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈 海萨尼转换 不完全信息静态博弈的策略式表述和贝叶斯纳什均衡
3.2 贝叶斯纳什均衡与混合策略均衡的纯化 3.3 贝叶斯纳什均衡应用举例 3.4 非对称信息下的机制设计问题
版权所有
余向华
1
信息问题与现实生活
爱心困惑:面对一个个乞丐向你行乞,你会如何决定呢? 佛心者:宁可被骗一千次,绝不放过一次帮助需要帮助者。 人心者:宁可错过千次帮助需要帮助的人,绝不愿被骗一次?
不帮、或者收集信息再决定?
婚恋困惑:知人知面与知心问题 食品安全中的信息问题 信息与法律举证问题 …
版权所有
余向华
2
信息问题与市场运行
在信息不完美的情况下,博弈参与者的收益为期望收益: 被求者
接受 不接受
求爱博弈:
求爱 100,100
品德优良者求爱 求爱者 不求爱 0,0

博弈论与信息经济学第三章不完全信息静态博弈讲义

博弈论与信息经济学第三章不完全信息静态博弈讲义

⑴自然给定类型向量θ 察到 i ,但参与人
(1 ,,
j( i
n ) ,其中,i )只知道 p j
(θ j
i
|
,参与人 i 观 j ),观察不
到 i;
⑵参与人同时选择行动,参与人 i 从可行集 Ai (i )中选择行
动 a i,n 人的行动组合为a (a1,, an );
⑶参与人 i 的支付函数为 ui (ai ,ai ;i ) 。 注意,在上面的定义中,虽然参与人 i 的类型是私人信息,
i i 我们称 pi (i i ) 为参与人 的条件概率,即给定参与人 属于类型 i
的条件下,他有关其他参与人属于θ i 的概率。根据条件概率规则,
pi (i i )
p(i ,i ) p(i )
p(i ,i ) p(i ,i )
ii
这里,p(i ) 是边缘概率。如果类型的分布是独立的,pi (i i ) p(i )
不完全信息和贝叶斯纳什均衡
贝叶斯纳什均衡是完全信息静态博弈纳什均衡概念在不完 全信息静态博弈上的扩展。不完全信息静态博弈又称为静 态贝叶斯博弈。 定义:n人静态贝叶斯博弈的战略式表述包括:参与人的类 型空间 1,, n,条件概率 p1 ,..., pn ,类型依存战略空间
A11,..., An n ,和类型依存支付函数u1(a1,, an ;1),..., un (a1,, an ;n )
(-10,100)
上例市场进入阻挠博弈就可以转换为如图的完全但不完美信息博弈。
*完美信息博弈:如果博弈树的所有信息集都是单结的。
海萨尼转换
海萨尼转换已成为处理不完全信息博弈的标准方法。
将一个参与人所拥有的所有私人信息(即所有不是共同知
识的信息)被称为该参与人的类型。一般地,用 i 表示

不完全信息静态博弈

不完全信息静态博弈
通常,参与者的策略决定了对其每个信息集他将采取的行动。此时,信息集就以类型ti ∈ Ti加以区别。于是,参与者i的策略就是将其类型映射到其行为的函数si : Ti → Ai。比 如,在上例中,员工有四种策略:(工作,工作),表示不管他能力高低他将选择工作;(工 作,逃避),表示如果他能力高他将选择工作,而如果他能力低他将选择开小差;(开小差, 工作);以及(开小差,开小差)。
图1
参与者的私人信息被称为他的“类型”。比如,在上例中员工有高和低两种类型。由于 公司没有任何私密信息,所以公司只有一种类型。正如在上例中一样,不完全信息是通过不 完美信息博弈来描述的,其中大自然选择参与者类型并秘密地告诉他。这些博弈被称为不完 全信息博弈或贝叶斯博弈。
正规地讲,不完全信息条件下的静态博弈如下所述。首先,大自然选择某个t = (t1, t2, . . . , tn) ∈ T ,其中选择每个t ∈ T的概率为p(t)。此时,ti ∈ Ti是参与者i ∈ N = {1, 2, . . . , n}的类型。然后,每个参与者观察到自己的类型,但不能观察到其它 参与者的类型。最后,在每个参与者知道自己类型的情况下,他们同时选择他们的行为。我 们以a = (a1, a2, . . . , αn) ∈ A表示所有参与者选择的任何一组行为,其中ai ∈ Ai是 参与者i选择的行为。这个博弈可用(N, T, A, p)表示。
我们用
表 示 i 在 已 知 自 己 类 型 是 ti 的 情 况 下 对 其 它 参 与 者 类 型 是
的看法 。[如果所有参与者的类型是互相关联的,我们可
能需要利用贝叶斯法则。但是如果它们是互相独立的,那么问题就简单些。在此情况下,参 与者不会更新他们的看法。]
现在我们可以定义贝叶斯纳什均衡了。在有n个参与者的一个不完全信息的静态博弈中,

博弈论与信息经济学不完全信息静态博弈

博弈论与信息经济学不完全信息静态博弈
A11,..., An n ,和类型依存支付函数u1(a1,, an ;1),...,un (a1,, an ;n )
参加人i懂得自己旳类型 i i ,条件概率 pi pi (i i ) 描述 给定自己属于 i 旳情况下,参加人i有关其他参加人类型 i i旳不拟定性。我们用 G {A1,, An ;1,,n ; p1,, pn ;u1,,un} 代表这个博弈。
j
bi
aj cj
bi
aj cj
ui (vi bi ) P bi b j v j
1 2 (vi
bi ) P
bi
bj
vj
(vi
bi )
bi
aj cj
求导得:bi vi
1 2
vi
1 2
aj
由于bi vi
ci vi
ai
ci
1 2 , ai
1 2 aj
0
综上所述,bi vi
贝叶斯均衡是一组战略组合源自(a1.,a
2
.)
,使得对于每一

i
和每一种可能旳 ci
,战略
a
i
(.)最大化参加人
i
旳期望
效用函数
Ec
j
ui
(ai
,
a
j
ci
,
ci
)
。令
z
j
Pa j c j 1为均衡状
态下参加人 j 提供旳概率。最大化行为意味着,只有当参加
人 i 预期参加人 j 不提供时,参加人 i 才会考虑自己是否提
懂得(成本ci 是参加人 i 旳类型)。 c1和 c2 具有相同旳、独立旳定义在[c, c]
上旳分布函数,且是共同知识。

不完全信息静态博弈

不完全信息静态博弈
不完全信息静态博弈
吴建设
不完全信息
一个寓言故事的启示:
有一次,伊索进城,半路上遇见一位法官。法官 严厉的盘问:“你要去哪儿?”伊索回答说: “不知道。”于是,法官起了疑心,将伊索关进 了监狱,严加审问。“法官先生,要知道,我讲 的是实话。”伊索说,“我确实不知道我会来监 狱。” 启示:我们不可能了事如神,更不可能预测未来, 不确定性就像日出日落一样不可避免。 策略:我们没办法做到无所不知,也不止于一无 所知,应尽可能利用所知的一切寻求最优行动。
人本人知道、其他参与人则不知道的信息称为私人信息。某一参与人所拥有的全
部私人信息称为他的类型。在上述例子中,阻挠成本就是 A的私人信息。高阻挠 成本和低阻挠成本则是两种不同的类型。
A 高成本 低成本 默许 阻止 阻止
B
默许
进入
不进入
40, 50
0, 300
-10, 0
0, 300
30, 80
0, 400
拟的局中人——“自然”。自然首先行动,它决定每个参与人
的特征。每个参与人知道自己的特征,但不知道别的参与人特 征。这种方法将不完全信息静态博弈变成一个两阶段动态博弈, 第一个阶段是自然N的行动选择,第二阶段是除N外的参与人的 静态博弈。这种转换被称为“海萨尼转换”,这个转换把“不 完全信息”转变成为完全但不完美信息,从而可以用分析完全 信息博弈的方法进行分析。

在博弈中,其中有参与人也许对对方博弈的收益函数 并不十分清楚,可采用概率分布来表示其类型。也就 是基于概率对博弈进行分组建立博弈收益函数。 比如甲与乙选择策略时,可以这样考虑,甲选择某一 种策略时,乙选择策略有几种,乙的这些策略按发生 的概率进行分组。通常构建一个博弈树就可以较好地 表达这一切。 海萨尼的观点关键在于假定:对于策略选择发生的概 率是一个共同知识。先验概率是作为博弈规则的一部 分存在,因此,一个参与人必须是持有关于其它参与 人类型的先验信念,同时,在观察到他们的行动后, 就要假定他们遵循着均衡的行为,然后更新自己的信 念。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

海萨尼转换
海萨尼提出的处理不完全信息博弈的方法是,引入一个虚 拟的参与人——“自然”;自然首先行动决定参与人的特 征,参与人知道自己的特征,其他参与人不知道。 N
[p] 不进入 (0,300) 高 进入者 进入 合作 (40,50) 不进入

[1-p] 进入 在位者 合作 (30,80) 斗争 (-10,100)
i i的不确定性。我们用 G {A1 ,, An ; 1 ,, n ; p1 ,, pn ; u1 ,, un }
代表这个博弈。
不完全信息和贝叶斯纳什均衡
n 人不完全信息静态博弈的时间顺序为:
⑴自然给定类型向量 θ (1 ,, n ) ,其中, i i ,参与人 i 观 察到 i ,但参与人 j( i )只知道 p j (θ j | j ) ,观察不 到 i; ⑵参与人同时选择行动,参与人 i 从可行集 Ai ( i )中选择行 动 a i ,n 人的行动组合为 a (a1 ,, an ); ⑶参与人 i 的支付函数为 ui (ai , a i ; i ) 。 注意,在上面的定义中,虽然参与人 i 的类型是私人信息, 但是,行动空间和效用函数的结构是共同知识。换句话 说,尽管其他参与人并不知道参与人 i 的类型 i ,但是, 他们知道参与人 的行动空间和支付函数是如何依赖于 i i 参与人 的类型的。
ai (ci ) 是从 [c, c] 到{0,1}的一个函数,其中0表示不提供, i 1表示提供。参与人 的支付函数为:
ui (ai , a j , ci ) max(a1 , a2 ) ai ci
贝叶斯均衡是一组战略组合 ,使得对于每一 个 i 和每一个可能的 c i ,战略 ai (.)最大化参与人 i 的期望 效用函数 Ec j ui (ai , a ci , ci )。令 z j Pa j c j 1 为均衡状 j 态下参与人 j 提供的概率。最大化行为意味着,只有当参与 人 i 预期参与人 j 不提供时,参与人 i 才会考虑自己是否提 供。因为参与人 j 不提供的概率是 (1 z j ) ,参与人 i 提供的 i 预期收益是 1 (1 z j ) ,因此只有当 ci 1 z j 时,参与人 才会提供,即如果 ci 1 z j , ai (ci ) 1 ; 如果 ci 1 z j ,ai (ci ) 0 。
贝叶斯均衡的应用举例
企业1:
L 低成本:q1{1 (q1 q 2 )} 1 H 高成本:q 2 {1 (q1 q 2 )} 1 1 L H E 1 q1{1 (q1 q 2 )} q1{1 (q1 q 2 )} 2 2 1 1 L 1 H 求导得:q1 (1 q 2 q 2 ) 2 2 2 1 L 11 H 5 代入,联合解得: 1 , q 2 q , q2 3 24 24
动有一致的信念,即都知道所有参与人类型的概率分布函 数 p1 ,..., n
。此即“海萨尼公理”。
海萨尼转换
用 θ i (1 ,, i 1 , i 1 ,, n ) 表示除 i 之外的所有参与人的类型组合。这 样, ( ,..., ) ( , ) 。 1 n i i 我们称 pi ( i i ) 为参与人 i 的条件概率,即给定参与人i 属于类型 的条件下,他有关其他参与人属于 θ i 的概率。根据条件概率规则,
1.不完全信息库诺特模型
已知:市场总供给 1 q 2,p a (q1 q 2 ) q 企业1:q1 0 1 q1 , q 2 q1 a (q1 q 2 ) c1 。其中c1 1 企业2:q 2 0 2 q1 , q 2 q 2 a (q1 q 2 ) c 2 。 3 L 低成本 c 2 4 1 有两个类型 概率 5 H 2 高成本 c 2 4 当a为2时,两个企业将如何决 策?
博弈论与信息经济学
——第三章 不完全信息静态博弈
不完全信息博弈
例:市场进入阻挠博弈:不完全信息
高成本情况 默许 进入者 进入 不进入 斗争 在位者 默许 低成本情况 斗争
40,50 0,300
-10,0 0,300
30,80 0,400
-10,100 0,400
如果在位者是高成本,给定进入者进入,在位者的最优选择是默许;如果 在位者是低成本,给定进去者进入,在位者的最优选择是斗争。由于进入者并 不知道在位者究竟是高成本还是低成本,进入者的最优依赖于它在多大程度上 认为在位者是高成本的或低成本的。 假定进入者认为在位者是高成本的概率是p,低成本的概率是(1-p)。进入者 选择进入的期望利润是40×p+(-10) ×(1-p) ≥0 p≥1/5.
在位者(0,400) 斗争 (-10,0)
上例市场进入阻挠博弈就可以转换为如图的完全但不完美信息博弈。 *完美信息博弈:如果博弈树的所有信息集都是为处理不完全信息博弈的标准方法。 将一个参与人所拥有的所有私人信息(即所有不是共同知识 的信息)被称为该参与人的类型。一般地,用 i 表示参 与人 i 的类型,它属于一个可能的类型集 i 。 类型依赖:每一个人的行动都依赖于它的类型。 通过海萨尼转换,博弈开始时,所有参与人对“自然”的行
贝叶斯均衡的应用举例
2.一阶招标拍卖 一级密封价格拍卖(the first-price sealed auction)是许 多拍卖方式中的一种。在这种拍卖中,投标人(bidders) 同时将自己的出价写下来装入一个信封,密封后交给拍卖 人,拍卖人打开信封,出价最高者是赢家(获得拍卖品), 并按他的出价支付。这里,每个投标人的策略是根据自己 对物品的评价和对其他投标人评价的判断来选择自己的出 价,赢者的支付是他对物品的评价减去他的出价,其他投 标人的支付为零。
贝叶斯均衡的应用举例
首先考虑两个投标人的情况,i 1,2 。令 bi 0 是投标人i 的出价, v i 为拍卖品对投标人 i 的价值。假定 v i 只有 i 自己知道,因而 v i 是投标人 i 的类型,但两个投标人都 知道 v i 独立地取自定义在区间 [0, 1] 上的均匀分布函数。 投标人 i 的支付为

(a1 ., a2 .)
贝叶斯均衡的应用举例
ci 使得只有当 ci [c, ci ] 这就意味着,存在一个分割点 i 才会提供。类似的,存在一个 c j 使得只有当 时,参与人
c j [c, c ] 时,参与人 j 才会提供。 j
c
ci

c

ai (ci ) 1
不完全信息和贝叶斯纳什均衡
定义:在静态贝叶斯G {A1 ,, An ; 1 ,, n ; p1 ,, pn ; u1 ,, un } 博弈中, 纯策略贝叶斯纳什均衡是一个类型依存策略组 合a (θ) (a1 (1 ),, an ( n )),其中,每个参与人 i 在给定自己的类 型 i 和其他参与人依存策略 a i (θ i ) 的情况下最大化自己的预期效用 函数 E θi ui 。换句话说,策略组合 a (θ) (a1 (1 ),, an ( n ))是一个 贝叶斯纳什均衡,如果对每一参与人i 及 i 的类型集 i 中的每一 i 个 i ,ai ( i ) 满足
i
p( i , i ) pi ( i i ) p( i )
i i
p( i , i ) p( i , i )
p( i )
p 这里, ( i ) 是边缘概率。如果类型的分布是独立的,pi ( i i )
不完全信息和贝叶斯纳什均衡
贝叶斯纳什均衡是完全信息静态博弈纳什均衡概念在不完 全信息静态博弈上的扩展。不完全信息静态博弈又称为静 态贝叶斯博弈。 ◆定义:n人静态贝叶斯博弈的战略式表述包括:参与人的类 型空间 1 ,, n,条件概率 p1 ,..., pn ,类型依存战略空间 A1 1 ,..., An n ,和类型依存支付函数u1 (a1 ,, an ;1 ),...,un (a1 ,, an ; n ) 参与人i知道自己的类型 i i ,条件概率 pi pi ( i i ) 描述 给定自己属于 i 的情况下,参与人i有关其他参与人类型
贝叶斯均衡的应用举例
假设:
1 ci [0,2], F (ci ) ci 2 1 1 2 c i 1 1 c i c i 2 2 3 2 1,ci 3 ai ci 2 0,ci 3
vi bi , 如果bi b j 1 u i (bi , b j ; vi ) 2 (vi bi ) , 如果bi b j 0, 如果bi b j
贝叶斯均衡的应用举例
现假设:bi vi ai ci vi 则:bi b j v j a j c j v j 又 vi [0,1] bi a j bi a j P i b j v j P v j b cj cj bi a j 1 u i (vi bi ) P i b j v j (vi bi ) P i b j v j (vi bi ) b b 2 cj 1 1 求导得:bi vi vi a j 2 2
ai (ci ) 0
ci 1 z j 1 P c j c j 1 F c j
同理:



c
a j (c j ) 1
c j
c j 1 F ci



c
a j (c j ) 0
由上两式可得:
ci 1 F 1 F ci


参与人2 提供 参与人1 提供 不提供 不提供
1-c1,1-c2 1,1-c2
1-c1,1 0,0
假定公共产品的好处(每人1单位)是共同知识,但每人的提供成本只有自己 知道(成本 c i 是参与人 i 的类型)。 c1和 c2 具有相同的、独立的定义在 [c, c] 上的分布函数,且是共同知识。
相关文档
最新文档