第4讲不完全信息静态博弈
博弈论与经济分析(不完全信息静态)
博弈论与经济分析(不完全信息静态)第四章 不完全信息静态博弈不完全信息意味着至少有一个参与者不能确定另一个参与者的收益函数,或者说类型。
我们用一个例子来引入要讨论的问题: 例:信息不对称条件下的古诺模型 市场:P(Q)=a-Q ,Q=q1+q2 企业1:C1(q1)=cq1企业2:以θ的概率为高成本,即222()H C q c q =;以1θ-的概率为低成本,即222()L C q c q =。
当然,H L c c >。
信息不对称:企业2知道自己的成本,也知道企业1的成本;企业1知道自己的成本,但是只知道企业2成本状况的概率分布。
以上都是公共信息,即企业1知道企业2享有信息优势,企业2知道企业1知道,企业1也知道企业2知道企业1知道……如此等等。
解题:企业1会预测企业2在不同情况下的最优选择:当企业2为高成本时2122max[()]H q a q q c q *---当企业2为低成本时2122max[()]L q a q q c q *---既然企业只知道企业2成本情况的概率分布,则企业1只能根据上述预测最大化自己的期望收益:1121121max [(())](1)[(())]H L q a q q c c q a q q c c q θθ**---+----以上三个优化问题的一阶条件为:12()2H H a q c q c **--=12()2LL a q c q c **--=221[()](1)[()]2H L a q c c a q c c q θθ***--+---=联立求解:221()()36H H H L a c c q c c c θ*-+-=+-22()()36L L H L a c c q c c c θ*-+=-- 12(1)3H L a c c c q θθ*-++-=比较该结果与“完全信息条件”条件下结果的不同。
作业:说明企业2在两种成本下是否因为“信息优势”得到了好处?是应该巩固该优势还是向企业1公开信息?一、 静态贝叶斯博弈的标准表述完全信息静态:G={S1,…Sn;u1,…,un}在静态博弈条件下,策略S 就是一个行动A (当然,动态博弈则不同),于是我们可以写作G={A1,…An;u1,…,un}。
不完全信息博弈
• 这个博弈的一个纯策略ai(ci) 是从﹝c’, c’’﹞到﹛0,1﹜的一个函数,其中0表示不 提供,1表示提供。参与人的支付函数为: • Ui(ai,a j, ci)=max(a1, a2)-aici • 如果j提供,i不提供, Ui(0,1, ci)=max(0, 1)-0ci=1;如果i提供, j不提供, Ui(1,0, ci)=max(1, 0)-1ci=1-ci • 贝叶斯均衡是一个策略组合,便得对于每 个i和每个可能的ci,策略ai﹡ (ci) 最大化参 与人i的期望效用。
因为z j≡Prob﹙ c’ ≤c j ≤c j ﹡﹚= P﹙ c j ﹡﹚ ,均衡分割点ci﹡必须满足ci﹡=1P﹙ c j ﹡﹚。因此ci﹡ 和c j ﹡都必须满足 方程c﹡=1- P(1-P﹙ c ﹡﹚)。假定存在 唯一的一个c﹡,解这个方程,那么下列条 件一定成立: ci﹡ = c﹡= 1- P﹙ c ﹡﹚。 比如说,如果P(· )是定义在﹝0,2﹞上 均匀分布( P(c)≡c/2 ),那么c﹡是唯 一的,等于2/3。为了检查c﹡=2/3确实是个 均衡点,如果参与人i不提供,他的期望支 付是P(c﹡)=1/3;如果成本为c﹡时提供, 他的期望支付为1- c﹡,提供是最优的。
• 那么q2L =1/2(5/4-q1); q2H =1/2(3/4-q1) • 企业1不知道企业2的真实成本从而不知道企 业2的最优反应是q2L还是q2H ,因此企业1选 择q1最大化下列期望利润函数: • E u1 =1/2 q1 (1- q1- q2L )+ 1/2 q1 (1- q1q2H ) 解一阶条件可得企业1的反应函数: • q1﹡= 1/2 (1- q1H- q2L )=1/2(1-Eq2) • 解反应函数可得贝叶斯均衡为: • q1﹡=1/3; q2L﹡=11/24; q2H﹡=5/24
第三章信息经济学的研究方法—博弈论
第一节 概述-人生处处皆博弈
人生是永不停歇的博弈过程,博弈意 略达到合意的结果。
作为博弈者,最佳策略是最大限度地 利用游戏规则,最大化自己的利益;
作为社会最佳策略,是通过规则使社 会整体福利增加。
一、博弈论的定义
博弈论(game theory,又译为对策论,游戏论)
定义:研究决策主体的行为在直接相互作用时,人们如 何进行决策、以及这种决策如何达到均衡。
五、博弈论与信息经济学
博弈论是给定信息结构求均衡结果,它实际上是一种均衡理论, 我们最终要找的是一个均衡的结果,博弈论是方法论导向的, 它实际上是一种解决问题的方法。它是一个实证的方法。
信息经济学是给定信息结构求契约的安排。它实际上是一种契 约设计理论,它是问题导向的。它是一个规范的方法。
石匠的决策与拳击手的决策的区别
一、博弈论的定义
2、理性人假设 理性人是指一个很好定义的偏好,在面临给定的约束条件下
最大化自己的偏好。
博弈论说起来有些绕嘴,但理解起来很好理解,那就是 每个对弈者在决定采取哪种行动时,不但要根据自身的利益 和目的行事,而且要考虑到他的决策行为对其他人可能的影 响,通过选择最佳行动计划,来寻求收益或效用的最大化。
(一)囚徒困境
假定: (1)每个局中人都知道博弈规则和博弈结果的支付
矩阵; (2)每个局中人都是理性的(个人理性和个人最优
决策); (3)不能“串通”
(一)囚徒困境——纳什均衡
囚徒A
坦白
坦白 囚徒 B
-8,-8
抵赖 -10,0
抵赖 0,-10 -1,-1
-8大于-10 0大于-1
(坦白,坦白)是纳什均衡
第三章 信息经济学的研究方法 ——博弈论
博弈论——不完全信息静态博弈
3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。
不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。
如在拍卖商品或工程招投标中。
信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。
不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。
但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。
在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。
3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。
Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。
N 首先行动,决定每个局中人的特征。
每个局中人知道自己的特征,但不知道其他局中人特征。
这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。
这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。
局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。
用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。
博弈论_不完全信息静态博弈
贝叶斯纳什均衡的存在性
贝叶斯纳什均衡的存在性定理 定理3.1.2,见书上第62页,不讲定理的证明 它与第24页的定理2.2.3的比较。定理3.1.2所
要用到的前提条件更强,其原因在于: 在贝叶斯博弈中,局中人i的收益是纯策略下
的期望收益。或,局中人i的收益函数ui(s-i, si, ti)可以随着类型的变化而变化;当ui是si的凹函 数时,其凸组合“∑pi(t-i|ti)×ui(s-i(t-i), si, ti), t-i∈T-I”也是si的凹函数;若拟凹则不成立
义3.1.2做比较 此定义是对纯策略下贝叶斯纳什均衡定义的一
个直接扩展,其中E(ui)是局中人i在混合策略 组合下,对其收益函数ui的数学期望 定理3.1.3:混合策略组合是贝叶斯纳什均衡 的充分必要条件 定理3.1.4:贝叶斯纳什均衡的存在性定理
求解行业博弈的贝叶斯纳什均衡
条件概率 标记混合策略的符号 标记期望收益的符号 计算不同类型下的期望收益 书上的方法:由混合策略下贝叶斯纳什均衡的
对局中人2的计算
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 , -4/3 , 0 建厂 , -4/3 , 0
不建厂 , 1 , 0 不建厂 , 1 , 0
合成后的支付矩阵
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 0, -4/3 2, 0 建厂 1.5, -4/3 3.5, 0
混合策略
在贝叶斯博弈G=[N, {Ti}, P, {Si(ti)}, {ui}]中,局中人i 在类型ti∈Ti下,为每一个纯策略以概率进行选择,则 xi(ti) =(x1(i)(ti), x2(i)(ti), ···, xm_i(i)(ti))称为局中人i在类型 ti下的一个混合策略。有时简写为xi。
不完全信息静态博弈Harsanyi(1967-68)提出了一个不完全信息博弈的
β (x)F (x) + (N − 1)β(x) = (N − 1)x
– Typeset by FoilTEX –
4
我们以下定义均以纯策略为例:
不完全信息博弈 要求:虽然每个博弈者并不知道对手 的类型,但是所有类型出现的联合概率分布 F : Θ → [0, 1] 需为共同认识, 其中 Θ = Θ1 × Θ2... × ΘN。 博弈者 i 观察到私人类型 θi 后的效用可以表示为 Ui[s1(θ1), ..., sN(θN)|θi], Ui(·|θi) 是 在给定 θi 下的 von Neumann-Morgenstern 期望效用函 数, 因为其自变量均为随机变量。于是,
– Typeset by FoilTEX –
7
拍卖理论
现代拍卖理论是从 Vickery(1961) 开始的,80 年代以来 快速衍生出大量文献,其中以静态博弈为分析框架 的 拍卖问题主要是围绕收入相等法则(Revenue Equivalence Principle)和联系法则 (Linkage Principle) 两个基本原理展开。
方案 3? A 省在修路的情况下, 其支付额应在 50 万元 的修路费基础上,减去它给 B 省的外部性 30 万元,
– Typeset by FoilTEX –
20
方案 3 为: 如果 A 省上报值与 B 省收益和大于 100 万元,修路,但 A 省只支付 20 万元,B 省支付 50 万 元。
– Typeset by FoilTEX –
信息经济学部分习题解答
p
(3) 企业2先决策
根据逆推归纳法,先求企业1的反应函数
1 2 p a q c0 pa q c
p
代入企业2的利润函数,得
2 q b 2 p q b 2 a c q
再求企业2的反应函数,得
2 2 qba0 qab
解:根据问题的假设可知各企业的利润函数为
i piq ciqaqijn iqjqiciq
其中i=1,…,n。
将利润函数对qi求导并令其为0得:
i
qi
n
a
ji
qj c2qi 0
解得各企业对其他企业产量的反应函数为:
qi a n qj c/2
ji
根据n个企业之间的对称性,可知 q1*q2 *qn * 必然成立。代入上述反应函数可解得:
9
9
8.下表所示博弈重复两次,第二次开始之前第
一次的行动能被双方观察到。假定参与人对未 来收入不贴现。问题:支付向量(4,4)能否作为 子博弈精炼均衡结果在第一阶段出现(假定参与 人只选择纯战略)?如果能,请给出支持这一结 果的战略;如果不能,解释为什么。
L
C
R
T
3,1
0,0
5,0M2,1Fra bibliotek1,2
3,1
2 完全信息动态博弈
1.参与人1(丈夫)和参与人2(妻子)必须独立地决定出门时是否带 伞。他们知道下雨和不下雨的可能性相同(即50:50)。支付函数 如下:如果只有一人带伞,下雨时带伞者的效用为-2.5,不带 伞者(搭便车者)的效用为-3;不下雨时带伞者的效用为-1,不带 伞者的效用为0;如果两人都带伞,下雨时每人的效用为-2,不 下雨时每人的效用为1;如果两人都不带伞,下雨时每人的效 用为-5,不下雨时每人的效用为1。给出以下两种情况下的扩展 式表述(博弈树)和战略式表述:(1)两人出门前都不知道是否会 下雨,并且两人同时决定是否带伞(即每一方在决策时都不知道 对方的决策);(2)两人出门前都不知道是否会下雨,但丈夫先 决策,妻子在观察到丈夫是否带伞后才决定自己是否带伞;(3)
不完全信息静态博弈总结
不完全信息静态博弈总结不完全信息静态博弈1.不完全信息静态博弈特点:在博弈开始之前参与人之间的信息存在不确定性,但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
在不完全信息静态博弈中,在博弈开始前存在关于博弈人信息的不确定性,这个不确定像通常是博弈参与人的类型。
在市场进入博弈中不完全信息表现为:在位者的成本类型(高成本、低成本)在斗鸡博弈中不完全信息表现为:参与人的性格类型(强硬,软弱)2.海萨尼转换由于在不完全信息静态博弈中,参与人的类型存在不确定性,所以当一个参与人并不知道在与谁博弈时,博弈的规则是无法定义的,海萨尼提出了海萨尼转换解决这种不确定的问题。
解决方法:海萨尼指出,引入虚拟参与人——自然,由自然先决定参与人的不同类型,将不完全信息博弈转换为不完美信息博弈。
海萨尼通过引入“虚拟”参与人,将博弈的起始点提前,从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性。
这种通过引入“虚拟”参与人来处理不完全信息博弈问题的方法称为 Harsanyi转换。
3.不完全信息静态博弈均衡——贝叶斯纳什均衡贝叶斯博弈的定义:贝叶斯博弈包含以下五个要素:1.参与人集合BΓ={1,2,…,n};2.参与人的类型集合T1,…,T2;3.参与人关于其他参与人类型的推断P1(t-1 |t1),…,Pn(t-1n|tn);4.参与人类型相依的行动集A(t1),…, A(tn);5.参与人类型相依的支付函数贝叶斯博弈的战略:在贝叶斯博弈G={Γ;(Ti);(Pi);(A(ti);(ui(a(t);ti)}中,参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti);它包含了当自然赋予i的类型为ti时,i将从可行的行动集Ai(ti)中选择的行动。
贝叶斯纳什均衡:在贝叶斯博弈中,对于一个理性的参与人i,当他只知道自己的类型ti 而不知道其他参与人的类型时,给定其他参与人的战略s-i ,他将选择使自己期望效用(支付)最大化的行动 ai*(ti)。
第04讲 博弈的基本框架 - 学生
1
·明确一个博弈的四大构成要素(完美信息、不完美信息)。 ·精确理解信息集与策略(纯策略、混合策略、浓缩策略)这 两个重要概念。
·能够用博弈的扩展式与规范式来描述一个博弈问题。
·了解划分博弈类型的基本方法:完全信息静态、完全信息动 态、不完全信息静态、不完全信息动态。
2
博弈论的基本框架
而象棋则是一个完美信息博弈。
17
信息集
定义 4.2.1 一个信息集 H 是以决策点为元素的集合。
信息集需满足以下两个条件:
(1) 同一个信息集中的所有决策点必须紧接着完全相同的 可选行动。 (2) 同一个信息集中的决策点不能出现一个先于另一个出 现的情况。
18
信息集判断
信息集判断
19
信息集
信息集设臵是正确的。 它表示甲无法判断自己处于信息集四个决策点中的哪一个。 一个博弈者如果总能记住她所经历过的所有博弈路径,我们称她 具有完美回忆(Perfect Recall)。 在图中,我们可以断定甲已经忘记了她自己以前采取的行动以及 其对手的反应,否则她不可能完全分不清四个决策点。 所以我们说在图中,甲没有完美回忆。
22
信息集判断
信息集判断
23
信息集
图中的信息集设臵也是错误的。 它不符合定义4.2.1中的条件(2)。
(2) 同一个信息集中的决策点不能出现一个先于另一个出现的情
况。 信息集只对应一个博弈者,甲乙两人的决策点在同一个信息集内 造成概念上的混乱。
24
信息集判断
信息集判断
25
信息集
在图中的信息集虽然都对应着乙,但它也违反了定义4.2.1中的 条件(2)。 (2) 同一个信息集中的决策点不能出现一个先于另一个出现的情 况。
博弈论四种博弈类型
华为在阿根廷电信设备市场上的竞争博弈华为技术有限公司是一家总部位于中国广东省深圳市的生产销售电信设备的员工持股的民营科技公司,经过数十年的发展,成为全球最大的电信网络解决方案提供商,全球第二大电信基站设备供应商,同时也是全球第六大手机厂商,其海外市场的利润占到其总利润的75%。
在华为进入阿根廷电信设备市场之前,阿根廷的电信设备市场由爱立信、阿尔卡特-朗讯以及阿根廷本土设备供应商三家共同分享市场份额,接下来,我们将分析其不同条件下的博弈结果:1、完全信息情况下的静态博弈A 、纳什均衡:我们将上述三家公司统称为原有垄断者,华为称为虎视眈眈的潜在进入者,原有垄断者想要保住自己现有的垄断地位,就会想要阻止潜在进入者进入,在这个博弈中,原有垄断者有两种选择:一是进行斗争,打价格战;二是不斗争,默许其进入从而共同竞争,具体的支付矩阵结果表示如下:原有垄断者潜在进入者 进入 不进入根据纳什均衡的定义:各个参与者所做的是在给定其他参与者的策略是所能够做出的最好的一组策略。
当潜在进入者选择进入时,原有垄断者的最优选择是不斗争,获得70单位的利润;同样的,原有垄断者选择不斗争的情况下,潜在进入者的最优选择是进入,获得20单位的利润,从而获得一个要求纳什均衡的均衡(进入,不斗争),同理可以得出另一个纳什均衡(不进入,斗争)。
B 、占优策略:现假设华为公司已经获得了阿根廷电信集团的经营许可证,在严格管制情况下二者都不能以低于成本的价格进行价格战,同时禁止出现单一寡头垄断的情形,(各自均有正的利润)在这两种情况下考虑两者是否进行价格战的情况,具体支付矩阵如下所示:原有垄断者 低价 高价潜在进入者低价 高价对于潜在进入者而言,不论原有垄断者是否进行价格战,潜在进入者的占优策略都是进行价格战,因为在原有垄断者定低价时,潜在进入者定低价可以获得额外的20单位利润,在原有垄断者定高价时,潜在进入者定低价可以获得额外的10单位利润,从而确定华为必将进行价格战,在完全信息情况下,原有垄断者会将自己置于潜在进入者的位置进行决策,从而决定自己也要进行价格战,否则会失去更多的利润。
博弈论最全完整-讲解
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的
逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
例3:为什么教授如此苛刻?
问题是,一个好心肠的教授如何维持如 此铁石心肠的承诺?
他必须找到某种使拒绝变得强硬和可信 的方法。
拿行政程序或者学校政策来做挡箭牌 在课程开始时做出明确和严格的宣布 通过几次严打来获得“冷面杀手”的声
誉
导论
博弈均衡与一般均衡 博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型 主要参考文献
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
按照大家是否清楚对局情况下每个 局中人的得益。
“各种对局情况下每个人的得益是 多少” 是所有局中人的共同知识 (common knowledge)。
据“共同知识”的掌握分为完全信 息与不完全信息博弈。
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information)
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
不完全信息静态博弈:贝叶斯纳什均衡
不完全信息静态博弈:贝叶斯纳什均衡海萨尼1、前两篇⽂章讲的博弈都包含⼀个基本假设,即所有参与⼈都知道博弈的结构、规则、⽀付函数,因⽽称为完全信息博弈。
然⽽现实中,参与者并不了解其他参与者的⼀些信息,即不完全信息博弈(games of incomplete information)。
2、当对⼿有多种情况时,⽐如市场博弈的例⼦,在位者成本函数可能有需求⾼、需求中、需求低三种情况,那么可以采取“海萨尼转换”,即引⼊⼀个虚拟的参与⼈“⾃然”,⾃然⾸先⾏动,选择参与⼈的类型,被选择的参与⼈知道⾃⼰的真实类型,其他参与⼈并不清楚这个参与⼈的真实类型,但知道各种可能类型的概率分布。
如下图所⽰:3、这种情况下,可以通过海萨尼转换(Harsanyi transformation)把不完全信息博弈转换成完全但不完美信息博弈(complete but inprefer information)。
“不完美信息”指“⾃然”作出了选择,但其他参与⼈并不知道它的具体选择是什么,仅知道各种选择的概率分布。
4、在静态不完全信息博弈中,参与⼈同时⾏动,每个参与⼈的最优战略依赖于⾃⼰的类型,他不可能准确的知道其他参与⼈实际上会做出什么选择,但他能正确的预测其他参与⼈的选择是如何依赖于各⾃的类型的。
决策的⽬标就是在给定⾃⼰的类型和别⼈的类型依从战略的情况下,最⼤化⾃⼰的期望效⽤。
海萨尼定义了“贝叶斯纳什均衡”,给定⾃⼰的类型和别⼈类型的概率分布,每个参与⼈的期望效⽤达到了最⼤化,没有⼈有积极性选择其他战略。
5、举个例⼦,某⼀市场原来被A企业所垄断,现在B企业考虑是否进⼊。
B企业知道,A企业是否允许它进⼊,取决于A企业阻挠B企业进⼊所花费的成本。
如果阻挠的成本⾼,A企业的最优战略是默许B进⼊。
如果阻挠的成本低,A企业的最优战略是阻挠。
⽀付矩阵如下表所⽰:B企业并不知道A企业的阻挠成本是⾼还是低。
这⾥,某⼀参与⼈本⼈知道、其他参与⼈不知道的信息称为私⼈信息。
不完全信息静态博弈例子
不完全信息静态博弈例子博弈论是研究决策者在相互影响下进行决策的数学模型。
在博弈论中,不完全信息静态博弈是一种常见的博弈形式。
在这种博弈中,每个决策者只能获得有限的信息,无法完全了解其他决策者的策略和利益。
本文将通过一个例子来说明不完全信息静态博弈的特点和解决方法。
假设有两个商人A和B,他们同时决定是否进入一个新的市场。
进入市场的成本是固定的,但市场的利润是不确定的。
商人A可以选择进入市场或不进入市场,商人B也可以做出相同的选择。
然而,商人们只能获得有限的信息,无法准确了解对方的决策和市场利润。
商人A和B的利益是相互关联的。
如果两个商人都选择进入市场,他们将面临更大的竞争和风险,但如果市场利润高,他们也有机会获得更大的回报。
如果一个商人选择进入市场而另一个商人选择不进入市场,前者将面临更大的风险,但如果市场利润高,他将独享这一利润。
在这个例子中,商人A和B都面临着不完全信息的情况。
他们无法准确了解对方的决策和市场利润,只能根据自己的信息做出决策。
这种情况下,他们需要通过分析对方的可能策略和利益来做出最优的决策。
为了解决这个问题,我们可以使用博弈论中的概念和方法。
首先,我们可以建立一个博弈矩阵来描述商人A和B的策略和利益。
矩阵的行表示商人A的策略,列表示商人B的策略,每个单元格表示两个商人在不同策略下的利益。
然后,我们可以使用博弈论中的解概念来找到最优策略。
例如,纳什均衡是指在博弈中,每个决策者都选择了最优策略,而且没有动机改变自己的策略。
通过分析博弈矩阵,我们可以找到纳什均衡点,即商人A和B都选择了最优策略。
在这个例子中,纳什均衡点可能是商人A和B都选择进入市场,或者都选择不进入市场。
这取决于市场利润的不确定性和商人们的风险偏好。
如果市场利润高,商人们可能更倾向于进入市场以获取更大的回报;如果市场利润低,商人们可能更倾向于不进入市场以避免风险。
然而,由于不完全信息的限制,商人A和B可能无法准确预测市场利润。
博弈论与信息经济学不完全信息静态博弈
参加人i懂得自己旳类型 i i ,条件概率 pi pi (i i ) 描述 给定自己属于 i 旳情况下,参加人i有关其他参加人类型 i i旳不拟定性。我们用 G {A1,, An ;1,,n ; p1,, pn ;u1,,un} 代表这个博弈。
j
bi
aj cj
bi
aj cj
ui (vi bi ) P bi b j v j
1 2 (vi
bi ) P
bi
bj
vj
(vi
bi )
bi
aj cj
求导得:bi vi
1 2
vi
1 2
aj
由于bi vi
ci vi
ai
ci
1 2 , ai
1 2 aj
0
综上所述,bi vi
贝叶斯均衡是一组战略组合源自(a1.,a
2
.)
,使得对于每一
种
i
和每一种可能旳 ci
,战略
a
i
(.)最大化参加人
i
旳期望
效用函数
Ec
j
ui
(ai
,
a
j
ci
,
ci
)
。令
z
j
Pa j c j 1为均衡状
态下参加人 j 提供旳概率。最大化行为意味着,只有当参加
人 i 预期参加人 j 不提供时,参加人 i 才会考虑自己是否提
懂得(成本ci 是参加人 i 旳类型)。 c1和 c2 具有相同旳、独立旳定义在[c, c]
上旳分布函数,且是共同知识。
博弈的四种基本类型
博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。
例如,囚徒困境。
2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争。
3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈。
4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。
例如,信号传递博弈。
每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。
例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。
完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。
不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。
不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。
例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。
博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。
举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。
你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。
二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。
举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。
博弈论——不完全信息静态博弈讲义
3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。
不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。
如在拍卖商品或工程招投标中。
信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。
不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。
但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。
在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。
3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。
Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。
N 首先行动,决定每个局中人的特征。
每个局中人知道自己的特征,但不知道其他局中人特征。
这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。
这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。
局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。
用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。
第四章 不完全信息静态博弈-5
这 明 X ≠ 0, 2的 格 等 成 , 非 = 0 表 :当 IR 严 不 式 立 除 X
T = θ X θ X +T = θ ( X X ) +T
由IR 等式 1
= θ ( X X ) +θ X
Q IC2 T ≤θ X θ X +T, 提 T可 IC1仍 立 由 高 使 成 , 而 T ≤θ X θ X +T为 式 立 化 等 成 。
第四章
不完全信息静态博弈
一、不完全信息博弈和贝叶斯纳什均衡 二、贝叶斯纳什均衡应用举例 三、贝叶斯博弈与混合战略均衡 四、机制设计理论与显示原理
机制设计理论与显示原理
1.贝叶斯博弈和机制设计 2.拍卖机制设计 3.机制设计和显示原理 4.不完全信息与资源配置效率
贝叶斯博弈和机制设计
相关问题:卖者目的是得到一个 两种 一级密封价格拍卖——买者最优出价 最高的卖价 卖者最优要价 方式 双方叫价拍卖—— 应选何种方式→机制设计问题 买者最优出价 (mechanism design) →选择或设计一个博弈规则 (1)机制设计是一种特殊的不完全信息博弈 (2)机制设计的例子 (3)委托人设计机制的目的是最大化自己的期望效用函数 (4)满足参与约束的机制称为可行机制(feasible mechanism); 满足激励相容约束的机制称为可实施机制(implementable); 若同时满足参与约束和激励相容约束,则称为可行的可实施机制。 委托人的问题是选择一个可行的可实施机制使 (5)典型的机制设计是一个三阶段不完全信息博弈
假定卖者的供给成本为0,那么:
卖者的效益为T1+T2-0=T1+T2 (i两者有一个成交,且至少有一个Ti为0) 卖者的期望效用是
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
贝叶斯纳什均衡相关概念
一般地,我们采用θi 表示参与人i 的一个特定类型,Θi 表示参与人 i 所
有可能类型的集合(θi Θ i)。我们假定
数P(θ1,…,θn)是公共知识。
{i取自某个客观的分布函 }in1
我们称 pi (i | i )为参与人i 的条件概率,即给定参与人i 属于类型θi的
的一个特定行动。同理,参与人i 的效用函数也是类型依存的,采用ui (ai,
由此,给出不完全信息静态博弈的定义,即静态贝叶斯博弈如下: n人静态贝叶斯博弈的战略式表述包括:参与人的类型空间Θ1,…,Θn,条 件概率p1,…,pn,类型依存策略空间A1(θ1),…, An(θn),类型依存支付函数
u1 (a1,a-1,θ1),…, un (an,a-n,θn)。参与人i 知道自己的类型θi Θi,条件概
“海萨尼转换”。
自然与内生/外生的关系
• 由此得到海萨尼转换后的市场进入阻挠博弈:
N 高 [ p] 不进入 (0,300) 斗争 (-10,0) 进入 在位者 默许 (40,50) 进入者 不进入 (0,400) 斗争 (-10,100) 低 [1-p] 进入 在位者 默许 (30,80)
海萨尼转换后得到的纳什均衡称为贝叶斯纳什均衡,简称贝叶斯均 衡,该均衡和参与人的类型概率分布有关。
人的有限理性和阿罗不可பைடு நூலகம்性定理
理性人:在给定的约束条件下最大化自己的效用。
1、人的理性不一定能带来合理的结果。
例1、蜈蚣博弈
1 A 2 A 1 A 2 A 1 A 2 A (100,100)
D
D
D
D
D
D
(1,1)
(0,3)
(98,98)
(97,100) (99,99)
(98,101)
直觉告诉人类:从一开始采取“合作”策略是好的。但从逻辑的角度
第四讲 不完全信息静态博弈
浙江工业大学 经贸管理学院 曹柬:jcao@
一、贝叶斯纳什均衡
二、贝叶斯均衡的应用举例 三、贝叶斯博弈和混合策略均衡
一、贝叶斯纳什均衡
• 各参与人的策略空间、效用函数等都是“共同知识”的博
弈称为“完全信息博弈”。
我们将一个参与人所拥有的所有私人信息(即所有不是共
为“不合作”,但他难以确定在何处采取“不合作”策略。
这个悖论,有待采用新的数学理论或方法予以解决。
2、一个正常的人,在很多情况下,他的理性是有限的。
例2、分钱博弈
如果A在马路上捡到10000元(共100张100元),正巧被B看到。B要求分
钱。分钱方案由A提出,B表决。如果B同意,那么就按A提出的方案来 分;如果B不同意的话,两人将一无所获。
低成本情况:
进入者 不进入 (0,400) 斗争 进入 在位者 (-10,100) 默许
(-10,100) (30,80)
• 请问:进入者应该如何决策?
• 如果在位者有 n 种可能的不同成本函数,进入者似乎在与 n 个不同的 在位者博弈。在 1967 年以前,博弈论专家认为这样的不完全信息博 弈是没法分析的,因为当一个参与人不知道他在与谁博弈时,博弈 的规则是没有定义的。 • 常规思路是:假设进入者认为在位者为高成本的概率为 p,低成本的 概率为1-p,则进入者选择进入的期望利润为:p(40)+(1-p)(-10); 而选择不进入的期望利润为0。 • 因而,如果 p 1/ 5 ,进入者将进入。 • 根据这一思路,海萨尼提出处理不完全信息博弈的方法:引入一个虚 拟参与人“自然”;自然首先行动决定参与人的类型(如成本函数的 高低),参与人知道自己的类型,其他参与人不知道。这一方法称为
效用”问题上必须保持理性;而在“低效用”问题上可以采用非理性 的策略。如在购买彩票上,付出少量的金钱给购买者带来的损失不大, 可认为损失的效用在生活中可以忽略不计。
例4、投票悖论和阿罗不可能性定理
假如A、B、C三人晚上要一起活动,但对进行什么样的活动要投票表
决,有三个方案:T(聊天),M(看电影),D(跳舞)。对于这三 个活动,A的偏好顺序为T>M>D;B的为M>D>T;C的顺序为D>T>M。现在, 对这三个活动进行两两投票表决。 1、先是T和M表决,结果A、C投T,B选M,T>M,T获胜; 2、再对M和D表决,结果A、B选M,C选D,M>D,M获胜; 根据逻辑的传递性规则,我们由此得到T>M>D,即T>D; 3、如果再对T和D进行表决,发现D>T。
P=a-q1-q2,每个企业都有不变的单位成本。假设企业1的 单位成本c1是公共知识,而企业2的单位成本c2是不完全信 息。企业1知道企业2为低成本的概率为,为高成本的概 率为1- 。
不完全信息的存在对于博弈参与方各自收益(?)、以及整
体收益都带来了负效益。
2、不完全信息下的公共产品提供
• 两个参与人,i =1, 2,同时决定是否提供公共产品,每个参
现在考虑同样的博弈但具有不完全信息:每个参与人有相同的支付结
构,但如果他赢了的话,他的利润为(1+θi),这里θi是每个参与人的 类型,是私人信息。但θi在[-ε,+ε]上均匀分布,这是公共知识。
不完全信息抓钱博弈如下:
参与人 2 参与人 1 抓 不抓 抓 -1,-1 0,1+θ2 不抓 1+θ1,0 0,0
荷兰式拍卖:从一个非常高的初始标价逐步降低到有一个买者接受报价。 一级密封价格拍卖:出价最高的投标者获得拍卖品,并支付自己的出价 给卖者; 二级密封价格拍卖:出价最高的投标者获得拍卖品,并支付次最高出价。
1)
2)
英式拍卖:投标者按照递增的顺序宣布他们的出价,直到没有人愿意出更
高的价格,出价最高的投标者获得拍卖品; 荷兰式拍卖:从一个非常高的初始标价逐步降低到有一个买者接受报价。
例3、彩票购买问题
在现实中,有大量的人愿意掏少量的钱去买彩票。彩票的获奖率是很
低的,彩票发行者通过发行彩票来获得高额回报,他们肯定赢。因而,
对于理性的人而言,他是不会选择买彩票的。
但社会上仍有各种各样的彩票存在,也有大量的人来购买。可见,理
性人的假定是不符合实际情况的。
目前为止,对此提出的一种比较合理的解释为:一个正常人在“高
不完全信息的存在使得公共产品的供应量减少。
3、一级密封价格拍卖(招标)
拍卖和招标的相关知识:
这类博弈涉及双方信息、判断不一致情况下的决策问题 拍卖和招标有两个基本功能:揭示信息和减少代理成本。根据拍卖交易
制度的不同,分为四类拍卖:
1)
2) 3) 4)
英式拍卖:投标者按照递增的顺序宣布他们的出价,直到没有人愿意出 更高的价格,出价最高的投标者获得拍卖品;
贝叶斯博弈和混合策略均衡
海萨尼证明:完全信息情况下的混合策略均衡可以解释为不 完全信息情况下纯策略均衡的极限。 举两个例子予以说明。
一、抓钱博弈
参与人 2 抓 不抓 -1,-1 1,0 0,1 0,0
参与人 1
抓 不抓
这个博弈有两个非对称纯策略纳什均衡:(抓,不抓),(不抓,抓); 还有一个对称的混合策略纳什均衡:每个参与人以1/2的概率选择抓。
一级密封价格拍卖
每个投标人的策略是根据自己对该物品的评价和对其他投标人评价的判
断来选择自己的出价,赢者的支付是他对物品的评价减去他的出价,其
他投标人的支付为0。
在两个投标人的情况下,博弈的贝叶斯均衡为:每个投标人的出价是 其实际估计的一半。在不完全信息下,在均衡情况下,物品被估价最高 的投标人所得。但卖主只得到买者最高估价的一半。如果是完全信息, 卖主可以得到买者最高估价的全部。 当投标人有多个时,显然,b*(v)随着n 的增加而增加。也就是说,投 标人越多,卖主能得到的价格就越高;当投标人趋于无穷时,卖者几乎 得到买者价值的全部。因此,让更多的人加入竞标是卖者的利益所在。
条件下,与他有关的其他参与人属于θ-i的概率。如果类型的分布是独
立的,则
pi (i | i ) pi (i )
在不完全信息静态博弈中,所有参与人同时行动,参与人i 的策略空间Si 等同于他的行动空间Ai 。行动空间是类型依存的,即Ai依赖于他的类型 θi,可以采用Ai(θi)表示参与人i的类型依存行动空间。ai(θi) a-i,θi)表示。 A i(θi)表示i
二、恋爱博弈
女 男 足球 芭蕾 足球 2,1 0,0 芭蕾 0,0 1,2
这个博弈有两个非对称纯策略纳什均衡:(足球,足球),(芭蕾,芭 蕾);还有一个对称的混合策略纳什均衡:男的以2/3的概率选择足球,女 的以2/3的概率选择芭蕾。
考虑不完全信息下的恋爱博弈:
女 男 足球 芭蕾 足球 2+θm,1 0,0 芭蕾 0,0 1,2+θf
与人面临的是一个0-1决策问题,即提供 (ai=1) 和不提供
(ai=0)。参与人 1, 2 提供公共产品的成本分别为 c1,c2。博 弈的战略式表述如下:
参与人 2 参与人 1 提供 不提供 提供 1-c1,1-c2 1,1-c2 不提供 1-c1,1 0, 0
c2
1 2/3
0
2/3
1
c1
不完全信息下的公共产品提供区域 + 完全信息下的公共产品提供区域
由于θi在[-ε,+ε]上是均匀分布的,因而θi ≥ 0和θi < 0的概率各为1/2。可认 为每个参与人认为对方选择抓与不抓的概率各为1/2。 当ε 0时,该纯策略贝叶斯均衡就收敛为一个完全信息博弈的混合策 略纳什均衡。
因而,海萨尼说,完全信息博弈的混合策略均衡可以解释为不完全信息 情况下纯策略均衡的极限。
率
pi pi (i 描述给定自己属于 | i ) θi的情况下,其他参与人不同类型的
概率分布。我们采用G={A1,…,An;θ1,…,θn;p1,…,pn;u1,…,un}表示静态 贝叶斯博弈。 n人不完全信息静态博弈G={A1,…,An;θ1,…,θn;p1,…,pn;u1,…,un}的纯