不完全信息博弈汇总

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


给定参与人i知道自己的类型θ
• • •

i而不知道其他参与人的 类型θ -i,参与人i将选择ai(θ i) 最大化自己 的期望效用。参与人i的期望效用函数定义如 下: Vi=Σ pi(θ -i︱θ i) ui(ai,a-I;θ i,θ -i) 贝叶斯纳什均衡: 策略组合a﹡= (a1﹡ (θ 1), … an﹡ (θ n))是 一个贝叶斯纳什均衡,如果对于所有的i, ai﹡ (θ i) ∈argmax Σ pi(θ -i︱θ i) ui(ai,ai﹡;θ i,θ -i)
• 那么q2L =1/2(5/4-q1); q2H =1/2(3/4-q1) • 企业1不知道企业2的真实成本从而不知道企 业2的最优反应是q2L还是q2H ,因此企业1选 择q1最大化下列期望利润函数: • E u1 =1/2 q1 (1- q1- q2L )+ 1/2 q1 (1- q1q2H ) 解一阶条件可得企业1的反应函数: • q1﹡= 1/2 (1- q1H- q2L )=1/2(1-Eq2) • 解反应函数可得贝叶斯均衡为: • q1﹡=1/3; q2L﹡=11/24; q2H﹡=5/24
贝叶斯均衡的应用—不完全信息的 古诺模型
• P=a-q1-q2,每个企业都有不变的单位 成本。企业i的利润函数如下: • Ui(q1,q2)=qi[a-q1-q2-ci] • 假定企业1的单位成本c1是共同知识,企业 2的单位成本可能是c2L也可能是c2H,企业2 知道自己的成本是c2L还是c2H,但是企业1 只知道c2=c2L的可能性为p, c2=c2H的可能 性为1- p; p是共同知识。
Baidu Nhomakorabea
• 现在让我们比较一下不完全信息下的贝叶 斯均衡与完全信息下的纳什均衡。如果企 业2的成本是c2 =3/4,企业1知道c2 =3/4, 那么反应函数分别为: q1﹡= 1/2 (1- q2 ) • q2﹡= 1/2 (5/4- q1 )纳什均衡产量 • q1LNE =1/4, q2LNE =1/2。 • 如果企业2的成本是c2 =3/4 ,企业1知道c2 =3/4,纳什均衡产量: q1HNE =5/12, q2HNE =1/6
• q2LNE =1/2> q2L﹡=11/24 • q2HNE =1/6< q2H﹡=5/24 • 企业2的均衡产量与完全信息时的均衡产量有差异 的原因,在于企业2决定自己的产量时,必须考虑 企业1不知道企业2的真实成本,无法根据企业2 的真实成本决策的因素。例如当企业2实际是高成 本时,由于成本较高他理应生产较少,但这里他 也要考虑企业1不知道自己是高成本,因此企业1 选择的产量会小于知道企业2是高成本是的产量因 此企业2应该对此作出反应,适当多生产一些,产 量高于完全信息古诺模型时高成本时的均衡产量 是合理的。
• 为了更具体一些,我们假定 a=2,c1=1,c2L=3/4,c2H=5/4,p=1/2(企业2的成 本期望值与企业1的成本相等)。给定企业2知 道企业1的成本,企业2将选择q2最大化利润 函数:U2 =q2 (t-q1﹡- q2 ) • 这里t=a-3/4=5/4或t=a-5/4=3/4,信赖于企业2 的实际成本。一阶条件可得到企业2的反应函 数为: q2 ﹡(q1;t)=1/2(t-q1) • 就是说企业2的最优产量不仅依赖于企业1的 产量,而且领带于自己的成本。
• 比如说,一个企业选择什么产量依赖于它 的成本,一个人能干什么事情依赖于他的 能力。我们用Ai(θ i)表示参与人i的类型依 存行动空间,ai(θ i) ∈ Ai(θ i)表示i的一 个特定行动。类似地,参与人i的支付函数 也是类型依赖的,比如说,生产同样的产 量,不同成本函数的企业利润不同;工作 同样时间,不同类型的人得到的效用不同。 用ui(ai,a-i;θ i)表示参与人i的效用函数。
• 如同纳什均衡一样,贝叶斯均衡在本质上是 一个一致性预测,即每个参与人i都能正确预 测到具有类型θ j的参与人j将选择aj﹡ (θ j), 因此参与人i有关其他参与人的信念(条件概 率)的信念并不进入均衡的定义,唯一重要 的是参与人 i自己的信念pi和其他参与人的类 型依存策略a-i(θ -i) 。当涉及到不完全信息 动态博弈时,参与人有关其他参与人的信念 就是重要的,一个参与人可以通过观测其他 参与人的行动来修正信念或推断后者的类型。
• N人静态贝叶斯博弈的策略式表达包括:参与 人的类型空间Θ 1, …, Θ n,条件概率p1, …, pn,类型依存策略空间A1(θ 1) , …, An(θ n) , 和类型依存支付函数ui(ai,a-i;θ i)。参与人i知 道自己的类型,条件概率pi= pi(θ -i︱ θ i)描 述给定自己属于θ i的情况下,参与人i有关其 他参与人类型θ -i的不确定性。我们用 G=﹛A1, …An; θ 1,…θ n; p1,…pn ; u1,…un ﹜代表这个博弈。
不完全信息博弈
贝叶斯纳什均衡(Bayesian N.E)
• B.N.E是完全信息静态纳什均衡在不完全信息 博弈上的扩张,又被称为静态贝叶斯博弈 (the static Bayesian games) • 为了定义贝叶斯纳什均衡,我们首先要说明参 与人的策略空间和支付函数。如同在完全信息 博弈中一样,在不完全信息静态博弈中,所有 参与人同时行动,参与人i的策略空间Si等同 于他的行动空间Ai。但是在不完全信息静态博 弈中,参与人i的行动空间Ai可能依赖于他的 类型θ i,也就是行动空间是类型依赖的。 (type-contingent)
• 静态贝叶斯博弈的时间顺序如下:⑴自然选择类型 向量θ =( θ 1,…θ n ),参与人i观测到θ i,但 参与人j只知道pj(θ -j︱ θ j),观测不到θ i;⑵N 个参与人同时选择行动a=(a1, …,an);⑶参与人i得 到ui(ai,a-i;θ i)。 • 如果所有参与人的类型空间(或信息集)只包括一 个元素,则不完全信息静态博弈就变化成完全信息 静态博弈。 • 我们假定Ai(θ i)和ui(ai,a-i;θ i)是共同知识;就是 说尽管其他参与人并不知道参与人i的类型θ i,但 他们知道参与人i的策略空间和支付函数是如何依赖 于他的类型的。或者说如果知道θ i,也就知道Ai和 ui。当我们说其他参与人不知道i的支付函数,指的 是不知道支付函数是ui(ai,a-i;θ i)还是ui(ai,a-i; θ i ′)
相关文档
最新文档