第七章 不完全信息静态博弈资料
《西方经济学》第七章 博弈论
21
第五节
不完全信息动态博弈
对应于不完全信息动态博弈的均衡概念是精炼 精炼 贝叶斯均衡(perfect Bayesian equilibrium). 贝叶斯均衡 这个概念是完全信息动态博弈的子博弈精炼纳 什均衡与不完全信息静态均衡的贝叶斯纳什均 衡的结合.具体来说,精炼贝叶斯均衡是所有 参与人战略和信念的一种结合.它满足如下条 件:第一,在给定每个参与人有关其他参与人 类型的信念的条件下,该参与人的战略选择是 最优的.第二,每个参与人关于其他参与人所 属类型的信念,都是使用贝叶斯法则从所观察 到的行为中获得的.
22
贝叶斯法则 贝叶斯法则是概率统计中的应用所观察 到的现象对有关概率分布的主观判断 (即先验概率)进行修正的标准方法.
23
习
题
1. 什么是占优策略均衡?什么是重复剔除的占优策 略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性 博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为 0.两寡头所进行的是产量竞争.对于寡头产品 的市场需求曲线为P=30-Q,其中Q=Q1+ Q2.Q1是寡头1的产量,Q2是寡头2的产量. (1)假定两个寡头所进行的是一次性博弈. 如果两寡头同时进行产量决策,两个寡头各生产 多少产量?各获得多少利润?
25
�
第七章
第一节 第三节 第四节 第五节
博弈论
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
第一节 博弈问题概述
一,博弈的基本概念 二,博弈的分类
2
一,博弈的基本概念
博弈论 博弈论(game theory)是研究决策主体的 行为发生直接相互作用时候的决策以及这 种决策的均衡问题的. 博弈论的基本概念包括:参与人 行动 参与人,行动 参与人 行动, 战略,信息 支付函数,结果 均衡. 信息,支付函数 结果,均衡 战略 信息 支付函数 结果 均衡
不完全信息静态博弈
• (3)、信念不同出现的均衡的答案也会不同。 )、信念不同出现的均衡的答案也会不同 )、信念不同出现的均衡的答案也会不同。 • • • • (4)、由于参与者的收益函数具有不确定性,因而不可能通过 )、由于参与者的收益函数具有不确定性, )、由于参与者的收益函数具有不确定性 求解最大化的方式找到最优策略,换句话说, 求解最大化的方式找到最优策略,换句话说,就是什么策略都可 能成为最优策略,任何结果都有可能是博弈的均衡解。 能成为最优策略,任何结果都有可能是博弈的均衡解。这样得不 出结果。 出结果。
囚徒因境2 囚徒因境2的扩展式表达
2、囚徒因境2的扩展式的理解 、囚徒因境2
)、该博弈有两个开始点 行动的时候, • (1)、该博弈有两个开始点 )、该博弈有两个开始点(X1和X2),在囚徒 行动的时候, 和 ,在囚徒1行动的时候 囚 • 徒1分不清他到底位于哪一个节点,是X3、X4、X5,还是 。 分不清他到底位于哪一个节点, 分不清他到底位于哪一个节点 、 、 ,还是X6。 • (2)、博弈的扩展式有三个信息集,它们分别 )、博弈的扩展式有三个信息集 )、博弈的扩展式有三个信息集,它们分别{X1},{X2}和 , 和 • {X3,X4,X5,X6}。 , , , 。 • • • • )、由于该博弈有两个开始点 (3)、由于该博弈有两个开始点、可以理解为两个不同的博 )、由于该博弈有两个开始点、 但关键是,这两个博弈被一条虚线连接起来, 弈,但关键是,这两个博弈被一条虚线连接起来,因而它又是一 个博弈。它既是两个博弈又是一个博弈, 个博弈。它既是两个博弈又是一个博弈,从逻辑上来说这是矛盾 因而我们不可能直接分析它。 的,因而我们不可能直接分析它。
• 豪尔绍尼转换的主要思路 • 以类型概念构造对不完全信息的招述, 在此基础上构造统一的模型来描述局中人 在博弈中对不完全信息的处理,从而将不 完全信息博弈转化为不完美信息的完全信 息博弈。
7、不完全信息博弈
暗标拍卖的设计问题
实质:标价最高者以自己所报价格中标,不中标者 无任何损失。 对卖方的不利因素: 1、投标人少(或不识货),买方出价可能很低; 或者投标者进行串通。 2、投标人参与投标不中标没有任何代价,因此投 标人就不会积极投标,而采用低标价多次投标的 方法,从而使投标的价格偏低。
卖方对拍卖规则进行改进
边缘政策是一特殊类型的威胁声明。 边缘政策是一特殊类型的威胁声明。边缘不 是一座陡峭的悬崖,而是一道光滑的斜坡, 是一座陡峭的悬崖,而是一道光滑的斜坡, 它是慢慢变得越来越陡峭的。 它是慢慢变得越来越陡峭的。 启示:边缘政策的本质在于故意创造风险。 启示:边缘政策的本质在于故意创造风险。 这个风险应该大到让你的对手难以承受的地 而且风险超出你自己的控制, 步,而且风险超出你自己的控制,完全由对 方行为决定,从而迫使他按照你的意愿行事, 方行为决定,从而迫使他按照你的意愿行事, 以化解这个风险。 以化解这个风险。 人最理性的时候就是没有选择的时候。 人最理性的时候就是没有选择的时候。
绑票的价值: 取决于当事人避免 祸害的意愿和财力。
声明博弈
声明:口头或书面传递信息的形式。 包括阐明立场、威胁恐吓等。 声明的特点:没有成本。 声明者和接受声明者利益一致的时候或没有什么冲 突的时候,声明内容容易被接受。
房客声称不喜欢暖气太热 顾客说喜欢吃甜的或酸的的口味 工人声称自己是高素质的
为什么考试作弊仍然屡禁不止?
学生
作弊
老师
抓(抓住) 抓住) (5%) 不抓(抓不住) 不抓(抓不住) 95%) (95%) (?;-10) ;-10) 10 (? ;3 )
不作弊
(? ;0 ) (? ;0 )
学生作弊的预期收益 作弊 (-10)×5%+3×95%=2.35 不作弊 0×5%+0×90%=0
博弈论与信息经济学 不完全信息静态博弈
不完全信息和贝叶斯纳什均衡
定义:在静态贝叶斯G {A1, , An ; 1, , n ; p1, , pn ;u1, , un}博弈中, 纯策略贝叶斯纳什均衡是一个类型依存策略组
合a (θ) (a1 (1 ),
,
a
n
(
n
)),其中,每个参与人
i
在给定自己的类
型
i
和其他参与人依存策略
a
i
(θ i
不完全信息和贝叶斯纳什均衡
n 人不完全信息静态博弈的时间顺序为:
⑴自然给定类型向量θ 察到 i ,但参与人
(1, ,
j( i
n ) ,其中,i )只知道 p j
(θ j
i
|
,参与人 i 观 j ),观察不
到 i;
⑵参与人同时选择行动,参与人 i 从可行集 Ai (i )中选择行
动 a i,n 人的行动组合为a (a1, , an );
p(i ,i ) p(i )
p(i ,i ) p(i ,i )
ii
这里,p(i ) 是边缘概率。如果类型的分布是独立的,pi (i i ) p(i )
不完全信息和贝叶斯纳什均衡
贝叶斯纳什均衡是完全信息静态博弈纳什均衡概念在不完 全信息静态博弈上的扩展。不完全信息静态博弈又称为静 态贝叶斯博弈。 ◆定义:n人静态贝叶斯博弈的战略式表述包括:参与人的类 型空间 1, , n,条件概率 p1 ,..., pn ,类型依存战略空间
A11,..., An n ,和类型依存支付函数u1(a1, , an ;1),..., un (a1, , an ;n )
参与人i知道自己的类型 i i ,条件概率 pi pi (i i ) 描述 给定自己属于 i 的情况下,参与人i有关其他参与人类型 i i的不确定性。我们用 G {A1, , An ;1, ,n ; p1, , pn ;u1, ,un} 代表这个博弈。
不完全信息静态博弈
❑❑This chapter begins our study of games of incomplete information, also called Bayesian games. Recall that in a game of complete information the players’functions are common knowledge. In a game of incomplete information, in❑例如:❑❑K型集),既引入一个虚拟的参与人,记为定它的支付函数;它的唯一作用是决定TPN己,把P所有参与人同时行动,从各自的a由此变成BayesianDefinitionof an n-player static Bayesian game specifies the players’type spaces TP 1 , …, Pμ1known by player i, determines player i’s payoff function,member of the set of possible types, Ti’s belief Pn-1 other players’game by G={Aμ1Definition(T人si含了自然赋予己的策略空间的行动空间Definition T任意博弈方sias一个a❑❑❑❑如果在位者是高成本进入者进入者最优行为是进入,在位者最优行为是默许。
进入者如果在位者是低成本进入者进入者最优行为是不进入,在位者最优行为是斗争(一旦低成本者进入)。
进入者但进入者不知道在位者究竟是高成本还是低成本,因此,进入者的最优选择依赖于他对在位者成本的信念。
进入者❑❑❑❑❑❑❑❑❑❑❑❑❑❑❑❑❑❑❑❑❑❑❑E ❑q❑❑❑❑❑❑❑❑❑❑❑❑❑❑❑❑❑❑。
不完全信息静态博弈Harsanyi(1967-68)提出了一个不完全信息博弈的
β (x)F (x) + (N − 1)β(x) = (N − 1)x
– Typeset by FoilTEX –
4
我们以下定义均以纯策略为例:
不完全信息博弈 要求:虽然每个博弈者并不知道对手 的类型,但是所有类型出现的联合概率分布 F : Θ → [0, 1] 需为共同认识, 其中 Θ = Θ1 × Θ2... × ΘN。 博弈者 i 观察到私人类型 θi 后的效用可以表示为 Ui[s1(θ1), ..., sN(θN)|θi], Ui(·|θi) 是 在给定 θi 下的 von Neumann-Morgenstern 期望效用函 数, 因为其自变量均为随机变量。于是,
– Typeset by FoilTEX –
7
拍卖理论
现代拍卖理论是从 Vickery(1961) 开始的,80 年代以来 快速衍生出大量文献,其中以静态博弈为分析框架 的 拍卖问题主要是围绕收入相等法则(Revenue Equivalence Principle)和联系法则 (Linkage Principle) 两个基本原理展开。
方案 3? A 省在修路的情况下, 其支付额应在 50 万元 的修路费基础上,减去它给 B 省的外部性 30 万元,
– Typeset by FoilTEX –
20
方案 3 为: 如果 A 省上报值与 B 省收益和大于 100 万元,修路,但 A 省只支付 20 万元,B 省支付 50 万 元。
– Typeset by FoilTEX –
不完全信息静态博弈
假设我们观察到一个人干了一件好事,那么,这个人 是好人的后验概率为: P(GP |GT)= P(GT|GP定张三是好人的先验概率是0.5, 那么, 在观察到张三干了一就好事后,我们如何修正他是好 人的先验概率依赖于我们认为这间好事好到什么程度. 1,这是一件非常好的好事,好人一定干,坏人决不可能 干,即P(GT|GP)=1, P(GT|BP)=0
进入者似乎是与两个不同的在位者博弈, 一个是高成本的在位者,一个是低成本的 在位者.
不完全信息古诺模型 参与人的类型是成本函数.假设逆需求函数 为P = a-q1-q2,每个企业的单位成本不变, 为ci,则企业的利润函数为: πi = qi (a-q1-q2-ci), i=1,2
假设企业1的单位成本c1是共同知识,企 业2的单位成本可能是高的也可能是低的, 企业2知道自己的成本类型,但企业1只 知道企业2属于这两种类型的概率分布 和1-,是共同知识. 进一步假设 a = 2, h c 2 = 1.25, = 0.5 c1 = 1, l c2 = 0.75,
不完全信息静态博弈: 不完全信息静态博弈:贝叶斯纳什均衡
完全信息博弈的基本假设是所有的参与人都知 道博弈的结构,博弈的规则,和博弈的支付函 数.例如在"市场进入"博弈中,进入者知道 在位者的偏好,战略空间和各种战略组合下的 利润水平,反之亦然.当然,这个假设在许多 情况下是不成立的.
哈桑尼( 哈桑尼(Harsanyi)定义了"贝叶斯纳什均衡": )定义了"贝叶斯纳什均衡" 贝叶斯均衡是纳什均衡在不完全信息博弈中的 扩展:
在静态不完全信息博弈中,参与人同时行动,没有机 会观察到其他人的选择; 每个参与人仅知道其他参与人类型的概率分布而不知 道其真实类型; 他不可能准确地知道其他参与人实际上会选择什么战 略,但是,他能正确地预测到其他参与人的选择是如 何依赖于其各自的类型的 决策目标就是在给定自己的类型和别人的类型依从战 略的情况下,最大化自己的期望效用.
博弈论——不完全信息静态博弈讲义
3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。
不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。
如在拍卖商品或工程招投标中。
信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。
不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。
但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”()。
在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。
3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。
(1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。
N 首先行动,决定每个局中人的特征。
每个局中人知道自己的特征,但不知道其他局中人特征。
这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。
这种转换被称为“转换”,它将不完全信息博弈转换为完全但不完美信息博弈。
局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。
用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1Λ=。
不完全信息静态博弈中,局中人的类型存在多种可能,因而与局中人相关的各种概念都随其类型的不同而不同。
不完全信息静态博弈
图1
参与者的私人信息被称为他的“类型”。比如,在上例中员工有高和低两种类型。由于 公司没有任何私密信息,所以公司只有一种类型。正如在上例中一样,不完全信息是通过不 完美信息博弈来描述的,其中大自然选择参与者类型并秘密地告诉他。这些博弈被称为不完 全信息博弈或贝叶斯博弈。
正规地讲,不完全信息条件下的静态博弈如下所述。首先,大自然选择某个t = (t1, t2, . . . , tn) ∈ T ,其中选择每个t ∈ T的概率为p(t)。此时,ti ∈ Ti是参与者i ∈ N = {1, 2, . . . , n}的类型。然后,每个参与者观察到自己的类型,但不能观察到其它 参与者的类型。最后,在每个参与者知道自己类型的情况下,他们同时选择他们的行为。我 们以a = (a1, a2, . . . , αn) ∈ A表示所有参与者选择的任何一组行为,其中ai ∈ Ai是 参与者i选择的行为。这个博弈可用(N, T, A, p)表示。
我们用
表 示 i 在 已 知 自 己 类 型 是 ti 的 情 况 下 对 其 它 参 与 者 类 型 是
的看法 。[如果所有参与者的类型是互相关联的,我们可
能需要利用贝叶斯法则。但是如果它们是互相独立的,那么问题就简单些。在此情况下,参 与者不会更新他们的看法。]
现在我们可以定义贝叶斯纳什均衡了。在有n个参与者的一个不完全信息的静态博弈中,
不完全信息静态博弈
第八章 不完全信息静态博弈这一章里我们讨论不完全信息静态博弈,也称为贝叶斯博弈(Bayes)。
不完全信息博弈中,至少有一个参与者不能确定另一参与者的收益函数。
非完全信息静态博的一个常见例子是密封报价拍卖(sealed —bid auction):每一报价方知道自己对所售商品的估价,但不知道任何其他报价方对商品的估价;各方的报价放在密封的信封里上交,从而参与者的行动可以被看作是同时的。
静态贝叶斯博弈问题的主要来源也是现实经济活动,许多静态博弈关系都有不完全信息的特征,研究贝叶斯博弈不仅是完善博弈理论的需要,也是解决实际问题的需要。
8.1 静态贝叶斯博弈和贝叶斯纳什均衡为了更好的说明不完全信息与完全信息之间的差异,我们用一个典型静态贝叶斯博弈作为例子,自然的引进静态贝叶斯博弈概念。
考虑如下两寡头进行同时决策的产量竞争模型。
其中市场反需求函数由Q a Q P -=)(给出,这里21q q Q +=为市场中的总产量。
企业1的成本函数为1111)(q c q C =,不过企业2的成本函数以θ的概率为222)(q c q C H =,以θ-1的概率为222)(q c q C L =,这里H L c c <。
并且信息是不对称的:企业2知道自己的成本函数和企业1的成本函数,企业1知道自己的成本函数,但却只知道企业2边际成本为高的概率是θ,边际成本为低的概率是θ-1(企业2可能是新进入这一行业的企业,也可能刚刚发明一项新的生产技术)。
上述一切都是共同知识:企业1知道企业2享有信息优势,企业2知道企业1知道自己的信息优势,如此等等。
现在我们来分析这个静态贝叶斯博弈。
一般情况下,企业2的边际成本较高时选择较低的产量,边际成本较低时,选择较高的产量。
企业1从自己的角度,会预测到企业2根据其成本情况将选择不同的产量。
设企业1的最佳产量选择为*1q ,企业2 边际成本为H c 时的最佳产量选择为)(*2H c q ,企业2 边际成本为L c 时的最佳产量选择为)(*2L c q ,如果企业2的成本较高,它会选择)(*2H c q 满足:类似地,如果企业2的成本较低,)(*2L c q 应满足:从而,企业l 为了使利润最大化,选择*1q 应满足:三个最优化问题的一阶条件为:及 ]})()[(1(])([({211*21*2*1c c q a c c q a q L H ---+--=θθ 三个一阶条件构成的方程组的解为:及 3)1(2*1L H c c c a q θθ-++-=把这里的*1q 、)(*2H c q 和)(*2L c q 与成本分别为1c 和2c 的完全信息古诺均衡相比较,假定1c 和2c 的取值可使得两个企业的均衡产量都为正,在完全信息的条件下,企业的产出为3/)2(*j i i c c a q +-=。
不完全信息静态博弈:贝叶斯纳什均衡
不完全信息静态博弈:贝叶斯纳什均衡海萨尼1、前两篇⽂章讲的博弈都包含⼀个基本假设,即所有参与⼈都知道博弈的结构、规则、⽀付函数,因⽽称为完全信息博弈。
然⽽现实中,参与者并不了解其他参与者的⼀些信息,即不完全信息博弈(games of incomplete information)。
2、当对⼿有多种情况时,⽐如市场博弈的例⼦,在位者成本函数可能有需求⾼、需求中、需求低三种情况,那么可以采取“海萨尼转换”,即引⼊⼀个虚拟的参与⼈“⾃然”,⾃然⾸先⾏动,选择参与⼈的类型,被选择的参与⼈知道⾃⼰的真实类型,其他参与⼈并不清楚这个参与⼈的真实类型,但知道各种可能类型的概率分布。
如下图所⽰:3、这种情况下,可以通过海萨尼转换(Harsanyi transformation)把不完全信息博弈转换成完全但不完美信息博弈(complete but inprefer information)。
“不完美信息”指“⾃然”作出了选择,但其他参与⼈并不知道它的具体选择是什么,仅知道各种选择的概率分布。
4、在静态不完全信息博弈中,参与⼈同时⾏动,每个参与⼈的最优战略依赖于⾃⼰的类型,他不可能准确的知道其他参与⼈实际上会做出什么选择,但他能正确的预测其他参与⼈的选择是如何依赖于各⾃的类型的。
决策的⽬标就是在给定⾃⼰的类型和别⼈的类型依从战略的情况下,最⼤化⾃⼰的期望效⽤。
海萨尼定义了“贝叶斯纳什均衡”,给定⾃⼰的类型和别⼈类型的概率分布,每个参与⼈的期望效⽤达到了最⼤化,没有⼈有积极性选择其他战略。
5、举个例⼦,某⼀市场原来被A企业所垄断,现在B企业考虑是否进⼊。
B企业知道,A企业是否允许它进⼊,取决于A企业阻挠B企业进⼊所花费的成本。
如果阻挠的成本⾼,A企业的最优战略是默许B进⼊。
如果阻挠的成本低,A企业的最优战略是阻挠。
⽀付矩阵如下表所⽰:B企业并不知道A企业的阻挠成本是⾼还是低。
这⾥,某⼀参与⼈本⼈知道、其他参与⼈不知道的信息称为私⼈信息。
不完全信息静态博弈
吴建设
不完全信息
一个寓言故事的启示:
有一次,伊索进城,半路上遇见一位法官。法官 严厉的盘问:“你要去哪儿?”伊索回答说: “不知道。”于是,法官起了疑心,将伊索关进 了监狱,严加审问。“法官先生,要知道,我讲 的是实话。”伊索说,“我确实不知道我会来监 狱。” 启示:我们不可能了事如神,更不可能预测未来, 不确定性就像日出日落一样不可避免。 策略:我们没办法做到无所不知,也不止于一无 所知,应尽可能利用所知的一切寻求最优行动。
人本人知道、其他参与人则不知道的信息称为私人信息。某一参与人所拥有的全
部私人信息称为他的类型。在上述例子中,阻挠成本就是 A的私人信息。高阻挠 成本和低阻挠成本则是两种不同的类型。
A 高成本 低成本 默许 阻止 阻止
B
默许
进入
不进入
40, 50
0, 300
-10, 0
0, 300
30, 80
0, 400
拟的局中人——“自然”。自然首先行动,它决定每个参与人
的特征。每个参与人知道自己的特征,但不知道别的参与人特 征。这种方法将不完全信息静态博弈变成一个两阶段动态博弈, 第一个阶段是自然N的行动选择,第二阶段是除N外的参与人的 静态博弈。这种转换被称为“海萨尼转换”,这个转换把“不 完全信息”转变成为完全但不完美信息,从而可以用分析完全 信息博弈的方法进行分析。
在博弈中,其中有参与人也许对对方博弈的收益函数 并不十分清楚,可采用概率分布来表示其类型。也就 是基于概率对博弈进行分组建立博弈收益函数。 比如甲与乙选择策略时,可以这样考虑,甲选择某一 种策略时,乙选择策略有几种,乙的这些策略按发生 的概率进行分组。通常构建一个博弈树就可以较好地 表达这一切。 海萨尼的观点关键在于假定:对于策略选择发生的概 率是一个共同知识。先验概率是作为博弈规则的一部 分存在,因此,一个参与人必须是持有关于其它参与 人类型的先验信念,同时,在观察到他们的行动后, 就要假定他们遵循着均衡的行为,然后更新自己的信 念。
不完全信息静态博弈a
逆向归纳法的求解步骤
首先确定博弈的最后一个阶段,分析参与人在该阶段的最优策略;然后逐步向前推导,将每个阶 段的最优策略组合起来,形成整个博弈的最优策略。
线性规划法
01
线性规划法的基本思 想
将博弈问题转化为一个线性规划问题 ,通过求解线性规划的最优解来得到 博弈问题的解。
02
线性规划法的适用条 件
适用于具有线性目标函数和线性约束 条件的博弈问题。
03
线性规划法的求解步 骤
首先构建博弈问题的线性规划模型, 包括目标函数和约束条件;然后使用 线性规划算法求解该模型,得到最优 解;最后将最优解转化为博弈问题的 解。
启发式搜索算法
启发式搜索算法的基 本思想
利用启发信息来指导搜索过程, 提高搜索效率。
随着计算机技术的发展,博弈论在人工智能、机 03 器学习等领域也得到了广泛应用。
完全信息与不完全信息
01 完全信息是指参与方在博弈过程中拥有所有相关 信息,能够做出最优决策。
02 不完全信息是指参与方在博弈过程中只能获取部 分信息,无法做出最优决策。
02 在现实世界中,由于信息不对称和不确定性等因 素的存在,不完全信息博弈更为常见。
不完全信息静态博弈 a
目录
• 博弈论基本概念 • 不完全信息静态博弈原理 • 经典案例分析 • 现实应用举例 • 求解方法与算法设计 • 未来发展趋势及挑战
01
博弈论基本概念
博弈论定义与发展
博弈论是研究决策过程中各参与方相互作用和影 01 响的理论。
博弈论起源于数学领域,后逐渐应用于经济学、 02 政治学、社会学等多个领域。
经济博弈论7fcih
设博弈方j的策略为bj (v j ) a j c jv j ; P{bi bj} 0
mbai x[(vi
bi )P{bi
aj
c jv j}]
mbai x[(vi
bi )P{v j
bi
a j }] cj
mbai x[(vi
bi )
bi
aj cj
]
bi (vi )
vi
aj 2
,当vi
7.1.4 贝叶斯纳什均衡
在静态贝叶斯博弈G {A1,, An;T1,,Tn; p1,, pn;u1,, un} 中,博弈方i的一个策略,就是自己各种可能类型ti (ti Ti )的一个 函数Si (ti )。Si (ti )设定对于“自然”可能为博弈方i抽取的各种 类型ti,博弈方i将从自己的行为空间Ai中相应选择的行动ai 。
0 x
vb vb vs 1/ 4 1
交易
1 vs vb vs
0
1 vs
7.4 拍卖规则设计问题和揭示原理
7.4. 拍卖规则设计问题
投标人较少,且是不识货者时,买方的出价很可能会 非常低,从而使拍卖的商品得不到应有的价格,甚至 会大大低于其价值,如果投标人之间再形成某种形式 的串通,则卖方更吃亏了
,,
tn'
)
qn
(t1'
,,
tn'
)
1
必须成立
只有两个投标人,他们的估价类型V1、V2都是[0,1]上标准分布 1.两投标人同时声明V1、V2
2.投标人i中标的概率为qi Vi* / 2,中标的价格为pi Vi* /
Eui
Vi' 2
(Vi
Vi' )
7.不完全信息静态博弈
− i∈Θ− i
pi (θ − i | θi ) = p (θ − i )
3.1.3 贝叶斯纳什均衡
一、贝叶斯静态博弈的基本式
1、n人完全信息静态博弈的基本式:G=(I,S,u),其中
S = {S1 ,..., Sn }, Si 参与者i的策略空间;u = (u1 ,..., un ) ui ( s1 ,..., sn )是i在策略组合(s1 ,..., sn)下的收益
3 a − 2c + c2 * q1 = 3
2 2
(3)若 c2 = cH 时,且该信息为企业1完全掌握,则回到完全 信息静态博弈,均衡为: * * q2 (cH ) = (a − 2cH + c) / 3 q1 = (a − 2c + cH ) / 3 类似的,若 c2 = cL 时,均衡为: * * q2 (cL ) = (a − 2cL + c) / 3 q1 = (a − 2c + cL ) / 3
3 a − 2cH + c 1 − p * + ( cH − c L ) 解此方程组得: 解此方程组得: q2 (cH ) = 3 6 a − 2cL + c p * q2 (cL ) = + ( cH − cL ) 3 6
对以上均衡(预测)解进行分析: 对以上均衡(预测)解进行分析: 1 * * (1)由解得: q2 (cL ) − q2 (cH ) = (cH − cL ) > 0 2 这表明企业2高成本时的最佳产量<低成本时的,合理 合理; 合理 a − 2c2 + c (2)当 cH = cL = c2 时,就有: q * (c ) = 这就是企业1、2的边际成本 分别是 c、 c2 时,完全信息 下的库诺特均衡。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
经济博弈论 张卫国 教授
2018/12/31
7.1.2 静态贝叶斯博弈的一般表示
静态贝叶斯博弈的一般表达式为: G={A1,…,An ;T1,…,Tn;u1,…,un} 其中Ai为博弈方i的行为空间(策略空间), Ti是博弈方i的类型空间,博弈方i的得益 ui=ui(a1,…,an,ti)为策略组合(a1,…,an ) 和类型ti的函数。
q1*
a 2C1 CH (1 )CL ) 3
经济博弈论 张卫国 教授 2018/12/31
7
7.1.1 不完全信息的古诺模型
与完全信息古诺模型比较 完全信息古诺模型中的的产量
a 2C1 C2 q 3
* 1
q2*
a 2C2 C1 3
CH C2
max[(a q1* q2 ) CH ]q2
q2
5
经济博弈论 张卫国 教授
2018/12/31
7.1.1 不完全信息的古诺模型
q2*(CL)满足: q1*满足:
q1
max[(a q1* q2 ) CL ]q2
q2
max{ [a q1 q2* (CH ) C1 ]q1 (1 )[a q1 q2* (CL ) C1 ]q1}
7.1 静态贝叶斯博弈和贝叶斯纳什均衡
不完全信息的古诺模型 静态贝叶斯博弈的一般表示 海萨尼转换 贝叶斯纳什均衡
2
经济博弈论 张卫国 教授
2018/12/31
7.1.1 不完全信息的古诺模型
定义:假定在古诺模型中,各个厂商对彼此的 得益不是共识的,则该模型称为“不完全信息 古诺模型”。由于模型中的两个厂商在信息方 面是不平等,不对称的,因此有时也称其为 “不对称信息的古诺模型”。
12
经济博弈论 张卫国 教授
2018/12/31
7.1.3 海萨尼转换
基本思路:将静态博弈转化为动态博弈 (1)假设有一个名为“自然”的博弈方0,该博弈 方的作用是先为其他每个博弈方抽取他们的类型, 抽取的这些类型构成类型向量 t=(t1,…,tn),其中 ti Ti ,i=1,…,n。 (2)“自然”让每个博弈方知道到自己的类型, 但却不让其他博弈方知道。
4
经济博弈论 张卫国 教授 2018/12/31
7.1.1 不完全信息的古诺模型
厂商2在边际成本是较高的CH时会选择较低的产 量,而在边际成本为较低的CL时会选择较高的产量。 厂商1在做出自己的产量决策时当然会考虑厂 商2的这种行为特点。设厂商1的最佳产量为q1* 厂商2的边际成本为CH时的最佳产量为q2*(CH), 边际成本为CL时的最佳产量为q2*(CH),根据上面 的假设, q2*(CH)满足下式:
即厂商2是在不同边际成本下分别根据q1*求出使自 己取得最大得益的产量。而厂商1则根据q2*(CH) 和q2*(CL)及它们出现的概率求出使自己获得最 大期望得益的产量。
6
经济博弈论 张卫国 教授
2018/12/31
7.1.1 不完全信息的古诺模型
上述三个最大值问题的一阶条件为:
q2* (CH ) a q CH 2
经济博弈论 张卫国 教授 2018/12/31
9
7.1.2 静态贝叶斯博弈的一般表示
在静态贝叶斯博弈中,关于得益的信息是不公开 的,如何表示这种特征呢? 将博弈中某些博弈方对其他博弈方得益的不 了解转化成对这些博弈方“类型”的不了解,是 一种“追根溯源”的方法。这里的类型是相应的 博弈方自己清楚而他人无法肯定的私人内部信息、 有关情况或数据等。
第七章
不完全信息静态博弈
主要内容 针对不完全信息静态博弈,本章给出了一 个把得益不确定的博弈转化为对类型的不确定 的方法,即“海萨尼转换”。本章还较仔细的 讨论了几种典型的不完全信息博弈。 重点 1. 静态贝叶斯博弈的一般表示 2. 海萨尼转换及其思想
1
经济博弈论 张卫国 教授 2018/12/31
* 1
* a q 1 CL q2* (CL ) 2
1 q1* { [a q2* (CH ) C1 ] (1 )[a q2* (CH ) C1 ]} 2
解由这三个方程构成的方程组得:
q2* (CH ) a 2CH C1 1 (CH CL ) 3 6 q2* (CL ) a 2CL C1 (CH CL ) 3 6
CL C2
q2* (CH ) q2*
q (博弈论 张卫国 教授
2018/12/31
7.1.2 静态贝叶斯博弈的一般表示
完全信息博弈的一般表达式为G S1,, Sn ; u1,, un S i 为博弈方i的策略空间,即他的全体可选策略集 合,而 u i为博弈方i的得益函数。在完全信息静 态博弈中,一个博弈方的一个策略就是一次选 ai 表示博弈方i的一个行为, 择或一个行为,用 Ai 表示他的行为空间(全部可能的 ai 构成 而用 的集合),则完全信息静态博弈可表达为 G A1,, An ; u1,, un 其中 u i 为各博弈方都相互 u i 就随之确定了,并 知道的,即当 ai 确定后, 且是公开的信息和知识。
10
经济博弈论 张卫国 教授
2018/12/31
7.1.2 静态贝叶斯博弈的一般表示
用ti表示博弈方i的类型,并用Ti表示博弈方i的 类型空间(全部可能类型的集合),则 ti Ti 。 用ui(a1,…an,ti)来表示博弈方i在策略组合 (a1,…,an)下的得益,因为这个得益函数中 含有一个反应该博弈方类型的变量ti,并且该变 量的取值是博弈方i自己知道而其他博弈方并不 清楚的,因为正好可以反应静态贝叶斯博弈中 的信息不完全的特征。
3
经济博弈论 张卫国 教授
2018/12/31
7.1.1 不完全信息的古诺模型
描述:市场需求为P(Q)=a-Q,其中Q为市场总产 量,为两厂商产量q1和q2之和,即Q= q1+q2。厂 商1的成本函数为C1= C1( q1)= C1 q1,即无固 定成本,边际成本为C1,它是两个厂商都清楚的。 而厂商2的成本函数却只有厂商2自己完全清楚, 厂商1只知道有两种可能性,一种是C2= C2( q2) = CH q2,概率为θ,另一种是C2= C2( q2)= C Lq2,概率为1-θ,而CH>CL,也即边际成本有高、 低两种可能。