3 不完全信息静态博弈
不完全信息静态博弈
由于θi在[-ε,+ε]上是均匀分布的,因而θi ≥ 0和θi < 0的概率各为1/2。可认 为每个参与人认为对方选择抓与不抓的概率各为1/2。 当ε 0时,该纯策略贝叶斯均衡就收敛为一个完全信息博弈的混合策 略纳什均衡。
因而,海萨尼说,完全信息博弈的混合策略均衡可以解释为不完全信息 情况下纯策略均衡的极限。
策略贝叶斯均衡是一个类型依存战略组合
{ai* (i )}in,满足: 1
* ai* (i ) arg max pi (i | i )ui (ai , ai (i );i ,i ) ai
1、不完全信息古诺模型(板书)
• 在这个模型中,参与人的类型是成本函数。逆需求函数为
荷兰式拍卖:从一个非常高的初始标价逐步降低到有一个买者接受报价。 一级密封价格拍卖:出价最高的投标者获得拍卖品,并支付自己的出价 给卖者; 二级密封价格拍卖:出价最高的投标者获得拍卖品,并支付次最高出价。
1)
2)
英式拍卖:投标者按照递增的顺序宣布他们的出价,直到没有人愿意出更
高的价格,出价最高的投标者获得拍卖品; 荷兰式拍卖:从一个非常高的初始标价逐步降低到有一个买者接受报价。
看,一开始应采取“不合作”的策略。究竟是直觉正确,还是逻辑正
确? 博弈论专家Ken Binmore实验发现,不会出现一开始选择“不合作”
策略而使双方收益为1的情况。双方会主动选择“合作”策略,从而 走向合作。但逆向归纳法在某一步肯定会起作用。只要逆向归纳法在 起作用,“合作”便不能进行下去。
这个悖论在现实中的对应情况是,参与人不会在开始时确定他的策略
现在考虑同样的博弈但具有不完全信息:每个参与人有相同的支付结
构,但如果他赢了的话,他的利润为(1+θi),这里θi是每个参与人的 类型,是私人信息。但θi在[-ε,+ε]上均匀分布,这是公共知识。
博弈论与经济分析(不完全信息静态)
博弈论与经济分析(不完全信息静态)第四章 不完全信息静态博弈不完全信息意味着至少有一个参与者不能确定另一个参与者的收益函数,或者说类型。
我们用一个例子来引入要讨论的问题: 例:信息不对称条件下的古诺模型 市场:P(Q)=a-Q ,Q=q1+q2 企业1:C1(q1)=cq1企业2:以θ的概率为高成本,即222()H C q c q =;以1θ-的概率为低成本,即222()L C q c q =。
当然,H L c c >。
信息不对称:企业2知道自己的成本,也知道企业1的成本;企业1知道自己的成本,但是只知道企业2成本状况的概率分布。
以上都是公共信息,即企业1知道企业2享有信息优势,企业2知道企业1知道,企业1也知道企业2知道企业1知道……如此等等。
解题:企业1会预测企业2在不同情况下的最优选择:当企业2为高成本时2122max[()]H q a q q c q *---当企业2为低成本时2122max[()]L q a q q c q *---既然企业只知道企业2成本情况的概率分布,则企业1只能根据上述预测最大化自己的期望收益:1121121max [(())](1)[(())]H L q a q q c c q a q q c c q θθ**---+----以上三个优化问题的一阶条件为:12()2H H a q c q c **--=12()2LL a q c q c **--=221[()](1)[()]2H L a q c c a q c c q θθ***--+---=联立求解:221()()36H H H L a c c q c c c θ*-+-=+-22()()36L L H L a c c q c c c θ*-+=-- 12(1)3H L a c c c q θθ*-++-=比较该结果与“完全信息条件”条件下结果的不同。
作业:说明企业2在两种成本下是否因为“信息优势”得到了好处?是应该巩固该优势还是向企业1公开信息?一、 静态贝叶斯博弈的标准表述完全信息静态:G={S1,…Sn;u1,…,un}在静态博弈条件下,策略S 就是一个行动A (当然,动态博弈则不同),于是我们可以写作G={A1,…An;u1,…,un}。
博弈
1.两个人(甲、乙)通过一快递公司运送同样一件易碎品,结果途中都损坏,要求快递公司赔偿,快递公司只能对商品做一个粗略的估价(商品价格不超过500),于是让甲、乙分别在500元内写下货物价格,如果两个人写的价格一样,快递公司则按所写数额赔偿;如果两个人价格不一致,则按照低价进行赔偿,并且对报价低的人奖励50,对报价高的人罚款50。
甲、乙双方进行博弈,最后快递公司将获利。
不完全信息静态博弈2.7个人分一笔奖金,分配方式为:第一个人提出方案,如果同意这种方案的人数达到3人,提议通过,否则此人无权分享奖金,由剩余的人进行同样的过程。
并且提议顺序是既定的。
完全信息动态博弈3.定义物品的基本价值(公允价值),当物品的实际交易价格大于次基本价值,卖方获利,买房亏损,且两者数值相等,反之,买房获利,卖方亏损。
零和博弈4.两个人比武,双方都不知道对方实力。
比赛项目是徒手击碎转头,甲先一掌击碎3块,乙同样击碎3块。
于是,甲又拿来5块,一掌击碎,乙心中没底,放弃。
不完全信息动态博弈5.一名篮球前锋和队友在蓝下面对着对方的一个后卫时,形成了二打一的局面,该前锋可以选择直接投篮,也可以选择传球给队友,但根据经验,传球过人的成功率更大,最终前锋选择传球。
完全信息静态博弈6.甲到菜场去买菜,摊主众多,一摊主为了能与甲建立持久的销售关系,保持其信誉,不会对甲进行出售次品或者高价出售的行为,最后甲与摊主进行持久交易。
重复博弈7.一个收藏家,去农村淘宝,在一个农户家发现主人用珍贵的碟子做猫食碗,于是假装要买猫,主人不卖,收藏家表示愿意以高于猫本身价格两倍的钱购买这只猫,主人同意。
成交后,收藏家不在意地说:“这个碟子您已经没猫用不着了,就一起送我吧。
”,主人却说:“我用这个碟子已经卖出去10只猫了。
”不完全信息静态博弈8.两个人玩抛硬币的游戏,正面甲给以十元,背面乙给甲十元,为了公平起见,丙做裁判,每一局甲和乙都需要分别给丙一元,作为报酬,这项活动对甲、乙双方来说为负和博弈9. 各个国家通过比较优势进行贸易分工,充分利用资源,提高整体福利正和博弈10.跳蚤市场中卖方:甲;买方:乙。
博弈论——不完全信息静态博弈
3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。
不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。
如在拍卖商品或工程招投标中。
信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。
不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。
但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。
在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。
3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。
Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。
N 首先行动,决定每个局中人的特征。
每个局中人知道自己的特征,但不知道其他局中人特征。
这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。
这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。
局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。
用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。
博弈论第六章不完全信息静态博弈题库
博弈论第六章不完全信息静态博弈题库【原创版】目录一、引言二、不完全信息静态博弈的概述1.不完全信息的定义2.静态博弈的定义三、不完全信息静态博弈的解题方法1.严格优势策略2.纳什讨价还价解3.轴向讨价还价解四、应用案例分析五、总结正文一、引言在博弈论中,不完全信息静态博弈是一个重要的研究领域。
由于参与者在博弈过程中所拥有的信息不完全,这使得博弈过程变得更加复杂和有趣。
本文将介绍不完全信息静态博弈的概述,以及探讨如何解决这类问题。
二、不完全信息静态博弈的概述1.不完全信息的定义不完全信息指的是参与者在博弈过程中,无法完全了解其他参与者的策略或支付函数。
这种情况下,参与者需要根据自己所掌握的信息,来猜测其他参与者可能采取的策略。
2.静态博弈的定义静态博弈是指参与者在一定时间内,一次性地选择策略并完成博弈的过程。
静态博弈中,参与者不需要考虑时间顺序,只需关注当前状态下的最优策略。
三、不完全信息静态博弈的解题方法1.严格优势策略在完全信息静态博弈中,如果一个策略对某个参与者来说是严格优势的,那么他会选择这个策略。
在不完全信息静态博弈中,同样可以利用严格优势策略来求解。
即通过分析其他参与者可能采取的策略,找到一个对某个参与者来说严格优势的策略。
2.纳什讨价还价解纳什讨价还价解是解决不完全信息静态博弈问题的一种方法。
通过设计一种讨价还价机制,使得参与者可以在不完全信息的情况下,达成一种合作解。
纳什讨价还价解的关键是让参与者在博弈过程中,有动力去揭示自己的真实支付函数。
3.轴向讨价还价解轴向讨价还价解是另一种解决不完全信息静态博弈问题的方法。
它通过让参与者在博弈过程中,根据其他参与者的策略选择,来调整自己的策略,从而实现一种合作解。
轴向讨价还价解的优势在于,它可以在不完全信息的情况下,使得参与者的收益达到最大。
四、应用案例分析以寡头垄断市场为例,市场中有两个寡头企业,它们需要决定是否进行价格战。
在这个过程中,每个企业都需要考虑对方的策略选择。
第九讲不完全信息静态博弈o
Example 2:
Players: The pair of people
States: The set of states is yy, yn, ny, nn Actions: The set of actions of each player is B, S
Signals: Player 1 receive one of two signals, y1 and n1; her
Conclusion: (B, (B, S)), where the component is the action of player 1 and the other component is the pair of actions of the two types of player 2, is a Nash equilibrium.
2. The action of each type of player 2 is optimal, given the action of player 1.
That is, we treat the two types of player 2 as sepatate players and analyze the situation as a three-player strategic game.
1/2
BS 2/3 B 2,1 0,0
S 0,0 1,2
State y y
2:y2
B
1/3
S
1/2
BS 0,1 2,0 1,0 0,2
1:y1
2/3 B S
1/2
BS 2,0 0,2 0,1 1,0
State y n
1:n1
2:n2
B
博弈论_不完全信息静态博弈
贝叶斯纳什均衡的存在性
贝叶斯纳什均衡的存在性定理 定理3.1.2,见书上第62页,不讲定理的证明 它与第24页的定理2.2.3的比较。定理3.1.2所
要用到的前提条件更强,其原因在于: 在贝叶斯博弈中,局中人i的收益是纯策略下
的期望收益。或,局中人i的收益函数ui(s-i, si, ti)可以随着类型的变化而变化;当ui是si的凹函 数时,其凸组合“∑pi(t-i|ti)×ui(s-i(t-i), si, ti), t-i∈T-I”也是si的凹函数;若拟凹则不成立
义3.1.2做比较 此定义是对纯策略下贝叶斯纳什均衡定义的一
个直接扩展,其中E(ui)是局中人i在混合策略 组合下,对其收益函数ui的数学期望 定理3.1.3:混合策略组合是贝叶斯纳什均衡 的充分必要条件 定理3.1.4:贝叶斯纳什均衡的存在性定理
求解行业博弈的贝叶斯纳什均衡
条件概率 标记混合策略的符号 标记期望收益的符号 计算不同类型下的期望收益 书上的方法:由混合策略下贝叶斯纳什均衡的
对局中人2的计算
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 , -4/3 , 0 建厂 , -4/3 , 0
不建厂 , 1 , 0 不建厂 , 1 , 0
合成后的支付矩阵
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 0, -4/3 2, 0 建厂 1.5, -4/3 3.5, 0
混合策略
在贝叶斯博弈G=[N, {Ti}, P, {Si(ti)}, {ui}]中,局中人i 在类型ti∈Ti下,为每一个纯策略以概率进行选择,则 xi(ti) =(x1(i)(ti), x2(i)(ti), ···, xm_i(i)(ti))称为局中人i在类型 ti下的一个混合策略。有时简写为xi。
博弈论“囚徒困境”的四种形式
博弈论中的“囚徒困境”摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。
其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。
本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。
关键词:博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。
它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。
为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。
当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。
用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) :囚徒2囚徒1(表1)假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。
容易看出,由于对于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。
二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。
而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。
下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。
首先观察“囚徒困境”的有限博弈,以T记基本博弈的重复次数。
不完全信息静态博弈Harsanyi(1967-68)提出了一个不完全信息博弈的
β (x)F (x) + (N − 1)β(x) = (N − 1)x
– Typeset by FoilTEX –
4
我们以下定义均以纯策略为例:
不完全信息博弈 要求:虽然每个博弈者并不知道对手 的类型,但是所有类型出现的联合概率分布 F : Θ → [0, 1] 需为共同认识, 其中 Θ = Θ1 × Θ2... × ΘN。 博弈者 i 观察到私人类型 θi 后的效用可以表示为 Ui[s1(θ1), ..., sN(θN)|θi], Ui(·|θi) 是 在给定 θi 下的 von Neumann-Morgenstern 期望效用函 数, 因为其自变量均为随机变量。于是,
– Typeset by FoilTEX –
7
拍卖理论
现代拍卖理论是从 Vickery(1961) 开始的,80 年代以来 快速衍生出大量文献,其中以静态博弈为分析框架 的 拍卖问题主要是围绕收入相等法则(Revenue Equivalence Principle)和联系法则 (Linkage Principle) 两个基本原理展开。
方案 3? A 省在修路的情况下, 其支付额应在 50 万元 的修路费基础上,减去它给 B 省的外部性 30 万元,
– Typeset by FoilTEX –
20
方案 3 为: 如果 A 省上报值与 B 省收益和大于 100 万元,修路,但 A 省只支付 20 万元,B 省支付 50 万 元。
– Typeset by FoilTEX –
不完全信息静态博弈总结
不完全信息静态博弈总结不完全信息静态博弈1.不完全信息静态博弈特点:在博弈开始之前参与人之间的信息存在不确定性,但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
在不完全信息静态博弈中,在博弈开始前存在关于博弈人信息的不确定性,这个不确定像通常是博弈参与人的类型。
在市场进入博弈中不完全信息表现为:在位者的成本类型(高成本、低成本)在斗鸡博弈中不完全信息表现为:参与人的性格类型(强硬,软弱)2.海萨尼转换由于在不完全信息静态博弈中,参与人的类型存在不确定性,所以当一个参与人并不知道在与谁博弈时,博弈的规则是无法定义的,海萨尼提出了海萨尼转换解决这种不确定的问题。
解决方法:海萨尼指出,引入虚拟参与人——自然,由自然先决定参与人的不同类型,将不完全信息博弈转换为不完美信息博弈。
海萨尼通过引入“虚拟”参与人,将博弈的起始点提前,从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性。
这种通过引入“虚拟”参与人来处理不完全信息博弈问题的方法称为 Harsanyi转换。
3.不完全信息静态博弈均衡——贝叶斯纳什均衡贝叶斯博弈的定义:贝叶斯博弈包含以下五个要素:1.参与人集合BΓ={1,2,…,n};2.参与人的类型集合T1,…,T2;3.参与人关于其他参与人类型的推断P1(t-1 |t1),…,Pn(t-1n|tn);4.参与人类型相依的行动集A(t1),…, A(tn);5.参与人类型相依的支付函数贝叶斯博弈的战略:在贝叶斯博弈G={Γ;(Ti);(Pi);(A(ti);(ui(a(t);ti)}中,参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti);它包含了当自然赋予i的类型为ti时,i将从可行的行动集Ai(ti)中选择的行动。
贝叶斯纳什均衡:在贝叶斯博弈中,对于一个理性的参与人i,当他只知道自己的类型ti 而不知道其他参与人的类型时,给定其他参与人的战略s-i ,他将选择使自己期望效用(支付)最大化的行动 ai*(ti)。
博弈论讲义3-不完美信息静态博弈
不完全信息博弈中,至少有一个参与者i有多个可能的 类型,其他参与者虽然知道ti∈Ti,但都无法确知ti在 Ti中的具体取值。
如果只有虚拟参与人具有多个类型,则是不完全信息
如果有虚拟参与人以外的某些参与人有多个类型,则属于信息 不对称。
版权所有余向华源自12信息问题与市场的建立
“柠檬”市场现象(Akerlof):
由于信息问题引发逆向选择(劣币驱逐良币),
导致有效的市场可能建立不起来,或发展慢。
普遍存在于产品市场、劳动力市场(包括教师市场的问
题)、保险市场、信贷市场等上
“碟猫”市场现象:
本能不存在的市场,由于信息的不完全反给创
造出来了。比如赌石市场、彩票市场
第3篇 不完全信息静态博弈
3.1 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈 海萨尼转换 不完全信息静态博弈的策略式表述和贝叶斯纳什均衡
3.2 贝叶斯纳什均衡与混合策略均衡的纯化 3.3 贝叶斯纳什均衡应用举例 3.4 非对称信息下的机制设计问题
版权所有
余向华
1
信息问题与现实生活
爱心困惑:面对一个个乞丐向你行乞,你会如何决定呢? 佛心者:宁可被骗一千次,绝不放过一次帮助需要帮助者。 人心者:宁可错过千次帮助需要帮助的人,绝不愿被骗一次?
不帮、或者收集信息再决定?
婚恋困惑:知人知面与知心问题 食品安全中的信息问题 信息与法律举证问题 …
版权所有
余向华
2
信息问题与市场运行
在信息不完美的情况下,博弈参与者的收益为期望收益: 被求者
接受 不接受
求爱博弈:
求爱 100,100
品德优良者求爱 求爱者 不求爱 0,0
博弈论
• 4. 战略(strategy)
• 指参与人在给定信息集的情况下的行动规则, 它规定参与人在什么时候选择什么行动。 • (1)一般用si 表示第i个参与人的一个特定战 略,Si = {si}代表第i 个参与人的所有可选择 的战略集合。如果n个参与人每人选择一个战略, n维向量s=(s1,…,si,…,sn )称为一个战略组 合(strategy profile),其中si是第i个参与人 选择的战略。
•
囚徒困境引出重要结 论: 一种制度(体制)安 排,要发生效力,必须是 一种纳什均衡。否则,这 种制度安排便不能成立。 现实中囚徒困境问题: 军备竞赛、公共产品私 人提供、寡头竞争等。
领域
纳什均衡 (增产,增 产)
制度安排
寡头竞争 公共产品 私人 提供
• (2)战略与行动是两个不同的概念,战略是行动 的规则而不是行动本身。 • 例如:“人不犯我,我不犯人;人若犯我,我 必犯人”是一种战略,“犯”与“不犯”是两种 行动,战略规定了什么时候“犯”,什么时候 “不犯”。 • (3)作为一种行动规则,战略必须是完备的,它 要给出参与人在每一种可想象到的情况下的行动 选择,即使参与人并不预期这种情况会实际发生。
博 弈 论
西 北 大 学 经济管理学院
课程主体结构
一、博弈论概述 二、博弈论的基本概念 三、完全信息静态博弈 四、完全信息动态博弈
课程主体结构
五、不完全信息静态博弈
六、不完全信息动态博弈
一、博弈论概述
• 1.博弈论概念(game theory) • (1)博弈:又称为对策或游戏,是指一些人或组 织在“策略相互依存”情形下相互影响、互相作 用的状态。 • (2)博弈论:研究决策主体的行为发生直接相互 作用时的决策,以及这种决策的均衡问题,即当 一个主体的选择受到其他主体选择的影响,而且 反过来影响到其他主体选择时的决策问题和均衡 问题。
博弈论四种博弈类型
华为在阿根廷电信设备市场上的竞争博弈华为技术有限公司是一家总部位于中国广东省深圳市的生产销售电信设备的员工持股的民营科技公司,经过数十年的发展,成为全球最大的电信网络解决方案提供商,全球第二大电信基站设备供应商,同时也是全球第六大手机厂商,其海外市场的利润占到其总利润的75%。
在华为进入阿根廷电信设备市场之前,阿根廷的电信设备市场由爱立信、阿尔卡特-朗讯以及阿根廷本土设备供应商三家共同分享市场份额,接下来,我们将分析其不同条件下的博弈结果:1、完全信息情况下的静态博弈A 、纳什均衡:我们将上述三家公司统称为原有垄断者,华为称为虎视眈眈的潜在进入者,原有垄断者想要保住自己现有的垄断地位,就会想要阻止潜在进入者进入,在这个博弈中,原有垄断者有两种选择:一是进行斗争,打价格战;二是不斗争,默许其进入从而共同竞争,具体的支付矩阵结果表示如下:原有垄断者潜在进入者 进入 不进入根据纳什均衡的定义:各个参与者所做的是在给定其他参与者的策略是所能够做出的最好的一组策略。
当潜在进入者选择进入时,原有垄断者的最优选择是不斗争,获得70单位的利润;同样的,原有垄断者选择不斗争的情况下,潜在进入者的最优选择是进入,获得20单位的利润,从而获得一个要求纳什均衡的均衡(进入,不斗争),同理可以得出另一个纳什均衡(不进入,斗争)。
B 、占优策略:现假设华为公司已经获得了阿根廷电信集团的经营许可证,在严格管制情况下二者都不能以低于成本的价格进行价格战,同时禁止出现单一寡头垄断的情形,(各自均有正的利润)在这两种情况下考虑两者是否进行价格战的情况,具体支付矩阵如下所示:原有垄断者 低价 高价潜在进入者低价 高价对于潜在进入者而言,不论原有垄断者是否进行价格战,潜在进入者的占优策略都是进行价格战,因为在原有垄断者定低价时,潜在进入者定低价可以获得额外的20单位利润,在原有垄断者定高价时,潜在进入者定低价可以获得额外的10单位利润,从而确定华为必将进行价格战,在完全信息情况下,原有垄断者会将自己置于潜在进入者的位置进行决策,从而决定自己也要进行价格战,否则会失去更多的利润。
几个博弈案例
几个博弈案例1.囚徒困境警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证他们所犯的罪行。
如果罪犯中至少有一人供认犯罪,就能确认罪名成立。
为了得到所需的口供,警察将这两名罪犯分别关押防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境与面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;果两人都坦白认罪,则他们将被各判8年监禁。
问:两个罪犯会如何选择(坦白还是抵赖)?2.智猪博弈(占优战略均衡)猪圈里有一头大猪,一头小猪。
猪圈的边缘有个踏板,每踩一下,远离踏板的投食口就会落下少量食物。
如果是小猪踩踏板,大猪会在小猪跑到食槽之前吃光所有食物;若是大猪踩踏板,则小猪还有机会吃到一点残羹冷炙,因为小猪食量小嘛。
那么,两头猪会采取什么策略呢?答案是:小猪将安安心心地等在食槽边,而大猪则不知疲倦地奔忙于踏板与食槽之间。
办公室里也会出现这样的场景:有人做“小猪”,舒舒服服地躲起来偷懒;有人做“大猪”,疲于奔命,吃力不讨好。
但不管怎么样,“小猪”笃定一件事:大家是一个团队,就是有责罚,也是落在团队身上,所以总会有“大猪”悲壮地跳出来完成任务。
想一想,你在办公室里扮演的角色,是“大猪”,还是“小猪”?(其实小猪的决策是明智的,想想同一个公司,小股东与大股东的行为。
)3.性别之争(多重纳什均衡)“有一对夫妻,丈夫喜欢看足球赛节目,妻子喜欢看肥皂剧节目,但是家里只有一台电视,于是就产生了争夺频道的矛盾。
假设双方都同意看足球赛,则丈夫可得到2单位效用,妻子得到一单位效用;如果都同意看肥皂剧,则丈夫可得到1单位效用,妻子得到2单位效用;如果双方意见不一致,结果只好大家都不看,各自只能得到0单位效用。
这个博弈的策略式表达如下:丈夫\妻子足球赛肥皂剧足球赛(2,1 ) (0,0)肥皂剧(0,0) (1,2)可以用画线法求解该博弈的纳什均衡,均衡结果是(足球赛,足球赛)与(肥皂剧,肥皂剧)。
不完全信息静态博弈:贝叶斯纳什均衡
不完全信息静态博弈:贝叶斯纳什均衡海萨尼1、前两篇⽂章讲的博弈都包含⼀个基本假设,即所有参与⼈都知道博弈的结构、规则、⽀付函数,因⽽称为完全信息博弈。
然⽽现实中,参与者并不了解其他参与者的⼀些信息,即不完全信息博弈(games of incomplete information)。
2、当对⼿有多种情况时,⽐如市场博弈的例⼦,在位者成本函数可能有需求⾼、需求中、需求低三种情况,那么可以采取“海萨尼转换”,即引⼊⼀个虚拟的参与⼈“⾃然”,⾃然⾸先⾏动,选择参与⼈的类型,被选择的参与⼈知道⾃⼰的真实类型,其他参与⼈并不清楚这个参与⼈的真实类型,但知道各种可能类型的概率分布。
如下图所⽰:3、这种情况下,可以通过海萨尼转换(Harsanyi transformation)把不完全信息博弈转换成完全但不完美信息博弈(complete but inprefer information)。
“不完美信息”指“⾃然”作出了选择,但其他参与⼈并不知道它的具体选择是什么,仅知道各种选择的概率分布。
4、在静态不完全信息博弈中,参与⼈同时⾏动,每个参与⼈的最优战略依赖于⾃⼰的类型,他不可能准确的知道其他参与⼈实际上会做出什么选择,但他能正确的预测其他参与⼈的选择是如何依赖于各⾃的类型的。
决策的⽬标就是在给定⾃⼰的类型和别⼈的类型依从战略的情况下,最⼤化⾃⼰的期望效⽤。
海萨尼定义了“贝叶斯纳什均衡”,给定⾃⼰的类型和别⼈类型的概率分布,每个参与⼈的期望效⽤达到了最⼤化,没有⼈有积极性选择其他战略。
5、举个例⼦,某⼀市场原来被A企业所垄断,现在B企业考虑是否进⼊。
B企业知道,A企业是否允许它进⼊,取决于A企业阻挠B企业进⼊所花费的成本。
如果阻挠的成本⾼,A企业的最优战略是默许B进⼊。
如果阻挠的成本低,A企业的最优战略是阻挠。
⽀付矩阵如下表所⽰:B企业并不知道A企业的阻挠成本是⾼还是低。
这⾥,某⼀参与⼈本⼈知道、其他参与⼈不知道的信息称为私⼈信息。
不完全信息静态博弈例子
不完全信息静态博弈例子博弈论是研究决策者在相互影响下进行决策的数学模型。
在博弈论中,不完全信息静态博弈是一种常见的博弈形式。
在这种博弈中,每个决策者只能获得有限的信息,无法完全了解其他决策者的策略和利益。
本文将通过一个例子来说明不完全信息静态博弈的特点和解决方法。
假设有两个商人A和B,他们同时决定是否进入一个新的市场。
进入市场的成本是固定的,但市场的利润是不确定的。
商人A可以选择进入市场或不进入市场,商人B也可以做出相同的选择。
然而,商人们只能获得有限的信息,无法准确了解对方的决策和市场利润。
商人A和B的利益是相互关联的。
如果两个商人都选择进入市场,他们将面临更大的竞争和风险,但如果市场利润高,他们也有机会获得更大的回报。
如果一个商人选择进入市场而另一个商人选择不进入市场,前者将面临更大的风险,但如果市场利润高,他将独享这一利润。
在这个例子中,商人A和B都面临着不完全信息的情况。
他们无法准确了解对方的决策和市场利润,只能根据自己的信息做出决策。
这种情况下,他们需要通过分析对方的可能策略和利益来做出最优的决策。
为了解决这个问题,我们可以使用博弈论中的概念和方法。
首先,我们可以建立一个博弈矩阵来描述商人A和B的策略和利益。
矩阵的行表示商人A的策略,列表示商人B的策略,每个单元格表示两个商人在不同策略下的利益。
然后,我们可以使用博弈论中的解概念来找到最优策略。
例如,纳什均衡是指在博弈中,每个决策者都选择了最优策略,而且没有动机改变自己的策略。
通过分析博弈矩阵,我们可以找到纳什均衡点,即商人A和B都选择了最优策略。
在这个例子中,纳什均衡点可能是商人A和B都选择进入市场,或者都选择不进入市场。
这取决于市场利润的不确定性和商人们的风险偏好。
如果市场利润高,商人们可能更倾向于进入市场以获取更大的回报;如果市场利润低,商人们可能更倾向于不进入市场以避免风险。
然而,由于不完全信息的限制,商人A和B可能无法准确预测市场利润。
博弈的四种基本类型
博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。
例如,囚徒困境。
2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争。
3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈。
4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。
例如,信号传递博弈。
每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。
例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。
完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。
不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。
不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。
例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。
博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。
举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。
你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。
二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。
举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。
信息经济学部分习题解答
解:分企业1第一阶段未引进和引进投资两种情
况,每种情况都用逆推归纳法进行分析。
假设企业1第一阶段未投资引进新技术。此
时两个企业的边际成本都为2,利润函数为:
1 1 q 4 1 q 2 q 1 2 q 1
2 1 q 4 1 q 2 q 2 2 q 2
一阶最优条件为
一阶最优条件为
1
q1
142q1q210
求 故解当可1得9q 6 1 q 221 3144 q2 q11 3 2q1 25122 时10,99 引6 f进新技术
(-3,-2.5)(-5,-5)
信息经济学部分习题解答
战略式表述:(麻烦,自己写)
下雨
丈夫
带伞 不带伞
妻子
带伞
不带伞
-2,-2 -2.5,-3
-3,-2.5 -5,-5
不下雨
丈夫
带伞 不带伞
妻子
带伞 不带伞
-1,-1 -1,0
0,-1
1,1
信息经济学部分习题解答
3.下面的两人博弈可以解释为两个寡头企业的价格竞
u1(A)=u2(B)=u3(C)=2 u1(B)=u2(C)=u3(A)=1 u1(C)=u2(A)=u3(B)=0 找出这个博弈的所有的纳什均衡。
信息经济学部分习题解答
解:所有战略组合的支付函数如下
参与人3选择A
A
参与人 1
B
C
A 2,0,1 2,0,1 2,0,1
参与人2 B
2,0,1 1,2,0 2,0,1
2 p 1 ,p 2 a p 2 p 1 p 2
求各自价格的一阶偏导数,令其等于0,得:
1
p1
ap22p10
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出独特的优势。
不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。
如在拍卖商品或工程招投标中。
信息不完全又称为信息不对称,即其他参与人没有特定参与人清楚特定参与人自身的特征。
不完全信息静态博弈就是假定某些参与人具有其他参与人不清楚的某些特征的静态博弈。
但对于参与人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为参与人自己拥有的“私人信息”(private information)。
在博弈论中,习惯地将参与人的“私人信息”集中表现为参与人的支付函数特征,也就是说,参与人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些参与人不清楚另一参与人的支付函数,当然,每个参与人是完全清楚自己的支付函数的。
3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定参与人拥有私人信息的情况下,其他参与人对特定参与人的支付函数类型并不清楚,参与人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。
Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的参与人——“自然N ”。
N 首先行动,决定每个参与人的特征。
每个参与人知道自己的特征,但不知道其他参与人特征。
这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的参与人的静态博弈。
这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。
参与人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。
用i θ表示参与人i 的一个特定类型,i H 表示参与人i 所有可能类型的集合,即i i H ∈θ,称i H 为参与人i 的类型空间,n i ,,1 =。
不完全信息静态博弈中,参与人的类型存在多种可能,因而与参与人相关的各种概念都随其类型的不同而不同。
参与人的行动空间i A 将随类型i θ而变化,即)(i i i A A θ=。
支付函数也是类型依存的,可将其记为:),,,,,(1i n i i i a a a u u θ = n i ,,1 =。
该式给出的是在其他参与人已选定行动j a ,n j ,,1 =,i j ≠时,参与人选行动)(i i i A a θ∈获得的支付。
显然给定j a 时最大化i u 的i a 与i θ有关,即)(**i i i a a θ=,其中*i a 是给定j a 时最大化i u 的i a 。
用“类型依存”来描述包括最优战略在内的相关概念与类型的对应关系。
对参与人i ,他不知道其他参与人的类型。
当他选择行动)(i i i A a θ∈时,如果给定其他参与人类型与其最优战略j a 的一个对应组合)(*j j a θ,i j ≠,n j ,,1 =,其支付为:)),()(,),()((*1*11*11*1i n n i i i i i i a a a a a u θθθθθ ++--。
假定参与人i 认为其他参与人的类型组合恰好为i -θ的概率为()i i i P θθ-。
记事前的分布密度为),,,(1n i i P θθθ ,称为“先验概率”,即参与人在博弈之前掌握的知识使其对n i θθθ 1的取值可能性判断。
显然,()i i i P θθ-就是一种条件概率的概念,即当参与人i 的类型为i θ时,他认为i -θ取值i θ的概率为()∑--∈----==ii H i i i i i i i i i i P P P P P θθθθθθθθθθ),(),( )(),(这是概率论中著名的贝叶斯公式(Bayes equition )。
因为i 不知道i -θ,我们这里用von ·Neumann ——Morganstern 效用函数刻画这种不确定下的支付函数,即i 的期望支付为()*((),,)iiii i i i i P u a a θθθθθ----∑显然,最大化上式的i a 就是i 的最优战略*i a ,它与i θ有关,故)(**i i i a a θ=。
当存在一组“类型依存”的最优战略),,,,(***1*n i a a a a =,满足 ),),(()|{maxarg *)(*i i i i i iiA a i a a u P a ii i i θθθθθθ---∈∑-∈ n i ,,1= 则称*a 是一个(纯战略)纳什均衡,也称为贝叶斯纳什均衡(Bayes Nash equilibrium )。
*a 是类型依存的,即)(**θi i a a =。
为了减少复杂性,假定博弈开始之前各个参与人掌握的关于),,(1n θθ 的分布密度知识是相同的,即概率分布密度),,(1n P θθ 是所有参与人的共同知识。
这被称为Harsanyi 公理。
这一公理表明所有参与人有关自然行动的信念(belief )是相同的。
贝叶斯纳什均衡(也简称贝叶斯均衡)是完全信息静态博弈纳什均衡概念在不完全信息静态博弈上的扩展。
有时也称不完全信息静态博弈为静态贝叶斯博弈或贝叶斯静态博弈。
n 人静态贝叶斯博弈的战略式表述:参与人类型空间n H H ,,1 ;条件概率n P P ,,1 ;战略空间)(,),(11n n A A θθ ;支付函数),,,(,),,,,(1111n n n n a a u a a u θθ 。
i 知道i θ。
用{}n n n n u u P P A A G ,,,,,,,,,,,1111 θθ=表示该博弈。
博弈顺序为:①自然N 选),,(1n θθθ =,i i H ∈θ,参与人i 观察到i θ,但参与人i j ≠仅知道)|(j j j P θθ-,不能观察到i θ。
②n 个参与人同时选行动(战略)),,(1n a a a =,)(i i i A a θ∈。
③i 得到支付),,,(1i n i a a u θ ,n i ,,1 =。
该定义不排除参与人j 可能拥有关于参与人i 类型的某种信息,而当所有参与人类型空间只有一个元素时,不完全信息静态博弈就退化为完全信息静态博弈。
同时,这里假定)(i i A θ和),,(i i i i a a u θ-本身是共同知识,即尽管其他参与人不知道i 的类型i θ,但他们知道i 的战略空间和支付函数是如何依赖于他的类型的,即当他们知道i θ时,就必然知道)(⋅i A 和)(⋅i u 。
n 人不完全信息静态博弈{}n n n n u u P P A A G ,,,,,,,,,,,1111 θθ=的纯战略贝叶斯纳什均衡是一个类型依存战略组合{}ni i i a 1*)(=θ,满足:),),(()|{maxarg )(*)(*i i i i i i iiA a i i a a u P a i i i θθθθθθ---∈∑∈ n i ,,1=有限博弈的不完全信息静态博弈至少存在一个贝叶斯纳什均衡。
纯战略只是一个行动i a 如何依类型i θ而变的规则,不是指一个具体的结果。
例 市场进入博弈一个完全垄断企业B 正垄断着一个行业的市场,另一个潜在的试图进入该行业的企业A ,称A 为进入者,B 为在位者。
A 不知道B 的成本特征,设B 有两种可能的成本,即高成本和低成本。
两种成本情况下的博弈矩阵见下表。
市场进入博弈 B高成本 低成本 默许 斗争 默许斗争A 进入 不进入假定B 知道进入者A 的成本为高成本,且与B 为高成本时的成本相同。
假若信息是完全的,则当B 为高成本时,唯一的精炼纳什均衡为(进入,默许),另一纳什均衡(不进入,斗争)是含有不可置信的威胁。
当B 为低成本时,唯一的纳什均衡为(不进入,斗争),即若A 进入行业,具有低成本优势的B 将通过降低价格将A 逐出市场。
由于存在行业进入成本,所以A 被逐出市场后将有净的10单位进入成本的损失。
当A 不知道B 的成本情况时,他的选择将依赖于他对B 的成本类型的主观概率或先验概率密度。
设A 对B 是高成本的先验概率判断为P ,则A 认为B 为低成本的概率为P -1。
如果A 进入,其期望支付为 )10)(1()40(--+P P 如果1不进入,其期望支付为0。
当且仅当0)10)(1()40(≥--+P P 或51≥P 时,A 选择进入;反之,当51<P 时,A 不进入。
于是,贝叶斯均衡为:(进入,默许),高成本,51≥P ; (进入,斗争),低成本,51≥P ; (不进入,*),51<P 其中*表示可以是斗争,也可以是默许。
例 不对称信息(asymmetric information)下的古诺竞争市场中有两个企业。
市场需求: P (Q ) = a – Q , Q = q 1 + q 2.企业 1 成本: C 1(q 1) = cq 1.企业 2 成本: 以概率 θ取C 2(q 2) = c H q 2,以概率 1– θ取 C 2(q 2) = c L q 2。
企业 2的产量依赖于成本:max [(a - q 1* - q 2) - c H ]q 2和max [(a - q 1* - q 2) - c L ]q 2企业 1 选择 q 1max θ[(a - q 1 - q 2*(c H )) - c ]q 1 + (1–θ)[(a - q 1 - q 2*(c L )) - c ]q 1 一阶条件(a - q 1* - c H ) – 2q 2*(c H ) = 0 (a - q 1* - c L ) – 2q 2*(c L ) =0{θ[(a - q 2*(c H )) - c ] +(1-θ)[(a - q 2*(c L )) - c ]} - 2q 1*=0 解出q 2*(c H ) = 32c c a H +- + 61θ-(c H - c L )q 2*(c L ) = 32c c a L +- – 6θ(c H - c L )q 1*= 3)1(2L H c c c a θθ-++-3.3 应用例1 信息不完全的性别战帕特 歌剧 拳击歌剧 2+ t c ,1 0, 0 克丽斯拳击 0, 0 1, 2+ t p类型空间: T c = T p = [0, x ] t p 和t c 为[0, x ]上的均匀分布.推断(密度函数): p c (t p ) = p p (t c ) = 1/x直觉: 分别存在临界值c 与p :当 t c > c 时,克丽斯选择歌剧, 否则选择拳击. 当 t p > p 时,帕特选择拳击, 否则选择歌剧.克丽斯的期望收益看歌剧: x p (2 + t c ) + (1 –x p )× 0 = x p(2 + t c ) 看拳击:x p × 0 + (1 –x p ) = 1 –xp 选择歌剧最优x p (2 + t c ) ≥ 1 –xp 即 t c ≥ p x– 3 因此临界值 c =px– 3帕特的期望收益看拳击:(1 –x c )×0 +x c (2 + t p ) = xc(2 + t p ) 看歌剧: (1 –xc ) +x c ×0 = 1 –xc 由选择拳击最优t p ≥cx- 3 临界值 p =cx - 3 解得 p = c和 p 2 + 3p – x = 0.克丽斯选择歌剧的概率1 -x c = x c x - = 1 –xx2493++- 帕特选择拳击的概率1 -x p = x p x - = 1 –xx 2493++- 当x → 0时,1 –xx2493++- → 1 –31这正是完全信息下性别战博弈的混合战略纳什均衡。