不完全信息静态博弈:贝叶斯纳什均衡
不完全信息静态博弈
由于θi在[-ε,+ε]上是均匀分布的,因而θi ≥ 0和θi < 0的概率各为1/2。可认 为每个参与人认为对方选择抓与不抓的概率各为1/2。 当ε 0时,该纯策略贝叶斯均衡就收敛为一个完全信息博弈的混合策 略纳什均衡。
因而,海萨尼说,完全信息博弈的混合策略均衡可以解释为不完全信息 情况下纯策略均衡的极限。
策略贝叶斯均衡是一个类型依存战略组合
{ai* (i )}in,满足: 1
* ai* (i ) arg max pi (i | i )ui (ai , ai (i );i ,i ) ai
1、不完全信息古诺模型(板书)
• 在这个模型中,参与人的类型是成本函数。逆需求函数为
荷兰式拍卖:从一个非常高的初始标价逐步降低到有一个买者接受报价。 一级密封价格拍卖:出价最高的投标者获得拍卖品,并支付自己的出价 给卖者; 二级密封价格拍卖:出价最高的投标者获得拍卖品,并支付次最高出价。
1)
2)
英式拍卖:投标者按照递增的顺序宣布他们的出价,直到没有人愿意出更
高的价格,出价最高的投标者获得拍卖品; 荷兰式拍卖:从一个非常高的初始标价逐步降低到有一个买者接受报价。
看,一开始应采取“不合作”的策略。究竟是直觉正确,还是逻辑正
确? 博弈论专家Ken Binmore实验发现,不会出现一开始选择“不合作”
策略而使双方收益为1的情况。双方会主动选择“合作”策略,从而 走向合作。但逆向归纳法在某一步肯定会起作用。只要逆向归纳法在 起作用,“合作”便不能进行下去。
这个悖论在现实中的对应情况是,参与人不会在开始时确定他的策略
现在考虑同样的博弈但具有不完全信息:每个参与人有相同的支付结
构,但如果他赢了的话,他的利润为(1+θi),这里θi是每个参与人的 类型,是私人信息。但θi在[-ε,+ε]上均匀分布,这是公共知识。
不完全信息博弈和贝叶斯均衡
三、贝叶斯博弈的战略式描述
• 不完全信息博弈:完全信息博弈在不完 全信息上的拓展,我们又将其称为贝叶 斯博弈;
• 贝叶斯博弈:静态贝叶斯博弈和动态贝 叶斯博弈;
贝叶斯博弈的定义
• 贝叶斯博弈包含以下五个要素: (1) 参与人集合 {1,2,...,n}; (2) 参与人的类型集合T1,…,T2; (3) 参与人关于其他参与人类型的推断p1 (t1 t1 ),
tiTi
• 假设pss=0.2,psw=0.3,pws=0.25,pww=0.25。 • 其中, pss:决斗者1和决斗者2同时强硬的概率;
psw:决斗者1强硬、决斗者2软弱的概率; pws:决斗者1软弱、决斗者2强硬的概率; pww:决斗者1软弱、决斗者2软弱的概率; • 虽然决斗者1不知道决斗者2 的类型,但由于决斗 者1知道自己的类型,因此他可以根据贝叶斯公式 推知决斗者2的类型分布。
v i(a i,s i;ti) p i(t iti)u i(a i,a i(t i);ti) t i T i
其中,对 ti Ti,a i (t i ) 为给定t-i时由s-i 所确定的其他参与人的行动组合
• 高成本情形: (进入,默许)(不进入,斗争)
• 低成本情形: (不进入,斗争)
斗鸡博弈
• 两个所谓的勇士举着长枪,准备从独木 桥的两端冲上桥中央进行决斗。每位勇 士都有两种选择:冲上去(用U表示),或 退下来(用D表示)。若两人都冲上去,则 两败俱伤;若一方上去而另一方退下来, 冲上去者取得胜利(至少心理上是这样 的),退下来的丢了面子;若两人都退下 来,两人都丢面子。
• 当一个参与人并不知道在与谁博弈时,博 弈的规则是无法定义的,如何处理不完全 信息导致的这一问题?
二、海萨尼(Harsanyi)转换
不完全信息静态博弈-贝叶斯纳什均衡(博弈论与信息经济学-中科院张玲玲)
第四章 不完全信息静态博弈 -贝叶斯纳什均衡
一 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈 海萨尼转换 不完全信息静态博弈的战略式表述和贝叶斯纳什均衡
二 贝叶斯纳什均衡应用举例 三 贝叶斯纳什均衡与混合战略均衡 四 机制设计理论与显示原理
海萨尼转换
被求爱者对于
求爱者的品德的 信息是不完全的。
不完全信息博弈
你 接受 不接受
求爱博弈:
求爱 100,100 -50,0
品德优良者求爱 求爱者 不求爱 0,0
0,0
100x+(-100)(1-x)=0
当x大于1/2时,接受求爱
求爱博弈: 品德恶劣者求爱 求爱者
你 接受 不接受
求爱 100,-100 -50,0
不完全信息博弈
在生活中我们也会碰到这样的问题,比 如一个乞丐向你乞讨,你愿意帮助别人, 但不知道他是真的乞丐还是骗子,该如 何决定呢?如果你喜欢与人为善,你可 能愿意冒一点上当的危险,这不等于你 愚蠢,而是你认为,帮助一个困境中的 人比回绝一个骗子更重要。
不完全信息博弈
不完全信息:每一个参与人对所有其他参与人 的(对手)的特征、战略空间及支付函数有准 确的 知识,否则为不完全信息。
众官听得这个消息,尽皆失色。孔明登城 望之,果然尘土冲天,魏兵分两路杀来。
孔明令众将旌旗尽皆藏匿,打开城门,每 一门用20军士,扮作百姓,洒扫街道。而孔明 羽扇纶巾,引二小童携琴一张,于城上敌楼前 凭栏而望,焚香操琴。
不完全信息博弈
司马懿自马上远远望之,见诸葛亮神态自 若,顿时心生疑忌,犹豫再三,难下决断。又 接到远山中可能有埋伏的情报,于是叫后军做 前军,前军做后军,急速退去。司马懿之子司 马昭问:“莫非诸葛亮无军,故做此态,父何 故便退兵?”
不完全信息博弈
• 这个博弈的一个纯策略ai(ci) 是从﹝c’, c’’﹞到﹛0,1﹜的一个函数,其中0表示不 提供,1表示提供。参与人的支付函数为: • Ui(ai,a j, ci)=max(a1, a2)-aici • 如果j提供,i不提供, Ui(0,1, ci)=max(0, 1)-0ci=1;如果i提供, j不提供, Ui(1,0, ci)=max(1, 0)-1ci=1-ci • 贝叶斯均衡是一个策略组合,便得对于每 个i和每个可能的ci,策略ai﹡ (ci) 最大化参 与人i的期望效用。
因为z j≡Prob﹙ c’ ≤c j ≤c j ﹡﹚= P﹙ c j ﹡﹚ ,均衡分割点ci﹡必须满足ci﹡=1P﹙ c j ﹡﹚。因此ci﹡ 和c j ﹡都必须满足 方程c﹡=1- P(1-P﹙ c ﹡﹚)。假定存在 唯一的一个c﹡,解这个方程,那么下列条 件一定成立: ci﹡ = c﹡= 1- P﹙ c ﹡﹚。 比如说,如果P(· )是定义在﹝0,2﹞上 均匀分布( P(c)≡c/2 ),那么c﹡是唯 一的,等于2/3。为了检查c﹡=2/3确实是个 均衡点,如果参与人i不提供,他的期望支 付是P(c﹡)=1/3;如果成本为c﹡时提供, 他的期望支付为1- c﹡,提供是最优的。
• 那么q2L =1/2(5/4-q1); q2H =1/2(3/4-q1) • 企业1不知道企业2的真实成本从而不知道企 业2的最优反应是q2L还是q2H ,因此企业1选 择q1最大化下列期望利润函数: • E u1 =1/2 q1 (1- q1- q2L )+ 1/2 q1 (1- q1q2H ) 解一阶条件可得企业1的反应函数: • q1﹡= 1/2 (1- q1H- q2L )=1/2(1-Eq2) • 解反应函数可得贝叶斯均衡为: • q1﹡=1/3; q2L﹡=11/24; q2H﹡=5/24
不完全信息博弈和贝叶斯均衡
• 前面两章我们讨论了完全信息博弈问题, 但在现实生活中我们遇到更多的可能是不 完全信息博弈问题。
• 例如:
• 现在考虑这样的情形:假设参与人可能有 这样的两种性格特征(类型)——“强 硬”(用s表示)或“软弱”(用w表示)。
• 所谓“强硬”的参与人是指那些喜欢争强 好胜、不达目的誓不罢休的决斗者;而 “软弱”的参与人是指那些胆小怕事、遇 事希望息事宁人的决斗者。
• 可以想象,当具有不同性格特征的决斗者 相遇时,表现出来的博弈情形将会不同。
当参与人都为强硬者时
2
U
D
U -4, -4
2, -2
1
D
-2, 2
0, 0
• 博弈存在两个纯战略Nash均衡—— (U, D)和(D,U)。
当参与人1为强硬者参与人2为软弱者时
2
U
D
U -4, -4
2, 0
1
D
-2, 0
0, 1
• 博弈存在唯一的Nash均衡——(U, D)。
当参与人1为软弱者参与人2为强硬者时
• 高成本情形: (进入,默许)(不进入,斗争)
• 低成本情形: (不进入,斗争)
斗鸡博弈
• 两个所谓的勇士举着长枪,准备从独木 桥的两端冲上桥中央进行决斗。每位勇 士都有两种选择:冲上去(用U表示),或 退下来(用D表示)。若两人都冲上去,则 两败俱伤;若一方上去而另一方退下来, 冲上去者取得胜利(至少心理上是这样 的),退下来的丢了面子;若两人都退下 来,两人都丢面子。
第三章 不完全信息静态博弈
二、例子
1、抓钱博弈 这个博弈有两个非对 称纯战略均衡:一个 参与人抓,另一个参 与人不抓;一个对称 混合战略均衡:每个 参与人以0.5的概率 选择抓。 (1)完全信息
参与人2 抓 参与人1 不抓 抓 -1,-1 1,0
不抓 0,1
0,0
(2)不完全信息 每个参与人有相同 参与人2 的支付结构,但若 抓 不抓 他赢了,其利润是 抓 -1,-1 1+θ1,0 (1+θi)。 θi是参 参与人1 与人的类型,参与 不抓 0 , 1+θ 0,0 人i自己知道θi,但 另一参与人不知道。 假定θ 在[-ε,+ε]区间上均匀分 i 布。
博弈方的类型 原来的静态博弈,即各 中选择行动方案 a1 , , a n 个实际博弈方
u i u i ( a 1 , , a n , i ), i 1, , n
根据海萨尼公理,假定分布函数P(θ1,…,θn)是所有 参与人的共同知识,用θ-i =(θ1,…, θi-1 ,θi+1,…,θn)表示 除i之外的所有参与人的类型组合。这样, θ= (θ1,…, θn)= (θi,θ- i)。称pi(θ-i | θi)为参与人i的条 件概率,即给定参与人i属于类型θi的条件下,他有 关其他参与人属于θ- i的概率。根据条件概率规则, p i , i p i , i p i i | i p i p i , i 这里, p (θi)是边缘概率。如果类型的分布是独立的, pi(θ-i | θi)= p (θ-i)。
2
均衡意味着两个反应函数同时成立。解两个反应函数 得贝叶斯均衡为:
q1
*
1 3
; q2
L*
第五章 不完全信息静态博弈
不完全信息的古诺模型 5
不完全信息的古诺模型 6
三、静态贝叶斯博弈的战略式表述
参与人的类型
要准确地表示静态贝叶斯博弈,关键的问题是反映这种博弈中各参与 人虽然清楚自己的支付函数,却无法确定其他参与人支付函数这一特征。 解决这个问题的前提和基本思路:某些参与人虽然不能确定其他 参与人在一定策略组合下的支付,但至少知道其他参与人的支付有哪 几种可能的结果,而哪种可能的结果会出现则取决于其他参与人属于 哪种“类型”。 定义:一个参与人自己清楚而他人无法完全清楚的私人内部消息、有 关情况或数据等(所有个人信息),即所有不是共同知识的信息称为参 与人的类型。 上述方法实际上是将博弈中某些参与人对其他参与人支付的不了 解,转化成为对这些参与人“类型”的不了解,是一种“追根溯源 ”的思想方法。
与人不知道其他参与人的支付或支付函数。
暗标拍卖 注:不完全信息并不是完全没有信息,实际上不完全信息的博弈方至 少必须有关于其他博弈方支付分布的可能范围和分布概率的知识,否则 博弈方的决策选择就会完全失去依据,我们的博弈分析也就无意义了。
1. 不完全信息博弈例子:市场进入博弈
潜在进入企业(参与人1) 决定是否进入一个新的产业, 但不知道在位企业(参与人2) 的成本函数,不知道在位者 决定默许还是斗争。假设在 位者的成本有两种可能的成 本函数:高成本或低成本(称 为类型)。
四、海萨尼转换 2
海萨尼(Harsanyi,1967-1968)提出了一种在前述将对支付的不了解
转化为对类型的思路的基础上,进一步将不完全信息静态博弈转化为完全 但不完美信息动态博弈进行分析的思路,被称为海萨尼转换。
之后,
四、海萨尼转换 3
N
在位者 1 p 高成本 低成本
不完全信息静态博弈
2.案例1
考虑如下的古诺双头模型。其中市场反需求函数由给出,这里为市 场中的总产量。企业1的成本函数为,不过企业2的成本函数以的概率 为,以的概率为,这里。并且信息是不对称的:企业2知道自己的成本 函数和企业1的成本函数,企业1知道自己的成本函数,但却只知道企业 2边际成本为的概率是,边际成本为的概率是(企业2可能是新进入这一 行业的企业,也可能刚刚发明一项新的生产技术)。上述一切都是共同 知识:企业1知道企业2享有信息优势,企业2知道企业1知道自己的信息 优势,如此等等。
行动空间:诸葛亮:跑还是不跑;司马懿:退兵还是进攻
诸葛亮的类型空间:无兵,有兵。
诸葛亮的私人信息:无兵。
公共知识:司马懿:对方有兵因而埋伏的可能性大,无兵的可
能性小。
均衡结果:司马懿退兵;诸葛亮不动并逃跑成功。
在孔明—司马懿的空城计 博弈中,孔明了解双方的局势,制造空城 假象的目的就是让司马懿感到进攻有较大的失败的可能。如果我们用概 率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主观概率。 此时,在司马懿看来,进攻失败的可能性较大,而退兵的期望效用大于 进攻的期望效用。即:司马懿认为进攻的期望效用低于退兵的效用。诸
这就是为后人广为传颂的空城计。这是一个信息不对称的博弈。 这里,司马懿不知道自己和对方在不同行动策略下的支付,而诸葛 亮是知道的,他们对博弈结构的了解是不对称的,诸葛亮拥有比司马懿 更多的信息。这种信息的不对称完全是诸葛亮“制造出来的”。因此这是 一个信息不对称的博弈。 在这里,孔明可以选择的策略是“弃城”或“守城”。无论孔明所选择的 是“弃”还是“守”,只要司马懿明确知道在各种可能的情况下他自己的支 付,那么孔明均要被其所擒。孔明惟一的办法就是不让司马懿清楚地知 道他自己的策略结果。孔明通过空城计,目的是降低司马懿进攻的可能 收益,使得司马懿认为,后退比进攻要好。
12不完全信息静态博弈贝叶斯纳什均衡
12 不完全信息静态博弈贝叶斯纳什均衡不完全信息静态博弈Bayesian Game完全信息complete information不完全信息incomplete information完美信息perfect information不完美信息imperfect information信息不对称的例子拍卖暗标拍卖密封递交标书统一时间公正开标标价最高者以所报标价中标中标者的支付取决于标价和其对标的物的估价信息不对称的例子结婚信息不对称的例子市场进入在位者新企业信息不对称的例子信用困境良商奸商2 2信念Belief1 11 1商人B有两种可能的类型 type 良商奸商商人B的类型是自己的私人信息private information商人A对商人B有不同的信念 belief信念不同收益不确定信念不同均衡解也不同商人A如何确定B的类型如何作出理性的选择海萨尼转换The Harsanyi transformationNature良商 p奸商 1-pBelief共同知识海萨尼转换The Harsanyi transformationA的类型B的类型A知道自己的类型知道B的概率分布B知道自己的类型知道A的概率分布1212商人ANature1212A的选择H CB的选择HH HC CH CC商人A的期望收益厂商A的最优反应B选HH A选H B选HC A选HB选CH A选H B选CC A选C1212厂商B的最优反应A选H良商B选H奸商B选CA选C良商B选C奸商B选C均衡解 H HC BNE不完全信息的古诺模型假设两个厂商 A B市场需求厂商A的成本函数厂商B的成本函数以的概率为以的概率为信息是不对称的B知道自己的成本函数和A的成本函数A知道自己的成本函数但却只知道B为高成本或低成本的概率共同知识A的成本B的成本概率分布A知道B享有信息优势B知道A知道自己的信息优势利润函数如果B是高成本厂商如果B是低成本厂商情况1 情况2B是高成本厂商 B是低成本厂商B的选择 B选择概率为概率为A 面临的可能情况厂商A的目标同时求解三个最大化问题期望收益最大反应函数不完全信息的古诺均衡解完全信息的古诺均衡解不完全信息条件下贝叶斯博弈的战略表达式参与者空间参与者的行动空间参与者的类型空间参与者的信念参与者的收益函数参与者i 的类型 ti 是参与者i 的私人信息决定其效用函数 ui ai a-i ti参与者i 只知道自己的类型ti 而不知道其他参与者的类型 t-i参与者i 的信念 pit-i|ti 表示i 在给定自己的类型 ti 时对其他n-1个参与者可能的类型 t-i 的概率参与者i 的期望效用函数为贝叶斯纳什均衡在静态贝叶斯博弈 G A1An T1Tn p1pn u1un 中战略组合 a a1 an 是一个单纯战略贝叶斯纳什均衡如果对每一参与者i 及对i 的类型Ti 集中的每一 ti ai ti 满足古巴导弹危机苏联美国Cuban Missile Crisis1962古巴导弹危机假设Va Vb∈ 1 -7如果双方都选择进攻则会发生一场战争如果一方撤退则会避免战争苏每一方都知道自己属于哪一派但这一信息是自己的隐私美国的选择苏美国的选择如果苏联采取进攻当Vb1 鹰派时最好反应是进攻当Vb -7 鸽派时最好反应是撤退如果苏联选择撤退那么无论私人信息是什么最好反应都是进攻如果苏联是鹰派则进攻将是苏联的占优战略如果苏联选择进攻则美国的最优反应为如果美国是鹰派进攻如果美国是鸽派撤退美国的选择如果苏联是鸽派若美国进攻苏联将撤退若美国撤退苏联将进攻美国的选择美国的信念美国情报部门所掌握的信息赫鲁晓夫强硬的姿态苏联决策集团内部各种意见的综合苏联的实力赫鲁晓夫执行其意旨的能力美国的选择赫鲁晓夫可能断定美国人太胆小肯尼迪是个软弱的总统不敢冒核战争的风险美国人一旦实际面对着这些导弹除了抗议之外不会做什么别的苏联的选择赫鲁晓夫错误地估计了对方的反应认为美国会容忍这种后果而事实相反古巴导弹危机的结果美国施行封锁态度强硬苏联寻求妥协撤回在古巴的导弹1962年11月苏联从古巴撤回导弹。
第四章 不完全信息静态博弈
4.1 不完全信息静态博弈和贝叶斯纳什均衡4.1.1 不完全信息博弈在前两章,我们介绍了完全信息博弈。
在这种博弈中,每个参与人对所有其他参与人的支付收益函数是完全了解的,即支付收益函数是所有参与者的共同知识。
但是在现实的博弈应用,许多博弈并不满足完全信息的要求。
比方说,当你新接触一个陌生人时,并不能确定他的喜爱偏好是什么,通常需要寻找话题进行沟通来获取信息;而在一次古玩交易中,当你作为买家时,你并不清楚卖主愿意脱手的最低价格是多少。
类似上述这些不满足完全信息假设的,称为不完全信息博弈。
在不完全信息博弈中,至少有一个参与者不能确定另一参与者的支付收益函数。
【例 4.1】下面是一个不完全信息的市场博弈例子。
假设某商品的市场需求有高、中、低三种,公司A 和公司B 都具备扩展生产规模和维持原有规模两种策略。
两家公司的具体支付收益如下表所示:公司A 和公司B 对市场需求的概率分布是清楚的,但B 不了解A 的成本函数,其对博弈的支付收益也不了解,A 对博弈的支付收益是清楚的。
从表4.1可以看出,如果市场需求是高,假定公司A 扩展,那么公司B 的最优选择也是扩展;如果市场是中等需求,假定公司A 扩展,公司B 的最优选择为维持,若公司A 采取维持,那么公司B 最优选择变为扩展;当市场需求低时,无论公司A 采取什么策略,B 都优先采取维持的策略。
因此,公司B 最优的选择依赖于市场的需求规模。
4.1.2 海萨尼转换在上述的例子中,公司B 就像在与三个不同状况的公司A 博弈。
在1967年以前,这样的不完全信息博弈是无法分析的,因为当一个参与者并不知道他在与谁博弈时,博弈的规则是没有定义的。
海萨尼在1967—1968年提出的转换方法——海萨尼转换成为解决这一类博弈问题的标准方法。
海萨尼为博弈中引入一个虚拟参与人—“自然”,自然首先选择行动决定参与人的特征,参与人知道自己的特征,其他参与人不知道(上例中是决定市场需求,公司A 知道自己的特征,公司B 不知道公司A 的特征)。
不完全信息静态博弈
手无知无畏) , 自己的成本较高时或可获利 (对 手无知生畏) 。
14
L
H
=
L c2 的可能性为 µ ,
H 的可能性为 (1 − µ ) ;µ 是共同知识。 c2 = c2
因此企业 1 只有一个类型,企业 2 有 2 个类 型。进一步假定:
L H = a 2, = c1 1,= c2 c2 = µ 1/ 2 3/ 4,= ห้องสมุดไป่ตู้ / 5,
企业 2 将选择 q2 最大化利润函数
p ,那么进入者选
p) ,
择进入的期望效用是 40 p + ( −10)(1 −
选择不进入的期望利润是 0. 那么,进入者的 最优选择是:如果
p ≥ 1/ 5 , 进 入 ; 如 果
p < 1/ 5,不进入;如果 p = 1/ 5 ,则进入者
3
在进入与不进入之间没有差别。 那么如何描述纳什均衡呢 (贝叶斯纳什均 衡)? 首先,我们把在位企业的战略表述为 ,这里θ 是在位 a2 (θ ) (称为类型依存战略) 企业的类型,即它自己是高成本还是低成本, 这是它的私人信息(不是共同知识的信息) , 。称 a (θ ) 是企业自身类型(θ )的“函数” ( ( a1, a2 (θ )) 是一个纳什均衡,如果每个参 与者在给定对方战略的情况下自己的战略能 最大化自己的期望效用。这里进入者不知道θ
i , ai* (θi ) 使自身效用:
* vi = ∑ p (θ −i / θi ) ui (ai (θi ), a− i (θ − i );θ i ,θ − i )
θ−i
最大。 在这里,静态博弈的时间顺序如下: (1) 自然决定参与人类型向量θ
= (θ1,,θ n ) ,
不完全信息静态博弈(一)
在位者 低成本情况 默许
30,80
打击
-10,100
进入者
进入
不进入
40,50
-10,0
0,300
0,300
0,400
0,400
假定进入者认为在位者是高成本的概率是P,低成本的概 率是(1-P)。则进入者选择进入的期望利润是P(40)+ (1-P)(-10),选择不进入的期望利润是0.当P≥1/5时, P(40)+(1-P)(-10)≥ 0 ,选择进入, P<1/5时选择 不进入。 贝叶斯纳什均衡:高成本的在位者选择默许,低成本的在 位者选择打击;当且仅当P≥1/5时,进入者选择进入。
N
●
P
●
1-P
●
进入者 进
●
进入者 进
● ●
●
在位者 打击
●
(0,300)
●
(40,50)
(-10,0) (30,80) (-10,100)
海萨尼转换后的市场进入博弈
四、贝叶斯纳什均衡
贝叶斯纳什均衡的基本思想与纳什均衡一样:各博弈方的策 略必须是对其他博弈方策略的最佳反应。
R
0,0 2,2
博弈方1的策略是私人信息类型的函数:当“自然”选择得 益矩阵1时选择T,当“自然”选择得益矩阵2时选择B。
博弈方2的策略根据期望利益最大化决定。选择L的期望得 益是0.5×1+0.5×0=0.5,选择R的期望得益是 0.5×0+0.5×2=1,因此博弈方2选择R.
所以该博弈的贝叶斯纳什均衡为:博弈方1在“自然”选
暗标拍卖
第三章不完全信息静态博弈
第三章 不完全信息静态博弈 -贝叶斯纳什均衡
一 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈
海萨尼转换
不完全信息静态博弈的战略式表述和贝叶斯纳什均衡
二 贝叶斯纳什均衡应用举例
被求爱者对于 求爱者的品德的 信息是不完全的。
不完全信息博弈
求爱博弈: 品德优良者求爱 求爱
被求爱者 接受 不接受
100,100 -50,0 0,0
求爱者
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱者 求爱
被求爱者 接受 不接受
100,-100 -50,0 0,0
海萨尼转换
例如:市场进入博弈:在位者不知道进入者是否知道 自己是高成本还是低成本,只知道进入者有p的概率知 道自己的成本函数,(1-p)的概率不知道自己的成本 函数。 这种情况下,进入者也有两种类型:知道(在位者的 成本)或不知道(在位者的成本)。即参与人的类型 是其个人特征的一个完备描述。
例如:在谈判中,甲方知道自己是强硬派或妥协派, 乙方知道自己是否知道甲方是强硬派或妥协派,但甲 方不知道乙方是否知道自己是强硬派还是妥协派,则 甲方有两种类型:强硬派或妥协派,乙方有两种类型: 知道或不知道。 不完全信息意味着,至少有一个参与人有多个类型。
进入者关于 在位者成本信息 是不完全的。
市场进入博弈:不完全信息 在位者 低成本情况 高成本情况
默许
斗争 默许 斗争 进入 不进入
进入者
40, 50 0, 300
@第5章 不完全信息静态博弈
(三)贝叶斯纳什均衡定义
在静态贝叶斯博弈G { A1 ,, An ; T1 ,, Tn ; p1 ,, pn ; u1 ,, un } 中, 博弈方i的一个策略,就是自己各种可能类型ti (ti Ti )的一个 函数Si (ti )。Si (ti )设定对于“自然”可能为博弈方i抽取的各种 类型ti,博弈方i将从自己的行为空间Ai中相应选择的行动a i 。
不完全信息博弈又叫贝叶斯博弈
一、贝叶斯博弈与纳什均衡 二、贝叶斯博弈与混合策略均衡 三、拍卖理论 四、机制设计理论及显示原理
一 、 贝 叶 斯 博 弈 与 纳 什 均 衡
146
(一)静态贝叶斯博弈及其表示
• 完全信息静态博弈的一般表达式:
G {S1 ,, S n ; u1 ,, un }
二 、 贝 叶 斯 博 弈 与 混 合 策 略 均 衡 154
海萨尼(1973):完全信息情况下 的混合策略均衡可以解释为不完全 信息情况下的纯策略均衡的极限。
抓 抓 不抓
不抓
-41,-41 0,100
100,0 0,0
三 、 拍 卖 理 论
157
拍 卖 的 类 型
英式拍卖
收益等价定理: 在一些合理的 荷式拍卖 约束条件保证 下,四种拍卖 第一价格拍卖 形式最终的收 第二价格拍卖 益是相等的!
七个和尚分粥的故事 方案五:无论谁分粥,先分的人后领
结果:每个和尚轮流值日分粥, 但是分粥的那个和尚要最后一个 领粥。令人惊奇的是,七只碗里 的粥每次都是一样多。 启示:一个好的制度不是不让人 自利,而是要形成一个内在的制 约机制,利用人的利己之心引导 他做利于社会之事。
四 、 机 制 设 计 理 论 及 显 示 原 理
不完全信息静态博弈
假设我们观察到一个人干了一件好事,那么,这个人 是好人的后验概率为: P(GP |GT)= P(GT|GP定张三是好人的先验概率是0.5, 那么, 在观察到张三干了一就好事后,我们如何修正他是好 人的先验概率依赖于我们认为这间好事好到什么程度. 1,这是一件非常好的好事,好人一定干,坏人决不可能 干,即P(GT|GP)=1, P(GT|BP)=0
进入者似乎是与两个不同的在位者博弈, 一个是高成本的在位者,一个是低成本的 在位者.
不完全信息古诺模型 参与人的类型是成本函数.假设逆需求函数 为P = a-q1-q2,每个企业的单位成本不变, 为ci,则企业的利润函数为: πi = qi (a-q1-q2-ci), i=1,2
假设企业1的单位成本c1是共同知识,企 业2的单位成本可能是高的也可能是低的, 企业2知道自己的成本类型,但企业1只 知道企业2属于这两种类型的概率分布 和1-,是共同知识. 进一步假设 a = 2, h c 2 = 1.25, = 0.5 c1 = 1, l c2 = 0.75,
不完全信息静态博弈: 不完全信息静态博弈:贝叶斯纳什均衡
完全信息博弈的基本假设是所有的参与人都知 道博弈的结构,博弈的规则,和博弈的支付函 数.例如在"市场进入"博弈中,进入者知道 在位者的偏好,战略空间和各种战略组合下的 利润水平,反之亦然.当然,这个假设在许多 情况下是不成立的.
哈桑尼( 哈桑尼(Harsanyi)定义了"贝叶斯纳什均衡": )定义了"贝叶斯纳什均衡" 贝叶斯均衡是纳什均衡在不完全信息博弈中的 扩展:
在静态不完全信息博弈中,参与人同时行动,没有机 会观察到其他人的选择; 每个参与人仅知道其他参与人类型的概率分布而不知 道其真实类型; 他不可能准确地知道其他参与人实际上会选择什么战 略,但是,他能正确地预测到其他参与人的选择是如 何依赖于其各自的类型的 决策目标就是在给定自己的类型和别人的类型依从战 略的情况下,最大化自己的期望效用.
第四章 不完全信息静态博弈
然”(Nature)
转化为
化不完全信息博弈
完全但不完美信息博弈
(1)Harsanyi转换例子
(2)类型
(3)静态贝叶斯博弈的时间顺序
(4)贝叶斯纳什均衡建立
Harsanyi转换例子
N
高
低
[P]
进入者
[1-P]
不进入 (0,300)
合作
进入
不进入
在位者 (0,400)
斗争
合作
进入
斗争
(40,50)
当在位者两种成本,进入者似乎是与两个不同的在位者博弈, (一高,一低) 。如在位者有T种可能的C,进入者似乎是在与T个不同 的在位者博弈。(在1967年以前,博弈论专家认为这样的不完全信息 博弈是没法分析的,因为当一个参与人并不知道他与谁博弈时,博弈 的规则是没定义的。)
处理:Harsanyi,1967-1968—引入虚拟的参与人—“自
低成本:给定进入者不进入,在位者的最优选择是斗争,概率1-P,认为在位者低成本
则进入者选择进入的期望利润
进入者选择不进入的期望利润
40P-10 (1-P)
≥
0×P+0 (1-P)=0
50P≥10 P≥1/5
即 P>1/5进入 P<1/5不进入 P=1/5两者无差异 就选进入(假定)
海萨尼(Harsanyi)转换
i
a
* i
(a1*
(1
),
,
a* i 1
(
i
1
),
a* i 1
(
i
1
),
,
a
* n
(
nБайду номын сангаас
))
不完全信息博弈和贝叶斯纳什均衡
2.{ i}i =1 取自某个客观的分布函数P(θ 1,• •θ n ) • θ
3.博弈方0让每个实际博弈方知道自己的类型,但不让(全部或 部分)博弈方知道其他博弈方的类型 同时从各自的行为空间中选择行动方案a1 , ⋯, an , 其中 ai ( i )∈ Ai ( i ), θ θ 而行动空间是类型依存的 5.各博弈方得益ui = ui (a1 ,⋯ , an , θ i ), i = 1, ⋯, n 4.在前述基础上,在进行原来的静态博弈,即各个实际博弈方
-
3.1.3 不完全信息静态博弈的战略式表 述和贝叶斯纳什均衡 3.1 定义
-
-
3.2 博弈顺序
3.3 假设 3.3.2 Ai (θ i ) 和 u i ( a1 , ⋯ , a n , θ i ) 本身是共同 知识; 知识 3.3.1 参与人的类型是相互独立的 参与人的类型是相互独立的;
3.1.1不完全信息静态博弈 不完全信息静态博弈 1.1 定义: 定义: 不满足完全信息假设的博弈, 不满足完全信息假设的博弈,即在不完全 信息博弈中,至少有一个参与人不知道其他参 信息博弈中, 与人的支付函数。 与人的支付函数。 1.2 例:市场进入博弈 市场进入博弈
Байду номын сангаас
3.1.2 海萨尼转换
1.引进虚拟自然博弈方,可称为博弈方0,其作用是在博弈方选择 之前,为每个实际博弈方按随机方式或者说抽取他们的类型,构 成向量θ = (θ1 ,⋯,θ n),其中θ i ∈ Θ i , i = 1,⋯, n
3.4 期望效用
__ -
3.5 贝叶斯纳什均衡
-
-
-
博弈论-不完全信息静态博弈
从而V(b)=2b,或b=v/2
竞价者的最优战略是以自己保留价格的一 半作为叫价。
2021/4/9
24
一级密封价格拍卖(四)
如果有n人参与竞标,则b=(n-1)v/n,即b 随n的增加而增加,特别地,当n时, bv,就是说,投标人越多,卖者能得到 的价格就越高;当投标人趋于无穷时,卖 者几乎得到买者价值的全部。因此,让更 多的人加入竞标是卖者的利益所在。
不完全信息博弈
在生活中我们也会碰到这样的问题,比 如一个乞丐向你乞讨,你愿意帮助别人, 但不知道他是真的乞丐还是骗子,该如 何决定呢?如果你喜欢与人为善,你可 能愿意冒一点上当的危险,这不等于你 愚蠢,而是你认为,帮助一个困境中的 人比回绝一个骗子更重要。
2021/4/9
36
不完全信息博弈
❖ 不完全信息:每一个参与人对所有其他参与人 的(对手)的特征、战略空间及支付函数有准 确的 知识,否则为不完全信息。
不求爱 0,0
0,0
2021/4/9
33
市场需求信 息是不完全的。
不完全信息博弈
需求大的情况
开发商B 开发 不开发
开发商A
开发 4000,4000 不开发 0,8000
8000,0 0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
2021/4/9
32
不完全信息博弈
被求爱者对于
求爱者的品德的 信息是不完全的。
你 接受 不接受
求爱博弈:
求爱 100,100 -50,0
品德优良者求爱 求爱者 不求爱 0,0
0,0
100x+(-100)(1-x)=0
不完全信息静态博弈:贝叶斯纳什均衡
不完全信息静态博弈:贝叶斯纳什均衡海萨尼1、前两篇⽂章讲的博弈都包含⼀个基本假设,即所有参与⼈都知道博弈的结构、规则、⽀付函数,因⽽称为完全信息博弈。
然⽽现实中,参与者并不了解其他参与者的⼀些信息,即不完全信息博弈(games of incomplete information)。
2、当对⼿有多种情况时,⽐如市场博弈的例⼦,在位者成本函数可能有需求⾼、需求中、需求低三种情况,那么可以采取“海萨尼转换”,即引⼊⼀个虚拟的参与⼈“⾃然”,⾃然⾸先⾏动,选择参与⼈的类型,被选择的参与⼈知道⾃⼰的真实类型,其他参与⼈并不清楚这个参与⼈的真实类型,但知道各种可能类型的概率分布。
如下图所⽰:3、这种情况下,可以通过海萨尼转换(Harsanyi transformation)把不完全信息博弈转换成完全但不完美信息博弈(complete but inprefer information)。
“不完美信息”指“⾃然”作出了选择,但其他参与⼈并不知道它的具体选择是什么,仅知道各种选择的概率分布。
4、在静态不完全信息博弈中,参与⼈同时⾏动,每个参与⼈的最优战略依赖于⾃⼰的类型,他不可能准确的知道其他参与⼈实际上会做出什么选择,但他能正确的预测其他参与⼈的选择是如何依赖于各⾃的类型的。
决策的⽬标就是在给定⾃⼰的类型和别⼈的类型依从战略的情况下,最⼤化⾃⼰的期望效⽤。
海萨尼定义了“贝叶斯纳什均衡”,给定⾃⼰的类型和别⼈类型的概率分布,每个参与⼈的期望效⽤达到了最⼤化,没有⼈有积极性选择其他战略。
5、举个例⼦,某⼀市场原来被A企业所垄断,现在B企业考虑是否进⼊。
B企业知道,A企业是否允许它进⼊,取决于A企业阻挠B企业进⼊所花费的成本。
如果阻挠的成本⾼,A企业的最优战略是默许B进⼊。
如果阻挠的成本低,A企业的最优战略是阻挠。
⽀付矩阵如下表所⽰:B企业并不知道A企业的阻挠成本是⾼还是低。
这⾥,某⼀参与⼈本⼈知道、其他参与⼈不知道的信息称为私⼈信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
海萨尼转换
类型:一个参与人拥有的所有的个人信息(即所有不是共同知
识的信息)称为他的类型。 根据这个定义,甚至允许参与人不知道其他参与人是否知道自己 的类型。
例如:市场进入博弈:在位者不知道进入者是否知道自己是高成 本还是低成本,只知道进入者有p’的概率知道自己的成本函数, (1-p’)的概率不知道自己的成本函数。
不完全信息博弈
பைடு நூலகம்
不完全信息:每一个参与人对所有其他参与人的(对手)的特 征、战略空间及支付函数有准确的 知识,否则为不完全信息。 类似上述情况称为不完全信息博弈,即在不完全信息博弈中, 至少有一个参与人不知道其他参与人的支付函数。
不完全信息静态博弈 -贝叶斯纳什均衡
一 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈
司马懿自马上远远望之,见诸葛亮神态自 若,顿时心生疑忌,犹豫再三,难下决断。又 接到远山中可能有埋伏的情报,于是叫后军做 前军,前军做后军,急速退去。司马懿之子司 马昭问:“莫非诸葛亮无军,故做此态,父何 故便退兵?”
司马懿说:“亮平生谨慎,不曾弄险,今 大开城门,必有埋伏,我兵若进,必中计也。” 孔明见魏军退去,抚掌而笑,众官无不骇 然。诸葛亮说,司马懿“料吾生平谨慎,必不 弄险,疑有伏兵,所以退去。吾非行险,盖因 不得已而用之,弃城而去,必为之所擒。”
不完全信息静态博弈 -贝叶斯纳什均衡
一 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈
海萨尼转换
不完全信息静态博弈的战略式表述和贝叶斯纳什均衡
二 贝叶斯纳什均衡应用举例
三 贝叶斯纳什均衡与混合战略均衡
四 机制设计理论与显示原理
不完全信息博弈-无法避免的不确定性
有一次,主人派伊索进城。半路上,他遇 见一位法官。
这种情况下,进入者也有两种类型:知道(在位者的成本)或不 知道(在位者的成本)。 例如:在谈判中,甲方知道自己是强硬派或妥协派,乙方知道自 己是否知道甲方是强硬派或妥协派,但甲方不知道乙方是否知道 自己是强硬派还是妥协派,则甲方有两种类型:强硬派或妥协派, 乙方有两种类型:知道或不知道。 不完全信息意味着,至少有一个参与人有多个类型。
不完全信息博弈
“空城计”
街亭失守,司马懿引大军蜂拥而来,当时 孔明身边只有一班文官,军士一半已经运粮草 去了,只有2500军士在城中。 众官听得这个消息,尽皆失色。孔明登城 望之,果然尘土冲天,魏兵分两路杀来。
孔明令众将旌旗尽皆藏匿,打开城门,每 一门用20军士,扮作百姓,洒扫街道。而孔明 羽扇纶巾,引二小童携琴一张,于城上敌楼前 凭栏而望,焚香操琴。
不完全信息博弈
进入者关于 在位者成本信息 是不完全的。
市场进入博弈:不完全信息 在位者 低成本情况 高成本情况
默许
斗争 默许 斗争 进入 不进入
进入者
-3, -3 0, 1
-3, -3 0, 0
1, 0 0, 1
1, 0 0, 0
进入者的最优选择依赖于他在多大程度上认为在位者 是低成本的。
假定进入者认为在位者是高成本的概率是p,低成本的概率是(1-p), 那么,进入者选择进入的期望利润是p(40)+(1-p)(-10),选择不 进入的利润是0,因此,进入者的最优选择是:如果p>=1/5,进入,如 果p<1/5,当p=1/5时,进入与不进入是无差异的,我们假定其进入。
法官严厉地盘问:“你要去哪儿?”
“不知道”伊索回答说。
法官起了疑心,派人把伊索关进了监狱, 严加审问。 “法官先生,要知道,我讲的是实话。” 伊索说,“我确实不知道我会进监狱”。
不完全信息博弈
我们不可能料事如神,也无法掌握所有变因,更无力预测未来, 不确定性就象缴税一样不可避免。 这里主要探讨如何在不确定性的情况下做出理性、一致的决策, 换句话说,首先必须承认自己虽然没有办法做到无所不知,但 也不至于一无所知,而应该或尽可能有效运用自己所知的一切 为自己谋利。
不完全信息博弈-信息的重要性
司马懿
进攻 弃城 被擒,? 被擒,? 撤退 不被擒,? 不被擒,?
司马懿关于自 己策略的支付的 信息是不完全的。
诸葛亮
守城
司马懿:兵多将广,但不知道自己和对方在不同行动策略下的支付;
诸葛亮:处于劣势,但知道博弈的结构,比对方掌握更多的信息。 计策:使用各种手段迷惑司马懿,为的是不让对方知道其策略的结果(支 付)。迫使其认为,撤退比进攻好,降低其进攻的预期收益。
不完全信息博弈
海萨尼转换
不完全信息静态博弈的战略式表述和贝叶斯纳什均衡
二 贝叶斯纳什均衡应用举例
三 贝叶斯纳什均衡与混合战略均衡
四 机制设计理论与显示原理
海萨尼转换
市场进入博弈:不完全信息
高成本情况
默许
斗争 进入 不进入
在位者
低成本情况
默许 斗争
进入者
-3, -3 0, 1
-3, -3 0, 0
1, 0 0, 1
1, 0 0, 0
进入者似乎在与两个在位者博弈,一个是高成本的在 位者,一个是低成本的在位者;如果在位者有T种不同的成本 函数在位者就相当于与T个不同的在位者博弈。
1976年以前,博弈论专家认为这样的不完全信息是没法 分析的。
N
海萨尼转换
高
低
海萨尼在1967-1968 进入者 年提出了一个处理不 [1-P] [P] 完全信息的方法-引 进入 入一个虚拟的参与人 不进入 不进入 进入 “自然”,自然首先 行动,选择决定参与 在位者 人的特征(如成本函 B 斗争 B 在位者 (0,400) 数),参与人知道自 己的特征,其他参与 (0,300) 斗争 合作 人不知道。这样不完 合作 全信息博弈就转换为 完全但不完美信息博 (30,80) (-10,100) 弈,可以利用标准的 (40,50) (-10,0) 分析技术进行分析, 这就是“海萨尼转 换”。
如用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主
观概率,使司马懿认为进攻的期望收益小于撤退的期望收益。
不完全信息博弈
在信息不充分的情况下,博弈参与者 不是使自己的支付或效用最大,而是使 自己的期望效用或支付最大。 如让你在50%的概率获得100元与10% 的概率获得200元两者之间选择的话,前 者的期望所的是50元,后者是20元,故 选前者。