博弈论原理 第5讲 不完全信息静态博弈
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
贝叶斯纳什均衡
不完全信息博弈-无法避免的不确定性
有一次,主人派伊索进城。半路上,他遇见一位法官。法官严厉 地盘问:“你要去哪儿?” 伊索回答说“不知道” 。法官起了 疑心,派人把伊索关进了监狱,严加审问。“法官先生,要知道, 我讲的是实话。”伊索说,“我确实不知道我会进监狱”。
5.1 不完全信息与不完全信息静态博弈
工商管理学院
School .Busi Admin
在孔明与司马懿的博弈中,对于司马懿而言,孔明有谨 慎和冒险两种类型。 由于司马懿不知道双方行动的支付,根据其策略我们可 以假设他对此次博弈的预期支付为:
孔明 冒险 司 马 懿 守城 进攻 后退 获胜,被擒 不胜不败,逃 脱 弃城 获胜,被擒 不胜不败,逃 脱 守城 被伏击,逃脱 不胜不败,逃 脱 谨慎 弃城 获胜,被擒 不胜不败,逃 脱
5.1 不完全信息与不完全信息静态博弈
工商管理学院
School .Busi Admin
5.1 不完全信息与不完全信息静态博弈
工商管理学院
School .Busi Admin
如果用 ti 表示博弈方 i 的类型,用 Ti 表示博弈方 i 的类型空间, t i Ti ,用
ui (a1 ,, an , t i ) 表示博弈方 i 在策略组合 (a1 ,, an ) 下的得益,每一类型 ti 都对应
二、静态贝叶斯博弈的表示 在静态贝叶斯博弈中,各博弈方虽然知道自己的 得益函数,但却无法了解其他博弈方的得益函数,按照 一般静态博弈分析方法无法解决该问题。为此,我们可 以这样来考虑:虽然一些博弈方(如博弈方k)不能确定 其他博弈方在一定策略组合下的得益,但一般知道其他 博弈方(如博弈方i)的得益有哪些可能的结果,而具体哪 种可能的结果会出现则取决于博弈方属于哪种“类型” (Type)。这些“类型”是博弈方自己清楚而他人博弈 方无法完全清楚的有关私人内部信息。
然而,司马懿不知道自己和对方在不同行动策略下 的支付,而诸葛亮是知道的,他们对博弈结构的了 解是不对称的,诸葛亮拥有比司马懿更多的信息, 因此这是一个信息不对称的博弈。
1
5.1 不完全信息与不完全信息静态博弈
工商管理学院
School .Busi Admin
5.1 不完全信息与不完全信息静态博弈
5.1 不完全信息与不完全信息静态博弈
工商管理学院
School .Busi Admin
5.1 不完全信息与不完全信息静态博弈 建立如下支付矩阵:
工商管理学院
School .Busi Admin
空城计
背景:诸葛亮误用马谡,致使街亭失守。司马懿引 大军十五万蜂拥而来。当时孔明身边别无大将,只 有一班文官,五千军士,已分一半先运粮草去了, 只剩二千五百军士在城中。 孔明传令众将旌旗尽皆藏匿,诸军各收城铺。打开 城门,每一门用二十军士,扮作百姓,洒扫街道。 而孔明乃披鹤氅,戴纶巾,引二小童携琴一张,于 城上敌楼前凭栏而坐,焚香操琴。 司马懿顿然怀疑其中有诈,立即叫后军作前军,前 军作后军,急速退去。千古佳话,就此酿成!
将计就计:真正的“信息不对称”
工商管理学院
School .Busi Admin
5.1 不完全信息与不完全信息静态博弈
工商管理学院
School .Busi Admin
一个古董商发现一个人用珍贵的茶碟做猫食碗,于是假装对这只猫很感兴趣,要 丛主人手里买下,主人不卖,为此古董商出了大价钱。成交之后,古董商装做不在意 地说:这个碟子它已经用惯了,就一块送给我吧。猫主人不干了:你知道用这个碟子, 我已经卖了多少只猫了?
在上述的博弈中,进入者似乎在与两个 在位者博弈,一个是高成本的在位者, 一个是低成本的在位者;如果在位者有T 种不同的成本函数,进入者就相当于与T 个不同的在位者博弈。 1967年以前,博弈论专家认为这样的不 完全信息是没法分析的。
着博弈方 i 不同的收益函数的可能情况。其取值是博弈方 i 自己知道而其他博弈方并不 清楚的,ቤተ መጻሕፍቲ ባይዱ映了静态贝叶斯博弈中信息不完全的特征。根据上述思路,静态贝叶斯博 弈可一般表达为 G {A1 ,, An ; T1 ,Tn , u1 ,, u n } ,其中 Ai 为博弈方 i 的策略空间,Ti 是博弈方 i 的类型空间,
根据拍卖交易制度的不同, 目前有5种主要的拍卖机制:
在英式拍卖中, 投标者按照递增的顺序宣布他们的出价, 直到没有人愿意出更高的价格, 出价最高的投标者获得拍 卖品; 在荷兰式拍卖中, 拍卖从一个非常高的初始价格标价逐渐 降低到有一个买主接受报价; 在一级密封价格拍卖中, 出价最高的投标者获得拍卖品, 并支付自己的出价给卖者; 在二级密封价格拍卖中,出价最高的投标者获得拍卖品, 但支付次高价格给卖者; 在双方叫价拍卖中, 所有的买主和卖主同时出价, 拍卖商 然后选择成交价格出清市场。
拍卖和招投标是比较典型的不完全信息静态博弈。由拍 卖或招投标问题构成的博弈模型的共同特征就是都属于 不完全信息博弈,包括不完全信息静态博弈和不完全信 息动态博弈。而密封拍卖就可以构成一个典型的不完全 信息静态博弈,也就是静态贝叶斯博弈。
求爱博弈: 品德优良者求爱
20x+ (-100)(1-x)=0 当x大于5/6时,接受求爱
进入
求爱者
不进入
你
默许 进入 不进入
100,-100 0, 0
斗争
-50,0 0, 0
求爱博弈: 品德恶劣者求爱
求爱者
对手特征、战略空间
5.1 不完全信息与不完全信息静态博弈
工商管理学院
School .Busi Admin
5.1 不完全信息与不完全信息静态博弈
工商管理学院
School .Busi Admin
工商管理学院
School .Busi Admin
5.1 不完全信息与不完全信息静态博弈
工商管理学院
School .Busi Admin
在密封拍卖中,中标博 弈方的利益除了取决于 标价以外,还取决于他 对拍卖标的物的估价, 买价估价是私人信息, 因此在密封拍卖博弈中, 各个博弈方对其他博弈 方中标的实际得益无法 确知,只能自己判断, 这说明上述暗标拍卖博 弈确实是不完全信息博 弈, 是静态贝叶斯博弈。
工商管理学院
School .Busi Admin
5.1 不完全信息与不完全信息静态博弈 关于不完全信息
工商管理学院
School .Busi Admin
第五讲
1 2 3
不完全信息静态博弈
不完全信与不完全信息静态博弈 海萨尼转换
在生活中我们会碰到这样的问题,比如一个乞丐向你乞讨,你愿意帮助别人, 但不知道他是真的乞丐还是骗子,该如何决定呢? 在博弈中,不完全信息的博弈称为“贝叶斯博弈”。不完全信息是指至少有一 个博弈方不完全清楚其他某些博弈方的得益或得益函数。不完全信息的静态博 弈也就是后面即将要讲的“静态贝叶斯博弈”。 不完全信息的静态博弈主要探讨如何在不确定性的情况下做出理性、一致的决 策,换句话说,首先必须承认自己虽然没有办法做到无所不知,但也不至于一 无所知,而应该或尽可能有效运用自己所知的一切为自己谋利。
孔明可以选择的策略是“弃城”或“守城”,如果司马 懿判断孔明是“冒险”的,无论是“弃”还是“守”, 那么孔明均要被其所擒。 所以孔明就用空城计“于城上敌楼前凭栏而坐,焚香操 琴”,增大了司马懿判断自己是“谨慎”类型的主观概 率。 正如孔明所料,司马懿认为孔明是“谨慎”的,在“理 性的”司马懿看来,进攻失败的可能性较大,而退兵的 期望效用大于进攻的期望效用。故最终司马懿选择了退 兵,孔明则得以逃脱。
通过上述思想和方法, 我们就将博弈中一些博弈方 对其他博弈方得益的不了解,转化成对这些博弈方 “类型”的不了解,这样我们在分析静态贝叶斯博 弈的时候,就必须将关注各博弈方的得益转向关注 各博弈方的策略组合以及各自的“类型”。
ui (a1 ,, an , t i ) 为博弈方
i 的得益 , 它是策略组合
2
5.1 不完全信息与不完全信息静态博弈 我们假设卖主不设定成 交的最低限价,未中标 者没有成本。显然这种 暗标拍卖是发生在投标 人之间的,在同时开标 的情况下(即同时选择) 展开的一次性静态博弈, 各个博弈方的策略是他 们各自提出的标价;中 标博弈方的得益是其对 标的的估价与成交价格 之差,未中标博弈方的 利益则为0。
低成本情况 斗争 -10,100 0,400
进入者关于在位者成本信息是不完全的,进入者的最优选择依赖于他在多大程度上 认为在位者是低成本的。 假定进入者认为在位者是高成本的概率是p,低成本的概率是(1-p),那么,进入 者选择进入的期望利润是p(40)+(1-p)(-10),选择不进入的利润是0,因此, 进入者的最优选择是:如果p>=1/5,进入,如果p<1/5,当p=1/5时,进入与不进 入是无差异的,我们假定其进入。
著名的BF实验
把几只蜜蜂和几只苍蝇放进一个玻璃瓶中,然后将瓶子平放,让瓶底朝向窗户,结果会怎样呢? 你会看到,蜜蜂不停地在瓶底寻找出口,直到累死为止,而苍蝇则在不到两分钟内全部逃出。为什 么呢?因为蜜蜂喜欢光亮而且有智力,于是他们坚定的认为,出口一定在有光亮的地方,于是他们 不停地重复这一合乎逻辑的行为。而苍蝇呢?它们对事物的逻辑毫不在意,而是到处乱飞,探索有 可能出现的任何机会,于是他们成功了。 实验、试错、冒险、即兴发挥、迂回前进、混乱、随机应变,所有这些都有助于应付变化,要善 于打破固定的思维模式,要有足够的探索未知领域的学习能力。
密封拍卖一般有这样几个基本特征: (1)各方的报价放在密封的信封里上交 (2)在统一的时间里公证开标; (3 )每一个报价方知道自己对标的的估 价,但不知 道其他报价方对标的的估价 (4)一般是标价最高者中标
显然, 拍卖或招投标问题属于不完全信息博弈,包括不 完全信息静态博弈和不完全信息动态博弈。
(a1 ,, a n ) 和类型 ti 的函数。
5.1 不完全信息与不完全信息静态博弈
工商管理学院
School .Busi Admin
5.2 海萨尼转换
在位者 高成本情况 合作 进入者 进入 不进入 40,50 0,300 斗争 -10, 0 0, 300 合作 30,80 0,400
工商管理学院
School .Busi Admin
在上面的分析中,我们可以看到,对“类型”的了解, 是解决静态贝叶斯博弈问题的一个关键,因为在不完全 信息静态博弈中,如果一些博弈方对其他博弈方的“类 型”完全不了解,就完全失去了进行决策的依据。 因此,这些博弈方至少应该了解其他博弈方各种“类型” 出现机会的相对大小,即对每种“类型”出现的概率分 布有一个基本判断,这样才可能根据其他博弈方各种可 能的得益,推导出自己的选择,并对相应的期望利益进 行估计。
3
5.2 海萨尼转换 关于海萨尼转换
工商管理学院
School .Busi Admin
5.2 海萨尼转换 海萨尼转换的原理
工商管理学院
School .Busi Admin
海萨尼(Harsanyi)1967年提出了一种进一步将 不完全信息静态博弈转化为完全但不完美信息动态 博弈进行分析的思路,被称为“海萨尼转换 (Harsany Transformation)”
将计就计:掌握的正确信息越多,获胜的可能就越大
有一个卖草帽的人,有一天叫卖归来,在一棵大树旁 打起了瞌睡,等他醒来的时候,发现身边的帽子都不 见了,抬头一看,树上有很多猴子,模仿人的样子把 帽子戴在头上,他想到猴子喜欢模仿人的动作,就拿 下自己的帽子扔在地上,猴子也学他,纷纷将帽子扔 在地上。于是卖帽子的人检起帽子回家去了,并将这 个故事告诉了他的子孙。 很多年后,他的孙子继承了卖帽子的家业,有一天, 他也在大树旁睡着了,而帽子也同样被猴子拿走了, 他想起爷爷的办法,拿下帽子扔在地上。可是猴子非 但没有照他的做,还把扔在地下的帽子也拣走了,临 走时还说:我爷爷早告诉我了,你这个老骗子要玩什 么把戏。
5.1 不完全信息与不完全信息静态博弈 自然选择参与人的类型
行动
接受
工商管理学院
School .Busi Admin
5.1 不完全信息与不完全信息静态博弈
工商管理学院
School .Busi Admin
你
不接受
-50,0 0, 0 100,20 0, 0
几个静态贝叶斯博弈的例子
密封拍卖(Sealed-bid Auction)