博弈论第四讲

合集下载

博弈论第四讲动态博弈60页PPT

博弈论第四讲动态博弈60页PPT
Thank you
博弈论第四讲动态博弈
36、“不可能”这个字(法语是一个字 ),只 在愚人 的字典 中找得 到。--拿 破仑。 37、不要生气要争气,不要看破要突 破,不 要嫉妒 要欣赏 ,不要 托延要 积极, 不要心 动要行 动。 38、勤奋,机会,乐观是成功的三要 素。(注 意:传 统观念 认为勤 奋和机 会是成 功的要 素,但 是经过 统计学 和成功 人士的 分析得 出,乐 观是成 功的第 三要素旅途 ,义无 反顾。 40、对时间的价值没有没有深切认识 的人, 决不会 坚韧勤 勉。
6、最大的骄傲于最大的自卑都表示心灵的最软弱无力。——斯宾诺莎 7、自知之明是最难得的知识。——西班牙 8、勇气通往天堂,怯懦通往地狱。——塞内加 9、有时候读书是一种巧妙地避开思考的方法。——赫尔普斯 10、阅读一切好书如同和过去最杰出的人谈话。——笛卡儿

博弈论基础讲义-第四章

博弈论基础讲义-第四章

第四章动态不完全信息博弈第一节. 序贯均衡的内涵一.问题的提出1.序贯理性2.一致信念二.序贯均衡的内涵1.例子2.定义a.行为战略b.序贯理性c.一致信念3.存在性三.序贯均衡的计算1.例子:一般计算2.例子:分析应用第二节. 序贯均衡的应用一.教育和信号传递1.假设2.分析二.垄断限价模型1.假设2.分析三.声誉模型1.假设2.分析四.序贯均衡之再精炼1.剔除劣弱战略2.直观标准3.垄断限价模型第四章不完全信息动态博弈第一节.序贯均衡的内涵一.问题的提出1.序贯理性——参与人在所有情况决策都是理性的,即在给定信念的条件下,以及其他参与人的选择条件下,自身选择是最优的例1:子博弈最优——纳什均衡(,)L l是否合理?——如果参与人2有机会选择,肯定选r而不是l;——(,)L l不是子博弈精炼纳什均衡。

例2:单点信息集最优——纳什均衡(,,)D a l是子博弈纳什均衡;——但如果参与人2有机会选择,但肯定选择d;——(,,)D a l不满足单点信息集理性。

例3:多点信息集最优——纳什均衡(,)A r是子博弈精炼纳什均衡;——(,)A r不满足多点信息集理性。

2.一致信念例1:与客观事实一致u=是否合理?——参与人2的信念2/3——2/3u=是不合理的,因为任何到达参与人2信息集都不可能产生此后验概率;——后验信念必须与先念信念保持一致。

例2:前后信念一致——参与人2的第2个信息集上的信念,是否合理?——不合理,给定参与人战略和第1个信息集的信念,利用贝叶斯法则计算信念与此不一致;——参与人前后信念保持一致。

例3:独立偏离——参与人3的信念0.9u =是否合理?——参与人1和参与人3的偏离是独立的,所以参与人3的合理信念为0.1u =;——不同参与人之间的偏离是独立的总结,一致信念要求:参与人偏离最小化,,参与人之间偏离是独立的;二.序贯均衡的定义1.例子——定义参与人1在信息集1.1和1.3以及参与人2在2.2上的序贯理性;——定义信息集1.3和2.2的信念?2.定义a.行为战略:参与人在某个信息集到行动集映射,——如果某个状态真正发生,参与人如何决策;——序贯理性是否满足?b.序贯理性:在任何信息集上,参与人在给定信念和所有后续行为战略,选择自身行为战略最大化预期效用。

博弈论课件第四章

博弈论课件第四章

3
合作博弈
参与者之间可以合作并制定共同策略,追求更大的利益。
纳什均衡理论
纳什均衡是博弈论中的一个重要概念,指的是当参与者根据对手的选择来选 择自己的策略时,不存在更好的选择。这种均衡状态具有稳定性和可持续性。
混合策略的应用
硬币翻转
混合策略可以应用于硬币翻转等 概率性决策中,以平衡风险。
剪刀石头布
博弈理论在法律
博弈论可在法律领域中应用于博弈模型的构建和法律决策的优化。
博弈论的应用领域
经济学
博弈论在经济学中用于研究市场竞争、拍卖和价格形成等问题。
政治学
博弈论在政治学中用于分析选举、合作和冲突等政治策略。
生物学
博弈论在生物学中用于研究进化和动物行为等领域。
博弈论中的主要模型
1
零和游戏
参与者的收益总和为零,一方的利益损失即为另一方的利益增益。
2
非合作博弈
参与者之间缺乏合作,每个参与者根据自身利益进行决策。
博弈论课件第四章
博弈论是研究决策制定和互动模型的学科,第四章将介绍博弈论的基本概念、 应用领域、主要模型以及纳什均衡理论和混合策略的应用,同时提供实际应 用案例。
博弈论的基本概念
1 参与者
博弈论研究多人决策制定过程中的参与者之间的互动。
2 策略
参与者在决策过程中可选择参与者根据他们的行动所获得的支付或效益。
混合策略可用于剪刀石头布等多 次对局中,通过随机选择策略以 增加不可预测性。
扑克筹码
混合策略可应用于扑克中的下注 决策,以提高筹码的价值和战略 性。
博弈论在实际问题中的应用案例
商业竞争
博弈论可用于分析企业在市场竞争中的策略选择和定价决策。
军事战略

博弈论第四讲动态博弈

博弈论第四讲动态博弈

制止
(-2,5) 制止
仿冒
A 不仿冒
B
不制止 (0,10)
仿冒
A
B 不制止
不仿冒 (5,5)
(2,2)
(10,4)
节点: 边: 终节点:
引子
每一阶段节点数、每一个选择节点的可选行为 数量,都可以不同,比如
仿冒更多次数、仿冒的规模和程度、制止仿冒的力 度
也不是所有动态博弈都可以用扩展形
阶段很多,或在一个阶段有很多可以选择的行为, 如下棋
双寡头竞争:古诺(Cournot)博弈
设一市场有1,2两家厂商生产同样的产品。如果厂商1的产量为 q1,厂商2的产量为q2 ,则市场总产量为Q= q1+ q2 。设市场出 清价格P是市场总产量的函数P(Q)=a-(q1+q2)
两个企业同时选择产量,价格由市场决定; 假设每家公司的成本函数相同,并且每单位成本不随生产的数量
古诺寡头模型扩展--斯塔克博 格模型(Stackelberg)
先分析第二个厂商的决策:?
因为其决策时,厂商1的选择q1实际上已经决定了, 并且厂商2知道q1,因此对厂商2来说,相当于在给 定q1的情况下求使II2实现最大的q2 ,
II2对q2求导,得到q2必须满足:a-c- q1 -2 q2 =0, 即q2 *=(a-c- q1)/2
法律保障 --单次 企业信用体系--全寿命,一旦有失信发生,它的信用记录
有一笔摸不去的黑,将来它做生意也好,向银行贷款也好, 都会受此影响。所以国外企业对信用问题看的非常严重-- 电子商务的信用记录
关键在于必须增加一些对甲行为的制约!
在上面,甲选择不分,乙完全无可奈何;只能采取消极办法 -不借,保护自己不被骗
变化。更正规一些,每家公司具有常数边际成本函数;C(qi ) cqi

第四讲 动态博弈

第四讲 动态博弈

R (0,0)
2
U
1
L (3,1) (2,2)
D
修改的市场进入博弈
试说明上述不可置信的威胁是什么? 现实生活中的例子:父亲坚决不同意女儿 的婚事,威胁说,如果女儿不与相爱的人 断绝关系,他就与女儿断绝父女关系。
逆向归纳法
逆向归纳法可以排除不可置信的威胁。之 所以可以如此,根本原因在于采用了一种 分析动态博弈的有效方法——逆向归纳法, 即从动态博弈的最后一个阶段博弈方的行 为开始分析,逐步倒推回前一个阶段相应 博弈方的行为选择,一直到第一个阶段的 分析方法。一般方法是:从最后一阶段开 始分析,每一次确定出所分析阶段博弈方 的选择和路径,然后再确定前一阶段的博 弈方选择和路径。
(L/L,L/S) (L/L,S/S) (S/L,L/S) (S/L,S/S)
(若史密斯选择大则选择大;若其选择小则选择大) (若史密斯选择大则选择大;若其选择小则选择小) (若史密斯选择大则选择小;若其选择小则选择大) (若史密斯选择大则选择小;若其选择小则选择小)
跟随领头羊Ⅰ表明只要添加一点复杂性,就 使得策略式表述变得晦涩难懂,几无用武之 地。策略式如下。
威胁是指一个参与人承诺一旦其他参与人 偏离均衡,他将采取的某种行动,威胁是 有 一定影响力的,尽管可能它从未被实施 过。
在位者
默许 斗争 进入 40,50 -10,0 进入者 不进入 0,300 0,300 市场进入博弈中,如若进入者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润,所以 斗争就是一种不可置信的威胁。但纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)就成为一个纳 什均衡。
例如,一个模型不能在一开始就说德国相信它打 赢一场与法国的战争的概率是0.8,而法国相信这 一概率只有0.4,因此它们急欲一战。恰恰相反, 它必须假定信念(先验概率)开始时是一致的, 随后因为私人信息而产生分歧。例如两个参与人 都认为德国获胜的概率是0.4,但若德国的将军是 个军事天才,则这一概率就是0.8,而且随后德国 人发现德国的将军确实是个天才。如果是法国抢 先宣战,那么法国的错误信念可能会导致一场战 争,而若德国能令人信服它对德国将军天才的私 人信息,则这场战争本可避免。

王则柯博弈论4序贯决策博弈

王则柯博弈论4序贯决策博弈

• 试验表明,在分别判断的情况下(也就是人们不能把这两杯冰 淇淋放在一起比较),人们反而愿意为冰淇淋A多付钱。结果 显示,人们愿意花2.26美元买冰淇淋A,却只愿意用1.66美元 买冰淇淋B。 • 说明:人们在作决策的时候,不是象传统经济学那样判断一个 物品的真正价值,而是根据一些比较容易评价的线索来判断。 • 引申:在送礼物的时候,礼物在它所属的类别里面是不是昂贵 很重要。
n人序贯博弈的博弈树的主要特征
• 对于表达有n个局中人P1,P2,…,Pn参与 的一个序贯博弈的博弈树:
1. 在树的每一个非末端节点上,都只有一个局中人 进行决策; 2. 在树的每一个末端节点上,都指派了一个n维的 “支付”向量p(v)=(p1(v),p2(v),…,p3(v)),这 里v是这个末端节点的相应的策略表达.而1, 2,…n是博弈参与人首次决策的自然顺序。
• 博弈树必须说明在每一个决策节点上相应的局中人能够 采取的所有可能的选择。 • 一些博弈树可能包含“不做任何决策”的决策节点。每一个 决策节点都有至少一条棱从它那里出发往后延伸,但是 没有最大延伸数量的限制。 • 对于不是根的每个节点,只能有来自别的节点的唯一的 棱指向它这个节点。
• 博弈树并不要求每个局中人必须在至少一个非末 端节点上进行决策。即,可能会出现某些局中人 并不在任何一个非末端节点上进行决策的情形。
• 策略组合
• 策略组合星号简示法 : ( U ,{ U’ , * } )2 • 策略组合的节点表示法: ( { U / D }, { U’ / D’ , U’’ / D’’ })8
4-4 倒推法(逆向推导法)
• 在序贯博弈中,由于均衡与结果是两个不同的概 念,所以求解纳什均衡的虚线排除确定法,并不适 用于求解序贯博弈的结果。一般使用倒推法(逆向 推导法)求序贯博弈的结果。

博弈论(课一)

博弈论(课一)

博弈论(课一)课程内容和时光支配第一讲:概述(第一、二章)其次讲:术语解读和基本假设(第三、四章)第三讲:囚犯逆境和破解之道(第五、六、七章)第四讲:万元陷阱和智猪博弈(第八、九章)第五讲:懦夫博弈和性别战(第十、十一章)博弈学-----博览全局对弈棋局课一博弈在中国的理解--略观围棋,法于用兵,怯者无功,贪者先亡。

西方国家的理解--Game fair play。

(中国人在博弈中关注的是获胜,西方人在博弈中关注的是怎么玩的愉快。

)博弈可以在工作领域,可以在社交往来,可以在家庭相处,无处不在,博大精深。

知人者智,自知者明;胜人者力,自胜者强;小胜者术,大胜者德。

推举书刊1、蒋文华:《用博弈的思维看世界》,浙江高校出版社,2022年。

2、张维迎:《博弈论与信息经济学》,上海三联书店,上海人民出版社,1996年。

3、詹姆斯·米勒:《活学活用博弈论-如何利用博弈论在竞争中取胜》,中国财政经济出版社,2022年。

4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《策略思维》,中国人民高校出版社,2022年。

5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《妙趣横生博弈论》,机械工业出版社,2022年。

博弈指在一定的嬉戏规章约束下,基于直接互相作用的环境条件,各参加人依据所把握的信息,挑选各自的策略(行动),以实现利益最大化的过程。

故事1,两人同行打猎,忽遇一猛狮。

一人卸下身上物品狂奔,同伴不解,问道:“汝能胜狮?”答曰:“非需胜狮,只需胜汝!” (博弈既可以是竞争,也可以是合作!)嬉戏1,每位学生写1个介于1与100之间的自然数(整数,包括1与100在内),然后求出全部数字的平均数,假如你所写的数字最临近该平均数的二分之一,那么你将在嬉戏中胜出。

(博弈,必需学会换位思量!)博弈只需率先一步,高人一筹!大智若愚假如由于对方眼中的你的傻,而让对方更情愿和你合作,何乐而不为呢?嬉戏2,每位学生写5个大于0的自然数,假如你所写的5个数字中有一个是全部学生中所写的数字中最小的(在没有重合的状况下),那么你将在该嬉戏中胜出。

博弈论张维迎经典课件

博弈论张维迎经典课件

( )
∈ Θ ,信号 m ∈ M ,行动 a ∈ A ,参 与人i获得支付 u i (m, a, θ ) ,i = 1,2 。
ps
。若 p b
≥ p s ,则以价格
p = 0.5( pb + p s ) 成交,否则不成交。设买方对货物的估价为 vb
卖方的估价为 v s ,并设相互知道对方的估价标准分布于[0,1]区 为 p − v s 。若没成交,双方得益为0。求贝叶斯NE。 间上。若双方以价格p成交,则买方的得益为 vb − p ,卖方的得益
求贝叶斯均衡。
8
例4 不完全信息古诺模型 例5 不完全信息下公共品的提供问题 例6 消耗战 有两种动物为一个目标展开争斗,各自在单位时间内由于争斗 而付出的成本均为1。若其中一个首先停止争斗,另一个将获得 该目标。若同时停止争斗,谁也不能获得该目标。两博弈方应 如何选择争斗停止时间?即两个局中人同时选择一个停止时间
任意博弈方i和他的每一种可能的类型 t i ∈ Ti ,s i* (t i ) 所选择的 行动 a i 都能满足: * max ∑ {u i s1* (t1 ), L , s i*−1 (t i −1 ), a i , s i*+1 (t i +1 ), L , s n (t n ); t i , t − i p i (t − i t i )}
时装

足球 0,0 1,3+th
16
时装 足球
2+tw,1 0,0
第五章 不完全信息动态博弈
一、精炼贝叶斯NE 要求1:在各个信息集,轮到选择的博弈方必须具有一个关于 要求 博弈达到该信息集中每个节点可能性的判断。对多节点信息集, 一个判断就是博弈达到该信息集中各个节点可能性的概率分布, 对单节点信息集,则可理解为判断达到该节点的概率为1。 要求2:给定各博弈方的判断,局中人的策略必须是序列理性 要求 的。即在各个信息集,给定轮到选择博弈方的判断和其它博 弈方的后续策略,该博弈方的行为及以后阶段的后续策略, 必须使自己的得益或期望得益最大。此处所谓后续策略即相 应的博弈方在所讨论的信息集以后阶段中,针对所有可能情 况如何行为的完整计划。

博弈论最全完整ppt 讲解

博弈论最全完整ppt 讲解

完全信息
纳什均衡(NE)
子博弈完美纳什 均衡(SPNE)
不完全信息
贝氏纳什均衡 (BNE)
完美贝氏纳什均衡 (PBNE)及序贯均 衡(SE)
静态博弈与动态博弈
(static games and dynamic games)
同时决策或者同时行动的博弈属于静态 博弈;先后或序贯决策或者行动的博弈, 属于动态博弈
如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为一个常数, 这个博弈就叫常和博弈;
相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为一 个常数,这个博弈就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英国
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进 行分析”领域做出了重要贡献。
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈

第四篇博弈论PPT课件

第四篇博弈论PPT课件
• 此情况下由于博弈没有可预测的明确的博弈结果,所以就不能 确定博弈方的策略。但是是否在这样的博弈中,各博弈方选择 任何策略都是一样的,因此可以随意选择吗?
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈

硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式

第04讲 博弈的基本框架 - 学生

第04讲 博弈的基本框架 - 学生
博弈的基本框架
1
·明确一个博弈的四大构成要素(完美信息、不完美信息)。 ·精确理解信息集与策略(纯策略、混合策略、浓缩策略)这 两个重要概念。
·能够用博弈的扩展式与规范式来描述一个博弈问题。
·了解划分博弈类型的基本方法:完全信息静态、完全信息动 态、不完全信息静态、不完全信息动态。
2
博弈论的基本框架
而象棋则是一个完美信息博弈。
17
信息集
定义 4.2.1 一个信息集 H 是以决策点为元素的集合。
信息集需满足以下两个条件:
(1) 同一个信息集中的所有决策点必须紧接着完全相同的 可选行动。 (2) 同一个信息集中的决策点不能出现一个先于另一个出 现的情况。
18
信息集判断
信息集判断
19
信息集
信息集设臵是正确的。 它表示甲无法判断自己处于信息集四个决策点中的哪一个。 一个博弈者如果总能记住她所经历过的所有博弈路径,我们称她 具有完美回忆(Perfect Recall)。 在图中,我们可以断定甲已经忘记了她自己以前采取的行动以及 其对手的反应,否则她不可能完全分不清四个决策点。 所以我们说在图中,甲没有完美回忆。
22
信息集判断
信息集判断
23
信息集
图中的信息集设臵也是错误的。 它不符合定义4.2.1中的条件(2)。
(2) 同一个信息集中的决策点不能出现一个先于另一个出现的情
况。 信息集只对应一个博弈者,甲乙两人的决策点在同一个信息集内 造成概念上的混乱。
24
信息集判断
信息集判断
25
信息集
在图中的信息集虽然都对应着乙,但它也违反了定义4.2.1中的 条件(2)。 (2) 同一个信息集中的决策点不能出现一个先于另一个出现的情 况。

博弈论第四讲

博弈论第四讲

Prisoner 2 can be rational (selfish) or altruistic, depending on
whether he is happy or not. If he is altruistic then he prefers to mum and he thinks that “confess” is equivalent to additional “four months in jail”. Prisoner 1 can not know exactly whether prisoner 2 is rational or altruistic, but he believes that prisoner 2 is rational with probability 0.8, and altruistic with probability 0.2.
(Confess, (Confess if rational, Mum if altruistic))
Confess is prisoner 1’s best response to prisoner 2’s
choice (Confess if rational, Mum if altruistic). (Confess if rational, Mum if altruistic) is prisoner 2’s best response to prisoner 1’s Confess A Nash equilibrium called Bayesian Nash equilibrium
Max s .t . q 2 [ a ( q1 q 2 ) c H ] q2 0
q 2 (c H ) 1 2 ( a q1 c H )

博弈论课件 第四章

博弈论课件 第四章
第四讲 重复博弈
1
精选PPT
何为“重复博弈”?
重复博弈是指基本博弈重复进行构成的博弈过程。 – 重复博弈中每个阶段中的博弈方、可选策略、规则 和得益都是相同的----是特殊的动态博弈;
– 形式上是基本博弈的重复进行,但博弈方的行为和 博弈结果不一定是基本博弈的简单重复,因为博弈 方对于博弈会重复进行的意识,会使他们对利益的 判断发送变化,从而使他们在重复博弈过程不同阶 段的行为选择受到影响。
– 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的
每种结果,下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m
7
种策略组合,那么重复两次就有m2条博弈路径,重复次就有mt条博弈路径。
精选PPT
重复博弈的得益
任何博弈博弈方策略选择依据都是得益的大小。 计算重复博弈的“总得益”。 计算各阶段的“平均得益”。 时间有先后,引入贴现系数
推广:非零和或多个博弈方,博弈方的利益严格对立,
没有纯策略纳什均衡的其他严格竞争博弈中。在以这
些博弈作为原博弈构成的有限次重复博弈中,惟一的
子博弈完美纳什均衡就是所有博弈方都始终采用原博
12
弈的混合策略纳什均衡策略。
精选PPT
有限次重复猜硬币博弈
各博弈方的正确策略就是在每次重复中都采用 一次性博弈中的纳什均衡策略。
精选PPT
4.2.1 两人零和博弈的有限次重复博弈
重复零和博弈不会创造出新的利益。
合作的可能性根本不存在。即使双方都知道还要重复 进行许多次基本博弈,也不会改变它们在当前阶段博 弈中的行动方式,不可能变得(哪怕是暂时的)合作 和顾及对方的利益。
所有以零和博弈为原博弈的有限次重复博弈,博弈方 的正确策略都是重复一次性博弈中的纳什均衡策略。

博弈论第四章PPT课件

博弈论第四章PPT课件
• 完全承诺,如破釜沉舟、军事博弈
不完全承诺,增加行动成本
承诺行动与博弈结果
• 春节前夕,某小镇上两个商铺主甲和乙同时看到一个
赚钱机会:去城里贩一批鞭炮回来零售,购货款加上 运输费用共5000元,如果没有竞争对手,这批货在小 镇上能卖6000元;但如果另一家商铺同时在小镇上卖 鞭炮,价格下跌使得这批鞭炮只能卖4000元。纳什均 衡是什么?
• 假设甲先行动,商铺乙看到对方的选择后再决定是否
进货,子博弈精炼纳什均衡是什么?
承诺行动与博弈结果
如果甲先行动,但在博弈开始前商铺主乙有一次行动A的 机会,利用子博弈精炼均衡概念分析下述两种情况下的 博弈结果: (1)A:商铺主乙逢人便说自己一定要进货,无论对方如 何行动他都不会改变这个决定; (2)A:商铺主乙与某个嘲笑他说大话的第三者丙打赌: 如果自己到时不进货,向丙支付1500元;如果自己到时 候进货,丙向他支付100元。并且,乙将这个赌局通知甲。
分配给不同的局中人,并赋予行动时可选的策略; (4)局中人行动时的信息集合I; (5)对应局中人可能选择策略,各局中人在终结环节所得到
的报酬U。
战略式与扩展式
战略式表述 (strategic form representation) 多用矩阵
2
L
L
2,2
S -1,-1
1
-1,-1
1,1
S
(2,2) L
-10,0 0,300
不进入 (0,300)
进入者 进入
默许 (40,50) 在位者
斗争 (-10,0)
四、承诺行动(commitment)与 子博弈精炼纳什均衡
• 纳什均衡之所以不是精炼均衡,是因为不可置信的
威胁存在,如父母与子女之间的博弈。

博弈论第四讲

博弈论第四讲

实例
❖ 因为无论对方紧邻自己左边还是右边,自己始 终可以得到1/2的游客,其他的位置皆不可能 得到这么多游客。于是,两个小贩就紧挨着摊 位都摆在了沙滩的中点上
❖ 这个“长滩卖水”的博弈,还可以用于政治选 举中拉票活动的分析,也可以用于解释为什么 卖同类物品的商家都紧挨着布局。不过,我们 引用这个例子是为了说明纳什均衡—本章的主 题:在什么样的策略组合下,博弈的双方可以 得到一个稳定的结果。就像那两个小贩得到稳 定的摊位布局一样。
❖图4-2: 麦琪的礼物 妻子
剪发
不剪
卖表 丈夫
不卖
00 12
21 00
4.1 最优反应与纳什均衡-- 4.1.2纳什均衡
❖4.1.2 纳什均衡
❖ 纳什均衡是这样一种状态,在该状态下每个参与 人所采取的策略都是对于其他参与人的策略的最 优反应。以二人博弈为例,纳什均衡就是一个策 略组合(甲的策略,乙的策略),甲的策略是对 乙的策略的最优反应,而乙的策略也是对甲的策 略的最优反应。譬如,在囚徒困境博弈中,我们 说(甲供认,乙供认)是一个纳什均衡,就因为 它满足纳什均衡定义所要求的特性—甲供认是对 乙供认的最优反应,而乙供认是对甲供认的最优 反应。
4.1 最优反应与纳什均衡
❖ 故事模 型……………………………………………
❖ “麦琪的礼物”博弈改编自欧·亨利的同名小说。 小说写的是这样一个故事:
❖ 一对经济拮据的夫妻,丈夫吉姆有一只爱不释手 的怀表,却没有表链;而妻子有一头美丽的长发, 却缺少一把玳瑁梳子。他俩感情深厚,生活的美 满知足。在圣诞前夕,俩人分别悄悄外出为对方 购买礼物。结果妻子剪卖自己的长发,为先生买 了条表链,好配他的怀表;而丈夫则卖了怀表, 为妻子买了一把梳子。
4.1 最优反应与纳什均衡-- 4.1.1最优反应

博弈论第四讲

博弈论第四讲

Prisoner 2 Mum Prisoner 1 Mum Confess Confess
-1 , 0 ,
-1 -9
-9 , -6 ,
0 -6
5
Prisoners’ dilemma of incomplete information
Prisoner 1 is always rational (selfish).
At
least one player is uncertain about some other player’s payoff function (type)
Static games of incomplete information are
also called static Bayesian games
(Confess, (Confess if rational, Mum if altruistic))
Confess is prisoner 1’s best response to prisoner 2’s
choice (Confess if rational, Mum if altruistic). (Confess if rational, Mum if altruistic) is prisoner 2’s best response to prisoner 1’s Confess A Nash equilibrium called Bayesian Nash equilibrium
Payoffs if prisoner 2 is rational Prisoner 1 Mum Confess Prisoner 2 Mum -1 , 0 , -1 -9 Confess -9 , -6 , 0 -6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

n人静态贝叶斯博弈的战略式表述包括:参与人的类型空间Θ1, …, Θn,条件概率p1,…, pn,类型依存战略空间A1(θ1),…, An(θn)和类型依 存支付函数u1(a1,…,an; θ1),…,un(a1,…,an; θn)。参与人i知道自己的
类型θi∈Θi,条件概率pi=pi(θ-i︱θi)描述给定自己属于θi的情况下,

海萨尼转换
市场进入博弈:不完全信息
高成本情况
默许
斗争 进入 不进入

在位者
低成本情况
默许 斗争
进入者
40, 50 0, 300
-10, 0 0, 300
30,80 0, 400
-10, 100 0, 400
1967年以前,博弈论专家认为这样的不完全信息是没法分析的, 因为当一个参与人并不知道他在与谁博弈时,博弈的规则是没有 定义的。

海萨尼通过引入一个虚拟的参与人“自然”,将不完全信息博 弈转换为完全但不完美信息博弈,从而可以用完全信息博弈论进 行处理,这就是著名的“海萨尼转换”(Harsainyi Transformation)。
海萨尼转换



私人信息(Private Information):共同知识之外 的信息;只有参与人i知道,其他参与人不知道 的信息。 例如,C2=C2l?还是C2=C2h?厂商2自己知道, 厂商1不知道,C2是厂商2的私人信息。 类型(type):对参与人私人信息的一个完备描 述 不完全信息意味着,至少有一个参与人有多个 类型。
诸葛亮:处于劣势,但知道博弈的结构,比对方掌握更多的信息。
计策:使用各种手段迷惑司马懿,为的是不让对方知道其战略的结果 (支付)。迫使其认为,撤退比进攻好,降低其进攻的预期收益。 如用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败 的主 观概率,使司马懿认为进攻的期望收益小于撤退的期望收益。
不完全信息
说明

根据海萨尼公理:假定参与人类型的分布函 数P(θ1,…, θn)是所有参与人的共同知识。
以市场进入博弈为例,在位者高成本的概率p 是共同知识意味着:进入者知道在位者是高 成本的概率为p,进入者知道在位者知道进入 者知道在位者是高成本的概率为p,如此等等, 即在博弈开始时,所有参与人有关自然行动 的信念(belief)是相同的。

不完全信息博弈——“空城计”
街亭失守,司马懿引大军蜂拥而来,当时孔明身边只有一班文 官,军士一半已经运粮草去了,只有2500军士在城中。 众官听得这个消息,尽皆失色。孔明登城望之,果然尘土冲 天,魏兵分两路杀来。 孔明令众将旌旗尽皆藏匿,打开城门,每一门用20军士,扮 作百姓,洒扫街道。而孔明羽扇纶巾,引二小童携琴一张,于城 上敌楼前凭栏而望,焚香操琴。 司马懿自马上远远望之,见诸葛亮神态自若,顿时心生疑忌, 犹豫再三,难下决断。又接到远山中可能有埋伏的情报,于是叫 后军作前军,前军作后军,急速退去。司马懿之子司马昭问: “莫非诸葛亮无军,故做此态,父何故便退兵?” 司马懿说:“亮平生谨慎,不曾弄险,今大开城门,必有埋伏, 我兵若进,必中计也。” 孔明见魏军退去,抚掌而笑,众官无不骇然。诸葛亮说,司马 懿“料吾生平谨慎,必不弄险,疑有伏兵,所以退去。吾非行险, 盖因不得已而用之,弃城而去,必为之所擒。”
-10,0
0,300
30, 80
0, 400
-10, 100
0, 400
不进入
一个简例:市场进入博弈
市场进入博弈:不完全信息 高成本情况
默许 进入 斗争
在位者
进入者有关在位者成 本信息是不完全的 低成本情况
默许 斗争
进入者
40, 50 0, 300
-10,0 0,300
30, 80 0, 400
-10, 100 0, 400
练习-将下列博弈进行海萨尼转换

接受 求爱博弈: 求爱
100,100
不接受
-50,0 0,0
品德优良者求爱 求爱者 不求爱 0,0 求爱者品德优良的概率是p

求爱博弈: 品德恶劣者求爱 接受 求爱 不接受
0,0 100,-100 -50,0
求爱者
不求爱 0,0
N
优良 恶劣
[p] 求爱者
不求爱 求爱 被求者 (0, 0)
不进入
如果在位者是低成本:进入者的最优选择是不进入, 在位者的最优选择是斗争(一旦低成本者进入)
一个简例:市场进入博弈
市场进入博弈:不完全信息 高成本情况
默许 进入 斗争
在位者
进入者有关在位者成 本信息是不完全的 低成本情况
默许 斗争
进入者
40, 50 0, 300
-10,0 0,300
30, 80 0, 400
在信息不充分的情况下,博弈参与人不是使 自己的支付或效用最大,而是使自己的期望效 用或支付最大。 如果让你在“50%的概率获得100元”与 “10%的概率获得200元”两者之间选择的话, 不完全信息决策意味着你会选择前者。因为前 者的期望所的是50元,而后者仅为20元,故选 前者。
不完全信息博弈
求爱博弈: 求爱



说参与人i知道自己的支付函数等同于说参与人i知道自己 的类型,类似地,说参与人i可能不确定其他参与人的支 付函数,也就等同于说参与人i不能确定其他参与人的类 型。 θi表示参与人i的第k种类型(参与人i共有K种类型); Θi表 示参与人i的类型空间(类型集),即Θi={θ1,…, θK}; θ= (θ1,…, θn)表示一个类型组合。 θ-i=(θ1,…, θi-1, θi+1,θn)表示 除参与人i之外的其他参与人的类型组合。 注意:Θi={θ1,…, θK}及Pi(θ1,…, θK) 是Common Knowledge
管理学院
School of Management
不完全信息静态博弈
作者:朱怀念
经贸学院
huainian258@
不完全信息静态博弈 -贝叶斯纳什均衡


一 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈
海萨尼转换
不完全信息静态博弈的战略式表述和贝叶斯纳什均衡

二 贝叶斯纳什均衡应用举例
海萨尼转换

下图就是市场进入博弈问题,经过海萨尼转换后,得 N 到的博弈树。
高 低[P]不来自入进入者进入[1-P]
进入 在位者
不进入
(0,300)
合作
在位者
斗争
(0,400)
合作 斗争
(40,50)
(-10,0)
(30,80) (-10,100)
海萨尼转换



在不完全信息静态博弈中,所有参与人同时行动,其 战略空间等于行动空间,但是参与人i的行动空间可能 依赖于其类型,也就是行动空间是类型依存的。 比如企业能选择什么产量依赖于它的成本函数,一个 人能干什么依赖于他的能力,等等。 类似的,参与人i的支付函数也是类型依存的,比如说, 生产相同的产量,不同成本函数的企业利润就不同; 工作同样的时间,不同类型的人得到的效用不同。用 ui(ai,a-i; θi)表示参与人i的效用函数。可以用这些参数 表示一个静态贝叶斯博弈。


一个企业决定是否进入一个新的产业,但不知道在位企 业的成本函数,也不知道一旦进入,在位者决定默许还 是斗争。 假定在位者有两种可能的成本函数:高成本或低成本; 对应两种成本情况下的不同战略组合下的支付矩阵如下 表: 在位者 高成本情况 低成本情况
默许 进入 斗争 默许 斗争
进入者
40, 50
0, 300

如果p≥1/5,进入;如果p<1/5,不进入。
目录导航


一 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈
海萨尼转换
不完全信息静态博弈的战略式表述和贝叶斯纳什均衡

二 贝叶斯纳什均衡应用举例

三 贝叶斯纳什均衡与混合战略均衡
海萨尼转换
市场进入博弈:不完全信息 高成本情况
默许
斗争 进入 不进入
不进入
如果在位者是高成本:进入者的最优选择是进入, 在位者的最优选择是默许;
一个简例:市场进入博弈
市场进入博弈:不完全信息 高成本情况
默许 进入 斗争
在位者
进入者有关在位者成 本信息是不完全的 低成本情况
默许 斗争
进入者
40, 50 0, 300
-10,0 0,300
30, 80 0, 400
-10, 100 0, 400
求爱者
不求爱 0,0
不完全信息博弈
需求大的情况
市场需求信息 是不完全的。
开发商B 开发 不开发
开发商A
开发
4000,4000 0,8000
8000,0 0,0
不开发 需求小的情况
开发 开发商A
开发商B 开发
-3000,-3000 0,1000
不开发
1000,0 0,0
不开发
房地产开发博弈
一个简例:市场进入博弈
-10, 100 0, 400
不进入
但进入者不知道在位者究竟是高成本还是低成本, 因此,进入者的最优选择依赖于他对在位者的信念
一个简例:市场进入博弈
假定进入者认为在位者是高成本的概率为p,则是低成 本的概率为1-p。 进入者选择“进入”的期望支付是:p×40+(1-p) ×(10)

进入者选择“不进入”的期望支付是0 比较上面两个表达式,可知进入者的最优选择为:
不完全信息博弈——“空城计”



分析这个博弈 参与人 战略 支付 画出这个博弈的战略式或扩展式表述
不完全信息博弈—信息的重要性
司马懿
相关文档
最新文档