博弈论讲义9

合集下载

博弈论讲义完整版

博弈论讲义完整版


第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”

石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
你 接受 求爱博弈: 品德优良者求爱 求爱者 求爱
100,100
不接受
-50,0 0,0
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱者 接受 求爱 不求爱 0,0 你 不接受
问题:什么叫“完全而不完美信息博弈”?
第二章 完全信息静态博弈

一 博弈的基本概念及战略表述 二 占优战略(上策)均衡


三 重复剔除的占优均衡(严格下策反复消去法)
四 划线法
五 箭头法
六 纳什均衡
完全信息静态博弈

完全信息:每个参与人对所有其他参与人的特 征(包括战略空间、支付函数等)完全了解
同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境

囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的“最优策略”使整个“系统”处于不利 的状态。

思考:为什么会造成囚徒困境 是否由于“通讯”问题造成了囚徒困境? “要害”是否在于“利己主义”即“个人理 性”?

博弈论9

博弈论9

• 2.市场机会 设两个厂商都发现了一个市场机 会,但市场容量不大。若只有一家进入,能赚 100,若同时进入,则各亏50. • 厂商2 • 进 不进 • 进 100, 0 -50 -50 -50,-50 • 厂商1 • 不进 0 , 0
0 ,100
• 本博弈也有两个纯策略纳什均衡(不进,进), (进,不进)但它们分别有利于两个厂商,因此 这两个均衡都不容易实现,都应采取混合策略。 • 请同学们自己计算混合策略纳什均衡及得益。
• • • • •
2 s 1 s w
1,3 d 2,2 0,0 r 0,0 3,1
w
• 这是一个第二阶段为静态博弈的动态博弈问题。如 这是一个第二阶段为静态博弈的动态博弈问题。 果第一阶段1选 则博弈结束 双方各得2;如果1 则博弈结束, 果第一阶段 选d,则博弈结束,双方各得 ;如果 则第二阶段有三个纳什均衡: 选r则第二阶段有三个纳什均衡:纯策略的(s,w) 则第二阶段有三个纳什均衡 纯策略的( 和混合策略的双方以1/4和 选 和 和混合策略的双方以 和3/4选s和w.

• • • •
3.三寡头垄断市场的需求函数是 三寡头垄断市场的需求函数是p=100-Q, 三寡头垄断市场的需求函数是 , 市场总产量Q=q1+q2+q3 ,p为市场价格 三个企 为市场价格,三个企 市场总产量 为市场价格 业的边际成本都为2,固定成本为 如果企业1 业的边际成本都为 固定成本为0.如果企业 固定成本为 如果企业 和企业2先同时决定产量 先同时决定产量q 企业3看到 、 看到q 和企业 先同时决定产量 1和q2,企业 看到 1、 q2后同时决策,问三个企业各自的产量和利润 后同时决策, 是多少? 是多少? 解:三个企业的利润函数是 L(q1,q2,q3)=qi(100-Q)-2qi i=1,2,3 根据逆推归纳法先看企业3 的选择:( :(企业 根据逆推归纳法先看企业 的选择:(企业 3的利润对其产量求导并令其为零) 的利润对其产量求导并令其为零) 的利润对其产量求导并令其为零 q3=(98-q1-q2)/2

第九章 博弈论 《微观经济学》PPT课件

第九章 博弈论 《微观经济学》PPT课件




1,-1
3,-3
A
图9-3 写字博弈的收益矩阵
9.2 占优策略
• 在一个有n个人参与的博弈G={S1,…,Sn;u1,…,un}中,令 si′和si″是第i个参与人可选择的两个策略,如果对其他所有参与 人任意的策略组合s-i,总有 Ui(si′, s-i)<ui(si″, s-i)s-i(9-4)
• 式中:t-i表示除参与人i以外的其他参与人的类型。
9.4* 贝叶斯纳什均衡
9.4.3 不完全信息古诺模型
• 现在我们假定市场反需求函数为P=a-q1-q2,ci为每个厂商不变的 单位成本,那么厂商的利润函数为:
πi=qi(a-q1-q2-ci)=qi(ti-q1-q2) (i=1, 2) • 式中:ti=a-ci。更进一步假定a=2,c1=1,=3/4,=5/4,μ=1/2,
ቤተ መጻሕፍቲ ባይዱ囚徒B
坦白
不坦白

坦白
-3,-3
0,-6

A
不坦白
-6,0
-1,-1
9.1 基本描述
9.1.2 基本概念 • 博弈是指任何一种由一人、两人或多人参与竞争的情形。 • 任何一个博弈都必须至少具备以下3个基本要素:参与人、策
略和支付。除此之外,行动、信息等也都是博弈的要素。
9.1 基本描述
• 参与人是指博弈中每个策略的决策者,他的目的是通过自己个 人的理性决策来最大化自己的支付水平。
9.3 纳什均衡
2.伯特兰模型 • 伯特兰模型是寡头厂商联合定价博弈。与古诺模型不同,伯特
兰模型中厂商同时选择的不是产量,而是产品价格。 • 因此,该伯特兰模型的纳什均衡为((a+c)/(2-b),

《博弈论与信息经济学讲义》第9章 信号传递与机制设计

《博弈论与信息经济学讲义》第9章 信号传递与机制设计
本必须大于价值; • 送礼物,不送现金;(依赖送礼的原因) • 送别人自己不会买的东西最合适。
解释中国人送礼习惯
• 月饼的流通,不是为了吃; • 名烟名酒的价格为什么如此高? • 请客吃饭不在吃的是否舒服,而是请客
的人花了多少钱。所以饭馆的档次越来 越高。 • “谁送礼不知道,谁不送礼都知道”。
婚姻习惯
举例
• 人们对婚前性行为和婚外性行为态度的 变化:在封闭的社会,婚前和婚外性行 为都很容易观察;在流动的社会,有些 能观察到,有些不能;如果被观察到的 只是其中的一小部分,被观察到压力将 会减少;
• 官员腐败问题。
• 有熟人在场,陌生人面前表现也不同。
信息不完全导致社会规范变迁
• 如果是完全分离均衡,每类人的行为都是特定 的;
• 如果是混同均衡,所有人的行为不是一样的; • 如果是准分离(混同)均衡,有些行为传递信
息,有些行为不传递信息; • 如果外部因素导致社会由分离均衡转向混同均
衡或准分离均衡,社会规范就会发生变化。
售股票会引起股价下降); • 融资选择;
资本雇佣劳动理论
0.8
临界能力
0.2。 0
100
个人财富
风险投资问题
• 风险资本投资是“选人”,信息不对称 最为严重;
• 创业者自己的“抵押投资”很重要;
好人好事
• “人上一千,样样居全”; • “坏人”想浑水摸鱼,“好人”如何把
自己与“坏人”区别开来? • 办法是做更多的“好事”。
第9章 信号传递与社会规范
信号传递
• 信息不对称可能导致潜在的交易不能进 行;
• 但在许多情况下,为了获得交易带来的 收益,拥有私人信息的一方会主动揭示 自己的私人信息;

第九章 运筹学博弈论 ppt课件

第九章 运筹学博弈论  ppt课件

则。
1988年 法国人莫里斯-阿莱斯(Maurice Allais)
获奖理由:在市场理论及资源有效利用方面做出了
开创性贡献,并对一般均衡理论重新做了系统阐述。
1987年 美国人罗伯特-索洛(Robert M. Solow)
获奖理由:对增长理论做出贡献。提出长期的经济
增长主要依靠技术进步,而不是依靠资本和劳动力的
获奖理由:对不同汇率体制下的货币和财政政策以及最
优货币区域的分析做出了伟大贡ppt献课件。
8
1998年 印度籍经济学家阿马蒂亚-森(Amartya Sen) 获奖理由:对福利经济学以及发展经济学做出了突破
性贡献。 1997年 美国经济学家迈伦-斯科尔斯(Myron S.
Scholes)和罗伯特-默顿(Robert C. Merton) 获奖理由:前者给出了著名的布莱克-斯科尔斯期权
获奖理由:在动态宏观经济学方面做出了
巨大贡献。 2003年 美国经济学家罗伯特-恩格尔
(Robert F. Engle III)和英国经济学家克莱夫格兰杰(Clive W.J. Granger)
获奖理由:在经济时间数列中运用了统计
学的方法。
ppt课件
7
2002年 美国学者丹尼尔-卡尼曼(Daniel Kahneman)和弗农-
ppt课件
4
在国外,1912年E.Zermelo用集合论研究过下棋 问题,四十年代由于生产和战争的需要,博弈理 论得到了发展,系统博弈理论的形成则以1944 年V.Neumann,O.Morgensten合著的《博弈论 和经济行为》一书为标志.1994年瑞士皇家科 学院决定将诺贝尔经济学奖授予纳什(Nash),哈 萨尼(Harsanyi)和泽尔腾(Selten)三人,表彰他们 在博弈理论和应用研究方面作出的杰出贡献. 目前,博弈论在定价,招投标,拍卖,委托代理以及 很多重要的经营决策中得到应用,它已成为现代 经济学的重要基础.

《博弈论》精品讲义

《博弈论》精品讲义
指定n个局中人,以及他们各自的纯策略空间
Si,i1 ,2, ,n
和这些局中人各自的支付(盈利)函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为:
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明 公正無私
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
20
策略型表述: (两人有限博弈;Fra bibliotek阵形式)高需求情况
B
A
低需求情况?
博弈论20092009
正大光明 公正無私
21
➢房地产博弈分析
假设:同时决策;市场需求双方已知
若市场需求大,双方开发,各得0.4万元。 若市场需求小,依赖于对方行动。 若市场不确定,依赖对市场的判断及对方行动。
博弈论20092009
正大光明 公正無私
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
意5个数。如果不重复则得奖;否则受罚。 获胜的秘诀是什么?
博弈论20092009

博弈论讲义

博弈论讲义
L(A)=2rc+1(1-r)(1-c) dL(A)/dr =3c-1=0 L(B)=rc+2(1-r)(1-c) dL(B)/dc =3r-2=0 r=2/3 c=1/3
A:(2/3,1/3),B:(1/3,2/3)是本博弈的 混合策略纳什均衡
完全信息动态博弈
参与人先后行动 每个参与人对每个参与人的得益具有完全信 息 博弈树 参与人的行动顺序(when to move,谁在 什么时候行动) 参与人的信息集(what known,每次行动 时参与人知道些什么)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
如果A 选U,其期望收益为
1 L 0 (1 L ) L .
策略组合
策略组合:(s1,…,si,…,sn) ui=ui(s1,…,si,…sn) 一个参与人的支付不仅取决于自己的策略选择, 而且取决于其他参与人的策略选择 Max ui=ui(s1,…,si,…sn)
囚徒困境博弈的标准式表述
B
抵赖 坦白
抵赖
-1,-1 0,-10
-10,0 -8,-8
ui ( s ,...,s ) 0 si
* 1 * n
囚徒困境的纳什均衡
(坦白,坦白)构成本博弈的纳什均衡
抵赖
B
坦白
抵赖
-1,-1 0,-10
-10,0 -8 -8
A

《博弈论》精品讲义

《博弈论》精品讲义

7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
5
1.博弈现象
➢田忌赛马:正确的策略可以反败为胜。 ➢囚徒困境:
乙 甲
理性的人是自私自利的; 理性选择不是全局最优。
博弈论20092009
正大光明 公正無私
6
➢经济合作:
乙 甲
诚信的价值; 一报还一报策略; 人类生存环境启示。
博弈论20092009
正大光明 公正無私
如两人写的一样, 就 认为他们讲真话, 并 按 所 写数额赔偿;如果两人写的不一样,就认定低 者讲真话,并照此价格赔偿。同时,对讲真话的 旅客奖励2元钱,对讲假话的旅客罚款2元。
理性原则下,他们会写多少价格呢?
博弈论20092009
正大光明 公正無私
11
2. 博弈概念
➢什么是博弈:
个人或团体间在依存和对抗、合作和冲突 中的决策问题。
正大光明 公正無私
43
∴I的最优混合策略为
(1,2)
(1, 4
3) 4
同理,II的最优混合策略为
G=8
(1,2)
(1, 2
1) 2

《博弈论教程》课件

《博弈论教程》课件

博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。

博弈论讲义9

博弈论讲义9
作“吊诡” , 悖论 也被译作“吊诡”),简单说就是自相 也被译作 矛盾的说法。 矛盾的说法。 有时似乎无懈可击的推理和论证把你送进 了死胡同。 了死胡同。 启示:一个具有天才的人, 启示:一个具有天才的人,必具有超人的 性格,绝不遵循常人的思想和途径。 司汤 性格,绝不遵循常人的思想和途径。--司汤 达
实例1: 实例 :珍稀动物保护问题
比如: 比如:藏羚羊 如此珍稀的资源, 如此珍稀的资源,当然禁不起物欲横流的 消耗,藏羚羊的生存岌岌可危。 消耗,藏羚羊的生存岌岌可危。政府禁止 猎杀,严惩盗猎者,当然是正确之举。 猎杀,严惩盗猎者,当然是正确之举。 但是同时有什么效应?! 但是同时有什么效应?!
结果不想陷入困境, 结果不想陷入困境,只能同时写出原价最 好。 启示:人们在为私利考虑的时候不要太"精 启示:人们在为私利考虑的时候不要太 精 明",告诫人们精明不等于高明,太精明往 ,告诫人们精明不等于高明, 往会坏事;但是另一方面, 往会坏事;但是另一方面,它对于理性行 为假设的适用性提出了警告。 为假设的适用性提出了警告。
毒品之害,人所公认,可是在荷兰等国家, 毒品之害,人所公认,可是在荷兰等国家, 买卖轻度麻醉品却是合法的。 买卖轻度麻醉品却是合法的。 想想原因? 想想原因?
原因
1、没有权利阻止和惩罚自愿服用毒品的人 、 2、麻醉品合法化后,“被迫”食用麻醉品 、麻醉品合法化后, 被迫” 的人数肯定会下降。 的人数肯定会下降。 3、由于麻醉品只能在地下买卖,所以品质 、由于麻醉品只能在地下买卖, 得不到保证, 得不到保证,瘾君子的身体会受到更严重 的损害。 的损害。 4、管制之下,麻醉品的价格极高,这会诱 、管制之下,麻醉品的价格极高, 使瘾君子从事其他犯罪活动。 使瘾君子从事其他犯罪活动。

博弈论第九讲

博弈论第九讲

9.1 生活中的谈判—1.随处可见的谈判
LOGO
因为还有许多人因为购买物品与商场的店员讨价 还价,还有很多商人为了达成商业合作而努力, 还有很多为了维护自己权益的劳工与雇主交涉, 还有很多家庭成员为了确定在哪吃晚餐而互相沟 通„„甚至还有很多男生和女生正在就他们的恋 爱进行着艰辛的谈判之旅。 不可否认,谈判是一种艺术,而且有很多细节因 素影响着谈判的成效——在有些谈判领域尤其如 此,譬如一个女孩子不喜欢一个男孩子,常常并 非这个男孩在大是大非上的态度如何,而可能仅 仅是以为这个男孩子在某些细微的举动让女孩子 反感。这些小过失常常成了婚姻谈判中的很大阻 碍。
9.2谈判的策略—2.不同意就拉倒
LOGO
不同意就拉倒 让步,是促成合作的一个方法。而谈判中有 时也会使用到与让步相反地方法,那就是宣称不 让步来威胁对方。比如有些情况下,谈判的一方 会向对方宣称:“要么你们在协议上签字,要么 咱们宣布谈判破裂。我们已经不会再让步,也不 想再奉陪了。”这实际上是一个最后通牒式的提 议,因为对方现在只有作出同意或不同意的选择。 有时这种宣称可能还附带更大的威胁:“如果不 同意我的报价,我不仅要终止咱们的关系,而且 还要对你采取报复行为。”
9.2 谈判的策略—1.合作的利己主义
LOGO
拥有成员国的最惠国待遇;但是我们也必须知道, 如果不让世贸组织其他国家从我国的加入中获得 好处,它们就不会投我们的赞成票,所以我们需 要付出代价。事实上,中国加入世贸的谈判历程, 正是一个逐渐让步的过程,但正是这样的让步使 得合作得以达成,而谈判各方从合作中得到了其 好处。 当然,现实中也不乏那些不让步而最终损害自己 的例子。一个典型的例子是20世纪80年代美国纽 约市报业的兴衰变化。
9.1 生活中的谈判—2.简单的利益分割谈判

博弈论算法讲义

博弈论算法讲义

博弈论算法一、博弈的战略式表述及纳什均衡的定义在博弈论里,一个博弈可以用两种不同的方式来表述:一种是战略式表述(strategic form representation ),另一种是扩展式表述(或译为“展开式表述”)(extensive form representation )。

从分析的角度看,战略式表述更适合于静态博弈,而扩展式表述更适合于讨论动态博弈。

1.1博弈的战略式表述战略式表述又称为标准式表述(normal form representation )。

在这种表述中,所参与人同时选择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。

战略式表述给出:1.博弈的参与人集合:(),1,2,,i n ∈ΓΓ=。

2.每个参与人的战略空间:,1,2,,i S i n =。

3.每个参与人的支付函数:12(,,,),1,2,,i n u s s s i n =。

我们用()11,,;,,n n G S S u u =代表战略式表述博弈。

例如在两个寡头产量博弈里,企业是参与人,产量是战略空间,利润是支付;战略式表述博弈为:{}121122120, 0; (,), (,)G q q q q q q ππ=≥≥ (1.1)这里i q 、i π别表示第i 个企业的产量和利润。

1.2纳什均衡的定义有n 个参与人的战略式表述博弈()11,,;,,n n G S S u u =,战略组合{}1,,,,i n s s s s ****=是一个纳什均衡。

如果对于每一个i 、i s *是给定其他参与人选择{}111,,,,,i i i n s s s s s *****--+=的情况下第个参与人的最优战略,即(,)(,),,i i i i i i i i u s s u s s s S i***--≥∀∈∀ (1.2)或者用另一种表述方式,i s *是下述最大化问题的解:111argmax (,...,,,,...,),1,2,..., ;i i i i i n i i s u s s s s s i n s S *****-+∈=∈(1.3)我们用这个定义来检查一个特定的战略组合是否是一个纳什均衡。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信号博弈:(一)什么是信号博弈?
模型
(1)参与人:两个,信号发送者S和信号接收者R;S的 类型是私人信息,R的类型是公共信息(即只有一个类 型)。 (2)博弈顺序: 1、“自然”N首先选择S的类型ti,S知道,但R不知道。 只知道S属于类型ti的先验概率p(ti)。 2、S观测到类型ti后发出信号mj 3、R观测到S发出的信号mj,使用贝叶斯法则从先验概 率得到后验概率,然后选择行动ak。 4、R和S的收益都是ti ,ak, mj 的函数。
不同类型声明方偏好相同
2X2 声明博弈3:独裁声明博弈
独裁者行为 枪毙 谋反者 无辜者 释放 行为方
声明方
嫌疑犯类型
(-1,2) -1 2 (-1,1)
(-2,-1) -2 -1 (1,0)
行为方对声明方类型无差异
2X2 声明博弈4:猜子声明博弈
声明方 猜单 单数 双数
猜子方行为 猜双
行为方
握子方类型
0.4
a1 m1 R a2
(3,1)
(4,7)
试给出以上信号博弈的所有纯战略分离均衡和混同均衡
声明博弈:(一)什么是声明博弈?
模型 (1)参与人 )
声明方和行为方。声明方是发出声明的一方。声明方有 多种类型,声明方知道自己的类型,而行为方不清楚, 因此声明方的类型是声明方的私人信息。行为方是根据 声明方的声明作出行为选择的另一方。行为方有多种行 为可以选择,但只有一种类型。 为了便于分析,我们还引入了虚拟的参与人“自然”。
声明博弈的分离均衡(2)
实话反说,即声明方t1声明:t2,t2声明:t1也构成一个精炼贝叶斯纳什均衡。
给定先验概率p (t1)=p,声明方t1声明:t2,t2声明:t1,行为方看到:t1,后验概率p (t2| :t1)=1,选择最优行动a2(1>-1),行为方看到:t2,后验概率p (t1| :t2)=1, 选择最优行动a1(1>-1)。给定行为方的后验概率和行动,声明方的最优战略是t1声 明:t2(2>-2),t2声明:t1(2>-2)。这反过来又与行为方的信念吻合。因此构成精炼贝 叶斯纳什均衡。
声明博弈:(二)信息传递作用
声明没有或几乎没有成本,因此声明方可以 作出任何声明。如果声明方和行为方双方利益 不一致,那么声明的真实性没有保证,行为方 也不会轻易相信声明。 如果说,声明博弈并不总能有效传递信息, 那么声明博弈传递信息需要满足什么条件呢?
2X2 声明博弈1:医患声明博弈
医生行为 声明方 头疼 患者类型 脚疼 头疼处方 脚疼处方 行为方
信号博弈:(二)例子
萨摩亚岛居民的文身; 波那佩岛的山药; 教育文凭; 三包承诺; 巨额广告投入; 孔雀开屏; ………
信号博弈:(三)a2 t1
0.6
a1 m1 R a2
(2,1)
(4, 0)
(7,2)
N (3,5) a1 m2 R (7,4) a2 t2
p
a1 t1 :t1 a
(2,1)
(-2,-1)
a2
(-2,-1)
N (-2,-1) a1 :t2 a (2,1) a2 t2
1-p
a1 :t1 a a2
(-2,-1)
(2,1)
存在分离均衡
声明博弈的分离均衡(1)
实话实说,即声明方t1声明:t1,t2声明:t2构成一个精炼贝叶斯纳什均衡。
给定先验概率p (t1)=p,声明方t1声明:t1,t2声明:t2,行为方看到:t1,后验概率p (t1| :t1)=1,选择最优行动a1(1>-1),行为方看到:t2,后验概率p (t2| :t2)=1,选 择最优行动a2(1>-1)。给定行为方的后验概率和行动,声明方的最优战略是t1声 明:t1(2>-2),t2声明:t2(2>-2)。这反过来又与行为方的信念吻合。因此构成精炼 贝叶斯纳什均衡。
声明方总说反话,也能有效传递信息?
声明博弈:(三)精炼贝叶斯纳什均衡
(1,2) a1 :t2 a a2
0.5
a1 t1 :t1 a
(1,2)
(0,-1)
a2
(0,-1)
N (1,-1) a1 :t2 a (0,0) a2 t2
0.5
a1 :t1 a a2
(1,-1)
(0,0)
不存在分离均衡
不存在分离均衡
(2,1) (-2,-1)
(-2,-1) (2,1)
1. 2. 3.
不同类型的声明方偏好行为方不同行为 对应声明方不同类型行为方偏好不同行为 行为方的偏好与声明方具有一致性
2X2 声明博弈2:求职声明博弈
招聘企业行为 声明方 接受 高能力 低能力 拒绝 行为方
应聘者类型
(1,2) (1,-1)
(0,-1) (0,0)
实话实说,即声明方类型t1声明:t1,t2声明:t2不构成精炼贝叶斯纳什均衡。 给定先验概率p(t1)=0.5,声明方t1声明:t1,t2声明:t2。行为方看到:t1,后验概 率p (t1| :t1)=1,选择最优行动a1(2>-1),行为方看到:t2,后验概率p (t2| :t2)=1, 选择最优行动a2(0>-1)。给定行为方的后验概率和行动,声明方的最优战略是t1声 明:t1(1>0),t2声明:t1(1>0)。既然如此,行为方为什么还要相信声明方(t2)会实 话实说呢?因此不构成精炼贝叶斯纳什均衡。 同理,实话反说,也不构成精炼贝叶斯纳什均衡。 同理,实话反说,也不构成精炼贝叶斯纳什均衡。自己课后证明
主要内容简介
第一章 第二章 第三章 第四章 第五章 概述-人生处处皆博弈 完全信息静态信息博弈-纳什均衡 完全信息动态搏弈-子博弈精炼纳什均衡 不完全信息静态博弈-贝叶斯纳什均衡 不完全信息动态博弈-精炼贝叶斯纳什均衡
第五章 不完全信息动态博弈-精 炼贝叶斯纳什均衡
一 精炼贝叶斯纳什均衡
基本思路 贝叶斯法则 精炼贝叶斯纳什均衡 不完美信息博弈的精炼贝叶斯均衡
存在混同均衡
声明方类型t1声明:t1,t2声明:t1构成精炼贝叶斯纳什均衡。 给定先验概率p (t1)=0.5,声明方t1声明:t1,t2声明:t1。行为方看到:t1,后验 概率p (t1| :t1)= p (t1)=0.5 ,选择最优行动a1(2×0.5+0.5×(-1)>0.5×(-1)), 行为方看到:t2,由于在非均衡路径上,贝叶斯法则没有定义,我们规定后验概率p (t1| :t2)<=0.25,行为方选择最优行动a2。给定行为方的后验概率和行动,声明 方的最优战略是t1声明:t1(1>0),t2声明:t1(1>0)。这反过来又与行为方的信念吻合。 因此构成精炼贝叶斯纳什均衡。 同理,声明方类型 声明 声明:t2, 声明 也构成精炼贝叶斯纳什均衡。 声明:t2也构成精炼贝叶斯纳什均衡 同理,声明方类型t1声明 ,t2声明 也构成精炼贝叶斯纳什均衡。自己课后证明
(-1,1) (1,-1)
(1,-1) (-1,1)
声明方与行为方偏好相反
2X2 声明博弈声明能有效传递信息的必要条件
1. 不同类型的声明方必须偏好行为方不同行为; 2. 对应声明方不同类型行为方必须偏好不同行为; 3. 行为方的偏好必须与声明方具有一致性。
声明博弈:(三)精炼贝叶斯纳什均衡
(2,1) a1 :t2 a a2
二 声明博弈 三 信号博弈 四 博弈论概念简要总结
如何有效传递信息?
你和刚认识不久的朋友出去一块吃饭,你口味 清淡,不喜麻辣,而你朋友对此并不知情,你 如何让他(她)知道? 毕业找工作,由于你能力比较强,想进一家好 的单位,但这家单位招聘人员并不清楚你的能 力,你如何让他(她)知道?
传递信息的两种方式
声明博弈:(一)什么是声明博弈?
模型 (2)博弈的顺序 )
1自然从类型集合T = {t1, ⋯, t m }随机抽取声明方的类型t i,声明方知道自己 . 的类型,行为方不知道,只知道先验概率p (ti )。先验概率p (ti )是共同知识。 2.声明方观察到自己的t i以后,从T中选择t j 作为自己声明的类型。 当然t j 可以与t i 相同(说真话),也可以不同(说假话)。 3.行为方在听到声明方的声明t j 后,在可选择的行为集合 A = {a1, ⋯ , a n }中选a k 。 4.声明方的得益为u S (t i , a k ),行为方的得益为u R (t i , a k )。
通过无成本的口头(或书面)声明传递信息 ——声明博弈 通过有实际代价的行为(或信号)传递信息 ——信号博弈 声明博弈是一种特殊的信号博弈,而信号博弈是声明博弈的 一般化。二者的博弈结构与分析方法基本上是一样的,区别 仅仅在于传递信息的方式不同。
声明博弈:(一)什么是声明博弈?
概念 声明博弈:这是一类特殊的不完全信息 动态博弈,主要研究在有私人信息, 信息不对称的情况下,人们通过口头 或书面的形式传递信息的问题。
声明博弈与信号传递博弈
由于声明博弈传递信息需要严格的条件, 而现实生活中,这些条件往往都不满足。 因此,人们需要采用除声明以外的其他方 式来传递信息。这就是我们下面要讲的信 号传递模型。
信号博弈:(一)什么是信号博弈?
概念 信号博弈:这是一类特殊的不完全信息 动态博弈,主要研究在有私人信息,信 息不对称的情况下,人们通过有实际代 价的行为或信号传递信息的问题。
相关文档
最新文档