《博弈论原理模型与教程》第06章扩展式博弈第01节.
博弈论完整版PPT课件
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
博弈论讲义完整PPT课件
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
讲义6不完全信息动态博弈
不完全信息动态博弈的模型假设可能受到现实世界的限制。例如,玩家可能不完全了解其他玩家的类型 或策略,而这些类型和策略可能随着时间的推移而改变。这需要进一步研究和改进模型假设。
应用挑战
01 02 03
实际应用中的信息不对称
在不完全信息动态博弈中,信息不对称是一个常见的问题 。例如,在金融市场中,投资者可能不完全了解公司的财 务状况或未来的市场趋势。这使得应用不完全信息动态博 弈更加困难,需要更多的数据和信息来建立准确的模型。
不完全信息博弈的未来研究方向
目前,不完全信息博弈的研究已经涉及许多复杂的问题和挑战,未来的研究需要进一步 拓展和完善该领域的基础理论和方法,以更好地解释和解决现实世界中的问题。
02
不完全信息动态博弈模型
静态博弈与动态博弈的区别
静态博弈
参与人在同时进行决策,且决策 前都不知道其他参与人的类型和 策略。
政策制定
公共资源分配
政策制定者可以利用不完全信息动态 博弈来分析公共资源的分配问题,如 教育、医疗、环保等领域的资源分配 。
税收政策
反垄断政策
不完全信息动态博弈可以用于分析企 业的垄断行为,为政策制定者提供制 定反垄断政策的依据。
政策制定者可以通过分析企业和个人 的博弈行为,来制定合理的税收政策 ,以达到社会福利最大化的目的。
讲义6不完全信息动态博弈
汇报人: 2023-12-15
目录
• 不完全信息博弈概述 • 不完全信息动态博弈模型 • 不完全信息动态博弈的求解方
法 • 不完全信息动态博弈的应用 • 不完全信息动态博弈的挑战与
未来发展 • 不完全信息动态博弈案例研究
01
不完全信息博弈概述
定义与特点
博弈论最全完整ppt讲解
人们在日常生活中进行着博弈,与配偶,朋友,陌 生人,老板/员工,教授等。
类似的博弈也在商业活动、政治和外交事务、战争 中进行着——在任何一种情况下,人们相互影响以 达成彼此有利的协议或者解决争端。
博弈论为众多学科提供了分析的概念和方法:经济 学和商学,政治科学,生物学, 心理学和哲学。
案例1:囚犯困境
支付 嫌疑人A
嫌疑人 B
抵赖
坦白
抵赖 -1,-1 0,-9
坦白 -9,0 -6,-6
均衡与均衡结果
均衡战略(坦白,坦白) 均衡支付(-6,-6)
第二节 纳什均衡
占优战略均衡 重复剔除的占优战略均衡
纳什均衡
完全信息静态博弈的几点特性
同时出招,出招一次; 知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的
如何在博弈中获胜?
…… 真的能在博弈中(总是)获胜吗? 对手和你一样聪明! 许多博弈相当复杂,博弈论并不能提供
万无一失的应对办法。
例1:无谓竞争(The GPA Rat Race)
你所注册的一门课程按照比例来给分:无论卷面分数是 多少,只有40%的人能够得优秀,40%的人能得良好。
所有学生达成一个协议,大家都不要太用功,如何?想 法不错,但无法实施!稍加努力即可胜过他人,诱惑大矣。
与战略式表述
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行为发生直 接相互作用时候的决策以及这种决策的均衡问题。
博弈的战略式表述:G={N,(Si)iN,(Ui)iN} 有三个基本要素: (1)参与人(players)iN={1,2,…,n} ; (2)战略(strategies),siSi(战略空间); (3)支付(payoffs),ui=ui(s-i,si)。
博弈模型解决方案
博弈模型解决方案
《博弈模型解决方案》
博弈模型是一种用于分析决策制定和竞争情景的数学工具。
在许多领域,例如经济学、政治学和生物学中,博弈模型都被广泛应用。
通过建立数学模型来描述各方的利益和策略选择,博弈模型可以帮助决策者做出最佳的决策。
博弈模型解决方案是一种利用博弈论原理来解决实际问题的方法。
在博弈模型中,各方的利益和对策都会被建模,并且通过计算和分析来找到最优的策略。
这种方法可以应用到很多领域,例如竞争策略、投资决策和资源分配等问题中。
在博弈模型解决方案中,常用的方法包括纳什均衡、博弈树和博弈矩阵等。
纳什均衡是指在博弈中各方选择的策略是最优的,并且在互相了解对方策略的情况下不会改变。
博弈树是一种图形化工具,用于描述博弈过程和各方的决策路径。
博弈矩阵则用来清晰地展示各种情景下各方的策略选择和最终结果。
通过这些方法,博弈模型解决方案可以帮助人们更清晰地分析和理解各种竞争和决策情景。
通过对各方利益和策略的深入分析,我们可以更好地做出决策,最大化自己的利益并且减少风险。
因此,博弈模型解决方案是一种重要的工具,可以帮助我们更好地应对各种决策和竞争情景。
博弈论最全完整ppt-讲解
施锡铨编著,《博弈论》上海财大出版社,2000年版。
谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。
谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。
2021/3/11
34
课程主要内容
第一章 完全信息静态博弈 第二章 完全信息动态博弈 第三章 不完全信息静态博弈 第四章 不完全信息动态博弈 第五章 委托-代理理论 第六章 逆向选择与信号传递
通过几次严打来获得“冷面杀手”的声 誉
2021/3/11
11
导论
博弈均衡与一般均衡 博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型 主要参考文献
2021/3/11
12
导论
一、博弈均衡与一般均衡
2021/3/11
13
案例:囚犯困境
支付
嫌疑 人B
嫌疑人A
抵赖
坦白
抵赖 -1,-1 0,-9
坦白 -9,0 -6,-6
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
2021/3/11
4
如何在博弈中获胜?
…… 真的能在博弈中(总是)获 胜吗?
托马斯·谢林
24
导论
三、博弈论的基本类型
2021/3/11
25
合作博弈与非合作博弈
合作博弈(cooperative game)
达成有约束力的协议(binding agreement),强调团体理性,强调效 率、公正、公平
非合作博弈(non-cooperative game)
博弈论最全完整-讲解课件
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
《博弈论:原理、模型与教程》第00章 绪论 第05节 博弈问题的解
《博弈论:原理、模型与教程》第00章绪论0.5 博弈问题的解(已精细订正!)博弈论研究的目的(或核心)就是寻找博弈问题的解,即给定一个博弈问题,分析或预测什么样的博弈结果将会出现。
对于一个博弈问题,参与人间的交互作用到底会导致什么样的结果出现呢?或者说什么样的博弈结果才是博弈问题的解呢?探寻博弈问题的解,必须明确:博弈分析是博弈问题的结构和参与人完全理性为共同知识的假设下进行的,而在该假设下人们(或博弈专家)对博弈问题的求解,就等于完全理性的参与人对博弈问题的求解。
因此,可以采用内省式思维分析博弈问题的解。
假设某个参与人在博弈考试之前对博弈的结果进行分析,并且预测到结果A将会出现而采取与只相对应的行动。
现在的问题是:参与人的这种预测是否一定就是博弈的真正结果?或者说参与人的预测在什么情况下才是正确的?我们知道,博弈论是交互决策的理论,博弈中某个结果的出现是所有参与人共同选择的结果。
因此,上述参与人所预测到的结果A要成为博弈的结果,就必须所有的参与人都采取与之相对的行动。
也就是说,当所有参与人都在对博弈结果进行预测时,只有所有参与人的都预测到结果A将会出现,那么这个结果才有可能成为博弈的结果。
此时,参与人的预测才是正确的;反之,如果参与人有不同的预测,那么参与人的预测就可能不正确。
例如,在一个两人博弈,参与人1预测到结果A将会出现而采取与A相对应的行动,但参与人2预测到结果B将会出现而采取与结果B相对应的行动,那么博弈真正出现的结果可能既不是结果A(因为参与人2没有采取与结果A相对应的行动),也不是结果B(因为参与人没有采取与结果B对应的行动)。
因此,可以将博弈问题的解定义为:所有参与人都预测到博弈结果,即参与人的一致性预测。
需要注意的是,这种一致性的预测不仅仅是所有的参与人都预测到某个结果会出现,而且是所有参与人都预测到某个结果会出现,而且是所有参与人都预测到所有参与人预测到某个结果会出现,等等。
博弈论基础
博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
参见:行为生态学(behavioral ecology)。
约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
《博弈论原理模型与教程》第06章扩展式博弈第01节.
《博弈论:原理、模型与教程》第二部分完全信息动态博弈第6章扩展式博弈(已精细订正!)对博弈问题的规范性描述是科学、系统地分析博弈问题的基础。
前面介绍了一种常用的博弈问题描述方式—战略式博弈,虽然这种博弈模型结构简单,只要给出博弈问题的三个基本构成要素(即参与人、参与人的战略集及参与人的支付),就可完成对博弈问题的建模。
但是,由于战略式博弈假设每个参与人仅选择一次行动或行动计划(战略),并且参与人同时进行选择,因此从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
虽然战略式博弈也可以对动态博弈问题进行建模,但是从所得到的模型中只能看到博弈的结果,而无法直观地了解到博弈问题的动态特性。
本章将介绍一种新的博弈问题描述方式—扩展式博弈。
从扩展式博弈模型中,不仅可以看到博弈的结果,而且还能直观地看到博弈的进程。
在介绍扩展式博弈构成的基础上,还将对扩展式博弈的战略和解进行讨论。
6.1 扩展式博弈(文字描述、博弈树描述)所谓扩展式博弈(extensive form game),是博弈问题的一种规范性描述。
与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。
一般而言,要了解一个博弈问题的具体进程,就必须弄清楚以下两个问题:(1)每个参与人在什么时候行动(决策、选择);(2)每个参与人行动时,他所面临决策问题的结构,包括参与人行动时可供他选择的行动方案及所了解的信息(集)。
[注:行文中频繁出现的“行动”一词,有两义:其一,动词的“行动”,指选择、决策。
其二,名词的“行动”,指策略、战略、谋略、行动方案、方案。
]上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。
对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。
定义6 – 1 扩展式博弈包括以下要素:(1)参与人集合{1,2,...,}n Γ=; (2)参与人的行动顺序,即每个参与人在何时行动;(3)每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案及他所了解的信息(集);(4)参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。
第6章:扩展式博弈及其均衡)
开发
-0.3,-0.3 -0.3,-0.3 0.1,0 0,0.1 0,0 0,0.1
0.1,0 0,0
A
不开发
注意:均衡与均衡结果是不同的!!!
SA = A(h(O))
= {开发,不开发 ; }
SB = A(h(x1)) × A(h(x2 )) ={{开发,开发},开发,不开发}, { {不开发,开发},不开发,不开发} { }
定义1:设 S = (s , s ,..., s , S*为扩 ) 展式的一个Nash均衡,当且仅当 ∀i ∈Γ
* * 1 * 2 * n
s ∈argmaxUi (si , s−i )
* i * si∈Si
或者∀si ∈Si, i (si , s ) ≥ Ui (si , s )。 U
* −i * −i
所有参与人的一个纯战略组合
s = (s1, s2 ,..., sn )
决定了博弈树上的一个路径,例如(开发, {不开发,开发})决定了博弈路径: A (0.1,0) 开发 B 不开发
战略组合(不开发,{开发,开发})决定了 博弈路径: A (0,0.1) 不开发 B 开发
不同的纯战略组合可能决定同一个路 径,例如,战略组合(开发,{不开发, 开发})和(开发,{不开发,不开发}) 决定了: A (0.1,0) 开发 B 不开发
∀x1, x2 ∈ X ,
≺
x1 ≺ x2 ⇔ x1在 2之 x 前
1)传递性(transitivity):
≺满足:
∀x1, x2 , x3 ∈ X , 若 1 ≺ x2,x2 ≺ x3,则 x x1 ≺ x3
2)反对称性(asymmetricity):
∀x1, x2 ∈ X , 若 1 ≺ x2, x 则 x2 ≺ x1 不 立 成 。
博弈论的理论与方法优质课件
这种厂商的策略选择行为,在博弈论中 称为“从最小收益中选择最大收益 (Maximize the Minimun Payoffs)”, 其数学表达式形式为:
min a1j=a11=50 j
min a2j=a21=80 j
max min aij=a21=80 ij
同样,对于寡头垄断厂商B来说,如果 它也是一个在决策中非常谨慎的风险回避者, 也会在自己所选择的价格策略可能产生的最 糟糕的结果中,选择相对而言能产生较好结 果的价格策略,即:
如果A采用A2,B仍采用B1价格策略时,A所能获得的最小收益为80(TRA=a21=80)。
3
的概率采用策略A ,那么,根据上述厂商A采 在上述例子中,设厂商A的最优混合策略为:以概率ρa采用策略A1,以概率(1-ρa)采用策略A2,则在厂商B同时相应采用策略B1,
或者策略B2时,厂商A的预期收益为:
传统Micro研究效用(函数)最大化,生产(函 数)最大化,主要涉及人与物(商品、生产要 素)的关系,较少涉及人与人的关系。
当经济研究涉及人与人(企业与企业)的关系时 ,例如厂商的价格战,博弈论就成了一个有用 的分析工具。
博弈论的发展
① 博弈论产生于30-50年代
A、1944年,冯·诺依曼、摩根斯坦恩合作发表 《博弈论与经济行为》,将博弈论引入关于 经济不确定性分析(预期效用概念),是博 弈论正式诞生的标志;
ij
ji
这一博弈论模型的分析结论表明,厂商A和 厂商B都一致地选择了它们各自的价格策略 的组合a21(或者b21),结果产生了一个稳 定的博弈解或者均衡解。
因为,此时a21=80,既不是厂商A的最大收 益(或者厂商B的最大损失),也不是厂商A的 最小收益(或者厂商B的最小损失)。在博弈论 中,这一博弈的均衡解被称为“纳什均衡” ( Nash Eguilibrium ) 或 被 称 为 “ 鞍 点 ” (Saddle Point)。所谓“鞍点”,就是博弈所 具有的确定的解。存在“鞍点”的博弈,也被称 为 严 格 确 定 的 博 弈 ( Strictly Determined Game)。相应地,求解“鞍点”的方法在博弈 论 模 型 中 被 称 为 “ 极 小 — 极 大 定 理 ” ( Min— Max Theorem)。
扩展型博弈和策略型博弈
混合策略Nash均衡
• 当一个博弈没有纯策略Nash均衡时,人们考虑计 算所谓混合策略Nash均衡。 • 局中人的一个混合策略是指他按照某个概率分布 随机地选用各个纯策略;如果他有K个纯策略,那 么他的一个混合策略可以表示为i=(pi1,…,piK),其 中pik是他选用第k个纯策略的概率。 • 当局中人使用混合策略时,各人的期望赢得等于 他在每一个纯策略横断面上的赢得与该策略横断 面出现的概率的乘积之总和。为简便计,i的期望 赢得函数仍然用pi表示。
混合策略Nash均衡
• 无区别原则:如果*=(*i,*-i)是个混合策略Nash 均衡并且pi(*i,*-i) =M,那么对*i中局中人i以正 概率选用的每一个纯策略si都有pi(si,*-i) =M。换 句话说, *-i使得局中人i对于他实际采用的每个 纯策略无区别。 • 根据无区别原则,通常可以求解一个利用优劣关 系简化后得到的KK双矩阵博弈。
混合策略Nash均衡
• 局中人i的全体混合策略的集合记为i;注意一 个纯策略也可以看作一个特殊的混合策略。 • 如果每个局中人都选用一个混合策略,就得到一 个混合策略横断面。全体混合策略横断面的集合 记为。 • 一个混合策略横断面*=(*1,…, *n)叫做混合策略 Nash均衡,如果如果对每个局中人i, 他选定的混 合策略*i都是对所有其它局中人选定的混合策略 *-i的最优回应:pi(*)pi(*|i), *ii, iI。
二人策略型博弈Nash均衡的计算
• 可以按照定义找出所有的纯策略Nash均衡; • 如果策略型博弈比较复杂,可以用策略间的 “优”, “劣”关系化简,然后再寻找均衡。称i 的一个策略si劣于si (或si优于si),如果不管其他 人选定什么策略,si都比si使i得到更小的赢得。 如果存在一个si,它优于i的任何其他策略,就 称si为i的最优策略。显然,劣策略不可能构成 Nash均衡。所以,寻找Nash均衡时可以把劣 策略划掉以简化策略型博弈。
4.扩展式博弈与反向归纳策略
扩展式博弈的形式
完全信息的情况
①
L
②
R
②
l
2 0
r
2 1
l1Biblioteka 0r 3 1
不完全信息的情况
①
L
R
l
2 0
r
2 1
②
l
1 0
r
3 1
扩展式博弈的规则
在一个偏僻的山里,有一个村庄,村里有100对夫妇。 在这个村里已经形成了约定成俗的规定,如果女人发现自己的丈夫对自 己不忠的话,就会毫不犹豫的将他杀死,而且当天执行。当然,她必须 有确切的证据来证明他丈夫的不忠。由于这个因素,某个女人发现某个 男人不忠,她不会告诉那个不忠男人的妻子。但是,她会告诉其他人的 妻子,并且女人们会相互的传递这一信息,因此最后,一个男人不忠, 除了其妻子不知道外,其他女人都知道。 事实上是,村子里的这100对夫妇的男人都不忠,但由于女人不会将她们 知道的事实告诉不忠男人的妻子,每个女人不知道自己的男人不忠,因 此,该村子一直很稳定,而没有发生妻子杀丈夫的行为。 村子里有1个辈分很高的老太太,她德高望重,诚实可敬,对村子里的情 况了如指掌。一天,这位老人对这这100个女人说了一句很平常的话: “你们的男人当中至少有一个是不忠的。”于是,村里发生了这样一个 事情,前99天,村里风平浪静,但到了第100天,村里发生了一场大屠杀, 所有的女人都杀死了她们的丈夫! 为什么会这样?
结论
作为博弈方你不应该仅仅是个被动的参与人,满足于接受别人制定的博 弈规则,而应该设法改变博弈使其对自己尽量有利
可置信的承诺能够促进长期利润,但承诺方也确实因此而对自己的行动 施加了严格的限制。这种通过限制自己行动来获取竞争优势的做法被称 为策略性行为
7.3扩展式博弈
7.3扩展式博弈扩展式博弈定义7.13扩展式博弈一个扩展式博弈Γ由下列要素组成由下列要素组成::1、 有限的有限的参与人集合参与人集合N ;2、 行动集A ,它包括所有可能的行动它包括所有可能的行动,,不必是有限的不必是有限的3、 结或者或者历史的集合历史的集合X .(1) 初始结X ∈0x ,或空的历史或空的历史。
博弈从初始结开始开始。
(2) 对于一些有限多的行动A a i ∈,每个}{\0x x X ∈采取的形式为),...,,(21k a a a x =,这里a 1,a 2…表示第一步表示第一步、、第二步第二步。
的行动的行动。
(3) 如果对于一些K>1,K>1, }{\),...,,(021x X a a a k ∈,那么那么,,}{\),...,,(0121x X a a a k ∈−一个结或一段历史只是对在博弈中迄今已被采取的行动的一个完全的描述的行动的一个完全的描述。
}),({)(X a x A a x A ∈∈≡表示在历史}{\0x X x ∈之后轮到参与人行动时的该参与人可选择的行动集后轮到参与人行动时的该参与人可选择的行动集。
4、 一个行动集A x A ⊆)(0以及在A(x 0)上的一个概率分布π被用于描述博弈中自然的行被用于描述博弈中自然的行动动。
自然总是首先行动的首先行动的,,并且只行动一次并且只行动一次,,以概率π随机的在A(x 0)中选择一个行动。
因此,}{\),...,,(021x X a a a k ∈意味着对于i=1且只有i=1i=1,,)(0x A a i ∈。
5、 终点结集合A a X a x X x E ∈∉∈≡对于一切,),({},。
每个终点结描述了由开始至结束的博弈的一个特殊的完全演变特殊的完全演变。
6、 一个函数N x E X →}){(\:0U ι,表明在属于X 的每一个决策结上那个将轮到的采取行动的每一个决策结上那个将轮到的采取行动的参与参与人。
第4讲 完全信息扩展博弈(1):理论
研究生《博弈论与信息经济学》第四讲 完全信息扩展式博弈:理论董志强 dongzhq@Spring,20061.什么是完全信息扩展式博弈?局中人的行动具有先后顺序。
完全信息:自然不首先行动,局中人的赢利是共同知识。
共同知识:令1K 2K 为参与人1和参与人2对状态集合Ω的知识函数。
一个事件E ⊆Ω是状态ω∈Ω中参与人1和2的共同知识(common knowledge between 1 and 2 in the state),如果ω是无穷序列121221(),(),(()),(()),K E K E K K E K K E ……中每个集合的一个元素。
通俗地说,如果存在这样一个状态,该状态下1和2都知道事件E ,并且1和2都知道“对方知道事件E ”,并且1和2都知道『对方知道“对方知道事件E ”』……如此循环,至于无穷。
那么,事件E 就可以说是这个状态下参与人1和2的共同知识。
完美信息:每个局中人在做决策时候都知道以前所发生的所有事件。
显然,若没有完全信息,就不可能有完美信息;但是反过来,若没有完美信息,则可能有或可能没有完全信息。
Definition :完美信息扩展博弈(extensive game with perfect information)有下列组成部分:• 一个参与人集合N ;• 一个序列集合H (有限或无限的)满足以下三个性质:空序列φ是H 的一个元素;如果1,,()k k K a H ∞=∈"(这里K 可以是无限的)且L K <,那么1,,()k k L a H ∞=∈";如果一个无限序列1,()k k a ="对每个正数L 满足1,,()k k L a H =∈",那么1,()k k a H =∈"。
H 的每个元素是一段历史(History );一段历史的每一组成部分都是一个参与人采取的行动。
如果k 是无限的,或者没有1K a +使1,,1()k k K a H ∞=+∈",那么历史1,,()k k K a H ∞=∈"就是终点(terminal )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《博弈论:原理、模型与教程》第二部分完全信息动态博弈第6章扩展式博弈(已精细订正!)对博弈问题的规范性描述是科学、系统地分析博弈问题的基础。
前面介绍了一种常用的博弈问题描述方式—战略式博弈,虽然这种博弈模型结构简单,只要给出博弈问题的三个基本构成要素(即参与人、参与人的战略集及参与人的支付),就可完成对博弈问题的建模。
但是,由于战略式博弈假设每个参与人仅选择一次行动或行动计划(战略),并且参与人同时进行选择,因此从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
虽然战略式博弈也可以对动态博弈问题进行建模,但是从所得到的模型中只能看到博弈的结果,而无法直观地了解到博弈问题的动态特性。
本章将介绍一种新的博弈问题描述方式—扩展式博弈。
从扩展式博弈模型中,不仅可以看到博弈的结果,而且还能直观地看到博弈的进程。
在介绍扩展式博弈构成的基础上,还将对扩展式博弈的战略和解进行讨论。
6.1 扩展式博弈(文字描述、博弈树描述)所谓扩展式博弈(extensive form game),是博弈问题的一种规范性描述。
与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。
一般而言,要了解一个博弈问题的具体进程,就必须弄清楚以下两个问题:(1)每个参与人在什么时候行动(决策、选择);(2)每个参与人行动时,他所面临决策问题的结构,包括参与人行动时可供他选择的行动方案及所了解的信息(集)。
[注:行文中频繁出现的“行动”一词,有两义:其一,动词的“行动”,指选择、决策。
其二,名词的“行动”,指策略、战略、谋略、行动方案、方案。
]上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。
对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。
定义6 – 1 扩展式博弈包括以下要素: (1)参与人集合{1,2,...,}n Γ=;(2)参与人的行动顺序,即每个参与人在何时行动;(3)每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案及他所了解的信息(集); (4)参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。
从上述定义可以看到:如果要用扩展式博弈对一个博弈问题进行建模(或者描述),那么除了要说明博弈问题所涉及的参与人及每位参与人的支付函数以外,还必须对博弈过程中参与人所遇到的决策问题的序列结构进行详细的解释,说清楚每个参与人在何时行动,以及参与人行动时可供选择的行动方案和所了解到的信息。
【例6-1】 考察一个“新产品开发博弈”。
试用扩展式博弈对两个企业都知道市场需求且企业同时决策的博弈情形,即完全信息静态的“新产品开发博弈”进行建模。
⎪⎪⎪⎩⎪⎪⎪⎨⎧⎩⎨⎧⎩⎨⎧⎩⎨⎧。
为):不投入资金,利润不开发(万元开发,赔企业万元不开发,获利润企业需求小元开发,获利润企业万元不开发,获利润企业需求大元资金投入)开发(企业040022002300280022000:1b a 图1-1 新产品开发的投入-产出图解:文字描述如下:根据定义6-1,完全信息静态的“新产品开发博弈”的扩展式博弈包括以下要素: (1)参与人是企业1和企业2;(2)两个企业同时行动,即同时选择产量;(3)每个企业行动时有两种选择—“开发”和“不开发”,并且每个企业行动时不知道对方的选择1; (4)两个企业的支付如图1-1所示。
1 注意,虽然此时每个企业都不知道对方的选择,但用扩展式博弈进行建模时仍然假设参与人都同时看到了图1-1所示的投入-产出图,即图1-1对两个企业来说为共同知识。
⎪⎪⎪⎩⎪⎪⎪⎨⎧⎩⎨⎧⎩⎨⎧⎩⎨⎧。
为):不投入资金,利润不开发(万元开发,赔企业万元不开发,获利润企业需求小元开发,获利润企业万元不开发,获利润企业需求大元资金投入)开发(企业040022002300280022000:1b a 图1-1 新产品开发的投入-产出图【例6-2】 继续考察“新产品开发博弈”。
试用扩展式博弈对两个企业都知道市场需求且企业1先决策,企业2观测到企业1的选择后再进行选择的博弈情形,即完全信息动态的“新产品开发博弈”进行建模。
解:文字描述如下:根据定义6-1,完全信息动态的“新产品开发博弈”的扩展式博弈包括以下要素: (1)参与人是企业1和企业2; (2)企业1先行动,企业2后行动;(3)企业1行动时有两种选择—“开发”和“不开发”,企业1行动时不知道企业2的行动;企业2行动时有两种选择—“开发”和“不开发”,但企业2行动时已经知道企业1的行动; (4)两个企业的支付仍然有如图1-1所示。
上述两个例子中,用文字描述的方法给出了博弈问题的扩展式描述。
对于一些简单的博弈问题,这种文字表述的方法也许是简单可行的。
但可以想象,如果遇到的是更为复杂的博弈问题,如参与人人数大于2,每个参与人可以多次行动且每次行动时可供选择的行动方案不同等,文字描述所给出的模型就会显得繁冗拖沓,极不直观,因此 需要寻找一种简便易行的扩展式博弈的描述方式。
下面就以“新产品开发博弈”为例,介绍一种不仅简单方便,而且十分直观的扩展式博弈的描述方式—博弈树。
所谓博弈树,就是由结和有向枝构成的“有向树”。
图6-1给出的是当市场需求为大时,完全信息动态的“新产品开发博弈”的博弈树。
在图6-1所示的博弈树中,最上端的一个点1x (用空心圆表示)表示博弈的开始,将“企业1”标示在点1x 上,表示博弈开始于企业1的选择。
企业1的选择有“开发”和“不开发”,分别用标有“开发”和“不开发”的有向枝表示。
若企业1选择“开发”,则博弈从点1x 达到2x (用实心圆表示);若企业1选择“不开发”,则博弈从点1x 达到点3x (用实心圆表示)。
点2x (或3x )上标有“企业2”,表示企业2在博弈到达点2x (或3x )时,即企业1选择“开发”(或“不开发”)后,再进行选择;企业2的行动也有“开发”和“不开发”,同样分别用标有“开发”和“不开发”的有向枝表示。
若企业2选择“开发”,则博弈从点2x (或3x )达到点4x (或6x )(都用实心圆表示);若企业2选择“不开发”,则博弈从点2x (或3x )达到点5x (或7x )(都用实心圆表示)。
由于企业2选择后博弈结束,因此点4x 、5x 、6x 和7x 都表示博弈的结束。
在点4x 、5x 、6x 和7x 旁标有支付向量,表示博弈达到该点时企业的所得。
其中,支付向量中的第一个数字表示企业1的所得,第二个数字表示企业2的所得1。
图6-1中,点1x 、2x 、3x 、4x 、5x 、6x 和7x 称为博弈树的结(node ),其中标有参与人(即企业)的结1x 、2x 和3x 称为决策结(decision node ),表示参与人在此选择行动;标有支付向量的结4x 、5x 、6x 和7x 表示博弈结束,称为终点结(terminal node )。
在决策结中,决策结1x 表示博弈的开始,亦称为博弈树的初始结或根(root )。
结与结的连线称为博弈树的枝(branch ),表示博弈从枝的一个结达到另一个结参与人需要选择的行动。
例如,博弈从决策结1x 达到2x ,需要企业1选择行动“开发”,所以在连接1x 和2x 的枝上标有行动“开发”。
在博弈树中,枝是有向的,表示博弈只能从枝的一个结达到另一个结。
例如,在连接1x 和3x 的枝上,标有行动“不开发”,表示当企业1选择“不开发”时,博弈从1x 达到3x ,因此连接1x 到3x 的枝的方向是从1x 指向3x 。
1 一般情形下,支付向量中数字的顺序与博弈树中参与人的行动顺序相对应。
通过以上介绍,再考察图6-1中的博弈树,可以得到这样的信息: (1)博弈中的参与人是企业1和企业2; (2)博弈中企业1先选择,企业2后选择;(3)企业1选择时有行动“开发”和“不开发”,企业2选择的行动有“开发”和“不开发”; (4)博弈中企业的支付。
也就是说,除了“企业2行动时是否观测到企业1的选择”这一点暂时无法从图6-1中知道以外,完全信息动态的“新产品开发博弈”的扩展式描述所需要的信息(或要素)都可以从图6-1中得到。
如果还能够直接从博弈树中知道“企业2行动时是否观测到企业1的选择”,那么给出博弈树,就意味着给出了完全信息动态的“新产品开发博弈”的扩展式描述。
下面探讨如何在博弈树中,将“企业2行动时是否观测到企业1的选择”这一信息表示出来。
在完全信息动态的“新产品开发博弈”中,企业2决策时企业1已经做出选择,此时企业2面临的决策情形无非只有以下两种: 第一种:企业2知道企业1的选择; 第二种:企业2不知道企业1的选择。
对于第一种情形,企业2知道企业1的选择,即知道企业1选择“开发”还是“不开发”,因此企业2知道博弈是从1x 到了2x 还是从1x 到了3x 。
这就意味着当轮到企业2决策时,他知道自己是在点2x 上还是在点3x 上。
对于第二种情形,企业2不知道企业1的选择,即不知道博弈是从1x 到了2x 还是从1x 到了3x 。
因此,当轮到企业2决策时,他不知道自己是在点2x 上还是在点3x 上。
所以,“企业2行动时是否观测到企业1的选择”这一问题,实际上就等价于“企业2行动时是否知道自己是在博弈树中的点2x 上还是在点3x 上”。
为了将“企业2行动时是否知道自己是在博弈树中的点2x 上还是在点3x 上”这一点说清楚,需要引入“信息集”(information set )的概念。
在博弈树中,参与人i 的一个信息集(用i I 表示)是参与人i 决策结的一个集合,它满足以下条件: (1)i I 中的每个决策结都是参与人i 的决策结;(2)当博弈到达信息集i I (即博弈到达i I 中某个决策结)时,参与人i 知道自己是在信息集i I 中的决策结上,但不知道自己究竟在i I 中哪个决策结上。
因此,参与人i 的信息集i I 可以用来描述当轮到参与人i 行动时他所了解到的信息,即他知道什么(知道自己位于哪一个信息集上)、不知道什么(不知道自己位于信息集中哪一个决策结上)。
例如,在“新产品开发博弈”中,假设企业1先行动,企业2后行动,但企业2行动时不知道企业1的行动,那么在如图6-1所示的博弈中当企业2行动时就只知道博弈要么到达点2x ,要么到达点3x ,但具体在哪一点上,企业2不清楚。
也就是说,企业2只知道自己位于决策结集合23{,}x x 上,但不知道位于23{,}x x 中哪一个决策结上。
在这种情况下,23{,}x x 就是企业2的一个信息集。
如果假设企业2行动时知道企业1的行动,那么在如图6-1所示的博弈中,当企业2行动时就知道博弈是到达了点2x ,还是到达了点3x 。