博弈论概述课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11wenku.baidu.com
博弈的分类和均衡
行动次序
信息
静态
动态 子博弈精练 纳什均衡 泽尔腾 精炼贝叶斯均衡 泽尔腾等
12
完全信息
纳什均衡 纳什 贝叶斯均衡 海萨尼
不完全信息
第二节 博弈的种类
一、完全信息静态博弈
(一)完全信息静态博弈定义 所谓完全信息静态博弈指的是各博弈方同 时决策,或者决策行动虽有先后,但后行动者 不知道先行动者的具体行动是什么且各博弈方 对博弈中各种策略组合情况下所有参与人相应 的得益都完全了解的博弈。
29
三、动态博弈的表现形式—— “博弈树”
①结:结包括决策结和终点结。
②枝:博弈树上,枝是从一个决策结到其直接后续结的 连线,每一个枝代表参与人的一个行动选择。在每一 个枝旁标注该具体行动的代号。一般地,每个决策结 下有多个枝,给出每次行动时参与人的行动空间,即 此时 有哪些行动可供选择。
③信息集:将博弈树中某一决策者在某一行动阶段具有 相同信息的所有决策结称为一个信息集。
8
(三)博弈的分类
根据参与人的多少,可将博弈分为两人博弈 或多人博弈;
根据参与人是否合作,可将博弈分为合作博 弈或非合作博弈; 根据博弈结果的不同,又可分为零和博弈、 常和博弈与变和博弈。
9
1、从行动的先后次序来分,博弈可以 分为静态博弈和动态博弈。 静态博弈指在博弈中,参与人同时选择行 动,或虽非同时但后行动者并不知道前行 动者采取了什么具体行动; 动态博弈指的是参与人的行动有先后顺序, 且后行动者能够观察到先行动者所选择的 行动的博弈。
27
第二节 完全信息动态博弈
一、完全信息动态博弈定义 完全信息动态博弈指的是各博弈方先 后行动,后行动者知道先行动者的具体 行动是什么且各博弈方对博弈中各种策 略组合情况下所有参与人相应的得益都 完全了解的博弈.
28
二、动态博弈的构成要素
(1)参与人集合:I:1,…,n;此外我们以后将用"代表虚拟 的参与人——“自然”; (2)参与人的行动顺序:谁在什么时候行动; (3)参与 人的行动空间:在每次行动时,参与人有些什么行动可 供选择; (4)参与人的信息集:每次行动时,参与人知道些什么; (5)参与人的得益函数:在博弈结束后,每个参与人得到 些什么; (6)外生事件(即“自然”的选择)的概率分布。
16
(三)博弈的得益矩阵表示
一个博弈被称为有限博弈,如果:第一,参与人 的个数是有限的;
第二,每个参人可选择的策略个数是有限的。
有限博弈的策略式表达及其求解可以方便地用得益 矩阵直观地给出。
17
著名的“囚徒困境”的例 子
警察抓住了两个罪犯,但是警察局却缺乏足 够的证据指证他们所犯的罪行。如果罪犯中至少 有一人供认犯罪,就能确认罪名成立。为了得到 所需的口供,警察将这两名罪犯分别关押防止他 们串供或结成攻守同盟,并分别跟他们讲清了他 们的处境和面临的选择:如果他们两人都拒不认 罪,则他们会被以较轻的妨碍公务罪各判一年徒 刑;如果两人中有一人坦白认罪,则坦白者立即 释放而另一人将重判10年徒刑;果两人都坦白认 罪,则他们将被各判8年监禁。问:两个罪犯会 如何选择(即是坦白还是抵赖)?
40,50 0,300
打击
-10,0 0,300
从这个例子中我们知道一个博弈可能有多个纳 什均衡,而具体哪个均衡会实现,纳什均衡本身不 能给出回答,任何有限博弈都存在至少一个纳什均衡, 若是无限博弈则不一定。
26
几个博弈案例
1.智猪博弈(占优战略均衡) 2.性别之争(多重纳什均衡) 3.斗鸡博弈; 4.市场阻挠博弈
18
囚徒B 坦白 囚徒A 不坦白
坦白 不坦白
-8,-8
0,-10
-10,0
-1,-1
19
(四)纳什均衡
1、占优策略均衡。一般来说,由于每个参 与人的得益是博弈中所有参与人的策略的函数, 因此每个参与人的最优策略选择依赖于所有其他 参与人的策略选择。但在一些特殊的博弈中,一 个参与人的最优策略可能可以不依赖于其他参与 人的策略选择,就是说,不论其他参与人选择什 么策略,他的最优策略是 唯一的,这样的最优 策略被称为“占优策略”。 如果一个博弈中,某个参与人有占 优策略, 那么该参与人的其他可选择策略就被称为“劣策 略”。
5
三、博弈论的基本概念
(一)博弈论的定义
博弈论,英文为Game theory,是研究相 互依赖、相互影响的决策主体的理性决策行为 以及这些决策的均衡结果的理论。 一些相互依赖、相互影响的决策行为及其结果 的组合称为博弈(Game)。
6
(二)博弈的组成要素
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。 1、参与人指的是博弈中选择行动以最大化自 己效用的决策主体(可以是个人,也可以是团体); 2、行动是指参与人在博弈进程中轮到自己选 择时所作的某个具体决策; 3、策略是指参与人选择行动的规则,即在博 弈进程中,什么情况下选择什么行动的预先安排;
7
4、信息指的是参与人在博弈中所知道的关于 自己以及其他参与人的行动、策略及其得益函数 等知识; 5、得益是参与人在博弈结束后从博弈中获得 的效用,一般是所有参与人的策略或行动的函数, 这是每个参与人最关心的东西; 6、均衡是所有参与人的最优策略或行动的组 合;均衡结果是指博弈结束后博弈分析者感兴趣 的一些要素的集合,如在各参与人的均衡策略作 用下,各参与人最终的行动或效用集合。 上述要素中,参与人、行动、结果统称为博 弈规则,博弈分析的目的就是使用博弈规则来决 定均衡。
30
四、动态博弈的特点
1.动态博弈的策略特征: 博弈方决策的内容也是决定博弈结果的关 键,不是博弈方在单个阶段的行为,而 是各博弈方在整个博弈中轮到选择的每 个阶段,针对前面阶段的各种情况作出 的相应选择和行为的完整计划,以及由 不同博弈方的这种计划所构成的组合。 这种计划就是博弈方的策略。
31
2.博弈方的非对策性
23
纳什均衡的正式定义
纳什均衡:有n个参与人的战略式 表述博弈G={S1 ,…,Sn ;u1, …, un},战略组合S*=(S1*,…,Sn*)是 一个纳什均衡,如果对于每一个i,Si* 是给定其他参与人S-i*=(S1*,…,S-1*, Si+1*…,Sn* )的情况下第i个参与人的 最优战略,即:ui(si*,s-i*)≥ui(siα,s*) 对任意S α∈S ,和任意的 I都成立。 i i i
10
2、从参与人对其他参与人的各种特征信息 的获得差异来分,博弈可分为完全信息博弈和不 完全信息博弈。
完全信息指的是每一个参与人对所有其他参 与人的特征,如策略集合及得益函数都有准确完 备的知识;否则就是不完全信息。 将上述两个角度的划分结合起来,我们就得 到四种不同类型的博弈,这就是:完全信息静态 博弈,完全信息动态博弈,不完全信息静态博弈 和不完全信息动态博弈。
20
在一个博弈里,如果所有参与人都有占优策略 存在,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。所以在囚徒 困境博弈里,{坦白,坦白}是占优策略均衡。 囚徒困境反映了一个深刻的问题,即个人理性与 团体理性的冲突。这给我们一个启示,我们学习博弈论, 也许更应该研究的是怎样设计一种制度,在满足个人理 性的同时,去争取达到“集体理性”。
21
2、严格劣策略的重复剔除
重复剔除严格劣策略”的思路如下:首 先找出某个参与人的严格劣策略(假定其存 在),把这个劣策略剔除掉,重新构造一个不 包含已剔除策略的新的博弈;重复这个过程, 一直到只剩下一个唯一的策略组合为止。这 个唯一剩下的策略组合就是这个博弈的均衡 解,称为”重复剔除的占优 均衡”。注意, 上述表述中强调了“唯一”这个词。也就是 说,如果重复剔除后剩下的策略组合不唯一, 那么该博弈就不是可通过重复剔除劣策略求 解的。 22
在信息的占有上,后行动者往往比先行动者更 占优势。但所获得的收益不一定比先行动者多。 这与单人决策是不同的。 3.策略的可置信性问题: 策略是博弈方自己预先设定的,在各个博弈阶 段针对各种情况所作的相应行为选择的计划, 本身没有强制力,且实施起来有一个过程。在 该过程中,根据自己的利益需要,他完全可以 改变这个计划,从而存在“相机选择”,产生 策略的可置信性问题。
4
1994年诺贝尔经济学奖授予了三位博弈论专家纳什、 泽尔腾和海萨尼。 1996年诺奖授予两位博弈论与信息经济学研究专家莫里 斯、维克瑞; 2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰 他们在柠檬市场、信号传递和信号甄别等非对称信息 理论研究中的开创性贡献。 2005年诺奖授予有以色列和美国双重国籍的罗伯特· 奥 曼和美国人托马斯· 谢林,以表彰他们在博弈论领域 作出的贡献。
34
3.子博弈精炼纳什均衡求法——逆向 归纳法求解
3
二、现代经济学与博弈论
从现代的观点来看,经济学是研究人的决策 行为的学问。 理性人是指有一个很好定义的偏好,在面临给 定的约束条件下能最大化自己偏好的人,不考虑竞 争对手的决策。 价格理论有两个基本假定:1、市场参与人的 数量足够多,从而市场是竞争性的;2、参与人之 间不存在信息不对称问题(完全竞争、完全信息)。 然而在现实生活中,这两个假设在许多情况下 是不能被满足。
13
(二)博弈的策略式表达
在博弈论中,一个博弈可以用两种不同 的方式来表达: 一种是策略式表达:另一种是扩展式表达. 策略式表达更适合于静态博弈,而扩展式 表达更适合于讨论动态博弈。
14
策略式表达又称为标准式表达,在这种表 达中,所有参人同时选择自己的策略,所有参 与人选择的策略一起决定每个参与人的得益。 值得强调的是,这里参与人同时选择的是 “策略”,而不是“行动”。 在静态博弈中,于参与人只选择一次,所以 策略就等同于行动了。而在动态博弈中,策略 是参与人在各个阶段的行动的全面计划。
15
更为准确地讲,战略式表述给出:
1 、 博 弈 的 参 与 人 集 合 : i∈Γ , Γ=(1,2,…, n); 2、每个参与人的战略空间:Si i = 1,2,3,…,n; 3、每个参与人的得益函数:ui(s1, …, si…,sn),i=1,2,3, …,n。 用G={S1,…,Sn;u1, …,un}代表战 略式表述博弈。
博弈论概述课件
1
第一节 博弈论的基本概念
一、市场竞争中的博弈 二、现代经济学与博弈论 三、博弈论的基本概念
2
一、市场竞争中的博弈
在现实经济生活中,许多产业市场是寡 头断市场。寡头垄断市场是指少数几家大厂 商生产一个产业中的全部或大部分产品,从 而形成对一个产业的控制的产业市场。 在分析寡头垄断市场中的企业决策行为 时,就必须把各种决策者之间的策略相互作 用纳入到经济模型中,这就是一种博弈分析。
3.纳什均衡
纳什均衡是完全信息静态博弈解的一般概 念,构成纳什均衡的策略一定是重复剔除严格 劣策略过程中不能被剔除的策略,即没有任何 一个策略严格优于纳什均衡策略。当然,逆定 理是不存在的。更为重要的是,许多不存在占 优策略均衡或重复剔除的占优策略均衡的博 弈,也存在纳什均衡。 下面,我们给出纳什均衡的正式定义。
32
四、子博弈精炼纳什均衡—— 动态博弈的纳什均衡
1.意义:
“子博弈精炼纳什均衡”, 用于区分动 态博弈中的“合理纳什均衡”与“不合 理纳什均衡”,将纳什均衡中包含有不 可置信威胁策略的均衡剔除出去,就是 说,使最后的均衡中不再包含有不可置 信威胁策略的存在。
33
2.子博弈精炼纳什均衡的定义
子博弈:一个扩展式表示博弈的子博弈G是由 一个单结信息集x开始的与所有该决策结的后 续结(包括终点结)组成的能自成一个博弈的原 博弈的一部分。 子博弈精炼纳什均衡定义: 对于扩展式博弈的策略组合S*=(S1*,…,Si*,…, Sn*) ,如果它是原博弈的纳什均衡;它在每一 个子博弈上也都构成纳什均衡,则它是一个子 博弈精炼纳什均衡。
24
指一组给定对手行为前提下对各 博弈方存在的最佳选择;在纳什 均衡状态下,只要其它参与者不 变换策略选择,任何单个参与者 不可能单方面通过变换策略来提 高他的所获支付。
25
(五)纳什均衡的多重性
在两人的有限策略博弈中,我们还可以简 单地用划线法来找出纳什均衡 在位者 进入者 进入 不进入 默许
博弈的分类和均衡
行动次序
信息
静态
动态 子博弈精练 纳什均衡 泽尔腾 精炼贝叶斯均衡 泽尔腾等
12
完全信息
纳什均衡 纳什 贝叶斯均衡 海萨尼
不完全信息
第二节 博弈的种类
一、完全信息静态博弈
(一)完全信息静态博弈定义 所谓完全信息静态博弈指的是各博弈方同 时决策,或者决策行动虽有先后,但后行动者 不知道先行动者的具体行动是什么且各博弈方 对博弈中各种策略组合情况下所有参与人相应 的得益都完全了解的博弈。
29
三、动态博弈的表现形式—— “博弈树”
①结:结包括决策结和终点结。
②枝:博弈树上,枝是从一个决策结到其直接后续结的 连线,每一个枝代表参与人的一个行动选择。在每一 个枝旁标注该具体行动的代号。一般地,每个决策结 下有多个枝,给出每次行动时参与人的行动空间,即 此时 有哪些行动可供选择。
③信息集:将博弈树中某一决策者在某一行动阶段具有 相同信息的所有决策结称为一个信息集。
8
(三)博弈的分类
根据参与人的多少,可将博弈分为两人博弈 或多人博弈;
根据参与人是否合作,可将博弈分为合作博 弈或非合作博弈; 根据博弈结果的不同,又可分为零和博弈、 常和博弈与变和博弈。
9
1、从行动的先后次序来分,博弈可以 分为静态博弈和动态博弈。 静态博弈指在博弈中,参与人同时选择行 动,或虽非同时但后行动者并不知道前行 动者采取了什么具体行动; 动态博弈指的是参与人的行动有先后顺序, 且后行动者能够观察到先行动者所选择的 行动的博弈。
27
第二节 完全信息动态博弈
一、完全信息动态博弈定义 完全信息动态博弈指的是各博弈方先 后行动,后行动者知道先行动者的具体 行动是什么且各博弈方对博弈中各种策 略组合情况下所有参与人相应的得益都 完全了解的博弈.
28
二、动态博弈的构成要素
(1)参与人集合:I:1,…,n;此外我们以后将用"代表虚拟 的参与人——“自然”; (2)参与人的行动顺序:谁在什么时候行动; (3)参与 人的行动空间:在每次行动时,参与人有些什么行动可 供选择; (4)参与人的信息集:每次行动时,参与人知道些什么; (5)参与人的得益函数:在博弈结束后,每个参与人得到 些什么; (6)外生事件(即“自然”的选择)的概率分布。
16
(三)博弈的得益矩阵表示
一个博弈被称为有限博弈,如果:第一,参与人 的个数是有限的;
第二,每个参人可选择的策略个数是有限的。
有限博弈的策略式表达及其求解可以方便地用得益 矩阵直观地给出。
17
著名的“囚徒困境”的例 子
警察抓住了两个罪犯,但是警察局却缺乏足 够的证据指证他们所犯的罪行。如果罪犯中至少 有一人供认犯罪,就能确认罪名成立。为了得到 所需的口供,警察将这两名罪犯分别关押防止他 们串供或结成攻守同盟,并分别跟他们讲清了他 们的处境和面临的选择:如果他们两人都拒不认 罪,则他们会被以较轻的妨碍公务罪各判一年徒 刑;如果两人中有一人坦白认罪,则坦白者立即 释放而另一人将重判10年徒刑;果两人都坦白认 罪,则他们将被各判8年监禁。问:两个罪犯会 如何选择(即是坦白还是抵赖)?
40,50 0,300
打击
-10,0 0,300
从这个例子中我们知道一个博弈可能有多个纳 什均衡,而具体哪个均衡会实现,纳什均衡本身不 能给出回答,任何有限博弈都存在至少一个纳什均衡, 若是无限博弈则不一定。
26
几个博弈案例
1.智猪博弈(占优战略均衡) 2.性别之争(多重纳什均衡) 3.斗鸡博弈; 4.市场阻挠博弈
18
囚徒B 坦白 囚徒A 不坦白
坦白 不坦白
-8,-8
0,-10
-10,0
-1,-1
19
(四)纳什均衡
1、占优策略均衡。一般来说,由于每个参 与人的得益是博弈中所有参与人的策略的函数, 因此每个参与人的最优策略选择依赖于所有其他 参与人的策略选择。但在一些特殊的博弈中,一 个参与人的最优策略可能可以不依赖于其他参与 人的策略选择,就是说,不论其他参与人选择什 么策略,他的最优策略是 唯一的,这样的最优 策略被称为“占优策略”。 如果一个博弈中,某个参与人有占 优策略, 那么该参与人的其他可选择策略就被称为“劣策 略”。
5
三、博弈论的基本概念
(一)博弈论的定义
博弈论,英文为Game theory,是研究相 互依赖、相互影响的决策主体的理性决策行为 以及这些决策的均衡结果的理论。 一些相互依赖、相互影响的决策行为及其结果 的组合称为博弈(Game)。
6
(二)博弈的组成要素
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。 1、参与人指的是博弈中选择行动以最大化自 己效用的决策主体(可以是个人,也可以是团体); 2、行动是指参与人在博弈进程中轮到自己选 择时所作的某个具体决策; 3、策略是指参与人选择行动的规则,即在博 弈进程中,什么情况下选择什么行动的预先安排;
7
4、信息指的是参与人在博弈中所知道的关于 自己以及其他参与人的行动、策略及其得益函数 等知识; 5、得益是参与人在博弈结束后从博弈中获得 的效用,一般是所有参与人的策略或行动的函数, 这是每个参与人最关心的东西; 6、均衡是所有参与人的最优策略或行动的组 合;均衡结果是指博弈结束后博弈分析者感兴趣 的一些要素的集合,如在各参与人的均衡策略作 用下,各参与人最终的行动或效用集合。 上述要素中,参与人、行动、结果统称为博 弈规则,博弈分析的目的就是使用博弈规则来决 定均衡。
30
四、动态博弈的特点
1.动态博弈的策略特征: 博弈方决策的内容也是决定博弈结果的关 键,不是博弈方在单个阶段的行为,而 是各博弈方在整个博弈中轮到选择的每 个阶段,针对前面阶段的各种情况作出 的相应选择和行为的完整计划,以及由 不同博弈方的这种计划所构成的组合。 这种计划就是博弈方的策略。
31
2.博弈方的非对策性
23
纳什均衡的正式定义
纳什均衡:有n个参与人的战略式 表述博弈G={S1 ,…,Sn ;u1, …, un},战略组合S*=(S1*,…,Sn*)是 一个纳什均衡,如果对于每一个i,Si* 是给定其他参与人S-i*=(S1*,…,S-1*, Si+1*…,Sn* )的情况下第i个参与人的 最优战略,即:ui(si*,s-i*)≥ui(siα,s*) 对任意S α∈S ,和任意的 I都成立。 i i i
10
2、从参与人对其他参与人的各种特征信息 的获得差异来分,博弈可分为完全信息博弈和不 完全信息博弈。
完全信息指的是每一个参与人对所有其他参 与人的特征,如策略集合及得益函数都有准确完 备的知识;否则就是不完全信息。 将上述两个角度的划分结合起来,我们就得 到四种不同类型的博弈,这就是:完全信息静态 博弈,完全信息动态博弈,不完全信息静态博弈 和不完全信息动态博弈。
20
在一个博弈里,如果所有参与人都有占优策略 存在,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。所以在囚徒 困境博弈里,{坦白,坦白}是占优策略均衡。 囚徒困境反映了一个深刻的问题,即个人理性与 团体理性的冲突。这给我们一个启示,我们学习博弈论, 也许更应该研究的是怎样设计一种制度,在满足个人理 性的同时,去争取达到“集体理性”。
21
2、严格劣策略的重复剔除
重复剔除严格劣策略”的思路如下:首 先找出某个参与人的严格劣策略(假定其存 在),把这个劣策略剔除掉,重新构造一个不 包含已剔除策略的新的博弈;重复这个过程, 一直到只剩下一个唯一的策略组合为止。这 个唯一剩下的策略组合就是这个博弈的均衡 解,称为”重复剔除的占优 均衡”。注意, 上述表述中强调了“唯一”这个词。也就是 说,如果重复剔除后剩下的策略组合不唯一, 那么该博弈就不是可通过重复剔除劣策略求 解的。 22
在信息的占有上,后行动者往往比先行动者更 占优势。但所获得的收益不一定比先行动者多。 这与单人决策是不同的。 3.策略的可置信性问题: 策略是博弈方自己预先设定的,在各个博弈阶 段针对各种情况所作的相应行为选择的计划, 本身没有强制力,且实施起来有一个过程。在 该过程中,根据自己的利益需要,他完全可以 改变这个计划,从而存在“相机选择”,产生 策略的可置信性问题。
4
1994年诺贝尔经济学奖授予了三位博弈论专家纳什、 泽尔腾和海萨尼。 1996年诺奖授予两位博弈论与信息经济学研究专家莫里 斯、维克瑞; 2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰 他们在柠檬市场、信号传递和信号甄别等非对称信息 理论研究中的开创性贡献。 2005年诺奖授予有以色列和美国双重国籍的罗伯特· 奥 曼和美国人托马斯· 谢林,以表彰他们在博弈论领域 作出的贡献。
34
3.子博弈精炼纳什均衡求法——逆向 归纳法求解
3
二、现代经济学与博弈论
从现代的观点来看,经济学是研究人的决策 行为的学问。 理性人是指有一个很好定义的偏好,在面临给 定的约束条件下能最大化自己偏好的人,不考虑竞 争对手的决策。 价格理论有两个基本假定:1、市场参与人的 数量足够多,从而市场是竞争性的;2、参与人之 间不存在信息不对称问题(完全竞争、完全信息)。 然而在现实生活中,这两个假设在许多情况下 是不能被满足。
13
(二)博弈的策略式表达
在博弈论中,一个博弈可以用两种不同 的方式来表达: 一种是策略式表达:另一种是扩展式表达. 策略式表达更适合于静态博弈,而扩展式 表达更适合于讨论动态博弈。
14
策略式表达又称为标准式表达,在这种表 达中,所有参人同时选择自己的策略,所有参 与人选择的策略一起决定每个参与人的得益。 值得强调的是,这里参与人同时选择的是 “策略”,而不是“行动”。 在静态博弈中,于参与人只选择一次,所以 策略就等同于行动了。而在动态博弈中,策略 是参与人在各个阶段的行动的全面计划。
15
更为准确地讲,战略式表述给出:
1 、 博 弈 的 参 与 人 集 合 : i∈Γ , Γ=(1,2,…, n); 2、每个参与人的战略空间:Si i = 1,2,3,…,n; 3、每个参与人的得益函数:ui(s1, …, si…,sn),i=1,2,3, …,n。 用G={S1,…,Sn;u1, …,un}代表战 略式表述博弈。
博弈论概述课件
1
第一节 博弈论的基本概念
一、市场竞争中的博弈 二、现代经济学与博弈论 三、博弈论的基本概念
2
一、市场竞争中的博弈
在现实经济生活中,许多产业市场是寡 头断市场。寡头垄断市场是指少数几家大厂 商生产一个产业中的全部或大部分产品,从 而形成对一个产业的控制的产业市场。 在分析寡头垄断市场中的企业决策行为 时,就必须把各种决策者之间的策略相互作 用纳入到经济模型中,这就是一种博弈分析。
3.纳什均衡
纳什均衡是完全信息静态博弈解的一般概 念,构成纳什均衡的策略一定是重复剔除严格 劣策略过程中不能被剔除的策略,即没有任何 一个策略严格优于纳什均衡策略。当然,逆定 理是不存在的。更为重要的是,许多不存在占 优策略均衡或重复剔除的占优策略均衡的博 弈,也存在纳什均衡。 下面,我们给出纳什均衡的正式定义。
32
四、子博弈精炼纳什均衡—— 动态博弈的纳什均衡
1.意义:
“子博弈精炼纳什均衡”, 用于区分动 态博弈中的“合理纳什均衡”与“不合 理纳什均衡”,将纳什均衡中包含有不 可置信威胁策略的均衡剔除出去,就是 说,使最后的均衡中不再包含有不可置 信威胁策略的存在。
33
2.子博弈精炼纳什均衡的定义
子博弈:一个扩展式表示博弈的子博弈G是由 一个单结信息集x开始的与所有该决策结的后 续结(包括终点结)组成的能自成一个博弈的原 博弈的一部分。 子博弈精炼纳什均衡定义: 对于扩展式博弈的策略组合S*=(S1*,…,Si*,…, Sn*) ,如果它是原博弈的纳什均衡;它在每一 个子博弈上也都构成纳什均衡,则它是一个子 博弈精炼纳什均衡。
24
指一组给定对手行为前提下对各 博弈方存在的最佳选择;在纳什 均衡状态下,只要其它参与者不 变换策略选择,任何单个参与者 不可能单方面通过变换策略来提 高他的所获支付。
25
(五)纳什均衡的多重性
在两人的有限策略博弈中,我们还可以简 单地用划线法来找出纳什均衡 在位者 进入者 进入 不进入 默许