博弈论概述课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11wenku.baidu.com
博弈的分类和均衡
行动次序
信息
静态
动态 子博弈精练 纳什均衡 泽尔腾 精炼贝叶斯均衡 泽尔腾等
12
完全信息
纳什均衡 纳什 贝叶斯均衡 海萨尼
不完全信息
第二节 博弈的种类
一、完全信息静态博弈
(一)完全信息静态博弈定义 所谓完全信息静态博弈指的是各博弈方同 时决策,或者决策行动虽有先后,但后行动者 不知道先行动者的具体行动是什么且各博弈方 对博弈中各种策略组合情况下所有参与人相应 的得益都完全了解的博弈。
29
三、动态博弈的表现形式—— “博弈树”
①结:结包括决策结和终点结。
②枝:博弈树上,枝是从一个决策结到其直接后续结的 连线,每一个枝代表参与人的一个行动选择。在每一 个枝旁标注该具体行动的代号。一般地,每个决策结 下有多个枝,给出每次行动时参与人的行动空间,即 此时 有哪些行动可供选择。
③信息集:将博弈树中某一决策者在某一行动阶段具有 相同信息的所有决策结称为一个信息集。
8
(三)博弈的分类
根据参与人的多少,可将博弈分为两人博弈 或多人博弈;
根据参与人是否合作,可将博弈分为合作博 弈或非合作博弈; 根据博弈结果的不同,又可分为零和博弈、 常和博弈与变和博弈。
9
1、从行动的先后次序来分,博弈可以 分为静态博弈和动态博弈。 静态博弈指在博弈中,参与人同时选择行 动,或虽非同时但后行动者并不知道前行 动者采取了什么具体行动; 动态博弈指的是参与人的行动有先后顺序, 且后行动者能够观察到先行动者所选择的 行动的博弈。
27
第二节 完全信息动态博弈
一、完全信息动态博弈定义 完全信息动态博弈指的是各博弈方先 后行动,后行动者知道先行动者的具体 行动是什么且各博弈方对博弈中各种策 略组合情况下所有参与人相应的得益都 完全了解的博弈.
28
二、动态博弈的构成要素
(1)参与人集合:I:1,…,n;此外我们以后将用"代表虚拟 的参与人——“自然”; (2)参与人的行动顺序:谁在什么时候行动; (3)参与 人的行动空间:在每次行动时,参与人有些什么行动可 供选择; (4)参与人的信息集:每次行动时,参与人知道些什么; (5)参与人的得益函数:在博弈结束后,每个参与人得到 些什么; (6)外生事件(即“自然”的选择)的概率分布。
16
(三)博弈的得益矩阵表示
一个博弈被称为有限博弈,如果:第一,参与人 的个数是有限的;
第二,每个参人可选择的策略个数是有限的。
有限博弈的策略式表达及其求解可以方便地用得益 矩阵直观地给出。
17
著名的“囚徒困境”的例 子
警察抓住了两个罪犯,但是警察局却缺乏足 够的证据指证他们所犯的罪行。如果罪犯中至少 有一人供认犯罪,就能确认罪名成立。为了得到 所需的口供,警察将这两名罪犯分别关押防止他 们串供或结成攻守同盟,并分别跟他们讲清了他 们的处境和面临的选择:如果他们两人都拒不认 罪,则他们会被以较轻的妨碍公务罪各判一年徒 刑;如果两人中有一人坦白认罪,则坦白者立即 释放而另一人将重判10年徒刑;果两人都坦白认 罪,则他们将被各判8年监禁。问:两个罪犯会 如何选择(即是坦白还是抵赖)?
40,50 0,300
打击
-10,0 0,300
从这个例子中我们知道一个博弈可能有多个纳 什均衡,而具体哪个均衡会实现,纳什均衡本身不 能给出回答,任何有限博弈都存在至少一个纳什均衡, 若是无限博弈则不一定。
26
几个博弈案例
1.智猪博弈(占优战略均衡) 2.性别之争(多重纳什均衡) 3.斗鸡博弈; 4.市场阻挠博弈
18
囚徒B 坦白 囚徒A 不坦白
坦白 不坦白
-8,-8
0,-10
-10,0
-1,-1
19
(四)纳什均衡
1、占优策略均衡。一般来说,由于每个参 与人的得益是博弈中所有参与人的策略的函数, 因此每个参与人的最优策略选择依赖于所有其他 参与人的策略选择。但在一些特殊的博弈中,一 个参与人的最优策略可能可以不依赖于其他参与 人的策略选择,就是说,不论其他参与人选择什 么策略,他的最优策略是 唯一的,这样的最优 策略被称为“占优策略”。 如果一个博弈中,某个参与人有占 优策略, 那么该参与人的其他可选择策略就被称为“劣策 略”。
5
三、博弈论的基本概念
(一)博弈论的定义
博弈论,英文为Game theory,是研究相 互依赖、相互影响的决策主体的理性决策行为 以及这些决策的均衡结果的理论。 一些相互依赖、相互影响的决策行为及其结果 的组合称为博弈(Game)。
6
(二)博弈的组成要素
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。 1、参与人指的是博弈中选择行动以最大化自 己效用的决策主体(可以是个人,也可以是团体); 2、行动是指参与人在博弈进程中轮到自己选 择时所作的某个具体决策; 3、策略是指参与人选择行动的规则,即在博 弈进程中,什么情况下选择什么行动的预先安排;
7
4、信息指的是参与人在博弈中所知道的关于 自己以及其他参与人的行动、策略及其得益函数 等知识; 5、得益是参与人在博弈结束后从博弈中获得 的效用,一般是所有参与人的策略或行动的函数, 这是每个参与人最关心的东西; 6、均衡是所有参与人的最优策略或行动的组 合;均衡结果是指博弈结束后博弈分析者感兴趣 的一些要素的集合,如在各参与人的均衡策略作 用下,各参与人最终的行动或效用集合。 上述要素中,参与人、行动、结果统称为博 弈规则,博弈分析的目的就是使用博弈规则来决 定均衡。
30
四、动态博弈的特点
1.动态博弈的策略特征: 博弈方决策的内容也是决定博弈结果的关 键,不是博弈方在单个阶段的行为,而 是各博弈方在整个博弈中轮到选择的每 个阶段,针对前面阶段的各种情况作出 的相应选择和行为的完整计划,以及由 不同博弈方的这种计划所构成的组合。 这种计划就是博弈方的策略。
31
2.博弈方的非对策性
23
纳什均衡的正式定义
纳什均衡:有n个参与人的战略式 表述博弈G={S1 ,…,Sn ;u1, …, un},战略组合S*=(S1*,…,Sn*)是 一个纳什均衡,如果对于每一个i,Si* 是给定其他参与人S-i*=(S1*,…,S-1*, Si+1*…,Sn* )的情况下第i个参与人的 最优战略,即:ui(si*,s-i*)≥ui(siα,s*) 对任意S α∈S ,和任意的 I都成立。 i i i
10
2、从参与人对其他参与人的各种特征信息 的获得差异来分,博弈可分为完全信息博弈和不 完全信息博弈。
完全信息指的是每一个参与人对所有其他参 与人的特征,如策略集合及得益函数都有准确完 备的知识;否则就是不完全信息。 将上述两个角度的划分结合起来,我们就得 到四种不同类型的博弈,这就是:完全信息静态 博弈,完全信息动态博弈,不完全信息静态博弈 和不完全信息动态博弈。
20
在一个博弈里,如果所有参与人都有占优策略 存在,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。所以在囚徒 困境博弈里,{坦白,坦白}是占优策略均衡。 囚徒困境反映了一个深刻的问题,即个人理性与 团体理性的冲突。这给我们一个启示,我们学习博弈论, 也许更应该研究的是怎样设计一种制度,在满足个人理 性的同时,去争取达到“集体理性”。
21
2、严格劣策略的重复剔除
重复剔除严格劣策略”的思路如下:首 先找出某个参与人的严格劣策略(假定其存 在),把这个劣策略剔除掉,重新构造一个不 包含已剔除策略的新的博弈;重复这个过程, 一直到只剩下一个唯一的策略组合为止。这 个唯一剩下的策略组合就是这个博弈的均衡 解,称为”重复剔除的占优 均衡”。注意, 上述表述中强调了“唯一”这个词。也就是 说,如果重复剔除后剩下的策略组合不唯一, 那么该博弈就不是可通过重复剔除劣策略求 解的。 22
在信息的占有上,后行动者往往比先行动者更 占优势。但所获得的收益不一定比先行动者多。 这与单人决策是不同的。 3.策略的可置信性问题: 策略是博弈方自己预先设定的,在各个博弈阶 段针对各种情况所作的相应行为选择的计划, 本身没有强制力,且实施起来有一个过程。在 该过程中,根据自己的利益需要,他完全可以 改变这个计划,从而存在“相机选择”,产生 策略的可置信性问题。
4
1994年诺贝尔经济学奖授予了三位博弈论专家纳什、 泽尔腾和海萨尼。 1996年诺奖授予两位博弈论与信息经济学研究专家莫里 斯、维克瑞; 2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰 他们在柠檬市场、信号传递和信号甄别等非对称信息 理论研究中的开创性贡献。 2005年诺奖授予有以色列和美国双重国籍的罗伯特· 奥 曼和美国人托马斯· 谢林,以表彰他们在博弈论领域 作出的贡献。
34
3.子博弈精炼纳什均衡求法——逆向 归纳法求解
3
二、现代经济学与博弈论
从现代的观点来看,经济学是研究人的决策 行为的学问。 理性人是指有一个很好定义的偏好,在面临给 定的约束条件下能最大化自己偏好的人,不考虑竞 争对手的决策。 价格理论有两个基本假定:1、市场参与人的 数量足够多,从而市场是竞争性的;2、参与人之 间不存在信息不对称问题(完全竞争、完全信息)。 然而在现实生活中,这两个假设在许多情况下 是不能被满足。
13
(二)博弈的策略式表达
在博弈论中,一个博弈可以用两种不同 的方式来表达: 一种是策略式表达:另一种是扩展式表达. 策略式表达更适合于静态博弈,而扩展式 表达更适合于讨论动态博弈。
14
策略式表达又称为标准式表达,在这种表 达中,所有参人同时选择自己的策略,所有参 与人选择的策略一起决定每个参与人的得益。 值得强调的是,这里参与人同时选择的是 “策略”,而不是“行动”。 在静态博弈中,于参与人只选择一次,所以 策略就等同于行动了。而在动态博弈中,策略 是参与人在各个阶段的行动的全面计划。
15
更为准确地讲,战略式表述给出:
1 、 博 弈 的 参 与 人 集 合 : i∈Γ , Γ=(1,2,…, n); 2、每个参与人的战略空间:Si i = 1,2,3,…,n; 3、每个参与人的得益函数:ui(s1, …, si…,sn),i=1,2,3, …,n。 用G={S1,…,Sn;u1, …,un}代表战 略式表述博弈。
博弈论概述课件
1
第一节 博弈论的基本概念
一、市场竞争中的博弈 二、现代经济学与博弈论 三、博弈论的基本概念
2
一、市场竞争中的博弈
在现实经济生活中,许多产业市场是寡 头断市场。寡头垄断市场是指少数几家大厂 商生产一个产业中的全部或大部分产品,从 而形成对一个产业的控制的产业市场。 在分析寡头垄断市场中的企业决策行为 时,就必须把各种决策者之间的策略相互作 用纳入到经济模型中,这就是一种博弈分析。
3.纳什均衡
纳什均衡是完全信息静态博弈解的一般概 念,构成纳什均衡的策略一定是重复剔除严格 劣策略过程中不能被剔除的策略,即没有任何 一个策略严格优于纳什均衡策略。当然,逆定 理是不存在的。更为重要的是,许多不存在占 优策略均衡或重复剔除的占优策略均衡的博 弈,也存在纳什均衡。 下面,我们给出纳什均衡的正式定义。
32
四、子博弈精炼纳什均衡—— 动态博弈的纳什均衡
1.意义:
“子博弈精炼纳什均衡”, 用于区分动 态博弈中的“合理纳什均衡”与“不合 理纳什均衡”,将纳什均衡中包含有不 可置信威胁策略的均衡剔除出去,就是 说,使最后的均衡中不再包含有不可置 信威胁策略的存在。
33
2.子博弈精炼纳什均衡的定义
子博弈:一个扩展式表示博弈的子博弈G是由 一个单结信息集x开始的与所有该决策结的后 续结(包括终点结)组成的能自成一个博弈的原 博弈的一部分。 子博弈精炼纳什均衡定义: 对于扩展式博弈的策略组合S*=(S1*,…,Si*,…, Sn*) ,如果它是原博弈的纳什均衡;它在每一 个子博弈上也都构成纳什均衡,则它是一个子 博弈精炼纳什均衡。
24
指一组给定对手行为前提下对各 博弈方存在的最佳选择;在纳什 均衡状态下,只要其它参与者不 变换策略选择,任何单个参与者 不可能单方面通过变换策略来提 高他的所获支付。
25
(五)纳什均衡的多重性
在两人的有限策略博弈中,我们还可以简 单地用划线法来找出纳什均衡 在位者 进入者 进入 不进入 默许
相关文档
最新文档