博弈论管理知识讲义
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
⒈博弈论的发展 1944年,由冯•诺依曼和摩根斯坦恩合著的《博弈论
和经济行为》一书的出版标志着现代博弈论作为一种系统 理论的创立。
20世纪50年代,纳什创立了公理化的讨价还价理论 ,证明纳什讨价还价解的存在性,逐渐形成了以纳什非合 作博弈理论为核心的现代博弈论体系。20世纪60年代以 后,泽尔滕在纳什的研究基础上引入动态分析,海萨尼则 把不完全信息引入到博弈论中。
博弈论管理知识讲义
2020年4月26日星期日
博弈论用来分析所观察到的决策主体相互 影响时的现象,在给定的条件下寻求最优的解 决办法。本章主要介绍非合作博弈,非合作博 弈可分成四种情况:完全信息静态博弈、完全 信息动态博弈、不完全信息静态博弈和不完全 信息动态博弈。本章分析的重点在完全信息静 态博弈和完全信息动态博弈,分别给出纳什均 衡和子博弈精炼纳什均衡的详细讲解。
博弈可以划分为合作博弈和非合作博弈。合作博弈与 非合作博弈之间的区别主要在于人们的行为相互作用时, 当事人能否达成一个具有约束力的协议。如果能,就是合 作博弈;反之,则是非合作博弈。
二、博弈分析举例
⒈沙滩上的饮料销售商 为了争取更多的游客,两家销售商的销售位置又会开
始向中点移动,最终都将销售位置定在了中点处。
第二节 完全信息静态博弈
每一个参与人对所有其他参与人(对手)的特征、 策略空间及支付函数有准确的知识,而且博弈的参与人 同时选择行动或虽非同时但后行动者并不知道前行动者 采取了什么具体行动,这种情况下参与人的决策就是完 全信息静态博弈。
纳什对非合作博弈的主要贡献是在一般的意义上定 义了非合作博弈及其均衡解,并证明了均衡解的存在, 这一均衡就被称为“纳什均衡”。
20世纪70年代以后,经济学家开始强调个人理性。
⒉博弈论与主流经济学 博弈论进入主流经济学,反映了经济学发展的以下几
个趋势:①经济学研究的对象越来越转向个体,放弃了一 些没有微观基础的假定;②经济学越来越转向人与人之间 竞争与合作的研究,特别是经济学注意到理性人的个人理 性行为可能导致的集体非理性;③经济学越来越重视对信 息的研究。
1/2 1/4
A Ⅰ
1/2
1/2
3/4
B
两家销售商的初始位置
1/2
1/2
3/8 1/2 5/8
A
B
Ⅲ 销售商B的位置移动
9/16 3/8
A Ⅱ
7/16 9/16 3/4
B 销售商A的位置移动
1×1/2 1/2
A、B
Ⅳ 两家销售商的最终位置
图10-1 博弈分析举例:沙滩上的饮料销售商
⒉掷币游戏 A、B两个小孩玩掷币游戏,两人各拿出一枚硬币抛
⒊囚徒困境 囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别
被关在不同的屋子里审讯。表10-1给出了囚徒困境模型的 表述。每个囚徒都有两种选择:坦白或抵赖。表中每一格 的两个数字代表对应两个囚徒选择组合下各自的刑期。
囚徒A
表10-1 囚徒困境 囚徒B
坦白 抵赖 坦白 -8,-8 0,-10 抵赖 -10,0 -3,-3
掷在地面上,要么正面朝上,要么反面朝上。 ①都同为正面或反面朝上,A赢得B一枚硬币; ②一正面一反面朝上,A输给B一枚硬币。 这个例子中,两个小孩各自得到的结果(赢得一枚硬
币或者输掉一枚硬币),不仅取决于自己掷币的后果,也 取决于对手掷币的后果,双方决策的互相影响构成博弈。
在这个博弈中,一方所得正是其他方所失,这种博弈 称为零和博弈。
一、博弈的策略式表述
博弈可以采用两种不同的方式来表述,一种是策略式 表述,一种是扩展式表述。从理论上讲,这两种表述形式 几乎是完全等价的,但策略式表述更适合于分析静态博弈 ,扩展式表述更适合于分析动态博弈。
⒈策略式表述 n个参与人;说明每个参与人都有哪些策略;每个参
与人都选定一种策略时,每个参与人的支付水平(获得 的效用)是多少。根据上面给出的三要素,策略式表述 的博弈就是:
⑥结果:是博弈分析者感兴趣的所有东西,如均衡 策略组合、均衡支付组合等。
⑦均衡:是所有参与人的最优策略的组合。
四、博弈的分类
表10-2 博弈的分类及对应的均衡概念
信息
行动顺序静态动态 Nhomakorabea完全信息
完全信息静态博弈 完全信息动态博弈
纳什均衡
子博弈精炼纳什均衡
不完全信息
不完全信息静态博弈 不完全信息动态博弈 贝叶斯纳什均衡 精炼贝叶斯纳什均衡
⑤支付:在博弈论中指一个特定策略组合下参与人 得到的确定效用水平,或者是指参与人得到的期望效用
水平。支付是博弈参与人真正关心的东西。在一个策略 组合下,所有参与者的支付就构成了一个支付组合。在 囚徒困境模型中,如果两囚徒的策略组合为(抵赖,坦 白),那么囚徒A的支付为-10,囚徒B的支付为0,两囚 徒的支付组合为(-10,0);如果两囚徒的策略组合为 (坦白,坦白),那么囚徒A和囚徒B的支付均为-8,两 囚徒的支付组合为(-8,-8)。
③信息是参与人在博弈中的知识,特别是有关其他 参与人(对手)的特征和行动的知识。在囚徒困境模型 中,两囚徒的信息是都知道自己和另一囚徒在选择坦白 和抵赖的不同组合时面对的处罚。
④策略:是参与人在拥有既定信息情况下的行动规 则,它规定参与人在什么时候选择什么行动。一个参与 人的所有可选择的策略的集合就是这个参与人的策略空 间。如果每个参与人选择一个策略,就构成一个策略组 合。
三、博弈的要素
博弈的要素包括参与人、行动、信息、策略、支付 、结果和均衡,其中,参与人、策略和支付是描述一个 博弈所需要的最基本的要素,参与人、行动和结果统称 为博弈规则。
①参与人:指一个博弈中的决策主体在囚徒困境模 型中,有两个参与人,即“囚徒A”和“囚徒B”。
②行动:是参与人在博弈的某个时点的决策变量。 在囚徒困境模型中,囚徒A、B都只有两种行动可供选择 ,即“坦白”和“抵赖”。
第一节 博弈论概述
博弈论:用来分析所观察到的决策主体相互影响时的 现象,在给定的条件下寻求最优的解决办法。 一、博弈论的发展
20世纪40年代博弈论思想体系初步建立,经过50年 代的理论发展,博弈论在60年代逐步走向成熟。20世纪 70年代中后期以后,随着博弈论在经济分析领域内的广 泛和成功应用,博弈论也逐步进入主流经济学的体系。