第七章 博弈论初步
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
纳什均衡是完全信息静态博弈解的一般概念,也是所有其他类型博 纳什均衡是完全信息静态博弈解的一般概念, 弈解的基本要求. 弈解的基本要求. 本节先讨论纳什均衡的特殊情况,然后讨论纳什均衡的一般概念. 本节先讨论纳什均衡的特殊情况,然后讨论纳什均衡的一般概念.
河南科技学院
西方经济学 西方经济学微观第7章 7
河南科技学院
西方经济学 西方经济学微观第7章 9
囚徒困境
在一个博弈里,若所有参与人都有占优策略存在, 在一个博弈里,若所有参与人都有占优策略存在,则占优策略均 衡是可以预测到的唯一均衡, 衡是可以预测到的唯一均衡,因为没有一个理性的参与人会选择 劣策略. 劣策略. 在囚徒困境的博弈里,(坦白,坦白)是占优策略均衡. ,(坦白 在囚徒困境的博弈里,(坦白,坦白)是占优策略均衡.
河南科技学院
西方经济学 西方经济学微观第7章 11
河南科技学院
西方经济学 西方经济学微观第7章 3
博弈论的基本概念
③支付(Payoff)(支付函数与支付矩阵):博弈论中,可用数值 支付( )(支付函数与支付矩阵):博弈论中, )(支付函数与支付矩阵):博弈论中 表示各局中人从博弈中所获得的收益或效用水平, 表示各局中人从博弈中所获得的收益或效用水平,该数值称为支 付. 支付依赖于各个局中人所作出的策略, 支付依赖于各个局中人所作出的策略,这种收益与策略的依赖关系 构成了支付函数 支付函数. 构成了支付函数. 参与博弈的多个局中人的收益可用一个矩阵或框图表示, 参与博弈的多个局中人的收益可用一个矩阵或框图表示,这种矩阵 或框图叫做收益矩阵 收益矩阵. 或框图叫做收益矩阵. 除此之外,博弈论中的基本概念还包括:行动,信息,结果和均衡. 除此之外,博弈论中的基本概念还包括:行动,信息,结果和均衡. 它们关系是:行动是局中人的决策变量; 它们关系是:行动是局中人的决策变量;信息是局中人在进行博弈 时有关其他局中人的特征和行动的知识; 时有关其他局中人的特征和行动的知识;结果是博弈分析者感兴趣 的要素的集合;均衡是所有局中人的最优策略或行动的集合. 的要素的集合;均衡是所有局中人的最优策略或行动的集合.
河南科技学院
来自百度文库
西方经济学 西方经济学微观第7章 10
二,重复剔除的占优策略均衡
在绝大多数博弈中,并不存在占优策略均衡.但在有些博弈中, 在绝大多数博弈中,并不存在占优策略均衡.但在有些博弈中,仍 可应用占优的逻辑找出均衡. 可应用占优的逻辑找出均衡.
案例: 智猪博弈" 案例:"智猪博弈" 猪圈里有两头猪(大猪和小猪),猪圈一头有一猪食槽,另一头安装 ),猪圈一头有一猪食槽 猪圈里有两头猪(大猪和小猪),猪圈一头有一猪食槽 另一头安装 着一个按制猪食供应的按钮,按一下钮, 个单位的猪食进槽, 着一个按制猪食供应的按钮,按一下钮,有8个单位的猪食进槽, 个单位的猪食进槽 但需2个单位的成本 两头猪有两种策略:按按钮和等待. 个单位的成本. 但需 个单位的成本.两头猪有两种策略:按按钮和等待.具体的 博弈支付和结果如下表: 博弈支付和结果如下表:
河南科技学院
西方经济学 西方经济学微观第7章 2
一,博弈论的基本概念
博弈论的基本概念包括:参与者,策略, 博弈论的基本概念包括:参与者,策略,支付 参与者( ①参与者(Player)或称局中人:指在博弈中选择行动以最大化自身 )或称局中人: 效用的决策主体.可能是个人或团体(如国家,企业等). 效用的决策主体.可能是个人或团体(如国家,企业等). ②策略或策略空间(Strategy):策略是局中人选择行动的规则,它 策略或策略空间( ) 策略是局中人选择行动的规则, 规定局中人如何对其他人的行动作出反应, 规定局中人如何对其他人的行动作出反应,即在每种可能的情况下应 该如何行动.它与行动不同,行动是局中人的决策变量. 该如何行动.它与行动不同,行动是局中人的决策变量.如"人不犯 我不犯人;人若犯我,我必犯人"是一种策略, 我,我不犯人;人若犯我,我必犯人"是一种策略,而"犯"与"不 是两种不同的行动,策略规定了什么时候选择" 犯"是两种不同的行动,策略规定了什么时候选择"犯"什么时候选 不犯" 局中人可选择的策略的全体构成了策略空间( 择"不犯".局中人可选择的策略的全体构成了策略空间(或策略 集).
1. 囚徒困境反映了个人理性与集体理性的冲突,个体理性选择 囚徒困境反映了个人理性与集体理性的冲突, 的结果(导致了集体的非理性)并非帕累托最优. 的结果(导致了集体的非理性)并非帕累托最优. 2. 该模型所体现的合作的不稳定性及其后果,可以解释寡头市 该模型所体现的合作的不稳定性及其后果, 场共谋的不稳定性. 场共谋的不稳定性.
河南科技学院
西方经济学 西方经济学微观第7章 4
二,博弈的类型
1,根据博弈者选择的策略,博弈论可划分为合作博弈与非合作博弈. 根据博弈者选择的策略,博弈论可划分为合作博弈与非合作博弈. 纳什( ),泽尔腾 纳什(Nash),泽尔腾(Selten)和海萨尼(Harsanyi) ),泽尔腾( )和海萨尼( ) 1994诺贝尔经济学奖获得者 的主要贡献在于非合作博弈方面, 诺贝尔经济学奖获得者) (1994诺贝尔经济学奖获得者)的主要贡献在于非合作博弈方面,而 且现在大多数经济学家论及博弈时,也主要是指非合作博弈. 且现在大多数经济学家论及博弈时,也主要是指非合作博弈. 合作博弈和非合作博弈的区别在于人们的行动为相互作用时, 合作博弈和非合作博弈的区别在于人们的行动为相互作用时,当事人能 否达成一个具有约束力( 否达成一个具有约束力(binding agreement)的协议.若有,就 )的协议.若有, 是合作博弈;否则就是非合作博弈. 是合作博弈;否则就是非合作博弈. 例如,两个寡头企业,如果他们之间达成一个协议, 例如,两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利 且各自按该协议生产,即是合作博弈. 润,且各自按该协议生产,即是合作博弈.其面临的问题是如何分享合 作带来的剩余.但若两个企业间的协议不具有约束力, 作带来的剩余.但若两个企业间的协议不具有约束力,即没有哪一方能 强制另一方遵守该协议,每个企业都只选择自己的最优产量(或价格), 强制另一方遵守该协议,每个企业都只选择自己的最优产量(或价格), 则是非合作博弈.另外,合作博弈强调的是团体理性,效率, 则是非合作博弈.另外,合作博弈强调的是团体理性,效率,公正和公 非合作博弈强调的是个人理性,个人最优决策, 平.非合作博弈强调的是个人理性,个人最优决策,其结果可能是有效 率的,也可能是无效率的. 率的,也可能是无效率的. 河南科技学院 西方经济学 西方经济学微观第7章 5
河南科技学院
西方经济学 西方经济学微观第7章 8
囚徒困境
囚犯B的策略
坦白
囚犯A的策略
抵赖 0,-10 -1,-1
坦白 抵赖
-8,-8 -10,0
在该博弈中,每个囚徒有两种可能选择的策略:坦白和抵赖. 在该博弈中,每个囚徒有两种可能选择的策略:坦白和抵赖. 显然,无论同伙选择什么策略,每个囚徒的最优策略都是 显然,无论同伙选择什么策略, 坦白" 选择坦白, 选择坦白时支付为-8, "坦白".如,B选择坦白,若A选择坦白时支付为 ,选 选择坦白 选择坦白时支付为 择抵赖时支付为-10,因而坦白比抵赖好;若B选择抵赖,A 选择抵赖, 择抵赖时支付为 ,因而坦白比抵赖好; 选择抵赖 坦白时的支付为0,抵赖时为-1,因而坦白比抵赖好. 坦白时的支付为 ,抵赖时为 ,因而坦白比抵赖好.即是 坦白" 的占优策略. 说,"坦白"是A的占优策略.同样,"坦白"也是 的占优 的占优策略 同样, 坦白"也是B的占优 策略. 策略.
一,占优策略均衡
通常情况下,每个局中人的支付是博弈中所有参与人策略的函数, 通常情况下,每个局中人的支付是博弈中所有参与人策略的函数,故 每个局中人的最优策略选择依赖于所有其他参与人的策略选择. 每个局中人的最优策略选择依赖于所有其他参与人的策略选择. 但在一些特殊博弈中, 但在一些特殊博弈中,一个参与人的最优策略选择可能并不依赖于其 他参与人的策略选择,即无论其他参与人选择什么策略, 他参与人的策略选择,即无论其他参与人选择什么策略,他的最优策 略是唯一的,这种最优策略被称为"占优策略"(dominant 略是唯一的,这种最优策略被称为"占优策略" strategy). ). 例:"囚徒困境":囚徒困境是博弈论中的经典案例. 囚徒困境" 囚徒困境是博弈论中的经典案例. 该故事讲的是,两个嫌疑犯作案后被警察抓住, 该故事讲的是,两个嫌疑犯作案后被警察抓住,分别被关在不同的房 间里进行审讯.警察知道两人有罪,但缺乏有力的证据, 间里进行审讯.警察知道两人有罪,但缺乏有力的证据,除非两人之 中有一个坦白.警察告诉每个人,他们的可选择的策略与支付如下表: 中有一个坦白.警察告诉每个人,他们的可选择的策略与支付如下表:
第七章 博弈论初步
一,博弈论概述 二,完全信息静态博弈 三,完全信息动态博弈
河南科技学院
西方经济学 西方经济学微观第七章 1
第一节 博弈论概述
1)1944:冯诺依曼和摩根斯坦《博弈论与经济行为》.人们之间的冲 ) 诺依曼和摩根斯坦《 : 诺依曼和摩根斯坦 博弈论与经济行为》 突可用数学进行分析.塔克:囚徒困境. 突可用数学进行分析.塔克:囚徒困境.纳什给出了博弈均衡的定 义及其存在性证明( 义及其存在性证明(1950,1951). , ). 2)60年代,迪布鲁和斯卡夫讨论博弈中的核与经济中的一般均衡之间 年代, ) 年代 的关系. 的关系. 3)分析重心转向市场上理性的但拥有有限信息的个人行为.泽尔腾关 )分析重心转向市场上理性的但拥有有限信息的个人行为. 完全性"的论文( 于"完全性"的论文(1965),哈萨尼关于不完全信息的论文 ) 哈萨尼关于不完全信息的论文 ),泽尔腾 (1967,1968),泽尔腾(1975) , ),泽尔腾( ) 博弈也叫对策( 博弈也叫对策(Game):它主要研究参与者在对抗性或竞争性的局势 ) 如何采取行动,作出最有利的决策及其相应的均衡问题. 中,如何采取行动,作出最有利的决策及其相应的均衡问题. 博弈论强调在既定约束条件下追求效用最大化 强调在既定约束条件下追求效用最大化( 博弈论强调在既定约束条件下追求效用最大化(服从微观经济学的一般 分析方法).同时,信息和时序问题成为博弈论的两个重要的分析工具. ).同时 分析方法).同时,信息和时序问题成为博弈论的两个重要的分析工具.
博弈的类型
game) 2,从局中人行动的先后顺序可划分为静态博弈(Static game)和动 从局中人行动的先后顺序可划分为静态博弈( 态博弈( game).静态博弈是指在博弈中, ).静态博弈是指在博弈中 态博弈(dynamic game).静态博弈是指在博弈中,局中人同时选 择行动或虽非同时行动但后行动者并不知道先行动者采取了什么具 体行动.动态博弈是指局中人的行动有先后顺序, 体行动.动态博弈是指局中人的行动有先后顺序,且后行动者能够 观察到先行动者所选择的行动. 观察到先行动者所选择的行动. 3,从局中人是否具有有关其他参与人(对手)的特征,策略空间及支 从局中人是否具有有关其他参与人(对手)的特征, 付函数方面的知识的角度, 划分为完全信息博弈( 付函数方面的知识的角度,可划分为完全信息博弈(game of complete information)和不完全信息博弈(game of ) 不完全信息博弈( incomplete information). )
河南科技学院
西方经济学 西方经济学微观第7章 6
第二节 完全信息静态博弈
完全信息指每个局中人对所有其他参与人的特征(策略空间, 完全信息指每个局中人对所有其他参与人的特征(策略空间,支付 指每个局中人对所有其他参与人的特征 函数等) 函数等)有完全的了解 静态指的是所有局中人同时选择行动且只选择一次 指的是所有局中人同时选择行动且只选择一次. 静态指的是所有局中人同时选择行动且只选择一次.