11第十一章 对策论及其应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 7.考察一种投票对策:三个局中人A,B,C同时 投票给彼此,不能弃权,得到最多选票的当选。 如果没有一个人得到多数,则A当选。对应的支 付函数为: u ( A) u ( B) u (C ) 2
1 2 3
u1 ( B) u2 (C ) u3 ( A) 1 u1 (C ) u2 ( A) u3 ( B) 0
第十一章>>第一节
三、博弈的标准式表达
图11-1“囚徒困境”的收益矩阵
括号中第一个数字代表 局中人2的收益,第二 个数字代表局中人1的 收益,这个矩阵也被称 为支付矩阵,有时也被 称为双支付矩阵。
第十一章>>第一节
四、基本假设
• (1)博弈规则是共同知识(common knowledge)。
• (2)“局中人是理性的”是共同知识。
ui (s1, s2 , , si 1 , si, si 1, , sn ) ui (s1 , s2 , , si 1, si, si 1, , sn )
i 1 , Si 1 , , Sn 对其他参与者在其策略空间 S1, S2 , , S 中每一组可 (s1都成立。 , s2 , , si 1 , si 1 , , sn ) 能的策略
第十一章 对策论及其应用
L/O/G/O
• 讲授内容:
第一节 第二节 第三节 第四节 对策论的基本概念 纳什均衡 混合策略和纳什均衡的存在性 对策论案例
• 思考与练习
第十一章>>第一节
第一节 对策论的基本概念
第十一章>>第一节
一、构成对策论的三个基本要素
• 1.局中人(player)
– 局中人就是在一场竞争或对策中,根据自己的利益需要 来决定自己的策略的参与者。局中人可以是自然人,也 可以是企业、政府、社团和其他社会组织等。
– 古诺(1838)早在一个多世纪前就提出了纳什 均衡所定义的均衡(但是只是在特定的双头垄 断模型中)。他的研究成为对策论的经典文献, 同时也是产业组织理论的重要里程碑。本例只 讨论古诺模型中最简单的一种情况。掌握以下 内容:(a)如何把对一个问题的非正式描述 转化为对策论的标准表述;(b)如何计算对 策的纳什均衡;(c)反映存在唯一纳什均衡模 型的特点。
解:
Si
si
si Si
si*
* * * maxui (s1 , s2 , , si*1Leabharlann Baidu, si , si*1 , , sn )
第十一章>>第二节
一、纳什均衡的导出和定义
• 命题11.1:在n个局中人的博弈 * * * * G {S , S , , S ; u , u , , u } s ( s , s , , s 中,如果 是G的一个纳什 1 2 n) 均衡解,那么重复剔除严格劣策略法一定不会将 它剔除。 * G * 中,如果重复剔 * • 命题11.2:在n个局中人的博弈 s* (s1 , s2 , , sn ) 除严格劣策略法排除了除 之外的所有策 s* 略组合,那么 一定是该博弈唯一的纳什均衡解。
• 2.策略及策略集
– 策略型对策中有两种策略概念:一种为纯策略,简称为 策略。另一种策略概念为在纯策略基础上形成的混合策 略(mixed strategy)。
第十一章>>第一节
一、构成对策论的三个基本要素
• 3.支付函数
– 支付是指一局对策结束后,给每一个局中人带来的收 益,收益往往采用局中人的效用来表示。由于它是策 略组合的函数,所以也被称为支付函数,或收益函数。 通常用函数 u i 来表示第i个参与者的支付函数, (s1 , s2 , , sn ) ui (s1 , s2 ,即为参与者选择策略 , sn ) 时第i个参与者的 支付。
试求出这一局势中所有的纳什均衡。 • 8.试列举现实中应用了对策论方法的一些经济现 象,并对其中某一现象进行详细分析。
Thank You!
L/O/G/O
www.1ppt.com
第十一章>>第一节
二、对策论的分类
• 非合作博弈可以从两个角度来划分:
– (1)从时间角度来划分,即根据局中人行动的先后顺序, 分为静态博弈和动态博弈。 – (2)从信息方面来划分,即根据局中人对有关其他局中 人的特征、策略空间及支付函数等信息的掌握情况分为 完全信息博弈和不完全信息博弈。
第十一章>>第一节
三、博弈的标准式表达
• 【例11-1】囚徒困境(prisoners dilemma)
两个犯罪嫌疑人被捕并受到指控,被警方关在不同 的房间内审讯。他们面临的形势是:他们之间除非 一个人招认犯罪,否则警方并无充分的证据来证明 其有罪并判刑。警方对他们阐述了不同的行动会带 来的不同后果:如果两人都不招认,将均被判处2 个月;如果两人都招认,均被判处6个月;如果一 方招认而另一方不招认,招认的一方将马上获得释 放,不招认的一方被判处9个月。他们的收益矩阵 如图11-1:
思考与练习
第十一章>>思考与练习
• 1.试述决策论与对策论的区别与联系。
• 2.简述博弈的分类。 • 3.什么是策略的标准式?在策略的标准式中,什 么是严格劣策略,什么是纯策略纳什均衡? • 4.在下面的策略的标准式中,哪些策略不会被重 复剔除严格劣策略剔除?纯策略纳什均衡是什么?
思考与练习
第十一章>>思考与练习
第十一章>>第三节
• 三、纳什均衡多重性
– 纳什在1950年证明了在任何有限博弈中,都存 在至少一个纳什均衡。这也是纳什均衡的弱点 所在,它并不能保证唯一性,当存在多个纳什 均衡的时候,哪一个会成为参与博弈的局中人 理性选择的最终结果,这是问题的关键所在。
第十一章>>第四节
第十一章>>第四节
• 古诺双头垄断模型
• 5.请用画线法求出以下支付矩阵的纳什均衡。
思考与练习
第十一章>>思考与练习
• 6.丈夫喜欢看拳击,妻子喜欢看芭蕾舞。他们宁 愿在一起也不愿分开行动。下图是他们的收益矩 阵。本例有两种纳什均衡结果会出现,要么一起 去看拳击,要么一起去看芭蕾舞,请求出他们的 混合策略纳什均衡。
思考与练习
第十一章>>思考与练习
第十一章>>第一节
二、对策论的分类
• 对策论可以划分为合作博弈和非合作博弈,这两者 之间的区别主要在于局中人的行为相互作用时,局 中人能否达成一个具有约束力的协议,如果能,就 是合作博弈,否则就是非合作博弈。合作博弈强调 的是集体理性,强调效率、公平和公正;非合作博 弈强调的是个人理性和个人最优策略,结果可能是 有效率的,也可能是无效率的。
第十一章>>第二节
二、纳什均衡的应用
• 3.不存在纯策略的纳什均衡解 在有些对策局势中没有纯策略纳什均衡解,而只 有混合策略纳什均衡解,这就是需要在对策论 中引入混合策略概念的原因。
第十一章>>第三节
第十一章>>第三节
• 一、混合策略 • 二、纳什均衡的存在性
– 纳什定理(Nash,1950):在n个参与者的 标准式对策 中,如果n是有 G {S1 , S2i, , Sn也是有限的,则对策存 ; u1 , u2 , , un } 限的,且对于每个 , Si 在至少一个纳什均衡,均衡可能包含混合策略。
1 2 n 1 2 n
第十一章>>第二节
二、纳什均衡的应用
• 在各种对策局势中,纳什均衡解的数目不一定相 同,可分为以下几种情况:
– 1.存在唯一的纯策略纳什均衡解 通过剔除严格劣策略的方法得到最后唯一的一个策略, 这个唯一的策略就是唯一的纳什均衡解。 – 2.存在多个纯策略纳什均衡解 在某些对策局势中,纳什均衡解不是唯一的,而是存在 多个纳什均衡解,这种情况很常见。
过程,直到找到新的被优超策略为止。
第十一章>>第二节
第十一章>>第二节
一、纳什均衡的导出和定义
• 定义11.2:在n个参与者标准式博弈 中,如果策略组合 G {S1 , S2 , , Sn ; u1 , u2 , , un } * s 满足对任意一个参与者 i, 是他针对其他 ni * * * * * * * * (s1 , s2 , , sn ) ( s , s , , s , s , , s 1个参与者所选策略 1 的最优反应策略, 2 i 1 i 1 n) * * * (s1 , s2 , , sn ) 则称 是该博弈的一个纳什均衡,即
* * * * * * * * * * * u ( s , s , , s , s , s , , s ) u ( s , s , , s , s , s , , s ) i 1 2 i 1 i i 1 n i 1 2 i 1 i i 1 n 对所有 中的 都成立,亦即 是以下最优问题的
• (3)并且每个局中人在不确定下的效用函数都具 有期望效用函数性质。
第十一章>>第一节
五、优超(重复剔除严格劣策略)
• 定义11.1:在标准式的博弈 中,令 G {S1 , S2 , , Sn ; u1 , u2 , , un } 和 代表参与者 i 的两个可行策略。如果对其他参 Si Si 与者每一个可能的策略组合,i选择 的收益都小 Si Si 于其选择 的收益,则称策略 Si 相对于策略 是严格劣策略,即 Si
第十一章>>第一节
五、优超(重复剔除严格劣策略)
• 利用优超的概念,我们可以通过重复剔除被严格 优超策略的方法对对策局势求解,其方法是:为 每个局中人寻找被严格优超的策略,因为它不会 被局中人选择实施,所以只要找到它的严格优超 策略就可以将其从对策局势中剔除,从而得到一 种新的缩减后的对策局势。对这种局势重复上述
相关文档
最新文档