第十六章 对策论
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五篇-第十六章 对策论
2010-9-8
6/33
第一节
三、不同类型的对策
对策特点
(一) 合作对策与非合作对策 一 1. 按照局中人之间能否达成一个有约束力的 协议, 协议,对策可分为合作对策与非合作对策 2. 如果在一个对策过程中 , 局中人之间的协 如果在一个对策过程中, 承诺或威胁具有完全的约束力, 议、承诺或威胁具有完全的约束力,并能够 强制执行,称为合作对策, 强制执行,称为合作对策,否则称为非合作 对策
第五篇-第十六章 对策论 2010-9-8 4/33
第一节
对策特点
(三) 收益函数 三 1. 收益函数表明了局中人从对策中获得的收益 或效用水平, 或效用水平,它是所有局中人策略的函数 2. 收益函数通常可以用两种形式表示 : 一种是 收益函数通常可以用两种形式表示: 实物或货币收入的绝对数值或相对数值, 实物或货币收入的绝对数值或相对数值,另一 种是用局中人的效用 (四) 信息 四 1. 对策的信息是指局中人有关对策的全部知识 , 对策的信息是指局中人有关对策的全部知识, 包括局中人的特征和行动 2. 信息集是局中人在对策进行到某一点时 , 对 信息集是局中人在对策进行到某一点时, 于不同变量取值的全部知识之和
第五篇百度文库不确定性决策
第十六章 对策论
本章的学习要求与内容
本章要求掌握对策论的性质、 要素和类型, 本章要求掌握对策论的性质 、 要素和类型 , 求解完全信息和不完全信息对策均衡的方法, 求解完全信息和不完全信息对策均衡的方法 , 并了解进化对策论 本章分四节, 分别介绍对策特点、 本章分四节 , 分别介绍对策特点 、 完全信息 对策、 对策、不完全信息对策和进化对策
U A = ∑ a ( n 1) U n
n =1
第五篇-第十六章 对策论
2010-9-8
19/33
第二节
完全信息对策
此时, 局中人考虑的是所有未来收益的贴现值之和, 此时 , 局中人考虑的是所有未来收益的贴现值之和 , 而不是一次性的收益。如果A提出彼此抵赖的合作建议 提出彼此抵赖的合作建议, 而不是一次性的收益。如果 提出彼此抵赖的合作建议, 并威胁说: 如果你中途变卦, 我也将一直坦白, 并威胁说 : 如果你中途变卦 , 我也将一直坦白 , 对你 惩罚。 若施行威胁带来的重复对策贴现值之和, 惩罚 。 若施行威胁带来的重复对策贴现值之和 , 大于 不施行威胁的重复对策贴现值之和, 不施行威胁的重复对策贴现值之和 , 威胁变得可以置 信 相互合作, 若 A与B相互合作, 均一直抵赖, 可知在每一个子对策 与 相互合作 均一直抵赖, 的收益值为U 中 A的收益值为 1=U2=…=Un=…=-1, 设 a=0.9贴现值 的收益值为 , 贴现值 ∞ ( n 1) 之和为 U A = ∑ 0.9 (1) = 10
[例] 囚徒困境 例
这个对策的占优均衡就是(坦白,坦白) 这个对策的占优均衡就是 坦白,坦白 坦白
第五篇-第十六章 对策论 2010-9-8 13/33
第二节
完全信息对策
(三) 纳什均衡 三 1. 纳什均衡是指 : 当给定其他人选择策略的前提 纳什均衡是指: 每个人选择自己的最优策略, 下 , 每个人选择自己的最优策略 , 把所有局中 人选择的最优策略组合起来, 人选择的最优策略组合起来,就构成纳什均衡 2. 在“囚徒困境”中,策略组合 坦白,坦白 既 囚徒困境” 策略组合(坦白 坦白) 坦白, 是占优均衡, 是占优均衡,又是纳什均衡 [例1] 猜硬币模型 例 两个局中人都不存在占优 策略,也不存在占优均衡, 策略,也不存在占优均衡, 却存在纳什策略和纳什均衡
第五篇-第十六章 对策论 2010-9-8 16/33
第二节
完全信息对策
逆推法(backward induction) :在一般的有限 逆推法 次对策中,逆推法均可用于求解均衡问题, 次对策中 , 逆推法均可用于求解均衡问题 , 即 首先从对策树的末端开始, 首先从对策树的末端开始 , 求解末端的子对策 均衡, 均衡,然后将求出的均衡解取代该子对策 在完全信息动态条件下, 在完全信息动态条件下 , 如果原对策的所有子 对策均达到纳什均衡, 对策均达到纳什均衡 , 则称整个对策均衡为子 对策完美纳什均衡 承诺行动是指当事人使自己的威胁策略变成可 以置信的行动。不可置信的威胁, 以置信的行动 。 不可置信的威胁 , 则称空洞威 胁
第五篇-第十六章 对策论 2010-9-8 12/33
第二节
(二) 占优均衡 二
完全信息对策
1. 占优策略指的是:不管对策中其他局中人的策略 占优策略指的是: 是什么,对某一局中人来说, 是什么,对某一局中人来说,都是最优策略 2. 占优均衡就是所有局中人的占优策略组合起来, 占优均衡就是所有局中人的占优策略组合起来, 就构成占优均衡
第五篇-第十六章 对策论
2010-9-8
3/33
第一节 对策特点
二、对策要素
(一) 局中人 一 1. 局中人是指参与对策的直接当事人,他是对策 局中人是指参与对策的直接当事人, 的决策主体和策略的制定者。 的决策主体和策略的制定者 。 在不同的对策问 题中, 局中人的含义是不同的, 可能是个人, 题中 , 局中人的含义是不同的 , 可能是个人 , 也可能是团体或集团 2. 对策论要求局中人具有理性 (二) 策略集合 二 1. 策略集合是局中人可能采取的全部策略的集合 2. 每个策略集合至少应该有两种不同的策略
第五篇-第十六章 对策论
1 1
第一节
一、对策性质
对策特点
1. 对策论是研究理性决策主体间发生冲突时的决策 及其均衡问题, 及其均衡问题,即研究理性决策者之间冲突和合 作的理论 2. 对策论中个人决策同经济学中一样,都是在给定 对策论中个人决策同经济学中一样, 约束条件下追求效用或收益最大化, 约束条件下追求效用或收益最大化,但其约束条 件不尽相同 传统经济学中经济主体独自决策, 传统经济学中经济主体独自决策,既不考虑自己 的决策对他人决策的影响, 的决策对他人决策的影响,也不考虑他人决策对 自己决策的作用。而对策论里的对策, 自己决策的作用。而对策论里的对策,不仅依赖 于自己的选择,也依赖于他人的选择, 于自己的选择,也依赖于他人的选择,个人最优 选择是其他人选择的函数, 选择是其他人选择的函数,这就考虑了人们决策 的相互影响, 的相互影响,更接近于现实世界
第五篇-第十六章 对策论
2010-9-8
11/33
第二节
完全信息对策
一、完全信息静态对策
(一) 对策的标准形式 一 标准型对策的基本要素包括: 标准型对策的基本要素包括: 1. 对策的局中人名单(list of players) 对策的局中人名单 2. 每个局中人的所有策略单 每个局中人的所有策略单(list of strategies) 3. 每个策略组合所对应每个局中人的收益单 (list of payoff)
第五篇-第十六章 对策论 2010-9-8 10/33
第一节
对策特点
在非对抗性对策过程中, 在非对抗性对策过程中,局中人有各自不同 的收益值,局中人之间的收益或效用既冲突 的收益值, 又一致,具备达成某种均衡的可能。 又一致,具备达成某种均衡的可能。经济活 动中的很多对策问题都属于非对抗性对策, 动中的很多对策问题都属于非对抗性对策, 而非对抗性对策也就构成了经济对策论研究 的重点
第五篇-第十六章 对策论
2010-9-8
18/33
第二节
完全信息对策
[例] 无限重复囚徒困境 例 囚徒困境中重复进行无限次时假定 A,B均追求效用最大化,并用 均追求效用最大化, , 均追求效用最大化 U1,U2,…,Un,… 分别表示 在各 分别表示A在各 个子对策中获得的收益 A,B收益或效用的贴现系数为 , 收益或效用的贴现系数为 a,且a=1/(1+i) ,其中 为利率 其中i为利率 , A在所有子对策中所获收益的贴现值之和可 在所有子对策 ∞ 表示为
第五篇-第十六章 对策论
2010-9-8
7/33
第一节
对策特点
(二) 静态对策与动态对策 二 1.按照局中人决策时是否存在时间的先后次序, 按照局中人决策时是否存在时间的先后次序, 按照局中人决策时是否存在时间的先后次序 对策可分为静态对策与动态对策 2.如果局中人同时进行决策选择,或者虽非同 如果局中人同时进行决策选择, 如果局中人同时进行决策选择 时但后行动者并不知道先行动者采取什么具 体行动,称之为静态对策。当考虑时间因素, 体行动,称之为静态对策。当考虑时间因素, 对策需要多阶段或重复地进行下去时, 对策需要多阶段或重复地进行下去时,就称 为动态对策
第五篇-第十六章 对策论 2010-9-8 8/33
第一节
对策特点
(三) 完全信息对策与不完全信息对策 三 1. 按照局中人事先是否拥有其他局中人决策 方面的信息, 方面的信息,对策可分为完全信息对策与不 完全信息对策 2. 在完全信息对策中 , 每一位局中人都拥有 在完全信息对策中, 所有其他局中人的特征、 所有其他局中人的特征、策略集合及收益函 数方面的准确信息;在不完全信息对策中, 数方面的准确信息;在不完全信息对策中, 局中人只能了解上述信息中的一部分
第五篇-第十六章 对策论 2010-9-8 2/33
第一节
对策特点
3. 对策论的应用领域很多 , 包括政治 、 经济 、 对策论的应用领域很多, 包括政治、 经济、 军事、体育以及国际关系等多个方面。 军事、体育以及国际关系等多个方面。在经 济学中, 济学中,这种重视理性选择的相互依赖性的 思想, 思想,不仅构成了现代微观经济学的重要理 论,而且为宏观经济分析提供了重要的微观 基础
第五篇-第十六章 对策论 2010-9-8 9/33
第一节
对策特点
(四) 对抗性对策与非对抗性对策 四 在对抗性对策中, 在对抗性对策中,局中人的收益或效用完全对 一方所得必为另一方所失, 立,一方所得必为另一方所失,一方利益的增 加必然导致另一方利益的减少, 加必然导致另一方利益的减少,局中人收益之 和为零或常数。在非对抗性对策过程中, 和为零或常数。在非对抗性对策过程中,局中 人有各自不同的收益值, 人有各自不同的收益值,其和不等于零或常数 在对抗性对策中,如果局中人各方不管采取何 在对抗性对策中, 种策略,各自收益之和恒为零, 种策略,各自收益之和恒为零,则称之为零和 对策;如果各自的收益之和为常数, 对策;如果各自的收益之和为常数,则称之为 常和对策。 常和对策。否则称之为变和对策
第五篇-第十六章 对策论 2010-9-8 14/33
第二节
完全信息对策
第五篇-第十六章 对策论
2010-9-8
15/33
第二节
完全信息对策
二、完全信息动态对策
(一) 动态对策 一 [例]市场进入阻扰模型 例 市场进入阻扰模型 若为静态对策, 若为静态对策 , 从收益矩阵可 见存在两个纳什均衡: 进入 进入, 见存在两个纳什均衡 : (进入 , 合作) 不进入, 合作 与(不进入,斗争 不进入 斗争) 若为动态对策, 若为动态对策 , 根据逆向递推 的思路, 的思路 , 可剔除一个纳什均衡 (不进入,斗争 ,则动态对策 不进入, 不进入 斗争) 中各局中人理性选择的唯一纳 什均衡是(进入 合作) 进入, 什均衡是 进入,合作
第五篇-第十六章 对策论 2010-9-8 5/33
第一节
(五) 结果 五
对策特点
结果指的是局中人在对策完成之后, 结果指的是局中人在对策完成之后,其 感兴趣的所有要素的集合,如均衡策略组合、 感兴趣的所有要素的集合,如均衡策略组合、 均衡收益组合等 (六) 均衡 六 均衡是所有局中人最优策略的组合
第五篇-第十六章 对策论 2010-9-8 17/33
第二节
(二) 重复对策 二
完全信息对策
重复对策是一种特殊的完全信息动态对策, 重复对策是一种特殊的完全信息动态对策,指 同样结构的对策重复多次 重复对策可能是有限次的, 重复对策可能是有限次的,也可能是无限次的 重复对策的均衡结果,往往与一次性对策不同, 重复对策的均衡结果,往往与一次性对策不同, 有限次对策的均衡结果, 有限次对策的均衡结果,也与无限次重复对策 的均衡结果不同