博弈论课程概要(I)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
交通大学博弈论课程概要 (I)
周林
二零零四年十二月
主要教材:博弈论(Fudenberg & Tirole )
引言: 博弈论与决策论的差别. 例子:田忌赛马,换钱.
第一部分:完全信息策略式博弈 — 静态博弈
1. 策略式博弈的基本三要素:博弈者,策略空间,收益函数
2. 策略式博弈的基本三解法:
a. 占优策略. 例子: 囚徒困境,二价拍卖(Ebay , 易趣网)
b. 重复剔除劣策略. 例子:双寡头Cournot 竞争(线性需求)
c. Nash 均衡 (最重要的概念)
三种解法的合理性依次减低,而三种解法的适用范围(存在性)依次增加.
3. Nash 均衡存在性定理:如果策略空间是凸紧集,收益函数连续和自拟凹,至少存在一个Nash 均衡.
证明基本思路:最佳反应映射是从策略空间到策略空间的(上半)连续映 射(Berge 定理), 最佳反应映射的不动点就是Nash 均衡. 利用(Kakutani 不动点定理)Brouwer 不动点定理找出不动 点.(注意:这里的最佳反应映射不是一个压缩映射, 因 此不能用迭代法逼近不动点.)
推论:任何有限策略博弈至少有一个混合策略Nash 均衡.
4. Nash 均衡一般非唯一,非Pareto 最优. 可以通过外在信号机制改善收益. 相关均衡:公共信号仅将不同的Nash 均衡混合,私人信号更为有效.
作业:1.1,1.2, 1.5, 1.7, 1.10, 1.12, 2.2 (F&T ). 以及下面的题目:
A . 证明任何一个满足Nash 均衡存在性定理的对称博弈(首先给出一个合
理的定义)一定存在一个对称的Nash 均衡.
B . 画出下列博弈中所有的相关均衡生成的收益向量:
博弈者 2
博弈者 1 T W
第二部分:完全信息扩展式博弈 — 动态博弈
1. 例子:斯塔克伯格模型
2. 多阶段可观察行为博弈
0阶段: 每一个博弈者可以独立选择一个行动 i i A a ∈0.
1阶段: 在本阶段前的历史),,(00101n a a a h == 决定了本阶段每一个博
弈者可以选择的行动的范围)(1h A i . 每一个博弈者再独立选择 一个行动)(11h A a i i ∈.
…………
k 阶段: 在本阶段前的历史),,,(110-=k k a a a h 决定了本阶段每一个博弈者可以选择的行动的范围)(k i h A . 每一个博弈者再独立选择一个行动)(k i k i h A a ∈.
…………
博弈在K 阶段后中止.(我们允许K 为无穷,此时博弈可能进行无限阶段.)每一个博弈者获得的收益取决于博弈的全部历史
),,,(101K K a a a h =+: )(1+=K i i h u u .
(不一定每一个博弈者在任何一个阶段k 和历史k h 时都要做选择. 此时我们只要让1)(=k i h A 即可.)
3. 多阶段可观察行为博弈的策略式博弈表示
策略空间: 每一个博弈者的策略是一个完整的计划,包括了在所有 的阶段k 和所 有可能发生的历史k h 时会采取怎样的相应行动(想象一 本理想化的棋谱).
收益函数: 对于任何一个所有博弈者的策略的组合,我们可以逐阶段 的找出相应博弈者行动的历史,从而决定每一个博弈者获得的收益.
4. 多阶段可观察行为博弈的求解
对任何一个多阶段可观察行为博弈,我们首先可以找出它的策略式博 弈的Nash 均衡. 但是其中可能含有不合理的解,我们需要对Nash 均 衡进行挑选(精炼).
逆向归纳法: 仅适用于具有完美信息的有限阶段的博弈.
子博弈完美: 可以用于所有的多阶段可观察行为博弈.
一个多阶段可观察行为博弈G 在任何一个历史k h 后的延续本身 也是一个博弈. 我们称其为原博弈G 的一个子博弈, 记为)(k h G . 如果G 的一个Nash 均衡在它所有的子博弈上的限制也是子博弈 的一个Nash 均衡,我们称之为一个子博弈完美的Nash 均衡.
5. 子博弈完美Nash 均衡的判断条件:单阶段偏离原则*
6. 子博弈完美Nash 均衡的应用:囚徒困境的重复博弈, 有限和无限情况
7. 子博弈完美Nash 均衡的应用:Rubinstein 议价模型
作业:3.3,3.5, 3.7, 3.8, 4.5(a)(b), 4.8 . 以及下面的题目:
A . 证明:在囚徒困境的有限重复博弈中,任何一个Nash 均衡(不管是否
子博弈完美)的途径一定是每阶段 (不合作, 不合作).
B . G 是一个静态双人策略式博弈. 每个博弈者有两个选择变量:博弈者
一选择1x 和1y ,博弈者二选择2x 和2y . 假设()),(),,(*2*2*1*1y x y x 是G 的
Nash 均衡. 现在我们将G 变化为一个双人两阶段博弈G ~. 在阶段0时人博弈者一 选择1x ,博弈者二选择2x . 在阶段1时,当双方都观测到1x 和2x 之 后,博弈者一再选择1y ,博弈者二再选择2y . G ~的子博弈完美Nash 均衡同G 的Nash 均衡是否一样?请仔细解释.