《博弈论前沿专题》Word版教案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2011-2012学年第二学期《博弈论前沿专题》Word版教案
《第一章预备知识(1)》
1 博弈论学科的研究对象:a 博弈论研究冲突与合作
b 理性的个体或群体间的冲突与合作
c 相互影响的决策理论(罗伯特·奥曼Robert J. Aumann)
2 博弈论(Game Theory)学科的产生和发展:
(1)作为一门学科始于1944年冯·诺伊曼(Von Neumann)和摩根斯坦(O. Morgenstern)的“Theory of Games and Economic Behavior”一书。
(2)50年代初天才数学家纳什(J. Nash)证明了非合作博弈稳定解的存在性,纳什均衡和一般均衡一起成为经济学两个基石。
(3)泽尔腾(1965)提出求解动态博弈问题的子博弈均衡概念;
(4)海萨尼(Harsanyi,1967)提出求解不完全信息博弈问题的海萨尼转换,以及对于不完美信息博弈问题的贝叶斯均衡概念;
(5)90年代以来博弈论的3个发展动向:合作博弈理论(cooperate GT)、演化博弈(evolutionary GT)、实验博弈
3 古典经济学中“理性经济人”内涵:
(1)“自利”。
追求自身利益是根本动机,同时利他。
(2)“理性行为”
4 西蒙的“有限理性”概念:(1)经济学家西蒙(1976)认为,经济行为人由于:人类认知能力的限制;未来预测不确定性;多样化的目标追求,最优解是根本达不到的,提出了“有限理性”(bounded rationality)(2)具有有限理性的个体决策者,只能进行次优选择--追求较满意的目标。
5 博弈论中“理性”概念的内涵:
(1)目标理性(主观理性):参与者追求自身利益的最大化(经济学理性的内涵)
(2)过程理性(具有理性的能力):给定参与者对外部环境的信念后最大化自己的报酬,即“前后一致的”做出选择.可以分为两个推理步骤:
a 认知理性(cognitive)——参与者对相关环境可获得的信息与形成的信念之间的一致性,即参与者具有对相关环境形成信念的能力;
b 工具理性(instrumental)——参与者对外部给定的机遇与固定的偏好之间的一致性,即参与者具有从既定的信念推导出采取相应策略的能力。
6 贝叶斯决策:
(1)先由过去的经验或者专家估计获得即将发生事件的事前先验概率;
(2)根据调查或者试验得出的条件概率,利用贝叶斯公式,计算事后的后验概率。
《第二章预备知识(2)》
1 博弈中均衡(纳什均衡)的不同理解:
(1)观点1:参与者们采取的最佳应对策略一致同意达到的结果,其具有“可自我实施”(self-inforcement)的特征(即:独自偏离均衡策略不会带来更好结果)。
该观点认为,均衡是一种结果。
(2)观点2:博弈均衡,当且仅当每一个参与者对所有参与者的行为有正确的预期。
该观点认为,均衡是一种信念。
(3)观点3:该观点认为,均衡是一种规则。
在“理性”假设下,该三种定义是等价的。
2 选择(selection)与精练(perfection)
(1) 选择问题:在非合作博弈中,一些威胁和承诺是不可信的,如何选择那些能够实现一致预期的均衡结果;
(2)精练问题:对于博弈存在多重均衡的情况,如何判断哪些均衡更有可能实现。
3 Nash在其博士论文“Non-cooperative games”(1950年)给出Nash均衡的两种解释:
(1) 是“理性主义”的、内省的、演绎的传统解说——均衡是通过理性的参与者进行严密的逻辑演绎推理得到的,对参与者的理性能力有较高要求(传统博弈分析)。
(2) 是学习的、归纳的、演化的解说——当时没有很好的方法构建数学模型(国际上90年代兴起演化博弈理论)。
4 合作博弈:参与者之间的协议是有完全约束力并能够实施的,即外生给定的。
合作博弈研究的主要问题:如何实现有约束力的协议的参与者之间无冲突的串谋?
5 完美信息(perfective information)——参与者在选择行动时了解以前的历史,并且双方没有同时行动。
完备信息(complete information)——参与者对博弈的信息是否完全了解,又称完全信息。
当各个要素(参与者、规则、得益、策略)都是共同知识时,为完备信息。
《第三章传统博弈理论的简介》
1 传统博弈理论的研究思路:参与者“完全理性”假设下,通过推理演绎达到均衡化过程。
均衡是瞬间实现的。
2 纳什均衡(Nash Equilibrium,简记NE)的理解:参与者可以直接交换信息并一致同意选择某一策略,虽然这些口头协议无法强制实施,但是每个参与者单独偏离却不会带来更大收益,因此该策略组合是自动实施的(self-enforcing)。
3 纳什均衡的无效率问题:囚徒困境
在非合作博弈框架内的解决途径?——博弈重复进行的过程中产生合作行为。
其它的一些途径包括声誉效应、互惠机制、利他主义行为、空间网络上的演化博弈等
4 无限次重复博弈的分析思路;在无限次重复博弈中,考虑到时间价值,引入贴现系数δ,这样总收益将是一个有限数加以比较。
5如何理解无限次重复博弈的无名氏定理(民间定理)?对于原博弈具有唯一NE(如囚徒困境)的无限次重复博弈,可以设计出具有可信威胁的触发策略,如果参与者比较看重未来长期合作的收益(贴现系数δ足够大),就可以达成合作结局,摆脱囚徒困境。
6 动态博弈的核心问题:为了影响对方下阶段的行动,作出一些威胁或承诺。
但这些威胁或承诺是否可信?
7 子博弈完美的基本思想:
(1)动态博弈中,一个纳什均衡策略的每一个子博弈都是纳什均衡,则该均衡策略是子博弈完美纳什均衡;
(2)其对于双方理性能力的要求是基于“共同知识”,因此在NE的基础上(可自我实施的稳定均衡),依据反向归纳法进一步剔除那些不可信的威胁和承诺。
(3)由于动态博弈的核心问题是“可信性”,因此子博弈完美均衡是求解动态博弈问题的基本均衡概念。
8 不完全信息博弈的处理方法:
(1)海萨尼转换(Harsanyi’s procedure),引入一个神秘的“自然”,其事先决定了参与者的各种可能类型,以及每种类型发生的概率。
注意:每个参与者的真实类型只是他本人的私人信息;但是各种可能的类型和相应概率,却是共同知识。
由此,可将不完备信息转化为完备但不完美信息。
(2)进而,通过贝叶斯决策,可以得到不完美信息下分析方法。
9 计算要求:掌握求解静态博弈的混合策略均衡;动态博弈的子博弈完美纳什均衡;
重复博弈的均衡路径求解
《第四章不完全信息博弈和信息经济学(1):道德风险和激励理论》
1 信息经济学的研究对象:以参与者不对称信息为基本出发点,分析不对称信息对效率的损害,以及怎样设计可能的机制减轻这种损害。
2私人信息(private information):订立契约或执行过程中只有自己知道的信息。
其造成了交易双方的不对称信息。
公共信息(public information):大家都可以观察到的信息。
3 委托人和代理人:交易过程中具有私人信息的一方称为代理人(agent),处于信息劣势的一方称为委托人(contract)。
不对称信息的交易过程即为委托人与代理人签订某种契约的过程。
4 道德风险(moral hazard):由于委托人无法简单的要求代理人根据其利益采取相应的行动,因此代理人根据自己喜好采取有损委托人利益的行动(又称为签订契约后隐藏行动问题)。
其中,一种情况是代理人的行动无法被观察;另一种情况是观察到代理人的行动后无法证实违背合同。
5逆向选择(adverse selection):代理人在交易前谎报自己的真实信息,从而谋取更大利益。
由于委托人降低了对代理人水平的预期,造成高质量的代理人退出市场,交易减少,效率下降(又成签约前的隐藏信息问题)。
6委托-代理模型:(1)参与约束(Participation Constraints):代理人接受合同所能获得的最低效用,应该大于市场的保留效用。
(2)激励相容约束(Incentive-compatibility Constraints):在委托人无法观察代理人行动时,合同设计必须满足代理人付出较高水平的努力获得的效用,大于偷懒的效用。
此时代理人的激励和委托人目标是相容的。
各种激励方案,必须同时满足代理人的参与约束和激励相容约束。
(3)委托人选择的最优激励方案,目标使得委托人的期望收益最大化。
7 委托—代理理论的优缺点:
(1)优点:给定外部环境下,适用于分析在信息不对称条件下,哪一种激励兼容的契约安排能够成为对环境和激励约束的次优反应。
(2)局限性:
一是模型解对技术环境、参与者目标函数的参数、代理人参与约束的外部制度环境的设定非常敏感;
二是适用于特定的由技术唯一决定的制度环境中,未能考虑政治、文化、惯例等其它因素。
《第五章不完全信息博弈和信息经济学(2):逆向选择和信息甄别》
1 阿克罗夫(Akerlof)在其1970年发表的《柠檬市场:产品质量的不确定性与市场机制》中举了二手车市场的案例。
2 考虑劳动力可以通过接受教育发送信号的情况,分离均衡概念的涵义:是指均衡状态下,不同类型的代理人选择不同的观察指标(信号)最优水平,从而委托人能够加以区分。
3 不同信息条件下的效率比较:
(1) 完全信息下,企业不需任何成本,直接观察到两种类型的劳动力;
(2) 不完全信息下信号发送达到分离均衡时,企业也能区分两种类型的劳动力,但是高素质劳动力需要付出一定的教育成本,效率损失;
4 信息甄别概念:在不完全信息下,委托人设计特定的契约对不同类型的代理人进行筛选。
5 计算要求:作图和计算分析信号发送的混同均衡和分离均衡临界值。
《第六章不完全信息博弈和信息经济学(3):机制设计理论与显示原理》
1 机制设计理论的研究对象:为了达到某种理想的目标,而需要设计什么样的博弈规则(机制)来实现?其中所谓最优的机制,是从机制设计者角度而言最好的均衡结果。
2设计者的约束条件:
(1) 首先,不能有任何强迫(参与约束,或个人理性约束);
(2) 其次,参与者只根据自身利益最大化采取相应行动(激励相容约束)
3 机制设计的过程:
(1) 委托人设计一个机制(或契约、激励方案),即博弈规则;
(2) 代理人接受或拒绝该机制;
(3) 接受机制的代理人进行由机制所确定的博弈。
4 机制设计的目的:由于不完全信息下的均衡结果存在着福利损失,机制设计理论的一个重要目的:寻求使这种福利损失最小的机制
5 显示原理:任何一个说谎话机制(non-truth-telling)下的潜在交易达到的均衡结果,都可以被一个说真话的机制所取代。
显示原理(revelation principle)能够大大缩小我们的考察范围:当代理人拥有私人信息可以说谎时,根据显示原理,搜寻最优机制的范围缩小为那些说真话的机制即可。
《第七章不完全信息博弈和信息经济学(3):招标和拍卖》
1拍卖和招标(auction):把出售物品称为拍卖,把为了发包一项工程或提供一项服务的交易活动称为招标,即花钱购买服务。
两者区别:拍卖品已经存在,信息比较完全,因此由出价高者获得;招标是未完成的工程或服务,涉及到未来的不确定性,除了价格低廉外,还要考虑企业实施的承诺和企业信誉等因素。
两者共同点:通常标的物潜在价值都比较大;市场上只有单方向的竞争,即潜在的买主和投标人之间;一般情况下,买主对标的物的估价(保留价格)是私人信息,卖主或招标人不知道。
2 独立私有价值拍卖(individual private value auction):每个参与者都知道自己对拍卖品的估价,但是不知道别人的估价,而且每个买主是相互独立的(即拍卖时候不相互影响,不勾结)。
如艺术品
3 公共价值拍卖(common value auction):拍卖品的价值对所有买主都是相同的,但是仍不确定具体数额。
4 根据拍卖规则,拍卖的分类:
(1)英国式拍卖(English auction):一种升价的公开喊价拍卖,买主不断的提高竞拍价格,直到没人愿意出更高价钱为止。
具有“说真话”激励。
(2)荷兰式拍卖(Dutch auction):一种降价的公开喊价拍卖,拍卖主持人先提出一个很高的价格,然后不断降价,直到有人愿意接受。
(3)密封第一价格拍卖(first price sealed bid auction):买主向拍卖人递交密封的出价,由出价最高者赢得交易,付出所出价格。
(4)密封第二价格拍卖:买主向拍卖人递交密封的出价,由出价最高者赢得交易,但是只需要付出第二高的价格。
该拍卖制度为了便于分析拍卖理论,由维克瑞(Vickrey,96诺奖得主)1961年提出,又称维克瑞拍卖(Vickrey auction)。
具有“说真话”激励。
5 实际拍卖设计面临的一些问题:参与者合谋;进入阻挠和掠夺;保留价格过低等。
《第八章讨价还价和合作博弈理论》
1讨价还价问题的特点:
(1) 各方都面临共同的结果集合(即包含各种可能的谈判方案);
(2) 参与者在讨价还价过程中不会考虑那些比现状更糟糕的结果(即使谈判失败,也会维持现状而不会变得更差);
(3) 至少有一个讨价还价的结果是各方都有利可图的。
2讨价还价问题的纳什解法:不考虑具体讨价还价过程,现假定有一个裁判者,其效用偏好(即反映了该问题的一种解法)在图形上表现为无差异曲线: u (s )=u 1(s )·u 2(s ),该无差异曲线与效用配置集U (B )的切点N 即为讨价还价问题的纳什解。
σN (B )={ s ∈arg max [u 1(s )- u 1(d )]·[u 2(s )- u 2(d )]}
3讨价还价问题的解法的基本要求(公理化体系):
(1)帕累托最优:讨价还价问题的解不会是严格劣势的结果
(2)不相关选择项的独立性
(3)线性变换无关:讨价还价问题的解与效用函数的线性变换无关
(4)对称性要求:如果讨价还价双方的实力是相同的,那么任何合理的解法应该赋予双方同样的效用。
4讨价还价问题按比例分配的K-S 解法(Kalai 和Smorodinsky ,1975):
(1) 首先找出参与者在讨价还价问题中所能获得的各自最大效用;
(2) 将“最大效用组合点”与谈判破裂点连线,称为K-S 线;
(3) 该直线与效用配置集的交点,即为该方案的K-S 解。
5讨价还价问题的“平均主义”解法:K-S 线换成了固定的45度线。
伦理上考虑,无论初始条件如何,双方的分配结果绝对平均。
6讨价还价问题的“效用主义”解法:假设讨价还价双方能够形成总效用u 1(s )+u 2(s ),即将纳什解法 的双曲型无差异曲线换成了直线型。
只关心双方总效用的最大化
7 计算要求:掌握NASH 解法和K-S 解法。
《第九章 演化博弈理论》
1演化博弈理论群体参与者的“有限理性”基本假设的内涵:
(1)惯例行为(inertia ):由于参与者变更策略存在着成本,因此大多数人按惯例采取行动
(2)决策上的“近似眼”(myopia):当少部分参与者变更策略时,总是以现有策略状态作为已知条件进行分析,而不具有预测能力
(3)试错法的尝试行为(trial and experiments):少部分具有冒险精神的参与者并不拘泥于最优策略,而是尝试采取其它各种策略。
2 演化博弈理论的分析对象:社会经济系统中有限理性的群体参与者通过各种具体的动态
学习模仿过程,如何达到稳定的均衡状态。
3 复制动态(replicator dynamics ):是最常见的一种动态过程:每一个参与者只代表某一
特定的同类群体,其长期坚持采用某种纯策略si ,采用某种策略的群体比例θi 的增长率d θi /dt 是此策略效用u (si )与群体平均效用差的严格增函数()()()i i t i t t t u s u θθ=⋅-⎡⎤⎣⎦。
4 演化稳定策略(ESS ,evolutionary strategy stable )。
ESS 是演化博弈的核心概念,反映
均衡解的稳定性状态:对于非常小的正数ε,所有σ≠σ*,满足:(,(1))(,(1))u u σεσεσσεσεσ***-+>-+,即对于群体中很小比例ε的突变行为σ ,采取σ*策略将获得更高收益, σ*策略即为演化稳定策略。
涵义:在一个群体处于Nash 均衡状态(σ*, σ*)下,当少数变异者持有变异策略σ入侵时,侵
略将被击退,原均衡(σ*, σ*)保持不变.
5演化均衡EE (evolutionary equilibrium)的概念:不同于静态的ESS均衡概念,演化均衡EE为动态演化方程的稳定性概念,即:动态演化方程具有局部渐进稳定的均衡点。
6传统(古典)博弈
(1)基本特点:假定参与者在信息收集、预期形成、后果推断和决策上是完全理性的,但是这种共同预期是如何形成的未加说明。
(2)适用范围:侧重于人类的演绎推理能力,可分析规则的人为设计(如机制设计理论)。
7演化博弈
(1)基本特点:假定参与者理性是非常有限的,在行动上被惯例的惰性和简单模仿所驱使,但是无法保证均衡结果的收敛。
(2)适用范围:侧重于人类以观察为基础的归纳能力,可以分析以惯例、习俗体现的规则的自发演化。
8 计算要求:会求解基本的演化稳定策略。