《第三章 传统博弈理论(1重复博弈)》
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大量情绪、直觉、性格、感觉 等非理性的主观心理行为
知识的未知状态、 不可预测性和多样性 等造成不同层次的有限理性
6
第三章 传统博弈理论的简介
第一节 传统博弈理论的研究范式
传统博弈理论的研究思路:参与者“完全理性”假设下,通过 推理演绎达到均衡化过程→均衡是瞬间实现的。 在完全理性假设下,人们行为类似于按照既定程序运行的计算机 (即给定博弈的环境和规则,严格按照策略执行)。 回忆:“完全理性”的内涵
合作 合作博弈 信息
完全完美信息博弈
不完全或不完美信息博弈
机制设计理论、信息经济学
静态博弈、动态博弈、重复博弈
4
第三章 传统博弈理论的简介
主要内容:
第一节 第二节 第三节
传统博弈理论的研究范式; 纳什均衡的定义; 纳什均衡的无效率问题:重复博弈和无名氏定理;
第四节 纳什均衡的无效率问题:相关均衡和信号装置; 第五节 纳什均衡的多重性问题:静态博弈和焦点均衡; 第六节 纳什均衡的多重性问题:动态博弈和子博弈完美均衡;
长江源地区的草场正在退化
过度放牧,草场退化,缺草,西部的羊互相啃 食羊毛,牧民无奈只得给羊穿上衣服,但是裸 露在外面的羊毛还是被别的羊啃秃了 18
[资料夹]公地的悲剧:来自格鲁吉亚的例子
“该国大部分地区,每天供电4小时,入夜后村庄一片漆黑,点煤油灯照明。
“交上来的电费只有1/3,人们向查电表的人行贿,后者会把部分贿金交给 上司,上司再依样层层上交。人们花在煤油灯上的钱比交的电费还多。由于总 统的侄子控制着国家的煤油业,实行改革根本不可能。 “人人都知道老老实实地做事最终将一事无成”
中国象棋大师许银川 PK 浪潮天梭服务器 工具理性 目标理性 采取相应策略
——既没有冲动、情绪、直觉等非理性的因素,也不会像有限理性那样犯错误。
认知理性 相关环境
信念
最大化目标
2006年08月15日,浪潮杯”中国象棋人机大战再次展开,两场对决中,均战成平局。7
第三章 传统博弈理论的简介
第一节 传统博弈理论的研究范式
举例:囚徒困境博弈中,双方都选择坦白策略是一个NE;
师生的上课时间。
9
第三章 传统博弈理论的简介
第二节 纳什均衡的定义和实现途径 囚徒 B 坦白P
囚徒A 坦白P 抵赖NP -8,-8 0,-10
抵赖NP -10,0
-1,-1
定义:策略式博弈(X1,…,X n;u1,…,u n)的一个策略组合( x1*,…, x n*)是纳什均衡,如果下式成立: u ( xi*, x-i* )≥ u ( xi, x-i* ) ,所有 xi∈ Xi都成立 如果上式取严格不等号,则为强NE。 分析方法:离散的策略空间中,采用划线法。例如囚徒困境中,
博弈专题讲座
(Economic Game Theory)
东北财经大学 数学与数量经济学院 刘德海
ldhai2001@
1
作业讲解
睡觉 偷窃 小偷 不偷
守卫
不睡觉 -P,0 0, 0
V,-D 0, S
小作业:求守卫睡觉的混合均衡概率??
偷窃 u小偷 pB V 1 pB P 不偷窃 u小偷 pB 0 1 pB 0=0
16
第三章
传统博弈理论的简介
第三节 纳什均衡的无效率问题
博弈论揭示出新古典经济学基本命题存在· 斯密,1776 ):
“我们的晚餐不是来自屠夫、酿酒的商人或面包师傅的仁慈之心,而
是因为他们对自己的利益特别关注。。。每个人都会尽其所能,运用自己 的资本争取最大的利益, 。。。但如此一来,他就好象被一只无形的手 引领,在不知不觉中对社会改进尽力而为。”
第三章 传统博弈理论的简介 第二节 纳什均衡的定义和实现途径
纳什均衡的存在性(Nash,1951):每一个有限博弈都至少有一 个NE,其中包括混合策略纳什均衡。 证明:采用不动点定理证明;也可以采用单纯形法的初等证明, 参见施锡铨著《博弈论》。 布劳威尔不动点定理:对于一个拓扑空间中满足一定条件的连续 函数f,存在一个点x0,使得f(x0) = x0。 举例:大商场等地方可以看到平面地图(相当于一个映射f),上 面标有”您在此处”的红点。这个点x0就是把实际地形映射到地图 的连续函数f(x0)的不动点。
认知理性 相关环境
信念
工具理性
采取相应策略
目标理性
最大化目标
——参考:刘德海.理性概念的内涵及其在博弈论学科体系中的地位 .《东北财经大学学报》 3
课前复习:《第一章 博弈论的理论框架》
博弈论的理论体系: 实证检验 实验检验 实验博弈 演化主义均衡分析 演化博弈 非合作博弈
理论建模
理论分析
均衡 理性主义均衡分析 (传统博弈)
点评:当博弈规则不允许参与者事先进行沟通,又没有外部力量 进行行动协调时,如果参与者理性程度很高,仍可以实现NE 均衡(此时等价于“理性预期均衡”)。
2006-3-7
14
第三章 传统博弈理论的简介 第二节 纳什均衡的定义和实现途径
第四种实现途径:演化主义 ——参与者“有限理性”假设下,在归纳学习过程中实现均衡化过 程 参与者仅具有有限的认知能力和计算能力,但是时间的重复过程 弥补了理性的不足。 (1)长期机制,如生物学基于基因遗传和变异的自然选择过程; (2)中短期机制,如社会中模仿、经验、惯例、试错等学习过程。 群体参与者中,每个个体观察对方的行动后,根据各种复制原则 进行复制。那些最有效率的策略将被大量复制,并淘汰那些表现 不佳的策略,最终达成稳定的分布状态。 点评:当博弈规则不允许参与者事先进行沟通,又没有外部力 量进行行动协调时,参与者理性程度又很低,只好在不断的犯错 2006-3-7 15 误中摸索尝试。
NE为(P,P)。
思考:如果策略空间是连续函数f(x),如何分析?
——求利润函数f(q)最大值:d f(q1,q2) / dq1 = 0,即古诺模型
10
第三章 传统博弈理论的简介 第二节 纳什均衡的定义和实现途径
第一种实现途径: 博弈前的串谋
过程:参与者在博弈前直接的沟通,达成一个没有约束力的协议, 然后开始单独行动——如果一致同意达到某个结果,那么可以预 期这个结果是可以自我实施的(self-enforcing),即NE。 举例:参加齐心协力跑比赛
(1)认知理性(cognitive)——具有对相关环境形成正确信念的能力;
具体要求:了解博弈结构和规则、“共同知识”(递推归纳法的基础)、贝叶斯理性等
(2)工具理性(instrumental)——具有从既定信念采取相应策略的能力
具体要求:具有计算推理、预见、记忆、分析判断的能力,不会犯错误(颤抖手均衡)等
偷窃 不偷窃 u小偷 u小偷
pB P V P
分析:守卫睡觉的均衡概率p*B与小偷被抓体罚P成正比,
与看管物品价值V成反比
2
课前复习:《第一章 博弈论中“理性”概念的内涵》
作为数学分析方法,传统博弈对参与者的“理性”要求非常苛刻:
目标理性(主观理性):追求自身利益最大化(经济学理性的内涵) 过程理性(具有理性能力):包括两个推理步骤
第七节 不完全不完美信息下的纳什均衡存在性:贝叶斯均衡;
5
第三章
传统博弈理论的简介
第一节 传统博弈理论的研究范式
博弈理论的研究对象:参与者互动过程中冲突与合作问题; 分析思路:
为了对人们的互动行为 加以模型化分析, 必须进行合理的理论抽象 实际行 为方式 的无序 化 博弈论的 “完全理性”概念
问题描述:帕累托效率结果为(-1,-1),可是一次性博弈的纳什 均衡却陷入了深深的“囚徒困境”中:(-8,-8)
合作行为是如何产生的?——20世纪人类未解决的难题 思考:在非合作博弈框架内的解决途径?打虎亲兄弟,上阵父子兵 ——博弈重复进行的过程中产生合作行为 囚徒A 坦白P 抵赖NP 囚徒 B 坦白P 抵赖NP -8,-8 -10,0 0,-10 -1,-1
2006-3-7
12
[资料夹]朝核问题和六方会谈
朝一核反应堆施工现场(02年8月7日)
朝鲜指控美国对其国家安全构成最大威胁,美国坚持朝鲜半岛无核化。 为解决问题,朝鲜一直要求与美国进行直接对话,并多次提议与美国签 订互不侵犯条约,以图获得外交承认;但美国坚持不直接与“流氓国家” 接触,要求朝鲜先行放弃核计划,并坚持采取多边对话解决。 中国外交穿梭,先2003年4月23日-25日,中、朝、美三方在北京举行了 三方会谈,中国作为中间人角色促成朝美双方进行直接沟通;然后8月份 进入六方会谈阶段。
——结论:市场机制下个体理性(自利)达到社会理性。
“囚徒困境” Prisoner Dilemma (A. W. Tucker,1950) ——结论:个体理性与集体理性的深刻矛盾,在个体理性假设 下,可能无法实现资源配臵的帕累托状态。
17
[资料夹]n人的囚徒困境:公地的悲剧
1968年美国生物学教授哈丁(Garrett Hardin)在《公地的悲剧》 (The Tragedy of the Commons)中讨论 了公共草场的问题:如果草 场是公共的,为了增加收入,每个牧民都希望增加自己的牲畜, 这将 带来过牧的问题,并导致草场退化,最终给所有的放牧人带来悲剧。
传统博弈理论的研究内容:
纳什均衡的存在性(Nash,1951) 纳什均衡的无效率及其解决途径:
——重复博弈,无名氏定理(Friedman,1971);
——静态博弈,相关均衡(Aumann,1974);
纳什均衡的多重性及其解决途径:
——静态博弈,焦点均衡( Schelling,1960);
——动态博弈,子博弈完美均衡(Selten, 1965);
问题:现实条件可能不允许参与者事前进行直接沟通,怎么办?
(1) 物质条件不允许直接沟通(参与者人数众多); (2) 双方进行对话的基本互信不足(朝鲜核问题六方会谈); (3) 博弈规则不允许参与者会面(司马相如和卓文君私奔)。 ——通过外部力量进行协调。 注:通过事前的串谋实现纳什均衡,改变了原博弈的信息集合。
其他资料:独立15年来,格鲁吉亚仍处于四分五裂的状态,腐败现象十分
19 年 ——资料来源:(英)卢茨·克莱维曼 著 《新大牌局——亚洲腹地大国角力内幕 》,新华出版社,2006
普遍。该国54%的人生活在贫困线以下,20%的人在国外打工。
第三章
传统博弈理论的简介
第三节 纳什均衡的无效率问题
纳什均衡的无效率问题:囚徒困境
2006-3-7 11
第三章 传统博弈理论的简介 第二节 纳什均衡的定义和实现途径
第二种实现途径: 引入外部实体进行协调 回忆:一般均衡理论中市场均衡价格的形成 假定市场有一个“瓦尔拉斯”拍卖商 假定存在一个虚拟的“纳什调节器”(Nashian regulator), 博弈前其向每个参与者提供一个均衡的策略组合。 例如:朝鲜核问题中国外交穿梭
07年3月,美国首席谈判代表希尔与朝鲜代表团团长金桂冠在日内瓦就朝鲜核计 划举行了为期两天的谈判。据美国首席谈判代表希尔称,朝鲜将全面公开其核计 划,并在年底前关闭所有核设施。
2006-3-7 13
第三章 传统博弈理论的简介 第二节 纳什均衡的定义和实现途径
第三种实现途径:理性主义 ——参与者“完全理性”假设下,通过推理演绎达到均衡化的过 程 根据博弈的完全理性假设,尤其是理性的共同知识假设,每 个参与者都能利用全部的信息,并且能够正确理解参与者之 间的相互作用,因此做出正确的预期。
在不完全(或不完美)信息下,纳什均衡的存在性;
——贝叶斯纳什均衡(Harsanyi,1967)
8
第三章 传统博弈理论的简介
第二节 纳什均衡的定义和实现途径 囚徒 B 坦白P 抵赖NP
囚徒A 坦白P 抵赖NP
-8,-8
0,-10
-10,0 -1,-1
纳什均衡(Nash Equilibrium,简记NE)的理解:参与者可以直接交 换信息并一致同意选择某一策略,虽然口头协议无法强制实施,但 是每个参与者单独偏离却不会带来更大收益。 双人策略式博弈的纳什均衡:策略组合( x1*, x2*) 是一个NE,当且 仅当x1*是x2*的最佳应对策略, x2*也是x1*的最佳应对策略,双方都 没有动机偏离,该策略组合是自动实施的(self-enforcing)。