博弈论中的经典分析及启示囚徒困境
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大 路 扑空,逃脱
捉住曹操,被捉
(2)扩展形式(博弈树)
诸葛亮 弃城 守城 攻城
司马懿 退兵
司 马 懿
诸 葛 亮 退兵
守城 弃城 守城 弃城
进攻
退兵 进攻
胜利
和
擒住 孔明
和
Fra Baidu bibliotek
被擒
被擒
逃脱
逃脱
(3)联盟形式(特殊函数形式)
4. 博弈的类别
博弈的分类表
行动顺序 静 信息 态 动 态 完全信息 动态博弈 不完全信息 动态博弈
结论: 一种制度安排要生效,必须是 纳什均衡。不满足纳什均衡要求的制 度没有意义 。
类似囚徒困境
应试教育 公共产品供给不足(修路、公 寓楼道 的路灯) 卡特尔的内在不稳定性产量限制、价格 限制)
商业诚信
乙
诚信
诚信 甲
10,10
欺诈
0,18
欺诈
18,0
3,3
此博弈的纳什均衡为(3,3)
交通规则
乙
坦白 坦白 抗拒
甲
抗拒
-5,-5
0,-8
-8,0
-1,-1
乙
坦白
坦白
抗拒
甲
抗拒
-5,-5
0,-8
-8,0
-1,-1
此博弈的“均衡”为(坦白,坦白)
该均衡就是大名鼎鼎的“纳什均衡”
纳什均衡:在对方策略确定的情况下,每 个参与者的策略都是最好的,没有人愿意先改 变自己的策略。 假如博弈中的所有参与人事先达成一项协 议,这个协议是否可以自动实施? 若当事人都 会自觉遵守这个协议,这个协议就构成纳什均 衡:没有人有积极性偏离协议。换句话说,如 果一个协议不构成纳什均衡,它就不可能自动 实施,因为至少有一个参与人会违背这个协议。
严格地讲,博弈论是一种方法,应用范 围不仅包括经济学,政治学、军事、外交、 国际关系、公共选择,还有犯罪学,都涉及 到博弈论。实际上,不少人把博弈论看成是 数学的一个分支。纳什1951年的奠基性文章 就是发表在数学杂志上。夏普里1953年的文 章本身也是一篇数学手稿。
一、博弈论基础知识
1. 博弈论的基本概念
完全信息
完全信息 静态博弈 不完全信息 静态博弈
不完全信息
二、博弈论中的经典分析及启示
1. 囚徒困境
“囚徒困境”博弈是1950年图克(Tucker)提 出的。它非常简单,却反映了博弈的根本特征, 是阐释众多经济社会问题的经典范式。
警察抓住两个罪犯,分别关押,并与罪犯 讲清:如果一人坦白,一人抗拒,坦白者立即 释放,抗拒者判刑 8 年;若两人都坦白,按律 从轻各判 5 年。罪犯知道,他们若抗拒,警察 掌握的证据只能各判 1 年。最后的结果会怎样?
博弈的三要素
1) 博弈的参加者
2) 博弈方各自可选择的全部策略 或行动的集合
3) 博弈方的得益
3. 博弈的表述形式
(1) 标准形式(策略形式)
司马懿 攻城 退兵
诸 葛 亮
守城 被擒,中计(主观) 逃脱,和
胜利(客观)
弃城 被擒,胜利
逃脱,和
曹
华容道
操
大路
诸 葛 亮
华容道 捉住曹操,被捉 扑空,逃脱
“博弈论”译自英文“Game Theory”。 直译:“游戏理论”。
游戏有下列特征:
(1)都有规则。 (2)都有结果(赢、输、平),结果能折算成数值。 (3)都有策略或者说计谋,选择不同的策略或计谋 往往带来不同的结果。 (4)策略和利益有相互依存性,即每一个游戏者所 得结果的好坏,不仅取决于自身的策略选择, 也取决于其他参加者的策略选择。 策略本身常常没有绝对的好坏之分,只有相对于 他方策略的相对好坏。
博弈论也称为“对策论”。其实并不 是很恰当。因为“对策”在实际中常被用 来表示具体的针对性反应方案,或站在某 个决策方的立场上找针对其他方的对策。 博弈论所研究的决策问题却是有开始、有 次序、有结果的整个过程。 “博弈”的通 俗含意不过是弈棋、赌胜,但由于它是带 有文言性质的词,因而显得学术味浓一些, 既能反映这门学科的特点和实质,又给人 一种高深莫测的感觉。
合作 5,3 7,7
博弈的纳什均衡为(合作,合作),解开了囚徒困境。
引
言
20世纪90年代至2008年,诺贝尔经 济学奖五次(1994,1996,2001,2005, 2007)授予了与博弈论相关的研究领域, 总共有十位经济学家获奖,是获奖人数最 多的领域(排在第二位的是金融)。
博弈论研究的最大特点
一般决策研究(数学表达): Y = f ( x1, x2, …, xn ) 博弈论的决策研究(数学表达): Y = f ( x1, x2 ,…, xn , z ) (z为他人行为) 特点:决策者目标函数的自变量中包含他人行为。
2. 构成一个博弈的基本要素
博弈的七要素
参与人、行动、信息、战略、支付函数、 结果、均衡。
参与人是博弈中选择行动以最大化自己效用的决 策主体(可以是个人、团体等); 行动是参与人的决策变量; 战略是参与人选择行动的规则,它告诉参与人在 什么时候选择什么行动; 信息指的是参与人在博弈中的知识,特别是有关 其他参与人(对手)的特征和行动的知识; 支付函数是参与人从博弈中获得的效用水平,是 每个参与人真正关心的东西; 结果是指博弈分析者感兴趣的要素的集合; 均衡是所有参与人的最优战略或行动的组合。
博弈的简明定义:博弈即一些个人 或其他组织,面对一定的环境条件,在 一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进 行选择并加以实施,各自取得相应结果 的过程。
博弈论,是研究决策主体的行为发 生直接相互作用时候的决策以及这种决 策的均衡问题。 博弈论研究的对象是理性的参与者 如何选择策略或如何作出行动的决定, 使自己的目标最大化。
有这样一个博弈
乙 甲 不合作 合作
不合作 1,1 0,5
合作 5,0 4,4
此时,两者的纳什均衡为(不合作,不合作)。
假如对采取“合作”策略的博弈方奖励 3 奖励矩阵为:
乙 甲 不合作 合作
不合作 0,0 3,0
合作 0,3 3,3
最终结果为上述两个矩阵相加:
乙 甲 不合作 合作
不合作 1,1 3,5
乙 守规 守规
10,10 18,0
违规
0,18 3,3
甲
违规
启示: ① 个人理性与集体理性的矛盾; ② 冤假错案是怎样产生的; ③ 个人的最优决策不一定带来集体的最优结果, 集体的最优结果未必来源于个人的最优决策。 领导的政绩? ④ 改变博弈结果的根本方法是改变博弈的支付 矩阵。
囚徒困境的解脱
① 奖励