博弈论简明教材
第11章-博弈论教材全篇
田忌
齐王 b1 b2 b3 b4 b5 b6
a1
3 1 1 1 1 1
a2
1 3 1 1 1 1
a3
1 1 3 1 1 1
a4 1 1 1 3 1 1
a5
1 1 1 1 3 1
a6
1 1 1 1 1 3
2-2 具有鞍点的博弈
通过下面的例3说明,什么是局中人的最优纯策略, 如何求出这个纯策略以及博弈解和博弈值的概念。
博弈的三个要素的矩阵表示(局中人A的收益)
局中人B
局中人A
策
a1
a2
略
am
b1
c11 c21
cm1
策
b2
c12 c22
cm 2
略
bn
c1n c2 n
cmn
局中人A的收益函数可用如下的矩阵表示:
c11
A
c21
cm1
c12 c22
cm 2
c1n c2n
cmn
二人零和博弈也称为矩阵博弈。
博弈论的研究建立在下述假设前提下:即参与博弈 的各局中人都是理性的。
“博弈中一个理性的决策必定建立在预测其他局中人 的反应之上。一个局中人将自己置身于其他局中人的 位置,并为他着想从而预测其他局中人将选择的行为, 在这个基础上该局中人决定自己最理想的行动。”
博弈的三个要素,即局中人,策略集和收益函数 构成了博弈信息,根据不同信息可对博弈做如下 分类:
同样乙方应从收益表中每列找出最大正数(恰为乙 方输掉的数值),为了减少损失,应从这些数字中 求出最小数,它所对应的列策略为乙方的最优纯策 略。
计算过程如下:
对局中人甲,先从每一行中求出最小值
min6,1, 8 8,min3, 2,6 2, min3,0, 4 3,再求出其中的最大值 max8, 2, 3 2。数字2对应的行策略
博弈论讲义完整版
第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
你 接受 求爱博弈: 品德优良者求爱 求爱者 求爱
100,100
不接受
-50,0 0,0
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱者 接受 求爱 不求爱 0,0 你 不接受
问题:什么叫“完全而不完美信息博弈”?
第二章 完全信息静态博弈
一 博弈的基本概念及战略表述 二 占优战略(上策)均衡
三 重复剔除的占优均衡(严格下策反复消去法)
四 划线法
五 箭头法
六 纳什均衡
完全信息静态博弈
完全信息:每个参与人对所有其他参与人的特 征(包括战略空间、支付函数等)完全了解
同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境
囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的“最优策略”使整个“系统”处于不利 的状态。
思考:为什么会造成囚徒困境 是否由于“通讯”问题造成了囚徒困境? “要害”是否在于“利己主义”即“个人理 性”?
尹伯成《西方经济学简明教程》(第7版)笔记和课后习题(含考研真题)详解(第8章 博弈论和信息经济学)
第8章博弈论和信息经济学8.1 复习笔记一、博弈论1.博弈论与传统经济学博弈论本质上也是研究理性的经济主体的最大化行为,但比传统经济学更进一步,认为自己的效用(以及利润或收入)函数不仅依赖于自己的决策,也依赖于他人的决策。
现实的经济生活中,新古典经济学的两个基本假设均难满足:(1)市场是不完全竞争的,市场局中人之间往往是相互影响的,因此一方在决策时必须考虑对方反应,而这一扩张恰恰是博弈论主题。
(2)现实市场中,局中人间信息通常是不充分的。
2.博弈论的基本要素博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。
在策略性环境中,每一个人进行的决策和采取的行动都会对其他人产生影响。
因此,每个人在进行策略性决策和采取策略性行动时,要根据其他人的可能反应来决定自己的决策和行动。
博弈论的基本要素包括:(1)局中人:参与博弈(对策)并承担后果的利益主体,有时也称参与人。
(2)策略集合:指所有局中人可能采取的行动方案的总和。
(3)收益:指在每种策略组合情况下局中人采取特定策略得到的结果。
3.上策均衡和纳什均衡(1)上策:指不管其他局中人采取什么策略,某一局中人都采取自认为对自己最有利的策略。
均衡指博弈中所有局中人都不想改变自己策略的一种相对静止状态。
上策均衡是指不管其他局中人采取什么策略,每个局中人都选择了对自己最有利的策略所构成的一个策略组合。
(2)纳什均衡:指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。
(3)二者关系:纳什均衡不一定是上策均衡,但上策均衡一定是纳什均衡。
如表8-1所示,该博弈没有上策均衡,(策略A,策略A),(策略B,策略B)都是纳什均衡,但不是上策均衡。
表8-1 纳什均衡4.重复博弈和序列博弈(1)静态博弈指局中人同时决策或虽非同时决策,但后决策者不知道先决策者采取什么策略的博弈。
动态博弈指局中人决策有先有后,后决策者能观察到先决策者决策情况下的博弈。
人大版微经 博弈论初步(博弈论)PPT课件
决策的个体;所谓参与人的策略,指的是一项规则, 根据该规则,参与人在博弈的每一时点上选择如何行 动;所谓参与人的支付则是指,在所有参与人都选择 了各自的策略且博弈已经完成之后,参与人获得的效 用(或期望效用)。
2020/8/3
.
3
第十章 博弈论初步 第一节 博弈论和策略行为
2020/8/3
.
16
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第四,将已经画好线的甲厂商的支付矩阵和乙厂商的 支付矩阵再合并起来,得到整个的有下划线的支付矩 阵
2020/8/3
.
10
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
四、纳什均衡
2.纳什均衡的概念 第一,纳什均衡的概念
所谓纳什均衡,指的是参与人的这样一种策略组 合,在该策略组合上,任何参与人单独改变策略都不 会得到好处。或者说,在一个策略组合中,如果所有 其他人都不改变策略,没有人会改变自己的策略,则 该策略组合就是一个纳什均衡。
3.博弈的简单分类 根据参与人的数量,可以分为二人博弈和多人博
弈;根据参与人的支付情况,可分为零和博弈和非零 和博弈;根据参与人拥有的策略的数量多少,可分为 有限博弈和无限博弈;根据参与人在实施策略上是否 有时间的先后,可分为同时博弈和序贯博弈。
2020/8/3
.
4
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
策和采取策略性行动的科学。 策略性环境是指,每一个人进行的决策和采取的
行动都会对其他人产生影响;策略性决策和策略性行 动是指,每个人要根据其他人的可能反应来决定自己 的决策和行动。
博弈论简明教材
博弈论第一节博弈问题概述一、博弈的基本概念博弈论是近年经济学中发展得很快的一个分支。
博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的。
换句话说,博弈论研究当某一经济主体的决策既受到其它经济主体决策的影响,而且该经济主体的相应决策又反过来影响到其它经济主体时的决策问题和均衡问题。
在前面几讲中,除了寡头市场外,消费者的效用或厂商的利润都只依赖于他自己的选择,而与其他人的选择无关。
在这里,经济作为一个整体,各个经济主体的选择是相互影响的。
但对于单个的消费者或厂商来说,所有其它经济主体的行为都被包括在一个参数里。
这个参数就是价格。
除此以外,经济主体在决策时,面临的似乎是一个非人格化的东西。
经济主体既不需要考虑他人的选择对自己选择的影响,也何必需要考虑自己的选择对他人的影响。
而在本讲所介绍的博弈论中,消费者的效用或厂商的利润不仅依赖于自己的选择,而且依赖于具体的某一个或某一些其它经济主体的选择。
在经济学中,博弈论通常是放在寡头市场的分析中,因为在寡头市场上,某一寡头企业在决策时,不得不考虑其他寡头企业的反应。
但事实上,博弈行为是广泛存在的。
博弈分析的目的是使用博弈规则决定均衡。
博弈论的基本概念包括:参与人、行动、战略、博弈规则、信息、报偿、均衡。
参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。
行动是指参与人作的决策。
战略是指参与人选择行动的规则,它告诉参与人在什么情况下选择什么行动。
例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。
这里,“犯”与“不犯”是两种不同的行动。
战略规定了什么时候选择“犯”,什么时候选择“不犯”。
博弈规则是指参与人共同接受的不同情况下的最优战略。
信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。
报偿是参与人从博弈中获得的结果,它取决于所有参与人的行动或战略。
博弈论最全完整-讲解课件
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
简明博弈论教程(2)
15
• 【定义2.1】 • 假设有n个人参与博弈,给定其他人策略的条件下, 每个人选择自己的最优策略(个人最优可能依赖于 也可能不依赖于其他人的策略),所有参与人的最 优策略组成的一个组合就是纳什均衡。 • 这种策略组合由所有参与人的最优策略组成,也就 是说,给定别人策略的情况下,没有任何单个参与 人有积极性选择其他策略,从而没任何人有积极性 打破这种均衡。用句不太褒义的话来说,纳什均衡 是一种“僵局”:给定别人不动的情况下,没有人 有兴趣动。
25
26
27
• 第一节 预测博弈
• 第二节 纳什均衡的应用例子
28
• 试运用霍特林模型解释为什么中国各个地 区总是存在产业雷同化现象。
• 试运用霍特林模型解释为什么一些厂商喜 欢模仿其他企业的产品。
29
21世纪经济学系列教材
中国人民大学出版社
• 第一节 预测博弈
• 第二节 纳什均衡的应用例子
3
1
进入 不进入
2 进入 -1,-1 0,1
不进入 1,0 0,0
5
• 假定参与人1具有二阶理性。 • 1进入,2则会选择不进入 • 1不进入,2则会选择进入 • 博弈是完全对称的
6
• 假设参与人1具有三阶理性 • (不进入,进入) • 假设参与人具有四阶理性 • (进入,不进入)
古诺博弈和反应函数 伯特兰竞争
世贸组织互惠性
冻结价格战的博弈机制
22
商场B 降价 降价 商场A 不降价
-3 , -3
5, -5
不降价
-5 , 5
3, 3
23
•L
A
M d D
B
R
24
• 1991年10月,中东和会在马德里召开,确立“土 地换和平”基本原则,阿以间开始艰难的和平谈 判。阿拉法特领导的巴解组织随之作出历史性决 定:通过谈判实现巴以和平。 • 1992年1月,中东问题多边会谈在莫斯科举行,会 谈涉及军控与安全、水资源利用、难民安置、经 济合作、环境保护5个重要地区性问题。 • 1993年9月,在美国总统克林顿的斡旋下,巴以双 方在华盛顿签署了第一个和平协议——《奥斯陆 协议》,规定巴在加沙和杰里科首先实行有限自 治。之后以军开始撤离所占领土,巴逐步接管加 沙和约旦河西岸地区。 • ……
简明博弈论教程(7)
13
• 这就从一个方面揭示了为什么合作解能够 在重复博弈中出现,因为合作得到奖励, 不合作受到惩罚,因而每一方都会加以遵 守。在人类社会中,这种奖励与惩罚机制 可以通过国家意志——法律的形式得到实 现,从而为人类的合作提供一种制度上的 保障。所谓的契约社会,就是通过法律、 道德的形式来实现这种诚信(遵守契约规 定)。
23
• 我们可以推演出各个回合双方的行为如下: 第一回合,甲仁厚玩合作H,乙宰客玩欺 骗D;第二回合,甲报复玩欺骗D,乙仍 然宰客玩欺骗D;第三回合,甲仍报复玩 欺骗D,乙发现甲并非傻客,于是玩合作 H;第四回合,甲原谅乙,玩合作H;乙 却因甲上次不合作,回头玩欺骗D宰客
24
• 如果博弈G是有限博弈,最小最大支付组 合向量为y=(y1,y2,…,yn),可行集里的 任一点为x,并且x>y,则存在A>0使a>A时 重复博弈存在纳什均衡,其平均支付组合 为 x。
14
合作解要在有限重复博弈中出现要求 阶段博弈G必须存在多重纳什均衡,但在无限 重复博弈中这一条件并不是必需的:即使阶段 博弈G只存在唯一纳什均衡(甚至不存在纯纳 什均衡),无限重复博弈中也存在子博弈完美 均衡解,其中没有任何一个阶段结果是G的纳 什均衡。根本的原因就在于如果博弈是无限重 复的,当充分接近1,即人们有足够的耐心, 那么考虑长远利益就要好于短视。
• 为了说明上述观点,我们仍然考虑信用困 境博弈,但它无限次地进行下去。 • 每一阶段都重复纳什均衡(欺骗,欺骗) 显然是无限重复信用困境的子博弈完美均 衡,问题是还存在着其他“更好”的子博 弈完美均衡吗?这里我们考虑三个常见的 策略:触发策略(Trigger strategy),有 限惩罚策略(Limited punishment stategy)和一报还一报策略(Tit for tat strategy)。
《博弈论教程》课件
博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
《博弈论入门》PPT课件
在不同博弈中可供博弈方选择的策略或行为的数量 很不相同,在同一个博弈中,不同博弈方的可选策 略或行为的内容或数量也常不同,有时只有有限的 几种,甚至只有一种,而有时又可能有许多种,甚 至无限多种可选策略或行为。
精选PPT
男人无所谓忠诚,忠诚是因为背叛的砝码太低; 女人无所谓忠贞,忠贞是因为受到的引诱不够.
某个综艺节目现场,女主持人气势咄咄的问一个男嘉宾,你 为什么那么在乎钱,男嘉宾说:“钱能买到一切!” 现场的观 众哗然了。
男嘉宾微笑的说:“我们做个测试吧。”
一个很简单的主题,你的一个仇人爱上了你的女友,现在
局中人所选择的策略构成的组合(招,招)被称为 博弈均衡。
精选PPT
21
参与人(Players)
即在所定义的博弈中究竟有哪几个独立决策、独立 承担结果的个人或组织。
对我们来说,只要在一个博弈中统一决策,统一行 动、统一承担结果,不管一个组织有多大,哪怕是 一个国家,甚至是由许多国有组成的联合国,都可 以作为博弈中的一个参加方。并且,在博弈的规则 确定之后,各参加方都是平等的,大家都必须严格 按照规则办事。
人,也许是在权衡什么。一半的男人沉默了,另一半
的男人怯生生的说:“我要爱情。”身边的女友也有点
呆住了,一个女孩子站起来说:“如果一个男人肯出
五百万,我想我没有理由拒绝他。”沉默..................
精选PPT
26
男人选择了金钱,500万可以买一套房子,一部车子,全家 过上好曰子,甚至可以开始自己的事业。一个男人说:“他是 我的仇人,我有了这个500万,我可以含辛茹苦,我可以报仇 ,我可以计划我所有的未来,当个真正主宰自己的男人。”一 些女人看着身边的男人,若有所思。
《西方经济学简明教程》第6章 博弈论(game theory)
2)古诺模型- 纳什均衡
反应函数-已知对方的产量-自己的最优产量
广告博弈?
厂商乙
上策均衡
做 广 告 做 广 告
不 做 广 告
不做广告
厂 商 甲
30 20
30 50
50 20 40 40
第二节
信息经济学
不完全信息是指市场上买方与卖方所掌 握的信息是不对称的,一方掌握的信息多一 些,另一方所掌握的信息少一些。有些市场 卖方所掌握的信息多于买方,而另一些市场 买方所掌握的信息多于卖方。 本节我们将就不完全信息下所导致的逆 选择(adverse selection)、败德行为 (moral hazard)等进行讨论,并探讨由这 些问题而产生的效率损失。
囚 徒 困 境(prisoner’s dilemma) 囚徒 B 坦白 囚 徒 A 坦白 抵赖 -3,-3 - 6, 0 抵赖 0,-6 -1,-1
•3、上策均衡
不论其他参与人选择什么战略,他的最优战略是唯一的, 这样的最优战略被称为上策均衡,也被称为“占优战略” (dominant strategies)。
四、如何解决不完全信息下出现的 问题
• 不同的市场上因非对称信息而产生问题性 质不同,需要采取不同的方法解决。可以 通过政府解决,也可以不通过政府解决。
逆选择-信号传递和信号显示 道德风险-激励相容和制度设计
逆选择的结果:劣弊驱逐良币-差的商品总是将 好的商品驱逐出市场
二、败德行为
• 败德行为也称为道德公害,指在协议达 成后,协议的一方通过改变自己的行为, 来损害对方的利益。败德行为产生的原 因是非对称信息。 • 败德行为是在承保人无法觉察或监督投 保人行为的情况下所发生的。解决的办 法只能是通过某些制度设计使投保人自 己约束自己的行动。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论第一节博弈问题概述一、博弈的基本概念博弈论是近年经济学中发展得很快的一个分支。
博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的。
换句话说,博弈论研究当某一经济主体的决策既受到其它经济主体决策的影响,而且该经济主体的相应决策又反过来影响到其它经济主体时的决策问题和均衡问题。
在前面几讲中,除了寡头市场外,消费者的效用或厂商的利润都只依赖于他自己的选择,而与其他人的选择无关。
在这里,经济作为一个整体,各个经济主体的选择是相互影响的。
但对于单个的消费者或厂商来说,所有其它经济主体的行为都被包括在一个参数里。
这个参数就是价格。
除此以外,经济主体在决策时,面临的似乎是一个非人格化的东西。
经济主体既不需要考虑他人的选择对自己选择的影响,也何必需要考虑自己的选择对他人的影响。
而在本讲所介绍的博弈论中,消费者的效用或厂商的利润不仅依赖于自己的选择,而且依赖于具体的某一个或某一些其它经济主体的选择。
在经济学中,博弈论通常是放在寡头市场的分析中,因为在寡头市场上,某一寡头企业在决策时,不得不考虑其他寡头企业的反应。
但事实上,博弈行为是广泛存在的。
博弈分析的目的是使用博弈规则决定均衡。
博弈论的基本概念包括:参与人、行动、战略、博弈规则、信息、报偿、均衡。
参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。
行动是指参与人作的决策。
战略是指参与人选择行动的规则,它告诉参与人在什么情况下选择什么行动。
例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。
这里,“犯”与“不犯”是两种不同的行动。
战略规定了什么时候选择“犯”,什么时候选择“不犯”。
博弈规则是指参与人共同接受的不同情况下的最优战略。
信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。
报偿是参与人从博弈中获得的结果,它取决于所有参与人的行动或战略。
把全体参与人可能采取的不同战略及其报偿都列出来,称为报偿矩阵。
均衡是所有参与人的最优战略或行动的组合。
二、博弈的分类可以从不同的角度对博弈进行分类。
根据博弈者选择的战略,可以将博弈分成合作博弈 (cooperative games) 与非合作博弈 (non-cooperative games). 合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。
如果有,就是合作博弈;反之,就是非合作博弈。
例如,如果几家寡头通过订立并实行协议,限制产量,制定垄断高价,则称这种博弈为合作博弈。
若寡头们在市场竞争中没有达成有约束里的协议,每个企业仅仅是在考虑到竞争对手可能采取的行为的条件下,独立地进行产量与价格的决定,则称这种博弈为非合作博弈。
根据参与人行动的先后顺序,可以将博弈分成静态博弈 (static game) 与动态博弈(dynamic game) 。
静态博弈是指,博弈中参与人同时选择行动;或者虽非同时行动,但行动在后者并不知道行动在先者采取了什么具体行动。
动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。
根据参与人对其他参与人的了解程度,可以将博弈分成完全信息博弈 (games of complete information) 和不完全信息博弈 (games of incomplete information) 。
完全信息博弈是指:在每个参与人对所有其他参与人(对手) 的特征、战略和支付函数都有精确了解的情况下,所进行的博弈。
如果了解得不够精确,或者不是对所有的参与人都有精确的了解,在这种情况下进行的博弈就是不完全信息博弈。
在以下的几节中,首先介绍非合作博弈,然后介绍合作博弈。
而非合作博弈的介绍又分成四种情况分别介绍。
这四种情况是:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。
第二节完全信息静态博弈一、占优战略均衡一般来说,由于每个参与人的效用(支付)是博弈中所有参与人的战略的函数,因而每个参与人的最优战略选择依赖于所有其他参与人的战略选择。
但在一些特殊的博弈中,一个参与人的最优战略可能并不依赖于其他参与人的战略选择。
换句话说,不论其他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略” (dominant strategies) 。
以博弈论中最著名的囚徒困境 (prisoner 's dilemma) 为例。
两个合伙作案的犯罪嫌疑人被抓住了。
警方怀疑他们作了许多的案子,但除了其中的一小部分外,警方手中并没有他们作案的确切证据,因而对这两个犯罪嫌疑人犯罪事实的认定及相应的量刑取决于他们自己的供认。
假定警方对两名犯罪嫌疑人实行隔离审讯,二者无法订立攻守同盟。
同时警方局明确地分别告诉这两名犯罪嫌疑人,他们面临着来以下后果。
即如果犯罪嫌疑人与其同伙都供认其全部犯罪事实,那么,由于其罪行的严重性,两人各判 8年徒刑。
如果某一犯罪嫌疑人供认其全部犯罪事实,而其同伙抵赖,则供认者坦白从宽,从轻判处 1年徒刑,而不供认者抗拒从严,从重判处 10年徒刑。
如果两个犯罪嫌疑人都不供认警方所不知道的犯罪事实。
那么,根据已经掌握的证据,只能判处他们每人2年徒刑这两个犯罪嫌疑人所面临的后 果可以用表7-1来表示。
表中,正 数值表示参与人有所得,负数值表 示参与人有所失。
在表7-1中,每个犯罪嫌疑人 都有两种可供选择的战略:坦白或 抵赖。
但不论同伙选择什么战略, 每个犯罪嫌疑人的最优战略是坦白■ 坦白时,A 如也选择坦白,则被判处8年徒刑,A 如选择抵赖,则将被判处10年徒 刑。
因而A 选择坦白比选择抵赖好。
当犯罪嫌疑人 B 选择抵赖时,A 如选择坦白, 则被判处1年徒刑,A 如选择抵赖,则将被判处2年徒刑。
因而A 选择坦白还是比 选择抵赖好。
因此,坦白是犯罪嫌疑人 A 的占优战略。
对于犯罪嫌疑人B 来说, 坦白同样也是他的占优战略。
在博弈中,如果所有的参与人都有占优战略存在,因而博弈将在所有参与 人的占优战略的基础上达到均衡,这种均衡称为占优战略均衡。
在表 7-1中, “A 坦白,B 也坦白”就是占优战略均衡。
应该指出的是,占优战略均衡只要求所有的参与人是理性的,而并不要求 每个参与人知道其他参与人也是理性的。
因为,不论其他参与人是否理性,占 优战略总是一个理性参与人的最优选择。
在表7-1中,如果每个犯罪嫌疑人都选择抵赖,则每人将被判处 2年徒刑。
对于两个犯罪嫌疑人来说,这显然比每人判处 8年徒刑要好。
但由于AB W 人均从 个人角度出发,如果不存在某种约束,他们不可能在“ A 和B —起抵赖”的基础 上达到均衡。
囚徒困境反映了一个深刻的问题,这就是个人理性与团体理性的冲突。
微 观经济学的基本观点之一,是可以通过市场机制这只“看不见的手”,在人人 追求自身利益最大化的基础上达到全社会资源的最优配置。
囚徒困境是对上述 基本观点的挑战。
、重复剔除的占优战略均衡在绝大多数博弈中,占优战略均衡是不存在的。
尽管如此,在有些博弈 中,我们仍然可以用占优的逻辑找出均衡。
以博弈论中另一个著名的智猪博表7-2按按钮对于吃食量的影响 弈(boxed pigs)为例。
猪圈里有两头 猪,大猪和小猪。
猪圈的一头有一个 猪食槽,另一头安装着一个控制着猪按按钮的猪 吃到的猪食数量 大猪 小猪 食供应的按钮。
按一下按钮,将有8大猪 4单位 4单位 个单位的猪食进入猪食槽,供两头猪 小猪 7单位 1单位 食用。
可供大猪和小猪选择的战略有 两猪同时 5单位 3单位 两种,自己去按按钮,或者等待另一头猪去按按钮。
如果某一头猪作出自己去按按钮的选择,它必须付出下列代 价:第一,它需要支付相当于2个单位猪食的成本;第二,由于按钮远离猪食 槽,它将成为猪食槽边的后到者,从而减少能够吃到的猪食数量。
具体情况如坦白 囚徒B 抵赖 囚徒A 坦白 抵赖 -8,-8 -10,-1 -1,-10 -2,-2 表7-1囚徒困境 以犯罪嫌疑人 A 为例。
当犯罪嫌疑人B 选择表7-2所示。
智猪博弈的后果如表7-3所示。
表中的 数字表示不同情况下每头猪所吃到的猪食数量减去按按钮的成本之后的净支付水平。
表7-3表明,在这个博弈中,无论大猪 选择什么战略,小猪的占优战略均为等待。
而对大猪来说,其最优战略依赖于小猪的选 择。
如果小猪选择等待,大猪的最优战略是 按按钮;如果小猪选择按按钮,则大猪的最优战略是等待。
换句话说,大猪没 有占优战略什么是这一博弈的均衡解呢?假定小猪是理性的,它肯定会选择自己的占 优战略一一等待。
再假定大猪知道小猪是理性的,则大猪会正确地预测到小猪 会选择等待,根据小猪的这一选择,大猪选择了在此前提下自己的最优战略一 —按按钮。
在这种情况下大猪和小猪的支付水平分别是 2单位和4单位。
这是一 个多劳不多得、少劳不少得的均衡。
在寻找智猪博弈的均衡解时,我们所使用的做法可以归纳如下:首先找出 某一博弈参与人的严格劣战略,将它剔除掉,重新构造一个不包括已剔除战略 的新的博弈;然后继续剔除这个新的博弈中某一参与人的严格劣战略;重复进 行这一过程,直到剩下唯一的参与人战略组合为止。
这个唯一剩下的参与人战 略组合,就是这个博弈的均衡解,称为“重复剔除的占优战略均衡” (iterated dominance equilibrium).这里所说的劣战略(dominated strategies),是指在其他博弈参与人战略 为既定的条件下,某一参与人可能采取的战略中,对自己相对不利的战略。
严 格劣战略(strictly dominated strategies) 则是指:无论其他博弈参与人采取 什么战略,某一参与人可能采取的战略中,对自己相对不利的战略。
在智猪博弈中,我们首先剔除了小猪的严格劣战略“按按钮”。
在剔除掉 小猪的这一选择后的新的博弈中,小猪只有等待一个战略,而大猪有两个战略 可供选择。
我们再剔除新博弈中大猪的严格劣战略“等待”,从而达到重复剔 除的占优战略均衡。
在现实生活中有许多智猪博弈的例子。
例如,在股份公司中,股东承担着 监督经理的职能。
但不同的股东从监督中得到的收益大小不一样。
在监督成本 相同的情况下,大股东从监督中得到的收益显然多于小股东。
因此,股份公司 中监督经理的责任往往由大股东承担,小股东则搭大股东的便车。
与前面讨论的占优战略均衡相比,重复剔除的占优战略均衡不仅要求博弈 的所有参与人都是理性的,而且要求每个参与人都了解所有的其他参与人都是 理性的。
在上例中,如果大猪不能排除小猪按按钮的可能性,按按钮就不一定 是大猪的最优选择。
三、纳什均衡纳什均衡(Nash equilibrium) 是指这样一种均衡。