第七章-博弈论实验讲解学习

合集下载

《博弈论:原理、模型与教程》第07章 子博弈精炼Nash均衡 第02节 子博弈精炼Nash均衡的求解

《博弈论:原理、模型与教程》第07章  子博弈精炼Nash均衡  第02节  子博弈精炼Nash均衡的求解

《博弈论:原理、模型与教程》第二部分完全信息动态博弈第7章子博弈精炼Nash均衡7.2 子博弈精炼Nash均衡的求解(重点!)(已精细订正!)定义7-1虽然给出了子博弈精炼Nash的定义,但没有说明如何求解子博弈精炼均Nash衡。

下面以图6-8 中扩展式博弈为例,介绍一种最常用的求解子博弈精炼Nash均衡的方法—逆向归纳法。

(讲!)考察图6-8中的博弈。

参与人1在博弈开始时(即在信息集}{)(11x I 上面临两种选择—行动A和行动B 。

参与人1此时选择哪种行动呢?对于理性的参与人1来讲,只会选择使自己支付最大化的行动。

从图6-8很容易知道参与人1选择行动B 时所得到的支付为2;但是,如果参与人1选择行动A ,则所得支付就要取决于参与人2在信息集}{)(22x I 上的选择,以及博弈达到决策结3x 时参与人1在信息集}{)(31x I 上的选择。

也就是说,参与人1选择行动A 所得支付,取决于子博弈)(2x Γ的结果。

因此,为了确定参与人1在博弈开始时的选择,就必须确定参与人1选择行动A 的所得支付,而为了确定参与人1选择行动A 的所得支付,就必须先求解子博弈)(2x Γ。

如何求解博弈)(2x Γ呢?可以采用同样的方法来求解子博弈)(2x Γ,即在求解子博弈)(3x Γ的基础上,确定参与人2在信息集}{)(22x I 上的选择,从而求解子博弈)(2x Γ。

由以上分析可以得到图6-8中博弈的求解过程:首先求解博弈树中最底层的子博弈)(3x Γ得到子博弈)(3x Γ的结果为(3,0)(即参与人1选择E );再求解博弈)(2x Γ,容易得到博弈的结果(1,1)(即参与人2选择D ); 最后求解原博弈,即子博弈)(1x Γ,得到博弈的结果为(2,1)(即参与人1选择B )。

(讲!)考察更一般的情形。

对于图7-6中的博弈树,参与人i 在信息集})({i i x I 选择行动L 还是行动R ,取决于选择行动L 和行动R 所带来的后果。

第七章 博奕论(Game Theory教材课程

第七章  博奕论(Game Theory教材课程

max

u1
即该博奕的纳什均衡解
max u 2
maxu1 maxu2
U1 Uq12
q2
6q2 6q1
2q1 2q2
0 0
的解,
求解上述方程组:
q 1 * q 2 * 2 , Q 4 u 1 1 , u 2 4 , u 1 u 2 8
标志着博奕论的初步形成。 50年代,合作博奕发展到鼎盛阶段,非合作博奕开始出现 纳什和夏普里的讨价还价模型, 塔克的“囚徒困境” 60年代以后,selten,Haysany,Krops,Wilseen
“信誉问题模型” (动态不完全信息博弈) 最近十多年,博弈论几乎贯穿了整个微观经济学,产业组
织理论和企业制度理论,并扩展到宏观经济学,环境、劳动、 福利经济学等领域。
新厂商的市场进入问题
B
打入
A
打击
(0,10)
和平共处
(-2,3)
(5,5)
6.博奕进程的信息
完美信息博奕:在动态博奕中,博弈方对博弈的进程, 即次此行为前各博奕方的行为完全了解
非完美信息博弈:
完全信息博弈:博奕各方完全了解所有博奕方各种策 略组合下得益情况 非完全信息博弈:
7.2.2博弈的主要分类
1 3、赢得(利益):参加博奕各方从博奕中所获得的 利
益 支付矩阵,博弈树
零和博奕:各博奕方赢得的代数和为零 非零和博奕:各博奕方赢得的代数和不为零
4.均衡:所有博奕方的最优策略的组合
博奕分析的目的是使用博奕规则决定均衡
5.得益的信息
完全信息博奕:博奕各方完全了解所有博奕方各种策略 组合下得益情况的博奕,如囚徒困境和田忌赛马。
7。3 完全信息静态博奕——纳什均衡

浙大微观经济学ch7博弈论

浙大微观经济学ch7博弈论
第七章 博弈论与决策行为

博弈论:又称对策论,是研究理性的决策主体 之间的行为相互作用时的决策以及这种决策的 均衡问题。 博弈论的应用是微观经济学的重要发展。

2013/6/13
2
博弈论
1944 年美藉匈牙利数学家冯 · 诺依曼( John Von Neuman )和美藉奥地利经济学家摩根斯顿 ( Morgenstern )出版经典著作《博弈论与经济行 为》,为现代博弈论的发展奠定了基础。 纳什 美国的数学家、经济学家纳什(John Nash),美籍匈牙利经济学家海萨尼 (John C. Harsanyi)和德国经济学 家泽尔滕(R.Selten)因对博弈论的卓越贡 献而获得1994年度的诺贝尔经济学奖。 海萨尼 泽尔滕
可信的威胁
2013/6/13 11
思考题

赌徒分钱?
2013/6/13
12
囚徒B 不招供 不招供 囚徒A 招供 (0,-8) (-5,-5) 招供 揿 大猪 等待 (9,-1) (0,0) 揿 (5,1) 小猪 等待 (4,4)
(-1,-1) (-8,0)
囚徒困境
智猪博弈
2013/6/13
7
博弈论相关概念

重复博弈:一个结构相同的博弈被重复多次。



在一次性静态博弈的情况下,结成共谋的每个寡头面临着 “囚徒困境”,但在重复博弈中,情况会有所不同。 若是无限次重复博弈,通过“以牙还牙”策略,寡头厂商有望 走出“囚徒困境”,取得合作解。 若是有限次重复博弈,则取得非合作均衡解。但在不能确定 终止期的有限次重复博弈中,合作解是可以存在的。 当且仅当局中人的策略组合在每个子博弈都构成纳什均衡 时,才会形成子博弈精练纳什均衡。
2013/6/13 3

《西方经济学》第七章 博弈论

《西方经济学》第七章 博弈论

21
第五节
不完全信息动态博弈
对应于不完全信息动态博弈的均衡概念是精炼 精炼 贝叶斯均衡(perfect Bayesian equilibrium). 贝叶斯均衡 这个概念是完全信息动态博弈的子博弈精炼纳 什均衡与不完全信息静态均衡的贝叶斯纳什均 衡的结合.具体来说,精炼贝叶斯均衡是所有 参与人战略和信念的一种结合.它满足如下条 件:第一,在给定每个参与人有关其他参与人 类型的信念的条件下,该参与人的战略选择是 最优的.第二,每个参与人关于其他参与人所 属类型的信念,都是使用贝叶斯法则从所观察 到的行为中获得的.
22
贝叶斯法则 贝叶斯法则是概率统计中的应用所观察 到的现象对有关概率分布的主观判断 (即先验概率)进行修正的标准方法.
23


1. 什么是占优策略均衡?什么是重复剔除的占优策 略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性 博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为 0.两寡头所进行的是产量竞争.对于寡头产品 的市场需求曲线为P=30-Q,其中Q=Q1+ Q2.Q1是寡头1的产量,Q2是寡头2的产量. (1)假定两个寡头所进行的是一次性博弈. 如果两寡头同时进行产量决策,两个寡头各生产 多少产量?各获得多少利润?
25

第七章
第一节 第三节 第四节 第五节
博弈论
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
第一节 博弈问题概述
一,博弈的基本概念 二,博弈的分类
2
一,博弈的基本概念
博弈论 博弈论(game theory)是研究决策主体的 行为发生直接相互作用时候的决策以及这 种决策的均衡问题的. 博弈论的基本概念包括:参与人 行动 参与人,行动 参与人 行动, 战略,信息 支付函数,结果 均衡. 信息,支付函数 结果,均衡 战略 信息 支付函数 结果 均衡

第七章 零和博弈(博弈论教程-石家庄经济学院,于振英)

第七章   零和博弈(博弈论教程-石家庄经济学院,于振英)
2014-1-9
第七章零和博弈 最小最大方法
20
第二节 零和博弈的研究方法
一、最小最大方法 (四)纳什均衡 Maximin=minimax=3 Maximin值与minimax值形成的策略 组合:(中,右)
2014-1-9
第七章零和博弈 最小最大方法
21
用最小最大方法寻找纳什均衡
甲的支付单矩阵 乙 不可行! 原因: 石头 剪刀 Maximin≠minimax 其他方法? 1 0 石头 -1 0 甲 剪刀 1 -1 布
2014-1-9
博弈论 第七章零和博弈
11
第一节
基本概念
四、零和博弈的表示方法:单矩阵 1.猜硬币者的支付单矩阵 抛硬币者 正面 反面 正面 1 -1 猜硬币者 -1 1 反面
2014-1-9
博弈论 第七章零和博弈
12
第一节
基本概念
四、零和博弈的表示方法:单矩阵 2.抛硬币者的支付单矩阵 抛硬币者 正面 反面 正面 -1 1 猜硬币者 1 -1 反面
2014-1-9
第七章零和博弈 最小最大方法
19
第二节 零和博弈的研究方法
一、最小最大方法 (三)乙(列参与人)的思想与行动 2.乙的行动:追求自身利益最大 从每列max值中寻找min值(甲的min 值,对乙有利)→ 从最大中寻找最小,minimax→ 结果:“右”列, minimax =3
2014-1-9
第七章零和博弈 最小最大方法
24
若John的期望支付相等?
p-(1-p) = -p+(1-p)→ p*=0.5 若p<0.5 John翻黑牌→预期Candy翻红牌 若p>0.5 John翻红牌→预期Candy翻黑牌

博弈论PPT课件

博弈论PPT课件

第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······

第七章、非对称信息博弈 《经济博弈论基础》PPT课件

第七章、非对称信息博弈 《经济博弈论基础》PPT课件

2.信贷配给的传统解释
经济学家或者将信贷配给解释为由外部振动引 起的一种暂时的非均衡现象,或者将其解释为政府 干预的结果(如政府人为地规定利率上限导致需求 大于供给)。
3. Stiglitz & Weiss 的解释
银行(放款人)的期望收益取决于贷款利率和 贷款人还款的概率两个方面,因此,银行不仅关心 利率水平,而且关心贷款人的风险。如果贷款风险 独立于利率水平,在资金的需求大于供给时,通过 提高利率,银行可以增加自己的收益,不会出现信 贷配给问题。
Stiglitz & Weiss 的解释
问题是:当银行不能观察借款人的投资风险时, 提高利率将使低风险的借款人退出市场(逆向选择 行为),或者诱使借款人选择更高风险的项目(道 德风险行为),从而使得银行放款的平均风险上升。
Stiglitz & Weiss 的解释
原因是:那些愿意支付较高利息的借款人正是那 些预期还款可能性低的 人。结果,利率的提高可能降 低而不是增加银行的预期收益,银行宁愿选择在相对 低的利率水平上拒绝一部分贷款要求,而不愿意选择 在高利率水平上满足所有贷款人的申请,信贷配给就 出现了。
三、激励机制设计模型
2、 分布函数的参数化方法:
max v( s(x)) f (x, , a)dx
a,s(x)
s.t.(IR) u(s(x)) f (x, , a)dx c(a) u (IC) u(s(x)) f (x, , a)dx c(a) u(s(x)) f (x, , a)dx c(a),a A
二.信号传递:Spence(1974)劳动力市场模型
雇员的教育程度可以作为信号向雇主传递有关 雇员能力的信息,因为接受教育的成本与能力成反 比,不同能力的人的最优教育程度是不同的。

博弈论实验报告

博弈论实验报告

实验名称:最后通牒博弈实验目的:通过参与博弈实验进一步认识经济学关于“理性人”假设和竞争的关系,发现经济学中理性人假设、效用函数理论等存在的缺陷和不足之处,加深对竞争及经济人假设等经济思想的认知,检验社会偏好对博弈均衡的影响。

实验准备:在本实验中需要实验者收益记录表、实验者数据汇总表、实验数据统计总表等实验表格若干份。

实验内容:从参加实验的人当中,随机地选出两个人,配对进行博弈。

随机地指定A组一个人先行动,即A有权先选择行动策略,然后B再回应。

这个博弈中,A和B两人共同分配100元,这个100元是无条件地送给两人,但条件是他们必须对分配方案达成一致。

由A提出分配方案,比如说A占百分之60,B占百分之40。

这样的一个方案,B可以接受,也可以不接受,当B 接受了以后,实验者就把这100元按A的方案分配给他们两个人(模拟,最后据得益计算实验成绩,得益高者成绩也高):如果B不接受A提出的方案,AB两个就都什么也得不到。

所以,这里面有一个博弈的过程,因为B可以否决,如果觉得自己分得的太少了,不公平,可以否决A的方案,但否决的结果是自己也什么也得不到。

就是说B惩罚了A,自己也付出了成本,失去了本来可以得到的部分,最后双方都是0了。

实验过程:1.实验人员的选择和分组(1)实验人员的选择。

采用随机数或抽奖软件随机抽取若干名同学作为实验参与者,选取2名同学作为实验工作人员,负责发放相关表格和统计数据。

(2)分组。

将选定的实验参与者分成A、B两组,A组实验者为提议者,其编号为A1,A2,A3,...;B组实验者为响应者,其编号为B1,B2,B3,...(3)座位调整。

为了避免个人关系等因素的干扰,在实验过程中不能让两组实验参与者坐在一起,应让他们隔离相向坐于教室的左右两端。

2.发放实验材料向A组实验者发放写好编号的实验卡片,向所有实验参与者发放实验收益记录表。

向A组每位实验者发放100元虚拟货币。

3.宣读展示实验说明(1)每一位实验参与者都应收益的最大化为目标。

第七章 博弈论实验讲解

第七章 博弈论实验讲解

Cooper等调查了允许无约束事前交流来解决 协助问题的可能性。在允许交流的情况下, 选择策略2的百分比变为80%,而被试者中 申明未协调选择的比重只有71%。
7.2.2.4 n人博弈的实验
n人博弈实验的目的是为了观察同一批参与人反复进 行同一博弈的结果。这样可以使得谈判博弈具有 合作性。
G.Kalisch等做了一组n人博弈实验。在3人博弈中, 被试者被蒙住了眼睛,只能通过手势向仲裁人示 意他们的行动。在4人博弈中,每个被试人都坐在 其他人看不到的地方,他将自己的行动写在纸上。 3人博弈规则如下:
二种情况下,3个参与人都得0.
实验结果表明,被试者选择等待策略的比 重只占了33%,而由一个被试者叫价另一 个接受而形成联盟的策略出现的比例较高。 实验结果说明同一批人反复进行同一个博 弈有利于形成合作博弈。
7.3完全信息动态博弈实验
7.3.1基础知识 逆向归纳法:该方法适用于有限次博弈, 并且参与人都是理性的,都清楚的知道博 弈树结构,参与人首先从博弈树的末端开 始,求解末端的子博弈均衡,然后继续向 前求解,直至起点。
假设有两个被试者PP和ZZ,他们已掌握零和博弈论, 同时知道冯.诺依曼-摩根斯坦非零和博弈论,但他 们不清楚纳什均衡理论。
支付矩阵如表所示:
纳什均衡策略为(2,1)
如果允许单边支付,冯.诺依 曼-摩根斯坦的非零和博弈 解是策略(1,2)。
Merrill报告了100次实验的结 果,pp得到0.4美元,zz得 到0.65美元。如此看来, 在现实的讨价还价中并没 有达到纳什均衡。
混合策略纳什均衡:参与人根据一组选定的 概率,在两种或两种以上可能的行动中随 机选择中得到纳什均衡。
7.2.2实验研究
7.2.2.1纳什均衡与冯.诺依曼-摩根斯坦博弈解

博弈论最全完整-讲解课件

博弈论最全完整-讲解课件
(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。

管理经济学讲义(新)管理经济学第七章博弈论与竞争策略

管理经济学讲义(新)管理经济学第七章博弈论与竞争策略

四.博弈的分类
• (1)合作博弈与非合作博弈根据参与者之间能否通过谈判达成
具有约束力的协议或合同来划分。
• 可以达成协议的为合作博弈cooperative game,合作博弈强调集 体理性和整体最优。如买卖双方讨价还价后成交。
• 不能达成协议的为非合作博弈non-cooperative game,非合作博 弈强调个体理性和局部最优。如寡头之间的竞争博弈,双方的 利益和目标有冲突,难以达成可以实施的协议,双方都有欺骗 和违约的冲动。博弈论在经济学中的应用主要在非合作博弈领 域。
• 在有些情况下,为了避免陷入被动,采取最大最小策略十分 必要。在下图的博弈中,乙方采取“右”是一个支配性策略。
因为不管甲方选什么,乙方采取右的策略都比左的策略好,
可以得到1的收益。在期望乙方采取右的情况下,甲方应该采
取“下”,并得到2的收益。这样,支配性策略均衡为(下,
右)。
• 如果甲方比较慎重,考虑到乙方可能不一定理性,或者可能 故意捉弄甲方,则应该采取最大最小策略,形成(上,右) 的博弈结果。
甜 20,10 -8,-8
2.对社会有害的合作,设法制止
• 在囚徒的困境博弈中,如果两个囚徒可以互相协商, 并形成攻守同盟,则罪犯得到好处,对社会不利。 例如在寡头厂商的定价博弈中,勾结定高价对双方 都有好处,但对社会不利,因此受到反垄断法的严 密监控。
• 寡头厂商的价格博弈收益矩阵如下:
厂商2
高价
二.支配性策略dominant strategy均衡
• 支配性策略均衡也称上策均衡或优势策略均衡。在博弈中,对 有些参与者来说,不管对手采取什么策略,他的策略都保持不 变。这种不取决于对手选择的最优策略称为支配性策略(上策 或优势策略)。

博弈论第7章

博弈论第7章

©2008仅供课程参考。

未经许可,请勿传播1第七章委托代理问题汕头大学商学院姚洪心委托者代理者的定义©2008仅供课程参考。

未经许可,请勿传播2©2008仅供课程参考。

未经许可,请勿传播3隐藏行动和知识道德风险问题逆向选择©2008仅供课程参考。

未经许可,请勿传播4信号传递与信号鉴别©2008仅供课程参考。

未经许可,请勿传播5委托代理问题的分类©2008仅供课程参考。

未经许可,请勿传播6一个生产博弈©2008仅供课程参考。

未经许可,请勿传播7一个生产博弈由于委托者可以观察到代理者的努力程度,所以代理者的努力程度应该超过©2008仅供课程参考。

未经许可,请勿传播8©2008仅供课程参考。

未经许可,请勿传播9委托代理问题一个生产博弈完全信息下的合同类型©2008仅供课程参考。

未经许可,请勿传播10线性工资图示付出努力上升,必须要更高的工资才能刺激其工作动力。

努力水平到达一定程度的时候,其边际产出下降,效用递减。

©2008仅供课程参考。

未经许可,请勿传播11例题©2008仅供课程参考。

未经许可,请勿传播12例题©2008仅供课程参考。

未经许可,请勿传播13例题©2008仅供课程参考。

未经许可,请勿传播14©2008仅供课程参考。

未经许可,请勿传播15例题given©2008仅供课程参考。

未经许可,请勿传播16一个生产博弈(II)由于是agent 首先提出,故首先应该由agent 优化自己的目标函数一个生产博弈(III)力,考虑到这个结果委托者将不再支付工资。

例子,教师的科研和教学工作。

©2008仅供课程参考。

未经许可,请勿传播17一个生产博弈(IV)©2008仅供课程参考。

未经许可,请勿传播18一个生产博弈(V)e直接求解法©2008仅供课程参考。

博弈论7不完全信息动态博弈概论

博弈论7不完全信息动态博弈概论

❖ 定义:精炼贝叶斯均衡s*(t)=( s*1 (t1), …, s*n
(tn))是一个战略组合,和一个后验概率组合
p ( p1, p2 , , pn ) ,满足:
(1) 对于所有的参与人i,在每一个信息集h,
arg max si*(si ,ti )
pi (ti aih )ui (si , si , ti )
❖ 即在每一个信息集中应该行动的参与者(以及参与者 随后的战略),对于给定的该参与者在此信息集中的 推断,以及其他参与者随后的战略必须是最优反应。
❖ 要求1意味着如果博弈的进行达到参与者2的非单节 信息集,则参与者2必须对具体到达哪一个节(也就 是参与者1选择了L还是R)有一个推断。这样的推断 就表示为到达这两个节的概率p和1-p。
❖ 当参与人 i在他的某个信息集h上观察到其他
n-1个参与人行动组合 ahi ,条件概率 , pi (ti | ahi ) 是参与者i在观察到 ahi 的情况下,
对参与者的类型t-i的修改,这个修正产生
pi (ti | ahi )的推断称为后验概率
❖ 在例1图7-1中,设R(t11),R(t12)是参与人1的 两个战略。从而该博弈表示为完全但不完美
❖ 假定i属于类型tk的先验概率为
K
p(tk ) 0, p(tk ) 1 k 1
❖ 给定i属于tk,i选择ah的条件概率为
p(ah tk ), p(ah tk ) 1 h
❖ 则i选择ah的全概率是:
❖ 根据概率公式,观测到i选择了行 动ah,i属于类型tk的后验概率为:
p(ah tk ) p(tk ) p(ah t k ) p(t k )
❖ 参与人的行动是类型依存的,每个参与人的 行动都传递着有关自己类型的某种信息,

博弈论第7讲

博弈论第7讲
一些不完全信息的例子
与一个陌生人打交道 购买一幅艺术品 一个企业想进入某个市场 参与投标的各个厂商 消费者不知道企业产品的真正质量 用人单位不知道应聘者的真正水平和能力 二手车市场,买家不知道旧车的真正状况。。。。
一个简例:市场进入博弈
一个企业决定是否进入一个新的产业, 但不知道在位企业的成本函数,也不知 道一旦进入,在位者决定默许还是斗争。
海萨尼(Harsanyi)转换
我们将一个参与人所拥有的所有个人信 息称为他的类型(Types)
不完全信息意味着,至少有一个参与人 有多个类型(否则就成为完全信息博 弈)。
海萨尼(Harsanyi)转换
一般地,用θi表示参与人 的一个特定类 i 型,Θi表示参与人i的所有类型的集合, 即θi∈ Θi
应用举例1:不完全信息古诺 模型
E Z1=(1/2) q1(1- q1- q2L) + (1/2)q1(1-q1- q2H)
解最优化一阶条件,得企业1的反应函数为:
q1*=(1/2)(1-(1/2) q2L-(1/2) q2H)=(1/2)(1-E q2)
均衡意味着两个反应函数同时成立,解两个 反应函数,可得到贝叶斯均衡为 q1*=1/3; q2L*=11/24; q2H=5/24 作为练习,请与完全信息下的古诺模型产量 进行对比。
海萨尼通过引入虚拟的参与人——”自 然”(Nature),将不完全信息博弈转换 为完全但不完美信息的博弈,从而可用 完全信息博弈论进行处理,这就是著名 的“海萨尼转换”(Harsanyi Transformation)
海萨尼(Harsanyi)转换
图4.1就是市场进入博弈问题,经过海萨尼转换后,得 到的博弈树。 0 高 低 [P] [1-P] 进入者 不进入 进入 进入 不进入 (0, 300) (0, 400) 合作 斗争 斗争 合作 (40, 50) (-10, 0) (30, 80) (-10, 100) 图3-1 市场进入博弈

第七章 竞争型决策分析——博弈论 (《决策理论与方法》PPT课件)

第七章  竞争型决策分析——博弈论  (《决策理论与方法》PPT课件)

)为G的一个“纳什均衡”。
纳什均衡有强弱之分,以上是弱纳什均衡,也是最常用的纳什均衡概念,强纳什均衡是指每个博弈方对
于对手的策略有唯一的最佳反应,即
s
i
为严格纳什均衡,当且仅当对所有i,所有其他
sij

S i,均有:
ui
(s1 ,
,
s i1
,
si
,
s i1
,
, sn )

ui
(s1 ,
不难验证鞍点(i, j)是博弈 G {S , S ;A}的纳什均衡,鞍点又称纯策略纳什均衡。

i
两人有限零和博弈存在的鞍点的充要条件是支付矩阵中存在一个元素
1,2, , m ,j 1,2, , n,总有:
ai
j
,使对于一
aij ai j ai j
第二节 完全信息静态博弈
信息是博弈方有关博弈的知识。博弈方应尽可能多地收集有关博弈的信息,从而在采取策略进行决策 时掌握主动。
(五)博弈的次序
很多时候各博弈方的决策又必须有先后之分,并且,在一些博弈中每个博弈方还要作不止一次的决策选 择,这就免不了有一个次序问题。因此,规定一个博弈就必须规定其中的次序,不同的次序必然是不同的 博弈,即使其他方面都相同。
策问题。多人博弈是指有三个或三个以上博弈方参加的博弈。
第一节 竞争型决策分析与博弈论
(二)有限博弈和无限博弈
根据各博弈方可选策略数量的多少,将博弈分为有限博弈和无限博弈。有限博弈是指各个博弈方的 可选策略都是有限的博弈。无限博弈是指至少有某些博弈方的策略是无限多个的博弈。
(三)零和博弈、常和博弈和变和博弈
弈记作G {S , S ;A}。

07博弈论与企业策略性行为_产业经济学(王俊豪版)

07博弈论与企业策略性行为_产业经济学(王俊豪版)

第四节 合作策略性行为
(二)冷酷策略 冷酷策略(grim strategy)是指在重复博弈中, 只要所有的人都采取合作的策略,那么就一直合作 下去,如果有一方背叛了合作,那么合作就永远终 止,所有的人对此行为加以惩罚。
第四节 合作策略性行为
(三)胡萝卜加大棒策略 胡萝卜加大棒策略则是一个较为温和的策略。 开始所有的垄断企业都生产一个合作的低产量,相 应地利润也比较高,但是一旦有某个企业背离了这 个策略生产高产量时,所有的企业都调整为高产量 去惩罚他。如果任何一个企业在惩罚期不惩罚(对于 不执行惩罚策略的人给予惩罚是给予惩罚者的一个 胡萝卜),惩罚期重新开始。如果没有企业在惩罚期 不惩罚,合作期又重新开始。
第四节 合作策略性行为
三、明确合作策略性行为
明确合作策略性行为是指寡头企业通过公开或 秘密的协议(书面或秘密会谈)来协调行为以使合 作组织利润最大化的一种行为。
(一)共同成本手册与多产品定价公式 (二)转售价格维持(RPM) (三)基点定价
第四节 合作策略性行为
(四)一致-竞争条款 (五)价格领导 (六)预告价格变动 (七)最惠国待遇条款 (八)行业协会 (九)交换信息 (十)分割市场与固定市场份额
小约翰纳什(John Forbes Nash)是20 世纪最有才华的 数学家之一。他在22 岁的时 候所写的一篇只有20 多页的 论文奠定了博弈论的基础, 1994 年和另外两位经济学家 一起获得了诺贝尔经济学奖。
第一节 博弈与博弈论
到60年代,出现了一些重要人物,泽尔滕 (Selten)将纳什均衡的概念引入动态分析提出了 “精炼纳什均衡”的概念;海萨尼(Harsanyi)把不 完全信息引入博弈论研究。
掠夺性定价是指原有企业将价格削减至对手平 均成本之下,以便将对手驱逐出市场或者遏制进入, 即使遭受短期损失。一旦对手离开市场,原有企业 就会提高价格以补偿掠夺期损失(Schmalensee; Rosenbaum; Romano and Berg)。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验结果:百分比从第一组5个人匹配的43% 下降到最后5个人匹配的20%。可以看出, 参与人有合作的倾向,但当被试着获得经 验后,结验
C1(参与人 C2(参与人2) 2)
有两个纯策略纳什均衡
(R1,C2)和(R2,C1)。
还存在一个混合策略纳什 均衡,纳什理论预测选择 R2或C2的可能性是75%。
2(zz) 1/2,1 1,-1
7.2.2.2 囚徒困境博弈实 验
假定有两个潜在的进入新 市场者,决定进入(E) 或者不进入(N)。策略 组合如图所示:
N (参与人2) E (参与人2)
N(参与人1) 800,800
0,1000
E (参与人1) 1000,0
350,350
Cooper对此博弈进行了实验,实验中被试者 成对搭配,每个被试者仅碰到其他被试着 一次,被试者之间不能讨论问题和签订协 议。
支付矩阵如表所示:
纳什均衡策略为(2,1)
如果允许单边支付,冯.诺依 曼-摩根斯坦的非零和博弈 解是策略(1,2)。
Merrill报告了100次实验的结 果,pp得到0.4美元,zz得 到0.65美元。如此看来, 在现实的讨价还价中并没 有达到纳什均衡。
1(pp) 2(pp)
1(zz) -1,2 0,1/2
7.3.2埃克斯罗德重复博弈实验
支付矩阵如图。
合作B 背叛B 合作A 3,3 0,5 背叛A 5,0 1,1
第一次实验:共有15个策略。将每一策略分别和所有策略对 弈,每对策略对弈5次,每次200步,但对于参赛者而言, 什么时候结束博弈是未知的。参与人可以选择一下策略: ①“一报还一报”:第一回合合作,以后各回合均重复对 方在上一个回合中的策略:对方背叛,自己也背叛,对方 合作,自己也合作。②“弗里德曼策略”:这是一个缺乏 宽容的策略。他不首先背叛,但一旦对方背叛,就永远选 择背叛。③“道宁策略”:第一步背叛,然后每走一步, 估计自己合作或背叛之后对方合作的概率,如果对方似乎 仍然倾向于合作,则选择背叛,反之,则合作。④“乔斯 策略”:试图偶尔背叛而不受惩罚。若对方背叛则马上背 叛,但十次有一次是对方合作之后而背叛。
7.2.2实验研究
7.2.2.1纳什均衡与冯.诺依曼-摩根斯坦博弈解
实验假设:开始的阶段,人们的行为接近均衡点, 然后继续寻找更好的均衡点,最后阶段,参与人 的选择接近冯.诺依曼-摩根斯坦合作博弈解。参与 人之间的社会关系是影响博弈结果的重要因素。
假设有两个被试者PP和ZZ,他们已掌握零和博弈论, 同时知道冯.诺依曼-摩根斯坦非零和博弈论,但他 们不清楚纳什均衡理论。
7.2.2.4 n人博弈的实验
n人博弈实验的目的是为了观察同一批参与人反复进 行同一博弈的结果。这样可以使得谈判博弈具有 合作性。
G.Kalisch等做了一组n人博弈实验。在3人博弈中, 被试者被蒙住了眼睛,只能通过手势向仲裁人示 意他们的行动。在4人博弈中,每个被试人都坐在 其他人看不到的地方,他将自己的行动写在纸上。 3人博弈规则如下:
dB,C得到-(dA+ dB)。若 dA+ dB>15,3个人都得到0.若
形成一个联盟,这次博弈结束,3个人都得0.
若某个被试者(比如说A)第一步选择等待,且另一个被试 者向他提出了一个联盟叫价,则他就进行第二步,他要么 接受要么拒绝。两种情况下,这一次博弈都结束。第一种
情况下的支付是: A得到 d 15- B, B得到 dB, C得到-15.第
第七章-博弈论实验
7.2完全信息静态博弈实验
7.2.1基础理论 占优策略:是指不管竞争对手做什么,参与
人都是最优的策略。
纳什均衡:给定对手的行为,参与人自身的 最优选择。此时,参与人的策略是其他策 略的最优反映。
混合策略纳什均衡:参与人根据一组选定的 概率,在两种或两种以上可能的行动中随 机选择中得到纳什均衡。
• 重复博弈:同样结构的博弈重复多次,或者无数 次,其中的每次博弈称为“阶段博弈”。
• 特征:A、重复博弈的阶段,博弈之间没有“物 质”上的联系,即前一个阶段博弈并不改变后一 个阶段的博弈的结构;
• B、在重复博弈的每一个阶段,所有参与人都观 测到该博弈过去的历史;
• C、参与人的总收益是所有阶段博弈的收益的贴 现值之和或加权平均数。
R1(参与人 1)
R2(参与人 1)
0, 0 600,200
200,600 0,0
Cooper等的试验程序与囚徒困境博弈相同: 20个单期博弈中不同参与人相互被匹配, 使用策略2的被试者所占比重小于混合策略 预测的百分比。
Cooper等调查了允许无约束事前交流来解决 协助问题的可能性。在允许交流的情况下, 选择策略2的百分比变为80%,而被试者中 申明未协调选择的比重只有71%。
实验结果,得分最高的是“一报还一报”策 略。“弗里德曼”策略得分最低。埃克斯 罗德总结了排名靠前的策略的特点: ① 善
良性,即不做首先的背叛者。②可激怒性, 即针对对方的背叛行为给与报复 ③宽容性, 即不能没完没了的报复。
第二次实验:第二次实验规模更大,共有来 自6个国家63位参赛者,其中包括第一次实 验的所有参赛者。赛前,埃克斯罗德给每 位参赛者寄去了关于第一次比赛的分析报 告。每对策略仍对弈5次。
1、被试者A要么等待,要么提出一个叫价与被试者B或C其
中的一个结成联盟,这一叫价要列明A想得到的在将来联
盟中的份额dA(整数),参与人B和C也进行同样的第一
步——而且三个人要同时和独立地完成自己的选择。
若两个被试者(比如说A和B)彼此提出了叫价,且dA+
dB≤15,则博弈结束,并且支付如下: A得到 dA, B得到
二种情况下,3个参与人都得0.
实验结果表明,被试者选择等待策略的比 重只占了33%,而由一个被试者叫价另一 个接受而形成联盟的策略出现的比例较高。 实验结果说明同一批人反复进行同一个博 弈有利于形成合作博弈。
7.3完全信息动态博弈实验
7.3.1基础知识 逆向归纳法:该方法适用于有限次博弈, 并且参与人都是理性的,都清楚的知道博 弈树结构,参与人首先从博弈树的末端开 始,求解末端的子博弈均衡,然后继续向 前求解,直至起点。
相关文档
最新文档