第七章 博弈论实验讲解

合集下载

《博弈论:原理、模型与教程》第07章 子博弈精炼Nash均衡 第02节 子博弈精炼Nash均衡的求解

《博弈论:原理、模型与教程》第07章  子博弈精炼Nash均衡  第02节  子博弈精炼Nash均衡的求解

《博弈论:原理、模型与教程》第二部分完全信息动态博弈第7章子博弈精炼Nash均衡7.2 子博弈精炼Nash均衡的求解(重点!)(已精细订正!)定义7-1虽然给出了子博弈精炼Nash的定义,但没有说明如何求解子博弈精炼均Nash衡。

下面以图6-8 中扩展式博弈为例,介绍一种最常用的求解子博弈精炼Nash均衡的方法—逆向归纳法。

(讲!)考察图6-8中的博弈。

参与人1在博弈开始时(即在信息集}{)(11x I 上面临两种选择—行动A和行动B 。

参与人1此时选择哪种行动呢?对于理性的参与人1来讲,只会选择使自己支付最大化的行动。

从图6-8很容易知道参与人1选择行动B 时所得到的支付为2;但是,如果参与人1选择行动A ,则所得支付就要取决于参与人2在信息集}{)(22x I 上的选择,以及博弈达到决策结3x 时参与人1在信息集}{)(31x I 上的选择。

也就是说,参与人1选择行动A 所得支付,取决于子博弈)(2x Γ的结果。

因此,为了确定参与人1在博弈开始时的选择,就必须确定参与人1选择行动A 的所得支付,而为了确定参与人1选择行动A 的所得支付,就必须先求解子博弈)(2x Γ。

如何求解博弈)(2x Γ呢?可以采用同样的方法来求解子博弈)(2x Γ,即在求解子博弈)(3x Γ的基础上,确定参与人2在信息集}{)(22x I 上的选择,从而求解子博弈)(2x Γ。

由以上分析可以得到图6-8中博弈的求解过程:首先求解博弈树中最底层的子博弈)(3x Γ得到子博弈)(3x Γ的结果为(3,0)(即参与人1选择E );再求解博弈)(2x Γ,容易得到博弈的结果(1,1)(即参与人2选择D ); 最后求解原博弈,即子博弈)(1x Γ,得到博弈的结果为(2,1)(即参与人1选择B )。

(讲!)考察更一般的情形。

对于图7-6中的博弈树,参与人i 在信息集})({i i x I 选择行动L 还是行动R ,取决于选择行动L 和行动R 所带来的后果。

博弈论ch7ppt课件

博弈论ch7ppt课件
④ 无关选择公理:如果原来可行的选择没有被选择,去掉这 些‘无关’选择并不会影响讨价还价的结果。
精选课件ppt
24
对称性谈判局势
y
谈判唯一的理性结局 e
b
P
F
45o
a
x
精选课件ppt
25
纳什解——谈判唯一的理性解
max (x-a)h(y-b)k ——纳什福利函数
s.t. x+y=V(x,y) ——y=f ( x ) 就
精选课件ppt
33
改变谈判砝码
谈判砝码对达成什么样的分配协议具有决定性的意 义。如果双方预期分配是纳什解,他们可以通过在 谈判前的阶段以非合作博弈的方式改变(a,b)。从而 改变在第二阶段谈判时的相对优势。
可以将第一阶段的模型视为非合作博弈,每个人独
立地选择最优的a或b。
精选课件ppt
34
图示
他们之间如何分配这3000元?
精选课件ppt
38
① 该合作博弈的表述:B=(S,d;u1,u2)
参与人——画家、拍卖商 S——局中人共有的策略集(利润的分配方案) d——谈判破裂的结果,d∈S; ui——定义在S上的局中人i的效用函数,满足
对任意的s∈S,u1(s)≥ u1(d), u2(s)≥ u2(d); 至少存在一个s∈S,u1(s)> u1(d), u2(s)> u2(d);
安迪生产微芯片,他可以以900美元的价格卖给任何一 家计算机制造商。
比尔的软件包可以以100美元的价格进行零售。
两个人凑在一起,发现他们如果生产一个软硬件 的联合产品,可以卖到3,000美元。
他们之间如何分配这3000美元?
精选课件ppt
19
他们之间如何分配这3000美元?

博弈论最全完整-讲解PPT课件

博弈论最全完整-讲解PPT课件

王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
.
32
导论
四、主要参考文献
.
33
张维迎著,《博弈论与信息经济学》,上海三联书店、 上海人民出版社,1996年版。
Roger B. Myerson著:Game Theory(原文版、译文 版),中国经济出版社,2001年版。
是关于动态博弈进行过程之中面临决策 或者行动的参与人对于博弈进行迄今的 历史是否清楚的一种刻划。
如果在博弈进行过程中的每一时刻,面 临决策或者行动的参与人,对于博弈进 行到这个时刻为止所有参与人曾经采取 的决策或者行动完全清楚,则称为完美 信息博弈;否则位不完美信息。
.
30
零和博弈与非零和博弈
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
.
4
如何在博弈中获胜?
…… 真的能在博弈中(总是)获 胜吗?
对手和你一样聪明! 许多博弈相当复杂,博弈论并不
施锡铨编著,《博弈论》上海财大出版社,2000年版。
谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。
谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。

博弈论PPT课件

博弈论PPT课件

第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······

博弈论完整版PPT课件

博弈论完整版PPT课件

ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战

博弈论实验报告

博弈论实验报告

实验名称:最后通牒博弈实验目的:通过参与博弈实验进一步认识经济学关于“理性人”假设和竞争的关系,发现经济学中理性人假设、效用函数理论等存在的缺陷和不足之处,加深对竞争及经济人假设等经济思想的认知,检验社会偏好对博弈均衡的影响。

实验准备:在本实验中需要实验者收益记录表、实验者数据汇总表、实验数据统计总表等实验表格若干份。

实验内容:从参加实验的人当中,随机地选出两个人,配对进行博弈。

随机地指定A组一个人先行动,即A有权先选择行动策略,然后B再回应。

这个博弈中,A和B两人共同分配100元,这个100元是无条件地送给两人,但条件是他们必须对分配方案达成一致。

由A提出分配方案,比如说A占百分之60,B占百分之40。

这样的一个方案,B可以接受,也可以不接受,当B 接受了以后,实验者就把这100元按A的方案分配给他们两个人(模拟,最后据得益计算实验成绩,得益高者成绩也高):如果B不接受A提出的方案,AB两个就都什么也得不到。

所以,这里面有一个博弈的过程,因为B可以否决,如果觉得自己分得的太少了,不公平,可以否决A的方案,但否决的结果是自己也什么也得不到。

就是说B惩罚了A,自己也付出了成本,失去了本来可以得到的部分,最后双方都是0了。

实验过程:1.实验人员的选择和分组(1)实验人员的选择。

采用随机数或抽奖软件随机抽取若干名同学作为实验参与者,选取2名同学作为实验工作人员,负责发放相关表格和统计数据。

(2)分组。

将选定的实验参与者分成A、B两组,A组实验者为提议者,其编号为A1,A2,A3,...;B组实验者为响应者,其编号为B1,B2,B3,...(3)座位调整。

为了避免个人关系等因素的干扰,在实验过程中不能让两组实验参与者坐在一起,应让他们隔离相向坐于教室的左右两端。

2.发放实验材料向A组实验者发放写好编号的实验卡片,向所有实验参与者发放实验收益记录表。

向A组每位实验者发放100元虚拟货币。

3.宣读展示实验说明(1)每一位实验参与者都应收益的最大化为目标。

博弈论算法讲义范文

博弈论算法讲义范文

博弈论算法讲义范文
一、对局(Game)
1、定义:对局(Game)是由一个或多个策略者参与构成的有决策过程
的系统,一步步进行的,并且,策略者的行为往往会影响后续的行为。

2、基本假设:
(1)策略者相互独立,没有彼此通讯的机会;
(2)策略者在做出行动时都是理性的,也就是说,他们都认为能够
获得的利益最大化。

3、类型:
(1)博弈:指在决策过程中,双方的目标是相互对抗,差异方案最
大化,最终谁都不赢;
(2)友好博弈:指在决策过程中,双方的目标是协同合作,以共同
获利和最优解。

二、博弈论(Game Theory)
1、定义:博弈论(Game Theory)是用来研究博弈应用问题的数学理论,旨在分析和研究在对局中各个策略者互相作用对抗的结果。

2、组成:
(1)博弈模型:它是由一组策略者的全部可能行动和他们的后果,
以及他们的信息和有关产生的报酬及其图像,构成的决策系统;
(2)决策分析:根据博弈模型,分析不同攻击者使用的不同策略以及各自的收益;
(3)决策算法:根据系统的状况,实施一系列有效的决策算法,达到博弈模型期望的最优解;
(4)实验结果:实验的结果,通过比较和分析,证明博弈模型具有较高的准确性和有效性。

三、Nash均衡。

博弈论PPT解读

博弈论PPT解读
判断是否劣于某个混合策略,证 明Z不是劣策略
> 假定参与人1对参与人2的信念, 证明Z是最优反应策略

静态环境下的行为分析 (严格劣策略的重复剔除法)重复占优法留下可理性化策略,可理性化策略集
合为最优反应策略集合,可理性化策略基于某一信念无法剔除 R={(U,L)} R={A,B} X {X,Y}
博弈论
演讲人
2021-03-21
目录
01. 博弈的表述 02. 静态环境下的行为分析 03. 动态环境下的行为分析
01
博弈的表述
博弈的表述
扩展型表示博弈
信息集与决策节点的关系
策略
策略空间(策略集合)
S={H,L}
1
2
单个策略
s=H
策略组合
(A,B)
3
4
策略组合的集合
S={A,B}X{C,D}={(A, C ),(A,D),(B,C),(B,D)}
0
3
最后对剩下的策略进行 检验
两方博弈,最优反应策略集合=非严格劣策略集合,B=UD
找出参与人1以1的概率选择某策略时,参与人2的最优反应策略
在B中,因此也在UD中
两方博弈,最优反应策略集合=非严格劣策略集合,B=UD
找出劣于其他纯策略的策略
不在UD中,也不在B中
最后对剩下的策略 进行检验
(严格劣策略的重复剔除法)重复占优法留下可理性化策略,可理性化策略集合 为最优反应策略集合,可理性化策略基于某一信念无法剔除
R={(U,L)} R={A,B} X {X,Y}
静态环境下的行为分析
定位博弈与合伙人博弈
分阶段剔除劣策略从而获得可理性化策略的集合,当剔除所有劣策略时, 上界和下界都会收敛于各参与人最优反应曲线相交的点

博弈论最全完整ppt 讲解

博弈论最全完整ppt 讲解

完全信息
纳什均衡(NE)
子博弈完美纳什 均衡(SPNE)
不完全信息
贝氏纳什均衡 (BNE)
完美贝氏纳什均衡 (PBNE)及序贯均 衡(SE)
静态博弈与动态博弈
(static games and dynamic games)
同时决策或者同时行动的博弈属于静态 博弈;先后或序贯决策或者行动的博弈, 属于动态博弈
如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为一个常数, 这个博弈就叫常和博弈;
相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为一 个常数,这个博弈就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英国
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进 行分析”领域做出了重要贡献。
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈

博弈论最全完整-讲解课件

博弈论最全完整-讲解课件
(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。

博弈论课件

博弈论课件

脚的看牌人、看棋人,企业的顾问等。
对参与人的决策来说,最重要的是
必须有可供选择的行动集(策略集)和
一个很好定义 的支付函数。
自然被当作虚拟参与人。
清华诚志
10
(2)策略(strategies ):博弈中有两种策略
概念,一种为纯策略(pure strategy ), 简称策略, 指参与人在博弈中可以选择采用的行动(actions or moves)方案,是参与人在给定信息结构的情况 下的行动规则,它规定参与人在什么时候的什么情
囚徒困境反映了个人理性和集体理性的矛盾。如果 A和B都选择抵赖,各判刑1年,显然比都选择坦 白各判刑8年好得多。当然,A和B可以在被警察 抓到之前订立一个"攻守同盟",但是这可能不会有 用,因为它不构成纳什均衡,没有人有积极性遵守 这个协定,显然最好的策略是双方都抵赖.
清华诚志
5
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到自己,这样他 们必然要服长的刑期。只有当他们都首先替 对方着想时,或者相互合谋(串供)时,才可 以得到最短时间的监禁的结果。
清华诚志
26
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的思想, 每个个体都是理性的,所以必须了解竞争对手的思 想。商业关系被认为是一种相互作用。但博弈论并 不是疗法,并不是处方,它并不告诉你该付多少钱 买东西,这是计算机或者字典的任务。博弈论只是 提供一些关系的例证,一些有用的解决问题的方法。 这种思维方法也许是企业家应该学习的。对于经济 学家,也许需要学习它的理论模型,它的实验方式 。

第七章博弈模型与竞争策略(微观经济学-清华大学施祖麟)

第七章博弈模型与竞争策略(微观经济学-清华大学施祖麟)

-1, 1
-1, 1
1, -1
2021/7/31
博弈模型与竞争策略
不完全信息静态对策
警卫与窃贼的博弈
警卫睡觉,小偷去偷,小偷得 益B,警卫被处分-D。
警卫不睡,小偷去偷,小偷被 抓受惩处-P,警卫不失不 得。
警卫睡觉,小偷不偷,小偷不 失不得,警卫得到休闲R。
警卫不睡,小偷不偷,都不得 不失。
偷 不偷
第七章博弈模型与竞争 策略(微观经济学-清华大
学施祖麟)
2021年7月31日星期六
博弈模型与竞争策略
现代经济学越来越转向研究人与人之 间行为的相互影响和作用,人与人之 间的利益冲突与一致,人与人之间的 竞争和合作。 现代经济学注意到个人理性可能导致 集体非理性(矛盾与冲突)。
2021/7/31
博弈模型与竞争策略
2.静态对策和动态对策(决策时间同时 或有先后秩序,能否多阶段、重复进 行)
3.完全信息对策和不完全信息对策(是 否拥有决策信息)
4.对抗性对策和非对抗性对策(根据收 益冲突的性质)
2021/7/31
博弈模型与竞争策略
博弈分类
静态
动态
完全 信息
完全信息静态对策,完全信息动态对策,
纳什均衡。
子对策完美纳什均衡。
警卫睡觉的期望得益
R
小偷认为警卫不会愿意得益为
负,最多为零,即
R/D= P偷/ ( 1- P偷)
0
小偷偷不偷的概率等于R与D
的比率。
P偷 1
小偷偷 的概率
D
2021/7/31
博弈模型与竞争策略
不完全信息静态对策
同样的道理警卫偷懒(睡觉) 的概率P睡,决定了小偷的得 益为: (-P) ( 1- P睡) + (B) P睡

第七章 博弈

第七章 博弈
21
§7-2 完全信息博弈
二、完全信息动态博弈
参与人集合
(二)博弈的扩展式表达
参与人的行动顺序
进入者
O

不进
扩展式要素
参与人的行动空间 参与人的信息集 参与人的得益函数
x •在位者 x’•

打默

击许
(40,•50)(-10•,0) (0,3•00)
在位者
打 击
(0,•300)
外生事件

决策结 终点结
进 进入 入 者 不进入
在位者 默许 打击
40, 50 0, 300
-10, 0 0, 300
静态市场进入模型
20
§7-2 完全信息博弈
二、完全信息动态博弈 (一)定义
各博弈方先后行动,后行动者知道先行动者的具体行动是什么 且各博弈方对博弈中各种策略组合情况下所有参与人相应的得 益都完全了解的博弈。
囚徒困境
劣策略
占优策略均衡(dominant-strategy equilibrium)
2、严格劣策略的重复剔除
14
§7-2 完全信息博弈
严格劣策略重复剔除博弈1
Bቤተ መጻሕፍቲ ባይዱ



上 A
1, 0
下 0, 4
1, 3 0, 1 0, 2 2, 2
A无占优策略 B的“右策略”严格劣于“中策略”
15
§7-2 完全信息博弈
所有博弈方的得益总和等于非零的常数。 例如若干人分配一份总额既定的财产乃典型的常和博弈。
7
§7-1 博弈论的基本概念与应用
三、博弈论的基本概念
(三)博弈的分类
1、 静态博弈 动态博弈

博弈论

博弈论

┊┊┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊┊┊博弈论实验报告实验一实验名称:囚徒的困境实验地点:经济综合实验室实验目的:验证公共产品私人投资的市场失灵问题实验内容我们要进行一个卡片游戏,每个同学都会和另一位同学组成一组(由教师指定)。

每个人都将拿到两张扑克牌,一张是红色的(红桃或者方块),一张是黑色的(黑桃或者梅花)。

牌上的数字或者图案不重要,关键是看颜色。

游戏开始后,每个人将一张牌放在自己的胸口(牌面朝里,别让他人看到你出什么牌),这样我们可以知道你已经作出决定,但是不知道这个决定是什么。

你出的牌和小组里另一位同学出的牌一起决定你的收益。

假如你出红牌,另一位同学出红牌,你将得到 3 元;假如另一位同学出黑牌,你将得到 0 元。

假如你出黑牌,另一位同学出红牌,你将得到 5 元;假如另一位同学出黑牌,你将得到 2 元。

总结一下:你的收益= 3 元,假如你出红牌,另一位出红牌;0 元,假如你出红牌,另一位出黑牌。

5 元,假如你出黑牌,另一位出红牌;2 元,假如你出黑牌,另一位出黑牌。

在你决定好出什么牌之后,把牌放到自己的胸口。

接下来,我们会宣布你和谁组成一组。

注意,每期你将和不同的人搭配。

小组成员之间不允许以任何方式沟通。

然后,你们同时公布你们的出牌。

并在下面的表格里做好记录。

在各轮游戏结束后,我们会按照您表格中记录的收益赋予相应的分数。

在第二阶段游戏中,游戏规则与前者基本一样,唯一不同的是:在教师为各位参与者配置了游戏小组后,允许二者在出牌之前进行口头沟通。

然后再进行三轮实验。

实验步骤第一步:实验者对实验进行说明。

第二步:实验。

实验者对每次实验进行记录(共进行三轮)。

第三步:统计分析结果,并讲评。

实验结果┊┊┊┊┊┊┊┊┊┊┊┊┊┊┊装┊┊┊┊┊订┊┊┊┊┊线┊┊┊┊┊┊┊┊┊┊┊┊┊┊┊1、单次实验单次实验的结果理论上有四种,即假如你出红牌,另一位出红牌你的收益为3;假如你出红牌,另一位出黑牌,你的收益为0;假如你出黑牌,另一位出红牌,你的收益为5;假如你出黑牌,另一位出黑牌,你的收益为2。

博弈论第7讲

博弈论第7讲
一些不完全信息的例子
与一个陌生人打交道 购买一幅艺术品 一个企业想进入某个市场 参与投标的各个厂商 消费者不知道企业产品的真正质量 用人单位不知道应聘者的真正水平和能力 二手车市场,买家不知道旧车的真正状况。。。。
一个简例:市场进入博弈
一个企业决定是否进入一个新的产业, 但不知道在位企业的成本函数,也不知 道一旦进入,在位者决定默许还是斗争。
海萨尼(Harsanyi)转换
我们将一个参与人所拥有的所有个人信 息称为他的类型(Types)
不完全信息意味着,至少有一个参与人 有多个类型(否则就成为完全信息博 弈)。
海萨尼(Harsanyi)转换
一般地,用θi表示参与人 的一个特定类 i 型,Θi表示参与人i的所有类型的集合, 即θi∈ Θi
应用举例1:不完全信息古诺 模型
E Z1=(1/2) q1(1- q1- q2L) + (1/2)q1(1-q1- q2H)
解最优化一阶条件,得企业1的反应函数为:
q1*=(1/2)(1-(1/2) q2L-(1/2) q2H)=(1/2)(1-E q2)
均衡意味着两个反应函数同时成立,解两个 反应函数,可得到贝叶斯均衡为 q1*=1/3; q2L*=11/24; q2H=5/24 作为练习,请与完全信息下的古诺模型产量 进行对比。
海萨尼通过引入虚拟的参与人——”自 然”(Nature),将不完全信息博弈转换 为完全但不完美信息的博弈,从而可用 完全信息博弈论进行处理,这就是著名 的“海萨尼转换”(Harsanyi Transformation)
海萨尼(Harsanyi)转换
图4.1就是市场进入博弈问题,经过海萨尼转换后,得 到的博弈树。 0 高 低 [P] [1-P] 进入者 不进入 进入 进入 不进入 (0, 300) (0, 400) 合作 斗争 斗争 合作 (40, 50) (-10, 0) (30, 80) (-10, 100) 图3-1 市场进入博弈

博弈论精品课件 (7)

博弈论精品课件 (7)
以下条件 的战略与信念构成: (3) 参与人在均衡路径信息集上的信念设定 应满足与战略一致性原则,即通过贝叶 斯法则与参与人的均衡战略来确定; (4) 参与人在非均衡路径信息集上的信念设 定应满足结构一致性原则,即通过贝叶 斯法则和参与人可能的均衡战略来确定。
1 2
共同信念
• 指所有参与人在任一信息集(包括给定战 略下能够到达的信息集与未能到达的信 息集)上的信念相同。
精炼贝叶斯Nash均衡
主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较
• 精炼贝叶斯Nash均衡是Selten子博弈精炼 Nash均衡的“均衡精炼”的思想,在不 完全信息扩展式博弈中的自然推广。
R
L
R L
2
R L
R L
2
R
L
R
x p (t1 L)
1 p1 p1 1 p1 1 p2 1 p3 p1 p2 p3
1 p2 p2 1 p1 1 p2 1 p3 p1 p2 p3 1 p3 p3 1 x x p (t3 L) 1 p1 1 p2 1 p3 p1 p2 p3 x p (t2 L)
精炼贝叶斯Nash均衡
主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较
精炼贝叶斯Nash均衡
主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较
• 在完全信息动态博弈中,假设s*为一子博 弈精炼Nash均衡,那么在参与人采用均 衡战略s*的情况下,不管博弈的进程如何 或是否发生,每个参与人的战略对从任 一决策结开始的子博弈(或在其后轮着他 采取的行动)都是最优的。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Cooper等调查了允许无约束事前交流来解决 协助问题的可能性。在允许交流的情况下, 选择策略2的百分比变为80%,而被试者中 申明未协调选择的比重只有71%。
7.2.2.4 n人博弈的实验
n人博弈实验的目的是为了观察同一批参与人反复进 行同一博弈的结果。这样可以使得谈判博弈具有 合作性。
G.Kalisch等做了一组n人博弈实验。在3人博弈中, 被试者被蒙住了眼睛,只能通过手势向仲裁人示 意他们的行动。在4人博弈中,每个被试人都坐在 其他人看不到的地方,他将自己的行动写在纸上。 3人博弈规则如下:
二种情况下,3个参与人都得0.
实验结果表明,被试者选择等待策略的比 重只占了33%,而由一个被试者叫价另一 个接受而形成联盟的策略出现的比例较高。 实验结果说明同一批人反复进行同一个博 弈有利于形成合作博弈。
7.3完全信息动态博弈实验
7.3.1基础知识 逆向归纳法:该方法适用于有限次博弈, 并且参与人都是理性的,都清楚的知道博 弈树结构,参与人首先从博弈树的末端开 始,求解末端的子博弈均衡,然后继续向 前求解,直至起点。
假设有两个被试者PP和ZZ,他们已掌握零和博弈论, 同时知道冯.诺依曼-摩根斯坦非零和博弈论,但他 们不清楚纳什均衡理论。
支付矩阵如表所示:
纳什均衡策略为(2,1)
如果允许单边支付,冯.诺依 曼-摩根斯坦的非零和博弈 解是策略(1,2)。
Merrill报告了100次实验的结 果,pp得到0.4美元,zz得 到0.65美元。如此看来, 在现实的讨价还价中并没 有达到纳什均衡。
混合策略纳什均衡:参与人根据一组选定的 概率,在两种或两种以上可能的行动中随 机选择中得到纳什均衡。
7.2.2实验研究
7.2.2.1纳什均衡与冯.诺依曼-摩根斯坦博弈解
实验假设:开始的阶段,人们的行为接近均衡点, 然后继续寻找更好的均衡点,最后阶段,参与人 的选择接近冯.诺依曼-摩根斯坦合作博弈解。参与 人之间的社会关系是影响博弈结果的重要因素。
350,350
Cooper对此博弈进行了实验,实验中被试者 成对搭配,每个被试者仅碰到其他被试着 一次,被试者之间不能讨论问题和签订协 议。
实验结果:百分比从第一组5个人匹配的43% 下降到最后5个人匹配的20%。可以看出, 参与人有合作的倾向,但当被试着获得经 验后,结果接近于纳什均衡,即不合作。
7.5.2蜈蚣博弈实验研究
传递 传递 传递 传递 传递 →→→→→ 接受↓ 接受↓ 接受↓ 接受↓ 接受↓ 0.4 0.2 1.6 0.8 6.4 0.1 0.8 0.4 3.2 1.6 8% 41% 38% 10% 2%
第二行是Red的收益,第三行为Blue的 收益,最后一行为结果比例。
从上表可以看出,参与人的行为与逆向 归纳法所预测的结果不一致。Mckelvey和 Palfrey的解释是被试者是利他主义的,他出一个叫价与被试者B或C其
中的一个结成联盟,这一叫价要列明A想得到的在将来联
盟中的份额dA(整数),参与人B和C也进行同样的第一
步——而且三个人要同时和独立地完成自己的选择。
若两个被试者(比如说A和B)彼此提出了叫价,且dA+
dB≤15,则博弈结束,并且支付如下: A得到 dA, B得到
7.4.2最后通牒式议价谈判博弈实验
最后通牒式议价谈判博弈实验的一般模 式为:博弈双方就一个定数c的份额分配进 行一次讨价还价。一方为开价者,他提出 的分配方案为给对方x,自己留下c-x。如果 被开价者接受方案,则谈判达成一致,否 则就破裂。
为了考察非对称激励机制对议价结果的影响,李竹渝
等分别在三天的实验中设计了由谈判博弈的外部组织者的 干预使得博弈双方的收益/激励呈非对称的3种不同的实验 规则。
也就是说公平性在很大程度上影响着分 配结果。
7.5不完全信息动态博弈实验
蜈蚣博弈:
运用逆向归纳法可以得出,参与人A在 博弈开始时会直接选择D,两人收益都为1.
很显然这种结果是非帕累托最优的。如果 AB合作,则双方都可以获得高收益。由于 A首先选择R而不是D,在随后的子博弈中, 即使B选择了D,A仅遭受1单位损失,但是 如果B选择r,则A的收益永远不会小于1, 而且很有可能获得相当可观的收益。但是B
dB,C得到-(dA+ dB)。若 dA+ dB>15,3个人都得到0.若
形成一个联盟,这次博弈结束,3个人都得0.
若某个被试者(比如说A)第一步选择等待,且另一个被试 者向他提出了一个联盟叫价,则他就进行第二步,他要么 接受要么拒绝。两种情况下,这一次博弈都结束。第一种
情况下的支付是: A得到 d 15- B, B得到 dB, C得到-15.第
实验结果可以观察到开价者要求的分配额 度集中于12点的有6组,分别分布在三种实 验规则中。而要求14点的有5组,也分布在 三组规则中,而要求平均分配的发生在第 一第二种规则中。
Roth等在美国、以色列、日本、前南 斯拉夫进行了该项实验,并重复进行了该 试验。
结果是所有国家参与人都是各取一半。 具体为美国和前南斯拉夫各取50%,以色 列、日本提议人得60%,后者分取40%。
究竟是一位合作者还是短期利益至上者, 只有B自己知道。因此,B具有完全信息, 而A不具有。
后行动者能够观察到先行动者的行为, 但不知道先行动者的类型。因为参与人的 行动是互相依存的,先行动者可以设法对 后行动者传递对自己最有利的信息,后者 可以选择自己的最优行为。所以动态博弈 过程不仅是参与人选择行动的过程,而且 是不断修正信念的过程。
7.3.2埃克斯罗德重复博弈实验
支付矩阵如图。
合作B 背叛B 合作A 3,3 0,5 背叛A 5,0 1,1
第一次实验:共有15个策略。将每一策略分别和所有策略对 弈,每对策略对弈5次,每次200步,但对于参赛者而言, 什么时候结束博弈是未知的。参与人可以选择一下策略: ①“一报还一报”:第一回合合作,以后各回合均重复对 方在上一个回合中的策略:对方背叛,自己也背叛,对方 合作,自己也合作。②“弗里德曼策略”:这是一个缺乏 宽容的策略。他不首先背叛,但一旦对方背叛,就永远选 择背叛。③“道宁策略”:第一步背叛,然后每走一步, 估计自己合作或背叛之后对方合作的概率,如果对方似乎 仍然倾向于合作,则选择背叛,反之,则合作。④“乔斯 策略”:试图偶尔背叛而不受惩罚。若对方背叛则马上背 叛,但十次有一次是对方合作之后而背叛。
1(pp) 2(pp)
1(zz) -1,2 0,1/2
2(zz) 1/2,1 1,-1
7.2.2.2 囚徒困境博弈实 验
假定有两个潜在的进入新 市场者,决定进入(E) 或者不进入(N)。策略 组合如图所示:
N (参与人2) E (参与人2)
N(参与人1) 800,800
0,1000
E (参与人1) 1000,0
• 重复博弈:同样结构的博弈重复多次,或者无数 次,其中的每次博弈称为“阶段博弈”。
• 特征:A、重复博弈的阶段,博弈之间没有“物 质”上的联系,即前一个阶段博弈并不改变后一 个阶段的博弈的结构;
• B、在重复博弈的每一个阶段,所有参与人都观 测到该博弈过去的历史;
• C、参与人的总收益是所有阶段博弈的收益的贴 现值之和或加权平均数。
实验结果是“一报还一报”再次荣获第一名, 并且第二次比赛再次证明第一次比赛的结 论是成立的。
第三次实验:埃克斯罗德假设博弈者所组成 的群体是一代一代进化下去的。他把个体 的得分看作个体的后代期望数,谁在第一 轮中的得分高,他在第二轮的群体所占的 比例就高。这样较优的策略就能繁衍更多 的后代,较差的策略就会被抑制,直至灭 绝。结果,“一报还一报”从第二代开始 扩大,在整个过程中一直领先。到1000代, “一报还一报”是最成功的策略,并且增 长的最快。
第七章
博弈论实验
7.1博弈论基础知识
7.1.3博弈论与实验博弈论 实验博弈由以下三个基本要素构成:实验 所要达到的目的;实验必备的信息;游戏 规则。
7.2完全信息静态博弈实验
7.2.1基础理论 占优策略:是指不管竞争对手做什么,参与
人都是最优的策略。
纳什均衡:给定对手的行为,参与人自身的 最优选择。此时,参与人的策略是其他策 略的最优反映。
7.4不完全信息静态博弈实验
在现实情境中,信息往往是不充分的,人们 在决策时不能了解所有信息。海萨尼提出了处理 不完全信息博弈的方法。即每个参与人的偏好是 一个随机变量,这个随机变量实现的事前概率分 布被假设为所有参与人的共同知识。这就是“海 萨尼转换”。
这种参与人不了解其他参与人选择的完全信 息,但却有其他参与人类型概率分布的完全信息 博弈称为“完全但不完美信息博弈”。
7.2.2.3含混和策略纳什 均衡的博弈实验
C1(参与人 C2(参与人2) 2)
有两个纯策略纳什均衡
(R1,C2)和(R2,C1)。
还存在一个混合策略纳什 均衡,纳什理论预测选择 R2或C2的可能性是75%。
R1(参与人 1)
R2(参与人 1)
0, 0 600,200
200,600 0,0
Cooper等的试验程序与囚徒困境博弈相同: 20个单期博弈中不同参与人相互被匹配, 使用策略2的被试者所占比重小于混合策略 预测的百分比。
第一天的规则定为博弈双方如未能达成一致,除参加试验的 基本支付外,博弈双方谈判破裂的收益都为0。
第二天的规则是在谈判破裂时,开价者的冲突点支付上升为 8点,而接受者仍为0点。
第三天在谈判破裂时,开价者的冲突点支付上升为8点,而 接受者仍为2点。如接受者接受了开价者的报价,判断谈 判达成一致,接受者将分别获得开价者分配的x点,而开 价者得20-x点。
实验结果,得分最高的是“一报还一报”策 略。“弗里德曼”策略得分最低。埃克斯 罗德总结了排名靠前的策略的特点: ① 善
良性,即不做首先的背叛者。②可激怒性, 即针对对方的背叛行为给与报复 ③宽容性, 即不能没完没了的报复。
相关文档
最新文档