6 重复博弈和策略性行动(2)
重复性博弈
为什么我不首先采取合作态度——把价格定在垄 断价格呢?
© 2011-13 王秋石
3/100
重复性博弈:日常生活
在公交车上,我们很少为素不相识的乘客买车票 ,因为这大凡是一次性博弈。
无限次重复性博弈就是可以无限次数地、重复性 地玩的一种博弈。
© 2011-13 王秋石
7/100
有限次重复性博弈
假定我们知道囚犯困境博弈只玩十次,现在就是 最后一次,结果会如何呢?最后玩的那次博弈就 像只玩一次的博弈。因此,两者的结果应该是相 同的。
第九轮会如何呢?我们已知在第十轮双方都会承 认犯罪,为什么在第九轮就要合作呢?
在囚犯困境的重复性博弈中,大家都清楚地知道 ,合作的巨大收益提供了合作的正面激励,对方 的有效威胁和潜在伤害则提供了合作的负面激励 。
© 2011-13 王秋石
2/100
重复性博弈:价格
在固定价格的一次性博弈中,哪怕有约在先,双 方都保持垄断价格同时分享市场需求,最后的均 衡为各自采用竞争性价格获得零经济利润。
无限次重复性博弈所形成 的合作均衡解并不是稳定 的,它较为容易被打破。
© 2011-13 王秋石
9/100
序列博弈
到目前为止所讨论的博弈都是两个选手要同时选 择策略。例如,在古诺模型中,两家企业同时决 定产量。
在序列博弈中,选手们按先后顺序进行选择。因 此,序列博弈就是选手依次出招的博弈。
30/100
可信的威胁
© 2011-13 王秋石
31/100
可信的威胁
重复博弈的详细介绍
• 一报还一报战略的胜利对人类和其他生物 的合作行为的形成具有深刻地含义。
• 爱克斯罗德在《合作进化》一书中指出, 一报还一报战略能导致社会各个领域的合 作,包括在最无指望的环境中的合作。
• 典型的例子就是越战中自发产生的“自己 活,也让他人活”的原则:只要对方不开 枪伤人,我也不开枪。
一报还一报—自然界的例子
• 猜想:杀鸡儆猴的效应
单阶段博弈矩阵
支付 在位者
进入者
进入
默许 3,3
斗争 -1,0
不进入
1,10
1,10
纳什均衡为:在位者在每一个市场选择默许,进入者在 每一个市场选择进入。
单阶段扩展式博弈
k
I A
F
C
O
1,10
-1,0
3,3
阶段博弈的子博弈精炼纳什均衡为:在位者在每一个市 场选择默许,进入者在每一个市场选择进入。
• 该博弈存在唯一的Nash均衡,即(U,L)。
• 同时注意到,该博弈还存在一个高效均衡(D, R),高效均衡对应着一种合作行为。
• 为什么高效的均衡不是纳什均衡?如何保证 这一高效均衡能够实现?
两次重复博弈的博弈树
假设将上述博弈重复两次,那么第二次博弈开始 时,第一次博弈的结果可视为已知。
1
2 1
平均收益
给定贴现率 ,无限的收益序列1,2,3
的平均收益为
(1 ) t1t
t 1
阶段博弈收益 相等时的总收益
所以
故
2 t1t t 1
1
t1 t
t 1
(1 ) t1t t 1
重复博 弈总收益
无限次重复博弈的无名氏定理:
• 令G为一个n人阶段博弈,令(e1,e2, ,en ) 为G的
博弈论07 重复博弈2
博弈论重复博弈重复博弈就是同样结构的博弈重复进行。
例如,囚徒困境、情侣博弈等重复进行多次时,每次都是相同的博弈,就是重复博弈。
重复博弈关系在现实中具有普遍性。
社会经济活动中除了短期一次性关系外,大量存在的是长期反复的合作和竞争关系。
重复博弈每次重复进行的博弈称为阶段博弈,或基本博弈,或原博弈。
重复博弈在理论上属于动态博弈,但重复进行的阶段博弈本身可以是静态博弈,也可以是动态博弈。
可以是完全信息重复博弈,也可以是不完全信息重复博弈。
本节讨论完全信息重复博弈。
博弈的重复是否会改变局中人的均衡策略,与重复次数及信息对称与否有关。
按重复次数可以分为有限次重复博弈和无限次重复博弈。
重复博弈的策略由于重复博弈中每个局中人在每个阶段都必须行动,因此局中人的一个策略就是在每个阶段针对每种情况(以前各阶段的结果)如何行动的整体计划。
因为重复博弈中其他局中人过去行动的历史是可以观测到的,所以一个局中人可以使自己在某个阶段的选择依赖于其他局中人过去的行动历史。
例如,囚徒困境博弈中,“如果你这次选择了坦白,我下次将选择坦白;如果你这次选择了抵赖,我下次将选择抵赖。
”重复博弈的策略也就是说,一个策略是一个完备的相机行动规则,它明确了在每一种可能的情况下局中人的行动选择。
因此,局中人在重复博弈中的策略空间远远大于和复杂于在每一个阶段博弈中的策略空间。
重复博弈的策略也就是说,一个策略是一个完备的相机行动规则,它明确了在每一种可能的情况下局中人的行动选择。
因此,局中人在重复博弈中的策略空间远远大于和复杂于在每一个阶段博弈中的策略空间。
重复博弈的策略也就是说,一个策略是一个完备的相机行动规则,它明确了在每一种可能的情况下局中人的行动选择。
因此,局中人在重复博弈中的策略空间远远大于和复杂于在每一个阶段博弈中的策略空间。
重复博弈的策略也就是说,一个策略是一个完备的相机行动规则,它明确了在每一种可能的情况下局中人的行动选择。
因此,局中人在重复博弈中的策略空间远远大于和复杂于在每一个阶段博弈中的策略空间。
经济学 博弈论
经济学博弈论
经济学中的博弈论是一个重要的分支领域,它研究的是在多个参与者之间互动决策的情境下,他们可能采取的不同策略以及相应的结果。
博弈论在经济学中有广泛的应用。
下面是一些博弈论的基本概念和常见的博弈类型:
1. 策略(Strategies):参与者在博弈中可选择的行动或决策。
2. 支配策略(Dominant Strategies):一种策略在所有情况下都会产生更好的结果,无论其他参与者选择什么策略。
3. 纳什均衡(Nash Equilibrium):在博弈中,当每个参与者都选择了对自己最有利的策略,并且没有动机单独改变策略时,达到的状态就是纳什均衡。
4. 合作与背叛(Cooperation and Betrayal):博弈中参与者可以选择合作或背叛其他参与者,涉及到合作博弈和非合作博弈的概念。
5. 零和博弈(Zero-sum Game):参与者的利益总和为零,一个人的收益增加意味着其他人的收益减少。
6. 非零和博弈(Non-zero-sum Game):参与者的利益总和不一定为零,可以存在合作使得所有参与者都获益的可能性。
7. 重复博弈(Repeated Games):博弈过程会重复进行多次,参与者的策略可能受到之前行动的影响。
这些只是博弈论的基本概念,实际应用中还有更多复杂的情况和模型。
博弈论在经济学中可以用来分析市场竞争、企业战略、拍卖、资源分配等众多领域。
它对于理解和预测人类行为决策的影响具有重要意义。
博弈论读后感
博弈论读后感博弈论读后感(一)博弈小术语:收益矩阵、均衡、纳什均衡、零和博弈论,也称互动的决策论。
它的基本假设之一是人是理性的。
但现实并非如此,人不可能具有完备的知识也不可能时时理性。
尽管如此,人们仍然乐意用博弈论的方法来解释和分析现实社会现象。
每一次的人际交往都可以简化成两个基本选择:合作或背叛。
比如在前面的日志里提到的囚徒困境,在人际交往中普遍存在囚徒困境:双方明知合作能带来双赢,却因为理性的自私和信任的缺乏而导致合作难以形成。
当一次性博弈出现时,人们往往会选择背叛。
这在现实生活中也有很多例子,比如飞机场,为什么食品价格敢定那么高呢?因为它知道候机的乘客不会是它的长期客户。
而当博弈的终点不可知时,就又是另一回事了。
在多次博弈中,背叛仍不可避免,但合作的几率会相比一次博弈有提高。
至于如何更加有效地减少背叛,一种办法是引入惩罚机制,可以是带剑的法律或温和些的道德约束。
现实中的集体活动等候上车问题就是个例子,让那些迟到的人自己负责任就是一种惩罚措施。
当然,如果在开头就有一些善意的人出来表明合作态度对提高合作机会也是有帮助的,不管这些善意的人是出于何种目的。
一旦合作开始,人们就能体验到合作的好处,并乐于坚持一段时间。
至于时间的长短,关键是看博弈的终点是否明确。
这在上面也提到了,如果终点明确,人们就会倾向于在最后一次背叛。
而当大家都知道对方会这样想时,倒数第二次就会成为新的终点,新的背叛。
如此反复推演,合作从一开始就很难形成。
注意上面的论述是基于没有惩罚机制的基础。
有一个很有意思的实验,是由爱克斯罗德完成的。
这是一个计算机模拟竞赛,参赛的62位科学家递交了自己写的关于博弈策略的代码,同时加上爱克斯罗德本人写的一个随即策略代码,共63个。
结果表明,前15名中只有第8名是非善意的程序,最后15名只有一个善意的,夺魁的是一报还一报策略。
这个实力不凡的一报还一报策略就是对方选择什么我就回应什么,你合作我就合作,你背叛我也背叛。
博弈论与企业策略性行为
第一节 博弈与博弈论
一、博弈论概述
现代博弈理论的创立源于匈牙利数学家冯· 诺 伊曼(Von Neumann)于1944年,与经济学家奥斯 卡· 摩根斯坦恩(Oskar Morgenstern)合作出版的巨 著《博弈论与经济行为》,这标志着现代系统博弈 理论的初步形成。博弈论分为合作博弈与非合作博 弈。
第二节 新产业组织学与策略性行为
一、产业组织理论的发展阶段
迄今为止,产业组织理论研究的发展大致经历
了两个阶段:
第一阶段是基本完成于20世纪60年代并在后来
仍然具有很大影响力的传统产业组织理论(TIO), 它主要包括以市场结构研究为核心内容(SCP范式) 的哈佛学派和以市场行为研究为核心内容的芝加哥 学派;
策略性行为的研究方法主要是博弈论和信息经 济学的运用。策略性行为研究的应用主要是为现实 的市场现象提供理论解释,并为反托拉斯分析提供 理论依据。
第三节 合作策略性行为
合作策略性行为是指企业旨在协调本行业各家企
业行动和限制竞争而采取的一些行为。对于合作策略
性行为的研究源于卡特尔合谋(collusion)理论。
论在经济学中的绝大多数应用模型都是在70年代中
期以后发展起来的。从80年代开始,博弈论逐渐成
为主流经济学的一部分。
第一节 博弈与博弈论
二、博弈论的主要内容
一个完整的博弈应至少包含如下三项要素:(1) 博弈的参加者,也称为局中人或博弈方。(2)策略 空间。是指各博弈方可选择策略的集合。(3)局中 人的盈利函数。 按照局中人行动的先后次序,如果局中人同时选 择行动,称为静态博弈。如果局中人的行动有先后顺 序,后行动者可以观察到先行动者的行动,并在此基 础上采取自己最有利的策略,称为动态博弈。
管理经济学第六章博弈论和策略行为
案例6-2:性别之战 两个谈恋爱的人准备在周末晚上一起出去。男 的喜欢听音乐会,但女的喜欢看电影。当然,两个 人都不愿意分开活动。 不同的选择给他们带来的满足由表 2表示。
女
音乐会 电 影
音乐会
2 , 1 -1 , -1
男
电 影 -1 , -1 1 , 2
在这样一个对局中,男的和女的都没有支配性 策略。实际上,他们的最优策略依赖于对方的选择, 一旦对方选定了某一项活动,另一个人选择同样的 活动就是最好的策略。两个纳什均衡解。
四、顺序性博弈
序列博弈
现实生活中,还存在另一种博弈状态,即对局者
选择策略有时间先后的顺序,某些对局者可能率先采
取行动,这种博弈称为顺序性博弈。重复博弈和序列
博弈都是动态博弈。
先行动的参与者往往会有一定的优势。
案例6-6:双寡头垄断的两家企业都打算推出 一种新产品。四种可能的策略组合的利润结果见表 6, 单位是百万美元。
1、在一次性博弈中任何欺骗和违约行为都不会 遭到报复,囚犯困境的不合作解通常是难以避免的。
2、在无限期重复博弈中,报复的机会总是存在 的,所以,每一个参与者都不会采取违约或欺骗的 行为,囚犯困境合作均衡解是存在的。
3、在有限期重复博弈中,囚犯困境博弈的纳什 均衡是参与者的不合作。
4、在不能确定终止期的有限期重复博弈的囚犯 困境模型中,纳什均衡的合作解是可以存在的。
无新产品 有新产品
企业 B
无新产品 有新产品
4,4
3,6
6,3
2,2
1、如果企业谋求最大利润,本例存在两个纳什均衡。
两个纳什均衡:(无新产品 ,有新产品)和 (有新产品,无新产品)
2、按照最大最小决策准则,均衡解是: (无新产品 ,无新产品)
重复博弈
重复博弈重复博弈(Repeated Games)[什么是重复博弈 顾名思义,重复博弈是指同样结构的博弈重复许多次,其中的每次博弈称为“阶段博弈”(stage games)[1]。
重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。
在重复博弈中,每次博弈的条件、规则和内容都是相同的, 但由于有一个长期利益的存在, 因此各博弈方在当前阶段的博弈中要考虑到不能引起其它博弈方在后面阶段的对抗、报复或恶性竞争, 即不能象在一次性静态博弈中那样毫不顾及其它博弈方的利益。
有时, 一方做出一种合作的姿态, 可能使其它博弈方在今后阶段采取合作的态度, 从而实现共同的长期利益。
下面给出两个重要定义: 定义1:可信性是指动态博弈中先行动的博弈方是否该相信后行动的博弈方会采取对自己有利或不利的行为。
定义2:如果动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成均衡, 则称该策略组合具有子博弈完美性。
在重复博弈中, 可信性同样是非常重要的, 也即子博弈完美性仍是判断均衡是否稳定可靠的重要依据, 又由于长期利益对短期行为的制约作用, 因此有一些在一次性博弈中不可行的威胁或诺言在重复博弈中会变为可信的, 从而使博弈的均衡结果出现更多的可能性。
[编辑]重复博弈的特征 1、阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构。
2、所有参与人观察到博弈过去的历史。
3、参与人的总得益是所有阶段博弈得益的贴现值之和。
如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的策略可以选择,均衡结果可能与一次博弈大不相同。
[编辑]重复博弈的例子[1] 以下我们用一个产品定价的例子讨论重复博弈,给出了一次性完全信息静态博弈的收益矩阵。
A、B两个参与人都有两种定价待选择:定高价或定低价。
产业经济学复习整理笔记
一、名词解释1.产业经济学:研究产业组织、产业结构、产业管理、产业发展等问题的经济理论,是一门新兴的应用经济学科。
2.产业组织(industry organization):产业组织(industrial organization)是同一产业内企业间的组织或者市场关系.这种企业间的市场关系主要包括:交易关系、行为关系、资源占用关系和利益关系.3.范围经济:单一经营企业内部由于生产或分配多种产品而带来的成本的节约(钱德勒);单个企业联合生产多种产品比多个企业各自生产一种产品更有效率.即范围经济。
4.交易费用:交易费用是利用市场机制进行交易(形成契约)的成本。
5.有效竞争:克拉克提出了有效竞争概念:即既有利于维护竞争又有利于发挥规模经济作用的竞争格局。
6.市场集中度:用于表示特定产业或市场中,卖者或买者具有怎样的相对规模结构的指标,反映特定市场的集中程度。
7.市场绩效:市场绩效是指一定市场结构中,有一定的市场行为所形成的价格、产量、成本、利润、产品质量和品种以及技术进步等方面的最终经济成果。
8.完全信息动态博弈:完全信息动态博弈指的是各博弈方先后行动,后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解。
二、填空题1)企业并购类型:横向(水平)并购;纵向并购;混合并购。
2)一个经济组织必须解决的两大关键问题3)按照生产要素在企业中的集中程度和产出量的大小,可以把规模经济分为三个层次:➢单一产品的规模经济;➢工厂水平上的规模经济;➢多工厂水平上的规模经济。
4)产业经济学是介于宏观经济学与微观经济学之间的中观经济学.5)产品差别化对市场结构的影响:[1]影响市场集中度[2]形成差别化壁垒6)产业组织理论主要研究过头垄断市场的定价行为,其中寡头企业行为包括7)产业管制按照规制的手段划分:可以分为直接规制和间接规制.8)现代企业理论的三大理论✓交易成本理论;✓产权理论;委托代理理三、多项选择题1、产业经济学的研究方法的一般方法论包括(1)系统分析方法.即把产业和产业结构作为一个整体,用系统论的方法进行分析。
[经济学]博弈论第六章 重复博弈
r表示投资收益率,1/(1+r)称为折现因子。 当1>2/r时,即周收益率r>200%时,乙选择永远背叛下去 才是值得的。而这种情况几乎是不太可能的.因此,当双方 都实行礼尚往来策略时,双方是不会背叛对方的.这样礼尚 往来策略就解决了囚徒困境的难题了!
举例
假如投资收益率为10%(即r=0.1,从而 δ=1/1.1=0.91),并且博弈在持续一期的概率为 35%(即P=0.35),那么投资的有效收益率为:
R 1 1 2.14 0.35 0.91
在前面礼尚往来例子中,假如甲坚持采用礼尚往来策略, 只有当投资收益率大于200%时,乙采用永久性背叛策略就是值 得的。但是如果乙面临10%的投资收益率以及博弈再多维持一 期的概率是0.35时,有效收益率为214%,超过了200%的临界值。 因此,如果重复博弈有足够高的概率在一阶段结束,也就是P 足够小,则通过礼尚往来策略支持的合作会由于局中人的背叛 而结束。
假如在前面那个案例中企业乙背叛了一假如在前面那个案例中企业乙背叛了一个星期后突然又个星期后突然又改邪归正改邪归正选择继选择继续合作则选择合作的这个星期利润只续合作则选择合作的这个星期利润只有有11万因为此时甲企业为了惩罚他的上万因为此时甲企业为了惩罚他的上次背叛使用了低价策略因此这次背叛次背叛使用了低价策略因此这次背叛的收益是的收益是11万在背叛的那个星期获得的万在背叛的那个星期获得的背叛的成本是损失了背叛的成本是损失了44万在背叛后接下来万在背叛后接下来的一个星期发生的那么他这次背叛是的一个星期发生的那么他这次背叛是否值得呢
在囚徒困境中,重复博弈是一种促使局中 人采用合作策略的机制。因为,局中人担 心一次不合作会招致未来合作机会的丧失。 如果未来合作的价值很大,超过采取背叛 策略所能获得的短期收益,则双方会出于 长远利益的考虑,形成非契约的默契,使 彼此都从默契的非契约合约中得到好处。
第六讲 重复博弈
at a1 a2 aT
t 1 T 1 t 1
T
• 无限次重复博弈的总得益的现值就是
t 1
t 1
at a1 a2
T 1
aT
• 平均得益:如果一个常数A作为重复博弈的各个阶段 的得益,能产生与得益序列a1,a2, …,aT相同的现在 值,就称A为a1,a2, …,aT的平均得益。 • 如果不考虑贴现因素,可让贴现率为1,就可以同样 适用上述定义。 • 在无限次重复博弈中,当每一阶段的得益都是A时, A 现在值就是
• 重复博弈的各阶段有时间次序,各阶段的得益也有时 序。重复次数不多或时间间隔不长,得益的时序问题 无关紧要,但若是次数较多,或时间较长,比如是无 限阶段重复博弈,就必须考虑得益的时序问题。 • 一般是把各阶段的得益折合成现值来计算。若利率为r, 则贴现系数为 1
1 r
• 则重复T次,各阶段的得益分别为a1,a2, …,aT时的总 得益的现值就是
• 2.基本概念 • (1)设G是一个基本博弈(动静都可以,但一 般研究静态),重复进行T次,并且每次重复之 前各博弈方都能看到此前的博弈结果,这样的博 弈过程称为“G的T次重复博弈”,记为G(T), G称为G(T)的原博弈,每一次重复称为G(T) 的一个阶段。 • 重复博弈的每一个阶段都是独立的博弈,各方都 有得益。这是与一般动态博弈的重要不同。另一 方面,重复博弈中各阶段的博弈方和博弈内容都 必须相同,与一般的动态博弈也不同。
1 p (1 p) A a1 a2 a3 2 1 r (1 r )
2 (1 p) 1 p t 1 at at , 其中 t 1 (1 r ) 1 r t 1 t 1 t 1
博弈论-重复博弈
(-5,-5) 囚徒2 坦白 不坦白 -10,-10 -5,-13 -6,-6
囚 坦白 徒 -13,-5 1 不坦白
(-10,-10)
有限次重复削价竞争博弈
寡头2 高 价
寡 头 1
低 价
20,150 70,70
高价
低价
100,100 150,20
有唯一纯策略纳什均衡 (70,70) 有限次重复的结果仍然是 (低价,低价)
《博弈论与信息经济学》
第四章
重复博弈
本章介绍基本博弈重复进行构成的重复博弈。 虽然形式上是基本博弈的重复进行,但重复博弈中 博弈方的行为和博弈结果却不一定是基本博弈的简 单重复,因为博弈方对于博弈会重复进行的意识, 会使他们对利益的判断发生变化,从而使他们在重 复博弈过程中的行为选择受到影响。这意味着不能 把重复博弈当作基本博弈的简单叠加,必须把整个 重复博弈过程作为整体进行研究。
t 1
4.2 有限次重复博弈
4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈 的有限次重复博弈 4.2.3多个纯策略纳什均衡博弈 的有限次重复博弈 4.2.4 有限次重复博弈的民间定理
4.2.1 两人零和博弈的有限次重复博弈
零和博弈是严格竞争的,重复博弈并不改变这 一点。 以零和博弈为原博弈的有限次重复博弈与猜硬 币博弈的有限次重复博弈一样,博弈方的正确 策略是重复一次性博弈中的纳什均衡策略。
1 2
设厂商1已采用该触发策略,若厂商2也采用该触发策 略,则每期得益4.5,无限次重复博弈总得益的现值为: 4.5 4.5 1 + + + L 1 如果厂商2偏离上述触发策略,则他在第一阶段所选 产量应为给定厂商1产量为1.5时,自己的最大利润产量, 即满足:
博弈论基础课程教学大纲
博弈论基础课程教学大纲课程名称:博弈论基础英文名称:Game Theory课程编号:X4080251学时数:32其中实验(实训)学时数:0课外学时数:0学分数:2适用专业:金融学一、课程的性质和任务本课程是经济类专业选修课程之一。
本课程的任务是使学生从应用角度出发,在理论和实践上掌握博弈论的基本概念和基本方法,使学生具有应用博弈论的方法分析实际问题的初步能力。
二、课程教学内容的基本要求、重点和难点1.博弈的基本理论基本要求:理解策略形式的博弈,掌握博弈三要素和博弈的基本分类,理解囚徒困境、“抓钱博弈”。
重点和难点:博弈要素、囚徒困境2.同时决策博弈基本要求:掌握纳什均衡的定义,理解优势策略均衡,理解纳什均衡的应用。
重点和难点:纳什均衡3.混合策略纳什均衡基本要求:理解混合策略与期望支付,了解反响函数法,掌握纳什定理和奇数定理,了解多重纳什均衡及其甄别。
重点和难点:纳什定理4.序贯决策博弈基本要求:掌握序贯决策博弈与博弈树,理解策略与行动,了解序贯博弈的纳什均衡, 了解倒推法。
重点和难点:序贯决策博弈与博弈树5.同时博弈与序贯博弈基本要求:掌握正规型表示与展开型表示,理解同时决策与序贯决策的混合博弈,了解树型博弈的子博弈,了解子博弈精炼纳什均衡重点和难点:同时博弈与序贯博弈的正规型表示与展开型表示6.重复博弈和策略性行动基本要求:理解囚徒困境的有限次重复,理解囚徒困境的无限次重复,掌握重复次数不确定的情形,.掌握策略性行动的分类。
重点和难点:囚徒困境的有限次、无限次重复7.零和博弈基本要求:掌握零和博弈与非零和博弈,了解最小最大方法、直线交叉法,理解零和博弈的线性规划解法,了解霍特林模型。
重点和难点:零和博弈与非零和博弈,零和博弈的线性规划解法三、教学方式及学时分配四、课程其它教学环节的要求本课程以教师讲课为主,并适当安排课堂讨论,以学生课后实践为辅,同时鼓励学生参与经济实践与经济讨论的活动如举行经济辩论、撰写小论文等。
第六章:重复博弈与合作行为
方L
1P
Q
H
5,5 6,0 2,0 0,0 0,0
博弈方2
M
0,6 3,3 2,0 0,0 0,0
L
0,2 0,2 1,1 0,0 0,0
P
0,0 0,0 0,0 4,1/2 0,0
Q
0,0 0,0 0,0 0,0 1/2,4
博弈方1:在第一阶段采用H,如果第一阶段结果是(H,H),那么第 二阶段采用M,否则采用P;
➢ 定理:设原博弈G有唯一的纯 策略纳什均衡,则对任意正整数 T,重复博弈 G(T)有唯一的子 博弈完美纳什均衡,即各博弈 方每个阶段都采用G的纳什均 衡策略。各博弈方在G(T)中的 总得益为在G中得益的T倍,平 均得益的等于原博弈G中的得 益。
囚徒2
坦 白 不坦白
囚 徒
坦白
-5,-5
0,-8
1 不坦白 -8,0 -1,-1
触发策略:第一阶段采用H,如果前t-1阶段的结果都是 (H,H),则继续采用H,否则采用L。
如果博弈方2采用L,总得益现值为
5 1 1 2 5 1
如果博弈方2采用H,总得益现值为
V 4 V 因此当 1/ 4 时,此触发策略纳什均衡策略
23
两寡头削价竞争无限次重复博弈的民间定理
厂商2 得益
博弈方2:在第一阶段采用H;如果第一阶段结果是(H,H),那么 第二阶段采用M,否则采用Q。
16
两市场博弈的重复博弈(重复两次)
厂 商
A
1B
厂商2
A
B
3,3
1,4
4,1
0,0
两市场博弈
➢ (A,B)+(A,B) OR (B,A)+(B,A)——(1,4)(4,1) ➢ 连续两次采用混合策略——(2,2) ➢ (A,B)+(B,A) OR (B,A)+(A,B)——(2.5,2.5)轮换策略 ➢ 一次纯策略+一次混合策略——(1.5,3)(3,1.5)
博弈论的研究方法
博弈论的研究方法博弈论是一门研究人与人之间利益冲突、合作等行为的学科,通过建立数学模型来探究最优策略、均衡点等问题,并应用于经济学、政治学、社会学等领域。
本文将介绍博弈论的研究方法。
一、博弈形式化建模博弈论研究的第一步是将现实中的博弈问题形式化为数学模型,以便于分析和求解。
博弈论的形式化建模可以通过以下步骤完成:(1)确定博弈参与者博弈问题通常涉及到多个参与者的决策行为,因此需要明确博弈参与者的身份和数量。
(2)确定博弈策略参与者在博弈中可以采取不同的决策行为,这些行为构成了参与者的策略空间。
确定参与者的策略空间可以通过观察历史数据、分析市场机制等途径获得。
(3)求解均衡点博弈中的均衡点是指博弈参与者采取某种策略后,其他参与者都会选择最优的策略。
博弈论的主要研究目标之一就是寻找均衡点,以便参与者作出最优决策。
二、求解博弈均衡点的方法博弈均衡点可以通过多种方法求解,其中常用的有以下几种:(1)支配回避法支配回避法是一种基于策略支配关系的博弈求解方法。
当一种策略的效果不如另一种策略时,这种策略就被另一种策略所支配,可以从策略空间中删除。
(2)纳什均衡法纳什均衡是指博弈参与者采取某种策略后,其他参与者都将不会改变策略。
该均衡状态下,所有参与者都无法通过改变策略获得更多的收益。
(3)重复博弈法重复博弈是指博弈过程不止一次,参与者可以根据之前的决策情况对后续决策做出调整。
重复博弈法可以通过分析历史数据和未来走向等手段求解均衡点。
三、博弈论的应用博弈论在经济学、政治学等领域有着广泛的应用。
(1)经济学中的应用博弈论在经济学中的应用主要包括博弈理论、合作博弈、竞争博弈、均衡选择等方面。
经济学家使用博弈论的方法来研究市场竞争、价格策略、公共品的供给等问题,以达到最优效益。
(2)政治学中的应用博弈论在政治学中的应用主要包括选举、利益集团、国际关系等方面。
政治学家运用博弈论的方法来评估政策决策的反应、各利益集团的侧重点、国际关系的战略冲突等,以提高政策的制定和理解的准确性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
威胁和允诺的讨论
• 每个威胁都会与一个隐含的允诺相关联。每一个 允诺也会与一个威胁相关联。 • 威胁和允诺的一个区别:
– 如果一个威胁是成功的,则提出威胁的一方无须实施威 胁的内容,因为对提出威胁的一方而言,威胁是“无成 本”的 。 威胁会被夸大 威胁不可信 – 如果一个允诺成功地改变了对手的行动选择,则允诺方 必须履行允诺,允诺是“有成本”的。 希望允诺有效的同时尽可能降低允诺的成本。
– 恋人会把彼此介绍给自己的父母亲朋。
6-6 威胁、允诺及可信性
• 威胁意味着如果对手采取与你利益相违背的行 动,他们将在博弈中遭受损失,威胁的目的在于 防止其他局中人做出对你不利的事情,具有威慑 功能。 • 允诺意味着如果对手采取对你有利的行动选择, 那么你将采取对他们有利的行动,目的在于引导 其他局中人做出对你有利的事情,有诱导功能。
• A所采取的策略性行动是一种条件依存的策略性 行动。
– 两种主要的表现形式:威胁(threat)和允诺(promise)。
威胁(threat)和允诺(promise)
• 威胁: A对B说,“除非你的行动符合我所说 的条件,否则我将采取行动报复你。” • 允诺:A对B说,“如果你的行动符合我所说 的条件,我将采取对你利的行动。” • 通常用支付的大小来衡量“报复’’和“‘得到好 处”的程度。
• 6-3 重复次数不确定的情形
– 投资的有效收益率R
第六章 重复博弈和策略性行动(2)
主要内容
• 6-4 策略性行动的分类 • 6-5 承诺及其可信性 • 6-6 威胁、允诺及可信性
6-4 策略性行动的分类
• 在博弈过程中,一些局中人为达到某种影响对手的 行为的目的,如诱使对手采取对自己有利的行动选 择,或阻止对手采取对自己不利的行动选择,往往 会采取某种相应的行动,称为策略性行动(srategic moves)。
– 窃贼和主人对峙
• 谢林:“20世纪后半页最大伟大的事件是有一件事 没有发生”。
– 这没发生的事件就是核战争——核战争之所以没有爆 发,因为美苏任何一方都知道,既然不能一击使对方毙 命,那么自己就会在对方的报复中损失惨重。报复能 力,是对对手的一种巨大的震慑力量。
允诺的例子:价格大战博弈
• 严格优势策略均衡(3,3)。 • 乙允诺:如果你实行高价,那么 我也会实现高价。 •) 回顾
• 6-1 囚徒困境的有限重复 • 6-2 囚徒困境的无限次重复
– 依存策略或相机策略;触发策略;冷酷策略;礼尚往来策 略;惩罚K次的礼尚往来策略;严格的礼尚往来策略;不记 仇的礼尚往来策略;记仇的礼尚往来策略;惩罚无穷次的 礼尚往来策略 – 礼尚往来实验;艾克谢罗德的合作进化;缺陷 – 背叛一次的分析;永远背叛的分析
威胁的例子:日美贸易关系
• 同时或序贯:日本得到 了最高的支付。 • 美国无条件的承诺没有 作用。 • 威胁:如果你采取关闭 本国市场的话,我也将 关闭本国市场。
分析
• 当美国所做出的威胁可信时,日本不会采取他的优势 策略。 • 威胁的可信性值得怀疑。如果日本为了测试美国的威 胁是否可信而继续关闭本国市场的话,美国面临着不 实施威胁的诱惑。 • 完整的美国策略。 • 美国可采取方法使威胁变得可信。如:立法,商务部 代理执行。
因此,
• 承诺是无条件的策略性行动; • 威胁和允诺是条件依存的策略性行动,属 于反应规则(反应函数)。
6-5 承诺及其可信性
• 若博弈本身是一个同时决策博弈,如果其中一个局 中人能够采取一个策略性的行动,创造博弈的前置 阶段,对自己在“下一阶段”进行的博弈中将采取的 行动,作出一个可信的宣告,同样也能够获得类似 于序贯博弈的先动优势。
夫妻博弈
• 承诺并非在任何情况下都是最优的。
• 情侣博弈,双方都可以做出承诺,谁获得成 功,取决于谁能率先行动以及这种行动的可 信性。
– 如果采取行动与对手观察到这个行动之间存在 时滞的话,则男女双方有可能做出不相容的同 时承诺。 – 一个局中人可以首先做出承诺,另一个局中人 却视而不见,从而使得做出承诺方的企图落中。
• 只要日本认为威胁可信,日本的行动选择会发生改变。
威胁的讨论
• 空洞的威胁在对手不足够理性的时候是管 用的。
– 孩子和父亲之墙上画画
• 理性不足也有好处
– 孩子和父亲之买玩具 – 精神病人的要求 – 理性村和非理性村
报复能力
• 有报复能力和报复是不同的,因为有报复能力,而 进攻者也知道这个报复能力,他就不会选择进攻, 而报复也不会真的发生。
• 策略性行动:承诺,威胁和允诺。
先行一步
• 先行一步的基本含义:
– 可观察性:你的行动必须能被对手观察到; – 不对逆转性:你的行动必须是不可逆转的。
1.无条件的策略性行动:承诺
• 假定A在博弈的第一阶段采取一个可以观察得到并且不可逆转 的行动。
• 例如本来第二阶段应该B先行,但是A在目前阶段对B说:“在 接下来的博弈中,我将采取行动X”,这意味着A在未来采取的 行动是无条件的,无论B在将来采取什么行动,A都采取行动X。 • 如果A的这番话可信,就相当于改变了下一阶段的博弈顺序, 使得不仅A先行动B后行动,并且A将采取的行动一定是X。 • 此策略性行动称为承诺(commitment)。
交作业博弈
• 在采取一个旨在获取先动优势的策略时,老师必须作承 诺,表明他不会采取他在同时行动博弈时所采取的均衡策 略,这一策略性的行动会改变学生的预期以及他们的行动。
• 为了使承诺可信,老师所做出的承诺必须 满足以下几点:
– 承诺必须在学生采取行动之前做出; – 老师的承诺必须能被学生观察到,学生必须消 楚他们所需要遵守的规则; – 老师的承诺必须是不可逆转的,必须要让学生 知道,一且他们违背规则,无论任何理由,老 师都个会改变规则而原谅他们。
例子:情侣博弈
• 假定男方有机会首先采取策略性行动。 • 在第一阶段(前置阶段),男方需要决策, 是作出承诺还是不作出承诺。
– 如果不做出承诺,在第二阶段,男女双方进行 同时决策博弈。 – 男方做出承诺,这种承诺是他放弃行动的自由 使得足球成为他在第二阶段唯一的选择。。
• 在前置阶段,男方选择作出承诺是最优的,因为这种策略 行动保证了在博弈中他能得到最好的支付。
• 承诺如果成立,应该能够帮助做出承诺的局 中人抓住先动优势。 • 例如:在情侣博弈中,男方先买好足球票, 然后打电话邀请女方一起去看足球比赛。
2.条件依存的策略性行动
• 反应规则(反应函数):A所采取的行动取决于 B的行为。
– 博弈的第二阶段B先采取行动,A将在B行动之后才采 取行动, – A将如何回应B的选择,已经在第一阶段确定下来。
爱情的代价和可置信
• 有一位小伙子在给心爱的姑娘的信中写到:“爱你爱得如 此之深,以至愿为你赴汤蹈火;我是那么地想见到你,任 凭艰难险阻也挡不住我的脚步。本周六如不下雨,我一定 来找你!” • ——爱情需要付出代价。
• 爱情领域的现象
– 昂贵的彩礼,高档的婚宴,是一种承诺行动。
• 表明了愿意为对方做出的牺牲; • 向外界传递了他们把这段感情看得有多重的信号而排斥了潜在 的婚姻竞争者; • 高额下聘,使得其财富减少不可能再去找另外一个婚姻对象, 是典型的承诺行动了。