博弈论(第七章)
博弈论7不完全信息动态博弈概论
❖ 参与人1(在位者)的行动空间
A1={m1 (低价格),m2(高价格)} ❖ 参与人1的类型空间
T1={t11 (高成本),t12 (低成本)} ❖ 参与人2(进入者)的行动空间
A2= a1 (进入),a2(不进入)} ❖ 参与人2的类型空间T2={t2},单点集,因此参与人
参与人1对参与人2的信念p1=1; ❖ 参与人2对参与人1的信念p2=(p,1-p); ❖ 参与人1先行动,参与人2后行动。
按照海萨尼转换,该博弈表示为:
L
(2, 2)
t11
[P] 1
R
2
N t12
[1 P] 1
R
L
2
(2, 2)
A
B
A
B
(0, 0)
(0,1)
(1, 0)
(3,1)
图7-1
❖ቤተ መጻሕፍቲ ባይዱ例题2:考察一个市场进入博弈
❖ 但(L,A)又排除不掉,因为没有子博弈。 ❖ 假设在参与人2的信息集h2上,观察到R产生
的后验概率为 p(t11 | R) q, p(t12 | R) 1 q,
❖
❖ 这时,参与者2选择A的期望收益为: 0*q+0*(1-q)=0 选择B的期望收益为: 1*q+1*(1-q)=1>0
所以参与人2一定会选择B.
❖ 当参与人 i在他的某个信息集h上观察到其他
n-1个参与人行动组合 ahi ,条件概率 , pi (ti | ahi ) 是参与者i在观察到 ahi 的情况下,
对参与者的类型t-i的修改,这个修正产生
pi (ti | ahi )的推断称为后验概率
❖ 在例1图7-1中,设R(t11),R(t12)是参与人1的 两个战略。从而该博弈表示为完全但不完美
浙大微观经济学ch7博弈论
博弈论:又称对策论,是研究理性的决策主体 之间的行为相互作用时的决策以及这种决策的 均衡问题。 博弈论的应用是微观经济学的重要发展。
2013/6/13
2
博弈论
1944 年美藉匈牙利数学家冯 · 诺依曼( John Von Neuman )和美藉奥地利经济学家摩根斯顿 ( Morgenstern )出版经典著作《博弈论与经济行 为》,为现代博弈论的发展奠定了基础。 纳什 美国的数学家、经济学家纳什(John Nash),美籍匈牙利经济学家海萨尼 (John C. Harsanyi)和德国经济学 家泽尔滕(R.Selten)因对博弈论的卓越贡 献而获得1994年度的诺贝尔经济学奖。 海萨尼 泽尔滕
可信的威胁
2013/6/13 11
思考题
赌徒分钱?
2013/6/13
12
囚徒B 不招供 不招供 囚徒A 招供 (0,-8) (-5,-5) 招供 揿 大猪 等待 (9,-1) (0,0) 揿 (5,1) 小猪 等待 (4,4)
(-1,-1) (-8,0)
囚徒困境
智猪博弈
2013/6/13
7
博弈论相关概念
重复博弈:一个结构相同的博弈被重复多次。
在一次性静态博弈的情况下,结成共谋的每个寡头面临着 “囚徒困境”,但在重复博弈中,情况会有所不同。 若是无限次重复博弈,通过“以牙还牙”策略,寡头厂商有望 走出“囚徒困境”,取得合作解。 若是有限次重复博弈,则取得非合作均衡解。但在不能确定 终止期的有限次重复博弈中,合作解是可以存在的。 当且仅当局中人的策略组合在每个子博弈都构成纳什均衡 时,才会形成子博弈精练纳什均衡。
2013/6/13 3
《西方经济学》第七章 博弈论
21
第五节
不完全信息动态博弈
对应于不完全信息动态博弈的均衡概念是精炼 精炼 贝叶斯均衡(perfect Bayesian equilibrium). 贝叶斯均衡 这个概念是完全信息动态博弈的子博弈精炼纳 什均衡与不完全信息静态均衡的贝叶斯纳什均 衡的结合.具体来说,精炼贝叶斯均衡是所有 参与人战略和信念的一种结合.它满足如下条 件:第一,在给定每个参与人有关其他参与人 类型的信念的条件下,该参与人的战略选择是 最优的.第二,每个参与人关于其他参与人所 属类型的信念,都是使用贝叶斯法则从所观察 到的行为中获得的.
22
贝叶斯法则 贝叶斯法则是概率统计中的应用所观察 到的现象对有关概率分布的主观判断 (即先验概率)进行修正的标准方法.
23
习
题
1. 什么是占优策略均衡?什么是重复剔除的占优策 略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性 博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为 0.两寡头所进行的是产量竞争.对于寡头产品 的市场需求曲线为P=30-Q,其中Q=Q1+ Q2.Q1是寡头1的产量,Q2是寡头2的产量. (1)假定两个寡头所进行的是一次性博弈. 如果两寡头同时进行产量决策,两个寡头各生产 多少产量?各获得多少利润?
25
�
第七章
第一节 第三节 第四节 第五节
博弈论
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
第一节 博弈问题概述
一,博弈的基本概念 二,博弈的分类
2
一,博弈的基本概念
博弈论 博弈论(game theory)是研究决策主体的 行为发生直接相互作用时候的决策以及这 种决策的均衡问题的. 博弈论的基本概念包括:参与人 行动 参与人,行动 参与人 行动, 战略,信息 支付函数,结果 均衡. 信息,支付函数 结果,均衡 战略 信息 支付函数 结果 均衡
博弈论ch7ppt课件
精选课件ppt
24
对称性谈判局势
y
谈判唯一的理性结局 e
b
P
F
45o
a
x
精选课件ppt
25
纳什解——谈判唯一的理性解
max (x-a)h(y-b)k ——纳什福利函数
s.t. x+y=V(x,y) ——y=f ( x ) 就
精选课件ppt
33
改变谈判砝码
谈判砝码对达成什么样的分配协议具有决定性的意 义。如果双方预期分配是纳什解,他们可以通过在 谈判前的阶段以非合作博弈的方式改变(a,b)。从而 改变在第二阶段谈判时的相对优势。
可以将第一阶段的模型视为非合作博弈,每个人独
立地选择最优的a或b。
精选课件ppt
34
图示
他们之间如何分配这3000元?
精选课件ppt
38
① 该合作博弈的表述:B=(S,d;u1,u2)
参与人——画家、拍卖商 S——局中人共有的策略集(利润的分配方案) d——谈判破裂的结果,d∈S; ui——定义在S上的局中人i的效用函数,满足
对任意的s∈S,u1(s)≥ u1(d), u2(s)≥ u2(d); 至少存在一个s∈S,u1(s)> u1(d), u2(s)> u2(d);
安迪生产微芯片,他可以以900美元的价格卖给任何一 家计算机制造商。
比尔的软件包可以以100美元的价格进行零售。
两个人凑在一起,发现他们如果生产一个软硬件 的联合产品,可以卖到3,000美元。
他们之间如何分配这3000美元?
精选课件ppt
19
他们之间如何分配这3000美元?
第七章 零和博弈(博弈论教程-石家庄经济学院,于振英)
第七章零和博弈 最小最大方法
20
第二节 零和博弈的研究方法
一、最小最大方法 (四)纳什均衡 Maximin=minimax=3 Maximin值与minimax值形成的策略 组合:(中,右)
2014-1-9
第七章零和博弈 最小最大方法
21
用最小最大方法寻找纳什均衡
甲的支付单矩阵 乙 不可行! 原因: 石头 剪刀 Maximin≠minimax 其他方法? 1 0 石头 -1 0 甲 剪刀 1 -1 布
2014-1-9
博弈论 第七章零和博弈
11
第一节
基本概念
四、零和博弈的表示方法:单矩阵 1.猜硬币者的支付单矩阵 抛硬币者 正面 反面 正面 1 -1 猜硬币者 -1 1 反面
2014-1-9
博弈论 第七章零和博弈
12
第一节
基本概念
四、零和博弈的表示方法:单矩阵 2.抛硬币者的支付单矩阵 抛硬币者 正面 反面 正面 -1 1 猜硬币者 1 -1 反面
2014-1-9
第七章零和博弈 最小最大方法
19
第二节 零和博弈的研究方法
一、最小最大方法 (三)乙(列参与人)的思想与行动 2.乙的行动:追求自身利益最大 从每列max值中寻找min值(甲的min 值,对乙有利)→ 从最大中寻找最小,minimax→ 结果:“右”列, minimax =3
2014-1-9
第七章零和博弈 最小最大方法
24
若John的期望支付相等?
p-(1-p) = -p+(1-p)→ p*=0.5 若p<0.5 John翻黑牌→预期Candy翻红牌 若p>0.5 John翻红牌→预期Candy翻黑牌
博弈论PPT课件
第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······
第七章博弈论高鸿业
(二)重复剔除的占优策略均衡
• 在绝大多数博弈中,占优策略均衡是不存在的。 在绝大多数博弈中,占优策略均衡是不存在的。 • 智猪博弈(boxed pigs)是博弈论中的另一个著名的例子。 pigs)是博弈论中的另一个著名的例子。 智猪博弈( • 表7 -3 智 猪 博 弈 的 收 益 矩 阵 小猪 等待 2,4 0,0
求解智猪博弈均衡的方法
• 首先找出某一个参与者的严格劣战略,将其剔除 首先找出某一个参与者的严格劣战略, 严格劣战略 然后构造新博弈, 掉,然后构造新博弈,继续剔除新博弈中某一参 与人的严格劣战略;重复进行这一过程, 与人的严格劣战略;重复进行这一过程,直到剩 下唯一的参与人战略组合为止, 下唯一的参与人战略组合为止,这一唯一剩下的 参与人战略组合就是这个博弈的均衡解, 参与人战略组合就是这个博弈的均衡解,称为 重复剔除的占优战略均衡” “重复剔除的占优战略均衡” • 严格劣战略是指无论其他参与者选择什么战略, 严格劣战略是指无论其他参与者选择什么战略, 某一参与人可能采取的对自己不利的战略
这个博弈的均衡解是什么呢? 这个博弈的均衡解是什么呢?
这个博弈的均衡解是大猪选择按按钮, 这个博弈的均衡解是大猪选择按按钮,小 猪选择等待,这时, 猪选择等待,这时,大猪和小猪的净收益水平 分别为2个单位和4个单位。 分别为2个单位和4个单位。 这是一个“多劳不多得,少劳不少得” 这是一个“多劳不多得,少劳不少得”的 均衡。 均衡。
• 占优策略均衡 占优策略均衡要求任何一个参与人对于其 他参与人的任何策略 任何策略选择来说,其最优的 任何策略 策略都是唯一的。 • 纳什均衡 纳什均衡只要求任何一个参与人在其他参 与人的策略选择给定 策略选择给定的条件下,其选择的 策略选择给定 策略是最优的。 • 占优策略均衡一定是纳什均衡,但纳什均 衡不一定就是占优策略均衡。
博弈论与策略性行为
与掠夺性定价的异同
企业采用限制性定价,直接目的是阻止新 企业进入市场,但实质上这是一种牺牲部分短 期利润以追求长期利润最大化。因此同掠夺性 定价一样,都是企业长期定价的策略性行为。 所不同的是采用限制性定价的企业短期内仍有 “利润”,而采用掠夺性定价的企业在短期内 处于亏损状态。
动态限制性定价
是指一家在位企业在长期内确定价格和产 量来减少或消除导致新企业进入它所在市场的 诱因的方法。
市场主导企业经常是先定立一个高价,然 后随新企业进入逐渐降低价格。现实经济中, 我们可以看到,新产品刚刚导入时价格定得很 高,然后逐渐回落到竞争性价格水平。
影响限制性定价的主要因素
市场进入壁垒高,新企业难以进入, 阻止的价格也就高。壁垒低,新企业容易 进入,要阻止新企业进入,必须按平均的 甚至更低的利润水平定价。
第七章 博弈论与策略性行为
博弈论又称为对策论或游戏论,是研究决 策主体的行为发生直接相互作用时的决策以及 这种决策的均衡问题。
近20年来,博弈论在经济学中得到了广泛 的应用,它对寡头理论、信息经济学等方面的 发展做出了重要贡献。
1994年度的诺贝尔经济学奖授予三位从事对策论 研究的经济学家:纳什、泽尔腾、海萨尼。
(2)对于现实经济而言,掠夺性定价并不是 经常发生,大企业更愿意通过兼并来消灭竞 争者,因为兼并能使企业免受低价造成的利 润损失,又有利于增强企业的实力和竞争力。
什么情况下掠夺性定价行为难以成功?
两家企业的成本函数相同 完全可竞争市场
二、限制性定价行为
限制性定价又称阻止进入定价,指一家 在位企业将其价格和产量定在新企业进入市 场后所剩的需求不足以使它生存的水平。
第七章企业与竞争者
从市场方面看,企业的竞争者有: 1.品牌竞争者
以相似价格向相同顾客提供相似产品的竞争者。 (产品、档次均相同)空调:格力、海尔、三菱
2.行业竞争者
行业内提供同类产品的竞争者。 (产品相同,档次不同?)家用空调和中央空调
博弈论的历史
❖ 博弈论思想古已有之,我国古代的《孙子兵法》 就不仅是一部军事著作,
而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥 牌、赌博中的胜负问题,人们对 博弈局势的把握只停留在经验上, 没有向理论化发展。
著名的“囚徒困境”的例子
❖ 警察抓住了两个罪犯,但是警察局却缺乏足够的证据指证 他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能 确认罪名成立。为了得到所需的口供,警察将这两名罪犯 分别关押防止他们串供或结成攻守同盟,并分别跟他们讲 清了他们的处境和面临的选择:如果他们两人都拒不认罪, 则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人 中有一人坦白认罪,则坦白者立即释放而另一人将重判10 年徒刑;果两人都坦白认罪,则他们将被各判8年监禁。 问:两个罪犯会如何选择(即是坦白还是抵赖)?
竞争者一般是指那些与本企业提供的产品或服 务相似,并且所服务的目标顾客也相似的其他企业。
竞争者分析是指企业通过某种分析方法识别出竞 争对手,并对它们的目标、资源、市场力量和当前战 略等要素进行评价。
Hale Waihona Puke 7.1.2竞争者分类从行业的角度来看,企业的竞争者有:
1.现有竞争者:已进入市场,生产与企业相似或同类的 产品,并拥有一定顾客和时常份额的竞争者。
❖ 市场活动中的企业经过无数次交易和博奕也会 得出同样的结论:欺诈、坑蒙拐骗等可以得逞 一时,不会得逞一世,为了大家的共同利益, 企业除了选择遵守规则和合作外别无他途。
第七章 博弈论实验讲解
Cooper等调查了允许无约束事前交流来解决 协助问题的可能性。在允许交流的情况下, 选择策略2的百分比变为80%,而被试者中 申明未协调选择的比重只有71%。
7.2.2.4 n人博弈的实验
n人博弈实验的目的是为了观察同一批参与人反复进 行同一博弈的结果。这样可以使得谈判博弈具有 合作性。
G.Kalisch等做了一组n人博弈实验。在3人博弈中, 被试者被蒙住了眼睛,只能通过手势向仲裁人示 意他们的行动。在4人博弈中,每个被试人都坐在 其他人看不到的地方,他将自己的行动写在纸上。 3人博弈规则如下:
二种情况下,3个参与人都得0.
实验结果表明,被试者选择等待策略的比 重只占了33%,而由一个被试者叫价另一 个接受而形成联盟的策略出现的比例较高。 实验结果说明同一批人反复进行同一个博 弈有利于形成合作博弈。
7.3完全信息动态博弈实验
7.3.1基础知识 逆向归纳法:该方法适用于有限次博弈, 并且参与人都是理性的,都清楚的知道博 弈树结构,参与人首先从博弈树的末端开 始,求解末端的子博弈均衡,然后继续向 前求解,直至起点。
假设有两个被试者PP和ZZ,他们已掌握零和博弈论, 同时知道冯.诺依曼-摩根斯坦非零和博弈论,但他 们不清楚纳什均衡理论。
支付矩阵如表所示:
纳什均衡策略为(2,1)
如果允许单边支付,冯.诺依 曼-摩根斯坦的非零和博弈 解是策略(1,2)。
Merrill报告了100次实验的结 果,pp得到0.4美元,zz得 到0.65美元。如此看来, 在现实的讨价还价中并没 有达到纳什均衡。
混合策略纳什均衡:参与人根据一组选定的 概率,在两种或两种以上可能的行动中随 机选择中得到纳什均衡。
7.2.2实验研究
7.2.2.1纳什均衡与冯.诺依曼-摩根斯坦博弈解
博弈论蒋文华浙江大学
第一讲、博弈论概述献给诸位知人者智,自知者明;胜人者力,自胜者强;小胜者术,大胜者德。
第一章何为“博弈”博:博览全局弈:对弈棋局→谋定而动是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。
第一节从一个简单的故事说起博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。
特别提示:博弈既可以是竞争,也可以是合作!特别提示:博弈,必须学会换位思考!特别提示:博弈,只需领先一步,高人一筹!博弈就是你中有我,我中有你。
由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。
博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。
特别提示:站在别人的立场上想一想,就是为自己未来的遭遇着想。
——米兰·昆德拉特别提示:如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚)特别提示:请不要在一个充分竞争的市场去追求成功!特别提示:选对市场(对手)比选对策略更重要!特别提示:在博弈之前,博弈就已经开始了!第二节博弈的渊源一、中国的理解博+弈=下围棋略观围棋,法于用兵,怯者无功,贪者先亡。
----汉代刘向,《围棋赋》二、西方的理解game(规则)费厄泼赖(fair play)第三节学习博弈论的收益一、当局者清更有利的选择更快速的反应二、旁观者更清理解历史与现实预测未来的发展三、提出完善游戏规则(制度)的建议第二章发展简史第一节最初的探索和应用一、古诺模型参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。
二、伯川德模型该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。
博弈论第7章
©2008仅供课程参考。
未经许可,请勿传播1第七章委托代理问题汕头大学商学院姚洪心委托者代理者的定义©2008仅供课程参考。
未经许可,请勿传播2©2008仅供课程参考。
未经许可,请勿传播3隐藏行动和知识道德风险问题逆向选择©2008仅供课程参考。
未经许可,请勿传播4信号传递与信号鉴别©2008仅供课程参考。
未经许可,请勿传播5委托代理问题的分类©2008仅供课程参考。
未经许可,请勿传播6一个生产博弈©2008仅供课程参考。
未经许可,请勿传播7一个生产博弈由于委托者可以观察到代理者的努力程度,所以代理者的努力程度应该超过©2008仅供课程参考。
未经许可,请勿传播8©2008仅供课程参考。
未经许可,请勿传播9委托代理问题一个生产博弈完全信息下的合同类型©2008仅供课程参考。
未经许可,请勿传播10线性工资图示付出努力上升,必须要更高的工资才能刺激其工作动力。
努力水平到达一定程度的时候,其边际产出下降,效用递减。
©2008仅供课程参考。
未经许可,请勿传播11例题©2008仅供课程参考。
未经许可,请勿传播12例题©2008仅供课程参考。
未经许可,请勿传播13例题©2008仅供课程参考。
未经许可,请勿传播14©2008仅供课程参考。
未经许可,请勿传播15例题given©2008仅供课程参考。
未经许可,请勿传播16一个生产博弈(II)由于是agent 首先提出,故首先应该由agent 优化自己的目标函数一个生产博弈(III)力,考虑到这个结果委托者将不再支付工资。
例子,教师的科研和教学工作。
©2008仅供课程参考。
未经许可,请勿传播17一个生产博弈(IV)©2008仅供课程参考。
未经许可,请勿传播18一个生产博弈(V)e直接求解法©2008仅供课程参考。
第七章 不完全信息动态博弈
第七章 不完全信息动态博弈本章将在动态博弈中引入信息不对称因素,其博弈的内容被称为不完全信息动态博弈(uncomplete information dynamic game )。
不完全信息动态博弈就其基本要素来看是前面引入的不完全信息概念与博弈的动态性质的一种综合。
譬如,我们在处理不完全信息要素时是通过将某些局中人“类型”的不确定性作为信息不完全性的一种表征,这种方法将继续在本章中得以采用,即博弈中局中人面临的信息不完全性(无论它是指何种信息)将完全由某些局中人的“类型”的不确定性加以刻画。
同时,作为动态博弈,正如我们在第五章中所指出的那样,“序贯理性”的思想将一直得到贯彻。
我们将第五章中引入的“子博弈精炼均衡”的思想作类似的推广于不完全信息动态博弈。
这种延续在逻辑上是必需的,因为一旦我们在不完全信息动态博弈中将信息不完全程度削减到零,则不完全信息动态博弈就自然应退化成一种完全信息动态博弈,其相应的精炼均衡概念就应回到子博弈精炼均衡。
从这种意义上来看,不完全信息动态博弈的精炼均衡概念是子博弈精炼均衡概念的一种推广,正如不完全信息动态博弈应被视作完全信息动态博弈的一种推广一样。
7.1 精炼贝叶斯均衡在本小节中,我们来构造不完全信息动态博弈的均衡概念,特别是贯彻了“序贯理性”原则的精炼均衡概念。
首先,博弈的纳什均衡是一种“僵持”状态的战略组合,当所有的局中人都选择该战略组合中给出的相应战略时,任何一个局中人都不会有单方面偏离这一选择的动机。
作为动态博弈,一个战略是局中人在其可能进行行动选择的所有信息集上将作何选择的一整套规定或计划,而作为不完全信息博弈,这种规定或计划还是“类型依存”的,即不同类型的局中人将选择不同的战略规定。
因此,一个不完全信息动态博弈的纳什均衡将是指这样的一种类型依存性的战略组合(或战略组合的族),当给定其他局中人的战略时(其他局中人的战略是类型依存的,所以,说给定其他局中人的战略即指给定其他局中人的战略与类型的依存关系),任一局中人在其任何类型下由该组合给出的类型依存战略给出的战略是其最优的。
活学活用博弈成功智慧_第七章 斗鸡博弈:面子怪圈中的芸芸众生
双方都不愿妥协的斗争斗鸡场上,两只英勇好战、实力又旗鼓相当的公鸡狭路相逢。
在这种情况下,每只公鸡都有两个行动选择:一个是退下来,另一个是进攻。
如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡就会很丢面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,则两败俱伤。
因此,对每只公鸡来说,最好的结果是,对方退下来而自己不退,但是这种结果很难实现,而且隋况并不在自己的掌握之中。
如果两只公鸡均选择“前进”,结果是两败俱伤,两者的收益是一2个单位,也就是损失为2个单位;如果一方“前进”,另外一方“后退”,前进的公鸡获得1个单位的收益,赢得了面子,而后退的公鸡获得一1的收益或损失1个单位,输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子,获得一l的收益或1个单位的损失。
由此可见,斗鸡博弈有两个纳什均衡:一方进另一方退。
但是,我们无法据此预测斗鸡博弈的结果,因为无从了解谁进谁退,谁输谁赢。
这也是博弈论的一个理论模型。
它描述的是两个强者在对抗冲突的时候,如何能让自己占据优势,力争得到最大收益,确保损失最小。
现实中,大到20世纪后半期美苏两大国的“冷战”,小到两强相遇互不买账的悲剧婚姻,都可以用斗鸡博弈的模型来解释。
面子怪圈中的两只公鸡斗鸡博弈之所以成为僵持不下的困局,原因有二:一是实力相当,一是双方都不愿丢面子。
如果其中有一只公鸡愿不要面子退下来,找无人处勤学苦练,积蓄力量,那么它终有一日能够让自己的实力超过对手。
君子报仇,十年不晚,这时的它再回到斗鸡场上,必定会令对方刮目相看。
如果再进行新一轮的较量,此公鸡胜出的几率也就增大了。
这就是破解斗鸡博弈的关键,在这一困境中,只要有一方退下来,就会实现最好的结果。
问题的关键在于,现实中的人们能否做到这一点。
实际情况是,很多人都没能做到。
他们不明白面子只是一个小问题..丢面子不会给人带来实质性的损失,死要面子则活受罪。
博弈论第7讲
与一个陌生人打交道 购买一幅艺术品 一个企业想进入某个市场 参与投标的各个厂商 消费者不知道企业产品的真正质量 用人单位不知道应聘者的真正水平和能力 二手车市场,买家不知道旧车的真正状况。。。。
一个简例:市场进入博弈
一个企业决定是否进入一个新的产业, 但不知道在位企业的成本函数,也不知 道一旦进入,在位者决定默许还是斗争。
海萨尼(Harsanyi)转换
我们将一个参与人所拥有的所有个人信 息称为他的类型(Types)
不完全信息意味着,至少有一个参与人 有多个类型(否则就成为完全信息博 弈)。
海萨尼(Harsanyi)转换
一般地,用θi表示参与人 的一个特定类 i 型,Θi表示参与人i的所有类型的集合, 即θi∈ Θi
应用举例1:不完全信息古诺 模型
E Z1=(1/2) q1(1- q1- q2L) + (1/2)q1(1-q1- q2H)
解最优化一阶条件,得企业1的反应函数为:
q1*=(1/2)(1-(1/2) q2L-(1/2) q2H)=(1/2)(1-E q2)
均衡意味着两个反应函数同时成立,解两个 反应函数,可得到贝叶斯均衡为 q1*=1/3; q2L*=11/24; q2H=5/24 作为练习,请与完全信息下的古诺模型产量 进行对比。
海萨尼通过引入虚拟的参与人——”自 然”(Nature),将不完全信息博弈转换 为完全但不完美信息的博弈,从而可用 完全信息博弈论进行处理,这就是著名 的“海萨尼转换”(Harsanyi Transformation)
海萨尼(Harsanyi)转换
图4.1就是市场进入博弈问题,经过海萨尼转换后,得 到的博弈树。 0 高 低 [P] [1-P] 进入者 不进入 进入 进入 不进入 (0, 300) (0, 400) 合作 斗争 斗争 合作 (40, 50) (-10, 0) (30, 80) (-10, 100) 图3-1 市场进入博弈
07博弈论与企业策略性行为_产业经济学(王俊豪版)
第四节 合作策略性行为
(二)冷酷策略 冷酷策略(grim strategy)是指在重复博弈中, 只要所有的人都采取合作的策略,那么就一直合作 下去,如果有一方背叛了合作,那么合作就永远终 止,所有的人对此行为加以惩罚。
第四节 合作策略性行为
(三)胡萝卜加大棒策略 胡萝卜加大棒策略则是一个较为温和的策略。 开始所有的垄断企业都生产一个合作的低产量,相 应地利润也比较高,但是一旦有某个企业背离了这 个策略生产高产量时,所有的企业都调整为高产量 去惩罚他。如果任何一个企业在惩罚期不惩罚(对于 不执行惩罚策略的人给予惩罚是给予惩罚者的一个 胡萝卜),惩罚期重新开始。如果没有企业在惩罚期 不惩罚,合作期又重新开始。
第四节 合作策略性行为
三、明确合作策略性行为
明确合作策略性行为是指寡头企业通过公开或 秘密的协议(书面或秘密会谈)来协调行为以使合 作组织利润最大化的一种行为。
(一)共同成本手册与多产品定价公式 (二)转售价格维持(RPM) (三)基点定价
第四节 合作策略性行为
(四)一致-竞争条款 (五)价格领导 (六)预告价格变动 (七)最惠国待遇条款 (八)行业协会 (九)交换信息 (十)分割市场与固定市场份额
小约翰纳什(John Forbes Nash)是20 世纪最有才华的 数学家之一。他在22 岁的时 候所写的一篇只有20 多页的 论文奠定了博弈论的基础, 1994 年和另外两位经济学家 一起获得了诺贝尔经济学奖。
第一节 博弈与博弈论
到60年代,出现了一些重要人物,泽尔滕 (Selten)将纳什均衡的概念引入动态分析提出了 “精炼纳什均衡”的概念;海萨尼(Harsanyi)把不 完全信息引入博弈论研究。
掠夺性定价是指原有企业将价格削减至对手平 均成本之下,以便将对手驱逐出市场或者遏制进入, 即使遭受短期损失。一旦对手离开市场,原有企业 就会提高价格以补偿掠夺期损失(Schmalensee; Rosenbaum; Romano and Berg)。
博弈论第七章习题
第七章习题一、判断下列表述是否正确,并作简单分析(1)海萨尼转换可以把不完全信息静态博弈转换为不完美信息博弈,说明有了海萨尼转换,不完全信息静态博弈和一般的不完美信息动态博弈是等同的,不需要另外发展分析不完全信息静态博弈的专门分析方法和均衡概念。
答:错误。
即使海萨尼转换把不完全信息静态博弈转换为不完美信息动态博弈,也是一种特殊的有两个阶段同时选择的不完美信息动态博弈,对这种博弈的分析进行专门讨论和定义专门均衡的概念有利于提高分析的效率。
(2)完全信息静态博弈中的混合策略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。
答:正确。
完全信息静态博弈中的混合策略博弈几乎总是可以解释成一个有少量不完全信息的近似博弈的一个纯策略Bayes—Nash均衡。
夫妻之争的混合策略Nash均衡可以用不完全信息夫妻之争博弈的Bayes—Nash均衡表示就是一个例证。
(3)证券交易所中的集合竞价交易方式本质上就是一种双方报价拍卖。
答:正确。
我国证券交易中运用的集合竞价确定开盘价的方式就是一种双方报价拍卖。
与一般双方报价拍卖的区别只是交易对象,标的不是一件而是有许多件。
(4)静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型,都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。
答:错误。
不是因为能够迷惑其他博弈方,而是其他博弈方必然会考虑这些行为选择并作为他们行为选择的依据。
因为只根据实际类型考虑行为选择就无法判断其他博弈方的策略,从而也就无法找出自己的最优策略。
其实,在这种博弈中一个博弈方即使自己不设定针对自己所有类型的行为选择,其他博弈方也会替他考虑。
因为设定自己所有类型下的行为,实际上是要弄清楚其他博弈方对自己策略的判断。
(5)“鼓励—响应”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。
答:错误。
“鼓励—响应”机制也就是说真话的直接机制,实际上只保证博弈方揭示,也就是说出自己的真实类型。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
到bi<1,则行为空间为[0,1]。
博弈方i的类型就是他的估价vi,类型空间Ti=[0,1]。 博弈方的实际类型只有他自己知道,另一方知道vi在[0,1]上平 均分布。
第二节 典型不完全信息静态博弈
暗标拍卖
q
* 1
2
第二节 典型不完全信息静态博弈
不完全信息的古诺模型
求解以上方程组,得:
* q2 ( cH )
a 2cH c1 (1 )(cH cL ) 3 6
* q2 ( cL )
a 2cL c1 (cH cL ) 3 6
a 2c1 cH (1 )cL q 3
b1
max[(v1 b1 ) P{v2
b1
b1 }] c2
max[(v1 b1 )
b1
b1 ] c2
式中P{bi=bj}=0,上式等于:
第二节 典型不完全信息静态博弈
暗标拍卖
第三节不完全信息与混合策略均衡
在完全信息静态博弈中,混合策略解决了完全信息静态 博弈中不存在纯策略纳什均衡的问题。 海萨尼1973年证明,完全信息情况下的混合策略均衡, 可以解释为不完全信息情况下纯策略均衡的极限。也就是说, 完全信息静态博弈中的混合策略纳什均衡,几乎总是可以被 解释为一个有些许不完全信息的静态贝叶斯博弈的一个纯策
第一节静态贝叶斯博弈和贝叶斯纳什均衡
海萨尼(Harsanyi)转换
1. 引进一个虚拟的“自然”博弈方,也可以称为“博弈方0”, 其作用是在博弈中进行实际博弈的博弈方选择之前,为每个实 际博弈方按随机方式进行选择,或者说抽取他们各自的类型, 抽取的这些类型构成类型向量t=(t1,…, tn),其中ti∈Ti; 2. 这个“自然”博弈方让每个实际博弈方知道自己的类型,但 不让(全部或部分)博弈方知道其他博弈方的类型; 3. 在前述基础上,在进行原来的静态博弈,即每个实际博弈方 同时从各自的策略空间中选择行动方案a1,…,an; 4. 除了“自然博弈方”外,每个博弈方各自取得得益ui=ui (a1,…,an,ti)。
第二节 典型不完全信息静态博弈
不完全信息的古诺模型
求极值,分别求导,得:
* a q1 cH q ( cH ) 2 * 2 * a q1 cL q ( cL ) 2 * 2
* * [a q2 (cH ) c1 ] (1 )[a q2 (cL ) c1 ]
1920- )美国人,由于他与另外两位数 学家在非合作博弈的均衡分析理论方
面做出了开创性的贡献,对博弈论和
经济学产生了重大影响,由此获得诺 贝尔经济奖。
第一节静态贝叶斯博弈和贝叶斯纳什均衡
贝叶斯纳什均衡
在不完全信息静态博弈中G={A1, …, An; T1, …, Tn; p1, …,
pn ;u1, …, un}中,博弈方i的一个策略,就是自己各种可能类型 ti(ti∈Ti)的一个函数Si(ti)。Si(ti)设定对于“自然”可能 为博弈方i抽取的各种类型ti,博弈方i将从自己的行为空间Ai中 相应选择的行动ai。
1 max[(vi bi ) P{bi b j } (vi bi ) P{bi b j }] bi 2
第二节 典型不完全信息静态博弈
暗标拍卖
假设博弈方的策略是风险中性,标价符合线性函数:
bi=civi,其中, ci≥0。有:
1 max[(v1 b1 ) P{b1 c2 v2 } (v1 b1 ) P{b1 b2 }] b1 2 max[(v1 b1 ) P{b1 c2 v2 }]
厂商B的最优策略是“不进入”,当p>0.25时,厂商B的最优策
略是“进入”。
第一节静态贝叶斯博弈和贝叶斯纳什均衡
暗标拍卖:
暗标拍卖有这几个特征:(1)密封递交标书;(2)统一 时间公证开标;(3)标价最高者以所报标价中标。假设,拍卖
和投标本身没有成本。则中标者的得益是他对拍卖标的的估计
与成交价(即投标价)的差额,未中标博弈方的得益则为0。
第一节静态贝叶斯博弈和贝叶斯纳什均衡
第一节静态贝叶斯博弈和贝叶斯纳什均衡
市场进入博弈模型:
有一市场已经为某企业A所占有,现在有一潜在的企业B也 想进入这一市场,但企业B不知道企业A的成本函数,以及当 自己决定进入市场后企业A的反击策略选择。假定企业A有高 成本和低成本阻止进入两种成本函数,且对应两种成本情况的 不同策略组合的得益如下所示:
* 1
第二节 典型不完全信息静态博弈
不完全信息的古诺模型
设:c1=2, cH=3,cL=1
则:q1=2
q2(cH)=1.5 q2(cL)=2.83
q2
6
3
(2,2)
0
3
6
q1
第二节 典型不完全信息静态博弈
暗标拍卖
两个风险中性博弈方,对拍品标的的估价分别是v1和v2,假
设v1和v2是独立的,且在[0,1]上平均分布,各博弈方都知道自己
第一节静态贝叶斯博弈和贝叶斯纳什均衡
市场进入博弈模型:
厂商A 高成本(p) 默许 斗争 -10 0 进入 30 40
不进入 0
厂商 B
低成本(1-p) 默许 斗争 20 70 -10 80 0 300 0 300
200
0
200
第一节静态贝叶斯博弈和贝叶斯纳什均衡
市场进入博弈模型:
给定厂商A是高成本,当厂商B进入时,厂商A的最佳策略 是默许;厂商A是低成本,厂商B进入时,厂商A的最佳策略是 斗争。 假定厂商B认为厂商A是高成本的概率是p,低成本的概率 是1-p。在厂商B选择进入的期望得益是p×30+(1-p)× (-10)=40p-10,选择不进入的期望得益是0。当p<0.25时,
则称博弈的策略组合S*=(S1*,…, Sn*)为G的一个 (纯策略)贝叶斯纳什均衡。
第二节 典Байду номын сангаас不完全信息静态博弈
不完全信息的古诺模型
两寡头进行同时决策的产量竞争,市场需求为P(Q)=a
-Q。厂商1的成本函数为C1=C1(q1)=c1q1,两个厂商都知
道。厂商2的成本函数有两种可能,一种是C2=C2(q2)=cHq2, 另一种是C2=C2(q2)=cLq2,cH>cL,即边际成本有高低两种
第一节静态贝叶斯博弈和贝叶斯纳什均衡
用ai表示局中人i的策略,Ai表示局中人i的策略集(或
策略空间)即ai∈Ai;用ti表示局中人i的类型,ti∈Ti;用pi =p{t-i|ti}表示博弈方i在自己的实际类型下对其他博弈方 类型组合t-i的概率判断;用ui表示各局中人的得益函数。 G={A1, … , An; T1, … , Tn; p1, … , pn; u1, …, un}
拍卖是不完全信息静态博弈。
第一节静态贝叶斯博弈和贝叶斯纳什均衡
我们用G={S1, …, Sn; u1, …, un}表示完全信息静态博 弈,其中Si是博弈方i的策略集(或策略空间,ui是博弈方 的得益函数,ui=ui(s1,…,sn)。 为了准确表达静态贝叶斯博弈,我们对G={S1, …, Sn; u1, …, un}做如下扩展:
* max[(a q1 q2 ) cH ]q2 q2
q2*(cL)应满足: max[(a q1* q2 ) cL ]q2
q2
* * q1*应满足: max{ [(a q1 q2 (cH ) c1 ]q1 (1 )[(a q1 q2 (cL ) c1 ]q1} q1
第一节静态贝叶斯博弈和贝叶斯纳什均衡
贝叶斯纳什均衡
在不完全信息静态博弈中G={A1, …, An; T1, …, Tn;
p1, …, pn ;u1, …, un}中,如果对任意博弈方i和他的每一种
可能的类型ti∈Ti,Si*(ti)所选择的行动ai都能满足:
* max ui [ S1* (t1 ),..., Si*1 (ti 1 ), ai , Si*1 (ti 1 ),..., S n (tn ), ti ] p(ti | ti ) ai Ai t i
略贝叶斯纳什均衡。
第三节不完全信息与混合策略均衡
根据海萨尼的结论,我们进一步认为一个混合策略纳什 均衡的根本特征不是博弈方以随机的方法选择策略,而是在 于各博弈方不能确定其他博弈方将选择什么战略。这种不确 定行可能是由于随机性引起的,也可能是由于信息的不完全 性,即博弈方不知道其他博弈方的得益类型引起的。
情况,厂商2知道自己实际是哪一种,厂商1只知道前一种的概
率为θ,后一种情况的概率是1-θ。
第二节 典型不完全信息静态博弈
不完全信息的古诺模型
设厂商1的最佳产量为q1*;厂商2在边际成本为cH时会选择最 佳产量q2*(cH),在边际成本为cL时会选择最佳产量q2*(cL)。 则q2*(cH)应满足:
第七章不完全信息静态博弈
贝叶斯纳什均衡
典型不完全信息博弈
不完全信息与混合策略 机制设计
第七章不完全信息静态博弈
庄子与惠子游于濠梁之上。庄子曰:“儵鱼出游从容,是 鱼之乐也。”惠子曰∶“子非鱼,安知鱼之乐?”庄子
曰:“子非我,安知我不知鱼之乐?”惠子曰“我非子,固不
知子矣;子固非鱼也,子之不知鱼之乐,全矣!”庄子曰: “请循其本。子曰‘汝安知鱼乐’云者,既已知吾知之而 问我。我知之濠上也。”
是h/x,选择德语的概率是(x-h)/x。
第三节不完全信息与混合策略均衡
选修课博弈
假设乙已经采取了上述策略,则甲选择法语的期望得益 是: EU甲(法语)=(3+t1)(h/x)+ 1· (x-h)/x =(2h+ t1h+x)/x EU甲(德语)= 0· (h/x)+ 2· (x-h)/x=2· (x-h)/x 当EU甲(法语)> EU甲(德语)时,即t1>x/h -4, 可得w=