2 同时决策博弈(2)
第17章 决策与博弈论
第17章决策与博弈论17.1 复习笔记1.博弈论的基本概念(1)博弈及其三个要素博弈论是在一个简化的体系里描述复杂的决策问题,这些决策问题往往涉及多个行为者,他们之间的决策相互依存,相互作用。
博弈包含三个要素:①参与者;②决策;③报酬。
(2)合作与非合作博弈如果在博弈参与者之间可形成共同计划的决策这类具有约束性的合同,那么这类博弈被称为合作性的博弈。
如果在参与者之间不能达成或实施有约束性的合同,这类博弈则被称作非合作性的博弈。
(3)主导策略(占优策略均衡)主导策略是指对某参与者而言,不管其竞争对手的反应如何,这一决策总是最优的策略。
2. 纳什均衡(1)纳什均衡纳什均衡是指在给定对方行动的前提下可以给每个参与者都带来最佳结果的某种决策(或行动)。
达到纳什均衡时,每一个博弈者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。
也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而这个均衡没有人有积极性去打破。
占优策略均衡即是一种纳什均衡。
占优策略均衡若存在,只存在惟一均衡,而纳什均衡可能存在多重解。
(2)最大极小决策(囚徒困境)最大极小决策反映的是,从个人角度出发所选择的占优策略,从整体来看,却是最差的结局,即个人理性与团体理性的冲突。
这一决策可以发生在不少的博弈场合,也可以解释卡特尔联盟的不稳定性。
(3)混合策略在有些博弈中,仅采取一种决策或一种行动的“纯决策”不是最好的决策,即可能不存在纳什均衡。
而以某特定的概率P选择一种行为,以1-P的概率选择另一种行为,则有可能是纳什均衡的解。
这时的选择被称为混合策略。
但反过来需要注意,存在混合策略均衡的博弈也有可能存在非混合策略的均衡。
3. 重复博弈重复博弈即同一个博弈被重复多次的动态博弈,它是反复不断进行的。
在无限期重复博弈中,对于任何一个参与者的欺骗和违约行为,其他参与者总会有机会给予报复。
所以,每一个参与者都不会采取违约或欺骗的行为,囚犯困境合作的均衡解是存在的。
博弈论复习题(1)
1.设一四阶段两博弈方之间的动态博弈如图所示。
试找出全部子博弈,讨论该博弈中的可信性问题,求子博弈完美纳什均衡策略组合和博弈的结果。
2.假设一个工会是一个寡头垄断市场中所有企业唯一的劳动力供给者,就像汽车工人联合会对于通用、福特、克莱斯勒等大的汽车厂家。
令博弈各方行动的时间顺序如下:(1)工会确定单一的工资要求w ,适用于所有的企业(2)每家企业i 了解到w ,然后同时分别选择各自的雇佣水平L i ;(3)工会的收益为(w-w α)L ,其中w α为工会成员到另外的行业谋职可取得的收入,L=L 1+…L n 为工会在本行业企业的总就业水平;企业i 的利润为π(w ,L i ),其中决定企业i 利润水ABB A h g (2,4)(8,5)(3,6)(4,3)b (5,3)a c d f e平的要素如下。
所有企业都有同样的生产函数:产出等于劳动力q i=L i。
市场总产出为Q=q1+…+q n时的市场出清价格为p(Q)=a-Q。
为使问题简化,假设企业除了工资支出外没有另外的资本。
求出此博弈的子博弈精炼解。
在子博弈精炼解中,企业的数量是如何影响工会的效应的?为什么?(吉本斯2.2节 2.7答案)3.下图所示的同时行动博弈重复进行两次,并且第二阶段开始前双方可观测到第一阶段的结果,不考虑贴现因素。
变量x大于4,因而(4,4)在一次性博弈中并不是一个均衡收益。
对什么样的x,(双方参与者同时采取)下述战略是一个子博弈完美纳什均衡?第一阶段选择Q i,如果第一阶段的结果为(Q1,Q2),在第二阶段选择P i;如果第一阶段的结果为(y,Q2),其中y≠Q1,第二阶段选择R i;如果第一阶段的结果为(Q1,z),其中z≠Q1,第二阶段选择S i;如果第一阶段结果为(y,z),其中y≠Q1,且z≠Q2,则在第二阶段选P iP2 Q2 R2 S2P1Q1R1S1(2.10吉本斯)思路:逐个分析上述的四种情形:第一种情形,第一阶段选择Qi,第二阶段选择Pi,即双方均采取合作的策略,得益均为6;第二种情形和第三种情形下,实际上有一方是采取了不合作,其得益为x,另一方即利益受损方得益为2;第四种情形实际上是双方都不采取合作的策略,而根据题目要求,对于x,下述战略是一个子博弈精炼纳什均衡,所以x必须小于双方均合作时的收益6,否则第一种情形不会出现,因为既然x>6了,双方均会选择不合作而使情形一不会出现。
第二讲纳什均衡
诚实 游客 游客收益10 商户收益5 不购买 游客收益0 商户收益-5 购买
欺诈 游客收益5 商户受收益10 游客收益0 商户收益0
案例讨论
2008年的美国总统大选让我们看到一 幕大戏。这场大戏的精彩部分并不是 迷住当与共和党的总统选举对决,而 是民主党总统候选人的提名选举。 民主党的提名竞选,最终只在希拉里 和奥巴马之间进行。在2008年之前, 奥巴马只是一个默默无闻的小角色, 他那年才46岁,只有3年的国会参议员 和伊利诺伊州参议员的工作经历,但 他是当时国会中唯一一位黑人参议员, 也是
2、纳什均衡一定是在重复剔除严格劣战略过 程中没有被剔除掉的战略组合,但没有被剔除 的战略组合不一定是纳什均衡,除非它是唯一 的。(这句话并不适用于弱劣战略剔除的情况)
第二节
纳什均衡
三、寻找纳什均衡的方法 (一)劣势策略反复消去法 民主党 主动增税 被动增税 2,2 1,4 主动增税 共和党 4,1 3,3 被动增税
纳什均衡
纳什均衡:(被动增税,被动增税) 巨额赤字
试一试:劣势策略反复消去法
上 参与人1 下 参与人2 左 中 右
1,0
0,4
1,3
0,2
0,1
2,0
第二节
纳什均衡
三、寻找纳什均衡的方法 2000:军费支出 (二)相对优势策略划线法 -∞:丧失主权 8000:掠夺者赢利 0:军费支出为零,和平 原苏联 共处 扩军 裁军 -2000,-2000 8000,-∞ 扩军 美国 -∞,8000 0, 0 裁军
2 TR TC p2 (a p2 bp1 ) (a p2 bp1 )c
伯川德模型
通过令一阶导数为零,得到:
管理决策博弈法计算题
管理决策博弈法计算题(最新版)目录1.管理决策博弈法简介2.管理决策博弈法计算题的类型3.管理决策博弈法计算题的解法4.管理决策博弈法计算题的应用实例5.总结正文【1.管理决策博弈法简介】管理决策博弈法是一种用于解决管理决策问题的数学方法,它基于博弈论,通过分析决策者之间的相互作用,研究决策者的策略选择和决策结果。
管理决策博弈法可以帮助决策者在复杂的决策环境中找到最佳的决策策略,从而实现组织目标。
【2.管理决策博弈法计算题的类型】管理决策博弈法计算题主要包括以下几种类型:(1)静态博弈计算题:静态博弈是指在一次性决策中,决策者需要同时做出决策,并且每个决策者的决策不会受到其他决策者的影响。
(2)动态博弈计算题:动态博弈是指在多次性决策中,决策者需要根据其他决策者的决策结果,调整自己的决策策略。
(3)完全信息博弈计算题:完全信息博弈是指决策者拥有完全的信息,可以准确地预测其他决策者的决策结果。
(4)不完全信息博弈计算题:不完全信息博弈是指决策者拥有不完全的信息,无法准确地预测其他决策者的决策结果。
【3.管理决策博弈法计算题的解法】管理决策博弈法计算题的解法主要包括以下几种:(1)纳什讨价还价解法:纳什讨价还价解法是一种用于解决静态博弈问题的方法,它假设每个决策者都会选择最优的策略,并且每个策略都会考虑到其他决策者的可能策略。
(2)重复博弈解法:重复博弈解法是一种用于解决动态博弈问题的方法,它假设决策者会在多次决策中,根据其他决策者的决策结果,调整自己的策略。
(3)贝叶斯博弈解法:贝叶斯博弈解法是一种用于解决不完全信息博弈问题的方法,它假设决策者会根据自己拥有的信息,对其他决策者的策略进行概率分析,并选择最优的策略。
【4.管理决策博弈法计算题的应用实例】管理决策博弈法计算题在实际应用中,可以解决许多管理决策问题,例如:(1)定价决策:在市场竞争中,企业需要根据竞争对手的价格策略,选择最佳的定价策略。
第2次作业:P138-3
下面的两人博弈可以解释为两个寡头企业的价格竞争博弈,其中p是企业1 的价格,q是企业2的价格。企业1的利润函数是
π 1 = −( p − aq + c) 2 + q
企业2的利润函数是 π 2 = −( q − b ) + p 求解: (1)两个企业同时决策时的纳什均衡; (2)企业1先决策时的子博弈精炼纳什均衡; (3)企业2先决策时的子博弈精炼纳什均衡; (4)是否存在某些参数值(a,b,c)使得每一个企业都希望自己先决策?
∂π 1 = −2 * ( p − aq + c) = 0 企业1的最优选择 ∂p
p = aq − c
这是企业1对企业2的价格策略q的最优反应 第2步:因为企业2预测到对企业1的选择 p = aq − c 则企业2在先决策面临的问题就是
∂π 2 = −2 * (q − b) + a = 0 ∂q
a2 则: p = 2 + aq − c
π 1 = −( p − ab + c) + q
p = ab − c
∂π 1 = −2 * ( p − ab + c) = 0 ∂p
则: p = ab − c
q=b
即为精炼纳什均衡
(3)下面用逆向归纳法求解(企业2先决策)
π 1 = −( p − aq + c) 2 + q 首先,考虑企业2的价格q既定下的,
a a2 a2 π 2 = −(q − b) 2 + p = −( + b − b) 2 + + ab − c = + ab − c 2 2 4
当先决策的利润大于后决策时,企业才会希望先决策
a b > + b,即a < 0,企业1希望先决策 2 a2 + ab − c > ab − c,即a ≠ 0,企业2希望先决策 4
博弈论课程设计 (2)
博弈论课程设计1、引言博弈论是现代数学中的一个重要分支,是由经济学家和数学家共同合作发展起来的。
博弈论主要研究人类社会中的决策行为和相互关系,以及在涉及决策行为和相互关系的情景中个体或组织如何做出理性的决策。
博弈论在生物学、心理学、社会学、管理学、工程学等领域也有广泛的应用。
在博弈论的学习过程中,理论与实践相结合是必不可少的。
本文将介绍一些博弈论的课程设计,旨在帮助学生更好地理解和应用博弈论的知识。
2、课程设计2.1 美国拍卖模拟实验美国拍卖是一种竞价拍卖。
在竞拍过程中,买家通过不断提高他们的出价来争夺商品,最后出价最高者获得商品所有权。
美国拍卖的特点是出价者可以随时根据拍卖过程中的信息改变他们的出价。
该模拟实验的目的是通过竞卖过程的模拟来让学生学习博弈论中的核心概念,如策略、博弈纳什均衡等。
该实验还可以帮助学生分析竞价策略与结果的关系,提高学生思考和策略制定的能力。
2.2 博弈纳什均衡实验博弈纳什均衡是博弈论中的一个重要概念。
在一个博弈中,如果所有参与者都选择了他们各自的最优策略,那么这个博弈就到达了一个均衡状态,称为纳什均衡。
该实验可以让学生自己尝试找到博弈的纳什均衡,提高学生的逻辑推理和自主思考能力。
同时,这个实验中涉及到的博弈模型也可以用来分析和解决现实生活中的问题。
2.3 连续混合策略实验连续混合策略是博弈论中的一个重要概念,它在实际应用中有广泛的应用。
在连续混合策略中,玩家有一个概率分布,他们可以随机选择他们的行动。
在竞争和合作的情况下,连续混合策略被用来描述下注、选择行为模型等。
在本实验中,学生将学习如何制定连续混合策略并评估它们的效果。
通过该实验,学生将加深对复杂博弈策略的理解和应用,提高学生的计算能力和分析能力。
3、结语博弈论不仅仅是一种专业的数学知识,它已经成为了理解和解决社会问题的一种重要的工具。
实践是理论的检验,课程设计可以帮助学生更好地理解和应用博弈论的知识。
希望本文介绍的三个课程设计能够为读者提供一些启示,帮助读者更好地理解博弈论的知识和应用。
第二讲纳什均衡
习题:齐威王田忌赛马矩阵
上中下 上中下
田忌
上下中 中上下 中下上 下中上 下上中
+3,-3 +1,-1 +1,-1 -1,+1 +1,-1
+1,-1 +3,-3 -1,+1 +1,-1 +1,-1
+1,-1 +1,-1 +3,-3 +1,-1 -1,+1
+1,-1 +1,-1 +1,-1 +3,-3 +1,-1
在第二行1 下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
20
第三节 纳什均衡
三、寻找纳什均衡的方法 (二)相对优势策略划线法 3.设定甲靠左行(第一行) 乙: 1>-1 乙相对优势策略:靠左行
在第一列 1下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
21
第三节 纳什均衡
四、古诺模型 max i 2.企业i的目标: π1=?,π2=? 3.企业利润最大化的一阶、二阶条件
1 0 q1 2 0 q2
2015年12月6日
2 1 2 0 2 q1 2 2 2 0 2 q 2
博弈论第二章 第二讲纳什均衡
35
第三节 纳什均衡
27
第三节
纳什均衡
要点:(1)箭 头指向的支付 大;(2)只有 一方单独改变 策略
三、寻找纳什均衡的方法 (三)箭头指向法 2.分析:(适度放牧,过度放牧) (1)给定乙不变,甲改变:0→10 (箭头向上) (2)给定甲不变,乙也不变
2015年12月6日
博弈论第二章 第二讲纳什均衡
经济博弈论 02 完全信息静态博弈(Park)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
博弈决策
斗鸡博弈
此博弈的战略式表述
东尼 退怯
吉米
退怯
3,3
勇进
4,2
勇进 2,4 0,0
斗鸡博弈
分析
吉米
退怯 勇进
东尼 退怯
3,3 4,2
勇进 2,4 0,0
抵赖
( -10, 0)
( -1, -1)
囚徒困境(Prisoner’s Dilemma)
结论:
演奏家将会承认
Tchaikovsky呢?
演奏家 坦白
囚徒困境(Prisoner’s Dilemma)
坦白
Tchaikovsky 抵赖
( -8, -8)
( 0, -10)
抵赖
( -10, 0)
( -1, -1)
斗鸡博弈
应用:公共产品的供给; 两军对抗; 商业竞争:占领市场
市场进入阻挠
参与者:垄断企业(在位者),进入者 面临的情况:在位者垄断着某个市场,进入者想要打进
这个市场分一杯羹 行动(策略):在位者:默许,斗争;进入者:进入,
不进入 收益函数
进入者进入,在位者默许,则进入者40,在位者50 进入者不进入,在位者默许,进入者0,在位者300 进入者进入,在位者斗争,则进入者-10,在位者0 进入者不进入,在位者斗争,则进入者0,在位者300
( -1, -1)
演奏家 坦白
囚徒困境(Prisoner’s Dilemma)
坦白
Tchaikovsky
抵赖
( -8, -8)
( 0, -10)
3(2)同时博弈与序贯博弈
也即πi(ti, tj, hi,ei, hj, ej)=
[a-(hi+ej)]hi -chi +
企业i在市场的最优化问题就可拆为一对问题, 在每个市场分别求解
企业的收益为其利润πi: [a-(hj+ei)]ei-cei-tjei
πi(ti, tj, hi,ei, hj, ej)=
[a-(hi+ej)]hi -chi +
企业的收益为其利润πi:
+ [a-(hj+ei)]ei-c(hi+ei)-tjei
πi(ti, tj, hi,ei, hj, ej)= [a-(hi+ej)]hi
ei*必须满足:maxei[a-(ei+hj*)-c]-tjei ei≧0
企业的收益为其利润πi:
+ [a-(hj+ei)]ei-c(hi+ei)-tjei
企业i在市场的最优
化问题就可拆为一对 问题,在每个市场分 别求解
企业的收益为其利润πi:
πi(ti, tj, hi,ei, hj, ej)= [a-(hi+ej)]hi -chi + [a-(hj+ei)]ei-cei-tjei
hi*须满足: max hi[a-(hi+ej*)-c], hi ≧ 0
银行挤兑(1)
王则柯“银行挤兑的成因和预防”
对客户来说,抽回存款的日期也有两种:一是在银行投资 两客户在同一银行各存有100元,银行将 项目到期之前,称日期 1;一是在到期之后,称日期2。 这200元投资于一个长期项目。如果在项
假定如果两客户在日期 1要求抽回资金则各得70元;如果只 目到期前银行要抽回资金,则只能收回 有一个客户在日期1要抽回资金则该客户得100元,另一客 140元;但如果到期后再收回投资,则可 户只能得到剩余的 40元。
博弈论2纳什均衡及应用举例
房地产开发博弈
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 开发商A 开发商B 开发 不开发
4000,4000 8000,0
0,8000
0,0
开发商B 开发 不开发
-3000,-3000 0,1000 1000,0 0,0
不开发
房地产开发博弈
若双方同时决策 若市场需求已知 若市场需求未知,是否开发依赖于 (1)各自在多大程度上认为需求是大的, (2)对方是否开发
Complete and Perfect ——完全信息与完美信息
如房地产开发博弈中,如果至少有一个 参与人不知道市场需求的大小,信息是 不完全的也是不完美的 如果两个参与人都知道市场需求是大的 还是小的,信息是完全的,但如果A不知 道B选择了什么行动,那么A的信息是不 完美的。
支付Payoff
房地产开发博弈
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 开发商A 开发商B 开发 不开发
4000,4000 8000,0
0,8000
0,0
开发商B 开发 不开发
-3000,-3000 0,1000 1000,0 0,0
不开发
市场进入博弈
高
N
低
[P]
不进入
进入者
进入 不进入
[1-P]
有限策略与无限策略同时存在一个博弈问题中
零和博弈
零和博弈: 社会总得益,即各博弈方得益之和总是为 0 猜硬币方
正面 正 面 反 面 反面
盖 硬 币 方
-1,1
1,-1
1,-1
-1,1
零和博弈
零和博弈的特点:
7第五章 同时博弈与序贯博弈[70页]
信息集与三人罢工博弈
某公司总共雇佣了三名员工,年底公司老板宣 布明年不涨工资,消息引起了三名员工的不满。因 此,三名员工考虑第二天是否罢工。
✓ 情况0:完美信息 ✓ 情况1:2不知道1 ✓ 情况2:3不知道2 ✓ 情况3:3不知道1 ✓ 情况4:3不知道1,也不知道2 ✓ 情况5:互相都不知 • 写出各种情况下所有人策略集。
• 举例:房地产开发
– B的一个行为策略:如 果A选择开发,那么我 以40%的概率选择开发, 60%的概率选择不开发; A 如果A选择不开发,那 么,我以70%的概率选 择开发,以30%的概率 选择不开发。
B不 不
开
不 开B
开
(30%) (70%) (60%) (40%)
序贯决策博弈的纳什均衡
• 展开型博弈的行为策略与策略型博弈的混合策略 有什么区别? – 混合策略是针对所有纯战略而言的; – 行为策略则与信息集密切联系,规定了每一个 信息集上的行动的概率分布。 – 行为策略也是一种相机行动规则,只不过在这 种行动规则指导下参与人的行动选择带有随机 性。
2.矩阵表示转化为树型表示
• 问题:树型如何能够表达出局中人同时进 行博弈的情况?
信息集
• 处理方法: 用一个扁椭圆形的虚线的圈,把所论局
中人的若干决策节点罩起来,成为他的一个信 息集,并约定如下的理解:
– 所论局中人只知道博弈是否进行到了他的这个 信息集,但是在他知道博弈已经进行到他的这 个信息集的情况下。他不知道博弈究竟进行到 这个信息集中的哪个决策节点。
–每一个决策位置都是一个信息集。
• 同集同注:就是从同一个信息集的各个决策节
点出发的策略选择,不仅数目相同,而且名称相同
• 当博弈走到一个单点集的信息集时,面临决策的 局中人对于博弈迄今的历史是清楚的,他清楚博 弈具体走到了他的这个决策节点而不是别的决策 节点。
同时博弈论
两人都丢面子
B
进
退
-3
0
进 -3
2
2
0
退0
0
Case4.石头剪子布
1. 博弈方1,2;
2. 可选策略: 石头、剪子 和布;
3. 几乎同时决 策;
4. 所得利益: 0表示没有输 赢;1表示赢; -1表示输。
博弈方2 石头 剪子 布
石 0,0 1,-1 -1,1 博头 弈 方 剪 -1,1 0,0 1,-1
1.2.6 完全信息博弈和不完全信息博弈
• 完全信息博弈:是指每一参与者都拥有所有其他参 与者的特征、策略集及得益函数等方面的准确信息的博弈。 • 不完全信息博弈:是指参与者只了解上述信息中的 一部分的博弈。
将博弈的信息特征和行为时间特征结合起来,可以进一 步把博弈细分为下面四种类型的非合作博弈,得到四种均衡:
乙
左
中
右
0
3
1
甲上 1
1
0
4
2
0
下0
0
2
划线法——情侣博弈battle of sexes
一对情侣面临周末晚上安排什么节目的决策,Jim 是铁杆球迷,怎肯放过一场世界杯的生死之战?Eva 崇尚高雅艺术,正好有一场《胡桃夹子》的芭蕾舞剧。 分开各自做喜欢的事,对于热恋中的他们也是一种折 磨,怎么办?
Eva
同时决策/行动博弈
• 完全信息静态博弈中的行为假定
理性参与人 ----追求支付最大化
完全信息
----对策略、策略组合及相关支付完全了解
独立决策
----无勾结(不管是明的还是暗的)
• 同步决策(静态博弈)
在寡头市场,当经理们必须在无法知道竞争对手的决策的情况下做出自己的 决策时,同步决策博弈发生。
2×2双矩阵博弈的图解法
博弈论讲义——完全信息静态博弈❑❑❑博弈❑论讲义——完全信息静态博弈博弈❑论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈❑❑博弈论讲义——完全信息静态博弈博弈❑论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈❑r1博弈论讲义——完全信息静态博弈r1博弈论讲义——完全信息静态博弈r1博弈论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈3/4博弈论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈博弈论讲义——完全信息A 静态博弈博弈论讲义——完全信息A 静态博弈博弈论讲义——完全信息静态博弈❑❑博弈论讲义——完全信息静态博弈❑❑博弈❑论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈❑❑博弈论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈❑❑博弈❑论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈❑❑博弈❑论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈❑❑博弈❑论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈❑上述问题可表示为双矩阵形式,见图❑该博弈也存在两个纯策略纳什均衡,分别为❑博弈❑论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈博弈❑论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈博弈❑论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈❑❑博弈论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈❑❑博弈论讲义——完全信息静态博弈❑❑博弈❑论讲义——完全信息静态博弈博弈论讲义——完全信息静态博弈D U参与人1博弈论讲义——完全信息静态博弈D U参与人1博弈论讲义——完全信息静态博弈D U参与人1博弈论讲义——完全信息静态博弈参与人1博弈论讲义——完全信息静态博弈博弈❑论讲义——完全信息静态博弈。
02 完全信息静态博弈
假设C为单位成本,则两商店的利润分别为
( p , p ) ( p c) D ( p , p ) ( p , p ) ( p c) D ( p , p )
当a=1-b时,即两商店位于同一位置,完全无差异,则
p
*
1
p
* 2
c
如果企业的竞争战略是价格,则Bertrand证明,即使只 有两个企业,在均衡情况下,价格等于边际成本,企业的 利润为零,与完全竞争市场均衡一样。这就是“伯川德悖 论(Bertrand Paradox)”。 解开这个悖论的办法之一就是引入产品的差异性。
* * ,sn ) 的各一个策略组成的某个策略组合 (s1 中,任一参与人
* * 的策略,都是对其余参与人策略的组合 (s1 ,si*1 , si*1 ,...sn )
* * * * ,si*1, si* , si*1,...sn ) ui (s1 ,si*1, si , si*1,...s, 的最佳对策,即 ui (s1 n)
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1
6q1 q1q2 q12
u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2
6q2 q1q2 q22
古诺模型的反应函数
maxu1 max(6q1 q1q2 q12 )
* * ( ui (si* , s )对任意 s S i 都成立,则称 ) u ( s , s i i i i )
i
s
*
* * ( s1 , sn ) 为 G 的一个纳什均衡
博弈论贝叶斯纳什均衡
博弈论贝叶斯纳什均衡一、引言博弈论是研究决策者在相互影响中做出决策的科学。
贝叶斯纳什均衡是博弈论中的一种解法,它考虑了不完全信息下的决策问题,被广泛应用于经济学、政治学、计算机科学等领域。
本文将从博弈论和贝叶斯纳什均衡两个方面进行详细介绍。
二、博弈论1.基本概念博弈论中有三个基本概念:玩家、策略和收益。
玩家是参与游戏的实体,可以是个人、组织或国家等。
每个玩家都有自己的目标和利益。
策略是指玩家在游戏中做出的选择。
每个玩家都有多种可选的策略,每种策略都对应着不同的收益。
收益是指每个玩家在游戏结束后获得的利益或损失。
收益可以用数字表示,也可以用其他方式来描述。
2.分类根据游戏参与者数量和信息情况,博弈论可以分为以下几类:(1)单人博弈:只有一个玩家参与游戏,如囚徒困境。
(2)双人博弈:有两个玩家参与游戏,如零和博弈、非零和博弈等。
(3)多人博弈:有多个玩家参与游戏,如合作博弈、竞争博弈等。
(4)完全信息博弈:每个玩家都知道其他玩家的策略和收益情况,如国际象棋。
(5)不完全信息博弈:每个玩家只知道自己的策略和收益情况,不知道其他玩家的策略和收益情况,如扑克牌。
3.解法解决一个博弈问题需要找到一种最优的策略组合,使得每个玩家都能够获得最大化的收益。
常见的解法有纳什均衡、帕累托最优解等。
三、贝叶斯纳什均衡1.基本概念贝叶斯纳什均衡是指在不完全信息下的多人博弈中,每个玩家根据已知信息做出最优选择所形成的策略组合。
它包含两个部分:先验概率和后验概率。
先验概率是指每个玩家在游戏开始前对其他玩家的策略和收益情况所做的预测。
后验概率是指每个玩家在游戏进行过程中,根据已知信息对其他玩家的策略和收益情况所做的修正。
2.求解方法贝叶斯纳什均衡的求解方法可以分为两种:直接求解和迭代求解。
直接求解是指通过计算每个玩家在不同信息情况下的期望收益,找到满足条件的最优策略组合。
这种方法适用于信息量较少、博弈参与者较少的情况。
迭代求解是指通过反复修正先验概率和后验概率,最终找到满足条件的最优策略组合。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 这个双寡头竞争模型表述成一个策略型博弈,其 三要素为:
– 两个局中人:企业1和企业2 – 每个企业的策略集(0,∞) – 企业 i 的支付函数即其利润函数:
π i q1 , q2) (a − q1 − q2 )qi − ci qi ( =
• 用连续情形纳什均衡的检验方法来计算纳什均衡:
π 1 q1 , q2) (a − q1 − q2 )q1 − c1q1 ( =
乙 a 2 A 2 3 甲 B 1 0 C 2 2 2 3 2 3 2 3 2 b 1 0 2 c 2
• 谁想偏离纳什均衡另搞一套,利益角逐的 最终结果,还是要回到原来的纳什均衡的 位置。 • 只有纳什均衡才是博弈的稳定对局。
2-10纳什均衡的应用
• 古诺竞争模型
– 两个企业之间进行的一个策略型博弈,企业1和企业2, 这两个企业生产同质的产品,共同占有这种产品的市场。 记企业1的产量为 q1,企业2的产量为q 2 ,则两个企业的 总产量就是 q = q1 + q 2 。 – 设这种商品的市场需求曲线 q = a - p , a为常数 – 市场的反需求函数 p(q) = a - q – 设企业 i 生产 q i 单位产品的总成本是 ci qi ,其中 ci 是 正常数, i =12 ,
策略型博弈的纳什均衡定义
• 符号约定:
• 当策略集不是有限集的时候,无法运用已经学过 的劣势策略消去法,相对优势策略划线法和箭头 指问法。但是,对于策略集都是实数的开区间并 且支付函数都是可微的多元函数的情形,运用微 分方法可以找出纳什均衡。
策略集都是实数的开区间且支付函 数都是可微的多元函数
= u1 x, y, z) - x 4 + 14 x 3 /3 − [5 + 2( y + z )]x 2 + 4( y + z ) x ( = u(x, y, z) − y / 2 + zy 2
2
= u(x, y, z) z 2 / 2 + (1 − y ) z 3
求纳什均衡解。
2-9“最后归宿”博弈
• 这个双寡头竞争模型表述成一个策略型博弈,其 三要素为:
– 两个局中人:企业1和企业2 – 每个企业的策略集是价格,而非产量: [0,∞) – 企业 i 的支付函数即其利润函数:
π i pi , p j) qi ( pi , p j )( pi − c) = (a − pi + bp j )( pi − c) ( =
i = 1,2
∂π 1 p1 , p2) ( = −2 p1 + bp2 + a + c = 0 ∂p1
∂π(p1 , p2) 2 = bp1 − 2 p2 + a + c = 0 ∂p2
a+c p = p2 = 2−b
* 1 *
2-11 纳什均衡的观察与验证
• 假设两个人分一百块钱,每个人独立地提 出自己要求的数额,并把要求写在一张纸 上,然后由公正的第三方来主持和判定最 终的分配结果。规则是这样的:设 x1 为第 一个人要求的数额,x2 为第二个人要求的数 额,如果 x1 + x2 ≤ 100 ,则每个人得到自己要 求的数额;否则,两人一分钱都得不到。 • 请猜测纳什均衡的结果。
具体操作方法
• 依次考察矩阵型博弈的每个策略组合,如果在这 个策略组合某个局中人能够通过单独改变策略选 择增加自己的支付,则从所分析的策略组合下他 所对应的支付处引一箭头,指向他单独改变策略 后新的策略组合下他所对应的支付。当所有策略 组合都这样处理完了以后,没有箭头指出去的那 些格子表征的策略组和2时,每个人都愿意出100块钱;当 N ≥ 4时,没有人愿意出钱。因为当参与分钱的 人数大于钱增加的倍数时,对于任何一个参与 人,自己出钱是件亏本的事情,只有当参与分钱 的人数小于钱增加的倍数时,自己出钱才是划算 的。所以没有人出钱就是纳什均衡。 • N=3,每人都出100元是这个博弈的一个纳什均 衡。每个局中人都不出钱,也是一个纳什均衡。
• 可得方程组唯一解:
* 1
a + c2 − 2c1 q = 3
a + c1 − 2c2 q2 = 3
*
• 二阶导数计算:
∂ 2π 1 q1 , q2) ( = −2 < 0 2 ∂q1
2
∂ π(q1 , q2) 2 = −2 < 0 2 ∂q2
∴ q ,q2 )是博弈的纳什均衡解。 (
* 1 *
第二章同时决策博弈(1) 回顾
• 2-1二人同时博弈的三要素
– 局中人,策略,支付的含义和数学表达 – 策略集,策略组合,支付函数,支付向量
• 2-2支付矩阵
– 二人博弈的一般性矩阵表示 – 有限博弈,T.C.Schelling的双矩阵形式,三人博弈 – 正规型(策略型)博弈定义
• 2-3 优势策略
2-12 弱劣势策略消去法的讨论
严格纳什均衡和普通纳什均衡
• 公明博弈中的一个纳什均衡就被普通劣势策略消 去法错过了。 • 纳什均衡也有严格纳什均衡和普通纳什均衡之分。
– 普通纳什均衡只是说任何局中人单独把策略从均衡改 变出去没有好处,不会得到好处。但是,没有好处也 不一定有坏处。在公明博弈中右下方格子就是一个普 通纳什均衡。 – 严格纳什均衡不仅是单独改变没有好处,而且指那些 谁单独改变策略谁就要倒霉的纳什均衡。在公明博弈 中左上方格子就是一个严格纳什均衡。
极值的必要条件,是函数的所有偏导数都等于0。
连续情形纳什均衡的必要条件
连续情形纳什均衡的检验方法
• 例:设一个3人的策略型博弈,每个局中人的策 略集都是正实数开区间(0,∞ ),他们的策略变 量分别是x,y,z,他们的支付函数分别是:
( = u1 x, y, z) 2 xz − x y
2
= u(x, y, z) 12( x + y + z ) − y 2 = u(x, y, z) 2 z − xyz 3
• 任何满足 x1 + x2 = 100 的分配数对( x1 , x2 )都 构成这个二人博弈的纳什均衡,因此,这个博弈 存在无数个纳什均衡。
• 一个有N个人参加的游戏:每个人可任意放 最多100块钱到一部可以生钱的机器里,机 器把所有人放进去的钱的总和增加到原来 的3倍,然后再平分给这N个人。你能猜出 这个N人博弈的一个纳什均衡并给出相应的 证明吗?
求纳什均衡解。
2
• “纳什均衡检验方法” 只是确定纳什均衡的一 种方法。还有一些纳什均衡,不能由它确 定。纳什均衡检验方法的最大缺陷是要求 满足一阶条件的“必要解”唯一。 • 但是,必要解不唯一,并不等于博弈不存 在纳什均衡。
• 例:设一个3人的博弈 G = {S1, S 2, S3 ; u1, u 2, u 3} 中,每 个局中人的策略集都是正实数开区间(0,∞ ), 他们的策略变量分别是x,y,z,他们的支付函 数分别是:
= − q1) + (a − q2 − c1 )q1 (
2
π(q1 , q2) (a − q1 − q2 )q2 − c2 q2 = 2
= − q2) + (a − q1 − c2 )q2 (
2
∂π 1 q1 , q2) ( = −2q1 + a − q2 − c1 = 0 ∂q1
∂π(q1 , q2) 2 = −2q2 + a − q1 − c2 = 0 ∂q2
• 2-6 相对优势策略划线法
第二章 同时决策博弈(2)
• 2-7箭头指向法 • 2-8纳什均衡的正式定义 • 2-9“最后归宿”博弈 • 2-10纳什均衡的应用 • 2-11 纳什均衡的观察与验证 • 2-12 弱劣势策略消去法的讨论
2-7箭头指向法
• 基本思路:
– 对博弈中的每个策略组合进行分析,考察在这 个策略组合下各个局中人是否能够通过单独改 变自己的策略而增加支付。
– 优势策略,整体的严格优势策略,弱优势策略 – 劣势策略,整体的严格劣势策略,弱劣势策略 – 严格劣势策略逐次消去法(IESDS)
• 2-4优势策略均衡
– 优势策略均衡,严格优势策略均衡,公明博弈 – 普通劣势策略消去法,寻找优势策略均衡求解 的局限
• 2-5 相对优势策略和纳什均衡
– 相对优势策略,纳什均衡,检验纳什均衡
伯川德双寡头竞争模型
• 考虑两种有差异的产品,假设在企业1和企业2 这两个双寡头企业分别选择价格 p1 和 p 2的时候, 市场对企业 i 的产品的需求为:
( = qi pi,p j) a − pi + bp j , i = 1,2, i ≠ j , a, b > 0
b> 0
边际成本为一个共同的常数 c < a
乙 坦白 -3 坦白 甲 抵赖 -5 -1 -3 0 0 -1 抵赖 -5
丽娟 足球 芭蕾
1
足球 大海 芭蕾
0 0
2 0 0
2 1
2-8纳什均衡的正式定义
• 在这个策略组合里,每个局中人的策略选择,都 是对于其他博弈参与人的策略选择的组合的最佳 策略选择。这种策略组合,叫做博弈的纳什均衡 (Nash equilibrium)。 • 纳什均衡是非合作博弈理论中最重要的一个概念。