第二章 完全信息静态博弈的基本理论
博弈论(第二章)讲义
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2
左
中
右
上 博弈方1
下
1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0
应用博弈论第二讲完全信息静态博弈
•
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。
•
例2
为什么中小企业不会花钱去开发新产品 ?
•
完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。
•
生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。
•
例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。
第二讲 完全信息静态博弈
得每个参与人的策略是对其他
参与人策略的最优反应。
在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法
箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法
第2章_完全信息静态博弈
2. “斗鸡博弈” 斗鸡博弈”
甲、乙两人相对而行,试图通过一座独木桥。 乙两人相对而行,试图通过一座独木桥。 独木桥仅能容纳一人通行。 独木桥仅能容纳一人通行。 如果两人坚持继续前行, 如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄 的独木桥,两人都会掉到河里, 的独木桥,两人都会掉到河里,均得到收益 -10。 。 如果甲选择退让,让乙先行, 如果甲选择退让,让乙先行,那么得意的乙将得到收益 20, , 面子受损的甲 得到收益 -2。 。 如果乙选择退让,让甲先行, 如果乙选择退让,让甲先行,那么得意的甲将得到收益 20, , 面子受损的乙得到收益 -2。 。 如果甲和乙均选择退让, 如果甲和乙均选择退让,那么双方均得到收益 10。 。
2.智猪博弈 .
猪栏里养了两头猪,一头大猪、一头小猪。 猪栏里养了两头猪,一头大猪、一头小猪。 在猪圈的一端有一个盛食槽。 在猪圈的一端有一个盛食槽。 在猪圈的另一端有一个按压式开关。 在猪圈的另一端有一个按压式开关。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 大猪和小猪都在思考是否去按压开关。 大猪和小猪都在思考是否去按压开关。
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第二章
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
2.通过“划横线法”求解“智猪博弈”的均衡 .通过“划横线法”求解“智猪博弈”
小猪 按开关 按开关 大猪 等待 (10,-2) , ) (0,0) , ) (5,-1) , ) 等待 (4,2) , )
完全信息静态博弈
• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。
•
R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)
•
F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。
博弈论Game Theory2
划线法
在具有策略和利益相互依存的博弈问题中,各个 博弈方的得益既取决于自己选择的策略,还与其 他策略方选择的策略有关。因此,博弈方在决策 时必须考虑其他博弈方的存在和策略选择。 依据这种思想,科学的决策思路应该是:找出自 己针对其他博弈方每种策略和策略组合的最佳对 策,即自己的可选策略与其他博弈方每种策略配 合,给自己带来最大得益的策略,然后通过对其 他博弈方策略选择的判断,预测博弈的可能结果 和确定自己的最优策略。
举例
古诺的寡头模型 设一市场有两家厂商生产同样的产品。如果厂商1 的产量为q1,厂商2的产量为q2,则市场总产量为 Q = q1 + q2 。设市场出清价格P(可以将产品全 部卖出去的价格)是市场总产量的函数P = P(Q) = 8 -Q。再设两厂商的生产都无固定成本,且每 增加一单位产量的边际成本相等,C1 = C2 = 2, 即它们分别生产q1和q2单位产量的总成本分别为2 q1和2 q2 。最后强调两厂商同时决定各自的产量, 即他们在决策之前都不知道另一方的产量。
求解纳什均衡
博弈方就是n个农户,他们各自的策略空间就是他 们可能选择的羊群数目qi(i=1,2, …,n),取值范围, 当各户羊群数为q1, …qn时,在公共草地上放牧羊群 的总数为Q= q1+ q2+…+ qn,,每只羊的产出应是羊 群总数Q的函数V=v(Q)=v(q1+ q2+…+ qn).假设每 只羊的成本是不变的常数c,则农户i养qi只羊的得益 函数为:
u i q i V ( Q ) q i c q iV ( q 1 q 2 q n ) q i c
续
假设 n 3 , 即只有三个农户,每只 羊的产出函 数为 V 100 Q 100 ( q 1 q 2 q 3 ), 而成本 c 4 .这时,三个农户的得益 函数分别为 u 1 q 1 [100 ( q 1 q 2 q 3 )] 4 q 1 u 2 q 2 [100 ( q 1 q 2 q 3 )] 4 q 2 u 3 q 3 [100 ( q 1 q 2 q 3 )] 4 q 3 把上述得益函数看作连 续函数。
第二章完全信息静态博弈的基本理论
第二章完全信息静态博弈的基本理论第二章完全信息静态博弈的基本理论0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。
特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。
一.求解方法之一:剔除严格劣策略1.占优策略与劣策略。
严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b 策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。
弱占优策略与弱劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付不低于b策略,且至少有一种情况下的支付会严格大于b策略,则称b策略是相对于a策略的弱劣策略(weakly dominated strategy );a策略则是相对于b策略的弱占优策略(weakly dominating strategy)。
占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。
特别提示:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。
类似地,可以定义局部劣策略与全局劣策略。
理性的人在博弈时绝对不会选择严格劣策略。
通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。
2.案例案例1乙坦白不坦白甲坦白-6-6-10不坦白-10-1-1案例2乙不作广告作广告甲不作广告 8810 2作广告 21044在上面的两个例子中,通过剔除严格劣策略,可以获得一个占优策略均衡(坦白,坦白),(作广告,作广告)。
经济博弈论 02 完全信息静态博弈(Park)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
完全信息静态博弈论模型
完全信息静态博弈论模型引言:博弈论是研究决策制定者在不同利益冲突场景下的行为和策略选择的数学模型。
在博弈论中,静态博弈是指参与者在同一时间点做出决策的情况。
完全信息表示每个参与者对于其他参与者的行为和策略选择都有完全的了解。
本文将介绍完全信息静态博弈论模型的基本概念、解决方法以及应用领域。
一、基本概念1.1 参与者完全信息静态博弈中,有两个或多个参与者,每个参与者可以是个体、团体或国家等。
参与者通过制定决策来追求自身的利益。
1.2 策略每个参与者在博弈中可以选择的行动方案称为策略。
策略可以是纯策略,即只选择一个确定的行动;也可以是混合策略,即以一定概率选择不同的行动。
1.3 支付函数支付函数是衡量参与者在不同策略组合下所获得效用或利益的函数。
支付函数可以表示为参与者的收益、成本或效用。
1.4 纳什均衡纳什均衡是指在博弈中,每个参与者选择的策略组合使得没有参与者有动机改变自己的策略。
换言之,每个参与者都在给定其他参与者的策略下做出最优的决策。
二、解决方法2.1 支付矩阵为了描述参与者之间的策略选择和支付函数之间的关系,可以使用支付矩阵。
支付矩阵是一个二维矩阵,行表示一个参与者的策略选择,列表示其他参与者的策略选择,每个元素表示对应策略组合下的支付函数。
2.2 最优响应最优响应是指在其他参与者的策略下,参与者能够选择的最优策略。
通过计算每个参与者的最优响应,可以找到纳什均衡。
2.3 前瞻性在完全信息静态博弈中,参与者可以通过推断其他参与者的策略和支付函数来做出决策。
前瞻性是指参与者能够预测其他参与者的行为并做出相应的反应。
三、应用领域完全信息静态博弈论模型广泛应用于经济学、政治学、生物学等领域。
3.1 经济学博弈论在经济学中有广泛应用,如市场竞争、定价策略、拍卖等。
完全信息静态博弈模型可以帮助分析参与者的决策行为,预测市场的走势和结果。
3.2 政治学在政治学中,博弈论可以用于分析选举、政策制定和国际关系等问题。
2 完全信息静态博弈
2 政府
救济 3,
3
-1,
1 0 0,
1 )( ( )) ( 01
不救济 -1,
求微分,得到政府最优化的一阶条件:
同样,可以根据流浪汉 的期望效用函数找到政 府的最优混合策略。??
即:流浪汉以0.2的概率选择寻 找工作,0.8的概率选择游荡
四. 混合策略纳什均衡
社会福利博弈
四. 混合策略纳什均衡
社会福利博弈
救济 政府
流浪汉
寻找工作 2 3, 1 不救济 -1, 0, -1, 0 流浪 3
设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的策略都是给定对方混合策略时的最优策略
四. 混合策略纳什均衡
四. 混合策略纳什均衡
策略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
纯策略:如果一个策略规定参与人在每一个给定的信 息情况下只选择一种特定的行动,该策略为 纯策略。 混合策略:如果一个策略规定参与人在给定信息情况 下以某种概率分布随机地选择不同的行动, 则该策略为混合策略。
由于混合策略伴随的是支付的不确定性,因此参与 人关心的是其期望效用。
最优混合策略:是指使期望效用函数最大的混合策 略(给定对方的混合策略) 在两人博弈里,混合策略纳什均衡是两个参与人的 最优混合策略的组合。
支付最大 化法
四. 混合策略纳什均衡
流浪汉
寻找工作 流浪
假定政府的混合战略是 G , ); ( 1 流浪汉的混合战略是 L , )。 ( 1 政府的期望效用函数为: v( G, L) (3 1 ( )( )) 1 (5 1 ) vG 5 1 0 故 * 0.2
博弈论第二章(4)
这时1、2方有合谋的动机,可能选择(D,R)使自己更好。
二、共谋和防共谋博弈均衡
2、防共谋均衡:如果一个博弈的策略组合满足(1)没有任何 单个博弈方的串通会改变博弈结果;(2)给定博弈方有再次偏 离的自由时,没有任何两个博弈方的忠勇串通会改变要;(3) 依此类推,直到所有博弈方的串通也不会改变博弈结果。满 足上述条件的博弈均衡为防共谋均衡。 上例博弈的防共谋均衡为(D,R,B)。这也是一个囚徒困境。 事实上,在排除了共谋的影响后,多人博弈与两人博弈就 没有实质上的区别了。所以我们的举例一般都 以二人博弈为 例。所得出的纳什均衡、风险上策、pareto上策等都适用于多 人博弈。
但是, 既然(和平,和平)是帕累托上策均衡,那为 什么历史上还会有那么多的战争呢?可能的原因是:
决策者缺乏理智或理性。
局部战争的收益比博弈分析中假设大的多。 战争的一方认为自己有绝对获胜的把握。
2、风险上策均衡 例三国鼎立的吴蜀联盟博弈。即两家联合进攻魏国,若获 胜则可瓜分魏国的国土,若一方背叛,则有亡国的危险;若
猎鹿博弈 猎鹿博弈也是一个风险上策均衡的例子。两个 猎人同时发现了一只鹿和两只兔子,若两人合作就 有可能得到一只鹿,否则各人可能获得一只兔子。
猎人B 鹿 猎人A 鹿 兔子 5, 5 3, 0 兔子 0,3 3,3
该博弈说明的问题是,若合作为10人,或更多 的人时,相信其它更多的人的合作意愿比相信另外 一人合作的意愿更难。此时,更多的博弈方选择风 险上策均衡策略组合。
1、帕累托上策均衡 帕累托(pareto)均衡:即所有纳什均衡中最优的一个均衡 策略组合。
完全信息静态博弈
退 (2 , 0 ) ( 0 ,0 )
用划线法可得严格纳什均衡(退,进),(进,退)。 (试写出金发女郎博弈的矩阵,并求出NE)
例2.6 智猪博弈
猪圈里圈着两头猪,一头大猪,一头小猪。猪圈的一边有一 个猪食槽,另一边安装一个按钮,按一下按钮会有10个单位 的猪食进槽。但谁按按钮就需要付2个单位的成本。若大猪先 到,大猪吃到9个单位,小猪吃到1个单位;若同时到,大猪 吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位, 小猪吃4个单位,支付矩阵如下。
这时该博弈有惟一的纳什均衡(维护,维护)。
2.3 最优反应映射与纳什均衡
定义2.2 局中人的最优反应映射 定义 局中人i的最优反应映射是一个定义于策略组合集合S, 取值于 策略集 Si 的子集的集值映射(映射值为集合的映射称为集值映 S 射), ri ( s) ⊆ S i ,满足
i
ri ( s ) = {t i ∈ S i u i (t i , s −i ) = max u i ( s i , s −i )}
si ∈S i
定义2.2表明,局中人i的最优化反应映射 ri (s) 仅与 s −i 有关。 反应函数 当 ri (s) 为单点集时,称 ri (s ) 为局中人i的最优反应函数 最优反应函数,简称 最优反应函数 反应函数。这时将 ri (s ) 记为 BRi (s −i ) 。 反应函数
定义2.3 最优反应映射 定义
因s为纳什均衡需满足 si ∈ ri (s) ,故纳什均衡仅能存在于策 (北,东,陆 ) , 略组合(北,西,陆 ) , (南,东,海 ) 中。 (北,西,海 ) ,
* 2.对每个局中人 i , s i 是他应对 s −i 的最好的策略。 纳什均衡的定义
*
第2讲 完全信息静态博弈【博弈论经典】
第2讲 完全信息静态博弈
• 例2:公共产品的供给也是一个囚徒困境问题。 如果大家都出钱兴办公共事业,所有人的福利都会增加。问题是,如果我出钱你 不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以,每 个人的最优战略是“不出钱”,这种情况下,使得所有人的福利都得不到提高。
例3:“军备竞赛”。 例4:经济改革本身也可能是这样,在许多改革中,改革要付出成本(包括风险), 而改革的成果大家共享,结果是:尽管人人都认为改革好,却没有人真正去改革, 大家只好在都不满意的体
第们集中讨论完全信息静态博弈。 • “完全信息”指的是每个参与人对所有其他参与人的特征(包括战略空间、支付
函数等)有完全的了解。 • “静态”指的是所有参与人同时选择行动且只选择一次。“同时行动”是一个信
息概念而非日历上的时间概念:只要每个参与人在选择自己的行动时不知道其他 参与人的选择,我们就说他们在同时行动。
的组合。 定义:在博弈的战略式表述中,如果对于所有的i,si*是i的占优
战略,那么,战略组合s* = s1*,...,s*n 称为占优战略均衡(do min ant
strategy equilibrium)
第2讲 完全信息静态博弈
• 在一个博弈里,如果所有参与人都有占优战略存在,那么,占优战略均衡是可以 预测的到惟一的均衡,因为没有一个理性的参与人会选择劣战略。
• 纳什均衡是完全信息博弈解的一般概念,也是所有其他类型博弈解的基本要求。
第2讲 完全信息静态博弈
• 1.纳什均衡 纳什对博弈论的贡献有两个方面:一是合作博弈理论中的讨价还价模型,称为纳什 讨价还价解(Nash bargaining solution); 二是非合作博弈论方面,这是他的 主要贡献所在。 纳什对非合作博弈的主要贡献是他在1950年和1951年的两篇论文中在非常一般意义 上定义了非合作博弈及其均衡解,并证明了均衡解的存在。这样就奠定了非合作 博弈论的基础。纳什所定义的均衡称为“纳什均衡”,它如同瓦尔拉斯均衡一样, 已成为经济学中的专家术语。
经济博弈论完全信息静态博弈
19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
经济博弈论02完全信息静态博弈(Park)
合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。
第二章完全信息静态博弈
二、反应函数
前面讨论的两寡头古诺模型中,根据两厂商的 利润最大化条件可以得到两厂商的反应函数 (Reaction Function) :
q
1
R1 (q2 )
1 2
(6 q2 )
q
2
R2 (q1 )
1 2 (6 q1 )
第二十六页,编辑于星期三:十五点 五十五分。
q2 (0,6)
(0,3)
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G { S 1 , ,S n ;u 1 , u n } 中, 如果严格下策反复消去法排除了除 之外 (s1 *,,sn *) 的所有策略组合,那么 (s1 *, ,sn *)一定是该博弈唯一 的纳什均衡。
命题2.2 在n个博弈方的博弈 G { S 1 , ,S n ;u 1 , u n 中},如 果 (s1 *, ,s是n *)G的一个纳什均衡,那么严格下策反 复消去法一定不会将它消去。
古诺寡头模型——产量博弈分析(1)
两厂商的利润函数分别为:
u 1q 1P (Q ) c1 q 1q 1 [8 (q 1 q 2) ]2 q 1 6 q 1 q 1 q 2 q 1 2
u 2 q 2P (Q ) c2 q 2 q 2 [8 (q 1 q 2) ]2 q 2 6 q 2 q 1 q 2 q 2 2
第二章 完全信息静态博弈
基本分析思路和方法 纳什均衡 无限策略博弈分析和反应函数 混合策略和混合策略纳什均衡
第一页,编辑于星期三:十五点 五十五分。
第一节 基本分析思路和方法
上策均衡 ; 严格下策反复消去法; 划线法;
剪头法。
第二页,编辑于星期三:十五点 五十五分。
一、上策均衡
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章完全信息静态博弈的基本理论0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。
特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。
一.求解方法之一:剔除严格劣策略1.占优策略与劣策略。
严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。
弱占优策略与弱劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付不低于b策略,且至少有一种情况下的支付会严格大于b策略,则称b策略是相对于a策略的弱劣策略(weakly dominated strategy );a策略则是相对于b策略的弱占优策略(weakly dominating strategy)。
占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。
特别提示:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。
类似地,可以定义局部劣策略与全局劣策略。
理性的人在博弈时绝对不会选择严格劣策略。
通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。
2.案例案例1乙甲坦白不坦白案例2乙不作广告甲 不作广告作广告在上面的两个例子中,通过剔除严格劣策略,可以获得一个占优策略均衡(坦白,坦白),(作广告,作广告)。
3.请思考下面这个例子是否存在占优策略均衡?甲在上与下之间作选择,乙在左中右之间作选择经过重复剔除严格劣策略,可以获得一个占优策略均衡(上,中),这就是求解方法之一——严格劣策略的迭代剔除方法。
思考:占优策略均衡(上,中)是通过不断剔除严格劣策略而获得的,为了成功地进行剔除,需要什么样的前提条件?由此可以理解公共知识的重要性。
4.思考:下面这个博弈是否存在占优策略均衡?假设甲乙两个参与人分别在上中下,左中右之间作选择:剔除严格劣策略并不适合于求解所有的博弈,许多博弈是不存在占优策略均衡的。
5.社会(或集体)困境(dilemma )、合作与非合作博弈、占优策略均衡 (1)案例案例1:霍布斯博弈假设鲁滨逊与星期五生活在一个自然状态之中。
为了生存,他们各自有两个选择:自己生产财富或掠夺对方的财富。
博弈情形如下:乙甲生产掠夺思考:面对囚徒困境、广告博弈、霍布斯博弈,请思考如何解决社会困境?(答案略;最低价格承诺实际上就是为解决寡头之间的串谋困境提供了有效的解决机制)案例2:1964年以前,美国香烟的电视广告非常普遍,1964年卫生总监的报告宣布以后,美国四大烟草公司经过协商与联邦政府达成协议,决定不再做电视广告,协议于1971年生效。
各大烟草公司的利润得以大幅增加。
(2)合作博弈与非合作博弈A合作博弈:参与人直接事先达成具有约束力的协议,以集体协商的方式选择策略,故又可称之为联盟博弈。
由此形成的策略选择与支付被称为博弈的合作解,通常以帕累托最优作为度量标准。
合作博弈其实就是指参与人在行动前能够实现进行沟通、交流,且沟通交流达成的协议是有约束力的。
B非合作博弈:又称策略博弈,参与人以独立的方式选择策略。
由此形成的策略选择与支付被称为博弈的非合作解。
C一般所说的博弈论是指非合作博弈理论。
(3)社会(或集体)困境与占优策略均衡A所谓社会(或集体)困境就是指博弈的不合作解与合作解相悖。
B凡是存在社会(或集体)困境问题的场合必定存在占优策略均衡,即社会(或集体)困境问题是存在占优策略均衡的重要博弈类型。
C注意:不要认为占优策略均衡都一定意味着社会(或集体)困境。
以下面的政治博弈为例:甲乙作为竞选的对手,分别有三种立场可以选择:左中右;选民的分布是对称的;甲乙均追求选票最大化;具体的选票情况如下:思考:该博弈存在占优策略均衡吗?该博弈存在社会困境吗?从这个博弈可以看出,只有中间立场在政治上被充分表达,绝大多数的非中间立场的选民的立场被严重忽视。
(4)占优策略均衡在制度设计中有着广泛的应用价值。
二.求解方法之二:最优反应法——符合理性人性质的方法,博弈论最重要的求解方法1.最优反应策略:给定其他所有参与人策略选择的情况下,能够给某参与人带来最大收益的策略,其思维过程为:如果对手采用……,某参与人就应该采用……。
这是一种相对优势策略。
通过最优反应方法所获得的博弈解称之为纳什均衡。
2.如何寻找纳什均衡?划线法(仅适合二人有限策略博弈)案例1 竞选博弈假设甲乙两个参与人分别在上中下,左中右之间作选择:思考(下,右)这个策略组合具有什么特点?互相构成对对手策略选择的最优反应。
案例2 选址博弈甲乙两家百货公司考虑开店,可供选择的地址有四个:市郊、市中心、城市东部、城市西部。
具体支付情况如下:思考(市中心市中心)这个策略组合具有什么特点?3.纳什均衡:它是由全部参与人所选择的策略构成的这样一个组合,在这个组合中,每个参与人的策略都是针对其他参与人人策略选择的最优反应。
特别注意,均衡是针对策略组合的,而不是支付组合的,即在上面的博弈中,(下,右)才是均衡,(6 6)是这个博弈的均衡结果,不要把均衡与均衡结果混淆,这显然与微观经济学不同,在微观经济学中均衡是针对结果而言的。
4.关于纳什均衡的体会:纳什均衡具有策略稳定性,在均衡状态之下没有人愿意单方面改变自己的策略选择,因此,纳什均衡具有自我实施特征。
特别说明:策略稳定性不同于均衡稳定性。
5.纳什均衡与占优策略均衡(1)占优策略均衡肯定也是纳什均衡,但是纳什均衡不一定是占优策略均衡。
(2)纳什均衡与占优策略均衡都是博弈的非合作解。
6.多重纳什均衡问题(1)寻找下列博弈的纳什均衡案例1 节目选择博弈甲乙两个电台各有三种节目形式可供选择,分别是摇滚乐、乡村音乐以及谈话节目案例2 夫妻博弈妻足球芭蕾夫足球芭蕾上述两个例子的共同特点就是存在多个纳什均衡,这是纳什均衡的最大缺陷,降低了纳什均衡解的预测能力,因为一旦参与人的预期不一致,就可能出现极为糟糕的结局。
(2)多重纳什均衡的精炼(refine)所谓精炼就是通过附加另外的合理的标准,使得某些不合理的纳什均衡被剔除掉,以减少纳什均衡的个数,提高理论分析对现实的预测能力(因为纳什均衡只是涵盖了理性的一个方面:最优反应)。
精炼方法之一:寻找支付帕累托占优均衡乙推不推甲推不推通过比较发现,精炼方法之二:寻找风险占优均衡通过比较发现,在上面的博弈中,(不推,不推)在风险上优于(推推)精炼方法之三:寻找焦点(focus)或谢林点(schelling point)所谓焦点就是指那些依据某种线索或信号(如:历史、习俗、惯例、经验、自然或社会标志物)能够成为所有博弈参与人共识的纳什均衡。
特别说明:一方面,习俗和惯例能够为多重纳什均衡提供解,另一方面,习俗和惯例的稳定性正在于它们是纳什均衡。
虽然依据某些线索或信号,某个纳什均衡更有可能发生,成为博弈的焦点,但是并不是所有存在多重纳什均衡的博弈都有焦点。
三.求解方法之三:最大最小(maxmin)方法,一种非常保守稳健的方法1.最大最小策略:首先确定参与人在每一个策略下所能够获得的最小支付,在所有的最小支付中最大那个支付所对应的策略就是最大最小策略。
由所有参与人的最大最小策略所构成的策略组合就是博弈的最大最小解,2.案例案例1:抢答博弈乙按不按甲按不按案例2:开车博弈乙等待前行甲等待前行3.最大最小解与纳什均衡的关系(1)零和博弈与非零和博弈;常数和博弈与非常数和博弈零和博弈:在任何博弈策略组合下所有参与人的支付总和均为零。
非零和博弈:在任何博弈策略组合下所有参与人的支付总和并不都是零。
常数和博弈:在任何博弈策略组合下所有参与人的支付总和为一个常数,其实任何常数和博弈均可以转化为零和博弈。
非常数和博弈:在任何博弈策略组合下所有参与人的支付总和不是一个常数。
(2)在常数和博弈中,最大最小解与纳什均衡解是一致的。
在非常数和博弈中,最大最小解与纳什均衡解可能不一致。
采用最大最小方法的逻辑在于无论我选择什么策略,对手的最佳反应是采取使我支付最低的策略,故这个方法特别适合于零和博弈。
特别注意:最大最小方法并不适用于求解所有的零和博弈,如配硬币博弈就是一个例子。
案例:配硬币博弈乙正面反面甲正面反面(3)当最大最小解与纳什均衡解不一致时,采用哪种方法更加合理?一般来说,纳什均衡解更加合理,但是一旦存在多重纳什均衡且无法进行精炼,博弈存在极大的不确定性时,采用最大最小方法更加合理。
思考:配硬币博弈是否存在纳什均衡?乙正面反面甲正面反面四.混合策略纳什均衡1.在配硬币博弈以及儿童常玩的“石头、剪刀、布”一类的游戏中,按照我们前面给出的寻找纳什均衡的方法,不存在纳什均衡。
对这类游戏,人们的一个经验就是避免行为的规律性,随机地选择自己的策略,使得对手摸不着北,然后看能否凭运气击败对手,即使自己的策略选择具有不可预测性。
2.混合策略(mixed strategy)与纯策略(pure strategy)(1)混合策略:参与人策略集上的概率分布,即参与人以随机方式选择策略。
假设参与人拥有两个策略,则混合策略可以写成(p,1-p);假设参与人拥有三个策略,则混合策略可以写成(p,r,1-p-r)(2)纯策略:参与人以非随机的方式选择策略,其实,纯策略是一种特殊的混合策略。
纯策略其实就是指博弈矩阵旁边标示的策略,或者说参与人策略集中所包括的策略。
3.参与人的期望支付(1)一旦参与人采取混合策略,参与人的支付就必须用期望支付来表示。
(2)一个实例:计算甲乙参加配硬币博弈的期望支付乙正面反面甲 正面反面假设甲选择正面的概率为p ;假设乙选择正面的概率为q 。
EU 甲=(11(1))p q q -∙+∙-+(1)(1(1)(1))p q q -∙+-∙-=(21)(12)q p -- EU 乙=(21)(21)q p --(3)二人博弈中计算期望支付的一般公式1mi EU ==∑甲1ni j ij j p q a =∑1mi EU ==∑乙1ni j ij j p q b =∑依据:当对手正在进行随机选择时,他一定会选择这样的概率组合,使得我选择任意纯策略的期望收益均相等,从而使我无从下手,所以我也将进行随机选择,而且我选的概率组合也会使得对手无所适从。