经济博弈论 02 完全信息静态博弈(Park)
复旦大学经济博弈论课件--经济博弈论242页PPT

30.11.2019
课件
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低 价”。
上策均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,必然是该博弈 比较稳定的结果
课件
17
竞争:个体利益最大化
q1R 1(q2,q3)4 81 2q21 2q3
11 q2R 2(q 1,q3)4 82q 12q3 q 3R 3(q 1,q2)4 81 2q 11 2q2
q1 *q2 *q3 *24 u1*u2 *u3 *576
Q*72
u*1728
21
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈G {S1, Sn;u1, un中},博弈方 i的策略
空间为 Si {si1, sik},则博弈方 i以概率分布 pi (pi1, pik)
随机在其 k个可选策略中选择的“策略”,称为一个“混合策
略”,0其p中ij 1 j1, 对,k
u 1 u 1 ( P 1 ,P 2 ) P 1 q 1 c 1 q 1 ( P 1 c 1 ) q 1 (P 1 c 1 )a 1 ( b 1 P 1 d 1 P 2 )
u 2 u 2 ( P 1 ,P 2 ) P 2 q 2 c 2 q 2 ( P 2 c 2 ) q 2 (P 2 c 2 )a 2 ( b 2 P 2 d 2 P 1 )
上策均衡不是普遍存在的
30.11.2019
课件
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
经济博弈论之完全信息静态博弈培训

2023
PART 04
完全信息静态博弈的策略 分析
REPORTING
优势策略
优势策略是指参与者在给定信息下, 选择对自己最有利的策略,而不考虑 其他参与者的反应。
优势策略是博弈分析中的重要概念, 它可以帮助参与者找到最优的策略选 择。
在完全信息静态博弈中,如果某个参 与者有一个优势策略,那么无论其他 参与者选择什么策略,该参与者都应 该坚持这个优势策略。
收益
每个参与者在博弈中获得的效用或收益,是衡量参与者利益的标准。
在完全信息静态博弈中,每个参与者的收益函数是共同知识,即所有参与者都知 道其他参与者的收益函数。
纳什均衡
纳什均衡是指在一个博弈中,每个参 与者的最优策略选择在其他参与者最 优策略选择给定的情况下是最优的。
在完全信息静态博弈中,纳什均衡是 所有参与者的最优策略组合,满足每 个参与者的最优策略选择在其他参与 者最优策略选择给定的情况下是最优 的。
2023
PART 02
完全信息静态博弈的基本 概念
REPORTING
参与者
博弈中的决策主体,通常称为局中人 或参与人。
在完全信息静态博弈中,每个参与者 都了解其他参与者的身份及其所有可 能的策略和收益。
策略
参与者在博弈中可以选择的行动方案,是参与者在给定信 息集下的决策变量。
在完全信息静态博弈中,每个参与者的策略空间是共同知 识,即所有参与者都知道其他参与者的所有可能策略。
2023
PART 03
完全信息静态博弈的经典 案例
REPORTING
囚徒困境
总结词
描述两个囚犯因被捕而面临供述与否的决策,揭示个 体理性与集体理性的矛盾。
详细描述
在囚徒困境中,两个囚犯因共同犯罪被捕,并分别被 关押在独立的房间。每个囚犯都有供述和保持沉默两 种选择。如果两个囚犯都保持沉默,则他们都不会受 到严重惩罚;但如果一个囚犯供述,另一个保持沉默 ,则供述者会得到较轻的惩罚,而沉默者会受到更严 厉的惩罚。由于囚犯之间无法进行沟通,他们往往会 基于自身利益而选择供述,从而导致双方都受到较重 的惩罚。
第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈
•
囚徒困境在经济学上有着广泛的应用。 例1:两个寡头企业选择产量的博弈。如果两个企业联合起来形成卡特尔,选择垄 断利润最大化的产量,每个企业都可以得到更多的利润。但卡特尔不是一个稳定 的均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果是,每 个企业都只得到小于最大利润的产量,利润严格小于卡特尔产量下的利润。 在有些情况下,个人理性和集体理性的冲突对社会来说也许是一件好事,尽管对 集体而言是一件坏事。
第2讲 完全信息静态博弈
下继续生活下去。 从囚徒困境中,我们可以引出一个很重要的结论:一种制度(体制)安排,要发 生效力,必须是一种均衡。否则,这种制度安排不能成立。
第2讲 完全信息静态博弈
•
3.重复剔除的占优均衡 在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在 绝大数博弈中,占优战略均衡是不存在的。
第2讲 完全信息静态博弈
•
在“智猪博弈”中,我们先剔除掉小猪的劣战略“按”,在剔除掉这个战略后的 新的博弈中,小猪只有一个战略“等待”,大猪仍有两个战略,但此时,“等待” 已成为大猪的劣战略,提出这个战略,剩下的唯一战略组合是(按,等待)。
第2讲 完全信息静态博弈
•
我们需要对“占优战略”和“劣战略”的概念进行重新定义。
都是(相对于si*的)劣战略。 在应用重复剔除方法寻找均衡时,一个战略是占优战略或劣 战略可能是相对于另一个特定的战略而言的。
第2讲 完全信息静态博弈
' ' ' 定义:令si 和s? 是参与人 i 可选择的两个战略(即 s i i Si, ' s’ i Si)。如果对于任意的其他参与人的战略组合s -i,参与人 ' ' i的选择si 得到的支付严格小于从选择s? i 得到的支付,即:
第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。
在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法
箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法
完全信息静态博弈教学课件

完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。
第二章完全信息静态博弈的基本理论

第二章完全信息静态博弈的基本理论第二章完全信息静态博弈的基本理论0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。
特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。
一.求解方法之一:剔除严格劣策略1.占优策略与劣策略。
严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b 策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。
弱占优策略与弱劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付不低于b策略,且至少有一种情况下的支付会严格大于b策略,则称b策略是相对于a策略的弱劣策略(weakly dominated strategy );a策略则是相对于b策略的弱占优策略(weakly dominating strategy)。
占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。
特别提示:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。
类似地,可以定义局部劣策略与全局劣策略。
理性的人在博弈时绝对不会选择严格劣策略。
通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。
2.案例案例1乙坦白不坦白甲坦白-6-6-10不坦白-10-1-1案例2乙不作广告作广告甲不作广告 8810 2作广告 21044在上面的两个例子中,通过剔除严格劣策略,可以获得一个占优策略均衡(坦白,坦白),(作广告,作广告)。
博弈论与信息经济学课件3—完全信息静态博弈2

2
聚点和相关均衡
抛硬币解决
博弈方2 博 弈 U 方 D 1 L 5, 1 4, 4 R 0, 0 1, 5 存在三个纳什均衡,其中: 两个是纯策略均衡: (U,L); (D,R) 一个是混合策略均衡: [(1/2,1/2),(1/2,1/2)]
相关均衡例子
由于避免(U,R)的出现符合双方的利益,可以使用抛硬币的解 决方法: 正面—1U,2L;反面—1D,2R.
国家2 战争 国 家 战争 1 和平 -5, -5 -10, 8 和平 8, -10 10, 10
两个纯策略纳什均衡: (战争,战争), (和平,和平) 在帕累托效率意义上,(和平,和平) 明显较好,构成一个帕累托上策 均衡。
战争与和平
如果两国的决策者都是理性的,那么两个国家之间就不应 该会发生战争。
3
共谋和防共谋均衡 这里提到的防共谋均衡中讨论的博弈方之间的串 通和联合行为均出于自愿自觉,是没有强制力的, 与协议式的合作行为不同。 因此,防共谋均衡是非合作博弈的均衡概念,而 不是合作博弈的概念。
完
博弈论与信息经济学
完全信息静态博弈2
——纳什均衡的选择和分析方法扩展
纳什均衡的选择和分析方法扩展
1
帕累托和风险上策均衡 ——帕累托上策均衡 ——风险上策均衡 聚点和相关均衡 ——聚点均衡 ——相关均衡 共谋和防共谋均衡
2
3
1
帕累托和风险上策均衡
帕累托上策均衡:依据帕累托效率意义上的优劣关系, 某一个纳什均衡给所有博弈方带来的利益都大于其他所 有纳什均衡会带来的利益,博弈方选择的倾向性是一致 的。
3
共谋和防共谋均衡
博弈方2 博 弈 方 1 博弈方2
经济博弈论 02 完全信息静态博弈(Park)

都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
博弈论日记(2)完全信息静态博弈基础理论

博弈论⽇记(2)完全信息静态博弈基础理论1.1.博弈的标准式和纳什均衡1.1A.博弈的标准式表述⾸先我们来说明⼀下什么是完全信息静态博弈,静态博弈指开始时由参与者同时选择⾏动,然后根据所有参与者的选择,每个参与者得到各⾃的结果。
完全信息博弈即每⼀个参与者的收益函数(根据所有参与者选择⾏动的不同组合决定某⼀参与者收益的函数)在所有参与者之间是共同知识。
之所以称为基础理论,是因为本⼩结要解决两个基本问题:如何描述⼀个博弈以及如何求博弈的解。
定义:在⼀个n⼈博弈的标准式的表述中,参与者的战略空间为S1,S2,……,Sn,收益函数为u1,u2,……,un,我们⽤G={S1,S2,……,Sn;u1,u2,……,un}表⽰此博弈。
1.2B.重复剔除严格劣策略上⾯是博弈论的表述⽅法,下⾯是⼀个关于博弈论的解的⽅法(虽然不常⽤)。
定义:在标准式的博弈G={S1,S2,……,S3;u1,u2,……,un}中,令Si′和Si″代表参与者i的两个可⾏战略(即Si′和Si″是Si中的元素)。
如果对其他参与者每⼀个可能的战略组合,i选择Si′的收益都⼩于其选择Si″的收益,则称战略Si′相对于Si″是严格劣战略。
ui(S1,S2,…,Si′,…,Sn;u1,u2,…,ui′,…un}<ui{S1,S2,…,Si″,…,Sn;u1,u2,…,ui″,…un}1/2 L2 R2 M2L1 1,0 1,2 0,1R1 0,3 0,1 2,0参与⼈1有两个可选策略,S1={L1,R1},参与⼈2有三个可选策略S2={L2,R2,M2}。
在这个博弈中,对参与⼈1来说L1和R1都不是严格占优的。
因为如果参与⼈2选择L2,参与⼈1L1优于R1;参与⼈2选择R2,参与⼈1L1优于R1;参与⼈2选择R2,参与⼈1R1优于L1;但对参与⼈2来讲,M2是严格劣于R2的,因此理性的参与⼈2是不可能选择M2的,就可以把M2在战略空间中剔除,如果参与⼈1知道参与⼈2是理性的,那么他就可以将这个博弈视为下图:1/2 L2 R2L1 1,0 1,2R1 0,3 0,1此时⼜产⽣了⼀个新的情况,对于参与⼈1来讲,R1⼜是严格劣与L1的,因此就可以将R1在参与⼈1的战略空间中剔除,博弈⼜变成了如下情况:1/2 L2 R2L1 1,0 1,2此时双产⽣了⼀个新的情况,对于参与⼈2来讲,L2⼜是严格劣与R2的,因此就可以将L2在参与⼈2的战略空间中剔除,博弈双变成了如下情况:1/2 R2L1 1,2上述的过程就可以称为“重复剔除严格劣策略”。
第二章 完全信息静态博弈的基本理论解析

1.占优策略与劣策略。
严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。
案例1:霍布斯博弈
假设鲁滨逊与星期五生活在一个自然状态之中。为了生存,他们各自有两个选择:自己生产财富或掠夺对方的财富。博弈情形如下:
乙
生产
掠夺
甲生产
8
8
10
-2
掠夺
-2
10
-1
-1
思考:面对囚徒困境、广告博弈、霍布斯博弈,请思考如何解决社会困境?(答案略;最低价格承诺实际上就是为解决寡头之间的串谋困境提供了有效的解决机制)
第二章完全信息静态博弈的基本理论
0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈
完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。
特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。
占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。
特别提ห้องสมุดไป่ตู้:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。类似地,可以定义局部劣策略与全局劣策略。
博弈论与信息经济学课件2—完全信息静态博弈1

定义一:
完全信息静态博弈(策略型博弈)是指在博弈
中局中人的信息是完全的,并且局中人同时采取行 动或局中人的行动有先有后,但后行动者不知道先 行动者的行动选择的一种博弈。
§1 完全信息静态博弈的表示—支付矩阵
1.2 策略型博弈的表示
1、局中人(Players):i , 1, 2,..., n ; 2、策略空间(Strategies): Si si , i 1, 2,..., n; 3、支付函数(Payoff Functions): ui ui (s1 , , si , , sn );
现实中的囚徒困境——公共资源过度使用
哈丁,1968年,《科学》杂志, 《公共地悲剧》
牧民乙
1只
牧 民 甲
2只
60, 120 80, 80
1只 2只
100, 100 120, 60
现实中的囚徒困境
应试教育与素质教育的两难选择
为什么路越来堵?
为什么成绩越来越高?
团队生产中的偷懒
„„„
现实中的囚徒困境
齐 威 王
上中下 上下中 中上下 中下上 下上中 下中上
性别大战博弈
女生 足球 足球 男生 歌剧 3,2 -1,-1 歌剧 1, 1 2, 3
§2 占优策略(上策)及占优策略(上策)均衡
例:囚徒困境
坦白 坦白 甲 不坦白
乙 不坦白
-5,-5
-8,0
0,-8
-1,-1
“坦白”是甲的优势策略 (坦白,坦白) “坦白”也是乙的优势策略 囚徒困境模型反应了个体理性与集体理性的冲突
完全信息静态博弈
四种博弈类型
完全信息动态博弈
不完全信息静态博弈 不完全信息动态博弈
2经济博弈论-完全信息静态博弈

第二章 完全信息静态博弈完全信息:每一个参与者对其他所有参与者的策略空间及得益有准确的知识。
静态:所有参与者同时选择策略,每一个参与者事先并不知道其他参与者的具体策略选择第二章 完全信息静态博弈2.1严格优势策略均衡 2.2严格劣势策略消去法 2.3相对优势策略划线法 2.4多重纳什均衡的选择 2.5无限策略博弈反应函数法 2.6混合策略纳什均衡2.1 严格优势策略均衡引子:囚徒困境(Prisoner ’s Dilemma)参与者:囚徒1、囚徒2 策略空间:坦白、抵赖 得益:1、一个坦白并作证,另一个抵赖,抵赖者入狱五年,坦白者将得到宽大释放; 2、都坦白,每人入狱三年;3、都不坦白,每人以妨碍公务罪入狱一年。
得益矩阵 得益矩阵 得益矩阵 囚徒 2 坦白抵赖囚徒1 抵赖11 055 033坦白 坦白策略被称为囚徒1的全面的严格的优势策略。
简称严格优势策略全面的:不论对方采用何种策略,此策略总显示优势 严格的:此策略严格好于其他策略由严格优势策略组成的博弈均衡,称为 “严格优势策略均衡”囚徒困境的严格优势策略均衡为(坦白,坦白) 双方的得益为(-3,-3)启示:“个人理性”与“集体理性”的冲突例1:公共品供给的囚徒困境李四 修不修张 修 三不修不修 00 133111修路的成本为4,各自获得的好处为3例2:价格战百事可乐低价 高价可 低价口口可 高价 乐乐 55 611 633注:囚徒困境得益+6第二章 完全信息静态博弈2.1严格优势策略均衡 2.2严格劣势策略消去法 2.3相对优势策略划线法 2.4多重纳什均衡的选择 2.5无限策略博弈反应函数法 2.6混合策略纳什均衡2.2 严格劣势策略消去法引子:智猪博弈按钮食槽小猪大猪 按一下按钮会有10单位的猪食进槽,但按按钮然后 再跑到猪食槽需要付出2单位成本参与者:大猪、小猪策略空间:按按钮、坐等其食 得益:1、同时按按钮并跑过来,大猪吃到7个单位,小猪 吃到3个单位。
第二章(完全信息静态博弈)PPT课件

q2 R2(q1)
(3,0) (6,0)
q1
图2.9 古诺模型的反应函数几何描述
2021
27
三、伯特兰德寡头模型——价格博弈
当厂商1和厂商2价格分别是 P1 和 P2 时,它们各 自的需求函数为 :
q 1 q 1 ( P 1 ,P 2 ) a 1 b 1 P 1 d 1 P 2 q 2 q 2 ( P 1 ,P 2 ) a 2 b 2 P 2 d 2 P 1
一、纳什均衡的定义
n个参与人的策略式表达博弈:G {S1, ,Sn;u1, un},
策略组合 S*{S1 *, ,Si*, Sn *}是一个纳什均衡,如果
对于每一个
i,s
* i
是给定其他所有参与人选择
S * 1 { S 1 * , ,S i* 1 ,S i* 1 S n * }的情况下第 i个参与人的
2021
17
三、纳什均衡与上述分析方法的关系
(一)纳什均衡与上策均衡的关系 上策均衡是比纳什均衡更强、稳定性更高的均衡 概念
纳什 均衡
上策均衡
图2.8 纳什均衡与上策均衡的关系
2021
18
G { S 1, ,S n;u 1, u n}
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G {S1, ,Sn;u1, un}中,
2021
16
正是由于纳什均衡是一致性预测,因此才进一 步有下列性质:首先,各博弈方可以预测它,可以 预测他们的对手会预测它,还可以预测他们的对手 会预测自己会预测它,……;其次,预测任何非纳 什均衡策略组合将是博弈的最终结果,意味着要么 各博弈方的预测其实并不相同(预测不同的纳什均 衡会出现等),要么预期至少一个博弈方要“犯错 误”,包括对博弈结构理解的错误,对其他博弈方 的策略预测错误,其理性和计算能力有问题,或者 是实施策略时会出现差错等。
经济博弈论完全信息静态博弈

19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
经济博弈论02完全信息静态博弈(Park)

合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Economics department
第二章 完全信息静态博弈
分析思路 纳什均衡 混合策略和混合策略纳什均衡 * 纳什均衡的存在性 * 纳什均衡的选择和存在性
2014-6-24
1
YBU
Economics department
楔子
本章介绍完全信息静态博弈。完全信息静态博弈即 各博弈方同时决策,且所有博弈方对各方得益都了解 的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石 头剪子布、古诺产量决策都属于这种博弈。完全信息 静态博弈属于非合作博弈最基本的类型。 本章介绍完全信息静态博弈的一般分析方法、纳什 均衡概念、各种经典模型及其应用等。
YBU
Economics department
2.1 Cont.
妻(囚徒 2 ) 坦白 不坦白 夫 (囚徒1 ) 坦白 不坦白 -5, -5 -8, 0 0, -8 -1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
-1, 1 1, -1
1, -1 -1, 1
YBU
Economics department
2.2 纳什均衡
一、纳什均衡的定义 博弈方:1,…,n ;表示有n个博弈方 策略空间:S1, ...,Si,…Sn,博弈方 i 的第 j 个策略 Sij∈ Si 博弈方 i 的得益: ui 博弈:G={S1, ...Sn; u1, ...un} 纳什均衡:在博弈 G={S1, ...Sn; u1, ...un}中,如果由各个博 弈方的各一个策略组成的某个策略组合 {S1*, ...Sn*}中,任一 博弈方 i 的策略 Si*, 都是对其余博弈方策略的组合 {S1*, ... Si-1*, Si+1*,… Sn*}的最佳对策,也即对任意
YBU
Economics department
2.4 混合策略和混合策略纳什均衡
一、猜硬币博弈
猜硬币方
正面 反面
正面 盖硬币方 反面
-1, 1 1, -1
1, -1 -1, 1
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略
这类博弈很多,引出混合策略纳什均衡概念
YBU
守卫睡觉时的得益
守卫不睡觉 时的得益
-D - D’
0
p*
p=1
加重对首位的处罚:短期中的效果是使守卫真正尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概略
maxu1=maxq1[100- (q1+q2+q3); ] –q1c; q1 maxu2=maxq2[100- (q1+q2+q3); ] –q2c; q2 max q3 u3=maxq3[100- (q1+q2+q3); ] –q3c; q1*=q2*= q3*= 24, u1*=u2*= u3*= 576
YBU
Economics department
Cont
证明:纳什均衡与严格下策反复消去法(反证法) 命题1:如果 消去所有后余下的{Si*, S-i*}不是纳什均衡 不是纳什均衡,一定存在那么{Si’, S-i*}, 使得{Si*, S-i*}<{Si’, S-i*}。 然而,反复消去法消去了{Si’, S-i}, 说明{Si*, S-i}>{Si’, S-i} {Si*, S-i*} in{Si*, S-i}, {Si’, S-i*} in {Si’, S-i} 所以, {Si*, S-i*} > {Si’, S-i*} 命题2: 如果纳什均衡{Si*, S-i*} 被严格下策反复消去; 那么必然存在一个Si‘, 使得{Si’, S-i} >{Si*, S-i} 进而, {Si‘, S-i*} > {Si*, S-i*} 与纳什均衡的定义,矛盾
q2
R1(q2)
R2(q1)
(3,0) (6,0) q1 古诺模型的反应函数图示
maxu1 max(6q1 q1q2 q12 )
q1
(0,6) (0,3)
q1 R1 (q2 ) 1 2 ( 6 q2 ) q2 R2 (q1 ) 1 2 (6 q1 )
YBU
Economics department
ui(S1*, ... Si-1*, Si*, Si+1*, ... Sn*) ≥ui(S1, ... Si-1*, Sij, Si+1*,… Sn*)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会 出现,所有博弈方都不会利用该预测或者这种预测能力 选择与预测结果不一致的策略,即没有哪个博弈方有偏 离这个预测结果的愿望,因此预测结果会成为博弈的最 终结果 只有纳什均衡才具有一致预测的性质 一致预测性是纳什均衡的本质属性 一致预测并不意味着一定能准确预测,因为有多重均衡, 预测不一致的可能
Cont。
伯特兰德寡头模型模型 Player:厂商1,2 Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium? maxu1=max(p1-2)(28- p1-0.5p2); p1 max u =max(p2-2)(28- p2-0.5p1); p 2
YBU
Economics department
2.1 基本分析思路和方法
一、上策均衡 上策(dominate str.):不管其它博弈方选择什么策略, 一博弈方的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略 ui (Si*, S-i )≥ ui (Si, S-i)
上策均衡:一个博弈的某个策略组合中的所有策略都是 各个博弈方的上策,则称为上策均衡。 *** 上策均衡必然是该博弈比较稳定的结果 上策均衡不是普遍存在的
p = 0.8, q = 0.8
u 1= 2.6, u 2= 2.6
YBU
Economics department
Cont.
Player 2 C (q) D (1-q)
博弈方2选C的收益(p混) 2, 3 5, 2 A (p ) 3p+1(1-p)=1+2p Player 1 博弈方2选D的收益(p混) 3, 1 1, 5 B (1-p) 2p+5(1-p)=5-3p 博弈方1选A的收益(q混) Payoff 2q+5 (1-q) =5-3q 博弈方1选B的收益(q混): 3q+1(1-q)=1+2q
如何变化,给一个博弈方带来的收益总是比另一种 策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下策 严格下策反复消去 Player 2 R L M
U D 1, 0 0, 4 1, 3 0, 2
Payoff
Player 1
0, 1 2, 0
YBU
Economics department
2.1 Cont.
寻找均衡的技术技巧 划线法
1, 0 0, 4 囚 徒 困 境 1, 3 0, 2 0, 1 2, 0 夫 妻 之 争
-5, -5 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
猜 硬 币
-1, 1
1, -1
YBU
Economics department
Cont.
三、一个例子 该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析
Player 2 C (q ) D (1-q) A (p) B (1-p)
Player 1
2, 3 3, 1
Payoff
5, 2 1, 5
I 的混合策略(p):3p+1(1-p)=2p+5(1-p) II的混合策略(q):2q+5(1-q)=3q+1(1-q) u1 = p[2q+5(1-q)]+(1-p)[3q+1(1-q)]=2.6 u2 = q[3p+1(1-p)]+(1-q)[2p+5(1-p)]=2.6
Economics department
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的策 略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随机在 其k个可选策略中选择的“策略”,称为一个“混合策略”, 其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。 混合策略纳什均衡:包含混合策略的策略组合,构成纳什 均衡。
如果总体来看, maxQ[100- Q ] –Qc; Q*=48,u=2304 公共资源的悲剧!!!
YBU
Economics department
Cont.
反应函数的问题和局限性 有此博弈中,博弈方的策略是有限且非连续时, 其得益函数不是连续可导函数,无法求得反应 函数,从而不能通过解方程组的方法求得纳什 均衡。 即使得益函数可以求导,也可能各博弈方的得 益函数比较复杂,因此各自的反应函数也比较 复杂,并不总能保证各博弈方的反应函数有交 点,特别不能保证有唯一的交点。