完全信息静态博弈.
完全信息静态博弈
博弈论的发展前景
无论是从社会经济发展的客观要求,还是从经济学理论发展本身的规律来看,博弈论都有很大的发展前途。 1)博弈论本身具有优美深刻的本质魅力,新的分析工具和应用领域的不断发现,以及博弈论价值得到越来越充分 的认识,不断吸引大量学者加入学习、研究和应用博弈论的队伍。这是博弈论继续向前发展的根本基础和保证。 2)在博弈规则的来源、博弈方的行为模式和理性等基础理论方面,博弈论还存在不少没有很好解决的问题,有待 进一步研究和解决。这正是博弈论未来发展的动力。 3)当前合作博弈理论发展相对落后,这个领域有很大的发展潜力,很可能孕育出引发经济学新革命的重大成果。 非合作博弈和合作博弈理论的重新组合也可能给博弈论的发展提出新的方向和课题。
1)决策者考虑短期利益、个人或者小集团利益更多,决策者确实缺乏理智和理性; 2)局部地区或特定时期战争的利益比上述博弈中所假设的要大; 3)其他国家选择战争时还击比不还击损失小,先发制人则更能使自己相对有利;
以上因素都是导致发生战争机会增大的重要原因。
2)风险上策均衡法
风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏爱其中某 一个纳什均衡,则该纳什均衡就是一个“风险上策均衡”。
博弈论在我国经济中的应用
企业经营者的启示:
1)在我国经济体制改革和国有企业管理体制改革中,委托人—代理人理论和激励机制设计原理有很大的应用价 值。如,对“监督困难的委托人—代理人理论”的研究,找到可以调整各方面的利益关系和调动职工和经营者 的积极性和责任心的依据和方法。 2)博弈论领域中“囚徒困境”,“激励悖论”等众多模型和命题为企业经营者揭示了众多经济、经营活动中的 内在规律,企业决策者利用这些工具可以大大提高在价格和产量决策、经济合作和经贸谈判,参与投标拍卖, 处理劳资关系等问题的决策效率。
经济博弈论之完全信息静态博弈培训
2023
PART 04
完全信息静态博弈的策略 分析
REPORTING
优势策略
优势策略是指参与者在给定信息下, 选择对自己最有利的策略,而不考虑 其他参与者的反应。
优势策略是博弈分析中的重要概念, 它可以帮助参与者找到最优的策略选 择。
在完全信息静态博弈中,如果某个参 与者有一个优势策略,那么无论其他 参与者选择什么策略,该参与者都应 该坚持这个优势策略。
收益
每个参与者在博弈中获得的效用或收益,是衡量参与者利益的标准。
在完全信息静态博弈中,每个参与者的收益函数是共同知识,即所有参与者都知 道其他参与者的收益函数。
纳什均衡
纳什均衡是指在一个博弈中,每个参 与者的最优策略选择在其他参与者最 优策略选择给定的情况下是最优的。
在完全信息静态博弈中,纳什均衡是 所有参与者的最优策略组合,满足每 个参与者的最优策略选择在其他参与 者最优策略选择给定的情况下是最优 的。
2023
PART 02
完全信息静态博弈的基本 概念
REPORTING
参与者
博弈中的决策主体,通常称为局中人 或参与人。
在完全信息静态博弈中,每个参与者 都了解其他参与者的身份及其所有可 能的策略和收益。
策略
参与者在博弈中可以选择的行动方案,是参与者在给定信 息集下的决策变量。
在完全信息静态博弈中,每个参与者的策略空间是共同知 识,即所有参与者都知道其他参与者的所有可能策略。
2023
PART 03
完全信息静态博弈的经典 案例
REPORTING
囚徒困境
总结词
描述两个囚犯因被捕而面临供述与否的决策,揭示个 体理性与集体理性的矛盾。
详细描述
在囚徒困境中,两个囚犯因共同犯罪被捕,并分别被 关押在独立的房间。每个囚犯都有供述和保持沉默两 种选择。如果两个囚犯都保持沉默,则他们都不会受 到严重惩罚;但如果一个囚犯供述,另一个保持沉默 ,则供述者会得到较轻的惩罚,而沉默者会受到更严 厉的惩罚。由于囚犯之间无法进行沟通,他们往往会 基于自身利益而选择供述,从而导致双方都受到较重 的惩罚。
完全信息静态博弈
一 占优战略均衡
占优战略均衡
定义:在博弈的战略表达式中,如果对于所
有的i,Si*是i的占优战略,下列战略组合称为
占优战略均衡:
s* (s1*, , sn* )
一 占优战略均衡
注意:
✓ 如果所有人都有(严格)占优战略存在,那么 占优战略均衡就是可以预测的唯一均衡。
✓ 占优战略只要求每个参与人是理性的,而不要 求每个参与人知道其他参与人是理性的(也就 是说,不要求理性是共同知识)。为什么?
二 重复剔除的占优均衡
举例: 剔除顺序:R3、C3、C2、R2,战略组合(R1,C1)
C1
R1
2,12
R2
0,12
R3
0,12
C2
1,10 0,10 0,10
C3
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
故一般使用严格劣战略剔除,可以看到,(R1,C3) (R1,C1)都是纳什均衡,但在这里是不可解的。
开发商B 开发 不开发
开发 4000,4000 8000,0
不开发 0,8000
0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的战略式表述
斗鸡博弈
独木桥
进 A
退
B
进
退
-3,-3 2,0
0,2 0,0
纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
6,2
R2
2,1
R3
3,0
8,4 9,6
3,6 2,8
完全信息静态博弈
三 纳什均衡
n 纳什均衡与占优战略均衡及重复剔除的占优均 衡:
n (1)每一个占优战略均衡及重复剔除的占优均衡一定 是纳什均衡,但并非每一个纳什均衡都是占优战略均 衡或重复剔除的占优均衡;
n (2)纳什均衡一定是在重复剔除严格劣战略过程中没 有被剔除掉的战略组合,但没有被剔除掉的组合不一 定是纳什均衡,除非它是唯一的(不适用于严格弱劣 战略的情况)
第二章 完全信息静态信息博弈-纳什均衡
n 一 占优战略均衡 n 二 重复剔除的占优均衡 n 三 纳什均衡 n 四 混合战略纳什均衡 n 五 纳什均衡存在性及相关讨论 n 六 纳什均衡应用举例
一 占优战略均衡
n 完全信息静态博弈 ü 完全信息:每个参与人对所有其他参与人的特
征(包括战略空间、支付函数等)完全了解 ü 静态:所有参与人同时选择行动且只选择一次。 ü 同时:只要每个参与人在选择自己的行动时不
四 混合战略纳什均衡
n 社会福利博弈
政府
流浪汉
寻找工作 流浪
2 救济 3,
1 不救济 -1,
3 -1,
0 0,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
猜谜游戏
v两个儿童各 拿一枚硬币,
v若同时正面 朝上或朝下, A给B 1分钱,
v若只有一面 朝上,B给A 1分钱。
零和博弈
博弈参与者有 输有赢,但结 果永远是0。
正面 反面
正面
反面
1 -1,
-1 1,
-1 1,
1 -1,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
n 警察与小偷
1万元
酒馆 东边
小偷
警察
警察与小偷的最优策略各是什么?
第二讲 完全信息静态博弈
得每个参与人的策略是对其他
参与人策略的最优反应。
在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法
箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法
完全信息静态博弈
• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。
•
R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)
•
F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。
完全信息静态博弈教学课件
完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。
博弈论 完全信息静态博弈
max u1 max(6q1 q1q2 q12 )
q1
1 q1 R1 (q2 ) (6 q2 ) 2
同样有: 2 max u1 max(6q2 q1q2 q2 )
q2
1 q2 R2 (q1 ) (6 q1 ) 2
2.3.2 反应函数
古诺模型的反应函数
个博弈方的各一个策略组成的某个策略组合 (s1*,…,sn*)中,任
一博弈方 i的策略si*,都是对其余博弈方策略的组合 (s1*,…, si1 *,
si+1* ,…,sn*) 的最佳对策,也即
* * ui ( si* , si*1 , si* , si*1 ,...sn ) ui ( si* , si*1 , sij , si*1 ,...sn )
q2
(0,6)
R1 (q2 )
q1 R1 (q2 ) 1 (6 q2 ) 2 q2 R2 (q1 ) (6 q1 )
1 2
(0,3)
R2 (q1 )
(3,0) (6,0)
q1
古诺模型的反应函数图示
对一个一般的博弈,只要得益是策略的多 元连续函数,我们都可以求每个博弈方针 对其他博弈方策略的最佳反应构成的函数 ,也即反应函数,而解出的各个博弈方反 应函数的交点就是纳什均衡。 这种利用反应函数求博弈的纳什均衡的方 法称为“反应函数法”。
本部分主要内容
2.1 基本分析思路和方法
2.2 纳什均衡
2.3 无限策略博弈分析和反应函数 2.4 混合策略和混合策略纳什均衡
2.5 纳什均衡的存在性
2.6 纳什均衡的选择和分析方法扩展
2.1 基本分析思路和方法
2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法
完全信息静态博弈论模型
完全信息静态博弈论模型引言:博弈论是研究决策制定者在不同利益冲突场景下的行为和策略选择的数学模型。
在博弈论中,静态博弈是指参与者在同一时间点做出决策的情况。
完全信息表示每个参与者对于其他参与者的行为和策略选择都有完全的了解。
本文将介绍完全信息静态博弈论模型的基本概念、解决方法以及应用领域。
一、基本概念1.1 参与者完全信息静态博弈中,有两个或多个参与者,每个参与者可以是个体、团体或国家等。
参与者通过制定决策来追求自身的利益。
1.2 策略每个参与者在博弈中可以选择的行动方案称为策略。
策略可以是纯策略,即只选择一个确定的行动;也可以是混合策略,即以一定概率选择不同的行动。
1.3 支付函数支付函数是衡量参与者在不同策略组合下所获得效用或利益的函数。
支付函数可以表示为参与者的收益、成本或效用。
1.4 纳什均衡纳什均衡是指在博弈中,每个参与者选择的策略组合使得没有参与者有动机改变自己的策略。
换言之,每个参与者都在给定其他参与者的策略下做出最优的决策。
二、解决方法2.1 支付矩阵为了描述参与者之间的策略选择和支付函数之间的关系,可以使用支付矩阵。
支付矩阵是一个二维矩阵,行表示一个参与者的策略选择,列表示其他参与者的策略选择,每个元素表示对应策略组合下的支付函数。
2.2 最优响应最优响应是指在其他参与者的策略下,参与者能够选择的最优策略。
通过计算每个参与者的最优响应,可以找到纳什均衡。
2.3 前瞻性在完全信息静态博弈中,参与者可以通过推断其他参与者的策略和支付函数来做出决策。
前瞻性是指参与者能够预测其他参与者的行为并做出相应的反应。
三、应用领域完全信息静态博弈论模型广泛应用于经济学、政治学、生物学等领域。
3.1 经济学博弈论在经济学中有广泛应用,如市场竞争、定价策略、拍卖等。
完全信息静态博弈模型可以帮助分析参与者的决策行为,预测市场的走势和结果。
3.2 政治学在政治学中,博弈论可以用于分析选举、政策制定和国际关系等问题。
博弈论_完全信息静态博弈
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡(Nash Equilibrium) 纳什均衡
纳什均衡、占优均衡、重复剔除严劣策 略均衡的关系
定理a 每一个占优均衡、重复剔除严劣策 略均衡一定是纳什均衡,但反过来不一定 成立; 定理b 纳什均衡一定不能通过重复剔除严 劣策略方法剔除。
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡应用举例: 纳什均衡应用举例:古诺模型
(q1*, q2*)是均衡产量意味着:
q1*∈argmaxπ1(q1, q2*) q2*∈argmaxπ2(q1*, q2) 根据上面两个式子可以得出反应函数(reaction function): q1*=R1(q2) q2*=R2(q1) 两个反应函数的交叉点就是纳什均衡(q1*, q2*), 见图1-9
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡应用举例: 纳什均衡应用举例:古诺模型
1 q 1 = q = (a − c) 3
* * 2
进而可以得出每个企业的纳什均衡产量下 的利润,为
π
*
1
=π
* 2
1 = (a − c)2 9
可以同垄断企业的最优决策类比
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
豪泰林价格竞争模型
古诺模型中,产品是同质的(homogenous); 豪泰林模型中,引入了产品的差异性;
产品的差异性可以有很多体现形式:如品牌、外 观、功能、空间差别(如房地产) 豪泰林模型中,产品的差异通过空间差别来体现 豪泰林模型的主要假设是产品的差异完全是由空 间位置的不同而造成的
完全信息静态博弈实验
在实验中,通常会设定每个策略都 有一个相应的收益值,这些收益值 可以是正面的,也可以是负面的。 参与人的目标是在给定其他参与人 策略选择的情况下,选择一个最佳
的策略,以最大化自己的收益
2
实验步骤
设定参与人数和策略 数量
确定每个参与人的策 略选择
分析博弈结果:包括 最佳策略选择、博弈 均衡以及影响因素等
的策略来增加自己的收益
除了得出最优策略组合外,实验结果还 可以分析不同因素对博弈结果的影响。 例如,参与人的风险偏好、信息不完全 程度、时间限制等因素都可能对博弈结
果产生影响
4
完全信息静态博弈实验是一种经 典的博弈模型,常用于分析策略 选择和决策行为。通过实验可以 得出最优策略组合以及不同因素 对博弈结果的影响。在实际应用 中,完全信息静态博弈也可以用 于研究各种不同领域的问题,例 如经济学、政治学、社会学等。 通过分析不同因素对博弈结果的 影响,可以更好地理解各种问题 的本质和规律,为决策提供参考
完全信息静态博弈实验还可以用 于研究人类的决策行为和心理。 例如,通过实验可以观察到人们 在面对风险和不确定性时的决策 偏好和行为特点。此外,完全信 息静态博弈实验还可以用于研究 人类的合作和竞争行为,以及如 何通过合作和竞争来实现共赢
结论
-
XXXX
感谢观看
汇报人:xxxx
时间:20XX.XX.XX
-
完全信息静态博弈实验
完全信息静态博弈实验
67 LOREM
完全信息静态博弈是一种经典的博弈 模型,其特点是参与人在进行决策时, 对于其他参与人的策略选择和收益情 况都有完全的了解。这种博弈模型常 用于分析策略选择和决策行为,以及
研究不同因素对博弈结果的影响
博弈论四种类型之完全信息静态博弈
博弈论四种类型之完全信息静态博弈决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。
完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。
⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。
在完全信息静态博弈中的均衡是纳什均衡。
最典型的例⼦是囚徒困境与智猪博弈。
下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。
【囚徒困境】中基于收益矩阵的模型描述如下:【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。
⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。
离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。
对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。
【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。
所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。
但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。
个⼈的最优选择从社会⾓度看并不是最优的。
社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。
【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚(第三⽅实施),会使两⼈合作,促进集体利益最⾼。
【智猪博弈】智猪博弈的收益矩阵模型如下:在此处,⼩猪有优势与劣势策略,但⼤猪没有,只能根据⼩猪的策略做出最佳应对,⽽⼩猪不会选择劣势策略,因此剔除⼩猪“按”的策略,此时,⼤猪的策略只能为“等”。
【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略,参与⼈选择策略A时的收益严格⼩于策略B时的收益。
经济博弈论完全信息静态博弈
19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
博弈的四种基本类型
博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。
例如,囚徒困境。
2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争。
3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈。
4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。
例如,信号传递博弈。
每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。
例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。
完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。
不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。
不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。
例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。
博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。
举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。
你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。
二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。
举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。
经济博弈论02完全信息静态博弈(Park)
合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。
完全信息静态博弈及其纳什均衡解
第三章完全信息静态博弈及其纳什均衡解1. 完全信息静态博弈定义 3.1.完全信息静态博弈。
完全信息静态是指,博弈中的参与人同时采取行动,或者尽管参与人行动的采取有先后顺序,但后行动的人在行动时不知道先采取行动的人采取的是什么行动;同时博弈参与人的策略空间及策略组合下的支付是博弈中所有参与人的“公共知识”。
两个特点:(1)静态;(2)完全信息。
完全信息静态博弈例子。
例1:锤子-剪刀-布例2:交通行驶非“完全信息静态博弈”例子:英式拍卖——动态博弈;第一密封价格及第二密封价格拍卖——不完全信息博弈。
2. 纳什均衡及其判定定义3.2 纳什均衡。
在一个n人博弈的标准式G={S1,S2,…,Sn;u1,u2,…,un}中,一个策略组合{s1*,s2*,…,sn*},若满足ui(s1*,…,si*,…sn*)≥ui(s1*,…si,…,sn*)(i=1…n),则称这个策略组合为{s1*,s2*,…,sn*}为该博弈G的一个纳什均衡。
某策略组合是纳什均衡指的是,在该策略组合上任何一个参与人的收益在其他人策略不改变的情况下都至少是弱优的。
特点:(1)每个人没有单独改变策略的动机;(2)局部最优。
纳什均衡判定方法:用定义来判定:某点是均衡看它是否符合纳什均衡的定义。
求解纳什均衡的方法:(1)剔除严格被占优策略。
例3:囚徒困境甲不合作合作乙不合作2,2 1,4 合作4,1 3,3缺点:只有当仅有一个纯策略均衡点的时候,该方法才是有效的。
(2)用定义来求解(3)对于策略空间为连续的博弈,用求极值的方法来求得。
3. 纳什均衡存在定理:(纳什)定理3.1.在一个n人博弈的标准式G={S1,S2,…,Sn; u1,u2,…,un}中,如果n是有限的,且对每个i, Si是有限的,则博弈至少存在一个纳什均衡。
这里的均衡可能包含混合策略均衡。
证明:略例子3:囚徒困境的均衡例1:“锤子-剪刀-布”的均衡?4. 混合策略与混合策略的均衡纯策略与混合策略概念。
完全信息静态博弈实验的启示和感悟
完全信息静态博弈实验的启示和感悟?答:完全信息静态博弈实验是一种研究决策制定和策略互动的重要工具。
在这个实验中,参与者需要在完全了解所有其他参与者的可能行动和收益的情况下,做出自己的决策。
这种类型的实验为我们提供了许多深刻的启示和感悟。
首先,完全信息静态博弈实验强调了信息在决策制定中的重要性。
在现实生活中,我们经常面临信息不对称的情况,这使得决策制定变得复杂和困难。
然而,在完全信息静态博弈中,所有参与者都拥有相同的信息,这使得我们能够更好地理解信息对决策的影响。
这启示我们在做决策时要尽可能地收集和了解相关信息,以减少信息不对称带来的风险。
其次,该实验揭示了策略互动的本质。
在博弈中,每个参与者的决策都会影响到其他参与者的收益,因此参与者需要考虑其他参与者的可能行动来制定自己的策略。
这使我们意识到在现实生活中,我们的决策也往往会受到他人的影响。
我们需要学会预测他人的行为,并据此调整自己的策略,以达到更好的结果。
此外,完全信息静态博弈实验还让我们认识到合作与竞争的关系。
在博弈中,有时通过合作可以实现双赢,但有时竞争也是不可避免的。
这启示我们在现实生活中要灵活地运用合作与竞争的策略,根据具体情况做出选择。
同时,我们也需要学会在竞争中寻找合作的可能性,以实现共赢。
最后,该实验提醒我们要保持理性思考。
在博弈中,情绪化的决策往往会导致不利的结果。
我们需要学会在面对复杂情况时保持冷静,运用逻辑和理性来分析问题并制定策略。
这不仅有助于我们在博弈中取得更好的成绩,也有助于我们在现实生活中应对各种挑战。
总之,完全信息静态博弈实验为我们提供了许多宝贵的启示和感悟。
通过参与这类实验,我们可以更好地理解决策制定、策略互动、合作与竞争以及理性思考等方面的问题,从而提升我们的决策能力和应对复杂情况的能力。
第2章_完全信息静态博弈
2.3.1 古诺的寡头模型
反应函数:是指每个博弈方针对其他博弈方所有战略的最佳反应构成 的函数。 纳什均衡就是各个博弈方的一组互为最佳反应对策的战略。
2.1.1 占优战略均衡(上策均衡)
开发商B 需求大的情况 开发商A 不开发 开发 开发 4000,4000 0,8000 不开发 8000,0 0,0 开发商B B严格劣 战略
A严格劣 战略
需求小的情况
开发
开发 开发商A 不开发 0,1000 -3000,-3000
不开发
1000,0 0,0
2.1.1 占优战略均衡(上策均衡)
-8, -8 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
-1, 1 1, -1
1, -1 -1, 1
2.1.4 箭头法
基本思路
对博弈中每个策略组合进行分析,考察在每个策略组合
处各个博弈方能否通过单独改变自己的策略而增加得益。
如能,则从所分析的策略组合对应的得益数组引一箭头, 到改变策略后策略组合对应的得益数组。最后综合分析 对每个策略组合的分析情况,形成对博弈结构的判断。
有任何人有积极性破坏这个协议,则这个协议是自动
实施的。这个协议就构成了一个纳什均衡。
2.2 纳什均衡
通俗地说,纳什均衡的含义就是:
给定你的策略,我的策略是最好的策略;给定我的策略,
你的策略也是你的最好的策略。即双方在给定的策略下
不愿意调整自己的策略。
2.2 纳什均衡
寻找纳什均衡
参与人B
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
完全信息静态博弈名词解释
完全信息静态博弈名词解释
嘿,你知道啥是完全信息静态博弈不?咱就说啊,这就好像是一场
棋局!每个人都清楚地知道所有的规则和局面(就像你清楚棋盘上每
个棋子的位置和走法一样)。
在完全信息静态博弈里,大家都在同一时间做决定(可不是像接力
赛那样一个接一个哦),而且对彼此的情况都了解得透透的。
比如说,两个人下棋,谁都知道对方有啥子棋,该咋走。
想象一下,你和朋友玩猜硬币正反面的游戏,这就是个简单的完全
信息静态博弈例子呀!你知道硬币就只有正反两面,你朋友也知道,
而且你们同时猜(可不是你先猜完了他再猜)。
再比如商场上的竞争,两家公司都清楚市场的情况、对方的实力,
然后同时决定自己的策略,这也是完全信息静态博弈。
这可不是闹着
玩的,一个决策失误,可能就满盘皆输啦!
咱回过头来想想,生活中好多场景不都像是一场完全信息静态博弈嘛!像买东西讨价还价,你知道商品大概值多少钱,老板也知道,然
后你们就开始“博弈”啦,看谁能争取到更有利的价格。
完全信息静态博弈就是这么个有趣又重要的概念,它让我们能更好
地理解人与人、企业与企业之间的互动和竞争。
它就像一个神奇的钥匙,能打开我们理解复杂社会现象的大门。
所以啊,可别小瞧了它,
它的用处大着呢!
我的观点就是:完全信息静态博弈在我们生活中无处不在,了解它能让我们更从容地应对各种情况,做出更明智的选择。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三:优超
1、优超概念 • 如果一个局中人在任何情况下从某种 策略中得到的支付均大于从另一种策略中 得到的支付,那么显然对他而言,前一种 策略优于后一种策略,这就是优超概念的 意义。 • (有严格优势策略和严格劣势策略、弱优 势策略)
三:优超
2、囚徒困境中的优超 在囚徒困境中,对局中人1而言,无论 局中人2采取何种策略,采用“坦白”策略 得到的支付都大于采用“不坦白”策略的 支付。对局中人1来讲,“坦白”策略优超 “不坦白”策略,或者说“不坦白”策略 被优超。从个人利益出发,显然被优超的 策略不应被局中人采用,因此可以利用优 超概念来简化博弈局势,从而获得博弈的 结果(解)。
三:优超
3、囚徒困境的结局 理性的人是不会采用对自己不利的严格劣势 策略的,所以在分析博弈的可能结局时,我们应 该把局中人的严格劣势策略剔除。这样我们就得 到囚徒困境的结局为:双方坦白,各得-6。因 此,我们在分析一个局中人的决策行为是,可以 首先把一个严格劣势策略从该局中人的策略中去 掉,然后在余下的策略范围中,试图再找出这个 局中人或者别的局中人的严格劣势策略,并将它 去掉。不断重复这一过程,直到对每个局中人而 言,再也找不出严格劣势策略为止。
• 在该矩阵中,括号内的第一个数字表示局中人1在对应 策略形成的结局中得到的支付,第二个数字表示局中人 2的相应支付。这种矩阵有时也被称为双支付矩阵,表 中常常省略局中人1和局中人2的标记。缺省的设定是, 局中人1选择行.局中人2选择列。如果有三个局中人, 则局中人3选择矩阵。 • 在不同的博弈论论著中,囚徒困境中的具体数值往往不 一样,情节上也略有差别,但所描述的原理都是一样的, 其中起关键作用的是数值的相对大小而不是数值的绝对 水平。 • 矩阵形式能够很清晰地表示只有两个局中人且每个局中 人可选策略数目不多的博弈局势,有时也用来表示3个 局中人策略有限的局势(列出若干个矩阵)。但它不能表 示局中人可选策略数目无限(或相当多)的情形,也很少 用于4个和更多局中人的情形。在不宜使用矩阵形式表 示的情况下,只能用语言描述或者使用数学公式进行描 述。
•
•
• • •
“完全信息”是指局中人对自己与其他局中 人的所有与博弈有关的事前信息(策略、空间、 支付函数等)有充分的了解。 “静态博弈”是指在博弈实际进行时,每个 局中人的策略选择同时进行而且仅进行一次。 这里的“同时”并不要求时间上的完全一致, 只要 每个局中人在选择策略时不知道其他局中人所 选择的策略即可。我们以下通过一个经典实例 来说明策略型博弈是如何描述博弈局势的。
二:囚徒困境
• 有两个人因为涉嫌一次犯罪而被捕,被警方分别 关在两个房间内审讯,他们面临的形势是:如果 两个人都坦白罪行,那么将各被判处6年有期徒 刑;如果一方坦白另一方不坦白,那么坦白者从 宽,判处1年徒刑,抗拒者从严,判处8年徒刑; 如果两个人均不坦白.则各被判处2年徒刑。
囚徒困境策略型博弈
一:策略型表述
三种基本要素构成了策略型博弈 • 1.局中人: • 2 .策略; • 3 .支付:
• 双人博弈:如果局中人只有两个。则称其为双人博弈
•
• 零和博弈:如果说所有局中人的支付之和在任何情况下均为零的 博弈 • 有限博弈:指博弈的局中人个数与每个局中人的策略数均是有限 的 •
完全信息与静态博弈的理解
完全信息静态博弈
• • • • 教学任务 1、策略型博弈的表达形式 2、如何进行策略型博弈 3、介绍其他策略型
第一节 策略型博弈
• 策略型博弈的定义 在博弈论中抽象出现实博弈中的最基本要 素构成的模型描述就是所谓的策略型,或称标准 型,用这种方式描述的博弈常常称为策略型博弈。 是整个博弈的基石,在此基础上进行博弈分析
严格劣势策略逐次消除法
局中人2
L T 局中人1 1 0 1 C 3 3 R 0
M
0
2
0
1
3
0 3
5
B
0
2
2
4
严格劣势策略逐次消除法
局中人2
L T 局中人1 M 0 1 2 0 0 1 1 C 3
B
0
2
2
4
严格劣势策略逐次消除法
局中人2
L T 局中人1 1 0 1 C 3
B
0
2
2
4
严格劣势策略逐次消除法
第二节 纳什均衡
• 一、纳什均衡的含义
一策略组合中,所有的参与者面临这 样的一种情况:当其他人不改变策略时, 他此时的策略是最好的。也就是说,此时 如果他改变策略,他的支付将会降低。在 纳什均衡点上,每一个理性的参与者都不 会有单独改变策略的冲动。
第二节
• 二、纳什均衡的意义
纳什均衡
1、它是关于博弈结局的一致性预测 如果所有局中人预测一个特定的纳什均衡会出现,那么之中均衡就会出现, 预测之间没有矛盾,不会因为有的局中人认为认为不符合自己的利益而失败。 只有纳什均衡才能使每个局中人均认可这种结局,而且他们均知道其他局中 人也认可这种结局。而非纳什均衡的结局并非一致性预测.如果局中人预测 会出现非纳什均衡,那么或者是局中人的预测相互不统一,或者是局中人在 估计别人的策略选择或极大化自己的支付时犯了错误。纳什均衡最重要的性 质是“自我强制性”,如果局中人就纳什均衡结局达成协议,那么不需要任 何外力的帮助,它自身就蕴含着保障实现的力量。 • 2、任何非纳什均衡的结局要成为协定都需要外在强制力量(道德、法律等)的 帮助,否则有的局中人将会有动机背叛协定。 • 3、纳什均衡的弱点 • 它并不能保证惟一性,存在多个纳什均衡时哪一个会在现实中出现是一 个难以解决的问题。另外,引入其他理性考虑后,有些纳什均衡并不那么合 理。
局中人2
C T 局中人1 1 3
B
2
4
弱优势策略
乙
左 上 4 12 3 中 10 2 右 12
甲
中
0 下
12
2 12
11
1 8
11
13
3
1
2
四:囚徒困境的结果及意义
• 1、对于囚徒困境,可以利用严格劣势策略逐次消除法 (迭代剔除被优超策略)的方法去求得结果。 • 2、囚徒困境反映了一个深刻的问题:个体理性与集体 理性之间的矛盾。个体理性选择的结果并非最优,不符 合集体理性的要求。囚徒陷入了理性的困境。 • 3、当每个人都为各自利益而努力的时候,市场经济体 制可以是资源配置得到最有效率的应用。然而类似囚徒 困境的博弈局势显示,每个人仅仅考虑自己利益要求时 的结果不一定是最优结局,存在使参与者利益都得到改 进的可能性却无法实现。 • 4、囚徒困境为我们理解人类理性提供了强有力的分析 工具。