完全信息静态博弈

合集下载

完全信息静态博弈

完全信息静态博弈

博弈论的发展前景
无论是从社会经济发展的客观要求,还是从经济学理论发展本身的规律来看,博弈论都有很大的发展前途。 1)博弈论本身具有优美深刻的本质魅力,新的分析工具和应用领域的不断发现,以及博弈论价值得到越来越充分 的认识,不断吸引大量学者加入学习、研究和应用博弈论的队伍。这是博弈论继续向前发展的根本基础和保证。 2)在博弈规则的来源、博弈方的行为模式和理性等基础理论方面,博弈论还存在不少没有很好解决的问题,有待 进一步研究和解决。这正是博弈论未来发展的动力。 3)当前合作博弈理论发展相对落后,这个领域有很大的发展潜力,很可能孕育出引发经济学新革命的重大成果。 非合作博弈和合作博弈理论的重新组合也可能给博弈论的发展提出新的方向和课题。
1)决策者考虑短期利益、个人或者小集团利益更多,决策者确实缺乏理智和理性; 2)局部地区或特定时期战争的利益比上述博弈中所假设的要大; 3)其他国家选择战争时还击比不还击损失小,先发制人则更能使自己相对有利;
以上因素都是导致发生战争机会增大的重要原因。
2)风险上策均衡法
风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏爱其中某 一个纳什均衡,则该纳什均衡就是一个“风险上策均衡”。
博弈论在我国经济中的应用
企业经营者的启示:
1)在我国经济体制改革和国有企业管理体制改革中,委托人—代理人理论和激励机制设计原理有很大的应用价 值。如,对“监督困难的委托人—代理人理论”的研究,找到可以调整各方面的利益关系和调动职工和经营者 的积极性和责任心的依据和方法。 2)博弈论领域中“囚徒困境”,“激励悖论”等众多模型和命题为企业经营者揭示了众多经济、经营活动中的 内在规律,企业决策者利用这些工具可以大大提高在价格和产量决策、经济合作和经贸谈判,参与投标拍卖, 处理劳资关系等问题的决策效率。

应用博弈论第二讲完全信息静态博弈

应用博弈论第二讲完全信息静态博弈
生活中其实有很多相关的例子。

生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。

例2
为什么中小企业不会花钱去开发新产品 ?

完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。

生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。

例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。

经济博弈论之完全信息静态博弈培训

经济博弈论之完全信息静态博弈培训

2023
PART 04
完全信息静态博弈的策略 分析
REPORTING
优势策略
优势策略是指参与者在给定信息下, 选择对自己最有利的策略,而不考虑 其他参与者的反应。
优势策略是博弈分析中的重要概念, 它可以帮助参与者找到最优的策略选 择。
在完全信息静态博弈中,如果某个参 与者有一个优势策略,那么无论其他 参与者选择什么策略,该参与者都应 该坚持这个优势策略。
收益
每个参与者在博弈中获得的效用或收益,是衡量参与者利益的标准。
在完全信息静态博弈中,每个参与者的收益函数是共同知识,即所有参与者都知 道其他参与者的收益函数。
纳什均衡
纳什均衡是指在一个博弈中,每个参 与者的最优策略选择在其他参与者最 优策略选择给定的情况下是最优的。
在完全信息静态博弈中,纳什均衡是 所有参与者的最优策略组合,满足每 个参与者的最优策略选择在其他参与 者最优策略选择给定的情况下是最优 的。
2023
PART 02
完全信息静态博弈的基本 概念
REPORTING
参与者
博弈中的决策主体,通常称为局中人 或参与人。
在完全信息静态博弈中,每个参与者 都了解其他参与者的身份及其所有可 能的策略和收益。
策略
参与者在博弈中可以选择的行动方案,是参与者在给定信 息集下的决策变量。
在完全信息静态博弈中,每个参与者的策略空间是共同知 识,即所有参与者都知道其他参与者的所有可能策略。
2023
PART 03
完全信息静态博弈的经典 案例
REPORTING
囚徒困境
总结词
描述两个囚犯因被捕而面临供述与否的决策,揭示个 体理性与集体理性的矛盾。
详细描述
在囚徒困境中,两个囚犯因共同犯罪被捕,并分别被 关押在独立的房间。每个囚犯都有供述和保持沉默两 种选择。如果两个囚犯都保持沉默,则他们都不会受 到严重惩罚;但如果一个囚犯供述,另一个保持沉默 ,则供述者会得到较轻的惩罚,而沉默者会受到更严 厉的惩罚。由于囚犯之间无法进行沟通,他们往往会 基于自身利益而选择供述,从而导致双方都受到较重 的惩罚。

完全信息静态博弈

完全信息静态博弈

一 占优战略均衡
占优战略均衡
定义:在博弈的战略表达式中,如果对于所
有的i,Si*是i的占优战略,下列战略组合称为
占优战略均衡:
s* (s1*, , sn* )
一 占优战略均衡
注意:
✓ 如果所有人都有(严格)占优战略存在,那么 占优战略均衡就是可以预测的唯一均衡。
✓ 占优战略只要求每个参与人是理性的,而不要 求每个参与人知道其他参与人是理性的(也就 是说,不要求理性是共同知识)。为什么?
二 重复剔除的占优均衡
举例: 剔除顺序:R3、C3、C2、R2,战略组合(R1,C1)
C1
R1
2,12
R2
0,12
R3
0,12
C2
1,10 0,10 0,10
C3
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
故一般使用严格劣战略剔除,可以看到,(R1,C3) (R1,C1)都是纳什均衡,但在这里是不可解的。
开发商B 开发 不开发
开发 4000,4000 8000,0
不开发 0,8000
0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的战略式表述
斗鸡博弈
独木桥
进 A
退
B

退
-3,-3 2,0
0,2 0,0
纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
6,2
R2
2,1
R3
3,0
8,4 9,6
3,6 2,8

完全信息静态博弈

完全信息静态博弈

三 纳什均衡
n 纳什均衡与占优战略均衡及重复剔除的占优均 衡:
n (1)每一个占优战略均衡及重复剔除的占优均衡一定 是纳什均衡,但并非每一个纳什均衡都是占优战略均 衡或重复剔除的占优均衡;
n (2)纳什均衡一定是在重复剔除严格劣战略过程中没 有被剔除掉的战略组合,但没有被剔除掉的组合不一 定是纳什均衡,除非它是唯一的(不适用于严格弱劣 战略的情况)
第二章 完全信息静态信息博弈-纳什均衡
n 一 占优战略均衡 n 二 重复剔除的占优均衡 n 三 纳什均衡 n 四 混合战略纳什均衡 n 五 纳什均衡存在性及相关讨论 n 六 纳什均衡应用举例
一 占优战略均衡
n 完全信息静态博弈 ü 完全信息:每个参与人对所有其他参与人的特
征(包括战略空间、支付函数等)完全了解 ü 静态:所有参与人同时选择行动且只选择一次。 ü 同时:只要每个参与人在选择自己的行动时不
四 混合战略纳什均衡
n 社会福利博弈
政府
流浪汉
寻找工作 流浪
2 救济 3,
1 不救济 -1,
3 -1,
0 0,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
猜谜游戏
v两个儿童各 拿一枚硬币,
v若同时正面 朝上或朝下, A给B 1分钱,
v若只有一面 朝上,B给A 1分钱。
零和博弈
博弈参与者有 输有赢,但结 果永远是0。
正面 反面
正面
反面
1 -1,
-1 1,
-1 1,
1 -1,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
n 警察与小偷
1万元
酒馆 东边
小偷
警察
警察与小偷的最优策略各是什么?

第二讲 完全信息静态博弈

第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。


在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法

博弈论 完全信息静态博弈

博弈论 完全信息静态博弈

max u1 max(6q1 q1q2 q12 )
q1
1 q1 R1 (q2 ) (6 q2 ) 2
同样有: 2 max u1 max(6q2 q1q2 q2 )
q2
1 q2 R2 (q1 ) (6 q1 ) 2
2.3.2 反应函数
古诺模型的反应函数
个博弈方的各一个策略组成的某个策略组合 (s1*,…,sn*)中,任
一博弈方 i的策略si*,都是对其余博弈方策略的组合 (s1*,…, si1 *,
si+1* ,…,sn*) 的最佳对策,也即
* * ui ( si* , si*1 , si* , si*1 ,...sn ) ui ( si* , si*1 , sij , si*1 ,...sn )
q2
(0,6)
R1 (q2 )
q1 R1 (q2 ) 1 (6 q2 ) 2 q2 R2 (q1 ) (6 q1 )
1 2
(0,3)
R2 (q1 )
(3,0) (6,0)
q1
古诺模型的反应函数图示


对一个一般的博弈,只要得益是策略的多 元连续函数,我们都可以求每个博弈方针 对其他博弈方策略的最佳反应构成的函数 ,也即反应函数,而解出的各个博弈方反 应函数的交点就是纳什均衡。 这种利用反应函数求博弈的纳什均衡的方 法称为“反应函数法”。
本部分主要内容
2.1 基本分析思路和方法
2.2 纳什均衡
2.3 无限策略博弈分析和反应函数 2.4 混合策略和混合策略纳什均衡
2.5 纳什均衡的存在性
2.6 纳什均衡的选择和分析方法扩展
2.1 基本分析思路和方法
2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法

完全信息静态博弈论模型

完全信息静态博弈论模型

完全信息静态博弈论模型引言:博弈论是研究决策制定者在不同利益冲突场景下的行为和策略选择的数学模型。

在博弈论中,静态博弈是指参与者在同一时间点做出决策的情况。

完全信息表示每个参与者对于其他参与者的行为和策略选择都有完全的了解。

本文将介绍完全信息静态博弈论模型的基本概念、解决方法以及应用领域。

一、基本概念1.1 参与者完全信息静态博弈中,有两个或多个参与者,每个参与者可以是个体、团体或国家等。

参与者通过制定决策来追求自身的利益。

1.2 策略每个参与者在博弈中可以选择的行动方案称为策略。

策略可以是纯策略,即只选择一个确定的行动;也可以是混合策略,即以一定概率选择不同的行动。

1.3 支付函数支付函数是衡量参与者在不同策略组合下所获得效用或利益的函数。

支付函数可以表示为参与者的收益、成本或效用。

1.4 纳什均衡纳什均衡是指在博弈中,每个参与者选择的策略组合使得没有参与者有动机改变自己的策略。

换言之,每个参与者都在给定其他参与者的策略下做出最优的决策。

二、解决方法2.1 支付矩阵为了描述参与者之间的策略选择和支付函数之间的关系,可以使用支付矩阵。

支付矩阵是一个二维矩阵,行表示一个参与者的策略选择,列表示其他参与者的策略选择,每个元素表示对应策略组合下的支付函数。

2.2 最优响应最优响应是指在其他参与者的策略下,参与者能够选择的最优策略。

通过计算每个参与者的最优响应,可以找到纳什均衡。

2.3 前瞻性在完全信息静态博弈中,参与者可以通过推断其他参与者的策略和支付函数来做出决策。

前瞻性是指参与者能够预测其他参与者的行为并做出相应的反应。

三、应用领域完全信息静态博弈论模型广泛应用于经济学、政治学、生物学等领域。

3.1 经济学博弈论在经济学中有广泛应用,如市场竞争、定价策略、拍卖等。

完全信息静态博弈模型可以帮助分析参与者的决策行为,预测市场的走势和结果。

3.2 政治学在政治学中,博弈论可以用于分析选举、政策制定和国际关系等问题。

博弈论_完全信息静态博弈

博弈论_完全信息静态博弈

博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡(Nash Equilibrium) 纳什均衡
纳什均衡、占优均衡、重复剔除严劣策 略均衡的关系
定理a 每一个占优均衡、重复剔除严劣策 略均衡一定是纳什均衡,但反过来不一定 成立; 定理b 纳什均衡一定不能通过重复剔除严 劣策略方法剔除。
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡应用举例: 纳什均衡应用举例:古诺模型
(q1*, q2*)是均衡产量意味着:
q1*∈argmaxπ1(q1, q2*) q2*∈argmaxπ2(q1*, q2) 根据上面两个式子可以得出反应函数(reaction function): q1*=R1(q2) q2*=R2(q1) 两个反应函数的交叉点就是纳什均衡(q1*, q2*), 见图1-9
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡应用举例: 纳什均衡应用举例:古诺模型
1 q 1 = q = (a − c) 3
* * 2
进而可以得出每个企业的纳什均衡产量下 的利润,为
π
*
1

* 2
1 = (a − c)2 9
可以同垄断企业的最优决策类比
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
豪泰林价格竞争模型
古诺模型中,产品是同质的(homogenous); 豪泰林模型中,引入了产品的差异性;
产品的差异性可以有很多体现形式:如品牌、外 观、功能、空间差别(如房地产) 豪泰林模型中,产品的差异通过空间差别来体现 豪泰林模型的主要假设是产品的差异完全是由空 间位置的不同而造成的

完全信息静态博弈实验

完全信息静态博弈实验
己的收益
在实验中,通常会设定每个策略都 有一个相应的收益值,这些收益值 可以是正面的,也可以是负面的。 参与人的目标是在给定其他参与人 策略选择的情况下,选择一个最佳
的策略,以最大化自己的收益
2
实验步骤
设定参与人数和策略 数量
确定每个参与人的策 略选择
分析博弈结果:包括 最佳策略选择、博弈 均衡以及影响因素等
的策略来增加自己的收益
除了得出最优策略组合外,实验结果还 可以分析不同因素对博弈结果的影响。 例如,参与人的风险偏好、信息不完全 程度、时间限制等因素都可能对博弈结
果产生影响
4
完全信息静态博弈实验是一种经 典的博弈模型,常用于分析策略 选择和决策行为。通过实验可以 得出最优策略组合以及不同因素 对博弈结果的影响。在实际应用 中,完全信息静态博弈也可以用 于研究各种不同领域的问题,例 如经济学、政治学、社会学等。 通过分析不同因素对博弈结果的 影响,可以更好地理解各种问题 的本质和规律,为决策提供参考
完全信息静态博弈实验还可以用 于研究人类的决策行为和心理。 例如,通过实验可以观察到人们 在面对风险和不确定性时的决策 偏好和行为特点。此外,完全信 息静态博弈实验还可以用于研究 人类的合作和竞争行为,以及如 何通过合作和竞争来实现共赢
结论
-
XXXX
感谢观看
汇报人:xxxx
时间:20XX.XX.XX
-
完全信息静态博弈实验
完全信息静态博弈实验
67 LOREM
完全信息静态博弈是一种经典的博弈 模型,其特点是参与人在进行决策时, 对于其他参与人的策略选择和收益情 况都有完全的了解。这种博弈模型常 用于分析策略选择和决策行为,以及
研究不同因素对博弈结果的影响

博弈论四种类型之完全信息静态博弈

博弈论四种类型之完全信息静态博弈

博弈论四种类型之完全信息静态博弈决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。

完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。

⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。

在完全信息静态博弈中的均衡是纳什均衡。

最典型的例⼦是囚徒困境与智猪博弈。

下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。

【囚徒困境】中基于收益矩阵的模型描述如下:【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。

⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。

离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。

对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。

【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。

所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。

但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。

个⼈的最优选择从社会⾓度看并不是最优的。

社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。

【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚(第三⽅实施),会使两⼈合作,促进集体利益最⾼。

【智猪博弈】智猪博弈的收益矩阵模型如下:在此处,⼩猪有优势与劣势策略,但⼤猪没有,只能根据⼩猪的策略做出最佳应对,⽽⼩猪不会选择劣势策略,因此剔除⼩猪“按”的策略,此时,⼤猪的策略只能为“等”。

【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略,参与⼈选择策略A时的收益严格⼩于策略B时的收益。

经济博弈论完全信息静态博弈

经济博弈论完全信息静态博弈

19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。

博弈的四种基本类型

博弈的四种基本类型

博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。

例如,囚徒困境。

2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。

例如,斯坦科尔伯格寡头竞争。

3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。

例如,性别战博弈。

4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。

例如,信号传递博弈。

每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。

例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。

完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。

例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。

不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。

例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。

不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。

例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。

博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。

举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。

你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。

二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。

举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。

经济博弈论02完全信息静态博弈(Park)

经济博弈论02完全信息静态博弈(Park)

合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。

完全信息静态博弈及其纳什均衡解

完全信息静态博弈及其纳什均衡解

第三章完全信息静态博弈及其纳什均衡解1. 完全信息静态博弈定义 3.1.完全信息静态博弈。

完全信息静态是指,博弈中的参与人同时采取行动,或者尽管参与人行动的采取有先后顺序,但后行动的人在行动时不知道先采取行动的人采取的是什么行动;同时博弈参与人的策略空间及策略组合下的支付是博弈中所有参与人的“公共知识”。

两个特点:(1)静态;(2)完全信息。

完全信息静态博弈例子。

例1:锤子-剪刀-布例2:交通行驶非“完全信息静态博弈”例子:英式拍卖——动态博弈;第一密封价格及第二密封价格拍卖——不完全信息博弈。

2. 纳什均衡及其判定定义3.2 纳什均衡。

在一个n人博弈的标准式G={S1,S2,…,Sn;u1,u2,…,un}中,一个策略组合{s1*,s2*,…,sn*},若满足ui(s1*,…,si*,…sn*)≥ui(s1*,…si,…,sn*)(i=1…n),则称这个策略组合为{s1*,s2*,…,sn*}为该博弈G的一个纳什均衡。

某策略组合是纳什均衡指的是,在该策略组合上任何一个参与人的收益在其他人策略不改变的情况下都至少是弱优的。

特点:(1)每个人没有单独改变策略的动机;(2)局部最优。

纳什均衡判定方法:用定义来判定:某点是均衡看它是否符合纳什均衡的定义。

求解纳什均衡的方法:(1)剔除严格被占优策略。

例3:囚徒困境甲不合作合作乙不合作2,2 1,4 合作4,1 3,3缺点:只有当仅有一个纯策略均衡点的时候,该方法才是有效的。

(2)用定义来求解(3)对于策略空间为连续的博弈,用求极值的方法来求得。

3. 纳什均衡存在定理:(纳什)定理3.1.在一个n人博弈的标准式G={S1,S2,…,Sn; u1,u2,…,un}中,如果n是有限的,且对每个i, Si是有限的,则博弈至少存在一个纳什均衡。

这里的均衡可能包含混合策略均衡。

证明:略例子3:囚徒困境的均衡例1:“锤子-剪刀-布”的均衡?4. 混合策略与混合策略的均衡纯策略与混合策略概念。

完全信息静态博弈实验的启示和感悟

完全信息静态博弈实验的启示和感悟

完全信息静态博弈实验的启示和感悟?答:完全信息静态博弈实验是一种研究决策制定和策略互动的重要工具。

在这个实验中,参与者需要在完全了解所有其他参与者的可能行动和收益的情况下,做出自己的决策。

这种类型的实验为我们提供了许多深刻的启示和感悟。

首先,完全信息静态博弈实验强调了信息在决策制定中的重要性。

在现实生活中,我们经常面临信息不对称的情况,这使得决策制定变得复杂和困难。

然而,在完全信息静态博弈中,所有参与者都拥有相同的信息,这使得我们能够更好地理解信息对决策的影响。

这启示我们在做决策时要尽可能地收集和了解相关信息,以减少信息不对称带来的风险。

其次,该实验揭示了策略互动的本质。

在博弈中,每个参与者的决策都会影响到其他参与者的收益,因此参与者需要考虑其他参与者的可能行动来制定自己的策略。

这使我们意识到在现实生活中,我们的决策也往往会受到他人的影响。

我们需要学会预测他人的行为,并据此调整自己的策略,以达到更好的结果。

此外,完全信息静态博弈实验还让我们认识到合作与竞争的关系。

在博弈中,有时通过合作可以实现双赢,但有时竞争也是不可避免的。

这启示我们在现实生活中要灵活地运用合作与竞争的策略,根据具体情况做出选择。

同时,我们也需要学会在竞争中寻找合作的可能性,以实现共赢。

最后,该实验提醒我们要保持理性思考。

在博弈中,情绪化的决策往往会导致不利的结果。

我们需要学会在面对复杂情况时保持冷静,运用逻辑和理性来分析问题并制定策略。

这不仅有助于我们在博弈中取得更好的成绩,也有助于我们在现实生活中应对各种挑战。

总之,完全信息静态博弈实验为我们提供了许多宝贵的启示和感悟。

通过参与这类实验,我们可以更好地理解决策制定、策略互动、合作与竞争以及理性思考等方面的问题,从而提升我们的决策能力和应对复杂情况的能力。

第2章_完全信息静态博弈

第2章_完全信息静态博弈
* q2 R2 ( q1 )
2.3.1 古诺的寡头模型
反应函数:是指每个博弈方针对其他博弈方所有战略的最佳反应构成 的函数。 纳什均衡就是各个博弈方的一组互为最佳反应对策的战略。
2.1.1 占优战略均衡(上策均衡)
开发商B 需求大的情况 开发商A 不开发 开发 开发 4000,4000 0,8000 不开发 8000,0 0,0 开发商B B严格劣 战略
A严格劣 战略
需求小的情况
开发
开发 开发商A 不开发 0,1000 -3000,-3000
不开发
1000,0 0,0
2.1.1 占优战略均衡(上策均衡)
-8, -8 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
-1, 1 1, -1
1, -1 -1, 1
2.1.4 箭头法
基本思路
对博弈中每个策略组合进行分析,考察在每个策略组合
处各个博弈方能否通过单独改变自己的策略而增加得益。
如能,则从所分析的策略组合对应的得益数组引一箭头, 到改变策略后策略组合对应的得益数组。最后综合分析 对每个策略组合的分析情况,形成对博弈结构的判断。
有任何人有积极性破坏这个协议,则这个协议是自动
实施的。这个协议就构成了一个纳什均衡。
2.2 纳什均衡
通俗地说,纳什均衡的含义就是:
给定你的策略,我的策略是最好的策略;给定我的策略,
你的策略也是你的最好的策略。即双方在给定的策略下
不愿意调整自己的策略。
2.2 纳什均衡
寻找纳什均衡
参与人B
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)

完全信息静态博弈名词解释

完全信息静态博弈名词解释

完全信息静态博弈名词解释
嘿,你知道啥是完全信息静态博弈不?咱就说啊,这就好像是一场
棋局!每个人都清楚地知道所有的规则和局面(就像你清楚棋盘上每
个棋子的位置和走法一样)。

在完全信息静态博弈里,大家都在同一时间做决定(可不是像接力
赛那样一个接一个哦),而且对彼此的情况都了解得透透的。

比如说,两个人下棋,谁都知道对方有啥子棋,该咋走。

想象一下,你和朋友玩猜硬币正反面的游戏,这就是个简单的完全
信息静态博弈例子呀!你知道硬币就只有正反两面,你朋友也知道,
而且你们同时猜(可不是你先猜完了他再猜)。

再比如商场上的竞争,两家公司都清楚市场的情况、对方的实力,
然后同时决定自己的策略,这也是完全信息静态博弈。

这可不是闹着
玩的,一个决策失误,可能就满盘皆输啦!
咱回过头来想想,生活中好多场景不都像是一场完全信息静态博弈嘛!像买东西讨价还价,你知道商品大概值多少钱,老板也知道,然
后你们就开始“博弈”啦,看谁能争取到更有利的价格。

完全信息静态博弈就是这么个有趣又重要的概念,它让我们能更好
地理解人与人、企业与企业之间的互动和竞争。

它就像一个神奇的钥匙,能打开我们理解复杂社会现象的大门。

所以啊,可别小瞧了它,
它的用处大着呢!
我的观点就是:完全信息静态博弈在我们生活中无处不在,了解它能让我们更从容地应对各种情况,做出更明智的选择。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。

R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)

F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。
参加者 策略 Player 1 坦白 抵赖
Player 2 坦白 -8, -8 -10, 0 抵赖 0, -10 -1, -1
• 囚徒困境博弈表明什么道理? • 个人理性的决策一定能够得到好的结果吗?
最优反应函数的图形
• (2) 伯川德模型 • 两家寡头生产完全同质的产品。
• 同时设定价格pi (i = 1; 2) ,生产的边际成本 为常数c。
• 市场需求函数为q = D(p) ,消费者总是购买 价格较低的产品。
• 两家企业的需求如下:
• 纳什均衡是什么?
• 唯一的纳什均衡是: • (p1*; p2*) = (c; c).
四、博弈的求解
• • • • 我们会讲解三种博弈的求解方法,分别是: (1)占优策略均衡法(特殊); (2)重复剔除劣策略法(特殊); (3)最优反应函数法(一般),又经常被 称为“划线法”。
• (一)占优策略方法 • 什么是占优策略(dominant strategy)? • 指的是无论其他人选择什么策略,居中人 的策略si的收益总是大于其他策略的收益。
• 课堂实验: • 你会选择什么策略? • 有多少人选 A?
• 分析: • 1. 有两个纳什均衡:(A,A) 、 (B,B)。 A 帕累托优于B。
• 2. 然而,现实中,人们更多选择B。因为选 A风险较高。
• Harsanyi-Selten 提出了风险占优的概念。
• 假设选A和B的概率各位0.5,可以看出此时 选B更合理。
• 练习: • 求解纳什均衡。
ห้องสมุดไป่ตู้
进一步练习纳什均衡的求解
一个不严格纳什均衡的例子
L T B 1, 1 1, 0 M 1, 0 0, 1 R 0, 1 1, 0
不同均衡概念 的关系
占优均衡
DSE 重复剔除劣策略均衡 IEDE 纯策略纳什均衡 PNE
五、策略连续的情形
• 1. 古诺模型 • 2. 伯川德模型
第2章 完全信息静态博弈
一、完全信息静态博弈的含义
• (一)什么是完全信息(complete information)? • 每个博弈的参加者都了解彼此的特征 (characteristics)。
• (二)什么是静态博弈?
• 在博弈中,每个局中人只行动一次,且所 有的局中人同时行动。 • 你能想出符合上述定义的例子吗?
• • • • • • •
囚徒困境的例子: (1)公地的悲剧; (2)价格战; (3)军备竞赛; (4)小车 vs.SUV; (5)合作中的偷懒行为; „„
• 练习: • 猎鹿博弈。两个猎人合作可以抓住一只鹿, 但如果一个人去抓鹿,则无法捕获;然而, 一个人就可以独自抓住一只野兔。 • 假设一只鹿的总收益为10,一只兔子的收 益为3。 • 请画出此博弈的策略式矩阵。
• 注:penny是一便士或一分钱的意思。
• The players then reveal their choices simultaneously. • If the pennies match (both heads or both tails) Player A keeps both pennies, so wins one from Player B (+1 for A, −1 for B).
• 如下都是纳什均衡:(A; A;A), (B;B;B), (C;C;C),(A;B;A), (A;C;C).
• 纽约博弈的两个结果无所谓优劣,两个参 加者是完全协作的关系。
• Schelling (1961) 提出了多重均衡中的聚点 (focal point),也就是更容易出现的均衡 结果。
• 对于每个博弈的结果而言,局中人都得到 了对应的收益(payoff)。
• 一个例子:Match pennies game的策略式 矩阵:
Bob
Head 1, -1 -1, 1
Adam
Head
Tail -1, 1
1, -1
Tail
三、几类经典的模型
• 1. 零和博弈(Zero-sum Game) • 在所有的博弈结果中,局中人的收益之和 恒等于0。
• A的期望收益为-3,而选B的期望收益为 7.5。B风险占优于A。
七、混合策略纳什均衡
• 社会福利博弈
流浪汉 寻找工作 政府 救济 不救济 没有一个策略组合构成纳什均衡 3, 2 -1,1 0, 0 流浪 -1,3
猜谜游戏
两个儿童各 拿一枚硬币, 若同时正面 朝上或朝下, A给B 1分钱, 若只有一面 朝上,B给A 1分钱。 正面 正面 反面

• 思考:中国的猜硬币游戏和国外的match pennies 有什么异同之处?
二、策略式矩阵
• 如何表示完全信息静态博弈? • 一个基本的工具就是策略式矩阵 (stategic matrix),实际上是一个表格。 • 用表格的行和列分别表示两个局中人的策 略(strategies); • 每一个空格代表博弈的一个结果 (outcome),或称为策略组合(strategy profile);
• 例如:猜硬币游戏 • 游戏规则:首先,一个人盖住硬币,然后, 另外一个人猜被盖住的硬币是正面还是反 面朝上。 • 属于静态博弈:(1)两个人都只行动一次; • (2)盖硬币的人选正面还是反面,猜的人 看不到。
• 国外的硬币游戏:Match pennies. • The game is played between two players, Player A and Player B. Each player has a penny and must secretly turn the penny to heads or tails.
• 纳什均衡(Nash Equilibrium):对任意一 个局中人而言,当其他人的策略给定时, 他当前所选的策略使其收益达到最大,通 过改变策略,无法使收益进一步增加。
* * ui (si* , s ) u ( s , s i i i i )
• 严格纳什均衡:
ui (s , s ) ui (si , s )
• 夫妻之争博弈的特点:当事人之间既有合 作又有冲突。
• 3. 鹰鸽博弈(Hawk-dove Game) • 鹰:强硬 • 鸽:温和
• 4. 囚徒困境(Prisoners’ Dilemma) • 两个嫌疑犯被分开审讯,他们各有两个选 择,坦白或者不坦白。 • 有四种结果: • (1)双方都不坦白,因证据较少,各判1 年徒刑; • (2)双方都坦白,证据充分,各判8年徒 刑;
* i * i * i
• 纳什均衡和最优反应函数有什么关系? • 根据互为最优反应的结果,能够找到纳什 均衡。 • 接下来,仍以囚徒困境为例,使用最优反 应函数法进行求解。
参加者 策略 Player 1 坦白 抵赖
Player 2 坦白 -8, -8 -10, 0 抵赖 0, -10 -1, -1

If the pennies do not match (one heads and one tails) Player B keeps both pennies, so receives one from Player A (−1 for A, +1 for B).
This is an example of a zero-sum game, where one player's gain is exactly equal to the other player's loss.
• 零和博弈的内涵: • 代表着当事人之间无可调和的利益冲突。
• 零和博弈的实例:财产分割、职位竞争、 赌博,etc.
• 2. 夫妻之争(Battle of Sexes) • 故事情节: • 夫妻二人决定如何度周末,各有两个选择: 看足球比赛或者看戏剧。 • 两人希望一起度周末,但男方偏爱看足球 比赛,而女方偏爱看戏剧。
• 占优策略的例子,囚徒困境中有没有占优 策略?
参加者 策略 Player 1 坦白 抵赖
Player 2 坦白 -8, -8 -10, 0 抵赖 0, -10 -1, -1
相关文档
最新文档