完全信息静态博弈

合集下载

完全信息静态博弈

完全信息静态博弈

博弈论的发展前景
无论是从社会经济发展的客观要求,还是从经济学理论发展本身的规律来看,博弈论都有很大的发展前途。 1)博弈论本身具有优美深刻的本质魅力,新的分析工具和应用领域的不断发现,以及博弈论价值得到越来越充分 的认识,不断吸引大量学者加入学习、研究和应用博弈论的队伍。这是博弈论继续向前发展的根本基础和保证。 2)在博弈规则的来源、博弈方的行为模式和理性等基础理论方面,博弈论还存在不少没有很好解决的问题,有待 进一步研究和解决。这正是博弈论未来发展的动力。 3)当前合作博弈理论发展相对落后,这个领域有很大的发展潜力,很可能孕育出引发经济学新革命的重大成果。 非合作博弈和合作博弈理论的重新组合也可能给博弈论的发展提出新的方向和课题。
1)决策者考虑短期利益、个人或者小集团利益更多,决策者确实缺乏理智和理性; 2)局部地区或特定时期战争的利益比上述博弈中所假设的要大; 3)其他国家选择战争时还击比不还击损失小,先发制人则更能使自己相对有利;
以上因素都是导致发生战争机会增大的重要原因。
2)风险上策均衡法
风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏爱其中某 一个纳什均衡,则该纳什均衡就是一个“风险上策均衡”。
博弈论在我国经济中的应用
企业经营者的启示:
1)在我国经济体制改革和国有企业管理体制改革中,委托人—代理人理论和激励机制设计原理有很大的应用价 值。如,对“监督困难的委托人—代理人理论”的研究,找到可以调整各方面的利益关系和调动职工和经营者 的积极性和责任心的依据和方法。 2)博弈论领域中“囚徒困境”,“激励悖论”等众多模型和命题为企业经营者揭示了众多经济、经营活动中的 内在规律,企业决策者利用这些工具可以大大提高在价格和产量决策、经济合作和经贸谈判,参与投标拍卖, 处理劳资关系等问题的决策效率。

完全信息静态博弈及其纳什均衡解

完全信息静态博弈及其纳什均衡解

第三章完全信息静态博弈及其纳什均衡解1.完全信息静态博弈定义 3.1.完全信息静态博弈。

完全信息静态是指,博弈中的参与人同时采取行动,或者尽管参与人行动的采取有先后顺序,但后行动的人在行动时不知道先采取行动的人采取的是什么行动;同时博弈参与人的策略空间及策略组合下的支付是博弈中所有参与人的“公共知识”。

两个特点:(1)静态;(2)完全信息。

完全信息静态博弈例子。

例1:锤子-剪刀-布例2:交通行驶非“完全信息静态博弈”例子:英式拍卖——动态博弈;第一密封价格及第二密封价格拍卖——不完全信息博弈。

2.纳什均衡及其判定定义3.2 纳什均衡。

在一个n人博弈的标准式G={S1,S2,…,S n; u1,u2,…,u n}中,一个策略组合{s1*,s2*,…,s n*},若满足u i(s1*,…,s i*,…s n*)≥u i(s1*,…s i,…,s n*)(i=1…n),则称这个策略组合为{s1*,s2*,…,s n*}为该博弈G的一个纳什均衡。

某策略组合是纳什均衡指的是,在该策略组合上任何一个参与人的收益在其他人策略不改变的情况下都至少是弱优的。

特点:(1)每个人没有单独改变策略的动机;(2)局部最优。

纳什均衡判定方法:用定义来判定:某点是均衡看它是否符合纳什均衡的定义。

求解纳什均衡的方法:(2)用定义来求解(3)对于策略空间为连续的博弈,用求极值的方法来求得。

3.纳什均衡存在定理:(纳什)定理3.1.在一个n人博弈的标准式G={S1,S2,…,S n; u1,u2,…,u n}中,如果n是有限的,且对每个i, S i是有限的,则博弈至少存在一个纳什均衡。

这里的均衡可能包含混合策略均衡。

证明:略例子3:囚徒困境的均衡例1:“锤子-剪刀-布”的均衡?4.混合策略与混合策略的均衡纯策略与混合策略概念。

定义.3.3.一个策略是纯策略指的是参与人策略空间中的某个确定策略;而一个混合策略是参与人策略空间上的一个概率分布,一般地,某个人i的策略空间为{s i1,s i2,…,s ik},则参与人i在策略空间上的一个概率分布p i=(p i1,p i2,…,p ik)构成他的一个混合策略,其中p i1+p i2+…+p ik=1。

应用博弈论第二讲完全信息静态博弈

应用博弈论第二讲完全信息静态博弈
生活中其实有很多相关的例子。

生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。

例2
为什么中小企业不会花钱去开发新产品 ?

完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。

生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。

例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。

完全信息静态博弈

完全信息静态博弈

一 占优战略均衡
占优战略均衡
定义:在博弈的战略表达式中,如果对于所
有的i,Si*是i的占优战略,下列战略组合称为
占优战略均衡:
s* (s1*, , sn* )
一 占优战略均衡
注意:
✓ 如果所有人都有(严格)占优战略存在,那么 占优战略均衡就是可以预测的唯一均衡。
✓ 占优战略只要求每个参与人是理性的,而不要 求每个参与人知道其他参与人是理性的(也就 是说,不要求理性是共同知识)。为什么?
二 重复剔除的占优均衡
举例: 剔除顺序:R3、C3、C2、R2,战略组合(R1,C1)
C1
R1
2,12
R2
0,12
R3
0,12
C2
1,10 0,10 0,10
C3
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
故一般使用严格劣战略剔除,可以看到,(R1,C3) (R1,C1)都是纳什均衡,但在这里是不可解的。
开发商B 开发 不开发
开发 4000,4000 8000,0
不开发 0,8000
0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的战略式表述
斗鸡博弈
独木桥
进 A
退
B

退
-3,-3 2,0
0,2 0,0
纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
6,2
R2
2,1
R3
3,0
8,4 9,6
3,6 2,8

完全信息静态博弈

完全信息静态博弈

三 纳什均衡
n 纳什均衡与占优战略均衡及重复剔除的占优均 衡:
n (1)每一个占优战略均衡及重复剔除的占优均衡一定 是纳什均衡,但并非每一个纳什均衡都是占优战略均 衡或重复剔除的占优均衡;
n (2)纳什均衡一定是在重复剔除严格劣战略过程中没 有被剔除掉的战略组合,但没有被剔除掉的组合不一 定是纳什均衡,除非它是唯一的(不适用于严格弱劣 战略的情况)
第二章 完全信息静态信息博弈-纳什均衡
n 一 占优战略均衡 n 二 重复剔除的占优均衡 n 三 纳什均衡 n 四 混合战略纳什均衡 n 五 纳什均衡存在性及相关讨论 n 六 纳什均衡应用举例
一 占优战略均衡
n 完全信息静态博弈 ü 完全信息:每个参与人对所有其他参与人的特
征(包括战略空间、支付函数等)完全了解 ü 静态:所有参与人同时选择行动且只选择一次。 ü 同时:只要每个参与人在选择自己的行动时不
四 混合战略纳什均衡
n 社会福利博弈
政府
流浪汉
寻找工作 流浪
2 救济 3,
1 不救济 -1,
3 -1,
0 0,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
猜谜游戏
v两个儿童各 拿一枚硬币,
v若同时正面 朝上或朝下, A给B 1分钱,
v若只有一面 朝上,B给A 1分钱。
零和博弈
博弈参与者有 输有赢,但结 果永远是0。
正面 反面
正面
反面
1 -1,
-1 1,
-1 1,
1 -1,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
n 警察与小偷
1万元
酒馆 东边
小偷
警察
警察与小偷的最优策略各是什么?

第二讲 完全信息静态博弈

第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。


在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法

第2章_完全信息静态博弈

第2章_完全信息静态博弈

2. “斗鸡博弈” 斗鸡博弈”
甲、乙两人相对而行,试图通过一座独木桥。 乙两人相对而行,试图通过一座独木桥。 独木桥仅能容纳一人通行。 独木桥仅能容纳一人通行。 如果两人坚持继续前行, 如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄 的独木桥,两人都会掉到河里, 的独木桥,两人都会掉到河里,均得到收益 -10。 。 如果甲选择退让,让乙先行, 如果甲选择退让,让乙先行,那么得意的乙将得到收益 20, , 面子受损的甲 得到收益 -2。 。 如果乙选择退让,让甲先行, 如果乙选择退让,让甲先行,那么得意的甲将得到收益 20, , 面子受损的乙得到收益 -2。 。 如果甲和乙均选择退让, 如果甲和乙均选择退让,那么双方均得到收益 10。 。
2.智猪博弈 .
猪栏里养了两头猪,一头大猪、一头小猪。 猪栏里养了两头猪,一头大猪、一头小猪。 在猪圈的一端有一个盛食槽。 在猪圈的一端有一个盛食槽。 在猪圈的另一端有一个按压式开关。 在猪圈的另一端有一个按压式开关。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 大猪和小猪都在思考是否去按压开关。 大猪和小猪都在思考是否去按压开关。
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第二章
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
2.通过“划横线法”求解“智猪博弈”的均衡 .通过“划横线法”求解“智猪博弈”
小猪 按开关 按开关 大猪 等待 (10,-2) , ) (0,0) , ) (5,-1) , ) 等待 (4,2) , )

完全信息静态博弈

完全信息静态博弈

• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。

R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)

F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。

1 完全信息静态博弈

1  完全信息静态博弈

1.4.3委托-代理关系中被设计的囚徒困境


囚徒困境对于人们来说是糟糕的,是应当竭力避免的? 在一些委托-代理关系中,故意创造出代理人之间的囚徒困 境有时对委托人有好处。这样的囚徒困境对于效率来说是 一种促进。 委托-代理关系:通常的含义是委托人请代理人代理某件事 情。其中的关键问题是二者利益不一致,并且委托人与代 理人之间存在信息不对称。为此,需要设计一种制度 (system)或机制(mechanism) ,使代理人在追求自己利益的 同时也最大化委托人的利益,如何设计这样的制度就是信 息经济学研究的问题。
1 完全信息静态博弈



博弈论的基本概念及战略式表述 纳什均衡 纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性与多重性
1.1 博弈论基本概念I
参与人:博弈中的决策主体,i=1,2,·,n · · 虚拟参与人:自然N,表示博弈面临的环境或外生 条件。 行动:ai表示第i个参与人的一个特定行动 Ai={ai}表示可供i选择的所有行动的集合。如, {坦白,抵赖}。 n人博弈中,n个参与人行动的有 序集a称为“行动组合”。如(坦白,坦白), (坦白,抵赖),(抵赖,坦白),(抵赖,抵 赖) 信息:参与人有关博弈的知识,特别是关于“自
供应商 B 8.5 10 供应商 A 8.5 10 125,125 0,250 250,0 200,200
1.5 重复剔除的占优均衡
智猪博弈(Boxed Pigs) : 一头大猪和一只小猪生活在同一猪圈里,共用一食槽。食槽的 一端有一个开关,猪用嘴一拱,食槽的另一端会掉下包子。假 定按一下会掉下10个包子,而跑去按开关的猪会耗费2个包子 的能量。如果小猪按开关,大猪先吃,等小猪按完跑过来时, 大猪会吃掉8个包子,小猪只能吃到2个;如果大猪先按开关, 按完后跑过来,小猪会吃掉4个包子,大猪可以吃到6个;如果 都不去按开关,就会被一起饿死。 小猪 战略式描述 按 等 按 6,0 4,4 大猪 10,-2 0,0 等

完全信息静态博弈教学课件

完全信息静态博弈教学课件

完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。

博弈论 完全信息静态博弈

博弈论 完全信息静态博弈

max u1 max(6q1 q1q2 q12 )
q1
1 q1 R1 (q2 ) (6 q2 ) 2
同样有: 2 max u1 max(6q2 q1q2 q2 )
q2
1 q2 R2 (q1 ) (6 q1 ) 2
2.3.2 反应函数
古诺模型的反应函数
个博弈方的各一个策略组成的某个策略组合 (s1*,…,sn*)中,任
一博弈方 i的策略si*,都是对其余博弈方策略的组合 (s1*,…, si1 *,
si+1* ,…,sn*) 的最佳对策,也即
* * ui ( si* , si*1 , si* , si*1 ,...sn ) ui ( si* , si*1 , sij , si*1 ,...sn )
q2
(0,6)
R1 (q2 )
q1 R1 (q2 ) 1 (6 q2 ) 2 q2 R2 (q1 ) (6 q1 )
1 2
(0,3)
R2 (q1 )
(3,0) (6,0)
q1
古诺模型的反应函数图示


对一个一般的博弈,只要得益是策略的多 元连续函数,我们都可以求每个博弈方针 对其他博弈方策略的最佳反应构成的函数 ,也即反应函数,而解出的各个博弈方反 应函数的交点就是纳什均衡。 这种利用反应函数求博弈的纳什均衡的方 法称为“反应函数法”。
本部分主要内容
2.1 基本分析思路和方法
2.2 纳什均衡
2.3 无限策略博弈分析和反应函数 2.4 混合策略和混合策略纳什均衡
2.5 纳什均衡的存在性
2.6 纳什均衡的选择和分析方法扩展
2.1 基本分析思路和方法
2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法

完全信息静态博弈论模型

完全信息静态博弈论模型

完全信息静态博弈论模型引言:博弈论是研究决策制定者在不同利益冲突场景下的行为和策略选择的数学模型。

在博弈论中,静态博弈是指参与者在同一时间点做出决策的情况。

完全信息表示每个参与者对于其他参与者的行为和策略选择都有完全的了解。

本文将介绍完全信息静态博弈论模型的基本概念、解决方法以及应用领域。

一、基本概念1.1 参与者完全信息静态博弈中,有两个或多个参与者,每个参与者可以是个体、团体或国家等。

参与者通过制定决策来追求自身的利益。

1.2 策略每个参与者在博弈中可以选择的行动方案称为策略。

策略可以是纯策略,即只选择一个确定的行动;也可以是混合策略,即以一定概率选择不同的行动。

1.3 支付函数支付函数是衡量参与者在不同策略组合下所获得效用或利益的函数。

支付函数可以表示为参与者的收益、成本或效用。

1.4 纳什均衡纳什均衡是指在博弈中,每个参与者选择的策略组合使得没有参与者有动机改变自己的策略。

换言之,每个参与者都在给定其他参与者的策略下做出最优的决策。

二、解决方法2.1 支付矩阵为了描述参与者之间的策略选择和支付函数之间的关系,可以使用支付矩阵。

支付矩阵是一个二维矩阵,行表示一个参与者的策略选择,列表示其他参与者的策略选择,每个元素表示对应策略组合下的支付函数。

2.2 最优响应最优响应是指在其他参与者的策略下,参与者能够选择的最优策略。

通过计算每个参与者的最优响应,可以找到纳什均衡。

2.3 前瞻性在完全信息静态博弈中,参与者可以通过推断其他参与者的策略和支付函数来做出决策。

前瞻性是指参与者能够预测其他参与者的行为并做出相应的反应。

三、应用领域完全信息静态博弈论模型广泛应用于经济学、政治学、生物学等领域。

3.1 经济学博弈论在经济学中有广泛应用,如市场竞争、定价策略、拍卖等。

完全信息静态博弈模型可以帮助分析参与者的决策行为,预测市场的走势和结果。

3.2 政治学在政治学中,博弈论可以用于分析选举、政策制定和国际关系等问题。

博弈论_完全信息静态博弈

博弈论_完全信息静态博弈

博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡(Nash Equilibrium) 纳什均衡
纳什均衡、占优均衡、重复剔除严劣策 略均衡的关系
定理a 每一个占优均衡、重复剔除严劣策 略均衡一定是纳什均衡,但反过来不一定 成立; 定理b 纳什均衡一定不能通过重复剔除严 劣策略方法剔除。
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡应用举例: 纳什均衡应用举例:古诺模型
(q1*, q2*)是均衡产量意味着:
q1*∈argmaxπ1(q1, q2*) q2*∈argmaxπ2(q1*, q2) 根据上面两个式子可以得出反应函数(reaction function): q1*=R1(q2) q2*=R2(q1) 两个反应函数的交叉点就是纳什均衡(q1*, q2*), 见图1-9
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡应用举例: 纳什均衡应用举例:古诺模型
1 q 1 = q = (a − c) 3
* * 2
进而可以得出每个企业的纳什均衡产量下 的利润,为
π
*
1

* 2
1 = (a − c)2 9
可以同垄断企业的最优决策类比
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
豪泰林价格竞争模型
古诺模型中,产品是同质的(homogenous); 豪泰林模型中,引入了产品的差异性;
产品的差异性可以有很多体现形式:如品牌、外 观、功能、空间差别(如房地产) 豪泰林模型中,产品的差异通过空间差别来体现 豪泰林模型的主要假设是产品的差异完全是由空 间位置的不同而造成的

经济博弈论完全信息静态博弈

经济博弈论完全信息静态博弈

19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。

第一章完全信息静态博弈

第一章完全信息静态博弈
参与人B 合作 合作 参与人A 不合作 r, r t, s 不合作 s, t p, p
二人对称矩阵博弈小结
参与人B
合作 不合作 s, t p, p
参与 人A
合作 不合作
r, r t, s
• • • •
囚徒困境博弈: t>r>p>s 胆小鬼博弈: t>s>(=,<)r>p 求同存异博弈: t>s>p>r 共同投资问题: r>p=(>)t> s
(4)共同投资(打猎)问题
• 当参与者共同投资大项目时将获得更高
的收益,但当另一方玩花样而投资于小 项目时,大项目投资者将被套 。 B
联合 单独
0,1
A
联合
2,2
单独
1,0
1 ,1
在该博弈中,双方都投资于小项目是风 险占优均衡 。
启 示
• 该类博弈与求同存异有相似之处,双方有
共同的利益,差异在于求同的两种结果中 ,一种是风险占优的,一种是帕累托占优 的。 • 考试作弊问题
理性经济人 行为互动假设 决策及其均衡问题
一、双人策略型博弈的经典例子
• 双人博弈又可分为:
对称博弈:博弈参与者是无差异的 非对称博弈:局中人地位不一样,因而 策略选择不一样,支付也不同 • 以下考查二人二种策略博弈问题。 二种策略是指将局中人的策略抽象为合 作(投对方所好)和非合作两种类型。
1、二人对称博弈
囚徒困境
• 博弈中的(坦白,坦白)是双方的占优策
略均衡。 囚徒B 抵赖 抵赖 囚徒A 坦白 -1,-1 0,-10 坦白 -10, 0 -8,-8
智猪博弈
小猪 按 按 大猪 等待 5,1 9,-1 等待 4,4 0,0
•对小猪而言,等待是其占优策略;大猪没有 占优策略。 •大猪理性的,知道小猪将选择等待而不会选 择按,在小猪选择等待时,对大猪而言按是 其占优策略。

完全信息静态博弈例题

完全信息静态博弈例题

完全信息静态博弈例题完全信息静态博弈是博弈论中的一个重要概念,指的是参与者在博弈开始前获得了所有相关信息,并且在博弈过程中没有隐私和未知因素的影响。

在完全信息静态博弈中,参与者同时作出决策,不考虑对方的反应。

下面我们来看一个完全信息静态博弈的例题:假设有两个玩家,分别为甲和乙,他们需要决定是否采取合作或者背叛的策略。

如果两人都选择合作,则每个人会获得3个单位的奖励;如果两人都选择背叛,则每个人都会获得1个单位的奖励;如果一人选择合作而另一人选择背叛,则合作的人将会遭受惩罚,只能获得0个单位的奖励,而背叛的人将获得5个单位的奖励。

在这个博弈中,甲和乙可以通过思考对方的可能策略来做出自己的决策。

从甲的角度来看,他可以考虑乙选择合作还是背叛,对于每种可能的情况,甲可以计算出自己的最佳策略。

如果乙选择合作,甲选择合作的话,他可以获得3个单位的奖励;如果甲选择背叛,他可以获得5个单位的奖励。

因此,对于甲来说,在乙选择合作的情况下,他的最佳策略是选择背叛。

同样地,从乙的角度来看,他可以考虑甲选择合作还是背叛,对于每种可能的情况,乙可以计算出自己的最佳策略。

如果甲选择合作,乙选择合作的话,他可以获得3个单位的奖励;如果乙选择背叛,他可以获得5个单位的奖励。

因此,对于乙来说,在甲选择合作的情况下,他的最佳策略是选择背叛。

综上所述,根据完全信息静态博弈的原理,在这个例题中,甲和乙的最佳策略都是选择背叛。

因此,根据这两个最佳策略,我们可以得出一个纳什均衡解,即双方都选择背叛。

完全信息静态博弈是博弈论中的一个重要分支,通过分析参与者的策略选择和预期收益,可以得出最佳策略和均衡解。

在实际生活中,完全信息静态博弈的思维模式可以帮助我们在竞争和合作的场景中做出更为理性和明智的决策。

博弈的四种基本类型

博弈的四种基本类型

博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。

例如,囚徒困境。

2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。

例如,斯坦科尔伯格寡头竞争。

3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。

例如,性别战博弈。

4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。

例如,信号传递博弈。

每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。

例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。

完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。

例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。

不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。

例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。

不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。

例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。

博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。

举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。

你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。

二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。

举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。

经济博弈论02完全信息静态博弈(Park)

经济博弈论02完全信息静态博弈(Park)

合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。

完全信息静态博弈名词解释

完全信息静态博弈名词解释

完全信息静态博弈名词解释
嘿,你知道啥是完全信息静态博弈不?咱就说啊,这就好像是一场
棋局!每个人都清楚地知道所有的规则和局面(就像你清楚棋盘上每
个棋子的位置和走法一样)。

在完全信息静态博弈里,大家都在同一时间做决定(可不是像接力
赛那样一个接一个哦),而且对彼此的情况都了解得透透的。

比如说,两个人下棋,谁都知道对方有啥子棋,该咋走。

想象一下,你和朋友玩猜硬币正反面的游戏,这就是个简单的完全
信息静态博弈例子呀!你知道硬币就只有正反两面,你朋友也知道,
而且你们同时猜(可不是你先猜完了他再猜)。

再比如商场上的竞争,两家公司都清楚市场的情况、对方的实力,
然后同时决定自己的策略,这也是完全信息静态博弈。

这可不是闹着
玩的,一个决策失误,可能就满盘皆输啦!
咱回过头来想想,生活中好多场景不都像是一场完全信息静态博弈嘛!像买东西讨价还价,你知道商品大概值多少钱,老板也知道,然
后你们就开始“博弈”啦,看谁能争取到更有利的价格。

完全信息静态博弈就是这么个有趣又重要的概念,它让我们能更好
地理解人与人、企业与企业之间的互动和竞争。

它就像一个神奇的钥匙,能打开我们理解复杂社会现象的大门。

所以啊,可别小瞧了它,
它的用处大着呢!
我的观点就是:完全信息静态博弈在我们生活中无处不在,了解它能让我们更从容地应对各种情况,做出更明智的选择。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博 弈 方 1
D U
(5,1)
(4,4)
博弈分析:
1)帕累托上策均衡;2)风险上策均衡;3)聚点均衡都不存在。 人们该如何在该博弈中进行选择呢??
4)相关均衡法
选择机制设置: 1)该装置以相同的可能性(各1/3)发出A、B、C三种信号; 2)博弈方1只能看到该信号是否A,博弈方2只能看到该信号是否C;
(2,1)
子 足球 (0,0)
夫妻之争博弈
可能会作为双方的一个聚点,丈夫则会顺从妻子的
偏好,则(时装,时装)在该博弈中是比较容易选 择的一个纳什均衡,因此, (时装,时装)则是 该博弈的一个“聚点均衡”。
??存在的问题?? 聚点均衡确实反应了人们在多重纳什均衡选择中的某些规律性,但因为它们涉及的 方面众多,因此虽然对每个具体的博弈问题可以找出聚点,但对一般的博弈却很难总结 普遍规律,只能具体问题具体分析。
二、完全信息静态博弈
—纳什均衡与多重纳什均衡的再精炼 1、什么是完全信息静态博弈? 2、完全信息静态博弈的几个经典实例。
3、完全信息静态博弈的分析思路和方法。
4、纳什均衡分析案例。 5、多重纳什均衡再精炼分析
1、什么是完全信息静态博弈?
完全信息静态博弈即各博弈方同时决策,且所有博弈方 对各方得益都了解的博弈。 完全信息静态博弈是最基本的博弈类型,在社会经济, 生活,政治等各个领域中广泛存在,如,“双寡头销价竞 争”,“石头·剪刀·布”,“国家间的战争与和平”等都
4、纳什均衡分析案例
双寡头销价竞争博弈
高价
寡 头 2 低价
寡 高价 (100,100) (20,150) 头 1 低价 (150,20) (70,70) 博弈结果:双方策略(低价,低价);双方收益(70,70)。两者的博弈达到市场效 率最低的均衡。 博弈启示:囚徒困境式矛盾的存在,在一定程度上否定了传统经济理论关于市场经济 中有一只“看不见的手”,总会把个人的利己行为变为对集体、社会有利的行为的推 断,也说明了政府在社会经济活动中的组织协调工作常常是必须的,放任自流并不是 导致社会最大福利的有效政策。 博弈目的:我们研究该类博弈的目的,有时是利用这种困境达到有益于社会的目的,
属于这种博弈。
2、完全信息静态博弈的几个经典实例
1)囚徒困境 2)双寡头销价竞争 3)夫妻之争 4)制式问题
5)国家间的战争与和平
6)猎鹿博弈
3、完全信息静态博弈的分析思路和方法
—最优反应对应
1)上策均衡法 2)严格下策反复消去法
3)划线法
4)箭头法
5)反应函数法(交互和互动分析)
6)混合策略法
帕累托上策均衡:人们通过比较帕累托效率意义上的优劣关系来选择自己的策略,即
多个纳什均衡中的某一个给所有博弈方带来的利益都大于其他所有纳什均衡会带来的利益, 博弈方选择倾向性就会是一致的,各个博弈方不仅自己会选择该纳什均衡的策略,而且可
以预料其他博弈方也会选择该纳什均衡的策略,该纳什均衡就是一个“帕累托上策衡” 。 国 家 2 战争 和平 国 战争 (-5,-5) (8,-10) 家 (-10,8) (10,10) 1 和平
D (-5,-5,0)
(-5,-5,0) (-1,-1,5)
博弈方3—B
博弈方3—A
博弈方1,、2都有偏 理该均衡的意愿, 并且可以串通同时 偏离达到(D,R, A)均衡各获得 (1,1,-5)单位的 收益,自己的收益 得到改善。
博弈方3有偏离的 意愿,达到(D,R, B)均衡,各获得 (-1,-1,5)单位 的收益,使自己的 得益得到改善。
博弈方2 鹿 兔子 (0,3)
(3,3)
1 1 *3 *3 2 2 6 2
博 鹿(1/2) (5,5) 弈 方 兔子(1/2) (3,0) 1
1 1 *5 *0 2 2 5 2
1 1 5 *5 *0 2 2 2
1 1 6 *3 *3 2 2 2
博弈方1的风险策略:兔子
如在打击罪犯;有时则是要设法避免这种困境,如在环境保护和公共资源开发方面。
4、纳什均衡分析案例
纳什均衡的其他几个典型案例: 丈 夫 时装 足球 (0,0) (1,2) 国 家 2 战争 和平 国 战争 (-5,-5) (8,-10) 家 (-10,8) (10,10) 1 和平
国家间战争与和平博弈
4)相关均衡法
现实意义:
1)上述相关均衡虽然仍不能完全实现最理想的博弈结果(D,L),但至少在具有
稳定的前提下部分实现了它,提高了博弈效率;
2)相关均衡作为社会经济中制度创新的一种解释更有意义。
5)防共谋均衡法
在有多个博弈方的多人博弈中,如果部分博弈方通过某种形式的默契或串通形成小 团体,有可能存在的部分博弈方之间联合追求小团体利益的行为,也可能导致纳什均衡 的不稳定性。对这种可能性的考虑,导出了“防共谋均衡”的概念。 如果一个博弈的策略组合满足下列要求: 1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图 (这意味着该策略组合首先是一个纳什均衡); 2)给定选择偏理的博弈方有再次偏理的自由时,没有任何两个博弈方的串通会改变
3)博弈方1看到A采用U,否则采用D;博弈方2看到C采用R,否则采用L。
结果分析: 1)保证了U和R不会同时出现,即排除掉了最不理想的结果(U,R); 2)保证(U,L)(D,L)和(D,R)各以1/3的概率出现,从而两博弈方的期望得益 达到1/3*5+1/3*4+1/3*1=3+1/3; 3)上述策略组合是一个纳什均衡; 4)上述相关装置并不影响双方各种策略组合下的得益,因此并不影响原来的均衡。
博弈论在我国经济中的应用
企业经营者的启示:
1)在我国经济体制改革和国有企业管理体制改革中,委托人—代理人理论和
激励机制设计原理有很大的应用价值。如,对“监督困难的委托人—代理人
理论”的研究,找到可以调整各方面的利益关系和调动职工和经营者的积极 性和责任心的依据和方法。
2)博弈论领域中“囚徒困境”,“激励悖论”等众多模型和命题为企业经营
博弈的结果;
3)依次类推,直到所有的博弈方都参加的串通也不会改变博弈的结果。 满足以上所述要求的均衡策略组合称为“防共谋均衡”
5)防共谋均衡法
博弈方2 L 博 弈 方 1 U (0,0,10) R (-5,-5,0) (1,1,-5) 博 弈 方 1 U D L (-2,-2,0) 博弈方2 R (-5,-5,0)
4)相关均衡法
当博弈方遇到博弈中多重纳什均衡选择的难题时,人们常会通过收集更多信息, 形成特定的机制和规则也就是某种形式的制度安排等主动寻找出路,从而达到其中 某一均衡。 我们称各博弈方根据相关装置选择策略构成的纳什均衡为“相关均衡”。 博弈方2 L R (0,0) (1,5) 该博弈的两个均衡分别是(D,L)(U,R)。 但是博弈双方在同时选择时并不知道对方的选 择策略,出现最差结果(D,R)的可能性是很 大的,1/4的可能性,并且这个结果不是任何一 个博弈方都希望得到的。可是人们为了避免这 个最差的结果,该如何进行选择呢??
以及博弈论价值得到越来越充分的认识,不断吸引大量学者加入学习、研究和应 用博弈论的队伍。这是博弈论继续向前发展的根本基础和保证。
2)在博弈规则的来源、博弈方的行为模式和理性等基础理论方面,博弈论还存
在不少没有很好解决的问题,有待进一步研究和解决。这正是博弈论未来发展的 动力。 3)当前合作博弈理论发展相对落后,这个领域有很大的发展潜力,很可能孕育 出引发经济学新革命的重大成果。非合作博弈和合作博弈理论的重新组合也可能 给博弈论的发展提出新的方向和课题。
者揭示了众多经济、经营活动中的内在规律,企业决策者利用这些工具可以大 大提高在价格和产量决策、经济合作和经贸谈判,参与投标拍卖,处理劳资
关系等问题的决策效率。
博弈论的发展前景
博弈论都有很大的发展前途。
无论是从社会经济发展的客观要求,还是从经济学理论发展本身的规律来看,
1)博弈论本身具有优美深刻的本质魅力,新的分析工具和应用领域的不断发现,
不一定能彻底解决一个博弈问题,那么,人们在面对多个纳
什均衡时该是如何选择的呢?此时,博弈方遇到了选择问题。 结论:纳什均衡需要再精炼。
完全信息静态博弈如何对多元纳什均衡再精炼?
5、多重纳什均衡的再精炼分析
1)帕累托上策均衡法 2)风险上策均衡法
3)聚点均衡法
4)相关均衡法 5)防共谋均衡法
1)帕累托上策均衡法
任何一个博弈方都 没有偏理的意愿, 并且偏理该策略对 自己来说无利可图, 此策略组合构成了 该博弈的“防共谋 均衡”。 该均衡具有稳定性
该均衡不具有稳定性
博弈论在我国经济中的应用
政府人员的启示:
1)市场经济条件下政府不能用计划和行政命令的方法调控经济,只能通过市场
方法加以影响,而且必须考虑企业和地方等的反应(即通常所说的“上有政策, 下有对策”)。因此,政府必须要有博弈的和运用博弈的思路,才能对经济实 现稳健的调控,否则效果与政策之间会有很大的偏差。 2)博弈可揭示市场经济的规律,给政府的经济管理提供有益的启示,如,商业 竞争中频繁爆发恶性商战的根源是“囚徒困境”的问题,通过研究此类模型可 以找到解决此类问题方法。 3)市场秩序建立的过程中,政府管理机构可以运用“不完全信息博弈”理论, 研究在经济活动中利用信息不对称搞欺诈活动的根源和解决此类问题的办法, 维护好秩序,提高经济活动效率。
自己相对有利;
以上因素都是导致发生战争机会增大的重要原因。
2)风险上策均衡法
风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概
率相同时,都偏爱其中某一个纳什均衡,则该纳什均衡就是一个“风险上策均衡”。
对博弈方2的风险策略分析
猎鹿博弈
对博弈方1的风险策略分析 博弈方2 鹿 (1/2) 兔子(1/2) 博 鹿 (5,5) 弈 (3,0) 方 1 兔子 (0,3) (3,3)
相关文档
最新文档