完全信息静态博弈

合集下载

完全信息静态博弈及其纳什均衡解

完全信息静态博弈及其纳什均衡解

第三章完全信息静态博弈及其纳什均衡解1.完全信息静态博弈定义 3.1.完全信息静态博弈。

完全信息静态是指,博弈中的参与人同时采取行动,或者尽管参与人行动的采取有先后顺序,但后行动的人在行动时不知道先采取行动的人采取的是什么行动;同时博弈参与人的策略空间及策略组合下的支付是博弈中所有参与人的“公共知识”。

两个特点:(1)静态;(2)完全信息。

完全信息静态博弈例子。

例1:锤子-剪刀-布例2:交通行驶非“完全信息静态博弈”例子:英式拍卖——动态博弈;第一密封价格及第二密封价格拍卖——不完全信息博弈。

2.纳什均衡及其判定定义3.2 纳什均衡。

在一个n人博弈的标准式G={S1,S2,…,S n; u1,u2,…,u n}中,一个策略组合{s1*,s2*,…,s n*},若满足u i(s1*,…,s i*,…s n*)≥u i(s1*,…s i,…,s n*)(i=1…n),则称这个策略组合为{s1*,s2*,…,s n*}为该博弈G的一个纳什均衡。

某策略组合是纳什均衡指的是,在该策略组合上任何一个参与人的收益在其他人策略不改变的情况下都至少是弱优的。

特点:(1)每个人没有单独改变策略的动机;(2)局部最优。

纳什均衡判定方法:用定义来判定:某点是均衡看它是否符合纳什均衡的定义。

求解纳什均衡的方法:(2)用定义来求解(3)对于策略空间为连续的博弈,用求极值的方法来求得。

3.纳什均衡存在定理:(纳什)定理3.1.在一个n人博弈的标准式G={S1,S2,…,S n; u1,u2,…,u n}中,如果n是有限的,且对每个i, S i是有限的,则博弈至少存在一个纳什均衡。

这里的均衡可能包含混合策略均衡。

证明:略例子3:囚徒困境的均衡例1:“锤子-剪刀-布”的均衡?4.混合策略与混合策略的均衡纯策略与混合策略概念。

定义.3.3.一个策略是纯策略指的是参与人策略空间中的某个确定策略;而一个混合策略是参与人策略空间上的一个概率分布,一般地,某个人i的策略空间为{s i1,s i2,…,s ik},则参与人i在策略空间上的一个概率分布p i=(p i1,p i2,…,p ik)构成他的一个混合策略,其中p i1+p i2+…+p ik=1。

第二讲 完全信息静态博弈

第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。


在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法

第2章_完全信息静态博弈

第2章_完全信息静态博弈

2. “斗鸡博弈” 斗鸡博弈”
甲、乙两人相对而行,试图通过一座独木桥。 乙两人相对而行,试图通过一座独木桥。 独木桥仅能容纳一人通行。 独木桥仅能容纳一人通行。 如果两人坚持继续前行, 如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄 的独木桥,两人都会掉到河里, 的独木桥,两人都会掉到河里,均得到收益 -10。 。 如果甲选择退让,让乙先行, 如果甲选择退让,让乙先行,那么得意的乙将得到收益 20, , 面子受损的甲 得到收益 -2。 。 如果乙选择退让,让甲先行, 如果乙选择退让,让甲先行,那么得意的甲将得到收益 20, , 面子受损的乙得到收益 -2。 。 如果甲和乙均选择退让, 如果甲和乙均选择退让,那么双方均得到收益 10。 。
2.智猪博弈 .
猪栏里养了两头猪,一头大猪、一头小猪。 猪栏里养了两头猪,一头大猪、一头小猪。 在猪圈的一端有一个盛食槽。 在猪圈的一端有一个盛食槽。 在猪圈的另一端有一个按压式开关。 在猪圈的另一端有一个按压式开关。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 大猪和小猪都在思考是否去按压开关。 大猪和小猪都在思考是否去按压开关。
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第二章
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
2.通过“划横线法”求解“智猪博弈”的均衡 .通过“划横线法”求解“智猪博弈”
小猪 按开关 按开关 大猪 等待 (10,-2) , ) (0,0) , ) (5,-1) , ) 等待 (4,2) , )

完全信息静态博弈

完全信息静态博弈

• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。

R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)

F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。

1 完全信息静态博弈

1  完全信息静态博弈

1.4.3委托-代理关系中被设计的囚徒困境


囚徒困境对于人们来说是糟糕的,是应当竭力避免的? 在一些委托-代理关系中,故意创造出代理人之间的囚徒困 境有时对委托人有好处。这样的囚徒困境对于效率来说是 一种促进。 委托-代理关系:通常的含义是委托人请代理人代理某件事 情。其中的关键问题是二者利益不一致,并且委托人与代 理人之间存在信息不对称。为此,需要设计一种制度 (system)或机制(mechanism) ,使代理人在追求自己利益的 同时也最大化委托人的利益,如何设计这样的制度就是信 息经济学研究的问题。
1 完全信息静态博弈



博弈论的基本概念及战略式表述 纳什均衡 纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性与多重性
1.1 博弈论基本概念I
参与人:博弈中的决策主体,i=1,2,·,n · · 虚拟参与人:自然N,表示博弈面临的环境或外生 条件。 行动:ai表示第i个参与人的一个特定行动 Ai={ai}表示可供i选择的所有行动的集合。如, {坦白,抵赖}。 n人博弈中,n个参与人行动的有 序集a称为“行动组合”。如(坦白,坦白), (坦白,抵赖),(抵赖,坦白),(抵赖,抵 赖) 信息:参与人有关博弈的知识,特别是关于“自
供应商 B 8.5 10 供应商 A 8.5 10 125,125 0,250 250,0 200,200
1.5 重复剔除的占优均衡
智猪博弈(Boxed Pigs) : 一头大猪和一只小猪生活在同一猪圈里,共用一食槽。食槽的 一端有一个开关,猪用嘴一拱,食槽的另一端会掉下包子。假 定按一下会掉下10个包子,而跑去按开关的猪会耗费2个包子 的能量。如果小猪按开关,大猪先吃,等小猪按完跑过来时, 大猪会吃掉8个包子,小猪只能吃到2个;如果大猪先按开关, 按完后跑过来,小猪会吃掉4个包子,大猪可以吃到6个;如果 都不去按开关,就会被一起饿死。 小猪 战略式描述 按 等 按 6,0 4,4 大猪 10,-2 0,0 等

经济博弈论 02 完全信息静态博弈(Park)

经济博弈论 02 完全信息静态博弈(Park)
ui(S1*, ... Si-1*, Si*, Si+1*, ... Sn*) ≥ui(S1, ... Si-1*, Sij, Si+1*,… Sn*)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?

博弈论与信息经济学-1完全信息静态博弈

博弈论与信息经济学-1完全信息静态博弈

完全信息 不完全信息
静态
动态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
完全信息动态博弈 子博弈精炼纳什均衡
泽尔腾(1965)
不完全信息动态博弈
不完全信息静态博弈
精炼贝叶斯纳什均衡
贝叶斯纳什均衡
泽尔腾(1975)
海萨尼(1967-1968) Kreps和Wilson(1982)
Fudenberg和Tirole (1991)
博弈论与信息经济学
第一章 完全信息静态博弈
博弈论概述:发展历程
1838年库诺特(Cournot)寡头竞争模型(数量战) 1883年伯川德(Bertrand)寡头竞争模型(价格战) 1944年冯诺依曼和摩根斯坦发表《博弈论和经济行为》 1950年纳什(Nash)提出了纳什均衡的概念。 1965年泽尔腾(Selten)提出了子博弈精炼纳什均衡的
共同知识指“所有参与人知道,所有参 与人知道所有参与人知道,所有参与人 知道所有参与人知道所有参与人知 道…”。
在博弈论中,一般假定参与人的行动空 间Ai和行动顺序是共同知识。
一个关于共同知识的小游戏
A还是B? 两个人的推理过程: 我看到你身上的A,如果我身上是B的话。
因为我们俩至少有一个人身上是A,因此 你因此判断自己身上的是A。但是由于你 没有说,因此我可以断定自己身上是A。
如果n个参与人每人从自己的Si中选择一个策略si, 则向量s=( s1,s2,…,si,…, sn)是一个策略组合 (strategy profile),参与人i之外的其他参与人的策略 组合可记为s-i=( s1,s2,…,si-1 ,si+1 ,…, sn)。
注意:
1. 策略与行动是两个不同的概念,策略是行 动的规则(告诉参与者在什么情况下应该做什 么)而不是行动本身。回顾上章提到的父亲和 女儿的博弈。

博弈论_完全信息静态博弈

博弈论_完全信息静态博弈

博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡(Nash Equilibrium) 纳什均衡
纳什均衡、占优均衡、重复剔除严劣策 略均衡的关系
定理a 每一个占优均衡、重复剔除严劣策 略均衡一定是纳什均衡,但反过来不一定 成立; 定理b 纳什均衡一定不能通过重复剔除严 劣策略方法剔除。
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡应用举例: 纳什均衡应用举例:古诺模型
(q1*, q2*)是均衡产量意味着:
q1*∈argmaxπ1(q1, q2*) q2*∈argmaxπ2(q1*, q2) 根据上面两个式子可以得出反应函数(reaction function): q1*=R1(q2) q2*=R2(q1) 两个反应函数的交叉点就是纳什均衡(q1*, q2*), 见图1-9
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡应用举例: 纳什均衡应用举例:古诺模型
1 q 1 = q = (a − c) 3
* * 2
进而可以得出每个企业的纳什均衡产量下 的利润,为
π
*
1

* 2
1 = (a − c)2 9
可以同垄断企业的最优决策类比
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
豪泰林价格竞争模型
古诺模型中,产品是同质的(homogenous); 豪泰林模型中,引入了产品的差异性;
产品的差异性可以有很多体现形式:如品牌、外 观、功能、空间差别(如房地产) 豪泰林模型中,产品的差异通过空间差别来体现 豪泰林模型的主要假设是产品的差异完全是由空 间位置的不同而造成的

博弈论四种类型之完全信息静态博弈

博弈论四种类型之完全信息静态博弈

博弈论四种类型之完全信息静态博弈决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。

完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。

⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。

在完全信息静态博弈中的均衡是纳什均衡。

最典型的例⼦是囚徒困境与智猪博弈。

下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。

【囚徒困境】中基于收益矩阵的模型描述如下:【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。

⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。

离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。

对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。

【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。

所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。

但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。

个⼈的最优选择从社会⾓度看并不是最优的。

社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。

【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚(第三⽅实施),会使两⼈合作,促进集体利益最⾼。

【智猪博弈】智猪博弈的收益矩阵模型如下:在此处,⼩猪有优势与劣势策略,但⼤猪没有,只能根据⼩猪的策略做出最佳应对,⽽⼩猪不会选择劣势策略,因此剔除⼩猪“按”的策略,此时,⼤猪的策略只能为“等”。

【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略,参与⼈选择策略A时的收益严格⼩于策略B时的收益。

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈
• 例2:公共产品的供给也是一个囚徒困境问题。 如果大家都出钱兴办公共事业,所有人的福利都会增加。问题是,如果我出钱你 不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以,每 个人的最优战略是“不出钱”,这种情况下,使得所有人的福利都得不到提高。
例3:“军备竞赛”。 例4:经济改革本身也可能是这样,在许多改革中,改革要付出成本(包括风险), 而改革的成果大家共享,结果是:尽管人人都认为改革好,却没有人真正去改革, 大家只好在都不满意的体
第们集中讨论完全信息静态博弈。 • “完全信息”指的是每个参与人对所有其他参与人的特征(包括战略空间、支付
函数等)有完全的了解。 • “静态”指的是所有参与人同时选择行动且只选择一次。“同时行动”是一个信
息概念而非日历上的时间概念:只要每个参与人在选择自己的行动时不知道其他 参与人的选择,我们就说他们在同时行动。
的组合。 定义:在博弈的战略式表述中,如果对于所有的i,si*是i的占优
战略,那么,战略组合s* = s1*,...,s*n 称为占优战略均衡(do min ant
strategy equilibrium)
第2讲 完全信息静态博弈
• 在一个博弈里,如果所有参与人都有占优战略存在,那么,占优战略均衡是可以 预测的到惟一的均衡,因为没有一个理性的参与人会选择劣战略。
• 纳什均衡是完全信息博弈解的一般概念,也是所有其他类型博弈解的基本要求。
第2讲 完全信息静态博弈
• 1.纳什均衡 纳什对博弈论的贡献有两个方面:一是合作博弈理论中的讨价还价模型,称为纳什 讨价还价解(Nash bargaining solution); 二是非合作博弈论方面,这是他的 主要贡献所在。 纳什对非合作博弈的主要贡献是他在1950年和1951年的两篇论文中在非常一般意义 上定义了非合作博弈及其均衡解,并证明了均衡解的存在。这样就奠定了非合作 博弈论的基础。纳什所定义的均衡称为“纳什均衡”,它如同瓦尔拉斯均衡一样, 已成为经济学中的专家术语。

经济博弈论完全信息静态博弈

经济博弈论完全信息静态博弈

19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。

第一课应用博弈论第二讲 完全信息静态博弈

第一课应用博弈论第二讲  完全信息静态博弈
博弈方的最终目标也是实现自身的最大得 益。不过,这里,各个博弈方的得益既取决于 自己选择的策略,还与其他博弈方选择的策略 有关。根据这种思想,科学的决策思路应该是: 先找出自己针对其他博弈方每种策略或策略组 合的最佳对策,然后在此基础上,通过对其他 博弈方策略选择的判断,预测博弈的可能结果 和确定自己的最优策略。根据上述思想,介绍 划线法寻找博弈的解。
们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。
21
例3
为什么只有大企业才会花巨额金钱打广 告?
大企业是大猪,中小企业是小猪。大企 业投入大量资金为产品打广告,中小企 业等大企业的广告为产品打开销路形成 市场后才生产类似产品进行销售。
经开始对日本和德国这两个法西斯轴心国展开大反 攻。
在欧洲,以艾森豪威尔为总司令的盟国远征军,准
备横渡英吉利海峡,在欧洲开辟第二战场。欧洲只
有东翼的苏德战场是两大阵营对抗的正面战场,前
苏联方面一再要求美英同盟国及早在欧洲大陆开辟
第二战场。1944年春天,英美联军在北非战场中彻
底摧毁了德国隆美尔元帅的抵抗,德军已经完全收
德军在欧洲西线的总兵力是58个师,要布防的海岸线 长达3000公里。因此,德军只能把主要兵力放在它认为 盟国最有可能渡海登陆的地方。同时,盟军在英国能够 用于渡海作战的兵力,由于受登陆舰船容量的限制,数 量也有限,只能考虑集中有限的兵力重点进攻一个地方。 因此,无论是对于盟军还是对于德军,选择和判断盟军 将在那里登陆已经成为这次跨海作战成败的关键。
生活中其实有很多相关的例子。
19
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们

博弈的四种基本类型

博弈的四种基本类型

博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。

例如,囚徒困境。

2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。

例如,斯坦科尔伯格寡头竞争。

3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。

例如,性别战博弈。

4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。

例如,信号传递博弈。

每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。

例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。

完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。

例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。

不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。

例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。

不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。

例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。

博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。

举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。

你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。

二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。

举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。

经济博弈论02完全信息静态博弈(Park)

经济博弈论02完全信息静态博弈(Park)

合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

* * q1 q2
ac 3
0 q1
* max f1 max q1 [a (q1 q2 ) c] 0 q1 * max f1 max q2 [a (q1 q2 ) c] 0 q2
0 q2
最后要价仲裁
参与争议的双方一为企业,一为工会,争议由工资而起。博弈进行如下。第 一步,企业和工会同时开出自己希望的工资水平,分别用wf和wu表示。第二 步,仲裁人在二者之中选择其一作为结果。假定仲裁人本身对工资水平有自 己的方案,用x表示,并假定在观测到双方要价wf和wu之后,仲裁人只是简 单选择距x最近的要价(可以认为wf<wu)。仲裁者知道x,但参与双方认为x 是一个随机变量,其累积分布函数F(x),相应的概率密度函数为f(x)。则有:
完全信息静态博弈
主要内容
• 名词解释 • 博弈的标准式 • 重复剔除严格劣战略 • 纳什均衡 • 古诺双头垄断模型 • 最后要价仲裁 • 公共财产问题
• 混合战略
名词解释
• 完全信息博弈:是指每一参与者都拥有所有其他参与者的特征、 策略及收益函数等方面的准确信息的博弈。
• 非完全信息博弈:至少有一个参与者不能确定其他参与者的特征、 收益函数等信息。
重复剔除严格劣战略
理性的参与者不会选择严格劣战略
参与者是完全理性的
参与者具有完全信息
纳什均衡
参与人2 左 上 参与人1 中 下 (0,4) (4,0) (3,5) 中 (4,0) (0,4) (3,5) 右 (5,3) (5,3) (6,6)
• • • •
纳什均衡是比重复剔除严格劣战略更强的解 一个博弈中纳什均衡并不是唯一的 达到纳什均衡并不意味着效率最优 在任意有限博弈(参与者和战略集都是有限的博弈) 中,都存在至少一个纳什均衡(可以包含混合战略)
重复剔除严格劣战略
参与人2 上 左 中 右 (1,0) (1,2) (0,1) (0,3) (0,1) (2,0) 参与人1 参与人1 上

参与人2 中 (1,2)
参与人2 上 左 中 (1,0) (1,2) (0,3) (0,1) 参与人2 左 中 (1,0)(1,2)
参与人1

参与人1

定义3:假设有n个参与人进行博弈,如果某情况下无一参与者可 以独自行动而增加收益,则此策略组合被称为纳什均衡。
THE END
• 动态博弈:行动有先后顺序,后动者可以观察到前者的行动,了 解前者行动的所有信息,而且一般都会持续一个较长时期。 • 静态博弈:各博弈方同时决策,或者决策有先后但是后动者无法 知晓前者的决策。
博弈的标准式表达
囚徒2
沉默
沉默 囚徒1 招认 (0,-9) (-1,-1)
招认
(-9,0) (-6,-6)
G* G** (反证法)
设社会最优选择为G**,一阶条件为:
v(G ) G v '(G ) c 0
** ** **
v(G* ) v(G** )
混合战略
参与人2 剪刀 剪刀 石头 布 (0,0) (-1,1) (1,-1-1,1)
(-1,1) (1,-1) (0,0)
• 参与者i • 每一参与者可选择的战略集Si,也 称为战略空间,其中的元素为si • 针对所有参与者可能选择的战略组 合( s1,…,sn ),每一个参与者 的收益函数ui
定义1:在一个n人博弈的标准式表述中,参与者的战略空间为S1,…,Sn,收 益函数为u1,…,un,我们用G={S1,…,Sn; u1,…,un}表示此博弈。 定义2:在一个博弈中,令si’和si’’代表参与者i的两个可行战略。如果对其他参 与者每一个可能的战略组合,i选择si’的收益都小于其选择si’’的收益,则称战略 si’相对于战略si’’是严格劣战略。
对于村民i而言: max gi v( gi g * ) c gi i
gi
代入gi*,并把所有村民的一阶条件加和,再除以n,得到: 对村庄而言:
1 v(G* ) G *v '(G * ) c 0, n G * g i*
i
0 G
max G v(G ) G c
最后要价仲裁
可以认为企业的目标是使期望工资最小化的仲裁结果,工会则设法使其最大 化。假定要价(wf*,wu*)是这个博弈的纳什均衡,则有:
min w f F (
wf * w f wu
max w* f F(
wu
2 w* f wu 2
* ) wu [1 F (
* w f wu
古诺双头垄断模型
令q1、q2分别表示企业1、2生产的同质产品的产量,市场中该产品的 总供给Q=q1+q2,令P(Q)=a-Q表示市场出清时的价格(a>Q)。设企业i 生产qi的总成本Ci(qi)=cqi(设c<a)。两个企业同时进行产量决策。 参与人:企业1、企业2 战略集:企业各自的产量q1、q2 收益函数:f1=q1P-C1;f2=q2P-C2 ui(si*,sj*)≥ui(si,sj*) ui(si*,sj*)≥ui(si*,sj)
) w u [1 F (
2 w* f wu 2
)] )]
假定x~N(m,σ2),则有:
w m
* u
2
2
w m
* f
2
2
公共财产问题
一个村庄有n个村民,每个村民在公共草地上放羊。用gi表示村民i的放羊数, 村里羊的总数量为G。购买和照看一只羊的成本为c。当草地上样的总头数为 G时,一个村民养一只羊的收益为v(G)。草地可容纳羊的数量为Gmax。当 G<Gmax时,v(G)>0;当G≥Gmax时,v(G)=0 。且对于G<Gmax ,v’(G)<0,v’’(G)<0。 假设羊是连续可分割的,村民i选择放羊数gi。
P( w f ) P{x P( wu ) 1 F ( w f wu 2 w f wu 2 } F( w f wu 2 )
)
则期望工资水平:
w f P( w f ) wu P ( wu ) w f F ( w f wu 2 ) wu [1 F ( w f wu 2 )]
纳什均衡: 每个参与者都按照1/3的概 率分别选择每个纯策略。
当每个参与者都在猜测其他参与者的战略 选择时,其最优行为就存在不确定性。
定义4:对标准式博弈G={S1,…,Sn; u1,…,un},假设Si={si1,…,sik}。则 参与者i的一个混合战略为概率分布pi=(pi1,…,pik),其中对所有k=1,…,K, 0≤pik ≤1,且pi1+…+pik=1。
相关文档
最新文档