第二章-完全信息静态博弈的基本理论(1)

合集下载

第2章_完全信息静态博弈

第2章_完全信息静态博弈


前行
退让
前行
(-10,-10) (20,-2)

退让
(-2,20) (0,0)
❖ (甲前行、乙退让)和(甲退让、乙前行)都是“斗鸡博弈” 的纳什均衡。
3.“市场争夺战”博弈
❖ 假设在市场中有两个竞争对手。一个是已经在市场中的“在位者”, 另一个是企图进入市场的“潜在进入者”。
❖ 潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个 可以选择的策略:斗争、默许。
(10,1) (2,2)
❖ 如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择? ❖ 理性的嫌疑人甲会选择坦白。 ❖ 在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。 ❖ 类似可分析其他情况
❖ 2.通过“划横线法”求解“智猪博弈”的均衡
大猪
按开关 等待
小猪
按开关
等待
(5,-1)
(4,2)
(10,-2) (0,0)
❖ 如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈 另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会 比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按 压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为 -1。
❖ 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下 开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花 一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强 力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况 下,大猪得到的收益是 4,小猪得到的收益是 2。
❖ 将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付 矩阵上方 。
❖ 嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人 甲可能的策略纵向排列在博弈支付矩阵左侧。

第二章 完全信息静态博弈

第二章 完全信息静态博弈

两寡头间的囚徒困境博弈
厂商2
不突破
厂 不突破 商 1 突破
突破
4.5,4.5
5,3.75
3.75,5
4,4
以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
2.3.2 反应函数(划线法)
古诺模型的反应函数
(0,6) R1(q2)
Cont…

反应函数: *
P
* 2
P 1
1 * ( a1 d1 P 2 ) 2b 1
2.3 无限策略分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 豪泰琳模型
2.3.1 古诺的寡头模型
企业Cournot模型 (无限策略博弈) 古诺( Cournot ,1838)比纳什(1950)定义早100年 假设条件: 1. 在一个寡头市场上两企业生产销售同质产品,市场 总产量Q = q1+q2 (两寡头企业就是指这两家企业 垄断了某一行业的市场) 2. 市场出清价格 P = 8 - Q 3. 生产无固定成本,边际成本 c=c1=c2=2 4. 两企业同时独立地决定各自的生产产量(q1, q2) 问题:两家企业应如何决策?
2.2.2

纳什均衡与一致预期
一致预期:基于信念的选择是合理的;支持选择的 信念是正确的; 预期的自我实现:如何所有人认为这个结果会出现, 这个结果就会出现。预期是自我实现的,预期不会 错误。如果你认为我预期你将选择X,你就真的会 选择X。

2.2.3 纳什均衡与严格下策反复消去法
上策均衡定是纳什均衡,但纳什均衡不一定是上策均衡 命题2.1:在n个博弈方的博弈 G {S1 ,Sn ; u1 ,un } 中,如 * * 果严格下策反复消去法排除了除 (s1 , sn ) 之外的所有策 * * 略组合,那么 (s1 , sn ) 一定是该博弈的唯一的纳什均衡 命题2.2:在n个博弈方的博弈中G {S1,Sn ; u1,un } 中,如 * * , sn )是 果 (s1 G 的 一个纳什均衡,那么严格下策 反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严 格下策反复消去法简化博弈是可行的

第二章 完全信息静态博弈(博弈与信息-西南财大,李映东)

第二章   完全信息静态博弈(博弈与信息-西南财大,李映东)

36
第四节 混合策略纳什均衡
引例:社会福利博弈与猜谜游戏 混合策略纳什均衡及其求解
混合策略纳什均衡的应用举例
关于纳什均衡的存在性与多重性
一道有趣的作业题
37
社会福利博弈
流浪汉 寻找工作 ( )
政府
游荡 (1-)
-1,3 0,0
救济 ( )
不救济 (1- )
3,2 -1,1
14
占优策略与占优策略均衡



占优策略(Dominant strategy):不论其他参与 人选择什么策略,一个参与人都只存在唯一的 最优策略,这样的最优策略被称为占优策略。 对于所有的s-i, si*称为参与人i的严格占优策略, 如果满足: – ui(si*,s-i)>ui(si',s-i) s-i, si' si* 占优策略均衡:每个参与人的占优策略组合(如 果存在的话)被称为占优策略均衡。
26
练习:重复剔除劣策略的占优均衡
L
U M D 4,3 2,1 3,0
M
5,1 8,4 9,6
R
6,2 3,6 2,8
27
思考与讨论(1)
L U D

R c,d g,h
a,b e,f
当a,b,c,d,e,f,g,h之间满足什么条件时,上述博 弈存在: (1)占优策略均衡;(2)重复剔出的占优 均衡;(3)纯策略纳什均衡。
31
纳什均衡是两反应函数的交点
q1 a-c R2(q1) 1/2(a-c) R1(q2) R1(q2)=q1=1/2(a-q2-c) R2(q1)=q2=1/2(a-q1-c)
1/2(a-c)
a-c
q2

第二章完全信息静态博弈.

第二章完全信息静态博弈.
①信息集(information set):描述i信息特征(博弈树上的 所有决策结分割成不同的信息集。每个信息集是决策结集合的一 个子集),该子集包括所有满足下列条件的决策结:
a、每一个决策结都是同一参与人i的决策结; b、i知道博弈进入该集合的某个决策结,但不知道自己究竟 处于哪一个决策结(见教材,P141)。如房地产开发博弈I(见 图2.1):A信息集为{大,小},B的信息集为{大}或{小}。 ②完美信息(perfect information):i对任一对手及N的行 动有准确了解,每个信息集都是单结的。(完美信息博弈:博弈 中没有任何两个参与人同时行动并且所有后行动者确切地知道前 行动者选择了什么行动,所有参与人观察到自然的行动)。
③在自然作选择的结上,有自然选择不同枝 的概率。
④有划分每个参与人的结的信息集。
⑤在每一个终点结上都有对每一个参与人的 支付。
博弈树(game tree)
博弈树(game tree)除⑤以外与扩展式都一样。在博弈树中, 扩展式中的⑤点变为:5’在每一个终点结上都有结果。
“博弈树”是一个比“扩展式”更为灵活的术语,如果结果 被定义为支付组合,则两者并无差别。
不开发
(4,4)
(8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1)
(0,0)
图2.1 房地产开发博弈I
(3)信息(information)
结(node):i或N采取行动的时点(决策结),或者 博弈结束的时点。
结x的后续结(successor):已经到达x之后才有可能 在随后的博弈中到达的结,并定义T(x)为x之后的所有结 的集合,t(x)为x的直接后续结。
许多不完全信息博弈都是不对称信息博弈,但这两个概念并 不等价。

1 完全信息静态博弈

1  完全信息静态博弈
博弈论与信息经济学
(Game Theory and Information Economics)
第2章:完全信息静态博弈
Chapter 2: Static Game of Complete Information
完全信息静态博弈

静态博弈(同时行动博弈)
所有参与人同时选择行动,而且只选择一次 如,罚点球时,守门员和对方射手必须同时决策 “同时”是一个信息概念,而不一定与日历上的时间一致 在博弈中,如果参与者在不知道对手如何选择的情况下行 动,该博弈就是静态的。
1 囚徒困境与占优战略均衡


现实生活中其他囚徒困境的例子
曾经威胁世界整个甚至人类的军备竞赛


公共资源过度开采/公共品供给短缺
大学扩招、研究生扩招、大学贷款基建 年年都有的评优评先活动 各种资格考试广泛盛行 备受批评却日益严重的应试教育
1 囚徒困境与占优战略均衡

如何走出囚徒困境?

基于收益矩阵的模型描述: 参与人
囚徒 B 坦白 抵赖囚徒B可 选策略囚徒 A坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
囚徒 A 的支付
囚徒 B 的支付
1 囚徒困境与占优战略均衡

博弈中参与人只拥有有限个离散型的纯战略供其选择。 如篮球比赛中的运球、过人和投篮 离散型策略 另一些博弈中,在其他博弈中,每个参与者的纯策略可以是 来自一个连续范围的一个数。如厂商定价 连续策略

离散型策略静态博弈通常用支付表来表示 ——博弈的战略式表述
1 囚徒困境与占优战略均衡

从一方的角度看,选择“坦白”比选择“抵赖”好,无论他 关 于对方的选择持有何等信念。 我们就说,对于囚徒而言,“坦白”的策略是一个占优策略, 以不变应万变 或者说“抵赖”的策略是一个劣策略。

第二讲 完全信息静态博弈

第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。


在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法

完全信息静态博弈

完全信息静态博弈

• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。

R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)

F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。

第二章完全信息静态博弈的基本理论

第二章完全信息静态博弈的基本理论

第二章完全信息静态博弈的基本理论第二章完全信息静态博弈的基本理论0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。

特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。

一.求解方法之一:剔除严格劣策略1.占优策略与劣策略。

严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b 策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。

弱占优策略与弱劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付不低于b策略,且至少有一种情况下的支付会严格大于b策略,则称b策略是相对于a策略的弱劣策略(weakly dominated strategy );a策略则是相对于b策略的弱占优策略(weakly dominating strategy)。

占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。

特别提示:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。

类似地,可以定义局部劣策略与全局劣策略。

理性的人在博弈时绝对不会选择严格劣策略。

通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。

2.案例案例1乙坦白不坦白甲坦白-6-6-10不坦白-10-1-1案例2乙不作广告作广告甲不作广告 8810 2作广告 21044在上面的两个例子中,通过剔除严格劣策略,可以获得一个占优策略均衡(坦白,坦白),(作广告,作广告)。

博弈论日记(2)完全信息静态博弈基础理论

博弈论日记(2)完全信息静态博弈基础理论

博弈论⽇记(2)完全信息静态博弈基础理论1.1.博弈的标准式和纳什均衡1.1A.博弈的标准式表述⾸先我们来说明⼀下什么是完全信息静态博弈,静态博弈指开始时由参与者同时选择⾏动,然后根据所有参与者的选择,每个参与者得到各⾃的结果。

完全信息博弈即每⼀个参与者的收益函数(根据所有参与者选择⾏动的不同组合决定某⼀参与者收益的函数)在所有参与者之间是共同知识。

之所以称为基础理论,是因为本⼩结要解决两个基本问题:如何描述⼀个博弈以及如何求博弈的解。

定义:在⼀个n⼈博弈的标准式的表述中,参与者的战略空间为S1,S2,……,Sn,收益函数为u1,u2,……,un,我们⽤G={S1,S2,……,Sn;u1,u2,……,un}表⽰此博弈。

1.2B.重复剔除严格劣策略上⾯是博弈论的表述⽅法,下⾯是⼀个关于博弈论的解的⽅法(虽然不常⽤)。

定义:在标准式的博弈G={S1,S2,……,S3;u1,u2,……,un}中,令Si′和Si″代表参与者i的两个可⾏战略(即Si′和Si″是Si中的元素)。

如果对其他参与者每⼀个可能的战略组合,i选择Si′的收益都⼩于其选择Si″的收益,则称战略Si′相对于Si″是严格劣战略。

ui(S1,S2,…,Si′,…,Sn;u1,u2,…,ui′,…un}<ui{S1,S2,…,Si″,…,Sn;u1,u2,…,ui″,…un}1/2 L2 R2 M2L1 1,0 1,2 0,1R1 0,3 0,1 2,0参与⼈1有两个可选策略,S1={L1,R1},参与⼈2有三个可选策略S2={L2,R2,M2}。

在这个博弈中,对参与⼈1来说L1和R1都不是严格占优的。

因为如果参与⼈2选择L2,参与⼈1L1优于R1;参与⼈2选择R2,参与⼈1L1优于R1;参与⼈2选择R2,参与⼈1R1优于L1;但对参与⼈2来讲,M2是严格劣于R2的,因此理性的参与⼈2是不可能选择M2的,就可以把M2在战略空间中剔除,如果参与⼈1知道参与⼈2是理性的,那么他就可以将这个博弈视为下图:1/2 L2 R2L1 1,0 1,2R1 0,3 0,1此时⼜产⽣了⼀个新的情况,对于参与⼈1来讲,R1⼜是严格劣与L1的,因此就可以将R1在参与⼈1的战略空间中剔除,博弈⼜变成了如下情况:1/2 L2 R2L1 1,0 1,2此时双产⽣了⼀个新的情况,对于参与⼈2来讲,L2⼜是严格劣与R2的,因此就可以将L2在参与⼈2的战略空间中剔除,博弈双变成了如下情况:1/2 R2L1 1,2上述的过程就可以称为“重复剔除严格劣策略”。

第2章完全信息静态博弈

第2章完全信息静态博弈

存在问题
▪ 伯特兰德模型之所以会得出这样的结论,与它的前提假 定有关。从模型的假定看至少在以下两方面的问题:
▪ ①假定企业没有生产能力的限制。如果企业的生产能力 是有限的,它就无法供应整个市场,价格也不会降到边 际成本的水平上。
▪ ②假定企业生产的产品是完全替代品。如果企业生产的 产品不完全相同,就可以避免直接的价格竞争。
演唱会
李 亚
足球
2,1

演唱会 -1,-1
0,0 1,2
某策略组合只有指向的箭头,没有 指离的箭头,则为稳定性的策略组合
猜硬币方

硬 币
正面
方 反面
正面
方面
-1,1 1,-1
1,-1 -1,1

弈上 方
1

博弈方2



1,0 1,3 0,1
0,4 0,2 2,0
1.3 画线法
由于决策的原则是使自己的得益尽可能的 大。同时由于一方的得益取决于其他方的策 略。
s
令p 为商店i的价格,D (p ,p ) 为需求函数, i=1,2。
i
i 12
如果住在x左边的将都在商店1购买,而住在xs右边的将在商店 s 2购买,需求分别为:
D =x,D =1-x,
1
2
这里x满足 p1+tx=p2+t(1-x)
解上式,得需求函数分别为: D1(p1,p2)=x=(p2-p1+t)/2t D2(p1,p2)=1-x=(p1-p2+t)/2t
第二章
博弈论——完全信息静态博弈
static games of complete formation
完全信息静态博弈

博弈论与信息经济学课件2—完全信息静态博弈1

博弈论与信息经济学课件2—完全信息静态博弈1

定义一:
完全信息静态博弈(策略型博弈)是指在博弈
中局中人的信息是完全的,并且局中人同时采取行 动或局中人的行动有先有后,但后行动者不知道先 行动者的行动选择的一种博弈。
§1 完全信息静态博弈的表示—支付矩阵
1.2 策略型博弈的表示
1、局中人(Players):i , 1, 2,..., n ; 2、策略空间(Strategies): Si si , i 1, 2,..., n; 3、支付函数(Payoff Functions): ui ui (s1 , , si , , sn );
现实中的囚徒困境——公共资源过度使用
哈丁,1968年,《科学》杂志, 《公共地悲剧》
牧民乙
1只
牧 民 甲
2只
60, 120 80, 80
1只 2只
100, 100 120, 60
现实中的囚徒困境
应试教育与素质教育的两难选择
为什么路越来堵?
为什么成绩越来越高?
团队生产中的偷懒
„„„
现实中的囚徒困境
齐 威 王
上中下 上下中 中上下 中下上 下上中 下中上
性别大战博弈
女生 足球 足球 男生 歌剧 3,2 -1,-1 歌剧 1, 1 2, 3
§2 占优策略(上策)及占优策略(上策)均衡
例:囚徒困境
坦白 坦白 甲 不坦白
乙 不坦白
-5,-5
-8,0
0,-8
-1,-1
“坦白”是甲的优势策略 (坦白,坦白) “坦白”也是乙的优势策略 囚徒困境模型反应了个体理性与集体理性的冲突
完全信息静态博弈
四种博弈类型
完全信息动态博弈
不完全信息静态博弈 不完全信息动态博弈

1.1完全信息静态博弈:基础理论

1.1完全信息静态博弈:基础理论

纳什均衡与协议的理念
和纳什均衡推导密切相关的是协议的理念:对给定 的博弈,如果参与者之间要商定一个协议决定博弈 如何进行,那么一个有效的协议中的战略组合必须 是纳什均衡的战略组合,否则,至少有一个参与人 会不遵守该协议。 为更准确地理解纳什均衡这一概念,下面求解几个 例题。

寻找纳什均衡的方法:划线法
纳什均衡和重复剔除严格劣战略均衡的关系
如果用重复剔除严格劣战略把除战略组合{s*1,…,s*n} 外所有的战略组合都剔除掉,则该所存战略组合就是 此博弈惟一的纳什均衡。 不过,由于重复剔除严格劣战略并不经常会只剩下惟 一的战略组合,纳什均衡作为比重复剔除严格劣战略 更强的解的概念,自然受到更多关注,理由如下: 如果战略组合{s*1,…,s*n}是一个纳什均衡,它一定不 会被重复剔除严格劣战略所剔除,但也可能有重复剔 除严格劣战略无法剔除的战略组合,其本身却和纳什 均衡一点儿关系都没有。

博弈的要素:
现在我们回到一般情况。 博弈的标准式表述包括: (1)博弈的参与者; (2)每一参与者可供选择的战略集; (3)针对所有参与者可能选择的战略组合,每 一个参与者获得的收益。

考虑n个参与者的博弈: (1)参与者从1到n排序; (2)设其中任一参与者的序号为i,令Si代表参 与者i可以选择的战略集合(称为i的战略空间),其 中任意一个特定的战略用si表示(有时我们写成, si∈Si表示战略si是战略集Si中的要素); (3)令(s1,...,sn)表示每个参与者选定一个战略形 成的战略组合,ui表示第i个参与者的收益函数, ui (si,...,sn)即为参与者选择战略(s1,...,sn)时第i个 参与者的收益。
0
0
智猪博弈3:劳而不得!

博弈论完全信息静态博弈

博弈论完全信息静态博弈
12
我们用ui(a)表示在行动组合a=(a1,a2,…,an)下 参与人i的支付(或效用水平), u(a)=(u1(a),… ,un(a))表示n个参与人的支付 组合。
博弈的一个基本特征是一个参与人的支付 不仅取决于他自己的行动选择,而且也取 决于其他所有参与人的行动选择。
13
2.2 纳什均衡

2.2.1 占优战略(上策)均衡
对某个参与人来说,


若存在一个行动严格优于其他行动,即选择这个行 动所得到的好处大于选择其他行动所带来的好处, 并且他的这个选择不依赖于其他参与人的行动选 择,也就是说,不论其他参与人选择什么行动,

他的最优行动都是这个行动,则这个行动被称 为“ 占优战略”(上策)(dominant strategy)。
8
(3) 对每一个参与人i都有一个 建立在集合 上的偏 好关系 (参与人 i的偏好关 系)。
9
定义:集合X上的偏好表示X上的一种二元 关系,是对集合X上的所有元素的一个全 排序。它满足以下三个性质: 对任意 ,有 1) 完备性: 2) 传递性:若 那么 ; 3) 自反性: 或 且 ; ,

10
被定义为: a b当且仅当ui(a)
1,2 0,1

L 参与A U
1,0
M
1,2
26

C1 R1 R2 R3 2,12 0,12 0,12 C2 1,10 0,10 0,10 C3 1,12 0,11 0,13
C2 R2 C1 R3--Æ(R1,C3) R3 C3 C2 R2Æ(R1,C1)
27
2.2.3 纯战略纳什均衡

使用重复剔除法剔除到最后剩下的行 动组合不一定唯一,我们就需要考虑比 重复剔除占优战略纳什均衡更弱的纳什 均衡。 如:市场进入博弈

第二章(完全信息静态博弈)PPT课件

第二章(完全信息静态博弈)PPT课件

q2 R2(q1)
(3,0) (6,0)
q1
图2.9 古诺模型的反应函数几何描述
2021
27
三、伯特兰德寡头模型——价格博弈
当厂商1和厂商2价格分别是 P1 和 P2 时,它们各 自的需求函数为 :
q 1 q 1 ( P 1 ,P 2 ) a 1 b 1 P 1 d 1 P 2 q 2 q 2 ( P 1 ,P 2 ) a 2 b 2 P 2 d 2 P 1
一、纳什均衡的定义
n个参与人的策略式表达博弈:G {S1, ,Sn;u1, un},
策略组合 S*{S1 *, ,Si*, Sn *}是一个纳什均衡,如果
对于每一个
i,s
* i
是给定其他所有参与人选择
S * 1 { S 1 * , ,S i* 1 ,S i* 1 S n * }的情况下第 i个参与人的
2021
17
三、纳什均衡与上述分析方法的关系
(一)纳什均衡与上策均衡的关系 上策均衡是比纳什均衡更强、稳定性更高的均衡 概念
纳什 均衡
上策均衡
图2.8 纳什均衡与上策均衡的关系
2021
18
G { S 1, ,S n;u 1, u n}
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G {S1, ,Sn;u1, un}中,
2021
16
正是由于纳什均衡是一致性预测,因此才进一 步有下列性质:首先,各博弈方可以预测它,可以 预测他们的对手会预测它,还可以预测他们的对手 会预测自己会预测它,……;其次,预测任何非纳 什均衡策略组合将是博弈的最终结果,意味着要么 各博弈方的预测其实并不相同(预测不同的纳什均 衡会出现等),要么预期至少一个博弈方要“犯错 误”,包括对博弈结构理解的错误,对其他博弈方 的策略预测错误,其理性和计算能力有问题,或者 是实施策略时会出现差错等。

经济博弈论完全信息静态博弈

经济博弈论完全信息静态博弈

19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。

第二章 完全信息静态博弈(一)

第二章 完全信息静态博弈(一)

纳什均衡的一致预测性质
由纳什均衡的一致预测,可以得出以下性质:
(1) 各博弈方可以预测纳什均衡,可以预测他们的
对手可以预测它,还可以预测他们的对手预测自己 会预测它……
(2) 预测任何非纳什均衡策略组合将是博弈最终结
果,意味着至少一个博弈方要“犯错误”,包括对 博弈结构理解错误,对其他博弈方策略预测错误, 理性和计算能力有问题,或实施策略出错。
2.2 纳什均衡
1)博弈的策略式表示 博弈的策略式表示 2)纳什均衡的定义 纳什均衡的定义 3)纳什均衡的一致预测性质 纳什均衡的一致预测性质 4)纳什均衡与严格下策反复消去法 纳什均衡与严格下策反复消去法
博弈的策略式表示
博弈的策略式表示: 博弈的策略式表示:
1、博弈的参与人集合: i ∈ Γ , Γ = (1, 2, L , n ); 2、每个参与人的有一个策略空间,用 S i 表示i的策略空间, i = 1, 2, L , n; sij ∈ S i 表示i的第j个策略,j为有限或无限 ; 3、每个参与人的得益函数 ui , i = 1, 2, L , n; 它是 策略的多元函数 ; L 4 、用 G = {S1, , S n ; u1 , L , u n } 代表n人博弈。
* * * 为博弈G的一个 略纳什均衡” 的一个“ 则称 {s1 , s2 ,L, sn } 为博弈 的一个“略纳什均衡”。
纳什均衡的一致预测性质
所谓“一致预测性”指:如果所有博弈方都预 测一个特定的博弈结果会出现,那么所有的博 弈方都不会利用该预测或者这种预测能力,选 择与预测结果不一致的策略,即博弈方没有偏 离预测结果的愿望。 “一致”是指,各博弈方的实际行为选择与他 们的预测一致,而不是不同博弈方的预测相同、 无差异,因为有些博弈可能没有纳什均衡,而 有些又有多个纳什均衡,而且无显著优劣。

博弈论第二章 (1)

博弈论第二章 (1)
囚徒2 坦 白 囚 坦 白 徒 1 不坦白 -5, -5 -8, 0 不坦白 0, -8 -1, -1
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3

3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略

二、重复剔除严格劣战略


(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5

第二讲完全信息静态博弈讲义

第二讲完全信息静态博弈讲义
10
这就是我们看到的为什么大多数 路、桥等公共设施都是由政府出资修建 的原因。
同样的道理,国防、教育、社会 保障,环境卫生等都由政府承担资金投 入,私人一般没有积极性承担这方面服 务的积极性和能力。
11
上策均衡分析存在的问题
这里的问题是并非每个博弈方都有这种绝 对偏好的上策,而且常常是所有博弈方都没有 上策,因为博弈方的最优策略随其他博弈方的 策略而变化正是博弈问题的根本特征,是博弈 关系相互依存性的主要表现形式。因此上策均 衡不是普遍存在的。
第二章 完全信息静术味浓厚一些),译自英文Game theory,直译应该是游戏理论。一般来讲,日常 生活中,下棋打牌、赌胜博彩,以及田径、球类 等各种体育比赛,都是游戏。
2
博弈的通俗理解
游戏有以下特征(打牌为例):(1)都 有一定的规则,几副牌,几个打,可以做什 么,不可以做什么,按什么次序出牌,犯规 了怎样处置等等。(2)都有一个结果。是输 还是赢,升几级等。(3)策略至关重要,先 出什么再出什么都蕴涵着策略,不同的策略 选择带来不同的结果。(4)策略和利益有相 互依存性,即每一个游戏者所得结果的好坏, 不仅取决于自身的策略选择,也取决于其他 参加者的策略选择。
12
2.1.2 严格下策反复消去法
如同寻找每个博弈方最优的策略思路一样, 如果找到每一个博弈方的最差策略,则可以将 其消去。一般地,如果在一个博弈中,不管其 他博弈方的策略如何变化,一个博弈方的某种 策略给他带来的得益,总是比另一种策略给他 带来的得益要小,那么我们称前一种策略为相 对于后一种策略的一个“严格下策”。很显然, 任何理性的博弈方都不可能采用严格下策,因 此可以将其消去。
们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。

第2章_完全信息静态博弈

第2章_完全信息静态博弈
* q2 R2 ( q1 )
2.3.1 古诺的寡头模型
反应函数:是指每个博弈方针对其他博弈方所有战略的最佳反应构成 的函数。 纳什均衡就是各个博弈方的一组互为最佳反应对策的战略。
2.1.1 占优战略均衡(上策均衡)
开发商B 需求大的情况 开发商A 不开发 开发 开发 4000,4000 0,8000 不开发 8000,0 0,0 开发商B B严格劣 战略
A严格劣 战略
需求小的情况
开发
开发 开发商A 不开发 0,1000 -3000,-3000
不开发
1000,0 0,0
2.1.1 占优战略均衡(上策均衡)
-8, -8 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
-1, 1 1, -1
1, -1 -1, 1
2.1.4 箭头法
基本思路
对博弈中每个策略组合进行分析,考察在每个策略组合
处各个博弈方能否通过单独改变自己的策略而增加得益。
如能,则从所分析的策略组合对应的得益数组引一箭头, 到改变策略后策略组合对应的得益数组。最后综合分析 对每个策略组合的分析情况,形成对博弈结构的判断。
有任何人有积极性破坏这个协议,则这个协议是自动
实施的。这个协议就构成了一个纳什均衡。
2.2 纳什均衡
通俗地说,纳什均衡的含义就是:
给定你的策略,我的策略是最好的策略;给定我的策略,
你的策略也是你的最好的策略。即双方在给定的策略下
不愿意调整自己的策略。
2.2 纳什均衡
寻找纳什均衡
参与人B
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章完全信息静态博弈的基本理论0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。

特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。

一.求解方法之一:剔除严格劣策略1.占优策略与劣策略。

严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。

弱占优策略与弱劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付不低于b策略,且至少有一种情况下的支付会严格大于b策略,则称b策略是相对于a策略的弱劣策略(weakly dominated strategy );a策略则是相对于b策略的弱占优策略(weakly dominating strategy)。

占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。

特别提示:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。

类似地,可以定义局部劣策略与全局劣策略。

理性的人在博弈时绝对不会选择严格劣策略。

通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。

2.案例案例1乙甲坦白不坦白案例2乙不作广告甲 不作广告作广告在上面的两个例子中,通过剔除严格劣策略,可以获得一个占优策略均衡(坦白,坦白),(作广告,作广告)。

3.请思考下面这个例子是否存在占优策略均衡?经过重复剔除严格劣策略,可以获得一个占优策略均衡(上,中),这就是求解方法之一——严格劣策略的迭代剔除方法。

思考:占优策略均衡(上,中)是通过不断剔除严格劣策略而获得的,为了成功地进行剔除,需要什么样的前提条件?由此可以理解公共知识的重要性。

4.思考:下面这个博弈是否存在占优策略均衡?5.社会(或集体)困境(dilemma)、合作与非合作博弈、占优策略均衡(1)案例案例1:霍布斯博弈假设鲁滨逊与星期五生活在一个自然状态之中。

为了生存,他们各自有两个选择:自己生产财富或掠夺对方的财富。

博弈情形如下:乙甲生产掠夺思考:面对囚徒困境、广告博弈、霍布斯博弈,请思考如何解决社会困境?(答案略;最低价格承诺实际上就是为解决寡头之间的串谋困境提供了有效的解决机制)案例2:1964年以前,美国香烟的电视广告非常普遍,1964年卫生总监的报告宣布以后,美国四大烟草公司经过协商与联邦政府达成协议,决定不再做电视广告,协议于1971年生效。

各大烟草公司的利润得以大幅增加。

(2)合作博弈与非合作博弈A合作博弈:参与人直接事先达成具有约束力的协议,以集体协商的方式选择策略,故又可称之为联盟博弈。

由此形成的策略选择与支付被称为博弈的合作解,通常以帕累托最优作为度量标准。

合作博弈其实就是指参与人在行动前能够实现进行沟通、交流,且沟通交流达成的协议是有约束力的。

B非合作博弈:又称策略博弈,参与人以独立的方式选择策略。

由此形成的策略选择与支付被称为博弈的非合作解。

C一般所说的博弈论是指非合作博弈理论。

(3)社会(或集体)困境与占优策略均衡A所谓社会(或集体)困境就是指博弈的不合作解与合作解相悖。

B凡是存在社会(或集体)困境问题的场合必定存在占优策略均衡,即社会(或集体)困境问题是存在占优策略均衡的重要博弈类型。

C注意:不要认为占优策略均衡都一定意味着社会(或集体)困境。

以下面的政治博弈为例:甲乙作为竞选的对手,分别有三种立场可以选择:左中右;选民的分布是对称的;甲乙均追思考:该博弈存在占优策略均衡吗?该博弈存在社会困境吗?从这个博弈可以看出,只有中间立场在政治上被充分表达,绝大多数的非中间立场的选民的立场被严重忽视。

(4)占优策略均衡在制度设计中有着广泛的应用价值。

二.求解方法之二:最优反应法——符合理性人性质的方法,博弈论最重要的求解方法1.最优反应策略:给定其他所有参与人策略选择的情况下,能够给某参与人带来最大收益的策略,其思维过程为:如果对手采用……,某参与人就应该采用……。

这是一种相对优势策略。

通过最优反应方法所获得的博弈解称之为纳什均衡。

2.如何寻找纳什均衡?划线法(仅适合二人有限策略博弈)案例2 选址博弈甲乙两家百货公司考虑开店,可供选择的地址有四个:市郊、市中心、城市东部、城市西部。

具体支付情况如下:3.纳什均衡:它是由全部参与人所选择的策略构成的这样一个组合,在这个组合中,每个参与人的策略都是针对其他参与人人策略选择的最优反应。

特别注意,均衡是针对策略组合的,而不是支付组合的,即在上面的博弈中,(下,右)才是均衡,(6 6)是这个博弈的均衡结果,不要把均衡与均衡结果混淆,这显然与微观经济学不同,在微观经济学中均衡是针对结果而言的。

4.关于纳什均衡的体会:纳什均衡具有策略稳定性,在均衡状态之下没有人愿意单方面改变自己的策略选择,因此,纳什均衡具有自我实施特征。

特别说明:策略稳定性不同于均衡稳定性。

5.纳什均衡与占优策略均衡(1)占优策略均衡肯定也是纳什均衡,但是纳什均衡不一定是占优策略均衡。

(2)纳什均衡与占优策略均衡都是博弈的非合作解。

6.多重纳什均衡问题(1)寻找下列博弈的纳什均衡 案例1 节目选择博弈案例2 夫妻博弈妻夫 足球芭蕾上述两个例子的共同特点就是存在多个纳什均衡,这是纳什均衡的最大缺陷,降低了纳什均衡解的预测能力,因为一旦参与人的预期不一致,就可能出现极为糟糕的结局。

(2)多重纳什均衡的精炼(refine )所谓精炼就是通过附加另外的合理的标准,使得某些不合理的纳什均衡被剔除掉,以减少纳什均衡的个数,提高理论分析对现实的预测能力(因为纳什均衡只是涵盖了理性的一个方面:最优反应)。

精炼方法之一:寻找支付帕累托占优均衡乙甲推不推通过比较发现,精炼方法之二:寻找风险占优均衡通过比较发现,在上面的博弈中,(不推,不推)在风险上优于(推推)精炼方法之三:寻找焦点(focus)或谢林点(schelling point)所谓焦点就是指那些依据某种线索或信号(如:历史、习俗、惯例、经验、自然或社会标志物)能够成为所有博弈参与人共识的纳什均衡。

特别说明:一方面,习俗和惯例能够为多重纳什均衡提供解,另一方面,习俗和惯例的稳定性正在于它们是纳什均衡。

虽然依据某些线索或信号,某个纳什均衡更有可能发生,成为博弈的焦点,但是并不是所有存在多重纳什均衡的博弈都有焦点。

三.求解方法之三:最大最小(maxmin)方法,一种非常保守稳健的方法1.最大最小策略:首先确定参与人在每一个策略下所能够获得的最小支付,在所有的最小支付中最大那个支付所对应的策略就是最大最小策略。

由所有参与人的最大最小策略所构成的策略组合就是博弈的最大最小解,2.案例案例1:抢答博弈乙甲按不按案例2:开车博弈乙甲 等待前行3.最大最小解与纳什均衡的关系(1)零和博弈与非零和博弈;常数和博弈与非常数和博弈零和博弈:在任何博弈策略组合下所有参与人的支付总和均为零。

非零和博弈:在任何博弈策略组合下所有参与人的支付总和并不都是零。

常数和博弈:在任何博弈策略组合下所有参与人的支付总和为一个常数,其实任何常数和博弈均可以转化为零和博弈。

非常数和博弈:在任何博弈策略组合下所有参与人的支付总和不是一个常数。

(2)在常数和博弈中,最大最小解与纳什均衡解是一致的。

在非常数和博弈中,最大最小解与纳什均衡解可能不一致。

采用最大最小方法的逻辑在于无论我选择什么策略,对手的最佳反应是采取使我支付最低的策略,故这个方法特别适合于零和博弈。

特别注意:最大最小方法并不适用于求解所有的零和博弈,如配硬币博弈就是一个例子。

案例:配硬币博弈乙甲 正面反面(3)当最大最小解与纳什均衡解不一致时,采用哪种方法更加合理?一般来说,纳什均衡解更加合理,但是一旦存在多重纳什均衡且无法进行精炼,博弈存在极大的不确定性时,采用最大最小方法更加合理。

思考:配硬币博弈是否存在纳什均衡?乙甲正面反面四.混合策略纳什均衡1.在配硬币博弈以及儿童常玩的“石头、剪刀、布”一类的游戏中,按照我们前面给出的寻找纳什均衡的方法,不存在纳什均衡。

对这类游戏,人们的一个经验就是避免行为的规律性,随机地选择自己的策略,使得对手摸不着北,然后看能否凭运气击败对手,即使自己的策略选择具有不可预测性。

2. 混合策略(mixed strategy)与纯策略(pure strategy)(1)混合策略:参与人策略集上的概率分布,即参与人以随机方式选择策略。

假设参与人拥有两个策略,则混合策略可以写成(p,1-p);假设参与人拥有三个策略,则混合策略可以写成(p,r,1-p-r)(2)纯策略:参与人以非随机的方式选择策略,其实,纯策略是一种特殊的混合策略。

纯策略其实就是指博弈矩阵旁边标示的策略,或者说参与人策略集中所包括的策略。

3.参与人的期望支付(1)一旦参与人采取混合策略,参与人的支付就必须用期望支付来表示。

(2)一个实例:计算甲乙参加配硬币博弈的期望支付乙甲 正面反面假设甲选择正面的概率为p EU 甲=(11(1))p q q -•+•-+(1)(1(1)(1))p q q -•+-•-=(21)(12)q p -- EU 乙=(21)(21)q p --(3)二人博弈中计算期望支付的一般公式1mi EU ==∑甲1ni j ijj p q a=∑1mi EU ==∑乙1nij ijj p q b=∑依据:当对手正在进行随机选择时,他一定会选择这样的概率组合,使得我选择任意纯策略的期望收益均相等,从而使我无从下手,所以我也将进行随机选择,而且我选的概率组合也会使得对手无所适从。

于是所有参与人的混合策略就构成了一个纳什均衡。

4.混合策略纳什均衡(1)混合策略纳什均衡是指这样一个策略组合,每个参与人的混合策略都是针对其他参与人所选择的混合策略的最优反应。

相应地,过去所说的纳什均衡就叫纯策略纳什均衡。

(2)如何计算混合策略纳什均衡?案例1:计算配硬币博弈的混合策略纳什均衡(答案略)案例2:计算夫妻博弈的混合策略纳什均衡,并且将混合策略均衡下参与人的支付与纯策略情况下的支付进行比较(答案略,注:协调博弈下的混合策略纳什均衡是不稳定的,只要略为偏离该概率分布,参与人的最优反应策略就是纯策略)。

相关文档
最新文档