第二章完全信息静态博弈(09)
第二章 完全信息静态博弈
两寡头间的囚徒困境博弈
厂商2
不突破
厂 不突破 商 1 突破
突破
4.5,4.5
5,3.75
3.75,5
4,4
以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
2.3.2 反应函数(划线法)
古诺模型的反应函数
(0,6) R1(q2)
Cont…
反应函数: *
P
* 2
P 1
1 * ( a1 d1 P 2 ) 2b 1
2.3 无限策略分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 豪泰琳模型
2.3.1 古诺的寡头模型
企业Cournot模型 (无限策略博弈) 古诺( Cournot ,1838)比纳什(1950)定义早100年 假设条件: 1. 在一个寡头市场上两企业生产销售同质产品,市场 总产量Q = q1+q2 (两寡头企业就是指这两家企业 垄断了某一行业的市场) 2. 市场出清价格 P = 8 - Q 3. 生产无固定成本,边际成本 c=c1=c2=2 4. 两企业同时独立地决定各自的生产产量(q1, q2) 问题:两家企业应如何决策?
2.2.2
纳什均衡与一致预期
一致预期:基于信念的选择是合理的;支持选择的 信念是正确的; 预期的自我实现:如何所有人认为这个结果会出现, 这个结果就会出现。预期是自我实现的,预期不会 错误。如果你认为我预期你将选择X,你就真的会 选择X。
2.2.3 纳什均衡与严格下策反复消去法
上策均衡定是纳什均衡,但纳什均衡不一定是上策均衡 命题2.1:在n个博弈方的博弈 G {S1 ,Sn ; u1 ,un } 中,如 * * 果严格下策反复消去法排除了除 (s1 , sn ) 之外的所有策 * * 略组合,那么 (s1 , sn ) 一定是该博弈的唯一的纳什均衡 命题2.2:在n个博弈方的博弈中G {S1,Sn ; u1,un } 中,如 * * , sn )是 果 (s1 G 的 一个纳什均衡,那么严格下策 反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严 格下策反复消去法简化博弈是可行的
[数学]第二章完全且完美信息静态博弈
ui (si/,s-i) > ui (si*,s-i)
s-i=(s1,…,si-1,si+1,…,sn)都成立。
…(1)
对任意由其他博弈方此时尚未消去的所有策略构成的策略组合
由于假设si*是纳什均衡(s1*,s2*,…,sn*)的各方策略中第一 个被消去的,因此其他博弈方的策略s1*,…,si-1*,
相对最佳对策总是存在的,不过不一定唯一)。若存在一个
策略组合,使得所有博弈方的得益值下都划了线,则该策略
14:49:49
组合就是一个纳什均衡。
12
例3:博弈G如右图: 上
博弈方Ⅰ
下
博弈方Ⅱ 左 中 右 1,0 1,3 0,1 0,4 0,2 0,0
解:该博弈的纳什均衡为(上,中)。
14:49:49
U
2,8 S 0,8 D 0,8
1,6 0,6 1,5 R
1,8 0,8 0,9
博弈方Ⅰ的策略“S”和“D” 都是策略“U”的严格下策,消去 策略“S”和“D” 后剩下唯一策略 组合(U,R)。
14:49:49
U S D
1,8 0,8 0,9
10
L
2)博弈方Ⅰ的策略“S” 和“D”都是策略“U”的下策
该博弈反复消去严格下策均衡。
14:49:49
严格下策反复消去法中每次消去的必须是严格下策,否
则会出现一些意想不到的结果。
例2:博弈G如下图:
博弈方Ⅱ
U
L 2,8
M 1,6
0,6
R 1,8
0,8
博弈方Ⅰ S 0 , 8 D 0,8
14:49:49
1,5
0,9
9
L
M
应用博弈论第二讲完全信息静态博弈
•
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。
•
例2
为什么中小企业不会花钱去开发新产品 ?
•
完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。
•
生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。
•
例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。
第二讲 完全信息静态博弈
得每个参与人的策略是对其他
参与人策略的最优反应。
在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法
箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法
第2章_完全信息静态博弈
2. “斗鸡博弈” 斗鸡博弈”
甲、乙两人相对而行,试图通过一座独木桥。 乙两人相对而行,试图通过一座独木桥。 独木桥仅能容纳一人通行。 独木桥仅能容纳一人通行。 如果两人坚持继续前行, 如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄 的独木桥,两人都会掉到河里, 的独木桥,两人都会掉到河里,均得到收益 -10。 。 如果甲选择退让,让乙先行, 如果甲选择退让,让乙先行,那么得意的乙将得到收益 20, , 面子受损的甲 得到收益 -2。 。 如果乙选择退让,让甲先行, 如果乙选择退让,让甲先行,那么得意的甲将得到收益 20, , 面子受损的乙得到收益 -2。 。 如果甲和乙均选择退让, 如果甲和乙均选择退让,那么双方均得到收益 10。 。
2.智猪博弈 .
猪栏里养了两头猪,一头大猪、一头小猪。 猪栏里养了两头猪,一头大猪、一头小猪。 在猪圈的一端有一个盛食槽。 在猪圈的一端有一个盛食槽。 在猪圈的另一端有一个按压式开关。 在猪圈的另一端有一个按压式开关。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 大猪和小猪都在思考是否去按压开关。 大猪和小猪都在思考是否去按压开关。
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第二章
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
2.通过“划横线法”求解“智猪博弈”的均衡 .通过“划横线法”求解“智猪博弈”
小猪 按开关 按开关 大猪 等待 (10,-2) , ) (0,0) , ) (5,-1) , ) 等待 (4,2) , )
完全信息静态博弈
• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。
•
R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)
•
F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。
完全信息静态博弈教学课件
完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。
第二章完全信息静态博弈的基本理论
第二章完全信息静态博弈的基本理论第二章完全信息静态博弈的基本理论0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。
特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。
一.求解方法之一:剔除严格劣策略1.占优策略与劣策略。
严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b 策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。
弱占优策略与弱劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付不低于b策略,且至少有一种情况下的支付会严格大于b策略,则称b策略是相对于a策略的弱劣策略(weakly dominated strategy );a策略则是相对于b策略的弱占优策略(weakly dominating strategy)。
占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。
特别提示:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。
类似地,可以定义局部劣策略与全局劣策略。
理性的人在博弈时绝对不会选择严格劣策略。
通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。
2.案例案例1乙坦白不坦白甲坦白-6-6-10不坦白-10-1-1案例2乙不作广告作广告甲不作广告 8810 2作广告 21044在上面的两个例子中,通过剔除严格劣策略,可以获得一个占优策略均衡(坦白,坦白),(作广告,作广告)。
第2章完全信息静态博弈
存在问题
▪ 伯特兰德模型之所以会得出这样的结论,与它的前提假 定有关。从模型的假定看至少在以下两方面的问题:
▪ ①假定企业没有生产能力的限制。如果企业的生产能力 是有限的,它就无法供应整个市场,价格也不会降到边 际成本的水平上。
▪ ②假定企业生产的产品是完全替代品。如果企业生产的 产品不完全相同,就可以避免直接的价格竞争。
演唱会
李 亚
足球
2,1
鹏
演唱会 -1,-1
0,0 1,2
某策略组合只有指向的箭头,没有 指离的箭头,则为稳定性的策略组合
猜硬币方
盖
硬 币
正面
方 反面
正面
方面
-1,1 1,-1
1,-1 -1,1
博
弈上 方
1
下
博弈方2
左
中
右
1,0 1,3 0,1
0,4 0,2 2,0
1.3 画线法
由于决策的原则是使自己的得益尽可能的 大。同时由于一方的得益取决于其他方的策 略。
s
令p 为商店i的价格,D (p ,p ) 为需求函数, i=1,2。
i
i 12
如果住在x左边的将都在商店1购买,而住在xs右边的将在商店 s 2购买,需求分别为:
D =x,D =1-x,
1
2
这里x满足 p1+tx=p2+t(1-x)
解上式,得需求函数分别为: D1(p1,p2)=x=(p2-p1+t)/2t D2(p1,p2)=1-x=(p1-p2+t)/2t
第二章
博弈论——完全信息静态博弈
static games of complete formation
完全信息静态博弈
完全信息静态博弈
退 (2 , 0 ) ( 0 ,0 )
用划线法可得严格纳什均衡(退,进),(进,退)。 (试写出金发女郎博弈的矩阵,并求出NE)
例2.6 智猪博弈
猪圈里圈着两头猪,一头大猪,一头小猪。猪圈的一边有一 个猪食槽,另一边安装一个按钮,按一下按钮会有10个单位 的猪食进槽。但谁按按钮就需要付2个单位的成本。若大猪先 到,大猪吃到9个单位,小猪吃到1个单位;若同时到,大猪 吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位, 小猪吃4个单位,支付矩阵如下。
这时该博弈有惟一的纳什均衡(维护,维护)。
2.3 最优反应映射与纳什均衡
定义2.2 局中人的最优反应映射 定义 局中人i的最优反应映射是一个定义于策略组合集合S, 取值于 策略集 Si 的子集的集值映射(映射值为集合的映射称为集值映 S 射), ri ( s) ⊆ S i ,满足
i
ri ( s ) = {t i ∈ S i u i (t i , s −i ) = max u i ( s i , s −i )}
si ∈S i
定义2.2表明,局中人i的最优化反应映射 ri (s) 仅与 s −i 有关。 反应函数 当 ri (s) 为单点集时,称 ri (s ) 为局中人i的最优反应函数 最优反应函数,简称 最优反应函数 反应函数。这时将 ri (s ) 记为 BRi (s −i ) 。 反应函数
定义2.3 最优反应映射 定义
因s为纳什均衡需满足 si ∈ ri (s) ,故纳什均衡仅能存在于策 (北,东,陆 ) , 略组合(北,西,陆 ) , (南,东,海 ) 中。 (北,西,海 ) ,
* 2.对每个局中人 i , s i 是他应对 s −i 的最好的策略。 纳什均衡的定义
*
博弈论四种类型之完全信息静态博弈
博弈论四种类型之完全信息静态博弈决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。
完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。
⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。
在完全信息静态博弈中的均衡是纳什均衡。
最典型的例⼦是囚徒困境与智猪博弈。
下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。
【囚徒困境】中基于收益矩阵的模型描述如下:【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。
⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。
离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。
对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。
【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。
所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。
但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。
个⼈的最优选择从社会⾓度看并不是最优的。
社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。
【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚(第三⽅实施),会使两⼈合作,促进集体利益最⾼。
【智猪博弈】智猪博弈的收益矩阵模型如下:在此处,⼩猪有优势与劣势策略,但⼤猪没有,只能根据⼩猪的策略做出最佳应对,⽽⼩猪不会选择劣势策略,因此剔除⼩猪“按”的策略,此时,⼤猪的策略只能为“等”。
【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略,参与⼈选择策略A时的收益严格⼩于策略B时的收益。
第2讲 完全信息静态博弈【博弈论经典】
第2讲 完全信息静态博弈
• 例2:公共产品的供给也是一个囚徒困境问题。 如果大家都出钱兴办公共事业,所有人的福利都会增加。问题是,如果我出钱你 不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以,每 个人的最优战略是“不出钱”,这种情况下,使得所有人的福利都得不到提高。
例3:“军备竞赛”。 例4:经济改革本身也可能是这样,在许多改革中,改革要付出成本(包括风险), 而改革的成果大家共享,结果是:尽管人人都认为改革好,却没有人真正去改革, 大家只好在都不满意的体
第们集中讨论完全信息静态博弈。 • “完全信息”指的是每个参与人对所有其他参与人的特征(包括战略空间、支付
函数等)有完全的了解。 • “静态”指的是所有参与人同时选择行动且只选择一次。“同时行动”是一个信
息概念而非日历上的时间概念:只要每个参与人在选择自己的行动时不知道其他 参与人的选择,我们就说他们在同时行动。
的组合。 定义:在博弈的战略式表述中,如果对于所有的i,si*是i的占优
战略,那么,战略组合s* = s1*,...,s*n 称为占优战略均衡(do min ant
strategy equilibrium)
第2讲 完全信息静态博弈
• 在一个博弈里,如果所有参与人都有占优战略存在,那么,占优战略均衡是可以 预测的到惟一的均衡,因为没有一个理性的参与人会选择劣战略。
• 纳什均衡是完全信息博弈解的一般概念,也是所有其他类型博弈解的基本要求。
第2讲 完全信息静态博弈
• 1.纳什均衡 纳什对博弈论的贡献有两个方面:一是合作博弈理论中的讨价还价模型,称为纳什 讨价还价解(Nash bargaining solution); 二是非合作博弈论方面,这是他的 主要贡献所在。 纳什对非合作博弈的主要贡献是他在1950年和1951年的两篇论文中在非常一般意义 上定义了非合作博弈及其均衡解,并证明了均衡解的存在。这样就奠定了非合作 博弈论的基础。纳什所定义的均衡称为“纳什均衡”,它如同瓦尔拉斯均衡一样, 已成为经济学中的专家术语。
经济博弈论完全信息静态博弈
19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
第二章完全信息静态博弈
二、反应函数
前面讨论的两寡头古诺模型中,根据两厂商的 利润最大化条件可以得到两厂商的反应函数 (Reaction Function) :
q
1
R1 (q2 )
1 2
(6 q2 )
q
2
R2 (q1 )
1 2 (6 q1 )
第二十六页,编辑于星期三:十五点 五十五分。
q2 (0,6)
(0,3)
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G { S 1 , ,S n ;u 1 , u n } 中, 如果严格下策反复消去法排除了除 之外 (s1 *,,sn *) 的所有策略组合,那么 (s1 *, ,sn *)一定是该博弈唯一 的纳什均衡。
命题2.2 在n个博弈方的博弈 G { S 1 , ,S n ;u 1 , u n 中},如 果 (s1 *, ,s是n *)G的一个纳什均衡,那么严格下策反 复消去法一定不会将它消去。
古诺寡头模型——产量博弈分析(1)
两厂商的利润函数分别为:
u 1q 1P (Q ) c1 q 1q 1 [8 (q 1 q 2) ]2 q 1 6 q 1 q 1 q 2 q 1 2
u 2 q 2P (Q ) c2 q 2 q 2 [8 (q 1 q 2) ]2 q 2 6 q 2 q 1 q 2 q 2 2
第二章 完全信息静态博弈
基本分析思路和方法 纳什均衡 无限策略博弈分析和反应函数 混合策略和混合策略纳什均衡
第一页,编辑于星期三:十五点 五十五分。
第一节 基本分析思路和方法
上策均衡 ; 严格下策反复消去法; 划线法;
剪头法。
第二页,编辑于星期三:十五点 五十五分。
一、上策均衡
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、占优战略均衡定义:在博弈的战略 式表述中,如果对于任意参与人i,
s 是占优策略,那么策略组合
* i
s ( s, , s)
* * 1 * n
被称为占优战略均衡(Dominant-
strategy equilibrium)。
(四)重复剔除的战略均衡
“重复剔除严格劣战略”(Iterated elimination of strictly dominated strategies) 思路就是排 除法。
(二)纳什均衡定义: 在博弈G={S1,…,Sn;u1,…,un}中,如果
* * * * 策略组合 s 中任一参与人i ( s , , s , , s ) 1 i n
* s 的策略 i 是对其他参与人策略组合
* * * * * s ( s , , s , s , , s ) 的最优策略,即 i 1 i 1i 1 n
成立时,策略组合s*才是一个强纳什均衡 (Strict or strong Nash equilibrium)。
(三)占优战略均衡
1、 “占优战略”(Dominant strategy) 是指参与人在一些特殊的博弈中不受其 它参与人的策略选择影响的最优策略。 也就是说,不论其它参与人选择什么策 略,他的最优策略都是唯一的、不变的。
智猪博弈 小猪
按 按 等待
大 猪 等
待
3 ,1 7,-1
2,4 0,0
参与人B L M R
参 与 人 A U D 1, 1, 0, 0 2 1 0, 0, 2, 3 1 0
C1
参 与 人 A R1 R2 R3
参与人B C2 C3
2,12 1,10 1,12 0,12 0,10 0,11 0,12 0,10 0,13
R3→C3→C2→R2 (R1, C1) C2→R2→C1→R3 (R1, C3)
参与人B L R 参 与 人 A
U D
8, 10 10 00, 9 7, 6, 6 5
(五)重复剔除劣策略的 占优战略均衡的应用
第二高价拍卖 (Second Price Auction)
An auction in which the bidder who submitted the highest bid is awarded the object being sold and pays a price equal to the second highest amount bid.
S1,…,Sn——参与人的策略空间,所谓策略空间是 指每个参与人的全部可选策略的集合;
sij∈Si——参与人i的第j个策略,其中j可取有限个值 (有限策略博弈),也可以取无限个值(无限策略 博弈)。
ui——参与人i的得益或效用,它是各参与人策略的多 元函数。
n人博弈可以写成G={S1,…,Sn;u1,…,un}
Reference books:
张维迎,博弈论与信息经济学,
Drew Fudenberg and Jean Tirole, Game Theory,
the MIT Press,1991. Eric Rasmusen, Games & Information—an Introduction to Game Theory, Third Edition, Blackwell Publishers Inc., 2001. Roger B. Myerson, Game Theory—Analysis of Conflict, Harvard University Press, 1991.
Characteristics of Different Types of Auctions
Type Rules
English, or ascending-price. Open.
Seller announces reserve price or some low opening bid. Bidding increases progressively until demand falls. Winning bidder pays highest valuation. Bidder may re-assess evaluation during auction. Seller announces very high opening bid. Bid is lowered progressively until demand rises to match supply. Bids submitted in written form with no knowledge of bids of others. Winner pays the exact amount he bids.
3、注意:
如果每次剔除的是严格劣策略,均衡结果与
剔除的顺序无关。 如果剔除的是弱劣策略,则均衡结果可能与 剔除顺序有关。 重复剔除的占优战略均衡不仅要求每个参与 人是理性的,而且要求“理性”是参与人的 共同知识。即所有参与人都知道所有参与人 是理性的,所有参与人都知道所有参与人…。 当支付取某些极端值时,重复剔除的占优均 衡不一定是一个合理的预测结果。
** * u ( s , s ) u ( s , s ), s S , i i i i i ij i ij i
* * * * 则称 s 为博弈G的一个“纳 ( s , , s , s ) 1 i, n
什均衡”。
纳什均衡是所有参与人最优策略的组合。 在给定别人策略的情况下,没有任何单个参与人 有积极性选择其它策略,从而没有任何人有积极性 打破这种均衡。
李四
A
B
C
甲
张 三
2, 2
1, 3
3, 1
2, 2
0, 2
3, 2
乙
丙
2, 0
2, 3
2, 2
最后归宿的博弈
纳什均衡有强弱之分( Harsanyi,1973)
当且仅当对于所有的参与人i,s
' i
s
* i
不
等式
u ( s , s ) u ( s , s ), s i
* i i i ' i i i
称
s
' i
弱劣于策略
s
'' i
,
s
'' i
称为相对于 s i'
的弱占优策略。
2、重复剔除的占优均衡
如果策略组合 s ( s, , s)是重复剔除劣
* * 1 * n
策略后剩下的唯一的策略组合,那么,策略
* * * s ( s , , s ) 被称为重复剔除的占优 组合 1 n
战略均衡。
第二章 完全信息静态博弈
Static Games of Complete Information
@ 2009 Zheng Daowen, All Rights Reserved
什么是完全信息静态博弈?
“完全信息”是指每个参与人对其它参与 人的特征(包括战略空间、支付函数等) 有完全的了解或者说了如指掌。 “静态”是指所有参与人同时选择行动, 且只选择一次。即使不是同时选择行动, 只要每个参与人在选择行动时不知道其 它参与人的选择,在知道后不改变自己 的选择,参与人的行动也可以被看作是 同时行动。
第二节 无限策略博弈的解和反应函数 第三节 混合策略
第四节 纳什均衡的存在性
第一节 纳什均衡 Nash Equilibrium
一、求解博弈的方法
1、划线法就是在每一个参与人针对竞争对手 每一策略的最大可能收益(或效用)下划线 以求得博弈解的方法。
2、箭头法就是通过反映参与人选择倾向的箭 头寻找稳定性策略组合的方法。
si ∈[0,+∞).
The highest bidder wins the object and pays the second bid, that is si max sj
ji
Bidder i has utility
u sj max i i
j i
The other bidders pay nothing, and therefore have utility 0. For player i the strategy of bidding his valuation (si=υi) weekly dominates all other strategies
“完全信息静态博弈”是每个参与人 都知道其它参与人特征的情况下, “同时”选择策略或采取行动的 博弈。
博弈分析的目的→预测博弈的均衡结果
给定每个参与人都是理性的(Rational),
每个参与人都知道所有参与人都是理性
的情况下,什么是参与人的最优策略? 什么是参与人的最优策略组合?
第一节
纳什均衡
左 上 甲 方 下 1,0
乙方 中 1,3
右
0,1
0,4
0,2
2,0
参与人B
L C 4,0 0,4 3,5 R 5,3 5,3 6,6
参 与 人 A
U M D
0,4 4,0 3,5
Hale Waihona Puke 左 上 1,0乙 方 中
1,3
右 0,1
甲 方
下 0,4 0,2 2,0
二、纳什均衡
(一)博弈的标记法
常用G表示一个博弈;n——博弈参与人的数量;