第二章 完全信息静态非合作博弈
非合作博弈经济管理学及财务知识分析理论
(7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
市场进入博弈-2阶段不完全信息动态博弈
基本思路-不完全信息动态博弈
在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡 概念没有规定参与人如何修正自己的信念。但是,如果进 入者可以任意修订自己有关在位者成本函数的信念,上述 不完全信息动态博弈可以有任意均衡。
假定参与人的类型是独立分布的,参与人i有K个类型, 有h个可能的行动,өk和ah分别代表一个特定的类型和 一个特定的行动。
如果我们观察到i选择了ah,i属于өk的后验概率是多少?
p(ahk)p(k) p(ahk)p(k)
Por{b kah}
(7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
市场进入博弈-2阶段不完全信息动态博弈
基本思路-不完全信息动态博弈
精练贝叶斯均衡是贝叶斯均衡、子博弈精练均 衡和贝叶斯推断的结合。它要求:
✓ 1、在每个信息集上,决策者必须有一个定义 在属于该信息集的所有决策结上的一个概率分 布(信念);
第二个弟子……
第三个弟子……
贝叶斯法则
在日常生活中,当面临不确定时,我们对某事 件发生的可能性有一个判断,然后,会根据新 的信息来修正这个判断。
✓ 统计学上,修正之前的判断称为“先验概率”
✓ 修正后的判断称为“后验概率”
贝叶斯法则就是人们根据新的信息从先验概率 得到后验概率的基本方法。
贝叶斯法则
基本思路-不完全信息动态博弈
成语故事:黔之驴-驴虎博弈
老虎通过不断试探来修正对毛驴的看法, 每一步行动都是给定它的信念下最优的, 毛驴也是如此。最终老虎将毛驴吃掉。
第2章_完全信息静态博弈
乙
前行
退让
前行
(-10,-10) (20,-2)
甲
退让
(-2,20) (0,0)
❖ (甲前行、乙退让)和(甲退让、乙前行)都是“斗鸡博弈” 的纳什均衡。
3.“市场争夺战”博弈
❖ 假设在市场中有两个竞争对手。一个是已经在市场中的“在位者”, 另一个是企图进入市场的“潜在进入者”。
❖ 潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个 可以选择的策略:斗争、默许。
(10,1) (2,2)
❖ 如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择? ❖ 理性的嫌疑人甲会选择坦白。 ❖ 在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。 ❖ 类似可分析其他情况
❖ 2.通过“划横线法”求解“智猪博弈”的均衡
大猪
按开关 等待
小猪
按开关
等待
(5,-1)
(4,2)
(10,-2) (0,0)
❖ 如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈 另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会 比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按 压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为 -1。
❖ 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下 开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花 一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强 力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况 下,大猪得到的收益是 4,小猪得到的收益是 2。
❖ 将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付 矩阵上方 。
❖ 嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人 甲可能的策略纵向排列在博弈支付矩阵左侧。
博弈论第3节
情侣博弈和纳什均衡
情侣博弈
丽娟 足球 足球 大 海 电影 2,1 0,0 电影 0,0 1,2
足球显然不是大海的劣势策略。 电影也不是大海的劣势策略,因为如果丽娟坚持选电 影,大海选足球只得0,选电影还可以得1。 所以,大海没有全面的劣势策略。同样,丽娟也没有 全面的劣势策略。
情侣博弈的纳什均衡
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 这类博弈很多, 这类博弈很多,引出混合策略纳什均衡概念
二、混合策略、混合策略博弈 和混合策略纳什均衡
} 混合策略:在博弈G = {S1,LSn ; u1,Lun中,博弈方 i 的策略 混合策略 空间为 S i = {si1 , L sik },则博弈方 i以概率分布 pi = ( pi1 ,L p ik ) 随机在其 k 个可选策略中选择的“策略”,称为一个“混合策 j = 1,L, k 0 ≤ p ij ≤ p i1 + L 略”,其中 1 对 都成立,且+ p ik = 1
占优策略均衡
占优策略:不管其它博弈方选择什么策略,一博 占优策略 弈方的某个策略给他带来的得益始终高于其它 的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;双寡头削价中“低 价”。 占优策略均衡:一个博弈的某个策略组合中的所 占优策略均衡 有策略都是各个博弈方各自的占优策略,必然 是该博弈比较稳定的结果 占优策略均衡不是普遍存在的
囚徒困境
囚徒 2 坦 白 囚 坦 白 徒 1 不坦白 囚徒1:坦白 囚徒2:坦白 -5, -5 不坦白 0, -8
-8, 0
-1, -1
两个罪犯的得益矩阵
在一个博弈里,如果所有参与人都有占优策略 存在,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。所以在囚徒 困境博弈里,{坦白,坦白}是占优策略均衡。 囚徒困境反映了一个深刻的问题,即个人理性与 团体理性的冲突。这给我们一个启示,我们学习博弈论, 也许更应该研究的是怎样设计一种制度,在满足个人理性 的同时,去争取达到“集体理性”。
第二章完全信息静态博弈
第二章完全信息静态博弈2在完全信息静态博弈中,各博弈方同时决策,且所有博弈方对各方得益都完全了解。
完全信息静态博弈属于非合作博弈最基本类型。
本章介绍该类博弈的一般分析方法、纳什均衡概念及分析方法的扩展。
2.1 基本分析方法3上策均衡严格下策反复消去法划线法箭头法上策均衡4 (Dominant-strategy Equilibrium)上策(Dominant-strategy) :不管其它博弈方选择什么策略,一个博弈方的某个策略给他带来的得益至少不低于其他策略。
例:囚徒困境Idea..?5上策均衡与均衡结果:上策均衡(坦白,坦白)均衡得益(-5,-5)“坦白”相对于“抵赖”是每个囚徒的上策(优势策略)-5,-50,-8-8,0-1,-1坦白抵赖坦白抵赖囚徒B囚徒A上策均衡6 (Dominant-strategy Equilibrium)上策均衡:由每个博弈方的上策所组成的策略组合。
一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果。
博弈方2博弈方1A B C a3,22,35,4 b2,11,23,3 c1,61,44,5例寻找上策(优势策略)检查一下你是否存在上策,如果有,就选择它。
站在其他方的位置上思考问题如果你没有上策,那么从其他博弈方角度考虑。
如果其他博弈方有上策,预期他将选择自己的上策。
严格下策:不管其它博弈方的策略如何变化,某种策略给一个博弈方带来的得益总比另一种策略小,称前一种策略为相对于后一种策略的“严格下策”。
1,01,30,40,2左中1,01,3左中1,01,30,10,40,22,0左中右上下211,3中上例:巡逻6,24,48,00,0巡逻不巡逻穷人不巡逻富人WELCOME富人与穷人1112处于强势的博弈方为维护自己利益采取某种决策时,为其他弱势博弈方提供了搭便车的机会公司里的大股东与小股东每一个博弈方针对其他方的每一种策略,在自己的最大可能得益下划线2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争划线法13划线法:通过在最佳对策得益下划线分析博弈的方法。
应用博弈论第二讲完全信息静态博弈
2.2.1 纳什均衡的定义
策略空间:S1 , S n
博弈方 i的第 j 个策略:si j Si 博弈方 i的得益:u i
博弈:G {S1,Sn;u1,un}
纳什均衡:在博弈G {S1,Sn;u1,un}中,如果由各个博弈方i
的各一个策略组成的某个策略组合(si*,sn* ) 中,任一博弈方 的策略,都是对其余博弈方策略的组合 (si*,si*1, si*1,...sn* ) 的最佳对策,也即ui (si*,si*1, si*, si*1,...sn*) ui (si*,si*1, sij , si*1,...sn*)
岗位职责三工作总结项目运维项目实施银青高速视频监控东毛隧道停车场项目全面实施ip设置贵州独平高速项目全面实施监控室机柜布线四心得体会在这段时间的学习过程中我对部门很多产品从零学起刚到公司的时候感觉压力很大经过这些时间的认真学习和实际操作调整心态现已完全能融入公司的各项岗位职责和管理制度中
第二章 完全信息静态博弈
25
表1 划线法分析囚徒困境
囚徒 2
招
不招
囚 招 -8,-8 0,-10
徒 1
不 招
-10,0
-1,-1
26
习题3:划线法(一)
矩阵1
妻子
丈 活着 夫 死了
活着
1,1 0,-1
死了
-1,0 0,0
27
矩阵1的含义
矩阵1的纳什均衡为(活着,活 着)和(死了,死了)。这两个纳什均 衡的含义是这对夫妻要么同时活着,要 么同时死,如果有一个死了,则另一个 也宁愿选择死,而不愿单独活着。这说 明这对夫妻的感情极度恩爱,以至于单 独活着只有痛苦,甚至生不如死。
经开始对日本和德国这两个法西斯轴心国展开大反 攻。
第2讲 完全信息静态博弈【博弈论经典】
第2讲 完全信息静态博弈
•
囚徒困境在经济学上有着广泛的应用。 例1:两个寡头企业选择产量的博弈。如果两个企业联合起来形成卡特尔,选择垄 断利润最大化的产量,每个企业都可以得到更多的利润。但卡特尔不是一个稳定 的均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果是,每 个企业都只得到小于最大利润的产量,利润严格小于卡特尔产量下的利润。 在有些情况下,个人理性和集体理性的冲突对社会来说也许是一件好事,尽管对 集体而言是一件坏事。
第2讲 完全信息静态博弈
下继续生活下去。 从囚徒困境中,我们可以引出一个很重要的结论:一种制度(体制)安排,要发 生效力,必须是一种均衡。否则,这种制度安排不能成立。
第2讲 完全信息静态博弈
•
3.重复剔除的占优均衡 在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在 绝大数博弈中,占优战略均衡是不存在的。
第2讲 完全信息静态博弈
•
在“智猪博弈”中,我们先剔除掉小猪的劣战略“按”,在剔除掉这个战略后的 新的博弈中,小猪只有一个战略“等待”,大猪仍有两个战略,但此时,“等待” 已成为大猪的劣战略,提出这个战略,剩下的唯一战略组合是(按,等待)。
第2讲 完全信息静态博弈
•
我们需要对“占优战略”和“劣战略”的概念进行重新定义。
都是(相对于si*的)劣战略。 在应用重复剔除方法寻找均衡时,一个战略是占优战略或劣 战略可能是相对于另一个特定的战略而言的。
第2讲 完全信息静态博弈
' ' ' 定义:令si 和s? 是参与人 i 可选择的两个战略(即 s i i Si, ' s’ i Si)。如果对于任意的其他参与人的战略组合s -i,参与人 ' ' i的选择si 得到的支付严格小于从选择s? i 得到的支付,即:
博弈论与信息经济学GameTheoryandInformationEconomics课件
而提出改造世界的方案,设计出各种在 信息不对称情况下保障市场有效运转的 机制是另一大贡献,甚至认为是更大的 贡献。
一 博弈论与信息经济学
博弈论
给定信息结构,求均 衡结果 均衡理论 方法论导向 实证的
信息经济学
给定信息结构,求契 约安排 契约设计理论 问题导向 规范的
模型
隐藏行动的道德 风险
隐藏信息的道德 风险
逆向选择风险
信号传递和信息 甄别
委托人
地主 股东 住户 公民 社会 雇主 股东 原告/被告 雇主 保险公司
雇主 买方投资
代理人
佃农 经理 房东 政府官员 犯罪 雇员 经理 代理律师 雇员 投保人
工人 卖方
行动、类型或信号
耕作努力 工作努力 房屋修缮 廉洁或贪污 偷盗的次数 任务的难易/工作努力 市场需求/投资决策 赢的概率/办案努力 工作技能 感染爱滋病病毒
险模型
时
非对称发生在事前(签约前),逆向选择模型;
间
非对称发生在事后(签约后),道德风险模型。
研究不可观测行动的模型称为隐藏行动模型;
研究不可观测信息的模型称为隐藏信息(或知识)模型
隐藏行动的道德风险
签约时信息是对称的
高
接受
选择行动
提供合同
努力或不 自然
努力
代理人
低
委托人
代理人 不接受
某些可 观测的 结果
作为博弈者,最佳策略是最大限度地利 用游戏规则,最大化自己的利益;
作为社会最佳策略,是通过规则使社会 整体福利增加。
第六章 委托-代理理论(I)
一 博弈论与信息经济学 二 信息经济学的分类 三 委托-代理理论的分析思路和框架 四 对称信息下的最优合同
经济博弈论 02 完全信息静态博弈(Park)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
第2章完全信息静态博弈
存在问题
▪ 伯特兰德模型之所以会得出这样的结论,与它的前提假 定有关。从模型的假定看至少在以下两方面的问题:
▪ ①假定企业没有生产能力的限制。如果企业的生产能力 是有限的,它就无法供应整个市场,价格也不会降到边 际成本的水平上。
▪ ②假定企业生产的产品是完全替代品。如果企业生产的 产品不完全相同,就可以避免直接的价格竞争。
演唱会
李 亚
足球
2,1
鹏
演唱会 -1,-1
0,0 1,2
某策略组合只有指向的箭头,没有 指离的箭头,则为稳定性的策略组合
猜硬币方
盖
硬 币
正面
方 反面
正面
方面
-1,1 1,-1
1,-1 -1,1
博
弈上 方
1
下
博弈方2
左
中
右
1,0 1,3 0,1
0,4 0,2 2,0
1.3 画线法
由于决策的原则是使自己的得益尽可能的 大。同时由于一方的得益取决于其他方的策 略。
s
令p 为商店i的价格,D (p ,p ) 为需求函数, i=1,2。
i
i 12
如果住在x左边的将都在商店1购买,而住在xs右边的将在商店 s 2购买,需求分别为:
D =x,D =1-x,
1
2
这里x满足 p1+tx=p2+t(1-x)
解上式,得需求函数分别为: D1(p1,p2)=x=(p2-p1+t)/2t D2(p1,p2)=1-x=(p1-p2+t)/2t
第二章
博弈论——完全信息静态博弈
static games of complete formation
完全信息静态博弈
博弈论与信息经济学讲义2012-2下+_2012[1].2.29晚_
纳什均衡与占优战略均衡及重复剔除的占优均 衡:
(1)每一个占优战略均衡及重复剔除的占优均衡一定 是纳什均衡,但并非每一个纳什均衡都是占优战略均 衡或重复剔除的占优均衡; (2)纳什均衡一定是在重复剔除严格劣战略过程中没 有被剔除掉的战略组合,但没有被剔除掉的组合不一 定是纳什均衡,除非它是唯一的(不适用于严格弱劣 战略的情况)
1,10 0,10 0,10
C3
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
故一般使用严格劣战略剔除,可以看到,(R1,C3) (R1,C1)都是纳什均衡,但在这里是不可解的。
练习: 找出下列两队夫妻的纳什均衡
妻子 活着 恩爱夫妻 丈夫 活着 死了
2,2 0,-6
三 重复剔除的占优均衡
注意: 与占优战略均衡中的占优战略和劣战略不 同,这里的占优战略或劣战略可能只是相对于 另一个特定战略而言。
三 重复剔除的占优均衡
案例2-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 0,0 4大于1 0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
木村 北 北 肯尼 南 南
2,-2 1,-1
2,-2 3,-3
三 重复剔除的占优均衡
练习:在下列战略式表达中,找出重复剔除的 占优均衡
C1 R1 R2 R3
4,3 2,1 3,0
C2
5,1 8,4 9,6
C3
6,2 3,6 2,8
三 重复剔除的占优均衡
注意:
1、严格占优战略下,重复剔除的占优均衡结果 与劣战略的剔除顺序无关;弱占优战略下,重 复剔除的占优均衡结果与弱劣战略的剔除顺序 有关。 2、重复剔除的占优均衡要求每个参与人是理性 的,而且要求“理性”是参与人的共同知识。 即:所有参与人知道所有参与是理性的,所有 参与人知道所有参与人知道所有参与是理性的
第二章 完全信息静态非合作博弈
博弈方2的混合策略
p A 3 pB 1 p A 2 pB 5
博弈方1的混合策略
pC 2 p D 5 pC 3 p D 1
2013-7-15
策略 收益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6
2013-7-15
博弈论 重庆大学 刘辛
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去:
左 上 下 中 右 左 中 左 中 1,0 1,3 0,1 0,4 0,2 2,0 1,0 1,3 0,4 0,2 1,0 1,3
ui qiV (Q ) qi c
以三农户为例 n=3,c=4
2013-7-15
博弈论 重庆大学 刘辛
18
竞争:个体利益最大化
q1 R1 ( q 2 , q3 ) 48 1 2 q2
1 2 1
1 2
q3
1 q3
q 2 R2 ( q1 , q3 ) 48
2 1 q3 R3 ( q1 , q 2 ) 48 q1 q 2 2 2
Q q1 q 2 P P (Q ) 8 Q
6 q1 q1q 2 q12
c1 c 2 2
1 q1 P (Q ) c1q1 q1[8 (q1 q2 )] 2q1
2 q2 P (Q ) c2 q2 q2 [8 (q1 q2 )] 2q2
24
博弈论 重庆大学 刘辛
五、小偷和守卫的博弈
博弈论第二章——博弈规则
U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
博弈论第二章 (1)
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3
3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略
二、重复剔除严格劣战略
(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5
第二章(完全信息静态博弈)PPT课件
q2 R2(q1)
(3,0) (6,0)
q1
图2.9 古诺模型的反应函数几何描述
2021
27
三、伯特兰德寡头模型——价格博弈
当厂商1和厂商2价格分别是 P1 和 P2 时,它们各 自的需求函数为 :
q 1 q 1 ( P 1 ,P 2 ) a 1 b 1 P 1 d 1 P 2 q 2 q 2 ( P 1 ,P 2 ) a 2 b 2 P 2 d 2 P 1
一、纳什均衡的定义
n个参与人的策略式表达博弈:G {S1, ,Sn;u1, un},
策略组合 S*{S1 *, ,Si*, Sn *}是一个纳什均衡,如果
对于每一个
i,s
* i
是给定其他所有参与人选择
S * 1 { S 1 * , ,S i* 1 ,S i* 1 S n * }的情况下第 i个参与人的
2021
17
三、纳什均衡与上述分析方法的关系
(一)纳什均衡与上策均衡的关系 上策均衡是比纳什均衡更强、稳定性更高的均衡 概念
纳什 均衡
上策均衡
图2.8 纳什均衡与上策均衡的关系
2021
18
G { S 1, ,S n;u 1, u n}
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G {S1, ,Sn;u1, un}中,
2021
16
正是由于纳什均衡是一致性预测,因此才进一 步有下列性质:首先,各博弈方可以预测它,可以 预测他们的对手会预测它,还可以预测他们的对手 会预测自己会预测它,……;其次,预测任何非纳 什均衡策略组合将是博弈的最终结果,意味着要么 各博弈方的预测其实并不相同(预测不同的纳什均 衡会出现等),要么预期至少一个博弈方要“犯错 误”,包括对博弈结构理解的错误,对其他博弈方 的策略预测错误,其理性和计算能力有问题,或者 是实施策略时会出现差错等。
(完整)博弈论判断题
博弈论判断题第一章导论(1)单人博弈就是个人最优化决策,与典型的博弈问题有本质区别。
(2)博弈方的策略空问必须是数量空间,博弈的结果必须是数量或者能够数量化.(3)囚徒的困境博弈中两个因徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。
(4)因为零和博弈中博奔方之间的关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。
(5)凡是博弈方的选择、行为有先后次序的一定是动态博弈。
(6)多人博弈中的“破坏者"会对所有博弈方的利益产生不利影响。
(7)合作博弈就是博弈方采取相互合作态度的博弈。
参考答案:(1)正确。
因为单人博弈只有一个博弈方,因此不可能存在博弈方之间行为和利益的交互作用和制约.因此实际上就是个人最优化决策,与存在博弈方之间行为和利益交互作用和制约的典型博弈问题有本质的区别。
(2)前半句错误,后半句正确.博弈方的策略空间不一定是数量空间,因为博弈方的策略除了可以是数量水平(如产量、价格等)以外,也可以是各种定性的行为取舍和方向选择,甚至也可能是各种函数或者其他更复杂的内容。
但一个博弈的结果必须是数量或者可以数量化,因为博弈分析只能以数量关系的比较为基础. (3)错误。
结论恰恰相反,也就是囚徒的困境博弈中两囚徒之所以处于困境,根源正是因为两囚徒很在乎坐牢的绝对时间长短。
此外,我们一开始就假设两囚徒都是理性经济人,而理性经济人都是以自身的(绝对)利益,而不是相对利益为决策目标的.(4)错误.虽然零和博弈中博弈方的利益确实是对立的.但非合作博弈的含义并不是博弈力之间的关系是竞争性的、对立的,而是指博弈方是以个体理性、个体利益最大化为行为的逻辑和依据,是指博弈中不能包含有约束力的协议。
(5)错误。
其实并不是所有选择、行为有先后次序的博弈问题都是动态博弈。
例如两个厂商先后确定自己的产量,但只要后确定产量的厂商在定产之前不知道另一厂商定的产量是多少,就是静态博弈问题而非动态博弈问题。
第二章完全信息静态博弈的基本理论
第二章完全信息静态博弈的基本理论第二章完全信息静态博弈的基本理论0.完全信息(complete information)博弈与不完全信息(incomplete information)博弈完全信息博弈是指每个参与人的支付函数都是该博弈的公共知识;只要有一个参与人的支付函数不是该博弈的公共知识,就意味着该博弈是不完全信息博弈。
特别提示:如果该博弈是完全信息博弈,这意味着参与人不仅知道自己是什么类型的人,也知道对手们是什么类型的人。
一.求解方法之一:剔除严格劣策略1.占优策略与劣策略。
严格占优策略与严格劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于b策略,则称a策略是相对于b 策略的严格占优策略(strictly dominating strategy),b策略是相对于a策略的严格劣策略(strictly dominated strategy)。
弱占优策略与弱劣策略:不管对手采取什么策略,如果参与人采取a策略所获得的支付不低于b策略,且至少有一种情况下的支付会严格大于b策略,则称b策略是相对于a策略的弱劣策略(weakly dominated strategy );a策略则是相对于b策略的弱占优策略(weakly dominating strategy)。
占优策略就是我们平时所说的上策,劣策略就是我们平时所说的下策。
特别提示:本文对占优策略的理解与其他教材不同,本文可以将以上述方式定义出来的占优策略称为局部占优策略;如果不管对手采取什么策略,如果参与人采取a策略所获得的支付严格大于其他所有策略,则称a策略是全局严格占优策略。
类似地,可以定义局部劣策略与全局劣策略。
理性的人在博弈时绝对不会选择严格劣策略。
通过剔除严格劣策略所获得的博弈解就称之为占优策略均衡。
2.案例案例1乙坦白不坦白甲坦白-6-6-10不坦白-10-1-1案例2乙不作广告作广告甲不作广告 8810 2作广告 21044在上面的两个例子中,通过剔除严格劣策略,可以获得一个占优策略均衡(坦白,坦白),(作广告,作广告)。
第二讲博弈的分类
第二讲:博弈的分类博弈的分类•1、合作博弈与非合作博弈2、完全信息博弈与不完全信息博弈•2完全信息博弈•3、静态博弈与动态博弈•相互组合:完全信息静态博弈、完全信息动态博弈、完全信息静态博弈完全信息动态博弈不完全信息静态博弈、不完全信息动态博弈。
、•4、纯策略博弈与混合策略博弈1、合作博弈与非合作博弈合作博弈合作博弈亦称为和博弈,是指博弈双•合作博弈:合作博弈亦称为正和博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个集体的利益有所而另方的利益不受损害,因而整个集体的利益有所增加。
•研究人们达成合作时如何分配合作得到的收合作博弈益,即收益分配问题。
合作博弈采取的是一种合作的方式,或者说是一种妥协。
方式或者说是种妥协•至于收益在博弈各方之间如何分配,取决于博弈各方的力量对比和技巧运用。
因此,妥协必须经过博弈各方的讨价还价,达成共识,进行合作。
1、合作博弈与非合作博弈1合作博弈•合作博弈存在的两个基本条件是:存在的两个基本条件是(1)对联盟来说,整体收益大于其每个成员单(1)对联盟来说整体收益大于其每个成员单独经营时的收益之和。
独经营时的收益之和(2)对联盟内部而言应存在具有(2)对联盟内部而言,应存在具有帕累托改进,即都性质的分配规则,即每个成员都能获得比不加入联盟时多一些的收益。
1合作博弈1、合作博弈与非合作博弈合作博弈的例子:(国际石油输出国组织),合作限产来共同增z OPEC(国际石油输出国组织),合作限产来共同增加利润。
他们控制了绝大部分石油储量,谁不遵守组织内部协定,就予以一定制裁。
内部协定就予以定制裁假如个域有尔玛家旗家润多z假如一个区域里有沃尔玛、家乐福、红旗、家润多、人人乐几个大型超市。
由于太集中了,经常打促销战,造成销售净利率下降为此他们组成个价格联盟来限成销售净利率下降。
为此,他们组成一个价格联盟来限制各自竞争行为。
然后设置了一个惩罚机制。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈方1的混合策略
pA 3 pB 1 pA 2 pB 5
博弈方2的混合策略
pC 2 pD 5 pC 3 pD 1
策略 收益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6
* P 1
1 * (a1 b1c1 d1 P 2 ) 2b1
* P 2
1 * (a2 b2 c2 d 2 P 1 ) 2b2
博弈论 重பைடு நூலகம்大学 刘辛 17
2015/10/22
2.3.4 公共资源问题
公共草地养羊问题
Q q1 qn V V (Q) 100 Q
一、夫妻之争的混合策略纳什均衡
丈夫 时装 妻 子 时装 足球 2, 1 0, 0 足球 0, 0 1, 3 妻子的混合策略
pw (C) 1 pw (F ) 0 pw (C) 0 pw (F ) 3
丈夫的混合策略
* * * q1 q2 q3 24
* * * u1 u2 u3 576
Q* 72
合作:总体利益最大化
u Q(100 Q) 4Q 96 Q
2015/10/22
u * 1728
Q 48 3 24 72 u 2304 3 576 1728
2015/10/22 博弈论 重庆大学 刘辛 12
2.3 无限策略分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 最佳反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性
2015/10/22
博弈论 重庆大学 刘辛
13
2.3.1 古诺的寡头模型
(0,6) (0,3)
R1 (q2 )
R2 (q1 )
(3,0) (6,0)
q1
古诺模型的反应函数图示
2015/10/22 博弈论 重庆大学 刘辛 16
2.3.3 伯特兰德寡头模型
• 价格竞争寡头的博弈模型 • 产品无差别,消费者对价格不十分敏感
q1 q1 ( P 1, P 2 ) a1 b 1P 1 d1 P 2 q2 q2 ( P 1, P 2 ) a2 b2 P 2 d2 P 1
19
博弈论 重庆大学 刘辛
2.3.5 反应函数的问题和局限性
• 在许多博弈中,博弈方的策略是有限且非连 续时,其收益函数不是连续可导函数,无法 求得最佳反应函数,从而不能通过解方程组 的方法求得纳什均衡。 • 即使收益函数可以求导,也可能各博弈方的 收益函数比较复杂,因此各自的反应函数也 比较复杂,并不总能保证各博弈方的最佳反 应函数有交点,特别不能保证有唯一的交点。
2015/10/22
博弈论 重庆大学 刘辛
15
2.3.2 最佳反应函数
古诺模型的最佳反应函 数
q2
理性局 限和古 诺调整
maxu1 max(6q1 q1q2 q12 )
q1
q1 R1 (q2 ) 1 2 ( 6 q2 ) q2 R2 (q1 ) (6 q1 )
1 2
纳什均衡:在博弈 G {S1,Sn ; u1 ,un } 中,如果由各个博 * * 弈方的各一个策略组成的某个策略组合 (si ,sn ) 中,任一博 * 弈方i 的策略,都是对其余博弈方策略的组合(si* ,si*1 , si*1,...sn ) * * ) ui (si* ,si*1, sij , si*1,...sn ) 对 的最佳对策,也即 ui (si* ,si*1, si* , si*1,...sn 任意 si j Si 都成立,则称 (s ,s ) 为G 的一个纳什均衡
6q2 q1q2 q22
2015/10/22
博弈论 重庆大学 刘辛
14
两寡头间的囚徒困境博弈
厂商2
不突破 厂 不突破 商 1 突破 突破
4.5,4.5
5,3.75
3.75,5
4,4
以自身最大利益为目标:各生产 2单位产量,各自收益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自收益为4.5
ij
混合策略扩展博弈:博弈方在混合策略的策略空间(概 率分布空间)的选择看作一个博弈,就是原博弈的“混合策 略扩展博弈)。 混合策略纳什均衡:包含混合策略的策略组合,构成纳 什均衡。
2015/10/22 博弈论 重庆大学 刘辛 23
三、一个例子
该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析
博弈方2 C D
1, -1
-1, 1
2015/10/22
博弈论 重庆大学 刘辛
7
2.1.4 箭头法
1, 0 0, 4 囚 徒 困 境 猜 硬 币
2015/10/22
1, 3 0, 2
0, 1 2, 0 夫 妻 之 争
-5, -5 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
-1, 1 1, -1
2015/10/22 博弈论 重庆大学 刘辛 1
本章分六部分
2.1基本分析思路和方法 2.2纳什均衡 2.3无限策略博弈分析和反应函数 2.4混合策略和混合策略纳什均衡 2.5纳什均衡的存在性 2.6纳什均衡的选择和分析方法扩展
2015/10/22
博弈论 重庆大学 刘辛
2
2.1 基本分析思路和方法
1, -1 -1, 1
博弈论 重庆大学 刘辛
8
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
2015/10/22
博弈论 重庆大学 刘辛
9
2.2.1 纳什均衡的定义
•策略空间: S1 ,Sn si j Si •博弈方i 的第 j个策略: •博弈方i 的收益: ui G {S1 ,Sn ; u1 ,un } •博弈:
一、猜硬币博弈
猜硬币方 正 面 盖 硬 币 方 正 面 反 面 -1, 1 1, -1 反 面 1, -1 -1, 1
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略
这类博弈很多,引出混合策略纳什均衡概念
2015/10/22 博弈论 重庆大学 刘辛 22
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈 G {S1,Sn ; u1,un} 中,博弈方i 的策略空 间为Si {si1,sik },则博弈方i 以概率分布 pi ( pi1 ,pik ) 随机 在其k 个可选策略中选择的“策略”,称为一个“混合策略”, j 1,, k 0 p 1 pi1 pik 1 其中 对 都成立,且
2015/10/22 博弈论 重庆大学 刘辛 11
2.2.3 纳什均衡与严格下策反复消去法
• 占优均衡肯定是纳什均衡,但纳什均衡不一定是占优均衡
命题2.1:在n个博弈方的博弈 G {S1,Sn ; u1,un } 中,如果严格 * ) 之外的所有策略组合, 下策反复消去法排除了除 (si* ,sn * ) 一定是该博弈的唯一的纳什均衡 那么(si* ,sn 命题2.2:在n个博弈方的博弈中 G {S1,Sn ; u1,un } 中,如果 * (si* ,sn ) 是 G 的一个纳什均衡,那么严格下策反复消 去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严 格下策反复消去法简化博弈是可行的
寡头产量竞争——以两厂商产量竞争为例
Q q1 q2 P P(Q) 8 Q
c1 c2 2
1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1
6q1 q1q2 q12 2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2
小偷 收益(偷)
守卫
V
睡
小 偷 偷 不偷 V,-D 0, S
不睡
-P,0 0, 0 0 -P 1
Pg 守卫 睡的概略
- P’
加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会是的守卫更多的偷懒
2015/10/22 博弈论 重庆大学 刘辛 26
2.4.2 多重均衡博弈和混合策略
2015/10/22
博弈论 重庆大学 刘辛
5
2.1.3 划线法
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
2015/10/22
博弈论 重庆大学 刘辛
6
囚 徒 困 境
猜 硬 币
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
-1, 1
1, -1
24
2015/10/22
博弈论 重庆大学 刘辛
五、小偷和守卫的博弈
守卫 收益((睡)
守卫 睡 V,-D 小 偷 偷 不偷 0,S 不睡 -P,0 0,0
S
0
1 -D
Pt 小偷 偷的概率
- D’
加重对保安的处罚:短期中的效果是使保安真正尽职 在长期中并不能使保安更尽职,但会降低盗窃发生的概略
2015/10/22 博弈论 重庆大学 刘辛 25
第二章 完全信息静态博弈
本章介绍完全信息静态博弈。 完全信息静态博弈即各博弈方同时决策,且所 有博弈方对各方收益都了解的博弈。 囚徒的困境、齐威王田忌赛马、猜硬币、石头 剪子布、古诺产量决策都属于这种博弈。 完全信息静态博弈属于非合作博弈最基本的类 型。 本章介绍完全信息静态博弈的一般分析方法、 纳什均衡概念、各种经典模型及其应用等。
2.1.1 占优均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法