第八章博弈论
微观经济学-第八章:博弈论
问题4:性别之战(恋爱艺术) (分析图表见黑板) △纳什均衡:在对手的策略既定下,各对手选择的策略都是 最好的
第一节:简单博弈与博弈均衡
结论: ①两个人分开都得不到任何满足, ②在一起都可以得到一定的满足, ③每人的最优策略都依赖对手的选择, ④对方决策后,自己选择最好的策略,达到纳什均衡。 指导意义:
结论:下一次博弈开始时,采用“以牙还牙”的策略或模 仿对手的策略,风险最小。
意义:避免恶性竞争,采取合作态度,防止双输局面出现。 即由竞争走向合作。(“竞争合作”理论的基础)
第二节:重复博弈与序列博弈
二、序列博弈
△对局者选择出台策略有时间先后顺序,称为序列博弈。 例1:有A、B两个房地产开发商在同一地区开发。 (对局见黑板) 1、若B已行动,分析A的策略 (分析图示见黑板) 结论:B不开,A进;B开,A不进。 2、A若已行动,分析B的策略 (分析图示见黑板) 结论:A不开,B进;A开,B不进。 小节:优先行动是关键,应先发制人,取得成功。
二、研究与开发策略(略)
第五节:不完全信息博弈
一、静态博弈
博弈的原则: 预测(估计)对手选择某个策略的可能性(概率)大小,
用概率论的方法进行分析决策。 例1: (对局、分析及图示见黑板)
二、动态博弈
博弈的原则: ①采用“黔驴技穷”的原则, ②不断试探,信息足够时再决定是否行动(选择策略)。 Firefly950整理改编,如有不宜发表内容请来信告知!
• 博弈论在20世记50年代由美国著名数Oscar Morgenstern)引入经济学。
• 目前已成为经济分析的主要工具之一。对产业组 织理论、委托代理理论、信息经济学等经济理论 的发展做出了非常重要的贡献。
第八章╲t博弈论
第八章博弈论一、重点和难点(一)重点1.博弈论及其基本概念2.纳什均衡3.占优策略均衡4.囚徒困境博弈(二)难点1.最小最大值(或最大最小值)策略2.子博弈精炼纳什均衡3.动态博弈战略行动4.不完全信息静态博弈5.不完全信息动态博弈二、关键概念博弈零和博弈非常和博弈囚徒困境纳什均衡支付子博弈精炼纳什均衡完全信息静态博弈占优策略均衡重复博弈战略移动可信威胁豪尔绍尼转换三、习题(一)单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。
A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。
A.规则B.占优战略均衡C.策略D.结局3.在具有占优战略均衡的囚徒困境博弈中()。
A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。
A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。
A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。
A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的战略称为()。
A.一报还一报的战略B.激发战略C.双头战略D.主导企业战略8.在囚徒困境的博弈中,合作策略会导致()。
A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在双寡头中存在联合协议可以实现整个行业的利润最大化,则()。
A.每个企业的产量必须相等B.该行业的产出水平是有效的C.该行业的边际收益必须等于总产出水平的边际成本D.如果没有联合协议,总产量会更大10.在什么时候,囚徒困境式博弈均衡最可能实现()。
博弈论PPT课件
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
第八章 2 完全信息静态博弈:应用
设 q < a − c(下面将证明该假设成立), 企业最优化问题的一阶条件既是必要条 件,又是充分条件: ∂π i *
* j
∂qi
= a − c − 2 qi − q j = 0
1 * 即 qi = ( a − c − q j ) 2
(1.2.1)
* * ( q1 , q2 ) 要成为纳什均衡, 那么,如果产量组合
我们仍假定每个企业的收益函数等于其利 润额,当企业I选择价格pi,其竞争对手 选择价格pj时,企业I的利润为:
π i ( pi , p j ) = qi ( pi , p j )[ pi − c]
= [a − pi + bp j ][ pi − c]
那么,价格组合 ( p , p ) 若是纳什均衡, 对每个企业i, pi* 应是以下最优化问题 的解:
假设市场中只有两个寡头企业1与2,他们 生产同样的产品,市场上该产品的价格由需求 决定:p=a-Q(更为精确一些的表述为:Q<a 时,P=a-Q;Q>a时,P=0)。Q=q1+q2 是总 供给,q1、q2分别表示企业1、2生产同质产品 的产量。设企业i生产qi的总成本Ci(qi)=cqi,即 企业不存在固定成本,且生产每单位产品的边 际成本为常数c,这里,我们假定c<a。根据古 诺的假定,两个企业同时进行产量决策。
要全面表述这一博弈并求出其均衡解,还 需把企业i的收益表示为他自己和另一企 业所选择战略的函数。我们假定企业的 收益就是其利润额,这样,在一般的两 个参与人标准式博弈中,参与人i的收益 ui(si,sj)就可写为: πi=qip-cqi=qi[a-Q]-cqi=qi[a-(qi+qj)-c]
我们照此进行转化: (1)参与人:寡头1、寡头2 (2)战略:寡头1选择产量q1≥0;寡头2选择产量q2≥0 ( 3 ) 收 益 : 寡 头 1 的 收 益 为 π1=q1p-cq1=q1[a-Q]cq1=q1[a-(q1+q2)-c] ; 寡 头 2 的 收 益 为 π2=q2pcq2=q2[a-Q]-cq2=q2[a-(q1+q2)-c] 按照定义,一对战略(s1*,s2*)如是纳什均衡,则对每一个 参与人i,si*应该满足 ui(si*,sj*)≥ui(si,sj*) 上式对Si中每一个可选战略si都成立,这一条件等价于: 对每个参与人i,si*必须是下面最优化问题的解:
第8章 博弈论
经济学原理
18
四种主要的均衡类型
完全信息 不完全信息
静态
动态
完全信息 不完全信息 NE:纳什均衡 纳什均衡 静态 静态( 静态(BNE) BNE:贝叶斯纳什 ) 贝叶斯纳什 贝叶斯 (NE) ) 均衡 子 完全信息 不完全信息 SPNE:子博弈精练 纳什均衡 动态 动态 SPBE:子博弈精练 子 (SPNE) (SPBE) ) 贝叶斯纳什均衡 贝叶斯纳什均衡
经济学原理 11
8.3.2 纳什均衡 纳什均衡
纳什均衡 纳什均衡(Nash Equilibrium) :在博弈分析中,纳什均衡是 Equilibrium) :在博弈分析中 纳什均衡是 博弈分析中, 所有参与人的最优战略组合。 注意: •均衡的战略组合包含了所有参与者的最优战略,是最优战 略的组合; •均衡战略组合是每一个参与者最优战略的交集,每个参与 人肯定存在最优战略,但是如果不存在交集,就没有均衡的 战略组合。 •均衡意味着:给定A的战略SA,B有最优战略SB;给定B的 均衡意味着:给定A的战略SA, 有最优战略SB;给定B 战略SB, 有最优战略SA,(SA,SB)就是均衡战略。 战略SB,A有最优战略SA,(SA,SB)就是均衡战略。
经济学原理
14
纳什均衡的简单解法 纳什均衡的简单解法
给定一方的选择,另一方的选择是最优的; 反过来,给定另一方的该选择,一方的选择 也是最优的,则该选择组合是纳什均衡。
B 坦白 A 坦白 不坦白 -8,-8 -10,0 10, 不坦白 0,-10 -1,-1
经济学原理
15
两小猜枚的支付矩阵和均衡 两小猜枚的支付矩阵和均衡
经济学原理
8
囚徒困境的标准表达式
李四( 李四(B) 坦白 张三 (A) 坦白 不坦白 -8,-8 -10,0 10, 不坦白 0,-10 -1,-1
第08章 博弈论
第八章 博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互影响的问题。
本章讨论这个问题,建立复杂环境下的决策理论。
开展这种研究的的理论叫做博弈论,也称为对策论(Game Theory)。
最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。
大部分经济行为都可视作博弈的特殊情况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。
博弈论的思想精髓与方法,已成为经济分析基础的必要组成部分。
第一节 博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双方的目的都是要战胜对方,互不相容,互相影响,互相制约。
一般来讲,博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。
当所有当事人都拿定主意作出决策时,博弈的局势就暂时确定下来。
博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。
博弈论推广了标准的一人决策理论。
在每个局中人的收益都依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。
下面来举例说明。
例1.便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否正面朝上。
局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。
对于这个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。
当甲和乙都作出选择时,博弈的局势就确定了。
显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。
博弈论和信息经济学
8
坦白
抵赖
-
1
囚 犯 的
坦白
囚犯甲
-3 -3
0 -6
困 境
抵赖
-6 0
-1 -1
9
上策均衡和纳什均衡
三、上策均衡和纳什均衡 1、上策均衡 ☆上策:指不管其他局中人采取什么策略,某一局中人 都采取自认为对自己最有利的策略 ☆均衡:指博弈中所有局中人都不想改变自己策略的一 种相对静止状态 ☆上策均衡:不管其他局中人采取什么策略,每个局中 人都选择了对自己最有利的策略所构成的策略组合 ☆表8-1中,甲、乙都坦白的策略组合为上策均衡 ●甲、乙各有坦白和抵赖两种策略 ●表中每一策略组合的前后两个数字代表甲、乙的收益
14
上策均衡和纳什均衡
●对乙来说,甲选A时,乙最好选A(1﹥0);甲选B时, 乙最好选B(2﹥0)。不存在不管甲采取何种策略, 乙总应采取某一策略的情况
●综上,该博弈没有上策均衡
例2【表8-2(b)】:
表8-2(b)纳什均衡
乙
策略A
策略B
甲
策略A
65
89
策略B
78
57
15
上策均衡和纳什均衡
●对甲来说,乙选A时,甲选B(7﹥6);乙选B时,甲选A (8﹥5),不存在总选择某一策略的情况
☆在位者要使进入者相信其威胁并不是空头恐吓,就必 须作出承诺。承诺是在位者使自己的威胁策略变成置 信的行动。在位者事先采取扩大生产规模的准备性措 施,作出你一旦进入我就在规模增加生产以大削价的 姿态,使进入者感到进入实在不值得
☆潜在竞争者究竟进入与否,取决于其对进入的成本和 收益的分析。上例中,在位者斗争的威助不可信,因 为斗争的收益(100)比合作(500)要小
第八章博弈论简要课件
11
第八章 博弈论
四、重复博弈和序列博弈
➢静态博弈是指局中人同时决策或虽非同时 决策,但后决策者不知道先决策者采取什么 策略的博弈。 ➢动态博弈是指局中人决策有先有后,后决 策者能观察到先决策者决策情况下的博弈。
12
第八章 博弈论
动态博弈的例子
进入
在位者甲
合作 斗争
进入者乙
(400 ,500) ( -100 ,100)
6
第八章 博弈论
3、策略集合: 是指所有局中人可能采取 的行动方案总和。例如:都坦白,都抵赖, 坦白与抵赖,抵赖与坦白 4、收益: 是指在每种组合情况下,局中 人采取特定策略得到的结果。例如:判3年, 6年,释放等
7
第八章 博弈论
三、上策均衡和纳什均衡
1、上策: 是指不管其他局中人采取什么策 略,某一局中人都采取自认为对自己最有 利的策略。 2、均衡: 是指博弈中所有局中人都不想改 变自己策略的一种相对静止状态。
1
第八章 博弈论
博弈论字面的意思是游戏策略,及用类 似游戏中解决问题的方法,揭示解决社会、 经济及其他领域问题的策略、对策,因此有 的还把博弈论译成对策论。准确的说博弈论 是在给定的条件下寻求最优策略,这里给定 的条件包含其他人的策略以及本人的决策对 其他决策主体的影响。
2
第八章 博弈论
策略性活动在社会、经济、政治生活中 大量存在,也可以说,整个社会、经济、政 治生活都是博弈行为。因此,博弈论作为一 种方法,广泛的应用在经济、政治、军事、 外交中,只是博弈论在经济学中应用的最广 泛、最成功。如前面介绍过的古诺均衡,就 属于经济学中的博弈过程。
8
第八章 博弈论
3、上策均衡: 不管其他局众人采取什么策 略,每个局中人都选择了对自己最有利的策 略所构成的一个策略组合。 4、纳什均衡: 是指参与博弈的每一局中人 在给定其他局中人策略的条件下选择上策所 构成的一种策略组合。 注:所有上策均衡都是纳什均衡,但不能反 过来说所有纳什均衡都是上策均衡。
博弈论课件
脚的看牌人、看棋人,企业的顾问等。
对参与人的决策来说,最重要的是
必须有可供选择的行动集(策略集)和
一个很好定义 的支付函数。
自然被当作虚拟参与人。
清华诚志
10
(2)策略(strategies ):博弈中有两种策略
概念,一种为纯策略(pure strategy ), 简称策略, 指参与人在博弈中可以选择采用的行动(actions or moves)方案,是参与人在给定信息结构的情况 下的行动规则,它规定参与人在什么时候的什么情
囚徒困境反映了个人理性和集体理性的矛盾。如果 A和B都选择抵赖,各判刑1年,显然比都选择坦 白各判刑8年好得多。当然,A和B可以在被警察 抓到之前订立一个"攻守同盟",但是这可能不会有 用,因为它不构成纳什均衡,没有人有积极性遵守 这个协定,显然最好的策略是双方都抵赖.
清华诚志
5
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到自己,这样他 们必然要服长的刑期。只有当他们都首先替 对方着想时,或者相互合谋(串供)时,才可 以得到最短时间的监禁的结果。
清华诚志
26
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的思想, 每个个体都是理性的,所以必须了解竞争对手的思 想。商业关系被认为是一种相互作用。但博弈论并 不是疗法,并不是处方,它并不告诉你该付多少钱 买东西,这是计算机或者字典的任务。博弈论只是 提供一些关系的例证,一些有用的解决问题的方法。 这种思维方法也许是企业家应该学习的。对于经济 学家,也许需要学习它的理论模型,它的实验方式 。
20博弈论-第八章
第八章 若干专题及扩展本书的最后一章将对纳什均衡的一些扩展进行一个介绍性的讨论,这些扩展反映着博弈论最前沿的研究与最新的运用。
同时,这些扩展也为更好地理解博弈论提供了新的角度和基础。
这一章主要涉及到三个专题,即同盟博弈及其解概念——核、演化博弈及其解概念——演化稳定策略和学习博弈。
第一节 同盟博弈与核同盟博弈(Coalitional game)所关注的是博弈参与者是如何组成各种利益集团的,以及同盟的稳定性。
一个利益集团就被看作是一个同盟(Coalition),如果一个同盟包含所有的博弈参与者就称为大同盟(Grand coalition)。
实际上,如果我们把所有博弈参与者看作一个全集,用N 表示,那么一个同盟就是N 的子集,并且是对N 的一个分割(Partition),即如果我们定义一个博弈中的各同盟为S i ,i =1, …, k ,那么,i ≠j 和i j S S =∅I 1ki i S N ==U 。
为了方便,我们用N 来表示大同盟,用S 来表示其他的任意同盟。
显然,大同盟是一个极端,而每一个参与者都是一个同盟是另一个极端,而大多数同盟分割都位于两个极端之间。
对于同盟博弈而言,主要感兴趣的是位于两个极端之间的同盟分割情况。
由于博弈参与者唯一能做的就是站队,因而参与者的偏好实际上就是对各利益集团(同盟)的行动进行排序。
定义8.1 同盟博弈可表示为G={N, A S, u},其中(1)参与者集合:N={1, …, n}。
(2)对于每一个同盟S而言的行动集合:A S。
(3)偏好:每一个参与者的偏好就是对(其参与其中的)各同盟行动的排序。
例8.1 景泰蓝的分工协作要生产出一个景泰蓝需要n个劳动者分工协作,生产出来的景泰蓝所获收益(不妨假设为1)在各工人之间进行分配。
只要有一个工人不合作,景泰蓝就无法生产出来。
每一个工人都希望自己获得的收益份额越多越好。
该情景的同盟博弈为G={N, A S, u}:(1)参与者集合:N={1, …, n}。
博弈论课件
扩展一:不完全信息博弈
不完全信息博弈的定义
01
在博弈中,参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度,可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略,研究候选人如何 制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调,分析政策 制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作,分析国家如何通过 外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡 。
特点
纳什均衡是一种稳定的状态,任何参 与者单方面改变自己的策略都不会获 得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略, 该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略,该 策略都能为参与者带来更低的收益 。
特点
在优势策略下,参与者没有理由改 变自己的策略;在劣势策略下,参 与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降,还可能引发市场恶性竞争,破坏市场秩序。此外,价格战还可能导致产品质量 下降,损害消费者利益。
案例二:国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中,各国之间往往存在着复杂的博弈关系。为了维护自身利益,各 国会采取不同的博弈策略,如通过外交手段、经济制裁、军事威胁等方式来达 到自己的目的。
博弈论-8
11
不完全信息古诺模型
22
此时卖者认为买者的期望报价
1 ab cb ps xdx cb E[ pb (vb ) pb (vb ) ps ] P pb (vb ) ps 1 ( ps ab cb ) 2
卖者目标函数
1 max[ ( ps E[ pb (vb ) pb (vb ) ps ]) vs ] P[ pb (vb ) ps ] ps 2
第5章 不完全信息静态博弈
1
本章概要
不完全信息博弈 海萨尼转换 不完全信息静态博弈的战略式表述 贝叶斯均衡 贝叶斯均衡与混合战略 机制设计理论初步 显示原理
2
不完全信息博弈 古诺博弈
企业1和2的成本可能高(cH),也可能低(cL) 企业1和2互不知道对方边际成本的情况下进行产量竞 争
问题——双方如何报价?如何成交?
18
分析过程
P(b j bi ) P[V (b j ) V (bi )]
当参与人i叫价bi时,获胜的概率是对方叫价低于bi的概率 ,或者等价地说,是对方的保留价格低于V (bi)的概率。 由于参与人对该物品的保留价格是 [0,1]上的均匀分布, 这一概率就等于V (bi)。所以,一个具有保留价格vi、叫价 bi的参与人的期望支付为: V (bi) ×(vi-bi)+[(1-V (bi)] ×0 从而他的目标是: max V (bi )(vi - bi ) 一阶条件
第八章 演化博弈 《博弈论与经济》 PPT课件
。
j
j
▪ 因Y 为ESS,又 E(X ,Y ) E(Y,Y ) ,因而 E(Y, X ) E(X , X ,) 这与 X 为
纳什均衡相矛盾。
▪ 由性质2立即可得以下命题。
▪ 命题8.3 若 X 为单总体演化博弈 G 的内点ESS,即 X 的分量均为正 数,则 X 为 G 的惟一的ESS。
▪ 我们可用以下两个命题确定纯策略意义下的ESS。
▪ 此时,该博弈有2个纯策略纳什均衡 (e1,e1), (e2, e2) 为 e1 。
。该博弈的ESS
▪ 8. a1 0, a2 0
▪ 表2.1的第6种情况中, 0 。 y(x), x(y) 图形退化为图8-3。图
8-3种两条粗线上每点都是纳什均衡,但惟一的ESS为 e2
y 1
0
图8-3
(a1
a2 ) y12
2a2 y1
a2
▪令
f
( y1)
E(Y ,Y )
E(X
,Y)
(a1
a2 ) y12
2a2 y1
a22 a1 a2
。
▪ f (y) 为开口向下的抛物线,且判别式 0 ,故对
▪ x1 y1 , f ( y1) 0 ,从而 E(Y,Y ) E(X ,Y ) 。
▪ 对于例2.21给出的斗鸡博弈,支付矩阵 ▪ 仅有惟一的ESS X (2 , 3) 。
则 E(ei , X ) E(X , X )
。
▪ 证明 因
m
m
E(X , X ) XAX xi Ai X xiE(ei , X )
(*),
i 1
i 1
▪ Ai 为A 的第 i 行. 因 X为ESS,故有 E(X , X ) E(ei , X ),对 i 1,2,, m
博弈论(第八、九章)
类型:自然首先选择参与人的类型,参与人自己知道,其他参与人不 -不完全信息 知道。 知道。---不完全信息 行动:行动有先有后,后行动者能观测到先行动者的行动,但不能观 -动态博弈 测到其类型。 测到其类型。---动态博弈 但是,参与人是类型依存型的,每个参与人的行动都传递有关 自己类型的信息,后行动者可以通过观察先行动者的行动来推断自 己的最优行动。先行动者预测到自己的行动被后行动者利用,就会 设法传递对自己最有利的信息。 不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与 人不断修正信念的过程。
行为方(城管)行为 偷懒 认真 1 1 小贩 2 0 声明方 类型 2 0 非小贩 1 1
声明方和行为方对对方不同类型存在不同偏好,但这种偏好 正好是相反的。这时候,声明方说实话对自己显然是不利的,因 此他不愿意说实话。而且,行为方对声明方的声明也不会轻易相 信。所以,此时信息的传递机制不存在。
第二节典型不完全信息动态博弈模型 声明博弈
声明博弈有效传递信息的几个必要条件: (1)不同类型的声明方必须偏好行为方的不同行为。 (2)对应声明方的不同类型,行为方必须偏好不同的行为。 (3)行为方的偏好必须与声明方的偏好具有一致性。
第二节典型不完全信息动态博弈模型 离散型声明博弈的一般模型
设声明方有I种可能的类型,行为方有K种可能的行为,这种博弈模 型可用如下方式表述: A.“自然”从声明方类型集T={t1,…,t2}中以概率分布p(t1),…,p(ti)随 机抽取声明方的类型ti,p(ti)>0。 B. 声明方观察到ti后,从T中选择tj作为自己声明的类型。tj可以与ti 相同,也可以不相同。 C. 行为方在了解声明方的声明tj后,在自己的行为空间A= {a1,…,ak}中选择自己的行为ak。 D.声明方的得益为Us(ti,ak),行为方的得益为Ur(ti,ak)。
第八章 博弈论
的欺骗和违约行为,其他参与者总会有机会给予报 复(“以牙还牙”策略)。
24
在无限期重复博弈中,报复的机会总是存在 的,所以,每一个参与者都不会采取违约或 欺骗的行为,囚徒困境合作的均衡解是存在 的。
25
有限期重复博弈: o 用逆推的方法,在有限期重复博弈中,囚犯困境博
张三和李四会坦白吗?
4
纳什均衡
坦白 李四
不坦白
坦白
张三
(-10,-10)
(-15,-2)
不坦白
(-2,-15)
(-5,-5)
5
第一节:博弈论的发展及基本概念
一、概念:
博弈论:又称对策论,是一种分析战略 行为的方法
博弈论是描述和研究行为者之间策略相 互依存和相互作用的一种决策理论。
6
o 在每一个博弈中,都至少有两个参与者,每 一个参与者都有一组可选择的策略。作为博 弈的结局,每个参与者都得到各自的报酬。 每个参与者的报酬都是所有参与者各自所选 择的策略的共同作用的结果。
改变方案三:减量加移位方案。投食仅原来 的一半分量,但同时将投食口移到踏板附近。
40
18
囚犯的困境反映了一个问题,从个人角度出 发所选择的占优策略,从整体来看,却是最 差的结局,即个人理性和团体理性的冲突。
应用: 囚徒的困境可以应用于许多场合。前面所讲
的寡头博弈(占优策略的均衡)就是一例。
19
做广告
可口可乐的决策
做广告
不做广告
百 事 可
做 广
每家30亿美元的利润
可口可乐得到20亿美元利润
3
一个著名的例子:囚徒困境
第八章博弈论与电力市场
三 结论
博弈论是继控制论、系统论之后,用于电力市场研 究的强有力的工具。用博弈论来解释并且设计一些用 于电力市场的算法,是一个新鲜而具有挑战性的课题。 博弈论本身就是带有优化功能的一门严谨的学科。不 过它更具有人的逻辑思维的色彩,融合了一些用别的 方法难以表达的信息。
•
( 2)从参与人对其他参与人的各种特征信息 的获得差异来分,博弈可分为完全信息博弈和不 完全信息博弈。 完全信息指的是每一个参与人对所有其他 参与人的特征,如策略集合及得益函数都有准确 完备的知识;否则就是不完全信息。 将上述两个角度的划分结合起来,我们就 得到四种不同类型的博弈,这就是:完全信息静 态博弈,完全信息动态博弈,不完全信息静态博 弈和不完全信息动态博弈。
斯塔克尔伯格模型:是一个产量领导模型,厂商之 间存在着行动次序的区别。产量的决定依据以下次序: 领导性厂商决定一个产量,然后跟随着厂商可以观察 到这个产量,然后根据领导性厂商的产量来决定他自 己的产量。需要注意的是,领导性厂商在决定自己的 产量的时候,充分了解跟随厂商会如何行动——这意 产量的时候,充分了解跟随厂商会如何行动——这意 味着领导性厂商可以知道跟随厂商的反应函数。因此, 领导性厂商自然会预期到自己决定的产量对跟随厂商 的影响。正是在考虑到这种影响的情况下,领导性厂 商所决定的产量将是一个以跟随厂商的反应函数为约 束的利润最大化产量。在斯塔克尔伯格模型中,领导 性厂商的决策不再需要自己的反应函数。
零和博弈:指参与博弈的各方,在严格竞争下, 一方的收益必然意味着另一方的损失,博弈各方的 收益和损失相加总和永远为“ 收益和损失相加总和永远为“零”。双方不存在合 作的可能。 占优策略:每一个博弈中的企业通常都拥有不止 一个竞争策略,其所有策略的集合构成了该企业的 策略集。在企业各自的策略集中,如果存在一个与 其他竞争对手可能采取的策略无关的最优选择,则 称其为占优策略(Dominant Strategy),与之相对的 称其为占优策略(Dominant Strategy),与之相对的 其他策略则为劣势策略。 占优策略均衡:由博弈中的所有参与者的占优策 略组合所构成的均衡就是占优策略均衡。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.夫妻之争
足球
•
•
1
•
•
•2
•
•
0
•
0
服装
0 0
2 1
PPT文档演模板
第八章博弈论
四、囚犯的难题
❖揭示了:纳什均衡并不一定导致帕里 托有效的结果
❖裁军计划 ❖排队上车——找熟人,托关系,走后
门。 ❖双寡头选择产量的博奕——卡特尔协
定不是纳什均衡
PPT文档演模板
第八章博弈论
第三节 完全信息动态博奕
❖常和博奕:得益和非零常数,如在几个人分配固 定数额的资金,财产或利润时——零和是常和的 特例。双方基本关系仍是竞争。
❖ 变和博奕
PPT文档演模板
第八章博弈论
三、博奕类型
1.参与人行动的先后顺序:
❖静态博奕:博奕中,参与人同时选 择行动或虽非同时但后行动者并不 知道前行动者采取了什么具体行动。
❖动态博奕:指参与人行动有先后顺 序,且后行动者能观察出先行动者 行动的选择。
PPT文档演模板
第八章博弈论
2.行动(策略):参与人在博奕的某个时点的决
策变量
3.支付(得益):指在一定的策略组合下,参与
人得到的确定效用水平,根据各博奕方得益之和 情况的不同,把博奕分为:
❖零和博奕:一方的收益必定是另一方的损失(见 表:法律诉讼)
特点:总得益=0(石头、齐、硬币……)双方是你 死我活的关系
❖有些博奕中可能不止一个纳什均衡,而究 竟哪个均衡实际上会发生
❖从动态的角度分析,可减少纳什均衡的个 数。
❖博奕的标准型的三个要素:参与人、可选 策略、支付函数——两人博奕可用矩阵表 示
PPT文档演模板
第八章博弈论
博奕的另外一种形式——扩展型,包括 五个要素:
❖参与人
❖每个参与人选择行动的时点
❖每个参与人在每次行动时可供选择的 行动集合
❖静态分析时有两个纳什均衡:
(进入,高价)(不进入,低价)
❖动 态 分 析 : 这 里 , 企 业 B 选 择 行 动 (进入或不进入),企业A后选择是 合作或斗争,最后的数字为支付水平。
PPT文档演模板
第八章博弈论
PPT文档演模板
•高价合作 •40,50
•企业 •B
•进入 •企业 •A
•低价斗争 •-10,0
❖而博论:个人效用不仅依赖于自己的选 择,而且依赖于他人的选择。
PPT文档演模板
第八章博弈论
二、博奕论的基本要素
1.博奕方(参与人、局中人):博奕中独立
决策、独立承担博奕结果的个人。囚犯两难中 的警察和齐威王田忌赛马中的孙膑,不是博奕 方。 ❖ 单人博奕 ❖ 两人博奕 ❖ 多人博奕——破坏者 3个城市 80个委员 : 33 29 18
这是一个“多劳不多得,少劳不少得”的均衡 类似:股份公司中的大股东、小股东;股市中的
大户、小户;市场中的大企业、小企业。
PPT文档演模板
第八章博弈论
三、纳什均衡
它是完全静态博奕解的一般概念:指在知 道其他参与人采取的策略后,能够使自 己的支付最为有利的策略组合。
❖一旦达到纳什均衡,双方都不会改变其 策略,所以纳什均衡——稳定解
PPT文档演模板
第八章博弈论
智猪博奕
小猪
按
等待
按
大猪
等待
•
•
1
•
•3
•
-1
0
•7
PPT文档演模板
4 2
0
第八章博弈论
小猪的最优策略:等待 大猪无最优策略:即大猪的最优策略是依赖于 小猪的策略
此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按
PPT文档演模板
第八章博弈论
广告战 :
企业B 广告促销 不作广告
•
•
广告促销 •10
•
企业A
不作广告
•
2
•6
5
0
15
8 10
PPT文档演模板
第八章博弈论
二、重复剔除的最优策略均衡
❖在每个参与人都有最优策略的情 况下,最优策略均衡是很理想的, 但大多数情况下,该均衡是不存 在的。尽管如此,在有些博奕中, 仍可用最优策略逻辑找到均衡。
PPT文档演模板
第八章博弈论
2.信息结构:参与人对有关其他参与 人的特征,战略空间、支付函数的知 识
❖完全信息
❖不完全信息
PPT文档演模板
第八章博ห้องสมุดไป่ตู้论
• 顺序 •信息
•完全信息
•不完全信息
•静态
•动态
•完全信息静态 博奕
•纳什均衡
•不完全信息静 态博奕
•贝叶斯纳什均 衡
•完全信息动态 博奕
•子博奕精练纳 什均衡
PPT文档演模板
第八章博弈论
1.麦片商博奕
B 咸麦片
甜麦片
咸麦片 A
甜麦片
PPT文档演模板
•
•
-5
10
•
-5
10
•
-5 • 10
10 -5
第八章博弈论
2.斗鸡博奕:两个手持利剑从独木桥 的两端走向中间进行决斗。
B
进
退
进
•
•
-3
A
•
-3
退
• •
2 0
0 2
0 0
PPT文档演模板
第八章博弈论
足球 服装
•不完全信息动 态博奕
•精练贝叶斯纳 什均衡
PPT文档演模板
第八章博弈论
第二节 完全信息静态博奕
一、最优策略均衡
一般,每个参与人的最优战略选择依赖于 所具有其他参与人的选择,但在一些特 殊博奕中,一个参与人的最优战略可能 并不能依赖于其他参与人的战略选择。
这种不论其他参与人的策略如何,能使 自己的支付对自己最为有利的策略叫最 优策略。
❖该理论是研究决策主体的行为发生直接相互
作用时的决策以及这种决策的均衡问题。
PPT文档演模板
第八章博弈论
博奕论与经济学决策理论的区别:
❖后者涉及的个人决策:是在给定的价格 参数,收入的条件下,追求效用最大化 的决策(消费者均衡或生态者均衡), 个人利益(效用)只依赖于自己选择, 而外在于他人的选择。
第八章博弈论
PPT文档演模板
2020/12/12
第八章博弈论
第一节 博奕论的基本知识
一、博奕论
❖博奕论(Game Theory)对称对策论、游戏 理论或策略运筹论,是指一些个人、队组、 或其他组织,面对一定的环境条件,在一定 的规则下,同时或先后,一次或多次,从各 自允许选择的行动或策略中进行选择并加以 实施,从中各自取得相应的结果的过程。
❖每个参与人在每次行动时有关对于过 去行动选择的信息
PPT文档演模板
❖支付函数
第八章博弈论
例: 市场进入阻挠博弈
❖A——唯一供给者 B——可能竞争者
A
高价(默许)
低价(斗争)
B
PPT文档演模板
•
进入 •
• • •
不进入
•
50 40
300 0
0 -10
300
0
第八章博弈论
❖假 定 进 入 前 垄 断 利 润 为 300 , 进 入 之 后寡头利润共为100(各50),进入成 本为10