第6章 扩展式博弈
博弈论-6
7
无限回合讨价还价 甲、乙两人仍就如何分享10000美元现金进行谈判,只 是谈判规则变为:从甲开始出价,对方均可以接受, 也可以不接受;接受则博弈结束,不接受自己给出新 分配方案,博弈进入下一回合,该过程可以无限继续。
博弈的奇数回合由甲出价,偶数回合由乙出价 博弈的消耗系数δ
Shaked和Sutton(1984) 一个无限回合博弈从第一回合开始和从第三回合开始 的结果是一样的
8
假设存在一个博弈的解,甲在第一回合出价S,乙接受, 双方支付分别为S和10000-S。根据Shaked和Sutton (1984),S也应是从第三回合开始的无限回合博弈的 逆向归纳法求出的解,即第三回合也应该是甲出价S, 乙接受,博弈结束。 在无限回合讨价还价博弈中,甲在第三回合的出价相 当于最终出价,从而无限回合博弈也相当于有强制力 的三回合讨价还价博弈。所不同的是,这个三回合讨 价还价博弈要求第一、三回合出价相同(S不必然为 10000)。 根据前面三回合讨价还价博弈的逆向归纳法结论,该 博弈的解是甲在第一回合出价(1-δ)10000+δ2S,乙 接受,双方支付分别为(1-δ)10000+δ2S和10000δ-δ2S。
18
间接融资与挤兑风险
银行为了给一家企业放贷一笔 20000元的贷款,以20 %的年利率吸引客户的存款。 两个客户各有10000元资金,若他们把资金作为1年期 定期存款存入该银行,银行就可以向企业贷款。如果 在不满1年的时候,一个客户单独或两个客户同时要 求提前取出存款,银行就不得不提前收回贷款。 假设提前取款时企业只能收回80%的本钱,并全部偿 还给银行。若是一个客户要求提前取款,则银行会偿 还其全部本金,余款则属于另一客户;若两客户同时 要求提前取款,则平分收回的资金。 假设银行不收手续费和提成。
扩展式博弈与标准式博弈
• 却不知道:诸葛亮知道自己知道“实则虚之”的 用兵之道
2-2 扩展式博弈
• 扩展式博弈(extensive form game): • 描述工具是博弈树
Game tree: ultimatum bargaining game(分 配100元钱)
给B90( 9-1分) 给B10( 1-9分)
10
90
90
10
10
0
90
0
0
90
0
10
0
0
0
0
2-4 联盟博弈
– 吴、蜀之间存在利益冲突,并多次兵戎相见, 但两国为什么在赤壁之战中能结为联盟?
• 联盟:相互协调行动的一组博弈参与人 • 联盟价值:一个联盟的产出(收益)
2-4 几种著名的博弈例子
囚徒困境
1,-1
下中上 1,-1
-1,1
1,-1
强 齐 王中
弱
博弈描述的复杂性
——再谈田忌赛马
强
中
田中
田忌 弱
Hale Waihona Puke 忌弱强中强
齐王
弱
田忌 弱 强
田 忌
田 忌
中 弱
强 中
齐王 强 弱
齐王 强
弱
田忌 弱
田忌 强
弱
田忌
强 中
田忌 强
中
弱
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开 囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
(1)若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方 保持沉默,此人将即时获释,沉默者将判监10年。 (2)若二人都保持沉默(相关术语称互相“合作”),则二人同样判监 1年。 (3)若二人都互相检举(相关术语称互相“背叛”),则二人同样判监 8年。
博弈论(第六章)
好 1
卖 2 买 不买 买 不买 不卖 卖
差 1
不卖
(a)
谢富纪 2009年4月 6
1. 不完美信息动态博弈
买
卖
不买
1
不卖
好
1
买
2
差 卖
1
不卖
不买
(b ) 二手车交易扩展形
谢富纪 2009年4月 7
1. 不完美信息动态博弈
好 1 卖 2 买 不买 买 1 差 不卖 (0,0)
1 不卖 卖
(0,0) 不买
谢富纪
2009年4月
15
2. 完美贝叶斯均衡
所以,子博弈完美纳什均衡是完美贝叶斯均衡在完 全且完美信息动态博弈中的特例。 要求1实际上是解决完全但不完美信息动态博弈的 基本前提,要有一个判断,否则决策就会失去依据。 要求2序列理性相当于子博弈完美纳什均衡中的子 博弈完美性。而在多节点信息集开始的不构成子博 弈的部分中,序列理性通过要求各方遵循最大利益 原则而排除博弈方策略中不可信的威胁或承诺。 序列理性要求对保证完美贝叶斯均衡的真正稳定性 是很重要的。
选R),对博弈方1选L还是选M的可能性大小毫无
判断,则他将不知道选U和选D哪个更合理,也就 是说,对两条路径的判断是决策的必要基础,从而 也使均衡策略的基础。
谢富纪
2009年4月
18
2. 完美贝叶斯均衡
条件2的必要性: 如果不要求序列理性,则博弈方2有一个可为自己争取 到的收益3,即博弈方2威胁在轮到自己选择时唯一地 选D,这样策略组合: 博弈方1:第一阶段选R; 博弈方2:如果轮到自己选择,唯一选D。 是一个纳什均衡,也是一个子博弈完美纳什均衡(因为 该博弈没有子博弈)。 但博弈方2的上述策略在博弈方1不选R时选L的概率较 大时,明显包含一个不可信的威胁。因此要求2对于 保证不完美信息动态博弈的均衡策略中没有不可信的 威胁或者承诺具有关键作用。
上海财经大学《高级微观经济学I》扩展式博弈
0
13
A 扩展式博弈
• 例:约会博弈
d1.1
– H 1={d1.1 ,d1.2} – H 2={d2 .1, d2.2} – 信息集
Reading 2
Concert
d1.2
• I 11={d1.1 }; I 12={ d1.2}
2B
S
• I 2={d2 .1, d2.2}
d2.1
d2.2
B
S
B
S
3
High See
d1.1
raise
d2.1
Pass
Meet
Low
d1.2
raise
-1 See
1
d2.2
Pass
Meet
1
2
-1
-2
1
-2
-1
2
A 扩展式博弈
• 连续行动集:货币政策
– 第一阶段:中央银行宣布政策目标 π0 – 第二阶段:居民/企业形成通货膨胀预期πe – 第三阶段:中央银行决定实际政策 π
0
– a(I1.1)∈ A(I1.1) , a(I1.2)∈ A(I1.2)
– 2的信息集I2 ={d2}
– 策略: s2 =a(I2)
d1.1
C
d2
S
C
d1.2
1
S
C
3
4
3
2
5
18
A 扩展式博弈
• 策略(一般定义)
– 是参与者信息集Ii到行动集A(Ii)的函数
– s1 =a(I1)
d1
• a(I1)∈ A(I1)
• 例:三阶段蜈蚣博弈
1.1
S
C
2
2
研究生-第六章 博弈论与信息经济学
逆向选择
3.逆向选择与信贷市场 信贷配给是信贷市场上存在的一种典型现象,原因在于逆 向选择现象存在,高风险的项目驱赶了低风险的项目. 信贷市场中,一般高风险与高收益成正比,银行不了解贷 款者的类型,厂商知道自己的信息.导致贷款利率与银 行期望收益之间的变化如图所示,利率上升的(直接的) 收益效应大于(间接的)风险效应,π随r上升而上升; 当r>r*时,利率上升的(间接的)风险效应超过(直接 的)收益效应,π随r的上升而下降,银行期望收益最大 化的利率为r*.
隐藏行动 事前 隐藏信息 逆向选择模型 信号传递模型 信息筛选模型 隐藏信号的道德风险模型
事后
隐藏行动的道德风险模型
第一节 逆向选择
1.逆向选择与旧货市场(Akerlof,the market for lemons) 逆向选择:在鉴定交易契约前,进行市场交易的一方 可能因为占据信息优势,做出对自己有利,对另一方 有害的事情,从而降低了市场效率,甚至可能导致这 一市场的萎缩. 在旧货市场,卖者拥有信息,买者缺乏信息,买者以 平均质量的价格购买旧商品,将质量较高的旧商品逐 出市场,质量较差的旧商品留在市场,并最终成交. 即为旧货市场的逆向选择行为.
第三节 完全信息静态博弈(二) ——混合策略(mixed strategies) ——混合策略(mixed strategies)
1.混合策略 定义:σ*=(σ1*,…,σn*)=(σi*,σ-i *)是一纳什混合 策略均衡,当且仅当对所有局中人而言, σi* 是σ-i*的最适反应,ui(σi*,σ-i *)≥ ui(σI',σ-i *), σ σ σ ≥ σ σ 对所有σi'∈∑i成立). 持混合策略的前提是在均衡时两种策略的报酬会 相等,是预期支付最大化的推导结果. 2.案例分析 掷硬币
第六章、合作博弈 《经济博弈论基础》PPT课件
• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。
7.3扩展式博弈
7.3扩展式博弈扩展式博弈定义7.13扩展式博弈一个扩展式博弈Γ由下列要素组成由下列要素组成::1、 有限的有限的参与人集合参与人集合N ;2、 行动集A ,它包括所有可能的行动它包括所有可能的行动,,不必是有限的不必是有限的3、 结或者或者历史的集合历史的集合X .(1) 初始结X ∈0x ,或空的历史或空的历史。
博弈从初始结开始开始。
(2) 对于一些有限多的行动A a i ∈,每个}{\0x x X ∈采取的形式为),...,,(21k a a a x =,这里a 1,a 2…表示第一步表示第一步、、第二步第二步。
的行动的行动。
(3) 如果对于一些K>1,K>1, }{\),...,,(021x X a a a k ∈,那么那么,,}{\),...,,(0121x X a a a k ∈−一个结或一段历史只是对在博弈中迄今已被采取的行动的一个完全的描述的行动的一个完全的描述。
}),({)(X a x A a x A ∈∈≡表示在历史}{\0x X x ∈之后轮到参与人行动时的该参与人可选择的行动集后轮到参与人行动时的该参与人可选择的行动集。
4、 一个行动集A x A ⊆)(0以及在A(x 0)上的一个概率分布π被用于描述博弈中自然的行被用于描述博弈中自然的行动动。
自然总是首先行动的首先行动的,,并且只行动一次并且只行动一次,,以概率π随机的在A(x 0)中选择一个行动。
因此,}{\),...,,(021x X a a a k ∈意味着对于i=1且只有i=1i=1,,)(0x A a i ∈。
5、 终点结集合A a X a x X x E ∈∉∈≡对于一切,),({},。
每个终点结描述了由开始至结束的博弈的一个特殊的完全演变特殊的完全演变。
6、 一个函数N x E X →}){(\:0U ι,表明在属于X 的每一个决策结上那个将轮到的采取行动的每一个决策结上那个将轮到的采取行动的参与参与人。
4.扩展式博弈与反向归纳策略
扩展式博弈的形式
完全信息的情况
①
L
②
R
②
l
2 0
r
2 1
l1Biblioteka 0r 3 1
不完全信息的情况
①
L
R
l
2 0
r
2 1
②
l
1 0
r
3 1
扩展式博弈的规则
在一个偏僻的山里,有一个村庄,村里有100对夫妇。 在这个村里已经形成了约定成俗的规定,如果女人发现自己的丈夫对自 己不忠的话,就会毫不犹豫的将他杀死,而且当天执行。当然,她必须 有确切的证据来证明他丈夫的不忠。由于这个因素,某个女人发现某个 男人不忠,她不会告诉那个不忠男人的妻子。但是,她会告诉其他人的 妻子,并且女人们会相互的传递这一信息,因此最后,一个男人不忠, 除了其妻子不知道外,其他女人都知道。 事实上是,村子里的这100对夫妇的男人都不忠,但由于女人不会将她们 知道的事实告诉不忠男人的妻子,每个女人不知道自己的男人不忠,因 此,该村子一直很稳定,而没有发生妻子杀丈夫的行为。 村子里有1个辈分很高的老太太,她德高望重,诚实可敬,对村子里的情 况了如指掌。一天,这位老人对这这100个女人说了一句很平常的话: “你们的男人当中至少有一个是不忠的。”于是,村里发生了这样一个 事情,前99天,村里风平浪静,但到了第100天,村里发生了一场大屠杀, 所有的女人都杀死了她们的丈夫! 为什么会这样?
结论
作为博弈方你不应该仅仅是个被动的参与人,满足于接受别人制定的博 弈规则,而应该设法改变博弈使其对自己尽量有利
可置信的承诺能够促进长期利润,但承诺方也确实因此而对自己的行动 施加了严格的限制。这种通过限制自己行动来获取竞争优势的做法被称 为策略性行为
第六章(完全但不完美信息动态博弈)
在该均衡策略组合下,博弈方2 的两节点信息集 是不在均衡路径上的信息集。 要求4要求博弈方 2此时在这个信息集的 “判断” 也要满足贝叶斯法则和双方的均衡策略。同要求 3, 贝叶斯法则仍然自动满足,因此我们只需要讨论博弈 方 2 的 “判断”与双方在此处可能有的均衡策略的 一 致性。 显然,到达这个信息集表明博弈方1 在第一阶段 偏离了上述均衡策略 R,按照前面的分析,博弈方2 一定会 “判断”博弈方1必然选择L策略(从得益分 布 情况可知)。
(2,1) (0,0) (1,-1) (-1,0)
图6-1 二手车交易扩展式表示
起始节点表示第一阶段卖方 (即博弈方1)对 如何使用汽车的选择,共有“好”和“差”两种可 能的 选择。 第二阶段卖方若选择 “不卖”,交易没有发生; 如果他选择“卖”,则进行到买方选择的第三阶段, 此时买方并不知道卖方的选择究竟是“好—卖”还 是 “差—卖”,用多节点信息集表示这种不完美性。 第三阶段买方不能直接作出针对性的选择,他 必须对这个多节点信息集中各节点出现的可能性做 出判断。
即对博弈方2来说,“判断” 是直接针对博弈方 1 的上期选择的,因此不存在条件概率问题,贝叶斯法 则自动满足。 再看博弈方2判断 判断是否符合各方的均衡策略,即 判断 看“判断” 是否符合博弈方1第一阶段的选择和博弈 方 2自己本阶段的选择。 由于博弈方1的均衡策略是在第一阶段选择L,因 此博弈方2只有判断 “博弈方1选择L的概率p=1” 才 与 博弈方1的策略相符合,而且这种判断也与博弈方2自 己在本阶段的选择U相符合,因此该 “判断”正是博 弈
1 ⋅ p + 0 ⋅ (1 − p ) = p
而选D的期望得益为:
0 ⋅ p + 1(1 − p) = 1 − p
博弈的描述
后,局中人 1 从 52 张纸牌中抽出一张牌,自己看完 牌的颜色后,决定是停牌( fold )还是加注 (raise) 。 若是停牌,需要将牌出示给 2 看,然后博弈结束。 此时,牌若是红色,局中人1赢,否则,则1输。若 是加注,局中人 1 需再拿出一元钱作为赌注,然后 局中人 2 决定是放弃( pass )还是追随 (meet) ,若 放弃,局中人1赢,博弈结束;若追随,则2需要也 拿出一元钱作为赌注,然后,1出示牌,若红色,1 赢,否则,1输。
Rf
Fr
Ff
(-2,2)
(1,-1)
(-1,1)
24
三、扩展式博弈的标准式表述
第一步:找出参与人的策略
参与人1的策略 S1={Rr,,Rf,Fr,Ff} 参与人2的策略 S2={M, P}
25
三、扩展式博弈的标准式表述
第二步:计算每一个策略组合下的报酬
策略组合(Rf, M)下参与人1和2的报酬
8
一、扩展式博弈(续5)
2、构成扩展式的要素
局中人集合
行动顺序
依赖行动的报酬 采取行动时掌握的信息 外生事件的概率分布
9
一、扩展式博弈(续)
3、扩展式的严格定义
节点:xm 枝: ( xm1 , xm ) 路径: {( x1 , x2 ), ( x2 , x3 ),, ( xm1 , xm )}
(2,-2)
(1,-1)
0
1
(1,-1)
(-2,2)
raise 2
(1,-1) (-1,1)
7
一、扩展式博弈(续4)
一个人不可能在他不知道有哪些选择的情 况下作出有意义的选择。 为了保证局中人在博弈的任何节点总是知 道他面临的选择,如果两个决策节属于同 一局中人的同一个信息集,那么他们的行 动分支就必须相同。
mathematical_计算博弈过程_概述及解释说明
mathematical 计算博弈过程概述及解释说明1. 引言1.1 概述在现代社会中,决策和博弈过程无处不在。
无论是在政治、经济还是商业领域,我们都需要进行各种决策,并且这些决策的结果受到各种因素的影响。
数学计算博弈理论提供了一种分析和解释这些决策过程的方法,使我们能够更好地理解和预测各种博弈情境下的可能结果。
1.2 文章结构本文将从以下几个方面对数学计算博弈过程进行概述和解释说明。
首先,在第二部分“数学计算博弈过程概述”中,将介绍博弈理论的基本背景和概念。
然后,在第三部分“解释说明数学计算博弈过程的基本要点”中,将详细讨论博弈过程中涉及到的策略、收益以及纳什均衡等关键要素。
接下来,在第四部分“示例及实际应用案例分析”中,将通过具体案例来展示这些理论知识在实际问题中的应用。
最后,在第五部分“结论与未来研究方向展望”中,将总结文章的主要内容,并对数学计算博弈的未来发展方向进行展望。
1.3 目的本文旨在通过对数学计算博弈过程的概述和解释说明,帮助读者更加深入地了解和理解博弈理论及其应用。
同时,本文还将提供一些实例和案例分析,以便读者能够更好地将这些理论知识应用到实际问题中。
最后,本文还将探讨数学计算博弈未来的研究方向,为相关研究者提供新的思路和视角。
通过阅读本文,读者将能够拓宽自己对于数学计算博弈过程的认识,并用于解决实际问题。
2. 数学计算博弈过程概述:2.1 博弈理论简介:博弈理论是研究决策制定者在相互依赖的环境中进行决策的分析工具。
它提供了一种框架,用于研究多方参与、相互影响以及利益冲突的情境中的最优决策。
博弈理论主要关注个体或团体之间的互动,并通过模型化、分析和解释不同参与者的选择行为来揭示最佳策略。
2.2 基本概念和术语:在数学计算博弈中,存在一些基本概念和术语需要了解。
首先,需要明确博弈参与者(玩家)的角色和数量。
通常将玩家抽象为不同实体,他们根据各自目标和偏好进行选择。
其次,策略是玩家在特定情境下可选择的行动方式。
第6章:扩展式博弈及其均衡)
开发
-0.3,-0.3 -0.3,-0.3 0.1,0 0,0.1 0,0 0,0.1
0.1,0 0,0
A
不开发
注意:均衡与均衡结果是不同的!!!
SA = A(h(O))
= {开发,不开发 ; }
SB = A(h(x1)) × A(h(x2 )) ={{开发,开发},开发,不开发}, { {不开发,开发},不开发,不开发} { }
定义1:设 S = (s , s ,..., s , S*为扩 ) 展式的一个Nash均衡,当且仅当 ∀i ∈Γ
* * 1 * 2 * n
s ∈argmaxUi (si , s−i )
* i * si∈Si
或者∀si ∈Si, i (si , s ) ≥ Ui (si , s )。 U
* −i * −i
所有参与人的一个纯战略组合
s = (s1, s2 ,..., sn )
决定了博弈树上的一个路径,例如(开发, {不开发,开发})决定了博弈路径: A (0.1,0) 开发 B 不开发
战略组合(不开发,{开发,开发})决定了 博弈路径: A (0,0.1) 不开发 B 开发
不同的纯战略组合可能决定同一个路 径,例如,战略组合(开发,{不开发, 开发})和(开发,{不开发,不开发}) 决定了: A (0.1,0) 开发 B 不开发
∀x1, x2 ∈ X ,
≺
x1 ≺ x2 ⇔ x1在 2之 x 前
1)传递性(transitivity):
≺满足:
∀x1, x2 , x3 ∈ X , 若 1 ≺ x2,x2 ≺ x3,则 x x1 ≺ x3
2)反对称性(asymmetricity):
∀x1, x2 ∈ X , 若 1 ≺ x2, x 则 x2 ≺ x1 不 立 成 。
第六讲 博弈的扩展式表述
完美信息动态博弈
战略式表述的局限:忽略参与人的行动 顺序
NE的缺陷:部分NE包含不可置信的战略
精练NE的思路:利用(准确反映参与人 行动顺序的)扩展式表述剔除包含不可 置信战略的NE
Selten(1965) 子博弈精练(subgame perfect)NE (SPNE)
子博弈:(完美信息博弈中),每一个 决策结及其后续结构成一个子博弈
博弈本身构成自身的一个子博弈
房地产开发博弈中的三个子博弈
自身
两个只有开发商B决策的单人博弈
B
B
开发
不开发
开发
不开发
-3,-3
1,0
子博弈B1
0,1
0,0
子博弈B2
SPNE:一个战略组合
(1)它是整个博弈的NE
(2)其相关行动规则在每一子博弈上都 是NE
一个在(从最后一个决策结开始的)子 子博弈中NE所对应的战略构成的(从倒 数第二个决策结开始的)(新的)子博 弈的NE的特点:
(1)它将是从倒数第二个决策结开始的 子博弈的NE
(2)它将满足从最后一个决策结开始的 子博弈的NE的要求
以此类推
直到从初始结(initial node)开始的原博 弈
“灵活务实型”
不论A开发还是不开发,B都不开发,记为(不 开发,不开发)
含义:不论博弈到达B的哪一个信息集,B都选 择不开发
“木呐保守型”
B的战略空间: ((开发,开发);(开发, 不开发);(不开发,开发);(不开发,不 开发)) 房地产开发博弈的战略式表述:
开发商B
A 开发
扩展型博弈和策略型博弈
混合策略Nash均衡
• 当一个博弈没有纯策略Nash均衡时,人们考虑计 算所谓混合策略Nash均衡。 • 局中人的一个混合策略是指他按照某个概率分布 随机地选用各个纯策略;如果他有K个纯策略,那 么他的一个混合策略可以表示为i=(pi1,…,piK),其 中pik是他选用第k个纯策略的概率。 • 当局中人使用混合策略时,各人的期望赢得等于 他在每一个纯策略横断面上的赢得与该策略横断 面出现的概率的乘积之总和。为简便计,i的期望 赢得函数仍然用pi表示。
混合策略Nash均衡
• 无区别原则:如果*=(*i,*-i)是个混合策略Nash 均衡并且pi(*i,*-i) =M,那么对*i中局中人i以正 概率选用的每一个纯策略si都有pi(si,*-i) =M。换 句话说, *-i使得局中人i对于他实际采用的每个 纯策略无区别。 • 根据无区别原则,通常可以求解一个利用优劣关 系简化后得到的KK双矩阵博弈。
混合策略Nash均衡
• 局中人i的全体混合策略的集合记为i;注意一 个纯策略也可以看作一个特殊的混合策略。 • 如果每个局中人都选用一个混合策略,就得到一 个混合策略横断面。全体混合策略横断面的集合 记为。 • 一个混合策略横断面*=(*1,…, *n)叫做混合策略 Nash均衡,如果如果对每个局中人i, 他选定的混 合策略*i都是对所有其它局中人选定的混合策略 *-i的最优回应:pi(*)pi(*|i), *ii, iI。
二人策略型博弈Nash均衡的计算
• 可以按照定义找出所有的纯策略Nash均衡; • 如果策略型博弈比较复杂,可以用策略间的 “优”, “劣”关系化简,然后再寻找均衡。称i 的一个策略si劣于si (或si优于si),如果不管其他 人选定什么策略,si都比si使i得到更小的赢得。 如果存在一个si,它优于i的任何其他策略,就 称si为i的最优策略。显然,劣策略不可能构成 Nash均衡。所以,寻找Nash均衡时可以把劣 策略划掉以简化策略型博弈。
博弈论拓展型表格
博弈论拓展型表格通常被称为扩展式,是博弈论分析和解决多方参与复杂决策的重要工具。
下面我会为您简单介绍一下扩展式表格的结构和应用。
扩展式表格是一种用于博弈分析的结构化表示工具。
该表格由多个行为者(称为玩家)组成,每个玩家都有不同的可选策略,例如行动或不行动,而策略组合将会决定博弈结果的概率。
扩展式表格通常采用树状结构,每个分支都展示了一种策略的发展过程。
通常,扩展式表格可以由以下四个部分组成:
1. 玩家:参与博弈的玩家,每个玩家都有自己的策略集合。
2. 信息集:表明在某些必须在同一时间内作出决策的情况下,玩家可能无法判断对手所采取的策略,因此可以将这些相同的决策节点分到一个信息集中。
3. 行动:博弈中玩家可以选择的行动或策略。
4. 支付:在每个可能的情况下,如果某一方采取了一定策略,它将付出或获得多少报酬或利益。
在使用扩展式表格解决博弈问题时,通常会使用一些主要的博弈解决方法,如支配策略、纯策略,混合策略和子博弈平衡等,这些方法将有助于决策者分析博弈结果、推导出最优策略以及各玩家获得的报酬或利益。
总之,扩展式表格是一种博弈论分析工具,将博弈问题转化成了树状结构,有助于博弈分析和解决多方参与的复杂决策问题。
扩展式博弈PPT精品文档
• 在“新产品开发博弈”中,假设企业1先行动, 企业2后行动,但企业2行动时不知道企业1的 行动。
企业2行动时,只知道 博弈要么到达点x2,要 么达到点x3 ,但具体在 哪一点,企业2不清楚。 也就是说,企业2只知 道自己位于决策结集合 {x2, x3 }上,但不知道位 于{x2, x3 }中哪一个决策 结上。
需求大
企业 开发(a):投入2千万元资金需求小对 对 对手 手 手不 开 开开 发 发发 , ,, 赔 获获 4利00利 润万润 3元 0200万0万 元元
不开发(b):不投入资金,利润为0
• 由于上述博弈较为简单,我们用文字描述 的方法给出了其扩展式描述。但对于更为 复杂的博弈问题,文字描述所给出的模型 就会显得繁冗拖沓,极不直观。
(1) 企业2知道企业1的选择;
(2) 企业2不知道企业1的选择。
• 对于第一种情形,企业2知道企业1的选择, 即知道企业1选择了“开发”还是“不开 发”,因此,企业2知道博弈是从x1到了x2 还是从x1到了x3。
• 对于第二种情形,企业2不知道企业1的选 择了,x3。即不知道博弈是从x1到了x2还是从x1到
策问题,包括参与人行动时可供选择的 行动方案、所了解的信息; (4) 参与人的支付函数。
例子: 新产品开发博弈
• 试用扩展式博弈对两个企业都知道市场 需求,且企业1先决策,企业2观测到企 业1的选择后再进行选择的博弈情形即完 全信息动态的“新产品开发博弈”进行 建模。
完全信息动态的“新产品开发博弈”的扩 展式博弈包括以下要素:
下图表示参与人3选择时,既不知道参与人2的选 择,也不知道参与人1的选择。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
扩展式博弈的定义:
扩展式博弈包括以下要素: (1) 参与人集合 Γ ={1, 2,..., n} ; (2) 参与人的行动顺序,即每个参与人在何时行 动; (3) 每个参与人行动时面临的决策问题,包括参 与人行动时可供他选择的行动方案以及他所 了解的信息; (4) 参与人的支付函数,即博弈结束时每个参与 人得到的博弈结果。
问题:
• 如何在博弈树中,将“企业2行动时 是否观测到企业1的选择”这一信息 表示出来?
•
在完全信息动态的“新产品开发博弈” 中,企业2决策时,企业1已经做出选 择。此时,企业2面临的决策情形就 有以下两种: (1) 企业2知道企业1的选择; (2) 企业2不知道企业1的选择。
• 对于第一种情形,企业2知道企业1的选 择,即知道企业1选择了“开发”还是 “不开发”,因此,企业2知道博弈是从 x1到了x2还是从x1到了x3。这就意味着当 轮到企业2决策时,他知道自己是在点x2 上还是在点x3上;
不开发
x4
-4 0 0 ,-4 0 0
x5
2 0 0 ,0
x6
0 ,2 0 0
0 ,0
x7
• 由于在博弈分析中,假设博弈的结构(或 描述方式)为共同知识,因此,在以后的 讨论中,如果给出博弈树,就意味着所 有的参与人都同时一起看到了博弈树。
• 除了前面一再提到的博弈结构和参与人 完全理性为共同知识外,对于多阶段的 动态博弈问题,一般还假设参与人满足 “完美记忆”(perfect recall)要求,即假 设参与人不会忘记以前知道或者做过的 事情。
参与人1第二次行动时 忘了他第一次行动时的 选择 。
L
2 1
x1
R
2
L′
x4
x2
1
R′
1
L′
x6
x3
1
R′
x7
L′′
R′′
L′′
x5
R′′
L′′
R′′
L′′
R′′
第六章 扩展式博弈
主要内容: 一、扩展式博弈 二、扩展式博弈的战略及其Nash均衡 三、两种博弈描述形式的比较
二、扩展式博弈的战略及其Nash均衡
Ai ( H i ) =
I i ∈H i
∪ Ai ( I i )
• 参与人i的一个纯战略si就是从信息集集 合Hi到行动集合Ai(Hi)的一个映射关系, 即
si : H i
→
Ai ( H i )
• 其中,对 ∀I i ∈ H i , si ( I i ) ∈ Ai ( I i )
• 根据上述定义,参与人i的一个纯战略可 以解释为参与人i在各个信息集上的行动 组合。 • 因此,在以后的讨论中,可以用参与人i 在每个信息集上的行动集Ai(Ii)的笛卡尔积 来表示参与人i的战略集Si,即
• 为了将“企业2行动时是否知道自己是 在博弈树中的点x2上还是在点x3上”这 一点说清楚,需要引入“信息集”(infor mation set)的概念。
•
在博弈树中,参与人i的一个信息集(用Ii表示) 是参与人i决策结的一个集合,它满足以下两 个条件: (1) Ii中的每个决策结都是参与人i的决策结; (2) 当博弈到达信息集Ii(即博弈到达Ii中某个决策 结)时,参与人i知道自己是在信息集Ii中的决 策结上,但不知道自己究竟在Ii中哪个决策结 上。
下图表示参与人3选择时,知道参与人1的选择, 但不知道参与人2的选择的博弈情形。
1
x4
x2
3
R′
x5 x6
L′
x3
3
R′
x7
L′′
R′′
L′′
R′′ L′′
R′′
L′′
R′′
下图表示参与人3选择时,知道参与人2的选择, 但不知道参与人1的选择的博弈情形。
1
L
2
x1
R
2
L′
x4
x2
• 一个扩展式博弈实际上已定义了博弈的 参与人及参与人的支付,因此,如果能 定义一个扩展式博弈的战略,那么就意 味着给出了一个扩展式博弈的战略式描 述,同时也就意味着可以用Nash均衡来 描述博弈的解。
• 所谓参与人的战略就是参与人在博弈中 的行动规则,它规定了参与人在博弈中 每一种轮到自己行动的情形下,应该采 取的行动。
(4) 两个企业的支付如下:
对手不开发,获利润800万元 需求大 对手开发,获利润300万元 开发(a ):投入2千万元资金 对手不开发,获利润200万元 企业 需求小 对手开发,赔400万元 不开发(b ):不投入资金,利润为0
• 在上述例子中,我们用文字描述的方法 给出了博弈问题的扩展式描述。对于一 些简单的博弈问题,这种文字表述的方 法也许是简单可行的。但可以想象,如 果我们遇到的是更为复杂的博弈问题, 文字描述所给出的模型就会显得繁冗拖 沓,极不直观。
• 因此,我们需要寻找一种简便易行的扩 展式博弈的描述方式。下面我们就以 “新产品开发博弈”为例,介绍一种不 仅简单方便,而且十分直观的扩展式博 弈的描述方式——博弈树。
1
L
2
x1
R
2
L′
3
x2
R′
3 3
L′
x6
x3
R′
3
L′′
x4
R′′
L′′
x5
R′′ L′′
R′′
L′′
x7
R′′
在以后的讨论中,我们假设博弈树 中的博弈都是从上往下进行的,因此, 在不引起歧义的情况下,我们都不标示 出博弈树中枝的方向。
例子:
• 考察“新产品开发博弈”。试用博弈树 描述“两个企业都知道市场需求,且企 业1先决策,企业2观测到企业1的选择后 再进行选择”的博弈情形。
Si =
I i ∈H i
∏ A (I )
i i
例如:
1 A x B 1 2 x x4 2 C D 2 ,1 1 x 3 x5 E F 1 ,1 x7 x6
1 ,2
3 ,0
• 参与人2的信息集为I2 ({x2}),参与人2在I2 ({x2}) 上的行动集为{C,D}。所以,参与人2的战略集 为{C,D} ; • 参与人1的信息集为I1 ({x1})和I1 ({x3}) ,其中参 与人1在I1 ({x1})上的行动集为{A,B},在I1 ({x3}) 上的行动集为{E,F}。所以,参与人1的战略集为 {A,B}×{E,F} ,即{A,E}、{A,F}、{B,E}和{B,F}。
第六章 扩展式博弈
主要内容: 一、扩展式博弈 二、扩展式博弈的战略及其Nash均衡 三、两种博弈描述形式的比较
一、扩展式博弈
• 所谓扩展式博弈(extensive form game)是 博弈问题的一种规范性描述。与战略式 博弈侧重博弈结果的描述相比,扩展式 博弈更注重对参与人在博弈过程中所遇 到决策问题的序列结构的详细分析。
• 考虑如下问题: 给定一个博弈问题的扩展式,该如 何来求解博弈问题的解? • 已知对于战略式博弈,可以用Nash均衡 来描述博弈问题的解,对于博弈树所描 述的扩展式博弈,是否同样可以用Nash 均衡来描述博弈问题的解?
• 对于一个博弈问题,要给出其战略式描 述,就必须定义清楚该博弈问题的三个 要素:参与人、参与人的战略以及参与 人在相应战略组合下的支付。
研究博弈问题的具体进程必须弄清楚的两个问题
(1) 每个参与人在什么时候行动(决策); (2) 每个参与人行动时,他所面临决策问题 的结构。这包括参与人行动时可供他选 择的行动方案,以及参与人行动时所了 解的信息。
• 上述两个问题构成了参与人在博弈过程 中所遇到决策问题的序列结构。 • 对于一个博弈问题,如果能够说清楚博 弈过程中参与人的决策问题的序列结构, 那么就意味着知道了博弈问题的具体进 程。
当市场需求大时,“新产品开发博弈”的博弈 树
企业1 开发 企业2 开发
x1
不开发
x2
不开发 开发
x3 企业2
不开发
x4
3 0 0 ,3 0 0
x5
8 0 0 ,0
x6
0 ,8 0 0
x7
0 ,0
当市场需求小时,“新产品开发博弈”的博弈 树
企业1 开发 企业2 开发
x1
不开发
x2
不开发 开发
x3 企业2
• 但在现实生活中,不满足“完美记忆” 要求的情形比比皆是。例如,人们在玩 扑克时,往往会忘记自己曾经出过什么 牌或者对手曾经出过什么牌;在棋类比 赛中,也会出现这种情况。
• 但是,在博弈分析中,如果没有“完美 记忆”假设,各种博弈结果都有可能出 现,那么我们也就无法对博弈进行预测。
不满足“完美记忆”要求的博弈情形
• 设X为一决策结集合,用Ii(X)表示参与人 的由决策结集X构成的一个信息集。 • 例如,I2({x2, x3})表示企业2的由决策结集 {x2, x3}构成的信息集,I2({x2})和I2({x3}) 分别表示企业2的由决策结集{x2}和{x3}构 成的信息集。 • 可以在博弈树中将同一信息集中的决策结 用虚线连接起来。
• 所谓博弈树就是由结和有向枝构成的 “有向树”。
企业1的选择 最上端的一个点(用空心圆 有“开发”和 表示),表示博弈的开始 。 “不开发”, 表示博弈达到 分别用标有 该点时企业的 “开发”和 所得 ,其中, “不开发”的 支付向量中的 有向枝表示。 第一个数字表 示企业1的所得, 第二个数字表 示企业2的所 得。
• 如果要用扩展式博弈对一个博弈问题进 行建模,那么除了要说明博弈问题所涉 及到的参与人及每位参与人的支付函数 以外,还必须对博弈过程中参与人所遇 到的决策问题的序列结构,进行详细的 解释,说清楚每个参与人在何时行动, 以及参与人行动时可供选择的行动方案 和所了解到的信息。