博弈论完整课件[浙江大学]Game_Cha
博弈论PPT课件

这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
博弈论完整版PPT课件

2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
精品课程《博弈论》PPT课件(全)

能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
博弈论教学课件(全)

二、博弈论的经济学渊源
经济学的一些思想为博弈论提供了基础,其中最 重要的就是所谓的“理性人”。
描述理性人的工具就是所谓的理性偏好。为了方便, 我们又用效用函数(在博弈论中称为收益函数)来 表示偏好。
构成博弈论基础的一个重要的经济定理就是所谓的 理性选择原理:如果决策主体的偏好是理性的,那 么(有限)选择集中就一定存在最优选择,这个选 择可能是唯一的,也可能是多个。
定义2.1 博弈表达的基本式(或策略式)由博弈的参 与者N,策略空间S和收益函数u三个要素组成,即G = {N, S, u}。
这里需要注意的是,完全信息静态博弈在多数情况 下,策略就等同于行动,所以G={ A,u}。但严格来 讲,策略并不是行动。
我们可以通过一个例子来加以说明。
[例1] 进攻与防守
对称博弈和对称均衡能够大大节省工作量,这也是博弈论中所举例子通常为对 称博弈的原因。
对称博弈通俗说就是代表参与者身份的下标,在分析中可以省略掉而没有关系。
四、混合策略
博弈论里面最根本的问题是什么?就是均衡 的存在性。如果均衡不存在,所有的工作都 成了无用功,之所以引入混合策略,意义就 在这里,因为如果仅仅限制在纯策略的范围 内讨论博弈的话,均衡有可能是不存在的。
双方争夺一个据点,有两条进攻路线X和Y,攻方有 两个军,而防守方也有两个军,只有当守方的兵力 不少于攻方时,才能击退进攻,否则据点将会失守。
首先可知守方的防守方案(即策略)为(0,2),(1,1),(2,0),即在X线路和Y线路驻扎 军队数,同样可以到的攻方的进攻方案(0,2),(1,1)和(2,0)。容易看出,行动并非策 略,策略是行动方案。
需要注意的几个问题:
(1)表达同一个偏好的收益函数不唯一,但在 单调变换下却是唯一的。
博弈论完整浙江大学GAMECha最新课件

下面给出有限次重复博弈的定义
Definition Given a stage game G,let G(T)(T<∞) denote the finitely repeated game in which G is played T times, with the outcomes of all preceding plays observed before the next play begins. The payoffs for G(T) are simply the sum of the payoffs from the T stage games.
第一阶段的行动组合是(M,M),则第二阶段的行动组 合将是(R,R);第一阶段的行动组合是(M,X)或(X, M),则第二阶段的行动组合将是(P,P)或(Q,Q);第 一阶段的行动组合博为弈论其完整[它浙江大,学]G则AME第_Cha二阶段还是(R,R)。
最新
参与人2 LM R P Q
L 4 , 4 5.5 , 4 3 , 3 3 , 3 3 , 3 参
行动组合 Stage 1 Stage 2
支付向量 总支付 平均支付
(A,B) (2,8) (1,4) (A,B)
(B,A) (5,5) (2.5,2.5)
(A,B) (5,5) (2.5,2.5) (B,A)
(B,A) (8,2) (4,1)
博弈论完整[浙江大学]GAME_Cha 最新
☺路径的支付采用平均支付与采用总支付相比的 优点:平均支付可以与阶段博弈的支付相比较。
博弈论完整[浙江大学]GAME_Cha 最新
回忆第二章第四节的“有同时选择的两阶段动 态博弈”。
两阶段囚徒困境其实属于这种类型博弈。无非这 里的参与人3、4与参与人1、2是相同的,行动空 间A3、A4 也与A1 、A2相同,并且总收益 μi(a1,a2, a3, a4)等于第一阶段结果(a1,a2)的收益与 第二阶段结果 (a3, a4)的收益简单相加。 ☺在“有同时选择的两阶段动态博弈”中第二阶 段参与人3和4的稳定行动依赖于第一阶段的可 行结果(a1,a2),表示为(a3*(a1,a2), a4*(a1,a2)),而 不是简单的(a3*, a4*)(关税博弈中第二阶段企业的 均衡产量依赖于博政弈论府完整第[浙江一大学阶]GAM段E_Ch所a 选择的关税).
博弈论(浙江大学,汪淼军)

( ) UI (σ ) = ∑σi (Ci ) ⋅Ui σ −i , [ci ]
——所有参与人所有偏离都是无利于图的
5
3.纳什定理 ——任何一个有博弈都存在至少一个纳什均衡纳什均衡 证明
——如果 S 是非空紧集凸集,F 是从 S 到 S 连续函数,则至少存在一个 X ,
8
a.一阶条件分析
qi ∈ arg max qi ×[a − c − qi − q j ] 一阶条件为:
a − c − 2qi − q j = 0
所以纳什均衡为: qi = q j = (a − c) / 3
b.剔除严格劣战略
qi
≤
a
− 2
c
⇒
qj
>
a−c 4
依次反复可得:
qi
=
qj
=
a
−c 3
(讨论)
x
A
y
B
x
A
x → y,
y A B
A
x'→ y'
17
3.相互转换 ..性别战
(足,足) (足,芭) (芭,足) (芭,芭)
性别战
足球 1,3 1,3 0,0 0,0
C2 芭蕾 0,0 3,1 0,0 3,1
..赌博博弈
C2
C1
M
P
Rr
0,0
1,-1
Rf
0.5,-0.5
0,0
Fr
-0.5,0.5
1,-1
a. c1 > c2
b. qi = a − pi + bi p j c.生产能力 K 受限, K < a / 2
博弈论全套课件

三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论,流传最广的是一个叫做“囚 徒 困 境 ” 的 故 事 。 这 个 博 弈 是 1950 年 图 克 (Tucker)提出的,这个博弈模型提出后曾引 发了大量的相关研究,也有许多关于“囚徒困 境”的版本。“囚徒困境”对博弈论的发展起 到了巨大的推动作用。可以说凡是讲博弈论, 都会说到这个经典的博弈模型。
在过去二三十年中,博弈论已成为社会科 学研究的一个重要方法。有人说,如果未来社 会科学还有纯理论的话,那就是博弈论。无论 是合作博弈还是非合作博弈都给我们提供了一 种系统的分析方法,使人们在其命运取决于他 人的行为时制定出相应的战略。特别是当许多 相互依赖的因素共存,没有任何决策能独立于 其它许多决策之外时,博弈论更是价值巨大。
最近十几年来,博弈论在经济学尤其是微 观经济学中得到了广泛的运用, 博弈论在许多 方面改写了微观经济学的基础,经济学家们已经 把研究策略相互作用的博弈论当作最合适的分 析工具来分析各类经济问题,诸如公共经济、 国际贸易、自然资源、企业管理等。在现代经 济学里,博弈论已经成为十分标准的分析工具。 除经济学以外, 博弈论目前在生物学、管理学 、国际关系、计算机科学、政治学、军事战略 和其他很多学科都有广泛的应用。现在已经有 愈来愈多的人开始关注、了解并学习博弈理论 。
博弈论(Game Theory)是一种关于游戏的 理论, 又叫做对策论, 是一门以数学为基础的、 研究对抗冲突中最优解问题的学科。事实上, 博弈论也正是衍生于古老的游戏,如象棋、围 棋、扑克等。
博弈论作为一门学科,是在20世纪50~60 年代发展起来的,当非零和博弈理论、特别是 不完全信息博弈理论获得充分发展时,才成为 现实。到20世纪70年代,博弈论正式成为主流 经济学研究的主要方法之一。1994年诺贝尔经 济学奖同时授予了纳什、泽尔腾、海萨尼三位 博弈论专家。2005年诺贝尔经济学奖又授予了 美国经济学家托马斯.谢林(Thomas Schelling)和以色列经济学家罗伯特.奥曼 (Robert Aumann),以表彰他们在合作博弈 方面的巨大贡献。
《博弈论入门》课件

博弈论的研究方法与工具
了解博弈论的研究方法和工具对于深入理解和应用博弈论至关重要。
博弈论中的常见概念与术语
学习博弈论需要了解一些常见的概念和术语,例如博弈矩阵、纳什均衡、最 优策略等。
博弈论的经典案例分析
通过分析博弈论的经典案例,我们可以更好地理解和应用博弈论的原理。
博弈论在实际决策中的应用
实际决策中经常涉及到多个参与者的利益博弈,博弈论可以帮助我们找到最优决策策略。
总结与展望
通用于实 际生活和决策中。
《博弈论入门》PPT课件
博弈论是一门研究决策和策略的学科,适用于各种领域,从经济学到政治学, 从生物学到计算机科学。
博弈论基础知识介绍
在这一部分中,我们将探讨博弈论的基本概念和原理,包括博弈模型、策略 和解的概念。
博弈论的应用领域
博弈论在现实生活中有许多应用,包括经济学、政治学、社会学、生物学、 医学等领域。
博弈论 PPT

1、古诺(Cournot)模型
• 两个寡头企业,分别称为企业1和企业2,每个 企业的策略是选择产量;效用是利润,利润是
企业产量的函数。
企业选择自己的最优产量时,对另一个企业具
有外部负效应。
2、豪泰林(Hotelling)价格竞争模型
• “伯川德悖论”:如果企业之间的竞争是价格而不是产 量,可以得到即使在只有两个企业的情况下,纳什均衡 的价格为边际成本,企业的利润为0。 • 产品之间的差异性:当消费者对产品有不同偏好的时候, 价格不是消费者感兴趣的唯一变量。
• 问:下列战略式表述中的均衡结果?
乙 M 1,2 0,1
甲
U D
L 1,0 0,3
R 0,1 2,0
• (1)R严格劣于M;
• (2)U严格优于D;
• (3)M严格优于L。 最后得到(U,M)是重复剔除的占优策略。
• 再来看下面(G1)这个博弈的均衡结果:
R S T L 2,12 0,12 0,12 乙 M 1,10 0,10 0,10 N 1,12 0,11 0,13
在位者 进入者 进入 不进入 默许 40,50 0,300 斗争 -10,0 0,300
例如市场进入阻挠博弈中,按照重复剔除严格劣策略的方法得到均 衡结果(即IDSE)为(进入,默许);而纳什均衡为(进入,默 许)和(不进入,斗争)。
二、纳什均衡应用举例 (板书)
1、古诺(Cournot)模型 2、豪泰林(Hotelling)价格竞争模型 3、公共地的悲剧 4、公共物品的私人自愿供给
* si* 是他的占优策略,则策略组合 s* (s1* ,si* ,, sn ) i,
称为占优策略均衡(也可简称占优均衡)。 • 占优策略均衡只要求每个参与人是理性的,并不要求每
杭电博弈论复习市公开课一等奖省赛课微课金奖PPT课件

例13
在两人分1万元讨价还价问题中,假设博弈方1风险中性,博弈方2 是风险躲避(u2=s2b,b=0.8),假设不论谈判是否成功,这1万 元中2千元必须留给博弈方2,要求这个两人讨价还价问题纳什解。
第14页
例14
在破产博弈中,债权人1有债权100万元,债权人2有债权500万元。 若两人都是风险中性,分别求可清偿资产为100万、300万和500万 情况下纳什讨价还价解和K-S讨价还价解。
第10页
例10
求出以下扩展型博弈完美贝叶斯均衡(写出求解过程)
R
1
L(p)
M(1-p) (1,3)
2
U
DU
D
(0,1) (0,2,) (0,0) (2,1)
第11页
例11
假设参加人小张和小王分配10元钱。他们同意最多用3天时间协商 分配问题。第1天,小张给出一个报价;第2天,小王能够接收也 能够拒绝这个报价,假如他拒绝,他要提出一个新报价;第3天, 小张提出最终报价。假如他们不能在3天之内达成协议,那么,双 方都将一无所获。假定小张和小王贴现因子分别为α和β,求子博 弈完美纳什均衡。
答:第一天,小张方案是自己得S1,小王得10-S1。小王接收或不接收,接收则小张和小王得益分别为S1和10-S1,不接收则进入下一回合。 第二天,小王方案是小张得S2,自己得10-S2。小张接收或不接收,接收则小张和小王得益分别为β ( 10-S2 )和α S2。不接收则进入下一回合。 第三天,小张方案是自己得S,小王得10-S。此时小王必须接收,小张和小王得益分别为α ^2S 和β ^2( 10-S)。 第二回合,小张得益α S2= α ^2S 即S2= α S。小王得益为 β ( 10- α S )=10 β- α β S。。。。。。不会了
博弈论-蒋文华-浙江大学

博弈论-蒋⽂华-浙江⼤学第⼀讲、博弈论概述献给诸位知⼈者智,⾃知者明;胜⼈者⼒,⾃胜者强;⼩胜者术,⼤胜者德。
第⼀章何为“博弈”博:博览全局弈:对弈棋局→谋定⽽动是指在⼀定的游戏规则约束下,基于直接相互作⽤的环境条件,各参与⼈依据所掌握的信息,选择各⾃的策略(⾏动),以实现利益最⼤化的过程。
第⼀节从⼀个简单的故事说起博弈时要搞清楚对⼿是谁!博弈时要搞清楚和别⼈⽐什么!⾏为选择既跟对⼿的情况有关,⼜跟所遇到的外部环境的变化有关。
特别提⽰:博弈既可以是竞争,也可以是合作!特别提⽰:博弈,必须学会换位思考!特别提⽰:博弈,只需领先⼀步,⾼⼈⼀筹!博弈就是你中有我,我中有你。
由于直接相互作⽤(互动),每个博弈参与者的得益不仅取决于⾃⼰的策略(⾏动),还取决于其他参与者的策略(⾏动)。
博弈的核⼼在于整体思维基础上的理性换位思考,⽤他⼈的得益去推测他⼈的策略(⾏动),从⽽选择最有利于⾃⼰的策略(⾏动)。
特别提⽰:站在别⼈的⽴场上想⼀想,就是为⾃⼰未来的遭遇着想。
——⽶兰·昆德拉特别提⽰:如果因为对⽅眼中的你的傻,⽽让对⽅更愿意和你合作,何乐⽽不为呢?(⼤智若愚)特别提⽰:请不要在⼀个充分竞争的市场去追求成功!特别提⽰:选对市场(对⼿)⽐选对策略更重要!特别提⽰:在博弈之前,博弈就已经开始了!第⼆节博弈的渊源⼀、中国的理解博+弈=下围棋略观围棋,法于⽤兵,怯者⽆功,贪者先亡。
----汉代刘向,《围棋赋》⼆、西⽅的理解game(规则)费厄泼赖(fair play)第三节学习博弈论的收益⼀、当局者清更有利的选择更快速的反应⼆、旁观者更清理解历史与现实预测未来的发展三、提出完善游戏规则(制度)的建议第⼆章发展简史第⼀节最初的探索和应⽤⼀、古诺模型参加博弈的双⽅以各⾃在同⼀时间内相互独⽴的产量作为决策的变量,是⼀个产量竞争模型。
⼆、伯川德模型该模型与古诺模型的不同之处在于,企业把其产品的价格⽽不是产量作为竞争⼿段和决策变量,通过制定⼀个最优的销售价格来实现利润最⼤化。
博弈论完整课件[浙江大学]Game_Cha
![博弈论完整课件[浙江大学]Game_Cha](https://img.taocdn.com/s3/m/999bf7d3a216147916112862.png)
结为此类博弈。
信息的不完全和不对称往往对拥有信息的
一方和缺乏信息的一方都会产生不利的影
响。拥有私人信息的一方许多时候保守秘
密对自己有利,但也存在希望将私人信息
传递给他人的的情可况编辑。ppt
24
在拥有信息和缺乏信息的双方之间的偏好和 利益完全一致的情况下,即使没有任何代价的空 口声明也能有效地传递信息。但如果双方的偏好 和利益不一致,那么拥有信息的一方就有欺骗对 方的动机,从而会破坏信息传递的机制。因此在 双方利益不一致的情况下,能有效传递信息的行 为必须满足一定的性质和条件。
“萨摩亚岛居民以文身的好差作为挑选武士 的标准”
在波纳佩岛上,谁能种出特别大的山药,谁
的社会地位就高,谁就能赢得人们的尊敬并可
担任公共职务。
可编辑ppt
25
Signals:经济或其他活动中具有信息传递作用 的行为。
Signaling Mechanism:通过信号传递信息的过程。
可编辑ppt
26
Pooling-strategy separating-strategy Hybrid-strategy
其次,如果可能的话,运用贝叶斯公式(结合
参与人1的策略)计算q;否则就任意确
定q.
第三,给定q,计算确定参与人2的最优行为;
最后,检验参与人1的策略是否确实是针对参
与人2的策略的最优反应。If so,you have
found a PBE.
可编辑ppt
14
例子:二手车交易模型(谢识予.图6.1-6.2-6.3) ☺P(g) 和P(b):
17
(四)PBE的类型 P277
1.市场类型
市场完全失败:卖方“好”商品也不卖 市场完全成功:“好”商品卖,“差”商品不卖 市场部分成功:“好”、“差”都卖,买方都买 市场接近失败:“好”商品卖,“差”商品部分
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的完美贝叶斯均衡(PBE)。Gibbons
可编辑ppt
9
PBE:Consider a strategy profile for the players, As well as beliefs over the nodes at all informa -tion sets.These are called a perfect Bayesian equilibrium(PBE) if:(1)each player’s strategy specifies optimal actions, given his beliefs and the strategies of the other players and (2)the beliefs are consistent with Bayes’ rule wherever possible.
A.因为原博弈本身不会成为原博弈的后续阶段 ,因此子博弈不能从原博弈的第一个节点开 始,即原博弈不是自己的一个子博弈;
可编辑ppt
3
B.包含所有在初始节点之后的选择节点和终 点,但不包含不跟在此初始节点之后的节点;
C.不分割任何的信息集。即如果一选择节点 包含在一个子博弈中,则包含该节点的信息集 中的所有节点都必须包含在该子博弈中。
可编辑ppt
7
要求3:在处于均衡路径之上的信息集中,推 断由Bayes’ rule 及参与者的均衡策略给出.
推断被提高到和策略同等重要的地位。即: 一个均衡不再只是由每个参与者的一个策略 所构成,还包括了所有参与者在该他行动的 每一个信息集中的一个推断.
克雷普斯Kreps和威尔逊Wilson 1982
其次,如果可能的话,运用贝叶斯公式(结合
参与人1的策略)计算q;否则就任意确
定q.
第三,给定q,计算确定参与人2的最优行为;
最后,检验参与人1的策略是否确实是针对参
与人2的策略的最优反应。If so,you have
可编辑ppt
10
理解PBE要注意以下两点:
在NE中,每一个参与人的策略必须是其他参 与人策略的一个最优反应,于是没有参与人会 选择严格劣策略。在PBE中,要求1和要求2事 实上就是要保证没有参与人的策略是始于任何 一个信息集的劣策略。
PBE使得参与人的推断明确化了。但这种 均衡往往不能像求解SNE那样沿博弈树通过逆 向推导而构建出来。求解步骤:P277
要求2:给定参与者的推断,参与者的策略必须
满足序贯理性(sequential rational)的要求。即
在每一信息集中应该行动的参与者(以及参与
者随后的策略),对于给定的该参与者在此信
可编辑ppt
5
息集中的推断,以及其他参与者随后的策略 必须是最优反应。(“随后策略”是在达到给 定的信息集之后,包括了其后可能发生的每 一种情况的完全的行动计划)
如果一个博弈没有子博弈,则子博弈精炼 的要求(参与人的策略在每一个子博弈中 君构成NE的要求)自然就得到满足,从 而在任何没有子博弈的博弈中,SNE=NE。
例子Gibbons P139可编辑ppt
2
(一)不完美信息动态博弈的子博弈
前文中—“由一个动态博弈第一阶段以外的某 阶段开始的后续博弈阶段构成的,有初始信息 集和进行博弈所需要的全部信息,能够自成一 个博弈的原博弈的一个部分”。这个定义实际上 隐含了三个方面的含义:
对于前例,要求1和要求2的满足足以使我们 排除不合理的均衡(R,R’)。
要求1和要求2只保证了参与人持有推断,并 对给定的推断选择最优行动,但并没有明 确这些推断是否是理性的。为进一步约束 参与人的推断,需要区分处于均衡路径上
可编辑ppt
6
的信息集和不处于均衡路径上的信息集
定义(Definition):对于一个给定的扩展式博弈中 给定的均衡,如果博弈根据均衡策略进行时将 以正的概率达到某信息集,称此信息集处于均 衡路径之上(on the equilibrium path)。反之, 如果博弈根据均衡策略进行时,肯定不会达到 某信息集,则称之为处于均衡路径之外的信息 集(off the equilibrium path).(其中均衡可以 是NE 、SNE、BNE、PBE )
Game Theory(5)
Dynamic Games of Incomplete Information
PERFECT
BAYESIAN EQUILIBRIUM
可编辑ppt
1
PBE<BNE <SNE<NE
在完全信息静态博弈中,有 PBE=BNE=SNE=NE 一、Introduction to PBE
可编辑ppt
8
要求1-3不仅包括了PBE的主要思想,而且 还构成了它的定义。不过,在更为复杂的 博弈中,为剔除不合理的均衡,还要引入 进一步的要求。
要求4 对处于均衡路径之外的信息集,推断 由Bayes’ rule 以及可能情况下的参与者的均 衡策略决定。
Definition 满足要求1-4的策略和推断构成博弈
可编辑ppt
11
(三)关于判断形成的进一步解释
先验概率 Initial belief Bayes’Rule
后验概率 Updated belief
贝叶斯公式(conditional belief):
P(A | Bi) P(Bi) P(Bi|A)= 1
Σ
j=1
P(A | Bj) P(Bj)可编辑pptA和B两点针对所有类型的动态博弈,而C 是专门针对不完美信息动态博弈的。
可编辑ppt
4
(二)PBE的要求(Requirement)
要求1:在每一个信息集中,应该行动的参与者 必须对博弈进行到该信息集中的每一个节点有 一个推断(belief)。对于非单节信息集,推断 是在信息集中不同节点的一个概率分布;对于 单节点 的信息集,参与者的推断就是到达此单 一节点的概率为1。
12
☺拥有私人信息的参与人的纯策略类型:
Separating strategy:不同类型行为不同 NFGE 或 GFNE
Pooling strategy:不同类型行为相同 NFNE 或 GFGE
可编辑ppt
13
PBE的求解步骤:
首先,考虑参与人1(拥有私人信息一方)的
策略(pooling or separating);