经济博弈论 第二章扩展式博弈
第二章 经济博弈论
* m ax (6 q1 − q1 q 2 − q12 ) q1 * 2 mqax (6 q代入, 6-q q-2q *=0 * 2 − q1 q 2 − * 2 ) 第一个对q1求导,并将q1 2 2 1
14
2011-12-21
经济博弈论讲义 张卫国 教授
2.3.2 反应函数
6
2011-12-21
经济博弈论讲义 张卫国 教授
2.2、纳什均衡
2、纳什均衡的定义: 对于博弈G={S1,…,Sn;u1,…,un},如果某个 策略组合(s1*,…,sn*)中任意博弈方i的策略si*都是对其他博弈方 策略组合(s1*,…,si-1*,si+1*,… sn*)的最佳策略,即 ui (s1*,…,si-1*,si*, si+1*,… sn*)≥ ui (s1*,…,si-1*,sij, si+1*,… sn*) 对于任意sij∈Si 都成立,则称(s1*,…,sn*)为G的一个纳什均衡。 3、纳什均衡的特征:在纳什均衡的策略组合中,各个博弈方都 不愿意单独改变策略,具有稳定性。纳什均衡具有一致预测 性和普遍存在性两个重要性质,体现了纳什均衡
* * ( s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去法一定不会将它
消去。
10
2011-12-21
经济博弈论讲义 张卫国 教授
–
纳什均衡点是一种局部均衡点,可以有很多个,也可以不 存在。 来源于策略组合的策略可能有n!个(离散),也可能无穷 多个(连续),那么求解将会十分烦琐。 得益 对于任一策略(s1,…,sn),其总得益为各博弈方得 ui ( s1 ,..., sn ) 益之和 u ( s1 ,..., sn ) = 那么对于具有多个纳什均衡点的博弈,则对应的应有最优 纳什均衡的概念,而对应于最优纳什均衡的点为全局最优 点。此处最优的含义为稳定性而不是得益之和最大。
博弈论第二章习题
问题1:博弈方2就如何分10000元钱进行讨价还价。
假设确定了以下原则:双方提出自己要求的数额1s 和2s ,10000021≤≤s s ,。
如果设博弈方1和,1000021≤+s s ,则两博弈方的要求都得到满足,即分得1s 和2s ;但如果1000021>+s s ,则该笔钱就被没收。
问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会选择什么数额,为什么?解:112111210000()010000s s s u s s s ≤-⎧=⎨>-⎩,那么,1210000s s =-221222110000()010000s ss u s s s ≤-⎧=⎨>-⎩那么,2110000s s =-它们是同一条直线,1210000s s +=上的任意点12(,)s s ,都是本博弈的纯策略的Nash 均衡。
假如我是其中一个博弈方,我将选择15000s =元,因为(5000,5000)是比较公平和容易接受的。
它又是一个聚点均衡。
问题2:设古诺模型中有n 家厂商。
i q 为厂商i 的产量,n q q q Q +++= 21为市场总产量。
P 为市场出清价格,且已知Q a Q P P -==)((当a Q <时,否则0=P )。
假设厂商i 生产产量i q 的总成本为ii i i cq q C C ==)(,也就是说没有固定成本且各厂的边际成本都相同,为常数)(a c c <。
假设各厂同时选择产量,该模型的纳什均衡是什么?当趋向于无穷大时博弈分析是否仍然有效?解:1()ni i i j i j pq cq a c q q π==-=--∑,1,2,,i n =令20ii j j ii a c q q q π≠∂=---=∂∑,1,2,,i n =解得:***121na c q q q n -====+,2***121na c n πππ-⎛⎫==== ⎪+⎝⎭当n 趋向于无穷大时,这是一个完全竞争市场,上述博弈分析方法其实已经失效。
博弈论原理模型与教程扩展式博弈
《博弈论:原理、模型与教程》第二部分完全信息动态博弈第6章扩展式博弈(已精细订正!)对博弈问题的规范性描述是科学、系统地分析博弈问题的基础。
前面介绍了一种常用的博弈问题描述方式—战略式博弈,虽然这种博弈模型结构简单,只要给出博弈问题的三个基本构成要素(即参与人、参与人的战略集及参与人的支付),就可完成对博弈问题的建模。
但是,由于战略式博弈假设每个参与人仅选择一次行动或行动计划(战略),并且参与人同时进行选择,因此从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
虽然战略式博弈也可以对动态博弈问题进行建模,但是从所得到的模型中只能看到博弈的结果,而无法直观地了解到博弈问题的动态特性。
本章将介绍一种新的博弈问题描述方式—扩展式博弈。
从扩展式博弈模型中,不仅可以看到博弈的结果,而且还能直观地看到博弈的进程。
在介绍扩展式博弈构成的基础上,还将对扩展式博弈的战略和解进行讨论。
6.1 扩展式博弈(文字描述、博弈树描述)所谓扩展式博弈(extensive form game),是博弈问题的一种规范性描述。
与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。
一般而言,要了解一个博弈问题的具体进程,就必须弄清楚以下两个问题:(1)每个参与人在什么时候行动(决策、选择);(2)每个参与人行动时,他所面临决策问题的结构,包括参与人行动时可供他选择的行动方案及所了解的信息(集)。
[注:行文中频繁出现的“行动”一词,有两义:其一,动词的“行动”,指选择、决策。
其二,名词的“行动”,指策略、战略、谋略、行动方案、方案。
]上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。
对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。
定义6 – 1 扩展式博弈包括以下要素: (1)参与人集合{1,2,...,}n Γ=;(2)参与人的行动顺序,即每个参与人在何时行动;(3)每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案及他所了解的信息(集); (4)参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。
博弈论策略的扩展式和战略式表述
博弈论策略的扩展式和战略式表述下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor.I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!博弈论策略的扩展式与战略式表述:深度解析博弈论,作为经济学、社会学、心理学等领域的核心理论工具,主要研究决策者在相互影响的环境下如何做出选择。
博弈论的extensive form
博弈论的extensive form博弈论是研究具有相互冲突和合作元素的情境下的决策制定的数学理论。
在博弈论中,一个游戏(博弈)可以被表示为扩展式(extensive form)或标准式(normal form)。
扩展式博弈也被称为树形结构,它详细地描述了游戏的所有可能的决策过程和时间顺序。
在扩展式博弈中,每个玩家根据游戏的历史(从根节点到当前决策点的路径)做出选择。
这种表示方法允许捕捉到玩家之间的行动顺序和信息传递,非常适合描述具有时间序列和信息不完全的动态决策过程。
扩展式博弈的主要组成部分包括:1. 历史(History):历史是一个有序集合,表示从博弈的开始到当前决策点所采取的行动序列。
在扩展式博弈的树形结构中,历史从根节点开始,每个节点代表一个决策点,节点之间的路径代表了行动的历史。
2. 玩家函数(Player Function):玩家函数P(h) 定义了在历史h 之后做出决策的玩家。
在扩展式博弈中,玩家函数确保了在每一个决策点,只有一个玩家负责做出选择。
3. 纯策略(Pure Strategy):纯策略是玩家在每个决策点上可能采取的行动集合。
一个玩家在扩展式博弈中的纯策略可以被表示为一个函数,该函数将历史映射到一个具体的选择上。
4. 博弈长度(Length of the Game):博弈长度l(G) 是指从根节点到叶节点的最长路径长度,它代表了博弈的持续时间。
扩展式博弈的优点在于它能够精确地描述玩家之间的决策顺序和信息结构,但它也有可能变得非常复杂,尤其是在参与者数量多或者决策序列长的情况下。
尽管如此,扩展式博弈是分析具有时序特征和信息不完全的决策问题的有力工具,特别是在经济学、政治学、心理学和人工智能等领域。
经济博弈论第二讲
▪ 请画出策略组合及得益矩阵,并分析博弈结果。
课后作业2(分析智猪博弈)
▪ 在博弈论经济学中,“智猪博弈”是一个著名例子 ▪ 假设猪圈里有一头大猪,一头小猪。猪圈的一头有猪
食槽,另一头安装着控制猪食供应的按钮,按一下按 钮会有10个单位的猪食进槽,但是谁按按钮就会首先 付出2个单位成本,若大猪先到槽边,大小猪吃到食 物的收益比是9:1;同时到槽边,收益比是7:3;小 猪先到槽边,收益比是6:4。 ▪ 在两头猪都有是有智慧的前提下,请分析猪的选择策 略。
▪ 上策均衡是反映了所有博弈方的绝对偏好,因此 非常稳定。根据上策均衡,就可以对博弈结果作 出最肯定的预测。
▪ 因此,进行博弈分析时,应首先判断各个博弈方是 否都有上策,博弈中是否存在上策均衡。
▪ 上策均衡分析采用的决策思路是一种选择法的思路, 是在所有可选择策略中选出最好的一种的思路。
▪ 因为博弈方的最优策略随其他博弈方的策略而变化 是博弈的根本特征,是博弈关系相互依存性的主要 表现形式,所以上策均衡不是普遍存在的。
1, 0 0, 4
1, 3 0, 2
囚
0, 1
徒
困
2, 0
境
-5, -5 -8, 0
0, -8 -1, -1
▪许多博弈不存在确定性的结果
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
夫 妻
2, 1
之
0, 0
争
0, 0 1, 3
2.1.4 箭头法
▪ 对博弈中每个策略组合进行分析,考察每个策略组合处各个博弈方 能否通过单独改变自己的策略而增加得益。
经济博弈论第2章(23) ppt课件
4 1
如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
uG 1, 4 1 uG 0,
0.2
PPT课件
18
• 解二: 支付等值法
如果一个混合策略是政府的最优选择,那一定意
味着流浪汉在寻找工作与游闲之间是无差异的,
即:
流浪汉
找工作
游荡
政府 救济 不救济
3,2 -1 , 1
-1 , 3 0,0
uL 1, 1 3 uL 0,
0.5
PPT课件
19
五、混合战略纳什均衡
• 对 * 0.2 的解释: • 如果流浪汉找工作的概率小于0.2, 则政府选择不
救济,如果大于0.2,政府选择救济 ,只有当概率等 于0.2时,政府才会选择混合战略或任何纯战略. • 对 * 0.5 的解释 • 如果政府救济的概率大于0.5,流浪汉的最优选择 是流浪,如果政府救济的概率小于0.5,流浪汉的最 优选择是寻找工作.
1 , -1 -1 , 1
假设A出红牌的概率为 p;B出红牌的概率为 q ;则
U A( p, q) 2 p(1 2q) (2q 1)
因此A的最佳反应函数为
p 1
0, 当q 1/ 2
p [0,1],当q 1/ 2
1, 当q 1/ 2
PPT课件
0
1/2
1 q 27
第二章 完全信息静态信息博弈-纳什均衡
一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡 五 混合战略纳什均衡 六 纳什均衡存在性及相关讨论
PPT课件
博弈模型扩展式 -回复
博弈模型扩展式-回复什么是博弈模型扩展式?博弈模型扩展式是指在传统的博弈模型基础上,通过增加相关规则、参与者或策略等因素,对博弈模型进行扩展和延伸的一种理论框架。
扩展式的博弈模型可以更好地描述现实世界中的复杂决策场景,使得博弈论在经济学、管理学、政治学等领域的应用更为广泛。
一、基础的博弈模型在介绍博弈模型扩展式之前,我们先简要回顾一下基础的博弈模型。
基础的博弈模型主要由参与者、策略和收益函数构成。
参与者根据收益函数和其他参与者的策略来选择自己的策略,并且最终根据收益函数来分配收益。
传统的博弈模型包括纳什均衡、博弈矩阵和博弈树等。
但是这些模型在描述现实中一些复杂情况时存在局限性。
二、增加的参与者在博弈模型中,我们可以通过增加参与者的数量来扩展博弈模型。
通常,博弈模型中的参与者被视为独立决策实体,他们根据自己的利益来选择策略。
然而,在现实生活中,存在许多博弈模型中没有考虑到的共同利益或合作关系。
因此,将更多的参与者纳入博弈模型可以更好地反映出现实情况中的决策情景。
例如,在环境保护领域的博弈中,传统模型只考虑了公司在追求利润最大化的同时对环境的影响。
然而,在现实中,政府和非政府组织等参与者对环境保护同样关注。
因此,我们可以通过增加政府和非政府组织等参与者,构建一个多参与者博弈模型,以更好地分析环境保护政策的制定和实施。
三、引入动态策略除了增加参与者,我们还可以通过引入动态策略来扩展博弈模型。
在传统的博弈模型中,参与者只能在某个时刻选择自己的策略,并且这个选择是一次性的,不可更改的。
然而,在现实生活中,很多决策是连续的,参与者可以根据其他参与者的策略变化来调整自己的策略。
例如,在股市投资中,投资者的决策往往是连续的,他们会根据市场走势和其他投资者的行为来调整自己的投资策略。
因此,我们可以通过引入动态策略,构建一个连续时间博弈模型,以更好地分析股市中的投资决策。
四、考虑不完全信息博弈模型扩展式还可以考虑参与者之间的信息不对称问题。
扩展式博弈优质内容
1.战略式博弈从本质上来讲是一种静态模型
• 战略式博弈从本质上来讲是一种静态模型, 它假设所有的参与人同时选择战略并实现 博弈在各种情形下的结果,至于博弈中参 与人何时行动,战略式博弈并不考虑。
• 虽然战略式博弈也可用来对动态博弈进行 建模,但从所得到的模型中,我们无法直 观地观察到动态博弈所具有的动态特性。
• 此时,可以采用博弈树对一个扩展式博弈 进行描述;
• 博弈树:就是由结和有向枝构成的“有向 树”。
企有最业“上1开端的发的选”一择和个点(用空心圆 “表不示开),发表”示,博弈的开始 。 分表别示用博标弈有达到 “该开点发时”企和业的 “所不得开,发其”中的, 有支向付枝向表量示中。的 第一个数字表 示企业1的所得, 第二个数字表 示企业2的所 得。
(4) 给出了博弈中各企业的支付。
• 除了“企业2行动时是否观测到企业1的选 择”这一点暂时无法从上图中知道以外, 完全信息动态的“新产品开发博弈” 扩 展式描述所需要的信息,都可以从上图中 得到。
• 问题:如何在博弈树中,将“企业2行动 时是否观测到企业1的选择”这一信息表 示出来?
• 在完全信息动态的“新产品开发博弈” 中,企业2决策时,企业1已经做出选 择。此时,企业2面临的决策情形就 有以下两种:
(1) 企业2知道企业1的选择;
(2) 企业2不知道企业1的选择。
• 对于第一种情形,企业2知道企业1的选择, 即知道企业1选择了“开发”还是“不开 发”,因此,企业2知道博弈是从x1到了x2 还是从x1到了x3。
• 对于第二种情形,企业2不知道企业1的选 择,即不知道博弈是从x1到了x2还是从x1到 了x3。
其中,对
si : Hi Ai (Hi )
第二章扩展式博弈
扩展式博弈
本章的主要内容
博弈论的启示 实际模型与虚拟模型 扩展式博弈:完美信息 扩展式博弈:不完美信息 策略是什么
第一节
博弈论的启示
博弈论主要在两个方面给我们帮助: 1、模型 它提供了一个研究复杂社会现象的框架, 可将其简化为可供分析的模型 2、方法 它提供了从这些与人们如何采取行动及人 们该如何采取行动相关的模型中,总结命 题的方法。
博弈论提供了对于人们行为背后逻辑的洞察, 还处于发展中。
第二节 实际模型与虚拟模型
实际模型 实际模型旨在呈现真实世界,是对真实世界的准确描 述,实际模型可能很复杂。 虚拟模型 虚拟模型是对真实模型的简化,并不一定是对真实模 型的准确描述。我们使用虚拟模型尽可能从本质上模 仿真实世界,并非复制真实世界。 构建虚拟模型 决定将哪些因素加入到虚拟模型中,就如同打包行李 去大学,你没有办法把所有需要的东西都塞进行李箱。 从本质上模仿,就是把最关键的因素加入模型,忽略 次要因素。有些时候,忽略次要因素更有助于研究关 键因素之间的关系。
扩展式博弈:不完美信息——信息集
在左图中,盖伊在决定杀死还是释放奥兰多之前,知道薇薇卡 是否交纳了赎金。信息集都是单节点,是一个完美信息博弈 (左图) 如果盖伊在决定杀死还是释放奥兰多之前,不知道薇薇卡是否 交纳了赎金。节点3和4共同构成一个信息集,这个信息集中包 含了两个节点,是一个不完美信息博弈(右图)
特征1:每一个节点都是初始节点 的后续节点,同时,初始节点是 唯一具有这一特征的节点。 特征2:除初始节点之外的任何一 个节点都只有一个直接前臵节点。 初始节点没有前臵节点。 特征3:从一个节点引出的不同分 枝具有不同的行动标签。 特征4:每一个信息集只包含一个 参与人的节点。 特征5:每个信息集中所有节点必 须具有相同数量的直接后继节点, 而且其中的所有节点是通过具有 相同集合行动标签的分枝而到达 这些后继节点的。
博弈论第二章——博弈规则
U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
博弈论第二章 (1)
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3
3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略
二、重复剔除严格劣战略
(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5
博弈模型扩展式
博弈模型扩展式博弈论是研究决策者在竞争、合作或冲突情境下的决策和行为的数学模型。
博弈模型的应用广泛,涉及经济学、政治学、生态学、社会学等多个领域。
在博弈论中,研究者通过建立数学模型来描述不同参与者之间的策略选择和行为结果,以揭示他们之间的互动和决策规律。
在此基础上,博弈模型的扩展式不仅包括了传统的零和博弈、非合作博弈等模型,还融入了更多实际情境下的因素和特征,使得博弈模型更加贴近实际、具有更强的预测和分析能力。
本文将对博弈模型扩展式进行探讨,旨在深入了解博弈论在不同领域的应用以及未来的发展方向。
一、博弈模型扩展式的基本原理博弈模型扩展式基于博弈论的基本原理,强调了在模型建立过程中,需要考虑更多的实际情境和因素,使得模型更加贴合实际场景。
传统的博弈模型通常建立在完全信息和理性参与者的假设基础上,但在实际情况中,参与者可能存在信息不对称、有限理性等情况,因此博弈模型扩展式需要考虑这些因素对决策和结果的影响。
博弈模型扩展式还需要考虑时间因素、空间因素、不确定性、复杂性等实际情境中常见的特征,从而使模型更加全面和有效。
二、博弈模型扩展式的应用领域1. 经济学领域博弈模型在经济学领域的应用非常广泛,涉及到市场竞争、定价策略、合作博弈等多个方面。
博弈模型扩展式将传统的利润最大化或效用最大化的假设融合了更多的实际市场情境因素,如不完全信息、交易成本、市场结构等,使得模型更贴合实际市场竞争情景,对企业和政府的决策提供了更准确的指导。
2. 政治学领域在政治学领域,博弈模型扩展式被广泛应用于描述国际关系、政治决策、游说活动等方面。
通过考虑领导人的政策选择、外交策略、冲突协调等情形,博弈模型扩展式为研究者提供了更多的分析工具,帮助理解国际政治事件及国际关系的发展。
3. 生态学领域生态学领域的研究者也开始利用博弈模型扩展式来研究物种协作、资源分配、环境保护等问题。
考虑到自然环境的复杂性和不确定性,博弈模型扩展式可以更好地描述物种之间的相互作用、资源竞争的演化规律,对生态系统的保护和管理具有重要的指导意义。
经济博弈论2
q1 = R1 ( q 2 , q 3 ) = 48 −
q 2 = R 2 ( q 1 , q 3 ) = 48 −
1 1 q 2 − q3 2 2
u = Q (100 − Q ) − 4Q = 96 − Q
1 1 q1 − q 3 2 2 1 1 q 3 = R 3 ( q 1 , q 2 ) = 48 − q 1 − q 2 2 2
0, -8 -1, -1 1, -1 -1, 1
2, 1 0, 1 纳什均衡的定义
策略空间: S1 ,⋯ S n si j ∈ S j 博弈方 i 的第 j 个策略: ui i 博弈方i 的得益: 博弈: G = {S1 ,⋯Sn ; u1 ,⋯un }
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
得益矩阵
小偷和守卫的博弈
守卫 睡 小 偷 偷 不偷 V,-D 0,S 不睡 -P,0 0,0
守卫 得益((睡)
S
0
1 -D - D’
Pt 小偷 偷的概率
加重对首位的处罚:短期中的效果是使守卫真正尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概略
P1 * = P 2* = 1 ( a 1 + b 1 c 1 + d 1 P 2* ) 2 b1 1 ( a 2 + b 2 c 2 + d 2 P1 * ) 2b2
2.3.4 公共资源问题
Q = q1 + ⋯ + q n , V = V ( Q ), u i = q iV ( Q ) − q i c
2.6 纳什均衡的选择和分析方法扩展
2.6.1 多重纳什均衡博弈的分析
博弈的扩展式表述_博弈论与信息经济学--PBL教程_[共5页]
59第3章 完全信息动态博弈 出怎样的分配方案才能够既不使自己被扔到大海里喂鲨鱼,又能使自己得到最多的金币?动态博弈由于添加了时间因素,因而更加贴近现实。
根据参与人是否相互了解收益情况,可分为“完全信息动态博弈”和“不完全信息动态博弈”,根据所有参与人是否都对自己选择前的博弈过程完全了解,可分为“完美信息动态博弈”和“不完美信息动态博弈”。
在本章中,我们首先对博弈的扩展式表达给出完整的定义,为动态博弈的分析奠定基础;其次,我们从扩展式表述博弈的纳什均衡分析逐步深入子博弈精炼纳什均衡,为动态博弈的分析提供可行的方法;接下来介绍完全信息动态博弈经典模型;最后,讨论重复博弈及无名氏定理。
3.1 博弈的扩展式表述在静态博弈中,所有参与人同时行动(或行动虽有先后,但没有人在自己行动之前观测到别人的行动);在动态博弈中,参与人的行动有先后顺序,且后行动者在自己行动之前能观测到先行动者的行动。
正如博弈论专家习惯于用战略式表述描述和分析静态博弈一样,他们也习惯于用扩展式表述(extensive form representation )来描述和分析动态博弈。
回顾一下,博弈的战略式表述包括3个要素:(1)参与人集合;(2)每个参与人的战略集合;(3)由战略组合决定的每个参与人的支付。
博弈的扩展式表述所“扩展”的主要是参与人的战略空间。
战略式表述简单地给出参与人有些什么战略可以选择,而扩展式表述要给出每个战略的动态描述:谁在什么时候行动,每次行动时有些什么具体行动可供选择,以及知道些什么。
简单地说,在扩展式表述中,战略对应于参与人的相机行动规则(contingent action plan ),即什么情况下选择什么行动,而不是简单的、与环境无关的行动选择。
具体来讲,博弈的扩展式表述包括以下要素。
(1)参与人集合:i =l, …, n ,此外,我们将用N 代表虚拟参与人“自然”;(2)参与人的行动顺序(the order of moves ):谁在什么时候行动;(3)参与人的行动空间(action set ):在每次行动时,参与人有些什么选择;(4)参与人的信息集(information set ):每次行动时,参与人知道些什么;(5)参与人的支付函数(payoff ):在行动结束之后,每个参与人得到些什么(支付是所有行动的函数);(6)外生事件(即自然的选择)的概率分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ⅰ Ⅱ
绑架 薇薇卡
不支付赎金 盖伊
Ⅲ
杀害 释放
Ⅳ
释放
杀害
释放 4 1
杀害
4 1
5 3
2 2
1 4
5 3
2 2
1 4
扩展式博弈:不完美信息——信息集
在节点3和节点4,盖伊需要作出如何对待奥兰多的决策, 但他并不知道薇薇卡是否交纳了赎金,换言之,盖伊并不 清楚自己处于节点3还是处于节点4。 参与人不能区分的所有节点组成的集合,称为信息集。 每个节点属于且只属于一个信息集。一个信息集至少包括 一个节点。 在任意一个扩展式博弈中,采取行动的参与者总是拥有一 个信息集,这个信息集表示参与者所知道的博弈状态。 所有的信息集只有一个节点的博弈,称为完美信息博弈。 至少有一个信息集包含多个节点的博弈,称为不完美信息 博弈。
2 1
不绑架 绑架, 支付赎金, 奥兰多被杀
绑架,支付赎金, 奥兰多被释放
绑架,不支付赎金, 奥兰多被杀 绑架,不支付赎金,奥兰多被释放
暴力盖伊 薇薇卡 3 5 5 1 4 3
2 1 2 4
扩展式博弈:完美信息——绑架案
假设盖伊仅仅只是想要得到一笔钱,如果拿不到赎金,出 于报复,他会杀害奥兰多。分析盖伊的处境。 假设盖伊认为如果奥兰多被杀死,他被逮捕的机会很小, 所以倾向于杀掉奥兰多。分析盖伊的处境。 假设薇薇卡关心丈夫胜过关心金钱。分析她的处境。 结果 盖伊 3 4 5 2 1 暴力盖伊 薇薇卡 3 5 4 2 1 5 1 3 2 4
特征1:每一个节点都是初始节点 的后续节点,同时,初始节点是 唯一具有这一特征的节点。 特征2:除初始节点之外的任何一 个节点都只有一个直接前臵节点。 初始节点没有前臵节点。 特征3:从一个节点引出的不同分 枝具有不同的行动标签。 特征4:每一个信息集只包含一个 参与人的节点。 特征5:每个信息集中所有节点必 须具有相同数量的直接后继节点, 而且其中的所有节点是通过具有 相同集合行动标签的分枝而到达 这些后继节点的。
第三节
扩展式博弈:完美信息
盖伊
因为博弈论的目的在于推 导人们行为的后果,所以 一个模型就应该重点关注 能够做出决策的个体。 在一个关于绑架的例子中, 我们重点关注绑架者盖伊 和被绑架者奥兰多的妻子 薇薇卡, 薇薇卡被通知交 付赎金。 思考问题:① 盖伊与薇薇 卡什么时候采取行动?② 当他们行动时有哪些可供 选择的行动方案?③当他 们采取行动时知道的信息 是什么?
盖伊 不绑架 盖伊 3 薇薇卡 5 支付赎金 盖伊 杀害 释放 绑架 薇薇卡 不支付赎金 盖伊 不绑架 盖伊
Ⅰ
绑架 薇薇卡
Ⅱ 盖伊 3 薇薇卡 5 支付赎金
Ⅲ
杀害 盖伊 释放
不支付赎金
Ⅳ
释放
杀害
杀害
释放 4 1 5 3 2 2
4 1
5 3
2 2
1 4
1 4
扩展式博弈:不完美信息——信息集
由于盖伊与薇薇卡同时决策,以下两种形式的扩 展式博弈是等价的。 本质相同:同一个博弈,有两个阶段,第一阶段 盖伊决策,第二阶段盖伊与薇薇卡同时决策。
扩展式博弈:完美信息——买车还价
上述扩展式博弈等同于以下所示的扩展式博弈
马库斯
马库斯
扩展式博弈:完美信息——小练习
思考一个包含两个参与者的博弈。在博弈中,父 亲可以选择是、否与可能;女儿随后做出选择, 她的选择方案有:待在家里和去超市。他们各自 的收益如下表所示。以扩展式写出这个博弈。
outcome
击球手
投手
击中的平均 概率
右 右
左 左
右 左
右 左
0.255 0.274
0.291 0.266
O队
JG JL
Y队
RJ
1 3
MR
3 1
2 O队 2 Y队
扩展式博弈:完美信息—审讯伽利略
天主教主乌尔 班八世决定是 否把伽利略带 到宗教法庭进 行审问,如果 决定要审问伽 利略,那么伽 利略决定是否 承认,而审讯 者需要决定采 取什么行动。
乌尔班八世
不提交法庭 提交给法庭
伽利略 乌尔班八世 3 伽利略 5 审讯者 3
认罪 5 不认罪 审讯者 用刑 不用刑 2
3 4
认罪
伽利略
不认罪 1
4 2
4
1 5
2 1
扩展式博弈:完美信息——买车还价
Macrus为售 车老板, Donna为顾客。 且PH>PM>PL 如果交易失 败,双方收 益均为0. 如果以价格P 成交,Donna 的收益为PMP,Macrus的 收益为2(P-PL)
盖伊 3 薇薇卡 5
支付赎金 盖伊 杀害
杀害
4 1 盖伊 不绑架
5 3
2 2
1 4
Ⅰ
绑架 薇薇卡 不支付赎金
Ⅱ 盖伊 3 薇薇卡 5 支付赎金 Ⅲ
杀害 盖伊 释放 5 3
Ⅳ
杀害 释放 1 4
4 1
2 2
扩展式博弈:错误的信息集举例
扩展式博弈:无限行动的情形
公司1首先决定在广告上投入多少费用,公司2在 观察到公司1的行动后,决定退出还是留在这个市 场。
第二章
扩展式博弈
本章的主要内容
博弈论的启示 实际模型与虚拟模型 扩展式博弈:完美信息 扩展式博弈:不完美信息 策略是什么
第一节
博弈论的启示
博弈论主要在两个方面给我们帮助: 1、模型 它提供了一个研究复杂社会现象的框架, 可将其简化为可供分析的模型 2、方法 它提供了从这些与人们如何采取行动及人 们该如何采取行动相关的模型中,总结命 题的方法。
策略是什么——例子1
一个策略规定了每种情形下参 与者选择的行动方案。 博弈中,盖伊面临三种情形: ①是否实施绑架;②实施绑架 且拿到赎金后,决定释放还是 杀害奥兰多;③实施绑架且没 有拿到赎金后,决定释放还是 杀害奥兰多。 他各有两种选择,所以他共有 8种策略:(绑架,释放,杀害); (绑架,释放,释放);(绑架,杀害, 释放);(绑架,杀害,杀害); (不 绑架,释放,杀害);(不绑架,释放, 释放);(不绑架,杀害,释放); (不绑架,杀害,杀害)
不绑架 盖伊 3
绑架
薇薇卡 不支付赎金 盖伊
薇薇卡 5 支付赎金 盖伊
杀害
释放
杀害 释放
4
1
5
2
1
3
2
4
绑架案
扩展式博弈:完美信息——绑架案
这个博弈有五种结果:每种结果对应博弈树的一个路径, 或者说一系列行动方案。如果盖伊没实施绑架,产生一个 结果;如果盖伊实施绑架,产生四种结果。这四种结果分 别取决于薇薇卡是否交付赎金与盖伊撕票还是释放。 五种结果中盖伊和薇薇卡的偏好不同:表 结果 盖伊 3 4 5
博弈论提供了对于人们行为背后逻辑的洞察, 还处于发展中。
第二节 实际模型与虚拟模型
实际模型 实际模型旨在呈现真实世界,是对真实世界的准确描 述,实际模型可能很复杂。 虚拟模型 虚拟模型是对真实模型的简化,并不一定是对真实模 型的准确描述。我们使用虚拟模型尽可能从本质上模 仿真实世界,并非复制真实世界。 构建虚拟模型 决定将哪些因素加入到虚拟模型中,就如同打包行李 去大学,你没有办法把所有需要的东西都塞进行李箱。 从本质上模仿,就是把最关键的因素加入模型,忽略 次要因素。有些时候,忽略次要因素更有助于研究关 键因素之间的关系。
虚拟模型的优势——举例
a有空气管,b牛顿管(真空) 现实中五米高扔铁球和纸片,落地时间不一样。 忽略空气阻力,才找到速度和重力之间的关系。 忽略空气阻力帮助我们揭示出本质。
神九与天宫一号进行交会对接:研究 设计的轨道时要考虑长度、宽度 (否),要研究卡口就不能不考虑。 根据研究问题决定选择哪些因素, 好的模型根据研究的问题选择一些因 素加入模型中 问题不同,选择的因素也不同。 博弈分析中都是虚拟模型,不是真实 模型
扩展式博弈:不完美信息——信息集
在左图中,盖伊在决定杀死还是释放奥兰多之前,知道薇薇卡 是否交纳了赎金。信息集都是单节点,是一个完美信息博弈 (左图) 如果盖伊在决定杀死还是释放奥兰多之前,不知道薇薇卡是否 交纳了赎金。节点3和4共同构成一个信息集,这个信息集中包 含了两个节点,是一个不完美信息博弈(右图)
在左图中,盖伊在决定杀死还是释放奥兰多之前,知 道薇薇卡是否交纳了赎金。(左图) 如果盖伊在决定杀死还是释放奥兰多之前,不知道薇 薇卡是否交纳了赎金。换言之,盖伊与薇薇卡同时决 策。(右图)
盖伊 不绑架 盖伊 3 薇薇卡 5 支付赎金 盖伊 杀害 释放 绑架 薇薇卡 不支付赎金 盖伊 不绑架 盖伊 3 薇薇卡 5 支付赎金 盖伊
若公司1与公司2同时决策采取行动呢?
扩展式博弈:不完美信息——小练习
返回到抢劫博弈中,假设劫匪不仅选择是否携 带和出示手枪,还选择是否给枪装上子弹。如 果西蒙看到劫匪持枪,但不知道枪里是否有子 弹。写下这个情境下的扩展式博弈(收益情况 可忽略)。
第五节
策略是什么
孙子:是故胜兵先胜而后求战,败兵先战而后求胜。 善用兵者,修道而保法,故能为胜败之政。强调策 略的重要性。 毛泽东:人不犯我,我不犯人;人若犯我,我必犯 人,这也是一种策略。 现实生活中,经常听到策略这个词,不同学科对策 略的概念有不同的定义,这里主要是从博弈论角度 谈策略的定义。 策略是参与者在博弈中完整详细的决策规则。策略 具有完备性。 策略考虑到任何一种可能性。不能只考虑部分可能 性。 策略不是一系列的行动集合,而是一系列的应变计 划。 一个参与人的策略描述的是,在它的每一个信息集 中,它所作出的决策。