博弈论的基本表达方式
博弈论知识简要
寻找混合策略纳什均衡的思路
• 令各博弈方随机选择纯策略的概率分布,满足使其 他博弈方采用不同策略的期望得益相同,从而计算 出各个博弈方随机选择各纯策略的概率。
• 在猜硬币博弈中,设盖硬币方出正面的概率为p, 出反面的概率为1-p。则猜硬币方猜正面的期望得 益为p·1+(1-p)·(-1)=2p-1,猜反面的期望得益 是p·(-1)+(1-p) ·1=1-2p,令二者相等,得p=1/2。 盖硬币方的混合策略是以(1/2,1/2)的概率随机 选择正面和反面。类似的,可以计算出猜硬币方的 混合策略。
S
i
1,2,...
表示 Si 中的某个特定策略。在静态博弈中,Si 中包含
的所有
S
i
就是第
i 个参与人的所有可选择的行动;ui
是第 i 个参与人的得益函数,它是所有参与人选择的
某个特定策略组合的函数,即
ui
ui
S1
,...,
S
i
,...,
S
n
。
•例 两寡头的产量博弈中,参与人就分别是编号为1和2的两个 企业;其各自的策略选择就是选择各自的产量;其各自的 策略空间就是其各自所能够生产的各种产量的集合。如果 假设两个企业,都能够生产大于0的任何数量的产量,那
下选择什么行动的预先安排; • 行动:参与人在博弈过程中轮到自己选择时所作的某个具体决策; • 得益:参与人从博弈中获得的效用,一般是所有参与人的策略
或行动的函数,这是每个参与人最关心的东西;
• 信息:参与人在博弈中所知道的关于自己以及其他参与人的行 动、策略及其得益函数等知识;
• 均衡:所有参与人的最优策略或行动的组合;
精炼贝叶斯均衡 泽尔腾等
博弈论概述
一般地,称 si*为局中人i的(严格)占优策略, 若对应所有的
si , s i*是i的严格最优策略 , 即:
ui (si*, si ) ui (si' , si ) si , si' si*
对应地,所有的 si' si* 被称为“劣策略”。注意:这
甲的策略
1
2
3
乙的策略
1
7
8
9
2
6
2
3
3
5
4
0
1.乙先行动。若乙选1,则甲选3;乙选2,则甲选1;乙选3, 则甲选1。乙在行动时会估计到甲的行动,它估计三种选择 中的最高代价为策略1(损失900万),其次为策略2(损失 600万),最低为策略3(损失为500万)。因此,乙必选代 价最低的策略3。——最大最小原理。结论:乙选择3,甲选 1作为回应,乙损失500万,甲获益500万。
在博弈论里,一个博弈可以有两种表述方式:一种是策 略式(strategic form representation)表述,另一种是 扩展式( extensive form representation )表述。前者 适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式 表述中,所有参与人同时选择各自的策略,所有参与人选择 的策略一起决定每个参与人的支付。
2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E.
高级微观经济学 第八章 博弈论
第八章 博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互影响的问题。
本章讨论这个问题,建立复杂环境下的决策理论。
开展这种研究的的理论叫做博弈论,也称为对策论(Game Theory)。
最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。
大部分经济行为都可视作博弈的特殊情况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。
博弈论的思想精髓与方法,已成为经济分析基础的必要组成部分。
第一节 博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双方的目的都是要战胜对方,互不相容,互相影响,互相制约。
一般来讲,博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。
当所有当事人都拿定主意作出决策时,博弈的局势就暂时确定下来。
博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。
博弈论推广了标准的一人决策理论。
在每个局中人的收益都依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。
下面来举例说明。
例1.便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否正面朝上。
局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。
对于这个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。
当甲和乙都作出选择时,博弈的局势就确定了。
显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。
博弈论教程
-5,-5
-10,0
0,-10
-1,-1
2.1.2 严格下策反复消去法(逐步剔除严格劣战略) 例
L M R
U M 8,3 2,1 5,1 8,4 6,2 3,6
D
3,0
9,6
2,8
可以预测该博弈的合理结局为(U,L),即参与人A
选择策略U,而参与人B选择策略L。
2.2 Nash 均 衡 2.2.1 Nash 均 衡 的 定 义 Nash 均衡是指这样的策略组合(或剖面): 为 了 极大化自己的收益(或效用), 每一个参与 人所 采取的策略一定应该是关于其他参与人 所采 取的策略的最佳反应. 因此没有一个参 与人会 轻率地偏离这个策略组合而使自己蒙 受损失。
博
弈
论
第一章 导论
1.1什么是博弈论(Game Theory) 1.1.1 从游戏到博弈
游戏都有一些共同的特点:
1.都具有一定的规则; 2.都有一个结果; 3.策略至关重要; 4.策略和利益有相互依存性
一、博弈论概述
1.1.1 博弈论的定义
博弈论研究的是人与人之间利益相互制约下策略选择时的 理性行为及相应结局。 豪尔绍尼(John C.Harsanyi)1994年诺贝尔经济学奖获 奖致词:博弈论是关于策略相互作用的理论。 博弈论研究人与人之间“斗智”的形式和后果,当人 们利益存在冲突时,每个人所获得的利益不仅取决于自己 所获取的行动,还依赖于其他人采取的行动,每个人都需 要针对对方的行为选择作出对自己最有利的反应。
定 义 在有n个参与人的博弈 G={S1,S2…Sn;u1,u2,…un)中,策略组合 s*=(s1 *,s2 *,…sn *)是一个Nash均衡,如果对于每一 个i, si*是给定其他参与人的选择: S-i*=(s1*,…si-1*,si+1*,…sn*)的情况下,第i个人的最 优策略,即 ui(si*,s-i*)≥ui(si,s-i*) ,对所有的i∈Γ 或者用另一种表示方式,si*是下述最大化问题的 解: si*∈arg ui(s1*,…si-1*,si,si+1*,…sn*),i=1,2,…n S *∈Si 因此,当且仅当没有一个参与人能从单方面背离 某个策略组合的预见中增加自己的得益时,这 个策略组合就是Nash均衡。
博弈论算法讲义
博弈论算法一、博弈的战略式表述及纳什均衡的定义在博弈论里,一个博弈可以用两种不同的方式来表述:一种是战略式表述(strategic form representation ),另一种是扩展式表述(或译为“展开式表述”)(extensive form representation )。
从分析的角度看,战略式表述更适合于静态博弈,而扩展式表述更适合于讨论动态博弈。
1.1博弈的战略式表述战略式表述又称为标准式表述(normal form representation )。
在这种表述中,所参与人同时选择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。
战略式表述给出:1.博弈的参与人集合:(),1,2,,i n ∈ΓΓ=。
2.每个参与人的战略空间:,1,2,,i S i n =。
3.每个参与人的支付函数:12(,,,),1,2,,i n u s s s i n =。
我们用()11,,;,,n n G S S u u =代表战略式表述博弈。
例如在两个寡头产量博弈里,企业是参与人,产量是战略空间,利润是支付;战略式表述博弈为:{}121122120, 0; (,), (,)G q q q q q q ππ=≥≥ (1.1)这里i q 、i π别表示第i 个企业的产量和利润。
1.2纳什均衡的定义有n 个参与人的战略式表述博弈()11,,;,,n n G S S u u =,战略组合{}1,,,,i n s s s s ****=是一个纳什均衡。
如果对于每一个i 、i s *是给定其他参与人选择{}111,,,,,i i i n s s s s s *****--+=的情况下第个参与人的最优战略,即(,)(,),,i i i i i i i i u s s u s s s S i***--≥∀∈∀ (1.2)或者用另一种表述方式,i s *是下述最大化问题的解:111argmax (,...,,,,...,),1,2,..., ;i i i i i n i i s u s s s s s i n s S *****-+∈=∈(1.3)我们用这个定义来检查一个特定的战略组合是否是一个纳什均衡。
博弈论初步
• 一、博弈理论(Game theory)的起源极其发展 • 代表人物:1、冯•诺依曼(Von Neumann);摩根斯(Morgenstern) 1944年《博弈论与经济行为》提出了预期效用理论 • 2、塔克(Tucker) “囚犯难题“ • 3、纳什(Nash) 1950《N个人对策的均衡点》和《讨 价还价问题》 • 两人奠定了非合作博弈理论的基础 • 4、泽尔腾(Selten) 1965 《需求减少条件下寡头垄断模 型的对策论描述》 • 5、海萨尼(Harsanyi) 1967 《由贝叶斯局中人参加的 不完全信息博弈》 • 6、克瑞普斯(Kreps)及威尔逊(W ilson),提出更高级的 序列均衡问题
完全信息的动态博弈
• • • • • • 博弈的扩展式表达 扩展式表达包括5个要素: 1、参与人集合, 2、参与人行动顺序, 3、每个参与人在每次行动时的行动集合, 4、每个参与人在每次行动时有关对手过去行动 选择 的信息(信息集), • 5、支付 • 6、外生事件的概率分布
房地产开发案例
• 假定行动顺序如下:1、开发商A首先行动,选择开发与否2、 A决策后自然选择市场需求的大小,3、B开发商在在观察到B开 发商决策和市场需求后作决策 • • • • • • B 大 N
博弈的表达方式
• • • • • • • • • • 1、战略式表达;标准式表达,2、扩展式表达 战略式表达给出: 1、参与人集合:i∈Γ 2、每个参与人的战略空间:si 3、每个参与人的支付函数: Ui(s1 s2… si… . sn) G={s1 s2… si… . sn, u1 u2… ui… . un;} 两寡头产量博弈: G={q1 >0 ,q2>0, , π1 (q1, q2), , π2 (q1, q2) ;} 有限博弈:参与人有限,策略有限,两个参与 人博弈可用矩阵表示
《产业经济学》第五章--(博弈1)讲解
在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。
博弈论公式大全
博弈论公式大全
博弈论中的公式和定理有很多,以下是一些常见和重要的博弈论公式:
1. 纳什均衡公式:对于任意的策略组合s1,s2,如果对于所有的i,pi(s1, s2) >= pi(si(1), s2) 和 pi(s1, s2) >= pi(s1, si(2))都成立,则称(s1, s2)为纳什均衡。
2. 零和博弈公式:在零和博弈中,一方的收益等于另一方的损失,即总和为零。
常见的零和博弈有剪刀石头布游戏、赌博等。
3. 优势策略均衡公式:如果对于任意的对手策略s2,玩家i的策略s1都是最优的,则称(s1, s2)为优势策略均衡。
4. 纯策略与混合策略公式:在博弈论中,玩家的策略可以分为纯策略和混合策略。
纯策略是指玩家在每个信息集上选择固定的行动,而混合策略则允许玩家以一定的概率在多个行动中进行选择。
5. 贝叶斯均衡公式:在非完全信息博弈中,如果每个玩家都采用贝叶斯纳什均衡策略,那么这个策略组合就是贝叶斯均衡。
6. 最大最小值定理:对于完全二叉树博弈,如果每个节点都有正的权重,那么最大最小值就是所有叶子节点的权重的最大最小值。
7. 尼姆定理:在非零和博弈中,如果每个玩家都追求自己的最大收益,则至少有一个玩家会获得零收益。
8. 约翰逊定理:在完全信息博弈中,如果存在一个玩家有严格优势策略,那么这个玩家将获得所有收益。
9. 拉姆齐定理:在非完全信息博弈中,如果每个玩家都采用最优混合策略,那么这个策略组合就是拉姆齐最优。
以上是一些常见的博弈论公式,它们在博弈论的研究和应用中发挥着重要的作用。
stackelberg博弈的数学表达式
stackelberg博弈的数学表达式Stackelberg博弈是博弈论中的一种重要形式,它是由德国经济学家海因茨·斯塔克尔贝格(Heinrich von Stackelberg)于1934年提出的,用于描述具有领导者和追随者的博弈情形。
在Stackelberg博弈中,领导者会先行选择策略,而追随者在知晓领导者选择的策略后再作出自己的决策。
这种不对称信息的情形使得领导者在选择策略时能够考虑到追随者的反应,从而获得更优的收益。
在实际生活中,Stackelberg博弈经常被用来分析企业之间的竞争策略、政府对市场的监管策略等方面。
在Stackelberg博弈中,参与者通常会通过数学模型来描述其决策过程。
对于一个简单的Stackelberg博弈,可以用以下的数学表达式来表示:1.定义参与者:在一个Stackelberg博弈中,通常会有两个参与者,分别是领导者和追随者。
2.定义策略集合:领导者和追随者分别有自己的策略集合,可以用S1和S2来表示。
其中,S1为领导者的策略集合,S2为追随者的策略集合。
3.定义效用函数:每个参与者在选择完策略后都会获得一个效用值,表示其收益情况。
通常会用u1和u2来表示领导者和追随者的效用函数。
4.定义约束条件:在实际情况下,参与者的选择可能会受到一些限制条件的约束。
这些约束条件通常会用c1和c2来表示。
通过上述的数学表达式,可以清晰地描述Stackelberg博弈中的参与者、策略、效用函数和约束条件,从而帮助分析者更好地理解其博弈模型。
接下来,我们将通过一个实例来说明Stackelberg博弈的具体应用。
假设有两家电信运营商A和B在同一个市场上竞争,A是市场领导者,B是追随者。
A可以选择提供高速网络服务或提供低价格服务两种策略之一,而B在A做出选择后可以选择跟随A提供相同的服务或采取不同的策略。
现在我们用数学模型来描述这个问题。
1.参与者:A是领导者,B是追随者。
9博弈论方法及其模型
江西财经大学 信息学院 2007-2008
3
经济数学模型与计算机仿真
囚徒的困境(Prisoners’ Dilemma) 博弈论中最著名的模型,1950年图克(Tuker)提出 囚徒A的战略: 坦白或抵赖 囚徒B的战略: 坦白或抵赖
囚徒B 坦白 囚徒A 坦白 抵赖
(8,8) (10,0)
(0,10) (1,1)
江西财经大学 信息学院 2007-2008
6
经济数学模型与计算机仿真
完美信息动态博弈和不完美信息动态博弈 “完全信息”指的是每一个参与人都对其他所有参与人 的特征、战略空间及支付组合(主要是支付组合)有准 确的知识;否则,称为“不完全信息”. “完美信息”指动态博弈中轮到行动的参与人对之前的 博弈进程完全了解的知识.
画线法:针对对手的每一
战略,找到自己的最优战略, 并在其支付值下面画线,最 后,双方同时画线的战略组 合就是纳什均衡
U 参与人A C D
L
参与人B M
R
(2,12)
(0,12) (0,12)
(1,10)
(0,10) (0,10)
(1,12)
(0,11) (0,13)
江西财经大学 信息学院 2007-2008小猪源自稳定的结果: 大猪按,小猪不按
大猪 按 不按
按
不按
(5,1) (9,1)
(4,4) (0,0)
江西财经大学 信息学院 2007-2008
5
经济数学模型与计算机仿真
静态博弈、动态博弈和重复博弈 博弈的次序也是博弈很重要的因素,有些博弈中的所有参 与人是同时选择战略的,但更多博弈中的参与人是先后选择战 略的,也有的博弈是反复或重复进行的. 静态博弈是指在博弈中所有的参与人同时选择战略,或者 虽然不是同时选择战略,但是后选择的参与人不知道先选择的 参与人的战略的博弈. 动态博弈是指在博弈中各参与人是按某种规则分先后行 动,并且后行动者知道先行动者的战略的博弈.
4博弈分析
假设投票成本为0,自己喜欢的候选人获胜收 益为 v>0,自己不喜欢的候选人获胜收益为0。 则博弈可表达为:
G={N,S,U}
– 参与者集合N={1,2,···,k},k=2n+1,n为自然数;
– 行动集合Si={A,B},i∈N; – 收欢益的函人数获:胜自,己Ui=喜0欢。的人获胜,Ui=v>0;自己不喜
收益:(参与者A,参与者B)
左
中
右
上 (1 ,0) (1,2) (0,1)
下 (0,3) (0,1) (2,0)
箭头法
箭头法是以博弈各参与者在追求个人收益最大化过程中不断调整 行动、最终达到一个相对稳定状态的过程为基础提出的求解博弈 均衡的方法。
选取博弈中的任一个策略组合、任一参与者作为始点进行分析, 考察在该策略组合处参与者能否通过单独改变自己的策略而增加 收益。如能,则从所分析的策略组合对应的收益组合引一箭头到 改变策略后策略组合对应的得益组合;在此收益组合下,分析其 他参与者能否通过改变策略增加收益,如能,则以箭头导向新的 组合,···,直至各个参与者不能通过单方改变策略获得更多收益 为止。此时,只有指向的箭头而没有指离的箭头的收益组合对应 的策略组合即为博弈的均衡解。
试分析:
参与者2
左
中
右
上 参与者1
下
1,0
1,2
0,1
0,3
0,1
2,0
收益:(参与者1,参与者2)
上 参与者1
下
上 参与者1
下
参与者1上
参与者2
左
中
右
1,0 1,2 0,1
0,3 0,1 2,0
参与者2
左
中
1,0 1,2
2.2博弈的策略式表述方法
博弈论之
博弈的策略式表述方法
博弈的策略式表述
三个要素:
1.博弈参与人(Players) N—参与人的集合
i—参与人i N
博弈的策略式表述
三个要素:
2.博弈参与人的策略集(Strategy sets)
S i—参与人的策略集
s i—参与人i策略集S i中的一个元素
所有参与人的策略放在一起,称之为博弈的策略
, s2, … s n)
组合,表示为s = (s
1
博弈的策略式表述
三个要素:
3.博弈参与人的支付函数
u i —参与人i 的支付函数i N
i (s 1, s 2, s 3,..., s ,..., s n )
u i
博弈的策略式表述
例:一家生产商和一家营销企业正在就某种商业合作进行谈判。
他们估计合作的总利润是100万美元。
如果企业的CEO自己谈判,则会同意平分合作利润,即每家得50万美元。
但现在,一家CEO雇佣了一位律师来帮助谈判,这会使该企业多获得利润10万美元,而对方会减少10万美元。
雇佣律师的成本是5万美元。
如果两家企业都雇佣律师,合作利润仍然平均分配。
博弈的策略式表述例:45,4555,4040,5550,50
生产企业
CEO 自己谈判自己谈判雇佣律师
雇佣律师营销企业CEO 参与人
参与人策略支付
= (s 1, s 2, s 3,...,s i-1,s i+1,..., s n )S -i 所有参与人的策略集组合为:S =(S i ,S -i )
博弈的策略式表述
三个要素:
1.博弈参与人
2.博弈参与人的策略集
3.博弈参与人的支付函数。
博弈论的基本表达方式
第七章
博弈论基础
博弈论的基本概念? 典型的博弈问题? 博弈论的基本表达方式? 非合作博弈的基本类型?
信息经济学( INFOR博弈论概述
2、几个典型的博弈问题
(1)猜硬币游戏:博弈论中最简单的例子
乙
正面
正面
反面
-1,1 1,-1
1,-1 -1,1
甲
反面
信息经济学( INFORMATION ECONOMIC)
西南科技大学
7.1 博弈论概述
(2)囚徒的困境:博弈论中最经典的例子,其本身部分的奠 定了非合作博弈论的理论基础
信息经济学( INFORMATION ECONOMIC) 西南科技大学
7.2博弈的表达方式
1 两种表达方式:
在博弈论里,一般可以用两种不同的表达 方式来表达一个博弈:一种是标准式表达,一 种是扩展式表述,从理论上讲,两种表达方式 是等价的,任何博弈都既可以用标准式表示, 又可以用扩展式表示。但相对而言,标准式表 达更适合于静态博弈,扩展式表述更适合于动 态博弈
囚徒2 坦白
不坦白
-6,-6
坦白
0,-10 -1,-1
囚徒1
不坦白
-10,0
信息经济学( INFORMATION ECONOMIC)
西南科技大学
7.1 博弈论概述
3 博弈论的基本概念
博弈论的基本概念包括参与者、行动、信 息、策略、收益、均衡和结果等。 要描述一个具体的博弈,参与者、策略和 收益是最基本的要素,这些基本要素通过行动 和信息构建成一个博弈过程。参与者、行动和 结果被称为博弈规则,博弈分析的目的就是在 给定条下,运用博弈规则预测均衡。 根据策略的数量可以将博弈分为有限策略 博弈和无限策略博弈
博弈论
博弈类型及其表述形式1 博弈的分类博弈模型一般分为合作博弈(cooperative game )和非合作博弈(non- cooperative game ),如图1.1。
合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素(Martin J.Osborne and Ariel Rubinstein ,2000,P2),也就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关系,并因为这种关系影响到博弈的结局。
合作博弈强调的是团体理性(collective rationality )、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是低效率或无效率的(张维迎,1996,P5)。
20世纪50年代,合作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐步转向在非合作博弈领域。
有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认为两者不相上下(Martin J.Osborne and Ariel Rubinstein ,2000,P2)。
合作博弈,有时也叫做联盟博弈(coalitional game ),一般根据有无转移支付而分为两类:可转移支付联盟博弈(coalitional game with transferable payoff )和不可转移支付联盟博弈(coalitional game with non-transferable payoff )。
可转移支付也叫有旁支付(side payment ),可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得,且各联盟的赢得可以按任意方式在联盟成员中分摊;否则,就是不可转移支付联盟博弈。
图1.1 博弈的分类非合作博弈的分类主要从两个角度进行划分。
博弈的标准式表述
博弈的标准式表述博弈论是一门研究人类行为决策和策略选择及其结果的学科。
它试图理解不同决策者之间的互动,并对他们的行为进行建模和分析。
博弈论的标准式表述是其中一种常用的方法。
本文将对博弈的标准式表述进行介绍和探讨。
一、博弈的基本概念博弈可以简单地定义为一种互动的决策过程,在这个过程中,决策者根据不同的策略选择来获得最大的利益。
博弈的基本概念主要包括以下几个要素:参与者、策略、支付和信息。
1. 参与者:博弈中的参与者通常被称为玩家。
每个玩家都有自己的决策能力和利益追求,他们通过选择不同的策略来达到自己的目标。
2. 策略:策略是玩家在博弈中所采取的行动方式。
每个玩家可以根据自己的判断和利益选择不同的策略。
策略可以是纯粹的,也可以是混合的。
3. 支付:支付是博弈过程中对玩家行为结果的评估。
通常用支付矩阵或效用函数来表示玩家的支付。
支付可以是正数、负数或零,表示对玩家来说是利益、损失还是中立的结果。
4. 信息:信息在博弈中起着重要的作用。
完全信息博弈指玩家对其他玩家的策略和支付有完全的了解。
而不完全信息博弈则指玩家对其他玩家的策略和支付了解不完全或部分了解。
二、博弈的标准式表述博弈的标准式表述是一种用矩阵来表示博弈的方法。
它将玩家的所有策略和相应的支付归结到一个矩阵中,以便于分析和计算。
标准式博弈主要包括博弈矩阵和纳什均衡两个重要概念。
1. 博弈矩阵:博弈矩阵是用来描述博弈的一种形式。
它的形式通常为二维矩阵,其中行表示玩家A的策略,列表示玩家B的策略,矩阵中的每个元素表示对应策略组合下的支付。
每个玩家根据自己的支付矩阵来选择最优的策略。
以下是一个简单的标准式博弈矩阵示例:玩家B策略1 策略2玩家A策略1 2 1策略2 3 4在这个矩阵中,玩家A有两个策略,玩家B也有两个策略。
矩阵中的每个元素表示对应策略组合下的支付。
2. 纳什均衡:纳什均衡是博弈论中的一个重要概念,指的是在博弈中,每个玩家根据其他玩家的策略来选择自己的策略时,达到一种稳定状态。
GAME THEORY
1.2.2 重复剔除的占优均衡
Definition:In a normal-form game, if for each player i , si" is i‟s dominant strategy, than we call the strategies profile (s1″, …, sn" ) the „dominantstrategy equilibrium‟.
1.2.1占优战略均衡
定义2:一个博弈G,若对博弈方i及所用s-i都有 ui (si*,s-i) > ui (si ‟,s-i),则称si*是si ‟的严格上 策, si ‟是si*的严格下策。 定义3:若在博弈G中对每个博弈方i都存在策 略si*是其它所有策略的严格上策,则称策略组 合s*=(s1*,s2*, … ,sn*)是G的上策均衡。
In the normal-form representation of a game ,each
player simultaneously chooses a strategy, and the combination of strategies chosen by the players determines a payoff for each player. Definition: The normal-form representation of an-n-player game specifies the players‟ strategy spaces S1 , … , Sn and their payoff functions u1 ,…, un. We denote this game
博弈论公式大全
博弈论公式大全全文共四篇示例,供读者参考第一篇示例:博弈论是一门研究各种博弈策略与结果的学科,它是数学、经济学和博弈理论的交叉学科。
在博弈论中,有一些常见的公式和概念,对于理解博弈过程和制定博弈策略十分重要。
本文将介绍一些常见的博弈论公式,帮助读者更深入地了解博弈论。
1. 最大最小定理最大最小定理是博弈论中最基础的定理之一,它表明在一个零和博弈中,每个博弈者都希望最大限度地提高自己的得分,同时也要对手的得分降到最低。
根据最大最小定理,博弈的解是博弈者选择的一个策略组合,使得每个博弈者都采取最佳策略,且不能通过改变自己的策略来改善自己的结果。
2. 纳什均衡纳什均衡是美国数学家约翰·纳什提出的一个概念,指的是博弈中每个参与者都已知对手的策略,且每个参与者都非常清楚地知道自己的最佳策略。
在纳什均衡下,每个参与者都做出了最优的选择,没有人可以通过改变自己的策略来改善自己的得分。
3. 迭代删除劣势策略迭代删除劣势策略是一种通过迭代过程来删除劣势策略的方法。
在一个有限次重复的博弈中,通过反复删除每位博弈者的劣势策略,最终可以找到一个稳定的策略组合。
这种方法可以帮助博弈者消除策略中的一些不必要的选择,从而简化博弈的分析过程。
4. 马甘定理马甘定理是博弈论中一个非常有用的定理,它用来判断一个零和博弈的解是否达到最优值。
根据马甘定理,一个零和博弈的最优解是通过分析每个参与者可能的最优策略来确定的。
马甘定理可以帮助博弈者找到一个最佳的策略组合,从而实现自己的最大利益。
5. 概率博弈概率博弈是博弈论中的一种特殊类型,它涉及到瞬时决策和不确定性因素。
在概率博弈中,每位博弈者都可以对自己的策略进行概率分配,从而增加博弈的不确定性。
对于概率博弈来说,博弈者需要考虑概率分配对于结果的影响,以便制定最佳的策略。
6. 必胜策略在一些博弈中,存在着一种称为必胜策略的策略,它可以确保博弈者取得胜利。
通过分析博弈的规则和对手的可能策略,博弈者可以找到一种必胜策略,并从而确保自己在博弈中取得胜利。
博弈的描述
后,局中人 1 从 52 张纸牌中抽出一张牌,自己看完 牌的颜色后,决定是停牌( fold )还是加注 (raise) 。 若是停牌,需要将牌出示给 2 看,然后博弈结束。 此时,牌若是红色,局中人1赢,否则,则1输。若 是加注,局中人 1 需再拿出一元钱作为赌注,然后 局中人 2 决定是放弃( pass )还是追随 (meet) ,若 放弃,局中人1赢,博弈结束;若追随,则2需要也 拿出一元钱作为赌注,然后,1出示牌,若红色,1 赢,否则,1输。
Rf
Fr
Ff
(-2,2)
(1,-1)
(-1,1)
24
三、扩展式博弈的标准式表述
第一步:找出参与人的策略
参与人1的策略 S1={Rr,,Rf,Fr,Ff} 参与人2的策略 S2={M, P}
25
三、扩展式博弈的标准式表述
第二步:计算每一个策略组合下的报酬
策略组合(Rf, M)下参与人1和2的报酬
8
一、扩展式博弈(续5)
2、构成扩展式的要素
局中人集合
行动顺序
依赖行动的报酬 采取行动时掌握的信息 外生事件的概率分布
9
一、扩展式博弈(续)
3、扩展式的严格定义
节点:xm 枝: ( xm1 , xm ) 路径: {( x1 , x2 ), ( x2 , x3 ),, ( xm1 , xm )}
(2,-2)
(1,-1)
0
1
(1,-1)
(-2,2)
raise 2
(1,-1) (-1,1)
7
一、扩展式博弈(续4)
一个人不可能在他不知道有哪些选择的情 况下作出有意义的选择。 为了保证局中人在博弈的任何节点总是知 道他面临的选择,如果两个决策节属于同 一局中人的同一个信息集,那么他们的行 动分支就必须相同。
博弈论第二章——博弈规则
U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
《博弈论》课程课件
破釜沉舟这种策略实际上有很多的变种。
36
3、企业应该在什么时候诚实 这里我们考虑一个所谓的诚信企业的动态博 弈,
占便宜 到诚信公司 顾客 不到诚信公司 诚信公司赚1000元 顾客损失2000元
25
这个模型是这样的:
第一个模型 假设:地球是圆的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到远方驶来 船只的船桅,并逐渐看到船的下部(与现实 中观察到的事实相符)
26
第二个模型
假设:地球是平的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到的是整个 船身(与现实中观察到的事实相悖)
18
博弈论在研究的过程中有两个基本前提假设 一是,理性人假设。 二是,博弈结构对参与者是公共知识。特别
是,参与者满足完美回忆。
19
例6 旅行者困境 两个旅行者在旅游圣地买了两个花瓶,但在 回程途中被航空公司打碎。航空公司知道花 瓶大约值100元,但并不清楚花瓶的确切价 格。于是,航空公司要求两位旅客各自写下 花瓶的价格,并按照两个旅客中所写的最低 价格进行赔偿(航空公司认为写最低价格的 旅客讲的是真话),为了鼓励旅客讲真话, 规定对讲真话的旅客奖励2元,对讲假话的旅 客罚款2元。容易证明,在理性人的假设下, 这个游戏唯一的结果是两人都写0。
22
表 1 博弈的分类和均衡概念
完全信息 静态 非完全信息
完全信息静态博弈 非完全信息静态博弈 (纳什均衡) (贝叶斯均衡)
完全信息动态博弈 非完全信息动态博弈 动态 (子博弈精炼均衡) (序列均衡)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7.2博弈的表达方式
1 两种表达方式:
在博弈论里,一般可以用两种不同的表达 方式来表达一个博弈:一种是标准式表达,一 种是扩展式表述,从理论上讲,两种表达方式 是等价的,任何博弈都既可以用标准式表示, 又可以用扩展式表示。但相对而言,标准式表 达更适合于静态博弈,扩展式表述更适合于动 态博弈
西南科技大学
7.1 博弈论概述
3 博弈论的基本概念
博弈论的基本概念包括参与者、行动、信 息、策略、收益、均衡和结果等。 要描述一个具体的博弈,参与者、策略和 收益是最基本的要素,这些基本要素通过行动 和信息构建成一个博弈过程。参与者、行动和 结果被称为博弈规则,博弈分析的目的就是在 给定条下,运用博弈规则预测均衡。 根据策略的数量可以将博弈分为有限策略 博弈和无限策略博弈
信息经济学( INFORMATION ECONOMIC)
西南科技大学
7.2博弈的表达方式
2.标准式表述
囚徒2 坦白
不坦白
-6,-6
坦白
0,-10 -1,-1
囚徒1
不坦白
-10,0
信息经济学( INFORMATION ECONOMIC)
西南科技大学
7.2博弈的表达方式
3.扩展式表述 中国联通
进入
中国电信 默许
甲
反面
信息经济学( INFORMATION ECONOMIC)
西南科技大学
7.1 博弈论概述
(2)囚徒的困境:博弈论中最经典的例子,其本身部分的奠 定了非合作博弈论的理论基础
囚徒2 坦白
不坦白
-6,-6
坦白
0,-10 -1,-1
囚徒1
不坦白
-10,0
信息经济学( INFORMATION ECONOMIC)
研究决策主体发生直接作用时的决策(或行动)
以及这种决策(或行动)的均衡问题的。
博弈可以分为:合作博弈与非合作博弈
信息经济学( INFORMATION ECONOMIC)
西南科技大学
7.1 博弈论概述
2、几个典型的博弈问题
(1)猜硬币游戏:博弈论中最简单的例子
乙
正面
正面
反面
-1,1 1,-1
1,-1 -1,1
不进入
默许 (30.80)
阻挠
阻挠
(0.200)
西南科技大学
(-10.100) (0.200)
信息经济学( INFORMATION ECONOMIC)
7.3 非合作博弈的类型
四种不同类型的博弈:
行动顺序 静态 信息 完全信息静态 完全信息
动态
完全信息动态 博弈 博弈 纳什均衡 子博弈精炼纳 纳什(1950、 什均衡 1951) 塞尔腾(1965) 不完全信息静 态博弈 贝叶斯纳什均 衡豪尔绍尼)
第七章
博弈论基础
博弈论的基本概念? 典型的博弈问题? 博弈论的基本表达方式? 非合作博弈的基本类型?
7.1 博弈论概述
7.2 博弈的表达方式
7.3 非合作博弈的基本类型
信息经济学( INFORMATION ECONOMIC) 西南科技大学
7.1 博弈论概述
1.博弈论的概念博弈论源自博弈论也称为“对策论”, 是不完全信息
不完全信息 动态博弈
信息经济学( INFORMATION ECONOMIC)
西南科技大学