第十章博弈论初步
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、最优纯策略
10.2 矩阵博弈的数学模型
矩阵博弈的解可以是不唯一的
α1 A = α2
α3 α4 max
β1 β2 β3 β4 6565 1 4 2 -1 8575 0262
8 5* 7 5*
min 5* -1 5* 0
于是 i* = 1,3; j* = 2,4
(α1,β2 )、(α1,β4 )、(α3,β2 )、(α3,β4 ) 四个局势都是博弈的解,且VG=5。
f(x,y*) ≤ f(x*,y*) ≤ f(x*,y)
则称(x*,y*)为函数f(x,y)的一个鞍点。 由定义2及定理1可知,矩阵博弈G在纯策略意义下有解 ,且VG = ai*j*的充要条件是:ai*j*是矩阵A的一个鞍点。 在博弈论中,矩阵A的一个鞍点也称为博弈的鞍点。
二、最优纯策略
10.2 矩阵博弈的数学模型
策体现。策略是参与人的行动规则,是一局博弈中,可供 参与人选择的一个实际可行的完整行动方案。它规定在什 么情况下选择什么行动。每一参与人i都有自己的策略集Si 。每一参与人的策略集中至少应包括两个策略。
行动和策略是相互联系又不相同的概念。策略是行动 的规则,如在“田忌赛马”博弈中,田忌在某一回合的行 动可以是{上、中、下};而田忌的策略则说明在什么情况 下选择什么行动,具体表达为:{若齐王出上等马,我出下 等马;若齐王出中等马,我出上等马;若齐王出下等马, 我出中等马}。
当局势出现后,博弈的结果也就确定了。也就是说,
对任一局势S,参与人i 可以得到一个赢得Hi(S)。显然, Hi(S)是局势S 的函数,称之为第i 个参与人的赢得函数 (或称支付函数)。
由于行动和策略的联系性,我们常将其视为一个因素 单元。当参与人、策略与行动、支付这三个基本因素确定
后,一个博弈模型也就给定了。
博弈论 博弈论是关于策略相互作用(Strategic interaction)和
理性行为的理论。 在策略依存性行为中,参与者具有各自不同的目标和
利益。为了达到各自的目标和利益,各方必须考虑对手的 各种可能的行动方案,并力图选取对自己最为有利或最为 合理的方案。博弈论就是研究博弈行为中竞争各方是否存 在着最合理的行动方案、以及如何找到这个合理的行动方 案的理论和方法。
(α*i ,β*j ) 使得对一切 i=1,2,…,m; j =1,2,…n, 均有
aij* ≤ ai*j* ≤ ai*j
二、最优纯策略
10.2 矩阵博弈的数学模型
二元函数鞍点的概念: 定义2 设f(x,y)为一个定义在 x∈A 及y∈B 上的实 值函数,如果存在x*∈A ,y*∈B,使得对一切x∈A 及 y∈B,有
矩阵博弈的值是唯一的。
二、最优纯策略
10.2 矩阵博弈的数学模型
例 某城市有A,B,C三个区,城市居民40%住在A区, 30%住在B区,30%住在C区,目前该城没有娱乐场。有两 个公司认为在该城修建娱乐场有利可图,甲公司要建两个 同样的娱乐场,乙公司原本也打算建两个与甲公司同样的 娱乐场与甲公司平分业务,但由于筹款不足,只能建一个。 由于每个娱乐场的规模档次差不多,故有如下情况:1)若 在某区建两个娱乐场,则该区业务将被平分;2)若在某区 只有一个娱乐场,则该区业务将被其独揽;3)若某区无娱 乐场,则该区业务将被其它区三个娱乐场所平分。问甲、 乙两公司应如何选择建设方案?
策略(如果最优纯策略存在)才是理智的行动。
二、最优纯策略
10.2 矩阵博弈的数学模型
例解
β1
β2
β3
Min aij
α1
6
α2
3
α3
9
α4
-3
Max aij
9
1
-5
-5
2
4
2*
-1
-10
-10
0
6
-3
2*
6
于是: max min aij = min max aij = a22 =2
ij
ji
由定义1, VG = 2, G的解为(α2 ,β2 ),α2 和β2分别是 参与人I 和II 的最优纯策略。
完全信息 动态博弈
不完全信息 动态博弈
一、矩阵博弈模型描述 10.2 矩阵博弈的数学模型
矩阵博弈: 二人有限零和博弈。 一般,用I、II分别表示两个参与人, 设参与人 I 有 m个纯策略 α1,α2 ,…,αm可供选择,
参与人II 有n 个纯策略 β1, β2, …, βn 可供选择, 则参与人I、II 的策略集分别为:
信息
Bayesian Nash Equilibrium Perfect Bayesian Nash Equilibrium
Harsanyi(67-68)
Selten(1975)
Kreps,Wilson(1982)
Fudenberg Tirole(1991)
三、博弈的分类
结盟博弈
静态博弈
联合博弈
合作博弈
二、最优纯策略
10.2 矩阵博弈的数学模型
可以看出,矩阵A的元素a22既是其所在行的最小元素, 又是其所在列的最大元素,即:
ai2 ≤ a22 ≤ a2j , i = 1,2,3,4; j =1,2,3
将这一事实推广到一般矩阵博弈,可得如下定理: 定理1 矩阵博弈G = {S1,S2;A}在纯策略意义下有解 的充要条件是:存在纯局势
1
1
α5(下,中,上)
1
1 -1 1 3 1
α6(下,上,中)
1
1
1 -1 1 3
二、最优纯策略
10.2 矩阵博弈的数学模型
1 最优纯策略的定义 矩阵博弈模型给定后,各参与人面临的问题便是:如 何选取对自己最为有利的纯策略以谋取最大的赢得(或最 少损失)。 例 设有一矩阵博弈 G = {S1、S2;A},
二、最优纯策略
10.2 矩阵博弈的数学模型
一般矩阵博弈的解可以是不唯一的。当解不唯一时,
解之间的关系具有下面两条性质:
性质1 无差别性:
若(αi1,βj1)和(αi2,βj2 )是博弈G的两个解,
则
ai1j1 = ai2j2
性质2 可交换性:
若(αi1,βj1)和(αi2,βj2 )是博弈G的两个解, 则 (αi1,βj2)和(αi2,βj1 ) 也是博弈G的解。
一、矩阵博弈模型描述 10.2 矩阵博弈的数学模型
田忌赛马(齐王的赢得表)
田忌的策略
β1
β2
β3
β4
β5
β6
齐王的策略
上中下 上下中 中上下 中下上 下中上 下上中
α1(上,中,下)
3
1
1
1 1 -1
α2(上,下,中)
1
3
1
1 -1 1
α3(中,上,下)
1
-1
3
1
1
1
α4(中,下,上) -1
1
1
3
S1 = {α1,α2 ,…,αm} S2 = {β1,β2,…,βn } 当参与人I选定纯策略αi和参与人II选定纯策略βj 后, 就形成了一个纯局势(αi,βj)。可见这样的纯局势共有 m×n 个。
一、矩阵博弈模型描述 10.2 矩阵博弈的数学模型
对任一纯局势(αi,βj),记参与人I的赢得值为aij, 并称
a11 a12 a1n
A
a
21
a22
a2n
am1
am2
amn
为参与人I的赢得矩阵(或为参与人II的支付矩阵),由
于假定博弈为零和的,故参与人II的赢得矩阵就是 -A。
当参与人I、II和策略集S1、S2及参与人I的赢得矩阵A 确定后,一个矩阵博弈就给定了,通常,将矩阵博弈记成
G = {I,II;S1、S2;A} 或 G = {S1、S2;A}。
第10章 博弈论初步
Game Theory
■10.1 博弈论的基本概念 ■10.2 矩阵博弈的数学模型 ■10.3 矩阵博弈的混合策略 ■10.4 矩阵博弈的解法
一、博弈论和博弈行为 10.1 博弈论的基本概念
博弈行为 博弈论是关于策略相互作用(Strategic interaction)和理
性行为的理论。 所谓策略依存性是指每一个博弈参与者所得结果的好坏,
最优纯策略的进一步解释
关于定理1的直观解释是:如果ai*j*既是矩阵A中第i*行 的最小值,又是A中j*列的最大值,则ai*j*即为博弈的值, 且(αi*,βj* )就是博弈的解。其博弈意义是:一个平衡局势 (αi*,βj* )应具有这样的性质,当参与人I 选取了纯策略αi* 后,参与人II 为了使其所失最少,只有选择纯策略βj*,否 则就可能失去的更多;反之,当参与人II 选取了纯策略βj* 后,参与人I 为了得到最大的赢得,也只能选择纯策略αi*, 否则就会赢得更少。双方的竞争局势在(αi*,βj* )下达到了 一个平衡状态。
博弈分析的目的是使用博弈规则预测均衡。
二、博弈的基本要素 10.1 博弈论的基本概念
参与人、行动、信息、策略、支付、结果、均衡
1)参与人(Players) 博弈中的决策主体,在一个博弈行为(或一局博弈
)中,有权决定自己行动方案。通常用 I 表示参与人的 集合,如果有n个参与人,则 I = {1,2,…,n}。
三、博弈的分类
10.1 博弈论的基本概念
博弈分类及对应的均衡概念
静态
动态
完全 信息
完全信息静态博弈 Nash Equilibrium Nash(50,51)
完全信息动态博弈
Subgame Perfect Nash Equilibrium
Selten(1965)
不完全 不完全信息静态博弈
不完全信息动态博弈
参与人的概念具有广义性,可理解为个人,还可理 解为某一集体,如球队、企业等。也可把大自然当作参 与人。(利益完全一致的参加者只能看成是一参与人)
在博弈中总是假定每一个参与人都是“理智的”决 策者。不存在利用他方失误来扩大自己利益的可能性。
二、博弈的基本要素 10.1 博弈论的基本概念
2)行动和策略 行动是参与人在博弈的某个时间点上的决策变量或决
二、博弈的基本要素 10.1 博弈论的基本概念
3)支付(Payoff) 支付有时也称赢得,是指一个特定策略组合下参与人
得到的收益水平。
在一局博弈中,各参与人所选定的策略形成的策略组
合称为一个局势,即若Si是第i个参与人的一个策略,则n个 参与人的策略组 S =(S1 ,S2 ,…,Sn )就是一个局势。
不仅取决于自己的策略选择,还取决于其他博弈参与者的策 略选择。这种具有策略依存性的竞争性的决策行为称为博弈 行为。
博弈就是一些个人、团队或组织,面对一定的环境条件, 在一定规则下,同时或先后、一次或多次,从各自可能选择 的行为或策略中进行选择和实施,各自得到相应结果的过程。
一、博弈论和博弈行为 10.1 博弈论的基本概念
S1 = {α1,α2 , α3, α4}, S2 = {β1, β2, β3 },
-6 1 -5 3 24 A= 9 -1 -10 -3 0 6
二、最优纯策略
10.2 矩阵博弈的数学模型
对于一般矩阵博弈,有如下定义:
设G = {S1、S2;A}为矩阵博弈,其中 S1 = {α1,α2 , …, αm}, S2 = {β1,β2, …, βn}, A = (aij)m×n, 若等式
二人博弈
有限博弈
多人博弈
博弈
不结盟博弈
无限博弈
二人博弈 多人博弈
动态博弈
微分博弈
零和博弈
非零和博弈 零和博弈 非零Fra Baidu bibliotek博弈 零和博弈 非零和博弈 零和博弈 非零和博弈
三、博弈的分类
完全理性 博弈
非合作博弈
博弈
有限理性 博弈
合作博弈
动态博弈
静态博弈
静态博弈
完全信息 静态博弈
不完全信息 静态博弈
动态博弈
A A,B 70
(30)
乙
B
C
75
70
(25) (30)
甲 A,C 70
70
75
(30) (30) (25)
B,C 60
72
72
(40) (28) (28)
二、最优纯策略
10.2 矩阵博弈的数学模型
2)甲公司的支付矩阵 市场业务总额为100(按百分比计),本 来乙公司想与甲公司各占50个份额,但乙公司因财力有限不能与甲公 司分享市场份额。当甲公司使用A,B纯策略,而乙公司采用纯策略A 时,甲公司多赢20个份额(70与50的差),这个20是这一局势下甲公 司的赢得值,而此时,甲公司多得的份额恰好是乙公司失去的份额 (50与30的差),于是我们可写出甲公司的赢得矩阵如下(把上面矩 阵每个元素的数值减去20):
二、最优纯策略
10.2 矩阵博弈的数学模型
分析 市场竞争中的博弈问题,为此首先建立甲公司的支付矩阵。 根据问题,甲公司要建的两个娱乐场不会都建在同一区,故甲公司 的纯策略有三个:把娱乐场建在A,B区,或A,C区,或B,C区; 乙公司也有三个纯策略:把娱乐场建在A区、B区或C区。于是根据 背景条件,甲(乙)公司占有市场的份额(以百分比计)为:
maxi minj aij = minj maxi aij = (ai*j*) 成立,记VG = ai*j*,则称VG为博弈G的值,称使上式 成立的纯局势(αi*, βj* )为G纯策略下的解(或平衡局 势),αi*, βj*分别称为参与人I,II最优纯策略。 由定义1可知,在矩阵博弈中两个参与人都采取最优纯