第六章对策论基础

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 2 3
1 6 1 8
A
2
3
2
4
3 4
9 3
1 0
10
6
最优纯策略的表述
• 若满足
max i
mjin{aij
}
min j
miax{aij
}
• 则上述条件规定的局势
(i*
,
* j
)
• 叫做最优纯局势,也是矩阵对策的最优解, 是局中人I、II的最优纯策略。
• 定理:矩阵对策G={S1,S2,A}Biblioteka Baidu纯策略解的
y1, y2 0
• 解得
x3 1/ 3, x4 2 / 3; y1 1/ 2, y2 1/ 2,V 5
矩阵混合对策问题的解
X (0,0,1/ 3,2 / 3,0)T Y (1/ 2,1/ 2,0,0,0)T V 5
相关定理
记T(G)为矩阵对策G的解集
定理1 设有两个矩阵对策 G1={S1,S2,A1}, G2={S1,S2,A2}, 其中A1=(aij), A2=(aij+L), L为一任意常数,则
混合策略的定义
• 令纯策略集对应的概率向量是
X (x1, x2 , , xm ) Y ( y1, y2 , , yn )
• 它们满足 xi , y j 0,i 1,2, , m; j 1,2, , n
m
n
xi 1 y j 1
i 1
j 1
• 混合策略的集合 S1* {X}, S2* {Y}
(1) VG2 VG1 L (2) T1(G) T2 (G)
相关定理
• 定理2 设有两个矩阵对策 G1={S1,S2,A1}, G2={S1,S2,A2}, >0,为一任意常数,则 (1) VG2 VG1
(2) T(G1) T(G2 )
优其策中略T1集(G。)和T2(G)分别为局中人Ⅰ和Ⅱ的最
i 1
n
aij y j V ,i 1,2, m
j 1
n
y j 1, y j 0
j 1
• 关于混合对策问题的解,我们有如下定理:
混合对策最优解定理
• 如果(X*,Y*)是对策G的最优混合局势,则对
于某个i或j来说,有:
n
(1)若xi* 0,则
aij
y
* j
V
j 1
m
(2)若y
* j
• 博弈论是研究博弈现象的规律的数学理论 和方法
• 博弈现象的要素
– 局中人(参与人) —二人或多人 – 行动与策略—有限或无限 – 信息—完全或不完全 – 支付函数—可正可负
一、基本概念与名词
• 局中人 • 策略与策略集 • 局势 • 赢得函数 • 零和对策 • 矩阵对策:二人有限零和对策
二、对策分类
第六章 对策论基础
• 概论
– 基本概念与名词 – 对策分类
• 矩阵对策的基本理论
– 矩阵对策的数学模型 – 最优纯策略 – 混合策略与混合扩充
第一节 概论
• 基本概念与名词 • 对策分类
博弈现象
下棋与打牌 体育比赛 战争 市场进入 谈判 生产管理决策 竞拍
二、博弈论及博弈现象的要素
例子引出混合策略
• 赢得期望值 E(x, y) xy 3x(1 y) 4(1 x) y
2(1 x)(1 y)
4xy x 2 y 1/ 2 5 / 2
4(x 1/ 2)(y 1/ 4) 5 / 2
• 在x=1/2,y=1/4时,赢得函数取得最优 值5/2。这实际上是对策双方都满意的结果。 我们把纯策略对应的概率向量叫做混合策 略,最优解则是最优混合策略。本例中, 最优混合策略是(1/2,1/2)和(1/4,3/4)。
充要条件是存在一个纯局势
(i*,
* j
)
使得
aij* ai* j* ai* j ,i 1,2, , m; j 1,2, , n
例子的最优纯策略
• 在上述定理中
• 因此符a合ij* 条 m件jin(aij ),
ai* j miax(aij )
max(a
i
ij
*
)
min j
(ai*
j
)
的即为最优纯策略。
• 则称(X*,Y*)为最优混合局势,或叫做G在混 合策略下的解,V叫做对策G的值。X*、Y* 分别是局中人I、II的最优混合策略。
混合对策问题的解法
• 如果G的值是V,则局中人I和II的最优策略 是下列两组不等式的解:
m
aij xi V , j 1,2, n
i 1
m
xi 1, xi 0
对策的数学表示
• 二人矩阵对策用下列式子表示
G I, II , S1, S2, A或G S1, S2, A
• 其中I、II表示两个局中人,S1、S2分别表 示局中人I、II的策略集,A则表示赢得矩阵:
A (aij )
二、最优纯策略
• 现有一矩阵对策
G S1, S2, A
• 其中 S1 {1,2 ,3,4}, S2 {1, 2 , 3}
–零和博弈
– 纯策略博弈 – 混合策略博弈
–非零和博弈
– 完全信息博弈
静态博弈 动态博弈
– 不完全信息博弈
静态博弈 动态博弈
非零和的四种博弈 也可以有纯策略和混合 策略博弈之分。
动态时行动和策略 不同,要素有五个;而 静态时行动与策略不加 区别,要素有三个。
第二节 矩阵对策的基本理论
• 矩阵对策的数学模型 • 最优纯策略 • 混合策略与混合扩充
动态
对策
静态
微分
不结盟
结盟
有限
无限
联合
合作
二人
多人
零和
非零和
二、对策分类
一)按对策双方是
否存在有约束力的 协议来分:
–合作对策 –非合作对策
二)按局中人数分
类:
•二人对策 •多人对策
三)按策略数分 类:
•有限策略对策 •无限策略对策
二人非合作对 策是我们讨论的重 点。
非合作博弈的进一步分类
非合作博弈
• 将 G* {S1*, S2*, E} 叫做G的混合扩充。
最优混合策略的定义
• 若令
E( X *,Y ) max E( X ,Y ), E( X ,Y *) min E( X ,Y )
X S1*
YS2*
• 并有 min E(X *,Y ) max E(X ,Y *) V
YS2*
X S1*
一、矩阵对策的数学模型
• 以齐王赛马为例说明 齐王赛马—二人非合作零和对策
– 局中人—齐王和田忌 – 策略— 上 中下三种等级的马的组合 ,比三次,
有六组策略:( 上,中,下) 、 ( 中,上,下) 、 ( 上,下,中) 、 ( 中,下,上) 、 ( 下,上,中) 、 ( 下,中,上) .
对对田齐忌王,,则这用六组i ,策i 略1用,2,3,i4,,i5,61,2表,3示,4,。5,6 表示,
1 2
A
3 4
7 4
3 6
• 若混合策略均不为零,由上述定理知混合 对策问题数学模型的不等式应为等式。因
此有
第二步 用方程组求解
• 最优混合策略满足如下方程组
7x3 4x4 V
7 y1 3y2 V
3x3 6x4 V
4 y1 6 y2 V
x3 x4 1
y1 y2 1
x3, x4 0
– 支付函数—赢了得一千金,输了付一千金。
齐王赛马赢得函数
田忌
1 2 3 4 5 6
(上中下) 1 3 1 1 1 1 -1 (上下中) 2 1 3 1 1 -1 1 齐 (中上下) 3 1 -1 3 1 1 1 王 (中下上) 4 -1 1 1 3 1 1 (下中上) 5 1 1 -1 1 3 1 (下上中) 6 1 1 1 -1 1 3
A
1 2
1 4
3 2
分析上述例子
• 因为
max i
mjin{aij
}
2,
min j
miax{aij
}
3
• 所以
max i
mjin{aij
}
min j
miax{aij
}
• 此时假设局中人I以概率x选取策略1,以概 率(1-x)选取策略2;局中人II以概率y选取 策略1,以概率(1-y)选取策略2。则对于局 中人I来说,赢得的期望值为E(x,y),它等 于
9 6
5 6 0 8 8 3
第一步 简化赢得矩阵
• 划去普遍较小的行,例如第1、2行,得
1 2 345
3 7 3 9 5 9 A 4 4 6 8 7 6
5 6 0 8 8 4
1 2
3 7 3 A 4 4 6
5 6 0
• 划去普遍较大的列,例如第3、4、5三列, 结果如上。
进一步化简
• 上述结果的第一行比第三行普遍更优,因 此再划去第三行,得
• 上述例子的最优纯策略为:最优局势(2, 2 )
且G=2为局中人I的赢得值。
三、混合策略与混合扩充
• 基本概念:当
max i
mjin{aij
}
min j
miax{aij
}
时不存在最优纯策略,此时需要应用混合
策略的方法确定参加对策的纯策略。
• 例如 G S1, S2, A
S1 {1,2}, S2 {1, 2} 1 2
0,则
aij xi* V
i 1
n
(3)若 aij y*j V ,则xi* 0 j 1
m
(4)若
aij xi*
V
,
则y
* j
0
i 1
以例说明混合对策问题的特殊解法
• 对于G={S1,S2,A}
1 2 3 4 5
1 3 4 0 3 0 2 5 0 2 5 9
A
3 4
7 4
3 6
9 8
5 7
习题
• P.272-273,习题1、3、4、5。
• (新书) P292:习题1、3、4、5。
相关文档
最新文档