对策与冲突分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“齐王赛马” 就是一个矩阵对 策
如何选取对自己最为有利的纯策略以谋取最大的 赢得(或最少损失) ?
如果双方都不想冒险,都不存在侥幸心理,而是考 虑到对方必然会设法使自己的所得最少这一点,就应 该从各自可能出现的最不利的情形中选择一种最为有 利的情形作为决策的依据,这就是所谓“理智行为”, 也是对策双方实际上都能接受的一种稳妥的方法。
ij
ij
i
和
E(x, y) aij xi y j aij xi y j E(x, j) y j
ij
ji
j
通过上述讨论,可给出定理2的另一等价形式:
定理3 设
x*
S1*
,
y*
S
* 2
,则
(x*
,
y*
)
是
G
的解的充分必要条件是:对任意 i 1, 2,, m 和 j 1, 2 ,, n
略进行对策呢?——用概率的观点,可以考虑局中人Ⅰ以概率x1选取α1, 以概率x2选择α2 ,局中人Ⅱ以概率y1选取β1,以概率y2选取β2。由于 加入了随机因素,所以应考虑局中人的期望效用。
对应纯策略集 合的概率向量
混合策略意义下解存在的鞍点型充分必要条件
求解:
2.3 矩阵对策的基本定理
有
E(i , y* ) E(x* , y* ) E(x* , j)
定理3又可表述为如下等价形式:
定理4
设
x*
S1*
,
y*
S
* 2
,则 (x* , y* ) 是
G
的解的充分必要条件是:存在数v ,使得 x* 和 y*
分别是不等式组
(Ⅰ)
和不等式组 (Ⅱ)
aij xi v
i
j 1,, n
xi 1
(2)若 max min P(x,y),min max P(x,y)都存在,则必有
II公司
β1(原价) β2(减价)
I公司 α1(原价) α2(减价)
10,10 16,6
6,16 10,10
已知两公司费用(或成本)皆为9个单位,于是销售为10时双方都
会有赢利,销售为7或6时则发生亏损。
分析效用序对矩阵可知:
①若双方均维持原价,均稍有赢利,最为安全;
②若能达成“双方交替减价”的协议,则销售额可达16+6=22,对双 方都有利,即可构成合作解;
Y S 2
X S1
Y S 2
X S1
由此定理得知,局中人1的效用矩阵中增加 或减少一常数,并不影响其对策的解,只
是在其对策值上差一常数,因此在线性规 划方法中,假设其值v>0,并不妨碍大局, 也是合理的。正因为如此,当局中人1的效 用函数与局中人2的效用常数之和是常数时, 也常称之为零和对策。
例 一矩阵对策的赢得矩阵为
(P ′)
min f x1 x2 x3 2x1 2x2 8x3 1 2x1 10x2 2x3 1 6x1 2x2 2x3 1 x1 , x2 , x3 0
(D ′)
max g y1 y2 y3 2 y1 2 y2 6 y3 1 2 y1 10 y2 2 y3 1 8y1 2 y2 2 y3 1 y1 , y2 , y3 0
和
j 1, 2,, n ,有
或 又由
得到
aij
y
* j
v*
aij xi*
j
i
E(i, y* ) v* E(x* , j)
E(x*, y*) E(i, y* )xi* v* xi v*
i
i
E(x*, y*) E(x*, j) y*j v* y j v*
j
jຫໍສະໝຸດ Baidu
v* E(x*, y* ) ,故定理5成立。
y* VG (3 25,3 50, 2 25)T (6 13,3 13, 4 13)T
对于矩阵对策有下面的定理:
定理:设有两个矩阵对策 G1 S1,S2,A,G2 S1,S2,B ,
其中 A aij mn , B (aij d)mn , d为常数,则G1,G2
的最优策略集不变,只是对策的值相差一个常数d,即VG2 VG1 d
b11 b21
am2
a1n a2n
amn
b1n
b2n
bmn
4.1 无限对策
1、二人无限零和对策
(1)定义: 局中人I和II分别完全独立地从区间[0,1]中各选择数x,y称 为局中人I和II的纯策略。选定x,y后,局中人I得到支付P(x,y), 局中人II得到支付-P(x,y),这种对策G称为二人无限零和对策 (infinite game),有时也称为正方形上的无限对策。
定理5的证明是 一个构造性的 证明,它不仅 证明了矩阵对 策解的存在性, 而且给出了利 用线性规划方 法求解矩阵对 策的思想。
3 解矩阵对策的线性规划方法
由定理5已知,任一对策矩阵G {S1, S2 ; A} 的求解均等于一对互为对偶的线性规划问题,而定理4表明,
对策 G 的解 x*和 y *等价于下面两个不等式组的解。
定理6 设矩阵对策 G {S1, S2; A}的值为 VG,则
VG
max min E(x,
xS1* 1 jn
j)
min max E(i, y)
yS2* 1im
求解矩阵对策的线性规划方法
求矩阵对策问题 G 的解可等价地转化为求 下列两个互为对偶的线性规划问题(P)和(D)的解的形式
若设 v 0(如:当矩阵A中存在一行,其所有元素皆
局中人Ⅰ按最大最小原则,局中人Ⅱ按最小最大原则
选择各自的纯策略,这对双方来说都是一种较为稳妥的行
为。
1 2 3 Max
1
-8
2
2
3
-10
4
Min
-3 92 6 2
max i
min j
aij
min j
max i
aij
ai* j*
2
一般矩阵对策的定义
max
-i 8
aij
2
-3
-3
min j
aij
16 2
第二章 对策与冲突分析
1 对策模型的构成及分类
1.1 对策行为和对策论
对策论亦称为竞赛论或博弈论,是研究具有斗争 或竞争性质现象(对策现象)的数学理论和方法。它 主要研究竞争的各方是否存在着最合理的行动方案和 如何找到这个合理方案。
下棋、打牌、体育比赛、交战、商战、谈判,等等
“齐王赛马”
1.2 对策行为的三个基本要素
建立单纯形表求解。可得问题(D’)的最优解为
y (3 25, 3 50, 2 25)T g 13 50
问题(P′)的最优解为
x (3 25, 3 50, 2 25)T f 13 50
于是
VG 50 13 x* VG (3 25,3 50, 2 25)T (6 13,3 13, 4 13)T
2 3 3 A 2 3 1
1 1 5
求最优混合策略。
解:容易看出:
4 1 5
A+(2)33=B
0
5
3
由B构成的矩阵对策的解为:
3 3 7
~
~
X (0,0,1),Y (2 / 5,3/ 5,0) 对策的值为 VG 3 2 1
4 其他对策模型
4.1 二人有限非零和对策
例:I 、II两个公司出售同一种质量相同的产品,且无其他竞争者。目前 两公司均面临“维持原价”和“减价出售”两个策略,构成双矩阵 对策,其效用序对矩阵如下:
③若一方实力雄厚,可能会威胁对方接受有利于自己的安排,构成威胁 解。
这样的对策为非零和对策,局中人在任何局
势下的效用值代数和不等于零也不等于某以常
数,效用矩阵要分别写出来或写成双矩阵形式, 有可能产生合作解或者威胁解。
a11
am1
a1n
b11
amn bm1
b1n
bmn
或aaam12111
成立即可。
考虑如下两个线性规划问题:
(P)
和
max w
aij xi w
i
j 1,, n
xi 1
i
xi 0 i 1,, m
(D)
min v
aij y j v
j
i 1,, m
yj 1
j
yj 0
j 1,, n
显然,问题(P)和(D)是互为对偶的线性规划问题,
而且
x
(1, 0 ,, 0)T
Em,
aij xi v
j 1,, n
aij y j v i 1,, m
i
j
(Ⅰ) xi 1
(Ⅱ) y j 1
i
j
xi 0 i 1,, m
y j 0 j 1,, n
其中
v
max min E(x, y) min max
xS1* yS2*
yS2* xS1*
E(x, y)
就是对策的值 VG
1.局中人(Player) 在一个对策行为(或一局对策)中,有权决定自己行
动方案的对策参加者,称为局中人。通常用I 表示局中人的 集合。如果有n个局中人,则I={1, 2,…,n}。一般要求一个对 策中至少要有两个局中人。
“齐王赛马” : 局中人就是齐王和田忌。
2.策略集(Strategy) 一局对策中,可供局中人选择的一个实际可行的完整的
证明:
mn
E2 ( X ,Y )
( ij d )xi y j
i1 j 1
mn
mn
ij xi y j
dxi y j
i1 j 1
i1 j 1
E1 ( X ,Y ) d
max min E2 (X ,Y ) max min E1(X ,Y ) d
X S1
Y S 2
X S1
Y S 2
min max E2 (X ,Y ) max min E1(X ,Y ) d
w
min j
a1 j
是问题(P)的一个可行解
y
(1,0,,0)T
E,n v
max
i
ai1
是问题(D)的一个可行解。
由线性规划的对偶理论可知,问题(P)和(D)分别存在最优解
(x*, w* ) 和 ( y* , v* ) ,且 v* w* 。
即存在
x*
S1*
,
y*
S
* 2
和数 v *,使得对任意 i 1, 2,, m
5
2
于是
max
i
min j
aij
min j
max
i
aij
a22
2
由定义2及定理1知
2.2 矩阵对策的混合策略
一个例子:
A 53 64
v1
max
i
min j
aij
4
v2
min j
max
i
aij
5
v2 a21 5 4 v1
不存在一双方均可接受的平衡局势!
说明该对策无鞍点,从而在纯策略意义下无解,这样局中人怎样选择策
大于零时,则必有 v 0),显然亦有 w 0 。
此时,若令 xi ' xi w , y j ' y j v ,则可将问题(P) 和(D)分别等价地 化为(P ′)和( D ′)
例5 一矩阵对策的赢得矩阵为
2 2 6 A 2 10 2
8 2 2
求最优混合策略。
解:该问题可写成下面两个相应的线性规划模型
利用单纯形法求解(D’):
引入松弛变量 y4 , y5 , y6 0 ,将( D' )化为标准形式:
max g y1 y2 y3
2 y1 2 y2 6 y3 y4
1
2 y1 10 y2 2 y3 y5 1
8y1 2 y2 2 y3
y6 1
y1 , y2 , y3 , y4 , y5 , y6 0
3.赢得函数(Pay off)(支付函数/效用Utility)
当以上三个基本因素确定后,一个对策模型就给定了。
1.3 对策的分类
2 矩阵对策(有限对抗对策)的基本定理
2.1 矩阵对策的数学模型 矩阵对策就是二人有限零和对策。这是指只有两个 参加对策的局中人,每个局中人都只有有限个策略可 供选择。在任一局势下,两个局中人的赢得之和总是 等于零,即双方的利益是激烈对抗的。
i
xi 0 i 1,, m
aij y j v
j
i 1,, m
yj 1
j
yj 0
j 1,, n
的解,且 v VG
定理5 对任一对策矩阵 G {S1 , S2 ; A} ,一定存在混合 策略意义下的解。
证明:由定理3,只要证明存在
x* S1* ,
y
*
S
* 2
,使得式
E(i , y* ) E(x* , y* ) E(x* , j)
行动方案称为一个策略。参加对策的每一局中人i,i∈I,
都有自己的策略集Si 。一般,每一局中人的策略集中至少 应包括两个策略。当局中人i以概率1选择策略si ,而以概 率0选择其它策略时,则称策略si为局中人i 的纯策略。
在“齐王赛马”的例子中,如果用(上,中,下)表示以上马、 中马、下马依此参赛这样一个次序,这就是一个完整的行动方案, 即为一个策略。可见,局中人齐王和田忌各自都有六个策略:(上, 中,下)(上,下,中)(中,上,下)(中,下,上)(下,中, 上)(下,上,中)。
两个记号:
当局中人Ⅰ取纯策略 i 时,记其相应的赢得函数为 E(i, y),于是
E(i, y) aij y j
j
当局中人Ⅱ取纯策略 j 时,记其相应的赢得函数为 E(x, j) ,于是
E(x, j) aij xi
i
由上面两式,可得
E(x, y) aij xi y j aij y j xi E(i, y)xi
如何选取对自己最为有利的纯策略以谋取最大的 赢得(或最少损失) ?
如果双方都不想冒险,都不存在侥幸心理,而是考 虑到对方必然会设法使自己的所得最少这一点,就应 该从各自可能出现的最不利的情形中选择一种最为有 利的情形作为决策的依据,这就是所谓“理智行为”, 也是对策双方实际上都能接受的一种稳妥的方法。
ij
ij
i
和
E(x, y) aij xi y j aij xi y j E(x, j) y j
ij
ji
j
通过上述讨论,可给出定理2的另一等价形式:
定理3 设
x*
S1*
,
y*
S
* 2
,则
(x*
,
y*
)
是
G
的解的充分必要条件是:对任意 i 1, 2,, m 和 j 1, 2 ,, n
略进行对策呢?——用概率的观点,可以考虑局中人Ⅰ以概率x1选取α1, 以概率x2选择α2 ,局中人Ⅱ以概率y1选取β1,以概率y2选取β2。由于 加入了随机因素,所以应考虑局中人的期望效用。
对应纯策略集 合的概率向量
混合策略意义下解存在的鞍点型充分必要条件
求解:
2.3 矩阵对策的基本定理
有
E(i , y* ) E(x* , y* ) E(x* , j)
定理3又可表述为如下等价形式:
定理4
设
x*
S1*
,
y*
S
* 2
,则 (x* , y* ) 是
G
的解的充分必要条件是:存在数v ,使得 x* 和 y*
分别是不等式组
(Ⅰ)
和不等式组 (Ⅱ)
aij xi v
i
j 1,, n
xi 1
(2)若 max min P(x,y),min max P(x,y)都存在,则必有
II公司
β1(原价) β2(减价)
I公司 α1(原价) α2(减价)
10,10 16,6
6,16 10,10
已知两公司费用(或成本)皆为9个单位,于是销售为10时双方都
会有赢利,销售为7或6时则发生亏损。
分析效用序对矩阵可知:
①若双方均维持原价,均稍有赢利,最为安全;
②若能达成“双方交替减价”的协议,则销售额可达16+6=22,对双 方都有利,即可构成合作解;
Y S 2
X S1
Y S 2
X S1
由此定理得知,局中人1的效用矩阵中增加 或减少一常数,并不影响其对策的解,只
是在其对策值上差一常数,因此在线性规 划方法中,假设其值v>0,并不妨碍大局, 也是合理的。正因为如此,当局中人1的效 用函数与局中人2的效用常数之和是常数时, 也常称之为零和对策。
例 一矩阵对策的赢得矩阵为
(P ′)
min f x1 x2 x3 2x1 2x2 8x3 1 2x1 10x2 2x3 1 6x1 2x2 2x3 1 x1 , x2 , x3 0
(D ′)
max g y1 y2 y3 2 y1 2 y2 6 y3 1 2 y1 10 y2 2 y3 1 8y1 2 y2 2 y3 1 y1 , y2 , y3 0
和
j 1, 2,, n ,有
或 又由
得到
aij
y
* j
v*
aij xi*
j
i
E(i, y* ) v* E(x* , j)
E(x*, y*) E(i, y* )xi* v* xi v*
i
i
E(x*, y*) E(x*, j) y*j v* y j v*
j
jຫໍສະໝຸດ Baidu
v* E(x*, y* ) ,故定理5成立。
y* VG (3 25,3 50, 2 25)T (6 13,3 13, 4 13)T
对于矩阵对策有下面的定理:
定理:设有两个矩阵对策 G1 S1,S2,A,G2 S1,S2,B ,
其中 A aij mn , B (aij d)mn , d为常数,则G1,G2
的最优策略集不变,只是对策的值相差一个常数d,即VG2 VG1 d
b11 b21
am2
a1n a2n
amn
b1n
b2n
bmn
4.1 无限对策
1、二人无限零和对策
(1)定义: 局中人I和II分别完全独立地从区间[0,1]中各选择数x,y称 为局中人I和II的纯策略。选定x,y后,局中人I得到支付P(x,y), 局中人II得到支付-P(x,y),这种对策G称为二人无限零和对策 (infinite game),有时也称为正方形上的无限对策。
定理5的证明是 一个构造性的 证明,它不仅 证明了矩阵对 策解的存在性, 而且给出了利 用线性规划方 法求解矩阵对 策的思想。
3 解矩阵对策的线性规划方法
由定理5已知,任一对策矩阵G {S1, S2 ; A} 的求解均等于一对互为对偶的线性规划问题,而定理4表明,
对策 G 的解 x*和 y *等价于下面两个不等式组的解。
定理6 设矩阵对策 G {S1, S2; A}的值为 VG,则
VG
max min E(x,
xS1* 1 jn
j)
min max E(i, y)
yS2* 1im
求解矩阵对策的线性规划方法
求矩阵对策问题 G 的解可等价地转化为求 下列两个互为对偶的线性规划问题(P)和(D)的解的形式
若设 v 0(如:当矩阵A中存在一行,其所有元素皆
局中人Ⅰ按最大最小原则,局中人Ⅱ按最小最大原则
选择各自的纯策略,这对双方来说都是一种较为稳妥的行
为。
1 2 3 Max
1
-8
2
2
3
-10
4
Min
-3 92 6 2
max i
min j
aij
min j
max i
aij
ai* j*
2
一般矩阵对策的定义
max
-i 8
aij
2
-3
-3
min j
aij
16 2
第二章 对策与冲突分析
1 对策模型的构成及分类
1.1 对策行为和对策论
对策论亦称为竞赛论或博弈论,是研究具有斗争 或竞争性质现象(对策现象)的数学理论和方法。它 主要研究竞争的各方是否存在着最合理的行动方案和 如何找到这个合理方案。
下棋、打牌、体育比赛、交战、商战、谈判,等等
“齐王赛马”
1.2 对策行为的三个基本要素
建立单纯形表求解。可得问题(D’)的最优解为
y (3 25, 3 50, 2 25)T g 13 50
问题(P′)的最优解为
x (3 25, 3 50, 2 25)T f 13 50
于是
VG 50 13 x* VG (3 25,3 50, 2 25)T (6 13,3 13, 4 13)T
2 3 3 A 2 3 1
1 1 5
求最优混合策略。
解:容易看出:
4 1 5
A+(2)33=B
0
5
3
由B构成的矩阵对策的解为:
3 3 7
~
~
X (0,0,1),Y (2 / 5,3/ 5,0) 对策的值为 VG 3 2 1
4 其他对策模型
4.1 二人有限非零和对策
例:I 、II两个公司出售同一种质量相同的产品,且无其他竞争者。目前 两公司均面临“维持原价”和“减价出售”两个策略,构成双矩阵 对策,其效用序对矩阵如下:
③若一方实力雄厚,可能会威胁对方接受有利于自己的安排,构成威胁 解。
这样的对策为非零和对策,局中人在任何局
势下的效用值代数和不等于零也不等于某以常
数,效用矩阵要分别写出来或写成双矩阵形式, 有可能产生合作解或者威胁解。
a11
am1
a1n
b11
amn bm1
b1n
bmn
或aaam12111
成立即可。
考虑如下两个线性规划问题:
(P)
和
max w
aij xi w
i
j 1,, n
xi 1
i
xi 0 i 1,, m
(D)
min v
aij y j v
j
i 1,, m
yj 1
j
yj 0
j 1,, n
显然,问题(P)和(D)是互为对偶的线性规划问题,
而且
x
(1, 0 ,, 0)T
Em,
aij xi v
j 1,, n
aij y j v i 1,, m
i
j
(Ⅰ) xi 1
(Ⅱ) y j 1
i
j
xi 0 i 1,, m
y j 0 j 1,, n
其中
v
max min E(x, y) min max
xS1* yS2*
yS2* xS1*
E(x, y)
就是对策的值 VG
1.局中人(Player) 在一个对策行为(或一局对策)中,有权决定自己行
动方案的对策参加者,称为局中人。通常用I 表示局中人的 集合。如果有n个局中人,则I={1, 2,…,n}。一般要求一个对 策中至少要有两个局中人。
“齐王赛马” : 局中人就是齐王和田忌。
2.策略集(Strategy) 一局对策中,可供局中人选择的一个实际可行的完整的
证明:
mn
E2 ( X ,Y )
( ij d )xi y j
i1 j 1
mn
mn
ij xi y j
dxi y j
i1 j 1
i1 j 1
E1 ( X ,Y ) d
max min E2 (X ,Y ) max min E1(X ,Y ) d
X S1
Y S 2
X S1
Y S 2
min max E2 (X ,Y ) max min E1(X ,Y ) d
w
min j
a1 j
是问题(P)的一个可行解
y
(1,0,,0)T
E,n v
max
i
ai1
是问题(D)的一个可行解。
由线性规划的对偶理论可知,问题(P)和(D)分别存在最优解
(x*, w* ) 和 ( y* , v* ) ,且 v* w* 。
即存在
x*
S1*
,
y*
S
* 2
和数 v *,使得对任意 i 1, 2,, m
5
2
于是
max
i
min j
aij
min j
max
i
aij
a22
2
由定义2及定理1知
2.2 矩阵对策的混合策略
一个例子:
A 53 64
v1
max
i
min j
aij
4
v2
min j
max
i
aij
5
v2 a21 5 4 v1
不存在一双方均可接受的平衡局势!
说明该对策无鞍点,从而在纯策略意义下无解,这样局中人怎样选择策
大于零时,则必有 v 0),显然亦有 w 0 。
此时,若令 xi ' xi w , y j ' y j v ,则可将问题(P) 和(D)分别等价地 化为(P ′)和( D ′)
例5 一矩阵对策的赢得矩阵为
2 2 6 A 2 10 2
8 2 2
求最优混合策略。
解:该问题可写成下面两个相应的线性规划模型
利用单纯形法求解(D’):
引入松弛变量 y4 , y5 , y6 0 ,将( D' )化为标准形式:
max g y1 y2 y3
2 y1 2 y2 6 y3 y4
1
2 y1 10 y2 2 y3 y5 1
8y1 2 y2 2 y3
y6 1
y1 , y2 , y3 , y4 , y5 , y6 0
3.赢得函数(Pay off)(支付函数/效用Utility)
当以上三个基本因素确定后,一个对策模型就给定了。
1.3 对策的分类
2 矩阵对策(有限对抗对策)的基本定理
2.1 矩阵对策的数学模型 矩阵对策就是二人有限零和对策。这是指只有两个 参加对策的局中人,每个局中人都只有有限个策略可 供选择。在任一局势下,两个局中人的赢得之和总是 等于零,即双方的利益是激烈对抗的。
i
xi 0 i 1,, m
aij y j v
j
i 1,, m
yj 1
j
yj 0
j 1,, n
的解,且 v VG
定理5 对任一对策矩阵 G {S1 , S2 ; A} ,一定存在混合 策略意义下的解。
证明:由定理3,只要证明存在
x* S1* ,
y
*
S
* 2
,使得式
E(i , y* ) E(x* , y* ) E(x* , j)
行动方案称为一个策略。参加对策的每一局中人i,i∈I,
都有自己的策略集Si 。一般,每一局中人的策略集中至少 应包括两个策略。当局中人i以概率1选择策略si ,而以概 率0选择其它策略时,则称策略si为局中人i 的纯策略。
在“齐王赛马”的例子中,如果用(上,中,下)表示以上马、 中马、下马依此参赛这样一个次序,这就是一个完整的行动方案, 即为一个策略。可见,局中人齐王和田忌各自都有六个策略:(上, 中,下)(上,下,中)(中,上,下)(中,下,上)(下,中, 上)(下,上,中)。
两个记号:
当局中人Ⅰ取纯策略 i 时,记其相应的赢得函数为 E(i, y),于是
E(i, y) aij y j
j
当局中人Ⅱ取纯策略 j 时,记其相应的赢得函数为 E(x, j) ,于是
E(x, j) aij xi
i
由上面两式,可得
E(x, y) aij xi y j aij y j xi E(i, y)xi