运筹学—对策论(一)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
再如:α2 =(上,下,中), β 1 =(上,中, 下),则在局势s21下齐王的赢得值H1(s21)=1,田忌的 赢得值H2(s21)=﹣1。如此等等.
当局中人,策略,赢得函数三个因素确定后,一 个对策模型也就给定了。
三﹑对策的分类 联合对策
结 静 盟 合作对策
态对
二人
对 策有
策
限
不
多人
对
结
策
盟
﹣3 0 6
解:根据选择的原则,分析局中人的选择的策略
⑴局中人Ⅰ的策略:纯策略α1,α2, α2, α4可能带来的最 小赢得分别﹣8,2,﹣10,﹣3 所以,最小赢
得中最大的值为2。因此局中人Ⅰ的策略应为α2 ⑵局中人Ⅱ的策略:纯策略β 1, β 2, β 3可能带来的最大
损失分别9,2,6 。 所以,最大损失中最小的值为2。 因此局中人Ⅱ的策略应为β 2 。
定理的直观解释:如果ai*j*既是矩阵A=(aij)m×n中 第i*行的最小值,又是第j*列的最大值,则ai*j*是对策 的值,且(α i* , β j* )是在纯策略意义下的解。
定理的对策意义:一个平衡局势(α i* , β j* )具有 这样的性质,当局中人Ⅰ 选择了纯策略α i* 后,局中 人Ⅱ为了其所失 最小,只能选择β j* ,否则就可能失 去更多;反之,当局中人Ⅱ 选择了纯策略β j* 后,局 中人Ⅰ为了得到 最大的赢得,只能选择α i* ,否则就 会赢得更少 。双方在局势(α i* , β j* )下达到一个平衡 状态。
②在对策中总是假定每一个局中人都是“理智 的”决策者或竞争者。即对任一局中人来讲,不存 在利用其它局中人决策的失误来扩大自身利益的可
2﹒策略集
策略
一局对策中,可供局中人选择的一个实际可行 的完整的行动方案,称为一个对策。
策略集
设i为局中人,i的所有策略构成的集合Si称为i的 策略集。
如:在“齐王赛马”中,如果用(上,中,下) 表示以上马﹑中马﹑下马依次参赛这样一个次序,这 就是一个完整的行动方案,即为一个策略。
运筹学—对策论(一)
§1对策论的基本概念 一﹑对策行为和对策论
1﹒对策行为: 具有竞争或对抗性质的行为称为对 策行为。 对策行为的实例:
⑴下棋﹑打牌﹑体育比赛等。
⑵战争—在战争活动中的双方,都力图选取对自 己最为有利的策略,千方百计去战胜对手。
⑶政治—国际的谈判,各种政治力量之间的斗争, 各国际集团之间的斗争等都具有斗争的性质。
根据条件可看出,两人各采取什么的样出马顺序 对胜负是至关重要的。
二﹑对策行为的三个基本要素
1﹒局中人 在一个对策行为中,有权决定自己行动方案的
对策参加者,称为局中人。通常用I表示局中人的集 合。如果n个局中人,则I={1,2,…,n}。
说明:
①对策中关于局中人的概念是具有广义性的。 局中人除了可理解为个人外,还可以理解为一集体, 如球队﹑交战国﹑企业等,以及研究自然界中某个 现象时,可把这个现象看成一个局中人。
根据定义1可知,例1中( α 2 , β2 )是在纯策略 下的解。对策值VG=a22=2 ,i*=2,j*=2 。
定理1 矩阵对策G={S1 , S2;A}在纯策略意义下有解 的充要条件是:存在纯局势( α i* , β j* )使得对一切 i=1,2, …,m, j=1,2, …,n, 均有aij*≤ ai*j* ≤ ai*j 。
3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。
3﹒矩阵对策模型
设Ⅰ﹑Ⅱ分别表示两个局中人,且它们的纯策略 集分别为S1={α1,α2, …,αm}和S2={ β 1, β 2, …, β n}。记 局中人Ⅰ对任一局势( αi, β j )的赢得值为aij,并称
a11 a12 …a1n A= . . … .
am1 am2 …amn
为局中人Ⅰ的赢得矩阵。
显然, Hi(s)是局势s的函数,称之为第i局中人的 赢得函数。
如:在“齐王赛马”中,局中人集合I={1,2}, 齐王和田忌的策略集可分别用S1={α1, α2, α3 , α4 , α5 , α6}和S2={β1 ,β 2, β 3 , β 4 , β 5 , β 6}表示。 这样,齐王的一个策略αi和田忌的一个策略β j就决定 了一个局势sij 。 如果α1 =(上,中,下), β 1 =(上, 中,下),则在局势s11下齐王的赢得值H1(s11)=3,田 忌的赢得值H2(s11)=﹣3。
﹣6 1 ﹣8
A=
32 4 9 ﹣2 ﹣10
求出局中人Ⅰ﹑Ⅱ的最优策略。
﹣3 0 6
例1 设有一矩阵G={S1 , S2;A},其中S1={α1,α2, α2, α4}和S2={ β 1, β 2, β 3} 局中人Ⅰ的赢得矩阵为
﹣6 1 ﹣8
A=
32 4 9 ﹣2 ﹣10
求出局中人Ⅰ﹑Ⅱ的最优策略。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵
为﹣A。
当局中人Ⅰ﹑Ⅱ和策略集S1 ﹑ S2及局中人Ⅰ的赢 得矩阵A确定后,一个矩阵对策就确定了。
通常,将矩阵对策记成G={Ⅰ,Ⅱ;S1 , S2;A} 或G={S1 , S2;A} 。
4﹒局中人如何选取对自己最有利的纯策略? ①局中人的“理智行 双方都不想冒险,都不存在侥 为幸”心:理,而是考虑到对方必然会设法使自己的所得最小,
从各自可能出现的最不利的情形中选择一种最为有利的 情形作为决策的依据。
②选择原则:局中人Ⅰ按最大最小原则,局中人Ⅱ按最
小最大原则。即局中人Ⅰ从所有最小的赢得中选择最
大的赢得的策略,局中人Ⅱ从所有最大的损失中选择 最小的损失的策略。
例1 设有一矩阵G={S1 , S2;A},其中S1={α1,α2, α2, α4}和S2={ β 1, β 2, β 3} 局中人Ⅰ的赢得矩阵为
设Ⅰ﹑Ⅱ分别表示两个局中人,且它们的纯策略
集分别为S1={α1,α2, …,αm}和S2={ β 1, β 2, …, β n}。记局
中人Ⅰ对任一纯局势( a11 a12 …a1n
αi,
β
j
)的赢得值为aij,并称
A= . . … . 为局中人Ⅰ的赢得矩阵。
am1 am2 …amn
局中人Ⅱ的赢得矩阵为﹣A。
⑷经济—各国之间,各公司企业之间的各种经济 谈判,企业之间为争夺市场而进行的竞争。
2﹒对策论
对策论是研究对策行为中斗争各方是否存在着最 合理的行动方案,以及如何找到这个合理的行动方案 的数学理论和方法。对策论也称为竞赛论或博奕论。
经典的对策论研究的例子:“齐王賽马”
战国时期,齐王有一天提出要与田忌进行賽马。 双ห้องสมุดไป่ตู้约定:从各自的上中下三个等级马中各选一匹参 赛,每匹均只能参赛一次,每次比赛双方各出一匹马, 负者要付给胜者千金。已知:在同等级的马中,田忌 的马不如齐王的马,而如果田忌的马比齐王的马高一 等级,则田忌的马可取胜。 双方如何取胜?
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
定理1的一个等价命题:
定义2 设f(x,y)为一个定义在x∈A ,y∈B上的实值 函数,如果存在x* ∈A,y* ∈B,使得对一切x∈A ,y∈B, 有f(x,y*) ≤f(x*,y*) ≤ f(x*,y) , 则称(x*,y*) 为函数f(x,y) 的一个鞍点。
定理1的等价命题:矩阵对策G在纯策略意义下有 解,且VG=ai*j*的充要条件是: ai*j*是矩阵A的一个鞍 点(也称为对策的鞍点)。
对
二人
动 策无
态
限
对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型
当局中人,策略,赢得函数三个因素确定后,一 个对策模型也就给定了。
三﹑对策的分类 联合对策
结 静 盟 合作对策
态对
二人
对 策有
策
限
不
多人
对
结
策
盟
﹣3 0 6
解:根据选择的原则,分析局中人的选择的策略
⑴局中人Ⅰ的策略:纯策略α1,α2, α2, α4可能带来的最 小赢得分别﹣8,2,﹣10,﹣3 所以,最小赢
得中最大的值为2。因此局中人Ⅰ的策略应为α2 ⑵局中人Ⅱ的策略:纯策略β 1, β 2, β 3可能带来的最大
损失分别9,2,6 。 所以,最大损失中最小的值为2。 因此局中人Ⅱ的策略应为β 2 。
定理的直观解释:如果ai*j*既是矩阵A=(aij)m×n中 第i*行的最小值,又是第j*列的最大值,则ai*j*是对策 的值,且(α i* , β j* )是在纯策略意义下的解。
定理的对策意义:一个平衡局势(α i* , β j* )具有 这样的性质,当局中人Ⅰ 选择了纯策略α i* 后,局中 人Ⅱ为了其所失 最小,只能选择β j* ,否则就可能失 去更多;反之,当局中人Ⅱ 选择了纯策略β j* 后,局 中人Ⅰ为了得到 最大的赢得,只能选择α i* ,否则就 会赢得更少 。双方在局势(α i* , β j* )下达到一个平衡 状态。
②在对策中总是假定每一个局中人都是“理智 的”决策者或竞争者。即对任一局中人来讲,不存 在利用其它局中人决策的失误来扩大自身利益的可
2﹒策略集
策略
一局对策中,可供局中人选择的一个实际可行 的完整的行动方案,称为一个对策。
策略集
设i为局中人,i的所有策略构成的集合Si称为i的 策略集。
如:在“齐王赛马”中,如果用(上,中,下) 表示以上马﹑中马﹑下马依次参赛这样一个次序,这 就是一个完整的行动方案,即为一个策略。
运筹学—对策论(一)
§1对策论的基本概念 一﹑对策行为和对策论
1﹒对策行为: 具有竞争或对抗性质的行为称为对 策行为。 对策行为的实例:
⑴下棋﹑打牌﹑体育比赛等。
⑵战争—在战争活动中的双方,都力图选取对自 己最为有利的策略,千方百计去战胜对手。
⑶政治—国际的谈判,各种政治力量之间的斗争, 各国际集团之间的斗争等都具有斗争的性质。
根据条件可看出,两人各采取什么的样出马顺序 对胜负是至关重要的。
二﹑对策行为的三个基本要素
1﹒局中人 在一个对策行为中,有权决定自己行动方案的
对策参加者,称为局中人。通常用I表示局中人的集 合。如果n个局中人,则I={1,2,…,n}。
说明:
①对策中关于局中人的概念是具有广义性的。 局中人除了可理解为个人外,还可以理解为一集体, 如球队﹑交战国﹑企业等,以及研究自然界中某个 现象时,可把这个现象看成一个局中人。
根据定义1可知,例1中( α 2 , β2 )是在纯策略 下的解。对策值VG=a22=2 ,i*=2,j*=2 。
定理1 矩阵对策G={S1 , S2;A}在纯策略意义下有解 的充要条件是:存在纯局势( α i* , β j* )使得对一切 i=1,2, …,m, j=1,2, …,n, 均有aij*≤ ai*j* ≤ ai*j 。
3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。
3﹒矩阵对策模型
设Ⅰ﹑Ⅱ分别表示两个局中人,且它们的纯策略 集分别为S1={α1,α2, …,αm}和S2={ β 1, β 2, …, β n}。记 局中人Ⅰ对任一局势( αi, β j )的赢得值为aij,并称
a11 a12 …a1n A= . . … .
am1 am2 …amn
为局中人Ⅰ的赢得矩阵。
显然, Hi(s)是局势s的函数,称之为第i局中人的 赢得函数。
如:在“齐王赛马”中,局中人集合I={1,2}, 齐王和田忌的策略集可分别用S1={α1, α2, α3 , α4 , α5 , α6}和S2={β1 ,β 2, β 3 , β 4 , β 5 , β 6}表示。 这样,齐王的一个策略αi和田忌的一个策略β j就决定 了一个局势sij 。 如果α1 =(上,中,下), β 1 =(上, 中,下),则在局势s11下齐王的赢得值H1(s11)=3,田 忌的赢得值H2(s11)=﹣3。
﹣6 1 ﹣8
A=
32 4 9 ﹣2 ﹣10
求出局中人Ⅰ﹑Ⅱ的最优策略。
﹣3 0 6
例1 设有一矩阵G={S1 , S2;A},其中S1={α1,α2, α2, α4}和S2={ β 1, β 2, β 3} 局中人Ⅰ的赢得矩阵为
﹣6 1 ﹣8
A=
32 4 9 ﹣2 ﹣10
求出局中人Ⅰ﹑Ⅱ的最优策略。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵
为﹣A。
当局中人Ⅰ﹑Ⅱ和策略集S1 ﹑ S2及局中人Ⅰ的赢 得矩阵A确定后,一个矩阵对策就确定了。
通常,将矩阵对策记成G={Ⅰ,Ⅱ;S1 , S2;A} 或G={S1 , S2;A} 。
4﹒局中人如何选取对自己最有利的纯策略? ①局中人的“理智行 双方都不想冒险,都不存在侥 为幸”心:理,而是考虑到对方必然会设法使自己的所得最小,
从各自可能出现的最不利的情形中选择一种最为有利的 情形作为决策的依据。
②选择原则:局中人Ⅰ按最大最小原则,局中人Ⅱ按最
小最大原则。即局中人Ⅰ从所有最小的赢得中选择最
大的赢得的策略,局中人Ⅱ从所有最大的损失中选择 最小的损失的策略。
例1 设有一矩阵G={S1 , S2;A},其中S1={α1,α2, α2, α4}和S2={ β 1, β 2, β 3} 局中人Ⅰ的赢得矩阵为
设Ⅰ﹑Ⅱ分别表示两个局中人,且它们的纯策略
集分别为S1={α1,α2, …,αm}和S2={ β 1, β 2, …, β n}。记局
中人Ⅰ对任一纯局势( a11 a12 …a1n
αi,
β
j
)的赢得值为aij,并称
A= . . … . 为局中人Ⅰ的赢得矩阵。
am1 am2 …amn
局中人Ⅱ的赢得矩阵为﹣A。
⑷经济—各国之间,各公司企业之间的各种经济 谈判,企业之间为争夺市场而进行的竞争。
2﹒对策论
对策论是研究对策行为中斗争各方是否存在着最 合理的行动方案,以及如何找到这个合理的行动方案 的数学理论和方法。对策论也称为竞赛论或博奕论。
经典的对策论研究的例子:“齐王賽马”
战国时期,齐王有一天提出要与田忌进行賽马。 双ห้องสมุดไป่ตู้约定:从各自的上中下三个等级马中各选一匹参 赛,每匹均只能参赛一次,每次比赛双方各出一匹马, 负者要付给胜者千金。已知:在同等级的马中,田忌 的马不如齐王的马,而如果田忌的马比齐王的马高一 等级,则田忌的马可取胜。 双方如何取胜?
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
定理1的一个等价命题:
定义2 设f(x,y)为一个定义在x∈A ,y∈B上的实值 函数,如果存在x* ∈A,y* ∈B,使得对一切x∈A ,y∈B, 有f(x,y*) ≤f(x*,y*) ≤ f(x*,y) , 则称(x*,y*) 为函数f(x,y) 的一个鞍点。
定理1的等价命题:矩阵对策G在纯策略意义下有 解,且VG=ai*j*的充要条件是: ai*j*是矩阵A的一个鞍 点(也称为对策的鞍点)。
对
二人
动 策无
态
限
对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型