对策论的基本概念
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对策论(又称博弈论)就是研究对策现象的理论和方法, 它既是现代数学的一个分支,也是管理科学的一个重要部 分,而且已成为主流经济学的重要组成部分。
2
对策论的基本概念
例(市场占有):某城市东、南、西三个城区分别居住着40%, 30%,30%的居名,目前该市还没有大型仓储式超市,公司甲计划 修两个,公司乙计划修一个。
类似的,可以写出其他各种局势下的结果.
5
对策论的基本概念
甲在各局势中的市场分额
乙
1(1,0,0)
1(2,0,0)
2/3
2(0,2,0)
0.5
甲
3(0,0,2)
0.5
4(1,1,0)
0.7
5(1,0,1)
0.7
6(0,1,1)
0.6
2(0,1,0)
0.6 2/3 17/30 0.75 0.7 43/60
此时,局中人公司甲只可能以4,5作为其最优选择,局中人公司乙 只可能以1作为其最优选择,相应的可能的局势有(4,1)和(5,1)。
只有当赢得矩阵A=(aij)满足 m a ixm jinaij m jinm a ixaij 时,上面
的局势才是稳定的,此时两个居中人都不能通过单方面改变策略而受益。 所以,当对策重复进行时,居中人都会坚持使用该策略不变。这种策略称 为最优纯策略,并把(4,1)和(5,1)称为对策G在纯策略意义下的解, 又称对策G的鞍点。把其值V=0.7称之为矩阵对策G={S1,S2,A}的对策值。
0.7
5(1,0,1)
0.7
6(0,1,1)
0.6
2(0,1,0)
0.6 2/3 17/30 0.75 0.7 43/60
3(0,0,1)
0.6 17/30 2/3 0.7 0.75 43/60
双方都是从采用不同的策略可能出现的最坏的结果中选
择一种最好的结果作为决策依据(从最坏处着想,去争
取最好的结果),该原则假定局中人是保守性的决策者。
10
矩阵对策的最优纯策略
设矩阵对策 G = { S1, S2, A }。当
m a ixm jinaij m jinm a ixaij 时,不存在最优纯策略。
例:设一个赢得矩阵如下:
min
59 5
A= 86 6
max 6
i
策略2
max 8 9
min 8
j
策略1
11
矩阵对策的最优纯策略
59
A=
86 当甲取策略2 ,乙取策略1时,甲实际赢得8,乙当然不满意。 此时,乙发现他选择2要好过1 。反过来,此时如果乙采取策略2, 甲发现他选择1要好过2,则赢得更多为9… 。因此,对两个局中
人甲、乙来说,没有一个双方均可接受的平衡局势,其主要原因是 甲和乙没有执行上述原则的共同基础,即:m a ixm jinaij m jinm a ixaij
注:判断局势( i*, j* ) 是否是鞍点的另外一种方法是:对任意 i和j存在 aij*ai*j*ai*j 。
பைடு நூலகம்12
矩阵对策的最优纯策略
优超原则: 假设矩阵对策 G={S1,S2,A}
A=
0.7 0.75 0.7 0.7 0.7 0.75 0.6 43/60 43/60
7
二人有限零和对策(矩阵对策)
二人有限零和对策(又称矩阵对策): 局中人为2;每个局中人的策略集的策略(也称纯策略)
数目都是有限的;每一局势(也称纯局势)的对策均有确定 的损益值,并且对同一局势的两个局中人的益损值之和为零。
9
矩阵对策的最优纯策略
矩阵A中每行的最小元素分别为0.6,0.5,0.5,0.7,0.7.0.6。
在这些最少赢得中最好的结果是0.7,故公司甲会采取策略4,或者 5,无论对手采取何策略,公司甲至少获得70%的市场分额。对于公司乙, 矩阵A中每列的最大的元素分别为其可能给自己带来的最大损失,分别为 0.7,0.75,0.75。乙会采取1策略,确保公司甲的市场分额不会超过0.7。
每个公司都知道,若在某个区内设有两个以上超市,这些超 市将分摊该区域业务;若在某个城区只有一个超市,则该超市将 独揽这个城区的业务;若在一个城区没有超市,则该城区的业务 将分摊给其他城区的超市。
每个公司都想使自己的营业额尽可能多,试分析:两个公司 的最优策略以及各应该占有多大的市场份额。
3
对策论的基本概念
1
对策论的基本概念
在第三章我们讨论了决策技术,其核心是在不确定的 自然状况下如何评价和选择方案。实际上,一个决策主体 在进行决策时,不仅要面对自然的状况,还常常要与其他 决策者发生直接的相互作用,而各决策主体的利益又往往 存在着冲突,这就形成了决策者间的竞争。这种具有冲突 特征从而具有竞争甚至斗争性质的决策现象称为对策现象。
通常将矩阵对策记为:G={S1,S2,A}
S1:甲的策略集; S2:乙的策略集;A:甲的赢得矩阵
“市场占有”是一个矩阵对策问题 基本假定:理性人、完全信息
8
矩阵对策的最优纯策略
甲在各局势中的市场分额
乙
1(1,0,0)
1(2,0,0)
2/3
2(0,2,0)
0.5
甲
3(0,0,2)
0.5
4(1,1,0)
对策模型的三个基本要素: • 1.局中人:局中人指能够选择自己的行动方案从而使自身
的利益最大化的决策主体,即有决策权的参加者。(理性) • 2.策略集:局中人选择对付其它局中人的行动方案称为策
略;某局中人的所有可能策略全体称为策略集; • 3.一局势对策的益损值:局中人各自使用一个策略就形成
了一个局势,局中人各选择一个特定的策略所形成的局势 下局中人得到的收益称为益损值。
3(0,0,1)
0.6 17/30 2/3 0.7 0.75 43/60
甲:行局中人;乙:列局中人
6
对策论的基本概念
其中:公司甲的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 公司乙的策略集:S2={ 1, 2, 3}。
下面矩阵称公司甲的赢得矩阵:
2/3 0.6 0.6 0.5 2/3 17/30 0.5 17/30 2/3
甲方赢得矩阵 A=[ a ij ]m n 若存在两行(列),s行(列)的各元素均优于t行(列)的元素,
4
对策论的基本概念
数据: 当甲公司决定只在东城区修建两个超市,且乙公司也决定在
东城区修建一个超市时,甲公司的市场占有率为:
4% 023% 023% 022
3
3
33
此时乙公司的市场占有率为1/3,若甲公司的市场占有率上
升,则乙公司的市场占有率就会下降,双方的利益是激烈对抗
的,两公司的市场占有率总和在任何情况下都为“1”.
2
对策论的基本概念
例(市场占有):某城市东、南、西三个城区分别居住着40%, 30%,30%的居名,目前该市还没有大型仓储式超市,公司甲计划 修两个,公司乙计划修一个。
类似的,可以写出其他各种局势下的结果.
5
对策论的基本概念
甲在各局势中的市场分额
乙
1(1,0,0)
1(2,0,0)
2/3
2(0,2,0)
0.5
甲
3(0,0,2)
0.5
4(1,1,0)
0.7
5(1,0,1)
0.7
6(0,1,1)
0.6
2(0,1,0)
0.6 2/3 17/30 0.75 0.7 43/60
此时,局中人公司甲只可能以4,5作为其最优选择,局中人公司乙 只可能以1作为其最优选择,相应的可能的局势有(4,1)和(5,1)。
只有当赢得矩阵A=(aij)满足 m a ixm jinaij m jinm a ixaij 时,上面
的局势才是稳定的,此时两个居中人都不能通过单方面改变策略而受益。 所以,当对策重复进行时,居中人都会坚持使用该策略不变。这种策略称 为最优纯策略,并把(4,1)和(5,1)称为对策G在纯策略意义下的解, 又称对策G的鞍点。把其值V=0.7称之为矩阵对策G={S1,S2,A}的对策值。
0.7
5(1,0,1)
0.7
6(0,1,1)
0.6
2(0,1,0)
0.6 2/3 17/30 0.75 0.7 43/60
3(0,0,1)
0.6 17/30 2/3 0.7 0.75 43/60
双方都是从采用不同的策略可能出现的最坏的结果中选
择一种最好的结果作为决策依据(从最坏处着想,去争
取最好的结果),该原则假定局中人是保守性的决策者。
10
矩阵对策的最优纯策略
设矩阵对策 G = { S1, S2, A }。当
m a ixm jinaij m jinm a ixaij 时,不存在最优纯策略。
例:设一个赢得矩阵如下:
min
59 5
A= 86 6
max 6
i
策略2
max 8 9
min 8
j
策略1
11
矩阵对策的最优纯策略
59
A=
86 当甲取策略2 ,乙取策略1时,甲实际赢得8,乙当然不满意。 此时,乙发现他选择2要好过1 。反过来,此时如果乙采取策略2, 甲发现他选择1要好过2,则赢得更多为9… 。因此,对两个局中
人甲、乙来说,没有一个双方均可接受的平衡局势,其主要原因是 甲和乙没有执行上述原则的共同基础,即:m a ixm jinaij m jinm a ixaij
注:判断局势( i*, j* ) 是否是鞍点的另外一种方法是:对任意 i和j存在 aij*ai*j*ai*j 。
பைடு நூலகம்12
矩阵对策的最优纯策略
优超原则: 假设矩阵对策 G={S1,S2,A}
A=
0.7 0.75 0.7 0.7 0.7 0.75 0.6 43/60 43/60
7
二人有限零和对策(矩阵对策)
二人有限零和对策(又称矩阵对策): 局中人为2;每个局中人的策略集的策略(也称纯策略)
数目都是有限的;每一局势(也称纯局势)的对策均有确定 的损益值,并且对同一局势的两个局中人的益损值之和为零。
9
矩阵对策的最优纯策略
矩阵A中每行的最小元素分别为0.6,0.5,0.5,0.7,0.7.0.6。
在这些最少赢得中最好的结果是0.7,故公司甲会采取策略4,或者 5,无论对手采取何策略,公司甲至少获得70%的市场分额。对于公司乙, 矩阵A中每列的最大的元素分别为其可能给自己带来的最大损失,分别为 0.7,0.75,0.75。乙会采取1策略,确保公司甲的市场分额不会超过0.7。
每个公司都知道,若在某个区内设有两个以上超市,这些超 市将分摊该区域业务;若在某个城区只有一个超市,则该超市将 独揽这个城区的业务;若在一个城区没有超市,则该城区的业务 将分摊给其他城区的超市。
每个公司都想使自己的营业额尽可能多,试分析:两个公司 的最优策略以及各应该占有多大的市场份额。
3
对策论的基本概念
1
对策论的基本概念
在第三章我们讨论了决策技术,其核心是在不确定的 自然状况下如何评价和选择方案。实际上,一个决策主体 在进行决策时,不仅要面对自然的状况,还常常要与其他 决策者发生直接的相互作用,而各决策主体的利益又往往 存在着冲突,这就形成了决策者间的竞争。这种具有冲突 特征从而具有竞争甚至斗争性质的决策现象称为对策现象。
通常将矩阵对策记为:G={S1,S2,A}
S1:甲的策略集; S2:乙的策略集;A:甲的赢得矩阵
“市场占有”是一个矩阵对策问题 基本假定:理性人、完全信息
8
矩阵对策的最优纯策略
甲在各局势中的市场分额
乙
1(1,0,0)
1(2,0,0)
2/3
2(0,2,0)
0.5
甲
3(0,0,2)
0.5
4(1,1,0)
对策模型的三个基本要素: • 1.局中人:局中人指能够选择自己的行动方案从而使自身
的利益最大化的决策主体,即有决策权的参加者。(理性) • 2.策略集:局中人选择对付其它局中人的行动方案称为策
略;某局中人的所有可能策略全体称为策略集; • 3.一局势对策的益损值:局中人各自使用一个策略就形成
了一个局势,局中人各选择一个特定的策略所形成的局势 下局中人得到的收益称为益损值。
3(0,0,1)
0.6 17/30 2/3 0.7 0.75 43/60
甲:行局中人;乙:列局中人
6
对策论的基本概念
其中:公司甲的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 公司乙的策略集:S2={ 1, 2, 3}。
下面矩阵称公司甲的赢得矩阵:
2/3 0.6 0.6 0.5 2/3 17/30 0.5 17/30 2/3
甲方赢得矩阵 A=[ a ij ]m n 若存在两行(列),s行(列)的各元素均优于t行(列)的元素,
4
对策论的基本概念
数据: 当甲公司决定只在东城区修建两个超市,且乙公司也决定在
东城区修建一个超市时,甲公司的市场占有率为:
4% 023% 023% 022
3
3
33
此时乙公司的市场占有率为1/3,若甲公司的市场占有率上
升,则乙公司的市场占有率就会下降,双方的利益是激烈对抗
的,两公司的市场占有率总和在任何情况下都为“1”.