浙江大学数学建模第七章 对策与决策模型

合集下载

数学模型对策与决策方法建模合作效益分配模型

数学模型对策与决策方法建模合作效益分配模型
第十一章 对策与决策 方法建模
经济活动中的经营、军事对抗中的谋略、 政治和外交活动中的联合、对立等诸多方面都 和选择恰当的对策有关。20世纪四五十年代由 冯.诺依曼和摩根斯坦合作创立的对策论(又称 博弈论)研究了一系列对策问题。在本章中我 们简单地介绍常见的模型——合作效益分配、 矩阵对策(二人零和对策)、混合策略对策。
在处理生活和工作中一件事的时候,常常 面临几种情况,有几种方案可供选择,这时应 该采取科学的方法和手段,从多个可行方案中 选择一个最优的,这就是决策问题。本章简单 介绍决策方法中的层次分析法、不确定型决策 和决策树法。

数学建模案例分析--对策与决策方法建模3混合策略对策模型

数学建模案例分析--对策与决策方法建模3混合策略对策模型

§3 混合策略对策模型并不是所有的矩阵对策在纯策略意义下都有解,即有鞍点。

例如:两家电视台各种节目搭配时的甲台节目收视率如下表:表1 甲台节目收视率(%)乙台节目1节目2甲台节目A7040节目B4555用上述方法对此例进行计算,得到表格如下:表2 基于甲台节目收视率的双方对策分析表(%)乙台节目1节目2 a = 45甲台节目A704040节目B455545 b = 557055a≠b由表中可知,a≠b。

如果甲台播放节目A,以期得到70%的收视率,此时乙台一定不会播放相应对策组合(节目A,节目1)中的节目1,而是播放节目2,因为对策组合(节目A,节目2)对乙台来说,可以获得60%的收视率。

但若乙台播放节目2,甲台一定不会播放这个组合要求的节目A,必然改播节目B,因为对策组合(节目B,节目2)甲可以获得55%的收视率。

同理可以推出,若甲台播放节目B,乙台必然改播节目1,但若乙台播放节目1,甲台必然改播节目A,这样看来每对策组合都不能使双方同时满意。

这就是矩阵对策双方不存在最优纯策略的原因。

象这样的对策进行多次时,就有了混合策略的概念,即某一局中人以一定的概率随机地采用各个策略。

一般来说,在一个矩阵对策中,如果局中人甲的赢得矩阵为,则他的最优混合策略是下面线性规划问题的解。

局中人乙的最优混合策略是下面线性规划问题的解。

由线性规划理论可知,上面两个线性规划问题都有解,且其中。

记上式两端的值为,而相应的的值为,则局中人甲采用混合策略时,他可保证期望赢得至少为,而采用其它策略则期望赢得可能低于。

局中人采用混合策略时,可保证期望损失不超过,而采用其它策略则期望损失可能大于。

上例中局中人甲的策略为:以概率采用纯策略;局中人乙的策略为:以概率采用纯策略,那么局中人甲的期望赢得是其中,,。

局中人甲的最优混合策略是下面线性规划问题的解。

同样局中人乙的最优混合策略是下面线性规划问题的解。

通过数学软件,可以算出局中人甲的最优混合策略,他的期望赢得至少为0.5125,局中人乙的最优混合策略,他的损失期望不超过0.5125。

《对策与决策模型》课件

《对策与决策模型》课件
运用两种模型进行分析
使用对策模型和决策模型,分别对该案例进行深入分析和评估。
分析结果和结论讨论
讨论对策模型和决策模型在案例分析中得出的结果和结论,并分享观点和见解。
总结和反思
1 两种模型的优劣
总结对策模型和决策模型 的优劣之处,以及它们在 不同情境下的适用性。
2 课程内容和收获
回顾本次课程的主要内容 和学习收获,以及如何将 理论知识应用于实践。
3 需要改进和学习的方

指出学生在进一步学习和 实践中需要改进和学习的 方向,激发学生对策略和 决策的兴趣。
结束语
主要目标和达成情况
概括本次课程的主要目标和学生的学习情况,评估 达成情况。
加强学习和实践
鼓励学生继续加强对策略和决策的学习和实践,以 提高管理和决策能力。
《对策与决策模型》PPT 课件
本课程旨在介绍对策与决策模型,以及它们在战略规划和决策制定中的重要 性。通过本课程,您将学习如何应用这些模型来解决各种组织和管理挑战。
概述
策略与决策的定义
解释策略和决策的概念以及 它们在组织中的作用。
策略和决策的区别
探讨策略和决策之间的异同 以及它们在不同情境下的应 用。
决策模型
决策模型的基本概念
介绍决策模型的核心概念,包括 信息收集、分析、评估和选择最 佳方案。
决策模型的四个要素
解释决策模型的四个重要要素, 包括问题定义、决策条件、选择 方法和风险评估。
决策模型的应用示例
通过实际案例,展示如何运用决 策模型来做出明智的决策。
实际案例分析
提供一个实际案例
选择一个与战略决策相关的实际案例,为后续分析做准备。
策略与决策的重要性
阐述策略和决策对组织成功 的重要性,并解释为什么它 们需要系统化的模型。

数学建模 对策与决策模型共25页

数学建模 对策与决策模型共25页
谢谢!
数学建模 对策与决策模型
16、自己选择的路、跪着也要把它走 完。 17、一般情况下)不想三年以后的事, 只想现 在的事 。现在 有成就 ,以后 才能更 辉煌。
18、敢于向黑暗宣战的人,心里必须 充满光 明。 19、学习的关键--重复。
20、懦弱的人只会裹足不前,莽撞的 人只能 引为烧 身,只 有真正 勇敢的 人才能 所,也会招来人们的反感轻蔑和嫉妒。——培根 22、业精于勤,荒于嬉;行成于思,毁于随。——韩愈
23、一切节省,归根到底都归结为时间的节省。——马克思 24、意志命运往往背道而驰,决心到最后会全部推倒。——莎士比亚
25、学习是劳动,是充满思想的劳动。——乌申斯基

数学建模案例分析--对策与决策方法建模5不确定型决策

数学建模案例分析--对策与决策方法建模5不确定型决策

§5 不确定型决策在具有多个自然状态的决策问题中,如果决策者无法获得各种自然状态在未来发展的可能性信息,那么这类问题就属于不确定型决策。

这种情况下,决策者有时只能凭主观倾向进行决策。

例如,水果商对于购进水果的品种与数量常常会感到头疼,尤其是在夏季,水果批发的风险更大。

以西瓜为例,不同的气温不仅会影响其销售量,而且还会影响其价格。

因此,水果商在进货时必须面对的一个问题就是西瓜的购进量多少时最为合理。

对于这种问题,未来的情况是未知的,具有较大的不确定性。

假设水果商无法预知各种气温出现的概率,决策表如下:一、乐观(Max Max)准则乐观准则是指决策者所持的态度是乐观的,不放弃任何一个可能获得最好结果的机会,充满着乐观冒险精神,争取各方案最大收益值中的最大值。

决策的一般步骤为:(1)从决策表中选出各方案的收益的最大值。

(2)在这些选出的收益最大值中,再一次选出最大值。

该最大值所对应的方案就是乐观型决策者所认为的最优方案。

例如,在上述问题中,(1)选出各方案的最大收益值:方案一:Max(600,800,800)=800(元)方案二:Max(150,2000,2000)=2000(元)方案三:Max(-300,1550,3200)=3200(元)(2)选出上面三个值中的最大值:Max(800,2000,3200)=3200(元)它所对应的方案三,即购进西瓜8000公斤为最优方案。

通常情况下,当投资者拥有较强的经济实力,且即使最坏的状态发生也不会对他产生较大的影响时,可以采用乐观准则进行决策。

二、等可能性(Laplace)准则当决策者面临着几种自然状态可能发生时,在没有确切理由说明某一自然状态有更多的发生机会时,那么只能认为各种自然状态发生的机会是均等的。

决策的一般步骤为:(1)计算各方案的收益平均值:平均值=该方案在各种自然状态下收益值的和/自然状态数(2)在这些收益平均值中选出最大者,并以它对应的方案为最优方案。

数学建模案例分析--对策与决策方法建模6决策树法

数学建模案例分析--对策与决策方法建模6决策树法

§6 决策树法对较为复杂的决策问题,特别是需要做多个阶段决策的问题,最常用的方法是决策树法。

决策树法是把某个决策问题未来发展情况的可能性和可能结果所做的预测用树状图画出来。

其步骤如下:1、用方框表示决策点。

从决策点画出若干条直线或折线,每条线代表一个行动方案,这样的直线或折线称为方案枝。

2、在各方案枝的末端画一个园圈,称为状态点,从状态点引出若干直线或折线,每条线表示一个状态,在线的旁边标出每个状态的概率,称为概率枝。

3、把各方案在各个状态下的损益期望值算出标记在概率枝的末端。

4、把计算得到的每个方案的损益期望值标在状态点上,然后通过比较,选出损益期望值最小的方案为最优方案。

例1某厂准备生产一种新产品,产量可以在三种水平n1、n2、n3中作决策。

该产品在市场上的销售情况可分为畅销、一般和滞销三种情况,分别为S1、S2、S3。

通过调查,预测市场处于这三种情况的概率分别为0.5、0.3、0.2。

三种决策在各种不同市场情况下的利润见下表:表1 基于各种决策的各种市场情况的利润表(万元)我们可以计算每种决策下利润的期望值:实行在水平n1下生产的利润的期望值为:90×0.5+30×0.3-60×0.2=42实行在水平n2下生产的利润的期望值为:60×0.5+50×0.3-10×0.2=43实行在水平n3下生产的利润的期望值为:10×0.5+9×0.3-6×0.2=6.5由于在水平n2下生产利润的期望值最大,因而应选择产量水平n2生产。

可以应用决策树帮助解决这样的决策问题,把各种决策和情况画在图1上:图1图中的方框(□)称为决策点,圆圈(○)称为状态点,从方框出发的线段称为对策分支,表示可供选择的不同对策。

在圆圈下面的线段称为概率分支,表示在此种对策下可能出现的各种情况。

在概率分支上注明了该情况出现的概率。

在每一个概率分支的末端注明了对应对策和对应情况下的收益(利润)。

对策与决策模型

对策与决策模型

对策与决策模型策略是个人或组织用来达到特定目标的行动计划。

当面对重要决策时,采取正确的策略尤为重要。

然而,制定策略并非易事,因为决策者需要综合考虑各种因素和风险。

因此,我们需要有效的对策与决策模型来辅助我们的决策过程。

1. 定义决策模型决策模型是指用来描述和解决问题的一种逻辑框架。

它通常包括问题定义、目标设定、解决方案的生成和评估等步骤。

决策模型可以是定性的,也可以是定量的。

在制定决策模型时,需要考虑问题的复杂性、可行性以及可预测性。

2. 常见的决策模型2.1. SWOT分析模型SWOT分析模型是一种常用的对策与决策模型。

SWOT代表着公司(或个人)的优势(Strengths)、劣势(Weaknesses)、机会(Opportunities)和威胁(Threats)等方面。

通过对内部和外部环境的评估,可以制定相应的对策。

2.2. 五力模型五力模型是迈克尔·波特开发的一种对策与决策模型。

该模型通过评估竞争对手、供应商、客户、替代品和市场进入壁垒等因素,帮助企业确定竞争战略。

2.3. 敏捷决策模型敏捷决策模型是一种面向复杂和动态环境的决策模型。

该模型鼓励快速反应、多样化的方法和分阶段的决策。

通过迭代和渐进的方法,可以更好地适应不确定性和变化。

3. 决策模型的应用决策模型可以应用于各个领域,包括企业管理、市场营销、公共政策制定等。

在企业管理方面,决策模型可以帮助管理者制定战略发展计划、人员配置和资源分配等。

而在市场营销方面,决策模型可以帮助企业确定市场定位、产品定价和促销策略等。

此外,政府机构使用决策模型来制定公共政策,以最大程度地满足社会需求。

4. 决策模型的挑战与解决方案制定决策模型面临许多挑战,如信息不完整、风险评估困难和模型选择等。

为了克服这些挑战,我们可以采取以下解决方案。

4.1. 多源信息收集在制定决策模型之前,我们应该收集来源广泛的信息,以便全面评估问题和风险。

4.2. 风险分析与评估针对可能的风险,我们可以进行风险分析和评估,以确定其潜在影响和可能的解决方案。

浙大城院数学建模7电子教案

浙大城院数学建模7电子教案
第七章、对策与决策模型
前言 §7.1 对策问题 § 7.2、决策问题
/26
MCM
1
2020/4/26
前言
对策与决策是人们在日常生活和工作中经常碰 到的择优活动。人们在处理某一问题时,往往会面 临多种可能出现的情形,同时又存在多种可供选择 的行动方案,要求根据自己的行动目的从中选定一 种方案,以期获得最佳的结果。
MCM
12
2020/4/26
A、B的策略集合分别为
SA1,2,L,m 和 SB1,L,n
如果局中人A选择策略 i 而局中人B选择策略 j
则对策结果 ( i , j ) 就成为此对策的一个纯局势。
显然,策略集 S 与A S 共B 构成 mn
个纯局势,它们构成表7.3。由对策问题的全体
纯局势构成的集合 S称为此对策问题的局势集合。
MCM
5
2020/4/26
例7.2 (石头—剪刀—布)
这是一个大多数人小时候都玩过的游戏。游戏双方 每次出拳只能选石头、剪刀、布中的一种,石头赢 剪刀,剪刀赢布,而布又赢石头,赢者得一分,输 者失一分,双方相同时不得分,见下表。
表7-1
A B 石头
剪子

石头
0
1
-1
剪子
-1
0
1

1
-1
0
MCM
6
2020/4/26
MCM
4
2020/4/26
各派赛马一匹比试,每局的败者要付给胜者一千两黄 金。当时,齐王的每一等级的马都比田忌同等级的马要 强,因而,如果田忌用自己的上等马与齐王的上等马比 试,用自己的中等马与齐王的中等马比试,用自己的下 等马与齐王的下等马比试,则田忌要输三局,因而要输 掉黄金三千两。但是结果田忌并没有输,反而赢了一千 两黄金。这是因为田忌的谋士孙膑给他出了一个主意, 让他用下等马对齐王的上等马,上等马对齐王的中等马, 中等马对齐王的下等马,结果田忌二胜一败,反而赢了 一千两黄金。

对策与决策2

对策与决策2

四、决策问题
人们在处理问题时,常常会面临几种可能出现的自然情况,同时又存 在着几种可供选择的行动方案。此时,需要决策者根据已知信息作决 策,即选择出最佳的行动方案,这样的问题称为决策问题。面临的几 种自然情况叫做自然状态或简称状态。状态是客观存在的,是不可控 因素。可供选择的行动方案叫做策略,这是可控因素,选择哪一方案 由决策者决定。 由前述可以看出,决策问题应包含三方面信息:状态集合 Q={ θ 1,…, θ n}、策略集合A = { α1,…, α m}及收益R = {aij},其中aij表示 如果决策者选取策略i而出现的状态为j,则决策者的收益值为aij(当aij为 负值时表示损失值)。 决策问题按自然状态的不同情况,常被分为三种类型:确定型、风险型 (或随机型)和一种可能自然状态的决策问题。 这种决策问题的结构较为简单,决策者只需 比较各种方案,确定哪一方案最优即可。
2、风险型决策问题 在风险型决策问题中存在着两种以上可能出现的 自然状态。决策者不知道究竟会出现哪一种状 态,但知道各种状态出现的概率有多大。
例 在开采石油时,会遇到是否在某处钻井的问题。尽管勘探队已作了大 量调研分析,但由于地下结构极为复杂,仍无法准确预测开采的结果, 决策者可以决定钻井,也可以决定不钻井。设根据经验和勘探资料,决 策者已掌握一定的信息并列出下表。
(2)随机误差项在不同样本点之间是独立的,不存在序列相关:
cov(ε i , ε j ) = 0, i ≠ j
(3)随机误差项与解释变量之间不相关:
cov(ε i , xij ) = 0, i = 1,
, n; j = 1,
,k
2 参数的最小二乘估计
ˆ ˆ 求 (b0 , b1 , ˆ , bk ) , 使得如下函数最小:

数学建模对策与决策模型选读

数学建模对策与决策模型选读

数学建模对策与决策模型选读
数学建模作为一种应用数学方法,可以在现实生活中的问题中提供解决方案和决策支持。

在实际应用中会遇到许多问题,需要我们考虑如何制定对策和选择适当的决策模型。

本文将从两个方面探讨如何制定对策和选择决策模型,以应对常见的数学建模问题。

制定对策
在进行数学建模之前,我们需要对问题进行分析和思考,以制定最合适的对策。

以下是一些有效的对策制定方法:
1. 细化问题:将问题分解成更小的部分,以便更清楚地了解每个部分的特点和难点,并通过分解解决问题。

2. 选择适当的方法:确定问题的类型,选择最适合的方法进行分析和解决问题。

有时我们需要多种分析方法的结合,才能得到最完整的解决方案。

3. 学习和借鉴:学习和借鉴已经解决的类似问题的经验,以便在解决新问题时能够更快地找到合适的对策和模型。

选择决策模型
决策模型是指用来作出决策的数学模型。

选择适当的决策模型对解决问题至关重要。

以下是一些选择决策模型的方法:
1. 确定目标:首先明确决策的目标,并对各个因素进行排除和优化,以便选择适当的决策模型。

1。

数学建模对策与决策模型选读考核试卷

数学建模对策与决策模型选读考核试卷
B.库存控制模型
C.采购模型
D.生产计划模型
27.在数学建模中,下列哪种方法用于求解微分方程()
A.迭代法
B.拉格朗日乘数法
C.牛顿法
D.欧拉法
28.以下哪种模型适用于处理市场分析问题()
A.消费者行为模型
B.市场份额模型
C.营销组合模型
D.市场预测模型
29.在项目管理中,下列哪种方法用于确定项目风险()
|------|--------------|--------------|
|线路1 | 30 | 120 |
|线路2 | 25 | 110 |
|线路3 | 20 | 100 |
为了提高效率,公共交通部门计划调整发车次数,并希望找到一种方案,使得所有线路的乘客满意度至少达到85%,同时总运营成本最小化。假设每条线路每次发车的运营成本相同,乘客满意度与实际发车次数成正比。请设计一个数学模型来解决这个问题,并说明如何求解。
13.项目管理中的关键路径法(CPM)是一种_______方法。
14.在供应链管理中,_______是核心环节之一。
15.数学建模中,常用的模型求解方法有_______、_______和_______。
16.在进行市场分析时,常用的预测方法包括_______和_______。
17.项目风险管理中的风险应对策略包括_______、_______和_______。
1.数学建模的主要目的是()
A.提高数学水平
B.解决实际问题
C.学习数学理论
D.培养计算机技能
2.以下哪项不是数学建模的基本步骤()
A.提出问题
B.收集数据
C.建立模型
D.模型验证
3.在线性规划模型中,决策变量代表()

数学建模案例分析--对策与决策方法建模1合作效益分配模型

数学建模案例分析--对策与决策方法建模1合作效益分配模型

第十一章 对策与决策方法建模经济活动中的经营、军事对抗中的谋略、政治和外交活动中的联合、对立等诸多方面都和选择恰当的对策有关。

20世纪四五十年代由冯.诺依曼和摩根斯坦合作创立的对策论(又称博弈论)研究了一系列对策问题。

在本章中我们简单地介绍常见的模型——合作效益分配、矩阵对策(二人零和对策)、混合策略对策。

在处理生活和工作中一件事的时候,常常面临几种情况,有几种方案可供选择,这时应该采取科学的方法和手段,从多个可行方案中选择一个最优的,这就是决策问题。

本章简单介绍决策方法中的层次分析法、不确定型决策和决策树法。

§1 合作效益分配模型n 个独立决策人在事件上进行合作,显然能产生效益是合作的必要前提,可能不同的合作人会追求不同的效益。

下面考虑一种合作问题:合作产生了每个决策人都是惟一追求的效益,而且这种效益在合作后需在合作者中间进行分配,显然公平的分配是重要的。

那么,怎样的分配机制才是公平的呢?先来看下面一个具体的例子。

沿河有三个城镇1,2,3,其地理位置如下图所示。

这三个城镇的污水需经处理后方可排入河水,用Q 表示污水量(吨/秒),L 表示管道长度(公里),按经验,建污水处理厂的费用为712.01730Q P =(万元)。

铺设管道的费用为L Q P 51.026.6=(万元),已知三城镇的污水量分别是51=Q ,32=Q ,53=Q ,L 的数值如图。

三城镇既可以单独建污水处理厂,也可以联合建厂,用管道送污水集中处理只能由河流的上游城镇向下游城镇输送。

现要从节约总投资的角度出发,给出一种最优的污水处理方案。

1Q 2Q 3Q河→记i C —城镇i 单独建厂费用)3,2,1(=i ,由712.0730ii Q C =计算出23001=C (万元),16002=C (万元),23003=C (万元) 记ij C —城镇j i ,合作在j 建厂,从i 到j 铺管道的费用 )3,2,1,,(=<j i j i 。

【精选】浙江大学数学建模精品课程0114

【精选】浙江大学数学建模精品课程0114

数学建模概论浙江大学数学建模实践基地§1.1数学模型与数学建模数学模型(Mathematical Model)是用数学符号、数学式子、程序、图形等对实际课题本质属性的抽象而又简洁的刻划,它或能解释某些客观现象,或能预测未来的发展规律,或能为控制某一现象的发展提供某种意义下的最优策略或较好策略。

数学建模(Mathematical Modeling)应用知识从实际课题中抽象、提炼出数学模型的过程。

例(万有引力定律的发现 )十五世纪中期 ,哥白尼 提出了震惊世界的 日心说。

丹麦著名的实验天文学 家第谷花了二十多年时间 观察纪录下了当 时已发现的五大 行星的运动情况 。

第谷的学生和助手 开普勒对这些资料进行了九年时间的分 析计算后 得出著名的Kepler 三定律。

牛顿根据开普勒三定律和牛顿第二定律,利用微积分方法推导出牛顿第三定律即 万有引力定律。

1.行星轨道是一 个椭圆,太太阳位于此椭圆的一个焦 点上。

2.行星在单位时间内 扫过的 面积不变。

3.行星运行周期的平方正比 于椭圆长半轴的三次方 , 比例系数不随行星而 改变 (绝对常数) 开普勒三大定律这其中必 定是某一 力学 规律 的反映,哼哼,我要找出它。

如图,有椭圆方程 :θcos 1e pr -=θd r dA 221=矢径所扫过的面 积A 的微分为: 由开普勒第二定 律:==w r dt dA 221常数 立即得出: ∙∙+==wr w r r w r dt d 222)(0即:2=+∙∙w r w r 椭圆面积 wT r dt dt dA ab T2021==⎰π由此得出 ==Tab w r π22常数简单推导如下:行星rθ太阳我们还需算出行星的加速度,为此需要建立 两种 不同的坐标架。

第一个是固定的,以太阳为坐标原点,沿长轴方向的单位向量记 为i ,沿短轴方向的单位向量记 为j ,于是:ji r θθsin r cos r +=进而有 加速度·cos sin )(2(sin )(cos ()sin r (dtd)cos r (dt d 22222))j i j i ji r a θθθθθθ+-+++-=+==∙∙∙∙∙∙w r w r rw r 以行星为坐标原点建立活动架标,其两个正交的单位向量分别是j i e j i e θθθθcos sin sin cos +-=+=θr , 因此得出rrw r e a )(2-=∙∙由于 02=+∙∙w r w r也就是说行星的加速度为rrT a e a 223214∙-=π由开普勒第三定律知 23/T a 为常数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章 对策与决策模型
浙江大学数学建模基地
第八章 对策与决策模型
对策与决策是人们生活和工作中经常会遇到的择优活动。 人们在处理一个问题时,往往会面临几种情况,同时又存在 几种可行方案可供选择,要求根据自己的行动目的选定一种 方案,以期获得最佳的结果。
有时,人们面临的问题具有竞争性质,如商业上的竞争、 体育中的比赛和军事行动、政治派别的斗争等等。这时竞争 双方或各方都要发挥自己的优势,使己方获得最好结果。因 而双方或各方都要根据不同情况、不同对手做出自己的决择, 此时的决策称为对策。在有些情况下,如果我们把可能出现 的若干种情况也看作是竞争对手可采取的几种策略,那么也 可以把决策问题当作对策问题来求解。
(2)策略集合。局中人能采取的可行方案称为策略,每一 局中人可采取的全部策略称为此局中人的策略集合。对策问 题中,对应于每一局中人存在着一个策略集合,而每一策略 集合中至少要有两个策略,否则该局中人可从此对策问题中 删去,因为对他来讲,不存在选择策略的余地。应当注意的 是,所谓策略是指在整个竞争过程中对付他方的完整方法, 并非指竞争过程中某步所采取的具体局部办法。例如下棋中 的某步只能看和一个完整策略的组成部分,而不能看成一个 完整的策略。当然,有时可将它看成一个多阶段对策中的子 对策。策略集合可以是有限集也可以是无限集。策略集为有 限集时称为有限对策,否则称为无限对策。
本节讨论只有两名局中人的对策问题,即两人对策,其结果可 以推广到一般的对策模型中去。对于只有两名局中人的对策问 题,其局势集合和赢得函数均可用表格表示。例如,表8.2就给 出了例8.3的局势集合和赢得函数。
二、零和对策
存在一类特殊的对策问题。在这类对策中,当纯局势确定后, A之所得恰为B之所失,或者A之所失恰为B之所得,即双方所得
则易见,( 2, 2),( 2, 4),( 4, 2),( 4, 4)均为此对策问题的解。 一般又可以证明。
定理8.3 对策问题的解具有下列性质:
(1)无差别性。若( , )与( , )同为对策G的解,则必有

(2)可交换性。若( , j1)、( , j2)均为对策G的解,
则( , j2)和( , j1)也必为G的解。
定理8.4 (Von Neumann)任意混合策略对策问题必存在鞍点,即必存在概率向
量和,使得:
(证明从略)。
使用纯策略的对策问题(具有稳定解的对策问题)可以看成使用混合策略的对策 问题的特殊情况,相当于以概率1选取其中某一策略,以概率0选取其余策略。 对于双方均只有两种策略的对策问题(即2×2对策),可按几何方法求解。
给定一个两人对策只需给出局中人A、B的策略集合SA、SB 及表示双方赢得值的赢得矩阵R。综上所述,当遇到零和对 策或可转化为零和对策的问题时,R可用通常意义下的矩阵 表示,否则R的元素为一两维矢量。
故两人对策G又可称为矩阵对策并可简记成 G = { SA, SB, R }
例8.4 给定G = { SA, SB, R},其中SA = { 1, 2, 3},SB = { 1, 2, 3, 4}
局中人B 2
(1, 9) (9, 1) (6, 4) (4, 6)
3 (7, 3) (3, 7) (8, 2) (6, 4)
在有些两人对策的赢得表中,A之所得并非明显为B之所失,但 双方赢得数之和为一常数。例如在表8.4中,无论A、B怎样选 取策略,双方赢得总和均为10,此时,若将各人赢得数减去两 人的平均赢得数,即可将赢得表化为零和赢得表。表8.4中的 对策在转化为零和对策后,具有赢得矩阵
1
2

A 1 ( 1, 1) ( 1, 2) …
的2 策
( 2, 1) ( 2, 2)

略… …


i ( i , 1) ( i, 2) ……………
m ( m, 1) ( m, 2) …
B的策略
J

( 1, j) …
( 2, j) …


( i, j) …


( m, j) …
n ( 1, n) ( 2, n) … ( i, n) … ( m, n)
从R中可以看出,若A希望获得最大赢利30,需采取策略 1,但此时若B采 取策略 4,A非但得不到30,反而会失去22。为了稳妥,双方都应考虑到
对方有使自己损失最大的动机,在最坏的可能中争取最好的结果。局中人
A采取策略 1、 2、 3时,最坏的赢得结果分别为
min { 12, -6, 30, -22 } = -22 min { 14, 2, 18, 10} =2 min {-6, 0, -10, 16} = -10

则必有μ+ν≤0
证明 :

易见μ为A的最小赢得,ν为B的最小赢得,
由于G是零和对策,故μ+ν≤0必成立。
定理8.2 零和对策G具有稳定解的充要条件为μ+ν= 0。
证明:
(充分性) 由μ和ν的定义可知,存在一行(例如p行)μ 为p行中的最小元素且存在一列(例如q列),-ν为q列中的
最大元素。故有
apq≥μ且apq≤-ν
其中最好的可能为max {-22,2,-10}=2。如果A采取策略 2,无论B采 取什么策略,A的赢得均不会少于2.
B采取各方案的最大损失为max {12,14, -6}=14,max {-6,2,0}=2,max {30,18, -10}=30和max {-22,10,16} =16。当B采取策略 2时,其损失
)使得
,则称( 对应的元素 优策略。
)为对策G的鞍点或稳定解,赢得矩阵中与(
)相
称为赢得矩阵的鞍点, 与 分别称为局中人A与B的最
对(8.1)式中的赢得矩阵,容易发现不存在具有上述性质的鞍点。给定
一个对策G,如何判断它是否具有鞍点呢?为了回答这一问题,先引入下
面的极大极小原理。
定理8.1 设G = { SA, SB, R }, 记
(1)局中人。参加决策的各方被称为决策问题的局中人,一 个决策总是可以包含两名局中人(如棋类比赛、人与大自然 作斗争等),也可以包含多于两名局中人(如大多数商业中 的竞争、政治派别间的斗争)。局中人必须要拥用可供其选 择并影响最终结局的策略,在例8.3中,局中人是A、B两名疑 犯,警方不是局中人。两名疑犯最终如何判刑取决于他们各 自采取的态度,警方不能为他们做出选择。
2,又会使A输掉4,……。此时,在只使用纯策略的范围内,对策问题 无解。这类决策如果只进行一次,局中人除了碰运气以外别无办法。但
如果这类决策要反复进行多次,则局中人固定采用一种策略显然是不明
智的,因为一旦对手看出你会采用什么策略,他将会选用对自己最为有
利的策略。这时,局中人均应根据某种概率来选用各种策略,即采用混
不会超过2。注意到在赢得矩阵中,2既是所在行中的最小元素又是所在列 中的最大元素。此时,只要对方不改变策略,任一局中人都不可能通过变 换策略来增大赢得或减小损失,称这样的局势为对策的一个稳定点或稳定 解,(注:也被称为鞍点)
定义8.1 对于两人对策G = { SA, SB, R},若有
,则称G具有稳定解,并称VG为对策G的值。若纯局势(
记局中人i的策略集合为Si。当对策问题各方都从各自的策略 集合中选定了一个策略后,各方采取的策略全体可用一矢量S
表示,称之为一个纯局势(简称局势)。
例如,若一对策中包含A、B两名局中人,其策略集合分别为
SA = { 1,…, m},SB = { 1,…, n}。若A选择策略 i而B选策 略 j,则( i, j)就构成此对策的一个纯局势。显然,SA与 SB一共可构成m×n个纯局势,它们构成表8.3。对策问题的全 体纯局势构成的集合S称为此对策问题的局势集合。
合策略的办法,使自己的期望收益尽可能大。
设A方用概率xi选用策略 i,B方用概率yj选用策略 j,

且双方每次选用什么策略是随机的,不能让对方看出规律,
记X = (x1, …,xm)T,Y = (y1, …,yn)T,则A的期望赢得为 E ( X,Y) = XTRY
其中,R为A方的赢得矩阵。记
策略 α1,…, αm SA:
§8.1 对策问题
对策问题的特征是参与者为利益相互冲突的各方,其结局 不取决于其中任意一方的努力而是各方所采取的策略的综合 结果。
先考察几个实际例子。
例8.1 (田忌赛马)
田忌赛马是大多数人都熟知的故事,传说战国时期齐王欲与 大将田忌赛马,双方约定每人挑选上、中、下三个等级的马 各一匹进行比赛,每局赌金为一千金。齐王同等级的马均比 田忌的马略胜一筹,似乎必胜无疑。田忌的朋友孙膑给他出 了一个主意,让他用下等马比齐王的上等马,上等马对齐王 的中等马,中等马对齐王的下等马,结果田忌二胜一败,反 而赢了一千金。
概率 x1,…,xm
策略 β1,…, βn SB:
概率 y1,…,yn
分别称SA与SB为A方和B方的混合策略。 对于需要使用混合策略的对策问题,也有具有稳定解的对策问题的类似结果。
定义8.2 若存在m维概率向量和n维概率向量,使得对一切m维概率向量X和n 维概率向量y有
则称( , )为混合策略对策问题的鞍点。
又因μ+ν= 0,所以μ=-ν,从而得出apq=μ,apq为赢得矩阵 的鞍点,( p, q)为G的稳定解。
(必要性)若G具有稳定解( p , q ),则apq为赢得矩阵的鞍点。故有
从而可得μ+ν≥0,但根据定理8.1,μ+ν≤0必成立,故必有μ+ν=0。
上述定理给出了对策问题有稳定解(简称为解)的充要条件。当对策问 题有解时,其解可以不唯一。例如,若
之和总为零。在零和对策中,因F1(s)= -F2(s),只需指出其
中一人的赢得值即可,故赢得函数可用赢得矩阵表示。例如若
A有m种策略,B有n种策略,赢得矩阵
相关文档
最新文档