运筹学课程(决策)
合集下载
运筹学决策分析

• 选择性:从多个可行方案中选择最优方案。
• 非零起点:一般地说,组织的决策或多或少要受到 过去决策的影响,因此,大多数决策都是“非零起 点”决策。 • 预测性:决策是在事情发生之前的一种预先分析和 抉择,具有明显的预测性。 • 动态性:决策的动态性指的是决策具有一定的生命 周期。
第二节 决策的分类
第五节 风险型决策方法
23 成功(0.8) 失败 (0.2)
H
40万元
D
13
A
提出 不提出
B F
0
得到合同 (0.6) 得不到 (0.4)
23
旧方法
I-45万元 J
50万元
C
新方法
7.5 成功(0.5)
G
-2万元
E
(0.5)
失败
K-35万元
由多级决策树图可以看出:提出建议可获益损值 为13万元,如果不提出,益损值为0。结论:应提出建 议。
该问题属于不确定型决策问题,常用的决策准 则包括:最大最小准则、最大最大准则、最小最大后 悔值准则等。
第四节 不确定型决策方法
1.最大最小决策准则
自然状态 方案 方案1 方案2 方案3 畅销(万元) 300 一般 (万 最小收益 滞销(万元) 元) 值 150 -200 -200
200 150
100 50
最大最大决策准则
从表中看出,此时本例的最优方案为方案1。
第四节 不确定型决策方法
3.赫威斯决策准则
自然状态 方案 方案1 方案2 方案3 畅销 (万元 ) 300 200 150 一般 (万元 ) 150 100 50 滞销 (万元 ) -200 -50 10 最大收 最小收 益值 益值 300 200 150 -200 -50 10 折衷收 益值 150 125 108
运筹学决策论

开始结点:应是决策结点 终止:后果 一个简单的决策树
概率枝 状态点
带雨伞 =0.62 不下雨 0.6 下雨 0.4 0.5 下雨 0.4 0.8
后果
0.6
决策点
不带雨伞 0.42 不下雨 0.6 0.3
方案枝
状态点后可 以接方案点
试验
出油 0.85 好 0.6 钻井 不出油 0.15 不钻 井 出油 0.6 不好 0.4 钻井 不出油 0.4 不钻 井
θ1 U11 U21 U31 ┆
θ2 U12 U22 U32 ┆
θ3 U13 U23 U33 ┆
θ4 U14 U24 U34 ┆
┈ ┈ ┈ ┈
该后果相对于决策者的效用,无 量钢,0~1之间的数,U=U (X)——称为效用函数,具体 如何获得决策者的效用函数,后 面章节将具体介绍
状态
行动
A1 A2 A3 ┆
决策是社会科学中用来描述人类进行选择的过程的 术语; 决策是指考虑策略(或方法)来解决目前或未来问 题的智力活动
通过以上定义可以看出:决策是一种有目的的选择行 动,它以人的主观价值判断为依据
决策理论最早与对策一同发展,当前区分依赖于: 对策-多个人之间或人和人之间的决策 决策-人与环境之间对策
不试验 钻井
出油 0.4
不出油 0.6
方案点后可 以接方案点
不钻 井
悲观主义决策准则 乐观主义决策准则 等可能性(Laplace)准则 最小机会损失(最小后悔值、Savage)准则 折中主义准则
§ 6 随机型(风险型)决策准则
6.1随机型决策问题的基本条件和准则
随机性决策问题的基本条件
策 略
运筹学第16章 决策分析

S2
25
10
5
S3
50
0
-40补11充源自§1 不确定情况下的决策 • 解:(1)最大最小准则
投资方案
S1 S2 S3
不同经济形势
好 一般 差
10
0
-1
25
10
5
50
0
-40
• 因此,最优方案为:S2。
min aij
-1 5(max)
-40
补12充
§1 不确定情况下的决策
• (2)后悔值准则:
– 由已知可求后悔值矩阵为:
用 E(Si )表示第I方案的收益期望值
自然状态
行动方案
S1(大批量生产) S2(中批量生产) S3(小批量生产)
N1
(需求量大)
p = 1/2
30
20
10
N2
(需求量小)
p = 1/2
-6
-2
5
收益期望值 E (Si)
12(max) 9 7.5
8
§1 不确定情况下的决策
四、乐观系数(折衷)准则
• 决策者取乐观准则和悲观准则的折衷:
第十六章 决策分析
第一节 不确定情况下的决策 第二节 风险型情况下的决策 第三节 效用理论在决策中的应用 第四节 层次分析法
1
第十六章 决策分析
“决策” 一词来源于英语 Decision making,直译为“做出决定”。所谓 决策,就是为了实现预定的目标在若 干可供选择的方案中,选出一个最佳 行动方案的过程,它是一门帮助人们 科学地决策的理论。
➢风 险 型 决 策 问 题
• 在决策环境不确定的条件下进行,决策者对各自然状态发生的概率可 以预先估计或计算出来。
第10章 (运筹学) 决策论

第10章 决策论
着各种事件的发生概率不清时,决策者考虑可能由于决策错 误而造成重大经济损失。由于自己的经济实力比较弱,他 在处理问题时就比较谨慎。他分析各种最坏的可能结果, 从中选择最好者,以它对应的策略为决策策略。用符号表 示为max-min决策准则。在收益矩阵中先从各策略所对应的 可能发生的“策略—事件”对的结果中选出最小值,将它 们列于表的最右列。再从此列的数值中选出最大值,以它 对应的策略为决策者应选的决策策略。 悲观决策准则又称小中取大的准则。该准则为: (1)根据收益矩阵A=[aij],确定每一个策略可能得到最 坏结果Mi Mi=min{ai1,ai2,…,ain},i=1,2,…,m (2)选取Sk使得Mk=max{M1,M2,…,Mm}。
第10章 决策论
相应的收益和损失值。如当选择月生产量为20件时,而销出 量为10件,这时收益额为: 10×(35-30)-1×(20-10)=40(元) 可以一一计算出各“策略—事件”对应的收益值和损失值, 记为aij,将这些数据汇总在决策矩阵中,见下表:
Ej Si 策 0 10 事 20 件 30 40
第10章 决策论
或行业负责人)要进行战略性决策,中下层管理人员(如部 门经理、计划管理人员、作业调度指挥人员等)要进行战术 性决策或技术性决策。地位越高,决策在工作中的作用就 显得越重要。决策的正确与否,对经济和让会效益影响极 大,小则影响一个企业、一个部门,大则影响整个国家和 社会的发展。 正确的决策必须建立在认识和了解问题内部关系以及环境 状况的基础上。首先,必须掌握决策对象的运动规律,占 有必要的资料和信息。其次,还要掌握辅助决策的技术和 方法,遵守必要的决策程序和步骤。 1. 决策问题的构成 为了说明决策问题的构成,我们先举一个例子。某工厂生 产的产品要销往销售地,决定自己组织运输,方案有两种: 一是增购车辆,二是租车。如果租车运输,所支付的运费 就高些,如果使用自己的车辆运输,运费就便宜些,
运筹学 -- 决策树

--2--
--第15章 决策分析--
☆决策分类: 按内容与层次:战略决策、战术决策 按重复程度:程序决策、非程序决策 按决策条件:确定型、不确定型、风险型、竞争型 按决策时间:长期决策、中期决策、短期决策 按决策目标:单目标决策、多目标决策 ※ 本章只对不确定型和风险型决策问题讨论。
99/12
--3--
4. 树梢:序贯决策引起的最后结果,以表示。
99/12
--20--
--第15章 决策分析--
决策树示例:
从事石油钻探工作的B企业与某石油公司签订了一份合 同,在一片估计含油的荒地上钻井探测储油状况。它可以采 用先做地震试验,然后决定钻井或者不钻井的方案;也可以 不用地震试验法,只凭自己的经验来决定钻井或者不钻井。 做地震试验的费用每次为3,000元,钻井的费用为10,000元。 若钻井后采出石油,则可获得40,000元的收入;若钻井后采 不出石油,那么则无任何收入。各种情况下出油的概率及有 关数据如图中所示。问企业应如何决策,可使收入的期望值 最大?
99/12 --6--
--第15章 决策分析--
一、悲观主义准则 ( max--min)
决策依据:从决策的最坏结果考虑,取其中结果相对较好 者,即对各种决策最坏可能的结果分析,判别方案的优劣, 通常以 max {min (aij) } 来表示。
i j
aij -------第i种方案第j种需求下收益值 悲观主义决策属于保守型决策,或称谨慎型决策, 其 处事的原则是“未思进,先思退”。
事件 决策 0 产 1000 2000 量 3000 4000 0 0 -10 -20 -30 -40 1000 0 20 10 0 -10 需求量 2000 3000 0 0 20 40 30 20 20 40 60 50 4000 0 20 40 60 80 max 0 20 40 60 (80)max
运筹学 第11章-决策分析

N1(需求量大)
p(N1) = 0.3
S1(大批量生产) S2(中批量生产) S3(小批量生产) 30 20 10
N2(需求量小)
p(N2) = 0.7
-6 -2 5
2
§1 决策的基本概念与决策程序
策略 事件
N1(需求量大)
p(N1) = 0.3
30 20 10
N2(需求量小)
p(N2) = 0.7
三、等可能性准则
• 决策者把各事件的发生看成是等可能的: 则每个事件发生的概率为 1/n, n为事件数 ,然后 计算各行动方案的收益期望值。 用 E(Si)表示第i方 案收益期望值
事件 事件 策略 策略
S1(大批量生产) 1(大批量生产) S2(中批量生产) 2(中批量生产) S3(小批量生产) 3(小批量生产)
EOL(Si)
7.7 7.9 6 (min)
9
§2 风险形决策问题
四、全情报的价值(EVPI)
• 全情报:关于事件的确切消息。 • Expected Value in perfect Information是指决策人为获取全情 报,所能支付的信息费的上限。 前例,当我们不掌握全情报时S3 是最优策略,期望收益为 0.3*10 + 0.7*5 = 6.5万 记 EMV* = 6.5万 若得到全情报时:
1
2
1j2
S1(大批量生产) 30 S1(大批量生产) 10 (30-20) S2(中批量生产) 20 S2(中批量生产) 20 (30-10) S3(小批量生产) 10 S3(小批量生产)
0 (30,理想值)
11 [5-(-6)] -6 7 [5-(-2)] -2 0 (5,理想值)
5
11 10 (min) 20
p(N1) = 0.3
S1(大批量生产) S2(中批量生产) S3(小批量生产) 30 20 10
N2(需求量小)
p(N2) = 0.7
-6 -2 5
2
§1 决策的基本概念与决策程序
策略 事件
N1(需求量大)
p(N1) = 0.3
30 20 10
N2(需求量小)
p(N2) = 0.7
三、等可能性准则
• 决策者把各事件的发生看成是等可能的: 则每个事件发生的概率为 1/n, n为事件数 ,然后 计算各行动方案的收益期望值。 用 E(Si)表示第i方 案收益期望值
事件 事件 策略 策略
S1(大批量生产) 1(大批量生产) S2(中批量生产) 2(中批量生产) S3(小批量生产) 3(小批量生产)
EOL(Si)
7.7 7.9 6 (min)
9
§2 风险形决策问题
四、全情报的价值(EVPI)
• 全情报:关于事件的确切消息。 • Expected Value in perfect Information是指决策人为获取全情 报,所能支付的信息费的上限。 前例,当我们不掌握全情报时S3 是最优策略,期望收益为 0.3*10 + 0.7*5 = 6.5万 记 EMV* = 6.5万 若得到全情报时:
1
2
1j2
S1(大批量生产) 30 S1(大批量生产) 10 (30-20) S2(中批量生产) 20 S2(中批量生产) 20 (30-10) S3(小批量生产) 10 S3(小批量生产)
0 (30,理想值)
11 [5-(-6)] -6 7 [5-(-2)] -2 0 (5,理想值)
5
11 10 (min) 20
运筹学课件决策分析

步骤如下:
决策者从最不利的角度考虑问题,再从中选择其中最好的。
先选出每个方案在不同自然状态的最小收益值; 从最小收益值中选取一个最大值,对应方案为最优方案。
例1:P371 例2:某决策相关的决策收益表如下,用最大最小准则进行决策。
例1:某公司现需对某新产品生产批量作出决策,现有三种备选方案。S1:大批量生产;S2:中批量生产;S3:小批量生产。未来市场对这种产品的需求情况有两种可能发生的自然状态:N1:需求量大;N2:需求量小。经估计,采用某一行动方案而实际发生某一自然状态时,公司的收益如下表所示,请用最大最小准则作出决策。
S1
4 5 6 7
S2
2 4 6 9
S3
5 7 3 5
S4
3 5 6 8
S5
3 5 5 5
举例:
01
例1:P373 例2:某决策相关的决策收益表如下,用乐观系数准则进行决策。
01
Nj SijSi
自然状态
max
N1 N2 N3 N4
S1
4 5 6 7
6.4
S2
2 4 6 9
Nj SijSi
自然状态
期望值
N1 N2 N3 N4
S1
4 5 6 7
5.50
S2
2 4 6 9
5.25
S3
5 7 3 5
S5
3 5 5 5
Nj SijSi
自然状态
min
N1 N2 N3 N4
S1
4 5 6 7
S2
2 4 6 9
S3
OK
7
9
7
8
5
3.等可能性准则
决策者认为各自然状态发生的概率相等。
决策者从最不利的角度考虑问题,再从中选择其中最好的。
先选出每个方案在不同自然状态的最小收益值; 从最小收益值中选取一个最大值,对应方案为最优方案。
例1:P371 例2:某决策相关的决策收益表如下,用最大最小准则进行决策。
例1:某公司现需对某新产品生产批量作出决策,现有三种备选方案。S1:大批量生产;S2:中批量生产;S3:小批量生产。未来市场对这种产品的需求情况有两种可能发生的自然状态:N1:需求量大;N2:需求量小。经估计,采用某一行动方案而实际发生某一自然状态时,公司的收益如下表所示,请用最大最小准则作出决策。
S1
4 5 6 7
S2
2 4 6 9
S3
5 7 3 5
S4
3 5 6 8
S5
3 5 5 5
举例:
01
例1:P373 例2:某决策相关的决策收益表如下,用乐观系数准则进行决策。
01
Nj SijSi
自然状态
max
N1 N2 N3 N4
S1
4 5 6 7
6.4
S2
2 4 6 9
Nj SijSi
自然状态
期望值
N1 N2 N3 N4
S1
4 5 6 7
5.50
S2
2 4 6 9
5.25
S3
5 7 3 5
S5
3 5 5 5
Nj SijSi
自然状态
min
N1 N2 N3 N4
S1
4 5 6 7
S2
2 4 6 9
S3
OK
7
9
7
8
5
3.等可能性准则
决策者认为各自然状态发生的概率相等。
《运筹学》第四章决策分析介绍

41
P(S2)=0.4时
一般: 般:
E(A1 )=α×500+(1500+(1 α)(-200)=700 )( 200)=700α-200 200 E(A2) )=α×( (-150)+(1150)+(1 α)(1000) )(1000)=-1150 1150α+1000 令E1 =E2 得α=0.65
决策步骤
30
(三)、折衷准则 选择加权系数α(0 α1) max{α(maxVij )+(1-α)(minVij )}
i j j
α=0.6
S1
S2
S3 Vi1 =max Vi2 =min 加权平均
A1 20 A2 9 A3 6
1 8 5
-6 0 4
20 9 6
-6 0 4
9.6 5.4 max=9.6
15
决策分析的主要内容
决策准则 决策树 用决策树分析系列决策问 用决策树分析系列决策问题 检查是否需要获得更多的信息 贝叶斯法 用更新的信息更好地决策 贝叶斯法——用更新的信息更好地决策 效用理论 用效用更好地反映收益的价值 效用理论——用效用更好地反映收益的价值
16
概率论基础
随机事件(实验,试验 实验 试验)
称α=0.65为转折概率 α>0.65 α<0.65 选 A1 选 A2
42
直接使用先验概率 决策步骤 –对于每一种备选方案,将每一个收益乘以 相应自然状态的先验概率,再把乘积相加 就得到收 的加权 均 这就是备选方案 就得到收益的加权平均,这就是备选方案 的期望收益 –选择具有最大期望收益的备选方案作为决 选择具有最大期 收益的备选方案作为决 策方案
34
P(S2)=0.4时
一般: 般:
E(A1 )=α×500+(1500+(1 α)(-200)=700 )( 200)=700α-200 200 E(A2) )=α×( (-150)+(1150)+(1 α)(1000) )(1000)=-1150 1150α+1000 令E1 =E2 得α=0.65
决策步骤
30
(三)、折衷准则 选择加权系数α(0 α1) max{α(maxVij )+(1-α)(minVij )}
i j j
α=0.6
S1
S2
S3 Vi1 =max Vi2 =min 加权平均
A1 20 A2 9 A3 6
1 8 5
-6 0 4
20 9 6
-6 0 4
9.6 5.4 max=9.6
15
决策分析的主要内容
决策准则 决策树 用决策树分析系列决策问 用决策树分析系列决策问题 检查是否需要获得更多的信息 贝叶斯法 用更新的信息更好地决策 贝叶斯法——用更新的信息更好地决策 效用理论 用效用更好地反映收益的价值 效用理论——用效用更好地反映收益的价值
16
概率论基础
随机事件(实验,试验 实验 试验)
称α=0.65为转折概率 α>0.65 α<0.65 选 A1 选 A2
42
直接使用先验概率 决策步骤 –对于每一种备选方案,将每一个收益乘以 相应自然状态的先验概率,再把乘积相加 就得到收 的加权 均 这就是备选方案 就得到收益的加权平均,这就是备选方案 的期望收益 –选择具有最大期望收益的备选方案作为决 选择具有最大期 收益的备选方案作为决 策方案
34
运筹学决策工作总结

运筹学决策工作总结
运筹学决策是指运用数学、统计学和计算机科学等方法,对复杂的问题进行分
析和优化,从而帮助企业和组织做出更加科学和合理的决策。
在过去的一段时间里,我们团队在运筹学决策工作中取得了一些成绩和经验,现在我将对这些工作进行总结。
首先,我们团队在运筹学决策工作中,运用了各种数学模型和算法,对生产、
物流、供应链等方面的问题进行了深入分析。
通过对数据的收集和分析,我们建立了相应的数学模型,利用线性规划、整数规划、动态规划等方法,对问题进行了优化和求解。
这些工作不仅提高了生产效率,降低了成本,还提升了企业的竞争力。
其次,我们团队在运筹学决策工作中,注重了与实际业务的结合。
我们深入了
解了企业的业务流程和需求,根据实际情况进行了合理的模型建立和算法选择。
我们与企业内部各部门和外部合作伙伴进行了紧密的沟通和协作,确保了决策的科学性和可行性。
最后,我们团队在运筹学决策工作中,注重了技术的创新和应用。
我们不断学
习和研究最新的运筹学理论和方法,将其应用到实际的工作中。
我们还利用计算机科学的技术,开发了一些定制化的软件工具,帮助企业进行决策分析和优化。
总的来说,我们团队在运筹学决策工作中,取得了一些成绩和经验,但也面临
了一些挑战和问题。
我们将继续努力,不断提升自己的专业水平,为企业的发展和进步做出更大的贡献。
希望通过我们的努力,能够为运筹学决策工作的发展和应用,做出更多的贡献。
运筹学 第十一章 决策分析11-5-8

7×10 × 16 销路一般0.3 销路一般 3×10 × -4×10 × 17.5 5×10 × 销路一般0.3 销路一般 2.5×10 × -2.5×10 × 16.5 销路一般0.3 销路一般 3×10 × 1.5×10 × -0.5×10 ×
17.5
扩建现车间 -10
单阶段决策和多阶段决策
追求利润最大,还是损失最小; 追求利润最大,还是损失最小; 有人敢于冒险,有人则力求稳妥。 有人敢于冒险,有人则力求稳妥。
决策的分类 按决策的层次分类: • 按决策的层次分类: 战略型决策:关于全局、影响深远的决策。 战略型决策:关于全局、影响深远的决策。 战术型决策:短期的具体的决策。 战术型决策:短期的具体的决策。 • 按决策出现的频率划分: 按决策出现的频率划分: 程序决策: 经常重复出现的例行决策活动。 程序决策: 经常重复出现的例行决策活动。 非程序决策:指不经常或不重复出现的决策。 非程序决策:指不经常或不重复出现的决策。 • 按决策过程的连续性划分: 按决策过程的连续性划分: 单阶段决策:只有一个阶段。 单阶段决策:只有一个阶段。 多阶段决策:有多个阶段。 多阶段决策:有多个阶段。
实现方法: 实现方法:
表格法 决策树法
(一)、表格法 在例1中 假设已经知道市场销售情况为高、 在例 中,假设已经知道市场销售情况为高、中、低的 概率分别为0.3,0.5,0.2,问如何决策? 概率分别为 ,问如何决策?
自然状态 状态概率 方案 A1 A2 A3 S1 0.3 20 9 6 最优方案 S2 0.5 1 8 5 S3 0.2 -6 0 4 期望收益E(Ai) 期望收益
表格法
自然状态
s1
s2
…
sn
状态概率 损益值 方案
运筹学第七章 决策论

准则,公式为
i
r * min min f ( d i , s j )
j
2 悲观法(最大最小决策准则)
基本思想:悲观法也称为瓦尔德准则,决策者对客观 情况总是抱悲观态度,从各种最坏的情况出发,然后再 考虑从中选择一个最好的结果,因此叫最大最小决策准 则。计算公式为
r * max min f (di , s j )
解: 可供选择的日产量有 4 种方案: 1 = 100 件, 2 = 110 d d 件,d3 = 120 件,d4 = 130 件,利用最小机会损失决策准 则, 进行损失最小的决策。 先求各 “自然状态与方案对” 的损失值。 当日产量 d1 = 100 件时,若 s1 = 100,则损失 s1d1 = 0; 若 s2 = 110 件,s2d1 = 10,则损失 10 × 50 = 500 元; 若 s3 = 120 件,s3d1 = 20,则损失 20 × 50 = 1000 元; 若 s4 = 130 件,s4d1 = 30,则损失 30 × 50 = 1500 元。 当日产量 d2=110 件,d3=120 件,d4 = 130 件类似可以求 出损失值,得下表。
八 多目标决策的层次分析法
层次分析法(Analytic Hierarchy Process,AHP)是美国运筹 学家 T.L.Saaty 于 70 年代中期创立的一种定性与定量分析相结 合的多目标决策方法。其本质是试图使人的思维条理化、层次 化,它充分利用人的经验和判断,并予以量化,进而评价决策 方案的优劣,并排出它们间的优先顺序。由于 AHP 的应用简 单有效,特别对目标结构复杂,并且缺乏必要的数据资料的情 况(如社会经济系统的评价项目)更为实用。应用层次分析法进 行系统评价,其主要步骤: 构造多级递阶结构模型,建立比较的判断矩阵,计算相对 重要度,进行一致性检验,计算综合重要度等。
i
r * min min f ( d i , s j )
j
2 悲观法(最大最小决策准则)
基本思想:悲观法也称为瓦尔德准则,决策者对客观 情况总是抱悲观态度,从各种最坏的情况出发,然后再 考虑从中选择一个最好的结果,因此叫最大最小决策准 则。计算公式为
r * max min f (di , s j )
解: 可供选择的日产量有 4 种方案: 1 = 100 件, 2 = 110 d d 件,d3 = 120 件,d4 = 130 件,利用最小机会损失决策准 则, 进行损失最小的决策。 先求各 “自然状态与方案对” 的损失值。 当日产量 d1 = 100 件时,若 s1 = 100,则损失 s1d1 = 0; 若 s2 = 110 件,s2d1 = 10,则损失 10 × 50 = 500 元; 若 s3 = 120 件,s3d1 = 20,则损失 20 × 50 = 1000 元; 若 s4 = 130 件,s4d1 = 30,则损失 30 × 50 = 1500 元。 当日产量 d2=110 件,d3=120 件,d4 = 130 件类似可以求 出损失值,得下表。
八 多目标决策的层次分析法
层次分析法(Analytic Hierarchy Process,AHP)是美国运筹 学家 T.L.Saaty 于 70 年代中期创立的一种定性与定量分析相结 合的多目标决策方法。其本质是试图使人的思维条理化、层次 化,它充分利用人的经验和判断,并予以量化,进而评价决策 方案的优劣,并排出它们间的优先顺序。由于 AHP 的应用简 单有效,特别对目标结构复杂,并且缺乏必要的数据资料的情 况(如社会经济系统的评价项目)更为实用。应用层次分析法进 行系统评价,其主要步骤: 构造多级递阶结构模型,建立比较的判断矩阵,计算相对 重要度,进行一致性检验,计算综合重要度等。
运筹学课件之决策方法

Uij dj方案在θi状态 下产生的利润值 R(θi, dj) = Lij dj方案在θi状态 下产生的损失值
方案 利润 状态
d1
d2
……
dn
θ1
θ2 θm
P(θ1)
P(θ2) P(θm)
L11
L21 Lm1
L12
L22 Lm2
…
… …
L1n
L2n Lmn
(1)确定型决策这类决策问题只可能 出现一种确定的自然状态。每个行动 方案在这唯一自然状态下的结局是可 以计算出来的。确定型决策问题是一 种逻辑上的比较简单的决策,只需从 所有备选方案中,根据每个方案的结 局,选择出一个最好的即可。
确定型决策问题必须具备4个条件
①存在着决策者期望达到的目标; ②只存在一个确定的自然状态; ③具有两个或两个以上可供选择的行动 方案; ④不同行动方案在确定的自然状态下的 损益值可以定量地估算出来。
在实际问题中,确定型决策问题 并非像上述那样简单。尤其当行动方 案为数较多时,就很难直观地找出最 优方案,因此必须借助于优化技术求 解。
思考题:是什么因素使李维公司获 得如此巨大的成功?
结论
正确的市场决策带来了李维公司 的大发展。做好市场调查、树立牢固 的市场观念、按用户需要组织生产是 李维公司成功的关键。
在一个组织的管理岗位上,管理人 员要做出许多决策——有大的,有小 的,而且一旦决策错误,就会导致严 重的后果。著名的管理学家彼得 ·德 鲁克认为,在一个组织中,管理人员 最终做出有效的决策比什么都重要。 决策是管理活动的核心,贯穿于管理 过程的始终。
4.1.4 决策的类型
1.按决策的层次划分,可以把决策分为战略 决策、管理决策和业务决策。
•
经济学运筹学决策论

上的行动方案; (4)不同的行动方案在确定状态下的收益值
或损失值可以计算出来。
2021/3/10
15
确定型决策
例1、假定某人需要从甲地到乙地,有三个 方案:乘火车,乘船及乘飞机可供选择 如下图所示:
单位:元
方案 A1(火车) A2(船) A3(飞机)
旅费 600
450
1800
2021/3/10
16
7
2、按决策环境分类 确定型:(1)目标明确,
(2)决策环境确定, (3)存在可供选择的备选方案。 若满足(1)和(3),但是决策环境不确定 不确定型:概率未知 风险型:概率已知
2021/3/10
8Leabharlann 、某企业决定拿出500万元建立投资部,现 有三种方案可供选择
方案一:投入国债,每年稳收入25万元(假 定年利率为5%)。
决策是决策主体运用自己的知觉、记忆、 思维等认知能力,对情境做出判断和选择 的过程。
决策(Decision Making)是一种对已知目标和 方案的选择过程,是人们已知需实现的目 标,根据一定的决策准则,在供选方案中 作出决策的过程。
2021/3/10
1
国家经济管理层面的决策 利率决策 、税收决策、产业调整决策 企业管理层面的决策 新产品开发决策、生产决策、库存决策 个人决策 消费决策、投资决策(理财决策)、 选课决策(课程规划决策)
2021/3/10
2
第一节 决策分析的基本问题
一、决策分析的基本概念 1、决策 狭义:选择 广义:选择的过程:设定目标、理解问题、确
定备选方案、评估备选方案、方案实施 2、决策目标:决策者希望达到的状态
2021/3/10
3
3、决策系统
或损失值可以计算出来。
2021/3/10
15
确定型决策
例1、假定某人需要从甲地到乙地,有三个 方案:乘火车,乘船及乘飞机可供选择 如下图所示:
单位:元
方案 A1(火车) A2(船) A3(飞机)
旅费 600
450
1800
2021/3/10
16
7
2、按决策环境分类 确定型:(1)目标明确,
(2)决策环境确定, (3)存在可供选择的备选方案。 若满足(1)和(3),但是决策环境不确定 不确定型:概率未知 风险型:概率已知
2021/3/10
8Leabharlann 、某企业决定拿出500万元建立投资部,现 有三种方案可供选择
方案一:投入国债,每年稳收入25万元(假 定年利率为5%)。
决策是决策主体运用自己的知觉、记忆、 思维等认知能力,对情境做出判断和选择 的过程。
决策(Decision Making)是一种对已知目标和 方案的选择过程,是人们已知需实现的目 标,根据一定的决策准则,在供选方案中 作出决策的过程。
2021/3/10
1
国家经济管理层面的决策 利率决策 、税收决策、产业调整决策 企业管理层面的决策 新产品开发决策、生产决策、库存决策 个人决策 消费决策、投资决策(理财决策)、 选课决策(课程规划决策)
2021/3/10
2
第一节 决策分析的基本问题
一、决策分析的基本概念 1、决策 狭义:选择 广义:选择的过程:设定目标、理解问题、确
定备选方案、评估备选方案、方案实施 2、决策目标:决策者希望达到的状态
2021/3/10
3
3、决策系统
运筹学课件-第4讲 马尔可夫决策

报酬函数与策略
报酬函数
描述系统在某一状态下采取某一行动后所获得的报酬或收益,通常用$r(s, a)$表示。报酬函数可以是正值、负值或零 ,取决于具体的决策问题和目标。
策略
描述了在每个状态下选择行动的规则或方法,通常用$pi(a|s)$表示在状态$s$下选择行动$a$的概率。策略可以是确 定的或随机的,根据问题的性质和求解方法的不同而有所选择。
约束处理方法
处理约束的方法包括拉格朗日松弛、动态规划中的约束处理等。
应用场景
约束条件下的马尔可夫决策过程在资源分配、任务调度等问题中有 广泛应用。
连续时间马尔可夫决策过程
连续时间模型
与离散时间马尔可夫决策过程 不同,连续时间马尔可夫决策
过程的时间参数是连续的。
转移概率与决策策略
在连续时间模型中,转移概率 和决策策略需要适应连续时间
值函数
描述了从某一状态开始遵循某一策略所获得的期望总报酬,通常用$V^pi(s)$表示在状态$s$下遵循策略 $pi$的值函数。值函数是评估策略优劣的重要指标,也是求解马尔可夫决策过程的关键所在。
03 值函数与最优策略求解
值函数定义及性质
值函数定义
在马尔可夫决策过程中,值函数用于评估从 某一状态开始,遵循某种策略所能获得的期 望总回报。它分为状态值函数和动作值函数 两种。
强化学习
强化学习问题可以建模为MDP,通过 智能体与环境交互来学习最优策略。
02 马尔可夫决策过程模型
状态空间与行动空间
状态空间
描述系统所有可能的状态,通常用$S$表示。在马尔可夫决策过 程中,状态空间可以是离散的或连续的。
行动空间
描述在每个状态下可采取的所有行动,通常用$A$表示。行动空间 也可以是离散的或连续的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3 4
5
6 7
8
21
风险型决策问题的基本分析方法
风险型决策问题的解决基于下述五个基本条件: (1)存在着两个或两个以上的不以决策者的主观意志为转移的 自然状态; (2)在几种不同的自然状态中将来究竟出现哪种自然状态决策 者不能肯定,但是决策者可以预先估计出各种自然状态出现的 概率,即可能性; (3)存在着两个或两个以上的行动方案可供决策者选择; (4)决策者对各种后果的偏好模式是合乎理性的,由此,对各 种行动方案的评价可以采用后果效用的期望效用值; (5)不同的行动方案在不同的自然状态下的相应后果及其效用 值可以计算出来。
16
例4 某一经营高级时装的商场,为了决 定购多少件皮上装进行决策。由于只能 发出一次定货单,并且假定这些上装在 几周内卖不出去的话,它们将失去市场 价值,因此,必须认真处理。这些上装 的成本为每件2000元,售价为4000元, 估计的需求情况如表6。试用基于最大 可能准则的决策方法决定定货量。
17
Q(ai0 , j0 ) max min Q(ai , j )
1i m 1 j n
则基于悲观准则的最优行动为 ai0
28
3.3 基于赫威兹准则的决策方法
利用基于赫威兹准则的方法进行决策时,首先指定 一个表示决策者乐观程度的所谓乐观系数,用 表
就越 示, 0 1 。决策者对状态的估计越乐观,
被感知 的环境 条件
提出 决策 问题
确定
决策 目标
选定
决策 策略
拟定 分析 备选 方案
选择 行动 方案
决策 实施 评价
决策 实施 后的 现状
被感知 的现状
7
2
风险型决策方法
2.1 风险型决策问题 例1:某石油公司拥有一块可能有油的土地。根据可
能出油的多少,该土地拥有四种类型:可产油 50万桶、 可产油20万桶、可产油5万桶和无油。公司目前有三种 方案:自行钻井、无条件出租和有条件出租。若自行 钻井,打出一口有油井的费用是10万元,打出一口无 油井的费用是7.5万元,每一桶油的利润是1.5元。若 无条件出租,公司可得4.5万元。若有条件出租,当产 量为20万桶至50万桶时,每桶公司收取0.5元。按过去 的经验,该块土地属于上面四种类型的可能性分别为: 10%,15%,25%和50%。问题是该公司选择哪种方案, 可获得最大利润? 8
接近于1;越悲观, 就越接近于0。然后,对每一 个行动 a i ,按下面的公式计算H的值。
H (ai ) max Q(a i , j ) (1 a) min Q(ai , j )
1 j n 1 j n
i 1,, m
29
比较诸 H (ai )的大小,使 H (ai ) 达到最大值
23
3 不定型决策问题及其决策方法
对不定型决策问题的分析需满足下述三个基本条件
(1)存在着两个或两个以上的行动方案可供决策者
选择,最后选定一个行动方案;
(2)存在着两个或两个以上的不以决策者的主观意
志为转移的自然状态,且自然状态已知,但自然状态
发生的概率未知;
(3)不同的行动方案在不同的自然状态下的后果值
3 4
5
6 7
8
19
2.4 基于渴望水平的决策方法
基于渴望水平准则的决策方法是,首先给出收 益(后果)的一个渴望水平A,然后,对每一 个行动,都求出其收益达到渴望水平A的概率。 使这个概率最大的行动,就是渴望水平准则下 的最优行动。 例5 对上个例子所描述的决策问题,设渴望水 平为10000元,试用基于渴望水平准则的决策 方法确定定货量。
15
2.3 基于最大可能准则的决策方法
在风险型决策问题中,可以选择一个概率 最大(也就是发生可能性最大)的自然状 态,设为θ0,然后假定就是最大可能状态 θ0发生。这样,风险型决策问题就变成了 确定型决策问题。可以立即根据各行动方 案在θ0状态下的后果值找出最优行动方案。 这就是基于最大可能准则的决策方法。
2
1. 2 管理与决策 决策渗透于管理的四个职能中 管理工作都是以决策为其特征的 管理工作的核心是决策 美国著名的管理学家西蒙(H.A.Simon)指出:
“管理就是决策”
3
1.3 决策分析问题的特征 1. 不确定性 2. 动态性 3. 多目标性 4. 模糊性 5. 群体性
4
1.4 决策过程
⊙
⊙
1000万/年
600万/年
1
中需求:500﹡0.3 ﹡5=900
低需求:-200﹡0.2 ﹡5=-200
⊙
⊙ ⊙
-200万/年
550万/年 450万/年
决策
高需求:550﹡0.5 ﹡5=1375
2300
2
中需求:450﹡0.3 ﹡5=675
低需求:250﹡0.2﹡5=250
⊙
250万/年
图2 决策过程
max maxQ(ai , j ) Q(ai 0 , j 0 ) 1 i m 1 j n
26
例6: 某工厂试制成功一种新产品,准备批量生产投 放市场。 假定工厂可以采取三种行动:大批生产a1、 中批生产a2和小批生产a3 。未来销售也有三种:畅销 θ1 、一般θ2和滞销θ3。各行动下的利润见表9。求该 工厂基于乐观准则下的最优行动。
31
一般地,对给出收益矩阵 Q(ai , j ),(i 1,, m; j 1,, n)
13
目标:要求工厂在投产后5年内净利润最大?
高需求:0.5
决策 点
⊙
1000万/年
600万/年
1
中需求:0.3 ⊙
低需求:0.2 ⊙
决策 高需求:0.5 2 中需求:0.3 低需求:0.2
状态 点
-200万/年
550万/年 450万/年
⊙ ⊙
⊙
250万/年
结果 点
14
图1 决策树
高需求:1000﹡0.5 ﹡5=2500 3200
的行动 a i 便是赫威兹准则下的最优
行动,即如果
H (aopt ) max H (ai )
1i m
则 aopt 就是赫威兹准则下的最优行 动。
30
3.4 基于等概率准则的决策方法
基于等概率准则的决策方法的设想是,既
然不定型决策是对各个状态出现的概率一
无所知,只能假定各状态发生的概率彼此 相等,然后求各行动方案的收益期望值。 具有最大收益期望值的行动便是等概率准 则下的最优行动。
表1 某公司的决策收入表
50万桶 20万桶 5万桶 无油 (S 1) (S 2) (S 3) (S 4) 自行钻井(A1) 无条件出租(A2) 有条件出租(A3) 650000 200000 -5000 -75000 45000 45000 45000 45000 0 0
250000 100000
表9 某工厂生产新产品的收益矩阵
自然状态 收益 值 行动方案
1
10 5 2
2
-1 3 2
3
-5 -0.7 1.5
27
a2
a1
a3
3.2 基于悲观准则的决策方法
悲观准则也称为最大最小准则。该准则是设想采取任 何一个行动,都是收益最小即后果最差的状态发生, 然后比较各行动的结果,哪一个行动的收益最大,这 一个行动就是基于悲观准则下的最优行动。 一般地,对给出的收益阵 Q(ai , j )(i 1,, m; j 1,, n) , 结果
4. 效用。效用是指决策者对后果的偏好的数值度量。
U (A i,S i)
10
风险型决策问题的两种方法:决策矩阵法,决 策树法 2.2 决策矩阵法
表2 风险型决策矩阵 状 态
S1 S2 p1 p2
方 A1
Sn pn a1n a2n
A2
a11 a12 a21 a22 am1 am1
25
3.1 基于乐观准则的决策方法
乐观准则也称为最大最大准则。该准则是设想任何 一个行动,都是收益最大即后果最好的状态发生, 然后比较各行动的结果,哪一个行动的收益最大, 这个行动就是基于乐观准则下的最优行动。
一般地,设给出决策阵 Q(ai , j )(i 1,, m; j 1,, n) , 其中 Q(ai , j ) 代表在决策者采取行动 a i 自然状态为 j 时的收益。如果
表6 皮装的需求情况
需求量 3 4 5 6 7 8
发生概率 0.05
0.15
0.5
0.20
0.05
0.05
18
表7 定货问题的决策
3 0.05 6000 4000 2000 0 -2000 -4000 4 0.15 6000 8000 6000 4000 2000 0 5 0.50 6000 8000 10000 8000 6000 4000 6 0.20 6000 8000 10000 12000 10000 8000 7 0.05 6000 8000 10000 12000 14000 12000 8 0.05 6000 8000 10000 12000 14000 16000
12
2.3 决策树
例3 设有某厂商想投资建一个工厂来生产高性能的移 动电话,决策信息如表5: 表5 决策信息 高需求 中需求 低需求 (S 3) (S 1) (S 2) 0.3 0.2 0.5 建较大规模的厂 (A 1) 建较小规模的厂 (A 2) 1000 550 600 450 -200 250
20
表7 定货问题的决策
3 0.05 6000 4000 2000 0 -2000 -4000 4 0.15 6000 8000 6000 4000 2000 0 5 0.50 6000 8000 10000 8000 6000 4000 6 0.20 6000 8000 10000 12000 10000 8000 7 0.05 6000 8000 10000 12000 14000 12000 8 0.05 6000 8000 10000 12000 14000 16000