运筹学之决策论
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i 1,m
②策略空间 人们根据不同的客观情况,可能做出主观的选择, 记一种策略方案为Ui,有n种不同的策略,其集合为:
U {u1 , u2 ,, un } {u j } j 1,, n
U称为策略空间;U的元素Uj称为决策变量。 ③损益函数 当状态处在Si情况下,人们做出Uj决策,从而产生的 损益值Vij,显然Vij是Si,Uj的函数,即:
例如,日进货50箱,售出50箱,即 Q D ,利润为5050=2500元, 若需求量大于50箱,利润仍为2500元; 又日进货60箱而售出50箱,即 Q D ,这时的利润为 5070- 2060=2300元,见表4.12。
计算各个进货方案的期望利润值。 各个方案的期望利润,是在收益表的基础上,将每个方案 在不同自然状态下的利润值乘以该自然状态发生的概率值 之和。 (3)决策。从表4.12的计算结果可以看出:进货70箱的计划方案 期望利润最大。因此,该店的最优进货方案是日进货70箱雪糕。
解 (1)根据前两年同期日销售量资料,进行统计分析, 确定不同日销售量的概率,见表4.11的最后一列。
(2)根据每天的日销售量,编制不同进货方案的收益表 (见表4.12)
各进货方案在不同的日销售量条件下的利润是随供需关系而 定的.设以 Q 代表日进货量,以 D 代表市场的日可能销售量, 则每日利润的计算方法如下: 当 Q D 时,利润 (110 60)Q 50Q ; 当 Q D 时,利润 (110 60) D 20(Q D) 70D 20Q
30 20 10
-6 -2 5
一、最小最大准则(悲观准则)
决策者从最不利的角度去考虑问题: 先选出每个方案在不同自然状态下的最小收益值(最保 险),然后从这些最小收益值中取最大的,从而确定行动 方案。 用a(Ai, Sj)表示收益值
自然状态 行动方案
A1(大批量生产) A2(中批量生产) A3(小批量生产)
1.引例
计划用6个鸡蛋煎饼,现已经向碗里打了5个鸡蛋,在打第6个鸡蛋前 ,有三种不同行动方案可供选择: a1:向盛有5个好蛋的碗里打第6个鸡蛋; a2:向另一个碗里单独打第6个鸡蛋,以便检查好坏; a3:放弃第6个鸡蛋。 第6个鸡蛋有两种自然状态: θ 1 :好蛋;θ 2 :坏蛋。 各种行动方案在各种不同的自然状态下会产生不同的结果oij:
第十一章 决策论 Theory of Decision
11.1 决策分析的基本问题 11.2 确定型和非确定型决策 11.3 风险型决策 11.4 效用理论 11.5马尔可夫决策
11.1 决策分析的基本问题
“决策”一词来源于英语Decision Analysis,直译为“ 做出决定”。 所谓决策,就是为了实现预定的目标在若干可供选择的 方案中,选出一个最佳行动方案的过程,它是一门帮助人 们科学地决策的理论。
好蛋θ 打入碗里a1 单独检查a2 丢弃a3
1
坏蛋θ
2
o116个蛋煎饼 o21 6个蛋煎饼,多洗一个碗 o315个蛋煎饼,浪费一个好
o125个好蛋浪费,无蛋煎饼 o225个蛋煎饼,多洗一个碗 o325个蛋煎饼
决策问题的构成要素
决策者 可供选择的的方案(行动、策略) 自然状态(不能被决策者所控制的客观存在的环境) 结果(每一方案选择所导致的后果,即收益或损失)
算各行动方案的收益期望值,最大的收益期望值为最优方案。
用 E(Ai )表示第i方案的收益期望值.
自然状 态 行动方案
A1(大批量生产) A2(中批量生产) A3(小批量生产)
S1
p = 1/2
30 20 10
S2
p = 1/2
-6 -2 5
(需求量大) (需求量小)
收益期望值 E (Ai)
12(max) 9 7.5
销量(万份/天) 天 数 15 12 14 20 13 30 12 25 11 13
晚报销量分布表
销量(万份/天) 天 数 15 12 14 20 13 30 12 25 11 13
解: 有5个备选方案: 每天印刷 S1 : 15万份; S2 : 14万份; S3 : 13万份; S4 : 12万份; S5 : 11万份; 每天出售该晚报份数(万份)的自然状态有5种: N 1 15 , N 2 14 , N 3 13 , N 4 12 , N 5 11 , 相应的自然状态概率为: P( N1 ) 0.12, P( N 2 ) 0.20, 方案 S i 在自然状态 N j 下得到收益值为 aij (i, j 1, 2,3, 4,5)
11.3 风险型决策
特征:在决策环境不完全确定的情况下进行的决策,已知 自然状态概率集。 由于使用了概率,所以称此类决策为风险型决策.
期望收益决策法
风险型决策 决策树法
1. 期望收益决策法 选择期望收益最大的方案为最优方案. 例 某建筑公司承建一项工程,需要决定下个月是否开工. 如果开工后天气好,可以按期完工,并可获得利润50万元; 如果开工后天气坏则将造成损失20万元;如果不开工,不管 天气是好还是坏,都要付出窝工损失5千元.根据历史气象统 计资料,预计下月天气好的概率是0.4,天气坏的概率是0.6, 数据列表见表4.10. 为使利润最大,该公司应决定开工还是 不开工?
S1
0 (30,理想值) 10 (30-20) 20 (30-10)
S2
11 [5-(-6)] 7 [5-(-2)] 0 (5,理想值)
(需求量大) (需求量小)
1j2
Max aij'
11 10 (min) 20
结论分析:在难以准确估计事件发生概率的条件下进行投资 决策,主要取决于决策者对风险的偏好,根据决策者对风险 持有的态度,得到不同的最优方案. 本节学习要点 1. 针对不确定型决策,本节介绍的五种方法有一定的局限 性,是因条件所限,没有办法的办法. 2. 不同的决策者有不同的决策习惯;同一个决策者当自身 的实力发生变化时,对同一个决策问题也会采取不同的决 策方法. 作业:p297-1
解: 计算各方案的期望收益值.
开工方案:0.450+0.6(20)=8(万元)
不开工方案:0.4(5)+0.6(5)=5(万元) 根据计算结果,如选择开工方案能够获利8万元;如选择不 开工方案则损失5万元。因此,选择开工方案作为决策最优 方案。
例4.6 某市一家报社,现在每天印刷一种晚报15万份,其大 部分通过零售网点发行。据100天内的销量调查,每天出售 该晚报份数的分布如表所示。已知该晚报每份售价为0.3元, 成本为0.25元。该报社领导决定根据市场销售量调查结果, 确定一个最佳印刷量,使期望利润最大.该报社领导应如何 决策? 晚报销量分布表
自然状 态 行动方案
A1(大批量生产) A2(中批量生产) A3(小批量生产)
S1
30 20 10
S2
-6 -2 5
Max [(Ai,Sj)]
1j2
(需求量大) (需求量小)
30(max) 20 10
三、等可能性准则( Laplace准则 )
决策者把各自然状态发生的机会看成是等可能的: 设每个自然状态发生的概率为 1/自然状态数 ,然后计
10
风险型决策: 在决策环境不是完全确定的情况下进行决策. 由于存在不 可控制的自然状态,采取一种方案可能出现几种不同的结果, 各自然状态发生的概率已知。 例: 产值 天气 最好 策略 A 10 B C 概率 8 3 0.15
较好 1 4 3 0.60
坏 -2 0 3 0.25
不确定型决策: 不确定型决策对于各自然状态发生的概率,决策者是一 无所知的,只能靠决策者的主观倾向进行决策。 常用的不确定型准则有: 1. 悲观准则 2. 乐观准则 3. 折衷法准则 4. 等可能性准则 5. 最小机会损失(后悔)准则
2. 决策系统 决策系统可以表示为三个主要因素的函数: D=D(S, U, V)
(1)状态空间S (2)策略空间U (3)损益函数V ①状态空间 不以人的意志为转移的客观因素,设一个状态为Si, 有m种不同状态,其集合记为:
S {S1 , S 2 , S3 , S m } {Si }
S称状态空间,S的元素Si称为状态变量。
11.2 不确定型决策
特征:1、自然状态已知;2、各方案在不同自然状态下的收益值已知;3、自 然状态发生不确定。
例:某公司需要对某新产品生产批量作出决策,各种批量 在不同的自然状态下的收益情况如下表(收益矩阵):
自然状态 行动方案
S1(需求量大)
S2(需求量小)
A1(大批量生产) A2(中批量生产) A3(小批量生产)
比较可知:E ( S 4 ) 最大,故
S4 :每天印刷12万份为最优方案。
练习 某冷饮店要拟订6,7,8月份雪糕的日进货计划。雪糕进货 成本为每箱60元,销售价格为110元,即当天能卖出去,每箱 可获利50元;如果当天卖不出去,剩余一箱就因冷藏费及其他 原因而亏损20元.现市场需求情况不清楚,但有前两年同期180 天的日销售资料,见表4.11。 问:应怎样拟订雪糕的日进货计划,才能使利润最大?
P( N 3 ) 0.30, P( N 4 ) 0.25, P( N 5 ) 0.13
则收益矩阵为
.
E (Si ) ai1 P( N1 ) ai 2 P( N 2 ) ain P( N n ),i = 1, 2, L , m
E ( S 2 ) 3430, E ( S 3 ) 4970, 有 E ( S1 ) 1290, E ( S 4 ) 5610,E ( S 5 ) 5500
A1(大批量生产) A2(中批量生产) A3(小批量生产)
S1
30 20 10
S2
-6 -2 5
CVi
19.2(max) 13.4 8.5
(需求量大) (需求量小)
当 =0时,是悲观准则,
当 =1时,是乐观准则.
五、后悔值准则
决策者从后悔的角度去考虑问题:
当决策者选定决策方案后,结果发现所选方案并非实 际最优方案,必然产生后悔.这种后悔,实际上是一种机会 损失。一定自然状态下所选方案的收益值与该状态下最优方 案的收益值之差越大,后悔就越大. 后悔值: 某自然状态下最大收益与该状态下其他收益之差
1.计算出在各种自然状态下各方案的后悔值, 2. 从各方案的最大后悔值中,选取后悔值最小的方案为最 优方案.
自然状态 行动方案
Biblioteka Baidu
S1(需求量大)
S2(需求量小)
A1(大批量生产) A2(中批量生产) A3(小批量生产)
30 20 10
-6 -2 5
自然状 态 行动方案
A1(大批量生产) A2(中批量生产) a3(小批量生产)
Vij v(Si , u j )
i 1,2,m; j 1,2,n
当状态变量是离散型变量时,损益值构成的矩阵叫损益矩阵.
v( S1 ,U 1 ) v( S1 ,U 2 ) v( S ,U ) v( S ,U ) 2 2 2 1 v ( S m , U1 ) v ( S m , U 2 ) v( S1 ,U n ) v( S 2 ,U n ) v( S m ,U n )
S1
30 20 10
S2
-6 -2 5
(需求量大) (需求量小)
1j2
Min[(Ai,Sj)]
-6 -2 5(max)
二、最大最大准则(乐观准则)
决策者从最有利的角度去考虑问题:
先选出每个方案在不同自然状态下的最大收益值(最乐 观),然后从这些最大收益值中取最大的,从而确定行动 方案。 用a(Ai, Sj)表示收益值
V (Vij ) mn
决策问题根据掌握的信息多少进行分类
确定型决策问题 不确定型决策问题 风险型决策问题
确定型决策:在决策环境完全确定的条件下进行的决策, 一个方案只能有一种确定的结果,其自然状态是为人们所掌握 的. 例1. 背包问题 例2. N台机器,N个工作,每台机器安排一项工作,如 何安排生产费用最小?
四、乐观系数(折衷)准则 决策者取乐观准则和悲观准则的折衷: 先确定一个乐观系数 (01),然后计算: CVi = max [a(Ai, Sj)] +(1- )min [a(Ai, Sj)] 从这些折衷标准收益值CVi中选取最大的,从而确定行动方 案。 取 = 0.7
自然状 态 行动方案