离散随机性动态规划模型求解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(8.16)
《运筹学》
8
当k=3时, f3 (1) 0,
x3 2 f3 (1) min c( x3 ) f 4 (1) x 3 D ( x 3 ) 3
f 4 (1) 的意义为第四个月初仍未得到一件合格产品, 因按合同需要赔偿1500元,故有 f 4 (1) 1500。
《运筹学》
6
(4) 状态转移律为:
(8.14)
(5)第k阶段的费用支出为c(uk),有
250 100xk cxk 0
xk 0 xk 0
(8.15)
《运筹学》
7
(6)设fk(sk)为从状态sk、决策xk出发的k阶段以后的最小 期望费用。因有fk(0)=0,故有
《运筹学》
4
例6:某公司承担一种新产品试制任务,合同要求 三个月内交出一台合格的样品,否则将负担1500元 的赔偿费。据有经验的技术人员估计,试制时每投 产一台合格概率为1/3,投产一批的准备结束费用为 250元,每台试制费用为100元。若投产一批后全部 不合格,可再投一批试制,但每投一批周期需一个 月。要求确定每批投产多少台,使总试制费用(包括 可能发生的赔偿损失)的期望值最小。
《运筹学》
9
当k=3时, 表8-8 x3 c(x3)+(2/3)x3 ×1500 s3 0 1 2 3 0 0 1 1500 1350 1117 994 f3(s3) x3* 4 5
0 946 948 946
来自百度文库0 4
《运筹学》
10 表8-9 f2(s2) 4 837 x2*
当k=2时,
x2
s2
0 1
xk xk 2 2 f k 1 min cxk f k 1 1 1 f k 1 0 xk Dk sk 3 3 xk 2 min cxk f k 1 1 xk Dk sk 3
c(x2)+(2/3) x2 ×946 0 1 2 3 0 946 981 870 830
0 830
0 3
《运筹学》
11
当k=1时,
x1
表8-10 f1(s1) x1*
s1
1
c(x1)+(2/3) x1×830 0 1 2 3 4 830 903 819 796 814
796
3
◆该公司的最优决策为第一批投产3台;如果无合格品,第二批 再投产3台;如果仍全部不合格,第三批投产4台。这样使总的期 望研制费用(包括三批均不合格时的赔偿费)为最小,共计796元。
《运筹学》
1
第四节 离散随机性动态规划模型求解
◆掌握离散随机性动态规划模型的求解
《运筹学》
2
一、随机性动态规划基本结构
《运筹学》
3
二、基本方程
f k sk max Evsk , xk f k 1 sk 1
xk Dk sk
(8.14)
其中E{ ·}表示括弧内数量的期望值。
《运筹学》
5
解:(1) 合同期为三个月,投产一批的周期为一个 月,作为一个阶段。故可将整个合同期划分为三个 阶段。 (2) 状态变量sk。假定尚没一台合格品时sk =1,已得到 一台以上合格品时sk =0。故签订合同时只有一种情况 s1 =1。
(3) 决策变量xk为每个阶段的投产试制台数 Dk(sk)={1,2, …,N}(当sk =1时) Dk(sk)={0} (当sk =0时)。