第四节 离散随机性动态规划模型求解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
xk ∈Dk ( s k )
(8.14)
其中E{}表示括弧内数量的期望值。 其中 表示括弧内数量的期望值。 表示括弧内数量的期望值
2010年5月
管理工程学院
《运筹学》 运筹学》
4
例5:某公司承担一种新产品试制任务,合同要求 :某公司承担一种新产品试制任务, 三个月内交出一台合格的样品,否则将负担1500元 三个月内交出一台合格的样品,否则将负担 元 的赔偿费。据有经验的技术人员估计, 的赔偿费。据有经验的技术人员估计,试制时每投 产一台合格概率为1/3, 产一台合格概率为 ,投产一批的准备结束费用为 250元,每台试制费用为 元 每台试制费用为100元。若投产一批后全部 元 不合格,可再投一批试制, 不合格,可再投一批试制,但每投一批周期需一个 要求确定每批投产多少台,使总试制费用(包括 月。要求确定每批投产多少台,使总试制费用 包括 可能发生的赔偿损失)的期望值最小 的期望值最小。 可能发生的赔偿损失 的期望值最小。
7
(6)设fk(sk)为从状态sk、决策xk出发的k阶段以后的最小 期望费用。因有fk(0)=0,故有
xk 2 xk 2 f k (1) = min c( xk ) + f k +1 (1) + 1 − f k +1 (0) xk ∈Dk ( sk ) 3 3 xk 2 = min c(xk ) + f k +1 (1) (8.16) xk ∈Dk ( sk ) 3
◆该公司的最优决策为第一批投产3台;如果无合格品,第二批 再投产3台;如果仍全部不合格,第三批投产4台。这样使总的期 望研制费用(包括三批均不合格时的赔偿费)为最小,共计796元。
2010年5月
管理工程学院
《运筹学》 运筹学》
1
第四节 离散随机性动态规划模型求解
◆掌握离散随机性动态规划模型的求解
2010年5月
管理工程学院
《运筹学》 运筹学》
2
一、随机性动态规划基本结构
2010年5月
管理工程学院
《运筹学》 运筹学》
3
二、基本方程
f k (sk ) = max E{v(sk , xk ) + f k +1 (sk +1 )}
2010年5月 管理工程学院
《运筹学》 运筹学》
6
(4)状态转移律为: 状态转移律为: 状态转移律为
(8.15)
(5)第k阶段的费用支出为c(uk),有
250 + 100 xk c ( xk ) = 0
( xk ≠ 0 ) ( xk = 0 )
2010年5月
管理工程学院
《运筹学》 运筹学》
9 表8-11 f2(s2) 3 830 4 837 0 830 0 3 x2*
当k=2时,
x2 s2 0 1
源自文库
c(x2)+(2/3) ×946 0 1 2 0 946 981 870
2010年5月
管理工程学院
《运筹学》 运筹学》
10
当k=1时, 表8-12 x1 f1(s1) x1* c(x1)+(2/3) ×830 s1 0 1 2 3 4 1 830 903 819 796 814 796 3
2010年5月
管理工程学院
《运筹学》 运筹学》
8
当k=3时, 表8-10 x3 s3 0 1 c(x3)+(2/3) ×1500 0 1 2 3 0 1500 1350 1117 994 f3(s3) x3* 4 5 0 4 0 946 948 946
2010年5月
管理工程学院
《运筹学》 运筹学》
2010年5月
管理工程学院
《运筹学》 运筹学》
5
合同期为三个月, 解:(1)合同期为三个月,投产一批的周期为一个月, 合同期为三个月 投产一批的周期为一个月, 故可将整个合同期划分为三个阶段。 故可将整个合同期划分为三个阶段。 (2)状态变量 k。假定尚没一台合格品时 k =1,已得到 状态变量s 假定尚没一台合格品时s , 状态变量 一台以上合格品时s 一台以上合格品时 k =0。故签订合同时只有一种情况 。 s1 =1。 。 (3)决策变量 k为每个阶段的投产试制台数 决策变量x 决策变量 Dk(sk)={1,2,…,N}(当sk =1时) 当 时 Dk(sk)={0} (当sk =0时)。 当 时。
(8.14)
其中E{}表示括弧内数量的期望值。 其中 表示括弧内数量的期望值。 表示括弧内数量的期望值
2010年5月
管理工程学院
《运筹学》 运筹学》
4
例5:某公司承担一种新产品试制任务,合同要求 :某公司承担一种新产品试制任务, 三个月内交出一台合格的样品,否则将负担1500元 三个月内交出一台合格的样品,否则将负担 元 的赔偿费。据有经验的技术人员估计, 的赔偿费。据有经验的技术人员估计,试制时每投 产一台合格概率为1/3, 产一台合格概率为 ,投产一批的准备结束费用为 250元,每台试制费用为 元 每台试制费用为100元。若投产一批后全部 元 不合格,可再投一批试制, 不合格,可再投一批试制,但每投一批周期需一个 要求确定每批投产多少台,使总试制费用(包括 月。要求确定每批投产多少台,使总试制费用 包括 可能发生的赔偿损失)的期望值最小 的期望值最小。 可能发生的赔偿损失 的期望值最小。
7
(6)设fk(sk)为从状态sk、决策xk出发的k阶段以后的最小 期望费用。因有fk(0)=0,故有
xk 2 xk 2 f k (1) = min c( xk ) + f k +1 (1) + 1 − f k +1 (0) xk ∈Dk ( sk ) 3 3 xk 2 = min c(xk ) + f k +1 (1) (8.16) xk ∈Dk ( sk ) 3
◆该公司的最优决策为第一批投产3台;如果无合格品,第二批 再投产3台;如果仍全部不合格,第三批投产4台。这样使总的期 望研制费用(包括三批均不合格时的赔偿费)为最小,共计796元。
2010年5月
管理工程学院
《运筹学》 运筹学》
1
第四节 离散随机性动态规划模型求解
◆掌握离散随机性动态规划模型的求解
2010年5月
管理工程学院
《运筹学》 运筹学》
2
一、随机性动态规划基本结构
2010年5月
管理工程学院
《运筹学》 运筹学》
3
二、基本方程
f k (sk ) = max E{v(sk , xk ) + f k +1 (sk +1 )}
2010年5月 管理工程学院
《运筹学》 运筹学》
6
(4)状态转移律为: 状态转移律为: 状态转移律为
(8.15)
(5)第k阶段的费用支出为c(uk),有
250 + 100 xk c ( xk ) = 0
( xk ≠ 0 ) ( xk = 0 )
2010年5月
管理工程学院
《运筹学》 运筹学》
9 表8-11 f2(s2) 3 830 4 837 0 830 0 3 x2*
当k=2时,
x2 s2 0 1
源自文库
c(x2)+(2/3) ×946 0 1 2 0 946 981 870
2010年5月
管理工程学院
《运筹学》 运筹学》
10
当k=1时, 表8-12 x1 f1(s1) x1* c(x1)+(2/3) ×830 s1 0 1 2 3 4 1 830 903 819 796 814 796 3
2010年5月
管理工程学院
《运筹学》 运筹学》
8
当k=3时, 表8-10 x3 s3 0 1 c(x3)+(2/3) ×1500 0 1 2 3 0 1500 1350 1117 994 f3(s3) x3* 4 5 0 4 0 946 948 946
2010年5月
管理工程学院
《运筹学》 运筹学》
2010年5月
管理工程学院
《运筹学》 运筹学》
5
合同期为三个月, 解:(1)合同期为三个月,投产一批的周期为一个月, 合同期为三个月 投产一批的周期为一个月, 故可将整个合同期划分为三个阶段。 故可将整个合同期划分为三个阶段。 (2)状态变量 k。假定尚没一台合格品时 k =1,已得到 状态变量s 假定尚没一台合格品时s , 状态变量 一台以上合格品时s 一台以上合格品时 k =0。故签订合同时只有一种情况 。 s1 =1。 。 (3)决策变量 k为每个阶段的投产试制台数 决策变量x 决策变量 Dk(sk)={1,2,…,N}(当sk =1时) 当 时 Dk(sk)={0} (当sk =0时)。 当 时。