建立动态规划数学模型的步骤教学内容
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完好机床数 xk+1=0.8xk-0.3uk
125
高负荷机床数 低负荷机床数
uk
xk-uk
0
125
第二年
100
0
100
第三年
80
0
80
第四年
64
64
0
第五年
32
32
0
此课件下载可自行编辑修改,仅供参考! 感谢您的支持,我们努力做得更好!谢谢
解:以年为阶段,k=1,2,3,4,5
取k年初完好的机床数为状态变量xk 以k年初投入高负荷运行的机床数为决策变量uk,则低负荷运 行机床数是xk-uk,于是状态转移方程为:
xk+1=1/2uk+4/5(xk-uk)=0.8xk-0.3uk 以利润为目标函数,则k年利润为:
10uk+6(xk-uk)=4uk+6xk 记fk(xk)为k年至5年末最大总利润,则动态规划基本方程
f2(x2)=0≤mua2≤xx{2 4u2+6x2+f3(0.8x2-0.3u2)}
= max{
0≤u2≤x2
4u2+6x2+18(0.8x2-0.3u2)}
当k=1时=0≤mua2≤xx{2 -1.4u2+20.4x2}=20.4x2
u2=0
f1(x1)=0≤mua1≤xx{1 4u1+6x1+f2(0.8x1-0.3u1)}
= max{
0≤u1≤x1
4u1+6x1+20.4(0.8x1-0.3u1)}
0==≤2mu21a.≤3xx2{1×1-225.=1227u91+02(2.万32元x1)}=22.32x1
u1=0
至此已算得最大总利润2790万元,再按与计算过程相反的 顺序推回去,可得最优计划如下表所示:
年份 k
第一年
终可以算出全过程的最优策略函数值及最优策略。
另一方面,由于k+1阶段的状态xk+1=T(xk, uk)是由前面 的状态xk和决策uk所形成的,在计算fk+1ห้องสมุดไป่ตู้xk+1)时还不能具 体确定xk+1的值,所以,这就要求必须就k+1阶段的各个可 能状态计算fk+1(xk+1),因此动态规划方法不但能求出整 个问题的最优策略和最优目标值,而且还能求出决策过程 中所有可能状态的最优策略及最优目标值。
fn+1(xn+1)=C
k=n,n-1,…,1
以上是建立动态规划模型的过程,这个过程是正确求解动态规
划的基础。
在动态规划基本方程中, rk(xk, uk), xk+1=T(xk, uk)都是已知函数, 最优子策略fk(xk)与fk+1(xk+1)之间是递推关系,要求出fk(xk) 及uk(xk),需要先求出fk+1(xk+1),这就决定了应用动态规划基本方 程求最优策略总是逆着阶段的顺序进行的。由后向前逐步计算,最
f当5(k=x45)时=0≤maux5≤{x5 4u5+6x5+f6(x6)}=10x5
u5=x5
f4(x4)=0=≤mmua4a≤xxx{{4
0≤u4≤x4
4u4+6x4+f5(0.8x4-0.3u4)} 4u4+6x4+10(0.8x4-0.3u4)}
= max{ 当k=3时0≤u4≤x4
u4+14x4}=15x4
建立动态规划数学模型的步骤
⒊确定决策变量uk及允许决策变量集合Dk(uk)。 ⒋根据状态变量之间的递推关系,写出状态转移方程:
xk+1=T(xk, uk(xk))
⒌建立指标函数。一般用rk(xk, uk)描写阶段效应,fk(xk)表示 k—n阶段的最优子策略函数。
⒍建立动态规划基本方程:
fk(xk)u=k∈opDt{k(ukr)k(xk, uk(xk))﹡fk+1(xk+1)}
为:
fk(xk)=0≤muak≤xx{k 4uk+6xk+fk+1(0.8xk-0.3uk)}
f6(x6)=0
k=5,4,3,2,1
以上是建立动态模型的过程,下面具体求解。
注意动态规划基本方程为: fk(xk)=0≤mauxk≤{xk 4uk+6xk+fk+1(0.8xk-0.3uk)}
所以,当k=5时,有
下面就按上述步骤求解例2。
例2(带回收的资源分配问题)某厂新购某种机床125台。据 估计,这种设备5年后将被其它设备所代替。此机床如在高负荷状 态下工作,年损坏率为1/2,年利润为10万元;如在低负荷状态下 工作,年损坏率为1/5,年利润为6万元。问应如何安排这些机床的 生产负荷,才能使5年内获得的利润最大?
u4=x4
f3(x3)=0≤mua3≤xx{3 4u3+6x3+f4(0.8x3-0.3u3)}
= max{
0≤u3≤x3
4u3+6x3+15(0.8x3-0.3u3)}
= max{
0≤u3≤x3
-0.5u3+18x3}=18x3
u3=0
动态规划基本方程为:
fk(xk)=0≤muak≤xx{k 4uk+6xk+fk+1(0.8xk-0.3uk)} 当k=2时