动态规划算法入门

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

动态规划算法⼊门
1. 动态规划算法定义：
动态规划，英⽂描述为Dynamic programming. 是⼀种可以把原始问题分解为若⼲相关联的⼦解问题，并通过求取和保存⼦问题的解，获得原问题的解。

动态规划算法可以解决的问题通常包含如下特征：
重叠⼦问题
最优⼦结构
对于第⼀个特征，⽐较容易理解，即分解的若⼲⼦问题，包含着重复的解。

举例如：斐波那契数列，F(n) = F(n-1) + F(n-2)，求解的
F(n-1)的过程中，包含着求解F(n-2)的结果。

对于第⼆个特征，参考⽹上的说法为：
假设当前决策结果是f[n],则最优⼦结构就是要让f[n-k]最优,最优⼦结构性质就是能让转移到n的状态是最优的,并且与后⾯的决策没有关系,即让后⾯的决策安⼼地使⽤前⾯的局部最优解的⼀种性质。

关键字解读为：
当前的决策与后⾯的决策是⽆关的，
f[n-k]是最优的，转移到f[n]的状态是最优的
2. 动态规划算法的⼀般步骤和难点
使⽤动态规划算法解决问题的⼀般步骤是:
找到问题的最优解的性质，⽤数学公式或者算法描述
拆解⼦问题，确定问题的递推结构，保证可以收敛。

⽤知乎⼤神们的总结就是：找到问题的状态描述和状态转移⽅程。

3. 动态规划算法的分类和理解
根据我的理解，以及⽹上的说法，我把动态规划算法分为三个类别和层次：
简单动态规划算法，即状态⽅程是⽤⼀个维度的变量的描述的，常见的问题如：斐波那契数列，爬台阶问题等
爬台阶问题问题描述：有⼀座⾼度是10级台阶的楼梯，从下往上⾛，每跨⼀步只能向上1级或者2级台阶。

要求⽤程序来求出⼀共有多少种⾛法。

状态描述：我们使⽤变量n表⽰台阶的级数，F(n)表⽰n级台阶⼀共有多少种⾛法
状态转移⽅程与问题分解：根据每次能跨越的台阶数⽬：1级台阶或者2级台阶，因为⾛到N级台阶之前，⼈⼀定是处于N-1级台阶或者N-2级台阶。

F（n）的⾛法，⼀定是n-1级别的台阶的所有的⾛法和n-2级别台阶的所有⾛法之和。

F（n） = F(n-1) + F(n-2); 关于状态的分解，更详细的说明，可以看这篇⽂章：。

作者讲的⾮常的通俗易懂。

佩服这么⾟苦的编辑。

Java的代码实现
public static int getSumStep(int n){
if(n < 1){
return 0;
}
else if(n == 1){
return 1;
}
else if(n == 2){
return 1;
} else {
int f1 = 1;
int f2 = 1;
int f = 0;
for(int i=3; i<=n; ++i){
f = f1 + f2;
f1 = f2;
f2 = f;
}
return f;
}
}
⼆维的变量变化的动态规划算法，即最优解和递推关系需要两个维度变量来描述的，⽐如01背包问题，两个字符串的公共⼦序列问题
这类问题通常需要两个维度的变量，状态的描述⽐较晦涩，不容易理解，递推关系不是很直观。

我⾃⼰的学习⽅法是牢记⼀个例⼦，这⾥以01背包问题为例：
问题描述：有编号分别为a,b,c,d的四件物品，它们的重量分别是2，3，4，5，它们的价值分别是3，4，5，6，现在给你个承重为8的背包，如何让背包⾥装⼊的物品具有最⼤的价值总和？
编号a b c d
w(重量)2345
v(价值)3456
这类问题我觉得抽象的⽐较好的⼀篇⽂章是这篇⽂章：
，不过我当时是在⼿机上看到的，好了好久才找到这篇⽂章。

作者抽象的实在太好了，我觉得我都没法⽤语⾔去写出这么严格的数学公式表达和证明，这⾥就不赘述了。

下⾯写的，仅供⾃⼰理解使⽤，总结下来就是：
X i的取值为0，1 ；表⽰物品是否选取， i的取值为 1，2，3，4表⽰a,b,c,d4见物品
Wi表⽰物品的重量， w1=2, 表⽰ a物品的重量为2
Vi 表⽰物品的价值， v3 - 5, 表⽰物品c的价值为5；
其中n 表⽰前 n个物品，这个表述是很重要的，如果是第⼀次思考这个问题，很多⼈都会卡在这⾥，
m表⽰背包的重量；
约束条件：
递推关系：
第⼀个公式表⽰ n == 0 或者 m == 0 , 即物品的数量为0 或者背包的重量为0的时候，可以算是起始条件
第⼆个公式表⽰：表⽰包的重量⼩于新增加的物品，新增加的物品，⽆法装⼊，如下图的F(2, 2 ) 表⽰前两个物品，包的重量2 ， 2 < (w[2] = 3)，此时F(2,2 )= F(1 , 2) = 3;
第三个公式表⽰：包的重量能够容纳w[n]，新增加的物品，这个时候，最⼤的价值就要在 F(n-1, m) 和 F(n-1, m- Wn) + V[n]) 这两个价值中选取了。

举例如下图打表的 F(4, 8), 因为 8 - (w[n] ，4) > 0 F(4, 8) = max(F(3, 8), F(3,3 ) + v[4]) = 10;
表的过程如下：
java代码如下：
public static int getMaxValue(int[] wArray, int[] vArray, int bagWeight){
int lenght = wArray.length;
// init set zero
// manipulator the talbe
int [][] result = new int[lenght+1][bagWeight+1];
int [][] bRecord = new int[lenght+1][bagWeight+1];
for(int i=1; i<= lenght; ++i){
for(int j=1;j <= bagWeight; ++j){
if(j<wArray[i-1]){
result[i][j] = result[i-1][j];
bRecord[i][j] = 1;
}else{
if( result[i-1][j] > result[i-1][j-wArray[i-1]]+ vArray[i-1]) {
result[i][j] = result[i-1][j];
bRecord[i][j] = 1;
} else{
result[i][j] = result[i-1][j-wArray[i-1]]+ vArray[i-1];
bRecord[i][j] = 2;
}
}
}
}
return result[lenght][bagWeight];
//return bRecord;
}
需要注意的是因为java数组的索引下标为从0，开始，所以
result[i][j] = result[i-1][j-wArray[i-1]]+ vArray[i-1];
brecord是记录操作的过程，⽤于回溯使⽤，这部分代码，后续实现。

带有额外条件的动态规划问题（这类问题，我暂时还没有学习）
4. 动态规划与分治法的区别和联系
分治法是指将问题划分成⼀些独⽴地⼦问题，递归地求解各⼦问题，然后合并⼦问题的解⽽得到原问题的解。

动态规划适⽤于⼦问题独⽴且重叠的情况,也就是各⼦问题包含公共的⼦⼦问题。

动态规划算法对每个⼦⼦问题只求解⼀次，将其结果保存在⼀张表中，从⽽避免每次遇到各个⼦问题时重新计算答案。

分治法主要在于⼦问题的独⽴性，⽐如排序算法等，动态规划算法主要适⽤于处理⼦问题重复性和最优⼦结构的的问题。

⽬前的理解还⽐较浅显，只能先这么记录了。