动态规划-入门理解

一、什么情况可以使用动态规划

动态规划 = 最优子结构 + 重叠子问题 + 转移方程

最优子结构：保证能从局部解推出全局解，也就是保证能够写出转移方程

重叠子问题：说明暴力解法太耗时，我们可以使用动态规划进行优化

转移方程：动态规划的核心，各种状态必须能够找到一个共同的状态转移方程

「最优子结构」是某些问题的一种特定性质，并不是动态规划问题专有的。也就是说，很多问题其实都具有最优子结构，只是其中大部分不具有重叠子问题，所以我们不把它们归为动态规划系列问题而已。

我先举个很容易理解的例子：假设你们学校有 10 个班，你已经计算出了每个班的最高考试成绩。那么现在我要求你计算全校最高的成绩，你会不会算？当然会，而且你不用重新遍历全校学生的分数进行比较，而是只要在这 10 个最高成绩中取最大的就是全校的最高成绩。

我给你提出的这个问题就符合最优子结构：可以从子问题的最优结果推出更大规模问题的最优结果。让你算每个班的最优成绩就是子问题，你知道所有子问题的答案后，就可以借此推出全校学生的最优成绩这个规模更大的问题的答案。

你看，这么简单的问题都有最优子结构性质，只是因为显然没有重叠子问题，所以我们简单地求最值肯定用不出动态规划。

再举个例子：假设你们学校有 10 个班，你已知每个班的最大分数差（最高分和最低分的差值）。那么现在我让你计算全校学生中的最大分数差，你会不会算？可以想办法算，但是肯定不能通过已知的这 10 个班的最大分数差推到出来。因为这 10 个班的最大分数差不一定就包含全校学生的最大分数差，比如全校的最大分数差可能是 3 班的最高分和 6 班的最低分之差。

这次我给你提出的问题就不符合最优子结构，因为你没办通过每个班的最优值推出全校的最优值，没办法通过子问题的最优值推出规模更大的问题的最优值。前文动态规划详解说过，想满足最优子结，子问题之间必须互相独立。全校的最大分数差可能出现在两个班之间，显然子问题不独立，所以这个问题本身不符合最优子结构。

那么遇到这种最优子结构失效情况，怎么办？策略是：改造问题。对于最大分数差这个问题，我们不是没办法利用已知的每个班的分数差吗，那我只能这样写一段暴力代码：

int result = 0;
for (Student a : school) {for (Student b : school) {if (a is b) continue;result = max(result, |a.score - b.score|);}
}
return result;

改造问题，也就是把问题等价转化：最大分数差，不就等价于最高分数和最低分数的差么，那不就是要求最高和最低分数么，不就是我们讨论的第一个问题么，不就具有最优子结构了么？那现在改变思路，借助最优子结构解决最值问题，再回过头解决最大分数差问题，是不是就高效多了？

二、动态规划的基本框架（以斐波那契数列说明）

斐波那契数列：

1. 穷举

动态规划的本质就是穷举只是比暴力穷举更优一点而已

有如下写法：

int fib(int N) {if (N == 1 || N == 2) return 1;return fib(N - 1) + fib(N - 2);
}

其递归树结构如下：

可以看出，效率很低，存在很多的重复计算

2. 备忘录去重

即然耗时的原因是重复计算，那么我们可以造一个「备忘录」，每次算出某个子问题的答案后别急着返回，先记到「备忘录」里再返回；每次遇到一个子问题先去「备忘录」里查一查，如果发现之前已经解决过这个问题了，直接把答案拿出来用，不要再耗时去计算了。

代码如下：

int fib(int N) {// 备忘录全初始化为 0int memo[N + 1];memset(memo, 0, sizeof(memo));// 进行带备忘录的递归return dp(memo, N);
}// 带着备忘录进行递归
int dp(int memo[], int n) {// base caseif (n == 0 || n == 1) return n;// 已经计算过，不用再计算了if (memo[n] != 0) return memo[n];memo[n] = dp(memo, n - 1) + dp(memo, n - 2);return memo[n];
}

注意：可能你会疑问，每次只考虑第一次计算，能保证结果的最优吗

答案是可以，这是转移方程决定的，我们通过转移方程得到的结果就是局部最优，如果不是，那么就是转移方程写错了

递归树简化如下图：

这种备忘录的剪枝操作，其实相当于只留下有用的主干，上图可以进一步画为：

3. dp数组迭代求解

有了上一步「备忘录」的启发，我们可以把这个「备忘录」独立出来成为一张表，通常叫做 DP table，在这张表上完成「自底向上」的推算

int fib(int N) {if (N == 0) return 0;int* dp = new int[N + 1];// base casedp[0] = 0; dp[1] = 1;// 状态转移for (int i = 2; i <= N; i++) {dp[i] = dp[i - 1] + dp[i - 2];}return dp[N];
}

状态转移如下：

我们发现和备忘录数组几乎一模一样，只是顺序不同

为什么可以将备忘录优化的递归写法转换为dp数组的迭代写法？

备忘录优化相当于去除重复的计算，每种计算只操作一次，而dp数组是先规划好要计算多少个状态，然后进行遍历，每种状态也只遍历一次，因此，两种写法本质上是一样的

注意：递归法使用备忘录去重后，尽管时间复杂度和迭代相同，但是，我们递归会不断的在栈上调用函数，造成大量的内存和时间消耗，这会导致实际运行时，递归法的时间空间消耗大于迭代法

详情参考：

第七章 C语言函数_递归函数的致命缺陷：巨大的时间开销和内存开销(附带优化方案)_c++ 递归资源消耗-CSDN博客

三、dp数组迭代五部曲

1.明确dp数组下标和下标对应的值的含义

这一步其实是要和转移方程结合理解的，很多时候我们是为了能够写出转移方程，才进行某种dp数组的定义

所以这一步非常重要，我们需要知道问题中有哪些状态才能为dp数组合理分配这些状态

所谓状态，也就是原问题和子问题中会变化的变量。我们要将这些变化的量分配给dp数组的下标和值

注意：比较难的题，状态不能一眼看出来，需要我们自己进行构造，这样的题只有靠积累

（1）简单例子

1：斐波那契的dp[]定义：i 表示n = i，dp[i]表示n = i对应的结果是什么，这样的逻辑非常清晰

2：凑零钱：（注意虽然硬币个数不会变化，因为硬币数量无限，所以有两个变化量，凑零钱的硬币数和目标金额），所以我们定义i为目标金额，dp[i]值为零钱个数（一般都会吧dp[i]当作输出结果）

这里会有一点歧义，我们要知道我们最后要得到的是什么，应该是amount对应的最小数量，那么dp[i]应该设置为金额i对应的最小数量，不要思考成我们将dp[i]定义为i对应的所有数量，然后通过比较所有dp[i]来求得最小值，这样似乎更容易理解，但是却不实际，那样dp[i]会被定义为二维数组，复杂度也上升了

我们应该知道，最小这个限制，是在转移方程里面实现的，所以我们默认得到的dp[i]就是最小值！

（2）困难例子

最长递增子序列：我们发现问题中貌似没有直接给出变化的状态，从而无从下手

这是子序列问题中的一类问题，处理方法有相对固定几类，我们这里就直接套用经典定义

dp[i] 表示以 nums[i] 这个数结尾的最长递增子序列的长度。

对于其他不明确状态的问题如何定义，这个也要靠积累，需要我们多做题才知道

虽然说了这么多，但是实际情况是要背住不同题型的数组含义，现想根本来不及

2.确定递推公式（转移方程）

动态规划的核心设计思想是数学归纳法。

相信大家对数学归纳法都不陌生，高中就学过，而且思路很简单。比如我们想证明一个数学结论，那么我们先假设这个结论在 k < n 时成立，然后根据这个假设，想办法推导证明出 k = n 的时候此结论也成立。如果能够证明出来，那么就说明这个结论对于 k 等于任何数都成立。

类似的，我们设计动态规划算法，不是需要一个 dp 数组吗？我们可以假设 dp[0...i-1] 都已经被算出来了，然后问自己：怎么通过这些结果算出 dp[i]？

直接拿最长递增子序列这个问题举例你就明白了。不过，首先要定义清楚 dp 数组的含义，即 dp[i] 的值到底代表着什么？

我们的定义是这样的：dp[i] 表示以 nums[i] 这个数结尾的最长递增子序列的长度（子序列中要包含nums[i],可能我们会想这样不能找到实际的最大子序列，但是其实我们遍历了所有nums[i]，并不会漏掉）。

假设我们已经知道了 dp[0..4] 的所有结果，我们如何通过这些已知结果推出 dp[5]

这就是求解转移方程的重点一步，此处

根据刚才我们对 dp 数组的定义，现在想求 dp[5] 的值，也就是想求以 nums[5] 为结尾的最长递增子序列。

其实就是自己总结规律，然后使用数学归纳法验证

光靠脑袋想dp的递推公式确实很困难我的做法是画一个dp数组出来找一个例子填进去,然后通过观察找出规律倒推递推公式(仅供参考,有待验证)

当我们发现递推公式不好找时,需要思考是否改变dp定义

nums[5] = 3，既然是递增子序列，我们只要找到前面那些结尾比 3 小的子序列，然后把 3 接到这些子序列末尾，就可以形成一个新的递增子序列，而且这个新的子序列长度加一。

同时我们是在找最长的子序列，所以我们需要找出前面序列中的最长序列接上去

我们的转移方程为：

dp[i] = dp[j] + 1;//j是比i小的数

接下来就是要将取最大值还有求比i小的j结合起来

代码如下：

    for(int j = 0;j < i;j++){        if (nums[i] > nums[j]) {// 把 nums[i] 接在后面，即可形成长度为 dp[j] + 1，// 且以 nums[i] 为结尾的递增子序列dp[i] = Math.max(dp[i], dp[j] + 1);}}

这整个代码才是完整的转移方程

一个重点：

我们一定要假设已经知道了dp[i-1]，并且我们设置的dp数组可以存放的值就是我们希望的值

3. dp数组初始化和base case

初始化要结合我们对dp数组的定义进行设置，并且结合保证在执行max和min操作时不会影响更新值，对dp数组的定义不同的话，初始化也会有差别

base case 就是递归中的最底层，是所有子问题中的最基础的问题，靠这个问题推出其他所有解

初始化非常重要，它和转移方程共同决定了我们定义的dp[i]里面的值是否正确,一般是确定了dp定义和转移方程,再开始初始化

一个方法：

我们只需要把dp数组画出来，然后看看是是通过什么方向进行转移的，将这个方向的最开头的状态初始化即可

4. 确定遍历顺序

现在接触到的都是顺序进行遍历的，并没有在遍历时挖坑，但是后面有从前往后，从后往前还有斜着遍历

这个也需要把dp数组画出来，然后一步步观察状态如何转移，不同顺序可能会导致转移的先后发生变化

将转移方程放入遍历中：

        for(int i = 0;i < nums.size();i++)for(int j = 0;j < i;j++){if(nums[i] > nums[j]){dp[i] = max(dp[i],dp[j]+1);}}

5. dp数组打印

通过递推公式手写出dp数组，用于检测dp哪里写错了

四、举例说明

1. 零钱兑换

题目链接：322. 零钱兑换 - 力扣（LeetCode）

(1)dp定义:

首先确定状态，问题中改变的状态只有总金额和使用的硬币个数（硬币总数无限，所以剩下的硬币数量不变化）

我们将dp[i]和i与变化量进行匹配，从而有如下设置：

i为总金额。dp[i]为达到总金额i需要的硬币数量

(2)转移方程

我们这样想，肯定是要建立dp[i]和dp[j]的联系，但实际这个i j应该如何取，也就是总金额如何变化更合理，所以自然想到了，每次对总金额 i 减少一个硬币的值，来求得 j ，那么关系如何建立呢

这就要用到上面的数学归纳法了，假设我们已经知道减少一个硬币后的dp[i - coin]的值，那么dp[i]的最小值就是dp[i - coin]+1

(3)初始化

由于我们的i要索引到amount，索引dp的size要为amount+1，同时对于dp[i]来说，最差的情况即使由i个一元硬币组成，那么最大个数为i，为了使得初始状态不影响结果，需要将dp[i] 赋值 i+1，为了省事直接赋值最大的amount+1，代码如下：

vector<int> dp(amount+1,amount+1);

对于base case，我们知道dp[0] = 0，但是注意dp[1] != 1,因为有一个硬币但不一定是一个一元的硬币，所有可能dp[1] = -1,因此不能将dp[1]放入base case中，代码如下：

        dp[0] = 0;// dp[1] = 1;

(4)确定遍历方向:

此题为顺序遍历，但是也要仔细理解一下

非常类似bfs的理解过程，我们先对dp[i]中所有金额从0-amount进行遍历，保证能够处理到所有的i（类似于走通每一层），然后对于每一个i我们都将所有的coin去除一次（所有的选择都选一次），选出最小的情况然后赋值给dp[i]

代码如下：

        for(int i = 0;i < amount+1;i++)for(int coin : coins){if(i - coin < 0)continue;dp[i] = min(dp[i],dp[i - coin] + 1);}

(5)：打印dp数组进行debug，此题过程比较简单就不演示了

完整代码如下：

class Solution {
public:int coinChange(vector<int>& coins, int amount) {vector<int> dp(amount+1,amount+1);if(amount == 0)return 0;dp[0] = 0;// dp[1] = 1;for(int i = 0;i < amount+1;i++)for(int coin : coins){if(i - coin < 0)continue;dp[i] = min(dp[i],dp[i - coin] + 1);}return dp[amount] == amount+1 ? -1 : dp[amount];}
};

2. 斐波那契数列

题目链接：509. 斐波那契数 - 力扣（LeetCode）

此题已经给出转移方程，并且dp数组的定义也较为清楚，base case给出，初始化时没有特殊要求，我们直接初始化为0就行了，并且也是顺序遍历，所有很容易写出如下代码：

class Solution {
public:int fib(int n) {if(n==0) return 0;vector<int> dp(n+1,0);dp[0] = 0;dp[1] = 1;for(int i = 2;i <= n;i++)dp[i] = dp[i-1] +dp[i-2];return dp[n];}
};

由于只涉及到两个数的处理，所以我们可以只保留这两个数，有如下优化代码：

class Solution {
public:int fib(int n) {if(n==0)return 0;if(n==1)return 1;int p=0,q=1,res=0;for(int i = 2;i <= n;i++){res = p + q;p = q;q = res;}return res;}
};