动态规划章节理论基础:
https://programmercarl.com/%E5%8A%A8%E6%80%81%E8%A7%84%E5%88%92%E7%90%86%E8%AE%BA%E5%9F%BA%E7%A1%80.html
123.买卖股票的最佳时机III
题目链接:https://leetcode.cn/problems/best-time-to-buy-and-sell-stock-iii/
思路:
这道题目相比前两道又进一步增加了难度,关键在于至多可以买卖两次,这意味着可以买卖一次,可以买卖两次,也可以不买卖。
动规五部曲:
(1)确定dp数组以及下标含义
一天一共就有五个状态,
0 => 没有操作 (其实我们也可以不设置这个状态)
1 => 第一次持有股票
2 => 第一次不持有股票
3 => 第二次持有股票
4 => 第二次不持有股票
dp[i][j]中 i表示第i天,j为 [0 - 4] 五个状态,dp[i][j]表示第i天状态j所剩最大现金。
需要注意:dp[i][1],表示的是第i天,买入股票的状态,并不是说一定要第i天买入股票,这是很多同学容易陷入的误区。
例如 dp[i][1] ,并不是说 第i天一定买入股票,有可能 第 i-1天 就买入了,那么 dp[i][1] 延续买入股票的这个状态。
(2)确定递归公式
达到dp[i][1]状态,有两个具体操作:
操作一:第i天买入股票了,那么dp[i][1] = dp[i-1][0] - prices[i]
操作二:第i天没有操作,而是沿用前一天买入的状态,即:dp[i][1] = dp[i - 1][1]
一定是选最大的,所以 dp[i][1] = max(dp[i-1][0] - prices[i], dp[i - 1][1]);
同理dp[i][2]也有两个操作:
操作一:第i天卖出股票了,那么dp[i][2] = dp[i - 1][1] + prices[i]
操作二:第i天没有操作,沿用前一天卖出股票的状态,即:dp[i][2] = dp[i - 1][2]
所以dp[i][2] = max(dp[i - 1][1] + prices[i], dp[i - 1][2])
同理可推出剩下状态部分:
dp[i][3] = max(dp[i - 1][3], dp[i - 1][2] - prices[i]);
dp[i][4] = max(dp[i - 1][4], dp[i - 1][3] + prices[i]);
(3)dp数组初始化
第0天没有操作,这个最容易想到,就是0,即:dp[0][0] = 0;
第0天做第一次买入的操作,dp[0][1] = -prices[0];
第0天做第一次卖出的操作,这个初始值应该是多少呢?
此时还没有买入,怎么就卖出呢? 其实可以理解当天买入,当天卖出,所以dp[0][2] = 0;
第0天第二次买入操作,初始值应该是多少呢?应该不少人疑惑,第一次还没买入呢,怎么初始化第二次买入呢?
第二次买入依赖于第一次卖出的状态,其实相当于第0天第一次买入了,第一次卖出了,然后再买入一次(第二次买入),那么现在手头上没有现金,只要买入,现金就做相应的减少。
所以第二次买入操作,初始化为:dp[0][3] = -prices[0];
同理第二次卖出初始化dp[0][4] = 0;
(4)确定遍历顺序
从递归公式其实已经可以看出,一定是从前向后遍历,因为dp[i],依靠dp[i - 1]的数值。
(5)举例推导dp数组
以输入[1,2,3,4,5]为例
现在最大的时候一定是卖出的状态,而两次卖出的状态现金最大一定是最后一次卖出。如果想不明白的录友也可以这么理解:如果第一次卖出已经是最大值了,那么我们可以在当天立刻买入再立刻卖出。所以dp[4][4]已经包含了dp[4][2]的情况。也就是说第二次卖出手里所剩的钱一定是最多的。
代码:
class Solution {public int maxProfit(int[] prices) {// 0 代表没有操作 (也可以不设置)// 1 代表第一次持有// 2 代表第一次不持有// 3 代表第二次持有// 4 代表第二次不持有int[][] dp = new int[prices.length][5];dp[0][1] = -prices[0];dp[0][3] = -prices[0];for(int i = 1;i<prices.length;i++){// 没有操作 或者 第一次买入dp[i][1] = Math.max(dp[i-1][1], -prices[i]);dp[i][2] = Math.max(dp[i-1][2], prices[i] + dp[i-1][1]);dp[i][3] = Math.max(dp[i-1][3], -prices[i] + dp[i-1][2]);dp[i][4] = Math.max(dp[i-1][4], prices[i] + dp[i-1][3]);} return dp[prices.length-1][4];}
}
188.买卖股票的最佳时机IV
题目链接:https://leetcode.cn/problems/best-time-to-buy-and-sell-stock-iv/description/
思路:
这道题目可以说是动态规划:123.买卖股票的最佳时机III的进阶版,这里要求至多有k次交易。
动规五部曲:
(1)确定dp数组以及下标含义
使用二维数组 dp[i][j] :第i天的状态为j,所剩下的最大现金是dp[i][j]
j的状态表示为:
0 表示不操作
1 第一次买入
2 第一次卖出
3 第二次买入
4 第二次卖出
…
应该发现规律了吧 ,除了0以外,偶数就是卖出,奇数就是买入。
题目要求是至多有K笔交易,那么j的范围就定义为 2 * k + 1 就可以了。
(2)确定递归公式
还要强调一下:dp[i][1],表示的是第i天,买入股票的状态,并不是说一定要第i天买入股票,
达到dp[i][1]状态,有两个具体操作:
操作一:第i天买入股票了,那么dp[i][1] = dp[i - 1][0] - prices[i]
操作二:第i天没有操作,而是沿用前一天买入的状态,即:dp[i][1] = dp[i - 1][1]
选最大的,所以 dp[i][1] = max(dp[i - 1][0] - prices[i], dp[i - 1][1]);
同理dp[i][2]也有两个操作:
操作一:第i天卖出股票了,那么dp[i][2] = dp[i - 1][1] + prices[i]
操作二:第i天没有操作,沿用前一天卖出股票的状态,即:dp[i][2] = dp[i - 1][2]
所以dp[i][2] = max(dp[i - 1][1] + prices[i], dp[i - 1][2])
(3)dp数组初始化
第0天没有操作,这个最容易想到,就是0,即:dp[0][0] = 0;
第0天做第一次买入的操作,dp[0][1] = -prices[0];
第0天做第一次卖出的操作,这个初始值应该是多少呢?
此时还没有买入,怎么就卖出呢? 其实大家可以理解当天买入,当天卖出,所以dp[0][2] = 0;
同理,dp[0][j] 当j为奇数的时候,都初始化为-prices[0]
(4)确定遍历顺序
从前向后遍历,因为dp[i],依靠dp[i - 1]的数值。
(5)举例推导dp数组
以输入[1,2,3,4,5],k=2为例。
代码:
class Solution {public int maxProfit(int k, int[] prices) {// dp[i]代表第i次持有// dp[i+1]代表第i次不持有int[][] dp = new int[prices.length][2 * k + 1];for (int i = 1; i < 2 * k; i += 2) {dp[0][i] = -prices[0];}for (int i = 1; i < prices.length; i++) {for (int j = 1; j <= 2 * k; j += 2) {// 持有:不操作 或者 当日买入dp[i][j] = Math.max(dp[i - 1][j], -prices[i] + dp[i - 1][j - 1]);// 不持有: 不操作 或者 当日卖出dp[i][j + 1] = Math.max(dp[i - 1][j + 1], prices[i] + dp[i - 1][j]);}}return dp[prices.length - 1][2 * k];}
}