动态规划理论学习

文章目录

    • 1. 理论总结
      • 1.1 “一个模型”
      • 1.2 “三个特征”
        • 1.2.1 最优子结构
        • 1.2.2 无后效性
        • 1.2.3 重复子问题
    • 2. 实例剖析
      • 2.1 问题描述
      • 2.2 两种DP解题思路
        • 2.2.1 状态转移表
        • 2.2.2 状态转移方程
    • 3. 四种算法思想比较

1. 理论总结

动态规划理论总结为“一个模型、三个特征”。

1.1 “一个模型”

  • 它指的是动态规划适合解决的问题的模型。我把这个模型定义为“多阶段决策最优解模型"。
  • 一般是用动态规划来解决最优问题。
  • 解决问题的过程,需要经历多个决策阶段。每个决策阶段对应着一组状态。
  • 然后我们寻找一组决策序列,经过这组决策序列,能够产生最终期望求解的最优值。

1.2 “三个特征”

1.2.1 最优子结构

  • 问题的最优解包含子问题的最优解。
  • 反过来说就是,可以通过子问题的最优解,推导出问题的最优解。后面阶段的状态可以通过前面阶段的状态推导出来。

1.2.2 无后效性

  • 在推导后面阶段的状态时,我们只关心前面阶段的状态值,不关心这个状态是怎么一步一步推导出来的。
  • 某阶段状态一旦确定,就不受之后阶段的决策影响。只要满足前面提到的动态规划问题模型,其实基本上都会满足无后效性。

1.2.3 重复子问题

  • 不同的决策序列,到达某个相同的阶段时,可能会产生重复的状态。

2. 实例剖析

2.1 问题描述

一个n乘以n的矩阵w[n][n]。存储的都是正整数。棋子起始位置在左上角,终止位置在右下角。每次只能向右或者向下移动一位。把每条路径经过的数字加起来看作路径的长度。最短路径长度是多少?
在这里插入图片描述

  • 是否符合“一个模型”
  1. 从(0,0)走到(n-1,n-1),总共要走 2n-1 步,对应着 2n-1 个阶段。
  2. 每个阶段都有向右或向下走两种决策,并且每个阶段都会对应一个状态集合。
  3. 我们把状态定义为 min_dist(i,j),其中 i 表示行,j 表示列。min_dist 表达式的值表示从(0,0)到达(i,j)的最短路径长度。
  4. 所以,这个问题是一个多阶段决策最优解问题,符合动态规划的模型。
    在这里插入图片描述
  • 是否符合“三个特征”
  1. 我们可以用回溯算法来解决这个问题。自己写一下代码,画一下递归树,就会发现,递归树中有重复的节点。重复的节点表示,从左上角到节点对应的位置,有多种路线,这也能说明这个问题中存在重复子问题

    在这里插入图片描述

下面给出回溯解法

/*** @description: dp课第二节,案例回溯法求解* @author: michael ming* @date: 2019/7/19 19:55* @modified by: */
#include <iostream>
#define N 4//地图大小
#define k (2*N-1)//需要走的步数
using namespace std;
int selectWay[k], shortestWay[k];
void step(int (*map)[N], int s, int &mins, int r, int c, int idx)
{selectWay[idx++] = map[r][c];//记录选择的路if(r == N-1 && c == N-1){if(s < mins){mins = s;//更新最小的总路程for(int i = 0; i < k; ++i)//把最终的路线记录下来shortestWay[i] = selectWay[i];}return;}if(r == N || c == N)return;//走出地图边界了step(map,s+map[r+1][c],mins,r+1,c,idx);//往下走step(map,s+map[r][c+1],mins,r,c+1,idx);//往右走
}
int main()
{int s = 0, mins = 65535;int map[N][N] = {1,3,5,9,2,1,3,4,5,2,6,7,6,8,4,3};step(map,s+map[0][0],mins,0,0,0);cout << "最短路径是:" << mins << endl;cout << "走过的点的距离分别是:" << endl;for(int i = 0; i < k; ++i)cout << shortestWay[i] << " ";return 0;
}

在这里插入图片描述

  1. 走到(i,j)这个位置,只能通过(i-1,j),(i,j-1)这两个位置移动过来,也就是,想要计算(i,j)位置对应的状态,只需关心(i-1,j),(i,j-1)两个位置对应的状态,并不关心棋子是通过什么样的路线到达这两个位置。而且,我们仅仅允许往下和往右移动,不允许后退,所以,前面阶段的状态确定后不会被后面的决策所改变,所以,这个问题符合“无后效性”这一特征。

  2. 把从起始位置(0,0)到(i,j)的最小路径,记作函数min_dist(i,j)。因为只能往右或往下移动,所以只有可能从(i,j-1)或(i-1,j)两个位置到达(i,j)。到达(i,j)的最短路径肯定包含到达这两个位置的最短路径之一。换句话说就是,min_dist(i,j)可以通过min_dist(i,j-1)和min_dist(i-1,j)两个状态推导出来。这就说明,这个问题符合“最优子结构”。

    min_dist(i, j) = w[i][j] + min{min_dist(i, j-1), min_dist(i-1, j)}
    

2.2 两种DP解题思路

2.2.1 状态转移表

  • 一般能用动态规划的,都可以使用回溯暴力搜索。所以,可以先用简单的回溯算法解决,然后定义状态,对应画出递归树。

  • 从递归树中,我们很容易可以看出来,是否存在重复子问题,以及重复子问题是如何产生的。以此来寻找规律,看是否能用动态规划解决。

  • 找到重复子问题之后,有两种处理思路,第一种是回溯加“备忘录”的方法,来避免重复子问题。从效率上来讲,这跟动态规划的解决思路没有差别。

  • 第二种是使用动态规划,状态转移表法。

  • 先画出一个状态表,一般是二维的,可以把它想象成二维数组。其中,每个状态包含三个变量,行、列、数组值。

  • 根据决策的先后,从前往后,根据递推关系,分阶段填充状态表中的每个状态。最后,将这个递推填表的过程,翻译成代码,就是动态规划代码。

  • 尽管大部分状态表都是二维的,如果问题的状态比较复杂,需要很多变量来表示,那对应的状态表就是高维的,这个时候,不适合用状态转移表法来解决了。一方面高维状态转移表不好画图表示,另一方面人脑不擅长思考高维的东西。

  1. 根据回溯代码画出递归树,递归树中,一个状态(节点)包含三个变量(i,j,dist),其中i,j表示行和列,dist表示从起点到达点(i,j)的路径长度。图中看出,尽管(i,j,dist)不存在重复,但是(i,j)重复的有很多。对(i,j)重复的节点,我们只选择 dist最小的节点,继续递归求解,其他节点舍弃。
    在这里插入图片描述

  2. 画出二维状态表,表中行、列表示棋子位置,表中数值表示从起点到这个位置的最短路径。我们按照决策过程,将状态表填好。为了方便,我们按行来进行依次填充。

    在这里插入图片描述
    在这里插入图片描述

    dp状态表法代码如下:

    /*** @description: * @author: michael ming* @date: 2019/7/19 23:30* @modified by: */
    #include <iostream>
    #include <stack>
    #define N 4//地图大小
    using namespace std;
    void printShortestWay(int (*map)[N], int (*states)[N])
    {stack<int> path;path.push(map[N-1][N-1]);//终点for(int i = N-1,j = N-1; j != 0 && i != 0; ){if(states[i][j]-map[i][j] == states[i-1][j])path.push(map[--i][j]);//从上面过来的elsepath.push(map[i][--j]);//从左边过来的}path.push(map[0][0]);//起点cout << "走过的点的距离分别是:" << endl;while(!path.empty())//栈逆序弹出路径{cout << path.top() << " ";path.pop();}
    }
    void step_dp(int (*map)[N])
    {int (*states)[N] = new int [N][N];int i, j, sum = 0;for(j = 0; j < N; ++j)//初始化第一行状态{sum += map[0][j];states[0][j] = sum;}sum = 0;for(i = 0; i < N; ++i)//初始化第一列状态{sum += map[i][0];states[i][0] = sum;}for(i = 1; i < N; ++i)//填写状态表for(j = 1; j < N; ++j)states[i][j] = map[i][j]+min(states[i][j-1],states[i-1][j]);cout << "最短路径是:" << states[N-1][N-1] << endl;printShortestWay(map,states);delete [] states;return;
    }
    int main()
    {int map[N][N] = {1,3,5,9,2,1,3,4,5,2,6,7,6,8,4,3};step_dp(map);return 0;
    }
    

    在这里插入图片描述

2.2.2 状态转移方程

  • 状态转移方程法有点类似递归。根据最优子结构写出递归公式,也就是状态转移方程。

  • 有两种代码实现方法,一种是递归加“备忘录”,另一种是迭代递推。

    min_dist(i, j) = w[i][j] + min{min_dist(i, j-1), min_dist(i-1, j)}
    
  • 状态转移方程是解DP的关键。如果能写出状态转移方程,那DP问题基本上就解决一大半了。但是很多DP问题的状态本身就不好定义,状态转移方程也就更不好想到。

下面用递归加“备忘录”的方式,将状态转移方程翻译成代码。对于另一种实现方式,跟状态转移表法的代码实现是一样的,只是思路不同。

/*** @description: dp 状态方程 递归* @author: michael ming* @date: 2019/7/20 9:35* @modified by: */
#include <iostream>
#include <stack>
#define N 4//地图大小
using namespace std;
int states [N][N];
void printShortestWay(int (*map)[N])
{stack<int> path;path.push(map[N-1][N-1]);//终点for(int i = N-1,j = N-1; j != 0 && i != 0; ){if(states[i][j]-map[i][j] == states[i-1][j])path.push(map[--i][j]);//从上面过来的elsepath.push(map[i][--j]);//从左边过来的}path.push(map[0][0]);//起点cout << "走过的点的距离分别是:" << endl;while(!path.empty())//栈逆序弹出路径{cout << path.top() << " ";path.pop();}
}
int minDist(int (*map)[N], int i, int j)//从起点到i,j点的最小距离
{if(i == 0 && j == 0)//从起点到起点,返回该位置数值return map[0][0];if(states[i][j] > 0)//遇到算过的,直接返回结果return states[i][j];int minLeft, minUp;minLeft = minUp = 65535;if(j-1 >= 0)minLeft = minDist(map,i,j-1);//点左边的点的最小距离if(i-1 >= 0)minUp = minDist(map,i-1,j);//点上面的点的最小距离int currMinDist = map[i][j]+min(minLeft,minUp);states[i][j] = currMinDist;//备忘录更新return currMinDist;
}
int main()
{int map[N][N] = {1,3,5,9,2,1,3,4,5,2,6,7,6,8,4,3};cout << "最短路径是:" << minDist(map,N-1,N-1) << endl;printShortestWay(map);return 0;
}

在这里插入图片描述
强调一点,不是每个问题都同时适合这两种解题思路。有的问题可能用状态表更清晰,而有的问题可能用状态方程思路更清晰。

3. 四种算法思想比较

到现在为止,已经学习了四种算法思想,贪心、分治、回溯、动态规划

  • 贪心、回溯、动态规划,都可以抽象成多阶段决策最优解模型
  • 而分治解决的问题尽管大部分也是最优解问题,但是,大部分都不能抽象成多阶段决策模型
算法算法特点
回溯穷举所有的情况,然后对比得到最优解。时间复杂度非常高,指数级,只能用来解决小规模问题。大规模问题,执行效率很低
动态规划需要满足三个特征,最优子结构、无后效性和重复子问题,动态规划之所以高效,是因为回溯算法实现中存在大量的重复子问题
分治要求分割成的子问题,不能有重复子问题,与动态规划正好相反
贪心高效,代码简洁。可以解决的问题也有限。需要满足三个条件,最优子结构、无后效性和贪心选择性。“贪心选择性”的意思是,通过局部最优的选择,能产生全局的最优选择。每一个阶段,都选择当前看起来最优的决策,所有阶段的决策完成之后,最终由这些局部最优解构成全局最优解

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480079.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java多线程系列(四):4种常用Java线程锁的特点,性能比较、使用场景

多线程的缘由 在出现了进程之后&#xff0c;操作系统的性能得到了大大的提升。虽然进程的出现解决了操作系统的并发问题&#xff0c;但是人们仍然不满足&#xff0c;人们逐渐对实时性有了要求。 使用多线程的理由之一是和进程相比&#xff0c;它是一种非常花销小&#xff0c;切…

论文浅尝 | Global Relation Embedding for Relation Extraction

链接&#xff1a;https://arxiv.org/abs/1704.05958Introduction在关系抽取任务中&#xff0c;通常采用远程监督的方式自动生成数据集。由于实体对间可能存在多关系&#xff0c;生成的数据集往往存在大量噪音。本文对文本中的关系表述&#xff08;textual relation&#xff09;…

tensorflow--模型的保存和提取

参考&#xff1a; TensorFlow&#xff1a;保存和提取模型 最全Tensorflow模型保存和提取的方法——附实例 模型的保存会覆盖&#xff0c;后一次保存的模型会覆盖上一次保存的模型。最多保存近5次结果。应当保存效果最优时候的模型&#xff0c;而不是训练最后一次的模型。所以…

推荐模型是怎样由窄变宽、越变越深的?

星标/置顶小屋&#xff0c;带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 邢智皓编 | 兔子酱当前&#xff0c;深度学习推荐模型已经成功应用于推荐、广告、搜索等领域&#xff0c;但在了解它之前&#xff0c;简单回顾传统推荐模型仍是有必要的&#xff0c;原因如下&#xff1a;…

动态规划应用--找零钱

文章目录1. 问题描述2. 问题分析2.1 回溯法求解2.2 DP状态转移方程法2.3 DP状态转移表法1. 问题描述 找零问题&#xff0c;在贪心算法讲过。但是贪心不一定能得出最优解。假设有几种不同币值的硬币v1&#xff0c;v2&#xff0c;.……vn&#xff08;单位是元&#xff09;。如果…

玩转算法之面试第九章-动态规划

动态规划&#xff1a; 9-12 斐波那契数列 对重复计算&#xff0c;进行优化&#xff0c;进行记忆化搜索 假设基本的问题已经被解决&#xff0c;依次内推。 动态规划&#xff1a;将原问题拆解成若干个子问题&#xff0c;同时保存子问题的答案&#xff0c;使得每个子问题只求…

领域应用 | 从本体论开始说起——运营商关系图谱的构建及应用

本文转载自公众号&#xff1a;中国联通大数据。联通大数据技术专家闫龙将从“本体论”说起&#xff0c;为大家介绍联通大数据关系图谱的构建与应用。一&#xff0e;本体论万维网之父Tim Berners-Lee教授在1998年将语义网络&#xff08;Semantic web&#xff09;带入人类的视线。…

史上最强多线程面试44题和答案:线程锁+线程池+线程同步等

最全BAT必考题答案系列 最全MySQL面试60题和答案 史上最全Spring面试71题与答案 史上最全Redis面试49题&#xff08;含答案&#xff09;:哨兵复制事务集群持久化等 分布式缓存RedisMemcached经典面试题和答案 最全Java锁详解&#xff1a;独享锁/共享锁公平锁/非公平锁乐观锁…

部门直推!百度大搜索招聘NLP、搜索方向算法工程师!

星标/置顶小屋&#xff0c;带你解锁最萌最前沿的NLP、搜索与推荐技术工作职责负责百度搜索排序相关性&#xff08;Relevance&#xff09;策略。 职位要求-了解主流机器学习算法。 -优秀的分析问题和解决问题的能力&#xff0c;对解决具有挑战性问题充满激情。 -C/C语言编程&…

POJ 1276 ATM凑钱(动态规划)(未解答)

文章目录1. 题目1.1 题目链接1.2 题目大意1.3 解题思路2. 代码2.1 Accepted代码1. 题目 1.1 题目链接 http://poj.org/problem?id1276 1.2 题目大意 需要凑的钱最多100000&#xff0c;面额最多10种&#xff0c;每种张数最多1000&#xff0c;面额最大不超过1000 1.3 解题思…

论文浅尝 | 为基于知识库的问答构建形式查询生成

论文笔记整理&#xff1a;刘晓臻&#xff0c;东南大学计算机科学与工程学院本科生。Citation: H.Zafar, G. Napolitano, and J. Lehmann. Formal query generation for questionanswering overknowledge bases. ESWC, 2018.https://link.springer.com/content/pdf/10.1007%2F97…

Java多线程系列(十一):ReentrantReadWriteLock的实现原理与锁获取详解

我们继续Java多线程与并发系列之旅&#xff0c;之前我们分享了Synchronized 和 ReentrantLock 都是独占锁&#xff0c;即在同一时刻只有一个线程获取到锁。 然而在有些业务场景中&#xff0c;我们大多在读取数据&#xff0c;很少写入数据&#xff0c;这种情况下&#xff0c;如…

这篇顶会paper,讲述了疫情期间憋疯的你和我

星标/置顶小屋&#xff0c;带你解锁最萌最前沿的NLP、搜索与推荐技术编 | 小轶2020年净忙着见证历史了。年初疫情爆发后&#xff0c;大家的生活模式也因为疫情发生了巨变。经历了史上最长假期&#xff0c;躺尸太久&#xff0c;到后来满脑子只想开学/复工。今年KDD会议上有一篇很…

论文浅尝 | Knowledge Vault: 全网规模的知识概率融合方法

论文笔记整理&#xff1a;吴桐桐&#xff0c;东南大学博士生&#xff0c;研究方向为自然语言处理。链接&#xff1a;https://www.cs.ubc.ca/~murphyk/Papers/kv-kdd14.pdf基于机器学习&#xff0c;Knowledge Vault不仅能够从多个来源&#xff08;文本&#xff0c;表格数据&…

java程序员的必用的9款开发工具

今天推荐java程序员开发利器&#xff0c;包含如如下&#xff1a; 开发环境&#xff1a; Eclipse IntelliJ IDEA IntelliJ在业界被公认为最好的java开发工具之一&#xff0c;尤其在智能代码助手、代码自动提示、重构、J2EE支持、各类版本工具&#xff08;git、svn等&#xff…

动态规划应用--搜索引擎拼写纠错

文章目录1. 字符串相似度1.1 莱文斯坦距离1.2 最长公共子串长度2. 计算编辑距离2.1 莱文斯坦距离2.2 最长公共子串长度3. 搜索引擎拼写纠错4. 练习题在 Trie树那节讲过&#xff0c;利用Trie可以进行关键词提示&#xff0c;节省输入时间。在搜索框中你不小心打错了字&#xff0c…

玩转算法之面试第十章-贪心算法

leetcode 455 分配饼干 尝试将最大的饼干给最贪心的朋友 如果满足&#xff0c;则1 如果不满足&#xff0c;则将最大的饼干给次贪心的朋友&#xff0c;一次类推 试图让最多的小朋友开心 在这里插入代码片 #include<iostream> #include<vector>using namespace …

论文浅尝 | 基于知识库的自然语言理解 04#

本文转载自公众号&#xff1a;知识工场。罗康琦&#xff0c;上海交通大学计算机系2019届博士&#xff0c;研究方向为自然语义理解和知识图谱。2012年获得华中科技大学软件工程学士学位&#xff0c;现就职于京东数据科学实验室&#xff08;Data Science Lab&#xff09;。他曾在…

BERT跨模态之后:占领了视觉常识推理任务榜单TOP 2!

星标/置顶小屋&#xff0c;带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 小鹿鹿lulu编 | YY前言由于 BERT-like 模型在 NLP 领域上的成功&#xff0c;研究者们开始尝试将其应用到更为复杂的 多模态 任务上。要求模型除文本数据以外&#xff0c;还要接收其他模态的数据&#xf…

常见的算法面试问题以及代码实现

1 时间复杂度分析 一个简单的时间测试代码如下&#xff1a; #include<iostream> #include<cmath> #include<ctime>using namespace std;int main(){for(int x1;x<9;x){int npow(10,x);clock_t startTimeclock();int sum0;for(int i0;i<n;i)sumi;clock…