【数据结构与算法】【算法思想】贪心算法

贪心算法
回溯算法
分治算法
动态规划

四种基本的算法思想:贪心算法,分治算法,回溯算法,动态规划,他们不是具体算法,常用来指导我们设计具体的算法和编码等。

一:贪心算法有很多经典应用

霍夫曼编码(Huffman Coding),Prim和Kruskal最小生成数算法,Dijkstra单源最短路径算法。

二:如何理解“贪心算法”

假设我们有一个可容纳100kg物品的背包,可以装下各种物品,我们有以下5中豆子,每种豆子的总量和总价值都各不相同。为了让背包中所装物品的总价最大,该如何?

第一步:当我们看到这类问题时,首先要联想到贪心算法:针对一组数据,定义了限制值和期望值,系统从中选出几个数据,在满足限制值的情况下,期望值最大。
第二步:尝试看这个问题是否可以用贪心算法解决:每次选择当前情况下,在对限制值同等贡献量的情况下,对期望值贡献最大的数据
第三步:举几个例子看下贪心算法产生的结果是否最优的。大部分情况下,举几个例子验证一下就可以了。严格的证明贪心算法的正确性,非常复杂,需要涉及较多的数学推理。并且,从实践的角度来说,大部分能用贪心算法的问题,贪心算法的正确性都是显而易见的,月不需要严格的数学推导证明。

贪心算法,专注于当下最优,但可能无法取得全局最优。

贪心算法实战分析

一:分糖果

有m个糖果和n个孩子,但m<n,所以糖果只能分配给一部分孩子。
每个糖果的大小不等,分为s1,s2……sm。除此之外,每个孩子对糖果大小的需求也是不一样的,只有糖果的大小>=孩子对糖果大小的需求分别是g1,g2,g3……gn。
如何分配才可能满足最多数量的孩子?

可将这个问题抽象成:从n个孩子中抽取一部分孩子分配糖果,让满足的孩子个数(期望值)是最大的。这个问题的限制值就是糖果个数m。

对于一个孩子而言,如果小的糖果可以满足,我们就没必要用更大的糖果,这样更大的就可以留给其他对糖果大小需求更大的孩子。另一方面,对糖果大小需求小的孩子更容易被满足,所以,我们可以从需求小的孩子开始分配他糖果。因为满足一个需求大的孩子跟满足一个需求小的孩子,对我们期望值贡献是一样的。

二:钱币找零(部分题目不适用 100 99 1 找396 )

假设有1元,2元,5元,10元,50元,100元这些面额的纸币,他们的张数分别是c1,c2,c5,c10,c20,c50,c100。我们要有支付k元,最少要用多少张纸币呢?

在贡献相同期望值(纸币数目)的情况下,我们希望多贡献点金额,这样就可以让纸币数更少。这就是一种贪心算法的解决思路。

三:区间覆盖

假设有n个区间,区间的起始端点和结束端点分分别是[l1,r1],[l2,r2],[l3,r3]……,从n个区间中选出一部分区间,这部分区间满足两两不相交(端点相交的情况不算相交),最多能选出多少个区间?

我们假设这 n 个区间中最左端点是 lmin,最右端点是 rmax。这个问题就相当于,我们选择几个不相交的区间,从左到右将[lmin, rmax]覆盖上。我们按照起始端点从小到大的顺序对这 n 个区间排序。
我们每次选择的时候,左端点跟前面的已经覆盖的区间不重合的,右端点又尽量小的,这样可以让剩下的未覆盖区间尽可能的大,就可以放置更多的区间。这实际上就是一种贪心的选择方法。
在这里插入图片描述

四:如何用贪心算法实现霍夫曼编码?

假设有一个包含1000个字符的文件,每个字符占1个byte(1byte=8bits),存储这1000个字符就一共需要8000bits。
但使用霍夫曼编码,可实现压缩率在20%~90%之间。
霍夫曼编码不仅会考察文本汇总有多少个不同字符,还会考察每个字符出现的频率,根据频率的不同,选择不同长度的编码。霍夫曼编码试图用这种不等长的编码方法,来进一步增加压缩的效率。
根据贪心的思想,可以把出现频率比较多的字符,用稍微短一些的编码;出现频率比较少的字符,用稍微长一些的编码。
由于霍夫曼编码是不等长的,每次应该读取1为还是2位,3位等来解压缩是个问题,这个问题导致霍夫曼编码解压缩比较复杂。
为了避免解压缩过程中的歧义,霍夫曼编码要求各个字符的编码之间,不会出现某个编码是另一个编码前缀的情况。

假设这6个字符出现的频率从高到低依次是a,b,c,d,e,f。我们把它们编码下面这个样子,任何一个字符的编码都不是另一个的前缀,在解压缩的时候,我们每次会读取尽可能长的可解压缩的二进制,所以在解压缩的时候也不歧义。
在这里插入图片描述

根据字符出现频率的不同,给不同的字符进行不同长度的编码的实现方式
把每个字符看作一个节点,并且辅带着把频率放到优先级队列中。从队列中取出频率最小的两个节点A,B,然后新建一个节点C,把频率设置为两个节点的频率之和,并把这个新节点C作为节点A,B的父节点。最后再把C节点放入到优先级队列中。重复这个过程,直到队列中没有数据。
在这里插入图片描述

給每一条边画上一个权值,指向左子节点的边,我们统统标记为0,指向右子节点的边,我们统统标记为1,那从根节点到叶节点的路径就是叶节点对应字符的霍夫曼编码

在这里插入图片描述

笔记整理来源: 王争 数据结构与算法之美

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/424831.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第六十四期:微软将不再把 .NET Framework API 移植到 .NET Core 3.0

投递人 itwriter 目前 .NET Core 3.0 拥有的 API 总数约为 .NET Framework API 的 80%&#xff0c;剩下尚未从 .NET Framework 移植到 .NET Core 的 API&#xff0c;微软考虑以开源的形式发布。 微软方面表示&#xff0c;通过 .NET Core 3.0&#xff0c;他们现在已具备轻松移植…

array专题5

#561 Array Partition I# 思路&#xff1a;题目要求数组中所有数字配对后&#xff0c;每一对中最小值加和sum&#xff0c;sum要尽可能大。我的第一反应就是暴力枚举。下标为0的数值可能匹配的下标有&#xff1a;1,2,3…n-1&#xff1b;接着计算下标为1的数值可能匹配的下标有哪…

第六十五期:IBM净利润下降38%,旧时代巨头如何自救?

投递人 itwriter 图片来自“123RF” 10 月 17 日&#xff0c;IBM 发布 2019 年第三季度财报&#xff0c;数据显示&#xff0c;其营收为 180.28 亿美元&#xff0c;同比下降 3.9%&#xff0c;其利润为 16.72 亿美元&#xff0c;同比下降约 38%。我们看到 IBM 的营收和利润都呈现…

【数据结构与算法】【算法思想】分治算法

贪心算法 回溯算法 分治算法 动态规划 MapReduce本质就是分治算法&#xff0c;是Google大数据处理的三驾马车之一&#xff0c;另外两个是GFS和Bigtable。它在倒排索引&#xff0c;PageRank计算&#xff0c;网页分析等搜索引擎相关的技术中都有大量的应用。 MapReduce 框架只是…

arry-718 Maximum Length of Repeated Subarray

题目&#xff1a;Input: A: [1,2,3,2,1] B: [3,2,1,4,7] Output: 3 Explanation: The repeated subarray with maximum length is [3, 2, 1]. 思路&#xff1a;要找到两个数组中重复数据最长的子数组的长度。暴力枚举&#xff1a;每个A的下标i&#xff0c;分别与B的每个下…

第六十六期:软件架构之道的一次感悟

张泰峰 6月3日 写在前面 2019悄悄溜走一半&#xff0c;无论是离别的忧愁&#xff0c;还是成长路途的艰辛&#xff0c;都在心中滚烫。 距离上一篇文章已经很久了... 懒惰的博主不能将这一切归结于我的时间、我的规划、我的工作&#xff0c;只能怪自己懒......正所谓学如逆水行…

[Leetcode][第332题][JAVA][重新安排行程][欧拉回路 / 欧拉通路][优先队列][DFS]

【问题描述】[中等] 【解答思路】 递归 复杂度 class Solution {Map<String, PriorityQueue<String>> map new HashMap<String, PriorityQueue<String>>();List<String> itinerary new LinkedList<String>();public List<String&g…

不会配置HTTPS?给我5分钟,手把手教你

本文针对不会配置HTTPS或者小白开发着&#xff0c;请大佬们自动忽略。非广告&#xff0c;心得分享&#xff0c;勿喷&#xff0c;谢谢。 正文开始 01、关于 FreeSSL.cnFreeSSL.cn 是一个免费提供 HTTPS 证书申请、HTTPS 证书管理和 HTTPS 证书到期提醒服务的网站&#xff0c;旨在…

第三十三期:使用wireshark抓包分析-抓包实用技巧

杰哥很忙 7月9日 前言 本文整理一下日常抓包使用的一些方法及抓包分析的一些方法。 本文基于wireshark2.2.6版本进行抓包处理。其他版本使用方式大同小异。 自定义捕获条件 wireshark可以将抓包数据保存到硬盘上。若需要长时间抓包的话&#xff0c;需要防止内存过大&#x…

Floyd判圈算法

leetcode习题287 Find the Duplicate Number 在答案中看到了floyd’s tortoise and hare 算法&#xff0c;知道了如果有限状态机、迭代函数或者链表存在环&#xff0c;那么是需要算法检测环是否存在。检测算法有三种:Floyd龟兔算法、Brent算法、Gosper算法。 Floyd龟兔算法 算…

【数据结构与算法】【算法思想】【联系与区别】回溯 贪心 动态规划 分治

4种算法思想比较与联系 如果将贪心&#xff0c;分治&#xff0c;回溯和动态规划四种算法思想分类&#xff0c;那贪心&#xff0c;回溯&#xff0c;动态规划可归为一类&#xff0c;而分治单独可以作为一类&#xff0c;因为它跟其他是三个都不大一样。 因为前三个算法解决问题的…

Idea debug时报错:Command line is too long

问题&#xff1a;git pull下的项目&#xff0c;debug时&#xff0c;报错如下图 解决方法 在项目/.idea/workspace.xml文件中添加一行代码如下 <component name"PropertiesComponent">...<property name"dynamic.classpath" value"true"…

第三十四期:一次非常有意思的sql优化经历

风过无痕的博客 6月24日 场景 我用的数据库是mysql5.6&#xff0c;下面简单的介绍下场景 课程表&#xff1a; create table Course(c_id int PRIMARY KEY,name varchar(10)) 数据100条 学生表: create table Student(id int PRIMARY KEY,name varchar(10)) 数据70000条…

array专题6

78. Subsets 思路1&#xff1a;深度优先搜索&#xff1a;每个位置都有选&#xff0c;和 不选两种选择。退出条件是下标出界。 public List<List<Integer>> subsetsV3(int[] nums) {List<List<Integer>> result new ArrayList<List<Integer>…

[Leetcode][第657题][JAVA][机器人能否返回原点][数组][HashMap]

【问题描述】[简单] 【解答思路】 遍历方向 看是否回到原点 或者 “上下” “左右”两个方向的数量是否相等 1. 方向 时间复杂度&#xff1a;O(N) 空间复杂度&#xff1a;O(1) class Solution {public boolean judgeCircle(String moves) {int x 0,y 0;int len moves.len…

网站公共部分的复用

一个网站的公共部分因为是一样的&#xff0c;可以通过公共部分的复用来减少代码的重复&#xff0c;同时也利于代码的后期维护。 关于公共部分复用的方法有很多&#xff0c;这里提供一些方法&#xff08;持续更新&#xff09; 利用ajax请求组件&#xff08;单个HTML&#xff09;…

第三十五期:当我们在讨论CQRS时,我们在讨论些神马?

thz 6月18日 当我写下这个标题的时候&#xff0c;我就有些后悔了&#xff0c;题目有点大&#xff0c;不太好控制。但我还是打算尝试一下&#xff0c;通过这篇内容来说清楚CQRS模式&#xff0c;以及和这个模式关联的其它东西。希望我能说得清楚&#xff0c;你能看得明白&#x…

【数据结构与算法】【算法思想】回溯算法

贪心算法 回溯算法 分治算法 动态规划 回溯算法思想应用广泛&#xff0c;除了用来指导深度优先搜索这种经典算法设计之外&#xff0c;还可以用在如正则表达式匹配&#xff0c;编译原理中的语法分析等。 除此之外&#xff0c;很多经典的数学问题都可以用回溯算法解决&#xff…

90 Subsets II

90 Subsets II leetcode第90题&#xff0c;用深度优先搜索的思路写出了三种不同的代码。一道题目&#xff0c;同样是深度优先搜索的问题&#xff0c;因为看问题角度不同&#xff0c;思路不同&#xff0c;代码也不一样 /*** [1,2,2,3] [] [1] [1,2] [1,2](重复) 情况&#xff1a…

2019 DDCTF 部分writeup

网上的wp已经很多了&#xff0c;但wp普遍很简略。我尽量写的详细一点。 一、WEB 滴~ 拿到题目后首先右键查看源代码&#xff0c;发现图片是以base64传送的 而且看url发现里面应该是包含了文件名&#xff0c;并且用了某个编码。测试过后是转16进制ascii码后两层bases64 &#xf…