数据结构与算法--最小的k个数

最小的k个数

  • 题目:输入n个整数,找出其中最小的k个数,例如输入4,5,6,7,8,9这六个数字,则最小的4个是4,5,6,7
方案一
  • 还是最直观的方法,先排序,最快的是快排O(nlog2n),然后遍历前面k个数组,得到我们需要的答案,这个最简单方案应该有更优实现
方案二
  • 题意,我们需要找出最小的k个数字,还是从快排的思路收到启发
  • 我们同样基于快速排序,但是只找出第k个大的数字
  • 因为快排过程中会将比基准值小的放到 之前,比基准值大的放到后面,因此只需要找到第k个大的数字,在之前的数就是我们需要的数
  • 基于如上分析有如下代码:
/*** 找出数组中最小的K个数** @author liaojiamin* @Date:Created in 10:18 2021/6/16*/
public class GetLeastNumbers {public static void main(String[] args) {Integer[] arrayData = new Integer[20];Random random = new Random();for (int i = 0; i < 20; i++) {arrayData[i] = random.nextInt(50);System.out.print(arrayData[i]+",");}System.out.println();Integer[] newArray = getLeastNumbers(arrayData, 10);for (Integer integer : newArray) {System.out.print(integer+",");}}/*** 按快速排序思路,找到第k个大的数,将小的放k前面* 将大的放k后,得到数组中最小的k个数就是下标是0~k的所有数*/public static Integer[] getLeastNumbers(Integer[] array, Integer key) {if (array == null || array.length <= 0 || array.length < key) {return new Integer[]{};}if (array.length == key) {return array;}return quickSort(array, 0, array.length-1, key);}public static Integer[] quickSort(Integer[] array, Integer left, Integer right, Integer key) {if (left < right) {Integer middle = quickSortSwap(array, left, right);if (middle == key) {return Arrays.copyOfRange(array, 0, key);}quickSort(array, left, middle - 1, key);quickSort(array, middle + 1, right, key);}return Arrays.copyOfRange(array, 0, key);}public static Integer quickSortSwap(Integer[] array, Integer left, Integer right) {if (left < right) {Integer position = array[left];while (left < right) {while (left < right && array[right] > position) {right--;}if (left < right) {array[left] = array[right];left++;}while (left < right && array[left] < position) {left++;}if(left < right){array[right] = array[left];right --;}}array[left] = position;}return left;}
}
  • 基于快排的方案是有限制的,因为我们需要修改输入的数组,最后的顺序是变化的,如果要求不能修改输入的参数,我们是否有其他方案。
方案三
  • 既然不能修改原值,那么我们复制一个我们需要的值,还是空间换时间的做法
  • 我们建一个原数组大小的容器用来存储,接着在容器中找出最小的k个数
  • 本次我们需要的存储的特点是能快速的找到最小值,这样重复查找k次最小值,就能得到结果
  • 如果我们用二叉查找树来实现这个容器,那么我们每次查询的时间复杂度是O(logn),也就是层高度,那么k次查询就是O(klogn)
  • 但是还有其他变种的二叉查找树二叉堆中对小堆,之前文章:数据结构与算法–二叉堆(最大堆,最小堆)实现及原理对最大堆,最小堆的实现有详细的解释
  • 最小堆的特点在于能在O(1)时间内找到最小值,就是二叉堆的根节点
  • 并且二叉堆的结构特性就在于能够快速的查询,我们将所有数据构造成一个最小堆,然后经k次O(1)的操作,就能得到结果
  • 经如上分析有如下代码:
/*** 找出数组中最小的K个数** @author liaojiamin* @Date:Created in 10:18 2021/6/16*/
public class GetLeastNumbers {public static void main(String[] args) {Integer[] arrayData = new Integer[20];Random random = new Random();for (int i = 0; i < 20; i++) {arrayData[i] = random.nextInt(50);System.out.print(arrayData[i]+",");}System.out.println();Integer[] heapArray = getLeastNumbersByBinaryHeapMax(arrayData, 10);for (int i = 0; i < heapArray.length; i++) {System.out.print(heapArray[i]+",");}}/*** 利用二叉堆,最小堆的结构特性,构建最小堆后,每次去跟节点都是最小的节点* 循环取k个最小堆中根元素,得到我们的结果* */public static Integer[] getLeastNumbersByBinaryHeapMax(Integer[] array, Integer key){if (array == null || array.length <= 0 || array.length < key) {return new Integer[]{};}if (array.length == key) {return array;}Integer size = (array.length + 2 )*11/10;BinaryHeap binaryHeap = new BinaryHeap(size);for (int i = 0; i < array.length; i++) {binaryHeap.insert(new AnyType(array[i]));}Integer[] result = new Integer[key];for (Integer i = 0; i < key; i++) {result[i] = Integer.valueOf(binaryHeap.deleteMin().getElement().toString());}return result;}
}

方案四

  • 如上最小堆的实现中虽然找最小值都是O(1),但是在构造最小堆的过程中我们需要O(logn)的时间复杂度,如果题目要是海量数据,其实我们也可以用最大堆
  • 我们可以用k个元素的最大堆,当堆满后,每次读入原数组中一个数据,与最大数据比较(O(1)时间)
  • 如果比最大数据要小,我们删除最大数据,插入当前值,直到整个数组遍历完
  • 此时得到的最大堆中k个数据就是我们需要的数据
  • 这种方案可以用来处理海量数据时候内存占用过多的问题。
  • 海量数据情况下,空间复杂度O(k)的实现方式如下:
/*** 找出数组中最小的K个数** @author liaojiamin* @Date:Created in 10:18 2021/6/16*/
public class GetLeastNumbers {public static void main(String[] args) {Integer[] arrayData = new Integer[20];Random random = new Random();for (int i = 0; i < 20; i++) {arrayData[i] = random.nextInt(50);System.out.print(arrayData[i]+",");}System.out.println();Integer[] maxArray = getLeastNumberByBinaryHeapMax(arrayData, 10);for (Integer integer : maxArray) {System.out.print(integer+",");}}/*** 利用二叉堆,最大堆,处理海量数据情况下获取前k个最小的数据* */public static Integer[] getLeastNumberByBinaryHeapMax(Integer[] array, Integer key){if (array == null || array.length <= 0 || array.length < key) {return new Integer[]{};}if (array.length == key) {return array;}Integer size = (array.length+2)*11/10;BinaryHeapMax binaryHeapMax = new BinaryHeapMax(size);for (int i = 0; i < array.length; i++) {AnyType anyType = new AnyType(array[i]);if(binaryHeapMax.heapSize() >= key){Integer heapMax =  Integer.valueOf(binaryHeapMax.findMax().getElement().toString());if(array[i] < heapMax){binaryHeapMax.deleteMax();binaryHeapMax.insert(anyType);}}else {binaryHeapMax.insert(anyType);}}AnyType[] anyTypes = binaryHeapMax.getAppHeapData();Integer[] result = new Integer[key];for (int i = 0; i < anyTypes.length; i++) {result[i] = Integer.valueOf(anyTypes[i].getElement().toString());}return result;}
}
解法对比
  • 第一种方案直接排序遍历平均时间复杂度是O(nlog2n),比第二种思路上更容易理解,但是同时也有明显的限制会修改入参数组
  • 第二种解法,也是基于快排思路,但是可以在中间退出,因此时间复杂度小于O(nlog2n),同样也会修改入参数组
  • 第三种方法,最小堆的方式,先构建最小堆,在读取,这种有两个明显优点,一个是没有修改输入的数据,因为我们只是读取入参数组中的数字,所有写操作都是在最小堆中完成,二是解法简单,缺点也明显,时间复杂度更大,构建时候需要insert,n次,每次insert的平均时间复杂度是O(logn),因此是O(nlogn)
  • 第四种算法适合海量数据的输入,如果题目要求的是海量数数据中找k个数,内存的大小限制,不可能全读取如内存,这时候,我们只一次读取一个数据进内存,只要求内存容纳的下最大堆中的k个数据即可,能有效解决n很大,k很小的情况,时间复杂度也是O(nlogk)

上一篇:数据结构与算法–两个链表中第一个公共节点
下一篇:数据结构与算法–数字在排序数组中出现次数

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/310350.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何将 Azure 上的 Ubuntu 19.10 服务器升级到 20.04

点击上方蓝字关注“汪宇杰博客”导语Ubuntu 20.04 LTS 已经正式推出了。作为一名软粉&#xff0c;看到新版鲍叔毒瘤&#xff0c;我当然是激动万分&#xff0c;抱着批判的态度&#xff0c;第一时间很不情愿的更新了我的服务器。4月23日发布的 Ubuntu 20.04 是个 LTS 版。其 Linu…

死磕 Java 8 的日期处理

TIME Java 8 推出了全新的日期时间API并且已经很久了&#xff0c;因为业务中遇到的时间处理的还是不多&#xff0c;因此用的也少&#xff0c;而且大多是用封装好的时间共计包&#xff0c;就更少接触java8 的时间类型API了&#xff0c;因此对他不是很熟&#xff0c;今天遇到了一…

我想快速给WPF程序添加托盘菜单

我想...1 简单要求&#xff1a;使用开源控件库在XAML中声明托盘菜单&#xff0c;就像给控件添加ContextMenu一样封装了常用命令&#xff0c;比如&#xff1a;打开主窗体、退出应用程序等TerminalMACS我在TerminalMACS中添加了托盘菜单&#xff0c;最终实现的托盘菜单效果&#…

【半译】在ASP.NET Core中创建内部使用作用域服务的Quartz.NET宿主服务

在我的上一篇文章《在ASP.NET Core中创建基于Quartz.NET托管服务轻松实现作业调度》&#xff0c;我展示了如何使用ASP.NET Core创建Quartz.NET托管服务并使用它来按计划运行后台任务。不幸的是&#xff0c;由于Quartz.NET API的工作方式&#xff0c;在Quartz作业中使用Scoped依…

mysql技术分享-- 视图是什么

视图 最近遇到mysql锁相关问题&#xff0c;在查阅资料时候&#xff0c;经常能看到在锁的解释中总有视图的概念出现&#xff0c;因此我觉得有必要先去了解一下视图相关的详细信息&#xff0c;有助于我对mysql锁相关的理解。视图&#xff08;View&#xff09;是一个命名的虚拟表…

在 Visual Studio 2019 中为 .NET Core WinForm App 启用窗体设计器

当我们在使用 Visual Studio 2019 非预览版本开发 Windows Forms App (.NET Core) 应用程序时是不能使用窗体设计器的。即使在窗体文件上右击选择“显示设计器”菜单&#xff0c;仍旧只能看到代码&#xff0c;无法打开窗体设计器。根据微软开发者博客的描述&#xff0c;我们可以…

mysql技术分享--表分区实现

分区表 分区概念 分区功能并不是在存储引擎层完成的&#xff0c;因此不止有InnoDB存储引擎支持分区&#xff0c;常见的存储引擎MyISAM&#xff0c;NDB等都支持。但是也并不是所有存储引擎都支持&#xff0c;比如CSV&#xff0c;FEDERATED&#xff0c;MERGE等就不支持&#xf…

视频号,张小龙的星辰大海

阅读本文大概需要 4.1分钟。前段时间&#xff0c;微信开通了视频号。本想第一时间写一篇文章&#xff0c;分析下视频号。发现理解还不深入&#xff0c;于是这段时间一直在思考视频号对微信的战略意义和它的前景。思考了接近1个月&#xff0c;想明白了一些事情&#xff0c;有时候…

[Java基础]List集合子类特点

ArrayList练习: package test19;import java.util.ArrayList; import java.util.Iterator;public class ArrayListDemo {public static void main(String[] args){ArrayList<String> array new ArrayList<String>();array.add("hello");array.add(&quo…

java8 stream案例分析

java8 stream Stream是java8 推出的一个处理集合类的一个全新的接口&#xff0c;在工作当中经常用到&#xff0c;并且他的预发规则与我们平台的有一点不一样&#xff0c;是流式的处理&#xff0c;非常类似RXJava的一个风格。java中对Stream的定义是&#xff1a; A sequence o…

[半翻] 设计面向DDD的微服务

这篇文章行文结构对照微软博客&#xff0c; 结合本人意译和多年实践的回顾性思考形成此次读书笔记。Domian-driven Design领域-驱动-设计&#xff08;DDD&#xff09;提倡基于(用例相关的现实业务)进行建模。1. DDD的视角DDD将现实问题视为领域;DDD将独立的问题描述为有界限的上…

数据结构与算法--数字在排序数组中出现次数

数字在排序数组中出现次数 题目&#xff1a;统计一个数字在一个排序数组中出现的次数。例如&#xff0c;输入数组{1,2&#xff0c;3&#xff0c;3,3&#xff0c;3,3&#xff0c;4,5} 和数字3&#xff0c;由于3 在数组中出现的次数是5&#xff0c;因此返回5 简单方案一 既然输…

【值得收藏】首次披露Facebook移动端软件的持续部署 | IDCF

&#xff08;图片来源于网络&#xff09;摘要持续部署是指软件更新一旦准备好就立即发布的实践方法&#xff0c;在业界越来越多地被采用。移动端软件的更新频率普遍落后于基于云端的服务&#xff0c;原因有很多。比如&#xff0c;移动端软件只能定期发布版本&#xff1b;用户可…

数据结构与算法--二叉树的深度问题

二叉树的深度 题目&#xff1a;输入一颗二叉树的根&#xff0c;求该树的深度。从根节点到叶子节点一次进过的节点形成的一条路径&#xff0c;最长的路径的长度为树的深度。如下图中二叉树的额深度4&#xff0c;因为从根节点A到叶子节点的路径中有4个节点A B E J 问题中定义了一…

进击谷歌:多线程下程序执行顺序怎么稳定不乱?

点击上方蓝字 关注我们面试官您好&#xff0c;我是来面试的您好&#xff0c;我是这次的面试官&#xff0c;先介绍一下自己把我是女孩&#xff0c;blala ....那问一个多线程的问题吧&#xff0c;在一个多线程的环境中&#xff0c;怎么能保证一系列方法的执行顺序呢&#xff1f;…

[Java基础]Set集合概述和特点

练习代码如下: package test21;import java.util.HashSet; import java.util.Set;public class SetDemo {public static void main(String[] args){Set<String> set new HashSet<String>();set.add("hello");set.add("world");set.add("…