用4KB内存寻找重复元素(算法村第十五关青铜挑战)

在海量数据中,普通的数组、链表、Hash、树等等结构无效,因为内存空间不足。而常规的递归、排序,回溯、贪心和动态规划等思想也无效,因为执行超时。这类问题该如何下手呢?这里介绍三种非常典型的思路:

1.使用位存储。

使用位存储最大的好处是占用的空间是简单存整数的1/8。例如一个40亿的整数数组,如果用整数存储需要16GB左右的空间,而如果使用位存储,就可以用0.5GB的空间,这样很多问题就能够解决了。

2.外部排序。如果文件实在太大 ,无法在内存中放下,则需要考虑将大文件分成若干小块,先处理每个块,最后再逐步得到想要的结果。这样需要遍历全部序列至少两次,是典型的用时间换空间的方法。

3.堆,如果在超大数据中找第K大、第K小,K个最大、K个最小,则特别适合使用堆来做。而且将超大数据换成流数据也可以,而且几乎是唯一的方式。口诀是“查小用大堆,查大用小堆”。

题目

给定一个数组,包含从1N的整数,N最大为32000,数组可能还有重复值,且N的取值不定。若只有4KB的内存可用,请问如何打印数组中所有重复元素。

分析

如果不限内存,我们可以创建一个大小为Nint数组,然后逐一读取数据,出现过的数据在数组中的对应位置标记为1,从而不断找到重复元素。

而在4KB的内存限制下,我们应该创建一个大小为Nbit数组。

1KB = 1024 Bytes
1 Byte = 8 bits

4KB = 4 * 1024 * 8 bits = 32768 bits。

比特的单位是 bit,但通常表达多个比特时使用复数形式 bits

例如,当我们说“4KB等于32768 bits”时,就是在用bits来表示比特的总数。

因此4KB足够我们创建32000比特大小的比特数组,其中一个比特位置就代表一个整数。例如...10000100表示数据中3和8出现过,再碰到重复的3、8,就输出一下。

演示代码

代码仅供参考,面试时能讲清楚解题逻辑就行,不用写代码

public class FindDuplicatesIn32000
{//比特集以及相关操作class BitSet{int[] bits;//创建大小为size的比特数组public BitSet(int size){this.bibit = new int[size >> 5];	//除以32}//判断某个位置的数是否出现过,出现过返回true,否则返回falseboolean get(int pos){int posBit = (pos >> 5);	//除以32int bitNumber = (pos & 0x1F); // ?//取模32。该操作会保留 pos 的最低5位,而将高于第五位的所有位设置为0。例如,若 pos 的值为 0b11011011(十进制的 219),那么 pos & 0x1F 的结果将是 0b00011011(十进制的 27)return (bits[posBit] & (1 << bitNumber)) != 0;	// ?}//将比特数组的pos位置设置为1void set(int pos){int posBit = (pos >> 5);	//除以32int bitNumber = (pos & 0x1F);// ?	//取模32bits[posBit] = bits[posBit] | (1 << bitNumber);// ?}}public void checkDuplicates(int[]array){BitSet bits = new BitSet(32000);for (int i = 0; i < array.length; i++){int num = array[i];  //num的范围是[1,N]int pos = num - 1;	//num在比特数组中的位置(数组下标从0开始)if (bits.get(pos))	//出现重复元素System.out.println(num);else	//元素第一次出现bits.set(pos);	//标记一下}}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/649018.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何在Vue项目中应用TypeScript?

文章目录 一、前言二、使用Componentcomputed、data、methodspropswatchemit 三 、总结 一、前言 与link类似 在VUE项目中应用typescript&#xff0c;我们需要引入一个库vue-property-decorator&#xff0c; 其是基于vue-class-component库而来&#xff0c;这个库vue官方推出…

Caused by: com.mongodb.MongoTimeoutException: Timed out after 30000 ms

报错 Caused by: com.mongodb.MongoTimeoutException: Timed out after 30000 ms while waiting to connect. Client view of cluster state is {typeUNKNOWN, servers[{addressmangodb-m.cc.com:3717, typeUNKNOWN, stateCONNECTING, exception{com.mongodb.MongoSocketReadE…

uniapp 使用echarts做折线图条形图。

提前10天把中烟活动做完了&#xff0c;以为能打酱油到除夕那天&#xff0c;结果又要做什么数据看板&#xff0c;方便烟草领导过年查看数据&#xff0c;还只给5天时间&#xff0c;真实压榨剥削啊&#xff0c;下辈子再也不‘拍黄片’了&#xff0c;不&#xff01;下份工作我就转前…

操作系统--Linux虚拟内存管理

​一、什么是虚拟内存地址 收货地址是一个虚拟地址&#xff0c;它是人为定义的 而我们的城市&#xff0c;小区&#xff0c;街道是真实存在的&#xff0c;他们的地理位置就是物理地址 以 Intel Core i7 处理器为例&#xff0c;64 位和32位虚拟地址的格式为&#xff1a; 二、为什…

Android App开发基础(3)——App的设计规范

3 App的设计规范 本节介绍了App工程的源码设计规范&#xff0c;首先App将看得见的界面设计与看不见的代码逻辑区分开&#xff0c;然后利用XML标记描绘应用界面&#xff0c;同时使用Java代码书写程序逻辑&#xff0c;从而形成App前后端分离的设计规约&#xff0c;有利于提高App集…

Fastbee开源物联网项目RoadMap

架构优化 代码简化业务&协议解耦关键组件支持横向拓展网络协议支持横向拓展&#xff0c;包括&#xff1a;mqtt broker,tcp,coap,udp,sip等协议插件化编码脚本化业务代码模版化消息总线 功能优化 网关/子网关&#xff1a;上线&#xff0c;绑定&#xff0c;拓扑&#xff0…

快毕业了,同学纪念册如何制作出高级感

​快毕业了&#xff0c;这是一个充满回忆和感慨的时刻。同学们都想制作一本高级感的同学纪念册&#xff0c;留住这段美好的时光。但是自己着手制作的纪念册太丑&#xff0c;那不出手怎么办&#xff1f;那你就问对人了&#xff0c;我给大家演示几个步骤&#xff0c;需要的可以学…

【java】常见的面试问题

目录 一、异常 1、 throw 和 throws 的区别&#xff1f; 2、 final、finally、finalize 有什么区别&#xff1f; 3、try-catch-finally 中哪个部分可以省略&#xff1f; 4、try-catch-finally 中&#xff0c;如果 catch 中 return 了&#xff0c;finally 还会执行吗&#…

ambari hdp 企业级安装实战

一 配置部署环境 1.1 检查操作系统 1.1.1 检查操作系统版本 cat /etc/redhat-release1.1.2 检查操作系统默认语言 $ echo $LANG en_US.UTF-8若操作系统默认语言为en_US.UTF-8,则进入下一步。 若操作系统默认语言非en_US.UTF-8,则执行以下步骤: # 将默认语言由中文切换为…

瀑布流布局 (初版)

瀑布流布局 文章目录 瀑布流布局前言1. 背景2. 点⬇️&#x1f517;去体验效果如下图所示&#xff1a; 一、初版waterfall布局和问题暴露&#xff1f;1.效果图如下&#xff1a;2.暴露问题如下图所示&#xff1a;第一张问题图&#xff1a;第二张问题图&#xff1a; 3.HTML代码如…

有效的字母异位词

42. 有效的字母异位词https://leetcode.cn/problems/valid-anagram/ 给定两个字符串 s 和 t &#xff0c;编写一个函数来判断 t 是否是 s 的字母异位词。 注意&#xff1a;若 s 和 t 中每个字符出现的次数都相同&#xff0c;则称 s 和 t 互为字母异位词。 示例 1: 输入: s …

go语言Map与结构体

1. Map map是一种无序的基于key-value的数据结构&#xff0c;Go语言中的map是引用类型&#xff0c;必须初始化才能使用。 1.1. map定义 Go语言中 map的定义语法如下 map[KeyType]ValueType其中&#xff0c; KeyType:表示键的类型。ValueType:表示键对应的值的类型。map类型的…

maven组件升级报错经验汇总

1. NosuchMethodError org.springframework.beans.factory.support.genericBeanDefinition(xxxxx) 2. ClassNotFoundException: org.springframework.boot.SpringApplication 可能冲突的依赖是&#xff1a; <dependency><groupId>org.springframework.boot</g…

NodeJS Express实现所有页面Http访问重定向跳转为Https

要在Node.js Express中实现所有页面从HTTP访问跳转到HTTPS&#xff0c;你可以使用重定向中间件。以下是一个简单的示例&#xff1a; 1. 首先&#xff0c;确保你已经安装了Express和express-redirect中间件。如果没有&#xff0c;你可以通过npm进行安装&#xff1a; npm insta…

8.6 代理设计模式

文章目录 一、代理模式&#xff08;Proxy Pattern&#xff09;概述二、代理模式和观察者设计模式三、模式结构四、协作角色五、实现策略六、相关模式七、示例八、应用 一、代理模式&#xff08;Proxy Pattern&#xff09;概述 代理模式是一种设计模式&#xff0c;它通过引入一个…

智能体AI Agent的极速入门:从ReAct到AutoGPT、QwenAgent、XAgent

前言 如这两天在微博上所说&#xff0c;除了已经在七月官网上线的AIGC模特生成系统外&#xff0c;我正在并行带多个项目组 第二项目组&#xff0c;论文审稿GPT第2版的效果已经超过了GPT4&#xff0c;详见《七月论文审稿GPT第2版&#xff1a;用一万多条paper-review数据集微调…

跨语言编程:在C#应用程序中调用Python

应用场景 众所周知&#xff0c;Python在深度学习中占有绝对优势。而C#语言的优势在各种后端应用开发&#xff0c;特别是工业领域。当我们使用 C# 开发应用程序时&#xff0c;可能需要调用 Python 代码来实现某些功能。这时&#xff0c;我们可以使用 Python.NET 或 IronPython 等…

69.x 的平方根(力扣LeetCode)

69.x 的平方根&#xff08;力扣LeetCode&#xff09; 题目描述 给你一个非负整数 x &#xff0c;计算并返回 x 的 算术平方根 。 由于返回类型是整数&#xff0c;结果只保留 整数部分 &#xff0c;小数部分将被 舍去 。 注意&#xff1a;不允许使用任何内置指数函数和算符&…

Vue-38、Vue中插件使用

1、新建plugins.js文件 2、可以在plugins.js 定义全局过滤器 定义全局指令 定义混入 给vue原型上添加一个方法 export default {install(Vue){console.log("install",Vue);//全局过滤器Vue.filter(mySlice,function (value) {return value.slice(0,4)});//定义全局…

遇到这3种接口测试问题,其实,你可以这么办~

作为整个软件项目的必经环节&#xff0c;软件测试是不可缺少的“查漏补缺”环节。而作为软件测试中的重要一环——接口测试&#xff0c;几乎串联了整个项目所有的输入和输出环节。 前几年&#xff0c;我在做后端测试时&#xff0c;接触最多的正是接口测试。基于此&#xff0c;…