C++从零开始(day54)——位图,布隆过滤器

这是关于一个普通双非本科大一学生的C++的学习记录贴

在此前,我学了一点点C语言还有简单的数据结构,如果有小伙伴想和我一起学习的,可以私信我交流分享学习资料

那么开启正题

今天分享的是关于位图, 布隆过滤器相关的知识点

1.位图

1.1位图的概念

我们先来看一道面试题:

给40亿个不重复的无符号整数,无序,给一个无符号整数,如何迅速判断一个数是否存在这40亿个数当中?

在学习哈希之前我们可能会用sort排序后二分查找,学了哈希之后可以用set或者unordered_set解决,但是这个题目用这两种方法都不行,因为空间不够,那么如何解决呢?我们来看位图的概念

位图的概念:用每一位存放某种状态,适用于海量数据,处理无重复的场景,通常来判断某个数据是否存在

位图用到了哈希的思想

1.2位图的实现

位图的实现并不难,熟练掌握位操作运算符即可轻松写出,这里直接给出

namespace wkl
{class my_set{public:my_set(size_t N){_a.resize(N / 32 + 1, 0);_num = 0;}void set(size_t x){size_t index = x / 32;size_t pos = x % 32;_a[index] |= (1 << pos);}void reset(size_t x){size_t index = x / 32;size_t pos = x % 32;_a[index] &= ~(1 << pos);}bool test(size_t x){size_t index = x / 32;size_t pos = x % 32;return _a[index] & (1 << pos);}private:vector<int> _a;size_t _num;};void Test_my_set(){my_set ms(100);ms.set(2);ms.set(4);ms.set(96);ms.set(97);ms.set(98);//ms.reset(2);for (size_t i = 0; i < 100; ++i){printf("[%d]:%d\n", i, ms.test(i));}}
}

1.3位图的应用

1.快速查找某个数据是否在一个集合当中

2.排序 + 去重

3.求两个集合的交集,并集

4.操作系统中的磁盘块标记

1.4位图的优缺点

优点:节约空间,效率高

缺点:只能处理整形数据

2.布隆过滤器

2.1布隆过滤器概念

在我们刷短视频时,是如何保证推送给我们的内容没有重复推送的呢?客户端会从用户历史记录里进行筛选,过滤掉已经存在的记录,那么何如快速查找呢?

1.使用哈希表存储用户记录,缺点:浪费空间

2.用位图存储用户记录,无法记录(位图只能处理整形数据

那么这里就要引出布隆过滤器

布隆过滤器:1970由布隆提出的一种紧凑的,巧妙地概率性数据结构,特点是高效地插入和查找,用来告诉用户某数据不存在或者可能存在它是由多个哈希函数,将一个数据映射到位图结构中,这种方法提高了查找效率,也极大地节省了内存

2.2布隆过滤器的实现

这里不给出代码只讲其原理

a.插入

用多个哈希函数找到数据映射位置,借助于set标记存储

b.查询

找到多个哈希函数映射的值,如果全被标记则可能存在,布隆过滤器如果说某个元素不存在时,该元素一定不存在,如果该元素存在时,该元素可能存在,因为有些哈希函数存在一定的误判

c.删除

布隆过滤器不能直接支持删除操作,因为在删除一个元素时,可能会影响到其他元素

2.3布隆过滤器的优缺点

优点:查找效率高,节省空间

缺点:不能删除元素,有误判率,不能获取元素本身

新手写博客,有不对的位置希望大佬们能够指出,也谢谢大家能看到这里,让我们一起学习进步吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/756562.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【linux】环境变量(进程二)

这里写目录标题 命令行参数&#xff1a;环境变量&#xff1a; 命令行参数&#xff1a; 不谈命令行参数就谈环境变量就是耍流氓。 相信我们在C语言阶段都在main函数里见过参数。 例如int main(int argc, char* argv[]) 这是什么东西呢&#xff1f; 话不多说我们直接打印一下看…

java.lang.ArithmeticException: Rounding necessary错误解决方法

今天使用BigDecimal的setScale方法控制小数位时遇到了java.lang.ArithmeticException: Rounding necessary错误&#xff0c;经查&#xff0c;setScale方法有2中使用方法&#xff1a; 1.只设置小数位 setScale(n)&#xff0c;例如&#xff1a; BigDecimal bigDecimal new Bi…

JupyterNotebook 如何切换使用的虚拟环境kernel

在Jupyter Notebook中&#xff0c;如果需要修改使用的虚拟环境Kernel&#xff1a; 首先&#xff0c;需要确保虚拟环境已经安装conda上【conda基本操作】 打开Jupyter Notebook。 在Jupyter Notebook的顶部菜单中&#xff0c;选择 “New” 在弹出的窗口中&#xff0c;列出了…

“JavaScript: void(0)的替代方案有哪些?”

学习目标&#xff1a; 理解javascript:void(0)的工作原理&#xff0c;以及它在前端开发中的作用和用途。掌握javascript:void(0)的正确用法&#xff0c;包括在HTML中使用和在事件处理程序中使用。能够识别javascript:void(0)可能引起的常见问题&#xff0c;并学会相应的解决方…

python 基础语法

python 基础语法 一、基础语法1. 标识符2. python保留字3. 注释分类4. 行与缩进5. 数字(Number)类型6. 字符串(String)7. 空行分割8. 等待用户输入9. 多个语句构成代码组10. import 与 from...import 二、代码概览 一、基础语法 1. 标识符 第一个字符必须是字母表中字母或下划…

numpy的数组深度叠加dstack详解

☞ ░ 前往老猿Python博客 ░ https://blog.csdn.net/LaoYuanPython 一、引言 numpy的dstack函数用于沿着第三个维度&#xff08;深度&#xff09;将数组堆叠起来。它将多个数组按照深度方向进行堆叠&#xff0c;生成一个新的数组。具体来说&#xff0c;dstack函数会将输入的…

docker部署开源多功能监控系统

HertzBeat 是一个无需 Agent、高性能、易扩展、功能强大的开源实时监控告警系统&#xff0c;无需 Agent、高性能、易扩展、功能强大&#xff0c;由 Dromara 团队开发并开源&#xff0c;能够帮我们轻松监控应用、服务、基础设施等各种资源的运行状况 部署 docker run -d -p 11…

腾讯云服务器按月收费价格表,优惠价格5元一个月起

2024腾讯云服务器多少钱一个月&#xff1f;5元1个月起&#xff0c;腾讯云轻量服务器4核16G12M带宽32元1个月、96元3个月&#xff0c;8核32G22M配置115元一个月、345元3个月&#xff0c;腾讯云轻量应用服务器61元一年折合5元一个月、4核8G12M配置646元15个月、2核4G5M服务器165元…

2024 年 AI 辅助研发趋势-人才培养与教育

2024 年 AI 辅助研发趋势随着人工智能技术的持续发展与突破&#xff0c;2024年AI辅助研发正成为科技界和工业界瞩目的焦点。从医药研发到汽车设计&#xff0c;从软件开发到材料科学&#xff0c;AI正逐渐渗透到研发的各个环节&#xff0c;变革着传统的研发模式。在这一背景下&am…

01 JDBC介绍

文章目录 JDBC本质版本使用核心APIDriverDriverManager驱动注册连接对象获取 Connection获取执行对象事务管理 Statement概述 ResultSet概述 JDBC本质 官方&#xff08;sun公司&#xff09;定义的一套操作所有关系型数据库的规则&#xff0c;即接口各个数据库厂商去实现这套接…

im-system学习

文章目录 LimServerLimServersnakeyaml依赖使用配置类配置文件 私有协议解码MessageDecoderByteBufToMessageUtils 这个很全&#xff1a; IM即时通讯系统[SpringBootNetty]——梳理&#xff08;总&#xff09; IO线程模型 Redis 分布式客户端 Redisson 分布式锁快速入门 Lim…

【Week Y2】使用自己的数据集训练YOLO-v5s

Y2-使用自己的数据集训练YOLO-v5s 零、遇到的问题汇总&#xff08;1&#xff09;遇到git的import error&#xff08;2&#xff09;Error&#xff1a;Dataset not found&#xff08;3&#xff09;Error&#xff1a;删除中文后&#xff0c;训练图片路径不存在 一、.xml文件里保存…

框架篇常见面试题

1、Spring框架的单例bean是线程安全的吗&#xff1f; 2、什么是AOP&#xff1f; 3、Spring的事务是如何实现的&#xff1f; 4、Spring事务失效的场景 5、SpringBean的声明周期 6、Spring的循环依赖 7、SpringMVC的执行流程 8、SpringBoot自动配置原理 9、Spring常见注解

Java中的实用类讲解(中篇)

如果想观看更多Java内容 可上我的个人主页关注我&#xff0c;地址子逸爱编程-CSDN博客https://blog.csdn.net/a15766649633?spm1000.2115.3001.5343 使用工具 IntelliJ IDEA Community Edition 2023.1.4 使用语言 Java8 代码能力快速提升小方法&#xff0c;看完代码自己敲…

AV1:帧内预测(一)

​VP9支持10种帧内预测模式&#xff0c;包括8种角度模式和非角度模式DC、TM(True Motion)模式&#xff0c;AV1在其基础上进一步扩展&#xff0c;AV1帧内预测角度模式更细化&#xff0c;同时新增了部分非角度模式。 扩展的角度模式 AV1在VP9角度模式的基础上进一步扩展&#xf…

CSharp的lambda表达式匿名类扩展方法

c#的lamba表达式 之前已经写过一些关于委托还有事件的文章&#xff0c;今天就来介绍一下lambda表达式。 首先定义需要的函数以及委托 { public delegate void DoNothingDelegate(); public delegate void StudyDelegate(int id, string name);private void DoNothing() {Cons…

P1678 烦恼的高考志愿(二分查找)

题目描述 现有 m 所学校&#xff0c;每所学校预计分数线是 ai​。有 n 位学生&#xff0c;估分分别为 bi​。 根据 n 位学生的估分情况&#xff0c;分别给每位学生推荐一所学校&#xff0c;要求学校的预计分数线和学生的估分相差最小&#xff08;可高可低&#xff0c;毕竟是估分…

蓝桥杯day3刷题日记--P9420 [蓝桥杯 2023 国 B] 子 2023 / 双子数

2023 思路&#xff1a;首先先用to_string把数字变成字符串&#xff08;ps&#xff1a;在Dev c里用不了&#xff09;&#xff0c;用数组dp&#xff0c;用dp【0】记录2的数量&#xff0c;dp【1】记录20的数量&#xff0c;dp【2】记录202的数量&#xff0c;dp【3】记录2023的数量…

蓝桥杯--完全二叉树

import java.util.Scanner;import static java.lang.Math.log;public class top9 {//求树的每一层的和public static void main(String [] args){Scanner scannernew Scanner(System.in);int nscanner.nextInt();int [] arrnew int[n];for(int i0;i<n;i){arr[i]scanner.next…

Android Studio实现内容丰富的安卓志愿者平台

获取源码请点击文章末尾QQ名片联系&#xff0c;源码不免费&#xff0c;尊重创作&#xff0c;尊重劳动 项目编号122 1.开发环境android stuido jdk1.8 eclipse mysql tomcat 2.功能介绍 安卓端&#xff1a; 1.注册登录 2.查看公告 3.查看岗位 4.浏览新闻&#xff0c; 5.个人中心…