Redis位图

简介

在我们平时开发过程中,会有一些bool型数据需要存取,比如用户一年的签到记录,签了是1,没签是0,要记录365天。如果使用普通的key/value,每个用户要记录365个,当用户上亿的时候,需要的存储空间是惊人的。

为了解决这个问题,Redis提供了位图数据结构,这样每天的签到记录只占据一个位,365天就是365个位,46个字节(一个稍长一点的字符串)就可以完全容纳,这就大大节约了存储空间。

位图不是特殊的数据结构,他的内容其实就是普通的字符串,也就是byte数组。我们可以使用普通的get/set直接获取和设置整个位图的内容,也可以使用位图操作getbit/setbit等将byte数组看成【位数组】来处理。

基本使用

Redis的位数组是自动扩展,如果设置了某个偏移位置超出了现有的内容范围,就会自动将位数组进行零扩充。如下图所示位“he”的ASCII码,使用redis-cli设置第一个字符,也就是位数组的前8位,如下图所示,h字符只有1/2/4位需要设置,e字符只有9/10/13/15位需要设置。值的注意的是位数组的顺序和字符的位顺序是相反的。
在这里插入图片描述
redis-cli示例

127.0.0.1:6379> setbit s 1 1 
(integer) 0
127.0.0.1:6379> setbit s 2 1 
(integer) 0
127.0.0.1:6379> setbit s 4 1 
(integer) 0
127.0.0.1:6379> setbit s 9 1 
(integer) 0
127.0.0.1:6379> setbit s 10 1 
(integer) 0
127.0.0.1:6379> setbit s 13 1 
(integer) 0
127.0.0.1:6379> setbit s 15 1 
(integer) 0
127.0.0.1:6379> get s
"he"

上面这个例子可以理解为【零存整取】,同样我们还可以【零存零取】,【整存零取】。【零存】就是使用setbit对位值进行逐个设置,【整存】就是使用字符串一次性填充所有位数组,覆盖掉旧值。

零存零取

127.0.0.1:6379> setbit w 1 1 
(integer) 0
127.0.0.1:6379> setbit w 2 1 
(integer) 0
127.0.0.1:6379> setbit w 4 1 
(integer) 0
127.0.0.1:6379> getbit w 1 
(integer) 1
127.0.0.1:6379> getbit w 2 
(integer) 1 
127.0.0.1:6379> getbit w 4 
(integer) 1 
127.0.0.1:6379> getbit w 5 
(integer) 0

整存零取

127.0.0.1:6379> set w h # 整存 (integer) 0
127.0.0.1:6379> getbit w 1 
(integer) 1
127.0.0.1:6379> getbit w 2 
(integer) 1 
127.0.0.1:6379> getbit w 4 
(integer) 1 
127.0.0.1:6379> getbit w 5 
(integer) 0

如果对应位的字节是不可打印字符,redis-cli会显示该字符的16进制形式。

127.0.0.1:6379> setbit x 0 1 
(integer) 0
127.0.0.1:6379> setbit x 1 1 
(integer) 0
127.0.0.1:6379> get x 
"\xc0"

统计和查找

Redis提供了位图统计指令bitcount和位图查找指令bitpos,bitcount是用来统计指定位置范围内1的个数,bitpos用来查找指定范围内出现的第一个0或1.

比如我们可以通过bitcount统计用户一共签到了多少天,通过bitpos指令查找用户从哪一天开始签到,如果指定了范围参数[start,end],就可以统计在某个时间范围内用户签到了多少天,用户自某天以后的哪天开始签到。

注意,start和end是字节索引,8个bit为一字节,如图中的“he”字符串,对应的ASCII码为 01101000 01100101,其中第0字节为01101000,第一个字节为01100101。因此,如果要计算某个月内用户签到了多少天,无法直接计算得出,而是需要讲这个月所覆盖的字节内容全部取出,然后在内存里进行统计。

示例:

127.0.0.1:6379> set w he 
OK
127.0.0.1:6379> bitcount w 
(integer) 7
127.0.0.1:6379> bitcount w 0 0 # 第一个字节中 1 的位数 
(integer) 3
127.0.0.1:6379> bitcount w 0 1 # 前两个字节中 1 的位数
(integer) 7
127.0.0.1:6379> bitcount w 1 1 # 第二个字节中 1 的位数
(integer) 4
127.0.0.1:6379> bitpos w 0 # 第一个 0 位 
(integer) 0
127.0.0.1:6379> bitpos w 1 # 第一个 1 位 
(integer) 1
127.0.0.1:6379> bitpos w 1 1 1 # 从第二个字符算起,第一个 1 位
(integer) 9

魔术指令bitfield

前文我们设置(setbit)和获取(getbit)指定位的值都是单个位的,如果要一次操作多个位,就必须使用管道来处理。bitfield有三个子指令,分别是get/set/incrby,他们都可以对指定位片段进行读写,但是最多只能处理64个连续的位,如果超过64位,就需要使用多个子指令,bitfield可以一次执行多个子指令。

仍然使用上面的例子,“he”对应的ASCII码表示
在这里插入图片描述

127.0.0.1:6379> set w hello
OK
127.0.0.1:6379> bitfield w get u4 0 # 从第一个位开始取 4 个位,结果是无符号数 (u)
(integer) 6
127.0.0.1:6379> bitfield w get u3 2 # 从第三个位开始取 3 个位,结果是无符号数 (u)
(integer) 5
127.0.0.1:6379> bitfield w get i4 0  # 从第一个位开始取 4 个位,结果是有符号数 (i) 
(integer) 6
127.0.0.1:6379> bitfield w get i3 2# 从第三个位开始取 3 个位,结果是有符号数 (i)
(integer) -3

所谓有符号数指获取的位数组中第一个位是符号位,剩下的都是值。如果第一位是1,那就是负数。无符号数表示非负数,没有符号位,获取的位数组全部都是值。有符号数最多可以获取64位,无符号数只能获取63位。如果超出位数限制,Redis会提示参数错误。

一次执行多个指令示例

127.0.0.1:6379> bitfield w get u4 0 get u3 2 get i4 0 get i3 2 
1) (integer) 6
2) (integer) 5
3) (integer) 6
4) (integer) -3

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/22694.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据中心综合解决方案

安科瑞电气股份有限公司 祁洁 acrelqj 一、方案介绍 安科瑞电气紧跟数据中心发展形式,推出数据中心综合解决方案,集成了变配电监测、电源备自投、电气接点测温、智能照明控制、电能质量监测及治理、蓄电池在线监测、精密配电监控、智能母线监控以及消…

重要经济数据对行情的影响有多大?

金融市场上的消息非常多,可以来自不同国家、不同大型企业,也可以由不同机构统计公布,甚至是各国政府或中央银行的发表。在宏观经济层面上,所有政经消息都属于金融市场的风险事件,大多能引起市场波动,因此投…

android 开机动画执行流程

android深入了解开机动画 开机动画的种类 1:View绘制 2:逐帧动画:比较主流的方式,一般动画的文件打包成 bootanimation.zip 存储到 /system/media/ 下。一般.zip文件 > 5M 就会有明显的卡顿,所以一般开机动画只有…

正大国际期货:期货交易需要根除的几点习惯

1、交易过多品种。对于期货交易而言,最不靠谱的就是同时操作多个品种。我认为的较合适的品种上限在3-4个,甚至更少为好。我们经常看到的截图,动辄十个甚至数十个品种,而且都盈利,这种截图看看就罢,不必认真…

Python处理时间和日期库之pytime使用详解

概要 在Python编程中,时间和日期处理是一个常见的需求。虽然Python标准库提供了强大的时间和日期处理模块,但对于一些常见的任务,例如自然语言解析时间、简单的日期计算等,标准库的使用相对复杂。pytime库提供了一种简单而直观的方法来处理时间和日期,使得这些任务变得更…

240.搜索二维矩阵

题目描述 编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target 。该矩阵具有以下特性: 每行的元素从左到右升序排列。每列的元素从上到下升序排列。 示例 1: 输入:matrix [[1,4,7,11,15],[2,5,8,12,19],[3,6,9,16,22],[10,…

宏基因组分箱(binning)|1.Metabat实战了解binning

Introduction 宏基因组学是直接从环境样本(如土壤、水、肠道内容物等)中回收遗传物质并进行研究的学科,无需对个体生物进行分离或培养。这一领域的研究为我们提供了对微生物群落多样性及其功能的深入理解。可以查看我之前写的宏基因组分析流…

汇总 |国内外医疗器械网络安全法规与标准

国内外关于医疗器械网络安全的法规和标准日益完善,旨在确保医疗器械在全生命周期内的网络安全,保障患者信息的安全和隐私,以及医疗器械的正常运行。不同国家和地区的法规和标准各有侧重,但都强调了医疗器械制造商、开发者、经营者…

Python - 深度学习系列38 重塑实体识别5-预测并行化改造

说明 在重塑实体识别4中梳理了数据流,然后我发现pipeline的串行效率太低了,所以做了并行化改造。里面还是有不少坑的,记录一下。 内容 1 pipeline 官方的pipeline看起来的确是比较好用的,主要是实现了比较好的数据预处理。因为…

Solidwokrs钣金拆图之移动面命令使用技巧

Solidwokrs钣金拆图之移动面命令使用技巧 Chapter1 Solidwokrs钣金拆图之移动面命令使用技巧Chapter2 solidworks如何删除外部参考 Chapter1 Solidwokrs钣金拆图之移动面命令使用技巧 原文链接:https://www.sohu.com/a/441562400_728492 今天给大家介绍一个SolidW…

IO进程线程(六)进程

文章目录 一、进程状态(二)进程状态切换实例1. 实例1 二、进程的创建(一)原理(二)fork函数--创建进程1. 定义2. 不关注返回值3. 关注返回值 (三) 父子进程的执行顺序(四&…

【Redis数据库百万字详解】数据持久化

文章目录 一、持久化1.1、什么是持久化1.2、持久化方式1.3、RDB优缺点1.4、AOF优缺点 二、RDB持久化触发机制2.1、手动触发2.2、自动触发 三、RDB持久化配置3.1、配置文件3.2、配置查询/设置3.3、禁用持久化3.4、RDB文件恢复 四、RDB持久化案例4.1、手动持久化4.2、自动持久化案…

2024第26届大湾区国际电机博览会暨发展论坛

2024第二十六届大湾区国际电机博览会 暨发展论坛 2024第26届大湾区国际电机博览会暨发展论坛 The 26th Greater Bay Area International Motor Expo and Development Forum 时间:2024年12月4-6日 地址:深圳国际会展中心(宝安新馆&#x…

安全生产新篇章:可燃气体报警器检验周期的国家标准解读

随着工业化进程的加快,安全生产成为了重中之重。 可燃气体报警器作为预防火灾和爆炸事故的重要设备,其准确性和可靠性直接关系到企业的生产安全和员工的生命财产安全。 因此,国家对可燃气体报警器的检验周期有着明确的规定,以确…

美洽工作台3.0,全新发布!

美洽工作台3.0,全新发布 想要效率翻倍,就要一步到位! 工作台 3.0,为效率而生 1. 更丰富的外观选择,让界面焕然一新,新增导航主题色选择,深色 Dark、浅色 Light 随意切换 2. 自定义你的专属导…

Python 识别图片形式pdf的尝试(未解决)

想识别出pdf页面右下角某处的编号。pdf是图片形式页面。查了下方法,有源码是先将页面提取成jpg,再用pytesseract提取图片文件中的内容。 直接用图片来识别。纯数字的图片,如条形码,可识别。带中文的不可以,很乱。 识别…

吴恩达深度学习笔记:机器学习(ML)策略(1)(ML strategy(1))1.3-1.4

目录 第三门课 结构化机器学习项目(Structuring Machine Learning Projects)第一周 机器学习(ML)策略(1)(ML strategy(1))1.3 单一数字评估指标(S…

Linux|如何安装 Java

引言 Java是最受欢迎的编程语言之一,JVM(Java的虚拟机)是运行Java应用程序的运行时环境。这两个平台是许多流行软件所需的,包括Tomcat,Jetty,Cassandra,Glassfish和Jenkins。 本教程[1]将指导您…

2024年应用经济学、管理科学与社会国际学术会议(ICAEMSS 2024)

2024年应用经济学、管理科学与社会国际学术会议(ICAEMSS 2024) 会议简介 2024年应用经济学、管理科学与社会国际学术会议将聚焦应用经济学和管理科学的前沿问题,深入探讨社会变革中的经济管理与科学应用。参会者将分享最新研究成果&#xf…

短剧小程序App系统源码:打造个性化追剧体验

随着数字媒体的迅猛发展,短剧作为一种新兴的娱乐形式,越来越受到广大观众的喜爱。为了满足用户对短剧内容的个性化需求,短剧小程序App系统应运而生。本文将深入探讨短剧App源码的核心功能,以及如何通过多语言支持和国际支付等技术…