目录
Redis 数据类型
一、String(字符串)
二、Hash(哈希)
三、List(列表)
四、Set(集合)
五、ZSet(sorted set:有序集合)
六、BitMap
七、HyperLogLog
八、GEO
九、Stream
Redis 数据类型
Redis支持五种数据类型:string(字符串),hash(哈希),list(列表),set(集合)及zset(sorted set:有序集合)。
这 5 种数据类型是直接提供给用户使用的,是数据的保存形式,其底层实现主要依赖这 8 种数据结构:简单动态字符串(SDS)、LinkedList(双向链表)、Dict(哈希表/字典)、SkipList(跳跃表)、Intset(整数集合)、ZipList(压缩列表)、QuickList(快速列表)。
随着Redis版本更新,后面又支持了四种数据类型:BitMap(2.2新增)、HyperLogLog(2.8新增)、GEO(3.2新增)、Stream(5.0新增)。
Redis 5 种基本数据类型对应的底层数据结构实现如下表所示:
随着Redis版本更新,后面又支持了四种数据类型:BitMap(2.2新增)、HyperLogLog(2.8新增)、GEO(3.2新增)、Stream(5.0新增)。
一、String(字符串)
简介
1. string 是 redis 最基本的类型,你可以理解成与 Memcached 一模一样的类型,一个 key 对应一个 value。
2. string 类型是二进制安全的。意思是 redis 的 string 可以包含任何数据。比如jpg图片或者序列化的对象。
3. string 类型是 Redis 最基本的数据类型,string 类型的值最大能存储 512MB。
应用场景
1.缓存:字符串类型可以用于缓存数据,例如缓存数据库查询结果、计算结果等。由于Redis的高性能和快速读写能力,使用字符串类型作为缓存可以大大提高系统的响应速度。
2.计数器:字符串类型可以用于实现计数器功能,例如统计网站的访问次数、用户的点赞数等。通过使用字符串类型的自增命令,可以方便地对计数器进行增加或减少操作。
3.分布式锁:字符串类型可以用于实现分布式锁,保证在分布式环境下的数据一致性和并发控制。通过设置一个唯一的字符串作为锁的值,并利用Redis的原子性操作,可以实现简单而高效的分布式锁机制。
4.会话管理:字符串类型可以用于存储用户的会话信息,例如用户登录状态、购物车内容等。通过将会话信息存储在字符串类型中,可以方便地进行读写操作,并且可以设置过期时间来自动清理过期的会话数据。
5.消息队列:字符串类型可以用于实现简单的消息队列,例如将消息内容作为字符串存储在Redis中,然后使用列表类型的命令进行消息的发布和订阅。
6.分布式缓存:字符串类型可以用于实现分布式缓存,例如将经过序列化的对象存储在字符串类型中,然后通过缓存命中来提高系统的性能和扩展性。
底层实现
String 类型的底层的数据结构实现主要是 long 和 SDS(简单动态字符串)。
二、Hash(哈希)
简介
1. Redis hash 是一个键值(key=>value)对集合。
2. Redis hash 是一个 string 类型的 field 和 value 的映射表,hash 特别适合用于存储对象。
应用场景
存储对象:刚才我们讲到,String类型也可以存储对象,但我们为什么不推荐呢?
比如一个用户对象,属性包括姓名、年龄、性别、学号、学分等,因为客户端会先把这个对象序列化后存储为一个字符串的值,这时候在需要修改其中某一项时,通常需要将所有值取出反序列化后,修改某一项的值,再序列化存储回去。
这样不仅增大了开销,也不适用于一些可能并发操作的场合(比如两个并发的操作都需要修改学分)。而Redis的Hash结构可以使你像在数据库中Update一个属性一样只修改某一项属性值。
Redis的Hash实际是内部存储的Value为一个HashMap,并提供了直接存取这个Map成员的接口。
底层实现
上面已经说到Redis Hash对应Value内部实际就是一个HashMap,实际这里会有2种不同实现,这个Hash的成员比较少时Redis为了节省内存会采用类似一维数组的方式来紧凑存储,而不会采用真正的HashMap结构,对应的value redisObject的encoding为zipmap,当成员数量增大时会自动转成真正的HashMap。
注意
Redis提供了接口(hgetall)可以直接取到全部的属性数据,但是如果内部Map的成员很多,那么涉及到遍历整个内部Map的操作,由于Redis单线程模型的缘故,这个遍历操作可能会比较耗时,而另其它客户端的请求完全不响应,这点需要格外注意。
三、List(列表)
简介
1.list 是按照插入顺序排序的string字符串链表,按照插入顺序排序。你可以添加一个元素到列表的头部(左边)或者尾部(右边),它是一个有序集合。
2. 双向链表实现,两端添加元素的时间复杂度为 O(1)
3. 插入元素时,如果 key 不存在,redis 会为该 key 创建一个新的链表,如果链表中所有的元素都被移除,该 key 也会从 redis 中移除。
4. 列表最多可存储 2的32方 - 1 元素 (4294967295, 每个列表可存储40多亿)。
应用场景
1. 消息队列:redis 的 list 数据类型对于大部分使用者来说,是实现队列服务的最经济,最简单的方式。
2. 任务池:可以利用Lists的PUSH操作,将任务存在Lists中,然后工作线程再用POP操作将任务取出进行执行,其实也有点类似消息队列。
3. “最新内容”:因为 list 结构的数据查询两端附近的数据性能非常好,所以适合一些需要获取最新数据的场景,比如新闻类应用的 “最近新闻”。
底层实现
LinkedList :普通链表,可以从双端访问,内存占用较高,内存碎片较多ZipList :压缩列表,可以从双端访问,内存占用低,存储上限低(redis7.0后废弃,交友listpack数据结构来实现了)
QuickList:LinkedList + ZipList,可以从双端访问,内存占用较低,包含多个ZipList,存储上限高
3.2版本前redis采用LinkedList和ZipList来实现List,当元素数量小于512并且元素大小小于64字节时采用ZipList编码,超过则采用LinkedList编码。
3.2版本后,List 数据类型底层数据结构就只由 quicklist 实现了,替代了双向链表和压缩列表。
四、Set(集合)
简介
1. Set是一个无序string类型集合。
2. 通过哈希表实现的,所以添加,删除,查找的复杂度都是 O(1)。
3. set 集合不允许数据重复,如果添加的数据在 set 中已经存在,将只保留一份
4. set 类型提供了多个 set 之间的聚合运算,如求交集、并集、补集,这些操作在 redis 内部完成,效率很高。
5. 集合最多可存储 2的32方 - 1 元素 (4294967295, 每个列表可存储40多亿)。
应用场景
set 类型的特点是“不重复且无序的一组数据”,并且具有丰富的计算功能,在一些特定的场景中可以高效的解决一般关系型数据库不方便做的工作。
- 唯一性数据存储:最基本的使用场景就是用来存储不重复的数据。你可以使用Set来存储用户ID、IP地址、邮箱地址等,确保数据的唯一性。
- 标签和标记系统:Set可以用于创建标签或标记系统。例如,你可以为文章、商品或其他实体创建一个包含相关标签的Set,以便后续快速检索。
- 关注和粉丝系统:在社交媒体或用户关系管理中,Set可以用来实现关注和粉丝系统。每个用户可以有一个Set,其中包含他们关注的其他用户或粉丝。
- 在线用户:Set可以用于跟踪在线用户。将用户ID添加到一个Set中,表示用户当前在线。通过检查Set中的成员,可以快速查找在线用户。
- 投票系统:Set可以用于实现投票系统。每个投票项目可以表示为一个Set,用户投票时将其ID添加到相应的Set中,确保每个用户只能投一次。
- 集合运算:Redis提供了多种Set运算,如交集、并集和差集。这些运算可以用于计算多个集合之间的共同元素、合并元素等。
- 排行榜和排名:Set可以用于创建排行榜系统。例如,每个元素代表一个玩家,分数作为元素的权重。可以通过有序集合操作获取排名和排行。
- 地理位置标记:Set可以用于存储地理位置数据,例如存储用户的经纬度坐标,然后利用Set运算来查找附近的位置。
- 过滤重复事件:如果你需要记录一系列事件,并且要确保事件不重复记录,可以使用Set来存储已经发生的事件,防止重复记录。
五、ZSet(sorted set:有序集合)
简介
1. Redis zset 和 set 一样也是string类型元素的集合,且不允许重复的成员。
2. 不同的是每个元素都会关联一个double类型的分数,redis正是通过分数来为集合中的成员进行从小到大的排序。
3. zset的成员是唯一的,但分数(score)却可以重复。
应用场景
在集合类型的场景上加入排序就是有序集合的应用场景了。
- 根据好友的“亲密度”排序显示好友列表。
- 直播间里,粉丝打赏金额排序。
- 排行榜和计分系统:有序集合非常适合实现排行榜和计分系统。成员的分数可以表示玩家的得分、评分、积分等。你可以通过分数对成员进行排序,快速地获取前几名的排名。
- 时间序列数据:如果你需要存储带有时间戳的数据,有序集合可以根据时间戳(作为分数)进行排序,然后按时间范围快速查询数据。
- 最新消息:有序集合可以用来存储最新的消息,每个消息的分数可以是消息的时间戳,这样可以方便地获取最新的消息。
- 带权重的标签/标签云:在社交网络或标签系统中,你可以使用有序集合来存储标签,成员是标签,分数可以表示标签的热度、权重等。这可以用来实现标签云、热门标签等功能。
六、BitMap
简介
bitmap,位图。是一连串二进制数组,可通过偏移量offset定位元素,BitMap通过最小单位bit来进行0、1的设置,表示某个元素的值或状态,时间复杂度为O(1)。
bit是计算机中最小的单位,使用起来非常节省空间,特别适用于一些数据量大且使用二值统计的场景。
应用场景
- 签到统计:在签到打卡的场景中,我们只用记录签到(1)或未签到(0),所以它就是非常典型的二值状态。
- 判断用户登陆态
七、HyperLogLog
简介
HyperLogLog是一种用于「统计基数」的数据集合类型,基数统计就是指统计一个集合中不重复的元素个数。 统计规则是基于概率完成的,不是非常准确,标准误算率是 0.81%。
在redis中每个HyperLogLog键只需要花费12KB内存就可以计算接近2^64个不同元素的基数,非常节省空间。
应用场景
百万级网页 UV 计数
八、GEO
简介
主要用于存储地理位置信息并对其进行操作。
底层实现
GEO 本身并没有设计新的底层数据结构,而是直接使用了 Sorted Set 集合类型。
GEO 类型使用GeoHash编码方法实现了经纬度到Sorted Set中元素权重分数的转换,这其中的两个关键
机制就是「对二维地图做区间划分」和「对区间进行编码」。一组经纬度落在某个区间后,就用区间的编
码值来表示,并把编码值作为Sorted Set元素的权重分数。这样一来,我们就可以把经纬度保存到Sorted Set中,利用Sorted Set提供的“按权重进行有序范围查找”的特性,实现LBS服务(位置信息服务 Location-Based Service)中频繁使用的“搜索附近”的需求。
应用场景
滴滴叫车:假设车辆 ID 是 33,经纬度位置是(116.034579,39.030452),我们可以用一个 GEO 集合保存所有车辆的经纬度,集合 key 是 cars:locations。
执行下面命令就可以把 ID 号为 33 的车辆的当前经纬度位置存入 GEO 集合中:
GEOADD cars:locations 116.034579 39.030452 33
当用户想要寻找自己附近的网约车时,LBS 应用就可以使用 GEORADIUS 命令。
执行下面命令,redis会根据输入的用户的经纬度信息,查找以此经纬度为中心 5km内的车辆信息。GEOADD cars:locations 116.034579 39.030452 5 km ASC COUNT 10
九、Stream
简介
Redis Stream是Redis 5.0版本新增加的数据类型,Redis专门为消息队列设计的数据类型。
在Redis 5.0 Stream 没出来之前,消息队列的实现方式都有着各自的缺陷,例如:
发布订阅模式,不能持久化也就无法可靠的保存消息,并且对于离线重连的客户端不能读取历史消息的缺陷;
List实现消息队列的方式不能重复消费,一个消息消费完就会被删除,而且生产者需要自行实现全局唯一ID。
基于以上问题,Redis 5.0便推出了Stream类型也是此版本最重要的功能,用于完美地实现消息队列,它
支持消息的持久化、支持自动生成全局唯一ID、支持ack确认消息的模式、支持消费组模式等,让消息
队列更加的稳定和可靠。
应用场景
消息队列