【Redis】数据类型详解及其应用场景

目录

    • Redis 常⻅数据类型
      • 预备知识
        • 基本全局命令
          • 小结
        • 数据结构和内部编码
        • 单线程架构
          • 引出单线程模型
          • 为什么单线程还能这么快


Redis 常⻅数据类型

Redis 提供了 5 种数据结构,理解每种数据结构的特点对于 Redis 开发运维⾮常重要,同时掌握每种数据结构的常⻅命令,会在使⽤ Redis 的时候做到游刃有余。本章内容如下:

  • 预备知识:⼏个全局(generic)命令,数据结构和内部编码,单线程模式机制分析。
  • 5 种数据结构的特点、命令使⽤、应⽤场景⽰例。
  • 键遍历、数据库管理。

预备知识

在正式介绍 5 种数据结构之前,了解⼀下 Redis 的⼀些全局命令、数据结构和内部编码、单线程命令处理机制是⼗分必要的,它们能为后⾯内容的学习打下⼀个良好的基础.主要体现在两个⽅⾯:

  1. Redis 的命令有上百个,如果纯靠死记硬背⽐较困难,但是如果理解 Redis 的⼀些机制,会发现这些命令有很强的通⽤性。
  2. Redis 不是万⾦油,有些数据结构和命令必须在特定场景下使⽤,⼀旦使⽤不当可能对 Redis 本⾝或者应⽤本⾝造成致命伤害。
基本全局命令

Redis 有 5 种数据结构,但它们都是键值对种的值,对于键来说有⼀些通⽤的命令。

必须要进入 redis-cli 客户端程序,才能输入 redis 命令
全局命令就是能够搭配任意一个数据结构使用的命令

KEYS

keys

查询当前服务器上匹配的 key,返回所有满⾜样式(pattern)的 key。⽀持如下统配样式。
通过一些特殊符号(通配符)来描述的模样,匹配上述模样的 key 就能被查询出来

pattern 包含特殊符号的字符串,是去描述另外的字符串是什么样的

  • h?llo 匹配 hello , hallohxllo
  • h*llo 匹配 hlloheeeello
  • h[ae]llo 匹配 hellohallo 但不匹配 hillo
  • h[^e]llo 匹配 hallo , hbllo , … 但不匹配 hello
  • h[a-b]llo 匹配 hallohbllo

?匹配任意一个字符

  • 匹配任意零个或者多个字符
    [abcde]只能匹配 abcde 的任意一个,相当于给出固定选项
    [^e]排除 e,只有 e 匹配不了,其他都能匹配
    [a-e]匹配 a 到 e 之间的字符,包括 a 和 e

语法:

KEYS pattern

命令有效版本:1.0.0 之后

时间复杂度:O(N)

所以在生产环境上,一般禁止使用 keys 命令,尤其是像 keys _ 这种,这是查询 Redis 存储所有的 key。Redis 经常被用于做缓存,挡在 MySQL 前面,如果 Redis 被 keys _ 这样一个命令阻塞住了,其他查询 Redis 操作间超时了,此时这些请求就会直接查数据库,如果请求过多 MySQL 就容易挂了。

  1. 办公环境:办公的电脑
  2. 开发环境:有时就是和办公环境一样的(前端/客户端),有时开发环境就是一个单独的服务器(后端,因为有些程序比较复杂)
    1. 编译一次时间比较久,比如 C++,就需要一台高性能的服务器
    2. 有些程序一启动就消耗很多 CPU 和内存资源
    3. 有的程序比较依赖 Linux,在 Windows 环境搭不起来
  1. 测试环境:一般是比较好的服务器,测试工程师用的
  2. 生产环境(线上环境):与前面三个环境相对的,前面三个是线下环境,线上环境是外界用户访问的,线下环境是外界用户无法访问的,这是影响公司营收的

返回值:匹配 pattern 的所有 key。

⽰例:

redis> MSET firstname Jack lastname Stuntman age 35
"OK"
redis> KEYS *name*
1) "firstname"
2) "lastname"
redis> KEYS a??
1) "age"
redis> KEYS *
1) "age"
2) "firstname"
3) "lastname"

EXISTS

exists

判断某个 key 是否存在。

语法:

EXISTS key [key ...]

命令有效版本:1.0.0 之后

时间复杂度:O(1),严谨点应该是多少个 key 就多少个 O(1)

Redis 组织这些 key 就是按照哈希表的方式来组织的。

Redis 支持很多数据结构指的是一个 value 可以是一些复杂的数据结构。Redis 自身的这些键值对是通过哈希表组织的,具体的某个值又可以是一些数据结构。

返回值:key 存在的个数。

⽰例:

 redis> SET key1 "Hello""OK"redis> EXISTS key1(integer) 1redis> EXISTS nosuchkey(integer) 0redis> SET key2 "World""OK"redis> EXISTS key1 key2 nosuchkey(integer) 2

DEL

del

删除指定的 key。

语法:

DEL key [key ...]

命令有效版本:1.0.0 之后

时间复杂度:O(1)

返回值:删除掉的 key 的个数。

⽰例:

 redis> SET key1 "Hello""OK"redis> SET key2 "World""OK"redis> DEL key1 key2 key3(integer) 2

在 MySQL ,像删除一类的操作,都是比较危险的,删除后数据就没有了。但在 Redis 主要的应用场主要是作为缓存,此时存的是一个热点数据,全量数据在 MySQL 之类的数据库中,此时直接把 Redis 的 key 删除了几个,一般来说问题不大,除非是删除了很多,这样就会导致请求直接发送到 MySQL,就容易把 MySQL 搞挂。

如果把 Redis 作为数据库存储,这样误删数据就问题大了。

如果把 Redis 作为消息队列,影响大不大就具体情况具体分析了。

EXPIRE

expire

为指定的 key 添加秒级的过期时间(Time To Live TTL),单位是秒,超过时间 key 就被自动删除了,比如手机验证码,基于 Redis 实现分布式锁(为避免不能正确解锁的情况,通常都会在加锁的时候设置过期时间,Redis 实现分布式锁就是给 Redis 里写一个特殊的 key value)。

pexpire 单位是毫秒,其他和 expire 是一样的

语法:

EXPIRE key seconds

key 必须存在

命令有效版本:1.0.0 之后

时间复杂度:O(1)

返回值:1 表⽰设置成功。0 表⽰设置失败。

⽰例:

TTL

ttl

time to live

获取指定 key 的过期时间,秒级。

pttl 单位是毫秒,其他和 ttl 是相似的

语法:

TTL key

命令有效版本:1.0.0 之后

时间复杂度:O(1)

返回值:剩余过期时间。-1 表⽰没有关联过期时间,-2 表⽰ key 不存在。

⽰例:

 redis> SET mykey "Hello""OK"redis> EXPIRE mykey 10(integer) 1redis> TTL mykey(integer) 10

EXPIRE 和 TTL 命令都有对应的⽀持毫秒为单位的版本:PEXPIRE 和 PTTL,详细⽤法就不再介绍了

一个 Redis 中可能同时存在很多 key,很大一部分可能都有过期时间,Redis 服务器是怎么知道哪些 key 已经过期要被删除,哪些 key 还没过期?

如果直接遍历所有的 key,肯定是效率很低的。

Redis 整体的策略:

  1. 定期删除:这个定期删除也采用了一个抽取样本的方式,每次只抽取一部分,保证这个抽取检查的过程足够快,不要浪费太多时间
  2. 惰性删除:过期了不会立即删除,但一旦访问到了 Redis 就立刻出发删除 key 的操作,同时返回一个 nil

以上策略的原因:因为 Redis 是单线程的程序,主要的任务是处理每个命令,如果扫描过期 key 太耗费时间就导致正常处理请求命令被阻塞了

以上策略的效果是一般的,仍然可能有很多过期的 key 被残留。对以上 Redis 也是有补充的,比如一系列的内存淘汰策略

注意:

  1. Redis 中没有采取定时器的方式来实现过期 key 的删除
  2. 如果有多个 key 过期,也可以通过一个定时器(基于优先级队列或者时间轮)来高效/节省 CPU 的前提下来处理多个 key

作者没有采用定时器的原因?可能是因为如果基于定时器实现就要引入多线程了,而 Redis 早期版本就是奠定了单线程的基调,多线程就不符合作者初衷

定时器的实现方式(Redis 并没有这个做):

  1. 优先级队列:
    1. 假定很多 key 都设置了过期时间,放入优先级队列后,指定优先级规则是过期时间早的先出队列,此时扫描线程只需要盯着队首元素即可
    2. 但这个是扫描线程也不需要检查得太频繁,可以根据当前时刻和队首元素的过期时间设置一个等待
    3. 此时如果有新任务添加进来,就唤醒一下刚才的线程,重新检查一下队首元素,再根据时间差距重新调整阻塞时间即可
  1. 时间轮:
    1. 把时间划分成很多的格子,划分的粒度看实际需求
    2. 每个格子都挂着一个链表,每个链表都代表一个要执行的任务
    3. 此时设置一个指针遍历这个轮,每隔固定的时间走一个格子
    4. 此时添加一个 key 时,把其过期时间除以指针移动的固定时间,放到对应的格子
    5. 对于时间轮多少个格子以及移动的固定时间都是根据需求设置的

Redis 源码中,一个比较核心的机制是事件循环

关于键过期机制,可以参考图 2-1 所⽰。

图 2-1 键的过期机制

TYPE

返回 key 对应的数据类型。

Redis 所有的 key 都是 string,但 key 对应的 value 可能有多种类型

语法:

TYPE key

命令有效版本:1.0.0 之后

时间复杂度:O(1)

返回值: none , string , list , set , zset , hashstream(这个是 Redis 作为消息队列使用的 value)。

⽰例:

 redis> SET key1 "value""OK"redis> LPUSH key2 "value"(integer) 1redis> SADD key3 "value"(integer) 1redis> TYPE key1"string"redis> TYPE key2"list"redis> TYPE key3"set"
小结
  • keys:用来查看匹配规则的 key
  • exists:用来判定指定 key 是否存在
  • del:删除指定的 key
  • expire:给 key 设置过期时间
  • ttl:查询 key 的过期时间
  • type:查询 key 对应的 value 的类型

以上只是给出⼏个通⽤的命令,为 5 种数据结构的使⽤(实际上 Redis 支持10个数据类型)做⼀个热⾝,后续将对键管理做⼀个更为详细的介绍。

数据结构和内部编码

type 命令实际返回的就是当前键的数据结构类型,它们分别是:string(字符串)、list(列表)、hash(哈希)、set(集合)、zset(有序集合),但这些只是 Redis 对外的数据结构,如图 2-2 所⽰。

图 2-2 Redis 的 5 种数据类型

这5种数据结构相当于 Java 中的:

  1. String
  2. HashMap
  3. List
  4. Set
  5. 这个找不太到,除了存储 member 外还需要存储一个 score(权重)

实际上 Redis 针对每种数据结构都有⾃⼰的底层内部编码实现,⽽且是多种实现,这样 Redis 会在合适的场景选择合适的内部编码,如表 2-1 所⽰。

表 2-1 Redis 数据结构和内部编码

数据类型内部编码说明
stringraw最基本的字符串
stringint当 value 是一个整数时,Redis 很可能直接用 int 保存
stringembstr针对短字符串进行的特殊优化
hashhashtable最基本的哈希表,但这并不是 Java 标准库的那个 HashTable
hashziplist压缩列表,针对哈希表里面元素较少的情况,能够节省空间
listlinkedlist链表
listziplist压缩列表
sethashtable
setintset针对集合中存的都是整数
zsetskiplist跳表,也是链表,但每个节点上有多个指针域
zsetziplist

可以看到每种数据结构都有⾄少两种以上的内部编码实现,Redis 会自动根据当前的实际情况选择内部的编码方式,自动适应的,例如 list 数据结构包含了 linkedlist 和 ziplist 两种内部编码。同时有些内部编码,例如 ziplist,可以作为多种数据结构的内部实现,可以通过 object encoding 命令查询内部编码:

127.0.0.1:6379> set hello world
OK
127.0.0.1:6379> lpush mylist a b c
(integer) 3
127.0.0.1:6379> object encoding hello
"embstr"
127.0.0.1:6379> object encoding mylist
"quicklist"

可以看到 hello 对应值的内部编码是 embstr,键 mylist 对应值的内部编码是 ziplist。

从 Redis 3.2 开始,对于 list 引入了新的实现方式 quicklist,就直接代替了 linkedlist 和 ziplist,同时兼顾了两个的优点,quicklist 就是一个链表,每个元素又是一个 ziplist,把空间和效率都折中兼顾到。

注意,只是对于 list 这个数据类型是这样,别的还是按照上述表格

Redis 这样设计有两个好处:

  1. 可以改进内部编码,⽽对外的数据结构和命令没有任何影响,这样⼀旦开发出更优秀的内部编码,⽆需改动外部数据结构和命令,例如 Redis 3.2 提供了 quicklist,结合了 ziplist 和 linkedlist 两者的优势,为列表类型提供了⼀种更为优秀的内部编码实现,⽽对⽤⼾来说基本⽆感知。
  2. 多种内部编码实现可以在不同场景下发挥各⾃的优势,例如 ziplist ⽐较节省内存,但是在列表元素⽐较多的情况下,性能会下降,这时候 Redis 会根据配置选项将列表类型的内部实现转换为linkedlist,整个过程⽤⼾同样⽆感知。
单线程架构

Redis 使⽤了单线程架构来实现⾼性能的内存数据库服务,本节⾸先通过多个客⼾端命令调⽤的例⼦说明 Redis 单线程命令处理机制,接着分析 Redis 单线程模型为什么性能如此之⾼,最终给出为什么理解单线程模型是使⽤和运维 Redis 的关键。

Redis 只使用一个线程处理所有的命令请求,而不是 Redis 服务器进程内部真的只有一个线程,有多个线程,多个线程是在处理网络IO

引出单线程模型

现在开启了三个 redis-cli 客⼾端同时执⾏命令。

客⼾端 1 设置⼀个字符串键值对:

客⼾端 2 对 counter 做⾃增操作:

客⼾端 3 对 counter 做⾃增操作:

我们已经知道从客⼾端发送的命令经历了:发送命令、执行命令、返回结果三个阶段,其中我们重点关注第 2 步。我们所谓的 Redis 是采⽤单线程模型执⾏命令的是指:虽然三个客户端看起来是同时要求 Redis 去执行命令的,但微观⻆度,这些命令还是采⽤线性⽅式去执⾏的,只是原则上命令的执⾏顺序是不确定的,但⼀定不会有两条命令被同步执⾏,如图 2-3、2-4、2-5 所⽰,可以想象 Redis 内部只有⼀个服务窗⼝,多个客⼾端按照它们达到的先后顺序被排队在窗⼝前,依次接受 Redis 的服务,所以两条 incr 命令⽆论执⾏顺序,结果⼀定是 2,不会发⽣并发问题,这个就是 Redis 的单线程执⾏模型

图 2-3 宏观上同时要求服务的客⼾端

图 2-4 微观上客⼾端发送命令的时间有先后次序的

图 2-5 Redis 的单线程模型

为什么单线程还能这么快

这是个重要的面试题

通常来讲,单线程处理能⼒要⽐多线程差,例如有 10000 公⽄货物,每辆⻋的运载能⼒是每次 200 公⽄,那么要 50 次才能完成;但是如果有 50 辆⻋,只要安排合理,只需要依次就可以完成任务。那么为什么 Redis 使⽤单线程模型会达到每秒万级别的处理能⼒呢?可以将其归结为三点:

  1. 纯内存访问。Redis 将所有数据放在内存中,内存的响应时⻓⼤约为 100 纳秒,这是 Redis 达到每秒万级别访问的重要基础。
  2. 核心功能更简单。Redis 核心功能比数据库的核心功能更简单,数据库对于数据的插入删除查询都有更复杂的功能支持,这样的功能势必要花费更多的开销。
  3. 非阻塞 IO。Redis 使⽤ epoll 作为 I/O 多路复⽤技术的实现,再加上 Redis ⾃⾝的事件处理模型将 epoll 中的连接、读写、关闭都转换为事件,不在⽹络 I/O 上浪费过多的时间,如图 2-6 所⽰。

一个线程就可以管理多个 socket,对于 TCP 来说,服务器每次要服务一个客户端就要安排一个 socket,一个服务器服务多个客户端,就需要多个 socket,但很多情况下每个客户端和服务器之间的通信也没那么频繁,此时很多 socket 大部分时间都是静默的,是没有数据需要传输的,同一时刻只有少数 socket 是活跃的,因此就用个 IO多路复用,一个线程来处理多个 socket。

这是操作系统给程序员提供的机制,提供了一套 API,内部的功能都是操作系统实现的。

Linux 提供的 IO多路复用 主要是三套 API:

  1. select
  2. poll
  3. epoll

epoll 是个事件通知/回调机制,一个线程可以同时做多件事情,能高效完成多件事,但前提是这多件事交互是互不影响的,大部分时间都在等。

C++ 可以直接使用 Linux 原生的 epoll API;Java 可以使用 NIO,这是标准库提供的一组类,底层就是封装了 epoll。

  1. 单线程避免了线程切换和竞态产生的消耗。单线程可以简化数据结构和算法的实现,让程序模型更简单;其次多线程避免了在线程竞争同⼀份共享数据时带来的切换和等待消耗。

图 2-6 Redis 使⽤ I/O 多路复⽤模型

虽然单线程给 Redis 带来很多好处,但还是有⼀个致命的问题:对于单个命令的执⾏时间都是有要求的。如果某个命令执⾏过⻓,会导致其他命令全部处于等待队列中,迟迟等不到响应,造成客⼾端的阻塞,对于 Redis 这种⾼性能的服务来说是⾮常严重的,所以 Redis 是面向快速执行场景的数据库

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/51918.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Oracle篇】统计信息和动态采样的深度剖析(第一篇,总共六篇)

💫《博主介绍》:✨又是一天没白过,我是奈斯,DBA一名✨ 💫《擅长领域》:✌️擅长Oracle、MySQL、SQLserver、阿里云AnalyticDB for MySQL(分布式数据仓库)、Linux,也在扩展大数据方向的知识面✌️…

PostgreSQL-02-入门篇-查询数据

文章目录 1 简单查询SELECT 语句简介SELECT 语句语法SELECT 示例1) 使用 SELECT 语句查询一列数据的示例2) 使用 SELECT 语句查询多列数据的示例3) 使用 SELECT 语句查询表所有列数据的示例4) 使用带有表达式的 SELECT 语句的示例5) 使用带有表达式的 SELECT 语句的示例 2 列别…

MySQL基础:函数

💎所属专栏:MySQL 函数是指一段可以直接被另一段程序调用的程序或代码,在MySQL中也内置了许多函数供开发者去调用,例如之前提到的聚合函数,本节再去介绍一些其他常用的函数 字符串函数 函数功能CONCAT(S1,S2...Sn)字…

可视化编程-七巧低代码入门02

1.1.什么是可视化编程 非可视化编程是一种直接在集成开发环境中(IDE)编写代码的编程方式,这种编程方式要求开发人员具备深入的编程知识,开发效率相对较低,代码维护难度较大,容易出现错误,也需要…

《图解设计模式》笔记(三)生成实例

五、Singleton模式:只有一个实例 Singleton 是指只含有一个元素的集合。因为本模式只能生成一个实例,因此以 Singleton命名。 示例程序类图 Singleton.java public class Singleton {private static Singleton singleton new Singleton();private Si…

[Meachines] [Easy] bounty web.config 文件上传代码注入+内核MS10-092权限提升

信息收集 IP AddressOpening Ports10.10.10.93TCP:80 $ nmap -p- 10.10.10.93 --min-rate 1000 -sC -sV PORT STATE SERVICE VERSION │ 80/tcp open http Microsoft IIS httpd 7.5 …

使用Element UI组件时,icon图标不显示

问题描述: 我在使用Element UI组件的日期选择器时,发现图标不显示(左边是原图,右边的问题图)。 经过检查我发现,我的JS,CSS文件都没有问题,只是缺少了element-icons.tff和element-icons.woff这两个文件。 …

Qt 0814作业

一、思维导图 二、登录窗口界面 自由发挥登录窗口的应用场景,实现一个登录窗口界面 要求:每行代码都有注释 【需要用到的图片或者动图,自己去网上找】 #include "mywidget.h"MyWidget::MyWidget(QWidget *parent): QWidget(par…

【OCR 学习笔记】二值化——全局阈值方法

二值化——全局阈值方法 固定阈值方法Otsu算法在OpenCV中的实现固定阈值Otsu算法 图像二值化(Image Binarization)是指将像素点的灰度值设为0或255,使图像呈现明显的黑白效果。二值化一方面减少了数据维度,另一方面通过排除原图中…

微服务架构的介绍

系统架构的演变 随着互联⽹的发展,⽹站应⽤的规模不断扩⼤,常规的应⽤架构已⽆法应对,分布式服务架构以及微服务架构势在必⾏,必需⼀个治理系统确保架构有条不紊的演进。 单体应用架构 Web应⽤程序发展的早期,⼤部分…

C++入门——“继承”

一、引入 面相对象的计算机语言有三大特性:“封装”、“继承”、“多态”。今天来讲解一下C的一大重要特性——继承。 通俗理解来讲,继承就和现实生活一样,子辈继承父辈的一些特性,C中的继承也可以这样理解。它允许我们在保持原有…

计算机毕业设计选什么题目好?springboot 基于Java的学院教学工作量统计系统

✍✍计算机毕业编程指导师 ⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡ Java、…

vue使用高德获取当前地区天气

1、收件箱 | 高德控制台 (amap.com) 首先打开高德开放平台注册一下 2、创建一个应用获取到key后面获取天气的时候 请求接口的时候会用到key 2.1.1 创建应用的时候注意类型选成天气 2.1.2 创建完成之后就点添加key 然后选择web服务就行 3、可以调取天气接口 天气查询-基础 API…

【鸿蒙学习】HarmonyOS应用开发者基础 - 构建更加丰富的页面(一)

学完时间:2024年8月14日 一、前言叨叨 学习HarmonyOS的第六课,人数又成功的降了500名左右,到了3575人了。 二、ArkWeb 1、概念介绍 ArkWeb是用于应用程序中显示Web页面内容的Web组件,为开发者提供页面加载、页面交互、页面调…

文献检索中JCR与SCIE的区别

一、SCIE Science Citation Index-Expanded(SCI-E,科学引文索引),属于Web of Science中一个子库,是全球著名的科学引文索引数据库,收录了全球自然科学、工程技术、临床医学等领域内170多个学科的9500多种国际性、高影响…

volta引发的血案

什么是volta volta用于做项目级别的node版本控制,当手头上的项目有多个时,且node版本可能还不一样,我们需要不断切换node版本。使用volta可以很好的解决这个问题。只需要安装volta,然后在下面的package.json中配置好node版本即可…

Oracle 用户-表空间-表之间关系常用SQL

问题: 当某一个表数据量特别大,突然插入数据一直失败,可能是表空间不足,需要查看表的使用率 用户-表空间-表之间关系:用户可以有多个表空间,表空间可以有多个表,表只能拥有一个表空间和用户 1.…

跨国企业是否适合使用专线连接国际互联网?

在跨国企业开展国际通信时,需要稳定高效的网络连接来保障业务运作。虽然传统的互联网连接方式较为普遍,但由于带宽有限、网络延迟等问题,跨国企业往往会遇到网速缓慢、连接不稳定等挑战。因此,专线连接逐渐成为跨国企业的一个可行…

如何将MySQL迁移到TiDB,完成无缝业务切换?

当 MySQL 数据库的单表数据量达到了亿级,会发生什么? 这个现象表示公司的业务上了一个台阶,随着数据量的增加,公司规模也进一步扩大了,是非常喜人的一个改变 ,然而随之而来的其他变化,就没那么…

C#实现国产Linux视频录制生成mp4

一. 技术方案 要完成这些功能,具体来说,需要解决如下几个技术问题: (1)麦克风数据采集。 (2)摄像头数据采集。 (3)音频数据编码。 (4)视频数…