Redis底层实现--字符串

Redis字符串存储实现原理

  • Redis 中的字符串是可以修改的字符串,在内存中他是以字节数组的形式存在的。我们在入门语言C语言里面的字符串标准形式是以NULL(即0x\0)作为结束符,但是Redis里面,字符串表示方法不是这样,因为,要获取以null结尾的字符串需要遍历整个字符串,时间复杂度是O(n),对应单线程对外服务的Redis来说是无法承受的。
  • Redis的字符串结构叫做SDS,Simple Dynamic String。他的结构是一个带上长度信息的字节数组,类似C语言中的结构体。
struct SDS<T>{T capacity;			//数组容量T len;				//已有数据长度byte flags; 		//特殊标志位byte[] content;      //数组主体内容
}
  • Redis中SDS存储结构的设计类似于ArrayList机构,因为Redis允许字符串的修改,因此初始申请可以有一部分的冗余空间。
    • capacity 标识所有分配数组的长度,包括未存储数据的部分空间
    • len标识字符串的实际长度
    • 当冗余的空间不够时候,先扩容,在复制旧的内容,然后在添加新内容,如果字符串长度非常长,内存的分配和复制开销会特别大。
  • 以上结构体中,使用的泛型T,其中Capacity和len的类型是T,因为Redis对存储的压缩优化
    • 当存储字符串比较短的时候,了你和capacity可以使用byte和short来表示,
  • Redis规定字符串长度不超过512M,创建字符串时候len和capacity一样长,不会多分配冗余空间,这是因为绝大多数场景下我们不会去修改字符串。
embstr OR raw
  • Redis字符串有两种存储方式,在长度短的时候,使用embstr形式存储,长度超过44 字节时候,使用raw形式存储,如下实验:
新docker-redis:0>set codehole aaaaaaaabbbjjbjbdjjskjkjsdeuiopoiioioioioioi
"OK"
新docker-redis:0>debug object codehole
"Value at:0x7f0a3b3c22c0 refcount:1 encoding:embstr serializedlength:41 lru:12955894 lru_seconds_idle:8"
新docker-redis:0>set codehole aaaaaaaabbbjjbjbdjjskjkjsdeuiopoiioioioioioi1111
"OK"
新docker-redis:0>debug object codehole
"Value at:0x7f0a3d6d66a0 refcount:1 encoding:raw serializedlength:43 lru:12955928 lru_seconds_idle:2"
  • 一下我们通过分析Redis字符串对象存储结构来说明两个问题

    • 问题一:为什么是44个字节作为界限
    • 问题二:embstr 和raw存储的区别
  • Redis对象存储都会有一个头部结构,如下形式

struct RedisObject{int4 type;			//4bitint4 encoding;		//4bitint24 lru;			//24bit 3byteint32 refcount;		//32bit 4bytevoid *ptr;			//8byte, 64bit system
} robj;
  • 不同的对象具有不同的type 类型(4bit)。

  • 同一个类型的type也会有不同的存储方式encoding(4bit)。

  • 为了记录对象的lru信息,使用了24bit来记录lru信息

  • 每个对象都有一个引用计数,refcount,当他归零时候,对象不被任何地方使用,对象将被销毁,内存被回收

  • ptr指针结构将指向对象的具体存储位置(body)

  • 以上所有的综合一起 4bit+ 4bit+ 24bit + 32 bit + 64bit = 128bit = 16byte,所有Redis对象的对象头结构都需要占据16字节存储空间。

  • 接着我们在分享SDS结构体大小,在字符串比较小的时候,SDS对象头结构的大小如下:

struct SDS{int8 capacity;		//1byteint8 len;			//1byteint8 flags;			//1bytebyte[] content; 	//存储数据的数组,长度capacity
}
  • 如上结构中 capacity ,len, flags 三个都占用1byte的内存,其他的就是 capacity长度的数组,用来存储具体数据。也就是最少也要3 个字节的存储空间。加上上面的16byte,我们一个没有存储字符串的Redis字符串对象,已经有19 byte的空间被系统各种属性占用。

  • 我们在内存分配的时候,使用jemalloc, tcmalloc等分配内存大小的单元都是2/4/4/8/16/32/64 byte,

  • 为了容纳完整的embstr对象,jemalloc最少分配32byte空间,如果字符串稍微长点,那就是64byte,如果字符串超过64byte,Redis会认为是一个大字符串,不在适合emdstr存储的形式,而使用raw形式

  • 我们用最大内存空间64 来计算最大字符串长度, 64 - 19 = 45 ,但是之前实验得到的是44

  • SDS结构中content中字符串是以null结尾,多出这个字节,便于直接使用glbc的字符串处理函数,以及便于字符串的调试打印输出。最终得出了44 的长度。如下图:
    在这里插入图片描述

  • 问题二中embstr存储形式与 raw的存储形式如下

    • embst存储将RedisObject对象头结构和SDS对象连续存储在一起,使用malloc方法一次性分配内存
    • raw存储形式不一样,他需要两次malloc方法,两个对象头在内存地址上不连续通过对象头中 ptr指针来寻址存储位置。
      在这里插入图片描述
扩容策略
  • 字符串的扩容两种方式:
    • 字符串长度在1MB之前,扩容空间都是加倍扩容,也就是保留100%的冗余空间
    • 字符串长度超过1MB后,避免加倍后冗余空间浪费过多,每次只多分配1MB大小的冗余空间。

上一篇:Redis服务信息–Info指令

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/310494.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[C++STL]C++实现string容器

代码如下: #pragma once #define _CRT_SECURE_NO_WARNINGS #include <iostream> #include <assert.h> #include <cstring> using namespace std;class String { public:String(const char *str ""){assert(str ! nullptr);_size strlen(str);_s…

ASP.NET Core 日志框架:Serilog

在 ASP.NET Core 日志模型 中对日志整体实现方式进行了介绍&#xff0c;通过使用内置日志记录器来实现日志的输出路径。而在实际项目开发中&#xff0c;使用第三方日志框架来记录日志也是非常多的&#xff0c;首先一般基础的内置日志记录器在第三方日志框架中都有实现&#xff…

[C++STL]C++实现vector容器

代码如下: #pragma once #include <iostream> #include <assert.h> using namespace std;template<typename T> class Vector { public:typedef T* iterator;typedef const T* const_iterator;Vector() :_start(nullptr), _finish(nullptr), _endOfStorage(…

数据结构与算法--简单栈实现及其应用

栈 栈&#xff08;Stack&#xff09;是一种限制插入和删除只能在一个位置上进行的表&#xff0c;改位置是表的末端&#xff0c;叫做栈顶top。栈的基本操作有push &#xff08;进栈&#xff09;pop&#xff08;出栈&#xff09;栈又叫做LIFO&#xff08;后进先出&#xff09;表…

树莓派销量突然猛增

树莓派基金会负责人 Eben Upton 近日在推特上公布&#xff0c;树莓派在三月份的销量达到 640,000 套&#xff0c;三月也成为有史以来销售量第二高的时期。Eben 认为&#xff0c;这大概是由于受 COVID-19 冠状病毒肺炎影响&#xff0c;在居家隔离期间&#xff0c;树莓派能够以低…

[C++STL]C++实现list容器

代码如下&#xff1a; #pragma once #include <iostream> using namespace std;template<typename T> struct ListNode {T _data;ListNode<T> *_next;ListNode<T> *_prev;ListNode(const T & val T()) :_data(val), _next(nullptr), _prev(nullp…

Java动态追踪技术--BTrace

Java动态追踪技术 需求翻译官的日常工作不是在的改bug&#xff0c;发布代码&#xff0c;就是在加日志查找bug的路上。查BUG的过程是痛苦的&#xff0c;我们总是在不停的看代码&#xff0c;修改代码&#xff0c;添加日志&#xff0c;从而帮助我们发现问题&#xff0c;这种形式是…

C#黔驴技巧之实现统计结果排名

本节是实现统计排名的一点技巧&#xff0c;可能有一部分童鞋在实现排名统计绕了一大圈&#xff0c;最后还不如两行代码就搞定&#xff0c;代码清晰而可读性强&#xff0c;接下来我们来一起来看看。我们知道在SQL Server中可以利用Row_Number、Rank等函数进行排名&#xff0c;在…

数据结构与算法--二叉树实现原理

二叉树 二叉树&#xff08;binary tree&#xff09;是一棵树&#xff0c;其中每个节点都不能有多于两个的子节点二叉树的一个性质是一颗平均二叉树的深度要比节点个数N小得多&#xff08;重点&#xff09;&#xff0c;对二叉树的分析得出其平均深度为O(N\sqrt NN​)&#xff0…

[C++STL]C++实现stack容器适配器

代码如下: #include <iostream> #include <deque> using namespace std;template<typename T,typename Con deque<T>> class Stack { public:Stack() {}void Push(const T &x) {_c.push_back(x);}void Pop(){_c.pop_back();}T & Top(){retur…

Istio Pilot架构解析

本文节选自 ServiceMesher 社区联合编写的《Istio Handbook——Istio 服务网格进阶实战》。本书地址&#xff1a;https://github.com/servicemesher/istio-handbook/在应用从单体架构向微服务架构演进的过程中&#xff0c;微服务之间的服务发现、负载均衡、熔断、限流等服务治理…

数据结构与算法--二叉查找树实现原理

二叉查找树 二叉树的一个重要应用就是他在查询中的使用&#xff0c;假设书中每个节点存储一项数据。在我们的案例中&#xff0c;任意复杂的项在java中都容易处理&#xff0c;但为了简单还是假设都是整数。还假设他们都是不重复的整数&#xff0c;使二叉树称为二叉查找树的性质…

[C++STL]C++实现queue容器适配器

代码如下: #include <iostream> #include <deque>using namespace std;template<typename T,typename Con deque<T>> class Queue { public:Queue(){}void Push(const T & x){_c.push_back(x);}void Pop(){_c.pop_front();}T &Back(){return…

当模板方法遇到了委托函数,你的代码又可以精简了

现如今当你翻看一些开源项目源码的时候&#xff0c;你会发现现在到处充斥着委托函数&#xff0c;如Func,Action,Predicate&#xff0c;确实现在的C#在函数式编程 的路上越来越成为主流&#xff0c;越来越显示威力&#xff0c;曾经的一些经典设计模式写法&#xff0c;在函数式下…

数据结构与算法--面试必问AVL树原理及实现

数据结构与算法–AVL树原理及实现 AVL&#xff08;Adelson-Velskii 和landis&#xff09;树是带有平衡条件的二叉查找树&#xff0c;这个平衡条件必须容易实现&#xff0c;并且保证树的深度必须是O(logN)。因此我们让一棵AVL树中每个节点的左子树和右子树的高度最多相差1&…

MySQL8.0新特性

在这之前Mysql的版本是5.7&#xff0c;也是目前使用最广泛的一个版本。现在新版本跳过了6和7直接来到了8&#xff0c;那么V6和V7版本去哪里了呢&#xff1f;比较靠谱的说法是v6用作了内部的其他用途而v7的话是因为mysql有个产品叫做clusterdb他有7这个版本&#xff0c;所以这个…

数据结构与算法--B树原理及实现

B树 前几篇文中讨论的数据结构我们都是假设所有的数据都存储在计算机的主存中。可说总要那么海量的数据需要通过个中数据结构去存储&#xff0c;我们不可能有这么多内存区存放这些数据。那么意味着我们需要将他们放磁盘。所以这个时候范问时间复杂度O决定了他是否能适合存储磁盘…

[C++STL]C++实现priority_queue容器适配器

代码如下: #pragma once #include <iostream> #include <vector> using namespace std;template<typename T> struct Less {bool operator()(const T &a, const T &b){return a < b;} };template<typename T> struct Greater {bool operat…

为什么要用内插字符串代替string.format

知道为什么要用内插字符串&#xff0c;只有踩过坑的人才能明白&#xff0c;如果你曾今使用string.format超5个以上占位符&#xff0c;那其中的痛苦我想你肯定是能够共鸣的。一&#xff1a;痛苦经历先上一段曾今写过的一段代码&#xff0c;大家来体会一下&#xff1a;LogHelper.…

SpringCloud Alibaba 框架下公司架构图

上一篇&#xff1a;Docker容器实战思维 下一篇&#xff1a;分布式事务理论模型