内核无锁队列kfifo

文章目录

  • 1、抛砖引玉
  • 2、内核无锁队列kfifo
    • 2.1 kfifo结构
    • 2.2 kfifo分配内存
    • 2.3 kfifo初始化
    • 2.4 kfifo释放
    • 2.5 kfifo入队列
    • 2.6 kfifo出队列
    • 2.7 kfifo的判空和判满
    • 2.8 关于内存屏障

1、抛砖引玉

昨天遇到这样一个问题,有多个生产者,多个消费者,一个公共的消息队列,生产者向消息队列中写数据,消费者从消息队列中读数据,因为消息队列是临界资源,因此需要加锁

在这里插入图片描述

这样做的话,锁竞争太严重,必定会影响效率,有没有一种办法,消费者在从消息队列中读取数据时,不需要加锁?

当然有,就是为每个消费者都建立一个自己的消息队列,生产者共用一个消息队列。生产者互斥的向消息队列中写数据,负载均衡器将数据分发到每个消费者的消息队列中,消息消费者再从自己的消息队列中读取数据,这样就形成了单读单写,这样的消息队列有一个名字,叫ringbuffer(环形缓冲区),适用于单生产者,单消费者的场景,虽然是两个线程,但是却不用加锁,可以用数组或者链表实现

在这里插入图片描述

有人可能会疑问,消费者自己的消息队列(ringbuffer)也是临界资源,也会被消费者和负载均衡器共同访问,难道不需要加锁控制吗?

其实在RingBuffer中设置了两个指针,head和tail。head指向下一次读的位置,tail指向的是下一次写的位置。RingBuffer可用一个数组进行存储。 在进行读操作的时候,我们只修改head的值,而在写操作的时候我们只修改tail的值。在写操作时,我们在写入内容到buffer之后才修改tail的值,而在进行读操作的时候,我们会读取tail的值并将其赋值给copyTail。赋值操作是原子操作。所以在读到copyTail之后,从head到copyTail之间一定是有数据可以读的,不会出现数据没有写入就进行读操作的情况。同样的,读操作完成之后,才会修改head的数值;而在写操作之前会读取head的值来判断是否有空间可以用来写数据。所以,这时候tail到head-1之间一定是有空间可以写数据的,而不会出现一个位置的数据还没有读出就被写操作覆盖的情况。这样就保证了RingBuffer的线程安全性。

理论证明,在一个生产者和一个消费者的情况下,两者之间的同步无需加锁,即可并发访问。

2、内核无锁队列kfifo

在Linux当中,单生产者单消费者的应用场景有很多,例如每个socket都对应着一个接受缓冲区和发送缓冲区,上层应用向发送缓冲区写数据,再将数据拷贝到网卡,发送给对方,接受缓冲区则相反。又比如一个进程A产生数据发给另外一个进程B,进程B需要对进程A传的数据进行处理并写入文件,如果B没有处理完,则A要延迟发送。为了保证进程A减少等待时间,可以在A和B之间采用一个缓冲区,A每次将数据存放在缓冲区中,B每次冲缓冲区中取。

因此Linux中有自己的ringbuffer,不过它的名字叫kfifo,kfifo设计的非常巧妙,代码很精简,以下为kfifo的相关源码,内核版本为4.9.145

2.1 kfifo结构

struct __kfifo {unsigned int	in;    //数据到来时,存放数据的位置unsigned int	out;   //读取数据的位置unsigned int	mask;  //mask+1表示缓冲区data的容量,能容纳多少个元素unsigned int	esize; //每个元素的大小void		*data;     //缓冲区的起始位置
};

请注意,这里的 in,out 均是无符号的整数类型。

2.2 kfifo分配内存

int __kfifo_alloc(struct __kfifo *fifo, unsigned int size,size_t esize, gfp_t gfp_mask)
{/** round down to the next power of 2, since our 'let the indices* wrap' technique works only in this case.*/size = roundup_pow_of_two(size);fifo->in = 0;fifo->out = 0;fifo->esize = esize;if (size < 2) {fifo->data = NULL;fifo->mask = 0;return -EINVAL;}fifo->data = kmalloc(size * esize, gfp_mask);if (!fifo->data) {fifo->mask = 0;return -ENOMEM;}fifo->mask = size - 1;return 0;
}

在为kfifo分配内存之前,需要检测传入的size是否为2的整数次幂,roundup_pow_of_two用于计算最接近且大于等于n的2的整数次幂,它的定义如下:

#define roundup_pow_of_two(n)			\
(						\__builtin_constant_p(n) ? (		\(n == 1) ? 1 :			\(1UL << (ilog2((n) - 1) + 1))	\) :		\__roundup_pow_of_two(n)			\)它可以等价为以下代码,方便理解:
unsigned int roundup_pow_of_two(unsigned int n)
{if(n == 1) return 1;int i = 0;for(; n != 0; ++i){n >> 1;}return 1U << i;
}假设n为5,二进制位0101,在for循环内,需要循环3次,n向右移3位,才为0,
最后1向左移3为,二进制为1000,十进制为8,为2的整数次幂,并且离5最近且大于5

为什么要这么做呢?因为kfifo是环形队列,它的可读可写位置必然会回到初始位置,因此就需要用到取余操作,那么 m%n 在CPU看来就等价于 m-n*floor(m/n),其中乘法最终是通过加法和移位操作完成的,而除法首先转变为乘法,减法又会通过补码转变为加法,因此效率就比较低。

但是如果缓冲区的长度为2的整数次幂,m%n = m & (n - 1),只有减法和位运算,效率就提高了,所以才会将缓冲区的长度设置为2的整数次幂,并且将 mask 设置为 size(容量) - 1,方便后续进行位运算

计算完size后,接着将 in/out 指向的位置初始化为0,因为此刻队列还未准备好,里面并没有任何数据。

esize 赋值给 fifo->esize 这个是代表了队列中数据的类型的 size,比如队列数据类型如果为 int,则 esize 等于 4,队列数据类型为char,则 esize 等于 1

接着调用 kmalloc_array 接口,分配一个 esize * size 大小的空间,作为缓冲区

最后将 fifo->mask 赋值为 size - 1

分配好队列后,实际情况如下所示:

在这里插入图片描述

2.3 kfifo初始化

这里跟kfifo分配内存有点不同,kfifo初始化是使用自己定义的buffer,不在需要调用 kmalloc_array 接口申请空间了

int __kfifo_init(struct __kfifo *fifo, void *buffer,unsigned int size, size_t esize)
{size /= esize;size = roundup_pow_of_two(size);fifo->in = 0;fifo->out = 0;fifo->esize = esize;fifo->data = buffer;if (size < 2) {fifo->mask = 0;return -EINVAL;}fifo->mask = size - 1;return 0;
}

这里依旧需要检测传入的size是否为2的整数次幂,roundup_pow_of_two用于计算最接近且大于等于n的2的整数次幂,其他部分都大致类似

2.4 kfifo释放

void __kfifo_free(struct __kfifo *fifo)
{kfree(fifo->data);fifo->in = 0;fifo->out = 0;fifo->esize = 0;fifo->data = NULL;fifo->mask = 0;
}

释放kfifo比较简单,直接释放data缓冲区,将所有的数据都置为0即可

2.5 kfifo入队列

static inline unsigned int kfifo_unused(struct __kfifo *fifo)
{return (fifo->mask + 1) - (fifo->in - fifo->out);
}static void kfifo_copy_in(struct __kfifo *fifo, const void *src,unsigned int len, unsigned int off)
{unsigned int size = fifo->mask + 1;unsigned int esize = fifo->esize;unsigned int l;off &= fifo->mask;if (esize != 1) {off *= esize;size *= esize;len *= esize;}l = min(len, size - off);memcpy(fifo->data + off, src, l);memcpy(fifo->data, src + l, len - l);/** make sure that the data in the fifo is up to date before* incrementing the fifo->in index counter*/smp_wmb();
}unsigned int __kfifo_in(struct __kfifo *fifo,const void *buf, unsigned int len)
{unsigned int l;l = kfifo_unused(fifo);if (len > l)len = l;kfifo_copy_in(fifo, buf, len, fifo->in);fifo->in += len;return len;
}

数据入队列时,调用了unsigned int __kfifo_in(struct __kfifo *fifo, const void *buf, unsigned int len)

在函数内部首先调用了kfifo_unused来判断当前还剩多少空间可以使用

前面我们已经提到过,fifo->mask 在初始化的时候被赋值成为 size - 1, 所以这里 (fifo->mask + 1) 就等于申请的时候的 size 值。size 的值代表着总的存储对象的个数,而每次在推数据进入 fifo 的时候,in 都会增加,取出数据的时候,out 都会增加。所以计算当前 fifo 中还剩余多少空间就使用了:

(fifo->mask + 1) - (fifo->in - fifo->out)

在这里插入图片描述

注意:这里的 in/out 是不断增加的无符号整形

接着会调用函数 static void kfifo_copy_in(struct __kfifo *fifo, const void *src, unsigned int len, unsigned int off)

首先还是通过 fifo->mask 得到了整个 size 的大小。然后是用:

off &= fifo->mask;

展开就是:

fifo->in = fifo->in & fifo->mask;

因为fifo->in是一直在增加的,但是缓冲区的容量是不变的,所以在写入数据之前,就需要找到具体在哪个位置写,也就是需要知道在缓冲区中,in的偏移量,因此就需要取余操作,但是呢,前面申请的空间已经是2的整数次幂,因此这里的位运算就替代了取余操作,提高了运算效率

接着判断 esize 的值,就是每个元素的占用内存的情况,如果不是 1 的话(一个字节),则需要对 off,size,len 分别乘以 esize。因为在使用 memcpy 时,需要以1个字节为单位进行数据拷贝。

举个例子:

在这里插入图片描述

接着使用:

l = min(len, size - off);

取得复制数据的长度 len 和 size-off(末尾的剩余空间) 之间的最小值,由是环形的缓冲区 ,所以在此处存在两种情况:

① 复制数据的长度len要小于size-off(末尾的剩余空间):

在这里插入图片描述

② 复制数据的长度len要大于size-off(末尾的剩余空间):

在这里插入图片描述

所以在这个地方,先去取一个 len 和 size-off 之间最小的那个值 l,即,先打算尝试把尾巴上能用的空间先用完,如果不够再去用从头部开始的剩余空间,这两个 memcpy 用得十分巧妙,不需要做额外的判断:

针对第一种情况(复制数据的长度len要小于size-off(末尾的剩余空间)):

第一条 memcpy:将 len 的数据 memcpy 到以 fifo->data (之前用过 kmalloc 分配的内存起始地址),加上 off 偏移(in 对应的偏移)的地方开始,copy 进 src 数据。

第二条 memcpy:len -l 等于0,memcpy 什么都不会做

针对第二种情况(复制数据的长度len要大于size-off(末尾的剩余空间)):

第一条 memcpy:和前一种情况一样

第二条 memcpy:len -l 大于0,将剩余的数据拷贝到fifo->data的头部

最终整个环形缓冲区的数据拷贝完成

最后在退出 kfifo_copy_in 后,在 __kfifo_in 函数中对 fifo->in 做累加:

fifo->in += len;

做完上述的拷贝后,对于上述两种情况,最后体现出来的是:

① 复制数据的长度len要小于等于size-off(末尾的剩余空间):

在这里插入图片描述

② 复制数据的长度len要大于size-off(末尾的剩余空间):

在这里插入图片描述

前面谈到的入队列都是out 在前,in在后,假设in在前,out在后呢?

复制数据的长度len要小于size-off(in和out之间的剩余空间):

在这里插入图片描述

第一条 memcpy:将 len 的数据 memcpy 到以 fifo->data,加上 off 偏移(in 对应的偏移)的地方开始,copy 进 src 数据。

第二条 memcpy:len -l 等于0,memcpy 什么都不会做

在这里插入图片描述

复制数据的长度len要大于size-off(in和out之间的剩余空间):

在这里插入图片描述

第一条 memcpy:将 len 的数据 memcpy 到以 fifo->data,加上 off 偏移(in 对应的偏移)的地方开始,copy 进 src 数据。

第二条 memcpy:len -l 等于0,memcpy 什么都不会做

在这里插入图片描述

到现在有人可能会有疑问,为什么在拷贝数据时为什么没有判断缓冲区是否满了呢?

其实这里调用了kfifo_unused函数计算剩余空间,如果剩余空间为0,虽然依旧会进入kfifo_copy_in函数,l = min(len, size - off),但这里是取了剩余空间和需要拷贝数据的最小值,即为0,两个memcpy什么都不会做

注意:如果拷贝的数据量大于剩余空间,会用数据将剩余的空间填充满,返回值就是拷贝了多少字节的数据

2.6 kfifo出队列

出队列和入队列的逻辑是差不多的,这里就不多赘述了

调用顺序是__kfifo_out–》__kfifo_out_peek–》kfifo_copy_out

static void kfifo_copy_out(struct __kfifo *fifo, void *dst,unsigned int len, unsigned int off)
{unsigned int size = fifo->mask + 1;unsigned int esize = fifo->esize;unsigned int l;off &= fifo->mask;if (esize != 1) {off *= esize;size *= esize;len *= esize;}l = min(len, size - off);memcpy(dst, fifo->data + off, l);memcpy(dst + l, fifo->data, len - l);/** make sure that the data is copied before* incrementing the fifo->out index counter*/smp_wmb();
}unsigned int __kfifo_out_peek(struct __kfifo *fifo,void *buf, unsigned int len)
{unsigned int l;l = fifo->in - fifo->out;if (len > l)len = l;kfifo_copy_out(fifo, buf, len, fifo->out);return len;
}
EXPORT_SYMBOL(__kfifo_out_peek);unsigned int __kfifo_out(struct __kfifo *fifo,void *buf, unsigned int len)
{len = __kfifo_out_peek(fifo, buf, len);fifo->out += len;return len;
}

2.7 kfifo的判空和判满

源代码中并没有判断空和判断满的函数,但是对于入队列时有一个计算剩余空间的函数,前面也提到过

static inline unsigned int kfifo_unused(struct __kfifo *fifo)
{return (fifo->mask + 1) - (fifo->in - fifo->out);
}

它的判满主要是看in - out 的值是等于 mask (size - 1)

对于出队列时,在__kfifo_out_peek 函数内,有l = fifo->in - fifo->out,当in和out相等时,就表示空的,也就是empty

关于in/out溢出问题
kfifo中的in和out只会一直增加,因为它俩是无符号整数,因此最终就会回到0,即使到in出现溢出,在out之前,in-out的值仍然为无符号整数,依旧能表示已经使用的buffer的长度,这点无需担心。这正是这个机制的精妙之处。

2.8 关于内存屏障

尽管单消费者和单生产者能够对kfifo的进行无锁并发访问,但是在源码中,入队列和出队列依旧使用了smp_wmb(),也就是内存屏障

编译器编译源代码时,会将源代码进行优化,将源代码的指令进行重排序,以适合于CPU的并行执行。然而,内核同步必须避免指令重新排序,优化屏障避免编译器的重排序优化操作,保证编译程序时在优化屏障之前的指令不会在优化屏障之后执行。

软件可通过读写屏障强制内存访问次序。读写屏障像一堵墙,所有在设置读写屏障之前发起的内存访问,必须先于在设置屏障之后发起的内存访问之前完成,确保内存访问按程序的顺序完成。Linux内核提供的内存屏障API函数说明如下表。内存屏障可用于多处理器和单处理器系统,如果仅用于多处理器系统,就使用smp_xxx函数,在单处理器系统上,它们什么都不要。

内存屏障含义
smp_rmb适用于多处理器的读内存屏障
smp_wmb适用于多处理器的写内存屏障
smp_mb适用于多处理器的内存屏障

所以在 kfifo_copy_in 和 kfifo_copy_out 的尾部都插入了 smp_wmb() 的写内存屏障的代码

它的作用是确保 fifo->in 和 fifo->out 增加 len 的这个操作在内存屏障之后,也就是保证了在 SMP 多处理器下,一定是先完成了 fifo 的内存操作,然后再进行变量的增加。以免被优化后的混乱访问,导致策略失败

不过,多个消费者、生产者的并发访问还是需要加锁限制

最后再提一句,pthread_mutex中不包含内存屏障,而spin_lock中包含内存屏障

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/202631.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【从零认识ECS云服务器 | 快速上线个人网站】二、使用ECS云服务器

第二章 使用ECS 2.1 获取ECS 方式一&#xff1a;通过试用中心免费领取ECS实例 满足以下全部条件的阿里云用户&#xff0c;可免费试用云服务器ECS&#xff1a; 阿里云注册会员用户并完成阿里云企业认证或个人认证用户。申请用户是云服务器ECS产品的新用户&#xff0c;可以申…

查询不用order by时结果默认怎么排序

总结: 如果在使用没有指定order by&#xff0c;那么基本上依赖于底层实现的&#xff0c;具体排序规则不定&#xff0c;所以排序的顺序也不固定&#xff0c;可能会随着时间发生变化。 在实际工作中&#xff0c;如果有查询列表展示数据的功能和需求&#xff0c;开发前一定要先确…

Linux 进程地址空间

文章目录 进程地址空间进程地址空间结构页表虚拟内存写时拷贝 进程地址空间 进程地址空间难以定义&#xff0c;因为它更像是一个中间件。 程序从磁盘中加载到内存&#xff0c;程序的执行需要硬件资源&#xff0c;所以每个程序启动时会创建至少一条进程&#xff0c;进程作为组…

HarmonyOS 修改App的默认加载的界面(ArkTS版本)(十七)

根据鸿蒙系统APP的应用生命周期结构&#xff08;鸿蒙4.0开发笔记之ArkTS语法基础之应用生命周期&#xff09;来看。 1、首先在roject/entry/src/main/ets/entryability/EntryAbility.ts文件中找到UI加载函数&#xff1a;onWindowStageCreate(…){…}&#xff0c;然后找到windo…

力扣100 相同的数(两种解法)

给你两棵二叉树的根节点 p 和 q &#xff0c;编写一个函数来检验这两棵树是否相同。 如果两个树在结构上相同&#xff0c;并且节点具有相同的值&#xff0c;则认为它们是相同的。 示例 1&#xff1a; 输入&#xff1a;p [1,2,3], q [1,2,3] 输出&#xff1a;true 示例 2&…

【数据分享】11个城市的出租车(网约车)数据(免费获取)

出租车&#xff08;网约车&#xff09;GPS数据是我们最常使用的交通大数据之一&#xff0c;但是出租车&#xff08;网约车&#xff09;GPS数据没有公开的获取渠道&#xff0c;有些学者可能能通过与相关机构合作拿到数据&#xff0c;但是对于绝大多数普通人是没有这个机会的&…

【理解ARM架构】中断处理 | CPU模式

&#x1f431;作者&#xff1a;一只大喵咪1201 &#x1f431;专栏&#xff1a;《理解ARM架构》 &#x1f525;格言&#xff1a;你只管努力&#xff0c;剩下的交给时间&#xff01; 目录 &#x1f35c;中断&#x1f368;GPIO中断代码实现 &#x1f35c;CPU&#x1f368;CONTROL…

2024王道考研计算机组成原理——存储系统

微信打开的时候会有一个人站在地球上&#xff0c;这个过程就是把程序从辅存转移到主存&#xff0c;数据只有调入主存当中才可以被CPU访问 cache&#xff1a;主存速度还是慢&#xff0c;为了进一步缓解CPU和主存之间的速度矛盾 在微信打视频聊天的时候&#xff0c;在这一段比较…

弘扬中华文化 感受戏曲魅力——安徽演艺小分队赴和田交流演出

为进一步弘扬中华优秀传统文化&#xff0c;促进皖和两地交往交流交融&#xff0c;12月2日&#xff0c;安徽省演艺小分队走进和田新夜市登台演出&#xff0c;黄梅戏、独唱、民乐演奏、杂技等丰富多样的表演&#xff0c;为观众们送上了一场文化盛宴。 安徽演艺小分队赴和田交流演…

一篇文章带你详细了解C++智能指针

一篇文章带你详细了解C智能指针 为什么要有智能指针内存泄漏1.什么是内存泄漏&#xff0c;它的危害是什么2.内存泄漏的分类3.如何避免内存泄漏 智能指针的使用及原理1.RAII2.智能指针的原理3.auto_ptr4.unique_ptr5.shared_ptr6.weak_ptr 为什么要有智能指针 C引入智能指针的主…

WindowsServer服务器系列:定时备份 MySQL

一、编写脚本 echo 取日期、时间变量值 set yy%date:~0,4% set mm%date:~5,2% set dd%date:~8,2% if /i %time:~0,2% lss 10 set hh0%time:~1,1% if /i %time:~0,2% geq 10 set hh%time:~0,2% set mn%time:~3,2% set ss%time:~6,2% set date%yy%%mm%%dd% set time%hh%%mn%%ss…

Vue2中v-html引发的安全问题

前言&#xff1a;v-html指令 1.作用&#xff1a;向指定节点中渲染包含html结构的内容。 2.与插值语法的区别&#xff1a; (1).v-html会替换掉节点中所有的内容&#xff0c;{{xx}}则不会。 (2).v-html可以识别html结构。 3.严重注意&#xff1a;v-html有安全性问题&#xff0…

IT外包的三种模式

在当今数字化时代&#xff0c;企业为了更好地专注于核心业务&#xff0c;通常选择将IT部门或项目外包给专业的IT外包服务公司。IT外包作为一种灵活的业务模式&#xff0c;不仅能够提高效率&#xff0c;还能够降低企业的运营成本。IT外包包含着不同的业务模式&#xff0c;其中有…

外包干了2个多月,技术明显有退步了。。。。。

先说一下自己的情况&#xff0c;本科生&#xff0c;19年通过校招进入武汉某软件公司&#xff0c;干了接近4年的功能测试&#xff0c;今年国庆&#xff0c;感觉自己不能够在这样下去了&#xff0c;长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试…

VMware 虚拟机 电脑重启后 NAT 模式连不上网络问题修复

问题描述&#xff1a; 昨天 VMware 安装centos7虚拟机&#xff0c;网络模式配置的是NAT模式&#xff0c;配置好后&#xff0c;当时能连上外网&#xff0c;今天电脑重启后&#xff0c;发现连不上外网了 检查下各个配置&#xff0c;都没变动&#xff0c;突然就连不上了 网上查了…

搭梯子之后电脑连接WIFI打不开浏览器网页:远程计算机或者设备不接受连接

问题描述&#xff1a; 打不开网页&#xff0c;但是能正常使用微信等app windows网络诊断&#xff1a; 远程计算机或者设备不接受连接 解决办法&#xff1a; 电脑搜索【internet选项】 进入连接&#xff0c;点击局域网设置&#xff0c;将里面的代理服务器选项关掉就可以正常打开…

Diary21-全网最全的HTML讲解(含可用代码)

HTML学习 1.网页基本信息 DOCTYPE:是一种规范&#xff0c;告诉浏览器我们要使用什么规范 head标签代表网页头部 title标签代表网页标题 body标签代表网页主体 下面是创建的第一个网页的源代码(在IDEA创建一个html文件会直接生成&#xff0c;我这个其实只改了网页标题) &l…

阿里云实时数据仓库HologresFlink

1. 实时数仓Hologres特点 专注实时场景&#xff1a;数据实时写入、实时更新&#xff0c;写入即可见&#xff0c;与Flink原生集成&#xff0c;支持高吞吐、低延时、有模型的实时数仓开发&#xff0c;满足业务洞察实时性需求。亚秒级交互式分析&#xff1a;支持海量数据亚秒级交…

玩弄GPTs:人人都会的Prompt模板

角色定义 分享一个自用的Prompt模板&#xff0c;只要学会了这个模板&#xff0c;当遇到新场景时&#xff0c;直接套用就行。 简单总结&#xff1a; 角色定义(Master)背景(Background)规则(rule)技能(skill)限制(constaints)工作流(workflow) 经过实际测试发现&#xff0c;这…

从零开始学习 JavaScript APl(七):实例解析关于京东案例头部案例和放大镜效果!

大家好关于JS APl 知识点已经全部总结了&#xff0c;第七部部分全部都是案例部分呢&#xff01;&#xff01;&#xff08;素材的可以去百度网盘去下载&#xff01;&#xff01;&#xff01;&#xff09; 目录 前言 一、个人实战文档 放大镜效果 思路分析&#xff1a; 关于其它…