linux内核视角看零拷贝

一、什么是零拷贝?

在很多性能优化方案中都有提到零拷贝,零拷贝到底是怎么回事,是真的没有数据的拷贝吗?零拷贝(Zero-copy)是一种数据传输技术,旨在减少数据在内核态和用户态之间的复制操作。其实并不是真的没有数据的拷贝。

二、内核发送数据包

2.1 网卡启动准备

linux启动的时候,在网卡能够收发数据包之前,要做很多准备工作。比如ksoftirqd内核线程的创建,注册好协议处理函数,网卡驱动初始化等。这些初始化工作完成后,就可以启动网卡了。网卡启动的时候,会创建好RingBuffer,现在的服务器上的网卡一般都是支持多队列的,每一个队列都是由一个RingBuffer表示
在这里插入图片描述

2.2 数据包发送

整体流程是:用户数据被拷贝到内核态,然后经过协议栈处理后进入网卡RingBuffer,网卡驱动真正将数据发送出去,当发送完成时,网卡发起硬中断来通知CPU,最后清理RingBuffer。

2.2.1 协议栈处理

在这里插入图片描述
用户进程进行系统调用时,找到内核的socket对象,之后进入内核协议栈处理。

在进入协议栈inet_sendmsg函数后,内核会找到socket对象上具体的协议发送函数,对于TCP协议就是tcp_sendmsg。

//file: net/ipv4/tcp.c
int tcp_sendmsg(...){while(...){......//申请内核态内存skbskb = sk_stream_alloc_skb(...);//把skb挂到socket的发送队列上,sk就是socketskb_entail(sk,skb);......//将用户空间的数据拷贝到skb,from是用户空间的数据地址skb_add_data_nocache(sk,skb,from,copy);}
}

在这里插入图片描述
注意:在协议栈处理这里,完成了一次用户数据到内核socket对象发送队列的拷贝。

2.2.1.1 传输层处理
//file: net/ipv4/tcp_output.c
static bool tcp_write_xmit(...){//循环从socket发送队列获取待发送skbwhile((skb = tcp_send_head(sk))){......//传输层发送tcp_transmit_skb(sk,skb,1,gfp);}
}
//file net/ipv4/tcp_output.c
static int tcp_transmit_skb(...){//循环socket发送队列克隆出新的skbif(likely(clone_it)){skb = skb_clone(skb,gfp_mask);......}//封装TCP头th = tcp_hdr(skb);th->source  =  inet->inet_sport;th->dest    =  inet->inet_dport;......//调用网络层发送接口ip_queue_xmit(...);
}

在这里插入图片描述
这里需要注意的是:传输层需要从socket发送队列克隆一个新的skb,那么为什么要复制一个skb出来?这是因为skb后续在调用网络层,最后到达网卡发送完成的时候,这个skb会被释放掉。而TCP协议是支持丢失重传的,在收到对方的ACK之前,socket发送队列上的skb不能被删除,等收到ACK再真正删除。 因此,传输层从socket发送队列拷贝skb也是不能少的。
自此,传输层的工作都完成了。数据离开传输层,接下来将会进入内核网络层的处理。

2.2.1.2 网络层处理
//file: net/ipv4/ip_output.c
int ip_queue_xmit(...){......//为skb设置路由表,路由表可以查到目的网络应该通过哪个网卡,哪个网关发送出去skb_dst_set_noref(skb,&rt->dst);//设置IP头iph = ip_hdr(skb);iph->protocol  = sk->sk_protocol;......//发送ip_local_out(skb);
}

在这里插入图片描述
如果使用iptables配置了一些规则,那么这里将检测是否命中规则,如果设置复杂的netfiler规则,将会增大CPU开销。

2.2.1.3 邻居子系统处理

邻居子系统是位于网络层和数据链路层中间的一个系统,其作用是为网络层提供一个下层的封装,让下层决定发送到哪个MAC地址。
在这里插入图片描述

2.2.1.4 网络设备子系统处理

在这里插入图片描述
QDisc(queueing discipline )位于IP层和网卡的ringbuffer之间。ringbuffer是一个简单的FIFO队列,这种设计使网卡的驱动层保持简单和快速。而QDisc实现了流量管理的高级功能,包括流量分类,优先级和流量整形(rate-shaping)。

2.2.1.5 网卡驱动处理

在驱动函数中,会将skb挂到RingBuffer上,并且将skb数据映射到网卡可以访问的DMA内存区域。最后驱动会触发真实的数据发送。

三、零拷贝到底是怎么回事?

传统的read + send系统调用:
在这里插入图片描述
sendfile系统调用:

在sendfile系统调用中,数据不需要拷贝到用户空间,用户进程可直接操作内核Page Cache数据,减少了拷贝的次数,所以,零拷贝并不是说完全没有数据拷贝。java的fileChannel.transferTo()底层就是sendfile系统调用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/691871.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机网络概论和数据通信基础

文章目录 计算机网络概论从物理构成上看,计算机网络包括硬件、软件和协议三大部分计算机网络的功能组成计算机网络的分类网络体系结构分层与体系结构接口、协议和服务数据传送单位OSI模型TCP/IP模型 数据通信基础数字信号调制为模拟信号正交振幅调制QAM 模拟数据编码…

二叉树基本概念与遍历

什么是二叉树 二叉树不同于别的树,因为他每个节点最多只有两个子节点,而别的树可以有无数个子节点。 所以二叉树就是只最多只有两个子节点的树,一个子节点叫右子节点,另一个子节点叫左子结点 而他们的上一层就是父子节点&#xf…

航班进出港|航班进出港管理系统|基于springboot航班进出港管理系统设计与实现(源码+数据库+文档)

航班进出港管理系统目录 目录 基于springboot航班进出港管理系统设计与实现 一、前言 二、系统功能设计 三、系统实现 5、航班信息管理 (1) 航班信息管理 (2)起飞降落申请管理 (3)公告管理 &…

城市智慧驿站是什么?城市智慧驿站有哪些功能

城市智慧驿站作为一种创新性的社会配套设施,开始在多个城市落地使用,引起了社会的关注。 城市智慧驿站是什么?城市智慧驿站是在智慧城市的背景下,城市智慧驿站智慧公厕成为了一种创新性的社会配套建筑。作为景观式模块化建筑&…

UE蓝图 分支(Branch)节点和源码

系列文章目录 UE蓝图 Get节点和源码 UE蓝图 Set节点和源码 UE蓝图 Cast节点和源码 UE蓝图 分支(Branch)节点和源码 文章目录 系列文章目录一、分支节点功能二、分支节点用法三、分支节点使用场景四、分支节点实现过程五、分支节点相关源码 一、分支节点功能 在Unreal Engine&a…

Mysql数据库主从集群从库Slave因为RelayLog过多过大引起服务器硬盘爆满生产事故实战解决

Mysql数据库主从集群从库slave因为RelayLog过多过大引起从库服务器硬盘爆满生产事故实战解决 一、MySQL数据库主从集群概念 MySQL数据库主从集群是一种高可用性和读写分离的数据库架构,它基于MySQL的复制(Replication)技术来同步数据。在主…

【Kotlin】Kotlin流程控制

1 选择结构 Kotlin 中选择结构主要包含 if -else、when 语句,并且可以返回结果。 1.1 if-else 1.1. 条件选择 fun main() {var score 85if (score > 90) {println("优秀")} else if (score > 80) {println("良好")} else if (score &…

信息安全法律法规体系

信息安全法律法规体系 我国信息安全法规体系可以分为4层。 法律层面具体对应的法律、法规一般性法律规定宪法、国家安全法、国家秘密法、治安管理处理条例等虽然没有专门针对信息安全的条款,但约束了信息安全相关的行为规范和惩罚信息网络犯罪的法律《中华人名共和国刑法》《…

MySQL篇之主从同步原理

一、原理 MySQL主从复制的核心就是二进制日志。 二进制日志(BINLOG)记录了所有的 DDL(数据定义语言)语句和 DML(数据操纵语言)语句,但不包括数据查询(SELECT、SHOW)语句。…

19-树-填充每个节点的下一个右侧节点指针 II

这是树的第19篇算法,力扣链接。 给定一个二叉树: struct Node {int val;Node *left;Node *right;Node *next; } 填充它的每个 next 指针,让这个指针指向其下一个右侧节点。如果找不到下一个右侧节点,则将 next 指针设置为 NULL 。…

继ChatGPT后的又一王炸!Sora模型解析与体验通道

前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家:https://www.captainbed.cn/z ChatGPT体验地址 文章目录 前言OpenAI体验通道Spacetime Latent Patches 潜变量时空碎片, 建构视觉语言系统…

“薪”的一年程序员裁员潮技术变革情况下 程序员就业机会在哪里?

引言:一对来自中国的工程师夫妻在美国的不幸身亡,疑似与谷歌的裁员有关,这一事件再次引发了人们对技术变革下裁员对程序员影响的关注。 一、针对裁员潮的一些看法 在我看来,技术变革对程序员的影响是双面的。一方面,…

代码随想录算法训练营day16

题目:104.二叉树的最大深度、111.二叉树的最小深度、222.完全二叉树的节点个数 参考链接:代码随想录 104.二叉树的最大深度 思路:上次是用层序遍历的思路做过。这次想一点不一样的思路,对于一个二叉树的最大深度其实即为其两个…

【Python机器学习】详解Python机器学习进行时间序列预测

🔗 运行环境:Python 🚩 撰写作者:左手の明天 🥇 精选专栏:《python》 🔥 推荐专栏:《算法研究》 🔐#### 防伪水印——左手の明天 ####🔐 💗 大家…

C++:const关键字

一、const成员变量(常成员变量) 1、只能使用初始化列表对常成员变量进行初始化; 2、常成员变量可以被访问,但是不能被修改; 3、类中所有构造函数都必须在初始化列表对常成员函数进行初始化(包括拷贝构造,移动构造)。 声明&am…

加固平板电脑在无人机的应用|亿道三防onerugged

无人机技术的快速发展已经在许多领域展现出巨大潜力,而加固平板电脑的应用在无人机领域中扮演着重要角色。 首先,加固平板电脑在无人机探测设备中发挥着关键作用。无人机探测设备通常需要实时传输高清图像和数据,以支持各种监测、勘测和检测…

蓝桥杯DP算法——背包问题(C++)

目录 一、01背包问题 二、完全背包问题 三、多重背包问题 四、多重背包问题(优化版) 五、分组背包问题 一、01背包问题 01背包问题就是有N件物品,一个空间大小为V的背包,每个物品只能使用一次,使得背包中所装物品…

职场数据分析必备|数据库入门之可视化工具Navicat

1、下载 Navicat (1)官网下载:https://navicatformysql.en.softonic.com/download 下载图示: 数据库入门(二)可视化工具Navicat​mp.weixin.qq.com/s?__bizMzU3Mzk0OTIzNA&mid100001258&idx1&…

el-table实现嵌套表格的展示

需求 一个表单中存在子表 列表返回格式 实现 实现思路 el-table中在嵌套一个el-table&#xff0c;这样数据格式就没问题了&#xff0c;主要就是样式 将共同的列放到一列中&#xff0c;通过渲染自定义表头render-header&#xff0c;将表头按照合适的宽度渲染出来 <el-…

品牌如何做好话题营销?这三点很关键

从“野性消费”到“疯四文学”&#xff0c;这些品牌让人记住的并不是某个内容&#xff0c;而是一个社交谈资&#xff0c;这些都算是成功的品牌话题&#xff0c;品牌话题的优势在于激活品牌&#xff0c;始终保持品牌活力&#xff0c;今天媒介盒子就来和大家聊聊&#xff1a;品牌…