网卡驱动收发包过程图解

网卡

网卡工作在物理层和数据链路层,主要由PHY/MAC芯片、Tx/Rx FIFO、DMA等组成,其中网线通过变压器接PHY芯片、PHY芯片通过MII接MAC芯片、MAC芯片接PCI总线

PHY芯片主要负责:CSMA/CD、模数转换、编解码、串并转换

MAC芯片主要负责:

1. 比特流和帧的转换:7字节的前导码Preamble和1字节的帧首定界符SFD

2. CRC校验

3. Packet Filtering:L2 Filtering、VLAN Filtering、Manageability / Host Filtering

Intel的千兆网卡以82575/82576为代表、万兆网卡以82598/82599为代表

收发包过程图

ixgbe_adapter包含ixgbe_q_vector数组(一个ixgbe_q_vector对应一个中断),ixgbe_q_vector包含napi_struct

硬中断函数把napi_struct加入CPU的poll_list,软中断函数net_rx_action()遍历poll_list,执行poll函数

这里写图片描述


发包过程

这里写图片描述


1、网卡驱动创建tx descriptor ring(一致性DMA内存),将tx descriptor ring的总线地址写入网卡寄存器TDBA

2、协议栈通过dev_queue_xmit()将sk_buff下送网卡驱动

3、网卡驱动将sk_buff放入tx descriptor ring,更新TDT

4、DMA感知到TDT的改变后,找到tx descriptor ring中下一个将要使用的descriptor

5、DMA通过PCI总线将descriptor的数据缓存区复制到Tx FIFO

6、复制完后,通过MAC芯片将数据包发送出去

7、发送完后,网卡更新TDH,启动硬中断通知CPU释放数据缓存区中的数据包

Tx Ring Buffer

收包过程

这里写图片描述

1、网卡驱动创建rx descriptor ring(一致性DMA内存),将rx descriptor ring的总线地址写入网卡寄存器RDBA

2、网卡驱动为每个descriptor分配sk_buff和数据缓存区,流式DMA映射数据缓存区,将数据缓存区的总线地址保存到descriptor

3、网卡接收数据包,将数据包写入Rx FIFO

4、DMA找到rx descriptor ring中下一个将要使用的descriptor

5、整个数据包写入Rx FIFO后,DMA通过PCI总线将Rx FIFO中的数据包复制到descriptor的数据缓存区

6、复制完后,网卡启动硬中断通知CPU数据缓存区中已经有新的数据包了,CPU执行硬中断函数:

  • NAPI(以e1000网卡为例):e1000_intr() -> __napi_schedule() -> __raise_softirq_irqoff(NET_RX_SOFTIRQ)
  • 非NAPI(以dm9000网卡为例):dm9000_interrupt() -> dm9000_rx() -> netif_rx() -> napi_schedule() -> __napi_schedule() -> __raise_softirq_irqoff(NET_RX_SOFTIRQ)

7、ksoftirqd执行软中断函数net_rx_action():

  • NAPI(以e1000网卡为例):net_rx_action() -> e1000_clean() -> e1000_clean_rx_irq() -> e1000_receive_skb() -> netif_receive_skb()
  • 非NAPI(以dm9000网卡为例):net_rx_action() -> process_backlog() -> netif_receive_skb()

8、网卡驱动通过netif_receive_skb()将sk_buff上送协议栈

Rx Ring Buffer

软件(SW)向从next_to_use开始的N个descriptor补充sk_buff,next_to_use += N,tail = next_to_use - 1(设置网卡寄存器RDT)

硬件(HW)向从head开始的M个descriptor的sk_buff复制数据包并设置DD,head += M

SW将从next_to_clean的开始的L个sk_buff移出Rx Ring Buffer交给协议栈,next_to_clean += L,向从next_to_use开始的L个descriptor补充sk_buff,next_to_use += L,tail = next_to_use - 1

注意:每次补充完sk_buff以后,tail、next_to_use、next_to_clean三者都是紧挨着的

这里写图片描述


中断上下部

这里写图片描述


do_IRQ()是CPU处理硬中断的总入口,在do_IRQ()中调用硬中断函数

netif_rx()

在netif_rx()中把skb加入CPU的softnet_data

RSS + FDIR

FDIR(Flow Director)的优先级高于RSS(Receive Side Scaling)

RSS通过计算包的五元组(sip、sport、dip、dport、protocol)的hash并取余,得到队列的index,然后将包放入这个队列,实现了数据包在各个队列之间的负载均衡,不过RSS不能保证回包也落在同一个队列上

对称hash(sip/sport和dip/dport交换后hash不变)可以部分解决该问题,但是对于一些需要做NAT的设备(比如负载均衡)就失效了,FDIR可以完全解决该问题,参见https://tech.meituan.com/MGW.html

这里写图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/462742.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Cisco路由器全局、接口、协议调试指南

全局调试 在配置Cisco路由器时,全局和接口命令的界限是十分明显的。在这种情况下,我们使用“全局”来标识那些不能用于接口调试或者特定的传输介质类型 和协议调试的命令。例如,在2500系列路由器中,就可以使用调试命令分析Cisco发…

发送带颜色的MSG

作者:深渊野鱼 来源:博客园 发布时间:2008-01-09 15:04 阅读:245 次 原文链接 [收藏] 用户经常发送MESSAGE,MESSAGE的颜色往往是绿色的,其实是可以发送彩色的MESSAGE的。解答 1.创建SNDCOLMSG CLP程序。SNDCOL…

在c++中,如果派生类没有重写基类中对应virtual函数会怎样?

在c中&#xff0c;如果一个派生类没有重写基类中对应的虚函数&#xff0c;那么在派生类的构造函数中依然会创建虚指针&#xff0c;但是该虚指针指向的是基类的虚表。 #include <iostream> #include <string>class Base { public:virtual void foo() {std::cout &l…

哪些类继承了Collection接口

Collection集合的基本结构&#xff1a; 1、Collection接口 Collection是最基本集合接口&#xff0c;它定义了一组允许重复的对象。Collection接口派生了两个子接口Set和List&#xff0c;分别定义了两种不同的存储方式&#xff0c;如下&#xff1a; 2、 Set接口 Set接口继承于Co…

陶哲轩实分析 定理 13.1.5

设 $(X,d_X)$ 是度量空间,并设 $(Y,d_Y)$ 是另一个度量空间.设 $f:X\to Y$是函数,那么 $f$ 是连续的可以推出 (c)只要 $V$ 是 $Y$ 中的开集,集合 $f^{-1}(V):\{x\in X:f(x)\in V\}$ 就 是 $X$ 中的开集.\begin{proof} 为了证明 $f^{-1}(V)$ 是开集,我们只用证明对于 $f^{-1}(V)…

安装Orchard错误

直接使用Visual Studio2010运行没有任何问题&#xff0c;但是配置到IIS就报如下的错误&#xff1a; 错误摘要 HTTP 错误 500.19 - Internal Server Error 无法访问请求的页面&#xff0c;因为该页的相关配置数据无效。 模块 IIS Web Core 通知 BeginRequest 处理程序 尚未确定 …

在c++中一个空类占用的字节数

结论&#xff1a; 在c中一个空类占用&#xff1a;1Byte。 有的同学认为一个空类占0Byte&#xff0c;那么定义一个空类时&#xff0c;他存放到哪里呢&#xff1f;为此&#xff0c;在c编译器中&#xff0c;为空类设置了占用1Byte内存。 #include <iostream> // std::c…

SpringBoot整合Mybatis-plus实现增删查改

今天给大家分享一下SpringBoot整合Mybatis-plus的增删查改案例。 pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance&qu…

Web Service security UserNameToken 使用

一: Web Service security UserNameToken 概念 原理&#xff1a;用户在发送请求的时候&#xff0c;在Soap head中加入自己的用户名以及密码&#xff0c;接受请求的Service通过之前与Client建立的共享密码来验证密码的合法性从而实现鉴别用户的功能。 <wsse:UsernameToken>…

使用Mule ESB与Groovy编排RESTful服务【转】很适合我们当前的架构

http://www.infoq.com/cn/articles/restful-services-mule 在过去几年中&#xff0c;REST风格的软件架构获得了越来越多的认可&#xff0c;这主要是因为它减少了系统对动件的需求、同时使系统耦合性更低&#xff0c;弹性更好。 目前越来越多的REST资源出现在企业应用中&#xf…

《领域驱动设计》第二部分:模型驱动设计的构造块 第四章:分离领域 阅读笔记...

内容概述 将领域对象与系统中的其他功能分离 第一小节 介绍了分离领域的技术&#xff1a;Layered Architecture。 第二小节 指出大部分软件系统都会采用分层的架构&#xff0c;但是分层方案有很多种。领域驱动设计只要求领域层存在即可&#xff0c;并且领域模型在领域层中表现不…

Starling框架帮助手册中文版(PDF下载)

什么是Statling&#xff1f;Starling 是一个基于Stage3D&#xff08;这是Flash Player11及Adobe AIR 3中新增的为3D加速功能所提供的API&#xff09;所开发的一个能够使用GPU来加速的2D Flash应用程序的ActionScript3框架。Starling主要是为游戏开发而设计的, 但是它的用途不仅…

在X32与X64下,每种数据类型占用的字节数

在X32与X64下&#xff0c;每种数据类型占用的字节数分别如下&#xff1a; X32 X64 指针 4Byte 8Byte char 1Byte …

一个Setup Factory的Lua脚本

需求是把安装路径中的反斜杠转义成斜杠并写入到配置文件特定的地方去。 读取配置文件 由于配置文件不大 一次性的读入到内存中 local f io.input(SessionVar.Expand("%AppFolder%\\Common\\conf.xml"), "r");local r f:read("*all");io.close()…

20190501-编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀,返回空字符串...

题目描述 编写一个函数来查找字符串数组中的最长公共前缀。 如果不存在公共前缀&#xff0c;返回空字符串 ""。 示例 1: 输入: ["flower","flow","flight"] 输出: "fl" 示例 2: 输入: ["dog","racecar"…

MySQL幻读及解决方法

这是一篇数据库隔离级别的科普文章&#xff0c;旨在了解数据库中著名的幻读现象&#xff0c;为了专注&#xff0c;对脏读、不可重复读不作讨论。 事务隔离级别 MySQL有四级事务隔离级别: 读未提交 READ-UNCOMMITTED&#xff1a; 存在脏读&#xff0c;不可重复读&#xff0c;幻…

SVN trunk branches tags 的用法 - 摘自网络

Subversion有一个很标准的目录结构&#xff0c;是这样的。比如项目是proj&#xff0c;svn地址为svn://proj/&#xff0c;那么标准的svn布局是svn://proj/|-trunk-branches-tags这是一个标准的布局&#xff0c;trunk为主开发目录&#xff0c;branches为分支开发目录&#xff0c;…

数据结构学习方法

在网上搜集到的数据结构学习方法&#xff0c;请同学们参考。 谈数据结构学习方法&#xff08;转帖&#xff09;我在这里只是谈谈自己的学习体会现在咱们学的的数据结构是C版本的 所以C的一些基础知识应该先看会 尤其是指针那一部分 很多人对指针只是一知半解 由于一直对指针概念…

UIPickerView基本使用

UIPickerView是很常用的一个UI控件&#xff0c;在各种购物平台选择地址时候都是必备的&#xff0c;下面我们来说一下具体的使用 首先UIPickerView的创建&#xff0c;与多数控件一样&#xff0c;分配内存并设置位置尺寸。 重要的的是代理与数据源&#xff0c;设置代理和数据源后…

幻读和不可重复读

MySQL MySQL默认的隔离级别为RR&#xff0c;因此只会出现幻读的情况。 不会出现不可重复读的问题。 幻读 事务在插入已经检查过不存在的记录时&#xff0c;惊奇的发现这些数据已经存在了&#xff0c;之前的检测获取到的数据如同鬼影一般。 例子&#xff1a; 在事务1中&…