【Linux】五种IO模型

文章目录

  • 1. IO基本概念
  • 2. 五种IO模型
    • 2.1 五个钓鱼的例子
    • 2.2 五种IO模型
      • 2.2.1 阻塞IO
      • 2.2.2 非阻塞IO
      • 2.2.3 信号驱动IO
      • 2.2.4 IO多路转接
      • 2.2.5 异步IO

1. IO基本概念

认识IO

IO就是输入和输出,在冯诺依曼体系结构中,将数据从输入设备拷贝到内存就叫输入,将输出将内存拷贝到输出设备就叫输出。
在这里插入图片描述

  • 对文件进行的读写操作本质就是一种IO,文件IO对应的外设就是磁盘。
  • 对网络进行的读写操作本质也是一种IO,网络IO对应的外设就是网卡。

OS如何得知外设中有数据可读?

输入就是操作系统将数据从外设拷贝到内存的过程,操作系统一定要通过某种方法得知特定外设上是否有数据就绪。

  • 并不是操作系统想要从外设中取数据时外设中就一定有数据,比如可能用户正在访问服务器,当用户的请求报文发出之后就需要在网卡中读取服务器发来的响应报文,但此时服务器可能还没有收到我们的报文,或是正在对收到的包文进行数据分析。
  • 但操作系统并不会去主动检测外设上是否有数据就绪,这样会降低操作系统的工作效率,因为大部分情况下外设当中都是没有数据的,如果操作系统去主动检测外设上是否有数据那么大部分情况下这样的操作都是徒劳的。
  • 操作系统实际采用的是中断的方式来得知外设上是否有数据就绪的,当某个外设上面有数据就绪时,该外设就会向CPU的中断控制器中发送中断信号,中断控制器再根据产生的中断信号的优先级顺序发送给CPU。
  • 每一个中断信号都有一个对应的中断处理程序,存储中断信号和中断处理程序映射关系的表叫做中断向量表,当CPU收到某个中断信号时就会自动停止正在运行的程序,然后根据该中断向量表执行该中断信号对应的中断处理程序,处理完毕后再返回被暂停的程序继续运行。

需要注意的是,CPU不直接和外设打交道指的是在数据层面上,而外设其实可以直接将某些控制信号发给CPU当中的某些控制器的。

OS如何处理从网卡中拿到的数据包?

操作系统任何时刻可能都会收到大量的数据包,因此操作系统必须将这些数据包管理起来。所谓的管理就是“先描述,再组织”,在内核当中有一个结构叫做sk_buff,该结构就是用来管理和控制接收或者发送数据包的信息的。

这是一个简化版的sk_buff结构:
在这里插入图片描述

  • 当操作系统从网卡中读取到了一个数据包之后,就会定义出一个sk_buff结构,然后用sk_buff结构当中的data指针指向这个读取到的数据包,并将这个定义出来的sk_buff结构与其他sk_buff结构用双链表的形式组织起来,这样操作系统对各个数据包的管理就变成了对双链表的增删查改了。
  • 接下来我们需要将读取上来的数据包交给最底层的链路层处理,进行链路层的解包和分用,此时就是让sk_buff结构当中的mac_header指针指向最初的数据包,然后向后读取链路层的报头,剩下的就是需要交给网络层的有效载荷了,此时便完成了链路层的解包。
  • 这时链路层就需要将有效载荷向上交付给网络层进行解包和分用了,这里所说的向上交付只是形象的说法,实际向上交付并不是要将数据从链路层的缓冲区拷贝到网络层的缓冲区,而是只需要让sk_buff结构当中的network_header指针指向数据包中链路层之后的数据即可,然后继续向后读取网络层的报头,便完成了网络层的解包。
  • 然后对传输层的处理同理,只需让sk_buff结构当中的transport_header指针指向数据包中网络层报头之后的数据,然后向后读取传输层的报头,便完成了传输层的解包。
  • 传输层解包之后就可以根据具体的使用的传输层协议,对应将剩下的数据宝贝到TCP或者UDP的接收缓冲区供用户读取即可。
    在这里插入图片描述
    发送数据时对数据进行封装也是同样的道理,就是依此在数据前面拷贝上对应的报头,最后再将数据发送出去(UDP)或者拷贝到发送缓冲区(TCP)即可。也就说,数据包在封装和解包的过程中,本质数据的存储位置是没有发送变化的,我们实际只是在用不同的指针对数据进行操作而已。

但内核中的sk_buff其实并没有那么简单,设计远比上面说的复杂。

  • 一方面,为了保证高效的网络报文处理效率,这就要求sk_buff的结构也必须高效。
  • 另一方面,sk_buff结构需要被内核协议当中的各个协议共同使用,因此sk_buff必须能够兼容所有的网络协议。

因此sk_buff结构其实是非常复杂的。

高效的IO

IO主要分两步:

  1. 第一步是等,等待IO就绪。
  2. 第二步是拷贝,将数据拷贝到内存或者外设。

任何IO的过程,都包含等和拷贝这两个步骤,在实际的应用场景中“等”消耗的时间远比“拷贝”消耗的时间多,因此要让IO变得高效,就要尽可能减少“等”的时间。

2. 五种IO模型

2.1 五个钓鱼的例子

IO的过程其实和钓鱼是非常类似的。

  • 钓鱼的过程同样分为“等”和“拷贝”两个步骤,只不过这里的“等”是等鱼上钩,“拷贝”指的是当鱼上钩后将鱼从河里“拷贝”到我们的鱼桶当中。
  • IO时等消耗的时间往往要比拷贝消耗的多,钓鱼也符合这个特点,钓鱼时哦我们大部分时间都在等待鱼上钩,而当鱼上钩后只需要一瞬间就能将鱼“拷贝”上来。

在了解五种IO模型之前,我们先看看什么样的钓鱼方式才是最高效的。

  1. 张三:拿了1个鱼竿,将鱼钩抛入水中就死死盯着浮漂,什么也不做,让有鱼上钩后再将鱼钓上来。
  2. 李四:拿了1个鱼竿,将鱼钩抛入水中后就去做其他事情,然后定期观察浮漂,如果有鱼上钩则挥动鱼竿将鱼钓上来,否则进行去做其他事情。
  3. 王五:拿了1个鱼竿,将鱼钩抛入水后在鱼竿顶部绑一个铃铛,然后就去做其他事情,如果铃铛响了就挥动鱼竿将鱼钓上来。
  4. 赵六:拿了00个鱼竿,将100个鱼竿抛入水中就定期观察这100个鱼竿的浮漂,如果某个鱼竿有鱼上钩则挥动对应的鱼竿将鱼钓上来。
  5. 田七:田七是一个有钱的老板,他给了自己的司机一个桶,一个电话,一个鱼竿,当司机去钓鱼,当鱼桶装满的时候再告诉田七来拿鱼,而田七自己则开车去做其他事情了。

张三、李四、王五的钓鱼效率是否一样?为什么?

本质都是一样的。

  • 首先它们的钓鱼方式都是一样的,都是等于上钩,然后再将鱼钓上来。
  • 其次,因为它们每个人都是拿的一根鱼竿。

因此他们三个的钓鱼效率本质是一样的,只不过他们的等待方式不同而已,张三是死等,李四是定期检测浮漂,王五是通过铃铛来判断鱼是否上钩。

需要注意的是,这里问的是他们的钓鱼效率是否一样,而不是问他们整体谁做的事更多,如果说整体做事情的量的话,那一定是王五做的最多,李四次之,张三最少。

与张三、李四、王五相比,赵六的钓鱼效率非常高。

高效的钓鱼就是要减少等的时间,增加拷贝的时间,赵六可以将等的时间重合,一次等待多个鱼竿有鱼上钩。

毫无疑问,赵六的钓鱼效率是四个人中最高的。

如何看待田七的钓鱼方式?

田七本人并没有参数整个钓鱼的过程,他只是发起了钓鱼的任务,真正钓鱼的是司机,田七在钓鱼期间可能就去做其他事情了。

如果将钓鱼看作是一种IO的话,前面四个人的钓鱼方式就是同步IO,田七的钓鱼方式就是异步IO。

2.2 五种IO模型

实际上上面所说的五种钓鱼方式分别对应五种IO模型

  1. 张三这种死等的方式叫做阻塞IO
  2. 李四这种定时检测的方式叫做非阻塞IO
  3. 王五这种通过设置铃铛的方式叫做信号驱动IO
  4. 赵六这种一次等待多个鱼竿的方式叫做IO多路转接
  5. 田七这种让别人帮自己钓鱼的方式就是异步IO

通过上面的例子我们可以看到,阻塞IO、非阻塞IO、信号驱动IO不能提高IO的效率,但是非阻塞IO和信号驱动IO能提高整体做事的效率。

其实,这个钓鱼场景中的各个事务都能与IO当中的相关概念对应起来,比如这里钓鱼的河对应就是内核,这里的每一个人都说进程或者线程,鱼竿对应的就是文件描述符或套接字,装鱼的桶对应的就是用户缓冲区。

2.2.1 阻塞IO

阻塞IO就是将内核将数据准备好之前,系统会一直等待。
在这里插入图片描述
阻塞IO是最常见的IO模型,所有的套接字,默认都是阻塞方式。

  • 比如调用recvfrom函数从某个套接字读取数据时,可能是底层数据还没有准备好,此时就需要等待数据就绪,当数据就绪之后再将数据从内核拷贝到用户空间,最后recvfrom函数才能返回。
  • 在recvfrom函数等待数据就绪期间,在用户看来该进程或者线程就阻塞住了,本质就是操作系统将该进程或线程的状态设置为了某种非R状态,然后将其放入等待队列当中,当数据就绪后操作系统再将其从等待队列中唤醒,然后该进程或线程再将数据从内核拷贝到用户空间。

以阻塞方式进行IO操作的进程或者线程,在“等”和“拷贝”期间都不会返回,在用户看来好像就是阻塞住了,因此我们称之为阻塞IO。

2.2.2 非阻塞IO

非阻塞IO就是,如果内核还未将数据准备好,系统调用仍然会直接返回,并且返回EWOULDBLOCK错误码。
在这里插入图片描述
非阻塞IO往往需要程序员以循环的方式反复尝试读写文件描述符,这个过程称为轮询,这对CPU来说是一种很大的浪费,一般只有在特定场景下才使用。

  • 比如当调用recvfrom函数以非阻塞方式从某个套接字上读取数据时,如果底层数据还没有准备好,那么recvfrom函数会立马错误返回,而不会让该进程或线程进行阻塞等待。
  • 因为没有读取的数据,因此该进程或线程后续还需要继续调用recvfrom函数,检测底层数据是否就绪,如果没有就绪数据,继续返回,直到就绪之后,再将数据从内核拷贝到用户空间然后成功返回。
  • 每次调用recvfrom函数读取数据时,不管底层有没有就绪,recvfrom函数都会直接返回,在用户看来该进程或线程就没有被阻塞住,称为非阻塞IO。

阻塞IO和非阻塞IO的区别在于,阻塞IO当数据没有就绪时,后续检测数据是否就绪是由操作系统发起的,而非阻塞IO当数据没有就绪时,后续检测数据是否就绪的工作是由用户发起的。

2.2.3 信号驱动IO

信号驱动IO就是内核将数据准备好的时候,使用SIGIO信号通知程序进行IO操作。
在这里插入图片描述
当底层数据就绪的时候会向当前进程或线程递交SIGIO信号,因此可以通过signal或者sigaction函数将SIGIO的信号处理程序定义为需要进行的IO操作,当底层数据就绪时就会执行对应的IO操作。

  • 比如我们需要调用recvfrom函数从某个套接字上读取数据,那么就可以将操作定义为SIGIO的信号处理程序。
  • 当底层数据就绪时,操作系统就会递交SIGIO信号,那么此时就会自动执行我们定义的信号处理程序,仅需将数据从内核拷贝到用户空间。

信号的产生是异步的,但信号驱动IO是同步IO的一种。

  • 我们说信号的产生是异步的,因为信号在任何时刻都可能产生。
  • 但信号驱动是同步IO的一种,因为当底层数据就绪时,当前进程或线程就需要停下正在做的事情,转而进行数据的拷贝操作,因此当前进程或线程仍然需要参与IO过程。

判断一个IO过程是同步的还是异步的,本质就是看当前进程或线程是否需要参与IO过程,如果要参与那么就是同步IO,否则就是异步IO。

2.2.4 IO多路转接

IO多路转接也叫IO多路复用,能够同时等待多个文件描述符的等待装填。
在这里插入图片描述
IO多路转接的思想:

  • 因为IO过程分为“等”和“拷贝”两个步骤,因此我们使用的recvfrom等接口的底层实际上都做了两件事,第一件事就是当数据不就绪时需要等,第二件事就是当数据就绪后需要进行拷贝。
  • 虽然recvfrom等接口也有等的能力,但这些接口一次只能等一个文件描述符上的数据或者空间就绪,这样IO效率太低了。
  • 因此系统为我们提供了三组接口,分别叫做select、poll、epoll,这些接口的核心工作就是等,我们可以将所有等的工作都交给这些多路转接的接口。
  • 因为这些多路转接接口是一次等多个文件描述符的,因此能够将等的时间进行重叠,当数据就绪之后再调用对应的recvfrom等函数进行数据的拷贝,此时这些函数就能够直接进行拷贝,而不需要再进行等操作了。

2.2.5 异步IO

异步IO就是数据拷贝完成之后,等待应用程序。
在这里插入图片描述

  • 进行异步IO需要调用一些异步IO的接口,异步IO接口调用后会立马返回,因为异步IO不需要你进行“等”和“拷贝”的操作,这两个操作都由操作系统完成,你要做的只是发起IO。
  • 当IO完成后操作系统会通知应用程序,因此进行异步IO的进程或线程并不参与IO的所有细节。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/23933.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中国1km分辨率月最低温度数据集(1901-2021年)介绍

该数据为中国逐月最低温度数据,空间分辨率为0.0083333(约1km),时间为1901.1-2021.12。数据格式为NETCDF,即.nc格式。数据单位为0.1 ℃。该数据集是根据CRU发布的全球0.5气候数据集以及WorldClim发布的全球高分辨率气候…

Mac强制停止应用

有时候使用Mac的时候,某个应用卡住了,但是肯定不能因为一个应用卡住了, 就将电脑重启吧,所以只需要单独停止该应用即可,使用快捷键optioncommandesc就会出现强制停止的界面,选择所要停止的应用,…

第一课-前提-Stable Diffusion 教程

学习 SD 的前提是电脑配置! SD 参考配置: 建议选择台式机 i5 CPU, 内存16GB,N卡 RTX3060, 8G显存以上的配置(最低配) 在此基础上的配置越高越好。 比如,cpu i7 更好,显卡能有 RTX4090 更好,32显存要能有最好,嘿嘿嘿。 如何查看自己的显卡配置? Win+R 输入 “dxdiag…

从零开始,探索Python变量的奥秘!

在Python这个充满魔力的编程世界中,变量是一门必须深入了解的基础知识。无论你是初学者还是有经验的开发者,掌握变量的基本语法对于编写优雅、高效的代码至关重要。本篇博客将带你从零开始,深入探索Python变量的奥秘,让你在编程之…

wait,notify/notifyAll都要放在synchronized锁里面

wait,notify/notifyAll都要放在synchronized锁里面 如果没放在synchronized锁里面,就要报这样的错误 public class Test5 {public static void main(String[] args) throws InterruptedException {Thread t1 new Thread(()->{syn();},"t1&quo…

在消费级GPU调试LLM的三种方法:梯度检查点,LoRA和量化

LLM的问题就是权重参数太大,无法在我们本地消费级GPU上进行调试,所以我们将介绍3种在训练过程中减少内存消耗,节省大量时间的方法:梯度检查点,LoRA和量化。 梯度检查点 梯度检查点是一种在神经网络训练过程中使动态计算只存储最…

26 MFC序列化函数

文章目录 Serialize对于存储文件的序列化 Serialize Serialize 是一个在 MFC (Microsoft Foundation Classes) 中常用的函数或概念。它用于将对象的数据进行序列化和反序列化,便于在不同的场景中保存、传输和恢复对象的状态。 在 MFC 中,Serialize 函数…

EdgeBox_tx1_A200 PyTorch v1.9.0 环境部署

大家好,我是虎哥,今天远程帮助几个小伙伴在A200 控制器上安装PyTorch v1.9.0 torchvision v0.10.0,中间也是经历了很多波折,当然,大部分是网络问题和版本适配问题,所以完事后,将自己完整可用的过…

esp32c3 xiao 脚本记录

oled显示网络时间, wifi链接网络 // ntp_get_date.h #include "time.h"String week[8] {"Sun", "Mon", "Tues", "Wednes", "Thur", "Fri", "Sat" };void printLocalTime(Adafruit_SSD1306 …

开源进展 | WeBASE v3.1.0发布,新增多个实用特性

WeBASE是一个友好、功能丰富的区块链中间件平台,通过一系列通用功能组件和实用工具,助力社区开发者更快捷地与区块链进行交互。 目前WeBASE已更新迭代至v3.1.0版本,本次更新中,WeBASE带来了最新的合约Java脚手架导出功能&#xff…

【音视频SDK测评】线上K歌软件开发技术选型

摘要 在线K歌软件的开发有许多技术难点,需考虑到音频录制和处理、实时音频传输和同步、音频压缩和解压缩、设备兼容性问题等技术难点外,此外,开发者还应关注音乐版权问题,确保开发的应用合规合法。 前言 前面写了几期关于直播 …

十四.redis哨兵模式

redis哨兵模式 1.概述2.测试3.哨兵模式优缺点 redis哨兵模式基础是主从复制 1.概述 主从切换的技术方法:当主节点服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费时费力,还会造成一段时间内服…

单例模式和工厂模式

目录 今日良言:关关难过关关过,步步难行步步行 一、单例模式 1.饿汉模式 2.懒汉模式 二、工厂模式 今日良言:关关难过关关过,步步难行步步行 一、单例模式 首先来解释一下,什么是单例模式。 单例模式也就是单个…

【动态规划刷题 4】礼物的最大价值下降路径最小和

礼物的最大价值 在一个 m*n 的棋盘的每一格都放有一个礼物,每个礼物都有一定的价值(价值大于 0)。你可以从棋盘的左上角开始拿格子里的礼物,并每次向右或者向下移动一格、直到到达棋盘的右下角。给定一个棋盘及其上面的礼物的价值…

以指标驱动,保险、零售、制造企业开启精益敏捷运营的新范式

近日,以“释放数智生产力”为主题的 Kyligence 用户大会在上海前滩香格里拉大酒店成功举行。大会包含上午的主论坛和下午的 4 场平行论坛,并举办了闭门会议、Open Day 等活动。来自金融、零售、制造、医药等行业的客户及合作伙伴带来了超过 23 场主题演讲…

AI驱动的靶点发现综述

疾病建模和靶点识别是药物发现中最关键的初始步骤。传统的靶点识别是一个耗时的过程,需要数年至数十年的时间,并且通常从学术报告开始。鉴于其分析大型数据集和复杂生物网络的优势,人工智能在现代药物靶点识别中发挥着越来越重要的作用。该综…

奥威BI系统:零编程建模、开发报表,提升决策速度

奥威BI是一款非常实用的、易用、高效的商业智能工具,可以帮助企业快速获取数据、分析数据、展示数据。值得特别注意的一点是奥威BI系统支持零编程建模、开发报表,是一款人人都能用的大数据分析系统,有助于全面提升企业的数据分析挖掘效率&…

[Docker实现测试部署CI/CD----自由风格的CI操作[最终架构](5)]

目录 11、自由风格的CI操作(最终)Jenkins容器化实现方案修改 docker.sock 权限修改 Jenkins 启动命令后重启 Jenkins构建镜像推送到Harbor修改 daemon.json 文件Jenkins 删除构建后操作Jenkins 添加 shell 命令重新构建 Jenkins通知目标服务器拉取镜像目…

C#核心知识回顾——19.插入排序

1.插入排序的基本原理 871542639 两个区域 排序区 未排序区 用一个索引值做分水岭 未排序区元素 与排序区元素比较 插入到合适位置 直到未排序区清空 int[] arr { 8, 6, 7, 2, 9, 4 };//第一步//能取出未排序区…

IL汇编实现两数相加输出结果

话说前面没有实现IL汇编2数相加;鼓捣了一下,实现的代码如下; .assembly extern mscorlib {}.assembly Test{.ver 1:0:1:0}.module test.exe.method static void main() cil managed{.maxstack 8.entrypoint.locals init (int32 V_0, int3…