Netty Review - NIO空轮询及Netty的解决方案源码分析

文章目录

  • Pre
  • 问题说明
  • NIO Code
  • Netty是如何解决的?
  • 源码分析
    • 入口
    • 源码分析
      • selectCnt
      • selectRebuildSelector

在这里插入图片描述

在这里插入图片描述


Pre

Netty Review - ServerBootstrap源码解析

Netty Review - NioServerSocketChannel源码分析

Netty Review - 服务端channel注册流程源码解析


问题说明

NIO空轮询(Empty Polling)是指在使用Java NIO 时,当Selector上注册的Channel没有就绪事件时,Selector.select()方法会返回0,但该方法会导致CPU空转,因为它会不断地调用操作系统的底层select系统调用。这种现象被称为NIO空轮询的bug。

NIO空轮询的问题源于Java NIO的Selector(选择器)机制。在NIO中,Selector负责监视多个Channel的事件,当某个Channel有事件发生时,Selector会将该Channel的就绪事件返回给应用程序进行处理。但是,如果Selector的select方法返回0,表示当前没有任何Channel处于就绪状态,此时,如果应用程序不进行任何处理,就会导致空轮询。

在早期版本的JDK中,Java NIO的实现对于空轮询问题没有进行有效的处理,导致在高并发、高负载的网络应用中,会造成CPU资源的浪费。空轮询问题的存在会降低系统的性能,并可能引发系统负载过高、响应缓慢等问题。

因此,对于网络应用来说,解决NIO空轮询的问题是非常重要的。后续版本的JDK和一些框架(比如Netty)针对这一问题进行了优化和改进,采取了一些措施来有效地避免空轮询,提高了系统的性能和稳定性。

在Netty中,通过使用基于事件驱动的模型,避免了空轮询的问题。Netty使用了单线程模型,基于事件循环(EventLoop)处理所有的I/O事件,而不是像原生的Java NIO那样在应用程序中频繁地进行轮询。这种基于事件驱动的模型能够更加高效地处理大量的并发连接,并且减少了CPU资源的浪费。


NIO Code


public class NioSelectorServer {public static void main(String[] args) throws IOException {// 创建NIO ServerSocketChannelServerSocketChannel serverSocket = ServerSocketChannel.open();serverSocket.socket().bind(new InetSocketAddress(9000));// 设置ServerSocketChannel为非阻塞serverSocket.configureBlocking(false);// 打开Selector处理Channel,即创建epollSelector selector = Selector.open();// 把ServerSocketChannel注册到selector上,并且selector对客户端accept连接操作感兴趣SelectionKey selectionKey = serverSocket.register(selector, SelectionKey.OP_ACCEPT);System.out.println("服务启动成功");while (true) {// 阻塞等待需要处理的事件发生selector.select();// 获取selector中注册的全部事件的 SelectionKey 实例Set<SelectionKey> selectionKeys = selector.selectedKeys();Iterator<SelectionKey> iterator = selectionKeys.iterator();// 遍历SelectionKey对事件进行处理while (iterator.hasNext()) {SelectionKey key = iterator.next();// 如果是OP_ACCEPT事件,则进行连接获取和事件注册if (key.isAcceptable()) {ServerSocketChannel server = (ServerSocketChannel) key.channel();SocketChannel socketChannel = server.accept();socketChannel.configureBlocking(false);// 这里只注册了读事件,如果需要给客户端发送数据可以注册写事件SelectionKey selKey = socketChannel.register(selector, SelectionKey.OP_READ);System.out.println("客户端连接成功");} else if (key.isReadable()) {  // 如果是OP_READ事件,则进行读取和打印SocketChannel socketChannel = (SocketChannel) key.channel();ByteBuffer byteBuffer = ByteBuffer.allocateDirect(128);int len = socketChannel.read(byteBuffer);// 如果有数据,把数据打印出来if (len > 0) {System.out.println("接收到消息:" + new String(byteBuffer.array()));} else if (len == -1) { // 如果客户端断开连接,关闭SocketSystem.out.println("客户端断开连接");socketChannel.close();}}//从事件集合里删除本次处理的key,防止下次select重复处理iterator.remove();}}}
}

正常情况下

    // 阻塞等待需要处理的事件发生selector.select();

这里在没有事件的情况下会阻塞的,但有些特殊的情况下不会阻塞住,导致整个while(true) 一直成立 , 嗷嗷叫 ,CPU 100%。

在这里插入图片描述


Netty是如何解决的?

当使用Java NIO进行网络编程时,通常会使用Selector来监听多个Channel的I/O事件。Selector会不断地轮询所有注册的Channel,以检查是否有就绪的事件需要处理。但是,在某些情况下,由于操作系统或者底层网络实现的限制,Selector可能会出现空轮询的情况,即Selector不断地被唤醒,但没有任何就绪的事件,这会导致CPU资源的浪费。

Netty针对这个问题采取了一系列的优化和解决方案:

  1. 事件驱动模型:Netty采用了基于事件驱动的模型,所有的I/O操作都被视为事件,由事件循环(EventLoop)负责处理。事件循环会将就绪的事件放入队列中,然后按照顺序处理这些事件,避免了空轮询。

  2. 选择合适的Selector策略:Netty在不同的操作系统上使用不同的Selector实现,以获得最佳的性能和可靠性。例如,在Linux系统上,Netty使用epoll作为默认的Selector实现,而不是传统的Selector。epoll具有更好的扩展性和性能,并且不容易出现空轮询的问题。

  3. 自适应阻塞:Netty引入了自适应阻塞的概念,可以根据当前的负载情况自动调整阻塞和非阻塞的策略。这样可以使得Netty在不同的网络环境和负载下都能够表现出良好的性能。

通过以上优化和解决方案,Netty能够有效地避免NIO空轮询的问题,提高了系统的性能和可靠性,特别是在高并发的网络应用场景下。


源码分析

入口

我们根据我们画的Netty线程模型源码图里 找到入口

在这里插入图片描述

源码分析

io.netty.channel.nio.NioEventLoop

在这里插入图片描述

private void select(boolean oldWakenUp) throws IOException {Selector selector = this.selector; // 获取当前NioEventLoop的Selectortry {int selectCnt = 0; // 记录select操作的次数long currentTimeNanos = System.nanoTime(); // 当前时间(纳秒)long selectDeadLineNanos = currentTimeNanos + delayNanos(currentTimeNanos); // 计算选择器的超时时间for (;;) { // 进入循环,不断执行select操作long timeoutMillis = (selectDeadLineNanos - currentTimeNanos + 500000L) / 1000000L; // 计算超时时间(毫秒)if (timeoutMillis <= 0) { // 如果超时时间小于等于0if (selectCnt == 0) { // 如果select操作次数为0selector.selectNow(); // 立即执行非阻塞的select操作selectCnt = 1; // 将select操作次数设置为1}break; // 跳出循环}// 如果有任务且需要唤醒Selector,则立即执行非阻塞的select操作if (hasTasks() && wakenUp.compareAndSet(false, true)) {selector.selectNow();selectCnt = 1;break;}// 执行阻塞的select操作,等待就绪事件的发生,超时时间为timeoutMillisint selectedKeys = selector.select(timeoutMillis);selectCnt ++; // 增加select操作次数// 如果选择到了就绪事件,或者已经被唤醒,或者有任务等待处理,或者有定时任务待执行,则跳出循环if (selectedKeys != 0 || oldWakenUp || wakenUp.get() || hasTasks() || hasScheduledTasks()) {break;}// 如果线程被中断,则重置select操作次数并跳出循环if (Thread.interrupted()) {selectCnt = 1;break;}long time = System.nanoTime();// 如果超时时间已经过去,并且仍然没有选择到就绪事件,则将select操作次数设置为1if (time - TimeUnit.MILLISECONDS.toNanos(timeoutMillis) >= currentTimeNanos) {selectCnt = 1;} else if (SELECTOR_AUTO_REBUILD_THRESHOLD > 0 && selectCnt >= SELECTOR_AUTO_REBUILD_THRESHOLD) {// 如果select操作次数达到了重建Selector的阈值,则重建Selectorselector = selectRebuildSelector(selectCnt);selectCnt = 1; // 重置select操作次数break;}currentTimeNanos = time; // 更新当前时间}// 如果select操作次数大于最小的不完整的select操作次数,则输出日志if (selectCnt > MIN_PREMATURE_SELECTOR_RETURNS) {if (logger.isDebugEnabled()) {logger.debug("Selector.select() returned prematurely {} times in a row for Selector {}.",selectCnt - 1, selector);}}} catch (CancelledKeyException e) {// 忽略取消键异常,因为它不会对程序执行造成实质影响if (logger.isDebugEnabled()) {logger.debug(CancelledKeyException.class.getSimpleName() + " raised by a Selector {} - JDK bug?",selector, e);}}
}

这段代码主要实现了对Selector的select操作的调度和控制,确保了在不同的情况下都能够正常执行select操作,并且针对一些特殊情况进行了处理和优化。


selectCnt

我们来总结一下:

  1. selectCnt 用于记录 select 操作的次数。在循环中,每次执行一次 select 操作,都会增加 selectCnt 的值。它主要用于以下几个方面:

    • 控制是否执行阻塞的 select 操作。
    • 在一些特殊情况下,如线程中断、超时等,重置 selectCnt 的值,以便重新执行 select 操作。
  2. selectRebuildSelector 方法用于重建 Selector。当 selectCnt 达到某个阈值(SELECTOR_AUTO_REBUILD_THRESHOLD),表明连续多次 select 操作未返回任何事件,可能存在 Selector 内部状态异常。为了解决这个问题,会调用 selectRebuildSelector 方法重建 Selector。重建 Selector 的目的是确保 Selector 内部状态的一致性和正确性,从而避免空轮询等问题的发生。

在这里插入图片描述


selectRebuildSelector

 // 如果超时时间已经过去,并且仍然没有选择到就绪事件,则将select操作次数设置为1if (time - TimeUnit.MILLISECONDS.toNanos(timeoutMillis) >= currentTimeNanos) {selectCnt = 1;} else if (SELECTOR_AUTO_REBUILD_THRESHOLD > 0 && selectCnt >= SELECTOR_AUTO_REBUILD_THRESHOLD) {// 如果select操作次数达到了重建Selector的阈值,则重建Selectorselector = selectRebuildSelector(selectCnt);selectCnt = 1; // 重置select操作次数break;}

重建Selector,就意味着,要把旧的Selector上关注的Channel迁移到新的Selector上来.

下面这段代码是用于重建 Selector 的方法 selectRebuildSelector

private Selector selectRebuildSelector(int selectCnt) throws IOException {// Selector 连续多次返回了空结果,可能存在问题,因此需要重建 Selector。logger.warn("Selector.select() returned prematurely {} times in a row; rebuilding Selector {}.",selectCnt, selector);// 重新构建 Selector。rebuildSelector();// 获取重建后的 Selector。Selector selector = this.selector;// 再次执行 select 操作,以填充 selectedKeys。selector.selectNow();return selector;
}

这段代码

  • 首先记录了 Selector 连续多次返回空结果的次数,并发出警告日志。
  • 然后调用 rebuildSelector() 方法重新构建 Selector。
  • 重建完成后,再次执行 selectNow() 方法进行一次非阻塞的 select 操作,以填充 selectedKeys 集合,并返回重建后的 Selector。

这样做的目的是为了尽快恢复 Selector 的正常工作状态,避免因连续空轮询导致的性能问题。


这段代码实现了重建 Selector 的方法 rebuildSelector()

/*** 用于替换当前事件循环的 Selector,以新创建的 Selector 来解决臭名昭著的 epoll 100% CPU bug。*/
public void rebuildSelector() {// 如果不在事件循环中,则提交任务到事件循环中执行 rebuildSelector0() 方法。if (!inEventLoop()) {execute(new Runnable() {@Overridepublic void run() {rebuildSelector0();}});return;}// 如果在事件循环中,则直接调用 rebuildSelector0() 方法。rebuildSelector0();
}

这段代码首先判断当前线程是否在事件循环中。如果不在事件循环中,则通过 execute() 方法将任务提交到事件循环中执行,确保在事件循环线程中执行 rebuildSelector0() 方法。如果已经在事件循环中,则直接调用 rebuildSelector0() 方法进行 Selector 的重建。

这样做的目的是为了确保在事件循环线程中执行 Selector 的重建操作,避免多线程并发访问导致的线程安全问题。


这段代码实现了 Selector 的重建操作 rebuildSelector0()

private void rebuildSelector0() {// 保存旧的 Selector 引用final Selector oldSelector = selector;// 新的 SelectorTuple 对象final SelectorTuple newSelectorTuple;// 如果旧的 Selector 为 null,则直接返回if (oldSelector == null) {return;}try {// 创建一个新的 SelectorTuple 对象newSelectorTuple = openSelector();} catch (Exception e) {// 如果创建新 Selector 失败,则记录日志并返回logger.warn("Failed to create a new Selector.", e);return;}// 记录迁移的 Channel 数量int nChannels = 0;// 遍历旧 Selector 的所有 SelectionKeyfor (SelectionKey key: oldSelector.keys()) {Object a = key.attachment();try {// 如果 SelectionKey 无效,或者对应的 Channel 已经注册到新的 Selector 上,则跳过if (!key.isValid() || key.channel().keyFor(newSelectorTuple.unwrappedSelector) != null) {continue;}// 获取原来的 SelectionKey 的感兴趣事件,并取消旧的 SelectionKeyint interestOps = key.interestOps();key.cancel();// 将 Channel 注册到新的 Selector 上,并保持感兴趣事件不变SelectionKey newKey = key.channel().register(newSelectorTuple.unwrappedSelector, interestOps, a);if (a instanceof AbstractNioChannel) {// 如果是 AbstractNioChannel 类型的 Attachment,更新其 SelectionKey((AbstractNioChannel) a).selectionKey = newKey;}nChannels ++;} catch (Exception e) {// 如果注册失败,记录日志,并关闭对应的 Channellogger.warn("Failed to re-register a Channel to the new Selector.", e);if (a instanceof AbstractNioChannel) {AbstractNioChannel ch = (AbstractNioChannel) a;ch.unsafe().close(ch.unsafe().voidPromise());} else {@SuppressWarnings("unchecked")NioTask<SelectableChannel> task = (NioTask<SelectableChannel>) a;invokeChannelUnregistered(task, key, e);}}}// 更新当前 EventLoop 的 Selector 引用为新的 Selectorselector = newSelectorTuple.selector;unwrappedSelector = newSelectorTuple.unwrappedSelector;try {// 关闭旧的 SelectoroldSelector.close();} catch (Throwable t) {// 如果关闭旧 Selector 失败,记录日志,但不影响继续执行if (logger.isWarnEnabled()) {logger.warn("Failed to close the old Selector.", t);}}// 记录迁移完成的 Channel 数量if (logger.isInfoEnabled()) {logger.info("Migrated " + nChannels + " channel(s) to the new Selector.");}
}

这段代码首先尝试创建一个新的 Selector,并遍历旧的 Selector 上的所有注册的 Channel。对于每个 Channel,取消其在旧 Selector 上的注册,然后重新在新的 Selector 上注册,并保持感兴趣的事件不变。如果注册失败,记录日志并关闭对应的 Channel。最后关闭旧的 Selector,更新当前 EventLoop 的 Selector 引用为新的 Selector。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/690979.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

专题十一、指针和数组

指针和数组 1. 指针的算术运算1.1 指针加上整数1.2 指针减去整数1.3 两个指针相减1.4 指针比较1.5 指向复合常量的指针 2. 指针用于数组处理3. 用数组名作为指针3.1 数组型实际参数&#xff08;改进版&#xff09;3.2 用指针作为数组名 4. 指针和多维数组4.1 处理多维数组的元素…

log4j2的使用

基础用法 1. pom文件导入依赖 junit用来做测试 <dependency><groupId>org.apache.logging.log4j</groupId><artifactId>log4j-core</artifactId><version>2.5</version></dependency><dependency><groupId>org.…

国际网络专线多少钱一年

国际网络专线作为企业扩展业务的重要通信渠道&#xff0c;已经成为许多企业不可或缺的选择。然而&#xff0c;对 于许多企业来说&#xff0c;选择一条稳定、高质量的国际网络专线&#xff0c;并不是一件容易的事情。那么&#xff0c;国际 网络专线到底多少钱一年呢&#xff1f;…

BGP 邻居建立

拓扑图 配置 BGP进程号及为AS号 使用环回口建立BGP邻居关系时&#xff0c;需要指定更新源地址 EBGP在使用环回口建立邻居关系时&#xff0c;需配置EBGP多跳&#xff0c;环回口路由可达 EBGP的路由器存在IBGP邻居时&#xff0c;需要配置next-hop-local&#xff0c;保证下一跳…

适合tiktok运营的云手机需要满足什么条件?

TikTok作为一款全球热门的社交媒体平台&#xff0c;具有无限的市场潜力。然而&#xff0c;卖家在运营过程中常常会面临到视频0播、账号被降权、限流等问题&#xff0c;甚至可能因为多人同时使用一个IP而导致封号的风险。为了规避这些问题&#xff0c;越来越多的卖家将目光投向了…

C语言—指针(2)

回原点(......?)当我没讲&#xff0c;好难 1. 编写函数,要求用指针做形参&#xff0c;实现将二维数组(行列相同)的进行转置&#xff08;行列数据互换&#xff09;&#xff1a; ...不会写 /*1. 编写函数,要求用指针做形参&#xff0c;实现将二维数组(行列相同)的进行转置&a…

看小姐姐的效果棒极了,写了一个工具,逐帧解析视频转成图片,有没有带上商业思维的小伙伴一起研究下

一个突然的想法&#xff0c;促成了这个项目雏形。 原理是&#xff1a; 上传一个视频&#xff0c;自动将视频每一帧保存成图片 然后前端访问 就能实现如图效果 后端是python/flask 数据库mysql 前端uniapp 项目演示&#xff1a; xt.iiar.cn 后端代码如下&#xff1a; #学习…

【C深剖】数组名的细节

本系列博客为个人刷题思路分享&#xff0c;有需要借鉴即可。 引言&#xff1a;我想我说的这个数组名细节可能很多人并没有留意&#xff0c;现在先来C设计者这样设计也很合理。 就是数组名本质上是一个指针&#xff0c;但是这个指针的内容也就是说指向的空间是固定的&#xff0c…

unplugin-vue-components解决命名冲突

我们在vue项目中通常会利用unplugin-vue-components插件进行自定义组件的自动引入 注&#xff1a;如果不知道怎么配置unplugin-vue-components插件&#xff0c;欢迎看我整理的这篇&#xff1a; vue3项目配置按需自动引入自定义组件unplugin-vue-components 当出现同名文件时&a…

先进电机技术——感应电机与同步电机

一、感应电机 感应电机&#xff08;Induction Motor&#xff09;是一种广泛应用的交流电动机&#xff0c;其工作原理基于电磁感应定律。在感应电机中&#xff0c;定子绕组连接到电源后会因通入的交流电而产生一个旋转磁场。这个磁场在空间中是连续变化并以恒定的速度&#xff…

【医学大模型】Text2MDT :从医学指南中,构建医学决策树

Text2MDT &#xff1a;从医学指南中&#xff0c;构建医学决策树 提出背景Text2MDT 逻辑Text2MDT 实现框架管道化框架端到端框架 效果 提出背景 论文&#xff1a;https://arxiv.org/pdf/2401.02034.pdf 代码&#xff1a;https://github.com/michael-wzhu/text2dt 假设我们有一…

算法-矩阵置零

1、题目来源 73. 矩阵置零 - 力扣&#xff08;LeetCode&#xff09; 2、题目描述 给定一个 m x n 的矩阵&#xff0c;如果一个元素为 0 &#xff0c;则将其所在行和列的所有元素都设为 0 。请使用 原地 算法。 示例 1&#xff1a; 输入&#xff1a;matrix [[1,1,1],[1,0,1…

机器学习---规则学习(一阶规则学习、归纳逻辑程序设计)

1. 一阶规则学习 “一阶”的目的&#xff1a;描述一类物体的性质、相互关系&#xff0c;比如利用一阶关系来挑“ 更好的”瓜&#xff0c;但实际应用 中很难量化颜色、 …、敲声的属性值。一般情况下可以省略全称量词。 命题逻辑&#xff1a;属性-值数据 色泽程度&#xff1a…

CSS:BFC

BFC&#xff0c;Block Formatting Context&#xff0c;块级格式化上下文&#xff0c;是一个独立的渲染区域或隔离的独立容器&#xff0c;它决定了其子元素如何布局&#xff0c;并且与这个区域外部的元素无关。 形成 BFC 的条件 float 的值不为 none&#xff08;left、right&a…

爬虫入门一

文章目录 一、什么是爬虫&#xff1f;二、爬虫基本流程三、requests模块介绍四、requests模块发送Get请求五、Get请求携带参数六、携带请求头七、发送post请求八、携带cookie方式一&#xff1a;放在请求头中方式二&#xff1a;放在cookie参数中 九、post请求携带参数十、模拟登…

HTTPS网络通信协议基础

目录 前言&#xff1a; 1.HTTPS协议理论 1.1协议概念 1.2加密 2.两类加密 2.1对称加密 2.2非对称加密 3.引入“证书” 3.1证书概念 3.2数据证书内容 3.3数据签名 4.总结 前言&#xff1a; 了解完HTTP协议后&#xff0c;HTTPS协议是HTTP协议的升级加强版&#xff0c…

设计模式二:代理模式

1、什么是动态代理 可能很多小伙伴首次接触动态代理这个名词的时候&#xff0c;或者是在面试过程中被问到动态代理的时候&#xff0c;不能很好的描述出来&#xff0c;动态代理到底是个什么高大上的技术。不方&#xff0c;其实动态代理的使用非常广泛&#xff0c;例如我们平常使…

unity 使用VS Code 开发,VS Code配置注意事项

vscode 对应的插件&#xff08;unity开发&#xff09; 插件&#xff1a;.Net Install Tool,c#,c# Dev Kit,IntelliCode For C# Dev Kit,Unity,Unity Code Snippets 本人现在是用了这些插件 unity需要安装Visual Studio Editor 1、.Net Install Tool 设置 需要在设置里面配置…

jvm gc日志拿取与分析思路

前言 参考文章:Java中9种常见的CMS GC问题分析与解决 - 美团技术团队 排查过程 进入容器里 生产应用是跑在docker上的&#xff0c;所以需要先进入到应用里面去&#xff0c;步骤如下 1. docker ps 找到对应的应用id&#xff0c;比如 zxc 2. 进入容器内部 docker exec -it 7690…

Elasticsearch:什么是搜索引擎?

搜索引擎定义 搜索引擎是一种软件程序或系统&#xff0c;旨在帮助用户查找存储在互联网或特定数据库中的信息。 搜索引擎的工作原理是对各种来源的内容进行索引和编目&#xff0c;然后根据用户的搜索查询向用户提供相关结果列表。 搜索引擎对于希望快速有效地查找特定信息的用…