数据库管理-第194期 网络加速RDMA初探(20240526)

数据库管理194期 2024-05-26

  • 数据库管理-第194期 网络加速RDMA初探(20240526)
    • 1 概念
    • 2 发展
    • 3 使用
    • 总结

数据库管理-第194期 网络加速RDMA初探(20240526)

作者:胖头鱼的鱼缸(尹海文)
Oracle ACE Associate: Database(Oracle与MySQL)
PostgreSQL ACE Partner
青学会(青年数据库学习互助会)外部顾问
10年数据库行业经验,现主要从事数据库服务工作
拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证
墨天轮MVP、认证技术专家、年度墨力之星,ITPUB认证专家、专家百人团成员,OCM讲师,PolarDB开源社区技术顾问,OceanBase观察团成员
圈内拥有“总监”、“保安”、“国产数据库最大敌人”等称号,非著名社恐(社交恐怖分子)
公众号:胖头鱼的鱼缸;CSDN:胖头鱼的鱼缸(尹海文);墨天轮:胖头鱼的鱼缸;ITPUB:yhw1809。
除授权转载并标明出处外,均为“非法”抄袭

之前在几场现场演讲和直播过程中提到过RDMA,也有很多人在问这么一个技术。这是一个很早就用在Oracle Exadata一体机上的网络技术,可以说一体机强大的性能一部分原因源自于此。从本期开始,将通过若干期内容分享,深入RDMA网络,探究其在数据库层面的应用。

1 概念

RDMARemote Direct Memory Access,可译作远程直接内存访问,是一种不经由操作系统从一台计算机到另一台计算机直接访问内存的技术。由于无需经过操作系统内核对网络包进行封装,可以节省大量CPU资源占用,同时也提供了高吞吐、低延迟网络,尤其适用于大规模并行计算机集群。
RDMA支持网络适配器直接通过网线将数据传输至应用内存或从应用内存直接传输至网线的零拷贝(Zero-copy)网络传输。这种传不再需要应用程序内存和操作系统数据缓存的数据复制拷贝操作。这种传输不需要CPU、缓存或上下文交换参与,并且传输可以与其他系统操作并行执行。使用RMDA可以有效减少消息传输的延迟。
但是,这种策略也会出现目标节点不会受到请求完成的通知(单向通信)等相关的一些问题。
image.png

2 发展

截止2018年,由于RDMA功能的不断完善与增强,在网络基础设施上的优异性能表现,获得了广泛的认可。例如:

  • RDMA over Converged Ethernet (RoCE)可以在有损或无损的设施上运行
  • iWRAP能够在物理层使用TCP/IP作为传输实现以太网RDMA

这使得RDMA将性能和延迟优势与低成本、标准化解决方案相结合。RDMA联盟和DAT Collaborative在RDMA协议和API的开发指定中发挥了关键通。
目前基于RDMA的高带宽网络设备,速度已达到100Gbit/s以上。IBM、红帽、Oracle等软件供应商已在最新产品中支持这些API。
硬件供应商已经开始开发基于RDMA的更高容量网络适配器,据报道其速率为100 Gbit/s。IBM、Red Hat和Oracle Corporation等软件供应商在其最新产品中支持这些API,截至2013年,工程师已开始开发通过以太网实现RDMA的网络适配器。Red Hat Enterprise Linux和Red Hat Enterprise MRGhave都支持RDMA。Microsoft通过SMB Direct在Windows Server 2012中支持RDMA。VMware的ESXi产品自2015年起也支持RDMA。
常见RDMA包含虚拟网络架构(Virtual Interface Architecture)、RDMA over Converged Ethernet (RoCE)、InfiniBand、Omni-Path和iWARP.
image.png

3 使用

应用程序访问控制可以通过最初设计用于InfiniBand的协议来使用RDMA的API,这些API可以用于任何底层RDMA实现。使用发送和完成队列,应用程序通过将工作队列条目(work queue entries,WEQs)提交到提交队列(submission queue,SQ)并从完成队列(completion queue,CQ)获取响应通知来执行RDMA操作。
RDMA可以通过可靠连接(Reliably Connected,RC)和不可靠数据包(Unreliable Datagram,UD)传输协议来进行数据的可靠或不可靠传输。前者有点事不丢失请求,而后者处理多个连接时则需要更少的队列对。这是因为UD是无连接的,允许单个主机使用单个队列与任何其他主机通信。

RDMA可以分别通过可靠连接(RC)和不可靠数据报(UD)传输协议可靠或不可靠地传输数据。前者的优点是保留请求(不会丢失请求),而后者在处理多个连接时需要更少的队列对。这是因为UD是无连接的,允许单个主机使用单个队列与任何其他主机通信。

总结

从前面的介绍可见,RDMA作为一款优秀的低延迟高吞吐量网络技术,是可以极大提升网络性能。后面将深入Exadata对RDMA的使用、基于RDMA技术的配置实操以及RDMA在数据库层面的使用愿景深入了解RDMA。
老规矩,知道写了些啥。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/15862.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

不同的二叉搜索树(II)题解

toc 🤚我的博客 欢迎光临我的博客:https://blog.csdn.net/qq_52434217?typeblog 🥛前言 动态规划是常见的算法思路,动态规划在计算过程中保存了部分计算结果到内存中,以便于在进行下一次计算时可以直接从内存中获…

【Text2SQL】Spider 数据集

论文:Spider: A Large-Scale Human-Labeled Dataset for Complex and Cross-Domain Semantic Parsing and Text-to-SQL Task ⭐⭐⭐⭐⭐ EMNLP 2018, arXiv:1809.08887 Dataset: spider GitHub: github.com/taoyds/spider 一、论文速读 本文提出了 Text2SQL 方向的…

1.4 Mac 电脑 Clion 安装教程

目录 1 安装 2 激活 3 汉化 1 安装 去 https://www.jetbrains.com/clion/download/other.html 下载: 也可以直接到链接进行下载:https

嵌入式全栈开发学习笔记---C语言笔试复习大全23

目录 联合体 联合体的定义 联合体的长度 如果来判断设备的字节序? 如何把大端数据转换成小端数据? 枚举 枚举的定义 上一篇复习了结构体,这一节复习联合体和枚举。 说明:我们学过单片机的一般都是有C语言基础的了&#xff…

docker镜像容器搭建nominatim地理编码服务

1、下载地图pbf文件: https://planet.openstreetmap.org/ 2、nominatim官网 https://nominatim.org/release-docs/latest/admin/Installation/ 3、地图文件打包: docker run -it --shm-size20g \ -e PBF_PATH/nominatim/data/china-latest.osm.pbf \ -e REPLIC…

C语言PTA练习题:三角形类别,输入三角形三条边,求面积,四则计算器,猴子吃桃

7-1 三角形类别 输入三个整数,以这三个数为边长,判断是否构成三角形;若不能输出"no",若构成三角形,进一步判断它们构的是:锐角三角形或直角三角形或钝角三角形.分别输出"ruijiao",&qu…

GitLens或者Git Graph在vscode中对比文件历史变化,并将历史变化同步到当前文件中

有时候我们上周改的代码,现在想反悔把它恢复过来,怎么办???很好,你有这个需求,说明你找对人了,那就是我们需要在vscode中安装这个插件:GitLens或者Git Graph,…

门禁-jenkins的构建状态同步到gitlab提交流水线

API接口文档 https://docs.gitlab.cn/jh/api/commits.html 配置pipline流水线 生成http请求代码: 使用HttpRequest插件生成 - sharelibs内容 //这是share libs里的 package devopsdef httpReq(reqType, reqUrl, reqBody, accessToken){def gitServer "…

有一个3x4的矩阵,要求用函数编写程序求出其中值最大的那个元素,以及其所在的行号和列号

常量和变量可以用作函数实参,同样数组元素也可以作函数实参,其用法与变量相同。数组名也可以作实参和形参,传递的是数组的起始地址。 用数组元素作函数实参: 由于实参可以是表达式,而数组元素可以是表达式的组…

2000 年至 2015 年中国(即水稻、小麦和玉米1km 网格)三种主要作物年收获面积的时空变化

摘要 可靠、连续的主要作物收获面积信息对于研究地表动态和制定影响农业生产、土地利用和可持续发展的政策至关重要。然而,中国目前还没有高分辨率的空间明确和时间连续的作物收获面积信息。全国范围内主要农作物收获面积的时空格局也鲜有研究。在本研究中&#xf…

2024年【熔化焊接与热切割】考试内容及熔化焊接与热切割考试报名

题库来源:安全生产模拟考试一点通公众号小程序 熔化焊接与热切割考试内容考前必练!安全生产模拟考试一点通每个月更新熔化焊接与热切割考试报名题目及答案!多做几遍,其实通过熔化焊接与热切割复审模拟考试很简单。 1、【单选题】…

SpringBoot【1】集成 Druid

SpringBoot 集成 Druid 前言创建项目修改 pom.xml 文件添加配置文件开发 java 代码启动类 - DruidApplication配置文件-propertiesDruidConfigPropertyDruidMonitorProperty 配置文件-configDruidConfig 控制层DruidController 运行验证Druid 的监控应用程序 前言 JDK版本&…

前端开发-添加公用的ts文件,并在Vue文件中引用

一般我们把页面要用的公用函数写在一个ts文件中 通过调用这个ts文件让我们可以在vue文件中使用函数 Eg:我们现在创建一个formRules.ts文件 然后在我们需要调用该函数体的vue文件中 import { required } from "/utils/formRules";有可能语法一开始会提示…

防火墙——域网络、专用网络、公用网络

在防火墙设置中,域网络、专用网络和公用网络是指计算机连接到网络时所处的不同环境。每种环境都有不同的安全级别和配置。 1、域网络(宽松) 域网络是指计算机加入了一个Windows域(Domain)环境,这通常在企业…

程序员的那些经典段子

哈喽,大家好,我是明智~ 本周咱们已经解决了在面试中经常碰到的OOM问题: 《美团一面,发生OOM了,程序还能继续运行吗?》 《美团一面:碰到过OOM吗?你是怎么处理的&#xff1…

白嫖的在线工具类宝藏网站清单,快点击进来收藏一波

简单整理了一下自己日常经常使用的10个免费工具网站,建议点赞关注收藏,快点分享给小伙伴们! 1.奶牛快传:用户体验更好的网盘工具。 https://cowtransfer.com/ 今年开始使用的一款网盘工具,和百度网盘类似,叫奶牛快传,如…

【设计模式】——装饰模式(包装器模式)

💻博主现有专栏: C51单片机(STC89C516),c语言,c,离散数学,算法设计与分析,数据结构,Python,Java基础,MySQL,linux&#xf…

数据结构--二叉搜索树

目录 二叉搜索树的概念 二叉树的实现 结点类 函数接口总览 实现二叉树 二叉搜索树的应用 K模型 KV模型 二叉搜索树的性能分析 二叉搜索树的概念 二叉搜索树(Binary Search Tree,简称BST)是一种特殊的二叉树,其具有以下几…

6818 android 修改开机 logo, 编译脚本分析

问题: 客户需要去掉 android5.1 的开机logo. 说明: 对于Android5.1 来说,uboot 与kernel 的logo 是一个。 过程: 其实对于开机logo 的修改很简单,直接参考厂家手册就可以了。 这是 android4.4 的开机logo 的修改&…