中科驭数HADOS 3.0:以四大架构革新,全面拥抱敏捷开发理念,引领DPU应用生态

一家成功的大算力芯片公司,其核心壁垒必须是软硬兼备的,既要有芯片架构的强大技术壁垒,更要有持久投入的、生态兼容完备的软件护城河。HADOS,就是中科驭数的软件护城河。

——中科驭数高级副总裁 张宇

近日,在DPU基础软件开发上,中科驭数迎来了一项重要的突破成果——HADOS 正式来到3.0版本。

HADOS 3.0是国内DPU软件研发平台的一个里程碑版本,集结了中科驭数6年全部软件研发投入与DPU在各行业广泛落地经验的整合和沉淀,体现了中科驭数全面拥抱敏捷开发的理念和方法,以及对高效、灵活、安全、易用的极致追求。

目前,HADOS 3.0核心代码量已经超过126万行,包含网络、计算、存储、安全等多层次API数量高达2765个,并且提供大量的开箱即用的组件和服务。相较于英特尔的IPDK和英伟达的DOCA,起步更早的HADOS在不少方面都有独特的沉淀和优势,包括云原生网络、微服务治理、全卸载能力、DPU全仿真技术、生态兼容性、运营管控、国内安全加解密,以及最重要的人工智能场景下国产AI芯片和GPU芯片网络方案等等方面。可以这么说,HADOS 3.0已经站在了业界最前沿,成为与国际巨头英伟达和英特尔并驾齐驱的本土解决方案。

HADOS 3.0 沿用驭数经典软件栈架构

为用户提供全方位、多层次的开发体验

从架构来看,HADOS3.0延续了此前两个大版本的三个逻辑功能分区架构,分别是超高性能的设备驱动层(DDL),兼容性完备的应用驱动层(ADL),以及功能强大且好用的应用开发平台层(ADP)。这也是中科驭数的经典软件栈架构模型设计,旨在为用户提供全方位、多层次的开发体验。

设备驱动层(DDL),作为性能与灵活性兼备的“不二之选”,集成了DPU开发所需的全套驱动模块与丰富的API接口,涵盖超低延迟LDMA、RDMA、虚拟化、存储加密等功能模块,并且支持NP的网络可编程,特别适用于追求极致性能与定制化的用户。

应用驱动层(ADL),聚焦于“三U一体”高性能算力中心,通过优化的DPDK、SPDK、OVS、OVN,以及云原生和服务网格等技术组件,为网络、计算、存储提供全面加速服务,助力用户轻松构建高性能算力底座,开箱即用,即刻享受DPU带来的性能飞跃。

而应用开发平台层(ADP),是HADOS的“敏捷”核心,配备了编译、仿真、调试、部署的全栈工具包,其中HADEP——业界首款DPU Emulator,更是历经三年精心打磨,实现了中科驭数DPU的全功能仿真,支持云化部署,让客户能够在云端一键部署DPU设备集群,大幅缩短开发周期,加速项目落地。此外,HADEP还支持与真实DPU的混合部署,进一步提升研发效率。

在内部,中科驭数本身就是HADEP的“重度用户”,基于云化部署的HADEP,搭建了自动化研发测试平台,大大节省了硬件资源协调和占用开销,提升了开发效率。这一举措不仅是HADOS敏捷异构开发理念的生动实践,也体现了驭数对研发效率与质量的不懈追求。

面对DPU开发平台的复杂性,中科驭数构建了ADIP——一套多流水线自动化DevOps与自动化测试平台,支持敏捷开发、持续集成、部署、安装、测试、迭代,确保HADOS的构建与自动化测试,成为推动HADOS成功的“幕后英雄”。

HADOS 3.0四大架构革新

全面拥抱敏捷开发,引领DPU应用生态

架构革新之一:为云原生而“原生”

云原生技术,既承载了当前通用数据中心中主流方式,更是在当下以AIGC和大模型为代表的人工智能浪潮中,承担核心算力操作系统角色,海量数据训练以及大模型训练、大模型推理都离不开云原生技术。

HADOS 3.0全面深度支持和拥抱原生网络集群,提供云原生网络加速、服务网格全卸载、裸金属共池管理和网络安全增强,为用户打造了一个高效率、低成本、安全可靠的开发与运行平台,提供了全面、高效的云原生解决方案。

架构革新之二:简约而不简单

深知客户在运维过程中面临的挑战与需求,HADOS 3.0通过一系列智能化的管理工具与服务,提供强大的智能化运维支撑。HADOS 3.0引入了完善的运维管控遥测接口,与服务组件无缝集成,确保了对DPU集群的全面监控与高效管理。更值得一提的是,HADOS灵活地提供了普罗米修斯等系统服务,满足客户多样化的运维需求。在此基础上,HADOS倾力打造的DPU UMS统一管理系统,不仅能实时监测DPU设备的状态,还能进行精细化的配置管理,确保集群的稳定运行与资源的高效利用。

通过这一平台,用户可以轻松实现设备的远程控制、故障预警、性能优化等功能,极大降低了运维的复杂度与成本,释放了更多精力专注于核心业务的创新与发展。

架构革新之三:层次化服务API,支持不同层次的二次开发

针对客户对于DPU开发使用门槛高的痛点,HADOS 3.0提供从基础到高级各个层次的服务API,更以直观清晰的文档,如全量、丰富的说明文档、用户手册、最佳编程实践与调优实践指导,助力开发者快速打开DPU应用的大门,大幅缩短项目启动周期,有效控制开发成本。

架构革新之四:一云多芯

“一云多芯”是当前业界整个高性能数据中心绕不过去的主流趋势。为了顺应这一多元化需求,HADOS 3.0支持“一云多芯”策略,让DPU能够与不同CPU、操作系统、GPU及IAAS层软件系统无缝对接,做到全适配、全兼容承诺,让客户轻松构建“三U一体”高性能算力底座,一键部署,即刻体验敏捷异构的效益。HADOS 3.0目前已成为业内唯一一款生态全兼容的DPU应用开发平台,兼容了8款主流国产CPU平台和10大国产操作系统。

六年磨一剑,HADOS已经成为业内适配最完全、竞争力最强、国内实际落地部署最多的DPU软件开发平台,累计部署量已经超过了万卡级别。

HADOS 3.0每一行代码,每一个功能模块,都是基于中科驭数对用户需求的深刻理解,为用户提供了从底层硬件到上层应用的全方位加速,有效解决DPU开发与部署过程中的复杂性与挑战,是对高性能计算与DPU规模化应用落地挑战的有力回应。中科驭数将一如既往地站在DPU软硬件技术探索前沿,与广大用户一道,共筑高性能计算的坚实基石。所有的这些努力,也都代表着一个信念——把敏捷易用送给客户,把复杂挑战留给驭数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/42433.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

关于MySQL mvcc

innodb mvcc mvcc 多版本并发控制 在RR isolution 情况下 trx在启动的时候就拍了个快照。这个快照是基于整个数据库的。 其实这个快照并不是说拷贝整个数据库。并不是说要拷贝出这100个G的数据。 innodb里面每个trx有一个唯一的trxID 叫做trx id .在trx 开始的时候向innodb系…

嵌入式音频处理技术的现在发展及未来的方向

嵌入式音频处理技术:从音频流媒体到声音识别 嵌入式音频处理技术的迅猛发展正在改变我们的生活方式,从音频流媒体到声音识别,这个领域为人们的生活和工作带来了巨大的影响。本文将探讨嵌入式音频处理技术的最新趋势和应用,以及提…

逻辑回归模型(非回归问题,而是解决二分类问题)

目录: 一、Sigmoid激活函数:二、逻辑回归介绍:三、决策边界四、逻辑回归模型训练过程:1.训练目标:2.梯度下降调整参数: 一、Sigmoid激活函数: Sigmoid函数是构建逻辑回归模型的重要激活函数&am…

openlayers更改点坐标

我现在的需求是无人机点位根据ws传输的经纬度改变位置,在网上查了很多资料,终于是做出来了,如果有问题请指出。 效果图,无人机可以来回移动 这里是核心代码 // 添加飞机点位图层let vectorLayerpointfunction DronepointLayer()…

Kafka(三)Producer第二篇

一,生产者架构 生产者客户端由两个线程协调运行,分别为主线程和Sender线程(发送线程)。 主线程:KafkaProducer创建消息,通过拦截器、序列化器和分区器之后缓存到消息收集器RecordAccumulator中;…

大语言模型的直接偏好优化(DPO)对齐在PAI-QuickStart实践

直接偏好优化(Direct Preference Optimization,DPO)算法是大语言模型对齐的经典算法之一,它巧妙地将奖励模型(Reward Model)训练和强化学习(RL)两个步骤合并成了一个,使得训练更加快…

【算法】单调队列单调栈

一、单调队列 用来维护一段区间内的最大值或最小值,例如滑动窗口、区间最值等问题。 基本概念 单调队列是一种存储数据的队列,其中元素的顺序是单调递增或单调递减的。在算法竞赛中,我们一般使用两个单调队列,一个维护单调递增序…

【版面费优惠丨ACM独立出版丨接受全文摘要投稿】2024年生物医药和智能技术国际学术会议(ICBIT 2024,8月23-25)

“2024年生物医药和智能技术国际学术会议(ICBIT 2024)”拟定于2024年8月23-25日于珠海召开。近年来,智能技术已经逐渐走入生物医药领域,并在与生物医药领域的融合创新中凸显出巨大的发展潜力和社会价值。人工智能技术在生物医药领…

水处理基本知识

RO反渗透程序设计软件下载 水处理基本知识 纯水制备的核心工艺 核心工艺:纯水(超纯水)制备的主要处理工艺,结合前处理(预处理)工艺,辅助工艺及特殊工艺,组成完整的纯水制备工艺。结…

优质作品集秘诀:8个技巧让你的作品脱颖而出

制作一个高质量的投资组合不仅可以展示你的技能和创造力,还可以帮助你在求职和职业发展中脱颖而出。如何制作高质量的投资组合?今天给大家讲述作品集的 8 个实用技能,帮助你制作出令人印象深刻的作品集! 1、精选作品 并不是所有…

飞睿智能会议室静止雷达人体检测传感器,实时监测使用状态,有人、无人智能感应节能减

在这个科技日新月异的时代,每一个细微的创新都可能成为推动行业创新的关键力量。今天,让我们聚焦于一项看似不起眼却实则潜力无限的技术——飞睿智能静止雷达人体检测传感器,以及它在会议室这一商务交流核心区域中的巧妙应用。想象一下&#…

前端Canvas入门——怎么用Canvas画一些简单的图案

Canvas作为前端的画图工具&#xff0c;其实用途还是蛮广泛的&#xff0c;但是很多前端学习课程其实都很少涉及到这块内容。 于是乎&#xff0c;就写下这个了。 当然啦&#xff0c;目前还在学习摸索中。 一些实战代码&#xff0c;仅供参考&#xff1a; <canvasid"ctx&…

EtherCAT总线冗余让制造更安全更可靠更智能

冗余定义 什么是总线冗余功能&#xff1f;我们都知道&#xff0c;EtherCAT现场总线具有灵活的拓扑结构&#xff0c;设备间支持线型、星型、树型的连接方式&#xff0c;其中线型结构简单、传输效率高&#xff0c;大多数的现场应用中也是使用这种连接方式&#xff0c;如下图所示…

【Qt课设】基于Qt实现的中国象棋

一、摘 要 本报告讨论了中国象棋程序设计的关键技术和方法。首先介绍了中国象棋的棋盘制作&#xff0c;利用Qt中的一些绘画类的函数来进行绘制。在创作中国象棋棋子方面&#xff0c;首先&#xff0c;我们先定义一下棋子类&#xff0c;将棋子中相同的部分进行打包&#xff0c;使…

idea推送到gitee 401错误

在idea上推送时遇到这样的问题&#xff0c;解决方法如下&#xff1a; 在https://的后面加上 用户名:密码 然后再提交就ok啦&#xff01;

三、SpringMVC

三、SpringMVC 1、SpringMVC简介 1.1、什么是MVC MVC是一种软件架构的思想&#xff0c;将软件按照模型、视图、控制器来划分 M&#xff1a;Model&#xff0c;模型层&#xff0c;指工程中的JavaBean&#xff0c;作用是处理数据 JavaBean分为两类&#xff1a; 一类称为实体…

代码随想录-Day55

42. 接雨水 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图&#xff0c;计算按此排列的柱子&#xff0c;下雨之后能接多少雨水。 输入&#xff1a;height [0,1,0,2,1,0,1,3,2,1,2,1] 输出&#xff1a;6 解释&#xff1a;上面是由数组 [0,1,0,2,1,0,1,3,2,1,2,1] 表示的高…

CentOS7二进制安装和YUM安装mongodb,服务器无法安装5.0以上的 mongodb 数据库报错 Illegal instruction

文章目录 MongoDB 安装二进制安装YUM 安装 Tips:1、MongoDB安装问题2、MongoDB登录3、MongoDB排序时内存大小限制和创建索引4、创建用户5、Java yaml使用密码连接mongodb6、MongoDB增删改查 MongoDB 安装 二进制安装 [rootmysql5-7 mongodb-6.0.4]# cat start.sh #!/bin/bash…

js使用proxy代理监听控制事件

本文为proxy代理的实例应用&#xff0c;有关代理的内容可以参考&#xff1a; js语法---理解反射Reflect对象和代理Proxy对象 监听事件 要监听dom元素的事件&#xff0c;我们会采用回调触发的方式来执行操作&#xff0c; 而触发事件的过程很明显是一个异步操作&#xff0c;异…

Docker 使用基础(1)—镜像仓库

&#x1f3ac;慕斯主页&#xff1a;修仙—别有洞天 ♈️今日夜电波&#xff1a;秒針を噛む—ずっと真夜中でいいのに。 0:34━━━━━━️&#x1f49f;──────── 4:20 &#x1f504; ◀️ ⏸ …