中科驭数第三代DPU芯片K2-Pro,专为数据中心打造的“六边形战士”

近日,中科驭数重磅发布第三代DPU芯片K2-Pro,是国内首颗面向量产的全功能芯片!

K2-Pro采用自主研发的Kernel Processing Unit架构,集网络、存储、安全及计算等多业务卸载功能于一体,包处理速率翻倍至80Mpps,最高支持200G网络带宽,具备高度可编程性,确保了系统的灵活扩展性,为数据中心的业务增长和算力扩容提供坚实基础。在处理复杂任务时,K2-Pro相比上一代芯片能耗降低30%。

作为一款纯国产的高性能解决方案, K2-Pro以其全面性能的均衡与卓越,成为数据中心战场上的“六边形战士”,可广泛适用于云计算、智能计算、及高性能计算等领域,也为数据中心的算力升级提供了全新解题思路。同时,K2-Pro也必将成为推动DPU芯片进入大规模量产的标杆之作。

自研KPU架构和KISA指令集

用创新的体系结构理论指导复杂的芯片架构设计

对于中科驭数来说,DPU的研发之路上,架构创新不是可选项,而是必选项。中科驭数在芯片研发领域持续深耕,从底层架构入手,致力于解决DPU芯片面临的高带宽、低延迟及复杂业务需求挑战的决心。

KPU架构——专用计算代表性架构

自主研发KPU芯片架构是中科驭数多年体系结构研究的结晶,基于软件定义硬件的技术路线,创新性地提出了面向专用计算统一计算架构KPU。该架构采用异构计算核作为基本单位,根据上层应用的具体需求定制化设计,具有软件可定义、超高并行处理能力、超强处理性能三大优势,配合数据流驱动的运算激活机制,确保了系统灵活性与高效运行的完美平衡,为DPU芯片设计打造新标杆。

KISA指令集——业界首个DPU指令集架构

以此为基础,中科驭数进一步推出了首个专为DPU设计的指令集架构——KISA,旨在解决专用计算领域编程范式的碎片化问题。不同于传统的CPU指令集,KISA紧密贴合DPU的特性,强调数据处理而非控制流,高计算密度型而非低计算密度型,采用数据流而非字节作为基本操作单元。更重要的是,KISA首次在指令集层次支持敏捷异构,用一套统一的指令实现了多种异构处理核进行管理调度。

目前,KISA指令集涵盖了KISA基础架构、以及面向DPU专用处理扩展指令,包含包解析、转发指令、以及表查询指令等。基于KISA已经覆盖25大类应用场景,累计数百个用例,得到非常充分验证。

KISA指令集的推出,将软件定义技术路线向着更加可落地、可执行的方向推进了一大步,系统性地解决了领域专用计算的编程范式混杂的难题,让开发变得更加简单高效,让每一行代码直达DPU算力。

实用制胜,量产为王

K2-Pro何以称为数据中心的“六边形战士”?

基于以上两大底层技术创新,不仅打破了传统DPU设计,更推动了DPU芯片向更高性能、更强灵活性和更低功耗方向发展。相较于单一性能的极致追求,中科驭数在DPU设计上秉持全面卓越的理念,致力于打造“全能冠军”而非“单项冠军”。

因此,K2-Pro在立项之初就把“实用制胜,量产为王”作为研发目标,确保技术创新与市场需求紧密结合。历经深度优化以及融合了对数据中心未来中心场景的深入理解,K2-Pro最终实现以下六个方面的极致优化:

K2-Pro是先进、好用的网络芯片

对于DPU来说,首先是一个网卡,才能再谈进一步拓展其复杂业务的处理能力。为此,中科驭数团队在基础网络功能上苦下工夫,将K2-Pro打造成综合能力强悍的网卡芯片。

一方面,在实现基础网络卸载功能上,K2-Pro集成了高通量DMA以及硬件虚拟化技术,并通过丰富的软件显著增强了运维能力,这一进步在国产网卡领域中尤为突出,直接对标国外主流产品。

另一方面,K2-Pro着重在网络延时、高阶包处理能力上做了增强。通过优化设计,K2-Pro将端到端网络延迟控制在1.2微秒以下,处理带宽达到200Gbps,做到业界领先水平,成功填补了国内低延迟网卡市场的空白。

同时,结合其可编程的包处理引擎,K2-Pro打破了传统网络处理局限于二层包的框架,赋予用户更高的灵活性去执行包解析和深度数据分析任务,根据自身需求设计特定的安全策略、流量优化方案等等,让用户在硬件层面实现个性化配置,极大提升了数据中心网络的智能化和定制化程度。

K2-Pro是高通量数据处理芯片

K2-Pro芯片,作为一款面向数据中心的高性能数据处理核心,其优势在于如何高效且有序地管理复杂多变的基础设施层服务。

DPU业务里面有非常鲜明的特点:一是业务类型繁多且性质各异,涵盖网络、存储及各类用户特定应用,每种业务不仅要求精确解析,还需定制化处理逻辑,加之不同业务的处理时延各异,极易引发处理顺序混乱等难题。二是并发级别极高,应对千万级别的数据流、管理动辄数百上千的虚拟机,是数据中心面临的运营常态。三是对延迟高度敏感,与GPU的批处理加速模式不同,DPU要求在严格的时间窗口内完成任务,任何延误都将导致数据丢失。

鉴于此,K2-Pro的高通量数据处理能力成为其核心竞争力,其背后的关键技术在于精细的流调度与隔离机制。经过深入研究与优化,K2-Pro从流的精准识别到并发处理能力均实现了显著提升,确保在极端并发场景下仍能维持高水平性能,几乎不受流量洪峰影响。最终做到了在承载千万级并发流、服务上千租户、处理千万级流表及数十种不同租户配置的复杂业务之下,稳定输出200Gbps数据吞吐率及40Mpps包处理能力的领先性能,让数据处理更加“游刃有余”。

K2-Pro是强业务卸载芯片

在复杂的云服务环境中,尤其是面对如服务网格这类高控制复杂度的业务,现有DPU技术往往难以有效承担,其业务卸载效率低下,通常不足20%。业界普遍采取的应对策略是增强控制层面的资源配置,极端时甚至采用服务器级CPU来维系控制功能。但这不仅未能从根本上改善服务质量和降低延迟问题,反而可能导致资源浪费。

基于上述挑战,中科驭数团队一直认为DPU必须轻控制,而非盲目追求与CPU相匹敌的控制能力。在此理念指导下,K2-Pro在设计上实现了多项关键技术突破,包括但不限于精密的流调度技术、高效数据交互协议,以及专门设计的网络卸载、表项卸载、存储卸载、RDMA卸载等重要引擎,将原本在DPU上难以卸载的业务比例从低于20%显著提升至90%以上,大幅减轻了控制面的压力。

服务治理场景下,K2-Pro也实现了量级的跃迁,将原先400us以上的治理延时降到了30us以内,显著优于当前市场上的解决方案,为确保高性能、低延迟的云服务环境提供了强大的技术支持。

K2-Pro是灵活可扩展处理芯片

虽然DPU出现时间不长,但是它的潜力在加速显现。随着更多业务向DPU转移,以及协议迭代和任务类型的增加,DPU的扩展能力成为关键。因此,K2-Pro芯片在三个维度上实现了独特性的可扩展性设计,让业务与同构算力、异构算力灵活扩展:

可编程与卸载能力:K2-Pro自身不仅配备了高性能的可编程引擎,还融入了协议分析引擎(PPP)与通用算法引擎(CAE),确保了对不断演进的协议和复杂算法的有效支持。中科驭数在金融领域做过一个尝试,通过全面卸载特定的金融通信协议和业务算法至DPU,性能相比现有方案提升了十倍以上,刷新了行业认知。

芯片级联与算力自由扩展:为满足日益增长的算力需求,中科驭数创新设计了DPU间的高速互联技术,支持芯片级联,使多个DPU能够无缝串联,实现DPU算力自由扩展。这一方案与行业标准接轨,为大规模数据中心的算力部署提供了高效路径。举例而言,通过多芯互联,能够轻松部署高性能的NAT网关解决方案,为数据中心的网络架构升级和业务扩展打开了新的可能性。

开放的外接算力集成策略:K2-Pro还致力于与其他类型算力芯片的协同工作,提供了多元化的集成方案,既展现了DPU在构建综合性解决方案中的灵活性,也预示着未来将有更多跨领域的创新合作案例涌现,进一步拓宽DPU的应用边界。如中科驭数在与安全芯片厂商的合作中,共同打造了处理能力达到百Gbps级别的安全解决方案。

K2-Pro是稳如磐石的“管理”芯片

DPU在一般认知中常被视作辅助或“副手”角色,负责任务卸载,然而实际上,它在数据中心扮演着更为关键的主角身份。DPU不仅参与虚机的生命周期管理、资源调配等核心任务,还必须保证全天候稳定运行,是数据中心最中心的处理核心。

中科驭数对稳定性给予了高度重视,对K2-Pro进行了深度优化:纳秒至毫秒级的分级异常恢复机制确保快速响应;系统与核心间的异常隔离设计,即使内部模拟攻防,也能维持运行不中断。配备的实时状态监测系统,对芯片内每个数据包、每个子系统的状态进行不间断监测,及时发现并预警潜在问题,实现了芯片内每个环节的全天候精准监控。截至目前,这种级别的监测精细度和系统稳定性在同类DPU产品中尚属罕见。

K2-Pro是极致能效比的网络芯片

能耗考验也是DPU在设计时面临着的又一大难题。尽管DPU承担的任务远超传统网卡,但在服务器架构中,其安装位置和功耗预算仍旧受限,类似于网卡的配置要求。鉴于此,中科驭数团队深知,要想实现DPU的广泛应用,必须在能效比上取得突破。

中科驭数不仅采用了诸多成熟的低功耗技术,更从应用层面进行了深度优化,通过精细的电源管理策略,实现了在不影响性能的前提下,对芯片面积和运行频率的精准调控,这一过程虽充满挑战,近乎苛刻,却也体现了团队对技术极限的不懈追求。最终,DPU在多种应用场景下展现出了显著的能效优势,相比上一代功耗降低30%,与国际DPU产品相比也有更为出色的能效表现,为DPU的大规模部署奠定了坚实的能效基础。

中科驭数高级副总裁、CTO卢文岩博士表示,正是我们坚持自主研发,突破技术壁垒,我们才能开发出自主知识产权的KPU架构与KISA指令集,为DPU领域贡献了我们的创新成果;正是这份对六个关键领域“死磕到底”的决心,我们才能在造“芯”路上厚积薄发,见证这个数据中心“六边形战士”的诞生;也正是我们坚持技术与市场的紧密结合,将量产与应用视为同等重要,我们才能见证K2-Pro成为了一款真正可落地、可推广的高性能DPU芯片。相信K2-Pro的问世,将会是数据中心算力技术革新的重要里程碑。期待见到它走向各行各业,未来在数据中心乘风扬帆,在算力征途上破浪前行!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/35925.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第4章,在 PyCharm 中创建、打开、关闭项目的操作

在 PyCharm 中创建、打开、关闭项目的操作 在PyCharm中创建、打开和关闭项目的操作步骤。以下是每个操作的步骤说明,以及在PyCharm界面中可能对应的区域: 1、创建新项目 1)启动PyCharm: 打开PyCharm IDE。 2)创建新…

餐饮点餐的简单MySQL集合

ER图 模型图(没有进行排序,混乱) DDL和DML /* Navicat MySQL Data TransferSource Server : Mylink Source Server Version : 50726 Source Host : localhost:3306 Source Database : schooldbTarget Server Type …

es学习初步总结

看api看麻了不知道意义在哪里,所以就简单总结点我觉得有用的东西 基本数据结构解析 分为了文档,索引和映射 索引可以理解为一张表,映射描述了索引的数据结构,而文档就是一个个具体的行 所以一般我们需要在申明索引的时候同时申…

游戏录屏怎么录?学会这3个方法,轻松搞定

在数字时代,游戏录屏已成为游戏爱好者们热衷的一项活动。无论是为了记录自己的精彩操作,还是为了分享给朋友或粉丝,游戏录屏都为我们提供了一个全新的视角去欣赏和回味游戏带来的乐趣。 想要录制出精彩的游戏视频,一款好用的游戏…

error: RPC failed: HTTP 413 curl 22 The reguested URL returned error: 413

当你用sourcetree 提交代码 报错 RPC failed: HTTP 413 curl 22 The reguested URL returned error: 413 4731719459468_.pic.jpg 1、修改缓存区大小 git config --global http.postBuffer 524288000 2、如果是自己公司搭建的git ,让人看看服务端有没有限制 3、尝试…

Doris:倒排索引

目录 一、倒排索引介绍 二、倒排索引语法 2.1建表时创建倒排索引 2.2 已有表增加倒排索引 2.3 删除索引 三、使用倒排索引 3.1 创建带有倒排索引的表 3.2 插入数据 3.3利用倒排索引查询 3.4 自定义分词 一、倒排索引介绍 倒排索引,是信息检索领域常用的索…

Node.js实验指南:完善接口服务器

上一章接口服务器,我们实现了一个异常简单的接口服务器。可能很多人会感觉有点不真实的感觉,接口这么简单吗?没错,就这么简单。 我们在真实项目的前后端对接中,调用接口,拿到数据,就是如此而已…

文心一言 VS 讯飞星火 VS chatgpt (291)-- 算法导论21.3 4题

四、假设想要增加一个 PRINT-SET(x) 操作,它是对于给定的结点 x 打印出 x 所在集合的所有成员,顺序可以任意。如何对一棵不相交集合森林的每个结点仅增加一个属性,使得 PRINT-SET(x) 所花费的时间同 x 所在集合元素的个数呈线性关系&#xff…

金顺心贸易有限公司简介

金顺心贸易有限公司成立于2015年,注册地位于风景如画的广西壮族自治区防城港市东兴市。 金顺心贸易如他们的名字一样,有着实实在在的业绩和口碑的。他们专注于国际贸易,主营越南进口食品:果汁饮料、春卷皮、调味品、汤底、米粉、…

定制聚四氟乙烯架子离心管架子消解管样品架

南京瑞尼克定制离心管架子、消解管架子、微波罐架子等,各种实验室所需器皿样品架。 我司聚四氟乙烯架子优势: 1.耐强腐蚀(耐各种强酸强碱和有机溶剂) 2.耐高低温:-200至250℃ 3.工艺精制,尺寸&#xff0…

算法设计与分析--考试真题

分布式算法试题汇总选择题简答题算法题 2013级试题2019级试题2021年秋考卷 根据考试范围找相应题目做。 分布式算法试题汇总 选择题 下述说法错误的是___ A 异步系统中的消息延迟是不确定的 B 分布式算法的消息复杂性是指在所有合法的执行上发送消息总数的最大值 C 在一个异步…

如何实现高精度PCB切割?— 在线式激光切割机解决方案

在线式PCB精密激光切割机是一种专门用于电子行业中印刷电路板(PCB)切割的高精度设备。以下是关于在线式PCB精密激光切割机的详细信息和特点: 1. 工作原理: 在线式PCB精密激光切割机主要通过激光束的高能量密度对PCB板进行瞬时加热…

新手必备!短视频剪辑常用的18个技巧——剪映篇

导入素材:这里我们可以选择自己拍摄好的素材(图片、视频或录制好的音频),按照顺序导入剪辑区剪辑。这一步是剪辑的基础,确定剪辑的大体思路与成片框架!别忽略了,剪映官方素材库提供的素材&#…

私域流量的深度解析与电商应用

一、私域流量的核心价值 在当今数字化时代,流量成为了企业发展的重要资源。与公域流量相比,私域流量以其独有的私有性和可复用性,为企业提供了与用户建立深度联系的机会。私域流量不仅有助于企业精准触达目标用户,还能通过数据分…

python办公自动化之excel

用到的库:openpyxl 实现效果:读取单元格的值,写入单元格 代码: import openpyxl # 打开现有工作簿 workbookopenpyxl.load_workbook(现有工作簿.xlsx) # 选择一个工作表 sheetworkbook[交易表] # 读取单元格的值 cell_valueshe…

甄选版“论软件系统架构评估”,软考高级,系统架构设计师

论文真题 对于软件系统,尤其是大规模的复杂软件系统来说,软件的系统架构对于确保最终系统的质量具有十分重要的意义,不恰当的系统架构将给项目开发带来高昂的代价和难以避免的灾难。对一个系统架构进行评估,是为了:分析现有架构存在的潜在风险,检验设计中提出的质量需求,…

一名HR,在招聘嵌入式开发岗位,为什么感觉一年比一年难?

在开始前刚好我有一些资料,是我根据网友给的问题精心整理了一份「嵌入式的资料从专业入门到高级教程」, 点个关注在评论区回复“888”之后私信回复“888”,全部无偿共享给大家!!! 1.嵌入式学用不一致, 高…

Dubbo快速入门

1. Dubbo概述 官网地址:https://cn.dubbo.apache.org/zh-cn/ Apache Dubbo 是一款高性能的轻量级的Java RPC框架,可以和Spring框架无缝集成。 本地调用:本机调用,指同个JVM内部的方法调用,例如三层架构之间的方法调用…

白话EAGLE2:解锁大模型的“打草稿”技术

实时了解业内动态,论文是最好的桥梁,专栏精选论文重点解读热点论文,围绕着行业实践和工程量产。若在某个环节出现卡点,可以回到大模型必备腔调或者LLM背后的基础模型重新阅读。而最新科技(Mamba,xLSTM,KAN)…

通义灵码上线 Visual Studio 插件市场啦!

通义灵码,是阿里云出品的一款基于通义大模型的智能编码辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力,提供代码智能生成、研发智能问答能力。 通义灵…