近日,趋动科技与 XSKY星辰天合联合宣布,结合双方优势能力和产品,携手推出高性能数据湖一站式方案及全协议存算一体化方案,帮助客户简化 AI 工作的 IT 基础设施部署,实现 AI 相关工作更加灵活和便捷。
全协议存算一体化解决方案
使 AI 工作更灵活、便捷
怎么才能实现 AI 工作的降本增效?对于大多数客户而言,在教学实训和科研场景中对 GPU 算力的使用存在明显的潮汐效应,然而由于独占的使用模式,客户需要不断投入资金采购 GPU 来满足教学、科研波峰时的资源需求。这一方面会导致 GPU 利用率低、存储浪费现象;另一方面会导致算力资源资源分配困难,管理难度高。在此背景下,趋动科技与星辰天合联合推出全协议存算一体化解决方案,通过构建算力资源池和存储资源池,帮助用户共享数据中心内所有服务器上的 GPU 算力以及存力。用户无需关心底层复杂多样的硬件架构,可以专注于更有价值的业务层面,让用户做科研、实训、教学、训练等 AI 工作变得更加灵活和便捷。联合解决方案架构图如下所示:
联合解决方案能够实现如下价值:
- GPU 算力池化,支持更多学生同时进行 AI 实训课程,降本增效明显;
- 轻松实现 GPU 跨机聚合,调度更多算力,支持科研加速,满足大规模科研场景;
- 统一门户管理,支持多租户、二级权限分配,全方位管理各种资源,同时满足教学、教研场景;
- 软件定义的分布式计算与存储资源按需弹性扩展,容量及性能线性提升;
- 智能缓存机制及热点目录预读,提升训练准备阶段效率;
- 文件、对象、大数据等多协议的融合互通,实现数据零拷贝。
高性能数据湖一站式解决方案
为自动驾驶 AI 深度学习场景量身定制
在自动驾驶整个业务中,AI 深度学习作为基石环节,承担关键的数据加工和转化工作,其中涉及到数据导入、预处理、筛选、标注、清洗、模型开发、训练、调优等。这些步骤中,会涉及到海量数据的存储,数据在不同存储系统间的高速流转,第三方标注平台间的数据交互控制,以及大量算力集群的管理与调度,存在着海量数据存储性价比平衡不易和 GPU 算力利用率低等多项挑战。因此,趋动科技和星辰天合结合自身优势,针对自动驾驶 AI 深度学习场景,量身定制了高性能数据湖一站式解决方案。该方案满足数据跨平台流动,应用无缝调用的需求,符合汽车和自动驾驶行业客户对一站式 AI 平台解决方案的诉求。趋动科技 GEMINI AI 训练平台为客户打造了一站式 AI 开发、训练、运维的解决方案,提供 CPU、物理 GPU、OrionX vGPU、存储等多种资源的界面化统一申请、调度、监控和运维,同时实现 AI 开发和训练任务级别的界面化管理,提升车企或自动驾驶企业算法研发效率,兼顾算法工程师和运维工程师等不同人员对 AI 平台的多样化需求。XSKY 星辰天合存储平台具备灵活的扩容能力、List 性能深度优化算法、开放的内容处理框架、XSpeed 访问加速等特性,可以帮助用户大幅提升数据处理效率。联合解决方案架构图如下所示:
联合解决方案能够实现如下价值:
- 实现 AI 开发、训练、运维的一体化管理解决方案,能够帮助客户完成 CPU、物理 GPU、OrionX vGPU 和存储资源的统一纳管;
- 提供完善的平台账户管理、权限管理、配额管理能力,方便运维工程师实现高效清晰运维管理工作;
- 支持 GPU 虚拟化,使用策略上更加灵活,能够在有限 GPU 资源情况下支持更多算法工程师同时使用;
- 平台实现 AI 任务所需数据、镜像、代码集中管理,方便数据复用和分享,同时兼顾企业信息安全保护和个人隐私保障;
- 支持 AI 分布式训练,能够让 AI 训练任务不受单节点 GPU 资源的限制,为 AI 训练加速;
- 海量数据统一管理,冷热数据分层,降低整体成本;软件定义,弹性扩展,EB 级容量、千亿级文件轻松管理;
- 高性能客户端 & 计算端读缓存,提升数据访问效率;持久化容器 CSI Driver,为 AI 提供稳定训练环境;热点目录预读,提升训练准备阶段效率。
作为软件定义 AI 算力技术的领导厂商,趋动科技专注于为全球用户提供国际领先的数据中心级 AI 算力虚拟化和资源池化软件及解决方案;作为国内技术领先的数据基础设施提供商,星辰天合专注于软件定义存储领域,致力于为政企客户提供以数据价值为核心的产品与服务。双方将继续携手推动 AI 领域的基础设施能力创新,帮助更多 AI 客户从容应对算力、存力等各种挑战。