AI引爆算力需求,思腾推出支持大规模深度学习训练的高性能AI服务器

近日人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4,可10秒钟做出一个网站,60秒做出一个游戏,参加了多种基准考试测试,它的得分高于88%的应试者;随后百度CEO李彦宏宣布正式推出大语言模型“文心一言”,作为百度全新一代知识增强大语言模型,其能够与人对话互动、回答问题、协助创作、高效便捷地帮助人们获取信息、知识和灵感。

随着这些应用AIGC应用的发布,人工智能变成了街头巷尾人们热议的话题,英伟达CEO黄仁勋在2023年GTC开发者大会上发表了主题演讲时表示:“我们正处于AI的iPhone时刻。”可见AIGC技术对社会的变革性影响,同时也引爆了AI行业对训练和推理的大模型需求。

图片

图片

思腾合力是一家人工智能基础架构解决方案供应商,公司成立于 2009年,在成立之初就一直致力于AI 行业,是英伟达的精英级合作伙伴,拥有自主品牌AI服务器及通用服务器,适用于深度学习训练及推理等场景,尤其是思腾合力自有产品IW4221-8GRs,一款专为AI大模型计算打造的新型GPU集群,接下来给大家介绍一下这款服务器的那些让人不可抗拒的优点:

第一 天花板级的算力配置

英伟达是行业翘楚,而A800又是英伟达的明星产品,其算力更是行业望其项背的存在,思腾合力IW4221-8GRs这款产品,单台服务就搭载了8个拥有第三代NVIDIA Tensor Core的A800 GPU单机可提供 5PFLOPS 的 AI 计算性能,比传统的双路 CPU 服务器提高 300 倍。

任意两个 GPU 之间可以直接进行数据 P2P 交互,GPU 间 P2P 通信速率为 400GB/s;具备更高的带宽和更低的延迟,可以依据不同需求完成GPU-GPU节点内部的高速互联,同时还能在GPU-CPU甚至CPU-CPU之间形成高速互联,特别是GPU与CPU之间的直接互连,提高了系统整体的性能和可扩展性。

搭载2颗Intel 高性能CPU原本,在CPU与GPU的极致配合下原本要花费10小时的双精度模拟过程缩短到4小时之内,多任务处理不卡顿,高效完成训练/推理任务,支持大规模的深度学习模型、高性能计算任务和机器学习工作负载。

第二 算力资源高效利用合理分配

运用英伟达的MIG技术可扩展 GPU 的应用范围,单张A800卡最多可被划分为7个实例,每个实例均完全独立于各自的高带宽显存、缓存和计算核心;且能为每项工作负载提供适当规模的 GPU 实例,最终优化利用率并使数据中心投资充分发挥成效。

凭借 MIG能确定性延迟和吞吐量,在单个 GPU 上同时运行推理、训练和高性能计算 (HPC) 工作负载;每个 MIG 实例借助专用于计算、内存和缓存的硬件资源,从而能够提供稳定可靠的服务质量 (QoS) 和有效的故障隔离。

图片

第三 极致的扩展性

单台服务器集成8通道内存控制器,32个内存插槽,速率最高支持3200,内存容量可扩展至4TB,最大支持 8 个热插拔 NVMe SSD 和 2 个 SATA 总线 M.2 SSD,10个PCIe 4.0 x16插槽,2个PCIe 4.0 x16插槽(PCIe 4.0 x8速率),1个OCP3.0插槽,最大支持 10 个 100G/200G 可远程直接内存访问(RDMA)高速网卡;用户可根据实际需求进行扩展,极大的提高的机器适用性。

第四 超强兼容性

X86 CPU 市场占有率超过90%,NVIDIA目前占据整个独立显卡市场的多达88%,上层软硬件应用基本与他们兼容为基础而进行开发,所以国内外主流软硬件及AI框架、工具、应用程序等都兼容。

第五 全方位的安全呵护

整机 6U 标准尺寸,3+3 冗余供电设计,使其适用于 更广泛的数据中心部署环境,为客户提供极高的可靠性和稳定性;支持可信平台模块(TPM 2.0)和可信密码模块(TCM),可提供高级加密功能。

支持Intel可信执行技术(Trusted Execution Technology),可基于硬件抵御恶意软 件攻击;支持 Intel SGX 技术(Software Guard Extensions),允许应用运行在自己的独立空间中,避免关键代码和数据被恶意窃取或修改;支持基于数字签名的固件更新机制,防止非授权固件的更新; 支持 UEFI 安全引导,保护系统免受恶意启动加载程序的侵害;支持 BIOS 分级密码保护,保证系统启动及管理安全;支持BIOS Secure Flash及Lock Enable(BLE)功能,消减恶意软件对 BIOS Flash 区域的攻击;支持 BMC、BIOS 双镜像机制,在检测到固件被破坏后进行恢复;支持 BMC 安全启动,防止 BMC 被恶意篡改; 支持灵活的 BMC 访问控制策略,提高 BMC 管理安全性。

第六 简约不简单的运维管理

技术人员可以通过 BMC Web 管理界面、故障诊断 LED 等指引设备进行整机管理,并 可通过前面板上的 UID 指示灯标记有故障的机器,快速找到已经发生故障(或者即将 发生故障)的组件,从而简化维护工作、加快解决问题的速度,并且提高系统可用性;通过 BMC 监控系统参数,提前发出告警信息,使技术人员能够采取相应措施,保证机器稳定运行; 配备 ISPIM 智能管理软件,实现服务器的集中管理,支持设备部件级资产管理、智能监控告警、自动巡检、故障诊断与报修、能耗管理、固件升级/配置等功能,实现服务器全生命周期管理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/647921.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用powerbuilder编写一个全局替换字符的函数

在PowerBuilder中,你可以编写一个全局替换字符的函数。以下是一个简单的例子,该函数名为GlobalReplace,它接受三个字符串参数:原始字符串、要替换的子字符串和替换后的子字符串。该函数返回替换完成后的新字符串。 powerscript /…

C语言中的强制类型转换:改变数据类型的处理方式

概念: 在C语言中,强制类型转换是指将一个数据类型的值转换为另一个数据类型的过程。强制类型转换可以改变数据的处理方式,让程序员可以在某些情况下处理不同数据类型的数据。 示例: 假设我们有两个变量,一个是整型变…

勒索袭击新方式,提防注册机中注入的勒索病毒!

1 事件概述 近期,用户反馈称自己在使用某款“注册机”软件时候,系统中文件被不行加密。通过对受害用户提供的线索和样本进 行综合分析研判,发现了一款借助破解类工具进行传播的新型勒索软件,其会通过向桌面释放勒索信与收款码图片…

STL-实操

3.10.1 案例描述 公司今天招聘了10个员工(ABCDEFGHIJ),10名员工进入公司之后,需要指派员工在那个部门工作 员工信息有: 姓名 工资组成;部门分为:策划、美术、研发 随机给10名员工分配部门和工资 通过multim…

mysql 基础(三)

一、多表设计 数据库设计范式 第一范式(确保每列保持原子性) 第一范式是最基本的范式。如果数据库表中的所有字段值都是不可分解的原子值,就说明该数据库表满足了第一范式。第二范式就是要有主键,要求其他字段都依赖于主键。 没有主键就没有唯一性&…

用ChatGPT写申请文书写进常春藤联盟?

一年前,ChatGPT 的发布引发了教育工作者的恐慌。现在,各大学正值大学申请季,担心学生会利用人工智能工具伪造入学论文。但是,聊天机器人创作的论文足以骗过大学招生顾问吗? ChatGPT简介 ChatGPT,全称聊天生…

如何修改指针变量的值“指针的引用*“

如何修改指针变量的值"指针的引用*&" 案例: void createObj(QFrame *f){f new QFrame(this); } QFrame *frame; createObj(frame);上面这个案例frame并不会被new,会导致frame野指针。 void createObj(QFrame *&f){f new QFrame(t…

【格密码基础】基于LWE问题的密码系统

目录 一. 介绍 二. LWE密码方案简单介绍 三. LWE经典归约 四. LWE性质 五. LWE的鲁棒性 一. 介绍 在2005年,Regev基于LWE问题提出了一个新的公钥密码方案。该方案可实现语义安全(semantic security),其中误差率(…

【云原生】Docker的镜像创建

目录 1.基于现有镜像创建 (1)首先启动一个镜像,在容器里做修改 ​编辑(2)然后将修改后的容器提交为新的镜像,需要使用该容器的 ID 号创建新镜像 实验 2.基于本地模板创建 3&am…

单链表的删除

设存储元素ai的结点为q,要实现将结点q删除单链表的操作,其实就是将它的前继结点的指针绕过,指向它的后继结点即可。 我们所要做的,实际上就是一步,p->nextp->next->next,用q来取代p->next&…

蓝凌OA sysUiExtend.do 任意文件上传漏洞复现

0x01 产品简介 蓝凌核心产品EKP平台定位为新一代数字化生态OA平台,数字化向纵深发展,正加速构建产业互联网,对企业协作能力提出更高要求,蓝凌新一代生态型OA平台能够支撑办公数字化、管理智能化、应用平台化、组织生态化,赋能大中型组织更高效的内外协作与管理,支撑商业…

shallowRef与shallowReactive

shallowRef&#xff1a;浅层响应->整体重新赋新值才会触发更新&#xff0c;只改变单个属性不会触发更新 shallowReactive&#xff1a;浅层响应->第一层属性变化会触发更新&#xff0c;不是第一层属性不会触发更新 <template><div><h2>{{ person }}&l…

[docker] Docker的数据卷、数据卷容器,容器互联

一、数据卷&#xff08;容器与宿主机之间数据共享&#xff09; 数据卷是一个供容器使用的特殊目录&#xff0c;位于容器中。可将宿主机的目录挂载到数据卷上&#xff0c;对数据卷的修改操作立刻可见&#xff0c;并且更新数据不会影响镜像&#xff0c;从而实现数据在宿主机与容…

81.网游逆向分析与插件开发-背包的获取-装备栏数据结构的逆向分析

内容参考于&#xff1a;易道云信息技术研究院VIP课 上一个内容&#xff1a;自动化助手显示物品数据-CSDN博客 然后游戏中有弓箭&#xff0c;弓箭有数量&#xff0c;可以作为突破口&#xff0c;也可以使用物品id 获取弓的方式 获取弓箭的方式 然后搜索250 然后搜索出一个 然后…

Spring和 Springboot的区别你了解吗

什么是Spring The Spring Framework provides a comprehensive programming and configuration model for modern Java-based enterprise applications - on any kind of deployment platform. 简单来说Spring framework为基于Java的企业应用程序提供了全面的编程和配置模型&am…

Linux零碎点

目录 Linux基础命令 1、who&#xff1a; 2、hostname&#xff1a; 3、ifconfig&#xff1a; 4、pwd&#xff1a; 5、cd&#xff1a; 6、exit&#xff1a; 7、shutdown&#xff1a; 8、ls&#xff1a; 9、创建文件夹&#xff1a; 10、touch&#xff1a; 11、cp&#…

在百度云免费配置SSL证书 http改https操作

以下以在百度智能云上的操作为例&#xff0c;并不是给他打广告 1.购买域名 2.到域名管理处&#xff0c;解析网址&#xff0c;添加,*,www,指向服务器IP&#xff0c; 此时就可以访问网址&#xff1a;http://www.域名.cn 3.但是浏览器会报不安全&#xff0c;所以需要配置SSL证书…

【手写数据库toadb】10 开发数据库内核开发阶段-数据库模型

数据库内核模型介绍 ​专栏内容: 手写数据库toadb 本专栏主要介绍如何从零开发,开发的步骤,以及开发过程中的涉及的原理,遇到的问题等,让大家能跟上并且可以一起开发,让每个需要的人成为参与者。 本专栏会定期更新,对应的代码也会定期更新,每个阶段的代码会打上tag,方…

acrobat调整pdf的页码和实际页码保持一致

Acrobat版本 具体操作 现在拿到pdf的结构如下&#xff1a; pdf页码实际页码1-10页无页码数11页第1页 操作&#xff0c;选择pdf第10页&#xff0c;右键点击 具体设置 最终效果

web前端之ES6的实用深度解构赋值方法、复杂的解构赋值

MENU 前言解构对象解构数组解构混用 前言 ES6中允许按照一定模式&#xff0c;从数组和对象中提取值&#xff0c;对变量进行赋值&#xff0c;这被称为解构(Destructuring)。 使用解构赋值可以将复杂的代码整理的更加干净整洁。 解构对象 在没有使用解构之前&#xff0c;想要确定…