Meta旨在打造世界上最快的人工智能超级计算机

e02460ca89ebe729e6c5e9910e51cacc.png

来源:ScienceAI

编辑:萝卜皮

Facebook 的母公司 Meta 表示,它已经建造了一台世界上最快的研究超级计算机。Meta 研究人员 Kevin Lee 和 Shubho Sengupta 在今天的博客文章中写道,到今年年中,系统的扩展完成后,速度将是最快的。他们写道,人工智能研究超级集群(RSC)有一天将与具有数万亿参数的神经网络一起工作。神经网络模型中的参数数量一直在迅速增长。例如,自然语言处理器 GPT-3 有 1750 亿个参数,这样复杂的 AI 预计只会增长。

RSC 旨在解决这种增长的关键限制,即训练神经网络所需的时间。通常,训练涉及针对大型数据集测试神经网络,测量它与准确完成工作的距离,使用该错误信号来调整网络的参数,并重复循环直到神经网络达到所需的准确度水平。大型网络可能需要数周的计算时间,这限制了在给定年份可以试用的新网络数量。一些资金雄厚的初创公司,如 Cerebras 和 SambaNova,部分是为了解决培训时间问题。

研究人员写道,除其他外,Meta 希望 RSC 能够帮助它建立新的神经网络,可以对一大群人进行实时语音翻译,每个人都说不同的语言。「最终,RSC 所做的工作将为构建下一个主要计算平台的技术铺平道路——Meta,人工智能驱动的应用程序和产品将在其中发挥重要作用。」

「我们为元宇宙构建的体验需要巨大的计算能力(每秒千亿次操作!),RSC 将启用新的人工智能模型,可以从数万亿个示例中学习,理解数百种语言等等。」Meta 首席执行官 Mark Zuckerberg 在一份声明中说。

  • 旧系统:22,000 个 Nvidia V100 GPU

  • 今天:6,080 个 Nvidia A100 GPU

  • 2022 年年中:16,000 个 Nvidia A100 GPU

与 Meta 目前使用的 AI 研究集群(设计于 2017 年)相比,RSC 是所涉及的 GPU 数量、它们的通信方式以及附加到它们的存储的变化。

「2020 年初,我们决定加速进展的最佳方式是从头开始设计新的计算基础架构,以利用新的 GPU 和网络结构技术。我们希望这个基础设施能够在 1 艾字节大的数据集上训练具有超过一万亿个参数的模型——从规模上看,这相当于 36,000 年的高质量视频。」

旧系统连接了 22,000 个 Nvidia V100 Tensor Core GPU。新的内核切换到 Nvidia 的最新内核 A100,该内核在最近的 AI 系统基准测试中占据主导地位。目前新系统是由 760 台 Nvidia DGX A100 计算机组成的集群,共有 6,080 个 GPU。计算机集群使用 Nvidia 200-gigabit-per-second Infiniband 网络绑定在一起。该存储包括 46 PB(4600 亿字节)的缓存存储和 175 PB 的大容量闪存存储。

  • 加速:

  • 计算机视觉:20 倍

  • 大规模自然语言处理:3x

与旧的基于 V100 的系统相比,RSC 在计算机视觉任务上的速度提高了 20 倍,在处理大型自然语言处理方面提高了 3 倍。

当该系统在今年年中完成时,它将连接 16,000 个 GPU,Lee 和 Sengupta 写道,这使其成为同类中最大的之一。届时,其缓存和存储容量将达到 1 艾字节(10 亿字节),能够为系统提供每秒 16 TB 的数据。新系统还将专注于可靠性。这很重要,因为非常大的网络可能需要数周的训练时间,而且您不希望在任务中途失败,这意味着必须重新开始。

aabf6d142010a2d7abddc57a03a861e9.png

作为参考,在最新一轮 MLPerf 神经网络训练基准测试中测试的最大的生产就绪系统是 Nvidia 部署的 4,320-GPU 系统。该系统可以在不到一分钟的时间内训练自然语言处理器 BERT。然而,与 Meta 想要使用的数万亿个参数相比,BERT 只有 1.1 亿个参数。

RSC 的推出还伴随着 Meta 使用数据进行研究的方式发生了变化:「与我们之前仅利用开源和其他公开可用数据集的 AI 研究基础设施不同,RSC 还通过允许我们在模型训练中包含来自 Meta 生产系统的真实示例,帮助我们确保我们的研究有效地转化为实践。」

研究人员写道,RSC 将采取额外的预防措施来加密和匿名这些数据,以防止泄漏。这些步骤包括 RSC 与更大的互联网隔离——既没有入站连接也没有出站连接。RSC 的流量只能从 Meta 的生产数据中心流入。此外,存储和 GPU 之间的数据路径是端到端加密的,数据是匿名的,并经过审查过程以确认匿名化。

相关报道:https://spectrum.ieee.org/meta-ai-supercomputer

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

154d16c0a3b48bfd9c2e6d1fa64bc2dd.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482622.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

day07-vue项目-搭建项目到登录功能

文章目录1.电商业务概述2.项目初始化3.码云相关操作B.安装gitD.在本地创建公钥:在终端运行:ssh-keygen -t rsa -C "xxxxxx.com"4.配置后台项目A.安装phpStudy并导入mysql数据库数据B.安装nodeJS,配置后台项目,从终端打开后台项目vu…

SSE,MSE,RMSE,R-square指标讲解

SSE(和方差、误差平方和):The sum of squares due to errorMSE(均方差、方差):Mean squared errorRMSE(均方根、标准差):Root mean squared errorR-square(确定系数):Coefficient of determinationAdjusted R-square:D…

互联互通下的超级App价值重构

来源:虎嗅APP题图:视觉中国站在岁末回看,这过去的一年,发生了无数影响深远的事件:反垄断政策落地、用户存量争夺愈演愈烈、商业创新乏力……互联网人突然发现,以往基于流量的增长打法逐渐失灵。与此同时&am…

WCF进阶:将编码后的字节流压缩传输

在前面两篇文章WCF进阶:将消息正文Base64编码和WCF进阶:为每个操作附加身份信息中讲述了如何通过拦截消息的方式来记录或者修改消息,这种方式在特定条件下可以改变消息编码格式,但实现方式并不规范,而且使用范围也有限制。 WCF缺省…

物理学四大神兽,除了“薛定谔的猫”, 你还知道哪几个?

来源 : 逗逼的500T硬盘物理学是一门研究物质运动最一般规律和物质基本结构的学科。分为纯物理学和多学科物理学,其中的纯物理学又分为:1.经典力学;2.热力学和统计力学;3.电磁学;4.相对论;5.量子…

JDBC-01-快速入门

文章目录01 JDBC快速入门02 JDBC各个类详解03 JDBC之CRUD练习04 ResultSet类详解05 JDBC登录案例练习抽取JDBC工具类 : JDBCUtils练习06 PreparedStatement类详解07 JDBC事务管理目标 1. JDBC基本概念 2. 快速入门 3. 对JDBC中各个接口和类详解 01 JDBC快速入门 1…

研究速递:预测学习——神经元高效运作的最佳策略

来源:集智俱乐部作者:袁郭玲、梁金编辑:邓一雪摘要了解大脑如何学习有助于制造具有与人类类似智力水平的机器。之前有理论提出,大脑可能是根据预测编码的原理运行。然而,对于预测系统如何在大脑中实现还没有很好的解释…

破解人工智能系统的四种攻击方法!

来源:未来科技前沿没有人喜欢早上起床,但现在人工智能驱动的算法可以设置我们的闹钟、管理我们家中的温度设置以及选择适合我们心情的播放列表,贪睡按钮的使用越来越少。人工智能安全辅助系统使我们的车辆更安全,人工智能算法优化…

PowerDesigner-快速入门(极简教程)

文章目录3. PowerDesigner3.1 PowerDesigner介绍3.2 PowerDesigner使用3.2.1 创建物理数据模型3.2.2 从PDM导出SQL脚本3.2.3 逆向工程3.2.4 生成数据库报表文件3. PowerDesigner 3.1 PowerDesigner介绍 PowerDesigner是Sybase公司的一款软件,使用它可以方便地对系…

关于dev无法更新、调试的问题

转载于:https://www.cnblogs.com/IcefishBingqing/p/5109876.html

MIT发布白皮书:美国欲重返世界半导体霸主!

来源:新智元编辑:时光 David近年来,全球芯片的持续性短缺已引发了一连串的产能瓶颈问题。各种消费品的价格都随着「缺芯」而上升,从CPU到显卡,从智能冰箱到SUV,这凸显出半导体在日常生活种所扮演的重要作用…

dubbo-快速入门-分布式RPC框架Apache Dubbo

文章目录分布式RPC框架Apache Dubbo1. 软件架构的演进过程1.1 单体架构1.2 垂直架构1.3 SOA架构1.4 微服务架构2. Apache Dubbo概述2.1 Dubbo简介2.2 Dubbo架构3. 服务注册中心Zookeeper3.1 Zookeeper介绍3.2 安装Zookeeper3.3 启动、停止Zookeeper4. Dubbo快速入门4.1 服务提供…

可构建AI的“AI”诞生:几分之一秒内,就能预测新网络的参数

来源:学术头条 作者:Anil Ananthaswamy译者:刘媛媛原文出处:quantamagazine.org人工智能在很大程度上是一场数字游戏。当深度神经网络在 10 年前开始超越传统算法,是因为我们终于有了足够的数据和处理能力来充分利用它…

linux-01-概述

文章目录入门概述走近Linux系统入门概述 我们为什么要学习Linux linux诞生了这么多年,以前还喊着如何能取代windows系统,现在这个口号已经小多了,任何事物发展都有其局限性都有其天花板。就如同在国内再搞一个社交软件取代腾讯一样&#xff0…

MySQL-Front的安装简介

本博文在作者的个人网站、博客园和CSDN同步发表,如要转载,请标明原作者和出处。 最近在学习MySQL数据库,开始的时候使用的Windows的命令行进行最基本的代码的输入,可是后来就觉得比较麻烦了,于是想找一款图形化数…

生命是什么?生物化学、物理学、哲学对生命本源的共同探索

来源: 集智俱乐部作者:Mark A. Bedua译者:宋词、范星辰 审校:周理乾、梁金编辑:邓一雪导语地球上充盈着生命,通常我们很容易分辨哪些是生命,哪些不是生命。可是,关于生命是什么&…

linux-02-常用的命令-必须掌握

文章目录目录管理基本属性文件内容查看目录管理 绝对路径和相对路径 我们知道Linux的目录结构为树状结构,最顶级的目录为根目录 /。 其他目录通过挂载可以将它们添加到树中,通过解除挂载可以移除它们。 在开始本教程前我们需要先知道什么是绝对路径与相…

上交大许志钦:神经网络中的奥卡姆剃刀——简单有效原理

来源: 智源社区作者:许志钦整理:熊宇轩编辑:李梦佳本文整理自青源Talk第十期,视频回看地址:https://event.baai.ac.cn/activities/217【专栏:研究思路】奥卡姆剃刀是由14世纪方济会修士奥卡姆的…

linux-03-Vim使用+账号用户管理

什么是Vim编辑器 Vim是从 vi 发展出来的一个文本编辑器。代码补完、编译及错误跳转等方便编程的功能特别丰富,在程序员中被广泛使用。 简单的来说, vi 是老式的字处理器,不过功能已经很齐全了,但是还是有可以进步的地方。 vim 则…

孙正义:未来30年投资趋势【附PPT】

来源:投资家、蓝血研究(lanxueyanjiu)作者:孙正义对于今后30年来讲,我认为现在是个很关键的时刻,尤其是在各位的人生当中。而且现在是一整个概念的转变,我们要包容这个概念的转变。我想先给大家看两张照片。…