全球最快AI超级计算机开动,每秒4百亿亿浮点运算!正拼接最大宇宙3D地图

来源:venturebeat

宇宙是在不断膨胀的吗?是的!而令宇宙不断膨胀的「罪魁祸首」就是暗能量。

作为是宇宙中最神秘的物质,它看不见摸不着,为了捕捉它,人类在地球上建立了许多相关实验,但都成效甚微。

但如今,一台拥有强大AI性能的超级计算机,或许能够助我们一臂之力。

近日,英伟达和美国国家能源研究科学计算中心(NERSC)打开了一个「开关」—— Perlmutte,该计算机被称为世界上用于人工智能工作负载的最快的超级计算机。

这台新的超级计算机以天体物理学家索尔-珀尔马特(Saul Perlmutter)的名字命名,拥有6144个英伟达A100 Tensor Core GPU,将负责拼接有史以来最大的可见宇宙3D地图

不仅如此,Perlmutter 还将对「宇宙摄像机」暗能量光谱仪(DESI)的数据进行处理,这是一种可以在一次曝光中捕获多达 5,000 个星系的宇宙相机。

处理DESI巨量数据,绘制最大的可见宇宙3D地图

那么,宇宙的3D地图该如何拼凑呢?

在不久前的5 月 17 日,DESI先行启动,开始了为期五年的捕捉数据之旅。在此前的四个月试运行期间,DESI已经捕获了 400 万个星系的光谱,这超过了以往所有光谱调查的总和。

而Perlmutter要做的,就是对DESI的数据进行汇总处理。

根据官网的介绍, Perlmutter 的 GPU 在一个晚上捕获数十次曝光。在之前的系统上,准备一年的数据以供发布可能需要数周或数月的时间,但 Perlmutter 将能够在短短几天内完成任务。

「我对我们在准备工作中在 GPU 上获得的 20 倍加速感到非常满意。」NERSC 的数据架构师 Rollin Thomas 说,他正在帮助研究人员为Perlmutter准备代码。

Rollin Thomas难掩对Perlmutter性能的自信,因为Perlmutter是世界上最大的 A100 驱动系统,有超过 20 个应用程序正准备成为首批搭载 6,159 个NVIDIA A100 Tensor Core GPU 的应用程序,在NERSC正式投入使用后,Perlmutter将为 7,000 多名研究人员提供近 4 exaflops 的 AI 性能。

暗能量主要是通过 2011 年诺贝尔奖获得者 Saul Perlmutter 的工作发现的。

在物理宇宙学中,暗能量是一种充溢空间的、增加宇宙膨胀速度的难以察觉的能量形式。暗能量假说是当今对宇宙加速膨胀的观测结果的解释中最为流行的一种。在宇宙标准模型中,暗能量占据宇宙68.3%的质能

作为某种作用于时空结构本身的能量,暗能量是种均匀的负压力,会导致时空结构膨胀。1998年,高红移超新星搜索队观测组发表了Ia型超新星的观测数据,显示宇宙在加速膨胀。随之,1999年,超新星宇宙学计划证实了该结果。该项工作于2011年获得诺贝尔物理学奖。

但遗憾的是,目前我们对它的研究仍然不够确切,DESI 的地图为我们带来了揭示暗能量奥秘的的新希望。

超级计算机融合 AI、HPC

毫无疑问,Perlmutter的作用将是无限的,除了拼凑宇宙的 3D 地图,还能帮助探索绿色能源的亚原子相互作用等等。

NERSC的应用性能专家Brandon Cook说:「过去不可能对像电池界面这样的大系统进行完全的原子模拟,但现在科学家们计划用Perlmutter来做这件事。」

我们知道,传统的超级计算机几乎无法处理几纳秒内生成几个原子模拟所需的数学运算,无法使用 Quantum Espresso 等程序。但通过将其高度精确的模拟与机器学习相结合,科学家可以在更长的时间内研究更多的原子。

这也是英伟达 A100 中 Tensor Core 发挥其独特作用的地方。它们加速了用于模拟的双精度浮点数学运算和深度学习所需的混合精度计算。

Perlmutter 基于包括 Slingshot 互连的 HPE Cray Shasta 平台,这是一个具有 GPU 加速节点和仅 CPU 节点的异构系统。该系统分两个阶段进行安装——最近揭幕的是第一阶段,其中包括系统的 GPU 加速节点和暂存文件系统;第 2 阶段将在 2021 年晚些时候添加仅使用 CPU 的节点。

英伟达高级产品营销经理 Dion Harris 在今天发布的博客中表示:「这使 Perlmutter 成为地球上在 16 位和 32 位混合精度数学 AI 使用中速度最快的系统。而且是目前为止,今年晚些时候在劳伦斯伯克利国家实验室的系统的第二阶段或许更强。」

Perlmutter 的 A100 GPU 采用 Nvidia Tensor Core 技术和直接液体冷却。另外,它也是 NERSC 的第一台具有全闪存暂存文件系统的超级计算机。据 NERSC 称,35 PB 的 Lustre 文件系统将以超过 5 TB/秒的速度移动数据,使其成为同类中最快的存储系统。

Perlmutter 安装的第一阶段由 12 个 GPU 加速机柜组成,可容纳 1,500 多个节点。今年晚些时候的第二阶段将增加 12 个 CPU 机柜,超过 3,000 个节点。Phase 1 的每个 GPU 加速节点都有四个基于 NVIDIA Ampere GPU 架构的 A100 Tensor Core GPU 以及 256GB 的内存。每个 Phase 1 节点还有一个 AMD「Milan」 CPU。第一阶段系统还包括非计算节点 (NCN)、20 个用户访问节点(NCN-UAN – 登录节点)和服务节点。据 NERSC 称,一些 NCN-UAN 可用于部署容器化用户环境,使用 Kubernetes 进行编排。

第一阶段机柜没有连接门,直接液体冷却系统的蓝色和红色线条

Phase 2 的每个 CPU 节点都将有两个 AMD Milan CPU,每个节点具有 512GB 的内存。Phase 2 系统还增加了 20 个登录节点和 4 个大内存节点。

支持多种编程环境,用计算极限探索宇宙极限

除了 CCE、GNU 和 LLVM 编译器外,Perlmutter 编程环境还将采用 NVDIA HPC SDK(软件开发套件),以支持多种并行编程模型,例如 MPI、OpenMP、CUDA 和用于 C、C++ 和 Fortran 代码的 OpenACC。

虽然人类用肉身探索宇宙的能力有限,但计算机没有这个障碍。

例如去年10月份,来自夏威夷大学马诺阿分校天文研究所的一组天文学家就在AI神经网络的帮助下,创造了迄今为止最全面的「天文学成像目录」,包括恒星、星系和类星体等。

该系统还测定了与星系的距离,最多只有3% 的误差。根据夏威夷大学的说法,最终的成果是「世界上最大的恒星、星系和类星体三维成像目录」

甚至,有来自微软的物理学家用80页论文证明「模拟矩阵」:宇宙是个自学成才的计算机。

进化定律的自学成才系统(a self-learning system of evolutionary laws)

根据作者的观点,宇宙也演化出了类似深度学习框架的自发系统。

我们知道,深度学习框架就是一套积木,各个组件就是某个模型或算法的一部分,你可以自己设计积木的堆叠。

因此,我们是否可以想象,宇宙演化出法则的操作矩阵架构,其本身是从一个自动教学系统演化而来的,该系统产生于最可能的最小初始条件?

论文中,作者描述了几个模型,这些模型均实现了「自导自演」:

有7,088个节点和7,304条边的图,由抽样可能的未来构成

生活中,物理定律的得出靠的是我们的观察,所以原始物理定律将极其简单,但经过代代更迭,定律有了自我延续并具有学习和发展的能力。

也许,宇宙不是从大爆炸开始的,而仅仅是粒子之间的简单相互作用。

文章围绕受限玻尔兹曼机(restricted Boltzmann machine, RBM)讨论。

受限玻尔兹曼机由Hinton等人提出,是一种生成式随机神经网络。这个概念非常抽象,是一种类似物理学的机器学习模型。然而,受限玻尔兹曼机是最简单的一类深度神经网络结构,

该架构由两层神经元组成。一个是可见层(绿色),一个是隐藏层(蓝色)。

了解宇宙未知的一面,一直是天文学家努力的方向。有了AI这个「队友」,我们会不会加速通向探秘宇宙的星辰大海呢?

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/484602.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于YOLOv5的中式快餐店菜品识别系统

基于YOLOv5的中式快餐店菜品识别系统[金鹰物联智慧食堂项目] 摘要 本文基于YOLOv5v6.1提出了一套适用于中式快餐店的菜品识别自助支付系统,综述了食品识别领域的发展现状,简要介绍了YOLOv5模型的历史背景、发展优势和网络结构。在数据集预处理过程中&am…

谋局科技创新:两院院士大会释放重要信号

来源:经济参考报作者:班娟娟、钟源从坚持把科技自立自强作为国家发展的战略支撑,到加快建设科技强国,实现高水平科技自立自强;从加强原创性、引领性科技攻关,坚决打赢关键核心技术攻坚战,到强化…

图像加减运算

图像的加减运算 原创文章:转载请注明出处 ©️ Sylvan Ding 图像相加 图像相加常常被用来进行图片降噪处理。令 g(x,y)g(x,y)g(x,y) 是无噪声理想图像 f(x,y)f(x,y)f(x,y) 被高斯加性噪声 η(x,y)\eta (x,y)η(x,y) 污染后的图像,即 g(x,y)f(x,y)η…

随机森林是我最喜欢的模型

来源:机器之心TensorFlow 决策森林 (TF-DF) 现已开源,该库集成了众多 SOTA 算法,不需要输入特征,可以处理数值和分类特征,为开发者节省了大量时间。在人工智能发展史上,各类算法可谓层出不穷。近十几年来&a…

拉普拉斯锐化[原理及Python实现](含拉氏标定、拉普拉斯标定)

拉普拉斯锐化 [原理及Python实现](含拉氏标定、拉普拉斯标定) 原创文章;转载请注明出处:©️ Sylvan Ding 锐化处理的主要目的是突出灰度的过度部分。图像锐化的用途多种多样,应用范围从电子印刷和医学成像到工业…

以太坊 方法签名

最近在工作中使用web3j调用合约,发现一个比较头疼的问题?复杂一点的合约参数多了,函数的方法签名老是出错。在这之前调用合约方法一直都是拼接合约的函数签名以及参数。为了能快速的获取每个合约的函数签名,我在思考是否便捷可行解…

训练 GPT-3,为什么原有的深度学习框架吃不消?

来源:AI前线作者:一流科技 CEO 袁进辉近年来,深度学习被广泛应用到各个领域,包括计算机视觉、语言理解、语音识别、广告推荐等。在这些不同领域中,一个共同的特点就是模型规模越来越大,比如 GPT-3 模型的参…

Canny边缘检测原理及其python实现

Canny边缘检测原理及其python实现 转载请注明出处:©️ Sylvan Ding Canny边缘检测算法 多数分割算法均基于灰度值的两个基本性质之一:不连续性和相似性。图像的边缘检测就是基于灰度的不连续性(灰度突变)来实现图像分割的。…

离奇的梦境,能够防范大脑过拟合

来源:混沌巡洋舰 1 )梦让我们对世界的理解不再那么简单化关于为什么大脑进化出夜间做梦?神经科学界提出了各种假说,诸如通过梦来调节情绪,巩固记忆,或梦可以帮助我们选择性的遗忘,对我们应对现实世界的问题…

RGB空间中的彩色图像分割原理及其python实现

RGB空间中的彩色图像分割 ⭐️ 为尊重原创性!转载请注明出处:©️ Sylvan Ding’s Blog 概述 本文论述了基于欧式距离和曼哈顿距离的彩色图像分割算法,并用python实现了各个算法。之后将二者的优势结合,提出了改进后的曼哈顿…

路飞学城Python-Day171

Evernote Export 线性结构:python的列表操作列表是如何存储的:顺序存储的,是一块连续的内存,内存是一堆格子,列表是一串连续的编号32位机器上一个整数占4个字节数组和列表有2点不同,1.数组的元素类型要求是…

HarmonyOS 2面世!是没有退路还是时机成熟?中国操作系统崛起元年或已到来

来源:21Tech(News-21)作者:倪雨晴编辑:张星6月2日晚间,华为鸿蒙操作系统HarmonyOS迎来重要时刻,华为正式发布多款搭载HarmonyOS 2的新产品,包括HUAWEI Mate 40系列新版本、Mate X2新版本、HUAWEI WATCH 3系…

操作系统:线程同步

操作系统:线程同步 使用Linux无名信号量实现了读写者线程的互斥和同步。 实验环境 环境:Linux语言:CCMake:3.17.1GCC:7.5.0IDE:Clion 2020.3.1 实验目标 理解进程同步的两种制约关系:互斥与…

中国工程院2021年院士增选第二轮候选人名单公布

来源:先进制造业中国工程院2021年院士增选进入第二轮评审候选人名单(按候选人姓名拼音排序)未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城…

vsftpd部署流程和常见问题详解

vsftpd部署流程和常见问题详解 ⭐️ 网上关于在云服务器里配置vsftpd的文章鱼龙混杂,没有一篇是可以彻底解决问题的,有些问题虽简单,但也让初学者感到困惑。本文详细说明vsftpd的部署流程和一些常见问题的解决方法,详述用户创建过…

谷歌发布史上最强人类大脑「地图」,1.3亿个突触,在线可视3D神经元「森林」!...

来源:Google AI Blog编辑:yaxin, LQ (新智元)突触,是神经网络的「桥梁」。我们知道,人类大脑有860亿个神经元,因为有了突触,才可以把神经元上的电信号传递到下一个神经元。长久以来&…

智慧食堂项目策划书(商业计划书/立项计划)

金鹰物联智慧食堂项目策划书(商业计划书/立项计划) ©️ 金鹰物联项目组,转载请注明出处! ⭐️ 技术部分请参考博文:基于YOLOv5的中式快餐店菜品识别系统 文章目录金鹰物联智慧食堂项目策划书(商业计划…

pipelineDB学习笔记-2. Stream (流)

一、流的定义: 所谓的“流”(stream)在pipelineDB中是指那些被允许的数据库客服端推送到 Continuous View(连续视图) 的时序化数据的一种“抽象”。流中的每一个raw(数据列)或者event(事件),看起来是和普通…

银行家算法之Python实现[操作系统实验]

银行家算法 银行家算法是著名的死锁避免算法,其思想是:把操作系统视为银行家,操作系统管理的资源相当于银行家管理的资金,进程向操作系统请求分配资源相当于用户向银行家贷款。操作系统按照银行家制定的规则为进程分配资源。进程…

城市智能化发展中,AI公司应该做什么?

来源:虎嗅APP题图来源:视觉中国在上海长宁区的部分区域,你会发现共享单车总是能够整整齐齐的排列,并且在每一个你需要的街道路边,都能找到空闲的单车,既不会车辆爆满,也不会无车可骑。这些城市细微之处的体…