人脑计划:大脑研究如何对超级计算提出新要求

2795a00fc2f19a36920b4046d428965f.png

来源:ScienceAI

编译:绿萝

「了解大脑的所有复杂性需要从多个尺度——从基因组学、细胞和突触到整个器官水平的洞察力。这意味着处理大量数据,超级计算正在成为解决大脑问题的不可或缺的工具。」人类大脑项目 (HBP) 科学主任、杜塞尔多夫大学和 Jülich 研究中心神经科学与医学研究所 (INM-1) 主任 Katrin Amunts 说。

Katrin Amunts 和 Thomas Lippert 在《Science》发表「Brain research challenges supercomputing」为题的观点论文。

91aef8d882f4141585e28d63f8b5ed8b.png

人类大脑包含约 860 亿个神经元。放大其细胞和亚细胞细节,揭示神经元连接的不同方面,是一个重要的研究领域。然而,将突触水平(纳米范围)到单个神经元和神经胶质细胞(微米水平)的不同空间尺度连接到整个器官是最具挑战性的。最近,秀丽隐杆线虫的连接组具有 302 个神经元的特征,并提出了完整的结构功能模型。人类大脑连接组的类似细节水平还有很长的路要走。因此,解码人类连接组、信号转导机制以及与大脑功能的关系,与先进计算和存储技术中呈指数增长的挑战有关,这反过来可能会导致神经科学之外的创造性解决方案。

扫描时间、存储技术和数据处理的挑战并非始于人类大脑的研究,而是研究脊椎动物甚至无脊椎动物的大脑时的重要考虑因素(见图)。例如,重建具有约 100,000 个神经元的成年果蝇大脑的突触连接,最终生成了约 2100 万个相机图像和 106 TB 的数据集。最近,人类大脑皮层的一个片段,大约 1 平方毫米的体积,在三个维度上被重建,对应于大约 1.4 PB 的数据量。虽然 1 mm^3 是大脑皮层的一小部分,占大脑总体积的 0.00007%,但需要高速多光束电子显微镜以 326 天的扫描时间收集这些数据。进行此类研究的动机是,深入了解大脑的详细结构可能会揭示对皮层网络的新理解,并提供描述组织特性的新定量数据,并对大脑活动产生影响。

5db7f3b3f30c90988c6ec3adbbc07bbc.png

来自人脑研究的大数据根据对人脑连接组和组织的研究的分辨率,数据的大小呈指数增长。最大的两个条形是估计大小,因为人类大脑不存在此类数据。

这种对人脑组织的分析是对其他物种大脑研究的重要补充,因为它们之间存在相当大的差异,尤其是连通性。例如,在哺乳动物进化过程中,大脑皮层的白质体积比灰质(含有神经元细胞体)增加得更快,其中包含支持远程连接的轴突。长短连接的比例对电生理特性有影响,因此对大脑功能有影响。然而,与啮齿动物或无脊椎动物相比,研究人类大脑中轴突及其突触的全部范围(可能距离它们的细胞体几厘米)代表了一个更实质的问题。

磁共振成像(MRI)能够解决远距离连接并揭示连接模式,包括活人大脑中的功能连接,但图像体素在毫米范围内。该分辨率远低于检测单个轴突所需的空间分辨率,因此容易导致束重建中固有的歧义。此外,大脑连通性包括诸如侧支化(一个轴突可能针对多个区域)、收敛、互惠或空间分离的「树突乔木」等现象,这些现象被认为是理解连通性的关键,但无法通过 MRI 获得。

5e4a665d3cc5e77ef6a389ac5e4d2671.png

因此,宏观和微观连接组尺度之间存在差异。已经提出了不同的方法来弥合这两个世界:例如,最近在同一组织块中探索了使用 CLARITY 技术清除的脑组织中荧光标记神经丝的扩散 MRI 和高分辨率光学成像的组合,以允许更强大多模态 MRI-CLARITY 比较。在另一项研究中,来自人类海马的组织块通过解剖和扩散 MRI、三维偏振光成像 [3D-PLI; (11)] 和双光子荧光显微镜将不同空间尺度的海马纤维结构信息汇总在一起,并将其表示在一个共同的参考空间 BigBrain 模型 (www.ebrains.eu) 中。这些数据显示了穿孔通路,它不代表一个统一的管道,而是一个多组分系统,起源于内嗅皮层,具有许多细轴突纤维束(在 20 毫米的范围内)并投射到角部和下叶。3D-PLI 是一种显微技术,可以解码穿孔通路的精细结构,该通路在学习和记忆以及阿尔茨海默病的发病机制中具有核心作用。在方法论上,不同技术的组合有助于交叉验证结果。实际上,它为将高分辨率感兴趣区域分析与全脑研究相结合铺平了道路。

Atlas 方法可以系统地充当宏观和微观尺度的桥梁,将来自单细胞超高分辨率研究的数据及其与感兴趣的小区域的联系整合到一个共同的微观参考空间中。BigBrain 以 20 毫米各向同性分辨率表示这种解剖模型,该分辨率略高于查看细胞形态细节所需的分辨率。它基于 7404 个组织学、细胞体染色切片;原始数据集约为 1 TB。BigBrain 提供了一个模板,将皮层甚至子层的发现与全脑结构、连接性和功能的数据相结合。

以细胞分辨率处理和分析整个人类大脑是一项巨大的挑战。目前,在全脑水平上深入到单个轴突还遥不可及。然而,为了简单起见,假设一个轴突连接两个神经元,在全脑水平跟踪轴突在计算上意味着什么?根据死后大脑的扩散 MRI 在毫米范围内计算全脑水平的纤维路线,意味着优化 4 × 10^5 个旋转方向。这将需要大约 130 兆字节的存储空间和 1 天的台式计算机计算时间。

使用 3D-PLI 对整个人脑进行 60 µm 各向同性分辨率水平的轴突分析将需要 8.3 TB 的存储空间和现有超级计算机上的数天时间来优化 2 × 10^10 个自旋。如此大的数据集也给数据可视化带来了巨大的挑战。例如,基于开源软件 VTK (www.paraview.org) 的 Paraview 可以使用并行图形处理单元 (GPU),并已应用于渲染和可视化 3D-PLI 数据。进一步优化 3D-PLI 以 1.3 µm 面内分辨率(即单轴突)获得的纤维取向,旋转 10^13 次,将导致 3.2 PB 的存储需求和多年的计算。这在目前的千万亿级技术中是不可能的,但可以通过未来的百亿亿级计算能力来实现,即每秒能够执行 10^18 次浮点运算(即 1 亿亿次浮点运算)的计算机。然而,处理如此大的数据集会在输入输出级别产生大量计算需求。更高效的输入输出程序和算法正在出现,这应该会有所帮助,但计算挑战仍然非常高。

当细胞和轴突信息与大脑组织的其他维度相关联时,计算要求也会进一步增加,例如,分子结构具有区域特异性,并且是信号转导的关键。同样,当添加时间变化来模拟细胞活动、可塑性或网络功能时,要求会进一步增加。在开发更符合生物学的大脑模型时,不仅要考虑大脑的区域隔离,还要考虑层流和亚层流特征及其特定的细胞数量、解剖和生理特性以及分布。同样,基于更现实的模型的人脑计算机模拟必须相应地缩放,这些模型解释了解剖学和生理学的限制。

这些努力对高性能计算技术提出了要求。例如,神经科学用例变得依赖于可扩展的工作流程,从提取存储在数据存储库中的多模态数据集到预处理、模拟、可视化和分析,甚至更多地使用机器学习和深度学习。此类工作流组件的计算将受益于未来超级计算的模块化和交互式概念,例如在欧洲深度项目中开发的那些概念。在模块化超级计算架构中,专门的计算模块被集成以形成深度连接的硬件架构,并且可以与最适合工作流特定组件的每个模块连贯使用。这包括各种模块,如中央处理单元 (CPU) 集群、GPU 增强器、用于数据分析的现场可编程门阵列模块、神经形态系统、极限存储模块,以及未来的量子计算机和退火器。此外,对需要交互式超级计算的神经科学工作流程的需求不断增长——例如,在继续之前可视化中间结果和正确的参数设置——并且依赖于 Paraview 等软件的交互式使用。

神经科学中的大数据挑战需要技术解决方案来存储数据(TB 到 PB 范围内),同时通过云提供给更广泛的社区。这需要从面向对象的云存储系统到超级计算机的 EB 级并行文件系统的透明数据传输。

艾伦大脑研究所为神经科学家提供了一个平台,并提供了大量反映不同物种(包括果蝇、斑马鱼、小鼠和人类)大脑组织多个方面的图像堆栈,以及用于可视化、上传和下载的工具(BigNeuron;www.alleninstitute.org/bigneuron/data/)。人类生物分子图谱计划旨在开发一个开放的全球平台来绘制整个人体中的健康细胞,这项努力伴随着大量的大数据和计算挑战。在欧洲,人类大脑项目开发了 EBRAINS 以提供大量研究仪器、数据和相关服务——重点是人类、大鼠和小鼠的大脑——它们相互关联,并使云访问交互式超级计算、基于网络的可视化和分析,以及通过 Fenix 的高端模拟和数据服务。该平台由神经科学家和开发人员根据研究需求共同构建,例如运行大规模模拟或 3D 重建和分析大脑模型。Fenix 被设计为一个通用的基础设施即服务平台,包括欧洲范围的身份验证服务,以支持许多研究社区的访问。在神经科学界共享数据、方法和研究工具,并在不同社区之间联合服务可以利用大量相关的方法和资源投资,这反过来又是开发新的脑医学诊断工具和疗法的基础。毫无疑问,基于云的超级计算和分布式协作研究平台,将在神经科学研究中发挥越来越大的作用,以更好地了解大脑的复杂性。

在未来五年内,欧洲的目标是部署其前两台百亿亿级超级计算机。它们将由欧洲高性能计算联合企业 (EuroHPC JU) 收购,这是欧盟、欧洲国家和私人合作伙伴之间的一项联合倡议。「大脑研究界随时准备使用这些百亿亿级系统。」Amunts 说。

参考内容:https://www.eurekalert.org/news-releases/935941

论文链接:

https://www.science.org/doi/10.1126/science.abl8519

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

d0d8db78bb235a9b09f973a235c834f2.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483202.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构与算法——递归、回溯与分治

文章目录1.预备知识1.1 递归1.2 回溯1.3 位运算2.子集2.1 题目描述2.2 解题思路——回溯递归法2.3 C实现2.4 解题思路——位运算法2.5 位运算实现3.子集 II3.1 题目描述3.2 解题思路3.3 回溯递归法——C实现3.4 位运算——C实现4.组合总和 II4.1 题目描述4.2 解题思路4.3 C实现…

MongoDB安装启动教程

MongoDB安装启动教程 简易教程:鉴于第一次大家使用分布式数据库,提供一个简易教程(也可看老师的PPT或者视频) 1.点击安装包(老师给的),安装目录不要更改,否则后面配置需要改&#xf…

机器能思考吗?

来源:人机与认知实验室机器有智能吗?机器会理解吗?机器能思考吗?从十七世纪到今,每一次机器功能的重大突破,这问题都被翻出来问一遍,只是否定它变得愈来愈困难了。Alpha Go与李世石的围棋赛尘埃…

数据结构与算法——二叉树与图

文章目录1.预备知识1.1 二叉树定义1.2 二叉树的构造2.路径总和 II2.1 题目描述2.2 算法思路2.3 C实现3.二叉树的最近公共祖先3.1 题目描述3.2 解题思路3.3 C实现4.二叉树展开为链表4.1 题目描述4.2 思考4.3 C实现4.4 解法二4.5 C实现5.二叉树的右视图5.1 预备知识5.2 题目描述5…

Nature评论:机器学习的物理启示录——隔壁的另一条机遇之道

来源:AI科技评论作者:Don编辑:青暮老话说:隔行不取利。但时过境迁,目前不管是娱乐圈还是学术界,跨界方可大红大紫。在娱乐圈,相声演员客串脱口秀,歌手跨界演员,赚的钵满盆…

操作系统——文件的逻辑结构

文章目录1.文件的逻辑结构的概念1.1 按照逻辑结构的文件分类1.2 无结构文件和有结构文件的区别2 顺序文件3 索引文件4.索引顺序表1.文件的逻辑结构的概念 1.1 按照逻辑结构的文件分类 1.2 无结构文件和有结构文件的区别 2 顺序文件 3 索引文件 4.索引顺序表

操作系统——文件目录

文章目录1.文件目录知识点2. 文件分配方式3.文件的存储空间管理4.文件的基本操作5.文件共享6.文件保护7.文件系统的层次结构1.文件目录知识点 2. 文件分配方式 3.文件的存储空间管理 4.文件的基本操作 5.文件共享 6.文件保护 7.文件系统的层次结构

我们不知道答案的125个科学问题(16)群体合作行为的演化

来源:张林科学网博客链接地址:http://blog.sciencenet.cn/blog-318012-1292142.html题记:离Science杂志提出125个问题到今天已经过去了16个年头,然而我这个125个问题的系列解读仅仅进行到第16个,想必这125个问题自己也…

Nature:大脑空间导航研究五十年

来源:集智俱乐部作者:Isabel I. C. Low & Lisa M. Giocomo译者:赵雨亭 审校:张澳 编辑:邓一雪 导语老马识途的故事被人们所熟知,但其识途的神经机制却尚待研究。1971年,研究人员首次发现&am…

操作系统——磁盘

文章目录1.磁盘的结构2.磁盘调度算法3.减少磁盘延时时间的方法4.磁盘管理1.磁盘的结构 2.磁盘调度算法 3.减少磁盘延时时间的方法 4.磁盘管理

建网站如何选择好用的网站源码程序

很多新手朋友第一次建网站时候,如何选择一款适合的网站源码是比较困惑的问题,选择一款好的网站源码可以节约大量时间和金钱,但是由于网站源码参差不齐,免费的,收费的,淘宝几元钱购买的,几万块钱…

操作系统——设备管理

文章目录1.I/O设备的基本概念与分类2.I/O控制器3.I/O控制方式4.I/O软件层次结构5.I/O核心子系统6.假脱机技术7.设备的分配和回收8.缓冲区管理1.I/O设备的基本概念与分类 2.I/O控制器 3.I/O控制方式 4.I/O软件层次结构 5.I/O核心子系统 6.假脱机技术 7.设备的分配和回收 8.缓冲区…

95页重磅报告:全面预测未来5年趋势

来源:中产财富分水岭将成为未来5年中国互联网的关键词,从浅水区向深水区过渡,引发竞争格局的强弱式转化。分水岭期不存在直道竞争,冷静和变化成为主旋律。版权申明:内容来源网络,版权归原创者所有。除非无法…

新发现为类脑计算机开辟了道路

来源:ScienceAI编辑:萝卜皮大型自旋霍尔纳米振荡器(SHNO)阵列的同步,是实现超快非常规计算的一种有吸引力的方法。然而,与阵列接口、调整其单个振荡器和提供内置存储器单元仍然存在巨大的难题。瑞典哥德堡大…

互联网大脑如何产生“梦境“并形成元宇宙

作者:刘锋本文摘录自2019年中信出版社出版的《崛起的超级智能,互联网大脑如何影响科技未来》的第二章“10条规则:互联网大脑如何影响科技企业的命运”中的“第九条规则,互联网大脑梦境的构建带来产业升级”。这一节详细阐述了互联…

2022年人工智能领域发展七大趋势

来源:科技日报编辑:蒲蒲美国《福布斯》网站在近日的报道中指出,尽管目前很难想象机器自主决策所产生的影响,但可以肯定的是,当时光的车轮到达2022年时,人工智能领域新的突破和发展将继续拓宽我们的想象边界…

数据库基础知识——DQL语言(一)

文章目录1.基础查询2.条件查询3.排序查询4.常见函数4.1 单行函数4.1.1 字符函数4.1.2 数学函数4.1.3 日期函数4.1.4 流程控制函数4.1.5 其他函数4.2 分组函数/统计函数/聚合函数5.分组查询1.基础查询 语法: SELECT 要查询的东西 【FROM 表名】;#查询employees表中所…

周志华教授发表首届国际学习与推理联合大会IJCLR开场Keynote:探索从纯学习到学习+推理的AI...

周志华,毕业于南京大学,欧洲科学院外籍院士,国家杰出青年基金获得者,现任南京大学人工智能学院院长、南京大学计算机软件新技术国家重点实验室常务副主任、机器学习与数据挖掘研究所 (LAMDA)所长、人工智能教研室主任。2021年8月1…

第八章 指针实验

C程序实验报告 实验项目: 1、指针基础及指针运算 2、数据交换 3、字符串反转及字符串连接 4、数组元素奇偶排列 姓名:曹时仙 实验地点:教学楼514教室 实验时间:2019.6.12 一、实验目的与要求 1、掌握指针的概念和定义方法 2、掌…

大脑的学习方式如何,机器学习与生物学习的联系将提供「答案」

来源:ScienceAI编辑:凯霞准确指出神经活动如何随着学习而变化,不是黑白分明的。有人认为大脑中的学习或生物学习可以从优化的角度来考虑,这就是在计算机或机器人等人工网络中学习的方式。由卡内基梅隆大学和匹兹堡大学的研究人员共…