DeepMind新突破!首次用深度学习从第一性原理计算分子能量


来源:AI科技评论

编译 | 青暮

DeepMind发表了一项新研究,展示了深度学习如何帮助解决现实系统中的量子力学基本方程问题,相关论文发表在物理学期刊《Physical Review Research》,代码也已经开源。

这种新的神经网络架构叫做Fermionic神经网络或FermiNet,该架构适合对大量电子集合体(化学键的基本组成部分)的量子态进行建模。

DeepMind表示,FermiNet是第一个利用深度学习来从第一性原理计算原子和分子能量的尝试,并拥有足够的精确度。

他们还计划将FermiNet用于蛋白质折叠、玻璃态动力学、晶格量子色动力学等研究项目,以将这一愿景变为现实。

论文地址:https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.2.033429

代码地址:https://github.com/deepmind/ferminet

1

FermiNet

量子力学拥有大量的计算工具,但是构建有效的表示仍然是个难题。

即使是最近似的方法,量子化学计算最多只能求解包含数万个电子的模型,而经典的(即非量子的)化学计算技术(例如分子动力学)可以处理数百万个原子。

经典系统的状态可以用很简单的方式描述,只需要知道每个粒子的位置和动量。而表示量子系统的状态则更具挑战性,因为电子的位置是不确定的,必须给出其概率分布。

波函数可用于编码电子的位置分布,并且波函数的平方给出了其概率值。要描述所有可能的位置,基本是不可能的。例如,假设有每个维度上具有100个点的网格,则硅原子的可能位置分布数将大于宇宙中的原子数。

图1:不同的原子轨道波函数图像,表面代表出找到电子的高概率区域。在蓝色区域,波函数为正,而在紫色区域,波函数为负。

这正是DeepMind认为深度神经网络可以提供帮助的地方。

在过去的几年中,神经网络在表示复杂的高维概率分布方面取得了巨大的进步。现在,神经网络已经可以高效、可扩展地训练。

DeepMind推测,鉴于神经网络已经证明了在解决人工智能问题中拟合高维函数方面的能力,也许它们也可以用来表示量子波函数。

这个想法不是DeepMind第一个提出的,例如Giuseppe Carleo和Matthias Troyer等曾经在Science上发表论文“Solving the quantum many-body problem with artificial neural networks”,表明使用现代深度学习解决理想的量子问题是可行的。

如今,DeepMind想使用深度学习来解决化学和凝聚态物理中更实际的问题,这意味着在计算中会包括电子。

电子必须遵守泡利不相容原理,这意味着任意两个电子不能同时处于相同的状态。因为电子是费米子,费米子包括了质子、中子、夸克、中微子等,它们都遵守泡利不相容原理。交换两个电子会使得总波函数乘以-1,如果两个电子的波函数是全同的,则总波函数将为0。

这意味着我们必须开发一种其输入是反对称的新型神经网络,DeepMind将其称为Fermionic神经网络或FermiNet。

在大多数量子化学方法中,使用行列式引入反对称性。矩阵的行列式具有以下属性:如果交换两行,则输出将乘以-1,就像费米子的波函数一样。

因此,对于一系列单电子函数,可以将其转换成一个矩阵。该矩阵的行列式就是适当的反对称波函数。

这种方法的主要局限性在于所得到的函数(称为Slater行列式)不是很通用。实际系统的波函数通常要复杂得多。

典型的改进方法是采用Slater行列式的大规模线性组合(有时甚至数百万个),并基于电子对添加一些简单的校正。即使那样,这仍不足以精确地计算能量。

图2:Slater行列式展示,每个曲线都是图1中的某个轨道的波函数。当电子1和2交换位置时,Slater行列式的其中两行交换,波函数乘以-1,从而保证遵守泡利不相容原理。

与基函数的线性组合相比,深度神经网络在表示复杂函数上通常效率更高。

在FermiNet中,这是通过使行列式中的每个函数作为所有电子的函数来实现的,这远远超出仅使用单电子和双电子函数的方法。

FermiNet对每个电子都有单独的信息流。如果这些流之间没有任何交互,网络的表示能力将不会超过常规的Slater行列式。

为了解决这个问题,DeepMind将来自网络每一层所有流的信息平均化,然后将此信息传递给下一层的每一流。

这样,这些流具有正确的对称性,从而可以创建反对称函数。这类似于图神经网络在每一层汇总信息的方式。

与Slater行列式不同,FermiNets是通用函数逼近器(至少在神经网络层变得足够宽的极限内)。

这意味着,如果可以正确地训练这些网络,它们将能够几乎精确地拟合薛定谔方程的解。

图3:FermiNets图示。网络函数的单个流(蓝色、紫色或粉红色)非常类似于常规轨道。FermiNets引入了流之间的对称相互作用,使得波函数更具一般性和更具表达能力。就像常规的行列式一样,将两个电子位置交换仍将导致行列式交换两个行,并将总波函数乘以-1。

我们通过最小化系统的能量来拟合FermiNet。为了精确地做到这一点,我们需要评估所有可能的电子构型下的波函数,因此不得不进行近似。

我们随机选择电子构型,在每个电子排列中局部地估计能量,将每个排列的贡献相加,并将其(而不是真实能量)最小化。

这称为蒙特卡洛方法,因为它有点像赌徒一遍又一遍地掷骰子。虽然是近似值,但如果我们需要使其更精确,则可以随时再次掷骰子。

由于波函数平方代表可以观察到的任何位置的粒子排列,因此最方便的是从波函数本身生成样本(本质上是模拟观察粒子的行为)。

虽然大多数神经网络都是从一些外部数据中训练出来的,但在DeepMind的这个案例中,用于训练神经网络的输入是由神经网络本身生成的。这意味着我们不需要任何训练数据,除了电子在的原子核周围的位置。

上述基本概念被称为变分量子蒙特卡洛(variational quantum Monte Carlo,VMC),自20世纪60年代就出现了,通常被认为是一种廉价但不太精确的计算系统能量的方法。

通过用FermiNet替换基于Slater行列式的简单波动函数,DeepMind极大地提高了该方法在多个系统上的精度。

图4:从FermiNet采样的模拟电子围绕双环戊烷分子的运动。

为了确保FermiNet确实代表了SOTA,DeepMind首先研究了简单且经过充分研究的系统,例如元素周期表第一行(氢到氖)中的原子。这些系统很小(少于10个电子)且足够简单,可以用最准确的方法进行处理。

FermiNet的性能远胜于对应的VMC计算(相对于指数缩放计算,通常可以将误差减少一半或更多)。

在更大的系统上,指数缩放方法变得棘手,因此DeepMind将“耦合簇”方法用作基准。该方法对处于稳定构型的分子效果很好,但是当键被拉伸或断裂时会很费力(这对于理解化学反应至关重要)。

尽管耦合聚类的缩放比指数缩放好得多,但它只能用于中等大小的分子。DeepMind将FermiNet逐渐应用于更大的分子,从氢化锂开始,一直到双环丁烷(它具有30个电子)。

在最小的分子上,FermiNet惊人地捕获了耦合簇能量和单个Slater行列式获得的能量之差的99.8%。在双环丁烷上,FermiNet仍捕获了97%或更多的相关能量。

图5:FermiNet在分子上捕获的相关能量的分数的图示。紫色条表示99%的相关能量。从左至右:氢化锂、氮、乙烯、臭氧、乙醇和双环丁烷。

尽管耦合簇方法对于稳定的分子非常有效,但计算化学的真正前沿是理解分子如何拉伸、扭曲和断裂。

在那里,耦合簇方法经常会遇到困难,因此我们必须与尽可能多的基准进行比较,以确保获得一致的答案。

DeepMind研究了两个基准拉伸系统——氮分子(N2)和具有10个原子的氢链(H10)。氮是一个特别具有挑战性的分子键,因为每个氮原子贡献3个电子。同时,氢链对于了解电子在材料中的行为方式(例如预测材料是否会导电)很重要。

在这两个系统上,耦合簇在平衡状态下都表现良好,但是随着键的拉伸,问题就出现了。常规的VMC计算结果总体而言效果不佳。但是,无论键长如何,FermiNet都是研究的最佳方法之一。

2

结论

DeepMind表示,FermiNet是深度学习与计算量子化学融合的伟大事物的开始。到目前为止,他们研究的大多数系统都经过了充分的研究和很好的理解。

DeepMind希望FermiNet将激发大量的扩展工作,并为新的甚至更好的网络体系结构激发许多想法。

自从去年DeepMind首次将工作放到arXiv以来,其他小组已经分享了他们将深度学习应用于多电子问题的第一性原理计算的方法。DeepMind表示,他们期待将FermiNet应用于材料科学和凝聚态物理中的难题。

原文链接:https://www.deepmind.com/blog/article/FermiNet

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/486635.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

重磅发布:2020全球前沿技术发展趋势报告

来源:科技日报作者:刘垠、操秀英大热的脑机接口、基因编辑等前沿技术发展如何?2020年科技界关注了哪些热点?22日在浦江创新论坛上发布的《全球前沿技术发展趋势报告》带来了答案。《全球前沿技术发展趋势报告》由中国科学技术信息…

400错误是什么原因_499错误是什么?499错误的原因及解决方法

​HTTP状态码出现499错误有多种情况,499错误是什么?下面我们来学习Nginx 499错误的原因及解决方法。日志记录中HTTP状态码出现499错误有多种情况,比如nginx反代到一个永远打不开的后端,日志状态记录就会是499、发送字节数是0。​经…

MapReduce过程详解及其性能优化

http://blog.csdn.net/aijiudu/article/details/72353510 废话不说直接来一张图如下: 从JVM的角度看Map和Reduce Map阶段包括: 第一读数据:从HDFS读取数据 1、问题:读取数据产生多少个Mapper?? Mapper数据过大的话&…

爱因斯坦梦断“大统一理论”

来源:数学职业家爱因斯坦发表了他最为得意之作:广义相对论之后,便开始了他的“统一之梦”。大有“躲进小楼成一统,管他冬夏与春秋”之势,这一“统”就是三十余年,到死方休。尽管统一场论一词始于爱因斯坦&a…

js数组截取前5个_想用好 Node.js?这 5 个经典国产项目值得细品

凭借着高并发性能优秀、异步事件驱动、入门简单等优势,Node.js 受到了不少开发者们的青睐。但不得不承认的是,如果用不好 Node.js,它的坑就会非常多,为了帮助各位 Node.js 的开发者们更灵活地使用它,Gitee 为大家推荐以…

微博html天涯吴奇隆刘诗诗,吴奇隆深夜微博晒爱心,为刘诗诗庆生,网友:撒了一大把狗粮...

导语:吴奇隆深夜微博晒爱心,为刘诗诗庆生,网友:撒了一大把狗粮明星夫妻的甜蜜生活,总会让大家感到幸福浪漫。看到自己的偶像能够过得这么好,作为粉丝心里也是很美的,为偶像的幸福感到高兴。娱乐…

划重点!2020年,这些前沿技术最受关注

来源:科技日报大热的脑机接口、基因编辑等前沿技术发展如何?2020年科技界关注了哪些热点?22日在浦江创新论坛上发布的《全球前沿技术发展趋势报告》带来了答案。《全球前沿技术发展趋势报告》由中国科学技术信息研究所和上海市科学学研究所联…

MVC里面写html获取不到input,asp.net-mvc – ASP.Net [HiddenInput]数据属性在Razor中用Html.EditorForModel渲染时不起作用?...

我有以下型号:public class Product{[HiddenInput(DisplayValue false)]public int ProductID { get; set; }[required(ErrorMessage"Please enter a product name")]public string Name { get; set; }[required(ErrorMessage"Please enter a descr…

select默认选中的option_macOS下妙用option按键

macOS下option键是非常重要的按键,它的特性是激活一些隐藏功能,所以经常被多数人忽视。现在总结一下option键让你意想不到的功能吧。最大化窗口mac左上角三个按钮默认为关闭 最小化和全屏,但大多数时候,我们最要的是最大化窗口&am…

化身“监工”的AI,我们该如何相处?

来源: 脑极体AI技术带来整体社会福利增加的同时,也正在带来一系列新的问题。目前来说,与人工智能是否会取代人类这类“玄学”问题而言,当下最现实的一个问题就是人和AI的协作问题了。不久前,人物杂志的一篇《外卖骑手&…

怎么判断一个字符串的最长回文子串是否在头尾_最长回文字串/子序列问题(leetcode5,9,519)

leetcode 5 最长回文子串给定一个字符串 s,找到 s 中最长的回文子串。你可以假设 s 的最大长度为 1000。示例 1:输入: "babad" 输出: "bab" 注意: "aba" 也是一个有效答案。示例 2:输入: "cbbd" 输出…

张亚勤:对于产业来讲,深度学习的黄金时代刚刚开始

大数据文摘出品由中国计算机学会(CCF)举办的计算领域年度盛会CNCC 2020今天在北京隆重开幕,大会主题是“信息技术助力社会治理”。大会设有14个特邀报告、3场大会论坛、百余场技术论坛以及CCF CTO峰会等多场活动,邀请到超过400位国内外计算机领域知名专家…

去月球“你知道戴维会变身成哪种动物吗?”

在《去月球》游戏中,有一节会遇到一个问题: “你知道戴维会变身成哪种动物吗?” (请用英语大写字母回答) 其实这个答案,和上面的回忆对话,就能知道了,看下图 答案就是:CO…

erp实施 数据库面试题_ERP管理系统多少钱

ERP系统本质上是一套软件包,可以执行会计,产品计划和开发,制造,库存管理,销售管理,人力资源和其他业务任务。很多企业在选择ERP系统的时候都会比较关心费用的问题,其实ERP系统价格受很多方面因素…

美军军事通信系统简史

来源:对讲机世界大家都知道,美军发明了互联网。但是,你也许不知道,今天的移动通信网络的前身正是美军的MSE (Mobile Subscriber Equipment,美军移动用户设备系统)。80年代,美军开始寻找新的技术…

html四边形的的框怎么编写,html知识点之利用css四边形切角并且加上边框

html知识点之利用css四边形切角并且加上边框html知识点之利用css四边形切角并且加上边框前言这几个月做了很多前端工作,其中一个需求还是蛮头疼,UI给的图上面的四边形是一个带斜边的,直接用背景图可以实现,但是会出现各种布局的问…

java this关键字的使用_Java关键字(五)——this

大家好,我是可乐,一个专注原创,乐于分享的程序猿。 本系列教程持续更新,可以微信搜索「 IT可乐 」第一时间阅读。回复《电子书》有我为大家特别筛选的海量免费书籍资料this 也是Java中的一个关键字,在《Java编程思想》…

受小动物大脑结构启发,研究人员开发出新的深度学习模型:更少神经元,更多智能...

大数据文摘出品来源:sciencedaily编译: 朱科锦、coolboy从搜索引擎到自动驾驶汽车,人工智能已经进入了我们的日常生活。这与近年来计算能力的巨大提升有关。但是,最新的人工智能研究成果表明,更简单、更小的神经网络可以比以前更好…

python画画用哪库好_小白开始学Python最著名的绘图库

原标题:小白开始学Python最著名的绘图库 这是菜鸟学Python的第101篇原创文章 数据分析里面可视化是重要的环节,辛苦把数据采集,然后经历了很多工序的清洗之后,最后要展现给用户,最好的方法就是数据可视化。数据可视化是…

​2021年人工智能的四大趋势

来源:工信头条PART Ⅰ前沿资讯2021年人工智能的四大趋势美国《福布斯》双周刊网站刊载题为《2021年人工智能的四大趋势》的报道,作者系伯纳德马尔,文章根据当下形势,预测了明年人工智能的四个趋势。在2020年全球疫情暴发和世界被彻…