用于化学动力学模拟的原子神经网络表示

编辑 | 白菜叶

机器学习技术已广泛应用于化学、物理、生物学和材料科学的许多领域。最富有成果的应用之一是从离散量子化学数据中学习势能或相关电子特性的复杂多维函数。特别是,大量努力致力于开发各种原子神经网络 (AtNN) 表示,这些表示是指将目标物理量表示为由原子 NN 表示的原子分量之和的一系列方法。这类方法不仅完全保留了系统的物理对称性,而且相对于系统的大小呈线性缩放,从而能够在复杂系统甚至跨相的多个可变大小系统中进行准确有效的化学动力学和光谱模拟。

在这里,中国科学技术大学蒋彬教授团队讨论了开发高效和可表示的 AtNN 势的不同策略,以及推广这些标量 AtNN 模型以学习具有正确旋转等方差的矢量和张量。研究人员还回顾了生成实用 AtNN 模型的主动学习算法,并展示了 AtNN 在气体表面系统中应用的精选示例,以证明它们准确表示分子系统和凝聚相系统的能力。研究人员指出了在更多应用场景中进一步开发更可靠、可转移和可扩展的 AtNN 表示的众多挑战。

该研究以「Atomistic neural network representations for chemical dynamics simulations of molecular, condensed phase, and interfacial systems: Efficiency, representability, and generalization」为题,于 2022 年 11 月 16 日发布在《WIREs Computational Molecular Science》。

7390e5145c3ec963ff284a167ea4e8ce.png

Born-Oppenheimer 近似可以解决静止原子核的电子薛定谔方程,这构成了量子化学的基础,自然产生了(绝热)势能面 (PES) 的概念。一旦 PES 已知,方程的核运动就可以根据系统的大小在化学动力学模拟中以经典或量子力学的方式求解。解决电子结构问题同样可以得出系统的其他电子特性,例如电荷密度、偶极矩、极化率以及不同电子态之间的跃迁和耦合量。虽然势能(和相关特性)可以直接连同分子动力学 (MD) 经典轨迹一起实时计算,但这种从头算分子动力学 (AIMD) 模拟只能使用廉价的电子结构方法,例如密度泛函理论 (DFT),难以研究稀有事件和长时间事件。此外,这种即时方法通常不适用于量子动力学,因为波包是非局部的。因此,更希望使用足够准确和有效的表示来替换动力学模拟中任意核位置的从头算计算,即使对表示参数化的初始投资可能很大。多年来,开发此类表示一直是原子级化学动力学和光谱模拟的关键任务。

获取 PES 的传统方法在很大程度上取决于系统大小及其使用目的。对于具有大量自由度 (DOF) 的复杂系统,例如,凝聚相材料和生物分子,PES 需要具有良好的可转移性和高效率,因此最常使用编码一些基本量子力学概念的(反应)经验力场(EFF)。相比之下,对于气相或气体表面界面的小型系统,各种线性或非线性拟合/插值方法在尽可能高的水平上忠实地表示从头算能量方面取得了巨大成功。这些 PES 可用于描述给定系统的特定过程,但通常不能转移和扩展到其他系统。

在过去的一两年中,现代机器学习 (ML) 技术彻底改变了在广泛的系统中开发势能和其他属性表示的方式。这种基于神经网络和基于内核的回归等方法与那些不依赖物理近似的传统数学表达式有一些相似之处。但是,前者在高维问题上通常具有更高的灵活性和可扩展性。各种强大的基于 ML 的方法已广泛应用于小分子和反应、反应散射、激发态、光谱学和扩展系统。一个特别成功的方法家族基于由 Behler 和 Parrinello 开创的原子神经网络 (AtNN) 框架,它可以跨阶段对小型和大型系统进行统一表示,并在表示分子特性方面取得重大进展。

50a6a03a7068f2d94c90f127bab8e5ca.png

图示:标量(即势能)的一般 AtNN 架构示意图。(来源:论文)

在这里,中科大的研究团队将回顾了这些 AtNN 模型近年来在物理概念和实际实施中的演变情况。他们论文里重点关注最近在提高 AtNN 表示的效率、可表示性和泛化方面所做的研究,以及为特定系统构建可用模型的数据采样方案。讨论了在气体表面系统中选定的 AtNN 应用,展示了它同样能够很好地描述分子中的定向相互作用以及凝聚相的更各向同性和周期性相互作用的能力。

2f6ff1e1e0eb38b9cdb03e5301a083bf.png

图示:主动学习算法的通用协议。(来源:论文)

尽管取得了众多成功,但 AtNN 表示的未来发展仍然面临一些挑战。首先,很难兼顾 AtNN 表示的效率和可表示性。虽然基于角度特征的 MPNN 模型,例如 REANN,可以通过增加消息传递的数量来包含具有线性缩放的高阶相关性,但仍有提高其效率的空间。特别是,它的并行化不如传统的 AtNN 模型有效,因为现在不同的原子特征是相关的。还提出了更有效的算法来加速高阶交互的直接计算,例如,在 NICE 模型中。更多的数值测试将非常有助于确定实际应用中效率和可表示性之间的最佳平衡。

其次,原子框架本质上依赖于局部近似,通过这种近似,每个原子组件只考虑局部相互作用。由于结合了原子环境内外原子之间的相关性,已经发现 MPNN 模型可以描述一些非局部相互作用。然而,有人认为 MPNN 模型不能像直接增加截止距离那样有效地描述长程相互作用。此外,在一些特殊的分子中,例如CnH4,长程相互作用衰减非常缓慢,并且任何已发布的 AtNN 模型似乎都无法捕捉到端氢旋转时势能的变化。最近的一项工作表明,可以通过以自我注意的方式传递球谐函数来合并非局部几何校正来克服这个问题。为了改进 AtNN 模型的远程行为,库仑相互作用已添加到基于 AtNN 学习的原子电荷的势能中。此外,还引入了电荷平衡方案来描述远程电荷转移。预计将沿着这个方向开展更多工作。

第三,虽然为给定系统建立 AtNN 模型的主动学习协议已经建立,但它们远不是复杂系统的黑盒工具。在大型系统中,需要更明智的方法来衡量预测方差和整个配置之间的相似性,以实现更好的数据效率。另一方面,添加新点的迭代过程需要重复训练 AtNN 模型,这成为主动学习算法的计算瓶颈,需要最小化。此外,尽管一些努力很有希望,但在大型化学空间中从头收集参考数据以生成一系列不同大小和组成的系统的 AtNN 模型仍然非常具有挑战性。

最后,将 AtNN 表示进一步推广到更复杂的场景将很有趣,例如,在存在外部场甚至分子尺度的受限场的情况下。在这种情况下,势能和相关电子特性将受到额外的对称性约束。另一方面,通过求解相应的薛定谔方程直接构建电子和核波函数的 AtNN 表示也很有前途。总而言之,有理由期待 AtNN 表示在未来几十年的各个方面会有更爆炸性的发展。

论文链接:https://wires.onlinelibrary.wiley.com/doi/10.1002/wcms.1645

相关报道:https://phys.org/news/2022-12-breakthroughs-atomistic-neural-network-representations.html

人工智能 × [ 生物 神经科学 数学 物理 材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展

欢迎注标星,并点击右下角点赞在看

点击读原文,加入专业从业者社区,以获得更多交流合作机会及服务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481203.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自然语言生成任务,如文本摘要和图像标题的生成。seq2seq的模型原理

版权声明&#xff1a;本文为博主原创文章&#xff0c;未经博主允许不得转载。 https://blog.csdn.net/Irving_zhang/article/details/78889364 </div><link rel"stylesheet" href"https://csdnimg.cn/release/phoenix/template/css/ck_htmledit…

史上最简单的决策树模型讲解

从前 从前&#xff0c;小夕种了一棵树&#xff0c;种在了小夕的小屋后面~ 为什么要种这棵树呢&#xff1f;因为呀&#xff0c;它可以帮小夕总结历史经验&#xff0c;然后帮小夕对当前的局势做出决策~这样小夕就可以安心给大家写文章啦~ 这棵树是这样的。 一开始&#xff0c;小夕…

听觉器官是高阶元分类“革命性证据”

来源&#xff1a;中国科学报反刍类的内耳几何形态学分析及系统发育示图。Laura Dziomber/绘化石研究的第一步是通过形态特征鉴定身份&#xff0c;厘清物种的亲缘关系&#xff0c;但这种方法并不完美。那些长相相似的也许“八竿子打不着”&#xff0c;而毫无共同特征的却是“亲属…

机器学习从理论到工程的第二步-开发环境与工具篇

在《第一步-编程语言篇》中&#xff0c;小夕为大家较为详细的介绍了做机器学习&#xff08;及其相关应用方向&#xff09;的编程语言的选择问题&#xff0c;这一篇便是小夕为大家推荐的各个编程语言的开发环境/工具。习惯性扫盲开篇。鉴于可能有部分同学的软件开发经验稍有欠缺…

干了一年“元宇宙”,Meta亏了300亿美金

来源&#xff1a;青投创新编辑&#xff1a;Leon"Facebook更名成Mate&#xff1a;从社交媒体转型为“元宇宙”&#xff0c;但前景并不乐观。一年前&#xff0c;Meta在元宇宙上高歌猛进。该公司刚刚完成了从Facebook到Meta的品牌重塑。正如马克扎克伯格&#xff08;Mark Zuc…

机器学习从理论到工程的第二步-开发环境与工具篇(下)

好啦~继续昨天的《第二步——开发环境与工具篇&#xff08;上&#xff09;》~其实有点尴尬啦&#xff0c;本来想一篇讲完的&#xff0c;结果小夕太啰嗦了&#xff0c;还没有开始讲正文&#xff0c;就写了快2000字了。。。所以说&#xff0c;这一篇是上一篇的正文。。。matlab就…

阿里-2019算法岗笔试编程题-kmp匹配

版权声明&#xff1a;本文为博主原创文章&#xff0c;未经博主允许不得转载。 https://blog.csdn.net/qq_25737169/article/details/82503724 </div><link rel"stylesheet" href"https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_…

IBM量子处理器,将突破1000位

来源&#xff1a;半导体行业观察IBM的CONDOR是世界上第一台拥有超过1000个量子比特的通用量子计算机&#xff0c;它将于2023年首次亮相。预计这一年IBM还将推出Heron&#xff0c;这是该公司表示可能对其有所帮助的新型模块化量子处理器群中的第一个到2025年生产出超过4000个量子…

ChatGPT到底有多聪明?我测试了ChatGPT的数学能力

来源&#xff1a;AI前线译者&#xff1a;马可薇 人人都听说过最新&#xff0c;也是最复杂的聊天机器人 chatGPT。而众所周知&#xff0c;它在英文文学等“软话题”方面甚是熟练&#xff0c;所以我决定测试它在数学这类“硬话题”方面的表现。你可能不知道&#xff0c;但我是有…

从朴素贝叶斯到贝叶斯网

回顾在文章《朴素贝叶斯》中&#xff0c;小夕为大家介绍了朴素贝叶斯模型的基本知识&#xff0c;并且得出了朴素贝叶斯是利用联合概率P(x1,x2,x3...xn,y)来确定某个样本为某个类别的概率&#xff0c;进而利用最大后验概率&#xff08;MAP&#xff09;来决策类别。也就是说&…

2022年,谁在数学史上永远留下了姓名

来源&#xff1a;新智元这一年&#xff0c;数学领域有什么大事&#xff1f;Quanta Magazine做了一份全年总结。我们可以把数学家想象成考古学家——他们煞费苦心地拂去世界隐藏结构上的灰尘。起来很吸引人&#xff1f;“你的起点并不重要&#xff0c;但要眼光长远&#xff0c;了…

神经网络激活函数=生物转换器?

啊~昨晚躺了一个小时竟然没有睡着&#xff0c;美容觉泡汤了...于是竟然大半夜起来写了这篇文章在《逻辑回归到神经网络》中&#xff0c;小夕让神经网络冒了个泡。在《一般化机器学习与神经网络》中&#xff0c;将神经网络这一火热的模型强制按回机器学习一般框架里。在《BP算法…

从Encoder到Decoder实现Seq2Seq模型

首发于机器不学习关注专栏写文章从Encoder到Decoder实现Seq2Seq模型天雨粟模型师傅 / 果粉​关注他300 人赞同了该文章更新&#xff1a;感谢Gang He指出的代码错误。get_batches函数中第15行与第19行&#xff0c;代码已经重新修改&#xff0c;GitHub已更新。前言好久没有更新专…

市场增速超20%,国产操作系统“浴火重生” | 解读操作系统的 2022

作者 | 凌敏 本文是“2022 InfoQ 年度技术盘点与展望”系列文章之一&#xff0c;由 InfoQ 编辑部制作呈现&#xff0c;重点聚焦操作系统领域在 2022 年的重要进展、动态&#xff0c;希望能帮助你准确把握 2022 年操作系统领域的核心发展脉络&#xff0c;在行业内始终保持足够的…

线性代数应该这样讲(二)

在《...&#xff08;一&#xff09;》中&#xff0c;小夕从映射的角度讲解了矩阵及矩阵运算&#xff0c;这也是机器学习中看待矩阵的非常重要的视角。另一方面说&#xff0c;矩阵当然也是用于存储数据的数据结构&#xff0c;这也是最好理解的形式。另外还可以看做是一个线性方程…

2023将至,Bengio等大佬年度展望!懂理性的AI模型要来了?

来源&#xff1a;新智元【导读】2022年对AI来说注定是不平凡的一年&#xff0c;这不吴恩达、Bengio等一众圈内大佬在接受DeepLearning.ai的采访中都展望了2023年AI的发展趋势&#xff0c;还分享了自己的科研小故事。还有1天&#xff0c;2022年就要过去了。此前我们报道了吴恩达…

【NLP】Attention Model(注意力模型)学习总结

【NLP】Attention Model&#xff08;注意力模型&#xff09;学习总结郭耀华发表于郭耀华‘s Blog订阅294在这篇文章中&#xff1a;1. 什么是Attention机制&#xff1f;2. 先了解编码-解码框架&#xff1a;Encoder-Decoder框架3. Attention Model4. Attention机制的本质思想5. S…

杂谈机器学习的几个应用场景

在上一篇文章末尾&#xff0c;小夕提到了“机器学习是实现自然语言处理的正确道路”。其实确实如此&#xff0c;纵观整个自然语言处理的发展史&#xff0c;也是纵观整个人工智能的发展史&#xff0c;从诞生到现在&#xff0c;机器学习不仅是在理论和工程上实现自然语言处理的目…

2022年度十大AI技术盘点:AIGC风暴来袭,自动驾驶后会无期?

来源&#xff1a;AI科技大本营翻译 & 整理&#xff1a;杨阳“科学不能告诉我们应该做什么&#xff0c;只能告诉我们能做什么。”——让-保罗萨特《存在与虚无》这一年&#xff0c;AI又有哪些前沿技术突破呢&#xff1f;通过汇总梳理2022年10大AI技术&#xff0c;AI科技大本…

从逻辑回归到受限玻尔兹曼机

在那很久很久以前&#xff0c;可爱的小夕写了一篇将逻辑回归小题大做的文章&#xff0c;然后在另一篇文章中阐述了逻辑回归的本质&#xff0c;并且推广出了softmax函数。从那之后&#xff0c;小夕又在一篇文章中阐述了逻辑回归与朴素贝叶斯的恩仇录&#xff0c;这两大祖先级人物…