AI+Science 是人类两大科研范式的结合,工程化正当时

89f1e2113b754676536bed67e2edafe6.png

来源:ScienceAI

编辑:ScienceAI

近年来,人工智能(AI)快速发展,与此同时,越来越多的自然科学研究开始利用 AI 解决领域问题,比如助力药物研发、癌症疗法、材料发现,以及科研工具的研发。

ScienceAI 此前曾报道过鄂维南院士的演讲「机器学习与科学计算」,鄂院士指出接下来十年科学将成为 AI 的主战场。日前,在 2021 年云栖大会首日主论坛上,鄂维南院士的学生、深势科技创始人兼首席科学家张林峰博士作了题为「『AI+Science』:从科学愿景走向大规模工程化」演讲,进一步阐释了 AI 在基础科研领域的应用潜力和意义。

张林峰指出,AI 和 Science 是人类认识自然世界物理规律的两种不同范式,前者从数据中寻找规律,而后者致力于发现基本原理。AI 和 Science 的结合,将这两种认识世界的方式合二为一,将进一步释放科学研究与工业设计的生产力。

8642170a256340eedf21e14ed05fe515.png

解决传统科学计算问题,AI 的系统性机会在哪里 

张林峰指出,AI 和 Science,都是非常热的词。做 AI 的人们在过去的几年里完成了 CV、征服了 NLP,并雄心勃勃地思考哪里是下一个战场;而在基础学科做 Science 的研究者们,坚持恪守着自己的诗和远方,却时常受到于研究手段的限制,难以展开创造和想象力的释放。当这两者相融合,将会碰撞出怎样的火花?

长期以来,我们对世界的认知遵循着两大范式:开普勒范式和牛顿范式。前者从数据中提取规律,后者寻求基本原理。两者都能用来解决实际问题。当代 AI 在 CV、NLP 等领域的应用是集前者之大成,而当代仿真模拟和工业设计软件则是后者的精华沉淀。

开普勒范式面临的挑战是所谓「知其然不知其所以然」的问题,即模型的可解释性、可迁移性等;而牛顿范式面临的挑战是带来棘手又漫长的计算过程,即所谓「维度灾难」。

在精确程度和计算速度两难全的困局下,「AI+Science」带来了两种范式结合的可能性。

「AI+Science」意味着 AI 的复杂数据处理能力和 Science 的第一性原理的结合,本质上,是两种传统研究范式的结合。

e5cc811c292c764e732d0a3ecb85c0f9.png

由此,带来「AI+Science」的系统性机会。以机器学习为代表的 AI 具备复杂数据处理的能力,可以使得训练出来的物理模型兼具微观尺度的精度和宏观尺度的效率,能够真正有效解决科学计算中的「维度灾难」问题。

以斩获戈登贝尔奖的 Deep Potential 方法为例,张林峰展示了 AI 和分子动力学模型的有效结合,在保证精度的同时,指数级地提升了物理模型的效率。以这套方法为代表的全新范式,可以系统性地解决药物设计、材料设计和化工设计等领域中的微观设计层面问题,实现「既快又准」的计算模拟;在宏观的飞机、汽车、火箭设计领域也将有丰富的应用。

4cfbe1d7aca5a1e162bb3b455b1d22ba.png

「AI+Science」大规模工程化正当时 

Science(科学)是探索和理解未知的世界,而工程是还原到实践的过程。

张林峰强调,「AI+Science」的工程化正当时,可以从规模、数据、性能三个维度的工程化来理解。

48eaf2202a32abbcb0c4824afe685d0d.png

首先是规模工程,便捷的云服务已经逐渐成为了基础设施,过去规模化的云服务主要面向购物、峰值支付等普通生活需求,中间架构更多是微服务的架构。而科学计算对它有巨大的需求,同时有着大规模并行、大规模并发离线计算以及多种计算资源混用调用等一系列新特点,这些新特点需要有好的架构支持和优秀的中间调度工具,规模工程要更加面向计算本身。

第二是数据工程,在很多 AI 应用领域,我们从最开始的基本数据积累逐渐到大数据、衍生出的大模型,然后基于这些 Pretrain 模型进行优化、压缩、做迁移等等。而「AI+Science」也可以做现在很火的大模型,玩模型迁移、模型压缩等,但它将需要面向物理,尊重物理约束。

最后是性能工程。过去也有不同尺度上的物理模型计算软件,发展至今经历了一系列的适配和优化的工作,改进的仅仅是面向不同类型硬件平台做出的定制化优化。而「AI+Science」召唤的是根据不同的计算类型去生产定制化硬件,科学计算的种种基础设施在当下或许已显老旧,积累了几十年,可能已经没有人愿意去清理、迭代了,而这个时候我们需要把它重新翻个底朝天,因为未来的性能工程将不再是软件对硬件的适配,而会是硬件对算法的定制。未来的「AI+Science」性能工程,将会是面向算法的。

重构基础设施的工作需要系统化努力,因此,「AI+Science」工程化需要的是科学家、工程师以及各行各业的协同作战。

张林峰指出打造「AI+Science」新一代基础设施的新思路——「开源协同」。「开源去中心的协同开发、在开发基础上快速地实现分布式评审,就是一种被验证且最佳的软件协同发展模式。

「AI+Science」的未来:解放科学研究与工业设计的生产力 

张林峰最后强调,「AI+Science」的未来在于解放科学研究与工业设计的生产力。

科学家们将有更好的工具去聚焦他们感兴趣的问题,而面向不同场景的需求,我们会有更好的工业设计的工具。而深势科技正基于这样的一个「AI+Science」的范式,聚焦微观的尺度,打造微尺度工业设计平台。希望科学计算平台能用来解放科学家的生产力,用药物设计和材料设计两大平台解放这两个行业的研发生产力。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

5321a1819c4999660c46e70873ddeaaf.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483509.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Docker 是一个开源的应用容器引擎

Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口。 Docker中包括三个基本概念…

【计算机网络复习 数据链路层】3.4.4 选择重传协议(SR)

选择重传协议(SR)一、选择重传协议中的滑动窗口二、SR发送方必须响应的三件事三、SR接收方要做的事四、滑动窗口长度五、总结一、选择重传协议中的滑动窗口 二、SR发送方必须响应的三件事 1、上层的调用 从上层收到数据后,SR发送方检查下一…

FZU - 2103 Bin Jing in wonderland

FZU - 2103 Bin & Jing in wonderland 题目大意:有n个礼物,每次得到第i个礼物的概率是p[i],一个人一共得到了k个礼物,然后按编号排序后挑选出r个编号最大的礼物。现在给出r个礼物的编号,问能得到这r个礼物的概率。…

登上Science子刊,神经科学再次启发DNN设计!中科院揭秘介观自组织反向传播机制...

来源:AI科技评论作者:张铁林,徐波论文标题:A Mesoscale Plasticity for Efficient AI Learning在人工智能领域,目前人工神经网络中被广泛使用的反向传播算法(Backpropagation,BP)采用…

【计算机网络复习 数据链路层】3.5.1 信道划分介质访问控制

信道划分介质访问控制一、传输数据使用的两种链路二、介质访问控制2.1 频分多路复用 FDM2.2 时分多路复用 TDM2.3 统计时分复用 STDM2.4 波分多路复用 WDM2.5 码分多路复用 CDM一、传输数据使用的两种链路 点对点链路:两个相邻节点通过一个链路相连,没有…

Nature:初步探索限制饮食如何影响肿瘤生长

来源:生物通近年来,有一些证据表明,饮食干预有助于减缓肿瘤的生长。麻省理工学院的一项新研究分析了小鼠的两种不同饮食,揭示了这些饮食是如何影响癌细胞的,并为为什么限制卡路里可以减缓肿瘤生长提供了解释。该研究检…

【计算机网络复习 数据链路层】3.5.2 ALOHA协议

一、纯ALOHA协议 纯ALOHA协议思想: 不监听信道,不按时间槽发送,随机重发。想发就发。 二、时隙ALOHA协议 时隙ALOHA协议的思想: 把时间分成若干个相同的时间片,所有用户在时间片开始时刻同步接入网络信道&#xff0c…

说好的「机器人出租车」和「自动驾驶汽车」,到底在哪? 原创 我爱至尊宝 科技行者 昨天...

来源:TheNexWeb编译整理:科技行者再有几周就到万圣节了,今年让人害怕的东西可不止是鬼怪、还有更多晦暗不明的新难题。 就拿自动驾驶汽车来说,技术人员直到现在也不清楚怎么才能在完全无需人类介入的情况下实现自主行驶。哪怕是代…

在Windows平台下使用Gitblit搭建Git服务器图文解说

Windows平台下Git服务器搭建 一.java环境变量的设置 下载jdk并配置jdk的环境变量,JAVA_HOME,CLASSPATH以及PATH,最后在DOS窗口输入java -version检验是否配置成功。这里参见jdk环境变量配置相关教程。 二.下载新版Gitblit.下载地址:http://ww…

“厌氧动物”出现,科学家不清楚代谢方式,或颠覆对生命的认知

来源:科学杂志众所周知,动物的生存的基本条件就是氧气。日常生活中,我们不会感到氧气的存在,因为它是无色无味且无处不在的。可以说,地球上能孕育生命的原因除了有水资源以外,氧气的存在也是重中之重。可当…

【计算机网络复习 数据链路层】3.5.4 CSMA-CD协议

CSMA-CD协议3.5.4 CSMA/CD协议一、CSMA/CD协议二、传播时延对载波监听的影响三、截断二进制指数规避算法四、最小帧长问题3.5.4 CSMA/CD协议 一、CSMA/CD协议 载波监听多点接入/碰撞检测 CSMA/CD(carrier sense multiple access with collision detection&#xf…

6G网络智能内生的思考

来源:6G俱乐部作者:李琴,李唯源,孙晓文,胡玉双:中国移动通信有限公司研究院研究员。孙滔:中国移动通信有限公司研究院主任研究员、网络创新实验室技术经理。面向6G时代,网络将迎来新…

实验四3

#include "stdafx.h" #include "stdio.h"int main(int argc, char* argv[]) {char a[81];int i;int num0,word0;char c;gets(a);for(i0;(ca[i])!\0;i)if(c )word0;else if(word0){word1;num;}printf("%d\n",num);return 0; } 转载于:https://www…

3 个问题:MIT专家论述关于阻碍AutoML发展的障碍

来源:ScienceAI编译:萝卜皮研究人员希望更多用户友好的机器学习系统将使非专家能够分析大数据——但这样的系统能完全自主吗?麻省理工学院计算机科学家 Kalyan Veeramachaneni 分享了他对自动化机器学习 (AutoML)现状、…

【计算机网络复习 数据链路层】3.6.1 局域网

局域网基本概念和体系结构局域网基本概念和体系结构一、局域网二、局域网拓扑结构三、局域网介质访问控制方法四、局域网的分类五、MAC子层和LLC子层局域网基本概念和体系结构 一、局域网 局域网 (Local Area Network):简称LAN,…

佐治亚理工学院发文:不要迷信可解释性,小心被误导

来源:AI科技评论编译:王晔校对: 琰琰可解释性对人工智能发展来说至关重要,但在可解释系统的可信度方面,理解其可能带来的负面效应亦同等重要。近日,佐治亚理工学院研究团队发表最新研究,重点讨论了可解释人工智能系统&…

【计算机网络复习 数据链路层】3.6.2 以太网

以太网一、以太网概述二、以太网提供无连接、不可靠的服务三、以太网传输介质与拓扑结构的发展四、10BASE-T以太网五、适配器与MAC地址六、以太网MAC帧七、高速以太网一、以太网概述 以太网(Ethernet)指的是由Xerox公司创建并由Xerox、Intel和DEC公司联…

软件开发冲刺1

站立会议: 分配好任务,在队长的带领下开始了为期十天的软件开发冲刺,我们做的是一款聊天无课表软件有了目标就有了动力。我们先对我们的产品做了一个详细的规划,指定每天的任务量,调试好开发环境,做好一切准…

一文了解机器人伺服系统

来源:传感器技术工业机器人有4大组成部分,分别为本体、伺服、减速器和控制器。而其中,工业机器人电动伺服系统的一般结构为三个闭环控制,即电流环、速度环和位置环。一般情况下,对于交流伺服驱动器,可通过对…

【计算机网络复习 数据链路层】3.6.5 PPP、HDLC

PPP协议和HDLC协议PPP协议和HDLC协议一、广域网二、PPP协议2.1 PPP协议的特点2.2 PPP协议应满足的要求2.3 PPP协议无需满足的要求2.4 PPP协议的三个组成部分2.5 PPP协议的帧格式三、HDLC协议3.1 HDLC的站3.2 HDLC的帧格式四、PPP协议 & HDLC协议PPP协议和HDLC协议 一、广域…