来源:ScienceAI
编辑:ScienceAI
近年来,人工智能(AI)快速发展,与此同时,越来越多的自然科学研究开始利用 AI 解决领域问题,比如助力药物研发、癌症疗法、材料发现,以及科研工具的研发。
ScienceAI 此前曾报道过鄂维南院士的演讲「机器学习与科学计算」,鄂院士指出接下来十年科学将成为 AI 的主战场。日前,在 2021 年云栖大会首日主论坛上,鄂维南院士的学生、深势科技创始人兼首席科学家张林峰博士作了题为「『AI+Science』:从科学愿景走向大规模工程化」演讲,进一步阐释了 AI 在基础科研领域的应用潜力和意义。
张林峰指出,AI 和 Science 是人类认识自然世界物理规律的两种不同范式,前者从数据中寻找规律,而后者致力于发现基本原理。AI 和 Science 的结合,将这两种认识世界的方式合二为一,将进一步释放科学研究与工业设计的生产力。
解决传统科学计算问题,AI 的系统性机会在哪里
张林峰指出,AI 和 Science,都是非常热的词。做 AI 的人们在过去的几年里完成了 CV、征服了 NLP,并雄心勃勃地思考哪里是下一个战场;而在基础学科做 Science 的研究者们,坚持恪守着自己的诗和远方,却时常受到于研究手段的限制,难以展开创造和想象力的释放。当这两者相融合,将会碰撞出怎样的火花?
长期以来,我们对世界的认知遵循着两大范式:开普勒范式和牛顿范式。前者从数据中提取规律,后者寻求基本原理。两者都能用来解决实际问题。当代 AI 在 CV、NLP 等领域的应用是集前者之大成,而当代仿真模拟和工业设计软件则是后者的精华沉淀。
开普勒范式面临的挑战是所谓「知其然不知其所以然」的问题,即模型的可解释性、可迁移性等;而牛顿范式面临的挑战是带来棘手又漫长的计算过程,即所谓「维度灾难」。
在精确程度和计算速度两难全的困局下,「AI+Science」带来了两种范式结合的可能性。
「AI+Science」意味着 AI 的复杂数据处理能力和 Science 的第一性原理的结合,本质上,是两种传统研究范式的结合。
由此,带来「AI+Science」的系统性机会。以机器学习为代表的 AI 具备复杂数据处理的能力,可以使得训练出来的物理模型兼具微观尺度的精度和宏观尺度的效率,能够真正有效解决科学计算中的「维度灾难」问题。
以斩获戈登贝尔奖的 Deep Potential 方法为例,张林峰展示了 AI 和分子动力学模型的有效结合,在保证精度的同时,指数级地提升了物理模型的效率。以这套方法为代表的全新范式,可以系统性地解决药物设计、材料设计和化工设计等领域中的微观设计层面问题,实现「既快又准」的计算模拟;在宏观的飞机、汽车、火箭设计领域也将有丰富的应用。
「AI+Science」大规模工程化正当时
Science(科学)是探索和理解未知的世界,而工程是还原到实践的过程。
张林峰强调,「AI+Science」的工程化正当时,可以从规模、数据、性能三个维度的工程化来理解。
首先是规模工程,便捷的云服务已经逐渐成为了基础设施,过去规模化的云服务主要面向购物、峰值支付等普通生活需求,中间架构更多是微服务的架构。而科学计算对它有巨大的需求,同时有着大规模并行、大规模并发离线计算以及多种计算资源混用调用等一系列新特点,这些新特点需要有好的架构支持和优秀的中间调度工具,规模工程要更加面向计算本身。
第二是数据工程,在很多 AI 应用领域,我们从最开始的基本数据积累逐渐到大数据、衍生出的大模型,然后基于这些 Pretrain 模型进行优化、压缩、做迁移等等。而「AI+Science」也可以做现在很火的大模型,玩模型迁移、模型压缩等,但它将需要面向物理,尊重物理约束。
最后是性能工程。过去也有不同尺度上的物理模型计算软件,发展至今经历了一系列的适配和优化的工作,改进的仅仅是面向不同类型硬件平台做出的定制化优化。而「AI+Science」召唤的是根据不同的计算类型去生产定制化硬件,科学计算的种种基础设施在当下或许已显老旧,积累了几十年,可能已经没有人愿意去清理、迭代了,而这个时候我们需要把它重新翻个底朝天,因为未来的性能工程将不再是软件对硬件的适配,而会是硬件对算法的定制。未来的「AI+Science」性能工程,将会是面向算法的。
重构基础设施的工作需要系统化努力,因此,「AI+Science」工程化需要的是科学家、工程师以及各行各业的协同作战。
张林峰指出打造「AI+Science」新一代基础设施的新思路——「开源协同」。「开源去中心的协同开发、在开发基础上快速地实现分布式评审,就是一种被验证且最佳的软件协同发展模式。
「AI+Science」的未来:解放科学研究与工业设计的生产力
张林峰最后强调,「AI+Science」的未来在于解放科学研究与工业设计的生产力。
科学家们将有更好的工具去聚焦他们感兴趣的问题,而面向不同场景的需求,我们会有更好的工业设计的工具。而深势科技正基于这样的一个「AI+Science」的范式,聚焦微观的尺度,打造微尺度工业设计平台。希望科学计算平台能用来解放科学家的生产力,用药物设计和材料设计两大平台解放这两个行业的研发生产力。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”