科学家们正在使用人工智能来构想革命性的新蛋白质

0997cd44d49609edce0425f8c9ca342b.png来源:ScienceAI

编译:白菜叶

6 月,韩国监管机构授权使用人类设计的新型蛋白质制成首个药物,即 COVID 疫苗。该疫苗基于研究人员近十年前通过劳动密集型试错过程创造的球形蛋白质「纳米颗粒」。

现在,由于人工智能(AI)的巨大进步,由西雅图华盛顿大学(UW)的生物化学家 David Baker 领导的一个团队在《科学》杂志上报告说,它可以在几秒钟而不是几个月内设计出这样的分子。

这些努力是科学巨变的一部分,因为诸如 DeepMind 的蛋白质结构预测软件 AlphaFold 等人工智能工具已被生命科学家所接受。7 月,DeepMind 透露,最新版本的 AlphaFold 已经预测了科学界已知的每种蛋白质的结构。最近几个月,人工智能工具出现了爆炸性增长——其中一些基于 AlphaFold——可以迅速构想出全新的蛋白质。此前,这是一项艰苦的追求,失败率很高。

「自 AlphaFold 以来,我们处理蛋白质设计的方式发生了转变。」西班牙赫罗纳大学的计算生物学家 Noelia Ferruz 说,「我们正在见证非常激动人心的时刻。」

大多数努力都集中在可以帮助制造原始蛋白质的工具上,这些蛋白质的形状不同于自然界中的任何东西,而没有过多地关注这些分子可以做什么。但研究人员——以及越来越多将人工智能应用于蛋白质设计的公司——希望设计出可以做有用事情的蛋白质,从清理有毒废物到治疗疾病。致力于实现这一目标的公司包括伦敦的 DeepMind 和加利福尼亚州门洛帕克的 Meta(原 Facebook)。

「这些方法已经非常强大了。他们会变得更强大。」Baker说,「问题是你要用他们解决什么问题。」

从头开始

Baker的实验室在过去的三年里一直在制造新的蛋白质。他的实验室于 1990 年代开始开发名为 Rosetta 的软件,该软件将流程分为多个步骤。最初,研究人员设想了一种新蛋白质的形状——通常是通过将其他蛋白质拼凑在一起——软件推断出与这种形状相对应的氨基酸序列。

但是这些「初稿」蛋白质在实验室制造时很少折叠成所需的形状,而是最终陷入了不同的确认中。因此需要另一个步骤来调整蛋白质序列,使其仅折叠成一个所需的结构。曾在 Baker 实验室工作的哈佛大学进化生物学家 Sergey Ovchinnikov 表示,这一步涉及模拟不同序列可能折叠的所有方式,计算成本很高。「你真的会让 10,000 台计算机运行数周来执行此操作。」

Ovchinnikov 说,通过调整 AlphaFold 和其他人工智能程序,这个耗时的步骤变得瞬间完成。在Baker团队开发的一种称为幻觉的方法中,研究人员将随机氨基酸序列输入到结构预测网络中。根据网络的预测,这会改变结构,使其变得更像蛋白质。在 2021 年的一篇论文中,Baker的团队在实验室中创造了 100 多种小的「幻觉」蛋白质,并发现了大约五分之一与预测形状相似的迹象。

AlphaFold 和 Baker 实验室开发的名为 RoseTTAFold 的类似工具经过训练,可以预测单个蛋白质链的结构。但研究人员很快发现,这样的网络也可以模拟多种相互作用蛋白质的组装。在此基础上,Baker和他的团队相信他们可以产生幻觉蛋白质,这些蛋白质会自组装成不同形状和大小的纳米粒子。这些将由单个蛋白质的多个副本组成,并且类似于 COVID-19 疫苗所基于的那些。

e02224bcb7c67405ce94cfeddc66109d.jpeg

但是当他们指导微生物在实验室中进行创造时,150 种设计都没有奏效。「它们根本没有折叠:它们只是粘在试管底部。」Baker说。

大约在同一时间,实验室的另一位研究员、机器学习科学家 Justas Dauparas 正在开发一种深度学习工具来解决所谓的逆折叠问题——确定与给定蛋白质的整体形状相对应的蛋白质序列。Ovchinnikov 说,这个名为 ProteinMPNN 的网络可以充当使用 AlphaFold 和其他工具创建的设计蛋白质的「拼写检查」,方法是在保持分子整体形状的同时调整序列。

当 Baker 和他的团队将第二个网络应用于他们的幻觉蛋白质纳米粒子时,它在实验上制造了分子,取得了更大的成功。研究人员使用低温电子显微镜和其他实验技术确定了 30 种新蛋白质的结构,其中 27 种与 AI 主导的设计相匹配。该团队的创作包括具有复杂对称性的巨型环,不同于自然界中发现的任何东西。共同领导这项工作的生物物理学家 Lukas Milles 说,从理论上讲,该方法可用于设计与几乎任何对称形状相对应的纳米粒子。「看到这些网络能做什么令人兴奋。」

深度学习革命

斯德哥尔摩大学的计算生物学家 Arne Elofsson 表示,蛋白质 MPNN 等深度学习工具已经改变了蛋白质设计的游戏规则。「你画出你的蛋白质,按下一个按钮,你就会得到十分之一有效的东西。」正如 Baker 的团队在设计纳米粒子时所做的那样,通过组合多个神经网络来处理设计过程的不同部分,可以实现更高的成功率。「现在我们可以完全控制蛋白质的形状。」Ovchinnikov 说。

Baker 团队并不是唯一一家将 AI 应用于蛋白质设计的实验室。在 9 月发布到 bioRxiv 的一篇评论论文中,Ferruz 团队统计了近年来使用各种方法开发的 40 多种 AI 蛋白质设计工具。

包括 proteinMPNN 在内的许多工具都解决了逆折叠问题:它们指定了与特定结构相对应的序列,通常使用从图像识别工具中借鉴的方法。其他一些基于类似于语言神经网络(如 GPT-3)的架构,可生成类似人类的文本;但是,相反,这些工具能够产生新的蛋白质序列。「这些网络能够『说』蛋白质。」Ferruz 说,她们共同开发了一个这样的网络。

加州大学伯克利分校的机器学习研究员 Chloe Hsu 与 Meta 的研究人员一起开发了一个反向折叠网络,他说,有这么多可用的蛋白质设计工具,如何最好地比较它们并不总是很清楚。

c0796d3c5e1ae607325054893367cbad.gif

许多团队评估他们的网络从结构中准确确定现有蛋白质序列的能力。但这并不适用于所有方法,科学家们表示,目前尚不清楚这个被称为回收率的指标如何适用于新型蛋白质的设计。Ferruz 希望看到一场蛋白质设计竞赛,类似于两年一次的蛋白质结构预测关键评估(CASP)实验,其中 AlphaFold 首次展示了其优于其他网络的优势。「这只是个梦。像 CASP 这样的东西真的会推动这个领域向前发展。」她说。

到湿实验室去

Baker 和他的同事们坚信,在实验室中制造一种新型蛋白质是对他们方法的最终测试。他们最初未能制造出幻觉的蛋白质组装体表明了这一点。「AlphaFold 认为它们是非常棒的蛋白质,但它们显然在湿实验室中不起作用。」Baker 实验室的生物物理学家 Basile Wicky 说,他与 Baker、Milles 和威斯康星大学生物化学家 Alexis Courbet 共同领导了这项工作。

但伊利诺伊州芝加哥丰田技术研究所的计算生物学家许锦波指出,并非所有为蛋白质设计开发 AI 工具的科学家都能轻松获得实验装置。寻找合作实验室需要时间,因此许锦波正在建立自己的湿实验室,以测试他的团队的创造。

Baker 说,在设计具有特定任务的蛋白质时,实验也很重要。7 月,他的团队描述了两种人工智能方法,使研究人员能够将特定序列或结构嵌入到一种新型蛋白质中。他们使用这些方法来设计催化特定反应的酶;能够与其他分子结合的蛋白质;以及一种可用于疫苗中的蛋白质,这种病毒是婴儿住院的主要原因。

去年,DeepMind 在伦敦成立了一家名为 Isomorphic Labs 的衍生公司,打算将 AlphaFold 等人工智能工具应用于药物发现。DeepMind 的首席执行官 Demis Hassabis 表示,他认为蛋白质设计是深度学习技术,尤其是 AlphaFold 的明显且有前途的应用。「我们在蛋白质设计领域做了很多工作。现在才刚开始。」

相关报道:https://www.nature.com/articles/d41586-022-02947-7

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

2a269bb77dbda3a0cb0570d1db165c9d.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481619.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

多模态认知计算

来源:图灵人工智能 日常生活中, 人类至少利用视觉, 听觉等多种感官理解周围环境, 通过整合多种感知模态, 形成对事件的整体认识. 为使机器更好地模仿人类的认知能力, 多模态认知计算模拟人类的“联 觉”(Synaesthesia), 探索图像, 视频, 文本, 语音等多模态输入的高…

知识表示与知识图谱--介绍

知识表示与知识图谱 知识支撑 人类理解需要机器也需要知识工程 手段:信息技术特点:高效率、大容量目标:获取并利用知识与信息的技术例子 第一个专家系统:费根鲍姆知识工程语言TUILI--1982--陆汝衿专家系统开发环‘天马’--1987--…

「图学习推荐系统」最新2022综述

来源:专知协同过滤是一种被广泛应用于推荐系统中的方法,其利用不同用户之间(或不同物品之间)的相似性关系来过滤和抽 取用户和物品的交互信息,从而进行用户推荐.近年来,图神经网络因其出色的表示学习性能和良好的可扩展性逐渐成为推荐 领域中的一种新兴的范式.文中从…

2知识图谱的生命周期

知识图谱的生命周期 知识图谱 知识建模--建立本体ontolog 建什么 概念、实体的类型概念/实体的关联关系要求:可靠性方法 自顶向下--专家手工形成数据模式自底向上--实体--类 利用现有的标准转换从现有的高质量数据源中进行映射:用知识图谱--抽象建模--来…

nlp1-介绍

能做什么? 自然语言处理: 如何让计算机能够自动或半自动地理解自然语言文本,懂得人的意图和心声?如何让计算机实现海量语言文本的自动处理、挖掘和有效利用,满足不同用户的各种需求,实现个性化信息服务&…

经纬张颖:给科研技术背景创始人的十条建议

来源:动脉橙果局编辑: Light出品: 科技智谷"给科研技术背景创始人的十条建议近一年,随着经纬在科技类公司的投资比例更大、金额更多,我和这类创始人们也进行了更高频次的交流,更多地了解了他们的困惑和…

nlp2-数学基础(信息论,概率论、词义消歧)

文章目录概率论信息论计算熵计算信息熵、条件熵、联合熵波利尼亚语熵率噪声信道模型建立一个翻译词义消歧(WSD贝叶斯最大熵的消歧方法概率论 在自然语言处理中,以句子为处理单位时一般假设句子独立于它前面的其它语句,句子的概率分布近似地符…

格鲁夫12年前惊人的预言,解释了今天美国对中国芯片所做的一切

来源: 未尽研究从芯片到光伏和动力电池,英特尔前董事长和CEO格鲁夫惊人地预言了美国制造业与科技当下所遇到的麻烦。他是一位以严厉著称的CEO,在美国金融危机刚结束之际,在商业杂志的封面发表了一篇犀利的评论。尤其是在美国硅谷如…

真正的人工智能,需要理解本体论

来源:混沌巡洋舰人工智能的终极语境是什么?真正的人工智能,需要理解本体论现在的人工智能技术突破或许具有划时代意义,但即使是计算能力最强大、最先进的机器,也达不到人类智能的层级。人工智能具备测算能力&#xff0…

知识图谱-架构图

binlog-MySQL的日志 用于实时处理与离线增量导入架构 Kafka消息队列 老虎队队长(AV75056045)

知识图谱2-知识表示

知识表示的重要性 知识是智能的基础 机器可以获得知识机器可以运用知识符合计算机要求的知识模式 计算机能存储处理的知识表示模式数据结构ER模型Sql与RDF模型SPARQL对比 关系模型 关系显式定义(RDF) 关系隐式定义(ER)(理解后写出来的表 数据变更时 RDF--数据变更…

韩国芯片教父:金钟基如何带领韩国成为半导体超级大国

来源 :大数据文摘编译:Mickey来源:https://spectrum.ieee.org/kim-choong-ki在韩国芯片行业有这样一群人的传说,他们被称为“金氏黑手党”。金钟基本人不会这么称呼这群人,但对韩国的半导体工程师们来说,“金氏黑手党”…

论文学习1-DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

文章目录摘要Introduction最近工作基于PRA的其他方法其他使用强化学习的方法我们的方法方法介绍(强化学习摘要 研究了大规模知识图的学习推理问题。更具体地说,我们描述了一个用于学习多跳关系路径的新型强化学习框架:我们使用一个基于知识图嵌入的具有…

万字因果推断入门:为什么要做因果推断?

来源:PaperWeekly1、为什么需要因果推断1.1 辛普森悖论首先,考虑一个与现实情况很相关的例子:针对某种新冠病毒 COVID-27,假设有两种疗法:方案 A 和方案 B,B 比 A 更稀缺(耗费的医疗资源更多&am…

论文学习2-Incorporating Graph Attention Mechanism into Knowledge Graph Reasoning Based on Deep Reinforce

文章目录摘要介绍相关工作方法Mean Selection Rate (MSR) and Mean Replacement Rate (MRRIncorporating Graph Attention Mechanism into Knowledge Graph Reasoning Based on Deep Reinforcement Learning摘要 知识图(KG)推理的目的是寻找关系的推理路径,以解决K…

报告下载:《2022城市大脑首部建设标准资料汇总》

2022年9月1日,中国指挥与控制学会正式发布城市大脑首批三项标准,这部《2022城市大脑首部建设标准资料汇总》除了包含发布的三项标准全文内容,还汇总了城市大脑标准研究团队2022年以来的相关研究资料,完整内容包括:1. 解…

nlp3-有限自动机FLandFA

文章目录1形式语言1.2形式语言3推导3.1句型、句子、语言3.2文法3.3派生树与二义性4有限自动机和正则文法4.1确定的有限自动机DFA4.2不确定的有限自动机NFA4.3有限自动机<>正则文法5.下推自动机PDA和上下文无关文法CFG5.1PDA5.1.1 PDA的例子.5.2 其他自动机5.2.1 区别6. 有…

经常看蓝色的东西能提升智力?科学研究发现,蓝色能改变意识状态

来源&#xff1a;科学的乐园我们的宇宙是一个“多姿多彩”的美丽时空&#xff0c;从人类睁开眼的那一刻开始&#xff0c;映入眼帘的就是一个五颜六色的世界。根据科学家的统计&#xff0c;人眼可以识别的电磁波频段包含100多万种“组合颜色”。这要归功于我们视觉系统得天独厚的…

论文学习3-Improving Neural Fine-Grained Entity Typing with Knowledge Attention

文章目录1 当前不足2. 本文的想法3.相关工作4.KNET4.1encoder4.2类型预测4.3attention5.实验6.以后Improving Neural Fine-Grained Entity Typing with Knowledge Attention用于&#xff1a;Fine-grained entity typing细粒度实体类型(它将实体划分为大量细粒度类型&#xff0c…

深度学习和因果如何结合?北交最新《深度因果模型》综述论文,31页pdf涵盖216篇文献详述41个深度因果模型...

来源&#xff1a;专知北京交通大学最新《深度因果模型》综述论文&#xff0c;31页pdf涵盖216页pdf详述41个深度因果模型&#xff0c;值得关注&#xff01;因果关系概念在人类认知中起着重要作用。在过去的几十年里&#xff0c;因果推理在计算机科学、医学、经济学和教育等许多领…