Science评论:深度学习助力高通量结构生物信息学

87bd303450bb4e2ced7be1b73b91a7fa.png

来源:集智俱乐部

作者:J. Pereira & T. Schwede

译者:刘培源 

审校:赵雨亭

编辑:邓一雪 

导语

以AlphaFold 2和RoseTTAfold等方法为代表的深度学习技术,不仅实现了蛋白质结构预测领域的突破性进展,也正在开启深度学习时代的相互作用组学研究。最近一篇发表在Science的工作,基于深度学习技术,创建了能够同时预测蛋白质-蛋白质相互作用的三维结构的新方法,并为作用过程建模。借助该技术,研究者甚至发现了许多此前从未观测到的相互作用。深度学习正在将以相互作用组学为代表的结构生物信息学推向新高度。

研究领域:深度学习,蛋白质结构,蛋白质互作,结构生物信息学

3b6e5d3b7ee959fc0cae238ff4ff0ee6.png

原文题目:

Interactomes in the era of deep learning

原文链接:

https://www.science.org/doi/10.1126/science.abm8295

1. 传统蛋白互作与计算建模的加入

表征大分子相互作用可以更好地理解细胞内部运作。但是,如今所有可用的方法都有其局限性:一些方法告诉我们两个大分子是否相互作用,另一些方法提供关于相互作用对象的原子细节,或者仅仅是没有细胞背景的孤立组件的结构。Humphreys等人最近发表于Science论文[1]描述了一种新的计算方法,它建立在结构生物信息学中正在进行的深度学习革命[2,3]的基础上,同时预测蛋白质-蛋白质相互作用的三维结构的组成与建模。他们将其方法应用于真核系统——面包酵母菌,并预测和准确模拟了1500多种蛋白质-蛋白质相互作用,其中有106种是第一次实现。这为整个细胞的高通量、高精度建模铺平了道路。

测定大分子在3D结构层面上的相互作用提供了有关大分子机制的重要信息,这些信息可以用于药物开发或生物技术开发等。高分子结晶(MX)和高分辨率低温电子显微镜(cryo-EM)等实验结构生物学方法,提供了大分子结构及其组装的原子级的细节[4]。这样的实验操作复杂:需要从细胞环境中提纯大分子。虽然诸如酵母双杂交(Y2H)和交联质谱(XL-MS)等技术允许大规模检测相互作用对象,但定点诱变或Förster能量共振转移(FRET)实验等方法能够表征单个相互作用与界面。这些信息可以用来指导装配体建模,例如通过分子对接的综合(或混合)方法,将来自低分辨率实验的各种数据类型与计算建模相结合,以生成大分子装配体的3D表示[5]。

近年来,结构生物学的视野因为结构预测计算技术而急剧扩大(如下图所示),这得益于机器学习算法的发展[6]以及开放数据库中实验信息的快速增长。例如蛋白质数据库(今年庆祝成立50周年)。自1994年以来,结构预测的临界评估(CASP)实验为检测蛋白质结构预测方法提供了一个平台,并且在其发展中经历了(也激发了)数次革命[7]。例如,用于检测远程同源关系的灵敏方法促进了基于同源性的建模,并且协同进化信息的使用进一步改进了没有已知结构同源物的蛋白质的模型。后一种方法是基于进化耦合的思想,从多序列比对中提取的耦合信号可以用来预测三维空间中的密切接触。这不仅被证明对蛋白质3D结构预测很有用,而且很容易扩展到分子间相互作用的领域:例如一种快速和准确的方法来筛选和预测蛋白质相互作用对(protein-interacting pairs,如大肠杆菌的蛋白质组)[8,9]。

2. 深度学习助力预测蛋白质互作

今年,结构生物信息学有了新突破,崭新时代开启[2,3]:DeepMind的AlphaFold2算法[6]成为第一个在CASP竞赛[10]中能够对单个蛋白质结构达到接近实验原子精读的计算方法[10]。其成功基础是综合使用了最先进的深度学习方法、大规模计算能力以及过去50年积累的海量结构和序列数据。这促进了科学社区中快速而激烈的活动——RoseTTAfold作为AlphaFold2的学术竞争对手迅速崛起[11]。这两种方法都使用了最先进的深度学习方法,但是它们的核心架构不同。尽管如此,两者重要的共同点是使用了多序列比对的进化耦合(evolutionary couplings from multiple sequence alignments)——在其底层往网络中得到有效处理,从而预测原子间接触,并根据氨基酸序列准确计算目标蛋白质中原子的3D坐标。鉴于此类信号在识别蛋白质间相互作用方面已取得成功[8,9],因此探索此类方法对于在原子水平上改进蛋白质间相互作用及其组装的预测和建模是有意义的。

2d4b9d927489e0b7810bc864810f57f3.png

研究大分子机器方法示意图。基于深度学习方法补充了实验技术,允许对蛋白质组装进行全蛋白质组的预测和建模

虽然大多数的努力集中在改造AlphaFold2和RoseTTAFold工作流程以模拟已知组成和化学计量的蛋白质复合物[12],但Humphreys等人将RoseTTAFold的接触预测算法的速度与AlphaFold2折叠引擎的高精度相结合,并提出了一种新方法来同时准确预测和建模面包酵母菌蛋白质组中的蛋白质相互作用对——这是第一个被以如此高通量方式对其相互作用进行建模的真核生物。Humphreys等人扫描了大约800万对蛋白质,根据强烈的协同进化信号预测了哪些蛋白质之间更可能发过相互作用,并且通过连接对(joint pair)的蛋白质结构预测取代大分子连接(macromolecular docking),以模拟组装的3D结构。该方法能够准确预测1500多个相互作用对的组成并对其结构建模。这些相互作用对几乎涵盖了所有关键的真核细胞过程,包括106种未被描述的组合(可能会突显出此前未知的生物过程),以及600多个此前已知的相互作用对(根据低分辨率生物物理数据)。

Humphreys等人的工作向高分辨率的整个细胞模型迈进了一步,并且已经启发了对人类线粒体相互作用的进一步研究[13]。目前,如高分子结晶和电子显微镜(EM)方法可以提供单个大分子机器的高分辨率原子表示。细胞低温电子断层成像有可能提供大分子相互作用网络的详细快照,但迄今为止只能获得亚纳米分辨率[14]。基于人工智能的高精度蛋白质组相互作用模型,可能能够及时弥补分辨率差距——尤其是对于更复杂的生物体。尽管如此,AlphaFold2和RoseTTAFold等方法提供了静态模型,未来还需要解决大分子组装的瞬态和动态特性。

这项工作还突出了开放科学和基于社区的方法开发的成功。由一家商业公司开发的AlphaFold2,向这个科学社区公开模型及其源代码。这促进了不同目标基于AI的生物信息学方法的快速发展,例如Humphreys等人的研究。基于人工智能方法显然正在促进未来生命科学研究方式的转变,其中3D计算模型将经常激发新的可实验验证的假说。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

1f04e190444ed58c7487c0b44f4ed9fb.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482855.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

repeater使用1

<td><!--kaishi--><asp:Repeater ID"Repeater1"runat"server"><HeaderTemplate><%--这里是头模板--%><table width"100%"border"0"cellspacing"0"cellpadding"0"><tr cla…

2.2.1.处理机调度的概念,层次

2.2.1.处理机调度的概念&#xff0c;层次 文章目录2.2.1.处理机调度的概念&#xff0c;层次1.知识总览2.调度的基本概念3.调度的三个层次3.1调度的三个层次--高级调度3.2调度的三个层次--中级调度3.3.补充知识&#xff1a;进程的挂起态与七状态模型3.4.调度的三个层次--低级调度…

通过学习生物范式,寻找解决AI识别噪音的新方法

来源&#xff1a;ScienceAI编辑&#xff1a;萝卜皮人工智能可以看到我们看不到的东西——通常是有害的。虽然机器在识别图像方面已经非常擅长&#xff0c;但仍然很容易愚弄它们。只需在输入图像中添加少量人眼无法察觉的噪声&#xff0c;AI 就会突然将校车、狗或建筑物归类为完…

2.2.2.进程调度的时机切换与过程、方式

2.2.2.进程调度的时机切换与过程、方式 文章目录2.2.2.进程调度的时机切换与过程、方式1.知识概览2.时机3.切换与进程3.1进程的切换与过程4.方式4.1抢占式和非抢占式5.知识回顾1.知识概览 2.时机 3.切换与进程 3.1进程的切换与过程 4.方式 4.1抢占式和非抢占式 5.知识回顾

2022年十大卫星技术创新及发展趋势

文章转载自微信公众号卫星与网络本文转载自“中信卫星”原标题&#xff1a;《2022年十大卫星技术趋势和创新》文 &#xff1a;StartUs Insights卫星的技术创新使整个航天工业取得了很大的进步。现在小型化卫星或小卫星&#xff0c;特别是纳卫星&#xff0c;已成为卫星发展的一个…

UVA 1599 Ideal Path

题目链接&#xff1a;https://vjudge.net/problem/UVA-1599 题目分析与翻译摘自《算法禁赛入门经典》 题目大意 给一个 n 个点 m 条边&#xff08;2 ≤ n ≤ 100000&#xff0c;1 ≤ m ≤ 200000&#xff09;的无向图&#xff0c;每条边上都涂有一种颜 色。求从结点 1 到结点 n…

2.2. 3.调度算法的评价指标

2.2. 3.调度算法的评价指标 文章目录2.2. 3.调度算法的评价指标1.知识概览2.cpu利用率3.系统吞吐量4.周转时间1.知识概览 2.cpu利用率 3.系统吞吐量 4.周转时间

谷歌等揭露「AI任务疑难」:存在局限的ImageNet等基准,就像无法代表「整个世界」的博物馆...

来源&#xff1a;AI科技评论作者&#xff1a;杏花编辑&#xff1a;青暮在日常生活中&#xff0c;我们需要一些「标准」来衡量个人的行为。而在科研工作中&#xff0c;研究人员也需要一些「基准」来评估模型的性能。因此&#xff0c;不管是普遍的「标准」还是特定的「基准」&…

如何配置Xshell连接Ubuntu

查看Ubuntu主机 IP命令: sudo –ifconfig –a 查看SSH服务是否启动命令: sudo –e|grep ssh ssh服务启动后&#xff0c;可以同时看到"ssh-agent"和"sshd"服务。 如果只有ssh-agent表示还没启动,需要通过sudo /etc/init.d/ssh start启动ssh server. 可通过…

spring-security-学习笔记-01-基本概念

Spring Security OAuth2.0认证授权 文章目录Spring Security OAuth2.0认证授权配套资源1.基本概念1.1.什么是认证1.2 什么是会话1.2 什么是授权1.3 授权的数据模型1.4 RBAC1.4.1 基于角色的访问控制1.4.2 基于资源的访问控制配套资源 企业开发首选的安全框架Spring Security深…

基于HC-SR04传感器的避障机器人设计与实现

本文介绍了如何设计和实现一个基于HC-SR04超声波传感器的避障机器人。我们将详细讨论硬件和电路连接&#xff0c;并提供完整的Arduino代码。该机器人可以利用超声波传感器检测周围的障碍物&#xff0c;并采取相应的动作进行避障&#xff0c;实现自主导航。 引言&#xff1a; 避…

伦敦大学学院、UC伯克利联手,撰文综述深度强化学习泛化研究

来源&#xff1a;机器之心编辑&#xff1a;陈萍强化学习应用广泛&#xff0c;但为何泛化这么难&#xff1f;如果要在现实世界的场景中部署强化学习算法&#xff0c;避免过度拟合至关重要。来自伦敦大学学院、UC 伯克利机构的研究者撰文对深度强化学习中的泛化进行了研究。强化学…

spring-security-学习笔记-02-基于Session的认证方式

spring-security-学习笔记-02-基于Session的认证方式 文章目录spring-security-学习笔记-02-基于Session的认证方式2 基于Session的认证方式2.1 认证流程2.2.创建工程2.2.1 创建maven工程2.2.2 Spring 容器配置2.2.3 servletContext配置2.2.4 加载 Spring容器2.3.实现认证功能2…

2021 年不可错过的 40 篇 AI 论文,你都读过吗?

来源&#xff1a;机器之心编辑&#xff1a;蛋酱虽然世界仍在从新冠疫情的破坏中复苏&#xff0c;人们无法向从前那样时常线下相聚、共同探讨交流关于学术领域的最新问题&#xff0c;但AI研究也没有停下跃进的步伐。转眼就是2021年底了&#xff0c;一年就这么就过去了&#xff0…

spring-security-学习笔记-03-spring-security快速上手

spring-security-学习笔记-03-spring-security快速上手 文章目录spring-security-学习笔记-03-spring-security快速上手3-spring-security快速上手3.1 Spring Security介绍3.2 创建工程3.2.1 创建maven工程3.2.2 spring容器配置3.2.3 Servlet Context配置3.2.4 加载 Spring容器…

所有的科学知识都是不确定的

理查德菲利普费曼&#xff08;Richard Phillips Feynman&#xff09;&#xff0c;1918年5月11日—1988年2月15日&#xff0c;美国著名理论物理学家&#xff0c;1965年&#xff0c;因在量子电动力学方面的成就而获得诺贝尔物理学奖。来源&#xff1a;科学技术哲学一、不存在决定…

2.1.1物理层基本概念

2.1.1物理层基本概念 文章目录2.1.1物理层基本概念

神经网络为大脑如何运作提供新见解

来源&#xff1a;ScienceAI编辑&#xff1a;萝卜皮单细胞空间转录组学&#xff08;sc-ST&#xff09;有望阐明复杂组织的结构方面。此类分析需要通过将 sc-ST 数据集中的细胞类型与单细胞 RNA-seq 数据集集成来对它们进行建模。然而&#xff0c;这种整合并非微不足道&#xff0…

2.1.2数据通信基础知识

文章目录2.1.2数据通信基础知识0 思维导图1. 典型的数据通信模型2 数据通信相关术语3 三种通信方式4 两种数据传输方式2.1.2数据通信基础知识 0 思维导图 1. 典型的数据通信模型 2 数据通信相关术语 3 三种通信方式 4 两种数据传输方式

一文读懂MEMS技术4大主要分类及应用领域

来源&#xff1a;传感器专家网MEMS传感器是在微电子技术基础上发展起来的多学科交叉的前沿研究领域。经过四十多年的发展&#xff0c;已成为世界瞩目的重大科技领域之一。它涉及电子、机械、材料、物理学、化学、生物学、医学等多种学科与技术&#xff0c;具有广阔的应用前景。…