基于注意力的几何感知的深度学习对接模型 GAABind - 评测

GAABind 作者是苏州大学的生物基础与医学院, 期刊是 Briefings in Bioinformatics, 2024, 25(1), 1–14。GAABind 是一个基于注意力的几何感知蛋白-小分子结合模式与亲和力预测模型,可以捕捉小分子和蛋白的几何、拓扑结构特征以及相互作用。使用 PDBBind2020 和 CASF2016 作为训练数据集,可以达到 82% 的结合模式预测能力,亲和力的预测的皮尔森相关系数为 0.803。

一、背景介绍

GAABind 来源于苏州大学基础医学与生物科学学院的胡广教授为通讯作者的文章:《GAABind: a geometry-aware attention-based network for accurate protein–ligand binding pose and binding affinity prediction》。文章链接:https://academic.oup.com/bib/article/25/1/bbad462/7473491 。该文章在 2023 年 11 月 22 日发表于 《Briefings in Bioinformatics》 上。

准确预测结合构象和结合亲和力是计算方法理解蛋白质-配体相互作用的关键挑战。传统的分子对接工具在构象搜索采样时需要很高的计算成本。现有的深度学习方法在分子表示学习和分子间相互作用建模方面也不尽人意。为此,作者提出了 GAABind ,这是一种几何感知的基于注意力的深度学习模型,能够在多任务学习框架内有效预测口袋-配体结合构象结合亲和力。GAABind 全面捕捉了结合口袋和配体的几何和拓扑特性,并采用表达性强的分子表示学习来建模分子内相互作用。此外,GAABind 熟练地学习分子间的多体相互作用,并通过精心设计的网络模拟配体在与蛋白质相互作用过程中动态的构象适应。

作者在 PDBbind v2020 上训练了 GAABind,并在 CASF 2016数据集上进行了评估。结果表明 GAABind 在结合构象预测中的成功率达到 82.8%,而预测的结合亲和力与实验值之间的皮尔逊相关系数高达 0.803 。此外,作者还评估了 GAABind 在严重急性呼吸综合症冠状病毒 2 型主要蛋白酶交叉对接数据集上的表现。在该评估中,GAABind 在结合构象预测中的成功率达到 76.5%,并在结合亲和力预测中与所有基准方法相比,获得了最高的皮尔逊相关系数。

二、模型介绍

理解蛋白质-配体相互作用是药物开发中的一个重要步骤。由于实验方法的花费和时间成本较高,所以计算方法已经成为一种新的研究范式。计算识别蛋白质-配体相互作用的三个主要问题包括准确预测:(1) 结合位点:蛋白质表面配体可以结合的特定区域;(2) 结合构象:配体结合其靶蛋白时所采用的特定取向和构象;(3) 结合亲和力:相互作用的强度。

分子对接是一种广泛用于预测蛋白质-配体的结合构象和结合亲和力的计算方法。传统的对接工具通过两个主要操作来预测蛋白质-配体的结合构象和结合亲和力:构象采样和评分。

近年来,提出了许多基于深度学习的评分函数,预测结合亲和力。基于蛋白-小分子复合物的模型利用从蛋白质-配体结合结构中获取的分子间相互作用信息,通常优于无复合物模型。然而,大多数蛋白质-配体复合物结构并不可用,通过实验方法或对接技术获取复合物结构涉及高昂的成本和劳力。

只有少数基于深度学习的方法专门用于蛋白质-配体结合构象预测,包括 DeepDock、EDM-Dock、TankBind 和 Uni-Mol。这些方法通常由两个阶段组成。第一阶段专注于学习分子表示,而第二阶段则建模分子间相互作用,以预测蛋白质与配体之间的原子距离。预测的分子间距离随后被用于通过差分进化、反向传播或距离几何优化等策略生成结合构象。

在第一阶段,DeepDock、EDM-Dock 和 TankBind使用图模型来表示分子。然而,图模型面临过度平滑和捕捉长距离依赖性困难等挑战。相比之下,Uni-Mol 结合了原子和成对表示与基于变换器的网络,建模分子的 3D 结构。然而,输入的成对表示仅包含原子对之间的几何距离,缺乏对分子关键 2D 拓扑信息的整合。此外,成对表示仅从原子表示中接收更新的注意力权重,忽略了分子表示学习中成对之间的多体相互作用。

进入第二阶段,DeepDock 和 EDM-Dock 以成对方式连接分子图的节点特征,然后将其输入多层感知器以预测分子间距离。然而,这种简单的特征连接方法未能充分捕捉分子间相互作用的复杂性。Uni-Mol 将学习到的分子表示连接成口袋-配体复合物表示,随后作为整体分子通过基于变换器的网络预测原子距离,对分子间和分子内相互作用没有区别对待。TankBind 使用分子图的节点特征初始化口袋-配体相互作用嵌入,并使用一个结合分子内距离图的三角函数模块对其进行更新。虽然三角函数模块整合了分子内几何约束,但分子内距离图的使用并未全面整合分子内相互作用。

为了解决当前方法的局限性,作者提出了 GAABind,这是一种几何感知的基于注意力的网络,用于同时预测蛋白质-配体的结合构象和结合亲和力。

3D 结构在分子相互作用中发挥的重要作用,这促使作者将几何感知注意力纳入模型。这一机制通过整合几何信息扩展了传统的注意力模型,从而增强了原子间相互作用的建模,并实现了配体与蛋白质之间物理上合理的几何关系的学习。在 GAABind 中,作者利用原子和成对嵌入进行分子表示。原子嵌入用于表示分子中的每个原子,而成对嵌入则表示原子对之间的关系。GAABind 的核心在于原子-成对注意编码块和互交块。前者专注于学习富有表现力的分子表示,而后者有效建模口袋与配体之间的互相作用。通过利用这些组件,GAABind 对口袋-配体对距离、配体对距离和蛋白质-配体结合亲和力进行预测。基于预测的距离,作者采用简单高效的反向传播方法生成配体的结合构象。在 CASF 2016 基准数据集上的实验表明,GAABind 在结合构象预测方面的表现优于其他先进的基准方法。此外,GAABind 在预测结合亲和力方面表现相当,且不依赖于蛋白质-配体复合物结构作为输入。

文章的主要贡献如下:

(1)作者引入了原子-成对注意编码块(Atom–Pair Attentive Encoding Block),这是一种用于富有表现力的分子表示学习的新方法。在该块中,原子和成对嵌入交替更新并相互通信,促进了输入分子的分子内相互作用的全面编码。

(2) 为有效建模口袋与配体之间的互相作用,作者提出了互交块( Mutual Interaction Block)。该块涉及一个迭代过程,包括口袋/配体到复合物、复合物自更新和复合物到配体的信息流阶段,从而实现对对接过程的有效和动态建模。

(3) 通过结合原子-成对注意编码和互交块,作者提出了 GAABind,这是一个强大的框架,用于预测口袋-配体结合构象和结合亲和力。实验结果表明 GAABind 在这两项任务中的稳健表现。

2.1 模型框架

GAABind 的整体架构如下图所示。给定一个已知 3D 结构的结合口袋和处于任何未结合(apo)构象的配体,首先提取输入分子的特征,并采用原子-成对注意编码块(Atom–Pair Attentive Encoding Block)为每个分子获取原子和成对嵌入。随后,通过整合口袋和配体的原子嵌入来初始化口袋-配体复合物对嵌入。接着,采用互交块( Mutual Interaction Block)基于分子间相互作用迭代更新复合物对和配体对嵌入。利用这些更新后的成对嵌入,GAABind 在预测块(Prediction Block)中对复合物对距离、配体对距离和输入的结合亲和力进行预测。通过预测的复合物对距离和配体对距离,可以使用简单高效的反向传播方法生成配体的3D结合构象。

模型的关键模块是原子-成对注意编码块(Atom–Pair Attentive Encoding Block)、互交块( Mutual Interaction Block)和预测块(Prediction Block)等。接下来主要介绍这几个模块。

2.1.1 原子-成对注意编码块

原子对注意编码块从嵌入初始化层开始,在这里,利用输入分子的提取特征初始化每个分子的原子和对嵌入。接着,交替使用原子注意层和对注意层来更新原子和对嵌入。结合口袋和配体的原子对注意编码块共享相同的架构,但权重不同。

对于嵌入初始化层,为了减少计算负担,仅考虑每个分子中的重原子。原子嵌入是使用基于输入原子特征的嵌入矩阵初始化的。对于对嵌入初始化,作者采用 Zhou 等人提出的空间位置编码方法来捕捉分子的几何特性。这种方法利用一种对配对类型敏感的高斯核来嵌入所有原子对的欧几里得距离。此外,原子之间的键特征也被纳入对嵌入中,这些特征包含重要的化学和拓扑信息。因此,使用的特征对全局旋转和位移是不变的。

如下图所示,作者在原子注意力层中使用多头自注意力(MHA),以全面捕捉局部和全局的原子间关系。对嵌入作为偏置项被纳入,以增强注意力机制,提供来自原子对的上下文信息。此外,原子之间的注意力权重被用来更新对嵌入,从而促进原子与其对应对之间的有效交流。

对注意力层操作对嵌入,以建模对之间的多体相互作用。在对嵌入的更新中,保持几何一致性(例如三角不等式)至关重要,因为它表示关于原子的成对信息。受到 AlphaFold 2 中使用的 Evoformer 框架的启发,作者设计了两个模块来有效更新对嵌入。

第一个模块称为自三角更新模块,如下图 A 所示,它结合了 AlphaFold2 提出的“具有外向边的三角乘法更新”和“具有内向

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/64074.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

远程桌面防护的几种方式及优缺点分析

远程桌面登录是管理服务器最主要的方式,于是很多不法分子打起了远程桌面的歪心思。他们采用暴力破解或撞库的方式破解系统密码,悄悄潜入服务器而管理员不自知。 同时远程桌面服务中的远程代码执行漏洞也严重威胁着服务器的安全,攻击者可以利…

Python高性能web框架-FastApi教程:(2)路径操作装饰器方法

路径操作装饰器方法 1. fastapi支持的各种请求方式 app.get() app.post() app.put() app.patch() app.delete() app.options() app.head() app.trace()2. 定义不同请求方式的路由 # 定义GET请求的路由 app.get(/get) def get_test():return {method: get方法} app.get(/get)…

Mysql体系架构剖析——岁月云实战笔记

1 体系架构 理论内容阅读了mysql体系架构剖析,其他的根据岁月云的实战进行记录。 1.1 连接层 mysql最上层为连接服务,引入线程池,允许多台客户端连接,主要工作:连接处理、授权认证、安全防护、管理连接等。 连接处理&a…

FPGA 16 ,Verilog中的位宽:深入理解与应用

目录 前言 一. 位宽的基本概念 二. 位宽的定义方法 1. 使用向量变量定义位宽 ① 向量类型及位宽指定 ② 位宽范围及位索引含义 ③ 存储数据与字节数据 2. 使用常量参数定义位宽 3. 使用宏定义位宽 4. 使用[:][-:]操作符定义位宽 1. 详细解释 : 操作符 -: 操作符 …

在数字孪生开发领域threejs现在的最新版本已经更新到多少了?

在数字孪生开发领域three.js现在的最新版本已经更新到多少了? 在数字孪生开发领域,three.js作为一款强大的JavaScript 3D库,广泛应用于Web3D可视化、智慧城市、智慧园区、数字孪生等多个领域。随着技术的不断进步和需求的日益增长&#xff0…

给新ubuntu电脑配置远程控制环境和c++版本的opencv环境

目录 改用户密码安装ssh sever安装net-tools配置vscode安装vim配置C opencv1. 安装g, cmake, make2.安装opencv依赖库3.下载opencv源文件(1)方法一:官网下载(2)方法二:GitHub下载方式: 4. Cmake…

Yet another PFC(新样式 PFC)

PFC 在依靠简单廉价兼容性而成功的以太网上弄巧成拙,但有 101 种优化它的方法,但代价是交换机越来越复杂。以太网的基因是简单廉价,这体现在以太帧的结构上,以太帧结构决定了交换机的能力上限,这是核心。核心认知不够&…

【鸿睿创智开发板试用】移植OpenCV 4到OpenHarmony 4.1

目录 目录 引言 编译系统镜像 (1) 下载代码后解压SDK (2) 下载docker镜像   (3) 编译OH 编译OpenCV 下载OpenCV源代码 构建编译配置文件 执行编译命令 安装库和头文件 测试 结语 引言 最近有个需求是在基于RK3568的OpenHarmony 4.1系统中使用OpenCV&#xff0c…

【OpenCV计算机视觉】图像处理——平滑

本篇文章记录我学习【OpenCV】图像处理中关于“平滑”的知识点,希望我的分享对你有所帮助。 目录 一、什么是平滑处理 1、平滑的目的是什么? 2、常见的图像噪声 (1)椒盐噪声 ​编辑(2) 高斯噪声 &a…

3D一览通在线协同设计,助力汽车钣金件设计与制造数字化升级

汽车行业已迎来智能化的汹涌浪潮,在此背景下,零部件制造商唯有积极应对,以智能制造为核心驱动力,方能跟上行业发展步调,在激烈的市场竞争中抢占先机。作为整车制造不可或缺的核心组件之一,汽车钣金件亦需紧…

【Leetcode】滑动窗口算法-编程苍穹下划破数据暗夜的高效光弧

前言 🌟🌟本期讲解关于滑动窗口问题~~~ 🌈感兴趣的小伙伴看一看小编主页:GGBondlctrl-CSDN博客 🔥 你的点赞就是小编不断更新的最大动力 🎆那么废话不多说直接…

【2025最新版】搭建个人博客教程

【2025最新版】搭建个人博客教程 –小记: 在搭建我的这个博客之前我在CSDN也发布过一些文章,目前应该也是几千粉丝了,但是看到别人都是用自己博客写的就感觉自己很LOW,所以就想自己来搭建一个属于自己的个人博客。当然搭建博客的…

多旋翼无人机 :桨叶设计—跷跷板结构

多旋翼无人机 :桨叶设计——跷跷板结构 前言跷跷板结构 前言 2024年11月,大疆发布了最新的农业无人机T70和T100。其中T70不同于以往的机型,在桨夹处采用了翘翘板结构,大疆将其命名为“挥舞桨叶”。 T70 无人机如下 放大其中螺旋…

力扣打卡14:多数元素

链接:169. 多数元素 - 力扣(LeetCode) 这道题正常很简单,但是如果想要完成进阶做法有点困难。我使用了O(n/2)左右的空间,使用了哈希映映射。 看了题解,有一种解法叫摩尔投票,可以解决这种问题…

MySQL八股文

MySQL 自己学习过程中的MySQL八股笔记。 主要来源于 小林coding 牛客MySQL面试八股文背诵版 以及b站和其他的网上资料。 MySQL是一种开放源代码的关系型数据库管理系统(RDBMS),使用最常用的数据库管理语言–结构化查询语言(SQL&…

JS原型及原型链

欢迎来到“雪碧聊技术”CSDN博客! 在这里,您将踏入一个专注于Java开发技术的知识殿堂。无论您是Java编程的初学者,还是具有一定经验的开发者,相信我的博客都能为您提供宝贵的学习资源和实用技巧。作为您的技术向导,我将…

List【Redis对象篇】

🏆 作者简介:席万里 ⚡ 个人网站: 文章目录 LIst1.简介2.使用场景3.常用操作1.写操作2.读操作 4.底层实现5.压缩列表的优化1.ZIPLIST结构2.ziplist更新数据3.LISTPACK优化 6.总结(重点) LIst 1.简介 Redis List是一组…

专业125+总分400+南京理工大学818考研经验南理工电子信息与通信工程,真题,大纲,参考书。

考研成功上岸,苦尽甘来,专业818信号系统与数字电路125,总分400,被南理工录取,从最早信心满满,到中期犹豫不决,到后期破釜沉舟,一路颠颠簸簸,总算坚持过来了,群…

ruoyi Cannot find module ‘@/views/system/user/index‘

Cannot find module /views/system/user/index 删除node_module 后打包成功

mall-admin-web开源项目搭建教程(图文)

本章教程,介绍如何在本地部署运行mall-admin-web这个开源项目。 开源地址:https://gitee.com/macrozheng/mall-admin-web mall-admin-web是一个电商后台管理系统的前端项目,基于Vue+Element实现。主要包括商品管理、订单管理、会员管理、促销管理、运营管理、内容管理、统计…