PocketMiner:基于深度学习发现蛋白的隐式口袋

文章目录

  • 1. 文章简介
  • 2. 前言
  • 3. 方法
    • 3.1 模型框架
  • 4. 结果
    • 4.1 已知隐式口袋在分子动力学模拟分析迅速打开
    • 4.2 图神经网络模型能够准确预测模拟中口袋的动态变化
    • 4.3 隐式口袋数据集数据集揭示了新的隐式口袋形成的模式
    • 4.4 PocketMiner能够从无配体的蛋白结构中精准预测预测口袋
    • 4.5 PocketMiner预测了人类蛋白组中的数千个隐式口袋。
  • 总结


1. 文章简介

标题:Predicting locations of cryptic pockets from single protein structures using the PocketMiner graph neural network
期刊: Nature communictions
团队:华盛顿大学生物化学与分子生物物理系
DOI:https://doi.org/10.1038/s41467-023-36699-3
在这里插入图片描述

2. 前言

靶点的成药口袋是药物研发的起点,而除了在自然状态下显而易见的”显式口袋“外。还存在一类由于蛋白结构的动态变化而形成的"隐式口袋"。靶向隐式口袋提供了新的药物研发可能,比如说:

  1. 目前因在基本态结构中缺乏口袋而被认为”不可成药“的蛋白,可能经由隐式口袋进行靶向。
  2. 靶向隐式口袋的分子同样能够通过抑制或者激活调控蛋白的功能
  3. 显式位点的口袋往往高度保守,并出现在多类蛋白中。因此相较于靶向显示口袋的分子,靶向隐式口袋的分子具有更高的特异性。
    在这里插入图片描述

虽然隐式口袋是诱人的的药物靶标,但定位和靶向他们仍然非常具有挑战性,大多数已知的隐式口袋的发现都是通过筛选或者优化命中化合物的时候偶然发现。此外,动力学模拟通过计算模拟了蛋白质在溶液中动态结构变化,并提供了蛋白结构的集合,这些结构中所揭露隐式口袋可以作为药物设计的模版。但动力学模拟所需要的计算资源较高,使得其难与用于大规模的隐式口袋筛选。

因此本篇文章提出训练了一个图模型PocketMiner用于预测蛋白中哪一块区域有可能在分子动力学模拟过程中打开,从而形成隐式口袋。


3. 方法

3.1 模型框架

在这里插入图片描述
模型框架采用的是GVP-GNN。相较于传统的GNN,其创新点就是加入了如下图所示的GVP模块:
在这里插入图片描述
GVP的输入包含标量s和向量V,首先对向量V做了一个线性变换得到Vh,之后对Vh进行L2正则化并将之与s拼接到一起。从而使得向量信息和标量信息之间形成一个信息交互。

有兴趣的可以去看看原文:https://arxiv.org/abs/2009.01411

4. 结果

4.1 已知隐式口袋在分子动力学模拟分析迅速打开

对16个已知具有隐式口袋的蛋白进行了动力学模拟,首先每个蛋白口袋进行了10次并行40ns模拟,并基于Fast算法对模拟轨迹进行聚类,取所有轨迹的聚类中心作为下一次模拟的起始构像,并再进行10次并行的40ns模拟。上述过程一共循环了5次,基于LIGSITE计算口袋的体积,如果大于或等于结合态的口袋体积即认为口袋已打开,具备了容纳配体的能力。以下是模拟的结果:
在这里插入图片描述

  • A和B图是一个简单的case展示,可以看到相对于apo态,隐式口袋的体积在经过模拟之后明显扩张了。

  • 图C展示的是GluR2蛋白体系在模拟过程中的隐式口袋体积大小分布情况,横坐标是迭代的次数,纵坐标是口袋体积,结果显示在第一次的迭代后,隐式口袋就已打开。

  • D图是多个蛋白体系的C图的集合,橙色的小提琴图代表的是第一次迭代后的口袋体积,而白色则代表的5次迭代后的口袋体积。横坐标代表的与Holo态相比的口袋倍数。即大于等于1就可以认为隐式口袋已打开。可以看到在15个蛋白体系中(有一个蛋白体系中的口袋在apo情况下比holo态还大,舍弃掉了),有13个体系在第一次迭代口袋就已经打开。另外的两个体系中国中AMPA在第五次迭代中口袋打开了,只有Niemann-PickC2
    Protein体系的口袋一直没打开。

总而言之,对于大多数较小的蛋白质,只要有短暂的模拟就可能足以发现隐蔽的口袋。
这一发现表明,识别APO态上隐式口袋的任务可以简化为训练一个模型去预测在短暂的分子动力学模拟时间窗口内(如40ns),口袋能否能够形成。

4.2 图神经网络模型能够准确预测模拟中口袋的动态变化

模型的训练数据集一共包含37个蛋白。其中16个蛋白是来自上一节种所整理的数据;其余蛋白来自课题组之前关于隐式口袋的动力学模拟数据,包括15个SARS相关蛋白和6个Ebolavirus VP35蛋白。和上一节一样,这些动力学模拟的数据全部由40ns的片段组合而成,一共2400个40ns的片段。从中提取了每个片段的初始构象,共941550个氨基酸标注数据用于模型的训练。
在这里插入图片描述
图A展示的是数据标注的方式。训练的标签为氨基酸是否能够在接下来40ns的动力学模拟任意时刻中参与形成隐式口袋的2进制标签。判断的标准基于ligsite计算每个氨基酸周围5A的网格点参与组成的口袋相对于apo状态的体积变化大于或等于40 A 3 A^3 A3d。

图B和图C展示的是,模型训练采用的五折交叉验证(基于37个蛋白而非MD轨迹)中的最优模型的PR曲线和AUC曲线。可以看到GVP-GNN模型要强于3D-CNN模型,且AUC达到了0.83。这些结果说明,当给定蛋白质的天然折叠状态结构时,无需计算中间状体(例如,使用MD模拟)也可以识别分子动力学模拟中隐式口袋形成的位点

4.3 隐式口袋数据集数据集揭示了新的隐式口袋形成的模式

从PDB数据库和已公布的数据集中提取了38个apo-holo蛋白结构对,包含39个隐式口袋。通过检视这些蛋白结构对,作者发现许多隐式口袋的形成是通过closing motion形成的,而非openning motion。closing motion的蛋白结构在apo态下相隔甚远,因此在apo态下几乎没有口袋,而在holo态下蛋白结构聚拢而成壁(wall)或盖子(lid),从而形成了一个可以供配体结合的空腔 (图D)。作者将这样的口袋命名为“reverse”口袋, 大多数的隐式口袋都由单一的motion形成。而在forward和reverse的口袋中,总共观察到了4种常见的结构重排,如下图所示:
在这里插入图片描述
图A,loops可以移开为进入的配体创造空间,或夹紧在配体上方形成壁(wall)或盖子(lid)
图B,二级结构可以发生偏移或者旋转
图C,二级结构和loops之间可以发生相互转换
图D,interdomain可以创造一个可供配体结合的空腔

4.4 PocketMiner能够从无配体的蛋白结构中精准预测预测口袋

鉴于GVP-GNN能够准确预测模拟中的结合口袋位置,作者接下来进一步研究了这种网络架构是否能够用于预测实验结构中的隐式口袋形成的位置。模型的训练数据就是第二节中的的37个蛋白的apo态,但这次除了ligsite的数据方法,还引入了fpocket的口袋成药性打分。最终的模型经由ligsite标注的数据训练了20个epoch,由经fpockt的标注的数据refine了一个epoch。

模型的测试集由三部分组成,首先是第三节中所获取的正集,以及中这样的高度刚性的蛋白(如下图1B),还有已经经过了大量实验的蛋白。作者认为如果一个蛋白已经有了大量的Holo态,那当这些Holo态聚合到一起时,没有ligand结合的区域就可以认为是无法形成隐式口袋的,可作为训练的负集使用(如下图2)。测试集之后又经历了两次过滤:

  1. 负集全部经由MD检验在40ns能不会参与形成口袋
  2. 所有测试集蛋白序列都与训练集中的蛋白序列做了序列比对,删除了一致性大于百分之55的蛋白结构。

最终测试集一共包含35个蛋白:23个能形成隐式口袋的正集,4个超刚性蛋白,以及7个经过了大量实验筛选的蛋白。总计563个正集氨基酸和1283个负集氨基酸。下图1是模型的性能情况:
residues that do not form cryptic pockets in our test set.
图1:
在这里插入图片描述
A:PocketMiner图形神经网络准确地检测了隐藏口袋形成的高的可能性区域(红色),其中就包括ligand的结合区域。该区域有一个loop在Holo态下打开了,形成了一个隐藏口袋。
B:高刚性蛋白结构的展示
C和D:模型性能的展示,可以看到相对于以前的监督学习方法,PocketMiner的AUC稍有提升。但PR曲线在高回收率(0.6~0.8)下预测的假阳性更少,这说明模型的预测错误率是相对下降了的。特别是针对超刚性蛋白,PocketMinder相对于CryotoSite有一个整体的提升。下表为来给那个算法的准确率:
在这里插入图片描述

在这里插入图片描述

图2
在这里插入图片描述
将所有的holo态结合到一起,如果周围5A内不含ligand。则认定该氨基酸无法形成隐式口袋(灰色),反之标红。

4.5 PocketMiner预测了人类蛋白组中的数千个隐式口袋。

之后作者利用上述模型去预测了超过10000个人体基因组蛋白进行了预测,将预测结果分为了三类:Groud state pocket,Criptic pocket 和No cryptic pocket。 分别对应着同时包含显示口袋或隐式口袋的蛋白,仅包含隐式口袋的蛋白以及未找到相关口袋的蛋白(图A), 可以看到有近百分之三十的蛋白仅仅包含隐式口袋,这说明即使在一个蛋白在自然状态下没有显示出明显的小分子口袋下,对其进行进行药物筛选依旧是有意义的。为了证明这一观点,作者将PocketMiner应用到了癌症相关通路Jak/Stat的几个蛋白上,包括下图中所示的PIM2,PIM2已经有经过drug筛选的正构口袋。
在这里插入图片描述
图A: 人体基因组蛋白的口袋类型比例,Groud state pocket,Criptic pocket 和No cryptic pocket。 分别对应着同时包含显示口袋或隐式口袋的蛋白,仅包含隐式口袋的蛋白以及未找到相关口袋的蛋白
图B: Jak/Stat 信号通路
图C:PIM 2 激酶的Holo态结构
图D:PocketMiner预测的隐式口袋分布
图E:PIM 2的MD结果,显示在PocketMiner预测的隐式口袋处确实出现了相应的口袋


总结

1. Pocket Miner能够基于Apo态的蛋白结构去精准预测其中的隐式口袋位置(AUC: 0.87), 并且实现了相对于传统监督学习方法CryptoSite实现了1个数量级的速度提升(>1000)
2. 基于MD能够有效发现已知的隐式口袋,并且并不需要长时间的模拟,400ns的模拟即可。
3. 在人体基因组蛋白的PocketMiner预测中发现了大量的仅含隐式口袋的蛋白,说明目前的药物发现的靶标范围是能进一步扩充的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/64531.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TBOX开发需求说明

TBOX功能需求: 支持4G上网功能,可获取外网IP,可和云端平台连通支持路由功能,支持计算平台、网关和云端平台建立网络连接支持USB转网口,智能座舱会通过USB连接AG35建立网络连接(类似IVI通过USB口连接TBOX&a…

linux中dmesg命令用法

在Linux系统中,dmesg(diagnostic message)是一个非常有用的命令行工具,用于显示和控制内核环形缓冲区中的消息。这些消息通常包含系统启动时的内核生成的信息,例如硬件设备的状态,驱动程序的加载&#xff0…

浅析Linux SCSI子系统:错误恢复

文章目录 概述SCSI错误恢复处理添加错误恢复命令错误恢复线程scsi_eh_ready_devs IO超时处理相关参考 概述 IO路径是一个漫长的过程,从SCSI命令请求下发到请求完成返回,中间的任何一个环节出现问题都会导致IO请求的失败。从SCSI子系统到低层驱动&#x…

【云原生】Ansible自动化批量操作工具playbook剧本

目录 1.playbook相关知识 1.1 playbook 的简介 1.2 playbook的 各部分组成 2. 基础的playbook剧本编写实例 2.1 playbook编写Apache安装剧本(yum方式安装) 报错集: 实例2:playbook编写nginx 的yum安装并且能修改其监听端口的…

认识JVM的内存模型

从上一节了解到整个JVM大的内存区域,分为线程共享的heap(堆),MethodArea(方法区),和线程独享的 The pc Register(程序计数器)、Java Virtual Machine Stacks(…

MVC,MVP,MVVM的理解和区别

MVC MVC ,早期的开发架构,在安卓里,用res代表V,activity代表Controller层,Model层完成数据请求,更新操作,activity完成view的绑定,以及业务逻辑的编写,更新view&#xf…

Jenkins java8安装版本安装

一、首先准备Jenkins、Jdk8、Tomcat9安装包 根据Jenkins官网介绍,Jenkins支持Java8的版本如下: 我们选择2.164版本进行安装,根据版本号支持输入下载地址:https://archives.jenkins.io/war/2.164/jenkins.war,进行下载…

Mybatis 插入、修改、删除

前面几篇我们介绍了使用Mybatis查询数据,并且也了解了如何在Mybatis中使用JDK的日志系统打印日志;本篇我们继续介绍如何使用Mybatis完成数据的插入、修改和删除。 如果您对查询数据和Mybatis集成JDK日志系统不太了解,建议您先进行了解后再阅…

【Vue CLI】

node.js安装 https://nodejs.org/download/release/v15.14.0/ 管理员运行cmd node -v 安装npm npm install -g cnpm --registryhttps://registry.npm.taobao.org 查看是否安装成功 npm -v 注册淘宝镜像加速器 npm config set registry https://registry.npm.taobao.org/ 查看…

Vue2项目练手——通用后台管理项目第二节

Vue2项目练手——通用后台管理项目 路由限制重复跳转CommonAside.vue 顶部header组件搭建与样式修改右边用户菜单栏使用的组件图片CommonHeader.vue Vuex实现左侧折叠文件目录store/index.jsstore/tab.jsmain.jsCommonHeader.vueCommonAside.vueMain.vue 路由限制重复跳转 路由…

Qt使用Json

包含目录&#xff1a; #include <QJsonObject> #include <QJsonDocument> #include <QByteArray> #include <QFile> #include <QJsonArray>基本结构&#xff1a; 写json QJsonObject studentobj;QJsonArray arrarydata;QJsonObject subdata;…

50ETF期权开户平台(0门槛期权开户指南)

50ETF期权开户平台比较好的有&#xff1a;期权馆&#xff0c;期权科普馆&#xff0c;小熊期权&#xff0c;期权酱&#xff0c;财顺财经&#xff0c;财顺期权等&#xff0c;都是国内前十的期权分仓平台&#xff0c;下文为大家结算50ETF期权开户平台&#xff08;0门槛期权开户指南…

HTTP介绍:一文了解什么是HTTP

前言&#xff1a; 在当今数字时代&#xff0c;互联网已经成为人们生活中不可或缺的一部分。无论是浏览网页、发送电子邮件还是在线购物&#xff0c;我们都离不开超文本传输协议&#xff08;HTTP&#xff09;。HTTP作为一种通信协议&#xff0c;扮演着连接客户端和服务器的重要角…

微信小程序新版隐私协议弹窗实现最新版

1. 微信小程序又双叒叕更新了 2023.08.22更新&#xff1a; 以下指南中涉及的 getPrivacySetting、onNeedPrivacyAuthorization、requirePrivacyAuthorize 等接口目前可以正常接入调试。调试说明&#xff1a; 在 2023年9月15号之前&#xff0c;在 app.json 中配置 __usePriva…

SpringCloudAlibaba Gateway(三)-整合Sentinel功能路由维度、API维度进行流控

Gateway整合Sentinel ​ 前面使用过Sentinel组件对服务提供者、服务消费者进行流控、限流等操作。除此之外&#xff0c;Sentinel还支持对Gateway、Zuul等主流网关进行限流。 ​ 自sentinel1.6.0版开始&#xff0c;Sentinel提供了Gateway的适配模块&#xff0c;能针对路由(rou…

kaggle赛后总结

1. 宽表 2.缺失值的处理方法 最简单粗暴的就是删除&#xff0c;这种情况是凡是有缺失值行数很少。均值替代。缺失值的行数比较多一点儿的时候&#xff0c;直接删除会影响样本数量&#xff0c;那就均值替代&#xff0c;或者中位数替代等方法。还有复杂的方法&#xff0c;把有缺…

机器学习笔记之最优化理论与方法(四) 凸函数:定义与基本性质

机器学习笔记之最优化理论与方法——再回首&#xff1a;凸函数定义与基本性质 引言凸函数的定义严格凸函数凸函数的推论&#xff1a;凹函数 常见凸函数凸函数的基本性质几种保持函数凸性的运算凸集与凸函数之间的关联关系 引言 本节将介绍凸函数定义及其基本性质。 本文是关于…

设计模式—简单工厂

目录 一、前言 二、简单工厂模式 1、计算器例子 2、优化后版本 3、结合面向对象进行优化&#xff08;封装&#xff09; 3.1、Operation运算类 3.2、客户端 4、利用面向对象三大特性&#xff08;继承和多态&#xff09; 4.1、Operation类 4.2、加法类 4.3、减法类 4…

QUdpSocket Class

继承自 QAbstractSocket 类 QUdpSocket类提供UDP套接字。 UDP(用户数据报协议)是一种轻量级、不可靠、面向数据报、无连接的协议。它可以在可靠性不重要的情况下使用。QUdpSocket是QAbstractSocket的一个子类&#xff0c;它允许您发送和接收UDP数据报。 使用这个类最常见的方法…

【探索SpringCloud】服务发现-Nacos服务端数据结构和模型

前言 上一文中&#xff0c;我们从官方的图示了解到Nacos的服务数据结构。但我关心的是&#xff0c;Nacos2.x不是重构了吗&#xff1f;怎么还是这种数据结构&#xff1f;我推测&#xff0c;必然是为了对Nacos1.x的兼容&#xff0c;实际存储应该不是这样的。于是&#xff0c;沿着…