论文笔记《基于深度学习模型的药物-靶标结合亲和力预测》

基于深度学习模型的药物-靶标结合亲和力预测

这是一篇二区的文章,算是一个综述,记录一下在阅读过程中遇到的问题。

文章目录

  • 基于深度学习模型的药物-靶标结合亲和力预测
  • 前言
  • 一、蛋白质接触图谱
  • 二、为什么蛋白质图谱的准确性对DTA模型预测结果没有影响
    • 1.对这段话的解释
    • 2.关于Alphafold3
  • 三、关于深度学习模型对特征的自动学习过程
    • 1.是怎么进行自动学习的
    • 2.特征学习过程
    • 2.深度神经网络模型对相互作用的预测DNN DML的学习。
  • 总结


前言

提示:这里可以添加本文要记录的大概内容:

例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。


提示:以下是本篇文章正文内容,下面案例可供参考

一、蛋白质接触图谱

蛋白质接触图谱是一种用于表示蛋白质三维结构的工具。它使用一个二元二维矩阵来表示所有可能的氨基酸残基对之间的距离¹⁴。

在这个矩阵中,如果两个氨基酸在空间中的距离小于一定的阈值(通常是8Å),那么我们就认为这两个氨基酸是接触的,矩阵中对应的元素值为1;否则,我们认为这两个氨基酸不接触,矩阵中对应的元素值为0²。

蛋白质接触图谱的主要意义在于,它提供了一种直观的方式来理解蛋白质的三维结构,特别是蛋白质内部各个氨基酸之间的相互作用。这对于理解蛋白质的功能,以及进行药物设计等任务具有重要的意义²。

Source: Conversation with Copilot, 28/05/2024
(1) Biopython | 计算蛋白质的接触图(contact map) - CSDN博客. https://blog.csdn.net/u012325865/article/details/121118617.
(2) Biopython | 计算蛋白质的接触图(contact map) - 华为云社区. https://bbs.huaweicloud.com/blogs/308589.
(3) 蛋白质结构预测—残基接触的基础知识—接触概念(三)_残基的ca-CSDN博客. https://blog.csdn.net/qq_36112387/article/details/117029591.
(4) 【9.4.1】蛋白-配体相互作用指纹图谱(PLIF) - Sam’ Note. https://bing.com/search?q=%e8%9b%8b%e7%99%bd%e8%b4%a8%e6%8e%a5%e8%a7%a6%e5%9b%be%e8%b0%b1%e6%98%af%e4%bb%80%e4%b9%88.
(5) undefined. https://files.rcsb.org/download/.

蛋白质接触图谱是一种二元二维矩阵,用于表示蛋白质三维结构中所有可能的氨基酸残基对之间的距离。以下是一个简化的例子:

假设我们有一个由四个氨基酸残基组成的蛋白质,我们可以将其表示为一个4x4的矩阵。在这个矩阵中,如果两个氨基酸在空间中的距离小于一定的阈值(通常是8Å),那么我们就认为这两个氨基酸是接触的,矩阵中对应的元素值为1;否则,我们认为这两个氨基酸不接触,矩阵中对应的元素值为0。

例如,假设第一个和第二个氨基酸接触,第三个和第四个氨基酸接触,其他的氨基酸对不接触,那么我们可以得到以下的接触图谱:

0 1 0 0
1 0 0 0
0 0 0 1
0 0 1 0

在这个例子中,矩阵的第一行和第二列的元素值为1,表示第一个和第二个氨基酸接触;矩阵的第三行和第四列的元素值为1,表示第三个和第四个氨基酸接触¹。

这只是一个简化的例子,实际的蛋白质接触图谱会更复杂,因为蛋白质通常由数百到数千个氨基酸残基组成,而且它们在空间中的排列方式也会非常复杂¹。希望这个例子能帮助你理解蛋白质接触图谱的基本概念!如果你有任何其他问题或需要进一步的解释,请随时告诉我!

Source: Conversation with Copilot, 28/05/2024
(1) Biopython | 计算蛋白质的接触图(contact map) - CSDN博客. https://blog.csdn.net/u012325865/article/details/121118617.
(2) The Human Protein Atlas. https://www.proteinatlas.org/.
(3) 蛋白质间接触的深度图学习,Bioinformatics - X-MOL. https://www.x-mol.com/paper/1495660998561189888/t?recommendPaper=1376496881286754304.
(4) undefined. https://files.rcsb.org/download/.
(5) undefined. https://github.com/zw2x/glinter.

二、为什么蛋白质图谱的准确性对DTA模型预测结果没有影响

基于蛋白质接触图谱的蛋白质编码方法并不能提高深度学习模型的性能。此外,通过各种预测方法计算的不同蛋白质接触图谱,如AlphaFold2 [73]、Pconsc4 [74]和ESM-1b [75],无论其准确性如何,对DTA预测都没有太大影响。同样,蛋白质和药物编码的组合方法不会显着影响深度学习模型的性能。在随机配体和随机配体节点属性之间的配体编码中观察到显着差异,表明学习任务对配体数据的依赖性要大得多。

1.对这段话的解释

这段文字主要讨论了几种蛋白质编码方法和药物编码方法对深度学习模型性能的影响。以下是主要观点的总结:

  • 基于蛋白质接触图谱的蛋白质编码方法并不能提高深度学习模型的性能。这意味着,尽管蛋白质接触图谱包含了蛋白质的三维结构信息,但这些信息并没有帮助提高模型的预测性能。

  • 无论使用哪种预测方法(如AlphaFold2、Pconsc4和ESM-1b)计算的蛋白质接触图谱,其准确性如何,对药物靶点亲和力(DTA)预测都没有太大影响。这可能表明,DTA预测更多地依赖于其他类型的信息,而不仅仅是蛋白质的结构信息。

  • 蛋白质和药物编码的组合方法不会显着影响深度学习模型的性能。这可能说明,编码方法的选择并不是影响模型性能的关键因素。

  • 在随机配体和随机配体节点属性之间的配体编码中观察到显着差异,表明学习任务对配体数据的依赖性要大得多。这可能意味着,对于这类任务,配体的特性和属性可能比蛋白质的信息更为重要。

这些发现可能对深度学习在药物发现中的应用有重要的指导意义。希望这个总结对你有所帮助!如果你有任何其他问题或需要进一步的解释,请随时告诉我!

2.关于Alphafold3

结合最新的Aphafold3呢?为什么蛋白质接触图谱,其准确性如何,对药物靶点亲和力(DTA)预测都没有太大影响。
关于AlphaFold3,据报道⁵⁶⁷⁸,它在预测蛋白质结构和相互作用方面取得了显著的进步。AlphaFold3可以预测蛋白质、DNA、RNA、配体等生物分子的结构和相互作用,这对于理解生物世界和药物发现具有重要的意义。对于蛋白质与其他分子类型的相互作用,AlphaFold3的预测精度至少比现有的预测方法提高了50%,对于一些重要的相互作用类别,预测精度甚至翻了一番。

然而,即使是AlphaFold3这样的先进工具,也并不能保证在所有情况下都能提高药物靶点亲和力(DTA)预测的性能。这可能是因为DTA预测的复杂性远超过了蛋白质结构的预测。DTA预测不仅需要考虑蛋白质的三维结构,还需要考虑药物分子的结构、药物和蛋白质之间的相互作用方式、药物分子和蛋白质在生物体内的动态行为等多种因素¹²³⁴。

因此,尽管蛋白质接触图谱的准确性对于理解蛋白质的三维结构非常重要,但它可能并不是影响DTA预测性能的关键因素。这也解释了为什么即使使用了不同的蛋白质接触图谱预测方法,如AlphaFold2、Pconsc4和ESM-1b,其准确性如何,对DTA预测的影响都不大。希望这个解释对你有所帮助!如果你有任何其他问题或需要进一步的解释,请随时告诉我!

Source: Conversation with Copilot, 28/05/2024
(1) AlphaFold 3 predicts the structure and interactions of all of life’s … https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/.
(2) Major AlphaFold upgrade offers boost for drug discovery - Nature. https://www.nature.com/articles/d41586-024-01383-z.
(3) Why AlphaFold 3 is stirring up so much buzz in pharma. https://www.pharmavoice.com/news/google-alphafold-3-drug-discovery-pharma-buzz/716496/.
(4) DeepMind Unveils AlphaFold3: Revolutionizing Protein Interactions with … https://thenota.com/post/2024/may/24/deepmind-unveils-alphafold3-revolutionizing-protein-interactions-with-ai/.
(5) Drug–target affinity prediction using graph neural network and contact maps. https://pubs.rsc.org/en/content/articlelanding/2020/ra/d0ra02297g.
(6) Drug–target affinity prediction with extended graph learning … https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-024-05698-6.
(7) PGraphDTA: Improving Drug Target Interaction Prediction using Protein … https://ar5iv.labs.arxiv.org/html/2310.04017.
(8) Drug–target affinity prediction using graph neural network and contact maps. https://pubs.rsc.org/en/content/articlehtml/2020/ra/d0ra02297g.

三、关于深度学习模型对特征的自动学习过程

深度学习在药物靶点亲和力(Drug-Target Affinity,DTA)预测中的应用。以下是主要观点的总结:

  • 深度学习方法可以在模型架构中集成特征表示和目标值预测。这意味着,深度学习模型可以同时处理特征提取和预测任务,而无需进行独立的特征工程步骤。

  • 这些模型可以自动学习化合物和蛋白质的有效表示。这是通过训练深度学习模型来识别和提取与DTA预测相关的重要特征。这些特征可能包括化合物的化学结构、蛋白质的氨基酸序列、以及它们之间的相互作用等。

1.是怎么进行自动学习的

当然可以。这里有一个具体的例子,叫做DeepCPI¹。DeepCPI是一个基于深度学习的框架,用于预测化合物和蛋白质的相互作用。它的工作原理如下:

  1. 语义分析和Word2vec方法:DeepCPI首先使用语义分析和Word2vec方法来获取化合物和蛋白质的低维特征表示¹。具体来说,它将化合物和蛋白质视为文本,将化合物的结构和蛋白质的氨基酸序列视为单词,然后使用Word2vec方法来学习这些"单词"的低维嵌入¹。

  2. 多模态深度神经网络(DNN)分类器:接下来,DeepCPI将这些低维特征输入到一个多模态深度神经网络(DNN)分类器中,预测化合物和蛋白质是否会相互作用¹。

通过这种方式,DeepCPI能够自动学习化合物和蛋白质的有效表示,并用这些表示来预测它们是否会相互作用。这个过程不需要人工设计特征,而是通过深度学习模型自动学习得到的¹。

希望这个例子能帮助你理解这个概念!如果你有任何其他问题或需要进一步的解释,请随时告诉我!

Source: Conversation with Copilot, 28/05/2024
(1) GPB|DeepCPI:基于深度学习的化合物和蛋白质相互作用预测框架-腾讯云开发者社区-腾讯云. https://cloud.tencent.com/developer/article/1785292.
(2) Drug Discov Today | 分子表示与性质预测中的深度学习方法-腾讯云开发者社区-腾讯云. https://cloud.tencent.com/developer/article/2165401.
(3) 【2021研电赛】基于深度学习的蛋白质与化合物结合性质预测 - 知乎. https://zhuanlan.zhihu.com/p/665870092.
(4) 生物信息学|DeepPurpose:药物靶标相互作用预测的深度学习库-CSDN博客. https://blog.csdn.net/ShenggengLin/article/details/110098120.
(5) undefined. https://academic.oup.com/nar/article/34/suppl_1/.

2.特征学习过程

深度学习模型,如用于预测化合物和蛋白质相互作用的模型,是通过训练数据集进行学习的。这个训练数据集通常包含一些已知的化合物和蛋白质,以及它们是否相互作用的信息。

具体来说,每个数据点在数据集中通常由一个化合物、一个蛋白质和一个标签组成。化合物和蛋白质的信息可以是它们的化学结构、氨基酸序列等特征,而标签则表示这个化合物和蛋白质是否相互作用。

在训练过程中,模型会尝试找到一种映射关系,将输入的化合物和蛋白质的特征映射到它们是否相互作用的标签。这个过程通常涉及到一些优化算法,如梯度下降,以及一些损失函数,如交叉熵损失。

通过这种方式,模型可以学习到化合物和蛋白质的特征与它们是否相互作用之间的关系,从而在给定新的化合物和蛋白质时,能够预测它们是否会相互作用。

在化合物和蛋白质的相互作用中,深度学习模型可能会学习到一些特定的模式或特征。这些特征可能包括但不限于以下几种

化学结构特征::例如,化合物的分子大小、形状、电荷分布、极性、亲水性或疏水性等。这些特征可以影响化合物与蛋白质的结合能力和方式。
氨基酸序列特征::例如,蛋白质的氨基酸序列、二级结构(如螺旋、折叠和转角)、三级结构(如蛋白质的空间结构)等。这些特征可以影响蛋白质的功能和与化合物的相互作用。
蛋白质-化合物相互作用特征::例如,化合物与蛋白质结合部位的形状和性质、化合物与蛋白质之间的距离、角度、键长、键角等。这些特征可以直接反映化合物与蛋白质的相互作用强度和方式。

2.深度神经网络模型对相互作用的预测DNN DML的学习。

总结

提示:这里对文章进行总结:

例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/17392.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用Python类的构造函数和析构函数

1、问题背景 当使用Python类时,可以使用构造函数和析构函数来初始化和清理类实例。构造函数在创建类实例时自动调用,而析构函数在删除类实例时自动调用。 在上面的代码示例中,Person类具有一个构造函数__init__和一个析构函数__del__。构造…

【代码】自定义函数

你有没有听过 n! ? n!n(n-1)(n-2)21 你想不想有一个c函数 jc() 专门用来计算n!? 不好意思,没有!c函数库说。没有咱自己可以造呀! 哈喽大家好,我是学霸小羊,今天讲讲自定义函数。 自定义函数的定义格式…

网易面试:手撕定时器

概述: 本文使用STL容器-set以及Linux提供的timerfd来实现定时器组件 所谓定时器就是管理大量定时任务,使其能按照超时时间有序地被执行 需求分析: 1.数据结构的选择:存储定时任务 2.驱动方式:如何选择一个任务并执…

CSS,HTML,JS 以及Vue前端面试题八股文总结【看完你就变高手】

■ 符号说明 💘 主题 🌟 常见重要 🌛 需要有印象的 🆕 v3新特性 ■ 杂谈 🌛 SEO优化 合理的title、description、keywords:搜索对着三项的权重逐个减小,title值强调重点即可;descrip…

东软的第三个研发基地,为什么选择了武汉?

继沈阳、大连之后,东软集团在国内打造的第三个研发基地——武汉东软软件园,于2024年5月25日正式开园。 “占地面积158亩、建筑面积14万余平方米的武汉东软软件园,从开工到竣工仅仅用了18个月的时间。这样的建设速度,充分体现了武汉…

使用XMLHttpRequest对象进行网络请求的步骤

使用XMLHttpRequest对象进行网络请求的基本步骤如下: 1:创建XHR对象: const xhr new XMLHttpRequest();2:初始化请求: xhr.open(method, url, async);method: HTTP请求方法,如 GET, POST, PUT, DELETE 等。 url: 请求的目标URL地址。 async: 是否异步…

2.开发环境介绍

开发环境介绍三种:第一种是在线开发环境、第二种是Windows下的开发环境、第三种是Linux下的开发环境。 1.在线开发环境 2.Windows下的开发环境 用的比较多的是Devc,新手适合使用,上手快,简单,方便。 Devc使用&#x…

蓝桥杯练习系统(算法训练)ALGO-932 低阶行列式计算

资源限制 内存限制&#xff1a;64.0MB C/C时间限制&#xff1a;1.0s Java时间限制&#xff1a;3.0s Python时间限制&#xff1a;5.0s 问题描述 给出一个n阶行列式(1<n<9)&#xff0c;求出它的值。 输入格式 第一行给出两个正整数n,p&#xff1b;   接下来n行&…

Flutter 中的 SizedOverflowBox 小部件:全面指南

Flutter 中的 SizedOverflowBox 小部件&#xff1a;全面指南 在 Flutter 的布局世界中&#xff0c;SizedOverflowBox 是一个相对独特的小部件&#xff0c;它允许子组件溢出其父组件的界限&#xff0c;同时保持父组件的尺寸不变。这在某些特定的布局场景下非常有用&#xff0c;…

软件工程作业6

问题&#xff1a;如果你要开发一个中小学生学习数学的软件你应该找谁去做用户调研&#xff1f; 开发一个针对中小学生的数学学习软件时&#xff0c;进行有效的用户调研至关重要&#xff0c;这能确保产品贴合目标用户的需求和学习习惯。以下是一些适合参与用户调研的对象&#…

简单工厂模式与策略模式的区别

相似之处&#xff1a;都用于松耦合 不同之处&#xff1a; 简单工厂模式&#xff1a;只关注传入的参数&#xff0c;对于后续的具体执行逻辑不关注(工厂会自动根据传入的参数类型生产对应的产品) 核心目的&#xff1a;隐藏创建对象的具体逻辑&#xff0c;客户端只需传入参数&a…

【JavaScript】P2 JavaScript 书写位置

本博文总结&#xff1a; JavaScript 书写位置&#xff1a; 内部外部行内 注意事项&#xff1a; 书写的位置尽量写到 </body> 之前外部 js 标签中间不写任何内容&#xff0c;因为不予以展示 正文&#xff1a; 交互效果示例 一个简单的交互效果示例&#xff1b; <…

【从零开始学习RabbitMQ | 第一篇】如何确保生产者的可靠性

目录 前言&#xff1a; 生产者重连机制&#xff1a; 生产者确认机制&#xff1a; Publisher Confirm&#xff08;生产者者确认&#xff09; Publish Return&#xff08;发布返回&#xff09; 总结&#xff1a; 前言&#xff1a; 在现代的分布式系统中&#xff0c;消息队…

【NumPy】关于numpy.divide()函数,看这一篇文章就够了

&#x1f9d1; 博主简介&#xff1a;阿里巴巴嵌入式技术专家&#xff0c;深耕嵌入式人工智能领域&#xff0c;具备多年的嵌入式硬件产品研发管理经验。 &#x1f4d2; 博客介绍&#xff1a;分享嵌入式开发领域的相关知识、经验、思考和感悟&#xff0c;欢迎关注。提供嵌入式方向…

zabbix监控mysql

一、mysql数据库监控的内容有 mysql的吞吐量 mysql的常规操作&#xff08;增删改查&#xff09; QPS&#xff08;Questions Per second:&#xff09;每秒能处理多少次请求数 TPS&#xff08;Transactions Per Second&#xff09;每秒查询处理的事务数 mysql库大小和表大小 监控…

VsCode个人插件

Auto Rename Tag > 同时修改标签 Rainbow Brackets > 不同层级不同括号颜色 Dracula Official > 个人比较喜欢的一款主题 Error Lens > 错误信息显示 ES7REACT/Redux/React-Native>react开发插件 ESLINT Indenticator>方便看结构 Prettier Formatter …

欧科云链:Web3.0时代 具备链上数据分析能力的公司愈发凸显其价值

在当今激烈的市场竞争中&#xff0c;新兴互联网领域迅速崛起&#xff0c;Web2.0已相对成熟&#xff0c;用户创造数据&#xff0c;但不拥有数据。被视为新的价值互联网的Web3.0&#xff0c;赋予用户真正的数据自主权&#xff0c;它的到来被认为是打破Web2.0垄断的机遇。 在Web3…

迅狐跨境商城系统源码

在当今全球化的商业环境中&#xff0c;跨境电商的兴起为商家提供了无限的可能性。为了满足这一需求&#xff0c;跨境商城系统源码的开发显得尤为重要。本文将探讨跨境商城系统源码的优势&#xff0c;以及如何利用这些优势来构建一个成功的跨境电商平台。 独立开发&#xff0c;…

el-table 合并单元格_以合并属性值相同行为例

在做表格展示时&#xff0c;通常会遇到合并相同日期/id行的需求&#xff1b; <template><div><el-table:data"tableData":span-method"objectSpanMethod"borderstyle"width: 100%; margin-top: 20px"><el-table-column pr…

LLM 大模型学习必知必会系列(十三):基于SWIFT的VLLM推理加速与部署实战

LLM 大模型学习必知必会系列(十三)&#xff1a;基于SWIFT的VLLM推理加速与部署实战 1.环境准备 GPU设备: A10, 3090, V100, A100均可. #设置pip全局镜像 (加速下载) pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/ #安装ms-swift pip install ms-…