BioTech - ADMET的性质预测 概述

欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://blog.csdn.net/caroline_wendy/article/details/136438192

ADMET

ADMET,即 Absorption、Distribution、Metabolism、Excretion、Toxicity,吸收、分布、代谢、排泄、毒性,这些性质对于药物的疗效和安全性有重要的影响。因此,在药物开发的早期阶段,就能依据化合物的 ADMET 性质,对于先导化合物进行有针对性的选取和优化,是非常必要的。然而,实验评估 ADMET 性质是耗时、耗费和有限的,因此,利用机器学习或深度学习等计算方法来预测 ADMET 性质,是一种有效的替代方案。

1. ADMET 预测算法

ADMET 预测算法

目前,有许多基于机器学习或深度学习的 ADMET 性质预测的算法和工具,主要利用了大量的公共数据库中的化合物数据和相关的 ADMET 实验数据,以及一些专业的特征提取方法,来构建不同的预测模型。例如:

  • ADMETboost:基于树的机器学习模型,使用多种特征,包括指纹和描述符,来预测 22 个 ADMET 任务,包括溶解度、血浆蛋白结合、肝脏代谢、肾脏排泄等。该模型在 Therapeutics Data Commons (TDC,治疗数据共享) 的 ADMET 基准数据集上表现优异,对于 22 个任务,该模型在 18 个任务中排名第一,在 21 个任务中排名前三。
  • ADMETlab:在线工具,提供了一系列计算模型,包括溶解度、血浆蛋白结合、肝脏代谢、肾脏排泄等,可以预测药物在人体内的吸收、分布、代谢和排泄过程,并且评估其潜在的毒性和安全性。该工具使用多种机器学习模型,如随机森林、支持向量机和 k-最近邻等,以及一些深度学习模型,如多任务图注意力网络等。该工具可以预测 53 个 ADMET 终点,覆盖了多种 ADMET 相关的性质。
  • SwissADME:免费的在线工具,提供了一系列计算模型,包括溶解度、血浆蛋白结合、肝脏代谢、肾脏排泄和 CYP450 互作等,可以预测药物在人体内的吸收、分布、代谢和排泄过程,并评估其潜在的毒性和安全性。该工具还提供了一些额外的功能,如药物分子库筛选和药物相互作用预测等。
  • XenoSite Web:这是一款非常有用的在线工具,采用多种机器学习算法和特征提取方法,可以帮助药物研究人员更好地了解和预测药物分子在细胞色素 P450 酶(CYP450)中的代谢过程及相应的代谢位点,并生成代谢产物的结构。这对于药物研究和开发来说非常重要,因为 CYP450 酶是药物代谢和毒性的主要通路之一。

尽管基于机器学习或深度学习的 ADMET 性质预测的算法和工具已经取得了很多进展和成果,但是仍然存在一些难点和挑战,例如:

  • 数据的质量和数量:ADMET 性质预测的准确性和可靠性很大程度上依赖于数据的质量和数量。然而,目前,可用的数据往往是不完整、不一致、不可靠或不可获取的,这给数据的收集、整理、标准化和共享带来了困难。因此,需要更多的努力来提高数据的质量和数量,以及建立更好的数据管理和交换平台。
  • 特征的选择和提取:特征是指用于描述和表示化合物的一些属性或参数,如指纹、描述符、拓扑、结构等。特征的选择和提取对于机器学习或深度学习模型的性能和效率有重要的影响。然而,目前,还没有一个统一的标准或方法来确定哪些特征是最适合或最重要的,以及如何从复杂的化合物结构中提取这些特征。因此,需要更多的研究来探索和开发更好的特征选择和提取方法。
  • 模型的构建和评估:模型是指用于预测 ADMET 性质的一些数学或计算的方法或过程,如线性回归、决策树、神经网络等。模型的构建和评估涉及到很多的参数和指标,如训练集、测试集、验证集、交叉验证、超参数、准确率、灵敏度、特异度等。这些参数和指标的选择和调整对于模型的性能和效率有重要的影响。然而,目前还没有一个统一的标准或方法来确定哪些参数和指标是最适合或最优化的,以及如何从多个模型中选择或组合最佳的模型。因此,需要更多的研究来探索和开发更好的模型构建和评估方法。

ADMET 应用场景主要包括:

  • 药物筛选:对于大量的候选化合物进行ADMET性质的评估,从中筛选出符合成药要求的化合物,以进入后续的药效和安全性的验证。
  • 药物设计:对于已知的化合物进行ADMET性质的分析,从中发现影响ADMET性质的结构特征或分子描述符,以指导化合物的结构优化或改造,以提高药物的成药性。
  • 药物代谢:对于药物在体内的代谢过程及相应的代谢产物进行预测和分析,以了解药物的代谢途径、代谢酶、代谢稳定性、代谢活性等,以评估药物的药效和毒性。
  • 药物毒性:通过计算方法或实验方法,对药物在体内的毒性效应进行预测和分析,以了解药物的致癌性、致畸性、致敏性、肝毒性、肾毒性等,以评估药物的安全性和副作用。

2. 药物毒性预测

药物毒性预测
毒性是指化合物对生物体的不良影响,是药物发现过程中的一个重要因素,属于药物的 ADME/T (吸收、分布、代谢、排泄和毒性) 属性之一。药物毒性预测,是指利用计算方法来评估候选药物的潜在毒性,以筛选出安全有效的化合物,降低药物开发的时间和成本。

基于机器学习或深度学习的药物毒性预测是指利用人工智能技术来构建预测模型,从化学结构、基因组数据、高通量筛选数据等各种数据源中提取特征,学习化合物与毒性的关系,预测化合物在不同的毒性终点上的活性或风险。这些方法可以提高预测的准确性和效率,同时也可以减少对动物实验的依赖。

基于机器学习或深度学习的药物毒性预测,也面临着一些难点和挑战,主要包括:

  • 数据的质量和数量。药物毒性预测需要大量的高质量的数据来训练和验证模型,但是,目前可用的数据往往存在不完整、不一致、不平衡、不可比等问题,导致模型的泛化能力和可靠性受到影响。
  • 特征的选择和工程。药物毒性预测需要从复杂的数据中提取有效的特征来表示化合物的结构和性质,但是,目前还没有统一的标准和方法来选择和构造最优的特征,不同的特征可能导致不同的预测结果。
  • 模型的解释性和透明度。药物毒性预测需要模型能够提供可解释的预测结果,以便理解化合物的毒性机制和作用途径,但是,目前的机器学习或深度学习模型往往是黑盒式的,难以揭示预测的内在逻辑和依据。
  • 伦理和监管的问题。药物毒性预测需要模型能够符合伦理和监管的要求,以保证药物的安全性和有效性,但是,目前的机器学习或深度学习模型还没有得到广泛的认可和接受,需要更多的验证和评估。

3. 药物代谢产物预测

药物代谢产物
代谢 Metabolism 是药物在体内受酶系统或者肠道菌丛的作用而发生结构转化的过程,是药物代谢动力学 (ADME) 中的一个重要方面。代谢产物预测是指根据药物分子的结构和性质,预测其可能的代谢途径和代谢产物的结构。这对于评估药物的安全性、有效性和药物相互作用有重要意义。其中,细胞色素 P450 (CYP450) 是一类广泛存在于生物体中的氧化还原酶,参与了大约 75% 的药物代谢反应。因此,预测药物分子的 CYP450 代谢位点和代谢产物是代谢产物预测的核心问题。

基于机器学习或深度学习的代谢产物预测是一种利用计算模型和算法,从大量的实验数据中学习和推断药物代谢规律的方法。近年来,这种方法在代谢产物预测领域取得了一些进展和突破,提高了预测的准确性和效率。

药物代谢产物预测的难点和挑战,包括:

  • 数据的质量和数量:代谢产物预测需要大量的高质量的实验数据来训练和验证计算模型,但是,目前可用的数据集往往规模有限、分布不均、缺乏标准化和注释,导致模型的泛化能力和可靠性受到影响。
  • 模型的复杂性和可解释性:代谢产物预测涉及到多种代谢酶、多种代谢途径、多种代谢产物,以及它们之间的相互作用和影响,这使得模型的构建和优化变得非常复杂和困难。同时,基于机器学习或深度学习的模型往往缺乏可解释性,难以揭示药物代谢的分子机制和生物学意义。
  • 模型的适应性和可扩展性:代谢产物预测需要考虑不同的生物体、不同的组织、不同的环境、不同的药物等多种因素的影响,这要求模型具有良好的适应性和可扩展性,能够适应不同的场景和需求,但是,目前的模型往往只针对特定的条件和数据进行训练和测试,难以泛化到其他情况。

CYP450 是细胞色素 P450 的简称,是含有血红素作为辅因子的单加氧酶,广泛存在于生物体中,参与许多重要的生物合成和代谢过程。CYP450 酶可以催化多种有机底物的氧化反应,例如将氧氛中的一个氧原子插入到底物分子中,而另一个氧原子被还原形成水。CYP450 酶在药物代谢中起着关键作用,影响药物的活性、安全性和药物-药物相互作用。CYP450 酶是一个庞大的酶超家族,有许多不同的同工酶和亚型,根据氨基酸序列和结构特征进行分类和命名。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/717451.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

题目 1629: 蓝桥杯算法训练VIP-接水问题

题目描述: 学校里有一个水房,水房里一共装有m个龙头可供同学们打开水,每个龙头每秒钟的供水量相等,均为1。现在有n名同学准备接水,他们的初始接水顺序已经确定。将这些同学按接水顺序从1到n编号,i号同学的接水量为wi。…

Linux shell:补充命令的使用

目录 一.导读 二.正文 三.结语 一.导读 上一篇介绍了脚本的简单概念以及使用,现在补充一些命令。 二.正文 目前处于全局目录,通过mkdir创建名我为day01的文件。 通过cd命令day01 切换至day01文件当中。 使用vim文本编辑器文件名(firstdir&…

设计模式学习笔记——工厂方法模式

设计模式(创建型)—— 工厂方法模式 传统的获取对象方法,是通过 new 关键字获取一个对象,但是如果多个地方都需要该对象,就需要 new 很多次,这时候如果这个类发生了一些改变,如类名变了&#x…

静态上下文调用了非静态上下文

问题描述: static修饰的方法不能调用非static修饰方法 问题原因: 在Java中,静态方法(如main方法)可以直接访问静态成员(包括静态变量和静态方法),但不能直接访问非静态成员&#…

【Python】进阶学习:pandas--query()用法详解

📚【Python】进阶学习:pandas–query()用法详解 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程👈 希…

剑指offer面试题24 二叉树搜索树的后续遍历序列

考察点 二叉搜索树,树的后序遍历知识点 题目 分析 本题目要求判断某序列是否是二叉搜索树的后序遍历序列,后序遍历的特点是左右根,因此序列的最后一个元素肯定是根结点,而前面的序列可以分为俩部分,第一部分是左子树…

LeetCode --- 无重复字符的最长子串

题目描述 无重复字符的最长子串 找到无重复的最长连续字符串。 示例1中 abc | bca | cab 都符合题意。输出3即可。 代码 可以使用暴力枚举 哈希表,哈希表来判断是否重复,枚举来判断每一种情况,需要开两层for循环,时间复杂度n…

linux高级编程:线程(二)、进程间的通信方式

线程: 回顾线程(一): 1.线程间通信问题 线程间共享同一个资源(临界资源) 互斥: 排他性访问 linux系统 -- 提供了Posix标准的函数库 -- 互斥量(互斥锁) 原子操作&#x…

精通Matplotlib:从入门到精通的绘图指南

在本篇文章中,我们将深入探索Matplotlib库,这是一个强大的Python绘图库,广泛用于数据可视化。Matplotlib让我们能够以简单而直观的方式创建各种静态、动态和交互式的图表。无论你是数据分析师、科研人员,还是任何需要数据可视化的…

用Redis如何实现延迟队列?

在Redis中实现延迟队列可以利用有序集合(Sorted Set)和定时任务的方式。下面是一个基本的实现思路: 添加延迟任务: 将任务信息作为一个字符串存储在Redis中,同时将其对应的执行时间作为分数(score)存储在有序集合中。使…

Bililive-go 实现直播自动监控录制

前言 最近有直播录制的需求,但是自己手动录制太麻烦繁琐,于是用了开源项目Bililive-go进行全自动监控录制,目前这个项目已经有3K stars了 部署 为了方便我使用了docker compose 部署 version: 3.8 services:bililive:image: chigusa/bilil…

win环境nginx实战配置详解

项目中经常使用nginx做负载均衡,接口路由、文件、文档的上传及下载、视频的代理播放等等,都离不开nginx的支持,今天我们分享一下其个使用场景。 1、配置文件 nd-nginx.conf 全局配置 #全局配置端,对全局生效,主要设置…

leetcode-字符串相加

415. 字符串相加 题目中已经说明不能使用库函数直接将输入的字符串转换为整数。这就需要我们自己实现大数加法的逻辑,我们可以从两个字符串的最后一位开始,逐位相加,同时记录进位。如果某一位相加的结果超过10,那么需要向前进位。…

javascript实现的星座查询

今天在这个网站http://xzxys.wiicha.com/看到查询星座幸运色的效果,想研究一下代码,结果右键禁用。后来参考了一下别人的代码,琢磨着先实现了一下星座查询的功能,输入月份和日期四位数后,可以查询属于哪个星座&#xf…

群体风暴之锤(War3地图编辑器)

文章目录 0、大致原理1、创建隐形单位2、新事件开端3、环境→新条件4、动作4.1、单位组4.1.1、圆范围内单位4.1.2、指定条件 4.2、对单位组内的所有单位释放风暴之锤 0、大致原理 真MK向目标点释放风暴之锤时选定(以技能释放点为圆心,设定半径&#xff0…

Python编程语言常用的包管理工具介绍

conda是一个开源的包管理器和环境管理器,用于安装、运行和更新包和它们的依赖项。conda可以用于Python编程语言,但它也支持其他编程语言。conda的主要特点是它能够在不同的环境中管理不同的包集合,这使得它非常适合于数据科学和机器学习项目&…

洛谷 P1439 最长公共子序列

题目描述 给出 1,2,…,n 的两个排列 P1​ 和 P2​ ,求它们的最长公共子序列。 输入格式 第一行是一个数 n。 接下来两行,每行为 n 个数,为自然数 1,2,…,n 的一个排列。 输出格式 一个数,即最长公共子序列的长度。 输入输出…

详解算法的时间复杂度和空间复杂度!

目录 ​编辑 1. 算法效率 2. 时间复杂度 2.1 时间复杂度的概念 2.2 大O的表示渐进法 2.3 一个栗子 3. 空间复杂度 4. 常见复杂度对比 5. 完结散花 ​​​​​​​ 悟已往之不谏,知来者犹可追 创作不易,宝子们!如果这篇文章对你们有…

Flex布局

Flex布局是一种用于创建灵活且自适应的布局模型,它使得元素能够更好地响应不同的屏幕尺寸和设备。Flex布局基于容器和项目的概念,通过设置容器的属性来控制项目的布局和对齐方式。 Flex布局的关键概念包括: 父容器(Flex容器&…

Git实战(3)之merge与rebase区别

1,采用merge和rebase后,git log的区别,merge命令不会保留merge的分支的commit 2,处理冲突的方式: (一股脑)使用merge命令合并分支,解决完冲突,执行git add .和 git commit -mfix conflict。这个时候会产生一个commit。(交互式)使用rebase命令合并分支,解决完冲突,…