「超级细菌」魔咒或将打破,MIT 利用深度学习发现新型抗生素

作者:加零

编辑:李宝珠、三羊

MIT 利用图神经网络 Chemprop 识别潜在抗生素,特异性杀死鲍曼不动杆菌。

自然界中充满了各种各样的微生物,例如结核杆菌(导致肺结核)、霍乱弧菌(导致霍乱)等严重危害了人们的健康。而在人类历史上,感染这些致病细菌,除了依赖人体自身的免疫系统,几乎无解。直到 1928 年,青霉素的发现,让人类第一次拥有了战胜致病细菌的有力武器。

然而,抗生素的广泛应用也带来了一个巨大的危机 —— 抗生素耐药性 (AMR),据世界卫生组织 (WHO) 统计, 2019 年全球约有 120 万人死于抗生素耐药性 (AMR) 所加剧的细菌感染,这已经高于艾滋病导致的死亡人数。滥用抗生素催生某些「超级细菌」的出现,成为了 21 世纪临床重要致病因。要解决这一难题,迫切需要开发全新的抗生素。

针对特异细菌,深度学习模型可以提高对化合物药效和安全性的预测准确性,有效减少实验室实验和临床试验的时间和资源消耗,对有效且安全的抗生素发现至关重要。

为此,来自 MIT 的研究者们开发了一种深度学习方法来发现抗生素,利用图神经网络 Chemprop 从大型化学库中识别潜在的抗生素,并发现了一类新型抗生素。 他们能够特异性杀死重要的耐药菌 —— 鲍曼不动杆菌 (Acinetobacter baumannii),相关论文已发表于 Nature。

在这里插入图片描述

论文已发表于 Nature

论文地址:
https://www.nature.com/articles/s41586-023-06887-8
关注公众号,回复「发现抗生素」下载完整论文

实验方法:利用图神经网络的深度学习

数据集:多种化合物

初步筛选: 该研究初步筛选了 39,312 种化合物,对其抗生素活性和人类细胞毒性特征进行分析。
扩大预测: 为进一步扩大预测范围,这些模型对 12,076,365 种化合物进行测试,其中 11,277,225 种来自 Mcule 数据库,799,140 种来自 Broad Institute 数据库。

在这里插入图片描述

39,312 个化合物的分子量分布

算法训练:利用图神经网络进行训练

使用图神经网络 Chemprop 对筛选出的 39,312 种化合物进行训练,预测其抗生素活性和人类细胞毒性,训练过程如下。

在这里插入图片描述

分子表示: 使用 RDKit 从每个化合物的 SMILES(Simplified Molecular Input Line Entry Specification,简化分子输入线性入口系统)字符串生成基于图的分子表示。

特征向量生成: 为每个原子和键生成特征向量,包括原子特征(如原子序数、键数、正电荷等)和键特征(如键类型、共轭、环成员资格等)。

信息传递: 实现基于键的信息传递卷积神经网络,更新键的消息,通过神经网络层并应用非线性激活函数。

模型输出: 模型在固定的信息传递步骤后,对整个分子的消息进行汇总,通过前馈神经网络预测化合物的活性,如抗生素活性、细胞毒性或改变质子动力势的活性。

优化措施: 包括添加额外的分子级特征、使用超参数优化选择最佳性能参数,以及通过集成学习增强模型的鲁棒性。

模型架构:保证化合物的有效性和安全性

抗生素活性模型

研究人员在化合物浓度 50 μM 的培养基中预测其对金黄色葡萄球菌 (S. aureus) 的抗生素活性,以 80% 标准化生长抑制截止值 (normalized growth inhibition cut-off) 区分为活性或无活性。共 10 个图神经网络模型在同一 80% - 20% 的训练数据集上进行了训练、验证和测试。

结果显示,具有 RDKit 特征的 Chemprop 模型表现出更优越的预测能力,在 39,312 种化合物中识别出 512 种活性化合物。

在这里插入图片描述

预测抗生素活性的深度学习模型比较

人类细胞毒性模型

研究人员利用 39,312 种化合物对人类肝癌细胞 (HepG2)、人类初级骨骼肌细胞 (HSkMCs) 和人类肺成纤维细胞 (IMR-90) 进行毒性筛选。在用每种化合物 10 μM 浓度处理 2-3 天后,评估细胞活力,以 90% 细胞活力截止值 (cell viability cut-off) 将化合物活性分类。

同样对 10 个 Chemprop 模型集合进行了训练、验证和测试,对比结果如下图:

在这里插入图片描述

预测人类细胞毒性的深度学习模型比较

结果显示,分别有 3,341 (8.5%)、1,490 (3.8%) 和 3,447 (8.8%) 的化合物对 HepG2 细胞、HSkMCs 和 IMR-90 细胞具有毒性。在上步筛选出的 512 种活性抗菌化合物中,306 种对这三种细胞类型均无毒性。

总结来看,尽管与抗生素活性模型相比存在一定局限性,这一模型平衡了药物的有效性和对人体的无害性,展示了在药物发现中使用先进计算方法的潜力。

实验结果:抗生素的筛选识别

精炼和大范围应用模型:全化学空间的筛选和可视化

在这一研究阶段中,重点在于精炼和应用模型,以便在庞大的化学空间中识别潜在的抗生素化合物,并评估它们的细胞毒性。研究人员重新训练了 20 个 Chemprop 模型用于预测抗生素活性和 HepG2、HSkMC、IMR-90 细胞的细胞毒性,改进后的模型被应用于 12,076,365 种化合物预测上。

化合物筛选

抗生素活性筛选:从 Mcule 数据库中筛选出抗生素预测得分超过 0.4 的 3,004 种化合物;从 Broad Institute 数据库中筛选出得分超过 0.2 的 7,306 种化合物。

人类细胞毒性筛选:

保留细胞毒性预测得分低于 0.2 的化合物,最终筛选出 3,646 种化合物(1,210 种来自Mcule 数据库,2,436 种来自 Broad Institute 数据库)——占所有评估化合物的 0.03%。

在这里插入图片描述

化合物筛选

a:计算机模拟过滤程序b-e:抗生素活性和 HepG2、HSkMC、IMR-90 细胞的细胞毒性预测

化学空间的可视化

以摩根指纹 (Morgan fingerprints) 为分子表示,采用 t 分布随机相邻嵌入 (t-SNE, t-distributed stochastic neighbour embedding) 方法对化学空间进行可视化。

如下图所示,t-SNE 的可视化揭示了 hits(通过筛选的化合物)和 non-hits(抗生素预测得分低的化合物)之间的明显差异。

在这里插入图片描述

对化合物的 t-SNE 分析

进一步筛选:识别两个有效化合物

在 3,646 个化合物中筛选出 2 个对金黄色葡萄球菌表现出高活性且对人类细胞具有良好选择性的化合物(1 号和 2 号),这两种化合物在各种测试条件下的表现、特别是在含血清的培养基中的生长抑制能力很优越,值得进一步研究。

这些化合物的研究表明,深度学习模型预测的结构类别可以有效地指导实验筛选,从而发现新的抗生素候选物。

筛选过程

化合物筛选:从最初的 3,646 个 hits 化合物中去除了含有可能反应活性、致突变或药代动力学不利的 PAINS 和 Brenk 警报的化合物,筛选至 2,209 个。

结构筛选:进一步筛选与训练集中化合物结构不同的化合物,使用最大 Tanimoto 相似性得分 ≤0.5 作为初步切断点,并排除含 β-内酰胺环或喹诺酮双环核心的化合物,最终得到 1,261 个化合物。

有效化合物的识别

生长抑制测试: 在 9 个与理性组 G1-G5 相关的 hits 化合物中,发现 4 个化合物 (44%) 对金黄色葡萄球菌 (S. aureus) 有活性,最小抑制浓度 (MIC) ≤32 μg/ml。

结构类别和有效性:这些有效化合物与理性组 G1、G2 和 G5 相关,其中 G2 组的两个化合物(1号和2号)被证实为活性。这两个化合物同时符合 Lipinski 的规则和 Ghose 标准,表明它们具有良好的口服生物利用度和药物样特性,值得进一步研究。

在这里插入图片描述

筛选出的两个化合物

进一步研究:两个化合物的特性

通过深入的机制研究和体内外实验,化合物 1 和 2 显示出作为新型抗生素候选物的潜力。它们不仅针对多重耐药菌株有效,而且具有较低的耐药性发展趋势和良好的安全性。

这些发现表明,这两种化合物可作为抗生素药物发展的有希望的化学系列。

作用机制和耐药性

共同结构: 化合物 1 和 2 共享 N-[2-(2-chlorophenoxy)ethyl]aniline core 这一结构,预测表明这可能是抗生素活性的基本结构。

生长抑制实验: 在对金黄色葡萄球菌和枯草杆菌的时间杀菌实验中,这两种化合物显示出了抗生素活性,与范科霉素类似但杀菌力较低。

耐药性研究: 在对抗生素耐药的金黄色葡萄球菌株进行的实验中,这两种化合物的最小抑制浓度 (MIC) 只略有增加,表明它们可能具有与常见抗生素不同的作用机制。

耐药性的发展: 经过 30 天的连续培养,这两种化合物的 MIC 几乎没有变化,显示出较低的耐药性发展趋势。

抗多重耐药菌效果

广泛抗性: 这两种化合物对包括万古霉素耐药性肠球菌在内的 40 种不同细菌种类表现出活性,其中 MIC 的中位数分别为 4 和 3 μg/ml。

对静止期细菌的有效性: 这两种化合物对枯草杆菌的静止期细胞也显示出活性。

毒理学、化学特性及功效

安全性研究: 这两种化合物在体外实验中表现出良好的安全性,包括非溶血性、不结合金属离子、无基因毒性、化学稳定性以及在小鼠体内的安全性。

体内功效实验: 在小鼠金黄色葡萄球菌皮肤感染和大腿感染模型中,化合物 1 表现出显著的抗菌活性。

在这里插入图片描述

化合物的体内疗效

深度学习:应对抗生素耐药性的利器

研究人员多年来一直在探索应对抗生素耐药性的有效、易推广的方法,在这一过程中,深度学习的出现为研究人员提供了新的解题思路,深度学习在应对抗生素耐药性方面的应用价值在于:

超越传统抗生素发现方法: 传统的抗生素发现方法往往依赖于已知的活性结构,这限制了新药发现的范围。深度学习方法可以识别与传统抗生素结构不同的新化合物,可能对当前耐药的菌株有效。

个性化和精准医疗: 深度学习可以用于分析特定病原体的遗传和表型特征,从而有助于开发针对特定病原体或感染类型的个性化抗生素。

道阻且长,行之将至。深度学习在药物研发中的应用仍处于相对早期阶段,可能会面临数据质量和可解释性等挑战,但作为人类对抗细菌的重要防线,相关研究意义重大,相信势必会在技术迭代的加持下持续向前。

参考文献:
https://www.nature.com/articles/s41586-023-06887-8

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/611422.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构实验4:链表的基本操作

目录 一、实验目的 二、实验原理 1. 节点 2. 指针 3.链表的类型 3.1 单向链表 3.2 双向链表 3.3 单向循环链表 3.4 双向循环链表 4. 单链表的插入 4.1 头插法 4.2 尾插法 4.3 在指定位置插入元素 5. 单链表的删除 5.1 删除指定数值的节点 5.2 删除指定位置的节点 …

Pytorch从零开始实战16

Pytorch从零开始实战——ResNeXt-50算法的思考 本系列来源于365天深度学习训练营 原作者K同学 对于上次ResNeXt-50算法,我们同样有基于TensorFlow的实现。具体代码如下。 引入头文件 import numpy as np from tensorflow.keras.preprocessing.image import Ima…

TensorRt(5)动态尺寸输入的分割模型测试

文章目录 1、固定输入尺寸逻辑2、动态输入尺寸2.1、模型导出2.2、推理测试2.3、显存分配问题2.4、完整代码 这里主要说明使用TensorRT进行加载编译优化后的模型engine进行推理测试,与前面进行目标识别、目标分类的模型的网络输入是固定大小不同,导致输入…

【现代密码学】笔记3.4-3.7--构造安全加密方案、CPA安全、CCA安全 《introduction to modern cryphtography》

【现代密码学】笔记3.4-3.7--构造安全加密方案、CPA安全、CCA安全 《introduction to modern cryphtography》 写在最前面私钥加密与伪随机性 第二部分流加密与CPA多重加密 CPA安全加密方案CPA安全实验、预言机访问(oracle access) 操作模式伪随机函数PR…

Java微服务系列之 ShardingSphere - ShardingSphere-JDBC

🌹作者主页:青花锁 🌹简介:Java领域优质创作者🏆、Java微服务架构公号作者😄 🌹简历模板、学习资料、面试题库、技术互助 🌹文末获取联系方式 📝 系列专栏目录 [Java项…

报错解决:No module named ‘pytorch_lightning‘ 安装pytorch_lightning

报错记录 执行如下代码: import pytorch_lightning报错: No module named ‘pytorch_lightning’ 解决方式 安装pytorch_lightning包即可。 一般情况下,缺失的包通过pip安装,即: pip install pytorch_lightning然…

1 快速前端开发

1 前端开发 目的:开发一个平台(网站)- 前端开发:HTML、CSS、JavaScript- Web框架:接收请求并处理- MySQL数据库:存储数据地方快速上手:基于Flask Web框架让你快速搭建一个网站出来。1.快速开发…

HarmonyOS应用开发学习笔记 应用上下文Context 获取文件夹路径

1、 HarmoryOS Ability页面的生命周期 2、 Component自定义组件 3、HarmonyOS 应用开发学习笔记 ets组件生命周期 4、HarmonyOS 应用开发学习笔记 ets组件样式定义 Styles装饰器:定义组件重用样式 Extend装饰器:定义扩展组件样式 5、HarmonyOS 应用开发…

14-股票K线图功能-个股日K线SQL分析__ev

需求:统计个股日K线数据,也就是把某只股票每天的最高价,开盘价,收盘价,最低价形成K线图。

山西电力市场日前价格预测【2024-01-11】

日前价格预测 预测说明: 如上图所示,预测明日(2024-01-11)山西电力市场全天平均日前电价为231.43元/MWh。其中,最高日前电价为422.21元/MWh,预计出现在18:00。最低日前电价为0.00元/MWh,预计出…

现代软件测试中的自动化测试工具

自动化测试的重要性和优势 引言:随着软件开发的不断发展,自动化测试工具在现代软件测试中扮演着重要角色。提高效率:自动化测试可以加快测试流程,减少人工测试所需的时间和资源。提升准确性:自动化测试工具可以减少人…

PACS医学影像报告管理系统源码带CT三维后处理技术

PACS从各种医学影像检查设备中获取、存储、处理影像数据,传输到体检信息系统中,生成图文并茂的体检报告,满足体检中心高水准、高效率影像处理的需要。 自主知识产权:拥有完整知识产权,能够同其他模块无缝对接 国际标准…

Linux CentOS 7.6安装JDK详细保姆级教程

一、检查系统是否自带jdk java --version 如果有的话,找到对应的文件删除 第一步:先查看Linux自带的JDK有几个,用命令: rpm -qa | grep -i java第二步:删除JDK,执行命令: rpm -qa | grep -i java | xarg…

企业的 Android 移动设备管理 (MDM) 解决方案

移动设备管理可帮助您在不影响最终用户体验的情况下,通过无线方式管理和保护组织的移动设备群,现代 MDM 解决方案还可以控制 App、内容和安全性,因此员工可以毫无顾虑地在托管设备上工作。移动设备管理软件可有效管理个人设备上的公司空间。M…

优化CentOS 7.6的HTTP隧道代理网络性能

在CentOS 7.6上,通过HTTP隧道代理优化网络性能是一项复杂且细致的任务。首先,我们要了解HTTP隧道代理的工作原理:通过建立一个安全的隧道,HTTP隧道代理允许用户绕过某些网络限制,提高数据传输的速度和安全性。然而&…

工业交换机在智慧水务和水处理中的应用

智慧水务是一种基于互联网和物联网技术的水务管理模式。它利用现代信息技术,将传统的水务管理模式升级,实现智慧化的水务管理方式。智慧水务的实现离不开各种先进的技术手段。物联网技术是智慧水务的重要组成部分。通过在水务系统中部署工业交换机、传感…

C/C++调用matlab

C/C调用matlab matlab虽然可以生成C/C的程序,但其能力很有限,很多操作无法生成C/C程序,比如函数求解、优化、拟合等。为了解决这个问题,可以采用matlab和C/C联合编程的方式进行。使用matlab将关键操作打包成dll环境,再…

MySQL 存储引擎全攻略:选择最适合你的数据库引擎

1. MySQL的支持的存储引擎有哪些 官方文档给出的有以下几种: 我们也可以通过SHOW ENGINES命令来查看: 还可以通过ENGINES表查看 2. 存储引擎比较 我们通过存储引擎表来看各自的优点: InnoDB 默认的存储引擎(SUPPORT字段为D…

广东做“人工心脏”可以报销啦

(人民日报健康客户端记者 杨林宋)1月5日,据南方医科大学珠江医院消息,医院为一位57岁患者处于心衰终末期的患者,植入一款国产“人工心脏”——左心室辅助装置。据了解,这是该款“人工心脏”纳入广东省医保准…

py的循环语句(for和while)

前言:本章节和友友们探讨一下py的循环语句,主播觉得稍微有点难主要是太浑了,但是会尽量描述清楚,OK上车!(本章节有节目效果) 目录 一.while循环的基本使用 1.1关于while循环 1.2举例 1.31-1…