在Jupyter-lab中使用RDKit画分子2D图

在Jupyter-lab中使用RDKit画分子2D图

在做完分子对接后,想看看筛选后的分子的结构。因此想利用Jupyter-lab来画分子的2D图。

1. 安装Jupyter-lab与RDKit

  • 系统:Win11
  • 已安装conda

RDKit 是一个功能强大、灵活易用的化学信息学工具包,广泛应用于药物发现、化学生物学、材料科学等领域。RDKit 提供了丰富的化学信息可视化功能,用户可以通过RDKit 生成分子结构图、化学反应图、药物分子的三维结构等,方便进行结果展示和分析。

1.1 安装RDKit

#创建并安装RDKit的conda环境
conda create -c conda-forge -n my-rdkit-env rdkit#激活RDKit的虚拟环境
conda activate my-rdkit-env

不知道为啥,这一步很慢,不知道是不是conda channel的问题。但总归是等了一段时间就成功了。参考自官方教程。

1.2 安装Jupyter-lab

Jupyter Lab是Jupyter Notebook的升级版本,可以一个窗口中同时打开多个 Notebook、代码编辑器、终端、文件浏览器等,更方便地进行多任务处理和工作流程管理。Jupyter Lab集成了丰富的文档编辑器,包括 Markdown、LaTeX 等,用户可以方便地编写和编辑文档,同时可以通过插件支持更多的文档格式和扩展功能。最主要的是Jupyter Lab提供了丰富的可视化功能,用户可以通过插件支持各种图表库和数据可视化工具,实现更丰富和复杂的数据分析和可视化。

使用pip安装

pip install jupyterlab

参考自官方安装教程。

2. 小分子(SDF格式)作图

2.1 画单个SDF格式的分子图

以他莫昔芬(Tamoxifen)小分子为例,首先从PubChem网站下载该分子的三维结构的SDF结构文件。
在这里插入图片描述
如法炮制,再下载其余三个小分子:阿司匹林(Aspirin),莫洛昔康(Molnupiravir),瑞德西韦(Remdesivir)。将四个分子保存在sdf/文件夹中。

在CMD中跳转至cd sdf/文件夹路径下,打开Jupyter-lab

from rdkit import Chem
from rdkit.Chem import AllChem
from rdkit.Chem import Draw#读取sdf文件
m1 = Chem.MolFromMolFile('sdf/Conformer3D_COMPOUND_CID_121304016.sdf')#通过调用AllChem.Compute2DCoords(m1)计算出m1分子相应的二维坐标,并将其更新到分子对象中
AllChem.Compute2DCoords(m1)#判断m1分子是否读取成功
m1 is None#Draw.MolToImage()函数画出分子的2D图像
Draw.MolToImage(m1)

运行后结果如下:
在这里插入图片描述

  • 读取单个的SDF文件可以用Chem.MolFromMolFile(),尽管这个主要用于读取MOL格式的分子文件。
  • 读取一个存有多个分子集的SDF文件,主要用Chem.SDMolSupplier()
  • Chem.MolFromMolFile()无法读取PDB格式的分子文件,因此小分子文件读取主推SDF格式

2.2 画多个SDF格式的分子图

读取sdf/文件夹下的多个SDF分子,且将分子的2D图放在一张图中。

import os
import glob# 指定小分子的存储路径
path = r'sdf/'# 使用os.path.join构建路径,获取所有.sdf文件的路径列表
sdf_files = glob.glob(os.path.join(path, '*.sdf'))# 将所有.sdf文件保存在一个列表ms中
ms = []
for sdf_file in sdf_files:m = Chem.MolFromMolFile(sdf_file)ms.append(m)#计算出列表中分子的二维坐标,并将其更新到分子对象中  
for m in ms: tmp=AllChem.Compute2DCoords(m)# MolsToGridImage()函数可以将4个分子画在一张图上
# molsPerRow=4参数设置4个小分子并排成一列
# subImgSize=(500,500)设置每个小分子的图像尺寸为500x500大小
# legends=x.GetProp("_Name")获取小分子的名称作为图例
img=Draw.MolsToGridImage(ms[:4],molsPerRow=4,subImgSize=(500,500),legends=[x.GetProp("_Name") for x in ms[:4]], returnPNG=False) # 保存分子图像为PNG格式文件在sdf/文件夹下
img.save('./Mol_4.png')img

结果如下所示:
在这里插入图片描述
Draw.MolsToGridImage函数中设置returnPNG=False参数,主要用于在保存画出的图片时img.save()的报错:


AttributeError Traceback (most recent call last) Cell In[23], line 20
17 for m in ms: tmp=AllChem.Compute2DCoords(m)
19 img=Draw.MolsToGridImage(ms[:4],molsPerRow=4,subImgSize=(500,500),legends=[x.GetProp(“_Name”)
for x in ms[:4]])
—> 20 img.save(‘./Mol12_20.png’)
21 img

AttributeError: ‘Image’ object has no attribute ‘save’

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/717702.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

w30使用python调用shell脚本

使用python脚本去实现永恒之蓝漏洞攻击 实验环境 攻击工具:pythonmsfconsole 靶场:win7 和 kali实验目的 演示python脚本调用过程 实验步骤 1.写一个永恒之蓝的攻击脚本,定义为blue.rc use exploit/windows/smb/ms17_010_eternalblue …

Spark(2)-基础tranform算子(一)

一、算子列表 编号名称1map算子2flatMap算子3filter算子4mapPartitions算子5mapPartitionsWithIndex算子6keys算子7values算子8mapValues算子9flatMaplValues算子10union算子11reducedByKey算子12combineByKey算子13groupByKey算子14foldByKey算子15aggregateByKey算子16Shuff…

深度学习工具之tokens计算器

1.什么是Token Token是GPT处理文本的基本单位。Token可以是一个字、一个词语或特定语言中的一个字符。它们负责将输入的文本数据转换为 GPT 可以处理的数据格式。每个 GPT 模型都有一个预设的最大 Tokens 数量,例如,GPT-3 每次调用允许处理的最大 Token…

韦东山嵌入式Liunx入门驱动开发五

文章目录 一、驱动程序基石1-1 休眠与唤醒1-2 POLL机制1-3 异步通知(1) 异步通知程序解析(2) 异步通知机制内核代码详解 1-4 阻塞与非阻塞1-5 定时器(1) 内核函数(2) 定时器时间单位 1-6 中断下半部 tasklet 本人学习完韦老师的视频,因此来复习巩固,写以…

《幻兽帕鲁》游戏对服务器性能的具体要求是什么?

《幻兽帕鲁》游戏对服务器性能的具体要求是什么? CPU:官方最低要求为i5-3570K,但在多人游玩时可能会有明显卡顿。此外,还有建议选择4核或更高性能的处理器,以确保游戏运行流畅。 内存:对于不同人数的联机&…

苹果ios群控软件开发常用源代码分享!

在移动软件开发领域,苹果设备由于其封闭性和安全性受到了广大开发者的青睐,然而,这也为开发者带来了一些挑战,特别是在进行群控软件开发时。 群控软件是指可以同时控制多台设备的软件,这在自动化测试、批量操作等场景…

数据要素:数字化转型中的新“金矿”及其发展潜力

作为一名在数字化转型项目中摸爬滚打的实践者,我们见证了数据从简单的信息处理工具逐渐演变为驱动经济社会发展的关键要素。近日,多部门联合发布的《“数据要素”三年行动计划(2024—2026年)》更是将数据要素的重要性提升到了新的…

C++ //练习 10.15 编写一个lambda,捕获它所在函数的int,并接受一个int参数。lambda应该返回捕获的int和int参数的和。

C Primer(第5版) 练习 10.15 练习 10.15 编写一个lambda,捕获它所在函数的int,并接受一个int参数。lambda应该返回捕获的int和int参数的和。 环境:Linux Ubuntu(云服务器) 工具:v…

十六、异常和File

异常和File 一、异常1.1异常的分类1.2 异常的作用1.3 异常的处理方式1.3.1 JVM默认的处理方式1.3.2 自己处理(捕获异常)1.3.3 自己处理(灵魂四问) 1.4 异常中的常见方法1.5 抛出异常综合练习(键盘录入数据)…

基于springboot+vue的社区养老服务平台

博主主页:猫头鹰源码 博主简介:Java领域优质创作者、CSDN博客专家、阿里云专家博主、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战,欢迎高校老师\讲师\同行交流合作 ​主要内容:毕业设计(Javaweb项目|小程序|Pyt…

黑马点评-商户查询业务

缓存原理 本文的业务就是redis的经典应用,标准的操作方式就是查询数据库之前先查询缓存,如果缓存数据存在,则直接从缓存中返回,如果缓存数据不存在,再查询数据库,然后将数据存入redis。 缓存更新策略 根据…

Spring重点记录

文章目录 1.Spring的组成2.Spring优点3.IOC理论推导4.IOC本质5.IOC实现:xml或者注解或者自动装配(零配置)。6.hellospring6.1beans.xml的结构为:6.2.Spring容器6.3对象的创建和控制反转 7.IOC创建对象方式7.1以有参构造的方式创建…

【OneAPI】猫狗类别检测API

OneAPI新接口发布:猫狗类别检测 45种狗狗类别和15种猫猫类别检测。 API地址:POST https://oneapi.coderbox.cn/openapi/api/detect/dogcat 请求参数(body) 参数名类型必填含义说明imageUrlstring是图片地址网络图片地址&#…

Vue路由(黑马程序员)

路由介绍 将资代码/vue-project(路由)/vue-project/src/views/tlias/DeptView.vue拷贝到我们当前EmpView.vue同级,其结构如下: 此时我们希望,实现点击侧边栏的部门管理,显示部门管理的信息,点击员工管理,显…

【周总结平淡但不平凡的周末】

上周总结 根据系统生产环境的日志文件,写了个脚本统计最近使用我们系统的用户的手机型号以及系统,帮助聚焦主要测试的机型,以及系统类型 依然是根据时区不同对项目进行改造,还有一个开发好的接口需要下周联调 2024/3/3 晴…

QT Mingw32/64编译ffmpeg源码生成32/64bit库以及测试

文章目录 前言下载msys2ysamFFmpeg 搭建编译环境安装msys2安装QT Mingw编译器到msys环境中安装ysam测试 编译FFmpeg测试 前言 FFmpeg不像VLC有支持QT的库文件,它仅提供源码,需要使用者自行编译成对应的库,当使用QTFFmpeg实现播放视频以及视频…

连接 mongodb集群的集中方式

mongodb 连接到复制集 mongodb://node1,node2,node3.../database?[options]mongodb 连接到分片集 mongodb://mongos1,mongos2,mongos3.../database?[options]使用 mongosrv 通过域名解析得到所有的 mongos 或 节点的地址, 而不是把这些写在连接字符串中. mongodbsrv://se…

经典的算法面试题(1)

题目: 给定一个整数数组 nums,编写一个算法将所有的0移到数组的末尾,同时保持非零元素的相对顺序。 示例: 输入: [0,1,0,3,12] 输出: [1,3,12,0,0] 注意:必须在原数组上操作,不能拷贝额外的数组。尽量减少操作次数。 这…

数据处理——一维数组转列向量(分割时间序列为数据块时的问题)

记录在处理数据时被磕绊了一下的一个处理细节。 1.想要达到的要求 在某次滑动窗口取样时间序列数据时,我得到如下一个以一维数组为元素的列表: 对于如上输出列表中的每个一维数组,我希望将其转换为下图中的形式,简单说就是希望他…

【详识JAVA语言】面向对象程序三大特性之三:多态

多态 多态的概念 多态的概念:通俗来说,就是多种形态,具体点就是去完成某个行为,当不同的对象去完成时会产生出不同的状态。 多态实现条件 在java中要实现多态,必须要满足如下几个条件,缺一不可&#xf…