python中cock什么意思_[转载]原创脚本逐步实现Autodcock-Vina的虚拟筛选及筛选后分析...

[转载]原创脚本逐步实现Autodcock-Vina的虚拟筛选及筛选后分析

a4c26d1e5885305701be709a3d33442f.png

(2013-07-03 11:31:56)

标签:

转载

Vina是在Autodock4基础上改进的算法,相比autodock4而言,具体优势:准确,并行计算(官网数据):AutoDock

Vina is a new open-source program for drug discovery, molecular docking and

virtual screening, offering multi-core capability, high performance

and enhanced accuracy and ease of use.

相应参考文献:O. Trott, A. J. Olson,

AutoDock Vina: improving the speed and accuracy of docking with a

new scoring function, efficient optimization and multithreading,

Journal of Computational Chemistry 31 (2010)

455-461

最近用了Vina做了一次对接,我只对接了几百个化合物,发现这软件,现在还不太智能,比如说前期处理,对接结果处理,我始终认为与典型的mol2或者sdf格式文件相比,PDBQT+dlg格式文件不是很好处理,最近和一个师弟写了几个脚本程序,用来处理Vina对接问题:主要的程序如下:

对接软件:Autdock-Vina (http://vina.scripps.edu/)

PDBQT生成脚本程序:LigPrep.sh or LigPrep.py (shell 和

python,见附件):可以实现mol2、sdf、PDB、PDBQT等格式文件的虚拟库,转化成Autodock或者Vina需要的单个分子的PDBQT文件,还写了一个插件,自动去除重复分子。

结果处理程序:ARC-1.2.py (Autodock and Vina Result Conversion,

python版本,见附件):实现Dlg文件、单个分子的PDBQT对接结果转化成集成的PDBQT、sdf等格式文件。还可以根据命令提示,提取打分最好的构想及打分,或者排名前十的分子,这对处理大规模虚拟筛选十分关键。

接口程序:Vina-1.4.sh (shell

版本):主要实现自动对接,只要用这个接口就可以实现,就像商业的软件的按钮操作一样,简单方便~

obabel 软件:我们的脚本需要调用此软件里面的插件来实现功能,关于这个插件,现在自己准备后面的时间来写这段代码。

我下面结合具体例子来说:

1、蛋白受体的处理:

这个不需要多说了,ADT或者PyRx,都可以生成受体的PDBQT文件(建议),或者就自己手动生成一个(不建议),然后确定盒子中心。按照Vina的输入文件要去制作.cgf文件,例如:

config.cgf

#######################################################

receptor = rec.pdbqt //受体的名称

center_x = -2

center_y = 0 //盒子的质心

center_z = -4

size_x = 30

size_y = 32 //盒子的大小

size_z = 46

exhaustiveness = 20 //计算的复杂度

cpu = 16 //并行计算

energy_range = 4 //作用能间距等级,这个我到现在也没搞懂

a4c26d1e5885305701be709a3d33442f.png

num_modes = 20 //保留构想数目,这个是cluster之后的结果,实际构想可能很多

#######################################################

2、虚拟库小分子文件的准备

首先把虚拟库转化成mol2格式文件(里面包含很多分子),其实这个处理还需注意一些事项,如加氢、电荷、去除自身小分子、离子、无机盐等等,对接前的构想最好是3D构想

然后启动脚本LigPrep.sh,根据提示操作:

###################################################################

# sh LigPrep.sh [option] argument #

# Usage: LigPrep.sh prepares autodock input files (PDBQT).

# Requirement:

# 1.Ensure that molecules in the input file are of 3D prior to

preparation. //需要小分子的3D构象

# 2.Each molecule should have a unique internal name. //需要小分子唯一的内部名字

# 3.obabel is in use and its environment varible set. //需要安装obabel软件

# Option:

# -i input_file (*.sdf, *.mol2, *.pdb, *.pdbqt)

# -o output_directory (default is '__pdbqt_files__')

# -n Number of molecules to divide into each group

# (default is 1500)

# -h display this message

# -help alias of '-h'

###################################################################

例如:

sh LigPrep.sh -i ***.sdf

(这样就可以生成一个默认的文件夹,里面包含虚拟库的单个小分子的PDBQT格式文件,即可以用于Autodock或者vina进行虚拟筛选)

3、虚拟筛选

启动脚本:vina-1.4.sh

#################################################################

# Usage: #

# sh vina-1.4.sh working_direcotry [option] #

# Option: #

# --help display this message #

# -h alias of "--help" #

# Note: #

# working_directory contains input and output folders. Receptor

file (e.g. receptor.pdbqt ), ligand file(s)

(e.g ligand_01.pdbqt or ligands.mol2 ) and configuration file (e.g

config.cfg) must be put in the "input" folder;

all output files (*_out.pdbqt, *.log and *.txt) will be generated

in the "output" folder.

# The hierarchy relationship of the above folders and files can be

depicted as follow: #

# ROOT

# |__ Group1 Group2 Group3 ... vina vina-1.2.sh

# |__ input

# | ___ *.pdbqt config.cfg

# |__ output

# ___ *_out.pdbqt *.log *.txt

#################################################################

这里面要搞清楚程序放的位置关系:

例如:

sh vina-1.4.sh UCSD/ &

这表明 vina-1.4.sh 和vina这2个程序

放在UCSD这个文件外面,UCSD文件里面有个input文件,里面放的是第一步产生的.cfg文件、蛋白的PDBQT文件,以及第二步产生的小分子的PDBQT文件

运行命令,即可筛选~

这样就在input文件夹同级产生output文件夹,里面就是对接结果,有几个文件解释一下:

all.log : 所有对接进度记录;

all_xtr.txt :所有对接打分记录

best_xtr.txt :所有小分子对接打分最好的记录

4、结果分析:

Vina产生的pdbqt文件和Autodock产生的dlg文件,都可以经过我们写的脚本进行处理,实现数据整合,可以用商业软件处理分析、可视化等等

#################################################################

arc-1.2.py [option] argument

Usage:

arc-1.2.py is an Autodock Result Converter that converts autodock

(AD4 or vina)

output file(s) to SDF file(s) via arcing DLG to PDBQT, modifying

PDBQT and

externally-generated SDF. Either an input file or a folder that

contains input

files is required. The output file or folder is optional, and

default name is

used if not specified.

Option:

-i [input_file] (*.dlg of AD4, *.pdbqt of vina or *.sdf) or

[input_directory]

-o [output_file] (default is *_out.pdbqt, *_mod.pdbqt or *_mod.sdf)

or

[output_directory]

-m [Num]; extract the [Num]th mode/model of each molecule

--mode alias of "-m"

--model alias of "-m"

-h display this message

--help alias of "-h"

#################################################################

例子:

python arc-1.2.py -i ***.dlg -o ***.sdf

(对Autodock产生的dlg文件的处理),sdf文件很多软件都可以打开

python arc-1.2.py -i input_directory -o ***.sdf(对Vina结果进行处理)

除此之外,还可以提取打分最好的分子,排序,等等功能

以上是我对Vina虚拟筛选的总结以及如何使用脚本程序来辅助智能化前处理和结果的后分析,花了一天的时间来准备这个,所有本帖提供的程序

都经过一天的测试,希望对大家有所帮助!

我要谢谢跟着我的一个本科生(SheldonCelan),提供技术支持!

有什么问题可以P me~

QQ:42131899

Phone:15626172279

E-mail:Babybluechina@gmail.com

分享:

a4c26d1e5885305701be709a3d33442f.png喜欢

0

a4c26d1e5885305701be709a3d33442f.png赠金笔

加载中,请稍候......

评论加载中,请稍候...

发评论

登录名: 密码: 找回密码 注册记住登录状态

昵   称:

发评论

以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/575836.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Entity Framework 4.1 : 贪婪加载和延迟加载

这篇文章将讨论查询结果的加载控制。 EF4.1 允许控制对象之间的关系,当我们进行查询的时候,哪些关系的数据将会被加载到内存呢?所有相关的对象都需要吗?在一些场合可能有意义,例如,当查询的实体仅仅拥有一个…

python数据结构编程_写给Python编程高手之 数据结构

python视频教程栏目介绍Python编程需要注意的关键点。如何在列表,字典,集合中根据条件筛选数据案例:如何在下列列表data中筛选出大于0的数data [1, -1, 2, 3, 4, 7]复制代码使用filter函数,第一个参数为一个函数,也可…

初步学习pg_control文件之八

接前文 初步学习pg_control文件之七 继续 看:catalog_version_no 代码如下: static void WriteControlFile(void) {.../** Initialize version and compatibility-check fields*/ControlFile->pg_control_version PG_CONTROL_VERSION;ControlFile-…

python编写下载器可暂停_Python编写一个优美的下载器

本文实例为大家分享了python编写下载器的具体代码,供大家参考,具体内容如下 #!/bin/python3# author: lidawei# create: 2016-07-11# version: 1.0# 功能说明:# 从指定的URL将文件取回本地#################################################…

fork()调用使子进程先于父进程被调度

由于内核使用写时复制机制,fork之后父子进程是共享页表描述符的,如果让父进程先执行,那么有很大几率父进程会修改共享页表指向的数据,那么内核此时必须给父进程分配并复制新的页表供父进程修改使用,那么如果子进程被创…

修改页面后获得flag_简单的CTF-从JS中获取flag

本文是一篇从合天网安实验室进行实验操作的笔记,一次非常简单地从JS中获取到flag的操作。1. 进入题目页(10.1.1.219:20123)看到一段话,还有一句很明显的提示语句“The evil url is the passkey”,翻译出来就是损坏的url就是flag。下面的英文…

文本框获取和失去焦点默认值问题

1. HTML控件<input id"txtName" type"text" value"默认值" /> <script src"script/jquery-1.7.1.min.js" type"text/javascript"></script><script type"text/javascript">$(function ()…

mac 源生安装mysql_Django执行源生mysql语句实现过程解析

1.使用extra方法解释&#xff1a;结果集修改器&#xff0c;一种提供额外查询参数的机制说明&#xff1a;依赖model模型使用方式&#xff1a;用在where后:Book.objects.filter(publisher_id"1").extra(where["titlepython学习1"])用在select后Book.objects.…

poj 3131 Cubic Eight-Puzzle 双向广搜 Hash判重

挺不错的题目&#xff0c;很锻炼代码能力和调试能力~ 题意&#xff1a;初始格子状态固定&#xff0c;给你移动后格子的状态&#xff0c;问最少需要多少步能到达&#xff0c;如果步数大于30&#xff0c;输出-1。 由于单向搜索状态太多&#xff0c;搜到二十几就会爆了&#xff0c…

mysql 优化rand_mysql优化--巧用rand(),with rollup,help__update2014.1.13

巧用rand()提取随机行&#xff1a;mysql中rand()获取0-1之间的一个随机数.这个函数和order by能把数据随机排序。随机从表中取出十条数据:select * from tablename order by rand() limit 10;此方法确实很方便&#xff0c;但是效率上却慢的惊人&#xff0c;切勿使用。SELECT * …

server2003 IIS 错误 解决

网页无法打开总显示&#xff1a;无法找到该页您正在搜索的页面可能已经删除、更名或暂时不可用。 --------------------------------------------------------------------------------请尝试以下操作&#xff1a;确保浏览器的地址栏中显示的网站地址的拼写和格式正确无误。 如…

mysql web备份软件_GitHub - toolzone/mysql_web_backup: mysql数据库自动备份,web网站自动备份shell脚本...

注意&#xff1a;Mysql_backup.sh 为 mysql 自动备份 脚本&#xff0c;配合 crontab命令 用来管理需要周期性执行任务Web_backup.sh 为 web文件 自动备份 脚本&#xff0c;配合 crontab命令 用来管理需要周期性执行任务Mysql_backup.sh 里&#xff1a;* 把 username 替换为mysq…

快速下载助手1.1--添加断点下载

在上一章中实现了多线程的断点下载&#xff0c;将快速下载助手添加断点下载功能&#xff0c;明天实现了速率统计功能 效果图如下&#xff1a; 打印信息如下&#xff1a; 欢迎使用快速下载助手-->并不是线程多就下载的快! 文件夹已经存在 默认的线程个数&#xff1a;3 保存路…

mysql查询自定义数据_实现自定义查询的数据库设计及实现(一)

需求先说一下需求&#xff1a;实现用户自定义的查询&#xff0c;用户可以自定义要查询的列、自定义条件条件、自定义排序。除了查询使用外&#xff0c;还可以使用于各个需要根据条件进行约束的业务&#xff0c;如权限&#xff1b;本设计和实现&#xff0c;很大部分是通过数据库…

poj 1321 棋盘问题

题目&#xff1a; http://poj.org/problem?id1321 八皇后问题&#xff0c;用dfsj即可。 源代码&#xff1a; 1 #include <iostream>2 #include<stdio.h>3 #include<cstring>4 using namespace std;5 int a[10][10];6 int visit[10];7 int n,k,sum;8 __int64…

php mysql-proxy报错_MySQL-proxy代理导致PHP PDO::ATTR_EMULATE_PREPARES的预处理出错,MySQL报General error: 1243错误...

背景&#xff1a;用的ThinkPHP5的框架。(相比之前的3.2版本&#xff0c;版本5都用了PDO处理数据库)症状&#xff1a;SQLSTATE[HY000]: General error: 1243 Unknown prepared statement handler (1) given to mysqld_stmt_execute具体的错误SQL&#xff0c;可能是任何一条正常的…

异步分页ajax

****jsp页面代码 <% page language"java" pageEncoding"utf-8"%> <% taglib prefix"s" uri"/struts-tags" %> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.or…

python函数模块_06.Python函数和模块

函数基础目标函数的快速体验函数的基本使用函数的参数函数的返回值函数的嵌套调用在模块中定义函数函数的快速体验1.1 快速体验所谓函数&#xff0c;就是把 具有独立功能的代码块 组织为一个小模块&#xff0c;在需要的时候 调用函数的使用包含两个步骤&#xff1a;定义函数 —…

浙江大学PAT上机题解析之1008. 数组元素循环右移问题 (20)

1008. 数组元素循环右移问题 (20) 时间限制 400 ms内存限制 32000 kB代码长度限制 8000 B判题程序 Standard一个数组A中存有N&#xff08;N>0&#xff09;个整数&#xff0c;在不允许使用另外数组的前提下&#xff0c;将每个整数循环向右移M&#xff08;M>0&#x…

mysql11导入数据_MySQL专题11之MySQL导出数据、MySQL导入数据

1、MySQL导出数据- MySQL中你可以使用SELECT...INTO OUTFILE语句来简单的导出数据到文本文件中。a、使用SELECT...INTO OUTFILE- 以下实例中我们将数据库runoob_tbl数据导出到/tmp/tutorials.txt文件中&#xff1a;mysql> SELECT * FROM runoob_tbl-> INTO OUTFILE /tm…