python中cock什么意思_[转载]原创脚本逐步实现Autodcock-Vina的虚拟筛选及筛选后分析...

[转载]原创脚本逐步实现Autodcock-Vina的虚拟筛选及筛选后分析

(2013-07-03 11:31:56)

标签：

转载

Vina是在Autodock4基础上改进的算法，相比autodock4而言，具体优势：准确，并行计算(官网数据)：AutoDock

Vina is a new open-source program for drug discovery, molecular docking and

virtual screening, offering multi-core capability, high performance

and enhanced accuracy and ease of use.

相应参考文献：O. Trott, A. J. Olson,

AutoDock Vina: improving the speed and accuracy of docking with a

new scoring function, efficient optimization and multithreading,

Journal of Computational Chemistry 31 (2010)

455-461

最近用了Vina做了一次对接，我只对接了几百个化合物，发现这软件，现在还不太智能，比如说前期处理，对接结果处理，我始终认为与典型的mol2或者sdf格式文件相比，PDBQT+dlg格式文件不是很好处理，最近和一个师弟写了几个脚本程序，用来处理Vina对接问题：主要的程序如下：

对接软件：Autdock-Vina (http://vina.scripps.edu/)

PDBQT生成脚本程序：LigPrep.sh or LigPrep.py (shell 和

python，见附件)：可以实现mol2、sdf、PDB、PDBQT等格式文件的虚拟库，转化成Autodock或者Vina需要的单个分子的PDBQT文件，还写了一个插件，自动去除重复分子。

结果处理程序：ARC-1.2.py (Autodock and Vina Result Conversion,

python版本，见附件)：实现Dlg文件、单个分子的PDBQT对接结果转化成集成的PDBQT、sdf等格式文件。还可以根据命令提示，提取打分最好的构想及打分，或者排名前十的分子，这对处理大规模虚拟筛选十分关键。

接口程序：Vina-1.4.sh (shell

版本)：主要实现自动对接，只要用这个接口就可以实现，就像商业的软件的按钮操作一样，简单方便~

obabel 软件：我们的脚本需要调用此软件里面的插件来实现功能，关于这个插件，现在自己准备后面的时间来写这段代码。

我下面结合具体例子来说：

1、蛋白受体的处理:

这个不需要多说了，ADT或者PyRx，都可以生成受体的PDBQT文件(建议)，或者就自己手动生成一个(不建议)，然后确定盒子中心。按照Vina的输入文件要去制作.cgf文件，例如：

config.cgf

#######################################################

receptor = rec.pdbqt //受体的名称

center_x = -2

center_y = 0 //盒子的质心

center_z = -4

size_x = 30

size_y = 32 //盒子的大小

size_z = 46

exhaustiveness = 20 //计算的复杂度

cpu = 16 //并行计算

energy_range = 4 //作用能间距等级，这个我到现在也没搞懂

num_modes = 20 //保留构想数目，这个是cluster之后的结果，实际构想可能很多

#######################################################

2、虚拟库小分子文件的准备

首先把虚拟库转化成mol2格式文件(里面包含很多分子)，其实这个处理还需注意一些事项，如加氢、电荷、去除自身小分子、离子、无机盐等等，对接前的构想最好是3D构想

然后启动脚本LigPrep.sh，根据提示操作：

###################################################################

# sh LigPrep.sh [option] argument #

# Usage: LigPrep.sh prepares autodock input files (PDBQT).

# Requirement:

# 1.Ensure that molecules in the input file are of 3D prior to

preparation. //需要小分子的3D构象

# 2.Each molecule should have a unique internal name. //需要小分子唯一的内部名字

# 3.obabel is in use and its environment varible set. //需要安装obabel软件

# Option:

# -i input_file (*.sdf, *.mol2, *.pdb, *.pdbqt)

# -o output_directory (default is '__pdbqt_files__')

# -n Number of molecules to divide into each group

# (default is 1500)

# -h display this message

# -help alias of '-h'

###################################################################

例如：

sh LigPrep.sh -i ***.sdf

(这样就可以生成一个默认的文件夹，里面包含虚拟库的单个小分子的PDBQT格式文件，即可以用于Autodock或者vina进行虚拟筛选)

3、虚拟筛选

启动脚本：vina-1.4.sh

#################################################################

# Usage: #

# sh vina-1.4.sh working_direcotry [option] #

# Option: #

# --help display this message #

# -h alias of "--help" #

# Note: #

# working_directory contains input and output folders. Receptor

file (e.g. receptor.pdbqt ), ligand file(s)

(e.g ligand_01.pdbqt or ligands.mol2 ) and configuration file (e.g

config.cfg) must be put in the "input" folder;

all output files (*_out.pdbqt, *.log and *.txt) will be generated

in the "output" folder.

# The hierarchy relationship of the above folders and files can be

depicted as follow: #

# ROOT

# |__ Group1 Group2 Group3 ... vina vina-1.2.sh

# |__ input

# | ___ *.pdbqt config.cfg

# |__ output

# ___ *_out.pdbqt *.log *.txt

#################################################################

这里面要搞清楚程序放的位置关系：

例如：

sh vina-1.4.sh UCSD/ &

这表明 vina-1.4.sh 和vina这2个程序

放在UCSD这个文件外面，UCSD文件里面有个input文件，里面放的是第一步产生的.cfg文件、蛋白的PDBQT文件，以及第二步产生的小分子的PDBQT文件

运行命令，即可筛选~

这样就在input文件夹同级产生output文件夹，里面就是对接结果，有几个文件解释一下：

all.log ：所有对接进度记录；

all_xtr.txt ：所有对接打分记录

best_xtr.txt ：所有小分子对接打分最好的记录

4、结果分析：

Vina产生的pdbqt文件和Autodock产生的dlg文件，都可以经过我们写的脚本进行处理，实现数据整合，可以用商业软件处理分析、可视化等等

#################################################################

arc-1.2.py [option] argument

Usage:

arc-1.2.py is an Autodock Result Converter that converts autodock

(AD4 or vina)

output file(s) to SDF file(s) via arcing DLG to PDBQT, modifying

PDBQT and

externally-generated SDF. Either an input file or a folder that

contains input

files is required. The output file or folder is optional, and

default name is

used if not specified.

Option:

-i [input_file] (*.dlg of AD4, *.pdbqt of vina or *.sdf) or

[input_directory]

-o [output_file] (default is *_out.pdbqt, *_mod.pdbqt or *_mod.sdf)

[output_directory]

-m [Num]; extract the [Num]th mode/model of each molecule

--mode alias of "-m"

--model alias of "-m"

-h display this message

--help alias of "-h"

#################################################################

例子：

python arc-1.2.py -i ***.dlg -o ***.sdf

(对Autodock产生的dlg文件的处理)，sdf文件很多软件都可以打开

python arc-1.2.py -i input_directory -o ***.sdf(对Vina结果进行处理)

除此之外，还可以提取打分最好的分子，排序，等等功能

以上是我对Vina虚拟筛选的总结以及如何使用脚本程序来辅助智能化前处理和结果的后分析，花了一天的时间来准备这个，所有本帖提供的程序

都经过一天的测试，希望对大家有所帮助！

我要谢谢跟着我的一个本科生(SheldonCelan)，提供技术支持！

有什么问题可以P me~

QQ：42131899

Phone：15626172279

E-mail：Babybluechina@gmail.com

喜欢

赠金笔

加载中，请稍候......

评论加载中，请稍候...

发评论

登录名：密码：找回密码注册记住登录状态

昵称：

发评论

以上网友发言只代表其个人观点，不代表新浪网的观点或立场。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/575836.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

python中cock什么意思_[转载]原创脚本逐步实现Autodcock-Vina的虚拟筛选及筛选后分析...

相关文章

Entity Framework 4.1 : 贪婪加载和延迟加载

python数据结构编程_写给Python编程高手之数据结构

初步学习pg_control文件之八

python编写下载器可暂停_Python编写一个优美的下载器

fork()调用使子进程先于父进程被调度

修改页面后获得flag_简单的CTF-从JS中获取flag

文本框获取和失去焦点默认值问题

mac 源生安装mysql_Django执行源生mysql语句实现过程解析

poj 3131 Cubic Eight-Puzzle 双向广搜 Hash判重

mysql 优化rand_mysql优化--巧用rand(),with rollup,help__update2014.1.13

server2003 IIS 错误解决

mysql web备份软件_GitHub - toolzone/mysql_web_backup: mysql数据库自动备份，web网站自动备份shell脚本...

快速下载助手1.1--添加断点下载

mysql查询自定义数据_实现自定义查询的数据库设计及实现（一）

poj 1321 棋盘问题

php mysql-proxy报错_MySQL-proxy代理导致PHP PDO::ATTR_EMULATE_PREPARES的预处理出错，MySQL报General error: 1243错误...

异步分页ajax

python函数模块_06.Python函数和模块

浙江大学PAT上机题解析之1008. 数组元素循环右移问题 (20)

mysql11导入数据_MySQL专题11之MySQL导出数据、MySQL导入数据