网页版blast构建

  之前做网站,要构建一个网页版的blast,我是一脸懵逼,这东西咋做,我只会在NCBI上用啊,网上找的资料基本还都是如何使用blast我就更懵逼了,问了同学,打开了思路,biopython上有相关函数但是好慢好卡,还容易崩,我又问问了,在本地下载个blast+再写个函数,跑就完事了,最后分析下结果,反正能比对就ok了,按着这思路,就做了如下的工作。

  1.下载blast+

   ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/ 下载对应的版本并进行安装

  2.网页部分的构建

   因为只需要blastn的功能,所以仿照blastn界面谢了一个界面

   2.1 涉及到参数及设计

    序列输入  =》 -query <file_in> 输入你要查找的序列,将上传的序列文件名放进去,最好是绝对路径

    查询范围  =》 -query_loc <n-x> 需要查找的位置(start-stop) ps:start/stop输入是数字型

    查询类型  =》 -task <string> 选择查询的类型,blastn下有好几种类型"blastn","blastn-short","megablast"各有有缺

    保留阈值  =》 -evalue 保留匹配的阈值,自己设定,一般默认是10

    匹配长度  =》 -word_size <integer,>=4> 设置最佳匹配长度

    匹配得分  =》 -reward <int,>=0> 匹配上的得分

    错配罚分  =》 -penalty <int,>=0> 错配的罚分

    open gap  =》 -gapopen<int> open gap 分数

    extend gap =》 -gapextend<int> extend gap分数

    筛选    =》 -dust<str> "yes"or"no" 筛选低复杂区域

    结果输出  =》 -outfmt 输出结果格式

           我用的是 -6 用"\t"格式分割  -7 用"\t"分割,包含注释

           输出还有一些列格式,没怎么用到,所以不赘述

    -6 输出一般是12列

    Queryid(查询id)  Subject id(比对上的id)   identity(配对一致性%)  alignment length(比对上的区域长度)  mismatches(错配数)

    gap open  q.start(匹配上的查询序列起点)  q.end(匹配上查询序列终点)  s.start(匹配上目标序列的起点)  s.end(匹配上目标序列的终点)

    e-value  bitscore(比对上的的得分)

  3.构建自己的库

   载入自己的需要的fa数据作为库 blastn 只要nucl库

   命令:makeblastdb.exe -in 基因组genomic.fna -parse_seqids -hash_index -dbtype nucl -out 自定义库名

  4.写程序获取上传的信息

   我用的是python,切换到blast+所在文件夹/bin/下

   """blastn -query %s  -db %s -out %s -task %s -evalue %d -word_size %d -reward %d -penalty %d -gapopen %d -gapextend %d -dust %s -outfmt 6 """%(inname,db,outname,task,evalue,word_size,reward,penalty,gapopen,gapextend,dust)

    设置好语句,就可以跑了

  5.获取到结果,将结果循环展示到结果界面上

 

  大概的构建过程就是这样,见仁见智。。记录一下,没白看。。。。

转载于:https://www.cnblogs.com/pipix/p/9929642.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/484799.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一种基于平衡二叉树(AVL树)插入、查找和删除的简易图书管理系统

目录1. 需求分析2. 项目核心设计2.1 结点插入2.2 结点删除3 测试结果4 总结分析4.1 调试过程中的问题是如何解决的&#xff0c;以及对设计与实现的回顾讨论和分析4.2 算法的时间和空间复杂度的分析&#xff0c;以及进一步改进的设想4.3 本次实验的经验和体会5 完整代码(C)1. 需…

解决a different object with the same identifier value was already associated with the session错误...

问题场景&#xff1a; &#xff08;我要做对象修改&#xff0c;然后保存进数据库&#xff09; 我通过数据库获取一个原对象obj; 然后新增了一个修改对象obj1; 然后将obj1.setId(obj.getId()); 然后调用数据库实例对象SESSION.UPDATE(OBJ1); 数据库报错&#xff0c;抛出了异常a…

物联网产业104页深度研究报告:物联网研究框架与投资机会分析

报告出品方&#xff1a;国信证券作者&#xff1a;马成龙、付晓钦、陈彤1物联网是未来五年甚至十年的大赛道1.1 物联网&#xff1a;下一代网络网络革命的本质是连接主体和连接方式的变化&#xff1a;第一代互联网&#xff08;PC互联网&#xff09;是计算机与计算机之间的联网&am…

随笔:朋友圈扫街图有感(爱情)

#声明&#xff1a;照片来自我的一位甘姓友人&#xff0c;并非本人所拍。但为之感动&#xff0c;尤其震撼。 皮夹里老照片上恰风华正茂的少年&#xff0c;但如今一双褶皱的手&#xff0c;缓缓掏出过了时的纸币&#xff0c;无疑岁月蹉跎&#xff0c;当年的Ta早已成了耄耋老人。说…

浅谈SDN架构下的运维工作

导读目前国内的网络运维还处于初级阶段&#xff0c;工作人员每天就像救火一样&#xff0c;天天疲于奔命。运维人员只能埋头查找系统运行的日志&#xff0c;耗时耗力&#xff0c;老眼昏花不说&#xff0c;有时候忙了半天还一无所获&#xff0c;作为运维工程师的你&#xff0c;有…

华为自动驾驶实车实路测试视频曝光!徐直军:比特斯拉好多了

资料来源&#xff1a;量子位、物联网智库等整理发布&#xff1a;物联网智库 昨日&#xff08;4月15日&#xff09;&#xff0c;消息称配备华为自动驾驶技术的北汽新能源极狐阿尔法S的HI版车型在上海进行了公开试乘&#xff0c;这也是华为自动驾驶技术公开试乘的全球首秀。以下视…

Pycharm社区版运行Django的三种方法(Pycharm添加配置参数快捷启动Django、Pycharm社区版Django项目创建)

目录Pycharm社区版运行Django的三种方法Django安装和环境变量的配置&#xff08;MacOS&#xff09;创建Project启动Django Webserver方法一&#xff1a;终端启动方法二&#xff1a;pycharm项目界面启动方法三&#xff1a;pycharm社区版实现直接启动Pycharm社区版运行Django的三…

日本机器人全球领先来自这三大顶尖技术

来源&#xff1a;工业机器人▍日本尖端技术之一&#xff1a;机器人精密减速机世界上工业机器人使用的精密减速机几乎都为日本所垄断。尽管国内也量产的RV减速机&#xff0c;但国产机器人企业却鲜有选用的&#xff0c;原因是日本精密减速机技术遥遥领先&#xff0c;短期很难替代…

仰望星空后,更将脚踏实地!

仰望星空后&#xff0c;更将脚踏实地&#xff01;

在目标检测中如何解决小目标的问题?

作者&#xff1a;Nabil MADALI来源&#xff1a;AI公园编译&#xff1a;ronghuaiyang在深度学习目标检测中&#xff0c;特别是人脸检测中&#xff0c;由于分辨率低、图像模糊、信息少、噪声多&#xff0c;小目标和小人脸的检测一直是一个实用和常见的难点问题。然而&#xff0c;…

html利用js生成excel表格(html表格标签生成excel)table2excel实例:一表格多sheets

table2excel实例 使用插件&#xff1a;table2excel.js简介&#xff1a;table2excel 可以转换和下载html上的表格&#xff0c;使他成为.xlsx格式&#xff0c;能够被Excel打开 实例代码 <head><!--js文件在文章末尾--><script src"table2excel.js">…

python学习之路day02

一、.pyc是什么&#xff1f; 1. Python是一门解释型语言&#xff1f; 我初学Python时&#xff0c;听到的关于Python的第一句话就是&#xff0c;Python是一门解释性语言&#xff0c;我就这样一直相信下去&#xff0c;直到发现了*.pyc文件的存在。如果是解释型语言&#xff0c;那…

像人一样自然流畅地说话,下一代智能对话系统还有多长的路要走?

来源&#xff1a;机器之心机器之心编辑部作为人工智能的一个子领域&#xff0c;自然语言处理&#xff08;NLP&#xff09;指的是机器理解并解释人类书面语和口语的能力&#xff0c;目的在于使计算机像人类一样智能地理解语言和用语言表达&#xff0c;弥补人类交流&#xff08;自…

机器学习:简单的随机梯度下降(SGD)求解回归问题和用逻辑回归(LR)解决分类问题

20210405作业&#xff1a; 回归问题: 用随机梯度下降法实现&#xff0c;数据用data.csv。分类问题: 用梯度下降实现逻辑回归&#xff0c;可以用批量梯度也可以用随机梯度实现。数据采用西瓜数据3.0α.csv。 1. SGD (Stochastic gradient descent) # 导包 import numpy as np i…

849. 到最近的人的最大距离

在一排座位&#xff08; seats&#xff09;中&#xff0c;1 代表有人坐在座位上&#xff0c;0 代表座位上是空的。 至少有一个空座位&#xff0c;且至少有一人坐在座位上。 亚历克斯希望坐在一个能够使他与离他最近的人之间的距离达到最大化的座位上。 返回他到离他最近的人的最…

Nature『大脑废物清除系统』已上线,从“痴呆”变聪明或成可能

来源&#xff1a;生物通 利用早发性阿尔茨海默氏症的小鼠模型&#xff0c;研究人员移除了一组小鼠大脑中的一些淋巴管。他们给这些小鼠以及对照组注射了单克隆抗体疗法&#xff0c;包括小鼠版本的Aducanumab。对小鼠大脑的研究显示&#xff0c;脑膜淋巴系统(紫色和粉红色)可以…

Unity3D_(API)Quaternion四元数中的Quaternion.LookRotation()

四元数百度百科&#xff1a;  传送门 四元数官方文档&#xff1a;  传送门 欧拉旋转、四元数、矩阵旋转之间的差异&#xff1a;  传送门 四元数转换为欧拉角eulerAngles  官方文档&#xff1a;  传送门 欧拉角转换为四元数Euler  官方文档&#xff1a;  传送门 Q…

思考:那么些大学生仅凭个人好恶来判断,缺乏是非观

“一切仅凭自己的好恶来判断&#xff0c;是缺乏是非观的体现” 今读某大学Z教授&#xff08;一位授课严谨认真的老师&#xff0c;在我心中&#xff0c;至少我是这样认为的&#xff09;的推文&#xff0c;深受触动。文章小中见大&#xff0c;批判了精致的利己主义思想&#xff0…

工业互联网的十大关键传感器

来源&#xff1a;传感器专家网工业互联网(Industrial Internet)是制造业一大热潮。从早期GE提出工业互联网理念被不少人解读为美国的制造业复兴战略&#xff0c;到GE的Predix平台受到热捧&#xff0c;再到西门子推出工业互联网平台Mindsphere&#xff0c;及多家本土的制造业巨头…

抽奖系统的流量削峰方案

如果观看抽奖或秒杀系统的请求监控曲线&#xff0c;你就会发现这类系统在活动开放的时间段内会出现一个波峰&#xff0c;而在活动未开放时&#xff0c;系统的请求量、机器负载一般都是比较平稳的。为了节省机器资源&#xff0c;我们不可能时时都提供最大化的资源能力来支持短时…