MinCED:注释CRISPRs

GitHub - ctSkennerton/minced: Mining CRISPRs in Environmental Datasets

安装

git clone http://github.com/ctSkennerton/minced
cd minced
make

使用

gunzip -k *
cat *.fa > all_MAG_contig.fasta
/home/zhongpei/hard_disk_sda2/zhongpei/Software/minced/minced all_MAG_contig.fasta all_MAG_contig.crisprs all_MAG_contig.gff
/home/zhongpei/hard_disk_sda2/zhongpei/Software/my_script/minCED_handel.py --gff3 all_MAG_contig.gff --input_fa all_MAG_contig.fasta --output_fa all_MAG_contig_CRISPR.fasta
#rm all_MAG_contig.fasta
#rm all_MAG_contig.gff
#rm all_MAG_contig.crisprs
rm *.fa

写了个代码来处理结果

#! /usr/bin/env python
#########################################################
# take minCED CRISPR result
# written by PeiZhong in IFR of CAASimport argparse
import os
from Bio.SeqRecord import SeqRecord
from Bio import SeqIOparser = argparse.ArgumentParser(description='take minCED CRISPR result')
parser.add_argument('--gff3', help='< minCED gff3 output >')
parser.add_argument('--input_fa', help='< your all MAGs contig >')
parser.add_argument('--output_fa',  help='< output CRISPR fasta >')args = parser.parse_args()
gff3 = args.gff3
input_fa = args.input_fa
output_fa = args.output_faresult_db = {}
with open(gff3, "r") as gff, open(input_fa, "r") as ifa, open(output_fa, "w") as ofa:sequences = SeqIO.to_dict(SeqIO.parse(ifa, "fasta"))for line in gff:if line.startswith("#"):continuefields = line.strip("\n").split("\t")seq_id = fields[0]start = int(fields[3]) - 1end = int(fields[4])zhushi = fields[8]ID = zhushi.split(";")[0]ID = ID.split("=")[1]name = f"{seq_id}+{ID}"subseq = sequences[seq_id].seq[start:end]record = SeqRecord(subseq, id=name, description="")result_db[name] = recordSeqIO.write(result_db.values(), ofa, 'fasta')

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/11407.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NeurIPS‘24 截稿日期逼近 加拿大温哥华邀你共赴盛会

会议之眼 快讯 第38届NeurIPS24(Conference and Workshop on Neural Information Processing Systems)即神经信息处理系统研讨会将于 2024 年 12月9日-15日在加拿大温哥华会议中心举行&#xff01; NeurIPS 每一年都是全球AI领域的一场盛宴&#xff0c;吸引着来自世界各地的顶…

暴雨信息:IT是新质生产力的赋能者

5月11日下午&#xff0c;2024全球徽商上海论坛在上海国际会议中心举办。暴雨信息孙辉在会上发表欢迎辞。孙辉在致辞和会后接受采访时表示&#xff0c;发展新质生产力要以“智”提质&#xff0c;发挥人工智能作为培育新质生产力的引擎作用&#xff0c;通过推广混合式人工智能&am…

【小白误闯】Activiti 框架你不得不知道的一些事

Activiti 是一个轻量级的、以Java为中心的开源工作流和业务流程管理&#xff08;BPM&#xff09;平台。它允许用户在业务应用程序中定义、执行和监控业务流程。以下是Activiti的核心组件&#xff1a; 8个核心组件概述 Activiti Engine&#xff1a;这是Activiti最核心的部分&am…

Java 面试问题及答案

Java 面试问题及答案 问题 1: 什么是Java虚拟机(JVM)&#xff1f;请简述其主要组成部分及其作用。 回答&#xff1a; Java虚拟机&#xff08;JVM&#xff09;是一个可以执行Java字节码的虚拟计算机。它是Java平台的核心组成部分&#xff0c;使得Java能够实现其核心特性之一&a…

Elasticsearch映射定义

文章目录 认识映射元字段数据类型1.基本数据类型2.复杂数据类型专用数据类型多字段类型 认识映射 映射类似于关系型数据库中的Schema&#xff08;模式&#xff09;。Schema在关系型数据库中是指库表包含的字段及字段存储类型等基础信息。 映射定义由两部分组成&#xff1a;元…

一些python包缺失带来的报错及解决办法

描述 一些python包缺失带来的报错及解决办法 安装 ModuleNotFoundError: No module named cv2 pip install opencv-pythonModuleNotFoundError: No module named torch 我的CSDN博客ModuleNotFoundError: No module named colorama pip install coloramaModuleNotFoundError…

5.10.8 Transformer in Transformer

Transformer iN Transformer (TNT)。具体来说&#xff0c;我们将局部补丁&#xff08;例如&#xff0c;1616&#xff09;视为“视觉句子”&#xff0c;并将它们进一步划分为更小的补丁&#xff08;例如&#xff0c;44&#xff09;作为“视觉单词”。每个单词的注意力将与给定视…

信号和槽基本概念

&#x1f40c;博主主页&#xff1a;&#x1f40c;​倔强的大蜗牛&#x1f40c;​ &#x1f4da;专栏分类&#xff1a;QT❤️感谢大家点赞&#x1f44d;收藏⭐评论✍️ 目录 一、概述 二、信号的本质 三、槽的本质 一、概述 在 Qt 中&#xff0c;用户和控件的每次交互过程称…

Bootloader+升级方案

随着设备的功能越来越强大&#xff0c;系统也越来越复杂&#xff0c;产品升级也成为了开发过程不可或缺的一道程序。在工程应用中&#xff0c;如何在不更改硬件的前提下通过软件的方式实现产品升级。通过Bootloader来实现固件的升级是一种极好的方式&#xff0c;Bootloader是单…

I2CKD : INTRA- AND INTER-CLASS KNOWLEDGE DISTILLATION FOR SEMANTIC SEGMENTATION

摘要 本文提出了一种新的针对图像语义分割的知识蒸馏方法&#xff0c;称为类内和类间知识蒸馏&#xff08;I2CKD&#xff09;。该方法的重点是在教师&#xff08;繁琐模型&#xff09;和学生&#xff08;紧凑模型&#xff09;的中间层之间捕获和传递知识。对于知识提取&#x…

12个乒乓球,有一个次品,不知轻重,用一台无砝码天平称三次,找出次品,告知轻重?

前言 B站上看到个视频&#xff1a;为什么有人不认可清北的学生大多是智商高的? 然后试了下&#xff0c;发现我真菜 自己的思路&#xff08;失败&#xff09; 三次称重要获取到12个乒乓球中那个是次品&#xff0c;我想着将12个小球编号&#xff0c;分为四组&#xff0c;每组…

yo!这里是socket网络编程相关介绍

目录 前言 基本概念 源ip&&目的ip 源端口号&&目的端口号 udp&&tcp初识 socket编程 网络字节序 socket常见接口 socket bind listen accept connect 地址转换函数 字符串转in_addr in_addr转字符串 套接字读写函数 recvfrom&&a…

Java入门基础学习笔记2——JDK的选择下载安装

搭建Java的开发环境&#xff1a; Java的产品叫JDK&#xff08;Java Development Kit&#xff1a; Java开发者工具包&#xff09;&#xff0c;必须安装JDK才能使用Java。 JDK的发展史&#xff1a; LTS&#xff1a;Long-term Support&#xff1a;长期支持版。指的Java会对这些版…

pycharm报错Process finished with exit code -1073740791 (0xC0000409)

pycharm报错Process finished with exit code -1073740791 (0xC0000409) 各种垃圾文章&#xff08;包括chatgpt产生的垃圾文章&#xff09;&#xff0c;没有给出具体的解决办法。 解决办法就是把具体报错信息显示出来&#xff0c;然后再去查。 勾选 然后再运行就能把错误显示…

MetaRTC-play拉流客户端代码分析

渲染使用opengl&#xff0c;音频播放使用alsa。 当点击播放按钮后&#xff0c;以此调用的类如下&#xff0c;开始建立rtc连接&#xff0c;AV解码&#xff0c;音频渲染&#xff0c;视频渲染。 如果想去除QT&#xff0c;改为cmake工程管理&#xff0c;去掉渲染部分即可。 下方是…

VUE+PrintJS打印-边距设置问题(提供解决方案)

VUE打印我们一般用printJS&#xff0c;虽然它也提供了边距设置&#xff0c;但不管怎么调&#xff0c;感觉都不对&#xff0c;也换其他组件试过&#xff0c;没啥区别&#xff0c;并不能解决问题。 今天又发来个需求&#xff0c;要求设置打印页面的上、下、左、右边距&#xff0…

Linux---vim编辑器(续写)

5. vim正常模式命令集 插入模式 按「i」切换进入插入模式「insert mode」&#xff0c; 按“i”进入插入模式后是从光标当前位置开始输入文件&#xff1b; 按「a」进入插入模式后&#xff0c;是从目前光标所在位置的下一个位置开始输入文字&#xff1b; 按「o」进入插入模式…

从头开始学Spring—01Spring介绍和IOC容器思想

目录 1.Spring介绍 1.1Spring概述 1.2特性 1.3五大功能模块 2.IOC容器 2.1IOC思想 ①获取资源的传统方式 ②反转控制方式获取资源 ③DI 2.2IOC容器在Spring中的实现 ①BeanFactory ②ApplicationContext ③ApplicationContext的主要实现类 1.Spring介绍 1.1Sprin…

Linux系统一步一脚印式学习

Linux操作系统具有许多特点和优势。首先&#xff0c;它是开放源代码的&#xff0c;也就意味着任何人都可以对源代码进行查看和修改。其次&#xff0c;可以同时支持多个用户且可以同时执行多个任务&#xff0c;此外&#xff0c;Linux操作系统也非常稳定和安全。相对于其他操作系…

银川岗位外包有邦芒 让岗位空缺不再成为难题

银川邦芒人力岗位外包服务&#xff0c;专为企业量身定制&#xff0c;涵盖从岗位人员招聘到劳动关系终止的全方位、无风险外包解决方案。借助我们的岗位外包&#xff0c;企业可以在确保用工稳定的同时&#xff0c;将更多资源聚焦于核心业务的发展与创新。 我们提供全面、高效的外…