三代测序PacBioONT reads过滤和修剪-Chooper

chopper简介

chopper是NanoFilt和NanoLyse的Rust语言版本,适用于长reads测序(如PacBio和纳米孔测序ONT)的过滤和修剪fastq文件。

chopper相对于python编写的NanoFilt和NanoLyse,运行输出相同结果的时间更短,且NanoFilt和NanoLyse现已停止更新,选择使用chopper会有更高的效率。

github地址: https://github.com/wdecoster/chopper

chopper

chopper安装

# conda安装
conda install -c bioconda chopper -y# linux发行版zip包安装
mkdir chopper && cd chopper 
wget https://github.com/wdecoster/chopper/releases/download/v0.8.0/chopper-linux.zip
unzip chopper-linux.zip
# 添加执行权限
chmod +x chopper
# 加入环境变量
echo "export PATH=/software/chopper/:$PATH" >> ~/.bashrc
source ~/.bashrcchopper  -h

运行示例

# 对于fastq.gz文件作为输入+管道+过滤质量低于10、长度低于1000bp的序列,gzip压缩为.gz文件
gunzip -c sample.fastq.gz | chopper -q 10 -l 1000 \
| gzip > sample.filtered.fastq.gz# fastq文件作为输入
chopper -q 10 -l 500 -i sample.fastq > sample.filtered.fastq.gz# fastq.gz文件作为输入,并对输出文件进行压缩
chopper -q 10 -l 500 -i sample.fastq.gz \
| gzip > sample.filtered.fastq.gz

参数说明:

-l ,–minlength :过滤掉小于指定长度的序列
-q , --quality :过滤掉低于指定质量序列
-i, input: 输入文件,默认从stdin读取
–maxlength :过滤掉超过此长度的序列, 默认2147483647
–threads:线程数,默认4
–contam: 参考fasta文件检查潜在的污染,默认None
–minGC:过滤掉低于指定GC含量此百分比的序列,默认0
–maxGC:过滤掉大于指定GC含量此百分比的序列, 默认1.0
–headcrop:从头部切掉n bp,默认0
–tailcrop:尾部切掉n bp,默认0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/865271.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

思维,CF 739A - Alyona and mex

一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 739A - Alyona and mex 二、解题报告 1、思路分析 我们考虑区间mex运算的值最大也就是区间长度,所以我们最大值的上界就是所有区间中的最小长度,假如记为mi 我们一定可以构造出答案…

zabbix 配置钉钉告警

1.申请一个钉钉企业版 2.群内申请一个机器人 下载电脑版钉钉,登录后,在要接收群消息的群里,点击右上角设置图标,下滑找到机器人,添加一个机器人,保存机器人的webhook地址 保存这里的加签字符串 保存这里的…

通信软件开发之业务知识:PON口割接什么意思?

一 PON口割接(原创总结) 在通信领域,PON口割接指的是对无源光网络(Passive Optical Network,PON)端口进行的切换或调整操作。简单来说,就是对光纤网络中的某个端口进行重新连接或重新分配&…

153. 寻找旋转排序数组中的最小值(中等)

153. 寻找旋转排序数组中的最小值 1. 题目描述2.详细题解3.代码实现3.1 Python3.2 Java 1. 题目描述 题目中转:153. 寻找旋转排序数组中的最小值 2.详细题解 如果不考虑 O ( l o g n ) O(log n) O(logn)的时间复杂度,直接 O ( n ) O(n) O(n)时间复杂…

【Hugging Face全面拥抱LangChain:全新官方合作包】

文末有福利! ❝ 最近Hugging Face官宣发布langchain_huggingface,这是一个由 Hugging Face 和 LangChain 共同维护的 LangChain 合作伙伴包。这个新的 Python 包旨在将 Hugging Face 最新功能引入 LangChain 并保持同步。 通过Hugging Face官方包的加持&…

14-15 为什么我们现在对阅读如此难以接受

写出来感觉很奇怪,但最近我感觉自己失去了阅读能力。长篇文本对我来说尤其具有挑战性。句子很难读完。更别提章节了。章节有很多段落,而段落又由许多句子组成。 啊。 即使在极少数情况下,我读完了一章,下一页上已经有另一章等着…

有sdwan可以不用专线吗?sdwan和专线的区别优势

SD-WAN(Software-Defined Wide Area Network,软件定义广域网)确实可以在很大程度上替代传统的专线连接,尤其是在追求成本效益和网络灵活性的场景下。SD-WAN的核心优势在于其智能化和自动化的能力,这使得它能够优化数据…

华清远见人工智能课程:项目优势助力,学习更高效!

在人工智能飞速发展的今天,学习人工智能成为新的高薪赛道。我们都知道人工智能的学习离不开项目练手,只有通过实际项目的操作,才能真正掌握人工智能的核心技能。但遗憾的是,很多人工智能课程只注重理论知识的传授,缺乏…

本地文件上传Github的方法

本文仅用于个人回忆本地文件上传GitHub方法,使用HTTP上传而不是SSH,其余文件已配置完成,如果你和我一样,那么请往下看,这条博客不说废话。 Step1 选择需要上传的文件,右键选择Git Bash Here Step2 创建一…

GAMES104:04游戏引擎中的渲染系统1:游戏渲染基础-学习笔记

文章目录 概览:游戏引擎中的渲染系统四个课时概览 一,渲染管线流程二,了解GPUSIMD 和 SIMTGPU 架构CPU到GPU的数据传输GPU性能限制 三,可见性Renderable可渲染对象提高渲染效率Visibility Culling 可见性裁剪 四,纹理压…

电路模型和电路定律

电路---为了某种需要由某些电工设备或元件按一定方式组合起来的电流的通路 实际电路的两个作用 1.电能的传输,分配和转换 2.传递和处理信号 电路中的几个基本概念 激励---电源或信号源的电压或电流,也称为输入 响应---由激励在电路各部分产生的电流…

怎么参与场外期权?

今天期权懂带你了解怎么参与场外期权? 目前个人投资者暂时还不能直接参与场外个股期权,因为场外个股期权现在只能机构来进行交易。 所以个人投资者目前只能通过机构通道来进行操作,类似期权懂,找到期权懂经理,然后通…

手机删除的照片怎么找回?3个急救指南,让你重新拥有

一不小心手滑,手机里的几百张珍贵照片就消失了!是不是心如刀割,感觉错过了几个亿?手机删除的照片怎么找回?别担心,小菜一碟,恢复照片就像打游戏一样,只要掌握正确的“攻略”&#xf…

AI大模型时代来临:企业如何抢占先机?

AI大模型时代来临:企业如何抢占先机? 2023年,被誉为大模型元年,AI大模型的发展如同一股不可阻挡的潮流,正迅速改变着我们的工作和生活方式。从金融到医疗,从教育到制造业,AI大模型正以其强大的生成能力和智能分析,重塑着行业的未来。 智能化:企业核心能力的转变 企…

世界智能产业博览会开幕 - 天空卫士汽车行业方案入选优秀案例

6月20日,以“智行天下、能动未来”为主题的2024世界智能产业博览会在国家会展中心(天津)开幕。主席向博览会致贺信并指出:中国高度重视人工智能发展,积极推动互联网、大数据、人工智能和实体经济深度融合,培…

[Python学习篇] Python函数

定义函数 语法:使用关键字 def def 函数名(参数): 代码1 代码2 ...... 调用函数 语法: 函数名(参数) 注意:不同的需求,参数可有可无。在Python中,函数必须先定义后使用 示例: # 定义函数 d…

csdn如何建立专栏,并且把已发布的文章,放到专栏里

不会在csdn上建立专栏,管理自己的博客? 建立了专栏,不知道该怎么放入文章? 本文将一步步带你解决这些问题。 我是蚊子码农,欢迎各位的点赞、关注和收藏,有了你们的激励,我会带来更好的作品。…

聚焦 Navicat 17 新特性 | 让用户界面交互更丝滑

随着 Navicat 17 的发布,引起业界热烈反响和深入讨论。早前,我们介绍了 Navicat 17 《模型设计创新与优化​​​​​​​》与《查询与配置》的新特性。此外,Navicat 在用户界面交互方面进行了显著优化,新增了一系列实用的功能&…

《后端程序猿 · 基于 Lettuce 实现缓存容错策略》

📢 大家好,我是 【战神刘玉栋】,有10多年的研发经验,致力于前后端技术栈的知识沉淀和传播。 💗 🌻 近期刚转战 CSDN,会严格把控文章质量,绝不滥竽充数,如需交流&#xff…

机器学习辅助的乙醇浓度检测

目录 1.为什么要机器学习 2. 神经网络一般组成 3.BP神经网络工作过程 4.评价指标 5.实操代码 1.为什么要用机器学习 人工分析大量的谐振模式,建立各种WGM的响应与未知目标之间的关系,是一个很大的挑战。机器学习(ML)能够自行识别全谱的全部特征。作为…