Skewer v0.2.2安装与使用-生信工具43

01 Skewer 介绍

Skewer(来自于 SourceForge)实现了一种基于位掩码的 k-差异匹配算法,专门用于接头修剪,特别设计用于处理下一代测序(NGS)双端序列。

fastp安装及使用-fastp v0.23.4(bioinfomatics tools-002)-CSDN博客

特性

  • 检测并去除接头序列
  • 支持模式匹配中的插入和删除
  • 适用于单端、双端(PE)和长配对(LMP)读取
  • 对带条形码的测序结果进行去重
  • 支持多线程
  • 基于 Phred 质量分数进行修剪
  • 支持条形码和接头中的 IUPAC 字符
  • 支持压缩输入和输出
  • 支持从二进制文件安装
02 安装
2.1 从二进制文件安装
  1. 将 skewer 复制到你喜欢的 BIN 目录,并确保正确设置 PATH 环境变量。例如:

    $ mkdir -p ~/bin
    $ cp -p skewer ~/bin/
    $ echo 'export PATH=~/bin:$PATH' >> ~/.bashrc
    $ source ~/.bashrc
    
2.2 从源代码安装
  1. 进入源代码目录,然后运行以下命令:

    $ make
    $ sudo make install
    
03 Skewer 使用说明

Skewer(一个快速且精确的接头修剪工具,适用于双端读取)

使用方法:

skewer [options] <reads.fastq> [paired-reads.fastq]或者
skewer [options] - (从 STDIN 获取输入)选项说明(括号中的数字为默认值):
接头:
-x <str>:接头序列/文件(默认:AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC)
-y <str>:双端读取的接头序列/文件(默认:AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTA),如果只指定 -x,则隐式使用。
-M, --matrix <str>:指示有效接头配对的文件(所有为 1 的矩阵)。
-j <str>:Nextera Mate Pair 读取的接头序列/文件(默认:CTGTCTCTTATACACATCTAGATGTGTATAAGAGACAG)。
-m, --mode <str>:修剪模式;
单端:head:5' 端;tail:3' 端;any:任何位置(默认:tail)
双端:pe:双端;mp:mate-pair;ap:amplicon(默认:pe)
-b, --barcode:根据接头/引物去重条形码(默认:no)
容错:
-r <num>:允许的最大错误率(标准化错误数/对齐区域长度)[0, 0.5](默认:0.1)
-d <num>:允许的最大插入/删除错误率(默认:0.03)
-k <int>:接头检测的最小重叠长度 [1, inf);(单端的最大值:max(1, int(4-10*r));mate-pair的值为<junction length>/2)
修剪:
-c, --cut <int>,<int>:强制修剪掉 5' 端引物作为条形码(在放大模式下)(默认:no)
-e, --cut3:如果读取长度大于指定的最大长度,则强制修剪掉 3' 端尾部碱基(默认:no)
过滤:
-q, --end-quality <int>:修剪 3' 端直到达到指定的质量值(默认:0)
-Q, --mean-quality <int>:修剪前允许的最低平均质量值(默认:0)
-l, --min <int>:修剪后允许的最小读取长度(默认:18)
-L, --max <int>:修剪后允许的最大读取长度(默认:no limit)
-n:是否过滤掉高度退化的(包含许多 N)读取(默认:no)
-u:是否过滤掉未确定的 mate-pair 读取(默认:no)
-N, --fillNs:是否将修剪的碱基替换为 N(在 b 或 -m mp 情况下无效)(默认:no)
输入/输出:
-f, --format <str>:FASTQ质量值的格式:sanger|solexa|auto(默认:auto)
-o, --output <str>:输出文件的基本名称(默认:<reads>.trimmed)
-z, --compress:以 GZIP 格式压缩输出(默认:no)
-1, --stdout:重定向输出到 STDOUT,禁止使用 -b、-o 和 -z 选项(默认:no)
--qiime:为 QIIME 处理准备“barcodes.fastq”和“mapping_file.txt”(默认:no)
--quiet:不显示进度更新(默认:not quiet)
-A, --masked-output:为修剪后的读取写输出文件(修剪后的碱基转换为小写)(默认:no)
-X, --excluded-output:为被排除的读取写输出文件(默认:no)
其他:
-i, --intelligent:在 mate-pair 模式下,是否根据接头信息重新分配读取(默认:no)
-t, --threads <int>:并发线程数 [1, 32](默认:1)
    04 常用示例
    skewer -Q 9 -t 2 -x adapters.fa sample.fastq -o trimmed
    skewer -x AGATCGGAAGAGC -q 3 sample-pair1.fq.gz sample-pair2.fq.gz
    skewer -x TCGTATGCCGTCTTCTGCTTGT -l 16 -L 30 -d 0 srna.fastq
    skewer -m mp -i lmp-pair1.fastq lmp-pair2.fastq
    skewer -m ap --cut 0,6 --qiime -x forward-primers.fa -y reverse-primers.fa mix-pair1.fastq mix-pair2.fastq
    
     05 引用

    Jiang, H., Lei, R., Ding, S.W. and Zhu, S. (2014) Skewer: a fast and accurate adapter trimmer for next-generation sequencing paired-end reads. BMC Bioinformatics15, 182.

    本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/69900.shtml

    如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

    相关文章

    Verilog语言学习总结

    Verilog语言学习&#xff01; 目录 文章目录 前言 一、Verilog语言是什么&#xff1f; 1.1 Verilog简介 1.2 Verilog 和 C 的区别 1.3 Verilog 学习 二、Verilog基础知识 2.1 Verilog 的逻辑值 2.2 数字进制 2.3 Verilog标识符 2.4 Verilog 的数据类型 2.4.1 寄存器类型 2.4.2 …

    智慧园区综合管理系统如何实现多个维度的高效管理与安全风险控制

    内容概要 在当前快速发展的城市环境中&#xff0c;智慧园区综合管理系统正在成为各类园区管理的重要工具&#xff0c;无论是工业园、产业园、物流园&#xff0c;还是写字楼与公寓&#xff0c;都在积极寻求如何提升管理效率和保障安全。通过快鲸智慧园区管理系统&#xff0c;用…

    JavaFX - 事件处理

    在 JavaFX 中&#xff0c;我们可以开发 GUI 应用程序、Web 应用程序和图形应用程序。在此类应用程序中&#xff0c;每当用户与应用程序 &#xff08;节点&#xff09; 交互时&#xff0c;都会称其发生了事件。 例如&#xff0c;单击按钮、移动鼠标、通过键盘输入字符、从列表中…

    小米CR6606,CR6608,CR6609 启用SSH和刷入OpenWRT 23.05.5

    闲鱼上收了一台CR6606和一台CR6609, 一直没时间研究, 趁春节假期把这两个都刷成 OpenWRT 配置说明 CPU: MT7621AT&#xff0c;双核880MHz内存: NT5CC128M16JR-EKI 或 M15T2G16128A, 256MB闪存: F59L1G81MB, 128MB无线基带芯片(BB): T7905DAN无线射频芯片(RF): MT7975DN无外置F…

    使用windows笔记本让服务器上网

    使用windows笔记本让服务器上网 前言准备工具开始动手实践1.将手机热点打开&#xff0c;让Windows笔记本使用无线网卡连接上网2.使用网线将Windows笔记本的有线网卡和服务器的有线网卡直连3.在Windows笔记本上按winR输入ncpa.cpl打开网卡设置界面4.在Windows笔记本上右键“无线…

    2007-2019年各省科学技术支出数据

    2007-2019年各省科学技术支出数据 1、时间&#xff1a;2007-2019年 2、来源&#xff1a;国家统计局、统计年鉴 3、指标&#xff1a;行政区划代码、地区名称、年份、科学技术支出 4、范围&#xff1a;31省 5、指标解释&#xff1a;科学技术支出是指为促进科学研究、技术开发…

    6. 使用springboot做一个音乐播放器软件项目【1.0版项目完结】附带源码~

    #万物OOP 注意&#xff1a; 本项目只实现播放音乐和后台管理系统。 不分享任何音乐歌曲资源。 上一篇文章我们 做了音乐播放器后台的功能。参考地址&#xff1a; https://jsonll.blog.csdn.net/article/details/145214363 这个项目已经好几天也没更新了&#xff0c;因为临近放…

    【Rust自学】15.4. Drop trait:告别手动清理,释放即安全

    喜欢的话别忘了点赞、收藏加关注哦&#xff0c;对接下来的教程有兴趣的可以关注专栏。谢谢喵&#xff01;(&#xff65;ω&#xff65;) 15.4.1. Drop trait的意义 类型如果实现了Drop trait&#xff0c;就可以让程序员自定义当值离开作用域时发生的操作。例如文件、网络资源…

    2025年1月22日(网络编程 udp)

    系统信息&#xff1a; ubuntu 16.04LTS Raspberry Pi Zero 2W 系统版本&#xff1a; 2024-10-22-raspios-bullseye-armhf Python 版本&#xff1a;Python 3.9.2 已安装 pip3 支持拍摄 1080p 30 (1092*1080), 720p 60 (1280*720), 60/90 (640*480) 已安装 vim 已安装 git 学习…

    嵌入式C语言:大小端详解

    目录 一、大小端的概念 1.1. 大端序&#xff08;Big-endian&#xff09; 1.2. 小端序&#xff08;Little-endian&#xff09; 二、大小端与硬件体系的关系 2.1. 大小端与处理器架构 2.2. 大小端与网络协议 2.3. 大小端对硬件设计的影响 三、判断系统的大小端方式 3.1.…

    当WebGIS遇到智慧文旅-以长沙市不绕路旅游攻略为例

    目录 前言 一、旅游数据组织 1、旅游景点信息 2、路线时间推荐 二、WebGIS可视化实现 1、态势标绘实现 2、相关位置展示 三、成果展示 1、第一天旅游路线 2、第二天旅游路线 3、第三天旅游路线 4、交通、订票、住宿指南 四、总结 前言 随着信息技术的飞速发展&…

    85.[1] 攻防世界 WEB easyphp

    进入靶场 属于代码审计 <?php // 高亮显示当前 PHP 文件的源代码&#xff0c;常用于调试或展示代码 highlight_file(__FILE__);// 初始化两个标志变量&#xff0c;用于后续条件判断 $key1 0; $key2 0;// 从 GET 请求中获取参数 a 和 b $a $_GET[a]; $b $_GET[b];// 检…

    智慧园区管理系统推动企业智能运维与资源优化的全新路径分析

    内容概要 在当今快速发展的商业环境中&#xff0c;园区管理的数字化转型显得尤为重要。在这个背景下&#xff0c;快鲸智慧园区管理系统应运而生&#xff0c;成为企业实现高效管理的最佳选择。它通过整合互联网、物联网等先进技术&#xff0c;以智能化的方式解决了传统管理模式…

    HTMLCSS :下雪了

    这段代码创建了一个动态的雪花飘落加载动画&#xff0c;通过 CSS 技术实现了雪花的下落和消失效果&#xff0c;为页面添加了视觉吸引力和动态感。 大家复制代码时&#xff0c;可能会因格式转换出现错乱&#xff0c;导致样式失效。建议先少量复制代码进行测试&#xff0c;若未能…

    java练习(1)

    两数之和&#xff08;题目来自力扣&#xff09; 给定一个整数数组 nums 和一个整数目标值 target&#xff0c;请你在该数组中找出 和为目标值 target 的那 两个 整数&#xff0c;并返回它们的数组下标。 你可以假设每种输入只会对应一个答案&#xff0c;并且你不能使用两次相…

    [EAI-028] Diffusion-VLA,能够进行多模态推理和机器人动作预测的VLA模型

    Paper Card 论文标题&#xff1a;Diffusion-VLA: Scaling Robot Foundation Models via Unified Diffusion and Autoregression 论文作者&#xff1a;Junjie Wen, Minjie Zhu, Yichen Zhu, Zhibin Tang, Jinming Li, Zhongyi Zhou, Chengmeng Li, Xiaoyu Liu, Yaxin Peng, Chao…

    DB-GPT试用

    继续上一篇 DB-GPT的安装 https://blog.csdn.net/berryreload/article/details/142845190 访问http://xxx:5670 访问这里 创建数据库连接 http://10.168.1.208:5670/construct/database 访问这里&#xff0c;点击刷新 http://10.168.1.208:5670/construct/app 刷新后才能出…

    华硕笔记本装win10哪个版本好用分析_华硕笔记本装win10专业版图文教程

    华硕笔记本装win10哪个版本好用&#xff1f;华硕笔记本还是建议安装win10专业版。Win分为多个版本&#xff0c;其中家庭版&#xff08;Home&#xff09;和专业版&#xff08;Pro&#xff09;是用户选择最多的两个版本。win10专业版在功能以及安全性方面有着明显的优势&#xff…

    Kafka中文文档

    文章来源&#xff1a;https://kafka.cadn.net.cn 什么是事件流式处理&#xff1f; 事件流是人体中枢神经系统的数字等价物。它是 为“永远在线”的世界奠定技术基础&#xff0c;在这个世界里&#xff0c;企业越来越多地使用软件定义 和 automated&#xff0c;而软件的用户更…

    LabVIEW温度修正部件测试系统

    LabVIEW温度修正部件测试系统 这个基于LabVIEW的温度修正部件测试系统旨在解决飞行器温度测量及修正电路的测试需求。该系统的意义在于提供一个可靠的测试平台&#xff0c;用于评估温度修正部件在实际飞行器环境中的性能表现&#xff0c;从而确保飞行器的安全性和可靠性。 系统…