Galaxy生信云平台:集合操作工具大全

Galaxy平台上的文件称为数据集(Dataset),如果将多个文件组合在一起,则形成数据集合(Dataset collection)。

上传文件后,可以通过工具将文件构建成数据集合。具体操作可以参考前面介绍转录组流程的文章:

上传数据,轻松分析 | 云上转录组标准分析流程使用指南

构建数据集合的工具有下图所示的4种:

84d10849cdcd9b271bf06b2c8afde1ea.png

  1. Build Dataset List,将多个文件组合成一个列表,每行一个数据集。

  2. Build Dataset Pair,将一对双端测序数据组合成一个数据集对。

  3. Build List of Dataset Pairs,将多个样本的双端测序数据构建成数据集对列表,每行一个数据集对。

  4. Build Collection from Rules,在一个表格工具中,通过各种规则,将数据构建成数据集合。

有了数据集合之后,还有许多工具对数据集合进行操作,以下是这些工具的简要介绍。

Apply rules

这个工具允许用户将现有的 Galaxy 数据集合的元数据处理为表格数据,应用一系列规则,并生成一个新的集合。

Build list

从单个数据集或集合构建一个新的列表集合。

942bfd223eed31f6cd7a317f23dbd921.png

Collapse Collection into single dataset in order of the collection

将列表集合合并为一个单一文件数据集,可以选择包含数据集名称或合并共同的标题行。

Duplicate file to collection

通过将输入数据集重复N次(其中N是用户指定的整数),创建一个任意大小的集合。

Extract dataset

根据位置或标识符从集合中提取数据集。

Extract element identifiers of a list collection

该工具接受一个列表类型的集合,并生成一个文本数据集作为输出,其中包含集合中所有数据集的元素标识符。

Filter collection

使用文件中提供的列表,从集合中过滤元素。

Filter empty datasets

从集合中移除空元素。

该工具接受一个数据集合并过滤(移除)空数据集。这对于继续多样本分析很有用,因为下游工具要求数据集具有内容。

2059e7b06cb7af5b2c29e6cf9cc1821e.png

Filter failed datasets

从集合中移除错误(红色)的数据集。

该工具接受一个数据集合并过滤(移除)处于失败(红色)状态的数据集。这对于在多个样本分析中继续进行时,当一个或多个样本在某个时刻失败时非常有用。

cd08b29f02b8b3e65629846006db82f8.png

Flatten collection

将嵌套集合展平为简单列表。

该工具接受嵌套集合,例如列表的列表或数据集对的列表,并从输入生成一个扁平化的列表。它有效地“展平”了层次结构。集合标识符被合并在一起(默认使用“_”),以创建扁平化结果中的新集合标识符。

38700e32fc477a630781405fb4f97180.png

Merge collections

接受两个或更多集合,并从它们创建一个单一的集合。

Relabel identifiers

使用提供的文件中的标识符,更改集合中数据集的标识符。

Sort collection

按字母顺序、数字顺序或使用提供的文件中预定的顺序对数据集合进行排序。

Split by group

给定单个输入数据集,该工具根据指定列中的唯一值将文件拆分。

Split file to dataset collection

该工具将由记录组成的数据集拆分为集合中的多个数据集。记录可以是一行、一个FASTA序列(标题+序列)、一个FASTQ序列(标题+序列+质量值)等。重要的属性是记录要么具有特定的长度(例如,FASTQ有4行),要么可以通过正则表达式指定新记录的开始/结束,例如,对于行可以使用 ".",对于FASTA可以使用">."。

Tag elements

向集合元素添加标签(包括名称(name:)和组(group:)标签)。

Unzip Unzip a file

解压包含各种类型文件的文件夹。如果要求保留多个文件,则输出将是一个包含压缩文件或tar存档中的所有文件的集合。

Unzip collection

将配对集合“解压缩”为两个简单的数据集集合(数据集的列表)。

给定一个包含正向和反向读取的配对集合,该工具将把它“解压缩”成两个分别包含正向和反向读取的集合。

d4bb3f0ebccdd79ffbd7c186a1a395e4.png

Zip collections

接受两个集合并将它们构建成一个配对集合。

如果您有一个仅包含正向读取的集合和一个仅包含反向读取的集合,这个工具将把它们“压缩”到一起,形成一个简单的配对集合。例如,给定两个包含正向和反向读取的集合,它们可以被“压缩”成一个单一的配对集合:

05550f5b664055a7b9540ffc2647ee65.png

关于简说基因

  • 生信平台

    Galaxy中国(UseGalaxy.cn)致力于打造中国人的云上生物信息基础设施。大量在线工具免费使用。无需安装,用完即走。活跃的用户社区,随时交流使用心得。

  • 生信分析

    我们能够承接所有 NGS 组学数据分析业务,包括但不限于 WGS / WES / RNA-seq 等。基因组组装、注释,以及各种重测序业务都可以与简说基因合作。

  • 生信培训

    简说基因的生信培训班,荣获学员的一致好评。如果你也对生物信息学感兴趣,欢迎来跟简说基因,学真生信

  • 联系方式

    QQ交流群(免费):925694514

    微信交流群(免费):加微信好友,邀请入群

    客服微信:usegalaxy

a764afc3a1b0389cf8a365d615bbc58f.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/713413.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

后台组件体系

从今天开始进入更细粒度说明。后台微服务是由组件构成的。平台的开发理念是为甲方打造一个生态环境。安装实施时为客户安装私仓来管理组件。开发微服务时鼓励拆分为组件。开发新功能时,先看有没有相关组件,有的话就在pom.xml文件(不要问我这个…

Day10:基础入门-HTTP数据包Postman构造请求方法请求头修改状态码判断

目录 数据-方法&头部&状态码 案例-文件探针 案例-登录爆破 工具-Postman自构造使用 思维导图 章节知识点: 应用架构:Web/APP/云应用/三方服务/负载均衡等 安全产品:CDN/WAF/IDS/IPS/蜜罐/防火墙/杀毒等 渗透命令:文件…

什么是端点安全以及如何保护端点

什么是端点安全 端点是指可以接收信号的任何设备,是员工使用的一种计算设备,用于保存公司数据或可以访问 Internet。端点的几个示例包括:服务器、工作站(台式机和笔记本电脑)、移动设备、虚拟机、平板电脑、物联网、可…

一【初识EMC】

在作为硬件行业相关从业者,经常接触到EMC相关问题,下面来简单介绍下EMC相关方面的知识 文章目录 前言一、生活中的EMC现象?二、EMC是什么三、EMC的三要素四、EMI与EMS的评估方式1.RE2.CE3.HAR4.FLICKER5.Rs6.CS7.ESD8.EFT9.DIP10.PMS11.surge…

Zookeeper3:客户端命令

文章目录 客户端命令连接服务端Zookeeper客户端内置命令 ls - 节点信息 客户端命令 连接服务端Zookeeper //客户端连接服务端zookeeper 默认连的本机2181端口的zookeeper cd /opt/module/zookeeper-3.9.1/bin && sh zkCli.sh//客户端连接远程服务端zookeeper cd /op…

【小尘送书-第十一期】编程的基石,开发的核心:《算法秘籍》

大家好,我是小尘,欢迎你的关注!大家可以一起交流学习!欢迎大家在CSDN后台私信我!一起讨论学习,讨论如何找到满意的工作! 👨‍💻博主主页:小尘要自信 &#x1…

如何使用GAP-Burp-Extension扫描潜在的参数和节点

关于GAP-Burp-Extension GAP-Burp-Extension是一款功能强大的Burp扩展,该工具在getAllParams扩展的基础上进行了升级,该工具不仅可以帮助广大研究人员在安全审计过程中扫描潜在的参数,而且还可以搜索潜在的链接并使用这些参数进行测试&#…

零基础如何快速入门伦敦金交易

伦敦金交易是金融市场中备受关注的一种投资方式。对于想要学习如何炒伦敦金并快速开始交易的人来说,本文将为您提供一份全面而详细的指南。无论您是初学者还是有经验的交易者,本文都将帮助您了解伦敦金交易的基本知识,并提供一些实用的技巧和…

协议-http协议-基础概念03-http状态码-http特点-http性能-压缩和分块传输-范围请求

参考来源: 极客时间-透视HTTP协议(作者:罗剑锋); 01-状态码分类 开头的 Version 部分是 HTTP 协议的版本号,通常是HTTP/1.1,用处不是很大。后面的 Reason 部分是原因短语,是状态码的简短文字描述&#xff…

每周一算法:双向广搜

题目链接 字符串变换 题目描述 已知有两个字串 A , B A,B A,B,及一组字串变换的规则(至多 6 6 6个规则): A 1 → B 1 A_1→B_1 A1​→B1​ A 2 → B 2 A_2→B_2 A2​→B2​ … 规则的含义为:在 A A A中的子串 A 1 A_1 A1​…

pytorch统计属性

目录 1.normal2. mean, sum, min, max, prod3.argmin, argmax4. topk kthvalue5. compare 1.normal torch.normal(mean, std, *, generatorNone, outNone) → Tensor返回一个张量,其中的每个元素随机来自独立的标准正态分布。这些分布具有给定的均值和标准差。 参数…

【cmu15445c++入门】(13)C++的std::promise

一、说明 std::promise 是C11并发编程中常用的一个类&#xff0c;常配合std::future使用。其作用是在一个线程t1中保存一个类型typename T的值&#xff0c;可供相绑定的std::future对象在另一线程t2中获取 二、代码 #include <chrono> #include <future> #includ…

Hive SQL 开发指南(二)使用(DDL、DML,DQL)

在大数据领域&#xff0c;Hive SQL 是一种常用的查询语言&#xff0c;用于在 Hadoop上进行数据分析和处理。为了确保代码的可读性、维护性和性能&#xff0c;制定一套规范化的 Hive SQL 开发规范至关重要。本文将介绍 Hive SQL 的基础知识&#xff0c;并提供一些规范化的开发指…

如何安装ProtoBuf环境

1 &#x1f351;下载 ProtoBuf&#x1f351; 下载 ProtoBuf 前⼀定要安装依赖库&#xff1a;autoconf automake libtool curl make g unzip 如未安装&#xff0c;安装命令如下&#xff1a; Ubuntu ⽤⼾选择&#xff1a; sudo apt-get install autoconf automake libtool cur…

Unity 向量计算、欧拉角与四元数转换、输出文本、告警、错误、修改时间、定时器、路径、

using System.Collections; using System.Collections.Generic; using UnityEngine;public class c2 : MonoBehaviour {// 定时器float t1 0;void Start(){// 向量Vector3 v1 new Vector3(0, 0, 2);Vector3 v2 new Vector3(0, 0, 3);// 计算两个向量的夹角Debug.Log(Vector3…

Java 学习和实践笔记(26):组合(component)的含义以及与继承(extends)的关系

组合的两个作用&#xff1a; 1&#xff09;通过将父类对象作为子类的属性 2&#xff09;通过第1点的作用&#xff0c;实现了代码复用。 示例代码&#xff1a; public class TestComponent {public static void main(String[] args) {Student2 s1 new Student2("jason&…

灯塔:HTML笔记

网页由哪些部分组成&#xff1f; *文字 图片 音频 视频 超链接 程序员写的代码是通过浏览器转换成网页的 五大浏览器有哪些&#xff1f; *IE浏览器 *火狐浏览器&#xff08;Firefox&#xff09; *谷歌浏览器&#xff08;Chrome&#xff09; *Safari浏览器 *欧朋浏览器&…

NENU OJ算法2例题||搜索E

NENU OJ算法2例题 合集原文指路 算法2搜索E 1281: E001 数的划分 题目描述 将整数n分成k份&#xff0c;且每份不能为空&#xff0c;任意两种分法不能相同&#xff08;不考虑顺序&#xff09;。 例如&#xff1a;n7&#xff0c;k3&#xff0c;下面三种分法被认为是相同的。…

【数据结构与算法】动态规划法解题20240302

这里写目录标题 一、198. 打家劫舍1、动态规划五部曲 二、213. 打家劫舍 II 一、198. 打家劫舍 你是一个专业的小偷&#xff0c;计划偷窃沿街的房屋。每间房内都藏有一定的现金&#xff0c;影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统&#xff0c;如果两间…

【python】双十一美妆数据分析可视化 [聚类分析/线性回归/支持向量机](代码+报告)【独一无二】

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;公众号&#x1f448;&#xff1a;测试开发自动化【获取源码商业合作】 &#x1f449;荣__誉&#x1f448;&#xff1a;阿里云博客专家博主、5…