单细胞转录组数据分析的10大软件/流程

单细胞数据分析现在已经有上千个软件工具可供使用了,这为用户带来便利的同时也造成了选择困难。就像时间一样,一个表,没问题,但如果有两个表,时间还不一样,该信谁的呢?

正好我们前面一篇文章介绍了这样一个开源数据库:https://www.scrna-tools.org/,里面收集了几乎所有的单细胞数据分析工具,我们在这个网站上通过工具的引用数排序,截取前 10 行结果,得到目前引用数最多,应用最广的 10 个单细胞数据分析工具 / 流程。这无疑能为我们以后的选择提供一个参考,如果你感到迷茫,选择引用数多的大体不会有错。

70fc161186583271ee57d2ce1a92a4dd.png

  1. STAR

STAR(Spliced Transcripts Alignment to a Reference)是一款用于转录组数据比对的工具,推出于2012年。STAR 在 RNA-seq  领域广泛应用,其独特的两阶段映射策略提高了比对精度,同时支持并行计算,使其适用于大规模数据处理。STAR 的高效性和准确性使其成为生物信息学研究中的重要工具,为基因表达和调控研究提供可靠支持。

2. Seurat

Seurat 是一款强大的单细胞 RNA-seq 数据分析工具,由 Satija 实验室于 2015 年推出。主要应用于识别细胞亚型、构建细胞谱系树和揭示基因表达模式。其优点包括高度可定制的工作流程以及有效的细胞群聚算法等。Seurat 为解析单细胞层面的生物学问题提供了全面而灵活的解决方案。

3. Monocle

Monocle 是一款用于单细胞 RNA-seq 数据分析的工具,由 Trapnell 实验室于 2014 年推出。主要应用于发现细胞发育轨迹、识别基因表达动态变化。其优点包括强大的拟动态系统建模、细胞状态推断和可视化分析。Monocle 广泛用于研究细胞分化、发育和异质性,为理解单细胞水平的生物学过程提供了深刻见解。

4. kallisto

Kallisto 是一款快速、准确的 RNA-seq 数据定量工具,由 Pachter 实验室于 2015 年推出。主要应用于基因表达定量,其优点包括高效的算法、低计算成本和适用于大规模数据集。Kallisto 通过采用估计碎片相对丰度的方法,不需对整个转录组进行比对,加速了分析过程,使其成为 RNA-seq 数据处理的理想选择,特别适用于高通量测序项目。

5. salmon

Salmon 是一款快速、准确的 RNA-seq 数据定量工具,由 Kingsford 实验室于 2017 年推出。主要应用于基因表达估算,其优点包括高效的碎片量化、低计算成本和适用于大规模测序数据。Salmon 采用概率模型,避免了传统比对方法的计算瓶颈,特别适用于高通量测序数据。

6. Scanpy

Scanpy 是一款用于单细胞转录组数据分析的 Python 工具,推出于 2017 年,主要应用于细胞聚类、差异表达和细胞发育轨迹分析。其优点包括强大的可扩展性、灵活的数据处理流程和丰富的可视化功能。Scanpy 为研究人员提供了高效而全面的工具,帮助他们深入了解单细胞水平的生物学特征,促进了单细胞转录组研究领域的发展。

7. CellRanger

CellRanger 是由 10x Genomics 开发的单细胞数据分析工具,于 2015 年首次发布。主要应用于单细胞 RNA-seq 数据处理,涵盖细胞特异性表达、群聚分析和基因表达定量。其优点包括高度自动化、用户友好的界面以及强大的分析工具。CellRanger 通过整合硬件和软件,为研究人员提供了一体化解决方案,大大简化了单细胞转录组研究的复杂性,促进了对细胞异质性和功能的深入理解。

8. inferCNV

inferCNV 是一款用于从单细胞 RNA-seq 数据中推断细胞染色体拷贝数变异的工具,由Broad Institute 开发,首次推出于2017年。其优点包括高效的计算方法、精准的拷贝数变异估算,以及适应于复杂细胞异质性的强大性能。inferCNV 为研究人员提供了深入挖掘单细胞层面基因组变异的工具,有助于解析肿瘤异质性、发育过程和其他与拷贝数变异相关的生物学问题。

9. SCENIC

SCENIC(Single-Cell rEgulatory Network Inference and Clustering)是一个用于推断单细胞基因调控网络的工具,由 Netherlands Cancer Institute 开发。推出于 2017 年,主要应用于识别单细胞水平的转录因子网络。其优点包括高度可定制的工作流程、对细胞异质性的有效处理,以及丰富的可视化功能。SCENIC 为研究人员提供了深入了解单细胞基因调控网络的工具,有助于揭示细胞类型和状态之间的分子调控机制。

10. Harmony

Harmony 是一款用于整合和纠正批次效应的单细胞 RNA-seq 数据分析工具,由 Dana-Farber 癌症研究所于 2018 年推出。主要应用于细胞聚类和亚型发现。其优点包括有效去除批次效应、提高数据集集成性,以及适用于大规模单细胞 RNA-seq 研究。Harmony 通过综合考虑细胞相似性和批次信息,为研究人员提供了一个强大的工具,帮助消除实验批次引入的噪音,确保准确而一致的单细胞分析结果。

可以看到,STAR 和 Seurat 两款软件的引用量遥遥领先,分别达到了恐怖的 3万+和 2.8万+。

STAR 的引用量最高,可能是因为它不仅用于处理单细胞测序数据,它还是用于 Bulk RNA-seq 数据比对的流行工具。而 Seurat,不愧为单细胞转录组数据处理事实上的标准,其优异的表现得到了广泛认可。不过其最大的缺点是运算速度,如果项目的细胞数过多,运算可能会很慢。不过这主要是R语言本身的锅。

值得一提的是,Python 爱好者喜欢的 Scanpy 仅排名第6,这可能是因为其推出时间较晚(2017,比 Seurat 晚2年)。不过现在由于项目的细胞数量越来越多,Python 单细胞数据分析生态越来越完善,Scanpy 的用户也正在快速增长。

最后,以上工具大都集成到了 Galaxy生信云平台(UseGalaxy.CN),不管是 Bulk RNA 还是 Single RNA,都可以在云平台通过鼠标点击就可以分析。

关于简说基因

  • 生信平台

    Galaxy中国(UseGalaxy.cn)致力于打造中国人的云上生物信息基础设施。大量在线工具免费使用。无需安装,用完即走。活跃的用户社区,随时交流使用心得。

  • 生信培训

    简说基因的生信培训班,荣获学员的一致好评。如果你也对生物信息学感兴趣,欢迎来跟简说基因,学真生信

  • 生信分析

    我们能够承接所有 NGS 组学数据分析业务,包括但不限于 WGS / WES / RNA-seq 等。基因组组装、注释,以及各种重测序业务都可以与简说基因合作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/659308.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LRU 缓存置换策略:提升系统效率的秘密武器(上)

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…

坚持刷题 | 完全二叉树的节点个数

Hello,大家好,我是阿月!坚持刷题,老年痴呆追不上我,今天刷:完全二叉树的节点个数 题目 222.完全二叉树的节点个数 代码实现 class TreeNode {int val;TreeNode left, right;public TreeNode(int val) …

springboot141夕阳红公寓管理系统的设计与实现

基于Spring Boot的夕阳红公寓管理系统的设计与实现 摘 要 如今社会上各行各业,都在用属于自己专用的软件来进行工作,互联网发展到这个时候,人们已经发现离不开了互联网。互联网的发展,离不开一些新的技术,而新技术的…

Lua脚本

1.准备 1.简介 1.Lua是一种轻量小巧的脚本语言,用标准C语言编写并以源代码形式开放 2.目标 1.其设计目的是为了嵌入应用程序中,从而为应用程序提供灵活的扩展和定制功能 3.特点 1.轻量级:用标准C语言编写并以源代码形式开放,编译后…

【Qt】—— Qt Creator界⾯认识

目录 (一)左边栏 (二)代码编辑区 (三)UI设计界⾯ (四)构建区 (一)左边栏 在编辑模式下,左边竖排的两个窗⼝叫做"边栏"。 ①是项⽬…

动手实践WebVR 全景

前言 近年来VR概念越来越火,相信大家在网上都有过VR的浏览体验,比如VR全景看房[1]、VR全景看车[2]、VR全景旅游[3]等等,VR全景给了我们视觉上的沉浸式体验。本文将会简单探究Web VR全景的实现原理,同时也会用threejs实现两个小的…

Linux文本三剑客-sed

一、sed介绍: sed(Stream Editor)是一种流编辑器,用于对文本进行处理和转换。它可以从输入流中读取文本,并根据指定的规则进行编辑和替换。sed通常用于在命令行中进行文本处理,可以实现搜索、替换、删除、…

Vmware 无法开启虚拟化解决方法

最近遇到了Vmware无法开启虚拟化的问题,已经解决,记录一下解决经过。 我遇到的情况是BIOS已经开启虚拟化,HV服务也停用了,但是Vmware仍然提示模块“VPMC”启动失败。网上的解决方案千篇一律,基本都是排查BIOS、停用Windows的虚拟化功能、停用HV主机服务、Vmware配置中关闭…

【开源】SpringBoot框架开发天然气工程运维系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 系统角色分类2.2 核心功能2.2.1 流程 12.2.2 流程 22.3 各角色功能2.3.1 系统管理员功能2.3.2 用户服务部功能2.3.3 分公司(施工单位)功能2.3.3.1 技术员角色功能2.3.3.2 材料员角色功能 2.3.4 安…

如何快速将 HTML 文件转换为 PDF

HTML表格是一种在网页上显示数据的通用且强大的方式。它们可用于创建简单的表(例如日历)或更复杂的表(例如数据网格)。在这篇博文中,我们将逐步学习如何在 C# 中创建 HTML 表格。本指南将为您提供在 C# 中有效创建 HTM…

阿里云服务器一键部署幻兽帕鲁专属服务器,图形化可视化修改游戏参数是如此简单!

幻兽帕鲁这款游戏最近很火,在线玩家太多了,官方服务器也是承压巨大,很多玩家现在都是搭建自己的专属幻兽帕鲁服务器来玩。搭建教程现在也是越来越简单了,可以说是真正的零基础,一看就会,并且开箱即玩&#…

【python】在python中使用单元测试unittest

在python中使用单元测试unittest 大家好,欢迎来到我的技术乐园!今天,我们将一起踏入Python单元测试的奇妙旅程,探索这个让我们的代码更可靠、更强壮的令人愉快的世界。 前言:为什么单元测试如此重要? 在我…

鱼和熊掌如何兼得?一文解析RDS数据库存储架构升级

在2023年云栖大会上,阿里云数据库产品事业部负责人李飞飞在主题演讲中提到,瑶池数据库推出“DB存储”一体化能力,结合人工智能、机器学习、存储等方法和创新能力,实现Buffer Pool Extension能力和智能冷温热数据分层能力。在大会的…

01神经网络的理论及实现

感知机的缺点就是需要设置合适的权重,而权重的设置都是人工操作的。 1、从感知机到神经网络 重新画出感知机的模型,在图上加上偏置,由于偏置始终为1,所以颜色加深。 图1-1 感知机模型 引入新函数(激活函数)&#xff…

2024前端面试题汇总

2024前端面试题汇总 1、全局变量与局部变量2、Vue3 区分ref 与 reactive 的原因3、关于服务端渲染(SSR)与客户端渲染(CSR)的理解4、单页面应用(SPA)与多页面应用(MPA)的优劣5、Vue2 …

计算机二级Python选择题考点——Python语言程序设计Ⅱ

代码1&#xff1a; def fibRate(n):if n < 0:return -1elif n 1:return -1elif n 2:return 1else:L [1,5]for i in range(2,n):L.append(L[-1] L[-2])return L[-2] % L[-1] print(fibRate(7))n 7 L [1,5] i 2 , 3 , 4 , 5 , 6 i 2 -> L[-1] L[-2] 5 1 6 -&g…

Linux逻辑卷(LV)扩容

Linux逻辑卷&#xff08;LV&#xff09;扩容 1、准备物理磁盘&#xff08;分区和不分区都行&#xff09;&#xff0c;可以使用lsblk命令查看新增的磁盘&#xff0c;如下图sde就是我们新增磁盘&#xff0c;容量为600G。 2、将新磁盘变成物理卷&#xff08;PV&#xff09; pvcr…

缓存的概念

文章目录 一、系统缓存buffer与cachecache 的保存位置cache 的特性 二、用户层缓存DNS缓存 三、浏览器缓存过期机制最后修改时间Etag标记过期时间 expires混合使用和缓存刷新缓存刷新 cookie和session 四、CDN缓存什么是CDN用户请求CDN流程利用 302 实现转发请求重定向至最优服…

RabbitMQ 死信队列应用

1. 概念 死信队列&#xff08;Dead Letter Queue&#xff09;是在消息队列系统中的一种特殊队列&#xff0c;用于存储无法被消费的消息。消息可能会因为多种原因变成“死信”&#xff0c;例如消息过期、消息被拒绝、消息队列长度超过限制等。当消息变成“死信”时&#xff0c;…

【数据分享】1929-2023年全球站点的逐月最高气温数据(Shp\Excel\无需转发)

气象数据是在各项研究中都经常使用的数据&#xff0c;气象指标包括气温、风速、降水、湿度等指标&#xff0c;其中又以气温指标最为常用&#xff01;说到气温数据&#xff0c;最详细的气温数据是具体到气象监测站点的气温数据&#xff01; 之前我们分享过1929-2023年全球气象站…