【 10X summary report】怎么看?详细解读笔记

报告内容

在开始正式的分析之前,需要查看在对齐和计数过程中生成的任何总结统计信息。下图是由Cell Ranger工具创建的10X总结报告,在从10X scRNA-seq实验生成计数矩阵时会生成。

 The left half of the report describes sequencing and mapping statistics. One thing to note is the “sequencing saturation”, which estimates the proportion of mRNA transcripts that has been sequenced. This is calculated by downsampling the mean number of reads per cell and obtaining the corresponding number of UMIs (nUMI). The relationship between the number of UMIs obtained against the number of reads is then extrapolated to the asymptote, which corresponds to 100% saturation. A low sequencing saturation implies that deeper sequencing will likely recover more UMIs. That said, some preliminary analysis should first be performed to determine if the current number of UMIs recovered is able to answer the biological questions of interest. Also, check that a high percentage of reads are mapped to the genome, which indicates low amounts of contamination.

The top-right portion of the report plots the nUMI captured in each droplet / barcode, with the droplets ordered in decreasing nUMI from left to right. On the left side of the plot, droplets have very high nUMI and are likely to contain cells. As we scan through the droplets towards the right, we eventually encounter a “knee point” where there is a drastic drop in the nUMI. This likely signifies a transition from observing cell-containing droplets to droplets containing cell debris or no cells at all. Droplets that are deemed by Cell Ranger to contain cells are coloured blue here and the algorithm tends to include slightly more cells beyond the plot shoulder. These cells with smaller nUMIs will have to be removed in the quality control step.

From the summary report, there is another important observation: the nUMI does not correspond to the number of reads per cell. Recall that this is because reads with the same UMI originated from a single mRNA molecule and is thus treated as a single UMI count . Thus, the number of counts i.e. nUMI is usually only a fraction (about 1/8 to 1/3) of the number of reads.

 下图为本人使用CellRanger V5.2.0对语一个单细胞数据跑出的结果

报告解读

细胞和基因数目的评估

  1. Estimated number of cells - 样本测到的细胞数
  2. Mean reads per cell - 每个细胞测到的平均reads
  3. Median genes per cell - 每个细胞基因数的中位数

Sequencing中

Number of reads - 测到的总read数目

Valid barcodes - UMI校正后匹配的UMI数量

Sequencing saturation:测序饱和度。一般60-80%比较合适(阈值范围可以适当调整,但是高于70%或80%左右绝对OK)。如果测到的细胞数多,但是每个细胞里面的平均reads数少,那么饱和度就不高,反之,饱和度高。但也不是越高越好,背后原理是抽样的原理,到达80%左右就可以代表整个样本了。

Q30 bases in barcode - 基于barcode的分数,大于30的比率

Q30 bases in RNA read - 基于RNA read的分数,大于30的比率

Q30 bases in UMI - 基于UMI的分数,大于30的比率

认为要一般要大于65%,少于这个比例的话,这个页面会报错,

Mapping结果

  1. Reads mapped to genome - 比对到选定基因组的reads
  2. Reands mapped confidently to genome - 仅仅比对到基因组的reads,如果一条reads既可以比对到外显子区又可以比对到非外显子区,那么算比对到了其中一个外显子区
  3. Reads mapped confidently to intergenic regions - 比对到基因组的基因间区域
  4. Reads mapped confidently to intronic regions - 比对到内含子区域
  5. Reads mapped confidently to exonic regions - 比对到外显子区域
  6. Reads mapped confidently to transcriptome - 比对到转录组的reads,这些读数可以用来UMI的计数
  7. Reads mapped antisense to gene - 比对到基因的相反的reads

细胞数目评估Cells图

横轴是barcodes,纵轴是UMI数量。通过barcode上的UMI标签分布来评估细胞数目,深蓝色代表细胞,灰色代表背景。

在前期磁珠(bead)与细胞形成油包水的结构过程中,会存在没有把细胞包进去的情况,这时候的油包水结构里面就只有磁珠和一些barcode的序列,而cDNA的碱基序列一般都是barcode碱基序列的10倍以上,就是由此来确定哪些是真实的细胞,哪些是background。

其他指标

  1. Estimated number of cells - 样本测到的细胞数
  2. Fraction reads in cells - valid-UMI的质量分数,代表与细胞相关的UMI可靠地比对到基因组,一般要在70%及以上,否则数据质量就不好
  3. Mean reads per cell - 每个细胞测到的平均reads
  4. Median genes per cell - 每个细胞的基因数中位数
  5. Total genes detected - 测到的总基因数,至少有一条UMI
  6. Median UMI counts per cell - 细胞UMI数量的中间值

饱和度评估

  1. 对reads抽样,观察不同抽样条件下检测到的转录本数量占检测到的所有转录本的比例。(如果曲线末端区域平滑,说明测序接近饱和,再增加测序量,覆盖到的转录本数目也不会变化太多。)
  2. 对reads抽样,观察不同测序数据量情况下检测到的基因数目的分布。(如果曲线末端区域平滑,说明测序接近饱和,再增加测序量,检测到的基因数目也不会变化太多。)

Reference

[1] A Guide to Analyzing Single-cell Datasets, John F. Ouyang, January 2023

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/716330.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

卖wordpress网站模板的网站

WP模板牛 http://www.wpniu.com 上面有很多免费wordpress模板资源的网站,除了免费模板,还有付费模板。 My模板(我的模板) http://www.mymoban.com 老牌网站模板资源站,上面有wordpress模板、帝国CMS模板、WooCommerce模板可以直接免费下载…

Linux whois命令教程:查询域名所有者信息(附案例详解和注意事项)

Linux whois命令介绍 whois命令是一个用于查询域名所有者信息的工具。它可以直接从命令行进行查询,这对于没有图形用户界面的系统或者需要在shell脚本中进行查询的情况非常有用。 Linux whois命令适用的Linux版本 whois命令在大多数Linux发行版中都可以使用&…

C++之stack

1、stack简介 stack是实现的一个先进后出,后进先出的容器。它只有一个出口,只能操作最顶端元素。 2、stack库函数 (1)push() //向栈压入一个元素 (2)pop() //移除栈顶元素 (3…

基于springboot+vue的中国陕西民俗网

博主主页:猫头鹰源码 博主简介:Java领域优质创作者、CSDN博客专家、阿里云专家博主、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战,欢迎高校老师\讲师\同行交流合作 ​主要内容:毕业设计(Javaweb项目|小程序|Pyt…

在 Angular 中使用 Renderer2

Renderer2 类 Renderer2 类是 Angular 提供的一个抽象服务,允许在不直接操作 DOM 的情况下操纵应用程序的元素。这是推荐的方法,因为它使得更容易开发可以在没有 DOM 访问权限的环境中渲染的应用程序,比如在服务器上、在 Web Worker 中或在原…

Java如何剪切视频

背景:如何使用Java批量切割视频 FFmpeg 是一个强大的开源多媒体处理工具,被广泛应用于音视频的录制、转码、编辑等方面。它支持几乎所有主流的音视频格式,能够在各种操作系统平台上运行,包括 Windows、macOS 和 Linux。FFmpeg 提…

nginx,php-fpm

一,Nginx是异步非阻塞多进程,io多路复用 1、master进程:管理进程 master进程主要用来管理worker进程,具体包括如下4个主要功能: (1)接收来自外界的信号。 (2)向各worker进…

SAP PP学习笔记04 - BOM2 -通过Serial来做简单的BOM变式配置,副明细,BOM状态,BOM明细状态,项目种类,递归BOM

本章继续讲BOM。 本章讲通过Serial来做简单的BOM变式配置。还讲了BOM的相关概念:副明细,BOM状态,BOM明细状态,项目种类,递归BOM 等。 1,通过Serial(序列号)来做简单的 VC&#xff0…

spring自定义注解之-ElementType.METHOD方法级注解声明

自定义注解类型和常用场景 可以参考之前的文章 : ElementType.FIELD字段级注解声明 如果在项目中,多处地方都需调用到同一个方法进行逻辑处理,且与方法的业务逻辑无关,比如监控,日志等,则可用自定义的方法…

【JavaSE】面向对象——继承性

继承性 继承性的概念 所谓继承,就是程序猿在保持原有类特性的基础上进行扩展,增加新功能,这样的类被称为派生类或者子类,原有类被称为超类或者基类。 在对于继承性概念进行书写前,我曾查阅许多资料来保证对其表达的…

Some collections -- 2024.3

一、TensorFlow Android (dataset: Mnist) We used TensorFlow to define and train our machine learning model, which can recognize handwritten numbers, called a number classifier model in machine learning terminology. We transform the trained TensorFlow mod…

C++学习第五天(内存管理)

1、内存分布 int globalVar 1; static int staticGlobalVar 1; void Test() {static int staticVar 1;int localVar 1;int num1[10] { 1, 2, 3, 4 };char char2[] "abcd";const char* pChar3 "abcd";int* ptr1 (int*)malloc(sizeof(int) * 4);int…

2024.03.01作业

1. 基于UDP的TFTP文件传输 #include "test.h"#define SER_IP "192.168.1.104" #define SER_PORT 69 #define IP "192.168.191.128" #define PORT 9999enum mode {TFTP_READ 1,TFTP_WRITE 2,TFTP_DATA 3,TFTP_ACK 4,TFTP_ERR 5 };void get_…

高维中介数据:基于交替方向乘子法(ADMM)的高维度单模态中介模型的参数估计(入门+实操)

全文摘要 用于高维度单模态中介模型的参数估计,采用交替方向乘子法(ADMM)进行计算。该包提供了确切独立筛选(SIS)功能来提高中介效应的敏感性和特异性,并支持Lasso、弹性网络、路径Lasso和网络约束惩罚等不…

npm 镜像源切换与设置

项目背景 依赖安装中断或响应特别慢。 可以看到当前所用的镜像是 https://registry.npmjs.org 。 切换淘宝镜像之后总算能够安装下来 命令行模式 查看当前镜像源 # 查看当前镜像源 npm config get registry 可以看到默认情况下是官方默认全局镜像 https://registry.npmjs.o…

竞争加剧下,登顶后的瑞幸该做什么?

瑞幸咖啡仅用短短18个月时间从品牌创立到纳斯达克上市,刷新全球最快上市记录。2020年因交易造假事件被勒令退市股价暴跌80%,有人说这个创造了赴美IPO奇迹的“巨婴”将是下一个倒下的ofo。2023年瑞幸咖啡以逆势超速增长领跑咖啡赛道有力回应了市场的质疑&…

Vector中的begin和end函数是左闭右开的区间

vector::end() 函数的语法 vector::end(); 参数&#xff1a; none——它什么都不接受。 返回值&#xff1a; iterator– 它返回一个指向向量的 past-the-end 元素的迭代器。 实际上Vector中的begin和end函数是左闭右开的区间。 例&#xff1a; Input: vector<int>…

Java多线程实现发布和订阅

目录 简介 步骤 1: 定义消息类 步骤 2: 创建发布者 步骤 3: 创建订阅者 步骤 4: 实现发布-订阅模型 前言-与正文无关 生活远不止眼前的苦劳与奔波&#xff0c;它还充满了无数值得我们去体验和珍惜的美好事物。在这个快节奏的世界中&#xff0c;我们往往容易陷入工作的漩涡…

棋牌室计时计费管理系统的灯控器连接教程

棋牌室计时计费管理系统的灯控器连接教程 一、前言 以下教程以 佳易王棋牌室计时计费管理系统软件V18.0为例说明 软件文件下载可以点击最下方官网卡片——软件下载——试用版软件下载 如上图&#xff0c;计时计费软件在开始计时的时候&#xff0c;点击 开始计时 如果连接了…

YOLOv9独家改进|动态蛇形卷积Dynamic Snake Convolution与空间和通道重建卷积SCConv与RepNCSPELAN4融合

专栏介绍&#xff1a;YOLOv9改进系列 | 包含深度学习最新创新&#xff0c;主力高效涨点&#xff01;&#xff01;&#xff01; 一、改进点介绍 Dynamic Snake Convolution是一种针对细长微弱的局部结构特征与复杂多变的全局形态特征设计的卷积模块。 SCConv是一种即插即用的空间…