测序名词解释

测序深度(Sequencing Depth)是指:测序得到的碱基总量(bp)与基因组(转录组或测序目标区域大小)的比值,是评价测序量的指标之一。

测序深度的计算公式为:

测序深度 = (L × N)/ G

L:读段(reads)长度;N:读段数目;G:测序目标区域大小

覆盖度(coverage)是指测序获得的序列占整个基因组的比例。由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖所有的区域,这部分未覆盖的区域就称为Gap。值得注意的是,sequencing coverage指的就是depth of sequencing coverage也就是sequencing depth,反映了一个区域平均被多少个reads测到。

举个例子

假设对一段2000 bp(G:测序目标区域大小)的目标序列进行单端测序,得到1000条reads(N:读段数目),每条reads 200bp(L:读段长度),测序后把所有的reads比对到目标区域后,若2000bp的目标区域中有1800bp的位置至少有1个read覆盖到,而剩余的200bp没有任何read覆盖到,

在这里插入图片描述
可见,测序深度与覆盖度是成正相关的。

而不同实验对于测序量的需求,与目标区域的大小、突变类型和疾病模型等是密切相关的。

对于全基因组测序(WGS)来说,人类全基因组大约3G,健康人一般需要测到30X,即获得90G有效数据;要可靠地检测基因组中的单核苷酸多态性(singlenucleotide polymorphism, SNP)和插入缺失标记(insertion-deletion, INDEL),至少需要测到35X,产生105G的有效测序数据 [1];而从头基因组测序(de novo genome sequencing)需要拼装基因组,最佳测序深度为50X [2]。

人类基因中大约有180,000个外显子,占人类基因组的1%,约30MB。对于全外显子测序(WES)来说,由于目标区域的异质性增加,以及探针50%的捕获效率,需要更大的平均读取深度才能获得与WGS相同的覆盖范围,覆盖89.6-96.8%的目标碱基,需要测到80X [1]。健康人的WES一般测到100X,获得6G数据,其中3G有效数据。

对于高异质性的细胞群或组织样本,比如肿瘤,WGS需要70-100X,WES需要160-200X。

RNA测序(RNA-seq)应用更广阔,现在已经在不同条件下的许多细胞和组织类型中进行了大量的RNA-seq实验,但是很少有关于RNA-seq测序深度的明确指南,这是因为测序要求通常取决于所研究的生物学问题,以及所测定的转录组的大小和复杂性。

单细胞真核生物和细菌等具有较简单的转录组,转录潜能也较低。如,4 M reads可以检测到80%的酵母基因。

哺乳动物拥有数以万计的基因,许多基因还包含不同亚型,并且具有不同的表达水平。在RNA-seq分析中,基因或转录本丰度通常表示为RPKM1。ENCODE2曾利用H1人胚胎干细胞做过评估,若研究对象是RPKM>10的基因,每个样本测到36 M reads就可以准确定量80%的基因表达。然而,对于低表达水平的基因(FPKM<10),要测到80 M reads才能准确定量。所以,如果需要在整个转录组准确定量所有基因(包括lncRNA基因),那么样本需要测到80M以上;如果只是研究表达量高的转录本的整体表达变化,那么每个样品36 M reads就足够了。

如果RNA-seq的目标是发现新的稀有的转录本,如noncoding RNA或mRNA新的可变剪接,考虑到这些转录本的低表达和建库方案产生的偏差,估计需要超过400 M reads。

https://zhuanlan.zhihu.com/p/74558512

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/226367.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一点技术细节

匈牙利算法&#xff1a; 14-4: 匈牙利算法 Hungarian Algorithm_哔哩哔哩_bilibili 课件&#xff1a;https://github.com/wangshusen/AdvancedAlgorithms.git SWin transformer&#xff1a; Swin Transformer论文精读【论文精读】_哔哩哔哩_bilibili patch:灰色 窗口&…

数据结构之---- 回溯算法

数据结构之---- 回溯算法 什么是回溯算法&#xff1f; 回溯算法是一种通过穷举来解决问题的方法&#xff0c;它的核心思想是从一个初始状态出发&#xff0c;暴力搜索所有可能的解决方案&#xff0c;当遇到正确的解则将其记录&#xff0c;直到找到解或者尝试了所有可能的选择都…

day01-报表技术POI

前言 报表[forms for reporting to the higher organizations]&#xff0c;就是向上级报告情况的表格。简单的说&#xff1a;报表就是用表格、图表等格式来动态显示数据&#xff0c;可以用公式表示为&#xff1a;“报表 多样的格式 动态的数据”。 1、开发环境搭建 功能说…

图扑物联 | WEB组态可视化软件

什么是组态&#xff1f; 组态的概念来自于20世纪70年代中期出现的第一代集散控制系统&#xff08;Distributed Control System&#xff09;&#xff0c;可理解为“配置”、“设置”等&#xff0c;是指通过人机开发界面&#xff0c;用类似“搭积木”的简单方式来搭建软件功能&a…

stm32H库的内部FLASH读写操作与结构体数组数据写入与读取

stm32H库的内部FLASH读写操作与结构体数组数据写入与读取 1.软硬件准备2.关于STM32的Flash的一些说明3.实验结果 参考博主-STM32系列(HAL库)——内部FLASH读写实验 1.软硬件准备 软件&#xff1a;CubeMX、SSCOM&#xff08;串口调试助手&#xff09; 硬件&#xff1a;SMT32F…

动态通讯录(并不难都能拿下)

文章目录 &#x1f680;前言&#x1f680;通讯录实现动态通讯录的初期准备模块化框架搭建 &#x1f680;实现接口函数 &#x1f680;前言 铁子们好啊&#xff01;今天咱们来整一个有意思的玩意——通讯录&#xff0c;相信大家对通讯录并不陌生&#xff0c;那接下来就跟着阿辉把…

基于ssm小区疫情防控管理系统论文

摘 要 现代经济快节奏发展以及不断完善升级的信息化技术&#xff0c;让传统数据信息的管理升级为软件存储&#xff0c;归纳&#xff0c;集中处理数据信息的管理方式。本小区疫情防控管理系统就是在这样的大环境下诞生&#xff0c;其可以帮助管理者在短时间内处理完毕庞大的数据…

微信小程序集成腾讯地图

微信小程序集成腾讯地图 微信小程序集成腾讯地图&#xff0c;实现用户附近停车位搜索显示。 腾讯开发者Key申请 官方地址&#xff1a;https://lbs.qq.com/ 下载工具JS 微信小程序JS代码 // pages/check-services.js const app getApp() // 引入SDK核心类 var QQMapWX …

Nginx配合Vue的history模式

加上一行代码就行&#xff1a; try_files $uri $uri/ /index.html;

PyQt6 QTreeWidget树控件

锋哥原创的PyQt6视频教程&#xff1a; 2024版 PyQt6 Python桌面开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili2024版 PyQt6 Python桌面开发 视频教程(无废话版) 玩命更新中~共计46条视频&#xff0c;包括&#xff1a;2024版 PyQt6 Python桌面开发 视频教程(无废话版…

Easy Excel生成复杂下Excel模板(下拉框)给用户下载

引言 文件的下载是一个非常常见的功能&#xff0c;也有一些非常好的框架可以使用&#xff0c;这里我们就介绍一种比较常见的场景&#xff0c;下载Excel模版&#xff0c;导入功能通常会配有一个模版下载的功能&#xff0c;根据下载的模版&#xff0c;填充数据然后再上传。 需求…

TrustGeo代码理解(七)preprocess.py

代码链接:https://github.com/ICDM-UESTC/TrustGeo 一、导入各种模块和数据库 # Load data and IP clusteringimport math import random import pandas as pd import numpy as np import argparse from sklearn import preprocessing from lib.utils import MaxMinScaler …

设计模式——外观模式(结构型)

引言 外观模式是一种结构型设计模式&#xff0c; 能为程序库、 框架或其他复杂类提供一个简单的接口。 ​ 问题 假设你必须在代码中使用某个复杂的库或框架中的众多对象。 正常情况下&#xff0c; 你需要负责所有对象的初始化工作、 管理其依赖关系并按正确的顺序执行方法等。…

C#动态生成带参数的小程序二维码

应用场景 在微信小程序管理后台&#xff0c;我们可以生成下载标准的小程序二维码&#xff0c;提供主程序入口功能。在实际应用开发中&#xff0c;小程序二维码是可以携带参数的&#xff0c;可以动态进行生成&#xff0c;如如下场景&#xff1a; 1、不同参数决定的显示界面不同…

MQTT中的保留消息(Retained Message)

一条保留消息是MQTT中保留标志设置为true的一条普通消息。代理&#xff08;broker&#xff09;为对应的主题保留最后的保留消息及对应的QoS。每一个订阅了该主题的客户端在订阅之后会马上收到这个保留消息。代理&#xff08;broker&#xff09;为每个主题只存储一条保留消息。本…

Docker本地镜像发布到阿里云或私有库

本地镜像发布到阿里云流程 &#xff1a; 1.自己生成个要传的镜像 2.将本地镜像推送到阿里云: 阿里云开发者平台:开放云原生应用-云原生&#xff08;Cloud Native&#xff09;-云原生介绍 - 阿里云 2.1.创建仓库镜像&#xff1a; 2.1.1 选择控制台&#xff0c;进入容器镜像服…

MQTT的奇妙之旅:探索RabbitMQ Web MQTT插件的威力【RabbitMQ 十一】

欢迎来到我的博客&#xff0c;代码的世界里&#xff0c;每一行都是一个故事 MQTT的奇妙之旅&#xff1a;探索RabbitMQ Web MQTT插件的威力 前言第一&#xff1a;揭秘RabbitMQ Web MQTT插件背景和目的&#xff1a;MQTT 协议简介&#xff1a;WebSockets 和 MQTT 的融合&#xff1…

谣言检测常用数据集汇总

Pheme-R 获取地址&#xff1a;https://figshare.com/articles/dataset/PHEME_rumour_scheme_dataset_journalism_use_case/2068650 PHEME社交媒体谣言数据集:这些谣言与9条不同的突发新闻有关。它是为分析社交媒体谣言而创建的&#xff0c;并包含由谣言推文发起的推特对话;这些…

竞赛保研 python区块链实现 - proof of work工作量证明共识算法

文章目录 0 前言1 区块链基础1.1 比特币内部结构1.2 实现的区块链数据结构1.3 注意点1.4 区块链的核心-工作量证明算法1.4.1 拜占庭将军问题1.4.2 解决办法1.4.3 代码实现 2 快速实现一个区块链2.1 什么是区块链2.2 一个完整的快包含什么2.3 什么是挖矿2.4 工作量证明算法&…

flink安装

什么是flink flink是一个分布式&#xff0c;高性能&#xff0c;随时可用的以及准确的流处理计算框架&#xff0c; flink可以对无界数据&#xff08;流处理&#xff09;和有界数据&#xff08;批处理&#xff09;进行有状态计算&#xff08;flink天生支持状态计算&#xff09;…