rsem比对_RSEM方法比对和表达量计算

分析模块,封装了Trinity程序包中的“align_and_estimate_abundance.pl”脚本,进行原始数据与转录本序列的比对和表达量计算。其中,核心程序为,Bowtie或Bowtie2进行原始数据与转录本序列的比对,RSEM根据比对结果进行表达量的计算。核心程序相关参数为,Bowtie:'--all --best --strata -m 300 --chunkmbs 512'。Bowtie2:'--no-mixed --no-discordant --gbar 1000 --end-to-end'。RSEM:默认参数。

分析模块,输入构建好索引的转录本参考文件(由分析模块“Build Transcript Reference Index”生成),以及转录组测序原始数据(fastq文件)。这里,推荐测序原始数据,先通过分析模块“Trimmomatic PE/SE”进行去接头污染和质量控制。

分析模块,将转录组测序原始数据(fastq文件数据)比对回转录本参考序列,生成bam格式的比对结果文件,转录本水平表达结果文件,基因水平表达结果文件。

注:bam文件,可以利用IGV软件打开,查看比对结果。

IGV安装和使用,包含Windows桌面版和iPad版,官方网站提供了详细的文档。参考网站:(http://www.broadinstitute.org/igv/)。

输入测序数据分两种模式(SE/PE):

选择Paire-End时,分析模块处理双末端测序数据,需提供2个fastq原始数据文件,分别对应左端和右端测序结果。

选择Single-Single时,分析模块处理单末端测序数据,需提供1个fastq原始数据文件。

输入:

1、构建好索引的转录本参考文件,由分析模块“Build Transcript Reference Index”生成。

2、fastq格式的测序原始数据文件。

示例:

@ecoli_section_9642_10205_3:0:0_1:0:0_0/1

CCCGCCATCTCTTGCAGAAGCGCCTGTTGCTGTACATGGTGCATTCGCATCCCCATCCCTACGCGGCTTC

+

2222222222222222222222222222222222222222222222222222222222222222222222

如果,转录组是链特异性建库测序,则需要设置链特异性文库类型。

PE测序,FR表明paired-reads与转录本一致,RF表明paired-reads与转录本反向互补链一致。

SE测序,F表明read与转录本对应,R表明read对应转录本反向互补链。

输出:

1、bam格式的比对结果文件。

关于Bowtie输出的BAM/SAM格式介绍,参考:(http://bowtie-bio.sourceforge.net/manual.shtml#sam-bowtie-output)。

关于Bowti2输出的BAM/SAM格式介绍,参考:(http://bowtie-bio.sourceforge.net/bowtie2/manual.shtml#sam-output)。

2、RSEM转录本水平表达结果文件。

其中,每一列的含义如下所示:

ltranscript_id,transcript name of this transcript.

lgene_id,gene name of the gene which this transcript belongs to.

llength,this transcript's sequence length.

leffective_length,counts only the positions that can generate a valid fragment.

lexpected_count,the sum of the posterior probability of each read comes from this transcript over all reads.

lTPM,Transcripts Per Million. It is a relative measure of transcript abundance. The sum of all transcripts' TPM is 1 million.

lFPKM,Fragments Per Kilobase of transcript per Million mapped reads.

lIsoPct,It is the percentage of this transcript's abandunce over its parent gene's abandunce. If it’s parent gene has only one isoform, this field will be set to 100.

3、RSEM基因水平表达结果文件。

其中,一些列的含义如下所示:

lgene_id,gene name of the gene

ltranscript_id(s),a comma-separated list of transcript_ids belonging to this gene.

lLength,weighted average of its transcripts' lengths (weighted by 'IsoPct').

leffective_length,weighted average of its transcripts' effective lengths (weighted by 'IsoPct').

lexpected_count、TPM、FPKM,为对应基因包含的所有转录本的数值求和。

后续的下游分析,如,差异表达分析、热图、PCA等。通常情况下,基于expected_count和FPKM的数值进行分析,即基因原始片段数估算结果和FPKM数值估计结果。

分析模块引用了Trinity v2.0.6程序包中的“align_and_estimate_abundance.pl”脚本(https://github.com/trinityrnaseq/trinityrnaseq/wiki)。

分析模块引用了Bowtie-0.12.7软件(http://bowtie-bio.sourceforge.net/index.shtml)。

分析模块引用了Bowtie2-2.1.0软件(http://bowtie-bio.sourceforge.net/bowtie2/index.shtml)。

分析模块引用了RSEM-1.2.26软件(http://deweylab.github.io/RSEM/)。

相关文献如下所示:

Haas BJ, Papanicolaou A, Yassour M, Grabherr M, Blood PD, Bowden J, Couger MB, Eccles D, Li B, Lieber M, Macmanes MD, Ott M, Orvis J, Pochet N, Strozzi F, Weeks N, Westerman R, William T, Dewey CN, Henschel R, Leduc RD, Friedman N, Regev A. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nat Protoc. 2013 Aug;8(8):1494-512. Open Access in PMC doi: 10.1038/nprot.2013.084. Epub 2013 Jul 11. PubMed PMID: 23845962.

Langmead B, Trapnell C, Pop M, Salzberg SL. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol 10:R25.

Langmead B, Salzberg S. Fast gapped-read alignment with Bowtie 2. Nature Methods. 2012, 9:357-359.

Bo Li and Colin N Dewey. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics201112:323.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/537067.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java sleep和wait区别

为什么80%的码农都做不了架构师?>>> 关于sleep和wait区别解析: sleep只是释放CPU资源,并不释放资源锁对象,wait是会释放掉资源锁对象。 比如,有个锁对象object,线程1和线程2都会锁住object对象…

u8转完看不到菜单_web网页有错误,无法看到操作菜单-用友U8

文章摘要:本文提供在用友U8V8.51erp软件财务会计管理的WEB财务模块中客户在使用WEB功能时,没有使用默认的设置,是将WEB功能设置在自己的网站上面,访问WEB功能没有问题,界面出来了,输入用户名、密码、选择帐…

.Net Core 项目引用本地类库方式(二)

上篇文章有详细的介绍.Net Core 项目中引用本地类库通过打包,然后Nugety引用方式,这里再介绍一种引用包的方式 转载于:https://www.cnblogs.com/wangshitou/p/10283800.html

深入理解equals和hashCode关系和区别

深入理解equals和hashCode关系和区别直入主题:区别:1.他们判断对象相同的方式不一样:2.他们判断对象是否相等的准确率不一样:改写equals时总是要改写hashcode分享一波:程序员赚外快-必看的巅峰干货为什么要说equals和hashCode这两…

lol韩服游戏内设置_韩服LOL进去了还不能玩?教你如何玩韩服!

领取免费韩服LOL安全号,百度搜索韩服LOL微博关注即可!上图错误为常识性错误,LOL韩服游戏的安装文件路径有中文所导致的错误 解决方法:将安装路径里的中文改成英文即可 举例 包含中文汉字的文件夹都是错误的 Program FilesLOL韩服 …

Jdk 和 jre 的 关系和区别

Jdk 和 jre 的 关系和区别 区别: JDK:是Java Development Kit 的简称–>翻译过来就是:Java 开发工具包。是程序员使用java语言编写java程序所需的开发工具包,是提供给程序员使用的。 JRE:是Java Runtime Environm…

OpenCV-Python入门教程7-PyQt编写GUI界面

前面一直都是使用命令行运行代码,不够人性化。这篇用Python编写一个GUI界面,使用PyQt5编写图像处理程序。包括:打开、关闭摄像头,捕获图片,读取本地图片,灰度化和Otsu自动阈值分割的功能。 使用Qt Designer…

spark 广播变量大数据_大数据处理 | Spark集群搭建及基本使用

点击蓝字关注我前面用了一篇文章详细的介绍了集群HDFS文件系统的搭建,HDFS文件系统只是一个用于存储数据的系统,它主要是用来服务于大数据计算框架,例如MapReduce、Spark,本文就接着上一篇文章来详细介绍一下Spark集群的搭建及Spa…

如何将本地项目上传到gitee

*************************************优雅的分割线 ********************************** 分享一波:程序员赚外快-必看的巅峰干货 如果以上内容对你觉得有用,并想获取更多的赚钱方式和免费的技术教程 请关注微信公众号:HB荷包 一个能让你学习技术和赚钱方法的公众号,持续更…

oracle dg 备库未设置convert参数导致ORA-01111,ORA-01110

2019独角兽企业重金招聘Python工程师标准>>> 查看trace 文件: MRP0: Background Managed Standby Recovery process started (amls) started logmerger process Sun Jan 20 07:55:53 2019 Managed Standby Recovery starting Real Time Apply MRP0: Back…

git回退历史版本无法上传_Git系列教程(二):版本库中添加文件、版本回退

Git系列教程(一):简介、安装、配置我们学习了分布式和版本控制系统的概念、Git具有的8个功能以及如何在Windows上安装Git、进行相关配置并创建版本库。Git版本库中添加文件Git 的工作就是创建和保存你的项目的快照及与之后的快照进行对比。我们编写一个readme.txt文…

nginx反向代理配置如何去除前缀

使用nginx做反向代理的时候,可以简单的直接把请求原封不动的转发给下一个服务。设置proxy_pass请求只会替换域名,如果要根据不同的url后缀来访问不同的服务,则需要通过如下方法: 方法一:加"/"** server {l…

「作文素材详解」写作必知篇:语言优美不是作文第一要求

语言优美不是作文第一要求“教孩子写作文,老师家长应该先提升自己。”“语言优美不是作文的第一要求。”“如果教孩子写漂亮的违心话,会害了他一辈子。”日前,著名作家肖复兴来到体育东路小学,与广州的一线语文教师交流&#xff0…

华为安装gsm框架_华为nova5怎么下载安装谷歌服务助手,安装GMS框架教程

看到不少的华为nova5用户喜欢这个谷歌服务助手,也就是想安装这个GMS框架,可是一直不知道如何下载安装,这个谷歌服务框架是可以在系统软件里面可以删除的一个APK程序,但现在有很多的软件和游戏需要谷歌服务的支持,那咱们…

VMware安装虚拟机并使用NAT模式连接网络

*************************************优雅的分割线 ********************************** 分享一波:程序员赚外快-必看的巅峰干货 如果以上内容对你觉得有用,并想获取更多的赚钱方式和免费的技术教程 请关注微信公众号:HB荷包 一个能让你学习技术和赚钱方法的公众号,持续更…

PHPStudy下Apache SSL证书安装教程

一、安装SSL证书的环境 Apache安装目录:E:phpStudyPHPTutorialApache 以上为windows下测试SSL证书安装的目录,具体目录请根据自己的实际环境! 二、获取SSL证书 成功在沃通申请SSL证书后,会得到一个压缩包文件,解压后得到四个文件&…

laravel 集成采集_新版2020 Laravel采集网站程序

环境:php5.6数据库:mysql5.5集成环境软件:护卫神apache这套程序是520.ag 的网站很早的程序了是去年还是前年 应该是前年免费采集网站 但是经常挂 其实他网站挂和服务器没有多大关系 是程序没有作好优化这套程序可以大家做起来 自己用就可以了 放出去免费采集的话 网站容易死程…

详解模板方法设计模式

分享一波:程序员赚外快-必看的巅峰干货 概念 定义一个操作中的算法骨架,而将一些步骤延迟到子类中。模板方法使得子类可以不改变一个算法的结构即可重定义该算法的重复代码全部在父类里面,不同业务的,使用抽象方法,抽取给子类进…

怎么从已有文件中挑选需要的文字重新生成新文件_CAD问题全面解答(几乎涵盖了CAD使用的全部问题)...

1.【CTrlN无效时之解决办法】众所周知CTRLN是新建命令但有时候CTRLN则出现选择面板这时只需到OP选项里调下设置操作:OP(选项)------系统-------右侧有一个启动(A显示启动对话框B不显示启动对话框)选择A则新建命令有效,反则无效2.【Ctrl键无效之解决办法】…