单细胞RNA测序(scRNA-seq)基础知识可查看以下文章:
单细胞RNA测序(scRNA-seq)工作流程入门
单细胞RNA测序(scRNA-seq)细胞分离与扩增
单细胞RNA测序(scRNA-seq)SRA数据下载及fastq-dumq数据拆分
单细胞RNA测序(scRNA-seq)Cellranger流程入门和数据质控
细胞定量是scRNA-seq重要的分析步骤,主要是进行细胞与基因的定量, cell ranger将比对、质控、定量都封装了起来,使用起来也相当便捷。
1. 参考基因组和注释文件准备
1.1 参考基因组、注释下载和参考基因组索引构建
参考基因组、注释下载注释和参考基因组索引参考以下文章:
单细胞RNA测序(scRNA-seq)构建人类参考基因组注释
构建完成后,GRCh38( cellranger mkref --genome 参数内容为指定输出文件夹)目录会出现以下内容。
# genes中gtf文件为.gz格式则解压
gzip -d genes.gtf.gz
# 查看genes/genes.gtf信息
grep -v '^#' genes.gtf |less -S
1.2 注释基因信息更新
- 在fasta/genome.fa的fasta文件基础上增加序列信息;
- 在genes/genes.gtf的gtf文件基础上增加注释信息(根据GTF文件格式);
- 重新执行运行cellranger mkref流程
2 cellranger count细胞定量
2.1 测序数据fastq文件命名说明
# 一般命名方式
[Sample Name]_S1_L00[Lane Number]_[Read Type]_001.fastq.gz# 其中Read Type有以下三种:
# I1: Sample index read (optional)
# R1: Read 1
# R2: Read 2# 查看rawdata目录下fastq.gz文件
ls -lh rawdata