零基础怎么快速进行单细胞分析?

近一段时间正在努力学习单细胞相关的理论知识,发现单细胞测序和普通的真核细胞的转录组非常相似。两者之间的最大的区别在于,一个测的是单个细胞的表达,一个测的是一堆细胞的表达之和。所以从这里就可以理解,为什么网上很多教程都在说,单细胞数据是一个巨大的稀疏矩阵。假设,一个样本可以捕获一万个细胞,这时候单细胞的矩阵大小为:2w个基因*样本数*1万个细胞,而转录组数据的大小:2w个基因*样本数。两个矩阵相差了一万倍,巨大一词就是从此处而来。

我们要理解不是所有的细胞都要表达2w个基因,细胞在机体内有各自的分工,所以有的细胞可能就只表达了几百个基因,有的是几十个,有的是几千个,所以单细胞数据中会存在大量的零,这种数据又被称为稀疏矩阵。

那我们怎么做单细胞分析呢?

目前生信豆芽菜提供了两版单细胞分析工具

老版:http://www.sxdyc.com/singleCellTool

为了更加简单方便的使用单细胞分析,又推出了新版工具,新版本更加契合零基础的用户。首先,我们大致了解单细胞基本分析包括哪些?

数据读取,质控,过滤,去批次,亚群聚类,marker基因的筛选,特征基因的表达,新增注释信息

基本分析基本已经满足了常规的套路文章3分加点单细胞验证的水平,比如说之前我们上线零代码复现2,基于某一个特征基因集建模分型,最后筛选到关键的基因,这时候,我们可以使用单细胞的基础分析工具盒进行简单的验证。

首先进入生信豆芽菜官网(http://www.sxdyc.com/index)

目前只上线了一个基础分析的版本,后续会对其他分析陆续进行上线

接下来,我们看看怎么进行单细胞的基础分析

第一步:细胞读入+质控

这里有三种格式的数据选择,记得先下载示例数据看一下再开始进行分析

这三个压缩包都是,都是可以直接使用的数据。

这里我们以10x的数据为例,10x的标准数据一个样本一个文件夹,每一个文件夹包含了三个文件

然后全选这三个文件夹,压缩为zip,上传即可。

提交后,输入任务队列名

运行成功后,下载文件

第一个相关性越大越好,后面两个相关的越小越好

通过小提琴图展示形式,选择第二步细胞过滤的阈值。

第二步:细胞的过滤

这里根据第一步生成的vlnPlot.befor.pdf,输入筛选的阈值,这里的UMI就是图中的ncount,基因数量为nfeature,线粒体的百分比含量为percent.mt。

如这里UMI的默认写了100,50000则默认为100<UMI<50000。双向的选择也是为了剔除细胞碎片和双细胞,那么选多少合适呢?选多少都可以,没有固定的标准。

提交等待运行成功就可以了

第三步:去批次

在第二步中,通过TSNE/UMAP的图,查看样本细胞的分布,如果不同样本之间泾渭分明,差别很大,则选择去批次的方法,如果各个样本之间相互杂糅你中有我,我中有你,可以选择不去批次,这时候直接选择none即可。

这两个图即是去批次后的tsne/UMAP图。

第四步:亚群聚类

输入分辨率,输入的数值越大,分的亚群越多,默认输入0.1的分辨率

细胞的一个分组信息

第五步:特征基因表达的气泡图(该步骤可以运行也可以不运行)

该步骤设计的主要有两个

1、做亚群手动注释,需要我们提前查找文献筛选细胞marker基因。

2、查找某一个特定的功能集中的基因的表达情况

这里我随便找了几个基因进行绘图

这里的基因表达颜色是从低到高,不管选几个颜色都是可以的

第六步:新增注释信息

这里默认会对meta的信息进行整理,先导入数据

根据需求新增注释信息,每选择一次需要提交,可以提交多次,如果是亚群注释的信息,列名需要改为cell_type

第七步:marker基因的筛选

如果在第六步进行亚群注释,新增了一列cell_type,即可针对注释后的亚群进行marker基因的筛选,如果没有进行亚群注释,只能选择注释前,也就是聚类(seurat_clusters)进行marker基因的筛选

到这一步,基础分析就做完了,操作简单,调理清晰,是不是有眼前一亮的感觉,也许这就是真正在用心做的平台吧,会想要关心用户的使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/9789.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GOOGLE翻译V3版

V3&#xff08;高级版&#xff09; # Imports the Google Cloud Translation library from google.cloud import translate # Initialize Translation client def translate_text( text: str "YOUR_TEXT_TO_TRANSLATE", project_id: str "YOUR_PROJECT_…

【c++算法篇】双指针(下)

&#x1f525;个人主页&#xff1a;Quitecoder &#x1f525;专栏&#xff1a;算法笔记仓 朋友们大家好啊&#xff0c;本篇文章我们来到算法的双指针的第二部分 目录 1.有效三角形的个数2.查找总价格为目标值的两个商品3.三数之和4.四数之和5.双指针常见场景总结 1.有效三角形…

解决 SyntaxError: Unexpected token ‘.‘ 报错问题

这个报错一般是编译问题&#xff0c;浏览器的版本过低没通过代码 解决办法&#xff1a; 在package.json文件中加上这个 "browserslist": ["> 1%","last 2 versions","not dead","not ie < 6","Android > 4&…

98、技巧-颜色分类

思路 这道题的思路是什么&#xff0c;首先典型荷兰国旗问题&#xff1a; 该问题的关键在于我们要将所有的0放到数组的前部&#xff0c;所有的1放在中间&#xff0c;所有的2放在后部。这可以通过使用两个指针&#xff0c;一个指向数组开头的“0”的最后一个位置&#xff0c;另…

【CV】计算机视觉中的特征追踪与背景处理

计算机视觉领域中的重要任务之一是视频特征追踪&#xff0c;它可以用于目标跟踪、运动分析、行为识别等应用。然而&#xff0c;在实际应用中&#xff0c;经常会遇到需要仅处理视频中特定特征物体而忽略背景的情况&#xff0c;这就需要进行背景处理。本文将介绍如何使用Python和…

Linux子进程通过“信号”终止父进程

背景指示&#xff1a;守护进程守护进程_amdaemon-CSDN博客 一种方法是通过kill命令发送特定的信号给父进程。如果子进程在其终止处理程序&#xff08;atexit或sigterm处理程序&#xff09;中调用kill命令&#xff0c;并且指定父进程的进程ID&#xff0c;那么父进程就可以被终止…

如何确保UDP文件传输工具有最低稳定的传输速度?

在当前日新月异的数字时代背景下&#xff0c;文件传输工具已经成为我们日常生活与工作中不可或缺的一部分&#xff0c;尤其针对那些频繁涉及即时数据交互与多媒体流通的场景。 UDP协议&#xff0c;以其突出的高速传输与低延迟特性&#xff0c;脱颖而出成为众多用户的首选。不过…

Python管理PVE(Proxmox VE)云平台--节点资源统计

一、前言 写本脚本的初衷是因手动查看统计已分配的PVE资源过于耗时&#xff0c;因此写一个脚本一劳永逸&#xff0c;具体实现方法&#xff1a;利用Python的paramiko模块进行远程命令查看、统计PVE平台各节点已分配的cpu、内存、磁盘空间。 二、步骤 1.构建shell脚本 1.1 统计…

Ubuntu系统下编译OpenCV4.8源码

OpenCV4.8源码编译与安装 其实很简单&#xff0c;只要三步即可搞定&#xff0c;第一步是下载指定版本的源码包&#xff1b;第二步是安装OpenCV4.8编译需要的编译器与第三方库支持&#xff1b;第三步就是编译OpenCV源码包生成安装文件并安装。 01下载OpenCV4.8源码包 在Ubunt…

解锁楼宇自动化新维度西门子Insight+BACnet IP I/O控制器

数字城市的楼宇自动化已不再是一个遥不可及的概念&#xff0c;而是成为了现代建筑的标配。特别是在大型商业综合体、高端写字楼和公共设施中&#xff0c;高效的楼宇管理系统是确保环境舒适度与能源效率的关键。当提及楼宇自动化领域的佼佼者&#xff0c;西门子Insight楼宇自动化…

KMeans,KNN,Mean-shift算法的学习

1.KMeans算法是什么&#xff1f; 在没有标准标签的情况下&#xff0c;以空间的k个节点为中心进行聚类&#xff0c;对最靠近他们的对象进行归类。 2.KMeans公式&#xff1a; 2. 1.关键分为三个部分&#xff1a; 1.一开始会定义n个中心点&#xff0c;然后计算各数据点与中心点…

jenkins使用gitLab(极狐)认证登陆

jenkins安装 GitLab Authentication插件 我因为java版本和最新GitLab Authentication 1.19版本不兼容&#xff0c;选择了本地安装 找个历史版本1.13版本&#xff0c;然后下载到电脑上 - 本地上传插件并安装 在极狐上创建一个应用 - 配置应用信息 应用名&#xff1a;jenkinsLo…

设计模式学习笔记 - 回顾总结:如何将设计思想、原则、模式等理论知识应用到项目中?

概述 上篇文章&#xff0c;我们第整个专栏的理论知识点做了串讲&#xff0c;不知道你掌握的如何&#xff1f;对于上节课总结的重点内容&#xff0c;希望你能多花点时间搞透彻&#xff0c;对于一些不那么重要的内容&#xff0c;你可以把它们当做资料&#xff0c;用到的时候随手…

你以为是个黄金程序员,结果是个王者

玩过王者荣耀的同学都知道&#xff0c;从青铜到王者&#xff0c;过程中需要步步修炼&#xff0c;可以说等级的提升是胜利的积累&#xff0c;也可以说是技术的提升。 而程序员行业也是这样&#xff0c;技术越高段位越高&#xff0c;当然段位越高技术也越高&#xff0c;这个行业大…

[力扣题解]37. 解数独

题目&#xff1a;37. 解数独 思路 回溯法 代码 class Solution { public:bool function(vector<vector<char>>& board){int i, j;char k;for(i 0; i < 9; i){for(j 0; j < 9; j){// 为空if(board[i][j] .){for(k 1; k < 9; k){if(right(board…

Oracle -在线回缩表

conn scott/tiger DROP TABLE EMP1 PURGE; CREATE TABLE EMP1 AS SELECT * FROM EMP; alter table emp1 enable row movement; -- 启动回缩特性 insert into emp1 select * from emp1; / / commit; -- 增加到14000行 -- 分析表的结构 analyze table emp1 comput…

小程序如何确定会员身份并批量设置会员积分或余额

因为一些原因&#xff0c;商家需要从其它系统里面批量导入会员&#xff0c;确定会员身份&#xff0c;然后给他们设置对应的账户余额。下面&#xff0c;就具体介绍如何进行这种操作。 一、客户进入小程序并绑定手机号 进入小程序&#xff1a;客户打开小程序&#xff0c;系统会自…

赶紧收藏!2024 年最常见 100道 Java 基础面试题(四十)

上一篇地址&#xff1a;赶紧收藏&#xff01;2024 年最常见 100道 Java 基础面试题&#xff08;三十九&#xff09;-CSDN博客 七十九、forward和redirect的区别&#xff1f; 在Java Web应用程序中&#xff0c;forward和redirect是两种不同的服务器端重定向机制&#xff0c;它…

【leetcode】栈题目总结

普通栈 先进后出的特点 ​​​​​​20. 有效的括号 class Solution { public:unordered_map<char, char> mp {{), (},{], [},{}, {}};bool isValid(string s) {stack<char> st;for (char c : s) {if (c ( || c [ || c {) {st.push(c);} else {if (!st.empty…

between函数为导致索引失效吗?

当BETWEEN函数用于WHERE条件时&#xff0c;索引可能会失效的情况是当被比较的列&#xff08;例如日期或数字列&#xff09;上存在索引&#xff0c;但是BETWEEN的范围涵盖了索引中的大部分数据。这会导致MySQL优化器放弃使用索引而选择全表扫描&#xff0c;因为对于优化器来说&a…