零基础怎么快速进行单细胞分析?

近一段时间正在努力学习单细胞相关的理论知识,发现单细胞测序和普通的真核细胞的转录组非常相似。两者之间的最大的区别在于,一个测的是单个细胞的表达,一个测的是一堆细胞的表达之和。所以从这里就可以理解,为什么网上很多教程都在说,单细胞数据是一个巨大的稀疏矩阵。假设,一个样本可以捕获一万个细胞,这时候单细胞的矩阵大小为:2w个基因*样本数*1万个细胞,而转录组数据的大小:2w个基因*样本数。两个矩阵相差了一万倍,巨大一词就是从此处而来。

我们要理解不是所有的细胞都要表达2w个基因,细胞在机体内有各自的分工,所以有的细胞可能就只表达了几百个基因,有的是几十个,有的是几千个,所以单细胞数据中会存在大量的零,这种数据又被称为稀疏矩阵。

那我们怎么做单细胞分析呢?

目前生信豆芽菜提供了两版单细胞分析工具

老版:http://www.sxdyc.com/singleCellTool

为了更加简单方便的使用单细胞分析,又推出了新版工具,新版本更加契合零基础的用户。首先,我们大致了解单细胞基本分析包括哪些?

数据读取,质控,过滤,去批次,亚群聚类,marker基因的筛选,特征基因的表达,新增注释信息

基本分析基本已经满足了常规的套路文章3分加点单细胞验证的水平,比如说之前我们上线零代码复现2,基于某一个特征基因集建模分型,最后筛选到关键的基因,这时候,我们可以使用单细胞的基础分析工具盒进行简单的验证。

首先进入生信豆芽菜官网(http://www.sxdyc.com/index)

目前只上线了一个基础分析的版本,后续会对其他分析陆续进行上线

接下来,我们看看怎么进行单细胞的基础分析

第一步:细胞读入+质控

这里有三种格式的数据选择,记得先下载示例数据看一下再开始进行分析

这三个压缩包都是,都是可以直接使用的数据。

这里我们以10x的数据为例,10x的标准数据一个样本一个文件夹,每一个文件夹包含了三个文件

然后全选这三个文件夹,压缩为zip,上传即可。

提交后,输入任务队列名

运行成功后,下载文件

第一个相关性越大越好,后面两个相关的越小越好

通过小提琴图展示形式,选择第二步细胞过滤的阈值。

第二步:细胞的过滤

这里根据第一步生成的vlnPlot.befor.pdf,输入筛选的阈值,这里的UMI就是图中的ncount,基因数量为nfeature,线粒体的百分比含量为percent.mt。

如这里UMI的默认写了100,50000则默认为100<UMI<50000。双向的选择也是为了剔除细胞碎片和双细胞,那么选多少合适呢?选多少都可以,没有固定的标准。

提交等待运行成功就可以了

第三步:去批次

在第二步中,通过TSNE/UMAP的图,查看样本细胞的分布,如果不同样本之间泾渭分明,差别很大,则选择去批次的方法,如果各个样本之间相互杂糅你中有我,我中有你,可以选择不去批次,这时候直接选择none即可。

这两个图即是去批次后的tsne/UMAP图。

第四步:亚群聚类

输入分辨率,输入的数值越大,分的亚群越多,默认输入0.1的分辨率

细胞的一个分组信息

第五步:特征基因表达的气泡图(该步骤可以运行也可以不运行)

该步骤设计的主要有两个

1、做亚群手动注释,需要我们提前查找文献筛选细胞marker基因。

2、查找某一个特定的功能集中的基因的表达情况

这里我随便找了几个基因进行绘图

这里的基因表达颜色是从低到高,不管选几个颜色都是可以的

第六步:新增注释信息

这里默认会对meta的信息进行整理,先导入数据

根据需求新增注释信息,每选择一次需要提交,可以提交多次,如果是亚群注释的信息,列名需要改为cell_type

第七步:marker基因的筛选

如果在第六步进行亚群注释,新增了一列cell_type,即可针对注释后的亚群进行marker基因的筛选,如果没有进行亚群注释,只能选择注释前,也就是聚类(seurat_clusters)进行marker基因的筛选

到这一步,基础分析就做完了,操作简单,调理清晰,是不是有眼前一亮的感觉,也许这就是真正在用心做的平台吧,会想要关心用户的使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/9789.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【c++算法篇】双指针(下)

&#x1f525;个人主页&#xff1a;Quitecoder &#x1f525;专栏&#xff1a;算法笔记仓 朋友们大家好啊&#xff0c;本篇文章我们来到算法的双指针的第二部分 目录 1.有效三角形的个数2.查找总价格为目标值的两个商品3.三数之和4.四数之和5.双指针常见场景总结 1.有效三角形…

解决 SyntaxError: Unexpected token ‘.‘ 报错问题

这个报错一般是编译问题&#xff0c;浏览器的版本过低没通过代码 解决办法&#xff1a; 在package.json文件中加上这个 "browserslist": ["> 1%","last 2 versions","not dead","not ie < 6","Android > 4&…

98、技巧-颜色分类

思路 这道题的思路是什么&#xff0c;首先典型荷兰国旗问题&#xff1a; 该问题的关键在于我们要将所有的0放到数组的前部&#xff0c;所有的1放在中间&#xff0c;所有的2放在后部。这可以通过使用两个指针&#xff0c;一个指向数组开头的“0”的最后一个位置&#xff0c;另…

如何确保UDP文件传输工具有最低稳定的传输速度?

在当前日新月异的数字时代背景下&#xff0c;文件传输工具已经成为我们日常生活与工作中不可或缺的一部分&#xff0c;尤其针对那些频繁涉及即时数据交互与多媒体流通的场景。 UDP协议&#xff0c;以其突出的高速传输与低延迟特性&#xff0c;脱颖而出成为众多用户的首选。不过…

Python管理PVE(Proxmox VE)云平台--节点资源统计

一、前言 写本脚本的初衷是因手动查看统计已分配的PVE资源过于耗时&#xff0c;因此写一个脚本一劳永逸&#xff0c;具体实现方法&#xff1a;利用Python的paramiko模块进行远程命令查看、统计PVE平台各节点已分配的cpu、内存、磁盘空间。 二、步骤 1.构建shell脚本 1.1 统计…

Ubuntu系统下编译OpenCV4.8源码

OpenCV4.8源码编译与安装 其实很简单&#xff0c;只要三步即可搞定&#xff0c;第一步是下载指定版本的源码包&#xff1b;第二步是安装OpenCV4.8编译需要的编译器与第三方库支持&#xff1b;第三步就是编译OpenCV源码包生成安装文件并安装。 01下载OpenCV4.8源码包 在Ubunt…

解锁楼宇自动化新维度西门子Insight+BACnet IP I/O控制器

数字城市的楼宇自动化已不再是一个遥不可及的概念&#xff0c;而是成为了现代建筑的标配。特别是在大型商业综合体、高端写字楼和公共设施中&#xff0c;高效的楼宇管理系统是确保环境舒适度与能源效率的关键。当提及楼宇自动化领域的佼佼者&#xff0c;西门子Insight楼宇自动化…

KMeans,KNN,Mean-shift算法的学习

1.KMeans算法是什么&#xff1f; 在没有标准标签的情况下&#xff0c;以空间的k个节点为中心进行聚类&#xff0c;对最靠近他们的对象进行归类。 2.KMeans公式&#xff1a; 2. 1.关键分为三个部分&#xff1a; 1.一开始会定义n个中心点&#xff0c;然后计算各数据点与中心点…

jenkins使用gitLab(极狐)认证登陆

jenkins安装 GitLab Authentication插件 我因为java版本和最新GitLab Authentication 1.19版本不兼容&#xff0c;选择了本地安装 找个历史版本1.13版本&#xff0c;然后下载到电脑上 - 本地上传插件并安装 在极狐上创建一个应用 - 配置应用信息 应用名&#xff1a;jenkinsLo…

你以为是个黄金程序员,结果是个王者

玩过王者荣耀的同学都知道&#xff0c;从青铜到王者&#xff0c;过程中需要步步修炼&#xff0c;可以说等级的提升是胜利的积累&#xff0c;也可以说是技术的提升。 而程序员行业也是这样&#xff0c;技术越高段位越高&#xff0c;当然段位越高技术也越高&#xff0c;这个行业大…

Oracle -在线回缩表

conn scott/tiger DROP TABLE EMP1 PURGE; CREATE TABLE EMP1 AS SELECT * FROM EMP; alter table emp1 enable row movement; -- 启动回缩特性 insert into emp1 select * from emp1; / / commit; -- 增加到14000行 -- 分析表的结构 analyze table emp1 comput…

小程序如何确定会员身份并批量设置会员积分或余额

因为一些原因&#xff0c;商家需要从其它系统里面批量导入会员&#xff0c;确定会员身份&#xff0c;然后给他们设置对应的账户余额。下面&#xff0c;就具体介绍如何进行这种操作。 一、客户进入小程序并绑定手机号 进入小程序&#xff1a;客户打开小程序&#xff0c;系统会自…

交友软件源码-源码+搭建+售后,上线即可运营聊天交友源码 专业语聊交友app开发+源码搭建-快速上线

交友小程序源码是一种可以帮助开发者快速搭建交友类小程序的代码模板。它通常包括用户注册、登录、个人信息编辑、匹配推荐、好友聊天等常见功能&#xff0c;以及与后台数据交互的接口。使用这种源码可以极大地缩短开发时间&#xff0c;同时也可以根据自己的需求进行二次开发和…

从0到1开发一个vue3+ts项目(一)

1. 环境配置 1.1 安装node 使用官方安装程序 前往 Node.js 官网&#xff1a;访问 Node.js 官网&#xff0c;下载适合你操作系统的安装程序。运行安装程序&#xff1a;下载完成后&#xff0c;双击安装程序并按照提示进行安装。验证安装&#xff1a;安装完成后&#xff0c;在终…

C++对象的拷贝构造函数

如果一个构造函数的第一个参数是类本身的引用,且没有其它参数(或者其它的参数都有默认值),则该构造函数为拷贝构造函数。 拷贝(复制)构造函数:利用同类对象构造一个新的对象 ●1.函数名和类同名 (构造函数) ●2.没有返回值 (构造函数) ●3.第一个参数必…

软考中级-软件设计师(九)数据库技术基础 考点最精简

一、基本概念 1.1数据库与数据库系统 数据&#xff1a;是数据库中存储的基本对象&#xff0c;是描述事物的符号记录 数据库&#xff08;DataBase&#xff0c;DB&#xff09;&#xff1a;是长期存储在计算机内、有组织、可共享的大量数据集合 数据库系统&#xff08;DataBas…

【C++】模拟实现string

文章目录 前言成员变量成员函数构造函数拷贝构造函数浅拷贝深拷贝拷贝构造函数实现 析构函数赋值重载 空间管理函数元素访问元素修改字符串运算流提取 & 流插入流提取流插入 迭代器begin & endrbegin & rend 总结 前言 模拟实现不是为了写得和库里面一样好。而是为…

OmniReader Pro mac激活版:智慧阅读新选择,开启高效学习之旅

在追求知识的道路上&#xff0c;一款优秀的阅读工具是不可或缺的。OmniReader Pro作为智慧阅读的新选择&#xff0c;以其独特的功能和卓越的性能&#xff0c;为您开启高效学习之旅。 OmniReader Pro具备高效的文本识别和处理技术&#xff0c;能够快速准确地提取文档中的关键信息…

《QT实用小工具·五十四》果冻弹出效果的动画按钮

1、概述 源码放在文章末尾 该项目实现动画按钮&#xff0c;鼠标放在按钮上可以弹性拉出的三个按钮&#xff0c;使用贝塞尔曲线实现&#xff0c;项目demo显示如下所示&#xff1a; 项目部分代码如下所示&#xff1a; #ifndef WATERCIRCLEBUTTON_H #define WATERCIRCLEBUTTON…

Day 43 1049. 最后一块石头的重量 II 494. 目标和 474.一和零

最后一块石头重量Ⅱ 有一堆石头&#xff0c;每块石头的重量都是正整数。 每一回合&#xff0c;从中选出任意两块石头&#xff0c;然后将它们一起粉碎。假设石头的重量分别为 x 和 y&#xff0c;且 x < y。那么粉碎的可能结果如下&#xff1a; 如果 x y&#xff0c;那么两…