louvain算法_单细胞聚类(四)图解Leiden算法对Louvain算法的优化

    Louvain算法是目前单细胞分析中最常用的聚类算法[1],Seurat/Scanpy/RaceID等单细胞分析工具都默认louvain算法。6天前HumanCell Atlas(HCA)团队发表在Nature Method上的单细胞分析流程中[2],默认的聚类算法是scran包的方法:细胞间权重基于排序计算(rank-based),聚类算法用Walktrap。这跟杰卡德距离+Louvain算法的方法截然不同。

       聚类算法孰优孰劣,此前已经有人做过比较。2016年Scientific Reports上有一篇文章比较了igraph包里的8种聚类算法,其中包括了Louvain和Walktrap[3]。测试结果的准确率Louvain和Walktrap相近。但是,当节点数(细胞数)大于6000时,Louvain的表现要优于Walktrap。

    总结评测结果,Louvain算法表现是最好的。但仍有不少文章选择其他聚类算法,因为louvain算法有以下几个缺点:

  1. 社区划分的精度有局限性[4];

  2. 分组内细胞分布密度的大小会影响亚群的鉴定[2];

  3. 被鉴定为同一个分群的细胞群内,存在两个没有连线的小分群[5]。

    Leiden算法主要针对上述的第3个缺点,对louvain算法进行优化[5]。

    Leiden算法的命名来源于荷兰莱顿大学(Leiden University)。该算法由莱顿大学的三位研究员开发,结果于今年3月份发表在Scientific Reports上。

93713fbb7a488985008b0852df758065.png

想了解louvain算法的聚类过程,可以回顾往期文章:

 单细胞聚类(二)社区划分与模块度

总结Leiden算法优化louvain的两个要点:

  1. 比louvain算法运行更快。

  2. 针对louvain聚类结果中出现一些分群内部存在断链的现象(连线没有把所有细胞串起来,存在明显亚群)进行优化,分群更加合理,可能得到更多亚群。

8cf6a649e857ba0aea46672c0d69ea1c.png

图解leiden算法的操作过程

我们可以把聚类过程当作体育课的一场游戏。

学生是细胞,在操场上站队(聚类)。

模块度是体育老师,检查学生站队是否合理。

连线(细胞间权重)表示学生之间有一定的关系,比如同班同学,身高一致等。

c91f4bf8bc1b86de4deef4dc605ea463.png

    经过学生的一阵骚动(初始划分聚类)之后,初始的队伍出来了,分成的三个队伍:

bbc62f88ff10f0373d084ed2d8a394f6.png

      这时体育老师出来,看了看整体队形(模块度给聚类结果打分),感觉还不行(模块度分数偏低),需要调整分组站队。

Leiden和louvain算法的调整策略不同(leiden优化的要点一):

  1. Louvain:让每个同学去另外两个队伍,每次换队伍都让体育老师评价一下;

  2. Leiden:只让每个同学去有连线的其他队伍,节省时间。

        当害羞同学980fd0f6a1c1dfef68eac56260810663.png从红队调整到绿队时,体育老师发现队形变好看了(模块度打分提高了)。因为红队身高整体比绿队高,害羞同学980fd0f6a1c1dfef68eac56260810663.png比较矮,适合绿队。害羞同学刚开始站在红队,是因为她跟红队是同班同学。

d9fa8820f6dc7aa0c4c866ab43862ac8.png

        但害羞同学980fd0f6a1c1dfef68eac56260810663.png离开红队之后,问题就来了。红队内部出现左右两个没有连线的小队:耶小队195143e1e82c980425f4b2d8cd1dfe0a.png和奸笑小队fe90155a96ae2d3750facf0a04f0ea91.png。Louvain算法没有检测这种内部断链的现象。尽管红队都是同班同学,但内部还是有身高的差异,耶小队195143e1e82c980425f4b2d8cd1dfe0a.png比奸笑小队fe90155a96ae2d3750facf0a04f0ea91.png普遍矮小。之前不高不矮的害羞同学980fd0f6a1c1dfef68eac56260810663.png在的时候,还能起到内部过渡的作用。当害羞同学980fd0f6a1c1dfef68eac56260810663.png离开之后,红队内部出现两极化。

5029ff4baf29ffdf58f3e8da4f7ec5f7.png

        幸亏体育老师提前备课,看了leiden算法,及时将红队分开。(leiden优化要点二)

    下课铃声响起,体育老师手握Leiden书,看着同学们完美的队形,露出了满意的微笑。

如果您对相关内容感兴趣,欢迎关注本公众号:“单细胞组学”。

如果您对内容满意,欢迎点击右下角 “在看”,让更多感兴趣的朋友看到!

感谢!

参考文献:

[1] Blondel,Vincent D., et al. "Fast unfolding of communities in large networks." Journal of statisticalmechanics: theory and experiment 2008.10 (2008): P10008.

[2] AmezquitaR A, Lun A T L, Becht E, et al. Orchestrating single-cell analysis withBioconductor[J]. Nature Methods, 2019: 1-9.

[3] YangZ, Algesheimer R, Tessone C J. A comparative analysis of community detectionalgorithms on artificial networks[J]. Scientific reports, 2016, 6: 30750.

[4] FortunatoS, Barthelemy M. Resolution limit in community detection[J]. Proceedings of thenational academy of sciences, 2007, 104(1): 36-41.

[5] Traag,Vincent A., Ludo Waltman, and Nees Jan van Eck. "From Louvain to Leiden:guaranteeing well-connected communities." Scientific reports 9 (2019).

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/244740.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java 动态绑定原理_详解Java动态绑定机制的内幕(图)

在Java方法调用的过程中,JVM是如何知道调用的是哪个类的方法源代码? 这里面到底有什么内幕呢? 这篇文章我们就将揭露JVM方法调用的静态(static binding) 和动态绑定机制(auto binding) 。静态绑定机制//被调用的类package hr.test;class Fath…

python重新加载模块_jupyter实现重新加载模块

最近几年,jupyter在全球数据科学领域,已经成为不可或缺的重要工具。在jupyter中用python写程序,若import了自己写的外部模块,如果这个外部模块有更新,再次执行import,jupyter是不会重新导入的。一般的做法是…

java连接access2013数据库_滴水穿石–Java连接Access数据库及其操作

1、配置数据源【控制面板】—>【管理工具】—>【数据源ODBC】点击添加选择Microsoft Access Driver填写数据源名(自定义,如test),并选择数据库(指定你的Access数据库文件),如下图红色箭头标注最后,点击确定数据源配置完成2、…

python抠透明图_python利用蒙版抠图(使用PIL.Image和cv2)输出透明背景图

因为最近在做深度学习抠图,正好要用到蒙版进行抠图,所以我将抠图代码进行了封装注释,可以直接使用。可能走了弯路,若有高见请一定提出!主要代码import cv2from PIL import Imageimport numpy as npclass UnsupportedFo…

java退出不报异常_如何优雅的处理异常(java)?

这篇文章应该可以解答你的疑问。Java中异常提供了一种识别及响应错误情况的一致性机制,有效地异常处理能使程序更加健壮、易于调试。异常之所以是一种强大的调试手段,在于其回答了以下三个问题:什么出了错?在哪出的错?为什么出错?在有效使…

无法复制winevt中的文件_u盘文件无法复制怎么解决 u盘文件无法复制解决方法【详细步骤】...

在使用u盘的过程中有时会出现 文件无法复制 的问题,并且会弹出磁盘已满的提示,而经过检查,u盘容量却拥有足够大的空间,那么此时该如何解决呢?接下来就跟着小编学习如何解决 u盘文件无法复制 的问题。u盘文件无法复制并提示磁盘已…

python 接口测试 url_Python 接口测试之接口请求方法封装

引言前面讲过三篇文章:既然我们接口测试用例写好了,测试数据也拿到了,那么就是模拟调用接口的方法了,方法有get,post,put,delete,具体是选择哪种,我们需要根据不同接口规定好请求方法来调用。为了方便&…

jenkins 项目启动日志_jenkins 修改启动文件即jdk路径、log路径和切换jenkins用户

环境操作系统: win7服务器(虚拟机):centos6.5(7)工具:CRT提前条件已经安装好了jenkins修改(或者说添加)jdk路径sudo vim /etc/init.d/jenkins# jenkins的版本是2.8candidates" /usr/programe_files/jdk1.8.0_121/bin/java /etc/alternat…

python3远程连接_Python3 SSH远程连接服务器的方法示例

下载paramiko首先,我的windows系统上有python2和python3。使用下面命令切换到python3:activate py3接着使用下面命令下载相关模块:pip install ecdsapip install Cryptopip install paramiko连接服务器操作:# -*- coding: utf-8 -*-import pa…

java jar 环境变量_java-jar jar包带环境变量(参数)启动

需求java工程我们可以编译成jar也可以翻译成war,一般地,war包我会丢到tomcat容器里,启动tomcat来访问服务,端口、SSL证书、日志等等,都托给tomcat。如果打的是jar包,我通常会用nohup启动,比如生…

java单列_Java 单例模式

单例模式保证一个类只有一个实例,并且提供一个访问该实例的全局访问点常见的应用场景:任务管理器。回收站。网站的计数器。操作系统的文件系统。在servlet编程中,每个servlet也是单例模式,项目中,读取配置文件的类&…

python字符串索引必须是整数_TypeError:在Python中,字符串索引必须是整数

我想从currency converter API得到的Json响应中获取key和value,得到一个错误:“of string index must be integers”。下面是Python代码、Json中的数据和错误消息。在import jsonfrom urllib.request import urlopenwith urlopen ("http://free.cur…

java 数字图片识别_java – 识别图像中的数字

您很可能需要执行以下操作:>在整个页面上应用Hough Transform算法,这应该会产生一系列页面部分。>对于您获得的每个部分,请再次应用。如果当前部分产生2个元素,那么你应该处理类似于上面的矩形。>完成后,您可…

python的基础命令_Python必学之命令行常用的命令

打开命令行,我们会看到每行前面都有诸如C:\Documents and Settings\Crossin>或者MyMacBook:~ crossin$之类的。这个提示符表示了当前命令行所在目录。在这里,我们输入python就可以进入python环境了。但今天我们暂时不这么做。第一个常用的命令是&…

内存泄漏java例子_一次线上Java应用内存泄漏分析实例

由于JVM的内存管理采用GC垃圾自动回收机制,这使得Java程序员在编程的时候确实可以从内存管理中释放出来,但这也引发了另外一个大问题,一旦Java应用出现内存泄漏的时候,常常让人措手不及,陷入无从下手的尴尬境地&#x…

python比较列表所有项是否有相同的部分_检查列表中的所有元素是否相同

一般方法&#xff1a;def checkEqual1(iterator):iterator iter(iterator)try:first next(iterator)except StopIteration:return Truereturn all(first rest for rest in iterator)单线&#xff1a;def checkEqual2(iterator):return len(set(iterator)) < 1还有一条线&…

java项目管理工具_Java 开发项目管理工具

团队协同工具(worktil):https://worktile.com/版本管理工具(GitLab)&#xff1a;http://www.tuicool.com/articles/bEz6Vf 配置教程&#xff1a;http://www.cnblogs.com/wintersun/p/3930900.html自动化构建工具(jenkins)&#xff1a;http://jenkins-ci.org/ 配置教程&#xff…

python判断是不是整数的命令_介绍python判断一个数是不是正小数和整数的方法

这篇文章主要介绍了python 判断是否为正小数和正整数的实例的相关资料,这里提供实例&#xff0c;实例注释说明很清楚&#xff0c;需要的朋友可以参考下python 判断是否为正小数和正整数的实例实现代码&#xff1a;def check_float(string):#支付时&#xff0c;输入的金额可能是…

.net core 2.1 mysql_ASP.NET Core 2.2 + MySQL + DB First

1 项目添加 Pomelo.EntityFrameworkCore.MySql2 编辑项目文件&#xff0c;在节点中添加如下代码&#xff1a;netcoreapp2.2InProcess3 CMD 切换到当前项目目录&#xff0c;执行如下命令dotnet ef dbcontext scaffold "Serverlocalhost;User Id数据库访问用户;Password数据…

java 向上抛异常_java throws 向上抛出的概念问题

展开全部------------------附注------------------------向上抛出的意思 针对 子类 父类,这里面涉及到几个方面,最重32313133353236313431303231363533e4b893e5b19e31333332613637要的一点,(先抛子类的异常,再抛父类的异常.)(FALSE)如果在该方法写明catch子句,catch的顺序是子…