louvain算法_单细胞聚类(四)图解Leiden算法对Louvain算法的优化

    Louvain算法是目前单细胞分析中最常用的聚类算法[1],Seurat/Scanpy/RaceID等单细胞分析工具都默认louvain算法。6天前HumanCell Atlas(HCA)团队发表在Nature Method上的单细胞分析流程中[2],默认的聚类算法是scran包的方法:细胞间权重基于排序计算(rank-based),聚类算法用Walktrap。这跟杰卡德距离+Louvain算法的方法截然不同。

       聚类算法孰优孰劣,此前已经有人做过比较。2016年Scientific Reports上有一篇文章比较了igraph包里的8种聚类算法,其中包括了Louvain和Walktrap[3]。测试结果的准确率Louvain和Walktrap相近。但是,当节点数(细胞数)大于6000时,Louvain的表现要优于Walktrap。

    总结评测结果,Louvain算法表现是最好的。但仍有不少文章选择其他聚类算法,因为louvain算法有以下几个缺点:

  1. 社区划分的精度有局限性[4];

  2. 分组内细胞分布密度的大小会影响亚群的鉴定[2];

  3. 被鉴定为同一个分群的细胞群内,存在两个没有连线的小分群[5]。

    Leiden算法主要针对上述的第3个缺点,对louvain算法进行优化[5]。

    Leiden算法的命名来源于荷兰莱顿大学(Leiden University)。该算法由莱顿大学的三位研究员开发,结果于今年3月份发表在Scientific Reports上。

93713fbb7a488985008b0852df758065.png

想了解louvain算法的聚类过程,可以回顾往期文章:

 单细胞聚类(二)社区划分与模块度

总结Leiden算法优化louvain的两个要点:

  1. 比louvain算法运行更快。

  2. 针对louvain聚类结果中出现一些分群内部存在断链的现象(连线没有把所有细胞串起来,存在明显亚群)进行优化,分群更加合理,可能得到更多亚群。

8cf6a649e857ba0aea46672c0d69ea1c.png

图解leiden算法的操作过程

我们可以把聚类过程当作体育课的一场游戏。

学生是细胞,在操场上站队(聚类)。

模块度是体育老师,检查学生站队是否合理。

连线(细胞间权重)表示学生之间有一定的关系,比如同班同学,身高一致等。

c91f4bf8bc1b86de4deef4dc605ea463.png

    经过学生的一阵骚动(初始划分聚类)之后,初始的队伍出来了,分成的三个队伍:

bbc62f88ff10f0373d084ed2d8a394f6.png

      这时体育老师出来,看了看整体队形(模块度给聚类结果打分),感觉还不行(模块度分数偏低),需要调整分组站队。

Leiden和louvain算法的调整策略不同(leiden优化的要点一):

  1. Louvain:让每个同学去另外两个队伍,每次换队伍都让体育老师评价一下;

  2. Leiden:只让每个同学去有连线的其他队伍,节省时间。

        当害羞同学980fd0f6a1c1dfef68eac56260810663.png从红队调整到绿队时,体育老师发现队形变好看了(模块度打分提高了)。因为红队身高整体比绿队高,害羞同学980fd0f6a1c1dfef68eac56260810663.png比较矮,适合绿队。害羞同学刚开始站在红队,是因为她跟红队是同班同学。

d9fa8820f6dc7aa0c4c866ab43862ac8.png

        但害羞同学980fd0f6a1c1dfef68eac56260810663.png离开红队之后,问题就来了。红队内部出现左右两个没有连线的小队:耶小队195143e1e82c980425f4b2d8cd1dfe0a.png和奸笑小队fe90155a96ae2d3750facf0a04f0ea91.png。Louvain算法没有检测这种内部断链的现象。尽管红队都是同班同学,但内部还是有身高的差异,耶小队195143e1e82c980425f4b2d8cd1dfe0a.png比奸笑小队fe90155a96ae2d3750facf0a04f0ea91.png普遍矮小。之前不高不矮的害羞同学980fd0f6a1c1dfef68eac56260810663.png在的时候,还能起到内部过渡的作用。当害羞同学980fd0f6a1c1dfef68eac56260810663.png离开之后,红队内部出现两极化。

5029ff4baf29ffdf58f3e8da4f7ec5f7.png

        幸亏体育老师提前备课,看了leiden算法,及时将红队分开。(leiden优化要点二)

    下课铃声响起,体育老师手握Leiden书,看着同学们完美的队形,露出了满意的微笑。

如果您对相关内容感兴趣,欢迎关注本公众号:“单细胞组学”。

如果您对内容满意,欢迎点击右下角 “在看”,让更多感兴趣的朋友看到!

感谢!

参考文献:

[1] Blondel,Vincent D., et al. "Fast unfolding of communities in large networks." Journal of statisticalmechanics: theory and experiment 2008.10 (2008): P10008.

[2] AmezquitaR A, Lun A T L, Becht E, et al. Orchestrating single-cell analysis withBioconductor[J]. Nature Methods, 2019: 1-9.

[3] YangZ, Algesheimer R, Tessone C J. A comparative analysis of community detectionalgorithms on artificial networks[J]. Scientific reports, 2016, 6: 30750.

[4] FortunatoS, Barthelemy M. Resolution limit in community detection[J]. Proceedings of thenational academy of sciences, 2007, 104(1): 36-41.

[5] Traag,Vincent A., Ludo Waltman, and Nees Jan van Eck. "From Louvain to Leiden:guaranteeing well-connected communities." Scientific reports 9 (2019).

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/244740.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java 动态绑定原理_详解Java动态绑定机制的内幕(图)

在Java方法调用的过程中,JVM是如何知道调用的是哪个类的方法源代码? 这里面到底有什么内幕呢? 这篇文章我们就将揭露JVM方法调用的静态(static binding) 和动态绑定机制(auto binding) 。静态绑定机制//被调用的类package hr.test;class Fath…

java连接access2013数据库_滴水穿石–Java连接Access数据库及其操作

1、配置数据源【控制面板】—>【管理工具】—>【数据源ODBC】点击添加选择Microsoft Access Driver填写数据源名(自定义,如test),并选择数据库(指定你的Access数据库文件),如下图红色箭头标注最后,点击确定数据源配置完成2、…

无法复制winevt中的文件_u盘文件无法复制怎么解决 u盘文件无法复制解决方法【详细步骤】...

在使用u盘的过程中有时会出现 文件无法复制 的问题,并且会弹出磁盘已满的提示,而经过检查,u盘容量却拥有足够大的空间,那么此时该如何解决呢?接下来就跟着小编学习如何解决 u盘文件无法复制 的问题。u盘文件无法复制并提示磁盘已…

内存泄漏java例子_一次线上Java应用内存泄漏分析实例

由于JVM的内存管理采用GC垃圾自动回收机制,这使得Java程序员在编程的时候确实可以从内存管理中释放出来,但这也引发了另外一个大问题,一旦Java应用出现内存泄漏的时候,常常让人措手不及,陷入无从下手的尴尬境地&#x…

.net core 2.1 mysql_ASP.NET Core 2.2 + MySQL + DB First

1 项目添加 Pomelo.EntityFrameworkCore.MySql2 编辑项目文件,在节点中添加如下代码:netcoreapp2.2InProcess3 CMD 切换到当前项目目录,执行如下命令dotnet ef dbcontext scaffold "Serverlocalhost;User Id数据库访问用户;Password数据…

windows linux cpu 抢占式 时间片_嵌入式Linux中进程调度怎样来解析

合作微信:xydf321456Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的UNIX工具软件、应用程序和网络协议。1.前言处理机(CPU)是整个计算机系…

java 堆内存分析_JVM内存堆布局图解分析

JAVA能够实现跨平台的一个根本原因,是定义了class文件的格式标准,凡是实现该标准的JVM都能够加载并解释该class文件,据此也可以知道,为啥Java语言的执行速度比C/C语言执行的速度要慢了,当然原因肯定不止这一个,如在JVM中没有数据寄…

wpf表格datagrid拖动列_这才是老板要的Excel表格,你做的太丑了!

在网上看到一个高手做的Excel表格,非常的漂亮,今天我们一起仿做一下。原始的表格,再熟悉不过的样式:完成后的效果,是不是有让你颠覆三观的感觉?同样的数据,不同的展示方式,后者不但好…

proteus跑马灯仿真_不花费一分钱,实现跑马灯编程实验

建立仿真工程初学者学习单片机编程,并不需要去网上买个开发板才能开始编程做实验,若是想先了解,可以先用proteus仿真软件来做实验,Protues软件具有其它EDA工具软件的功能。这些功能是:1.原理布图2&#xff…

power bi 日期计算_PowerBI 动态计算周内日权重指数

在很多行业,尤其是零售业,其销售规律在一周内呈现一定的特点。例如:平时有一种购买特点;周末有一种购买特点。故而一周内的星期一到星期日呈现一定的权重分布。周内日权重分布1 到 12 表示月序号;1 到 7 表示周内日。这…

vb 6.0 获取重定向的url_接口测试:A07_HttpRunner重定向_04_解决方案

A07_HttpRunner重定向_04_解决方案既然 HttpRunner 是对 requests 模块的封装,那我们就试图从 requests 中寻找答案,在其官网中发现了对重定向的描述和处理:地址:http://cn.python-requests.org/zh_CN/latest/user/quickstart.htm…

java wordcount程序_[java]wordcount程序

词数统计系统。作业解析:这次作业的内容是从本地读取一个程序代码,计算出这个程序中的行数,单词数,也可进行拓展。实现语言:java编程思路:程序是由各种单词和符号组成的,单词包括关键字&#xf…

robot ride edit 页面不显示_【框架】robot-framework预研

隔壁组在使用robot framework进行自动化测试,这玩意之前我没接触过,决定来预研一下这个auto test框架。背景一个好的框架,背后少不了一个牛逼的团队或组织(金主爸爸),也是判断是否值得投入时间学习的一个参考因素(虽然强如塞班系统…

php 任意字符串_php 生成任意长度字符串的类(只含有数字 只含有字母 混合数字和字母)...

[php]代码库/** 生成随机字符串的类,默认只包含数字、大小写字母*/class randomString {/** 生成的字符串包含的字符设置*/const NUMERIC_ONLY 1; //只含有数字const LETTER_ONLY 2; //只含有字母const MIXED 3; //混合数字和字母/** 用户传入变量,分…

explode php 报错,ecshop在php5.4下报错怎么办

ecshop在php5.4下报错的解决办法:1、打开“cls_template”文件,并修改“$tag_selarray_shift(explode( ,$tag));”;2、修改“static”;3、修改cls_captcha文件。本教程操作环境:windows7系统、PHP5.4版、Dell G3电脑。…

sql 相加_SQL经典题型

SQL内容及常见面试题如下:以下为具体的面试题内容和答案一、简单查询题目查询姓“猴”的学生名单查询姓名中最后一个字是“猴”的学生名单查询姓名中带“猴”的学生名单查询姓“孟”老师的个数二、汇总分析题目查询课程号为“0002”的总成绩查询选了课程的学生人数查…

基于stm32f429的手写识别_关注智能手机老年用户:百度输入法手写模型迎来重磅升级...

智能手机的快速普及让很多人都已经习惯于任何事情都用手机办理,不仅外出买东西、乘坐公共交通可以使用智能手机支付,同时一些与工作、政务相关的事情也可以在智能手机端完成,而社交工具更是让人们几乎已经不再使用短信、电话功能,…

Html页面上输出不了PHP,在页面上直接输出未经解析的HTML源码

摘要&#xff1a;<?php $str6$我在\php中文网\学习 PHP 和 HTML &#xff0c;目前我还是&小白&。;echo $str6,;//\, 、$str6$我在\php中文网\学习 PHP 和 HTML &#xff0c;目前我还是&小白&。;echo $str6,;//\, 、标签、&等均被解析输出echo htmlspec…

vue created 调用方法_vue 基础-生命周期 lifecycle 的执行顺序和作用

前言《vue 基础》系列是再次回炉 vue 记的笔记&#xff0c;除了官网那部分知识点外&#xff0c;还会加入自己的一些理解。(里面会有部分和官网相同的文案&#xff0c;有经验的同学择感兴趣的阅读)平时开发中&#xff0c;我真的不太使用生命周期相关的方法。但必须明确的是&…

vba 提取 json某个值_Excel中提取不重复值的方法汇总(5种基础+VBA+1个自定义函数)...

各位朋友&#xff0c;你们好&#xff0c;今天和你们分享Excel中提取不重复值的几种方法&#xff0c;着重介绍【5种】基础操作方法&#xff0c;另外附送一个VBA去重代码&#xff0c;拿去就可以直接使用。一、基础操作方法1、数据工具直接去重(见下图)数据工具去重2、高级筛选(见…