GRN前沿:STGRNS:一种基于transformer的可解释方法,用于从单细胞转录组数据推断基因调控网络

1.论文原名:STGRNS: an interpretable transformer-based method for inferring gene regulatory networks from single-cell transcriptomic data

2.发表日期:2023.4.2

摘要:

动机:单细胞RNA测序(scRNA-seq)技术提供了一个推断细胞特异性基因调控网络(GRNs)的机会,这是系统生物学中的一个重要挑战。尽管已经开发了许多方法来从scRNA-seq数据推断GRNs,但是处理细胞异质性仍然是一个挑战。结果:为了解决这一难题,我们开发了一种可解释的基于转化子的方法,即STGRNS,用于从scRNA-seq数据中推断GRNs。该算法采用基因表达基序技术,将基因对转化为相邻的子向量,作为Transformer编码器的输入。通过避免网络中缺失阶段特异性调控,基因表达基序可以提高不同类型scRNA-seq数据的GRN推断的准确性。为了评估STGRNS的性能,我们在21个静态和27个时间序列scRNAseq数据集上与一些常用的方法进行了对比实验。实验结果表明,STGRNS方法具有较上级的性能.;此外,STGRNS也被证明比“黑箱”深度学习方法更具可解释性,而“黑箱”深度学习方法以难以清晰解释预测而闻名。

1. 研究背景与动机

  • 单细胞RNA测序(scRNA-seq)技术为在单细胞水平上研究基因调控机制提供了可能,但推断细胞特异性的基因调控网络(GRNs)仍然是系统生物学中的一个重要挑战。

  • 现有的GRNs推断方法分为无监督方法和有监督方法,但这些方法在处理单细胞数据的异质性时存在局限性,例如高稀疏性、噪声和dropout事件,限制了其准确性。

2. STGRNS方法框架

STGRNS的整体框架包括四个主要模块:基因表达模式(GEM)模块、位置编码层、Transformer编码器和分类层。以下是各模块的具体功能和实现方式:

1. 基因表达模式(Gene Expression Motif, GEM)模块

功能

GEM模块的核心功能是将基因对的表达数据转换为适合Transformer编码器输入的格式。它通过将基因表达向量分割为连续的子向量,并将同一基因对的子向量拼接成新的向量,从而保留基因表达的同步性特征。

  • 优势

    • 保留基因表达同步性:通过将基因对的子向量拼接,GEM能够保留基因表达的同步性特征,这对于推断基因调控关系至关重要。

    • 提高模型输入效率:将基因对转换为连续的子向量形式,使得Transformer编码器能够更有效地处理输入数据。

2. 位置编码层

功能

位置编码层的目的是在将基因对输入Transformer编码器时,保留基因表达向量的顺序或时间信息。这对于处理时间序列数据或具有伪时间顺序的单细胞数据尤为重要。

  • 优势

    • 保留时间信息:位置编码能够使模型捕捉到基因表达的时间或顺序信息,这对于推断基因调控网络至关重要。

    • 增强模型性能:通过引入位置信息,模型能够更好地理解基因表达的动态变化,从而提高推断的准确性。

3. Transformer编码器

功能

Transformer编码器的主要功能是计算不同子向量之间的相关性,并关注关键子向量。它通过多头自注意力机制和前馈网络来提取基因对的交互信息。

  • 优势

    • 并行处理:Transformer编码器能够并行处理输入数据,提高计算效率。

    • 全局信息捕捉:多头自注意力机制允许模型在多个不同的投影空间中捕捉基因对的交互信息,从而提高推断的准确性。

    • 关注关键特征:通过自注意力机制,模型能够自动关注对基因调控关系推断更为关键的子向量。

4. 分类层

功能

分类层的目的是根据Transformer编码器的输出,对基因对是否具有调控关系进行分类。它将编码器提取的特征用于最终的调控关系预测。

  • 优势

    • 简洁高效:分类层结构简单,但能够有效地将编码器提取的特征用于最终的调控关系预测。

    • 可解释性:通过分析分类层的输出,可以解释模型的预测结果,例如哪些子向量对最终预测结果的影响最大。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/69216.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenAI 实战进阶教程 - 第四节: 结合 Web 服务:构建 Flask API 网关

目标 学习将 OpenAI 接入 Web 应用,构建交互式 API 网关理解 Flask 框架的基本用法实现 GPT 模型的 API 集成并返回结果 内容与实操 一、环境准备 安装必要依赖: 打开终端或命令行,执行以下命令安装 Flask 和 OpenAI SDK: pip i…

深入浅出:旋转变位编码(RoPE)在现代大语言模型中的应用

在现代大语言模型(LLMs)中,位置编码是一个至关重要的组件。无论是 Meta 的 LLaMA 还是 Google 的 PaLM,这些模型都依赖于位置编码来捕捉序列中元素的顺序信息。而旋转变位编码(RoPE) 作为一种创新的位置编码…

DeepSeek 部署过程中的问题

文章目录 DeepSeek 部署过程中的问题一、部署扩展:docker 部署 DS1.1 部署1.2 可视化 二、问题三、GPU 设置3.1 ollama GPU 的支持情况3.2 更新 GPU 驱动3.3 安装 cuda3.4 下载 cuDNN3.5 配置环境变量 四、测试 DeepSeek 部署过程中的问题 Windows 中 利用 ollama 来…

基础算法——二维前缀和

二维前缀和 我们先前已经了解了前缀和思想,二维前缀和感觉上就是一维前缀和的进阶,下面 ,我们剖析一下两种前缀和。 一维前缀和 一维前缀和的核心就是这两个公式,二维前缀和也差不多的嘞 下面我们来推理一下二维前缀和 已知&a…

每日Attention学习19——Convolutional Multi-Focal Attention

每日Attention学习19——Convolutional Multi-Focal Attention 模块出处 [ICLR 25 Submission] [link] UltraLightUNet: Rethinking U-shaped Network with Multi-kernel Lightweight Convolutions for Medical Image Segmentation 模块名称 Convolutional Multi-Focal Atte…

2. K8S集群架构及主机准备

本次集群部署主机分布K8S集群主机配置主机静态IP设置主机名解析ipvs管理工具安装及模块加载主机系统升级主机间免密登录配置主机基础配置完后最好做个快照备份 2台负载均衡器 Haproxy高可用keepalived3台k8s master节点5台工作节点(至少2及以上)本次集群部署主机分布 K8S集群主…

游戏引擎学习第89天

回顾 由于一直没有渲染器,终于决定开始动手做一个渲染器,虽然开始时并不确定该如何进行,但一旦开始做,发现这其实是正确的决定。因此,接下来可能会花一到两周的时间来编写渲染器,甚至可能更长时间&#xf…

链式结构二叉树(递归暴力美学)

文章目录 1. 链式结构二叉树1.1 二叉树创建 2. 前中后序遍历2.1 遍历规则2.2 代码实现图文理解 3. 结点个数以及高度等二叉树结点个数正确做法: 4. 层序遍历5. 判断是否完全二叉树 1. 链式结构二叉树 完成了顺序结构二叉树的代码实现,可以知道其底层结构…

Kubernetes 中 BGP 与二层网络的较量:究竟孰轻孰重?

如果你曾搭建过Kubernetes集群,就会知道网络配置是一个很容易让人深陷其中的领域。在负载均衡器、服务通告和IP管理之间,你要同时应对许多变动的因素。对于许多配置而言,使用二层(L2)网络就完全能满足需求。但边界网关协议(BGP)—— 支撑互联网运行的技术 —— 也逐渐出…

Linux提权--John碰撞密码提权

​John the Ripper​(简称 John)是一个常用的密码破解工具,可以通过暴力破解、字典攻击、规则攻击等方式,尝试猜解用户密码。密码的弱度是提权攻击中的一个重要因素,如果某个用户的密码非常简单或是默认密码&#xff0…

大数据学习之Spark分布式计算框架RDD、内核进阶

一.RDD 28.RDD_为什么需要RDD 29.RDD_定义 30.RDD_五大特性总述 31.RDD_五大特性1 32.RDD_五大特性2 33.RDD_五大特性3 34.RDD_五大特性4 35.RDD_五大特性5 36.RDD_五大特性总结 37.RDD_创建概述 38.RDD_并行化创建 演示代码: // 获取当前 RDD 的分区数 Since ( …

[创业之路-286]:《产品开发管理-方法.流程.工具 》-1- IPD两个跨职能团队的组织

IPD(集成产品开发)中的两个重要跨职能组织是IPMT(集成产品管理团队)和PDT(产品开发团队)。 在IPD(集成产品开发)体系中,IRB(投资评审委员会)、IPM…

DeepSeek 提示词之角色扮演的使用技巧

老六哥的小提示:我们可能不会被AI轻易淘汰,但是会被“会使用AI的人”淘汰。 在DeepSeek的官方提示库中,有“角色扮演(自定义人设)”的提示词案例。截图如下: 在“角色扮演”的提示词案例中,其实…

第二个Qt开发实例:在Qt中利用GPIO子系统和sysfs伪文件系统实现按钮(Push Button)点击控制GPIO口(效果为LED2灯的灭和亮)

引言 本文承接博文 https://blog.csdn.net/wenhao_ir/article/details/145420998 里的代码,在那里面代码的基础上添加上利用sysfs伪文件系统实现按钮(Push Button)点击控制GPIO口的代码,进而实现LED2灯的灭和亮。 最终的效果是点击下面的LED按钮实现LED…

登山第十七梯:矩形拟合——无惧噪声

文章目录 一 摘要 二 资源 三 内容 (文章末尾提供源代码) 一 摘要 目前,获取点集的矩形拟合结果的主要方法是计算其最小外包直立矩形或者旋转矩形。这些方法简单、易用,在数据质量良好的情况下能够较好的贴合矩形形状。然而,在数据缺失时,最小外包围盒方法将会…

57. Uboot图形化界面配置

一、Uboot图形化配置方法 1、通过终端配置。 2、进入到uboot的源码根目录下。 3、首先默认配置 make mx6ull_alientek_emmc_defconfig //默认配置 4、输入make menuconfig。打开图形化配置界面。 5、注意,新电脑需要安装ncurses库。sudo apt-get install libncurs…

kalman滤波器C++设计仿真实例第三篇

1. 仿真场景 水面上有条船在做匀速直线航行,航行过程中由于风和浪的影响,会有些随机的干扰,也就是会有些随机的加速度作用在船身上,这个随机加速度的均方差大约是0.1,也就是说方差是0.01。船上搭载GPS设备,…

(2025|ICLR,音频 LLM,蒸馏/ALLD,跨模态学习,语音质量评估,MOS)音频 LLM 可作为描述性语音质量评估器

Audio Large Language Models Can Be Descriptive Speech Quality Evaluators 目录 1. 概述 2. 研究背景与动机 3. 方法 3.1 语音质量评估数据集 3.2 ALLD 对齐策略 4. 实验结果分析 4.1 MOS 评分预测(数值评估) 4.2 迁移能力(在不同…

stm32生成hex文件详解

1.产生的map文件干啥的? 2.组成情况??? 废话少说,直接上代码具体内容况: Component: ARM Compiler 5.06 update 7 (build 960) Tool: armlink [4d3601]Section Cross Referencesstartup_stm32f103xe.o(S…

百度热力图数据获取,原理,处理及论文应用6

目录 0、数据简介0、示例数据1、百度热力图数据日期如何选择1.1、其他实验数据的时间1.2、看日历1.3、看天气 2、百度热力图几天够研究?部分文章统计3、数据原理3.1.1 ** 这个比较重要,后面还会再次出现。核密度的值怎么理解?**3.1.2 Csv->…