预测多基因扰动的转录结果

了解细胞对基因扰动的反应是许多生物医学应用的核心,从识别癌症中涉及的基因相互作用到开发再生医学方法。然而,可能的多基因扰动数量的组合爆炸严重限制了实验验证。在这里,作者提出了图增强的基因激活和抑制模拟器(GEARS,graph-enhanced gene activation and repression simulator),这是一种将深度学习与基因-基因关系知识图相结合的方法,利用单细胞 RNA 测序数据来预测对单基因和多基因扰动的转录反应。GEARS能够预测由从未在实验中受到干扰的基因组成的干扰组合的结果。在组合扰动筛选中,GEARS在预测四种不同的遗传相互作用亚型方面比现有方法的精度高40%,并且识别出最强的相互作用是先前方法的两倍。总体而言,GEARS可以预测多基因扰动的不同表型效应(phenotypically distinct effects),从而指导扰动实验的设计。

来自:Predicting transcriptional outcomes of novel multigene perturbations with GEARS
项目:https://github.com/snap-stanford/GEARS

目录

  • 背景概述
  • 结果
    • 基于知识的扰动效应学习
    • 预测新的具有生物学意义的表型

背景概述

细胞对基因扰动的转录反应揭示了细胞如何运作的基本见解。转录反应可以描述多种功能,从基因调控机制如何帮助维持细胞身份到调节基因表达如何逆转疾病表型。这对生物医学研究,特别是在开发个性化治疗方面具有重要意义。例如,通过基因扰动研究来验证药物靶点,增加了临床试验成功的可能性。此外,确定协同基因对可以提高联合治疗的有效性。由于已知复杂的细胞表型是由小组基因之间的遗传相互作用产生的,确定这种相互作用可以促进精确的细胞工程。虽然最近的进展使科学家能够更快地在实验中取样扰动结果,但由于潜在的多基因组合的规模巨大,预测扰动效应的方法是必不可少的。

然而,现有的预测扰动结果的计算方法有其自身的局限性。单基因扰动结果预测的主要方法依赖于以基因调控网络的形式推断基因之间的转录关系。这一方面受到从基因表达数据集准确推断网络的困难,另一方面也受到来自公共数据库的网络不完整的限制。此外,使用这种网络建立的现有预测模型线性地结合了个体扰动的影响,这使得它们无法预测多基因扰动的非加性效应,如协同效应(synergy)。

在这里,作者提出了图增强的基因激活和抑制模拟器GEARS,这是一种集成了深度学习和基因-基因关系知识图的计算方法,以模拟基因扰动的影响。生物知识的结合使GEARS可以预测干扰单个基因或基因组合的转录结果。

结果

基于知识的扰动效应学习

GEARS是一种基于深度学习的模型,用于预测组合扰动一组或多个基因(扰动集)的基因表达结果。给定未受干扰的单细胞基因表达以及选定的扰动集(图1a),输出是扰动后细胞的转录状态。

GEARS使用不同的多维嵌入来表示每个基因和它的扰动(用来表示一个有意义概念的任意数字向量,图1b)。每个基因的嵌入通过训练过程进行调整,以代表该基因的关键特征。将表示分解为两个多维组件,使GEARS具有额外的表达能力,用于捕获扰动响应的基因异质性。每个基因的嵌入顺序与扰动集中每个基因的扰动嵌入相结合,最后用于预测该基因的扰动后状态。

fig1a

  • 图1a:给定未受干扰的基因表达(绿色)和施加干扰的基因表达(红色),预测基因表达结果(紫色)。每个box对应一个单独的基因。箭头表示表达的变化。

fig1b

  • 图1b:GEARS模型架构:(i)对于每个处于无扰动状态的基因,GEARS初始化一个基因嵌入向量(绿色)和一个基因扰动嵌入向量(红色);(ii)这些嵌入向量被分配为基因关系图和扰动关系图(iii)中的节点特征;使用GNN来组合每个图中邻居之间的信息。每个基因嵌入与扰动集(iv)中每个扰动的扰动嵌入求和,使用跨基因层将所有基因的输出组合并输入到基因特异性输出层(v)。最终结果是扰动后的基因表达。

预测新的具有生物学意义的表型

通过预测来自Norman等人数据的102个基因的所有成对组合扰动的结果,将GEARS应用于新表型的发现(图4a)。为了做出这一预测,使用单基因扰动结果和128个双基因的扰动后基因表达结果来训练GEARS(图4b)。预测的扰动后表达捕获了许多不同的表型簇,包括Norman等人先前发现的那些,此外,GEARS的预测结果呈现了一些新的表型(图4c)。

为了确定这种在训练数据中未观察到的新预测表型的生物学相关性,作者将其与Tabula Sapiens细胞图谱中的原红细胞数据进行了比较。虽然该簇的erythroid marker表达尚未得到实验验证,但其鉴定表明,GEARS能够扩大扰动后表型的空间,超出了扰动实验中观察到的范围。此外,通过检验训练期间所有表型相似的扰动后结果,验证了这一预测的稳健性。
fig4

  • 图4a:预测一组基因的所有成对组合扰动结果的工作流程。
  • 图4b:用于训练GEARS的102个单基因扰动和128个双基因扰动后基因表达的低维表示。
  • 图4c:GEARS预测了实验中观察到的102个单基因的所有5151个成对组合的扰动后基因表达。预测的扰动后表型(非黑色符号)不同于实验中看到的表型(黑色符号)。

基因扰动验证药物靶点流程
对于最有说服力的湿实验,我们选择某个基因作为靶点或目标靶点相关的研究对象,降低该基因的表达或者让这个基因过表达,然后看药物注射后的情况,如果药物在扰动该基因后表现出显著的不同效应,可以初步认为该基因是潜在的药物靶点。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/77784.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

06-mq

1、消息队列有什么优点和缺点? 优点: 解耦、异步、削峰填谷。 缺点: 系统可用性降低 系统复杂性提高 一致性问题 2、常见消息队列的比较 3、Kafka的特性 1.消息持久化 2.高吞吐量 3.扩展性强(动态)4集群+4台集群…

硬件【10】运放-1-理想运放与虚断虚短的来源

1 概述 今天开始,聊一聊运放吧,之前很多兄弟们也提了这个要求。正好我最近也想深入看看运放方面的,那么就借这个机会一步一步再搞一搞吧。 运放这个器件相对于电阻,电容,三极管,MOS管等器件算是比较复杂的…

Docker进阶:Docker Compose(容器编排) 管理多容器应用—实战案例演示

Docker进阶:Docker Compose(容器编排) 管理多容器应用—实战案例演示 一、Docker Compose简介二、Docker Compose安装三、Docker Compose卸载四、Docker Compose核心概念4.1、一文件原则(docker-compose.yml)4.2、服务…

vue交互

目录 交互 指有人参与的,程序并非按照一定的顺序去执行,可以人为介入,让程序或应用去根据输入选择执行流程,提供给我们需要的信息。 前、后端 前端:指客户端,浏览器 用户可以直接看到、操作,可…

【大数据之Kafka】十二、Kafka之offset位移及漏消费和重复消费

1 offset的默认维护位置 Kafka0.9版本之前, consumer默认将offset保存在Zookeeper中。从0.9版本开始,consumer默认将offset保存在Kafka一个内置的topic中,该topic为 consumer_offsets。   consumer_offsets 主题里面采用 key 和 value 的方…

【网络教程】记一次使用Docker手动搭建BT宝塔面板的全过程(包含问题解决如:宝塔面板无法开启防火墙,ssh,nginx等)

文章目录 准备安装安装宝塔面板开启ssh和修改ssh的密码导出镜像问题解决宝塔面板无法开启防火墙无法启动ssh设置密码nginx安装失败设置开机启动相关服务准备 演示的系统环境:Ubuntu 22.04.3 LTS更新安装/升级docker到最新版本升级docker相关命令如下# 更新软件包列表并自动升级…

TypeScript断言

什么是断言? 一个编译时语法,用于告诉编译器用户比编译器更加确定变量的类型,进而解除编译错误,类型断言有点类似于其他语言的类型转换,但它没有运行时的影响,只是在编译阶段起作用。所以,即使通…

用Navicat备份Mysql演示系统数据库的时候出:Too Many Connections

今天用Navicat进行数据备份的时候,发现由于数据库连接数目过多导致连接锁定,这种情况在多人协同开发的场景中很常见。当然我这里也因为多个应用使用了数据库连接,所以出现了Too Many Connections。 可能是超过最大连接数了。 1、进入Navicat…

【nosql】redis之高可用(主从复制、哨兵、集群)搭建

redis群集有三种模式 redis群集有三种模式,分别是主从同步/复制、哨兵模式、Cluster集群,下面会讲解一下三种模式的工作方式,以及如何搭建cluster群集 ●主从复制:主从复制是高可用Redis的基础,哨兵和集群都是在主从…

学习笔记|定时器|STC中断|定时器时间计算|STC32G单片机视频开发教程(冲哥)|第十一集:定时器的作用和意义

文章目录 1.定时器的作用和意义定时器中断定时器是定时器和计数器的统称。 2.STC32G单片机定时器使用原理2.1 先设置功能为定时器/计数器(本质都是加法计数器)2.2、在定时器模式下,设置不分频或者12分频∶Tips:选择不分频还是12分频2.3、定时器的工作模式…

【腾讯云Cloud Studio实战训练营】戏说cloud studio

文章目录 前言产品概述项目体验登录空间模板模板项目体验 总结 前言 在奇幻世界中,存在着一片神秘的云海,被人们称为腾讯云云端开发环境 Cloud Studio。这片云海是一座巨大的浮岛,上面漂浮着一个集成式开发环境(Integrated Devel…

自动化测试入门知识 —— 数据驱动测试

一、什么是数据驱动测试? 数据驱动测试是一种测试方法,它的核心思想是通过不同的测试数据来验证同一个测试逻辑。通常情况下,测试用例中的输入数据和预期结果会被提取出来,以便可以通过不同的测试数据进行重复执行。 数据驱动测…

分享一个复合故障数据集

复合故障数据集 1.本数据集采集了轴承从正常状态到故障状态的振动信号, 包含失效的原因:内圈磨损,保持架断裂,外圈磨损和外圈裂损。其中有单一类型故障、单一故障组合的复合故障等多种失效形式,可用于诊断滚动轴承早期…

飞行动力学 - 第22节-动稳定性与运动方程 之 基础点摘要

飞行动力学 - 第22节-动稳定性与运动方程 之 基础点摘要 1. 稳定性定义2. 动稳定性示意图3. 数值仿真结构框图4. 运动响应类型5. 参考资料 1. 稳定性定义 飞机在平衡状态(静止或匀速运动)受到扰动: 有回到初始状态的趋势;静稳定…

微信怎么定时发圈?

定时发圈的妙用 在合适的时间点发布新的产品、促销活动,不仅能够及时提醒用户品牌的存在,还可以引发用户的兴趣,增加品牌的曝光率。 选择最佳的发朋友圈时间段,以确保推广内容得到最大的曝光和关注,提高广告投放的效果…

录音怎么转换成mp3格式?支持二十多种格式

录音怎么转换成mp3格式?在我们的日常生活和工作中,录音是一项非常有用的工具,随着手机以及录音设备越来越普及化,让录音这件事情变得非常的简单,录音可以帮助我们解决非常多的事情。例如通过录音,我们可以记…

Redis十大数据类型

✅作者简介:大家好,我是Leo,热爱Java后端开发者,一个想要与大家共同进步的男人😉😉 🍎个人主页:Leo的博客 💞当前专栏: Java从入门到精通 ✨特色专栏&#xf…

无涯教程-JavaScript - CUMIPMT函数

描述 CUMIPMT函数返回start_period和end_period之间的贷款累计利息。 语法 CUMIPMT (rate, nper, pv, start_period, end_period, type)争论 Argument描述Required/OptionalRateThe interest rate.RequiredNperThe total number of payment periods.RequiredPvThe present …

SpringBoot原理-自动配置-概述

自动配置 SpringBoot的自动配置就是当Spring容器启动后,一些配置类、bean对象就会自动存入IOC容器中,不需要我们手动去声明,从而简化了开发,省去了繁琐的配置操作。启动一个SpringBoot项目后,观察如下

【C++杂货铺】优先级队列的使用指南与模拟实现

文章目录 一、priority_queue的介绍二、priority_queue的使用2.1 数组中的第k个最大元素 三、priority_queue模拟实现3.1 仿函数3.2 成员变量3.3 成员函数3.3.1 构造函数3.3.2 AdjustDown3.3.3 push3.3.4 AdjustUp3.3.5 pop3.3.6 empty3.3.7 size 四、结语 一、priority_queue的…