Variomes:支持基因组变异筛选的高召回率搜索引擎

《Bioinformatics》2022

Variomes:

https://candy.hesge.ch/Variomes

Source code:

https://github.com/variomes/sibtm-variomes

SynVar:

https://goldorak.hesge.ch/synvar

图片

文章摘要(Abstract)

动机(Motivation):识别和解释临床可操作的基因组变异是一个关键瓶颈。根据ASCO/AMP/CAP实践指南,搜索文献中的证据是必要的,但这项工作既耗时又容易出错。作者开发了一个系统,用于筛选与支持基于证据的决策相关的出版物,并且该系统还能对变异进行优先级排序。

结果(Results):通过三种不同的实验设置评估系统搜索效果:文献筛选、变异优先级排序和将Variomes与LitVar进行比较。结果显示,几乎三分之二的前五篇返回的出版物与临床决策支持相关。该方法能够在前三个结果中识别出81.8%的临床可操作变异。在对803个查询进行测试时,Variomes平均检索到比LitVar多21.3%的文章,并在90%的查询中返回与LitVar相同或更多的结果,从而为搜索有关变异的文献建立了新的基准。

可用性和实现(Availability and implementation):Variomes公开可用,源代码也可在GitHub获取,链接已放在文章开头。

引言(Introduction)

文章讨论了个性化医学的进步,使得能够选择针对特定肿瘤变异的治疗方法。基于肿瘤的分子谱和临床信息,可以更好地确定可能带来有利反应的治疗。

临床专家在生物信息学工具的帮助下,负责确定哪些变异是可操作的,即可能带来更好或更差的预后和治疗反应。

然而,手动筛选科学出版物存在挑战,如出版物数量庞大且不断增长,信息隐藏在非结构化文本中。

材料和方法(Materials and methods)

  • 作者介绍了系统架构,包括使用的科学文献集合、术语标准化、查询处理和排名策略;

  • 这些方法的结合使得Variomes能够高效地检索和排序与基因组变异相关的科学文献,支持临床决策和变体的解释工作;

  • 描述了实验评估设置,包括文献筛选、变异优先级排序和与LitVar的比较。

(1)数据处理:

使用医学术语对文献集合进行预处理,以提高匹配用户信息请求的效率和召回率。预处理包括将文档和注释加载到MongoDB中,并在ElasticSearch中建立索引。

(2)查询处理:

用户查询时,系统自动处理关键词,将其映射到医学术语,并使用专门的变体扩展系统(如SynVar)来扩展遗传变异。

图片

(3)排名策略:

系统采用两步查询系统:首先聚焦于召回率,收集与特定案例相关的大量文档;其次聚焦于精确度,对文档集合进行适当排名。

(4)文献集合的使用:

MEDLINE的摘要、PubMed Central的全文文章和ClinicalTrials.gov的临床试验数据。

(5)变体名称标准化:

由于变体名称在文献中可能以多种形式出现,使用特定的命名实体识别工具来标准化变体名称至关重要。

(6)搜索算法:

系统生成包含三个“必须”子句(针对变体、基因、诊断)的Elasticsearch查询,以及至少一个“应该”子句,以增加灵活性

(7)结果合并:

通过线性组合策略合并不同查询的结果,以提高搜索效果。

(8)性能调优:

使用TREC基准进行直接搜索,通过优化排名函数来调整系统性能,使用R-Prec、P5和infNDCG等指标。

(9)用户界面和API:

提供用户友好的界面和APIs,允许用户检索和操作数据

(10)集成到SVIP平台

Variomes服务集成到了SVIP(Swiss Variant Interpretation Platform)平台,这是一个瑞士的临床验证变体注释的国家存储库。

(11)错误分析与反馈系统:

进行了错误分析,以理解VarChat和LitVar的不同优势,并实现了用户反馈系统,以收集用户评价和改进建议。

结果和讨论(Results and discussion)

系统调整基于五个步骤,包括约束放松策略、命名实体类型密度、人口统计学一致性、预定义关键词的评分以及所有策略的线性组合。

实验设置1(文献筛选)显示,系统在前五篇返回的摘要中,有近三分之二被判断为相关。

实验设置2(变异优先级排序)显示,P5(前五个结果中的精确度)为25%,R-Prec(R-Precision)为71.4%。

实验设置3(与LitVar的比较)显示,Variomes在检索到的文章数量上优于LitVar,并且具有更低的无结果查询比例。

结论(Conclusion)

Variomes是一个有效的工具,用于检索与变异相关的文献,并为检索基因组变异设定了新的标准。该系统特别适用于单核苷酸变异,对于大多数SNV查询,P5都大于80%。

图片

文章整体上提供了一个用于支持基因组变异文献筛选的高召回搜索引擎的设计、实现和评估,旨在提高临床可操作变异的识别和解释效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/51189.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电子电气架构--- 智能汽车电子架构的核心诉求

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗你的人和事,多看一眼都是你的不…

8.23工作感悟 关于div样式

一、关于div 样式嵌套在el-dialog框里面,如何让div框里面的东西,例如图片的大小不超出dialog框 首先对div框进行一个自定义class ‌div的class属性‌用于为div元素指定一个或多个类名,类名之间用空格分隔。类名可以在CSS样式表中使用,以定…

统计Statistics | AnyLogic 帮助

统计Statistics | AnyLogic 帮助 统计对象计算一系列数据样本的统计信息(平均值、最小值、最大值等),数据类型为double。 根据数据被视为离散还是连续,对象的工作原理不同。 演示模型: 观测次数的统计函数打开AnyL…

【经验】linux下cuda的更换

linux下cuda的更换 查看当前cuda和cudnn的版本 nvcc -Vcudnn版本 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2下载对应版本的cuda 查看驱动版本535.54.03 下载对应的cuda版本 版本查看https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.htm…

内存管理篇-02内存硬件电路和接口

1. 内存硬件实现机制 通过D触发器构建寄存器和内存的结构对比,这里主要先表达sram复杂,dram简单。 2. sram和ddr sdram结构图对比 主要是想对比sram和dram在和CPU连接过程的差异。sram需要的地址线较多,dram需要的较少,但是需要多次发送&…

货车制造5G智能工厂工业物联数字孪生平台,推进制造业数字化转型

货车制造5G智能工厂工业物联数字孪生平台,推进制造业数字化转型。随着5G技术的飞速发展与工业物联网的深度融合,货车制造5G智能工厂工业物联数字孪生平台应运而生,它不仅重新定义了生产模式,更以强大的技术驱动力,推动…

[数据集][目标检测]电力场景输电线防震锤检测数据集VOC+YOLO格式2721张2类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2721 标注数量(xml文件个数):2721 标注数量(txt文件个数):2721 标注…

武汉流星汇聚:亚马逊领跑全球电商,中国卖家迎来前所未有机遇窗口

在数字经济的浪潮中,亚马逊如同一艘巨轮,乘风破浪,引领着全球电商行业的航向。其每月近30亿次的访问量,不仅彰显了其在全球市场的强大影响力,更为中国卖家提供了前所未有的发展机遇。在这个平台上,中国卖家…

Unity URP Shader 修改深度让人物不再被地面遮挡

Unity URP Shader 修改深度让人物不再被地面遮挡 前言项目场景布置代码编写 前言 遇到一个小问题,人物总是被XY平面的地面遮挡,于是在Shader中改一下深度输出,这样地面再也不会挡住人物了。 项目 场景布置 将人物放到XY平面的后面 配置S…

【论文分享】Graviton: Trusted Execution Environments on GPUs 2018’OSDI

目录 AbstractIntroductioncontributions BackgroundGPUSoftware stackHardwareContext and channel managementCommand submissionProgramming modelInitializationMemory allocationHost-GPU transfersKernel dispatch Sharing Intel SGX Threat ModelOverviewGraviton Archi…

设计模式笔记01(java版)

文章目录 设计模式概述学习设计模式的必要性设计模式分类创建型模式结构型模式行为型模式 UML类图概述类图的作用类图表示法类的表示方式类与类之间关系的表示方式1,单向关联2,双向关联3,自关联聚合关系组合关系依赖关系继承关系实现关系 软件…

Pytorch 张量运算函数(补充)

mean() mean()函数是进行张量均值计算的函数,常用参数可以设置参数dim来进行对应维度的均值计算 以下是使用一个二维张量进行演示的例子 import numpy as np import torch device torch.device(mps if torch.backends.mps.is_available() else cpu) print(device ) data1 …

C++ | Leetcode C++题解之第367题有效的完全平方数

题目&#xff1a; 题解&#xff1a; class Solution { public:bool isPerfectSquare(int num) {double x0 num;while (true) {double x1 (x0 num / x0) / 2;if (x0 - x1 < 1e-6) {break;}x0 x1;}int x (int) x0;return x * x num;} };

linux系统,ubuntu安装英伟达NVIDIA4090显卡驱动

文章目录 前言下载英伟达NVIDIA官方驱动安装NVIDIA驱动远程安装关闭交互界面设置权限&#xff08;自己确认版本号5&#xff09;安装&#xff08;自己确认版本号5&#xff09;打开交互界面&#xff0c;并重启系统验证是否安装成功 异常处理问题1问题2问题3&#xff08;可能没解决…

python小游戏——躲避球(可当课设)

游戏简介&#xff1a; 没有美术&#xff0c;画面简洁&#xff08;懒得做&#xff09;。玩家控制小球躲避敌人&#xff08;上下左右&#xff0c;闪避&#xff09;&#xff0c;敌人体积越大速度越慢&#xff0c;随机生成道具球&#xff08;目前只有生命球&#xff09;&#xff0…

​14:00面试,14:06就出来了,问的问题有点变态。。。

从小厂出来&#xff0c;没想到在另一家公司又寄了。 到这家公司开始上班&#xff0c;加班是每天必不可少的&#xff0c;看在钱给的比较多的份上&#xff0c;就不太计较了。没想到5月一纸通知&#xff0c;所有人不准加班&#xff0c;加班费不仅没有了&#xff0c;薪资还要降40%…

Redis内存淘汰

Redis内存淘汰 Redis可以存储多少数据 maxmemory配置&#xff0c;默认是注释掉的。 #maxmemory <bytes>我们可以主动配置maxmemory&#xff0c;maxmemory支持各种单位&#xff0c;默认是字节 maxmemory 1024 maxmemory 1024KB maxmemory 1024MB maxmemory 1024GB当Re…

shallowReactive 与 shallowRef

除了之前的 ref与reactive 之外&#xff0c;Vue3 还准备了另外两个API&#xff0c;也是用来对响应式数据做处理&#xff0c;那就是 shallowReactive 与 shallowRef shallowReactive 文档解释&#xff1a;reactive() 的浅层作用形式&#xff0c;只能定义对象类型的数据。和 r…

Spring Boot整合Sentry

Spring Boot整合Sentry Sentry搭建Sentry中新建项目集成SpringBoot1. 添加依赖2. 配置Sentry4. 日志集成&#xff08;可选&#xff09;5. 测试Sentry集成6. 配置实时告警配置Alert Settings配置警报规则 发送消息服务代码参照文档 Sentry 是一个日志平台&#xff0c;分为客户端…

CMakeLists.txt模板

#设置编译该CMakeLists.txt文件所需要的最低cmake版本 CMAKE_MINIMUM_REQUIRED(VERSION 最低版本号)# 该项目名称 PROJECT(项目名称)SET(CMAKE_CXX_STANDARD 11)SET(CMAKE_C_STANDARD 11)# 此行可以理解为将路径下所有的文件装载到自定义集合filelist中 FILE(GLOB filelist &q…