Variomes:支持基因组变异筛选的高召回率搜索引擎

《Bioinformatics》2022

Variomes:

https://candy.hesge.ch/Variomes

Source code:

https://github.com/variomes/sibtm-variomes

SynVar:

https://goldorak.hesge.ch/synvar

图片

文章摘要(Abstract)

动机(Motivation):识别和解释临床可操作的基因组变异是一个关键瓶颈。根据ASCO/AMP/CAP实践指南,搜索文献中的证据是必要的,但这项工作既耗时又容易出错。作者开发了一个系统,用于筛选与支持基于证据的决策相关的出版物,并且该系统还能对变异进行优先级排序。

结果(Results):通过三种不同的实验设置评估系统搜索效果:文献筛选、变异优先级排序和将Variomes与LitVar进行比较。结果显示,几乎三分之二的前五篇返回的出版物与临床决策支持相关。该方法能够在前三个结果中识别出81.8%的临床可操作变异。在对803个查询进行测试时,Variomes平均检索到比LitVar多21.3%的文章,并在90%的查询中返回与LitVar相同或更多的结果,从而为搜索有关变异的文献建立了新的基准。

可用性和实现(Availability and implementation):Variomes公开可用,源代码也可在GitHub获取,链接已放在文章开头。

引言(Introduction)

文章讨论了个性化医学的进步,使得能够选择针对特定肿瘤变异的治疗方法。基于肿瘤的分子谱和临床信息,可以更好地确定可能带来有利反应的治疗。

临床专家在生物信息学工具的帮助下,负责确定哪些变异是可操作的,即可能带来更好或更差的预后和治疗反应。

然而,手动筛选科学出版物存在挑战,如出版物数量庞大且不断增长,信息隐藏在非结构化文本中。

材料和方法(Materials and methods)

  • 作者介绍了系统架构,包括使用的科学文献集合、术语标准化、查询处理和排名策略;

  • 这些方法的结合使得Variomes能够高效地检索和排序与基因组变异相关的科学文献,支持临床决策和变体的解释工作;

  • 描述了实验评估设置,包括文献筛选、变异优先级排序和与LitVar的比较。

(1)数据处理:

使用医学术语对文献集合进行预处理,以提高匹配用户信息请求的效率和召回率。预处理包括将文档和注释加载到MongoDB中,并在ElasticSearch中建立索引。

(2)查询处理:

用户查询时,系统自动处理关键词,将其映射到医学术语,并使用专门的变体扩展系统(如SynVar)来扩展遗传变异。

图片

(3)排名策略:

系统采用两步查询系统:首先聚焦于召回率,收集与特定案例相关的大量文档;其次聚焦于精确度,对文档集合进行适当排名。

(4)文献集合的使用:

MEDLINE的摘要、PubMed Central的全文文章和ClinicalTrials.gov的临床试验数据。

(5)变体名称标准化:

由于变体名称在文献中可能以多种形式出现,使用特定的命名实体识别工具来标准化变体名称至关重要。

(6)搜索算法:

系统生成包含三个“必须”子句(针对变体、基因、诊断)的Elasticsearch查询,以及至少一个“应该”子句,以增加灵活性

(7)结果合并:

通过线性组合策略合并不同查询的结果,以提高搜索效果。

(8)性能调优:

使用TREC基准进行直接搜索,通过优化排名函数来调整系统性能,使用R-Prec、P5和infNDCG等指标。

(9)用户界面和API:

提供用户友好的界面和APIs,允许用户检索和操作数据

(10)集成到SVIP平台

Variomes服务集成到了SVIP(Swiss Variant Interpretation Platform)平台,这是一个瑞士的临床验证变体注释的国家存储库。

(11)错误分析与反馈系统:

进行了错误分析,以理解VarChat和LitVar的不同优势,并实现了用户反馈系统,以收集用户评价和改进建议。

结果和讨论(Results and discussion)

系统调整基于五个步骤,包括约束放松策略、命名实体类型密度、人口统计学一致性、预定义关键词的评分以及所有策略的线性组合。

实验设置1(文献筛选)显示,系统在前五篇返回的摘要中,有近三分之二被判断为相关。

实验设置2(变异优先级排序)显示,P5(前五个结果中的精确度)为25%,R-Prec(R-Precision)为71.4%。

实验设置3(与LitVar的比较)显示,Variomes在检索到的文章数量上优于LitVar,并且具有更低的无结果查询比例。

结论(Conclusion)

Variomes是一个有效的工具,用于检索与变异相关的文献,并为检索基因组变异设定了新的标准。该系统特别适用于单核苷酸变异,对于大多数SNV查询,P5都大于80%。

图片

文章整体上提供了一个用于支持基因组变异文献筛选的高召回搜索引擎的设计、实现和评估,旨在提高临床可操作变异的识别和解释效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/51189.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电子电气架构--- 智能汽车电子架构的核心诉求

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗你的人和事,多看一眼都是你的不…

8.23工作感悟 关于div样式

一、关于div 样式嵌套在el-dialog框里面,如何让div框里面的东西,例如图片的大小不超出dialog框 首先对div框进行一个自定义class ‌div的class属性‌用于为div元素指定一个或多个类名,类名之间用空格分隔。类名可以在CSS样式表中使用,以定…

统计Statistics | AnyLogic 帮助

统计Statistics | AnyLogic 帮助 统计对象计算一系列数据样本的统计信息(平均值、最小值、最大值等),数据类型为double。 根据数据被视为离散还是连续,对象的工作原理不同。 演示模型: 观测次数的统计函数打开AnyL…

【经验】linux下cuda的更换

linux下cuda的更换 查看当前cuda和cudnn的版本 nvcc -Vcudnn版本 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2下载对应版本的cuda 查看驱动版本535.54.03 下载对应的cuda版本 版本查看https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.htm…

内存管理篇-02内存硬件电路和接口

1. 内存硬件实现机制 通过D触发器构建寄存器和内存的结构对比,这里主要先表达sram复杂,dram简单。 2. sram和ddr sdram结构图对比 主要是想对比sram和dram在和CPU连接过程的差异。sram需要的地址线较多,dram需要的较少,但是需要多次发送&…

货车制造5G智能工厂工业物联数字孪生平台,推进制造业数字化转型

货车制造5G智能工厂工业物联数字孪生平台,推进制造业数字化转型。随着5G技术的飞速发展与工业物联网的深度融合,货车制造5G智能工厂工业物联数字孪生平台应运而生,它不仅重新定义了生产模式,更以强大的技术驱动力,推动…

python 实现quantum entanglement量子纠缠算法

quantum entanglement量子纠缠算法介绍 量子纠缠(Quantum Entanglement)是量子力学中的一种奇特现象,它描述了两个或多个量子比特(qubit)之间的非经典、紧密的关联关系。这种关联关系在量子计算中起着关键作用&#x…

[数据集][目标检测]电力场景输电线防震锤检测数据集VOC+YOLO格式2721张2类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2721 标注数量(xml文件个数):2721 标注数量(txt文件个数):2721 标注…

Qt实现json数据的生成、解析、修改和删除

文章介绍 本文章主要介绍如何使用QT提供的json相关类来处理json数据&#xff0c;包括json数据的生成、解析、修改和json数据的删除。 json数据的增删改查 处理json数据时需要包含以下三个头文件 #include <QJsonDocument>#include <QJsonObject>#include <QJ…

react 路由创建与使用

1, 安装路由 npm i react-router-dom2&#xff0c;路由组件 createBrowserRouter // router/index.js import { createBrowserRouter } from "react-router-dom"import Home from ../page/home import New from ../page/newconst router createBrowserRouter([{pa…

武汉流星汇聚:亚马逊领跑全球电商,中国卖家迎来前所未有机遇窗口

在数字经济的浪潮中&#xff0c;亚马逊如同一艘巨轮&#xff0c;乘风破浪&#xff0c;引领着全球电商行业的航向。其每月近30亿次的访问量&#xff0c;不仅彰显了其在全球市场的强大影响力&#xff0c;更为中国卖家提供了前所未有的发展机遇。在这个平台上&#xff0c;中国卖家…

Unity URP Shader 修改深度让人物不再被地面遮挡

Unity URP Shader 修改深度让人物不再被地面遮挡 前言项目场景布置代码编写 前言 遇到一个小问题&#xff0c;人物总是被XY平面的地面遮挡&#xff0c;于是在Shader中改一下深度输出&#xff0c;这样地面再也不会挡住人物了。 项目 场景布置 将人物放到XY平面的后面 配置S…

搭建NFS服务器

搭建NFS服务器 记录linux下搭建使用NFS服务器的一般步骤&#xff0c;以ubuntu20.04和centos7.9操作进行记录。 1. 安装 NFS 服务器 运行以下命令安装 NFS 服务器。 # ubuntu下安装 sudo apt-get update sudo apt install nfs-kernel-server # 配置服务 sudo systemctl start …

第 13 章 JavaScript基本包装类型

第 13 章 JavaScript基本包装类型 1.基本包装类型概述 2.Boolean 类型 3.Number 类型 4.String 类型 为了便于操作基本类型值&#xff0c;ECMAScript 提供了 3 个特殊的引用类型&#xff1a;Boolean、Number和 String。这些类型与其他引用类型相似&#xff0c;但同时也具有…

EehCache介绍、应用场景和示例代码

EhCache 概述 EhCache 是一个高性能、轻量级的 Java 缓存库&#xff0c;广泛应用于各种 Java 应用中。EhCache 提供了丰富的功能&#xff0c;包括内存缓存、磁盘缓存、分布式缓存、持久化等&#xff0c;并且可以和 Spring 框架无缝集成。它支持基于内存和磁盘的混合存储&#…

除了按值和引用,方法参数的第三种传递方式

一、官方描述 三种参数传递方式并非我们杜撰出来的&#xff0c;而是写在.NET最核心的规范文档ECMA-355中&#xff08;I.12.4.1.5&#xff09;&#xff0c;原文如下&#xff1a; The CLI supports three kinds of parameter passing, all indicated in metadata as part of the …

WPS宏实现一个表格拆分成多个表格的功能

把首列名称中一样的分别创建该名称时间戳的新表格&#xff0c;比如有个表格存储各个省的信息&#xff0c;江苏的有50行数据&#xff0c;山西的55行数据等等&#xff0c;这个就是把江苏的创建一个新表保存&#xff0c;山西的创建一个新表格保存。里面主要是表格的创建与关闭相关…

Nginx 优化与防盗链

文章目录 Nginx 优化与防盗链一、隐藏版本号1.1 修改配置文件方式1.1.1 操作步骤 1.2 修改源码方式1.2.1 操作步骤 二、修改用户与组2.1 操作步骤 三、缓存时间3.1 操作步骤 四、日志切割4.1 操作步骤 五、连接超时5.1 操作步骤 六、更改进程数6.1 操作步骤 七、配置网页压缩7.…

【论文分享】Graviton: Trusted Execution Environments on GPUs 2018’OSDI

目录 AbstractIntroductioncontributions BackgroundGPUSoftware stackHardwareContext and channel managementCommand submissionProgramming modelInitializationMemory allocationHost-GPU transfersKernel dispatch Sharing Intel SGX Threat ModelOverviewGraviton Archi…

CLIP-VIT-L + Qwen 多模态源码阅读 - 语言模型篇(3)

多模态学习笔记 - 语言模型篇&#xff08;3&#xff09; 参考repo:WatchTower-Liu/VLM-learning; url: VLLM-BASE 吐槽 今天接着昨天的源码继续看&#xff0c;黑神话&#xff1a;悟空正好今天发售&#xff0c;希望广大coder能玩的开心~ 学习心得 前情提要 详情请看多模态…