领域应用 | OMAHA联盟发布“疾病临床表现”、“中毒”知识图谱及OMAHA知识库

转载公众号 | OMAHA联盟


资源发布

OMAHA已建立“七巧板”医学术语集、“汇知”医学知识图谱、元数据等资源,将于每月发布其中一项。具体各项发布时间为:“七巧板”术语集于每季度第一个月20日发布, “汇知”图谱于每季度第二个月20日发布,元数据于每季度第三个月20日发布。敬请关注!

“汇知”医学知识图谱是OMAHA联盟发布的医学知识图谱资源的总称,主要切入疾病、手术操作、检验检查、药品的知识,在每个季度第二个月20号定期发布。截止2020年11月,“汇知”图谱已发布“药品适应证”、“临床路径”、“疾病科室”、“心血管专科疾病”和“新型冠状病毒肺炎”领域知识图谱。本季度首次发布“疾病临床表现”、“中毒”知识图谱及OMAHA知识库,并更新发布“药品适应证”知识图谱。

  ◆  ◆

新发布图谱资源

“疾病临床表现”知识图谱

近年来,医学知识图谱很重要的应用方向之一就是医学领域的问答系统,例如医院的智能导诊机器人、线上挂号和线上问诊等系统。互联网诊疗中的问诊系统通过提取用户问题中的关键词,以医学知识图谱为支撑,形成答案返回给用户。它的本质就是通过在医学知识图谱中查询“疾病-临床表现”关系来完成患者的自查。新冠疫情的出现让越来越多人开始选择线上就诊。基于此需求,联盟启动了“疾病临床表现”知识图谱构建工作,希望可以助力问答等相关产品的开发。

“疾病临床表现”知识图谱共包含1.5万实体,8.0万三元组,其中0.6万实体与“七巧板”医学术语集建立映射。“疾病临床表现”知识图谱关系模型见图1。

图1:“疾病临床表现”知识图谱关系模型

“中毒”知识图谱

据《中国统计年鉴(2020)》显示,中毒作为部分地区城市和农村居民前5位的死因一直受到大众的关注。以“中毒”知识图谱为支撑的医学人工智能系统,可以辅助医生鉴别诊断中毒患者,有效缩短诊断时间。尤其在急诊环境中,可以协助没有处理经验的医护人员快速开展救治工作,挽救更多的生命。基于此需求,联盟启动了“中毒”知识图谱构建工作。该图谱包含0.5万实体,2.4万三元组,其中0.2万实体与“七巧板”医学术语集建立映射。“中毒”知识图谱关系模型见图2。

图2:“中毒”知识图谱关系模型

OMAHA知识库

为了使服务机构能够更便捷地合并使用“汇知”医学知识图谱及“七巧板”医学术语集数据资源,联盟于2021年第一季度开始发布OMAHA知识库资源包,发布时间与“汇知”图谱保持一致,为每个季度第二个月20号,1年发布4次。OMAHA知识库包含最新版“汇知”图谱及“七巧板”术语集数据,并遵循“汇知”图谱发布文件规范。本次OMAHA知识库共发布102万实体,587万三元组

  ◆  ◆

更新发布图谱资源

“药品适应症”知识图谱

为了更好地满足临床合理用药需求,联盟于2019年启动“药品适应证”知识图谱构建工作,并于同年9月首次发布“药品适应证”知识图谱。本次更新发布的“药品适应证”知识图谱共包含3.7万实体, 43.0万三元组,其中2.4万实体与“七巧板”医学术语集映射。更新内容如下:

  • 新增《国家基本医疗保险、工伤保险和生育保险药品目录(2020年)》中的医保支付类别和剂型关系;

  • 新增收录国家和各省医保药品目录中的药品实体;

  • 新增收录国家药品编码本位码(截至2020年12月31日)中的药品实体。

 

在根据国家和各省医保药品目录构建图谱时,发现有部分药品名称不严谨或不具有临床适用性,有少部分药品暂无查找到可靠来源的药品说明书。基于这些问题,在构建图谱时采取了一定的解决措施,详细情况请见表1。

序号

问题类型

涉及数量

 解决措施

1

药品名称不严谨,例如《广西基本医疗保险、工伤保险和生育保险药品目录(2020年版)》中的“感冒清颗粒”,正确名称应该为“感冒清热颗粒”。

24

已将相应的药品实体名称修正。

2

未找到可靠来源的药品说明书,例如《北京市基本医疗保险工伤保险和生育保险药品目录(2017年版)》中的“冠心丹参丸”。

33

继续跟进收集这些药品的说明书,收集后再进一步完善图谱。

3

药品名称不具有临床适用性,例如《国家基本医疗保险、工伤保险和生育保险药品目录(2020年版)》中的“替加氟氯化钠”,临床常用药品名称是“替加氟氯化钠注射液”。

909

以临床常用药品名称为实体构建适应证关系。

表1:基于国家和各省医保药品目录构建药品适应证关系时发现的问题及解决措施汇总

更多“汇知”医学知识图谱的信息您可以登陆HiTA服务平台(hita.omaha.org.cn)进行了解。

“汇知”医学知识图谱发展历程

  • 2019年8月医学知识图谱Schema模型发布

  • 2019年9月“药品-适应证”知识图谱发布

  • 2020年5月“临床路径”知识图谱发布

  • 2020年8月“疾病-科室”知识图谱、“心血管系统疾病”知识图谱发布

  • 2020年11月“药品适应证”知识图谱更新及新型冠状病毒肺炎诊疗知识图谱发布

  • 2021年2月 首次发布“疾病临床表现”、“中毒”知识图谱及OMAHA知识库

  • 2021年5月即将发布更多知识图谱,敬请期待……

 

联系我们

HiTA服务:hita@omaha.org.cn

数字医学知识中心负责人徐美兰:meilan.xu@omaha.org.cn

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478478.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

聊聊推荐系统中的偏差

文 | 成指导源 | 知乎背景推荐系统中大量使用用户行为数据,作为系统学习的标签或者说信号。但用户行为数据天生存在各式各样的偏差(bias),如果直接作为信号的话,学习出的模型参数不能准确表征用户在推荐系统中的真实行…

云端的SRE发展与实践

本文根据作者在美团点评第21期技术沙龙的分享记录整理而成。 SRE(Site Reliability Engineering)是Google于2003年提出的概念,将软件研发引入运维工作。现在渐渐已经成为各大互联网公司技术团队的标配。 美团点评作为综合性多业务的互联网生活…

一种单独适配于NER的数据增强方法:DAGA

链接:http://www.elecfans.com/d/1468784.html 本文首先介绍传统的数据增强在NER任务中的表现,然后介绍一种单独适配于NER的数据增强方法,这种方法生成的数据更具丰富性、数据质量更高。0 前言 在NLP中有哪些数据增强技术?这一定是…

LeetCode 80. 删除排序数组中的重复项 II

1. 题目 给定一个排序数组,你需要在原地删除重复出现的元素,使得每个元素最多出现两次,返回移除后数组的新长度。 不要使用额外的数组空间,你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。 来源:力扣…

技术沙龙 | 图神经网络(GNN)最新研究进展分享

由于深度学习在可推理和可解释性方面的局限性,结合图计算与深度学习的图神经网络 ( GNN ) 成为近期学术界和工业界研究的热点新方向之一,并在社交网络、推荐系统等领域得到了广泛的应用。本次技术沙龙,由北京邮电大学 GAMMA Lab 博士生纪厚业…

科研福利!国内TOP3的超算中心,免费领2000核时计算资源

长久以来,超级计算机一直是各国竞相角逐的科技制高点,也是国家综合科技实力的体现,尤其是近几年,中国和美国在超算领域的竞争已经进入“白热化”。2020年,我国超级计算机在《全球超级计算机500强榜单》中首次超越美国&…

深度学习在美团推荐平台排序中的运用

美团作为国内最大的生活服务平台,业务种类涉及食、住、行、玩、乐等领域,致力于让大家吃得更好,活得更好,有数亿用户以及丰富的用户行为。随着业务的飞速发展,美团的用户和商户数在快速增长。在这样的背景下&#xff0…

LeetCode 451. 根据字符出现频率排序(map+优先队列)

1. 题目 给定一个字符串,请将字符串里的字符按照出现的频率降序排列。 输入: "tree"输出: "eert"2. 优先队列解题 先用map统计字符出现次数再将字符何其次数插入优先队列出队 struct cmp { //写在类内也可以,写在函数里也行bool…

论文浅尝 - AAAI2020 | 小样本知识图谱补全

笔记整理 | 刘克欣,天津大学硕士链接:https://arxiv.org/pdf/1911.11298.pdf动机知识图谱对于许多下游应用(例如搜索,知识问答和语义网)至关重要。然而,现有知识图谱面临不完整的问题。知识图谱补全工作能让…

ACL 2021|美团提出基于对比学习的文本表示模型,效果提升8%

文 | 渊蒙 如寐 思睿等尽管基于BERT的模型在NLP诸多下游任务中取得了成功,直接从BERT导出的句向量表示往往被约束在一个很小的区域内,表现出很高的相似度,因而难以直接用于文本语义匹配。为解决BERT原生句子表示这种“坍缩”现象,…

Android远程调试的探索与实现

作为移动开发者,最头疼的莫过于遇到产品上线以后出现了Bug,但是本地开发环境又无法复现的情况。常见的调查线上棘手问题方式大概如下: 方法优点缺点联系用户安装已添加测试日志的APK方便定位问题需要用户积极配合,如果日志添加不全…

超硬核 ICML’21 | 如何使自然语言生成提速五倍,且显存占用减低99%

文 | 炼丹学徒编 | 小轶我们忽略掉引言和介绍,直接把工作的效果丢上来,相信就足够令自然语言生成的相关同学心动——对于任何一个已有的Transformer生成模型,只需根据本文算法更改attention的计算顺序,就可以实现成倍速度提升&…

论文浅尝 | Convolutional 2D knowledge graph embedding

笔记整理 | 孙悦,天津大学1. 介绍:知识图的链接预测是预测实体之间缺失关系的任务。先前有关链接预测的工作集中在浅,快速的模型上,这些模型可以缩放到大型知识图例如基于基于平移变换的 TransE 系列。但是,这些模型比…

sysbench在美团点评中的应用

如何快速入门数据库?以我个人经验来看,数据库功能和性能测试是一条不错的捷径。当然从公司层面,数据库测试还有更多实用的功能。这方面,美团点评使用的是知名工具sysbench,主要是用来解决以下几个问题: 统一…

[中文事件抽取]DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Lab

[中文事件抽取]DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Lab: ACL 2018DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Labeled Training DataAuthorHang Yang, Yu…

论文浅尝 - ACL2020 | 通过集成知识转换进行多语言知识图谱补全

笔记整理 | 谭亦鸣,东南大学博士生概述预测图谱中缺失的事实(fact)是知识图谱构建与推理中的一个重要任务,近年来也被许多KG embedding研究的关注对象。虽然目前的KG embedding方法主要学习和预测的是单个图谱中的事实,但是考虑到KG之间不同规…

LsLoader——通用移动端Web App离线化方案

由于JavaScript(以下简称JS)语言的特性,前端作用域拆分一直是前端开发中的首要关卡。从简单的全局变量分配,到RequireJS实现的AMD模块方式,browserify/webpack实现的静态引用方式。前端的业务逻辑也从一个个精心按顺序…

ACL'21 | debug完的神经网络,如何测试是否仍然存在bug?

文 | Sherry回归测试熟悉软件工程的小伙伴们一定知道回归测试:修改了旧代码后,重新进行测试以确认修改没有引入新的错误或导致其他代码产生错误。它可以大幅降低系统测试、维护升级等阶段的成本。随着深度学习网络的不断发展,越来越多的系统都…

LeetCode 198. 打家劫舍(DP)

1. 题目 你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统,如果两间相邻的房屋在同一晚上被小偷闯入,系统会自动报警。 给定一个代表每个房屋存…

论文浅尝 - ACL2020 | 利用常识知识图对会话流进行显式建模

笔记整理 | 韩振峰,天津大学硕士链接:https://arxiv.org/pdf/1911.02707.pdf动机人类对话自然地围绕相关概念发展,并分散到多跳概念。本文提出了一种新的会话生成模型——概念流(ConceptFlow),它利用常识知识图对会话流进行显式建…