本文转载自公众号:PKU自然语言处理前沿。
近日,由北京大学互联网信息工程研发中心(CIRE)开发的英语医学知识图谱英文抗生素药物医学知识图谱IASO1.0发布,面向公众正式开放试用。IASO是利用自然语言处理与文本挖掘技术,基于大规模医学文本数据,以人机结合的方式研发的英文药物医学知识图谱。
IASO知识图谱基于DO,IDO,NCBI,HPO和DrugBank等数据库,以及在线百科,权威医学文献等高质量医学数据资源构建而成的。涵盖507种传染病及其治疗方法,332个不同的感染部位,936种系统相关症状,371种并发症,838,407种细菌,341种抗生素及其介绍,1,504对抗生素和细菌之间的反应速率(抗菌谱),431对药物相互作用关系,以及86对抗生素特异性群体的禁忌关系。
基于药物医学知识图谱IASO,课题组还进行了药物开发中的关键一环——药物相似性计算的相关探索,包括研究抗生素与其副作用之间的关系和探讨NDF-RT药物基本药理学特性的作用机制等。为验证基于IASO的药物相似性计算的准确性,我们邀请至少3名医生对1326对最常用的抗生素进行了标注,其范围为[0,1]。每位医生所给评分与平均评分之间的Pearson系数范围为0.827至0.864, Spearman系数范围为0.792至0.888,均证明了医生评估的可靠性。
课题组未来还将不断添加更多的医学实体及其层次化类别信息,继续迭代更新完善知识图谱,欢迎大家多提宝贵意见!在未来的工作中,我们将致力于建立大规模、高质量的中文/英文医学知识图谱,为智能医学奠定专业知识基础。
附1:IASO 1.0链接:
http://www.iasokg.com/
附2:IASO药物知识图谱和药物相似性数据标注下载:
http://www.iasokg.com/dataDownload#dataSet
欢迎大家试用并提出宝贵意见!IASO仅供学术研究使用,不做商业用途。
研发者团队
北京大学互联网信息工程研发中心(CIRE):雷凯副教授、沈颖助理研究员、研究生袁凯琦、温德斯、张丽珠、陈道源、邓扬、戴竞超、黄济乐。
雷凯
1998年毕业于北京大学计算机系,获学士学位;1999年毕业于美国哥伦比亚大学计算机系,获硕士学位;2015年毕业于北京大学计算机系统结构专业,获博士学位。现为北京大学深圳研究生院信息工程学院副教授。
沈颖
2011年7月获欧盟Erasmus Muduns自然语言处理(英国/法国)双硕士学位。2015年7月获法国巴黎第十大学医学信息学博士。2017年9月于北京大学深圳研究生院继续科研工作。主要研究方向包括医学信息学,自然语言处理,数据挖掘,机器学习,人工智能等。
OpenKG
开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
点击阅读原文,进入 OpenKG 博客。