HyponymyExtraction
项目地址:https://github.com/liuhuanyong/HyponymyExtraction
HyponymyExtraction and Graph based on KB Schema, Baike-kb and online text extract, 基于知识概念体系,百科知识库,以及在线搜索结构化方式的词语上下位抽取.
项目介绍
上下位关系是语言学概念。概括性较强的单词叫做特定性较强的单词的上位词(hypernym),特定性较强的单词叫做概括性较强的单词的下位词(hyponym)。比如我们说,苹果是一种水果,苹果就是水果的一个下位词,也可以称为一个实例,而水果则是苹果的一个上位词,也可以称为一个类.
上下位这种语义关系是整个词汇语义关系中的一个重要内容,通过上下位关系,可以将世间万物进行组织和练联系起来,对于增进人们对某一实体或概念的认知上具有重要帮助
自然语言文本中存储着大量的上下位关系知识,如经过语言专家编辑整理形成的概念语义词典,如同义词词林,中文主题概念词典,hownet等,也存在开放百科知识平台当中,有效地利用这些信息,能够支持多项应用,如:
- 基于上下位关系的知识问答
- 基于上下位关系的知识推荐
- 基于上下位关系的文本理解
本项目主要解决第一个问题,本项目的应用场景是:用户输入一个需要了解的词语,后台通过查询既定知识库,从百百科知识库,在线非结构化文本中进行抽取,形成关于该词语的上下位词语网络,并以图谱这一清晰明了的方式展示出来.
本项目将采用三种方式来完成这一目标
1)基于既定知识库的直接查询,对应extract_kb
2)基于在线百科知识库的抽取,对应extract_baike
3)基于在线文本的结构化抽取,对应extract_text
项目分解
1)基于既定知识库的直接查询
使用方式:进入extract_kb, 设定需要查询的词word,指定python kb_search.py, 会生成相应的html文件,为最终展示结果
结果展示
苹果上下位
长江上下位
孔子上下位
2)基于在线百科的概念抽取
使用方式:进入extract_baike要查询的词word,指定python Baike_search.py, 会生成相应的html文件,为最终展示结果
结果展示
苹果上下位
小米上下位
姚明上下位
If any question about the project or me ,see https://liuhuanyong.github.io/
项目地址:https://github.com/liuhuanyong/HyponymyExtraction