本文转载自公众号:大数据创新学习中心。
3月10日,美团点评AI Lab NLP负责人王仲远博士,给大家进行了题为“基于概念化的短文本理解(Conceptualization for Short Text Understanding)”的报告。
王博士的这次报告主要分为3个步骤:通过理解短文本问题,引出知识图谱概念;讲解知识图谱的技术;以及应用场景。
他首先从通俗易懂的小例子入手,讲解了短文本。短文本比较稀疏,而且是充满噪音并包含歧义的。由于这样的特性,传统方法使得机器对短文本理解十分困难。并指出了当前搜索引擎面临的诸多问题。人类由于额外知识源,对于这种短文本的理解却很容易。
按照人类理解问题和回答问题的过程,可以将知识分两类—常识性知识和百科全书式知识(区别如下图)
而后,通过生动的例子讲解指出人们对于短文本的理解,会将它们映射到一个概念空间,再根据上下文进行推理。
紧接着,指出将常识知识加入到计算推理中
以实例讲解“概念化”:将文本映射到概念的空间。
又以例子具体讲解相关技术,如对实体进行正确的推理,挖掘字典关系,构建概念模型以及需要注意的事项等。
最后,王博士讲了这些技术的实际应用场景结束了这次精彩的汇报演讲。
OpenKG.CN
中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。