AAAI 2018经典论文获奖者演讲：本体论的昨天和今天

本文转自公众号：AI科技评论。

AI 科技评论按：正在美国新奥尔良召开的 AAAI 2018 的经典论文奖颁给了《Algorithm and Tool for Automated Ontology Merging and Alignment》。这篇论文发表在 2000 年的第 17 届 AAAI 大会上。这次颁奖是为了表彰这篇论文在本体匹配和集成研究方面的先驱性贡献，论文中分析了这个问题的具体情况，并提出了首个创新的解决方案。组委会认为这篇论文直到今天也有重要意义，它非常清晰地定义了本体合并问题，并创造了启发式的工具来应对这个问题。

根据维基百科介绍，在计算机科学与信息科学领域，理论上，本体是指一种「形式化的，对于共享概念体系的明确而又详细的说明」。本体提供的是一种共享词表，也就是特定领域之中那些存在着的对象类型或概念及其属性和相互关系；或者说，本体就是一种特殊类型的术语集，具有结构化的特点，且更加适合于在计算机系统之中使用；或者说，本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达（formal representation）。本体是人们以自己兴趣领域的知识为素材，运用信息科学的本体论原理而编写出来的作品。本体一般可以用来针对该领域的属性进行推理，亦可用于定义该领域（也就是对该领域进行建模）。作为一种关于现实世界或其中某个组成部分的知识表达形式，本体论目前的应用领域包括：人工智能、语义网、软件工程、生物医学信息学、图书馆学以及信息架构。

趁获奖机会，AAAI 组委会邀请了论文作者之一的 Natasha Noy 进行演讲。当年论文发表时 Natasha Noy 还在斯坦福大学攻读，如今她就职于谷歌研究院。

AI 科技评论把演讲主要内容整理如下，并做了不改变原意的编辑和修改。

Natasha Noy：谢谢邀请我演讲，这是一次很有趣的机会。

当时研究这个问题的时候我还在斯坦福大学研究生物医学信息，当我们在研究神经细胞的时候遇到了这个问题。论文完成后投到 AAAI ，当告知被接收之时，我们也觉得很惊喜。在座的各位如果对自己的论文不是很有信心，其实也可以投投看，最坏还能怎么样呢。今天演讲主要包含以下四部分内容：

本体论的早期发展：需要合并，需要对齐

其实本体论的研究由来已久，它可以研究任何实物上的任何一个组成部分。它的定义可以看作是世界上任意两个事物之间的关系。到了上世纪 80-90 年代，人工智能的出现重新统一化了问题的形式。

这是当年的论文，也有那个时代定义的框架用来交换知识、正式地定义问题。如果让智能体能够对世界建立起正式的描述，而且理解这些描述，它们就有可能可以合作解决问题。

这种分享知识的想法在当时还很初级，现在已经迅速发展到了知识图谱；虽然听起来不太一样，但是其实和谷歌知识库是一回事。现在许多公司都有知识图谱，用它来描述关系和实体。

最初的本体论方法并不正式，现在已经发展得很正式。当时有两个问题在各种论坛上反复被讨论提及，一个是「本体论是什么？它需要变得有多正式？什么时候才能提取出确定性的内容？」在 AAAI 1999 的论坛上就讨论了这个问题。

另一个问题是「是否每个领域都需要一个独立的本体论，还是可以有一组共通的理论在所有领域内共享」，比如在金融、生物、医疗中的本体论是否相同。这个问题的两种观点当时都有很多人强烈支持，有一些针对单个领域的本体论提出后就得到了很多人支持，典型的例子比如基因领域，表达基因和生物函数的时候，不需要考虑别的麻烦的东西，直接使用基因的本体论就好了。