深度学习如何集成领域知识?IBM研究等《知识增强深度学习》综述,全面阐述科学与经验知识增强的深度学习...

8dc8ad75bfaaaa6fde038b9b8570b61d.png

来源:专知

尽管在过去的几年里,深度学习模型在许多不同的领域取得了巨大的成功,但通常数据匮乏,在不可见的样本上表现不佳,而且缺乏可解释性。目标领域往往存在各种先验知识,利用这些先验知识可以弥补深度学习的不足。为了更好地模仿人类大脑的行为,人们提出了不同的先进方法来识别领域知识并将其集成到深度模型中,以实现数据高效、可泛化和可解释的深度学习,称为知识增强深度学习(KADL)。

ed82a6e4848fbed8b6764c7fe18d2e9d.jpeg

在本综述中,我们定义了KADL的概念,并介绍了它的三个主要任务,即: 知识识别、知识表示和知识整合。与现有的专注于特定类型知识的综述不同,我们提供了领域知识及其表示的广泛而完整的分类法。基于我们的分类法,我们对现有的技术进行了系统的回顾,不同于现有的综述集成方法对知识分类法的不可知的工作。该综述包含了现有的工作,并提供了知识增强深度学习一般领域的研究概览。对大量论文的全面和批判性的回顾不仅有助于了解当前的进展,而且有助于确定知识增强深度学习的未来研究方向。

1. 概述

尽管现有的深度模型在各个领域都取得了令人印象深刻的性能,但它们存在一些严重的缺陷,包括数据依赖性高和泛化[1]差。这些缺陷主要源于模型的数据驱动特性以及它们无法有效利用领域知识。为了解决这些限制,知识增强深度学习范式开始引起研究人员的注意,通过该范式,领域知识和可观察数据协同工作,产生数据高效、可泛化和可解释的深度学习算法

现实世界的领域知识是丰富的。在深度学习背景下,领域知识主要来源于两个来源:目标知识和度量知识。目标知识控制着我们想要预测的目标变量的行为和属性,而度量知识控制着产生目标变量的观察数据的底层机制。基于其表示,本文提出将深度学习中探索的领域知识分为两类:科学知识和经验知识。科学知识代表了在某一领域中已经确立的支配目标变量的属性或行为的规律或理论。相比之下,经验知识是指从长期观察中提取的众所周知的事实或规则,也可以通过人类的推理推断出来。知识可以用各种格式表示和组织。科学知识通常可以用数学方程来精确地表示。另一方面,经验知识通常不太正式,如通过逻辑规则、知识图谱或概率依赖。在深度学习框架中,不同表示形式的知识通过不同的集成方法与数据集成。

由于认识到当前深度学习的不足,人们对捕获先验知识并将其编码到深度学习中越来越感兴趣。两种主流技术是神经符号集成和物理成形深度学习。神经符号集成模型主要是将经验知识编码到传统的符号AI模型中,并将符号模型与深度学习模型进行集成。基于物理的深度学习侧重于将各种理论物理知识编码到不同的深度学习阶段。目前在这一领域的研究论文的范围有限,因为他们关注的要么是神经符号模型,要么是基于物理的机器学习方法,而忽略了许多其他相关的工作。具体而言,现有的神经符号模型综述主要包括对逻辑规则或知识图谱的讨论,以及它们与深度模型[2]、[3]的融合。然而,现有的关于基于物理的机器学习的调研仅限于一个特定的科学学科,并且集成方法通常是特定于任务的,例如,物理[4],[5],信息物理系统[6],几何[7]和化学[8]。因此,这些综述集中在实验室环境下解决科学问题的方法上,缺乏对现实世界应用的讨论。为了解决这一局限性,我们对现有的知识增强深度学习研究进行了全面而系统的综述。我们的综述有三个方面的贡献:

  • 本综述建立了一种新的领域知识分类方法,包括科学知识和经验知识。我们的工作包含了现有的工作,这些工作关注特定学科领域知识的子集[4]-[8]。

  • 本综述涵盖了广泛的知识表示和集成方法与系统分类。它不同于现有的关于一般集成技术的综述,后者不确定领域知识的分类[9]-[13]。

  • 本综述涵盖的方法不仅适用于在实验室环境下解决科学问题,更重要的是,适用于现实世界的应用任务。这项综述不局限于特定的应用任务,它涉及从计算机视觉到自然语言处理的任务。因此,我们的综述不仅引起了深度学习研究者的兴趣,也引起了不同领域的深度学习实践者的兴趣。

我们组织这次综述如下。在第二节中,我们首先介绍了KADL的概念,并定义了三个基本任务(即知识识别、知识表示和知识集成)。然后我们回顾了KADL方法,其中我们根据它们的重点领域知识对不同的技术进行了分类:1)第三节中的带有科学知识的深度学习,2)第四节中的带有经验知识的深度学习。在每个类别中,我们确定了领域知识、它的表示格式,以及为知识与数据的集成提出的现有方法。表一概述了现有的知识增强深度学习方法。

6acd02a8f8706f78bcf5909da28f448d.jpeg

2. 知识增强深度学习

知识增强深度学习的主要任务包括知识识别、知识表示和知识集成到深度模型中。

539ac2c5bad92de8049f2e282242506c.jpeg

3. 用科学知识进行深度学习

深度学习模型在先进的科学和工程领域越来越重要,而这些领域传统上是由机械(如第一原理)模型主导的。这类模型对于那些发生机制尚未被专家很好理解的科学问题,或者那些精确解在计算上不可行的问题,产生了特别有希望的性能。然而,现有的深度学习需要大量带注释的数据,对新数据或设置的泛化能力很差。在将科学和工程中的传统方法与现有的数据驱动的深度模型相结合方面,研究界有越来越多的共识。带有科学知识的深度学习探索了经典机制模型和现代深度模型之间的连续统一体。在机器学习领域,将科学知识整合到深度学习(也称为基于物理的机器学习)中,以产生物理上一致的、可解释的预测,并降低数据依赖性的努力越来越多。在下面,我们首先确定科学知识的类型及其表征。然后介绍了将科学知识与深度模型集成的不同方法。

9f63799e8ae40509b6deac57d81d042b.jpeg

4. 基于经验知识的深度学习

除了科学知识外,经验知识被广泛认为是神经符号模型的主要知识来源。经验知识是指日常生活中众所周知的事实,描述一个对象的语义属性或多个对象之间的语义关系。它通常是直观的,是通过长时间的观察或完善的研究得出的。与科学知识不同,经验知识虽然广泛存在,但具有描述性和不精确性。包含语义信息的经验知识可以作为深度学习中预测任务(如回归或分类任务)的强大先验知识,特别是在小数据环境下,仅训练数据不足以捕获变量之间的关系[65]。

08b730fa69e425db5b3af2181eb9d884.jpeg

4bece6da0ab68fa76cde8475bfbb6a96.jpeg

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

c213c3e0c76beec8928e486ac962a803.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481347.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

不确定因果:当因果遇到量子

导语2022年诺贝尔物理学奖授予“用纠缠光子实验验证量子力学违反贝尔不等式”,确认了被称为“鬼魅般的超距作用”的量子纠缠现象。量子的世界常常超出人类的直觉,当我们将因果关系从经典世界外推到量子世界,会发生什么?研究发现&a…

脑机接口深度报告!四大关键技术让科幻走进现实|智东西内参

来源:智东西脑科学问题是人类社会面临的基础科学问题之一,是人类理解自然和理解人类本身的待深入探索领域,而脑机接口是有效探索手段之一。在国家战略的积极推动下,在科技创新不断更迭促进下,在人民大众期待关注下&…

写代码调 Bug,OpenAI 发布最强 AI 对话系统 ChatGPT!

来源:CSDN(ID:CSDNnews)整理:苏宓GPT-3 发布的两年后,我们没等来它的亲弟弟 GPT-4,而是在今天亲眼见证了 OpenAI 带来了一种全新的 AI 聊天机器人——ChatGPT,也可以称之为是 GPT-3 …

AI 大模型开源之困:垄断、围墙与算力之殇

从新兴技术转变为AI基础设施,大模型开源很重要,但也很难。来源:AI科技评论作者:李梅编辑:陈彩娴2020年6月,OpenAI发布GPT-3,其千亿参数的规模和惊人的语言处理能力曾给国内AI界带来极大的震动。…

神经符号 AI,或为下一代 AIoT 的新解法

来源:AI科技评论作者:黄楠编辑:陈彩娴11 月 22 日,2023 年度 IEEE Fellow 名单公布,入选者约1/3为华人学者。IEEE Fellow 被称为全球电子电气工程领域的最高荣誉,每年当选人数不足整个 IEEE 协会的千分之一…

ChatGPT会取代搜索引擎吗

来源:AI科技大本营作者:张俊林本文经作者授权发布,原文地址:https://zhuanlan.zhihu.com/p/589533490作为智能对话系统,ChatGPT最近两天爆火,都火出技术圈了,网上到处都在转ChatGPT相关的内容和…

菲尔兹奖得主再次突破数论难题:多少整数能写成2个有理数立方和?结论直接影响“千禧难题”之七...

Pine 萧箫 发自 凹非寺量子位 | 公众号 QbitAI困扰数学界几个世纪的难题,终于有重大突破了!这个难题如果被解决,会直接影响到一个著名未解之谜的求解——贝赫和斯维讷通-戴尔猜想。贝赫和斯维讷通-戴尔猜想是数学界顶尖的7大千禧难题之一&…

从城市到国家:多学科视角的城市复杂系统

摘要与城市一样,国家在很大程度上是人造的系统。尽管它们在地点和规模上有所不同,但城市和国家都是可识别的单位,具有独特的特征,是独立的(不能被分解成部分而不失去其特征或个性的系统)。一个国家的历史与…

杀死1500只动物?马斯克的脑机接口公司被查!已宣布半年内进行人体试验

来源:每日经济新闻记者:郑雨航编辑:段炼 兰素英 杜波 杜恒峰校对:王月龙当地时间12月5日,路透社报道称,因涉嫌侵犯动物福利的违规行为,马斯克的脑机接口公司Neuralink正面临美国联邦部门的调查。…

人民日报:在集成电路基础研究中奋力攀登

来源:芯榜Pro转载自人民日报党的十八大以来,一大批70后、80后、90后青年科研人员脱颖而出,日益成为科技创新的生力军、主力军。党的二十大报告提出:“必须坚持科技是第一生产力、人才是第一资源、创新是第一动力,深入实…

骆清铭院士:给“大脑”绘制一个清晰可见的“地图”

来源:学习时报作者简介:骆清铭,中国科学院院士,海南大学校长,华中科技大学苏州脑空间信息研究院首席科学家。骆清铭团队研发的显微光学切片断层成像系统(MOST)系列技术,为实现单神经…

AI大神LeCun深度学习公开课来啦!4万字干货笔记(附干货笔记下载)

来源:Datawhatle喜欢深度学习?最好的方法就是在线课程。这里推荐图灵奖得主、纽约大学教授Yann LeCun主讲的在线课程。该课程最重要的优点是,它集成了LeCun对深度学习的思考。通过这门课,学习者可以了解深度学习的现状&#xff0c…

这种由数学描述的现象,在自然中终于找到了

#创作团队:原文作者:Raphael Sarfati(科罗拉多州大学波尔多分校博士后副研究员)编译:Gaviota排版:雯雯#参考来源:https://theconversation.com/synchrony-with-chaos-blinking-lights-of-a-fire…

互联网的未来:为什么我们需要 HTTP/3?

来源:SDNLAB*本文系SDNLAB编译自Ably博客自1997年HTTP/1.1标准化以来,一直是首选的应用层协议。多年来,为了跟上互联网的发展和网络上交换内容的多样性,HTTP 不得不进行升级。本文展示了 HTTP 协议的演变,深入探讨了 H…

评估深度学习模型以预测表观基因组概况

编辑 | 萝卜皮深度学习已经能够成功预测 DNA 序列的表观基因组图谱。大多数方法将此任务定义为二元分类,依赖峰值调用者来定义功能活动。最近,出现了定量模型来直接预测实验覆盖值作为回归。随着具有不同架构和训练配置的新模型不断出现,由于…

DeepMind携AlphaCode登Science封面,写代码能力不输程序员

来源:机器之心编辑:小舟、陈萍AI 卷到程序员自己身上了。今年年初,DeepMind 发布了基于 Transformer 的新模型 AlphaCode,该模型实现了大规模代码生成。现在,AlphaCode 又在《Science》上发表了新论文,研究…

微软 CTO 断言,明年是AI社区最激动人心的一年,网友:GPT-4 要来了?

来源:AI前线 整理:褚杏娟 核子可乐GPT 不出,AI 万古如长夜。“对于人工智能,2022 年是有史以来最激动人心的一年。”微软首席技术官 Scott Stein 在近日的分享中说道,但他还自信地表示,“2023 年将是 AI 社…

以“开放同行评议”推动学术发展

来源:《中国社会科学报》图片来源:CFP同行评议是指同一领域的专家学者评议研究人员稿件,确定学术论文是否适合发表、提出意见的过程。同行评议一直是学术期刊出版的重要基石。然而,学术界关于同行评议中的偏见和不利影响的争论&am…

2022年,人工智能领域发展的七大趋势有哪些?

来源:福布斯官网美国《福布斯》网站在近日的报道中指出,尽管目前很难想象机器自主决策所产生的影响,但可以肯定的是,当时光的车轮到达2022年时,人工智能领域新的突破和发展将继续拓宽我们的想象边界,其将在…

DeepMind VS Meta:实现纳什均衡理性最优解,还是多人非零和博弈算法更强大?

大数据文摘转载自AI科技大本营编译 & 整理:杨阳记得豆瓣高分电影《美丽心灵》中的约翰纳什吗?作为获得诺贝尔经济学奖的数学家,纳什在博弈论、微分几何学,以及偏微分方程等各个领域都作出卓越贡献。为表彰他在非合作博弈理论中…