情报领域因果推理智能项目概览:以DAPAR为例

美国国防高级研究计划局(Defense Advanced Research Projects Agency),简称DARPA,提出了旨在从推进人工智能常识推理能力发展、深化机器学习理论研究和推进国防部复杂问题中应用人工智能、深化美军对人工智能的研究和应用的“的下一代人工智能”计划。具体包括有:知识导向的“人工智能推理图谱”(KAIROS )、“世界建模者”(World Modelers )、“大机制”(Big Mechanism )、“复杂作战环境中的因果探索”(Causal Exploration )、“不同来源主动阐释”(AIDA )、“数据驱动的模型发现”(D3M )、“不完全信息博弈复杂军事决策中的串行交互”(SI3-CMD )等,这些项目旨在自动化地利用呈指数增长的数据信息,将复杂系统的建模与推理相结合,从而辅助国防部快速认识、理解甚至是预测复杂国际和军事环境中的重要事件。

本期围绕“情报领域因果推理智能项目”这一主题,选择“复杂作战环境中的因果探索”(Causal Exploration )、不同来源主动阐释”(AIDA )、知识导向的“人工智能推理图谱”(KAIROS )三个项目展开调研,从而加强对情报领域因果推理的认识。

一、Causal Exploration:

复杂作战环境中的因果探索项目

美国印太司令部与DARPA合作开展了一个名为“因果探索”的人工智能项目。该项目旨在 “建立一种工具,利用人工智能来增强机器所擅长的研究大量数据和模式识别等工作的效能并将其与人类相结合,允许人类发挥特有的专长,如提出新想法等。”DARPA网站称,该项目旨在建立一个“建模平台,以帮助军事规划者理解和解决导致复杂冲突局势的潜在因果因素。”这一工作,能够揭露出敌方防御的弱点,甚至是致命的漏洞。这些弱点可能是雷达覆盖的漏洞、关键防御系统的软件漏洞、机动中的空档,或者是敌方没有意识到、但可能通过大量的雷达数据和其他数据暴露出来的其他漏洞。

1、项目研究目标
该项目旨在开发一个建模平台,用于帮助军事规划者理解和解决导致区域混合冲突的潜在原因。平台具有以下根据作战环境(OE)快速创建和维护因果模型;探索影响作战环境的因果动力学;深入全面地了解作战环境等功能。该项目的成果可直接用于支持并告知规划工作,以解决由政治、种族或宗教紧张等因素主导的复杂人类层面的冲突、低强度冲突、经济侵略、或网络恐吓。

2、项目研究构成
该项目在技术构成上涉及“知识组织”、“因果模型装配”、“人机交互”、“模型评估”以及“系统集成”几个研究内容。

在这里插入图片描述
首先,在知识组织阶段,需要操作多种多样的异构和语义多样的文本及数字信息源,具体包括:军事和情报文件(如情报报告、作战评估、军事信息)、开源文本(如新闻媒体、基于Web的内容)、政府或非政府组织数据(如人口统计和经济等报告和数据库分析),以此作为输入源,提取出有关实体(参与者、条件、事件等)和关系的知识,并将实体和关系映射到公共本体中。这个阶段存在包括广泛变化的源材料、源信息的偏差或不可靠性、不符合清晰句法模式的因果关系、对因果关系特征(如置信度、强度、延迟)的一致估计等在内的多个挑战。

其次,在因果模型装配阶段,需要从知识组织阶段输出的数据集(以及可能的其他来源,如编码专家知识)中汇编出来一个因果整合模),并识别出因果整合模式的缺陷和差异,以便进一步整合人的输入从而修改或增强因果整合并整合新知识,从而实现最终的更新或完善。

最后,在人机交互阶段,一方面需要使具有不同经验和专业知识的用户能够与建好的因果整合模式进行互动,以建立理解;提供捕获因果整合模式的结果以及用户上下文的技术,产生灵活和动态产品。另一方面,还需要提供直观的探索功能,以帮助用户发现潜在的原因并评估潜在的方法,并使用户能够操作ICM结构、执行计算、可视化和简要的结果。

3、项目应用
该项目的定位为一个建模平台,以帮助军事规划者理解和解决导致复杂冲突局势的潜在因果因素,典型地的应用于以区域混合冲突为例的场景挖掘。

1)给定一个冲突实例:“尼日尔三角洲爆发了危机,武装分子占领了油田和沿海地区,并与有组织犯罪集团联手攻击海湾的航运”“)。

2)获取相应数据:获取军事和情报(作战评估、军事信息、情报报告)、政府和非政府组织数据(人口/经济报告和数据库)以及开源(公开信息,包括基于文本的新闻媒体、基于Web的内容、社交媒体)。

3)自动提取相关知识:实体知识:尼日利亚政府、尼日利亚安全部队、尼日尔三角洲人口、石油公司、犯罪集团、武装分子、博科圣地;条件、事件和趋势:滥用安全部队、人民支持武装分子;因果关系的识别:滥用安全部队增加了对武装分子的人口支持;领域本体的定制:博科圣地—恐怖分子—非国家军事演员—武装分子民兵组织—武装分子。

4)半自动因果模型装配:将提取到的各项知识进行组织。
在这里插入图片描述

二、Active Interpretation of Disparate Alternatives (AIDA)

主动解释不同替代方案

近年来,信息的复杂性已超出分析师从各种信息源搜集有价值信息的能力,这些信息样式各异,是结构数据和非结构数据的混合体,从军事情报到社交媒体,包含准确和不准确的消息。而对于那些力图理解世界大事的人,没有由其他媒体提供的信息作为参考,经常独立分析来自各个媒体的信息是有挑战的。经常出现的情况是,各个独立的分析会导致仅仅只有一种解释,而由于缺少证据,没有备选的解释,甚至缺少那些可以反驳那些可能选项的证据。通常在后续的分析过程中,当这些独立的、无力的分析被放在一起,结果会是单一的表象的认识,而不是一个真正的认识。

因此,DARPA通过开发“对不同方案的主动解释”(Active Interpretation of Disparate Alternatives,AIDA)项目,试图克服今天数据环境的混乱、矛盾和潜在的欺骗性。AIDA项目的目标是开发一种多重假设“语义引擎”,这种“引擎”根据从广泛渠道获得的数据,生成对真实事件、现状和趋势的解释。

该项目旨在创造一种新技术,这种技术能够自动聚集和扫描多个媒体的碎片信息,将这些信息转化为常用表述或故事情节,然后生成关于事件、现状和趋势的本质和含义的多种假设。AIDA可以帮助分析员和军队决策者改善他们的分析,以便他们更能同更大更完整的整体语境相一致,并且能获得对塑造我们世界的元素和力量的更加透彻的理解。AIDA提供对趋势和事件的更好理解,清除出不相干的和不可靠的数据。

1、项目研究目标
主动解释不同替代方案(AIDA)的目标是开发一个多假设语义引擎,从各种非结构化来源生成事件、情况和趋势的明确替代解释,用于嘈杂、冲突和潜在的欺骗性信息环境。

首先,该引擎必须能够将从多个媒体源自动派生的知识元素映射到公共语义表示,聚合从这些媒体源派生的信息,并生成和探索有关事件、情况和感兴趣趋势的多个假设,并能够根据分析的准确性和每个假设的语义表示的一致性,为派生知识和假设建立置信度量。

其次,该引擎还必须能够利用公共语义表示中的知识和生成的假设作为媒体分析算法的替代上下文,通过改变它们的模型或先验概率来提高准确性,并根据上下文的期望解决歧义。

最后,该语义引擎还需要能够与用户通信,以揭示生成的假设,并允许用户更改假设或建议新的假设。

2、项目研究构成
该项目最终定位为一个多假设语义引擎,这个引擎主要包括映射和反馈(Semantic Mapping and Feedback)、公共语义表示(Common Semantic Representation)、多重假设(Multiple Hypotheses)、集成和多重解释(Integration and Multiple Interpretations)等主要组成部分。
在这里插入图片描述

首先,在语义映射和反馈阶段,需要解决本项目的核心部分,即利用现有分析算法从所有可用媒体中提取知识元素,并将这些信息映射到定义的公共语义表示语言中。这一阶段的主要输入包括各种类型的文本、语音、图像、视频及其相关元数据流。通过分析每个输入的信息项,最终生成出一组关于该信息项中可观察到的事件、子事件或动作、实体、关系、位置、时间和情感的结构化表示。除了出处记录外,表示的每个知识元素(包括互排斥的知识要素)都需要有一个与之相关的置信度度量。

其次,在公共语义表示阶段,需要重点研究和开发一种新的通用语义表示,使人和计算机都可读。将输入的结构化且具有置信度量知识元素,用通用语义表示语言表示,并形成一个体系化的知识库。另外,在多重假设阶段,需要在知识库中以公共语义表示的方式组装信息,从而形成一个或多个内部一致的假设,其中的每个假设都应该捕获一个内部一致的世界模型,通过对输入数据的某些子集的解释,进而估计和传播不确定性。

最后,集成和多重假设阶段,需要开发出一个能够接受各种数据流的原型,该原型必须能够实现通过探测知识库、显示假设、向系统提交查询、编辑知识库或假设中的知识元素,以及向计算的任何阶段注入额外的“假设”来管理用户交互。

三 Knowledge-directed Artificial Intelligence Reasoning Over Schemas(KAIROS)

知识导向的人工智能推理模式

迅速理解世界事件对于为美国国家安全工作提供信息至关重要。这些自然界或人类社会中值得注意的变化可以对事件本身产生重大影响,或者可能构成产生更广泛影响的因果链的一部分。许多事件不是简单的事件,而是复杂的现象,它们是由许多附属元素组成的网络:包括从参与者到时间线,然而,越来越多的非结构化多媒体信息阻碍了对这些事件及其基本潜在要素的揭示和理解。

因此,美国国防部希望利用人工智能技术在日益复杂的全球环境中更好地追踪、分析各地的重要事件。在这一需求的驱动下,DARPA启动了“知识导向人工智能推理图谱”(KAIROS)项目,计划利用人工智能技术分析多媒体中的信息,理解世界各地发生的事件,旨在通过开发能够对现实世界事件进行上下文和时间推理的人工智能技术,从看似无关的事件中,分析发现事件之间的关联性。

1、研究目标
知识导向的人工智能推理模式这一系统旨在实现一个基于模式的人工智能系统,能够根据事件的上下文和时间推理,产生对复杂现实世界事件的可操作理解,并预测它们将如何展开。该系统可以筛选每天产生的无数事件和媒体片段,并识别其中任何连接或叙述的线索,识别和绘制事件或数据之间的相关性。

2、项目研究内容
该项目大体上分成两个阶段:在第一阶段,开发一种半自动化系统,能够识别和绘制看似无关的事件或数据之间的相关性,以帮助我们了解或创建关于我们周围世界的通用描述;第二阶段,将系统用于分析复杂的现实世界数据,并尝试根据创建的模式提取事件和叙述。
在这里插入图片描述
第一阶段关注通过基于语言学推断和常识推理的检测、分类、汇聚,从海量数据中形成事件模式,参与这个阶段的研究人员将运用归纳、综合和特殊化的流程来帮助形成可描述简单和复杂事件的模式,然后再将多个图式串列使用来提取诸如“角色”、“事件”这样的关键语境因素,并运用专业领域知识针对特定需求定制分析过程。

第二阶段关注将形成于第一个阶段的图式库应用到多媒体、多语言信息中去,以发现和提取复杂事件,这个阶段的研究将致力于识别事件、实体等因素之间的关联关系,以帮助人工智能系统形成和扩展其知识库。

在系统构成上,该项目包括事件模式的生成(Generation of Schemas for Events)、时间知识和模式的表示和使用(Representation and Use of Temporal Knowledge and Schemas)、系统集成和用户界面 (System Integration and User Interface)等模块。

在这里插入图片描述
首先,在事件模式的生成阶段,需要根据辅助元素、参数及时间和顺序信息分析复杂事件,以组成和概括事件模式。其输入数据包括多媒体、多语言批处理数据,要求输出表示事件及其辅助元素结构的模式,事件如何演变,辅助元素的典型持续时间和顺序是什么。
在这里插入图片描述

其次,在时间事件模式的生成阶段,该阶段以来自多媒体、多语言流作为输入,以事件模式的生成阶段中开发的模式,实现运行时使用的知识库。知识库中具体包含有关运行时数据中实例化模式的信息、与模式相关的所有事件和参与者,以及事件元素和参与者的时间关系,并能够基于模式进行可能后续事件预测。

最后,在系统集成和用户界面阶段,需要设计一个平台,该平台以多媒体或语料库作为输入,并允许所有系统组件与一个界面通信,该界面允许用户查询系统并控制可视化模块。该模块以来自事件模式的生成阶段和在时事件模式的生成阶段的算法、流模式或语料库中的数据作为输入,实现数据之间的传递。不仅需要让事件模式的生成阶段构建的模式库能够被时间事件模式的生成访问,还允许用户与时间事件模式的生成算法之间进行读取、编辑或可视化的接口。

四 总结

因果逻辑挖掘与推理,在情报领域扮演着越来越为重要的角色。DARPA所提出的Causal Exploration(复杂作战环境中的因果探索项目)、Active Interpretation of Disparate Alternatives (AIDA):主动解释不同替代方案)、Knowledge-directed Artificial Intelligence Reasoning Over Schemas(KAIROS:知识导向的人工智能推理模式)都从不同的角度出发,对这一技术进行了研究和探索。本文简要地从研究目标和研究内容两个方面进行了简要介绍。

类似地,从2018年开始至今,数据地平线对以“事件”为核心的应用型技术、因果逻辑挖掘和可解释性推理进行了探索和实践,并在此期间陆续发布了多项成果,包括:

1、“学迹”:大规模实时事理学习与搜索系统。该系统积累了数千万因果逻辑、事件描述逻辑与数十万产业链逻辑,为推理奠定了推理基础。

2、“数地工场”:NLP领域技术综合开放平台。该平台奠定了因果逻辑、事件挖掘实现的基础。

3、“投研云图”:集投资逻辑管理、多维数据辅证、实时舆情监控的智能投研工具。基于该系统可以完成逻辑的管理、自建、多维信息关联与监测。

4、“事理图谱Demo”:投资逻辑展示及检索平台。基于该平台,可以搜索和查阅既定事件背后的因果逻辑网络。

与金融领域一样,情报领域对事件、事理逻辑相关技术和应用有着很大的需求,接下来,我们将逐步开展面向情报领域的事件挖掘和分析,欢迎感兴趣的朋友们关注这项工作。

五、关于我们

If any question about the project or me ,see https://liuhuanyong.github.io/

如有自然语言处理、知识图谱、事理图谱、社会计算、语言资源建设等问题或合作,可联系我:
1、我的github项目介绍:https://liuhuanyong.github.io
2、我的csdn博客:https://blog.csdn.net/lhy2014
3、about me:刘焕勇,中国科学院软件研究所,lhy_in_blcu@126.com

参考文献
[1].https://www.ldc.upenn.edu/collaborations/current-projects
[2].https://www.sohu.com/a/385563257_613206
[3].https://www.federalgrants.com/Active-Interpretation-of-Disparate-Alternatives-AIDA-64580.html
[4].https://www.darpa.mil/news-events/2019-01-04
[5].https://m.sohu.com/a/132637014_465915
[6].https://www.darpa.mil

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480321.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文浅尝 | 基于模式的时间表达式识别

本文转载自公众号:南大Websoft. 时间表达式识别是自然语言理解中一个重要而基础的任务。在以前的研究工作中,研究人员已经发现时间词的类型信息可以给识别提供明显的帮助。本文中我们以词类型序列作为表达式模式,提出了基于模式的时间表达式识别方法&…

大数据项目(四)————用户画像

原文地址:https://blog.csdn.net/Jorocco/article/details/81428996 1、用户画像概述 用来勾画用户(用户背景、特征、性格标签、行为场景等)和联系用户需求与产品设计的,旨在通过从海量用户行为数据中炼银挖金,尽可能…

最强阿里面试126题:数据结构+并发编程+Redis+设计模式+微服务

BAT技术面试范围 数据结构与算法:最常见的各种排序,最好能手写 Java高级:JVM内存结构、垃圾回收器、回收算法、GC、并发编程相关(多线程、线程池等)、NIO/BIO、各种集合类的比较优劣势(底层数据结构也要…

AdaX:一个比Adam更优秀,带”长期记忆“的优化器

关注小夕并星标,解锁自然语言处理搜索、推荐与算法岗求职秘籍文 | 苏剑林(追一科技,人称苏神)美 | 人美心细小谨思密达前言这篇文章简单介绍一个叫做AdaX的优化器,来自《AdaX: Adaptive Gradient Descent with Exponen…

金融情报挖掘:面向公开文本的期货事件聚合与传导因素分析

金融情报挖掘是情报领域的一个重要分支,通过对金融领域信息进行提取和分析,发现关联线索,对传导关联进行建模,能够挖掘出市场变动的规律,最终辅助决策。 例如,国内外资本市场,衍生品市场热点不断…

论文浅尝 | 知识图谱的单样本关系学习

链接:http://cn.arxiv.org/pdf/1808.09040动机如今的知识图谱规模很大但是完成度不高,long-tail关系在知识图谱中很常见,之前致力于完善知识图谱的方法对每个关系都需要大量的训练样本(三元组),而新加入的关…

POJ 1200 Crazy Search 查找有多少种不同的子串(hash)

文章目录1.采用map解题2.采用hash查找题目链接: http://poj.org/problem?id1200题目大意:给定子串长度,字符中不同字符数量,以及一个字符串,求不同的子串数量。1.采用map解题 把子串插入map,map自动去重&…

金融行业如何用大数据构建精准用户画像?

原文地址:https://www.jianshu.com/p/6e0a0ca5948e 1. 什么是用户画像?2. 用户画像的四阶段用户画像的焦点工作就是为用户打“标签”,而一个标签通常是人为规定的高度精炼的特征标识,如年龄、性别、地域、用户偏好等,最…

最全BAT前端开发面试80题:算法+html+js+css!含答案大赠送!

最全前端开发面试题目:包含算法网络css面试jsh5面试题目,尾部有最全BAT前端面试经典77题和答案,想要的就快来领走吧~(领取方式见文末) 一、前端算法面试 1、基本排序的方式 冒泡、快排、桶排、堆排序、归并排序、插入…

超一流 | 从XLNet的多流机制看最新预训练模型的研究进展

关注小夕并星标,解锁自然语言处理搜索、推荐与算法岗求职秘籍文 | 老饕(某厂研究员,祖传调参)美 | 人美心细小谨思密达导读作为 NLP 近两年来的当红炸子鸡,以 ELMo/BERT 为代表的语言预训练技术相信大家已经很熟悉了。…

论文浅尝 | 神经网络与非神经网络简单知识问答方法的强基线分析

来源:NAACL 2018链接:http://aclweb.org/anthology/N18-2047本文关注任务为面向简单问题的知识库问答(仅用KB中的一个事实就能回答问题)。作者将任务划分为实体检测,实体链接,关系预测与证据整合&#xff0…

干货 | 搞定用户画像只需5个步骤

【转】http://www.sohu.com/a/115611583_445326有一句话是,千万人撩你,不如一人懂你,这句话在互联网圈可以说成是,真正的了解用户,才能得到用户,所以,用户画像的重要性不言而喻。什么是用户画像…

领域情报搜索实践:真实场景下的问答实施策略与风险分析

知识搜索,对于一个企业而言,目前无论是在对内管理还是对外服务的业务上,都有着大量的需求,并表现出急迫性的特征。 例如,很多企业都积累了大量的企业知识资产,并且规模以每年200%的速度增长,其…

数据结构--二叉树 Binary Tree

文章目录1.概念2.存储方式2.1 链式存储(二叉树代码大部分是链式实现的)2.2 顺序存储(基于数组)3.二叉树的遍历3.1 基于链表的二叉树实现代码3.2 基于数组的二叉树实现代码3.3 非递归法 二叉树遍历1.概念 二叉树,每个节…

算法工程师思维导图—数据结构与算法

卖萌屋的妹子们(划掉)作者团整理的算法工程师思维导图,求职/自我提升/查漏补缺神器。该手册一共分为数据结构与算法、数学基础、统计机器学习和深度学习四个部分。点击这里查看具体使用指南。该手册有两种获取方式:公众号后台回复…

通过预训练提升语言理解

官方地址:https://blog.openai.com/language-unsupervised/文章:https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf代码:https://github.com/openai/finetune-tran…

最全Java架构师130面试题:微服务、高并发、大数据、缓存等中间件

一、数据结构与算法基础 说一下几种常见的排序算法和分别的复杂度。 用Java写一个冒泡排序算法 描述一下链式存储结构。 如何遍历一棵二叉树? 倒排一个LinkedList。 用Java写一个递归遍历目录下面的所有文件。 二、Java基础 接口与抽象类的区别&#xf…

智能投顾全面解读

智能投顾全面解读 <p>传统投顾一直是与理财产品的销售紧密结合在一起的。投顾即销售&#xff0c;在国内理财界也是约定俗成的现实。<br></p><p>传统投资顾问即证券投资顾问业务遵循《证券投资顾问业务暂行规定》&#xff0c;开展证券投资顾问业务的机构…

数据结构--二叉查找树 Binary Search Tree

文章目录1.二叉查找树概念2.二叉查找树操作2.1 查找2.2 插入2.3 删除2.4 其他3. 支持重复数据的二叉查找树4 有散列表了&#xff0c;还需要二叉查找树&#xff1f;5 代码实现1.二叉查找树概念 二叉查找树要求&#xff0c;在树中的任意一个节点&#xff0c;其左子树中的每个节点…

最新蚂蚁金服Java面试题:Docker+秒杀设计+RocketMQ+亿级数据设计

蚂蚁金服一面&#xff1a; 1 自我介绍 2 讲一下ArrayList和linkedlist的区别&#xff0c;ArrayList的扩容方式&#xff0c;扩容时机。 3 hashmap的实现&#xff0c;以及hashmap扩容底层实现。 4 NIO了解么&#xff0c;讲一下和BIO的区别&#xff0c;AIO呢。阻塞&#xff0c;…