我们的实践: 400万全行业动态事理图谱Demo

历史经验知识在未来预测的应用
华尔街的独角兽Kensho,是智能金融Fintech的一个不得不提的成功案例,这个由高盛领投的6280万美元投资,总融资高达7280万美元的公司自推出后便名声大噪。Warren是kensho是一个代表产品,用户能够以通俗易懂的英文来询问Warren金融问题,例如“当三级飓风袭击佛罗里达州时,哪支股票上涨得最快?”在回答这个问题的时候,它会在后台强大的全球历史事件库中进行检索,并直接给出直接的答案,这是国外智能投研的一个成功例子。就这种内部实现而言,Warren内部本身具有复杂的事件和数据分析模型,囊括全世界上亿条事件的历史事件库为用户提到的问题提供了很好的支撑。

实际上,这种基于历史事件库对现有事件进行影响和事件预测的方式值得我们借鉴,通过大规模挖掘领域事理图谱,可以基于过往事件发生的结果,进一步对未来的事件进行预测,这个在金融领域中有大量的运用。例如,在进行行业研究时,往往需要考虑不同的事件对识别风险,发现潜在价值的风险,评估造成的影响。正所谓阳光底下无新事,历史总是相似的。通过总结过去历史经验,可以为未来相似事件提供预测上的帮助。而回到历史经验这个概念,如何表示这种历史经验?如何使得这种历史经验能够被计算机所理解?如何使这种历史经验具备可计算性?如何使这种历史经验能够更具备抽象和泛化能力?一方面,这些问题都对现有的知识模型提出了需求,另一方面,这些问题都可以归结成一种机器智能中的预测问题。

以事件作为实体节点单元的行业领域事理图谱是实现以上预测问题的一个切入点。虽然受限于数据来源的可靠性、逻辑抽取的准确性,事理图谱的准确度难以与分析师的逻辑进行匹敌,但事理图谱的优势在于,分析师收集的事件具有局部性,很难做到综合全球各大事件;分析师收集的数据难以进行量化,不同分析师对事件的判断偏差较大。

为了给分析师以及其他行业人员提供领域和常识性的事件推理历史经验库,我们推出了商品金融事理图谱。我们构建起了2000万的历史多行业资讯库,总结出上百种因果事件模式。基于显式因果模式,我们经过事件标准化、事件对齐、事件融合等处理后,最终形成了具有动态更新能力的多行业领域事理图谱,事理图谱Demo地址:http://39.106.1.94:8080(请复制到PC浏览器中打开),欢迎大家使用,并提出宝贵意见。有任何意见,可联系本文作者huanyong@iscas.ac.cn。

全行业动态事理图谱

1、平台地址:http://39.106.1.94:8080(请在PC浏览器中打开)

2、平台首页:进入该平台地址后,可以进入本demo的首页,首页如下,目前主要包括输入框、推荐搜索、提示、图谱展示区、联系备注信息、节点类型标示等几个区域。

在这里插入图片描述

图1

3、待查询事件的输入。本图谱收录的资讯为全行业,因此可以支持多领域的事理逻辑查询。用户输入的事件可以是一个表示具体动作的事件,可以是一个词,一个短语,也可以是一句话。如金融领域的“降准”、“通胀”;时事领域的“特朗普和金正恩吵架”“感冒”等;汽车领域的“刹车失灵”、“汽油价格上涨”,如医疗领域中的“感冒”、“失眠”,生活领域的“心情烦闷”、“情绪激动”等,娱乐领域的“刘强东性侵案”、“崔永元炮轰范冰冰等”。搜索框下,列举了几个推荐搜索例子,用户可以点击使用。

4、事理图谱的返回。当用户输入待查询事件之后,系统会在后台的事理图谱中进行事件查询,系统后台会返回一个与该事件最相近的事件,主要包括两类情况,一个是没有找到最为相似的事件,返回空结果,具体表示成一个红色的核心事件节点。另一个是找到若干个相似事件,这时返回三层的事理逻辑关系,以核心事件为中心,第二层为与第一层相似的事件,第三层为第二层事件所造成的影响事件。

5、事理图谱的构成。事理图谱中主要有节点和边两个元素组成,其中节点分成核心事件节点(红色节点)、原因事件节点(粉色节点)、结果影响节点(蓝色节点),关系边主要包括相似边和因果关系边两种,其中因果关系边由来源的因果模式来标记,如“导致”、“因为-所以”、“由于-导致”等。

6、事理图谱的扩展与回退。如图中的”提示“所示,点击图谱末节点可以继续展开下级节点,进入一个扩展模式,用户可以通过不断的点击,进行因果事件链条的不断扩展,若该因果事件没有结果事件时,界面会提示没有影响事件。同样,用户可以通过点击上层事件,完成事件的回缩。

7、事理图谱的缩放和拖动。为了增强用户的体验感,本图谱提供图谱的缩放和拖动功能,用户可以通过拖动和缩放,完成对整个图谱的全局和局部探索。

8、使用反馈。为了更好的提升用户体验以及发现我们的不足,欢迎大家使用并提出宝贵意见,有任何意见,请发送邮箱至huanyong@iscas.ac.cn

多领域事理图谱的检索

1、地缘政治的影响逻辑:“特朗普金正恩吵架”与“美国攻打伊拉克”

“美朝关系”是当今时代中最重要的主题之一,朝鲜核危机、朝韩关系、美朝关系的走向无不对全球的政治、军事、经济形势都能造成重要的影响。朝鲜最高领导人和美国总统特朗普在2018年之间的关系发生了从口角向会谈的戏剧性转变,这种转变的背后,有响应的逻辑影响在进行着。 我们以“特朗普金正恩吵架”为输入事件进行探索,可以得到图2的结果:

在这里插入图片描述
图2

从图中我们可以看到,事件图谱中没有找到与“特朗普与金正恩吵架”字符完全一致的事件,而是运用事件相似度计算返回了与该事件最为相似的事件表述“特朗普与金正恩唇枪舌战”,该事件直接导致了“美国朝鲜局势更为紧张”。在得到这一个结果事件之后,我们可以继续往下探索,点击“美国朝鲜局势更为紧张”节点之后,系统进一步返回与该事件相似的事件,包括“朝鲜紧张局势”、“美国朝鲜局势紧张”、“朝鲜半岛局势更为紧张”、“朝鲜半岛局势紧张”等相似事件,通过这些相似事件可以进一步得到二度的影响结果。如“朝鲜紧张局势”这一事件,会导致“全球股市走低”这一事件,点击“全球股市走低”,进一步得到“证券公司盈利下降”、“股票基金缩水严重”等结果事件。又如“美国攻打伊拉克”这一地缘政治事件,能够导致“国际油价上涨”、“伊朗原油供应中断”等事件。

在这里插入图片描述
图3

当然,图2、3展示的只是一部分的图谱内容,事实上可以在此基础上进一步拓展。从以上的结果上可以看出,从两个国家领导人之间的关系互动,其实可以牵扯出许多的经济影响,这说明收集起来的事理图谱可以进一步对地缘政治对经济的影响进行有趣、一定程度的刻画。

2、自然灾害影响逻辑:“智利地震”与“多雨雪天气”

地质灾害是人类的天敌,由于地球内部的构造和运动,总是会不时的发生“地震“、“洪水”等地址灾害。在经济全球化的今天,国家与国家之间的经济贸易往来不断扩大,一个国家发生重大事件往往会给另外一些国家带来深刻的影响,例如地质灾害在给国家带来经济损失的同时,也会造成一系列的链式反应。2010年智利发生了8.8级大地震,这一地震带来多种影响,我们以“智利地震”作为事件进行检索,得到图4结果。与上一段中提到的检索方法相彷,我们找到了与用户检索事件“智利地震”相关的一些事件,包括:“智利地震”、“智利发生地震”、“智利大地震”等事件,通过相似事件,我们可以得到相应产生的影响结果,包括“有色金属上涨”、“铜市场紧张”、“高档鱼粉价格上涨”等一度结果,通过拓展的方式,影响的事件可以进一步延长,后期可以看到“沪期锌主力走高”、“大盘企稳回升”等结果事件。从这些事件中,我们可以进一步总结出一些常识性经验,即智利是世界重要的产铜和鱼粉大国,智利地震对智利的铜出口会造成一定影响,而“铜”同属的有色金属板块,在实际的运转过程当中,会出现联动的效果。这些原本只有专业人士的知识,通过图谱可以很好的展示出来。

在这里插入图片描述
图4

此外,再以“多雨雪天气”为例,从图中,我们可以看到,“多雨雪天气”下会造成“交通受限”、“运输受阻”、“蔬菜产量减少”等不利结果,基于这些结果,可进一步得到更深更远层次的事理逻辑。

在这里插入图片描述
图5

3、健康生活影响逻辑:“经常熬夜”与“过度饮酒”

健康的生活往往是健康身体的根本保证,这是大家都心知肚明的事情,然而在实际的生活当中,我们总会因为这样那样的原因,将自己的身体放在一个亚健康的轨道上运行。熬夜、饮酒、是当前年轻人中普遍存在的一种亚健康生活方式,而这种亚健康方式到底会造成怎样的影响呢?我们分别以“经常熬夜”、“过度饮酒”为检索项进行检索,得到以下部分结果。从“经常熬夜”这个事理图谱的结果来看,“经常熬夜”将会导致“身体内热上升”、“身体内分泌失调”、“女性内分泌失调”等不良的身体后果,而“身体内分泌失调”对于男同胞而言,又会进一步导致“男性精子数量减少”、“男性生育能力下降”等不良结果,这给我们广大男同胞敲响了警钟。
在这里插入图片描述
图6

又如“过度饮酒”这个事件,“过度饮酒”无论在身体还是在经济上都会带来不良的影响,“过度饮酒”会造成“严重的个人消费负担”、“日益突出的健康问题”、“中枢神经系统中毒”、“高血压”等,而“高血压”又将进一步导致“肾脏功能衰竭”等。这一系列的问题,都能够为我们揭示出这一个“不良生活方式”下所牵扯并造成出的一系列坏处。

在这里插入图片描述
图7

4、国家政策的影响逻辑:“降准”与“一带一路”

改革开放40年来,我国取得了举世瞩目的经济成就,而伴随着改革开放的不断深入,我们国家在国内宏观调控和对外经济政策上也会根据当前的经济形势而发生改变。2013年我国提出了“一带一路”发展战略,为进一步推动全球经济发展做出了巨大贡献,今年10月,我国央行提出了“降准”政策,这对国内经济也带来一定影响。我们以“降准”和“一带一路政策”为例,在事理图谱中进行查询,得到以下结果:

在这里插入图片描述
图8

从图中可以看出,“降准”这一事件引发“资金外流”、“汇率贬值”、“人民币下行”等一系列影响,汇率贬值资本外流又进一步引起“外汇储备骤降”等进一步影响事件。下图展示了“一带一路政策”下的影响事件链条,“一带一路政策”相关的事件包括“一带一路政策升温”、“一带一路政策落地”、“一带一路政策走向”等事件,这些事件都带来一些利好影响,包括“订单上行”、“公司产能渐次释放”、“周边经济环境向好”、“业绩成长确定性较高”。

在这里插入图片描述
图9

总结

通过大规模挖掘领域事理图谱,可以基于过往事件发生的结果,进一步对未来的事件进行预测,这个在金融领域中将有大量的应用。我们构建起了2000万的历史多行业资讯库,总结出上百种因果事件模式。基于显式因果模式,我们经过事件标准化、事件对齐、事件融合等处理后,最终形成了具有动态更新能力的多行业领域事理图谱。本文介绍了我们开发的事理图谱Demo的使用方式,并列举了基于该事理图谱能够探索发现的几个有趣例子。总结的来说,目前事理图谱还十分复杂,无论是在精确度,还是在组织上都还存在着诸多不完善之处,如何基于该事件,进一步进行抽象建模,将事理图谱进一步落地,将是我们接下来需要攻克的方向,愿同各位一道,在事理图谱与知识工程上,砥砺前行!2019年的钟声即将敲响,在这次辞旧迎新之际,我们提前祝各位朋友在2019年中工作顺利,身体健康,顺着健康、稳定、繁荣的事理逻辑上稳扎稳打,更加辉煌!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480480.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蚂蚁花呗团队面试题:LinkedHashMap+SpringCloud+线程锁+分布式

一面 自我介绍 map怎么实现hashcode和equals,为什么重写equals必须重写hashcode 使用过concurrent包下的哪些类,使用场景等等。 concurrentHashMap怎么实现?concurrenthashmap在1.8和1.7里面有什么区别 CountDownLatch、LinkedHashMap、AQS实现原理 …

肖仰华 | SIGIR 2018、WWW2018 知识图谱研究综述

本文转载自公众号:知识工场。全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专委会定期举办的全国年度学术会议。CCKS源于国内两个主要的相关会议&#xf…

数据结构--栈--共享顺序栈

共享顺序栈:内部也是一个数组 将两个栈放在数组的两端,一个从数组首端开始压栈,一个从数组尾部开始压栈,等到两边栈顶在中间相遇时,栈满。 共享顺序栈在某些情况下可以节省空间。 头文件 sharingStack.h //共享顺序…

一个励志PM小哥哥的Java转型之路

先给大家看张我朋友圈截图: 这哥们本科学英语的,毕业后做了产品经理,去年 9 月份开始学 Java,6 个月的时间,拿到了快手的 Offer。如果你对 Java 也有兴趣,不妨听完这个故事。你是不是也和他当时的处境…

最全蚂蚁金服高级Java面试题目(3面)

一面: JVM数据存储模型,新生代、年老代的构造? java GC算法,什么时候会触发minor gc,什么时候会触发full gc? GC 可达性分析中哪些算是GC ROOT? 你熟悉的JVM调优参数,使用过哪些调…

运用事理图谱搞事情:新闻预警、事件监测、文本可视化、出行规划与历时事件流生成

目前,事理图谱在描述领域事件时空信息上具有独特性,这种逻辑图结构能够以一种直观的方式向我们展现出一个领域知识的链路信息。从学术的角度上来说,事理图谱与事件抽取、事件关系抽取、脚本学习、事件链生成、篇章句间关系识别、图谱图结构运…

CCKS 2018 | 最佳论文:南京大学提出 DSKG,将多层 RNN 用于知识图谱补全

本文转载自公众号:机器之心。 选自CCKS 2018作者:Lingbing Guo、Qingheng Zhang、Weiyi Ge、Wei Hu、Yuzhong Qu机器之心编译参与:Panda、刘晓坤2018 年 8 月 14-17 日,主题为「知识计算与语言理解」的 2018 全国知识图谱…

计算机软件系统

计算机软件系统按其功能可分为系统软件和应用软件两大类。1、系统软件系统软件是指管理、控制、和维护计算机及其外部设备,提供用户与计算机之间操作界面等方面的软件,它并不专门针对具体的应用问题。代表性的系统软件有:操作系统、数据库管理…

数据结构--栈--浏览器前进后退应用

浏览器前进后退: 当你依次浏览a,b,c,然后回到b,再浏览d,就只能查看a,b,d,了。 原理: 利用两个栈A,B 浏览新网页的时候,压入栈A,清空栈B前进&…

关于BERT,面试官们都怎么问

1.BERT 的基本原理是什么?BERT 来自 Google 的论文Pre-training of Deep Bidirectional Transformers for Language Understanding,BERT 是“Bidirectional Encoder Representations from Transformers”的首字母缩写,整体是一个自编码语言模…

牛逼!支付宝高级Java三面题目:线程锁+事务+雪崩+Docker等

支付宝高级Java一面 JVM中的老年代在什么情况下会触发GC? CMS的垃圾回收步骤,G1和CMS的区别? CMS哪个阶段是并发的,哪个阶段是串行的? 谈谈Java线程池,线程池中几个参数含义 谈谈你了解的J.U.C包的JDK源…

鲍捷 | 深度解析知识图谱发展关键阶段及技术脉络

本文转载自公众号: AI科技大本营 。 分享嘉宾 | 鲍捷(文因互联CEO)出品 | AI科技大本营(公众号ID:rgznai100)知识图谱是人工智能三大分支之一——符号主义——在新时期主要的落地技术方式。该技术虽然在 20…

8大常用数据库管理系统简介

转自:http://vps.zzidc.com/vpsjishu/817.html 数据库管理系统(Database Management System)是种操纵和管理数据库的大型软件,是用于建立、使用和维护数据库,简称DBMS。是企业进行数据管理及维护不可或缺的数据管理软件。 8大常用数据库管理系…

知识图谱之语言计算与信息抽取

语言计算与信息抽取是自然语言处理中两块重要内容。本文将根据自己的工作总结,形成了语言计算与信息抽取的知识图谱分布图。 一、总体图谱 二、概念抽取 三、实体抽取 四、事件抽取 五、语言监测 六、文本计算内容 七、文本内容计算应用 总结 本文介绍了关于语言…

数据结构--队列Queue--链式队列、顺序队列

队列:先进先出,就如排队一样,先到的,先排上 1.链式队列 1.1 头文件 listQueue.h /*** description: 链式队列* author: michael ming* date: 2019/4/1 22:47* modified by:*/#ifndef QUEUE_LISTQUEUE_H #define QUEUE_LISTQUEU…

技术动态 | 人工智能开源软件发展现状连载——知识图谱开源软件

本文转载自公众号:中国人工智能开源软件发展联盟,欢迎大家点击文末二维码关注。知识图谱 (Knowledge Graph)是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”&#xff0c…

2018 支付宝Java开发四面:Ngnix+MQ队列+集群+并发抢购

一面 介绍项目 java 线程池的实现原理,threadpoolexecutor关键参数解释 hashmap的原理,容量为什么是2的幂次 为什么要同时重写hashcode和equals ConcurrentHashMap如何实现线程安全? 介绍Java多线程的5大状态,以及状态图流转…

ACL2020 | 线上搜索结果大幅提升!亚马逊提出对抗式query-doc相关性模型

一只小狐狸带你解锁 炼丹术&NLP 秘籍作者:机智的叉烧(OPPO算法工程师,擅长Query理解方向)背景搜索和推荐经常会被放在一起对比,其中最突出的区别就是搜索中存在query,需要充分考虑召回内容和query之间的…

微型计算机性能指标以及分类

衡量微型计算机的主要技术指标是?特点是? 2018-11-29 20:38:08 来源:贤集网 赵媛 微型计算机大家应该耳熟能详,它又比称为“微型机”,由于其具备人脑的某些功能,所以也称其为“微电脑”。现在流行的微…

领域应用 | 为电商而生的知识图谱,如何感应用户需求?

本文转载自公众号:阿里技术(ali_tech)。 阿里妹导读:本文从需求分析和体系化构建的角度出发,阐述在电商这一特殊领域的知识图谱构建过程中,形成的一整套概念体系,还有在此过程中,通过算法、工程、产品、…