实时事理学习与搜索平台DemoV1.0正式对外发布

我们团队探索了一种将事件、概念、逻辑、实时学习、多类知识库实时更新串起来的知识服务新模式。一个面向事理的实时学习和搜索系统Demo,取名叫“学迹”,取自“学事理,知行迹”。
项目地址:https://xueji.zhiwenben.com

一、 “学迹”的起源与愿景
“踏雪有痕,抓铁有印”,“来时须有影,去时更有踪”,万物皆有迹可循。语言是社会的镜子,每天产生的文本中蕴含了大量的事件知识,清晰地记录了社会发展中各个事物在人们脑海中的印象以及自身发展和演变的轨迹。

我们常想,“要是能够构建一个全面、精准、紧随社会发展的轨迹库(事理知识库),将社会对某个事物或事件不同的认识整理出来,将某个或每类事件发展和演化的逻辑轨迹梳理出来;并基于这种认识和演化逻辑,将互相关联的事物联系起来,做些有意义的未知推理,将是件多么美妙的事”。

秉持着这个“学事理,知行迹”的初衷,我们推出了“学迹”,一个7*24小时不断学习的实时事理学习与搜索平台,力图紧跟实时网络信息,面向公众提供以“事件”为核心的实时结构化知识搜索服务。

我们希望,来过“学迹”的人,都能看到“学迹”的这种初衷,并从我们的知识服务中得到有用的信息,并对我们的不足,提出批评和建议,督促“学迹”不断进步。

二、 “学迹”的技术与构成

“学迹”的背后,是以“数地工场”中围绕“事件”为核心的相关自然语言处理技术(事理抽取、概念识别、产业链识别等)沉淀以及实时知识库构建与基于事理的关联推理技术支撑,也是数据地平线全体开发人员在近年来对“事理”相关工作的一个典型总结和应用尝试。

在这里插入图片描述
“学迹”就像一个还在成长的孩子,随着后台知识学习算法的不断升级以及更多、更广多源异构数据的输入,它必将成为一个庞大的多源知识库,提供更好的检索体验,为此:

我们设计了一套以“事件”为核心的知识学习和搜索数据流。我们避开了类型众多且不可控的“实体搜索”,而选择了更为聚焦的“事件搜索”,我们约定,一个事件应该包括具体的施事主体和关联动作,如“人民币贬值”、“美联储降息”,对应其中的实体信息,我们将以“概念描述”的方式对其实体进行解释展示。

我们从零研发了一套互联网采集引擎。每天数以万计的网络开源文本源源不断地输入到我们的实时学习系统中,并变成新的结构化事理、概念、产业链知识。值得注意是,这个学习过程在无人干预的情况下 7 x 24 小时不间断运行,实时文本中的结构化知识可在几秒钟内即可被掌握。

我们设计了一套可靠的知识可信度评分算法。随着信息源不断增加,先前学习到的知识的可信度会被不断更新,错误结果的权重被自动纠正,根据可信度排序,可以看到“学迹”最有把握的知识。

我们尝试了一种友好的方式来最大化地展示事理学习的动态过程。我们用连线和层级表示的方式,为每条知识都提供可视化的学习实证,从中可以看到知识的创造者、知识的创造时间、知识出现的上下文,知识学习来源的评分。

我们尝试了一个针对事件的实时热点发现和推荐形式。基于这些不断涌进的实时知识信息,进一步对当下实时的热点事件进行聚合和提炼,在提供快速事理搜索的同时,能够时刻看到时下最新、最热、发生的事件列表。基于推荐,相关的搜索可进一步得到拓宽和聚合。

我们尝试了一条将各种数据进行关联聚合的展示方式。为了将事件与其他关联数据形成传导通路,以事件为连接中介,我们将概念、事件、产业、数据等进行关联,将事件相关的事物都有机地聚合起来。

我们尝试地做了一种基于推理可解释性的产业标的物预测。试图基于这些知识试探性地往前走一步,做一些产业相关的推理和预测。根据演变的轨迹以及在概念、产业链以及数据关联路径,我们对标的物的利好利空情况进行了可能的判定。

我们尝试尽可能最大化地提供信息或知识服务。对于暂时未能收录到我们的知识库中的事件,我们会推荐出与其最为相关的事件以及关联资讯,这样即便没有得到期待的结构化知识,用户也不会白来,随着后台实时数据的不断扩充,这种情况会得到好转。

三、 “学迹” 的用法和探索

我们避开了类型众多且不可控的“实体搜索”,选择了更为聚焦的“事件搜索”。我们约定,一个事件应该包括具体的施事主体和关联动作,如“人民币贬值”、“美联储降息”,对应其中的实体信息,我们将以“概念描述”的方式对其实体进行解释展示。

因此,在“学迹”里,所有的功能和内容都围绕“事件”展开,我们更推荐您在使用的过程中输入一个事件,这样能够尽可能得到更满意的结果。在这里,我们希望您可以:
1、找到关心的事件
“学迹”以搜索框的形态出现,并限制在指定事件的搜索,在搜索的过程中,会自动进行事件联想,您可以根据下拉的事件联想中选择,也可以自己输入。

在这里插入图片描述
此外,您也可以进一步根据我们推荐的事件,完成更进一步的搜索。

2、了解当下的热点事件
我们根据时下发布的资讯,识别出了当下的实时事件热点,并实时更新,您也可以直接点击查看。

在这里插入图片描述
3、体验到知识的实时学习过程
在“学迹”的首页底部,我们与后台的实时学习进行对接,动态地展示了这种学习过程。

在这里插入图片描述
4、了解社会对该事件或关联概念的理解
我们不断学习出该事件自身或者事件关联实体的描述信息,从中我们可以得到对该事件本身的印象。
在这里插入图片描述

5、看到知识学习过程中的实证来源过程
我们用连线的方式,为每条知识都提供可视化的学习实证,我们随机选取了几条结构化的知识放在页面的右侧。从线条的首末尾动态关联,可体验到其中的“取之有道”。
在这里插入图片描述

我们对每个结构化的知识都进行了可信度的表示,颜色的深浅以及结构化标签上的数值对其进行了清晰的区分。点开标签后出现的下拉信息框中,可以看到知识的生成者、知识的生成时间、生成知识的上下文,知识学习来源的评分。
在这里插入图片描述

6、获取特定事件发生的前因后果
因果逻辑是事理逻辑中的一个重要组成部分,通过事件发生的前因后果,可以对事件的演化提供一定借鉴,通过对逻辑事件关联的聚合,可以看出不同可信度下特定事件发生的前因后果。
在这里插入图片描述
7、查看特定事件关联的数据和经济产业
我们将事件与产业链实时知识库进行关联,从以事件的关联逻辑进一步延伸至产业链的关联逻辑。
在这里插入图片描述

我们将事件与后台数据指标进行关联,形成事件与具体量化数据指标的联通。

在这里插入图片描述
8、基于可解释推理路径的经济标的物影响预测
根据演变的轨迹以及在概念、产业链以及数据关联路径,我们对标的物的利好利空情况进行了可能的判定,在给出标的物的同时,还给出推理路径,标的物的影响类型。

在这里插入图片描述
9、跟踪特定事件的关联资讯
除了结构化的知识之外,还给出了与事件相关的关联资讯。需要注意的是,对于暂时未能收录到我们的知识库中的事件时,这些相关关联资讯可以进一步发挥全文检索的功能,您也不会白来。
在这里插入图片描述

四、 “学迹”的未来与期待
我们正在寻求一种更为友好的技术展示形态,并寻求运用这类技术来做一些有意义和有价值的落地应用,用于探索解决并自然语言处理业务中的一些实际问题。“学迹”是对这一目标的一个尝试。
学迹”正不断成长,交互方式以及各个细节还处于初步探索阶段,但其中的学习技术和知识库思想让“学迹”前路可望。
我们相信,假以时日,后台知识的精度和广度、实时处理的速度和性能将进一步提升。我们相信,成长的“学迹”,将更好地为社会提供的实时事理知识检索和探索。
“让事理知识学得更快、学得更多、学得更好,并为更多人传递事理知识和知识学习技术”,是“学迹”下一步要前进的方向。
有关于对“学迹”有更好的想法和意见,对“学迹”中使用的抽取、关联和推理技术以及积累的知识库有兴趣或需求,欢迎与我们联系。
“学迹”还在不断成长,欢迎常回来看看。

项目地址:https://xueji.zhiwenben.com
如有自然语言处理、[知识图谱、事理图谱]、社会计算、语言资源建设等问题或合作,如果对事件知识库有兴趣的落地或者研究,可联系我:
1、我的github项目介绍:https://liuhuanyong.github.io
2、我的csdn博客:https://blog.csdn.net/lhy2014
3、about me:刘焕勇,中国科学院软件研究所,lhy_in_blcu@126.com
4、懂预言者得天下,得语言者分天下,得知识逻辑者,游得天下。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480350.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

卖萌屋算法工程师思维导图part3—深度学习篇

卖萌屋的妹子们(划掉)作者团整理的算法工程师思维导图,求职/自我提升/查漏补缺神器。该手册一共分为数据结构与算法、数学基础、统计机器学习和深度学习四个部分。下面是第三部分深度学习的内容~公众号后台回复【思维导图】获取完整手册&…

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

事件抽取的目标是在非结构化的文本中确认事件的触发词(Eventtrigger)和参与者(Event argument),并判断触法词的事件类型(Eventtype),判断参与者在事件中的扮演的角色(Arg…

今日头条Java后台Java研发三面题目

最近有同学在优知学院留言区留言是否能发布今日头条的面试题目,这位同学,题目来了哦~ 一面 concurrent包下面用过哪些? countdownlatch功能实现 synchronized和lock区别,重入锁 thread和runnable的区别 AtomicInteger实现原理…

实时事理逻辑知识库(事理图谱)终身学习项目-EventKGNELL(学迹)

EventKGNELL EventKGNELL, event knowlege graph never end learning system, a event-centric knowledge base search system,实时事理逻辑知识库终身学习和事件为核心的知识库搜索项目。包括事件概念抽取、事件因果逻辑抽取、事件数据关联推荐与推理。 项目地址&…

python--从入门到实践--chapter 15 16 17 生成数据/下载数据/web API

1.随机漫步 random_walk.py from random import choice class RandomWalk():def __init__(self, num_points5000):self.num_points num_pointsself.x_value [0]self.y_value [0]def fill_walk(self):while len(self.x_value) < self.num_points:x_direction choice([1…

ACL2020 | 基于Knowledge Embedding的多跳知识图谱问答

一只小狐狸带你解锁 炼丹术&NLP 秘籍作者&#xff1a;舒意恒&#xff08;南京大学硕士生&#xff0c;知识图谱方向&#xff09;背景什么是知识图谱问答&#xff1f;知识图谱&#xff08;KG&#xff09;是一个多关系图&#xff0c;其中包含数以百万计的实体&#xff0c;以及…

论文浅尝 | 基于超平面的时间感知知识图谱嵌入

链接&#xff1a;http://talukdar.net/papers/emnlp2018_HyTE.pdf本文主要关注 KG embedding 中三元组成立的时间有效性问题&#xff0c;比如三元组(Cristiano Ronaldo, playsFor, Manchester United)&#xff0c;其成立的有效时间段是2003年到2009年&#xff0c;这个使三元组有…

Java面试进阶:Dubbo、Zookeeper面试题锦集

Dubbo面试题锦集 1、默认也推荐使用netty框架&#xff0c;还有mina。 2、默认是阻塞的&#xff0c;可以异步调用&#xff0c;没有返回值的可以这么做。 3、推荐使用zookeeper注册中心&#xff0c;还有redis等不推荐。 4、默认使用Hessian序列化&#xff0c;还有Duddo、FastJ…

POJ 1064 分割线缆(二分查找)

题目链接&#xff1a;http://poj.org/problem?id1064 题目大意&#xff1a;多根电缆切成指定段数&#xff08;每段相同长度&#xff09;&#xff0c;求每段线缆的最大长度&#xff08;精确到0.01&#xff09; 这题精度控制是难点&#xff0c;方法很简单&#xff0c;二分查找…

Learning to rank基本算法小结

原文链接&#xff1a;https://zhuanlan.zhihu.com/p/26539920 Learning to rank基本算法小结最近工作中需要调研一下搜索排序相关的方法&#xff0c;这里写一篇水文&#xff0c;总结一下几天下来的调研成果。包括Learning to rank 基本方法Learning to rank 指标介绍LambdaMART…

命名实体识别难在哪?

亚里士多德在《形而上学》中认为&#xff0c;对于存在&#xff0c;最重要的问题&#xff0c;就是给世间万物的存在基于语言来分层和分类。从神说要有光起&#xff0c;到基友给你取了个外号叫狗蛋。你会发现&#xff0c;创造与命名&#xff0c;在历史中往往等同。名字是自我概念…

论文浅尝 | 面向简单知识库问答的模式修正强化策略

链接&#xff1a;http://aclweb.org/anthology/C18-1277知识库问答研究旨在利用结构化事实回答自然语言问题&#xff0c;在网络中&#xff0c;简单问题占据了相当大的比例。本文提出在完成模式抽取和实体链接后&#xff0c;构建一个模式修正机制&#xff0c;从而缓解错误积累问…

最全BAT数据库面试89题:mysql、大数据、redis

数据库 mysql面试题目&#xff1a; MySQL InnoDB、Mysaim的特点&#xff1f; 乐观锁和悲观锁的区别&#xff1f;&#xff1f; 行锁和表锁的区别&#xff1f; 数据库隔离级别是什么&#xff1f;有什么作用&#xff1f; MySQL主备同步的基本原理。 如何优化数据库性能&#…

POJ 3481 Double Queue

题目链接&#xff1a;http://poj.org/problem?id3481 题目大意&#xff1a; 给你0-3四个指令&#xff1a; 0 退出 1 添加优先级为P 的 K值&#xff0c;进入队列 2 最高优先级出队 3 最低优先级出队 思路&#xff1a; 利用map数据对key默认升序排列。 AC代码如下&#xff…

理解 Word Embedding,全面拥抱 ELMO

原文链接&#xff1a;https://www.infoq.cn/article/B8-BMA1BUfuh5MxQ687T 理解 Word Embedding&#xff0c;全面拥抱 ELMO DataFun社区 阅读数&#xff1a;4238 2019 年 6 月 15 日提到 Word Embedding &#xff0c;如果你的脑海里面冒出来的是 Word2Vec &#xff0c;Glove &…

肝了1W字!文本生成评价指标的进化与推翻

一只小狐狸带你解锁 炼丹术&NLP 秘籍作者&#xff1a;林镇坤&#xff08;中山大学研一&#xff0c;对文本生成和猫感兴趣&#xff09;前言文本生成目前的一大瓶颈是如何客观&#xff0c;准确的评价机器生成文本的质量。一个好的评价指标&#xff08;或者设置合理的损失函数…

美团大脑 | 知识图谱的建模方法及其应用

本文转载自公众号: 美团技术团队.作为人工智能时代最重要的知识表示方式之一&#xff0c;知识图谱能够打破不同场景下的数据隔离&#xff0c;为搜索、推荐、问答、解释与决策等应用提供基础支撑。美团大脑围绕吃喝玩乐等多种场景&#xff0c;构建了生活娱乐领域超大规模的知识图…

最全Java面试208题,涵盖大厂必考范围!强烈建议收藏~

这些题目是去百度、小米、乐视、美团、58、猎豹、360、新浪、搜狐等一线互联网公司面试被问到的题目,熟悉本文中列出的知识点会大大增加通过前两轮技术面试的几率。 一.java基础面试知识点 java中和equals和hashCode的区别 int、char、long各占多少字节数 int与integer的区别…

大规模事理常识知识系统“学迹”的定位、应用与不足

我们于3月16正式对外发布了一个面向事理的实时学习和搜索系统Demo&#xff0c;取名叫“学迹”&#xff0c;取自“学事理&#xff0c;知行迹”(https://xueji.zhiwenben.com)。“学迹”的发布&#xff0c;进一步拓宽了现有知识库的门类&#xff0c;为进一步获取特定事件的概念解…

数据结构--散列表 Hash Table

文章目录1.线性探测 哈希表代码2.拉链法 哈希表代码1. 散列表用的是数组支持按照下标随机访问数据的特性&#xff0c;所以散列表其实就是数组的一种扩展&#xff0c;由数组演化而来。可以说&#xff0c;如果没有数组&#xff0c;就没有散列表。 2. 散列函数&#xff0c;设计的基…