开源开放 | Gowild 狗尾草“七律”知识图谱进入 OpenKG,开放 8000 万中文百科知识三元组数据...

项目网站: https://ai.gowild.cn/kg

OpenKG发布地址: http://openkg.cn/dataset/7lore

狗尾草科技:https://www.gowild.cn


1.七律开放知识图谱简介

作为人工智能技术的重要分支,知识图谱自2012年被提出并成功应用后,就获得了迅速发展,成为推动互联网及AI发展的“重要武器”。

上海Gowild狗尾草人工智能研究院此次发布了中文开放知识图谱“七律”,及实体概念体系schema。七律知识图谱包含了事物、事实、概念、规则等信息,目前涵盖超过2亿个实体和超过30亿条关系,并且每天保持稳定地增量学习和增长。

640?wx_fmt=png

七律,源自于Gowild狗尾草旗下AI虚拟生命琥珀家乡(瓦歌世界)中魔法体系的高度抽象和理解,根据理解的层次和强弱共分为七层,称之为“七律”。七律知识图谱沿用了“七律”这一名称,将这种对于知识的抽象理解延伸至人类世界,将以结构化实体、关系为核心的百科知识图谱定作为基石的第七律,并把概念、常识、空间等复杂知识作为目标逐步抽象上层完善,最终形成真正的七律。

用户可通过七律官网:https://ai.gowild.cn/kg进行访问,目前支持三类知识查询:

  • QA 查询支持自然语言问句查询,返回问句答案,例如问句“美人鱼的导演是谁”,答案为“周星驰”

  • 实体查询支持mention-level的实体关键词查询,返回相关匹配的实体,并包含消歧字段,例如“三体”,返回结果包括“刘慈欣著科幻小说-三体”、“ 书法名词-三体”等

  • 概念查询支持mention-level的概念关键词查询,返回相关的上下位概念和同义词概念,例如“妻子”的父类(上位)概念为“配偶”,同义概念包括“媳妇”、“老婆”等


    640?wx_fmt=png


2.开放数据简介

本数据集包含百科事实三元组,即(s,p, o)形式,可用于构建百科知识图谱、抽取领域知识子图、构建冷启动训练数据等任务。本开放数据为七律的子集,后续将持续加大开放。

用户可通过访问OpenKG进行下载:http://openkg.cn/dataset/7lore

数据详情:

  • 数据类型:百科三元组

  • 数据量:8000万条

  • 数据格式:csv

  • 实体信息最新更新时间:2019-03-01

数据样例:

s, p, o

锅饺, 中文名, 锅饺

锅饺, 主要食材, 饺子

锅饺, 辅料, 油

锅饺, 辅料, 陈醋

锅饺, tag, 食品

陈醋, 外文名,  MATURE VINEGAR

陈醋, 主要原料, 大米

陈醋, 发源地, 山西省-太原市

陈醋, 主要食用功效,  散瘀

3.知识图谱助力构建AI虚拟生命

知识图谱是人类知识数据化的结晶,同时也是AI虚拟生命的“大脑”。通过多年潜心研发,Gowild人工智能研究院推出了GAVE虚拟生命引擎,并将其应用于AI虚拟生命“琥珀虚颜”,而知识图谱是让其理解、学习人类世界的重要工具。

640?wx_fmt=png

与其他人工智能不同的是,AI虚拟生命不仅能够执行命令,还可以与人类进行语音、视觉的沟通交流,甚至有自己的生活轴和情绪输出。知识图谱是未来人工智能实现从感知到认知跨越的重要基石之一,随着数据红利的消失,以大数据和深度学习为基础的感知智能会遭遇天花板。不断更新的七律开放知识图谱,则为AI虚拟生命处理各种通用型任务、掌握客观常识、主动进行推理联想等认知能力提供了可能。

核心研发人员张凯工程师表示,七律的开放也是希望能吸引更多有志者参与到知识共享中,共同构建和完善知识金字塔。Gowild 狗尾草 AI Lab 负责人邵浩博士认为,我们人类当前所能达到的知识结构化和数字化即处于第七律这个层次,还需要无数科学家献身人工智能,为达到更高成果而努力。

 



OpenKG


开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

点击阅读原文,下载「七律」数据集。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479999.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

向量空间 Vector Space -- 推荐系统

文章目录1. 算法解析2. 基于相似用户做推荐3. 基于相似歌曲做推荐4. 总结音乐App的功能越来越强大,不仅可以自己选歌听,还可以根据你听歌的口味偏好, 给你推荐可能会喜爱的音乐,有时候,推荐的还非常适合你的口味。1. 算…

阿里P8架构师谈:分布式事务的解决方案,以及原理、总结

分布式事务是企业集成中的一个技术难点,也是每一个分布式系统架构中都会涉及到的一个东西,特别是在这几年越来越火的微服务架构中,几乎可以说是无法避免,本文就围绕分布式事务各方面与大家进行介绍。 事务 1.1 什么是事务 数据库…

美团NLP中心算法实习生内推啦!

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术部门介绍搜索与NLP部是美团人工智能技术研发的核心团队,致力于打造高性能、高扩展的搜索引擎和领先的自然语言处理核心技术和服务能力,依托搜索排序,NLP(自然语…

B+树 -- MySQL数据库索引

文章目录1. 定义清楚问题2. 尝试学过的数据结构解决问题3. 改造二叉查找树来解决问题4. 总结为了加速数据库中数据的查找速度,我们常对表中数据创建索引。数据库索引是如何实现的呢?底层使用的是什么数据结构和算法呢? 1. 定义清楚问题 如何…

创建python的虚拟环境(图文教程),并使用。

创建python的虚拟环境 第一步:打开anaconda命令行,即打开anaconda prompt。 base的主环境切换到虚拟环境nlp (base) C:\Users\user>conda env list 查看环境列表 (base) C:\Users\user>conda create -n nlp python 创建一个虚拟环境&#xff0…

领域应用 | 到底什么时候使用图数据库?

本文转载自公众号:TigerGraph。图数据库作为近两年快速发展的新型数据受到了市场极大的关注。但对于很多行业而言,图数据库还是一个很新的概念,企业管理人员和技术人员面临着同样的问题:企业的业务适不适合使用图?到底…

常用的后端性能优化六种方式:缓存化+服务化+异步化等

后端优化的六种方法: 1.硬件升级 硬件问题对性能的影响不容忽视。 举一个例子:一个DB集群经常有慢SQL报警,业务排查下来发现SQL都很简单,该做的索引优化也都做了。后来DBA同学帮忙定位到问题是硬件过旧导致,将机械硬…

有钱可以多任性?OpenAI提出人肉模型训练,文本摘要全面超越人类表现!

文 | 小轶背景三个多月前,OpenAI的GPT-3在NLP界掀起轩然大波。就在上周,视金钱如粪土的OpenAI团队又在文本摘要方面推出了最新力作,全方位超越人类表现。其亮点在于:以人类偏好替代自动化评测方法(如ROUGE、BLUE&#…

数据挖掘第一次作业

我先大概写了写,还有一些读过的论文没有往上放,一些论文之间的联系线条没有搞出来。 就先这样吧!有空再搞,我现在想去玩板子啦!

A*搜索算法--游戏寻路

文章目录1. 算法解析2. 总结仙剑奇侠传这类MMRPG游戏中,有人物角色 自动寻路功能。当人物处于游戏地图中某位置时,点击另一个相对较远的位置,人物就会自动地绕过障碍物走过去。这个功能是怎么实现的呢?1. 算法解析 这是一个非常典…

阿里P8架构师谈:应用后端+移动端的性能优化指标,以及性能优化方法

性能优化专题 阿里P8架构师谈:MySQL数据库的索引原理、与慢SQL优化的5大原则 阿里P8架构师谈:Web前端、应用服务器、数据库SQL等性能优化总结 大型网站Web前端优化最佳实践,以及最全优化工具集锦 阿里P8架构师谈:多线程、架构、…

无主题

厦门月亮少 20191003 之前突然遇到个bug,解决好久无果,开始干点别的事情,大约四天后的今天,我打开程序想解决一下,然后,调试半天无果,妈妈突然微信和我聊天了,聊完以后往终端一瞥&a…

PyTorch Trick集锦

文 | z.defying知乎来源 | https://zhuanlan.zhihu.com/p/76459295前言本文整理了13则PyTorch使用的小窍门,包括了指定GPU编号、梯度裁剪、扩展单张图片维度等实用技巧,能够帮助工作者更高效地完成任务。1、指定GPU编号2、查看模型每层输出详情3、梯度裁…

论文浅尝 | 利用推理链进行视觉问题回答

论文笔记整理:吴杨,浙江大学计算机学院,知识图谱、NLP方向。http://papers.nips.cc/paper/7311-chain-of-reasoning-for-visual-question-answering.pdf动机在视觉问题回答中,较为复杂的问题经常需要多步骤的推理才能够回答&#…

阿里P8架构师谈:数据库、JVM、缓存、SQL等性能调优方法和原则

编辑 性能优化基本是BAT等一线互联网公司程序员必备的技能,以下为大家完整揭晓性能完整的优化方案和方法:包含web网站调优、数据库、JVM调优、架构调优等方案。 第一:Web网站调优 1、尽可能减少HTTP请求:图片合并 (cs…

知乎招聘搜索算法实习生!邀你共建知乎搜索引擎!

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术部门介绍搜索算法团队是知乎核心算法团队之一,负责知乎搜索框背后的各项算法工作。我们团队一直非常重视新技术在搜索场景的探索和落地,包括但不限于 NLP,排序,…

论文浅尝 | 主题感知的问答生成

Citation: XingC, Wu W, Wu Y, et al. Topic aware neural response generation[C]//Thirty-FirstAAAI Conference on Artificial Intelligence. 2017.动机人机对话在 AI 和 NLP 领域是一项具有挑战性的工作。现存的对话系统包括任务导向的对话系统和非任务导向的聊天机器人。在…

.halo勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复

尊敬的读者: 网络安全是当今数字时代的一大挑战,各种勒索病毒如.halo病毒层出不穷,对用户和企业的数据安全构成了严重威胁。本文将介绍.halo勒索病毒,以及如何恢复被其加密的数据文件,同时提供预防措施。在面对被勒索…

阿里P8架构师谈:多线程、架构、异步消息、Redis等性能优化策略

常见性能优化策略分类 1.代码 之所以把代码放到第一位,是因为这一点最容易引起技术人员的忽视。很多技术人员拿到一个性能优化的需求以后,言必称缓存、异步、JVM等。实际上,第一步就应该是分析相关的代码,找出相应的瓶颈&#xf…

周志华教授专著《集成学习:基础与算法》上市,豆瓣满分森林书破解AI实践难题...

近年来,机器学习技术的快速发展推动了语音、自然语言处理、机器视觉等多个领域获得巨大进步,也带动了人工智能相关产业的蓬勃发展。回顾机器学习最近30 年的发展历程,各种学习方法推陈出新、不断演进。但是,在此历程中&#xff0c…