领域应用 | 阿里发布藏经阁计划,打造 AI 落地最强知识引擎

如果没有知识引擎,人工智能将会怎样?知识引擎可以把数据加工成信息,信息和现有的知识通过推理能够获得新的知识,从而形成庞大的知识网络,像大脑一样支持各种决策。


你与智能音箱进行对话,背后就是基于知识引擎形成的问答系统在发挥作用;你在网上购物,当你去准备生小孩的待产包时,需要买什么,背后也是知识引擎利用百科在辅助推荐;在做商业智能决策,也是基于知识的判断……诸如此类的例子比比皆是。在人工智能可以发挥作用的各种应用场景、各个行业中,知识引擎都是那个关键的技术内核。


640?wx_fmt=png

知识引擎中的信息分类


“藏经阁”内酝酿知识引擎


可以这样说,谁拥有了知识引擎,谁就掌握了人工智能应用的主动权。举例来说,阿里巴巴智能消费导购与商品管控的商品“大脑”,已经广泛应用于搜索、前端导购、平台治理、智能问答、品牌商运营等多个业务中,通过知识大大改善了消费者的网上购物体验。


从发展的眼光看,知识引擎是阿里巴巴“大中台”的一个核心技术要素。从2015年阿里巴巴践行“大中台,小前台”战略开始,打造一个通用、开放的技术中台,为不同的业务前端提供支撑已经成为阿里巴巴的一个既定技术方针。在这一方针指导下,阿里巴巴一直在IDC、数据平台、计算平台、语音处理、图像处理、搜索、业务平台这些核心能力的建设上不断投入,知识引擎的建立和持续优化是其中的一个方向。


为了持续推动知识引擎的发展,阿里巴巴现在又“放大招”了。4月21日,阿里巴巴联合清华大学、浙江大学、中科院、苏州大学首次发布阿里巴巴藏经阁研究计划,用一年时间初步建成基于知识引擎的平台服务,并逐步应用于阿里巴巴的各项业务中。


640?wx_fmt=jpeg

4月21日,阿里联合清华大学、浙江大学、中国科学院自动化所、中科院软件所、苏州大学5所高校发布藏经阁(知识引擎)研究计划


据了解,阿里巴巴藏经阁研究计划邀请了来自清华大学的李涓子教授作为藏经阁计划学术负责人。浙江大学陈华钧教授,中科院软件所孙乐研究员,中科院自动化所赵军研究员,苏州大学张民教授作为藏经阁计划学术专家与阿里巴巴的研究人员一起,在知识建模、知识获取、知识融合、知识推理计算、知识赋能等领域协作创新,其目标用一年时间完成第一版基础通用技术应用的开发,形成知识引擎的平台化服务。


有了达摩院,怎能没有藏经阁?达摩院是各路技术大咖的汇聚、切磋之地,卧虎藏龙;而藏经阁则是阿里巴巴各项创新研究计划的诞生地和支撑未来战略发展的策源地,二者相得益彰。在金庸的武侠小说中,少林寺藏经阁中的至宝就是《易筋经》,它是改变筋骨,通过修炼丹田真气打通全身经络的内功方法,可以说是各种奇妙武学的基础。阿里巴巴藏经阁研究计划的核心——知识引擎,其地位就像是《易筋经》,是实现人工智能应用落地的基础。


特别值得一提的是,阿里巴巴始终保持开放的研究态度,而阿里巴巴达摩院正是这样一个阿里巴巴与生态伙伴共同研究、协同创新的基地。阿里巴巴藏经阁研究计划背后依托的正是与阿里巴巴有多年紧密合作关系的高校、科研院所等。今后这种“开门”创新的方式还会继续,也将成为产业协作创新的典范。


知识引擎是发动机、连接者和加速器


我们平时经常看到、听到、说到的是淘宝、天猫、阿里云、ET城市大脑等,这些都是阿里巴巴推出的各类业务应用。阿里巴巴的本质其实是一个平台,而这个平台又包含看得见和看不见的两类:看得见的平台诸如电子商务平台、云平台等,各种应用跑在上面,各类生态伙伴生长在上面;而看不见的则是阿里巴巴众多内部的能力平台,阿里巴巴现在着力打造的知识引擎也是其中的一种重要能力。


有了知识,人工智能才会变得更加强大,可以做更多你想得到或现在还想不到的事情;反之,人工智能的逐渐强大,可以为人类在物理世界中继续深入挖掘、获取知识和洞察知识提供能力和工具。两者互为促进,共同发展。


正是认识到了知识引擎的重要性和必要性,阿里巴巴才浓墨重彩地描绘其知识引擎的未来。


阿里巴巴内部知识引擎的最底层是知识构建技术,包括知识获取、知识建模、知识融合、知识表示、工程技术、画像技术等,产生知识网络,例如商品知识图谱、神马知识图谱、客服知识图谱、文娱知识图谱、多语言知识图谱等。这些知识网络与知识服务技术例如逻辑推理技术等相结合,从而成为智能应用的发动机。


阿里巴巴最终的目标是:形成可在云端服务的知识引擎技术平台,配合各种知识网络,提供平台化智能服务。


阿里巴巴全力打造的知识引擎技术平台,是新经济时代下阿里巴巴业务发展的“发动机”、新能力的“连接者”和新生态的“加速器”。知识引擎是阿里巴巴业务平台创新孵化的项目,它的建立和完善可以赋能阿里巴巴整个经济体,未来还可以赋能广大中小企业客户。


经过上述分析,你应该可以理解此次发布的阿里巴巴藏经阁研究计划的重要意义。为应对机器智能对大规模知识的迫切需求,此研究计划以多源大规模数据为对象,研究从大数据向通用、领域知识转化的共性关键技术,研发并推出知识建模、知识获取、知识融合、知识推理计算和知识赋能的平台服务,使得机器具备类脑的逻辑推理能力,从而进一步提升从大数据向大知识转换的技术创新能力,将为我国智能化信息服务新业态的建立提供核心技术支撑,并延展技术边界,同时也为中小企业带来新的商机。


知识引擎厚积才能薄发


在知识引擎建设方面,阿里巴巴有着长期积累,在实际应用中支持着阿里巴巴电商等业务的发展,也得到了业界的广泛认可。


举例来说,现有的阿里巴巴商品“大脑”,打造了全网商品智能服务体系,服务阿里巴巴生态中的各个角色。也正因为如此,在2017年11月7日举行的2017中国大数据技术大会(BDTC)上,阿里商品知识图谱荣获“TOP10大数据应用最佳实践奖”。


在2017年杭州云栖大会商品“大脑”首次亮相。在此之前,阿里巴巴早就与苏州大学合作,研究文本处理前沿技术,此外还与浙江大学合作,主攻知识表示与推理前沿技术方向。阿里巴巴还与国际上的专业组织频繁交流与合作,共同推动知识引擎的发展和完善。


2018年国际人工智能协会年会(AAAI)将在美国新奥尔良举行,阿里巴巴有多篇论文入选,其中就包括阿里巴巴业务平台事业部与苏州大学合作的两篇论文。随着阿里巴巴藏经阁研究计划的发布,阿里巴巴将与清华大学、浙江大学、中科院,以及苏州大学精诚合作,力争在知识引擎及其技术服务平台的建设方面实现更大的突破。




OpenKG.CN


中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480735.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ACL2020 | FastBERT:放飞BERT的推理速度

FastBERT 自从BERT问世以来,大多数NLP任务的效果都有了一次质的飞跃。BERT Large在GLUE test上甚至提升了7个点之多。但BERT同时也开启了模型的“做大做深”之路,普通玩家根本训不起,高端玩家虽然训得起但也不一定用得起。 所以BERT之后的发展…

2017年双十一最全面的大数据分析报告在此!+2018年双十一已经开始,厚昌竞价托管教你如何应对流量流失?+2019年双十一大战一触即发:阿里、京东都有哪些套路和玩法

首先说一个众所周知的数据:2017年双十一天猫成交额1682亿。 所以今天,从三个角度带你一起去探索1682亿背后的秘密: 1、全网热度分析:双十一活动在全网的热度变化趋势、关注来源、媒体来源以及关联词分析。 2、各平台对比分析&…

阿里P8架构师谈:大数据架构设计(文章合集)

架构师进阶有一块很重要的内容,就是需要掌握大数据的架构设计,主要涵括: MySQL等关系式数据库,需要掌握数据库的索引、慢SQL、以及长事务的优化等。 需要掌握非关系式数据库(NoSQL)的选型,以及…

论文浅尝 | 利用 RNN 和 CNN 构建基于 FreeBase 的问答系统

Qu Y,Liu J, Kang L, et al. Question Answering over Freebase via Attentive RNN withSimilarity Matrix based CNN[J]. arXiv preprint arXiv:1804.03317, 2018.概述随着近年来知识库的快速发展,基于知识库的问答系统(KBQA )吸引了业界的广…

positional encoding位置编码详解:绝对位置与相对位置编码对比

本文转载自公众号“夕小瑶的卖萌屋”,专业带逛互联网算法圈的神操作 -----》我是传送门 关注后,回复以下口令: 回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读) 回复【入群】&#xf…

## 作为多目标优化的多任务学习:寻找帕累托最优解+组合在线学习:实时反馈玩转组合优化-微软研究院+用于组合优化的强化学习:学习策略解决复杂的优化问题

NIPS 2018:作为多目标优化的多任务学习:寻找帕累托最优解多任务学习本质上是一个多目标问题,因为不同任务之间可能产生冲突,需要对其进行取舍。本文明确将多任务学习视为多目标优化问题,以寻求帕累托最优解。而经过实验…

手把手教你求职进入BAT

“ 最近利用部分的时间,帮助了好几位读者朋友进入了自己心仪的公司,以下我会谈到,求职简历方面给到他们的建议。 如果你本身具备很强的实力,不要因为对求职简历细节不重视,反而痛失良机。 求职加薪,除了…

one-hot(独热)、bag of word(词袋)、word-Embedding(词嵌入)浅析

目录 词袋模型 one-hot word-embedding 我们知道,传统的数据挖掘任务面向的是结构化数据。结构化数据很好理解,就是很有结构的数据嘛。 比如下面这张银行客户数据库中的表格: 编号 姓名 年龄 年收入 职业 有无欠贷 01 夕小瑶 16(…

德勤发布《 2020 亚太四大半导体市场的崛起》报告,美国收入占比达到47%,中国大陆仅占 5%

德勤发布《 2020 亚太四大半导体市场的崛起》报告(以下简称《报告》),《报告》指出: 亚太地区半导体市场正在全球加速崛起,中国大陆、日本、韩国和中国台湾,占据全球半导体总收入前六大国家/地区的四席。美…

干货 | 机器学习算法在饿了么供需平衡系统中的应用

干货 | 机器学习算法在饿了么供需平衡系统中的应用 image:url(https://ask.qcloudimg.com/avatar/1292807/6341kxs4h2.png?imageView2/2/w/72)">用户1292807发表于携程技术中心订阅830作者简介陈宁,饿了么人工智能与策略部高级算法专家,负责供…

研讨会 | “人工智能与行业知识图谱技术实战”研讨会

人工智能时代2017年7月,国务院《新一代人工智能发展规划》明确提出“建立新一代人工智能关键共性技术体系”的重点任务和设立“新一代人工智能重大科技项目以及“1N”人工智能项目群”,特别强调“研究跨媒体统一表征、关联理解与知识挖掘、知识图谱构建与…

Sigmoid函数与Softmax函数的区别与联系

目录 缘起逻辑回归 Sigmoid Softmax 缘起逻辑回归 逻辑回归模型是用于二类分类的机器学习模型(不要说逻辑回归可以做多类分类啊喂,那是二类分类器的组合策略问题,而与逻辑回归分类器本身的构造没有半毛钱关系啊)。 我们知道&…

数据挖掘算法(logistic回归,随机森林,GBDT和xgboost)-腾讯云社区

机器学习就是样本中有大量的x(特征量)和y(目标变量)然后求这个function。(了解更多可以看: https://zhuanlan.zhihu.com/p/21340974?refermlearn ) 求函数的方法,基于理论上来说&am…

阿里P8高级架构师教你如何通过BAT面试顺利拿到offer

“ 在开始面试之旅之前还是要多说几句,选公司是要看时机的 ,建议先去小公司试试水,找找感觉,其次建议选熟人内推,也是对面试成功率有帮助的,那么就开始今天的面试之旅吧。 一:招聘方式 BAT技术…

论文浅尝 | SenticNet 5: 借助上下文嵌入信息为情感分析发现概念级别的原语

Citation: Cambria E, Poria S, Hazarika D, et al.SenticNet 5: discovering conceptual primitives for sentiment analysis by meansof context embeddings[C]//AAAI. 2018.概述目前大部分的人工智能的研究都集中在基于统计学习的方法,这些方法需要大量的训练数据…

文本匹配(语义相似度)综述

本文转载自公众号“夕小瑶的卖萌屋”,专业带逛互联网算法圈的神操作 -----》我是传送门 关注后,回复以下口令: 回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读) 回复【入群】&…

大型网站架构设计

“ 大型网站的架构设计,涉及到的面非常多,并不像大家想象的那样,就是一个网站这么简单,今天抛砖引玉,希望能给想从事互联网行业的同学一点初步的概念。 架构设计,其实就要清楚整个大型网站技术架构的演变…

强化学习之原理与应用

PaddlePaddle原创2019/02/20 17:23强化学习之原理与应用强化学习特别是深度强化学习近年来取得了令人瞩目的成就,除了应用于模拟器和游戏领域,在工业领域也正取得长足的进步。百度是较早布局强化学习的公司之一。这篇文章系统地介绍强化学习算法基础知识…

论文浅尝 | 基于多原型mention向量的文本-实体联合学习

链接:http://anthology.aclweb.org/P/P17/P17-1149.pdf概述在知识库和文本的联合表示中,歧义是个困扰的难题。同一个 mention 可能在不同的语境下表述不同实体,同一个实体又有多种 mention 表示,如下图。本文提出了一个新的表示方…

NLP预训练模型综述:从word2vec, ELMo到BERT

目录 前言 word2vec 模型 负采样 char-level与上下文 ELMo BERT 深层双向的encoding 学习句子与句对关系表示 简洁到过分的下游任务接口 前言 还记得不久之前的机器阅读理解领域,微软和阿里在SQuAD上分别以R-Net和SLQA超过人类,百度在MS MARCO…