领域应用 | 智能导购?你只看到了阿里知识图谱冰山一角

在刚刚结束的2017第四届世界互联网大会上,评选出了年度18项代表性的领先科技成果,阿里云ET大脑就是其中之一。众所周知,融合了先进的大数据、人工智能技术的阿里云ET大脑已经在智慧城市、智慧交通等众多领域得到了应用和推广。但你知不知道,阿里巴巴还有一个智慧的“大脑”,是你每天都离不开的。它就是智能消费导购与商品管控背后的“商品大脑”——阿里巴巴商品知识图谱。

 

就让我们一同走近阿里巴巴商品知识图谱,看看它神秘的面纱背后,到底有哪些闪亮的“黑科技”。


 

人工智能应用的“基础设施”

 

阿里巴巴商品知识图谱已经广泛应用于搜索、前端导购、平台治理、智能问答、品牌商运营等核心和创新业务,但是对于普通消费者来说,感触最深的还是它让网上购物的体验更佳。举例来说,网上导购就是让消费者更容易找到他们想要的东西。当买家在搜索栏中输入“我要一条漂亮的真丝丝巾”,阿里巴巴商品知识图谱就会通过语法词法分析提取出语义的要点,如“一”、“漂亮”、“真丝”、“丝巾”等关键词,并据此帮买家实时搜索到适合的商品。随着大数据、人工智能等技术的快速进步,阿里巴巴商品知识图谱也变得越来越聪明,可以通过实时学习构建出场景,当你输入“去东北滑雪要买什么”时,搜索结果中会出现与滑雪相关的各类商品信息。


淘宝网搜索示例

 

什么是知识图谱?它是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互关系。简而言之,知识图谱就是机器大脑中的知识库,也是人工智能应用的基础设施。

 

在创造了“双11”一个又一个销售奇迹之后,可想而知,阿里巴巴的商品库有多么庞大,来自于淘宝、天猫、1688、AliExpress等多个市场的数据,品牌商、行业运营、治理运营、消费者、国家机构、物流商等多种角色参与其中。让电商大数据更好地服务消费者是阿里巴巴首先要解决的问题。

 

阿里巴巴选择以知识图谱的理念重构电商核心数据,通过知识表示技术实现商品数据的标准化, 通过命名实体识别和实体链指技术与内外部数据之间的深度互联,通过逻辑推理校验图谱数据质量,进一步补全图谱关系。

 

阿里巴巴商品知识图谱的强大具体表现在哪些方面?它承载着商品标准化这一基础性、根源性的工作,通过知识表示来规范对商品数据的描述。正因为如此,我们才能知道哪些商品是同样一件东西,产品卖到了哪些市场,单品的销量可以被精确统计……

 

阿里巴巴商品知识图谱以商品、 标准产品、 标准品牌、 标准条码、标准分类为核心,利用实体识别、实体链指和语义分析技术,整合关联了诸如舆情、百科、国家行业标准等9大类一级本体,包含百亿级别的三元组,形成了巨大的知识网。基于这个巨大的知识网络,消费者的购物体验得到持续改善,消费者判断的成本也逐步降低。

 

概括说,阿里巴巴商品知识图谱综合利用前沿的NLP、语义推理和深度学习等技术,打造了全网商品智能服务体系,服务阿里巴巴生态中的各个角色。

 

也正因为如此,在11月7日举行的2017中国大数据技术大会(BDTC)上,阿里商品知识图谱荣获“TOP10大数据应用最佳实践奖”,赢得了市场和用户的充分肯定。



阿里巴巴业务平台商品知识图谱负责人张伟(左七)代表团队接受颁奖

 

知识图谱背后的“黑科技”

 

你可能每天都会到淘宝或天猫上逛逛,但可能从未留意过“后台”到底是什么能让你的购物体验变得更加顺畅、轻松。阿里巴巴知识图谱每天的拦截量达到千万级别,全量智能审核次数达到亿级别,最大限度地保护了知识产权,以及消费者权益。

 

阿里巴巴商品知识图谱的一个核心功能是“平台治理”,它是保证阿里巴巴商业生态安全、可靠运行的基本保障。举例来说,阿里巴巴商品知识图谱被用于阿里电商平台的管控。过去,电商通常只能通过人工巡检对商品发布进行审核,而现在面对海量的商品发布量,人工巡检模式捉襟见肘。形象地说,阿里巴巴商品知识图谱就像拉起了一张过滤网,通过大数据分析、人工智能等技术,筛查出不良信息,阻止其进入阿里巴巴生态。

 

阿里巴巴商品知识图谱能够实现如此高效的智能识别,其背后是否也有“黑科技”助阵?答案是肯定的。这里主要介绍一下阿里巴巴商品知识图谱是如何实现推理的。

 

阿里巴巴的业务知识/规则、管控知识/规则、国家行业规则错综复杂。针对这种情况,阿里巴巴设计了一套框架做知识表示和推理,并按照不同场景,将推理分为上下位和等价推理、不一致性推理、知识发现推理、本体概念推理等。

 

所谓上下位和等价推理,就是在检索父类时,通过上下位推理把子类的对象召回,同时利用等价推理(实体的同义词、变异词、同款模型等),扩大召回。一个例子,比如需要拦截“产地为某核污染区域的食品”,推理引擎翻译为“找到产地为该区域且属性项与产地同义、属性值是该区域下位实体的食品,以及与命中的食品是同款的食品”。

 

另外,不一致推理是指在与问题卖家对弈的过程中,需要对商品标题、属性、图片、商品资质、卖家资质中的品牌、材质、成分等基础信息做一致性校验。比如,标题中的品牌是Nike,而属性或者吊牌中显示的品牌是Nake,这些标称不一致的商品即被推理引擎判断为有问题的商品。

 

在推理引擎的背后,其实是把自然语言通过语义解析(Semantic Parsing)转换为逻辑表达式(Logical Form)。语义解析采用了结合神经网络和符号逻辑执行的方式。而逻辑表达式又会触发后续的逻辑推理和图推理。

推理引擎背后技术框架

 

伴随着阿里巴巴商品知识图谱的建设,阿里巴巴电商平台的管控已从过去的“巡检”模式升级为发布端实时逐一检查。阿里巴巴商品知识图谱的推理引擎技术满足了智能化、自学习、毫秒级响应、可解释等更高的技术要求。

 

三年,阿里巴巴知识图谱到底做了什么?

 

提到知识图谱,很多人可能会首先想到谷歌、百度。他们确实起步比较早。不过,阿里巴巴仅用三年时间,就成功打造出国内最顶尖的电商域知识图谱。阿里巴巴是以应用促创新的典型代表。正是因为有了阿里巴巴庞大而复杂的商业生态,正是出于让用户拥有更好体验的不懈追求,才让阿里巴巴在知识图谱,甚至更广义的人工智能领域不断取得突破。未来,阿里巴巴还将继续深化与学界专家的合作,共同培育和打造开放的知识图谱社区。

 

阿里巴巴商品知识图谱在今年的杭州云栖大会上一亮相就博得了满堂彩。借此机会,阿里巴巴广邀全球技术领域的专家与学界大咖,共同研讨知识图谱领域的现状与远景,加深交流与互动。阿里巴巴早就与苏州大学国家杰出青年基金获得者张民教授及其团队建立了合作,研究知识图谱领域里涉及的文本处理前沿技术,此外还与浙江大学陈华钧教授的团队建立了合作,主攻知识图谱领域里知识表示与推理前沿技术方向。阿里巴巴商品知识图谱团队还与国际上的专业组织频繁交流与合作,全面开展数据合作。

 

让人感到兴奋的是,人工智能领域的顶级会议之一——2018年国际人工智能协会年会(AAAI)将在美国新奥尔良举行,阿里巴巴有多篇论文入选,其中就包括阿里巴巴业务平台事业部与苏州大学知识图谱联合项目的两篇论文。论文主要关注知识图谱构建过程中文本挖掘核心技术的创新。

 

仅用三年时间,阿里巴巴就积累并形成了一个巨大的知识图谱和海量的标准数据,通过与高校的联合研发,引入前沿的自然语言处理、知识表示和逻辑推理技术等,形成了完整的知识图谱技术平台,打造了全网商品智能服务体系,稳定支撑线上的全球消费者和卖家。知识图谱已经成了阿里“新零售”和国际化发展的智能引擎。



OpenKG.CN


中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480958.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

美团技术团队-大众点评搜索基于知识图谱的深度学习排序实践

美团技术团队博客网址:https://tech.meituan.com/2019/02/28/root-clause-analysis.html 1. 引言挑战与思路搜索是大众点评App上用户进行信息查找的最大入口,是连接用户和信息的重要纽带。而用户搜索的方式和场景非常多样,并且由于对接业务种…

NLP、炼丹技巧和基础理论文章索引

玩家你好 恭喜你捡到了一个来自上古时期的*七*星*炼*丹*炉*,只见炉壁上镶嵌着自然语言处理、推荐系统、信息检索、深度炼丹、机器学习、数学与基础算法等失传已久的江湖秘术。熔炉中虽然已有一层厚厚尘土,却依然掩盖不住尘埃下那一颗颗躁动不安的仙丹。 …

支付系统-概念与架构

一、什么是支付系统 自古以来,所有的商业活动都会产生货币的收款与付款行为。在人类漫长的历史长河中,记录收付款行为的方式不断迭代:古代的账房先生通过手工记账,工业社会通过收银机机械记账…… 今天,进入了互…

论文浅尝 | Reinforcement Learning for Relation Classification

论文链接:http://aihuang.org/p/papers/AAAI2018Denoising.pdf来源:AAAI 2018MotivationDistant Supervision 是一种常用的生成关系分类训练样本的方法,它通过将知识库与非结构化文本对齐来自动构建大量训练样本,减少模型对人工标…

各大集团技术团队社区-微软-阿里-腾讯-百度-美团

百度AI社区:http://ai.baidu.com/forum/topic/list/169 阿里云栖社区:https://yq.aliyun.com/articles/ 美团技术团队:https://tech.meituan.com/2019/02/28/root-clause-analysis.html 微软行业博客:https://cloudblogs.microsof…

2019年终总结与新年重磅福利

一只小狐狸带你解锁NLP/ML/DL秘籍圣诞已过,元旦即临回首2019,我们收获满满展望2020,我们砥砺前行在这新春佳节之际小夕给大家送上七福大礼包别怕太沉,赶紧收下吧~~~自然语言处理花生仁????神经网络与炼丹鲜虾丸????机器学…

支付系统-会计核心

一、复式记账 第一个问题:如何理解账务系统单边记账,会计系统复式记账? 有些公司内部账户之间转账都采用复式记账法,如充值、提现交易,他们在账务系统都记单边流水,等和银行对账后,在会计系统复…

【Java】函数式编程

1 函数式接口 1.1 概念 函数式接口是有且仅有一个抽象方法的接口,可以包括静态和默认方法。 FunctionalInterface:加上注解,检测是否的函数式接口 FunctionalInterface public interface MyFunctionInterface {public abstract void meth…

领域应用 | 中医临床知识图谱的构建与应用

本文转载自公众号:e医疗。 知识图谱是近年来知识管理和知识服务领域中出现的一项新兴技术,它为中医临床知识的关联、整合与分析提供了理想的技术手段。我们基于中医医案等临床知识源,初步建立了由疾病、证候、症状、方剂、中药等核心概念所构…

还在随缘炼丹?一文带你详尽了解机器学习模型可解释性的奥秘

一只小狐狸带你解锁NLP/ML/DL秘籍正文来源:腾讯技术工程所谓炼丹,就是将大量灵材使用丹炉将其凝炼成丹。练成的灵丹蕴含灵材的大部分特性,方便携带,容易吸收。高级仙丹在炼制中更是能吸收天地灵气从而引发天地异象。深度学习的模型…

支付系统-财务系统

一、概述 从业多年经手过的印象比较深刻的几个系统,我将其中对账及清结算系统进行了剥离,着重为大家分享一下支付系统需要具备哪些功能,以及当时在实际搭建过程中,我们对于功能及整体做出的具体选择。 首先如图所示,支…

论文浅尝 | CFO: Conditional Focused Neural Question Answering

Zihang Dai, Lei Li, and Wei Xu. 2016. CFO: Conditional focused neural question answering with large-scale knowledge bases. In Proceedings of ACL, pages 800–810.链接:http://aclweb.org/anthology/P/P16/P16-1076.pdfGitHub 项目地址:https:…

【Java】Stream流和方法引用

1 Stream流 1.1 Stream流优化过滤集合 传统方式 用一个循环过滤姓张的人用一个循环过滤名字长度大于2的人 public static void main(String[] args) {ArrayList<String> list new ArrayList<>();list.add("张三");list.add("李四");list.a…

Python中输入和输出

版权声明&#xff1a;本文为博主原创文章&#xff0c;未经博主允许不得转载。 https://blog.csdn.net/xiaokang123456kao/article/details/73009480 </div><link rel"stylesheet" href"https://csdnimg.cn/release/phoenix/template/css/ck_htm…

刘志明 | 知识图谱及金融相关

本文转载自公众号&#xff1a;挖地兔&#xff0c;本文的作者刘志明先生也是 Tushare 的作者。 Tushare 是一个基于 Python 语言的免费、开源的财经数据接口包&#xff0c;可以为金融量化分析人员提供快速、整洁和多样的结构化数据&#xff0c;帮助量化投资人员节省数据采集和清…

模型训练太慢?显存不够用?这个算法让你的GPU老树开新花

一只小狐狸带你解锁NLP/ML/DL秘籍作者&#xff1a;小鹿鹿鹿&#xff0c;夕小瑶老板&#xff0c;咱们就一台Titan Xp&#xff0c;训不动BERT呀没钱买机器&#xff0c;自己想办法。委屈T^T我听说混合精度训练可以从算法上缓解这个问题&#xff1f;喵喵喵&#xff1f;&#xff1f;…

【Java】Junit、反射和注解的笔记

1 Junit 黑盒测试&#xff1a;不需要写代码&#xff0c;给输入值&#xff0c;看程序输出是否符合期望 白盒测试&#xff1a;需要写代码&#xff0c;关注程序具体的执行流程 Junit —> 白盒测试 步骤 定义一个测试类&#xff08;测试用例&#xff09; 【命名&#xff1a;类…

我对Spring的理解

1、什么是Spring&#xff1f; Spring是Java企业级应用的开源开发框架。Spring主要用来开发Java应用&#xff0c;但是有些扩展是针对构建J2EE平台的web应用。Spring框架目标是简化Java企业级应用开发&#xff0c;并通过POJO为基础的编程模型促进良好的编程习惯。 2、使用Spring…

k-means+python︱scikit-learn中的KMeans聚类实现( + MiniBatchKMeans)

版权声明&#xff1a;博主原创文章&#xff0c;微信公众号&#xff1a;素质云笔记,转载请注明来源“素质云博客”&#xff0c;谢谢合作&#xff01;&#xff01; https://blog.csdn.net/sinat_26917383/article/details/70240628 </div><link rel"stylesh…