nsoutlineview 搜索_阿里巴巴搜索推荐广告三位一体的在线服务体系

最近在工作中大量使用到了淘系的在线分发服务体系,可以快速高效的实现个性化内容分发,其技术架构的概览在这里分享给大家。

AI·OS(Artificial Intelligence Online Serving)是阿里巴巴集个性化搜索、推荐、广告三位一体的在线服务平台。在大型互联网公司里,使用一套技术来支撑搜索、推荐乃至广告是比较少见的。之所以能成为统一的AI·OS体系,是因为阿里巴巴把搜索、推荐、信息流、广告、深度学习这几项,从技术到业务场景都不同的东西,非常好地结合到了一起,得以形成了有实质内涵,能相互借助合体发力的基础引擎平台。

阿里的平台技术战略,本质上是两样东西,一是电商技术(包括商品管理、类目管理、运营管理、交易链路),另一个是和电商配合的大数据 AI 技术的应用。在当今时代,AI的投放、搜索推荐,甚至广告的投放,已经是独立于传统电商的技术场景。

纵观整个业务场景,可以做如下划分:

0609277f-8f19-eb11-8da9-e4434bdf6706.png

对于技术层面的划分,由上至下分为三层:

  • 分布式引擎系统需要具备的能力。无论是搜索、推荐、广告,都需要召回、排序,系统做大之后,需要分布式通信,高性能索引的存储,要有比较高效率的支持索引灵活构建更新的能力,以上是基础能力。

  • 深度学习时代沉淀出来的技术要求和场景要求。比如深度学习需要做样本处理,做训练,在线预测,同时,与之相应的,是个性化投放,这在搜索、推荐、广告都有所体现。最后,索引的部分还应该支持实时更新

  • 整个体系内有资源管理,高可用性,相应的计算引擎的支撑,运维的管控和插件的支持。

AI·OS 工程体系技术

0909277f-8f19-eb11-8da9-e4434bdf6706.png

在这个组件的最下层是资源的管理,叫 Hippo,是一个非常高效的资源管理系统。

右侧是系统里的中间件,是更为基础的组件,跟实际的业务功能都直接相关。

左侧的算法平台、离线平台、训练平台、计算平台,是在深度学习时代新的开拓。星云是面向大规模商业化场景的一站式深度学习建模平台。借助星云,用户可以快速完成从特征引入、样本特征变换,到模型训练及评估,再到模型交付整个算法建模闭环。在此基础上,星云提供了完善的数据模型校验体系,确保用户的离线建模和模型交付具备生产级别的可靠性。星云支持全量学习、增量学习和在线学习,并通过高层抽 象实现了各种学习模式之间的低成本切换。XDL是以开源框架为基础,面向广告、搜索、推荐等场景打造的分布式深度学习框架,针对高维稀疏特征、互联网结构化数据和结构化模型进行了专门设计与优化。

中间在线服务和业务密切相关。HA3 搜索引擎的服务是阿里云最经典的具有全文本检索能力的引擎。商业化引擎,是与 HA3 相对应的,支持广告业务、关键词匹配带广告,或者支持定向场景投放的召回引擎。iGraph 图引擎,是具备在线图计算和图检索能力,在业界规模较大的图检索引擎,它里面具备的用户个性化关系、知识图谱的在线推导能力都是很大规模的。这些引擎都是支持数据实时更新的,这个能力的来源就是AI·OS Framework,支持对数据的管理,对更新的管理,是对右侧整套技术的依赖,也有延伸出来的深度学习的能力。预测引擎 RTP,把 TensorFlow 的能力集成进来,让深度大模型支持实时更新,充分利用实时数据分布,提升 CTR/CVR 预估精度,获取业务效果。模型特征支持实时更新,模型可以增量训练,通过对 RTP 在线 graph 分解,提取可更新模型 weights 成最大不连通可执行子图,实时发送模型数据消息,真正实现了模型离线流式训练,在线实时更新的效果。TPP(The Personalization Platform,阿里个性化平台)为集团众多的个性化业务提供开放、一致的解决方案,让搜索、推荐技术轻松服务于业务发展,业务也能快速得在平台找到需要的技术,是 AI·OS(Online Serving)大数据深度学习在线服务体系中的入口之一。

在线服务技术架构演进

AI·OS 在线服务架构,对逐步走向规模化的初创公司,具备一定的参考意义。

0a09277f-8f19-eb11-8da9-e4434bdf6706.png

  • 在 2013 年至 2015 年期间主要在搜索引擎上做性能优化,在阿里体系内部做搜索引擎平台化。搜索搭建主要是运用比较经典的架构——Query 的处理+搜索引擎+摘要服务,Query 的部分,会有一些个性化存储,当时是用简单的 KV 来完成。这个架构是很多初创型企业选用的架构,也是云产品提供的一个经典解决方案。

  • 2015 年到 2018 年,随着信息流业务的进入,将搜索底层(Suez 或 AI·OS framework)数据抽象沉淀出来,在沉淀的数据上面,衍生了图引擎、预测引擎、搜索引擎、推荐引擎,形成了今天 AI·OS 的主体框架。

  • 2018 年~2019 年,推进了全图化的架构。在业务逻辑调整、场景迭代、功能调整,如粗排、精排、统计、过滤这些功能,都用图化的方式来表达,在业务迭代效率上,有了质的飞越。

  • 随着集团内部进一步贯彻中台战略,不管是在软件的抽象,还是在能力的衍生,都需要在云上发挥。践行平台化、通用化的思路,用最高效的方式解决问题,并打造出了海神(一站式选品投放系统)、开放搜索(一站式内容智能搜索服务)等经典应用产品。

AI·OS 云原生产品与实践

依托于 AI·OS 体系构建的产品矩阵如下所示。

0b09277f-8f19-eb11-8da9-e4434bdf6706.png

  • 开放搜索(OpenSearch)源于阿里巴巴 AI·OS 体系技术,是免运维、一键式的云上平台,将搜索平台服务化、产品化,完全屏蔽了搜索系统的底层复杂度,以标准化产品的方式支持业务。

    0c09277f-8f19-eb11-8da9-e4434bdf6706.png

  • 智能推荐(AIRec)提供一站式的个性化推荐服务,服务使用者在提交内容和用户行为,在确保数据保密的前提下,按照不同行业的模板,应用个性化推荐算法,实时调整效果,为用户提供服务。

    0f09277f-8f19-eb11-8da9-e4434bdf6706.png

  • 还有围绕开源生态的 Elasticsearch,由阿里巴巴和 Elastic 公司合作推出。将 Elasticsearch 的灵活易用和阿里巴巴调度管控系统的稳定高效相结合,并根据用户需求,不断迭代自研的创新性功能.

在后续文章,我将通过展示这些系统的具体使用方法,欢迎大家关注。

[1]淘系千人千面分发体系全拆解 https://developer.aliyun.com/topic/download?spm=a2c6h.12873639.0.0.a7253263pFVo5c&id=8619&Signature=nqC%2Fc8BvldkxgJ21cQBlOgQe7Kk%3D

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/468402.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

为了生活

前几天,我刚刚满30岁,30岁的那天,过得很深刻,高烧了40度,每次发烧我都没有去医院,这次也一样,潜意识里面觉得它一定会来,潜意识里面也知道它一定会走,不管是40度还是45度…

深度ip转换器手机版app_手机大师智能管家app下载-手机大师智能管家app官网版 v1.0.0...

手机大师智能管家app:针对各种手机垃圾快速在线清除的软件,利用这款软件可以快速的清除各种不同的手机垃圾,而且还可以一键在线加速,更好的享受手机加速带来的便捷,同时针对各种文件清理也更加的简单,让你更…

小米19999

以前没有钱买小米现在也是,没有钱买小米19999的小米可能会比较贵但是看完这几个动图再决定要不要切肾毕竟肾只有一个消息提示调节音量播放音乐玩游戏CS通知栏充电好像有几次文章都说明了我有好多好多朋友在做手机所以我对手机其实没有多大新鲜感不是因为贵了就买而是…

html5+css3第一次作业_“台风爷爷,让我作业飞走!”南京小学生写的诗都这么逆天了?...

小学生的脑洞能有多大?看看他们写的诗就知道了!最近,南京游府西街小学四年(6)班孩子们的语文作业火了,一个个神句让老师都不得不服气。赶紧戳图来看↓↓↓语文老师严杏村介绍,原本的作业是抄写儿童现代诗,但…

小心内存对齐

什么是内存对齐?CPU在读取内存地址的时候,一定按照一定的偏移量去读取,不知道你发现了没有,我们没有看到一个变量的大小是 3 个字节的,都是 1 个字节,2个字节,4个字节,8个字节&#…

JavaScript获取select下拉框中的第一个值

JavaScript获取select下拉框中的第一个值 1、说明 获取select下拉框中的第一个值 2、实现源代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns&quo…

好用的平板电脑_支架里的变形金刚让手机、电脑、平板更好用!6种角度,1秒切换...

六 月 惊 喜戳 这 里嗨&#xff0c;我是专注研究数码3C产品的小嘻~对于当代人来说&#xff0c;办公、学习、娱乐离不开三件宝&#xff1a;手机、平板、电脑。手机不离手&#xff0c;沟通工作、看剧、刷抖音&#xff0c;没留神几个小时就过去了&#xff0c;放下手机的时候就觉得…

推荐一位AI技术人

今天推荐认识的一个朋友&#xff0c;推荐的原因很简单&#xff0c;因为他非常喜欢篮球&#xff0c;正统校队篮球队员&#xff0c;这个AI相关的公众号一直是他个人运营&#xff0c;写了非常多的文章&#xff0c;如果大家有在学习AI相关的知识&#xff0c;强烈推荐关注。AI蜗牛车…

如何 给给软件开发 添加 代理_敏捷开发是如何被跑偏的

今天聊聊敏捷软件过程。先说结论&#xff1a;据我观察&#xff0c;至少有60%的团队误用了敏捷软件过程&#xff0c;或者说至少60%的团队在进行伪敏捷开发。与大家通常的认知是相反的&#xff0c;敏捷过程并不是一个非常容易实践或者实施的过程规范。通常来讲&#xff0c;没有天…

在实时操作系统里随便写代码都能硬实时吗?

这是转发宋老师写的文章&#xff0c;我也是刚知道&#xff0c;宋老师跟我一样也是养娃的人了&#xff0c;国庆期间&#xff0c;看看文章&#xff0c;看看升升国旗。很久没有写技术文章了&#xff0c;做码农难&#xff0c;做养娃的码农更难&#xff0c;趁着娃看动画片的机会&…

python 数据分析 实际案例_python实战案例:超市营业额数据分析

实战是学习的最好途径&#xff0c;效率最高&#xff0c;本文不是很长&#xff0c;通过小小的练习&#xff0c;让大家综合运用基础知识&#xff0c;加深印象巩固记忆。一、读入数据&#xff0c;了解数据本数据随机生成的假数据&#xff0c;读者可以自己造&#xff0c;也可以通过…

台达n2系列变频器_台达变频器C2000系列在Profibus网络中的应用

基本介绍现场总线就是顺应信息技术的发展趋势和工业控制系统的分散化、网络化、智能化要求而发展起来的新技术&#xff0c;它的出现和发展已经成为全球工业自动化技术的热点之一&#xff0c;受到全世界和工业界的普遍重视。现场总线(Fieldbus)技术是实现现场级控制设备数字化通…

CentOS 6.8 虚拟机安装详解

第一步&#xff1a;安装 VMware 官方网站&#xff1a;www.vmware.com 下载百度云链接&#xff1a;http://pan.baidu.com/s/1bphDOWv 密码&#xff1a;0zix VMware 是一个虚拟 PC 的软件&#xff0c;可以在现有的操作系统上虚拟出一个新的硬件环境&#xff0c;相当于模拟出一台新…

unittest里discover用法_unittest框架核心要素及应用

1. unittest核心要素unittest介绍测试框架&#xff0c;不仅仅用于单元测试python自动的测试包用法和django.test.TestCase类似1.1【知道】unittest介绍和核心要素1.2【掌握】unittest核心要素的使用""" 1. 测试用例 2. 容器&#xff0c;容器添加测试用例 3. 运行…

void函数调用时显示不允许使用不完整的_4位数码管显示模块驱动

TM1637四位数码管模块是一个带时钟点的4位共阳数码管(0.36英寸)的显示模块&#xff0c;驱动芯片为TM1637&#xff0c;驱动方式为IIC&#xff0c;因此只需2根信号线即可使单片机控制4位8段数码管(数码管8级亮度可调)。模块特点如下&#xff1a;显示器件为4位共阳数码管数码管8级…

在线就能用的Linux我给你找好了

今天的天气真的是超级爽&#xff0c;秋日的凉风吹在脸上真的太美了&#xff0c;好不容易的假期&#xff0c;希望大家都玩得开心&#xff0c;今天分享一篇文章&#xff0c;是守望兄的&#xff0c;总结了几个在线的Linux&#xff0c;喜欢的同学&#xff0c;可以保存下来&#xff…

mysql访问类型最好的_【干货满满】最全的MySQL性能指南(一):选择最佳的数据类型...

对于 MySQL 数据库来说&#xff0c;好的逻辑表和物理表的规划至关重要&#xff0c;我们需要根据查询语句来针对性地设计 Schema &#xff0c;没有万能好用的 Schema。一个 denormalized 的 schema 可以在某些场景下加速语句查询&#xff0c;但是放在其他应用场景下就会适得其反…

测试两个主机之间的连通性_借助网络测试神器极速解决网络故障

时下&#xff0c;网络使用越来越频繁&#xff0c;随之遇到网络故障的情况也多起来&#xff0c;那么诊断网络故障就成了必不可少的一环&#xff0c;投诉和求助是一种基本的方法&#xff0c;但有时太过缓慢&#xff0c;有些时候自己可以快速搞定&#xff0c;检查到故障原因所在&a…

随想,对嵌入式职场建议

guoqingjie已经过去两天了&#xff0c;因为楠哥生病&#xff0c;我们搁浅在了深圳&#xff0c;不过相比在路上的奔波&#xff0c;待在家里感觉惬意不少&#xff0c;不用在路上各种操心&#xff0c;之前上班感冒&#xff0c;身体处在亚健康状态&#xff0c;睡了两天身体也恢复一…

java可达性_java垃圾回收机制--可达性算法

先说一些题外话&#xff0c;Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区&#xff0c;这些区分为线程私有区和线程共享区1、线程私有区a、程序计数器记录正在执行的虚拟机字节码指令地址。此区域是是唯一一个在java虚拟机规范中没有规定任何Ou…