双11个性化推荐背后,阿里云“舜天”如何应对百亿次挑战?

2018天猫双11在技术世界,创下不少新记录,其中有一个记录是11日当天阿里全平台共为用户做个性化推荐453亿次,这些推荐的图片长度加起来可以绕地球70圈。

当你在天猫/手淘上买买买的时,图片会以不同格式或分辨率来转码呈现,这就要求后台系统需要强大的算力来保障数倍于平时的转码需求。FPGA是可编程芯片中处理这类并行计算的最佳能耗比方案,这位曾经高冷的“王谢堂前燕”,通过云计算的价值加成,正在赋能越来越多的科技创新。

在今年的XDF 2018大会上,阿里云的工程师首次向业界揭开了阿里云FPGA平台“舜天”的神秘面纱,这台云端计算加速的新引擎初露锋芒。

FPGA最大的特点是直接基于硬件编程,拥有高吞吐和低延时等特性,可以很容易搭建出数据并行通道,同时完成流水线并行;相对于ASIC,又具有软件的可编程性和灵活性,这让它能完美适应AI等对大算力有刚性需求并且尚处于快速迭代期的场景。

然而,传统的FPGA线下开发,过程非常繁琐。对于IP提供商或方案集成商来说,需要自己开发和维护硬件,推广难、成本高。对于客户来说,开发时也绕不开硬件环节,试错成本大、周期长。

FPGA+云正好是解决这些难题的最佳方案。

阿里云工程师张振祥介绍,

“舜天”平台整合了传统FPGA产业链的多个环节:从芯片原厂商,硬件,IP供应商等等,将它们统一打包成平台资源,使客户可以专注于算力的实现,而IP供应商可以简化交付流程,大幅优化交付周期和运营成本。

从2017年8月开始,“舜天”已经历经三代产品迭代,最新上线的F3系列实例,可提供超过1000万逻辑单元和高达47 TeraMACs的DSP计算能力。

以时序数据库为例,舜天平台的处理效率比CPU高出30倍以上:单路FPGA实现的实测峰值性能为2.97GB/s,相比之下,单核CPU压缩的实测性能约为90M/s。在图片识别场景下,舜天F3提供的算力约相当于7台CPU服务器,大幅降低了Capex成本,相比CPU服务器,TCO降低超40%

而且,这个能力还可以扩展,当开发者在处理高性能计算和机器学习时,往往需要多芯片共同计算。“舜天”提供了各类高速接口,可完成1/2/4片芯片互联拓扑,并支持动态配置。以卡内双芯片通信为例,带宽高达600Gbps,同时支持多种轻量级传输协议,传输效率达95%

/一睹真容:久经沙场的悍将/

在阿里巴巴内部,“舜天”其实已经久经沙场,支撑了包括双11在内的超大型计算场景、城市大脑、时序数据库、高清视频编解码等等明星业务都涉及FPGA加速。

以双11举例,在客户通过淘宝/天猫APP或者网页端浏览商品时,图片需要以不同格式或分辨率来呈现。舜天平台的并行计算能力,直接将图片处理的延时缩减到CPU服务器的50%,将吞吐能力提升了数倍。

在基因赛场里,“舜天“的表现也很出色,100Gbp全基因组分析时间被缩短至两小时,速度比过去提升了10倍,单位成本也大大降低。全基因,指的就是把物种细胞里面完整的基因组序列从第1个DNA开始一直分析到最后一个DNA,这种技术几乎能够鉴定出基因组上任何类型的突变。

/化繁为简:大幅降低开发门槛/

在传统软件工程师眼里,FPGA芯片的开发门槛是很高的,一方面需要了解HDL硬件编程,一方面需要对底层硬件和接口了如指掌。

在此次的XDF大会上,阿里云工程师潘岳介绍了舜天平台的解决方案。

首先,“舜天”增加了对高级系统语言的支持,包括C, C++, OpenCL等。这意味着开发者可以在他们熟悉的编程语言和工作流程中顺畅使用,而且确保原本基于CPU或GPU的开发可以轻松移植到云上的FPGA器件中。同时,阿里云还提供了大量的参考设计和开发包,帮助开发者快速建立系统。

接口方面,“舜天”提供了统一的标准总线接口,包括:DDR4/5、PCIe、DMA等等,开发者无需动手,只需要关心内部逻辑实现(图中灰色部分)

此外,阿里云还支持多种主流FPGA的Shell+Role实现,可以适配跨平台的Multi-boot方案,让用户能够轻松完成跨平台迁移。

/IP加密隔离:安全不打折/

作为FPGA生态的最重要一环,IP厂商非常在意云上的多租户环境。既要需要确保IP产品不泄露,又要保证用户购买的IP只能被自己使用。

为此,阿里云采用了IP加密、网络隔离、IP所属权和使用权分离等方式确保了用户的源码(或IP源码)、发行包、部署环境全程对第三方完全不可见,同时还提供健康监控能力,及时感知底层故障并实时报警。

作为最早入住舜天平台的IP提供商之一,联捷计算科技CTAccel CEO俞海乐博士表示,

上云后安全是我们最关注的问题,阿里云的安全隔离做得非常到位,这也是我们优先选择阿里云进行部署的原因。

/不变的使命:共建普惠异构生态/

此前阿里云的Slogan“为了无法计算的价值”一直深入人心,积极布道普惠计算。自推出异构计算依赖,开发者在阿里云上能以更少的价格使用性能更强的GPU/FPGA实例,在深度学习领域将开发成本降低了一半以上。

为了让更多开发者能够享受到FPGA的收益,阿里云推出了FPGA弹性云服务器,并建立了FPGA镜像市场,让具有创新思路和成熟解决方案的IP产品通过平台脱颖而出,扩大市场规模,加快研发进度,提高设计稳定性。

张振祥说,

舜天是阿里云使能人工智能产业的一大利器,我们欢迎更多的开发者加入阿里云FPGA生态,推动技术落地到产业中去。

 

原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/520516.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

重磅发布!阿里云推PostgreSQL 10 高可用版

2015年,阿里云宣布正式推出RDS for PostgreSQL服务,届时,阿里云成为国内首家同时支持MySQL、SQL Server 和PostgreSQL关系型数据库的云计算服务商。 用户在云上就能享受PostgreSQL引擎带来的对SQL标准和NoSQL的高度兼容、强大的处理复杂查询能力、以及丰…

axios专栏

axios 基于promise用于浏览器和node.js的http客户端 支持浏览器和node.js 支持promise 能拦截请求和响应 自动转换JSON数据 能转换请求和响应 数据 axios基础用法 get和 delete请求传递参数 通过传统的url 以 ? 的形式传递参数 restful形式传递参数 通过params 形式传递参数…

表示自己从头开始的句子_从头开始的唯美句子

1、你有力气挣扎在自己的现状里,却没勇气跳出自己的生活,重新开始。2、亲爱的,不必去追悔过去。人生就像摩天轮,总有那么一刻,天空,会为你而停留。3、找不到坚持下去的理由,那就找一个重新开始的…

【双11】阿里云边缘节点ENS助力淘宝构建音视频通信网络

前言 淘宝在2016年推出直播平台,和娱乐直播性质不同,电商直播的主角多为网红店铺及网红达人,以直播带动产品售卖。在淘宝的双11流量加持之下,淘宝直播平台关注度持续攀升,通常的网红店主一场直播带来的收益不亚于一场…

护航Lazada双11购物节 阿里云CDN全球化火力全开

2018年11月12日零点——东南亚最大的电子商务公司Lazada 2018双11购物节正式收官。这是一场超过2000万的消费者在Lazada网站上及APP上浏览和疯狂抢购的盛会。 Lazada是东南亚最大B2C平台,业务范围覆盖印度尼西亚、马来西亚、菲律宾、新加坡、泰国和越南六个东南亚国…

plink源码_plink: 等位型计数(allele count)

对genotype的等位型进行计数,需要用到以下参数:--freq Allele frequencies--countsModifies --freq to report actual allele counts具体用法如下命令:/plink-1.07-x86_64/plink --freq --counts --noweb --bfile file --make-bed --out file…

AI行业真实现状:做芯片没工作,做视觉、语音血赚

最近,深圳前瞻产品研究院发布了《2019年人工智能行业现状和发展趋势报告》,笔者看过之后,感觉真是用了心,这不仅是一份数据报告,更像一本“扫盲手册”。众人皆知,AI血赚,当我们谈人工智能&#…

JSON数据从OSS迁移到MaxCompute最佳实践

本文为您介绍如何利用DataWorks数据集成将JSON数据从OSS迁移到MaxCompute,并使用MaxCompute内置字符串函数GET_JSON_OBJECT提取JSON信息。 数据上传OSS 将您的JSON文件重命名后缀为TXT文件,并上传到OSS。本文中使用的JSON文件示例如下。 {"store&…

java使用String的split()方法数组下标越界问题

今天做练习的时候使用String的split(",")方法在控制台进行信息截取,一开始出现数组下标越界的提示我就去用for循环遍历了一下,有三个片段的输出信息,然后我网上查了说有以下几种情况: 1.代码编码和控制台中文编码不一致…

在MaxCompute上分析IP来源的方法

淘宝IP库 淘宝IP地址库官网地址http://ip.taobao.com/,其查询接口[http://ip.taobao.com/service/getIpInfo.php?ip[ip地址字串]](http://ip.taobao.com/service/getIpInfo.php?ip[ip地址字串]),如下所示: 但是在MaxCompute中禁止使用http…

egg直接取req_Egg服务器基础功能

1. 框架约定目录规则1.1 app/router.js:用于配置URL路由规则;1.2 app/controller/** :用于解析用户的输入,处理后返回相应的结果;1.3 app/service/**: 用于编写业务逻辑层;1.4 app/public/**&am…

我和 Spring 大神的一天

先介绍一下故事的5位主人公。 Josh Long 龙之春: Spring 技术布道师,撰写过5部著作,录制过3部畅销的培训视频,是一位开源软件贡献者。 Spencer Gibb: Spring 技术布道师,Spring Cloud核心项目的联合创始人…

Android开发中解决自定义弹窗获取不到控件对象的问题

最近做期末作业的时候遇到一个功能需要在弹窗里修改账号密码,弹窗里面含有两个edittext控件,经过查阅资料我通过setView添加了一个view在弹窗里实现了,但是获取的控件对象一直为空导致我取不到输入的值,找了好久的错误原来获取对象…

是什么样的骚操作让应用上线节省90%的时间

优秀的程序员 总会想着 如何把花30分钟才能解决的问题 在5分钟内就解决完 例如在应用上线这件事上 通常的做法是 1. 构建项目 在本地用maven打包 每次需要clean一次,再build一次 2. 部署包 在本地ide、git/svn、maven/gradie 及代码仓库、镜像仓库和云平…

华为鸿蒙宣传悟空视频_华为自研鸿蒙系统定档9月?《悟空》微电影透露玄机...

【手机中国新闻】“六一”期间,由蔡成杰导演使用华为P30 Pro零外接镜头拍摄的竖屏电影——《悟空》引起网友热议。这部电影的精神内核在于孙悟空拥有十八般武艺,不畏艰险,敢与“恶势力”斗争。但是真正让网友们关注的是电影中出现了一个特别的…

阿里程序员工作小技巧 | 理解CPU分支预测,提高代码效率

技术传播的价值,不仅仅体现在通过商业化产品和开源项目来缩短我们构建应用的路径,加速业务的上线速率,也会体现在优秀程序员在工作效率提升、产品性能优化和用户体验改善等小技巧方面的分享,以提高我们的工作能力。 从本期开始&am…

Spring Tools 4 for Eclipse 下载

https://spring.io/tools 注:如果双击不能运行,就先执行java -jar spring-tool-suite-4-4.6.0.RELEASE-e4.15.0-win32.win32.x86_64.self-extracting.jar 再次双击运行,就好使了。 注:这个文件夹放到什么地方,都可…

我花了一夜用数据结构给女朋友写个H5走迷宫游戏 | CSDN 博文精选

戳蓝字“CSDN云计算”关注我们哦!作者 | bigsai(同公众号)转自| CSDN博客责编 | 阿秃先看效果图(在线电脑尝试地址http://biggsai.com/maze.html):起因又到深夜了,我按照以往在公众号写着数据结构!这占用了我大量的时间…