贾扬清演讲实录:一个AI开发者的奇幻漂流

简介:2021阿里灵杰AI工程化峰会,贾扬清深度解读阿里灵杰大数据和AI一体化平台。

演讲人:贾扬清

演讲主题:一个AI开发者的奇幻漂流

活动:2021阿里灵杰AI工程化峰会

对于绝大多数人来说,这一波AI浪潮兴许是从深度学习开始的。

2011年谷歌发表的一篇文章讲到,用16000个CPU和11个参数的连接来训练一个能够识别猫的模型。

今天AI算法和应用百花齐放,给我们带来了非常多的梦想;而这几年整个行业的起起伏伏,背后也有许多弯路和故事。今天我们已经习惯了刷脸支付,但是似乎有一些更加高冷的梦想,比如像无人驾驶,都还只在路上。

我叫贾扬清,今天是一个消费网红的年代,所以我们起了一个名字叫奇幻漂流。如果可以的话,我想把自己描述成一个AI老兵。在人工智能的上半场当中,我们的体验可能没有那么奇幻,因为基本上我们就像拓荒者一样,身兼多个角色,在尝试着把AI 算法跟应用能够逐渐落地。

我们做过算法研究员,从AlexNet开始到ResNet ,到LSTM 到Transformer ,各种各样的模型,我们都希望逐渐把它落地。

Dingtalk_20211221143716.jpg

我们做过软件工程师,从各种各样的框架,像Torch、Theano、Caffe开始,到今天大家耳熟能详的Tensorflow和Pytorch,我们相当于在不断重新设计一套又一套语言,让我们能够把算法高效地实现出来。

我们做过数据工程师,把图片、语音、自然语言、用户各种行为等数据做清洗做标注,把它放在无论是磁盘还是数仓的各种地方,然后再输入到各种算法当中去来做应用。

最后。我们也做过系统工程师,从GPU开始到各种各样嵌入式的系统。我们搭了大大小小的系统,让我们这些模型能够简单更高效地跑起来。

当然我们也在不断地看应用,搭一个webserver ,做一个open API,把上面训练出来的模型能够实际的做成一个像刷脸,或者说hopefully 自动驾驶这样的应用。

但是我们就在想,老兵们遇到的挑战是什么?今天事情越来越多,各种组件越来越复杂。我们会发现,要把全链路问题都像以前这样人拉肩扛地解掉会累死也不可能。今天AI的应用已经不是一个模型,一个算法那么的简单。

回到技术的角度,数据、算法、模型、以及最重要的人,我们有了怎样的一些变化?我们希望能够做什么样的进一步思考?我想从这几个角度来比较过去和今天有什么样的区别。

我们先说数据,以前我们在做图片存储的时候,我们就把图片都放到一个磁盘上面去。

会发现速度比较慢,于是我们又把它放到一个,比如说类似LevelDB数据库上面,回过头来看,我们会发现这些就是非常标准的KV数据库。

在洞察用户行为的时候,我们首先要从Hive的数仓里面做各种各样的处理,把数据从Java的环境里搬出来。再到Python的环境里做训练,而这个训练底层的实现又是C++的,类似这样的拉通,以及AI的模型标准等等,这一系列的问题都变得非常麻烦。

而在AI应用当中,怎么样把数据回流下来,进一步地再做新的训练,这些数据链路的质量都会决定了最终应用的质量。今天我们就会非常需要一个大数据和AI 一体化的平台来解决数据的全生命周期当中各种各样的问题。

软件就更是一个备受关注的领域。如果往回倒8年,我们经常听到“我的框架比你的快”这样的比较。那么多年过去之后,今天为止我们依然看见有很多框架在走着老路,重新设计一套语言,重新设计一个开发环境等等。我觉得今天我们不需要来重复地造轮子。软件,或者说框架,核心主要在于两个,一个是往下如何来兼容各种各样的硬件、不同的处理器、不同的新的芯片,另一个是往上如何实现更好的分布式开发。

Dingtalk_20211221143816.jpg

尤其是当超大规模的模型变得越来越受关注,往下我们需要有更加好地AI编译环境,让软件和硬件更容易地迭代和开发。往上我们会需要有更好的系统和模型,或者说系统和算法工程师更好的相协同工作模式,让我们构建起分布式的模型以及规模化训练。在今天接下来的讲座当中,我们就会讲到在AICompiler 以及在分布式框架Whale等等上面做的工作和思考。

当有了数据和算法,我们怎么样来找到最需要的AI模型?最简单的方式是直接训练一个。但是图片、语音、自然语言处理等等领域有太多的模型,我们不可能每一个都从零开始自己训练。学术界有一个Model Hub ,我们经常可以在网上找到偏向学术的不同领域的模型。但这些实验模型怎样部署,会是个难题。工业界我们能够看到各种各样的AI服务,比如说像OCR 、语音识别等,但要把它们连接起来,好像又比较难。开发者自己也多多少少有一些自己的模型,我们怎么样来自己部署一个模型,怎么样实现所需要的弹性、稳定性、免运维的能力,怎么样把模型从非常大的训练结果到逐渐做量化、做蒸馏、做压缩,到变成一个可以在不同平台上部署的模型,这些都是我们在平台层面需要解决的问题。

最后我们来说人的故事。我们以前在做代码开发的时候,有GitHub等非常成熟的模式。AI要管的东西更多,有数据、有算法代码、有模型、有计算资源、有训练跟推理的资源。怎么样来让一个开发平台从以前的单机,到今天的多机多卡多个数据中心的情况下,依然能够高效地管理调度这些资源。今天后面会跟大家讲到,我们在AIdesigner 或者说AI 工作空间上的思考,用一个统一的空间来拉通我们的算法迭代,数据管理、模型训练和最后模型上线。

AI 的痛苦在于本质上今天AI还没有范式。AI 不是一个产品,这句话有两层含义,一方面它不光是一个单点的产品,而是一系列能力的组合;AI 今天非常强烈地需要标准软件和定制化服务的协同。

我们在云栖大会推出的阿里灵杰就是这样的一个大数据和AI一体化的产品体系。为什么要推出灵杰呢?我们非常强烈地意识到,我们需要把软件、定制化服务、以及开发者效率都结合起来。灵杰做的一件事情是,它将可以标准化的部分标准化,将没法标准化的部分用一系列工具和组件的方式提供出来,让开发者在定制上层服务的时候,能够更加便捷易用。

v2-8726c2f24eec909359415868daad72e3_720w.jpg

我们可以把灵杰理解为四层产品的有机组合。它的最底层是基于云基础设施,比如像计算、存储、网络等等这一些我们耳熟能详的基础产品。和以前不同的是,我们并不需要思考,从资源视角怎么样搭一个集群、加一堆GPU、或者装一个硬盘。今天我们可以从需求视角来考虑,需要多大存储、怎样的异构计算、怎样通过云原生容器化等等方式把资源简单地链接起来。这是最底层基础设施给我们提供的简单化、便捷化的能力。

在上面是大数据和AI一体化的平台。我觉得它是灵杰的核心部分。首先它给我们提供了大数据跟AI结合的能力。比如MaxCompute平台已经可以调用10万台集群来支持2000万张表跟千万级任务调度,它的Serverless模式代表着我们可以在非常小的,例如一张表、一个数据集、一个GB、一个任务开始就用零公摊成本来使用几乎无限的弹性。

和大家分享一个数字。过去我们经常有一个感觉,觉得大数据和AI是分开的。当我们在看阿里集团内自己的应用情况时,在大数据平台上,有超过30%的数据计算都已经应用于AI模型训练,这里都还没有计入AI推理这块。通过AI  Compiler和Whale软件框架,我们今天也在进一步提升AI计算效率。 当然平台的另一个重点是提升开发效率。在今天后面的分享中,我们会向大家介绍在大数据和AI一体化的平台上,如何用AI 工作空间这样的轻量化平台,以及PAI-DSW、PAI-DLC、PAI-EAS等组件来打通数据、训练、资源管理、推理和服务等等这一系列挑战。 工程平台最终目的是为了实现算法创新。想象一下8年前我们要做一个AI应用的时候应该怎么办?基本上就是我们自己去搜集数据,然后训练一个模型,再非常痛苦地把这个模型在自己手工搭建Web Server里面透出出来。还要时刻担心,如果没有人来访问这个模型,是不是资源就浪费了,如果太多人来访问,是不是服务稳定性又会打折扣。 

今天很多AI能力,比如说像OCR、语音、自然语言处理等等,都已经是标准化开箱即用的状态了。因此阿里云的工程师和达摩院的算法同学们合作,在10多种场景下的开放服务层,提供了上百种标准化的算法模型和服务,来解决AI落地应用最后一公里的问题。无论是OCR、语音、还是文本的理解,我们希望能够通过一个标准的模式来实现AI 模型的开通、接入和使用流程,就像下载和使用一个APP那么简单。 在灵杰之上我们搭建了非常多应用,今天大家可能都经常听见,像城市大脑、医疗大脑等等这样的概念。今天后面分享当中,我们想跟大家分享在互联网领域一个非常典型的应用,就是像在电商这类业务中,如何实现更高效地增长。它的本质就是怎么样把用户和他们所感兴趣的内容结合起来,最终达到用户体验和商业结果双赢的局面,后面的分享会有更细节地呈现。 总结一下,8年前我们说能够训练一个图像识别模型然后搭一个小的demo,就已经是一个顶级的AI开发者了。今天我们所面对的需求是将AI 的数据、算法和场景结合起来,去构建一个完整而且更加复杂的解决方案,来解决各行各业当中的实际问题。 从开发的角度来说,从我们想写第一行代码开始,到写下第一个AI模型需要多久?从应用的角度来说,从我们看到一个需求到prototype上线和服务需要多久? 这是我们今天一直在考虑的问题。阿里灵杰解决这个问题的思路,就是让不同的开发者们都能够按需取用、开箱即用。从最底层的基础产品,到中间的开发平台,到上层的开放服务,来帮助各行各业的科学家们和开发者们在云上一起画出人工智能增长的第二曲线。

原文链接
本文为阿里云原创内容,未经允许不得转载。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/511751.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

上云避坑指南100篇|「云」上玩法虽多,小心水土不服

商业智能BI发展至今,从市场增速来看,我国已进入 BI 及 DA(数据分析)领域的第一方阵,并成为发展最快的国家之一。 IDC 数据显示,2020 年中国商业智能软件市场规模为 5.8 亿美元,同比增长 17.1%&a…

如何基于LSM-tree架构实现一写多读

简介:传统MySQL基于binlog复制的主备架构有它的局限性,包括存储空间有限,备份恢复慢,主备复制延迟等问题,为了解决用户对于云上RDS(X-Engine)大容量存储,以及弹性伸缩的诉求,PolarDB推出了历史库…

Dubbo-go v3.0 正式发布 ——打造国内一流开源 Go 服务框架

简介:Dubbo-go 是常新的,每年都在不断进化。介绍 Dubbo-go 3.0 工作之前,先回顾其过往 6 年的发展历程,以明晰未来的方向。 作者 | 李志信 来源 | 阿里技术公众号 作者介绍: 李志信(github laurencelizhix…

谁还没经历过死锁呢?

作者 | 敖丙来源 | 敖丙之前刚学习多线程时,由于各种锁的操作不当,经常不经意间程序写了代码就发生了死锁,不是在灰度测试的时候被测出来,就是在代码review的时候被提前发现。这种死锁的经历不知道大家有没有,不过怎么…

阿里巴巴超大规模Kubernetes基础设施运维体系解读

简介:ASI:Alibaba Serverless infrastructure,阿里巴巴针对云原生应用设计的统一基础设施。ASI 基于阿里云公共云容器服务 ACK之上,支撑集团应用云原生化和云产品的Serverless化的基础设施平台。 作者 | 仔仁、墨封、光南 来源 | …

搜索NLP行业模型和轻量化客户定制

简介:开放搜索NLP行业模型和轻量化客户定制方案,解决减少客户标注成本、完全无标注或少量简单标注的等问题,让搜索领域扩展更易用。 特邀嘉宾: 徐光伟(昆卡)--阿里巴巴算法专家 搜索NLP算法 搜索链路 …

CICD 的供应链安全工具 Tekton Chains

作者 | Addo Zhang来源 | 云原生指北软件供应链是指进入软件中的所有内容及其来源,简单地可以理解成软件的依赖项。依赖项是软件运行时所需的重要内容,可以是代码、二进制文件或其他组件,也可以是这些组件的来源,比如存储库或者包…

python计算不规则图形面积_python opencv中的不规则形状检测和测量

正如我在评论中提到的那样,对于这个问题,分水岭似乎是一个很好的方法.但是当你回答时,定义标记的前景和背景是困难的部分!我的想法是使用形态梯度沿着冰晶获得良好的边缘并从那里开始工作;形态梯度似乎很有效.import numpy as npimport cv2img cv2.imread(image.pn…

深度解析开源推荐算法框架EasyRec的核心概念和优势

简介:如何通过机器学习PAI实现快速构建推荐模型 作者:程孟力 - 机器学习PAI团队 随着移动app的普及,个性化推荐和广告成为很多app不可或缺的一部分。他们在改善用户体验和提升app的收益方面带来了巨大的提升。深度学习在搜广推领域的应用也…

助力公益数字化 火山引擎向公益机构捐赠多款技术产品

5月18日,字节跳动公益联合火山引擎举办了“科技应用创新让公益更美好”线上交流会,与中国红十字基金会、壹基金等多家公益机构探讨如何利用科技信息化产品提升公益事业的效率,从而进一步解决社会问题。 交流会上,火山引擎联合Pic…

云效发布策略指南|滚动、分批、灰度怎么选?

简介:在日常和用户交流过程中,我们也经常会被用户问到关于发布的问题,比如不同职能团队之间应该如何配合、发布的最佳实践应该是什么样子的等等。今天我们就来聊聊常见应用发布方式的选择,以及每种发布模式适合什么样的场景。 无论…

shell安装mysql5.7_一键部署----shell脚本安装MySQL5.7

运维开发网 https://www.qedev.com2020-11-09 12:30出处:51CTO作者:wx5ddda4c97f426一键部署----shell脚本安装MySQL5.7#/bin/bashyum-yinstallncursesbisoncmakegccgcc-cncurses-develuseraddmysql-s/sbin/nologinread-p"输入你存放压缩包的绝对路…

极致用云,数智护航

简介:我们邀请到了阿里云混合云监控平台(Sunfire)团队负责人王肇刚来给我们分析下阿里背后的数字化业务运维安全工程标准及解决方案。 本次分享涵盖了全新发布的数字化业务运维安全工程标准、安全生产解决方案,以及全新升级的产品能力:包括了…

Lakehouse 架构解析与云上实践

简介:本文整理自 DataFunCon 2021大会上,阿里云数据湖构建云产品研发陈鑫伟的分享,主要介绍了 Lakehouse 的架构解析与云上实践。 作者简介:陈鑫伟(花名熙康),阿里云开源大数据-数据湖构建云产品…

菜鸟教程 mysql like_MySQL LIKE 子句

MySQL LIKE 子句我们知道在 MySQL 中使用 SQL SELECT 命令来读取数据,同时我们可以在 SELECT 语句中使用 WHERE 子句来获取指定的记录。WHERE 子句中可以使用等号 来设定获取数据的条件,如 "runoob_author RUNOOB.COM"。但是有时候我们需要获…

云原生 Serverless Database 使用体验

简介:表格存储 Tablestore 作为一款广泛应用 Serverless DataBase,能够提供经济的计费模式,可以大幅缩减业务成本的同时, 具备极致的弹性服务能力和完全零运维的特性,能够给用户带来更丝滑的使用体验。 作者 | 李欣 …

首推业人一体,北森2022春季发布会,正式发布iTalentX5.0

5月19日,中国最大的一体化HR SaaS及人才管理平台北森于线上召开“HR x业务”2022春季新品发布会,基于“业务人力一体化”理念发布iTalentX5.0,以战略和业务为牵引,用数字化平台赋能经理、员工和HRBP, 实现人力资源与业…

【阿里云 CDP 公开课】 第二讲:CDH/HDP 何去何从

简介:Hadoop社区版CDH/HDP已经不再更新,也将终止服务。后续的平台路线图怎么规划?Cloudera CDP整合了CDH和HDP,有哪些性能提升和功能增强?如何平滑的进行迁移?本文结合CDH/HDP平台现状,详细介绍…

mysql表全连接_关于mysql 实现表连接(左,右,内,全连接)

mysql 实现表连接(左,右,内,全连接)查询中出现两个表的连接,下面通过实例来讲解一下各种连接查询的不同之处表 a,和表b 如下图a 表中 有 abcdb表中有 abcf内连接:SELECT * from a INNER JOIN b on a.nameb.…

阿里云 Serverless Kubernetes 的落地实践分享

简介:Serverless Kubernetes 基于 Kubernetes 之上,提供按需使用、节点免运维的 Serverless 能力,让开发者真正实现通过 Kubernetes 标准化 API 进行 Serverless 应用编程,值得关注。 作者 | 元毅(阿里云容器平台高级开…