戳蓝字“CSDN云计算”关注我们哦!
这是阿晶的第一次AWS之行,在上海,2019世界人工智能大会。
一年前,同样在上海,AWS成立其亚太地区首个人工智能研究院。还记得当时振奋人心的官宣:AWS上海人工智能研究院将重点聚焦推进和发展深度学习算法及其未来应用。具体会为AWS中国开发者社区带来不止于工具层面的突破,而是让早已大热的人工智能技术更快应用在开发者手上,走入开发者心中。
如今,一样的上海,AWS又发布了由上海人工智能研究院构建的Deep Graph Library (DGL),即图神经网络框架。据悉该框架可以高效帮助开发者构建深度学习模型,以快速、可扩展的方式理解数据中的图结构,从而让机器学习更好地应用到制药公司的新药开发,社交媒体的图像资料分析等诸多领域,召集更多开发者开展深度学习,促进初创企业采用机器学习技术。
“按需所用”,AWS机器学习服务“划重点”
以上讲了人工智能、深度学习、机器学习等专有名词概念,可能多少有些难于理解。谈及AWS的机器学习服务,阿晶觉得总体来说可以概括为四个字“随需所用”。
如图所示,AWS提供了多层面多维度的服务:通常如果使用最底层服务,原则上需要IT工程师、机器学习的科学家以及应用开发人员协作才能开发出一个适用性较高的AI服务;相比而言,使用中间层并不需要IT工程师,只需机器学习科学家以及应用开发人员这两者就可以轻松hold住;如果选择最上层服务,甚至不需要机器学习的科学家,仅仅是应用开发人员就可高效利用。
三层“结构”的机器学习堆栈
如此看来三个层面的服务,最大特点就是应用开发人员的不可或缺性,这一点很像云基础架构中的IaaS、PaaS以及SaaS。逐一说来,最底层涉及到很多框架、接口与基础服务,例如Tensorflow、MXnet、PyTorch等主流框架;Gluon、Keras等接口支持。据悉全球85%的机器学习框架Tensorflow的工作流都跑在AWS上。
所谓基础服务,更多是那些提供强大运算性能的服务器,例如Amazon EC2的P3DN实例类型。据阿晶了解,这是一个虚拟机类型,采用的GPU是NVIDIA的Tesla V100,一款在机器学习与推理方面表现十分强劲的加速卡。“P3DN后面的DN字缀则代表网络,速度高达100GB/s,如此看P3DN非常适合分布式机器学习。”AWS方技术专家表示。
此外这一层还有可以支持通用计算的M5实例,适用于x86、AMD和ARM处理器的实例以及适用于高性能、非关系型计算的实例I3en。一句话概括:无论机器学习的工作负载如何,AWS都可以提供保证成本优势的高性能计算资源。
着眼中间层,其主要服务被称为Amazon SageMaker,显著特点为自动化,即可以做到将一些机器学习模型打标记、训练、部署,最后成为高可用。简言之,使用本层服务只需要拥有大量的训练数据,输入并自选算法就可以很快出炉具备AI性质的服务,过程中Amazon SageMaker会代替去管理底层需要用到的所有服务器与框架。
另外AWS也对主流的ML的模型算法进行了提速,例如图形分类、时间序列预测以及用于异常事件判断的算法等。如果说到具体的使用效果,据了解此前一家制药公司自身建立一个机器学习的模型至少需花费超过两个月的时间构建,但凭借Amazon SageMaker等工具的帮助,耗时不超过4小时,简直又快又好的节奏,目前使用Amazon Sagemaker的企业已经超过10000家。
聚焦最上层 ,我们发现主要是已有的AI服务,无需训练直接调用。例如视觉类服务:Amazon Rekognition主要是静止图片识别的,Amazon Rekognition Immage是视频识别,Amazon Textract是从视频里面提取文本。
此处需要补充的一点,阿晶进一步了解到,于两三月之前上线的Amazon Textract开发合作伙伴社区始终在蓬勃发展之中,基于深度学习读取数据与分析数据技术,其中加拿大一家出版公司正在积极使用社区资源完成扫描文章的工作,另外还有部分机器自动化处理供应商用来读取表格信息等,采纳率正在不断提高。
语音类服务:Amazon Polly工具可以做到将文字转化成非常自然流畅的语音,区别于生硬的机器转化。此外 ,Amazon Transcribe是一种自动语音识别服务,使用它可以方便地为应用程序添加语音转文本的功能。此前Amazon Transcribe已经支持的语言包括美国英语、英国英语、澳洲英语、印度英语、西班牙语、美国西班牙语、法语、加拿大法语、意大利语、德语、巴西葡萄牙语、印地语、韩语和现代标准阿拉伯语。
目前该服务已支持中文普通话的语音转写。这一新的语言集拓展了Amazon Transcribe所服务的领域,让客服中心、媒体和娱乐、教育等领域的使用场景能够触达全球更广泛的受众。
语言类服务:Amazon Translate是几国语言的互相翻译,功能很实用;Amazon Comprehend是语言理解,类似于一段文字的中心思想提炼。
预测服务:Amazon Forecast是销售预测服务,采用Amazon.com背后做销售预测的模型,封装给所有人使用。
聊天机器人服务:Amazon Lex是聊天机器人服务,即文本到文本的聊天形式。
在进一步的智能媒体分析技术展示中,现场依照输入的关键词“男性”或“快乐”等,AI可以自动搜索出包含这些关键词的图像、声音、视频内容等,具体来说用户可以用电脑或者手机来获取图片、声音、视频等,通过服务上传到存储服务Amazon S3上,触发AWS Lambda服务,将图像、影像、声音文档发送至AWS的人工智能API,只要文件到位之后就可以按照次序进行分析对比,系统会先判断属于这三种文件中的哪一种,即Amazon Transcribe将声音变成文本,Amazon Comprehend进行语义分析等,所有的处理结果都会发送到Amazon Elasticsearch,这是一个搜索功能非常快的服务,该方案可用在智能零售、安防等场景。
谈及发展,AWS更倾向于“这样”
在很多公开场合,我们都习惯发问“目前的AI 究竟落地到什么程度?”对此,AWS副总裁Swami Sirasubramanian(斯瓦米·西瓦苏布拉曼尼)表示,如今的AI还是处于发展早期,但可喜的是AI采纳率上升速度、增长速度非常快。
“它已经不只是一两个细分行业中被应用的技术了,包括金融科技、自动驾驶、医药行业,还有移动端营销甚至时尚行业在内都纷纷尝试采用。例如,金融科技行业使用人工智能和机器学习来进行个性化定制,给客户提供个性化的金融计划,帮助减少纳税或者填表格的难度;自动驾驶行业也不断使用AWS机器学习服务,其中包括数据存储、分布式GPU计算等,甚至还有一些自动驾驶公司将AI 技术应用在无人驾驶的卡车上。”
“AWS看到越来越多的细分行业,上云使用机器学习和人工智能服务”,Swami Sirasubramanian很开心,“此外我们还发现很多非盈利机构使用人工智能和机器学习来打击人口贩卖并消除饥饿。”
AWS副总裁Swami Sirasubramanian(斯瓦米·西瓦苏布拉曼尼)
但我们从不同的细分行业应用中也确实看到了很多共同属性,例如更多情况下还是缺乏将AI技术主流化的技巧。因此 AWS不仅专注AI,更主张为细分行业提供有效的AI培训,例如免费的机器学习帮助完成训练并提供认证等。此外,Swami认为,目前全球范围内,包括中国,都处在一个AI加速落地的阶段,但是依然有很多因素阻碍企业采纳人工智能技术,其中很关键一项就是拥抱AI之前,被卡在数据处理阶段。“AI或者机器学习就像一个蛋糕上的奶油,蛋糕底下一定要有其他的东西作为支撑,其中包括大数据、存储、计算等方面。机器学习对于企业以及开发者们带来的最大挑战,就是为机器学习模型训练所筹备的数据。如今50%到70%的人力和时间都花在数据筹备上。”Swami表示。
关于5G发展,Swami坦承IoT与边缘计算技术,目前在AWS被作为优先发展的内容之一。“未来十年,如果你看到用户部署线下服务器的数量降低,那是因为更多都放在了云上,而这些属于云上的沟通交流完全离不开5G基础架构。确切的说,5G出现不但改变了设备之间的沟通方式,甚至变革了连接性。”未来,AWS会加强IoT方面的资金投入。
近年来反观AWS的发展,我们就会发现AWS的各项服务一直有条不紊地扩展到全球范围内各个不同的区域,截至目前已进入全球22个区域、69个可用区,重要的是最新的Amazon EC2 G4实例也将于今年部署到AWS 中国(北京)和AWS中国(宁夏)两个区域。关于业务拓展,Swami总结道,AWS有90%到95%的服务扩展都是基于客户反馈,另外5%到10%的变化也是基于AWS对客户反馈的诠释。
“我们从来不会发布所谓的扩展路线图或者扩展计划。因为如果抢先发布了诸如此类的路线图,却不是用户想要的,就很被动。一直以来用户很享受与我们之间的互动,而我们也会随时随地倾听他们的反馈并对其拓展,仅仅去年一年,AWS新推出的服务就多达1957个,是5年前的四倍。” Swami强调。
福利
扫描添加小编微信,备注“姓名+公司职位”,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!
推荐阅读:
上万条数据撕开微博热搜的真相!
IT公司老板落水,各部门员工怎么救??
HTML 30 年进化史
读了鸿蒙 OS 的代码后,我发现优秀项目都有这个共性!
字节跳动李航:自学机器学习,研究AI三十载,他说AI发展或进入平缓期
主链增幅最高飚至 152%,主流币却惊现回落;以太坊发币速度持续放缓
真香,朕在看了!