广度深度都要,亚马逊是如何推动 Alexa 内生成长的?

640?来源:雷锋网

摘要:发展到今天,Alexa 已经成为亚马逊旗下最重要的几个业务支柱之一,尤其是在人工智能语音助手层面,它和 Google Assistant、Apple Siri、Microsoft Cortana 并驾齐驱,甚至在应用场景上有领先之势。


说实话,2014 年秋天亚马逊推出 Echo 音箱时,大多数人根本不明白 Bezos 葫芦里到底卖的什么药,随后的几年里 Echo 和一大群 Alexa 设备却攻城略地,成了人见人爱的好伙伴。


虽然 Alexa 已经几乎“附身”了所有设备,但今年亚马逊在语音助手领域真正的进步却从广度转到了深度上。


当然,也不是说 Alexa 的增长遇到了瓶颈。今年其销售市场数量成功翻番,学习法语和西班牙语也提上了日程。同时,能与 Alexa 互动的智能家居设备已经超过 2.8 万款,是今年年初的 6 倍,与 Alexa 深度绑定的产品也突破 100 种。


总的来说,真正定义 2018 年的其实是 Alexa 的秘密进化,以及这种进化方式对其潜力释放的推动。Alexa 正变得越来越聪明,但这种润物细无声的微妙进化许多人恐怕根本注意不到。


我们试图一探究竟。


“铁脑袋”


由于许多语音助手的改良目标是减少矛盾,因此它们都用上了看不见的设计。在过去的一年里,Alexa 已经学会了将上下文语义从一个问题转移到另一个问题。同时,用户再也不用每问一次问题就喊“暗号”唤醒 Alexa 一次了,而且只需一个命令,你就能要求 Alexa 做多个任务。此外,召唤 Alexa 的技能时,你也无需一字不差的说出它的名字了。


是不是听起来只是些雕虫小技?你太小看 Alexa 了,这些看似玩票的小升级是在引导 Alexa 成为一个更善于“唠嗑”的语音助手,这才是解决问题而非创造新矛盾的真正方案。可以这么说,现在你跟 Alexa 聊天可比一年前顺畅多了。


随着机器学习技术的不断提升与改进,这些升级并不令人吃惊。为了减少 Alexa 的错误率,亚马逊还用了所谓的主动式学习,系统能自动识别自己需要人类专家帮助的领域并进行针对性提升。


“这样的解决方案被输送到了我们每一条‘血管’,包括语音识别和自然语言理解。”亚马逊 Alexa 首席科学家兼副主席 Rohit Prasad 说道。“它让我们所有的机器学习模型都上了一个台阶。”


最近,亚马逊还为 Alexa 引入了迁移学习技术。这就意味着每个人都能借助亚马逊的“蓝图”技巧打造自己的食谱。开发者更是能利用 Alexa 了解的所有餐馆或杂货铺知识减少那些乏味的工作。“实质上,有了深度学习我们就能模拟各种领域并将学到的知识转移到新的领域或技巧上。”Prasad 解释道。


机器学习带来的益处让 Alexa 完成了全方位升级,但它对整个系统最为深远的影响还是一年内降低 25% 的错误率。对 Echo 用户来说,这曾经是他们最头疼的问题,未来终于无需再面对了。


未来,Alexa 的进步也不会停滞。本月,Alexa 就推出了自主学习功能,让系统能根据上下文线索自动完成修正。Prasad 就表示:“对 AI 系统来说这可是件大事,毕竟它是从隐含反馈中学习的。”


不过,想突破下一个结界就没那么容易了,因为亚马逊想要 Alexa 在任何时候预测你的需求。同时,Alexa 不但要理解你在说什么,还要读懂你是怎么说的。


“当两个人谈话时,他们能很轻松的理解对方散发出的情感因子,不过机器人可不行。”卡耐基梅隆大学语音识别专家 Alex Rudnicky 解释道。“因此,研发人员试图让 Alexa 变得更复杂,提升其推断对话走向的能力。”


今年秋季,亚马逊就用一份专利抢了个头条,这项技术让 Alexa 能识别用户情绪并作出相应的反馈。不过,帮亚马逊抢了头条的并非这项技术有多先进,而是它随时监听的方式让人感觉不自在,而那种推断你感觉如何的方法会戏剧性地加剧用户的不适。


Prasad 表示,Alexa 的终极目标是拥有远程会话能力,它甚至可能会根据你的提问方式对给定的问题做出不同的反应。不过,想要拥有一个真正理解你语调微妙之处的语音助理,恐怕还需要一段时间。


“如果你了解人的五大情绪。”Rudnicky 说道。“就会发现人类最擅长感知其他人的愤怒。”


技能包


随着 Alexa 设备的爆发性增长,它掌握的技能也在迅速增殖。亚马逊的官方数据显示,Alexa 已经拥有越 7 万个技能,无论测验、游戏还是冥想,它都能驾轻就熟。在两年前,这个数字只有现在的七分之一。


Alexa 虽然已经能预测人们想使用哪项技能,但预测和发现并不能相提并论。同时,用户并没有彻底开发 Alexa 的潜力,大多数人只是将它当作厨房计时器而已。这样一来,开发者也没有动力继续在 Alexa 平台投入了。


此外,Alexa 的兴旺发达也不能仅靠深度学习。虽然借助它 Alexa 能迅速展现出最相关的技能,但语音助手的潜力可不止那些直接的功能需求。2016 年的互动游戏 The Magic Door 就是最好的例子,如果大家用 Echo 只是听听 NPR 或查查天气,那么算法将如何提醒你它自己的存在呢?


“如果我们向用户推介新技能和新功能,绝对能给他们带来引人入胜的体验。”主管 Alexa 体验的 Toni Reid 说道。“不过你得有个度,因为 Alexa 也会超载。我们必须在对的时间做对的事,内容的体量也需要严格控制。”


除了不断为 Alexa 大厦添砖加瓦,亚马逊还得时刻防着谷歌,后者虽然起步稍晚但正在努力缩小与亚马逊之间的差距。市场研究公司 Canalys Research 预计,今年第三季度 Echo 智能音箱出货量达 630 万台,而谷歌则已经将 Google Home 的单季出货量拉到了 590 万台。


不过,这场竞争并没有销售数字看起来那么紧张,因为它不包含第三方设备,在这一领域亚马逊是绝对统治者。而且别忘了,过去四年里亚马逊可以积累了海量的忠实客户。不过,谷歌也有让亚马逊不敢忽略的优势。


“谷歌的 AI 经验相当丰富,而亚马逊则一切都要重头来过。”Canalys 分析师 Vincent Thielke 说道。“由于谷歌的 AI 已经非常先进,因此它们追赶起来毫不费力。”除此之外,Android、Android Auto 和 WearOS 也能成为 Google Assistant 的自留地。反观亚马逊,由于 Fire Phone 已经彻底失败,因此在移动端亚马逊已经没有什么重量级棋子。在与车辆中控信息娱乐系统的整合方面,亚马逊也不是谷歌和苹果的对手,虽然它们已经推出了 Echo Auto 这样的“改装件”。


好在,Alexa 并没有放慢脚步的意思,新增的功能正让它变得包罗万象。至于未来 Alexa 将走向何方,恐怕现在你也能猜出一二了。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/493157.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

剖析云平台中的“共享型数据库”

剖析云计 算中的“共享型数据库” 摘要: 随着云计算的出现,出现了很多新的名词,像云数据库、云存储、弹性扩容,资源隔离等词汇。下面就大家炒的比较热的“共享型数据库”做一下解释,给大家剖析什么叫“共享型数据库”。…

FCOS: A Simple and Strong Anchor-free Object Detector

论文链接 一.背景 1.anchor-base缺点          (1).anchor的设置对结果影响很大,不同项目这些超参都需要根据经验来确定,难度较大. (2).anchor太过密集,其中很多是负样本&#xff…

大数据有十大应用领域,看看你用到了哪个?

来源:网络大数据摘要:如果提到“大数据”时,你会想到什么?也许大部分人会联想到庞大的服务器集群;或者联想到销售商提供的一些个性化的推荐和建议。如今大数据的深度和广度远不止这些,大数据已经在人类社会实践中发挥着巨大的优势…

2018年《环球科学》十大科学新闻出炉:霍金逝世、贺建奎事件位列前二

来源:量子位如果要用两个词来定义2018年的话,我们可能会选择“进步”与“反思”。中国科学在持续进步,克隆猴“中中”与“华华”、单条染色体的酵母,都是世界级的研究成果。“火星快车”在火星上发现大面积的液态湖泊,…

CornerNet: Detecting Objects as Paired Keypoints

CornerNet论文链接 Hourglass Network论文链接 一.背景 1.anchor-base缺点          (1).anchor的设置对结果影响很大,不同项目这些超参都需要根据经验来确定,难度较大. (2).anchor太过密集&…

详细解读什么是自适应巡航?

来源:智车科技摘要:自适应巡航设计初衷是减轻驾驶员长途驾驶的疲劳,极为复杂的城市路况并不是它发挥作用的地方。虽然现在的自适应巡航系统具备了根据前车情况、根据路况减速,甚至是刹停的功能,不过其开发之初便是为了…

CenterNet:Objects as Points

CenterNet论文链接 一.背景 1.anchor-base缺点          (1).anchor的设置对结果影响很大,不同项目这些超参都需要根据经验来确定,难度较大. (2).anchor太过密集,其中很多是负样本…

美国正在衰落的24个行业:“猝不及防”还是“温水煮青蛙”?

来源:资本实验室摘要:技术发展一日千里,外部环境日新月异。在这个变化无处不在的世界,许多行业都在不可避免地经历着或是猝不及防,或是“温水煮青蛙”般的冲击。近期,美国财经网站24/7 Wallst根据过去十年的…

距离与相似度计算

一.余弦相似度 加速计算参考这篇文章 from math import *def square_rooted(x):return round(sqrt(sum([a*a for a in x])), 3)def cosine_similarity(x,y):numerator sum(a*b for a, b in zip(x,y))denominator square_rooted(x)*square_rooted(y)return round(numerator/f…

5G 产业链重要细分投资领域

来源:乐晴智库精选▌2019年全球电子产业将保持增长ICInsights预计2018年全球电子产品销售额16220亿美元,同比增长5.1%,2019年将达到16800亿美元,同比增长3.5%,2017~2021年CAGR4.6%。预计2019年通信市场销售额5350亿美元…

CPNDet:Corner Proposal Network for Anchor-free, Two-stage Object Detection

CPNDet论文链接 一.背景 anchor-based方法将大量框密集分布在feature map上,在推理时,由于预设的anchor与目标差异大,召回率会偏低。而anchor-free不受anchor大小限制,在任意形状上会更加灵活,但是像CornerNet这种,先…

Unix/Linux环境C编程入门教程(3) Oracle Linux 环境搭建

Unix/Linux版本众多,我们推荐Unix/Linux初学者选用几款典型的Unix/Linux操作系统进行学习。2010年9月,Oracle Enterprise Linux发布新版内核——Unbreakable Enterprise Kernel,专门针对Oracle软件与硬件进行优化,最重要的是Oracl…

最权威北美放射学会年会回顾:AI的进化与下一个前沿

翻译 : 高璇摘要:人工智能在成像领域的前景必须为终端用户带来时间节省、资源优化、精度增益和感知增益(接近精准健康方法)。前两个是指生产力方面,而后两个是指质量方面。人工智能在成像领域的脚步不会停留在这里——它已经帮助重…

Registry注册机制

前言:不管是Detectron还是mmdetection,都有用到这个register机制,特意去弄明白,记录一下。 首先看Registry代码: # Copyright (c) Facebook, Inc. and its affiliates. All Rights Reservedfrom typing import Dict, Optional, Iterable, T…

Android Volley 库通过网络获取 JSON 数据

本文内容 什么是 Volley 库 Volley 能做什么 Volley 架构 环境 演示 Volley 库通过网络获取 JSON 数据 参考资料 Android 关于网络操作一般都会介绍 HttpClient 以及 HttpConnection 这两个包。前者是 Apache 开源库,后者是 Android 自带 API。企业级应用&#xff0…

python刷题+leetcode(第二部分)

100. 简化路径 思路:栈 class Solution:def simplifyPath(self, path: str) -> str:stack []for path_ in path.split(/):if path_ not in [, ., ..]:stack.append(path_)elif path_ .. and stack:stack.pop()return / /.join(stack) c实现: class Solution { public:s…

这一年,信息技术领域上演的“断舍离”

来源:中国科学报摘要:刚刚踏入2018年,信息技术产业领域就被“熔断”“幽灵”这两个几乎波及全行业的芯片漏洞所笼罩。孰料,该领域接下来上演的剧情——从美国断然发布对中兴通讯的出售禁令,到Uber无人驾驶汽车撞人致死…

利用JasperReport+iReport进行Web报表开发

用JasperReportiReport进行Web报表开发 序言在非常多实际的项目里,报表都是当中十分重要的组成部分,比如把查询结果以报表的形式呈现出来。这里所提到的报表可不是简单的二维表,而是拥有复杂表头的、多维的、能够在执行期从数据库中自己主动读…

AN IMAGE IS WORTH 16X16 WORDS :TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE(VIT)

最近看transformer用于CV比较热门,特意去进行了解,这里用分类的一篇文章进行讲解。 NLP中的transformer和代码讲解参考我另一篇文章。 论文链接:AN IMAGE IS WORTH 16X16 WORDS :TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE 一.思想 其…

人工智能领域的未来和挑战

来源:创新研究摘要:人工智能是一门综合了计算机科学、生理学、哲学的交叉学科。凡是使用机器代替人类实现认知、识别、分析、决策等功能,均可认为使用了人工智能技术。作为一种基础技术,人工智能在很多行业都有广泛应用。五道集团…