Jeff Dean亲自揭秘谷歌下一代AI架构:通用、稀疏且高效,网友不买帐:毫无新意...

503d0613dfac5fd260ed5c6ff5f51355.png

来源:机器之心

在这波 AI 浪潮中,人工智能技术经过十几年的爆发式发展,已经在各个领域有着极为广泛的应用,如医疗、科学研究、汽车等。

但是随着技术发展的缓慢,以深度学习为代表的人工智能技术瓶颈开始凸显。

今年 8 月份,谷歌人工智能主管 Jeff Dean 在一场 TED 演讲上曾表示,我们当前的 AI 只是触及了皮毛,他还透露谷歌正在开发一种灵活的多用途人工智能,可以执行数百万个任务。Google 的解决方案称为 Pathways,旨在将不同的 AI 集中到一个强大的、无所不知的算法中。

bc033285b6bc3529d2e081c90619954d.png

近日,Jeff Dean 亲自撰文介绍他眼中的下一代 AI 架构 Pathways,这是一种什么样的架构?总结来说:

  • Pathways 能够训练一个模型来做成千上万件事情;

  • 当前模型只注重一种感官,Pathways 可做到多种;

  • 当前模型密集且效率低下,Pathways 会把模型变得稀疏而高效。

以下是 Jeff Dean 撰写的原文,让我们来细致来看下。

下一代 AI 架构

当我回顾过去二十年的计算机科学研究时,没有什么比人工智能领域的显著进展更令我兴奋。

2001 年,几位坐在离我几英尺远的谷歌同事意识到他们可以使用一种叫做「机器学习」的晦涩技术来帮助纠正拼写错误的搜索查询。我记得当时我很惊讶地看到它适用于从「ayambic pitnamiter」到「unnblevaiabel」的所有内容。今天,人工智能已经成就了许多事情,无论是帮助您拍摄漂亮的照片 ,还是提供更有用的搜索结果,还是预警数亿人何时何地会发生自然灾害。二十年来的研究进展帮助人工智能从一个有前途的想法提升为数十亿人日常生活中不可或缺的帮助。尽管取得了这些进展,但我仍然对其尚未开发的潜力感到兴奋——人工智能已准备好帮助人类应对我们所面临的一些最严峻的挑战,包括疾病、不平等问题、气候变化等新问题。

但是,应对这些紧迫挑战的深度和复杂性将需要新的、功能更强大的人工智能系统——这些系统将把 AI 领域已经过证明的方法与新兴研究方向结合,从而解决我们今天无法解决的问题。为此,谷歌研究院的团队正在研究下一代人工智能架构的元素,我们认为这将有助于实现此类系统。

我们将这种新的 AI 架构称为 Pathways。

Pathways 是一种新的人工智能思维方式,它解决了现有系统的许多弱点且综合了它们的优势。为了展示我的观点,让我们来看看 AI 当前的一些缺点以及 Pathways 有哪些改进。

当前的 AI 模型只做一件事。Pathways 使我们能够训练一个模型型,做成千上万件事情。

今天的人工智能系统从头开始训练新问题——数学模型的参数是从随机数开始。就像每次你学习一项新技能(例如跳绳),你就忘记了你所学的一切——如何平衡、如何跳跃、如何协调你的手的运动,然后从无到有重新学习。

这或多或少是我们今天训练大多数机器学习模型的方式。我们不是扩展现有模型来学习新任务,而是从无到有训练新模型来做一件事(或者我们有时将通用模型专门用于特定任务)。结果是我们最终为数千个单独的任务开发了数千个模型。以这种方式学习每项新任务不仅需要更长的时间,而且还需要更多的数据,因为我们试图从无到有了解世界的一切以及该任务的细节(完全不同于人们的处理方式)。

相反,我们希望训练一个模型,不仅可以处理许多单独任务的,而且可以利用和结合现有技能来更快、更有效地学习新任务。这样,模型通过对一项任务进行训练(例如,学习航拍图像如何预测景观的高度)来学习的内容吗,也可以帮助它学习另一项任务——例如,预测洪水将如何流经该地形。

我们希望模型具有不同的功能,可以根据需要被调用,或者拼接在一起以执行新的、更复杂的任务——更接近哺乳动物大脑跨任务概括的方式。

今天的模型大多专注于一种感官,Pathways 将启用多种感官。

人们依靠多种感官来感知世界。这与当代人工智能系统消化信息的方式大不相同。今天的大多数模型一次只处理一种形式的信息。如接收文本、图像或语音——但通常不是同时接收。

Pathways 可以实现同时包含视觉、听觉和语言理解的多模态模型。因此,无论模型是在处理 「豹」 这个词、有人说 「豹」的声音,还是豹奔跑的视频,都会在内部激活相同的响应:豹的概念。这样会得到一个更有洞察力、更不容易出错和偏见的模型。

当然,人工智能模型不必局限于这些熟悉的感觉;Pathways 可以处理更抽象形式的数据,帮助找到人类科学家在气候动力学等复杂系统中难以发现的有用模式。

今天的模型密集且效率低下,Pathways 将使模型变得稀疏而高效。

第三个问题是,今天的大多数模型都是“密集的”,这意味着整个神经网络都会激活以完成一项任务。

这也与人们处理问题的方式非常不同。

我们的大脑有许多不同的部分,专门用于不同的任务,但我们只在特定情况下调用相关部分。你的大脑中有近千亿个神经元,但你依赖其中的一小部分来解释你看到的这句话。

人工智能可以以同样的方式工作。我们可以构建一个 “稀疏” 激活的模型,这意味着只有通过网络的小路径会根据需求被调用。事实上,模型动态地学习网络的哪些部分擅长哪些任务——它学习如何通过模型中最相关的部分来分配任务。

这种架构的一大好处是,它不仅具有更大的学习各种任务的能力,而且速度更快、能源效率更高,因为我们不会为每个任务激活整个网络。

例如,GShard 和 Switch Transformer 是我们创建的两个最大的机器学习模型,但由于两者都使用稀疏激活,因此它们消耗的能量不到类似大小密集模型的 1/ 10——同时与密集模型一样准确。

总结一下:今天的机器学习模型往往在单个任务上过度专项化,而不是擅长多类任务;它们依赖于一种形式的输入,而不是综合多种输入;当前模型往往是暴力美学,而不是灵活专业。

这就是我们建立 Pathways 的原因。Pathways 将使单个 AI 系统能够泛化数千或数百万个任务,理解不同类型的数据,并以非凡的效率来做到这一点——将我们从仅识别模式的单一用途模型时代推进到更多通用智能系统,可以适应新的需求。

最后一点至关重要。我们熟悉当今许多最大的全球挑战,并致力于研究帮助解决这些挑战的技术。但我们也确信未来还有一些我们尚未预料到的重大挑战,许多挑战需要紧急解决方案。因此,我们非常谨慎,始终遵循我们的 AI 原则,正在打造下一代 AI 系统,可以快速适应新需求并解决世界各地出现的新问题,帮助人类创造未来的大部分时间都在我们面前。

网友:没什么新意

对 Jeff Dean 描述的 Pathways 架构大家是否买账呢?当前国内外对此讨论还不多,不过评论不佳啊!

d07b7d6512f435014b0700de0112997e.png

例如,有 Reddit 网友表示 Jeff Dean 的博客肤浅无用,目标太大,也不知道如何实现。

也有网友表示是吸引关注的品牌性传播。

b987f114c070ca56198ce5a8d629d9b0.png

但也有网友表示,谷歌可能已经在构建通用 AI 了,并开始谨慎的对外公布。当然,也不排除炒作一些事情。

Pathways 也引发了国内 AI 从业者的一些讨论,在知乎上,一流科技创始人袁进辉也发表了自己的观点,认为 Pathways 中的观点业界讨论很多了,不太新鲜。

23713738b119e99bd399f12a7d1b0108.png

谷歌推广此新一代架构,后续必然会有更多研究公布。对此你怎么看?欢迎讨论。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

a47c3a87673496c04e591bdd28659bea.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483433.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

排序算法笔记(Java)

package datastructure;import java.util.Arrays; import java.util.Scanner;public class Sort {static int len; //声明全局变量,用于记录arr的长度public static void main(String[] args) {Scanner sc new Scanner(System.in);String str sc.nextLine();Strin…

计算机网络——时延、时延带宽积、RTT和利用率

1.什么是时延 \qquad数据(报文/分组/比特流)从网络的一端传送到网络另外一端所需的时间。也叫延迟或者迟延,单位是s 2.时延的种类 2.1 发送时延(传输时延) \qquad从发送分组的第一个比特算起,到该分组的最…

强人工智能与泛心论

来源:哲社院后台原载于《科学经济社会》2021年第39卷第3期第52~59页作者简介:陈敬坤,1981年1月生。哲学博士,山西大学哲学社会学学院副教授,曾赴比利时布鲁塞尔自由大学、美国匹兹堡大学等作学术访问。研究领域主要为心…

第一章 Linux是什么

Linux是核心与系统调用接口两层中间的操作系统不同硬件的功能函数并不相同,IBM的Power CPU与Inter的x86架构不同,所以同一套操作系统是不能在不同的硬件平台上面运行的。也就是说,每种操作系统都是在他专门的硬件机器上面运行的。不过&#x…

计算机网络——分层结构,协议,接口和服务

1.为什么要分层? \qquad当有两台主机,A向B通过网络发送文件,在发送文件前需要完成这么几件事情:1)A必须将数据通信的通路进行激活;2)要告诉网络如何识别目的主机B;3)A要查…

官宣!全球首富马斯克:创办这所“新大学”!

埃隆马斯克(Elon Musk)是特斯拉和SpaceX的创始人兼首席执行官。来源:青塔编辑:nhyilin美国《福布斯》杂志10月26日称,得益于特斯拉股价大涨,特斯拉CEO埃隆马斯克的财富跃升至近3000亿美元,不仅是…

“传统”遥感遇上AI,会产生怎样的效果?

来源:微信公众号人民网责编:翟巧红编辑:张素玲;作者:龚健雅 中国科学院院士、武汉大学教授;新一轮科技革命和产业变革的大幕早已掀开。作为全球科技竞争的制高点,人工智能已经成为世界主要国家推…

记录一次双系统安装

条件 1、U盘 2、UltraISO软件 官网 3、ISO镜像 ubuntu官网 压缩卷,获得空闲空间安装ubuntu 1、点击winx,进入磁盘管理,选择一个空间够大的硬盘进行分区 2、选择你要压缩的卷,比如D盘,右击,压缩卷&#xff0…

操作系统 —— 内存管理

目录一、思维导图二、内存的基础知识2.1 什么是内存?2.2 存储单元2.3 逻辑地址和物理地址2.4 编译、链接、装入2.4.1 编译2.4.2 链接链接的三种方式 :2.4.3 装入装入的三种方式:三、内存保护四、内存空间的扩充4.1 覆盖与交换4.1.1 覆盖技术4.1.2 交换技术4.2 虚拟内…

【前沿技术】10年内,19个关键技术将改变世界

来源:智能研究院据国外媒体报道,从无人驾驶汽车到机器人工人,在我们熟悉所有这一切之前,未来正迎面走来。根据世界经济论坛全球议程理事会关于《未来软件与社会》的一份报告,到2025年前,很多新兴技术将会达…

计算机网络——TCP/IP参考模型和五层参考模型

1.OSI参考模型和TCP/IP参考模型的对比 \qquad相同点:1)都分层;2)都是基于独立的协议栈的概念 ;3)可以实现异构网络的互联 \qquad不同点:1)OSI定义了三点:服务,协议和接口…

Github+docsify打造在线文档网站

写在前面 搭建这个在线文档的目的是方便自己对学习笔记的查看,比较喜欢 docsify 的主题风格,所以没有用 Github Pages 直接给的主题,自己根据官方文档进行了配置,目前已经成功上线。 1 效果图 可直接访问:https://x…

计算机网络——物理层基本概念

1.物理层的任务 \qquad将各种计算机的传输媒体进行物理连接,为设备间的数据传输做好准备。由此,我们需要确定传输媒体的接口特性。 2.传输媒体的接口特性 2.1 机械特性 \qquad定义物理连接的特性,比如连接规格,接口形状&#xf…

《Cell》新发现!“第二大脑”的反击

图像:巨噬细胞(绿色)包围肠道神经元(红色)。资料来源:洛克菲勒大学黏膜免疫学实验室来源:生物通一个简单的胃病就能造成很大的伤害。有1亿个神经元散布在胃肠道中——就在火线上——它们可能被肠道感染消灭,可能导致长期的胃肠道疾病。但肠道感染也有好处…

操作系统 —— 文件管理

目录1. 文件的简介1.1. 文件的属性1.2. 文件的分类1.2.1. 无结构文件(流式文件)1.2.2. 有结构文件(记录式文件)1.3 操作系统应向上提供哪些功能2. 文件的逻辑结构2.1 逻辑结构 vs 物理结构2.2 有结构文件的逻辑结构2.2.1 顺序文件…

vue-todolist

http://todolist.cn/ App.vue <template><div><div>大家好&#xff0c;我叫技术高超</div><div>大家好&#xff0c;我叫{{name}}</div><input type"text" v-model"name"><hr><input type"text&qu…

重磅!监管再升级!微信、淘宝、抖音或将纳入“超级平台”监管

来源&#xff1a;网易新闻&#xff1a;中国证券报编辑&#xff1a;郑雅烁对于互联网巨头监管&#xff0c;又有新举措。10月29日&#xff0c;国家市场监督管理总局公布了《互联网平台分类分级指南&#xff08;征求意见稿&#xff09;》《互联网平台落实主体责任指南&#xff08;…

linux的基础知识——raise函数,abort函数和定时函数

1.raise和abort函数 \qquadraise函数&#xff1a;int raise(int sig) \qquad功能&#xff1a;给当前进程发送指定信号&#xff08;自己给自己发信号&#xff09;&#xff0c;raise(signo)相当于kill(getpid(),signo) \qquad返回值&#xff1a;成功返回0&#xff1b;失败返回非0…

操作系统 —— 磁盘

目录1. 磁盘的结构1.1. 磁盘、磁道、扇区1.2. 如何在磁盘中读/写数据1.3. 盘面、柱面1.4. 磁盘的物理地址1.5. 磁盘的分类2. 磁盘调度算法一次磁盘读/写操作需要的时间2.1. 先来先服务算法&#xff08;FCFS&#xff09;2.2. 最短寻找时间优先&#xff08;SSTF&#xff09;2.3. …

027 Android 可扩展的listview:ExpandableListView的使用案例

1.ExpandableListView简介 ExpandableListView是一种用于垂直滚动展示两级列表的视图&#xff0c;和 ListView 的不同之处就是它可以展示两级列表&#xff0c;分组可以单独展开显示子选项。这些选项的数据是通过 ExpandableListAdapter 关联的。 2.xml页面布局 (1)主界面布局(C…