谷歌丢弃 TensorFlow:豪赌 JAX

c8026f0ef44bde4b7e3a8f5678e6422f.png

来源:云头条

・谷歌是机器学习领域的开拓者,发布了其中一种最早的通用框架TensorFlow。

・Meta发布AI框架PyTorch之后,TensorFlow逐渐失去了开发人员的青睐。

・如今谷歌内部正押宝在一个取代TensorFlow的新AI项目JAX上。

852992d624560e8219928e6636433d07.png

2015年,谷歌开源了谷歌大脑(Google Brain)团队一个名为TensorFlow的小型研究项目,那年它实际上创立了现代机器学习生态系统。

TensorFlow迅速流行起来,谷歌也成为了主流AI产品的管家。

谷歌的TensorFlow曾经是无处不在的机器学习工具,此后败给了Meta的机器学习工具PyTorch。

PyTorch最初是在Facebook开发而成的,于2017年以beta的形式开放了源代码,现在日益被视为机器学习领域的领导者。

接受采访的开发人员、硬件专家、云提供商以及熟悉谷歌机器学习项目的人士给出了一致的意见。TensorFlow已经失去了开发人员的芳心。其中一些人更是放言:“PyTorch吃掉了TensorFlow 的午餐”,可谓一语中的。

专家们表示,由于自身犯下一系列战术失误、错误的开发决策以及开源社区败给Meta,谷歌在互联网上引导机器学习未来的机会可能正在逐渐消失。PyTorch已俨然成为业余开发人员和科学研究人员的首选机器学习开发工具。

如今在PyTorch的阴影下,谷歌一直在悄然构建一种名为JAX的机器学习框架,许多人将它视为是TensorFlow的接班者。JAX曾是代表“Just After eXecution”(就在执行后)的缩写词,但谷歌官方称不再代表任何意思。

接近该项目的人士告诉《商业内幕》杂志,谷歌大脑团队和谷歌的AI子公DeepMind已全面丢弃了TensorFlow,转而力推JAX,为谷歌旗下的其他公司或部门亦步亦趋铺平了道路。

谷歌代表向《商业内幕》证实,如今JAX在谷歌大脑和DeepMind几乎得到了普遍采用。

熟悉谷歌机器学习项目的人士表示,最初JAX面临来自谷歌内部的巨大阻力。

知情人士称,谷歌员工习惯于使用TensorFlow。尽管TensorFlow很笨拙,但它在谷歌员工心目当中仍不失为是统一因素,尽管令人不安。他们表示,JAX采用的方法简单得多,但改变了谷歌内部构建软件的方式。

了解该项目的人士表示,这款工具现在有望成为未来几年谷歌所有使用机器学习的产品的基础,与TensorFlow在2010年代后期的地位如出一辙。

而JAX似乎已突破了谷歌这个孤立的圈子:Salesforce告诉《商业内幕》,它已经在其研究团队中采用了JAX。

专家们经常将Julia编程语言与JAX拿来比较,Julia的创建者Viral Shah说:“JAX是了不起的技术。我认为JAX是一种单独的编程语言,恰好可以通过Python创建实例。如果你恪守JAX想要你遵守的规则,那么它就能发挥奇效,它能出色地完成它旨在完成的任务。”

谷歌现在希望再次成为领头羊,同时也从TensorFlow开发时所犯的错误中汲取教训。不过专家们表示,这是个巨大的挑战,因为现在谷歌必须取代一款已赢得了开发人员芳心的开源工具。

TensorFlow没落与PyTorch崛起

据《商业内幕》获得的数据显示,PyTorch在开发者论坛上的人气正在迅速赶超TensorFlow。Stack Overflow的人气数据显示,按论坛上所提问题的数量来衡量,TensorFlow的人气近年来停滞不前,而PyTorch的人气持续攀升。

TensorFlow起步强劲有力,推出后迅速普及开来。优步和爱彼迎等公司以及美国宇航局(NASA)等组织很快就采用了TensorFlow,开始将它用于一些最复杂的项目,这些项目需要拿海量数据集来训练算法。到2020年11月,TensorFlow已被下载了1.6亿次。

但是开发人员和熟悉该项目的人士表示,谷歌的功能蔓延(feature-creeping)和不断更新越来越使TensorFlow变得笨拙,且对用户不友好,甚至对谷歌内部的用户都不友好。随着机器学习领域迅猛发展,谷歌不得不经常使用新工具更新其框架。熟悉该项目的人士称,随着越来越多的人参与进来,这个项目在内部蔓延开来,导致人们对最初使TensorFlow成为首选工具的部分缺乏关注。

专家们告诉《商业内幕》,这种疯狂的猫捉老鼠游戏是许多率先进入市场的公司经常遇到的问题。比如说,谷歌不是第一家建立搜索引擎的公司,却能够从AltaVista或雅虎等先行者所犯的错误中汲取教训。

与此同时,PyTorch于2018年从Facebook的AI研究实验室推出了完整的生产级版本。虽然TensorFlow和PyTorch都基于机器学习专家青睐的语言Python而建,但Meta不遗余力地迎合开源社区,更是不惜投入巨资。接近TensorFlow项目的人士称,PyTorch还得益于收缩阵线、聚焦目光,而TensorFlow团队在这方面很欠缺。

机器学习初创公司Hugging Face的研究工程师Patrick von Platen说:“我们主要使用PyTorch,它得到的社区支持力度最大。我们认为PyTorch在开源方面可能做得最好。他们确保问题在线上得到回复,示例都实用有效,PyTorch还始终奉行开源优先的做法。”

一些最大的组织(包括之前依赖TensorFlow的那些组织)启动了在PyTorch上运行的项目。没过多久,特斯拉和优步等公司就在PyTorch上运行难度最大的机器学习研究项目。

添加的每项功能(有时是为了复制PyTorch备受欢迎的功能特性)使得TensorFlow对于最初的研究人员和用户受众来说越来越臃肿不堪。2017年添加“即刻执行”(eager execution)就是这样一个例子,这项原生的Python使开发人员大大简化分析和调试代码的工作。

随着PyTorch和TensorFlow一争高下,谷歌内部的一个小型研究团队致力于开发一种新框架,该框架将使用户更容易访问定制芯片(名为张量处理单元或TPU),而这种芯片是谷歌AI方法的基础,只能通过TensorFlow才可以访问。

团队研究人员包括Roy Frostig、Matthew James Johnson和Chris Leary。这三名研究人员在2018年发表了一篇题为《通过高级跟踪编译机器学习程序》的论文,论文描述了最终成为JAX的项目。

Adam Paszke之前在供职Facebook期间是PyTorch的原始开发者之一,他在2019年作为学生开始与Johnson合作,并于2020年初加入了JAX团队,成为了一名全职成员。

新项目JAX提供了一种更简单直接的设计来处理机器学习中最复杂的问题之一:将一个大问题的工作量分散到多块芯片上。JAX不是为不同的芯片运行单独的代码段,而是自动分配工作量。这种需求来自在谷歌工作的一项特别待遇:可以立即访问数量众多的TPU,完成你需要完成的任何工作。

JAX解决了谷歌研究人员在处理越来越庞大的问题、需要越来越多的计算能力时面临的一个基本问题。

谷歌内部的开发人员和研究人员借助JAX这股东风,开始采用特别研发项目。

熟悉JAX的人士表示,JAX提供了一种方法,可以避免TensorFlow对开发人员的诸多不友好之处,并迅速将复杂的技术问题分散到多个TPU上。

与此同时,PyTorch和TensorFlow都以同样的方式起家。它们起初都是研究项目,随后备受好奇,接着成为机器学习研究领域的标准,最后研究人员将它们带出学术界,进入到更广阔的天地。

然而,JAX面临几大挑战。

首先,它在很多方面仍然依赖其他框架。开发人员和专家表示,JAX没有提供轻松加载数据和预处理数据的方法,需要TensorFlow或PyTorch来处理这方面的大部分前期工作。

JAX的底层框架XLA也针对谷歌的TPU进行了高度优化。这种框架可与更传统的GPU和CPU兼容,不过接近JAX的人士表示,该项目仍有办法让GPU和CPU优化达到与TPU同等的水平。

谷歌发言人表示,重视TPU源自2018年至2021年在组织上和战略上的混乱和迷茫,结果导致投入不足,对GPU支持并未给予应有的重视度,以及缺乏与大型GPU供应商英伟达的合作,不过这几方面都在迅速改善。公司发言人表示,谷歌自己的内部研究也主要致力于TPU,这导致GPU使用方面缺乏良好的反馈回路。

Cerebras Systems是一家估值达40亿美元的初创公司,专门生产面向机器学习的大尺寸芯片。首席执行官Andrew Feldman表示,随着众多公司希望将工作量分散到许多不同类型的面向机器学习的硬件上,这种改进将至关重要。

他说:“在硬件上任何厚此薄彼的做法会立即被视为糟糕的行为,会在开源社区受到拒绝和冷落。没有人希望自己被某一家硬件供应商绑住手脚,这就是为什么机器学习框架不断涌现出来。机器学习从业人员希望确保自己的模型是可移植的,确保可以将模型带到所选择的任何硬件平台上,而不是被某一种硬件平台牢牢锁定。”

与此同时,PyTorch本身现在即将迎来第六个年头,远过了TensorFlow首次开始出现放缓迹象的时期。目前尚不清楚Meta的项目会不会遭遇与谷歌支持的前身项目(即TensorFlow)相似的命运,但这可能意味着出现新技术的时机已经成熟。几位专家和熟悉该项目的人士提到了谷歌的规模,提醒批评人士永远不要轻视这家搜索巨头。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

8a1acde78d462e03e3eb6ca38f15f952.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481962.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Lucene基本使用和代码实现

目录 Lucene:全文检索技术 一、Lucene的介绍 1.1背景 1.2优点 1.3Lucene的缺点 1.4全文检索 二、Lucene的基本使用流程 2.1Lucene检索过程 2.2获取文档 2.3分析文档(分词) 2.4创建索引 2.5查询索引 三、Lucene具体实现 3.1下载 3.2实际开发…

深度学习的坎坷六十年

来源:机器之心编辑:极市平台从1958年弗兰克.罗森布拉特发明的感知机、RNN、LeNet-5到Transformers等等,前人们一步一步的带动着深度学习往前跑。本文主要偏向于计算机视觉方向,带大家回想智慧凝结的每一个里程碑。1958 年&#xf…

全干货!机器学习通识篇知识分享

来源:海豚数据科学实验室机器学习(通识篇).机器学习定义机器学习(Machine Learning)本质上就是让计算机自己在数据中学习规律,并根据所得到的规律对未来数据进行预测。机器学习包括如聚类、分类、决策树、贝…

在弱肉强食的世界里,人类的美德意识为何能够超越其他物种?

来源:混沌巡洋舰本文摘编整理自《人性悖论:人类进化中的美德与暴力》 中信出版集团 2022年6月狭隘利他主义假设,战争可能导致自我牺牲,似乎只适用于其文化效应方面,而不能解释为进化上的选择力量。然而,该理…

一场关于物理学本质的争论:实验是检验科学的唯一标准吗?

来源:本文经公众号“环球科学ScientificAmerican”(ID: huanqiukexue)撰文:马西莫皮柳奇(Massimo Pigliucci)翻译:叶宣伽审校:丁家琦为了统一广义相对论和量子力学而建立的弦理论&am…

搭建分布式环境:Dubbo+Zookeeper

QUESTION:搭建分布式环境:DubboZookeeper? ANSWER: 一:官网下载Zookeeper 点击官网:Zookeeper,进行下载。 下载完成,解压缩到文件。 二:配置启动Zookeeper 进入conf目录,复制zoo_sample.cfg一…

AI 界著名「嘴炮」发声:鬼扯,LaMDA 不可能觉醒!

来源:AI科技大本营作者:郑丽媛来源:CSDN因谷歌工程师 Blake Lemoine 坚称谷歌语言模型 LaMDA 已觉醒,这几天 LaMDA 已频繁登上国内外科技网站首页,其相关热门话题无一不是围绕“LaMDA 是否真的觉醒?”、“L…

AI 正在引领一场新型科学革命

来源:AI科技评论作者:Bryan McMahon编译:bluemin编辑:陈彩娴自20世纪50年代DNA被发现以来,生物学家一直试图将基因序列的长度与一系列细胞成分和蛋白质合成过程联系起来,例如,包括为现在著名的m…

西安交大团队开发了一种混合深度学习模型,用于在基因组中识别启动子

来源:ScienceAI编辑:萝卜皮人类的大部分细胞中,每时每刻都在进行着各种复杂的转录过程;这一过程与后续的蛋白质合成息息相关,从而会影响人体中各类酶、抗体、激素、免疫因子等生物分子的产生,最终影响人的身…

在科学史上,“革命”意味着什么?

来源:《科学哲学的历史导论》、思庐哲学(siluphilosophy)作者:约翰洛西对正统学说的诸多批评有一种累积的效果。许多科学哲学家渐渐认为,用形式逻辑范畴来重建科学时会失去一些至关重要的东西。在他们看来,…

SpringBoot整合Dubbo+Zookeeper进行分布式搭建系统

QUESTIONl:SpringBoot整合DubboZookeeper进行分布式搭建系统? ANSWER: 一:创建项目模块 1.1.创建一个Empty Project 名称:Dubbo 1.2.创建一个Provider模块 这里采用SpringBoot快速搭建。 1.3.创建Consumer模块 创建完成后代码架构: 二&am…

2023年全球前端大技术大会(GMTC北京站2023)-核心PPT资料下载

一、峰会简介 大会以“业务至上,效率为王”为主题,策划了 1 个主会场,10 个技术专场。会议议题包含前端 DevOps 实践、低代码、大前端监控、跨端技术选型、团队可持续发展、IoT 动态应用开发、移动端性能与效率优化、TypeScript、大前端技术…

人工智能并不像你想象的那么迫在眉睫

来源:AI前线作者:Gary Marcus策划:孙瑞瑞如果你仔细观察就会发现,最新的系统,包括 DeepMind 大肆宣传的 Gato,仍然被同样的老问题所困扰。在普通人看来,人工智能(AI)领域…

从感知机到Transformer,一文概述深度学习简史

来源:机器之心作者:Jean de Dieu Nyandwi这篇文章从感知机开始,按照时间顺序回顾了深度学习的历史。1958 年:感知机的兴起1958 年,弗兰克 罗森布拉特发明了感知机,这是一种非常简单的机器模型,…

深度学习的综述的综述

来源:知乎文章来源:https://zhuanlan.zhihu.com/p/85625555“ 综述永远是入门新领域的最快捷径之一!”2018年下半年an发的一篇综述类文献,好心的机器之心已经翻译好了,我就直接复制下来修改一下表述的错误和补充&#…

Docker添加或者更改容器的端口映射

QUESTION:Docker添加或者更改容器的端口映射? ANSWER: 初学Docker容器,按照教程的基本命令,拉取创建了几个容器,都是在一开始新建的时候 docker run -p 指定对应的端口,但对于docker start 没有这个功能&…

新书推荐:人工智能通识讲义

中国科学院大学经济与管理学院 副院长 中国科学院虚拟经济与数据科学研究中心 副主任 田英杰 目前,新一代人工智能(AI)技术处于爆发期之后的深化期,各行业都需要大量的具备AI技术素养的专业人才,人们的日常生活已经和A…

清华大学联手中科院顶会发文:全面分析四大自动驾驶策略

来源:新智元当前自动驾驶的策略研究还停留在具体场景执行具体策略,最近清华大学的研究人员在交通领域的顶会发表了一篇全面的综述,从更高级的角度分析自动驾驶策略。当自动驾驶遇见会车,应该抢先通过,还是等待让行&…

是什么让人类的大脑比其它动物更聪明?

Lena Vargas来源:六六脑在认知领域,人类有着无与伦比的卓越性。毕竟,还没有哪一个物种能向陌生的星球发射探测器,研发出可以挽救生命的疫苗,以及写出能够流芳百世的诗歌。人脑是如何处理信息的?人们对这一问…

MongoDB:SpringBoot有关@Document(collection = )与@Document(collation= )注解的区别

目录 QUESTION:SpringBoot有关Document(collection "")与Document(collation "")注解的区别? ANSWER: 一、问题原因 二、分析 2.1 Collection Id Document Indexed CompoundIndex Field Transient DBRef 2.…