人工智能正在推动芯片的复兴

来源丨Forbes

作者丨Rob Toews

编译丨科技行者

半导体是数字时代的一项基础技术。美国硅谷的名字正是源自于此。过去半个世纪以来,计算技术的革命改变着社会的方方面面,而半导体技术正是这场革命的核心。

自英特尔1971年推出全球第一个微处理器以来,计算能力一直以令人惊叹的步伐发展演进着。根据摩尔定律,当前的计算机芯片比50年前的芯片在功能上强大数百万倍。

尽管数十年来处理能力飞速增长,但直到现在,计算机芯片的基本体系结构仍然没有太大改变。很大程度上说,芯片的创新,需要进一步缩小晶体管的体积,让集成电路可以容纳更多晶体管。数十年来,英特尔和AMD等厂商通过提高CPU性能而取得了长足的发展,被Clayton Christensen视为“持续的创新”。

今天,这种情况正在发生着巨大的变化。人工智能(AI)引发了半导体创新的“新黄金时代”——机器学习带来独特的市场需求和无限的机会,第一次激发了企业家们,去重新思考芯片架构的基本原则。

他们的目标,是设计一种专为AI设计的新型芯片,为下一代计算提供动力,这也是当前所有硬件领域最大的市场机遇之一。

新的计算范式

在计算技术发展的历史中,主流的芯片架构一直是CPU。如今,CPU无处不在,它为笔记本电脑、移动设备和大多数数据中心提供动力。

1945年,传奇人物约翰·冯·诺伊曼(John von Neumann)构思了CPU的基本架构。值得注意的是,此后他的这一设计基本没有太大变化,今天,大多数计算机仍是基于冯·诺依曼理论的机器。

CPU的灵活性使得它有各种各样的用途:CPU是通用的,能够有效执行软件所需的任何计算。不过尽管CPU的主要优势是多功能性,然而如今领先的AI技术需要的,是一种非常特殊且密集的计算。

深度学习需要迭代执行数百万甚至是数十亿个相对简单的乘法和加法步骤。深度学习以线性代数为基础,在根本上是基于试错法的:对参数进行调整,对矩阵进行乘法运算,随着模型自身的不断优化,在整个神经网络中反复进行数字求和。

这种重复性的、计算量巨大的工作流程,对于硬件体系结构有很重要的要求。「并行化」变得至关重要,「并行」指的是:处理器能够同时、而不是一个接一个地执行多个计算的能力。与之紧密相关的是,深度学习涉及大量数据的连续转换,因此让芯片内存和计算核心尽可能靠近数据所在的位置,可以减少数据移动,从而大幅提升速度和效率。

CPU尚不足以支持机器学习的独特需求。CPU是按顺序而非并行地处理计算任务,CPU的计算核心和内存通常位于单独的模块上,通过带宽受限的通信系统(总线)进行连接。这就造成了数据移动的瓶颈,称为“冯·诺依曼瓶颈”,导致的结果就是,在CPU上训练神经网络的效率非常低。

随着机器学习正在日益普及,传统芯片已经无法应对现代AI算法的要求,这一点正变得愈加突出。正如AI专家Yann LeCun最近所说的:“如果你能穿越到未来五年或者十年,看看计算机大部分时间都在做些什么的话,我认为很可能是机器学习之类的事情。”

这时候,就需要GPU来推动AI的繁荣发展了。GPU架构是由英伟达(Nvidia)在1990年代后期为游戏应用开发的。当时GPU被专门用于连续处理大量数据,以高帧速率渲染计算机游戏画面。与CPU不同的是,GPU可以并行地运行数千个计算任务。

在2010年代初,AI领域开始意识到,Nvidia的游戏芯片实际上非常适合处理机器学习算法所需的工作负载,于是,GPU幸运地找到了新的目标市场。Nvidia抓住了这个机遇,将自己定位为“AI硬件市场领先提供商”,结果收获了惊人的收益——从2013年到2018年,Nvidia的市值增长了20倍。

然而,正如Gartner分析师Mark Hung所说,“大家知道GPU并非针对AI工作负载进行了优化。”虽然GPU已经被AI领域广泛采用,但它并非为AI而生。

近些年来,有一大批企业家和技术人员开始重新构想计算机芯片,从头开始对其进行优化,以释放AI的无限潜力。Alan Kay的一段话令人难忘:“真正认真对待软件的人,应该自己制造硬件。”

过去两年中,有5个芯片独角兽涌现,很多初创公司的估值令人瞠目结舌。传统CPU巨头英特尔为了避免被颠覆,所以进行了两项重大收购:2016年4月以4.08亿美元收购了Nervana Systems,2019年12月以20亿美元收购了Habana Labs。未来几年,这场竞赛将继续进行下去,争夺这个规模数千亿美元的市场。

谁会是下一个英特尔?

巨大的市场机会,再加上巨大的技术挑战,激发了一大批惊人的创意,意图打造出一款理想的AI芯片。

新一代AI芯片初创企业中,最引人注目之一的是Cerebras Systems公司。简单地说,大胆的Cerebras开发了有史以来最大的芯片。最近,Cerebras的市值达到了17亿美元,已经从Benchmark和Sequoia等顶级投资方那里获得了2亿美元。

Cerebras芯片的规格令人难以置信,要比典型的微处理器大60倍,是史上第一个可以容纳超过1万亿个晶体管(准确地说是1.2万亿个)的芯片。它的片上内存为18 GB,也是有史以来最高的。

将所有计算能力打包到单个芯片上,好处是非常诱人的:数据传输效率大大提升,内存与处理并置,可以做大规模的并行处理;但是,工程上的挑战也是极大的,几十年来,制造晶圆级芯片一直是半导体梦寐以求的,但从未实现。

Cerebras首席执行官Andrew Feldman表示:“每个规则、每个工具和每个制造器件,都是为巧克力曲奇大小的正常尺寸芯片设计的,而我们打造的芯片是曲奇盘子那么大。因此每个步骤我们都要进行全新设计。”

Cerebras的AI芯片已经投入商用:上周,阿贡国家实验室(Argonne National Laboratory)宣布,将使用Cerebras的芯片来对抗新型冠状病毒。

另外一家采用了全新芯片设计方法的公司,是位于美国湾区的Groq。与Cerebras相比,Groq的芯片专注于推理,而不是模型训练。Groq的创始团队拥有世界一流的领域专业知识:作为最早也是迄今为止最成功的AI芯片之一,Google TPU项目的十个原始成员中,有八个人加入了Groq团队。

Groq颠覆了业界的传统观念,正在打造批量为“1”的芯片,也就是说,一次性处理1个样本。据Groq称,这种架构几乎可以实现瞬时推理,而无需牺牲性能,这对于自动驾驶汽车等时间敏感型应用是至关重要的。Groq的芯片主要是软件定义的,具有独特的灵活性,是面向未来的。

Groq最近宣布,它的芯片实现了每秒1万亿次运算的速度。如果这是真的话,将成为有史以来速度最快的单模片芯片。

还有另一家公司,没有哪家公司比它具有更出色的技术愿景了,这就是Lightmatter。Lightmatter是由几位光子学专家创立的,总部位于美国波士顿。Lightmatter正在打造一种AI微处理器,但不是由电信号驱动,而是由光束驱动的。目前,Lightmatter已经从GV、Spark Capital和Matrix Partners等投资方那里筹集了3300万美元,以实现这一愿景。据Lightmatter称,这种独特的光技术让芯片的性能比现有解决方案高10倍。

这个领域还有其他公司值得关注。两家中国公司——地平线机器人(Horizon Robotics)和寒武纪科技(Cambricon Technologies),分别获得了更多的融资和更高的市值。

位于美国帕洛阿尔托的SambaNova Systems公司也得到了丰厚的资金,且技术精湛,尽管有关SambaNova的细节仍然很少,但它的技术似乎特别适合自然语言处理。

其他值得注意的初创公司还包括:Graphcore、Wave Computing、Blaize、Mythic和Kneron。

不仅如此,很多科技巨头也已经开始自主开发专用的AI芯片,例如上述的谷歌TPU。谷歌从2015年开始研发TPU,领先于技术曲线的发展;去年12月,亚马逊大张旗鼓地公布了Inferentia AI;与此同时,特斯拉、Facebook和阿里巴巴以及其他科技巨头也都行动起来了,开始内部研发AI芯片。

总结

眼下,一场为即将而来的AI时代开发所需的硬件竞争正在上演。如今,半导体行业的创新之多,是自硅谷创立之初以来从未有过的,巨量资金不断地投入其中。

未来几年,下一代芯片将塑造人工智能领域的雏形和轨迹。用Yann LeCun的话来说:“硬件能力...激励但却限制了AI研究人员想象并追求的想法。各种我们可以使用的工具正在不断刷新我们的想法,这一点我们不得不承认。”

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/487870.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MEMS为何独领风骚?看完这篇秒懂!

显微镜下的MEMS结构(注意图片上的刻度,是微米哦)文章来源:硬件十万个为什么卡西欧早年就以电机马达、继电器等机电产品闻名。如今的卡西欧本身就是MEMS的制造商之一,用MEMS的思路解决传统机械手表遇到的问题是卡西欧的…

如何把我的Java程序变成exe文件?

JAVA是一种“跨平台”的语言,拥有“一次编写,处处运行”的特点,让它成为当今IT行业,必不可少的一门编程语言。每一个软件开发完成之后,应该大家都需要打包程序并发送给客户,常见的方式:java程序…

福布斯:混合现实未来的八大应用场景

来源:AR工业应用近日,福布斯发布了一篇关于混合现实未来的八个值得关注的领域和应用场景。文中提到:随着时间的推移,技术永远在不断进展,而未来技术中很可能是AR和VR的结合形式。有报告显示:2024年&#xf…

演化树,靠不住?挑战物种出现与灭绝速率的估算方法

来源:Nature自然科研原文作者:Mark Pagel以演化树形式绘制的图表能够显示物种之间的系统发育关系,这类图表被广泛用于估算新物种出现以及现存物种灭绝的速率,但一项新的研究对这种方法提出了质疑。科学家经常试图对生物的过去是什…

2020五大技术趋势一览!超自动化、人类增强技术、无人驾驶发展、机器视觉崛起、区块链实用化...

文章原载于 RichardLiu自动驾驶技术的发展近年来,自动驾驶技术一直在发展,特斯拉、英特尔等大公司在这一领域取得了长足的进展。虽然我们还没有达到L4级或L5级自动驾驶汽车的水平,但我们已经很接近了。为了解释每个级别的含义,下…

Facebook 开源聊天机器人Blender,经94 亿个参数强化训练,更具“人情味”

来源:AI前线作者 | Kyle Wiggers编译 | Sambodhi策划 & 编辑 | 刘燕不久前,Facebook 开源了号称是全球最强大的聊天机器人 Blender,它标志着 Facebook 在 AI 领域的新进展:新的聊天机器人不仅解决了此前聊天机器人的固有缺点&…

微服务go还是java,Java微服务 vs Go微服务,究竟谁更强!?

前言Java微服务能像Go微服务一样快吗?这是我最近一直在思索地一个问题。去年8月份的the Oracle Groundbreakers Tour 2020 LATAM大会上,Mark Nelson和Peter Nagy就对此做过一系列基础的的测试用以比较。接下来就给大家介绍下。在程序员圈子里&#xff0c…

Defi安全-Mono攻击事件分析--etherscan+phalcon

MonoX攻击事件相关信息 在Ethereum和Polygon网络都发生了,攻击手段相同,以Ethereum为例进行分析: 攻击者地址:MonoX Finance Exploiter | Address 0xecbe385f78041895c311070f344b55bfaa953258 | Etherscan 攻击合约&#xff1a…

特斯拉自动驾驶靠自研芯片,国产智能汽车怎么办?

文章来源:量子位从这个月开始,特斯拉终于跌破30万,进入补贴行列,与国产汽车展开正面竞争。在国产汽车和特斯拉之间该如何选择,除了续航里程外,最重要的可能就是智能驾驶系统了。智能驾驶系统该怎么比较&…

【星·企业】竞逐卫星互联网“新基建”,「九天微星」完成2.7亿元B 轮融资

图为九天微星一箭七星“瓢虫系列”主星示意图来源:中科创星据了解,「九天微星」将用此轮融资在河北唐山和四川宜宾分别建设互联网卫星平台、载荷自动化产线,同时强化宽带通信系统研发能力,加速地面终端产品投产。九天微星卫星工厂…

3D原子映射有助于研究生命的起源

Chi Ma/Royal Ontario Museum来源:IEEE电气电子工程师一种相对较新的研究原子的技术可能会对地球上生命的起源提供更多的线索。科学家利用三维原子图(特别是原子探针层析成像)发现,太阳系中最古老的分子流体本可以支持氨基酸的发展…

混合现实未来的八大应用场景

来源:诚迈科技近日,福布斯发布了一篇关于混合现实未来的八个值得关注的领域和应用场景。文中提到:随着时间的推移,技术永远在不断进展,而未来技术中很可能是AR和VR的结合形式。有报告显示:2024年&#xff0…

4个重要的量子理论实验综述

文章原载于:大数据01 量子理论量子理论是一个容易让人迷惑的理论,因此,如果我们想准确地了解其概况,就需要非常谨慎。与大多数自牛顿著作和其他17世纪晚期科学家著作问世以来出现的物理学成果一样,量子理论是一个以数学…

前沿|《细胞》:绕过眼睛植入幻觉,科学家成功在盲人脑海中呈现指定图像!...

该文章内容转载自学术头条对于全球 5000 多万盲人来说,重见光明是一个遥不可及的梦想。而为了与盲人朋友进行交互,我们发明了盲文,用各种凸起的字符集合来表达各种意思。但这种通过手指触摸来识别的方式太过低效。随着脑科学研究的深入&#…

mysql error1045 yes,MySQLERROR1045(28000)错误的解决办法

错误现象:ERROR 1045 (28000): Access denied for userODBClocalhost(using password: NO)ERROR 1045 (28000): Access denied for userODBClocalhost(using password: YES)windows下,以上两个错误的解决方法,本人亲测有效,现分享…

软件测试常考面试题-软件测试面试宝典 ---面试过程中踩过的坑

问:你在测试中发现了一个 bug ,但是开发经理认为这不是一个 bug ,你应该怎样解决。 首先,将问题提交到缺陷管理库里面进行备案。 然后,要获取判断的依据和标准: 根据需求说明书、产品说明、设计文档等&am…

Soft robotics:造仿生昆虫机器人柔性骨骼新技术,只需2小时,成本不到7块!

来源:量子位原标题:只需2小时,成本不到7块,你我皆可制作的3D机器人机器人的骨架能像昆虫那般灵活、健壮吗?这个问题一直困扰着研究人员。以往,要么制作工艺太过复杂,耗的时间长;要么…

2019-2020年半导体行业深度报告

来源:华安证券新科技起点,不可缺芯半导体位于电子行业中游。通过集成电路、分立器件、被动器件在 PCB 上组合形 成模组,构成了手机、电脑、工业、航空航天、军事装备等电子产品的核心。这些产 品又直接影响到国家的发展、社会的进步以及个人的…

5G 智慧城市安全参考架构概述

来源:安全内参2020年5月12日,IMT-2020(5G)推进组安全工作组发布了《5G智慧城市安全需求与架构白皮书》,本文节选自该白皮书,主要概述了5G 智慧城市安全参考框架。该框架是参考GB/T 37971-2019《信息安全技术 智慧城市安全体系框架…

vue 学习笔记—路由篇

一.关于三种路由 动态路由 就是path:good/:ops 这种 用 $route.params接收  <router-link>是用来跳转 <router-view></router-view>用来盛放内容的容易 在routes 里面进行配置 [{ path:,name:,component:}] path为router-link的路径 component为 …