人工智能正在推动芯片的复兴

来源丨Forbes

作者丨Rob Toews

编译丨科技行者

半导体是数字时代的一项基础技术。美国硅谷的名字正是源自于此。过去半个世纪以来,计算技术的革命改变着社会的方方面面,而半导体技术正是这场革命的核心。

自英特尔1971年推出全球第一个微处理器以来,计算能力一直以令人惊叹的步伐发展演进着。根据摩尔定律,当前的计算机芯片比50年前的芯片在功能上强大数百万倍。

尽管数十年来处理能力飞速增长,但直到现在,计算机芯片的基本体系结构仍然没有太大改变。很大程度上说,芯片的创新,需要进一步缩小晶体管的体积,让集成电路可以容纳更多晶体管。数十年来,英特尔和AMD等厂商通过提高CPU性能而取得了长足的发展,被Clayton Christensen视为“持续的创新”。

今天,这种情况正在发生着巨大的变化。人工智能(AI)引发了半导体创新的“新黄金时代”——机器学习带来独特的市场需求和无限的机会,第一次激发了企业家们,去重新思考芯片架构的基本原则。

他们的目标,是设计一种专为AI设计的新型芯片,为下一代计算提供动力,这也是当前所有硬件领域最大的市场机遇之一。

新的计算范式

在计算技术发展的历史中,主流的芯片架构一直是CPU。如今,CPU无处不在,它为笔记本电脑、移动设备和大多数数据中心提供动力。

1945年,传奇人物约翰·冯·诺伊曼(John von Neumann)构思了CPU的基本架构。值得注意的是,此后他的这一设计基本没有太大变化,今天,大多数计算机仍是基于冯·诺依曼理论的机器。

CPU的灵活性使得它有各种各样的用途:CPU是通用的,能够有效执行软件所需的任何计算。不过尽管CPU的主要优势是多功能性,然而如今领先的AI技术需要的,是一种非常特殊且密集的计算。

深度学习需要迭代执行数百万甚至是数十亿个相对简单的乘法和加法步骤。深度学习以线性代数为基础,在根本上是基于试错法的:对参数进行调整,对矩阵进行乘法运算,随着模型自身的不断优化,在整个神经网络中反复进行数字求和。

这种重复性的、计算量巨大的工作流程,对于硬件体系结构有很重要的要求。「并行化」变得至关重要,「并行」指的是:处理器能够同时、而不是一个接一个地执行多个计算的能力。与之紧密相关的是,深度学习涉及大量数据的连续转换,因此让芯片内存和计算核心尽可能靠近数据所在的位置,可以减少数据移动,从而大幅提升速度和效率。

CPU尚不足以支持机器学习的独特需求。CPU是按顺序而非并行地处理计算任务,CPU的计算核心和内存通常位于单独的模块上,通过带宽受限的通信系统(总线)进行连接。这就造成了数据移动的瓶颈,称为“冯·诺依曼瓶颈”,导致的结果就是,在CPU上训练神经网络的效率非常低。

随着机器学习正在日益普及,传统芯片已经无法应对现代AI算法的要求,这一点正变得愈加突出。正如AI专家Yann LeCun最近所说的:“如果你能穿越到未来五年或者十年,看看计算机大部分时间都在做些什么的话,我认为很可能是机器学习之类的事情。”

这时候,就需要GPU来推动AI的繁荣发展了。GPU架构是由英伟达(Nvidia)在1990年代后期为游戏应用开发的。当时GPU被专门用于连续处理大量数据,以高帧速率渲染计算机游戏画面。与CPU不同的是,GPU可以并行地运行数千个计算任务。

在2010年代初,AI领域开始意识到,Nvidia的游戏芯片实际上非常适合处理机器学习算法所需的工作负载,于是,GPU幸运地找到了新的目标市场。Nvidia抓住了这个机遇,将自己定位为“AI硬件市场领先提供商”,结果收获了惊人的收益——从2013年到2018年,Nvidia的市值增长了20倍。

然而,正如Gartner分析师Mark Hung所说,“大家知道GPU并非针对AI工作负载进行了优化。”虽然GPU已经被AI领域广泛采用,但它并非为AI而生。

近些年来,有一大批企业家和技术人员开始重新构想计算机芯片,从头开始对其进行优化,以释放AI的无限潜力。Alan Kay的一段话令人难忘:“真正认真对待软件的人,应该自己制造硬件。”

过去两年中,有5个芯片独角兽涌现,很多初创公司的估值令人瞠目结舌。传统CPU巨头英特尔为了避免被颠覆,所以进行了两项重大收购:2016年4月以4.08亿美元收购了Nervana Systems,2019年12月以20亿美元收购了Habana Labs。未来几年,这场竞赛将继续进行下去,争夺这个规模数千亿美元的市场。

谁会是下一个英特尔?

巨大的市场机会,再加上巨大的技术挑战,激发了一大批惊人的创意,意图打造出一款理想的AI芯片。

新一代AI芯片初创企业中,最引人注目之一的是Cerebras Systems公司。简单地说,大胆的Cerebras开发了有史以来最大的芯片。最近,Cerebras的市值达到了17亿美元,已经从Benchmark和Sequoia等顶级投资方那里获得了2亿美元。

Cerebras芯片的规格令人难以置信,要比典型的微处理器大60倍,是史上第一个可以容纳超过1万亿个晶体管(准确地说是1.2万亿个)的芯片。它的片上内存为18 GB,也是有史以来最高的。

将所有计算能力打包到单个芯片上,好处是非常诱人的:数据传输效率大大提升,内存与处理并置,可以做大规模的并行处理;但是,工程上的挑战也是极大的,几十年来,制造晶圆级芯片一直是半导体梦寐以求的,但从未实现。

Cerebras首席执行官Andrew Feldman表示:“每个规则、每个工具和每个制造器件,都是为巧克力曲奇大小的正常尺寸芯片设计的,而我们打造的芯片是曲奇盘子那么大。因此每个步骤我们都要进行全新设计。”

Cerebras的AI芯片已经投入商用:上周,阿贡国家实验室(Argonne National Laboratory)宣布,将使用Cerebras的芯片来对抗新型冠状病毒。

另外一家采用了全新芯片设计方法的公司,是位于美国湾区的Groq。与Cerebras相比,Groq的芯片专注于推理,而不是模型训练。Groq的创始团队拥有世界一流的领域专业知识:作为最早也是迄今为止最成功的AI芯片之一,Google TPU项目的十个原始成员中,有八个人加入了Groq团队。

Groq颠覆了业界的传统观念,正在打造批量为“1”的芯片,也就是说,一次性处理1个样本。据Groq称,这种架构几乎可以实现瞬时推理,而无需牺牲性能,这对于自动驾驶汽车等时间敏感型应用是至关重要的。Groq的芯片主要是软件定义的,具有独特的灵活性,是面向未来的。

Groq最近宣布,它的芯片实现了每秒1万亿次运算的速度。如果这是真的话,将成为有史以来速度最快的单模片芯片。

还有另一家公司,没有哪家公司比它具有更出色的技术愿景了,这就是Lightmatter。Lightmatter是由几位光子学专家创立的,总部位于美国波士顿。Lightmatter正在打造一种AI微处理器,但不是由电信号驱动,而是由光束驱动的。目前,Lightmatter已经从GV、Spark Capital和Matrix Partners等投资方那里筹集了3300万美元,以实现这一愿景。据Lightmatter称,这种独特的光技术让芯片的性能比现有解决方案高10倍。

这个领域还有其他公司值得关注。两家中国公司——地平线机器人(Horizon Robotics)和寒武纪科技(Cambricon Technologies),分别获得了更多的融资和更高的市值。

位于美国帕洛阿尔托的SambaNova Systems公司也得到了丰厚的资金,且技术精湛,尽管有关SambaNova的细节仍然很少,但它的技术似乎特别适合自然语言处理。

其他值得注意的初创公司还包括:Graphcore、Wave Computing、Blaize、Mythic和Kneron。

不仅如此,很多科技巨头也已经开始自主开发专用的AI芯片,例如上述的谷歌TPU。谷歌从2015年开始研发TPU,领先于技术曲线的发展;去年12月,亚马逊大张旗鼓地公布了Inferentia AI;与此同时,特斯拉、Facebook和阿里巴巴以及其他科技巨头也都行动起来了,开始内部研发AI芯片。

总结

眼下,一场为即将而来的AI时代开发所需的硬件竞争正在上演。如今,半导体行业的创新之多,是自硅谷创立之初以来从未有过的,巨量资金不断地投入其中。

未来几年,下一代芯片将塑造人工智能领域的雏形和轨迹。用Yann LeCun的话来说:“硬件能力...激励但却限制了AI研究人员想象并追求的想法。各种我们可以使用的工具正在不断刷新我们的想法,这一点我们不得不承认。”

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/487870.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java integer 包_java之学习基本类型包装类的概述及Integer类的概述和构造方法

基本类型包装类的概述A:为什么会有基本类型包装类* 将基本数据类型封装成对象的好处在于可以在对象中定义更多的功能方法操作该数据。* B:常用操作* 常用的操作之一:用于基本数据类型与字符串之间的转换。* C:基本类型和包装类的对应byte Byteshort …

UVA3942 Remember the Word

题意&#xff1a;输入一个字符串(l<300000)&#xff0c;一个n(n<4000)&#xff0c;接下来n个字符串(l<100)&#xff0c;问能分解成几种字符串 题解&#xff1a;直接计算复杂度高&#xff0c;考虑DP&#xff0c;dp[i]代表以第i个字符开头的字符串分解的方案数&#xff…

MEMS为何独领风骚?看完这篇秒懂!

显微镜下的MEMS结构&#xff08;注意图片上的刻度&#xff0c;是微米哦&#xff09;文章来源&#xff1a;硬件十万个为什么卡西欧早年就以电机马达、继电器等机电产品闻名。如今的卡西欧本身就是MEMS的制造商之一&#xff0c;用MEMS的思路解决传统机械手表遇到的问题是卡西欧的…

如何把我的Java程序变成exe文件?

JAVA是一种“跨平台”的语言&#xff0c;拥有“一次编写&#xff0c;处处运行”的特点&#xff0c;让它成为当今IT行业&#xff0c;必不可少的一门编程语言。每一个软件开发完成之后&#xff0c;应该大家都需要打包程序并发送给客户&#xff0c;常见的方式&#xff1a;java程序…

福布斯:混合现实未来的八大应用场景

来源&#xff1a;AR工业应用近日&#xff0c;福布斯发布了一篇关于混合现实未来的八个值得关注的领域和应用场景。文中提到&#xff1a;随着时间的推移&#xff0c;技术永远在不断进展&#xff0c;而未来技术中很可能是AR和VR的结合形式。有报告显示&#xff1a;2024年&#xf…

php怎么实现简单的mvc框架,php实现简单的MVC框架实例

这篇文章主要介绍了php实现简单的MVC框架,较为详细的分析了php实现MVC框架的相关实现技巧与注意事项,具有一定参考借鉴价值,需要的朋友可以参考下本文实例讲述了php实现简单的MVC框架。分享给大家供大家参考。具体如下&#xff1a;在开始之前需要知道的知识1.php基础知识2.单一…

演化树,靠不住?挑战物种出现与灭绝速率的估算方法

来源&#xff1a;Nature自然科研原文作者&#xff1a;Mark Pagel以演化树形式绘制的图表能够显示物种之间的系统发育关系&#xff0c;这类图表被广泛用于估算新物种出现以及现存物种灭绝的速率&#xff0c;但一项新的研究对这种方法提出了质疑。科学家经常试图对生物的过去是什…

Windows中使用wget整站下载

weget wget安装 Windows下载 点击下载 https://eternallybored.org/misc/wget/会跳转到wget的下载页&#xff0c;根据自己电脑选择下载的文件&#xff0c;我下载的版本为wget-1.19.1-win64.zip下载完成后解压文件,并且双击exe使用wget wget使用 在需要下载到网站的位置新建文…

java中事件的概念,事件中心上IoTHub数据的概念

我是IoTHub的新手 . 我有一个关于数据如何发送到IoTHub \ EventHub的基本查询 . 从我的阅读中我看到 - 和 IoT Hub and Event Hub - 作为不同的实体 .My Requirement我需要开发一个可以将数据从Raspberry Pi3设备发送到IoT Hub的应用程序另一个Web应用程序&#xff0c;用于订阅…

Android媒体解码MediaCodec,MediaExtractor

Android提供了MediaPlayer播放器播放媒体文件&#xff0c;其实MediaPlyer只是对Android Media包下的MediaCodec和MediaExtractor进行了包装&#xff0c;方便使用。但是最好理解下Android媒体文件的解码&#xff0c;编码和渲染流程。 Shape Of My Heart.mp4 <source src"…

2020五大技术趋势一览!超自动化、人类增强技术、无人驾驶发展、机器视觉崛起、区块链实用化...

文章原载于 RichardLiu自动驾驶技术的发展近年来&#xff0c;自动驾驶技术一直在发展&#xff0c;特斯拉、英特尔等大公司在这一领域取得了长足的进展。虽然我们还没有达到L4级或L5级自动驾驶汽车的水平&#xff0c;但我们已经很接近了。为了解释每个级别的含义&#xff0c;下…

ansible执行mysql命令,Ansible常用命令(ad-hoc 命令)

Ansible提供两种方式去完成任务&#xff1a;1、ad-hoc命令2、写Ansible playbook脚本前者可以解决一些简单的任务&#xff0c;后者解决较复杂的任务(ad-hoc命令和ansible playbook的关系类似于在命令行敲入shell命令和写shell scripts两者之间的关系)。ansible命令应用基础语法…

Facebook 开源聊天机器人Blender,经94 亿个参数强化训练,更具“人情味”

来源&#xff1a;AI前线作者 | Kyle Wiggers编译 | Sambodhi策划 & 编辑 | 刘燕不久前&#xff0c;Facebook 开源了号称是全球最强大的聊天机器人 Blender&#xff0c;它标志着 Facebook 在 AI 领域的新进展&#xff1a;新的聊天机器人不仅解决了此前聊天机器人的固有缺点&…

微服务go还是java,Java微服务 vs Go微服务,究竟谁更强!?

前言Java微服务能像Go微服务一样快吗&#xff1f;这是我最近一直在思索地一个问题。去年8月份的the Oracle Groundbreakers Tour 2020 LATAM大会上&#xff0c;Mark Nelson和Peter Nagy就对此做过一系列基础的的测试用以比较。接下来就给大家介绍下。在程序员圈子里&#xff0c…

php类中双冒号和-的区别

就是为了区分对象的方法和属性&#xff0c;和是访问类的静态方法和静态变量&#xff0c;类的静态方法和静态变量是类公用的&#xff0c;不需要实例化也能访问&#xff0c;而对象的方法和属性是每个对象特有的&#xff0c;因此必须先实例化。其他语言如C,JAVA等也是一样的&#…

java用循环语法在窗体中显示文字,如果子窗体在窗体视图中,则访问2003循环当前页面不起作用...

我有一个包含多个子表单的表单 .我想有以下行为&#xff1a;按主窗体的最后一个字段中的tab键或子窗体的最后一个字段中焦点移动到下一个子窗体或根据定义的Tab顺序返回到主窗体 .为此&#xff0c;所有子表单和主表单都将Cycle属性设置为Current页面 .除了表单视图中显示的子表…

Defi安全-Mono攻击事件分析--etherscan+phalcon

MonoX攻击事件相关信息 在Ethereum和Polygon网络都发生了&#xff0c;攻击手段相同&#xff0c;以Ethereum为例进行分析&#xff1a; 攻击者地址&#xff1a;MonoX Finance Exploiter | Address 0xecbe385f78041895c311070f344b55bfaa953258 | Etherscan 攻击合约&#xff1a…

特斯拉自动驾驶靠自研芯片,国产智能汽车怎么办?

文章来源&#xff1a;量子位从这个月开始&#xff0c;特斯拉终于跌破30万&#xff0c;进入补贴行列&#xff0c;与国产汽车展开正面竞争。在国产汽车和特斯拉之间该如何选择&#xff0c;除了续航里程外&#xff0c;最重要的可能就是智能驾驶系统了。智能驾驶系统该怎么比较&…

Codeforces Round #263 (Div. 2) D. Appleman and Tree 树形dp

链接&#xff1a; http://codeforces.com/contest/462/problem/D 题意&#xff1a; 给定n个点的树&#xff0c; 0为根&#xff0c;下面n-1行表示每个点的父节点 最后一行n个数 表示每个点的颜色&#xff0c;0为白色&#xff0c;1为黑色。 把树分成若干个联通块使得每个联通块有…

【星·企业】竞逐卫星互联网“新基建”,「九天微星」完成2.7亿元B 轮融资

图为九天微星一箭七星“瓢虫系列”主星示意图来源&#xff1a;中科创星据了解&#xff0c;「九天微星」将用此轮融资在河北唐山和四川宜宾分别建设互联网卫星平台、载荷自动化产线&#xff0c;同时强化宽带通信系统研发能力&#xff0c;加速地面终端产品投产。九天微星卫星工厂…