困局中的英伟达:进一步是鲜花,退一步是悬崖

5edbf0d2e1de3214efcd6294b1d4116b.jpeg

来源: AI前线

整理:王强、冬梅

看看最近几个月的股价,英伟达的投资者肯定不怎么开心:

fe0508195577734ea1cde0d66a29e788.jpeg

但如果把时间拉长到 5 年,我们看到的故事似乎又不一样了:

c904111e33a87fe69beec36adaaa66a5.jpeg

2020 年底显然是是一个转折点。很多游戏玩家还清楚地记得,当他们看到新一代 3000 系列 GPU 以较低的定价发布时,本想着在两个月后购入新品升级自己的 PC,却在 GPU 发售后遭遇了前所未有的缺货和价格飞涨。随后,整个 GPU 市场进入了时长一年多的特殊时期。

新冠疫情让更多消费者被迫居家办公、居家娱乐,刺激了 PC 和游戏 GPU 的销量;人工智能的热潮让企业、学校和实验室购买了更多占据市场主导地位的英伟达 GPU,这是造成上述局面的两大因素。

当然,众所周知,最大的刺激来自数字货币市场。为了挖掘价格飞涨数倍的以太坊,大批数字货币矿工取代了 PC 玩家成为 GPU 市场的购买主力。他们不在乎涨价,因为以太坊涨得更多,购卡成本可以在极短时间内回本。狂热的气氛延续了一年多,直到 2022 年数字货币市场冷却后才开始消退。

直到今年 9 月份,筹备数年的以太坊大升级终于实施。以太坊由工作量证明(PoW)机制转向权益证明(PoS)机制,意味着使用 GPU 挖掘以太坊由此成为历史。没有任何其他数字货币能够承载矿工在以太坊中投入的天量算力规模,无数 GPU 一夜之间丧失了自己的存在意义。

就像每一位因为 GPU 涨价而被迫推迟升级计划,对挖矿热潮咬牙切齿的 PC 玩家所期待的那样,矿工开始以极低的价格大批量抛售 GPU。可以预期,市场很快会充斥廉价的二手矿卡。英伟达刚刚发布的 4000 系 GPU 虽然有着看似合理的定价,但在矿卡面前毫无吸引力。

英伟达的 CEO 黄仁勋因为喜欢以皮衣装扮出镜而被称为“皮衣黄”。他对媒体表示英伟达也挨了当头一棒,但 4000 系 GPU 的创新依旧能吸引买家的关注。看起来,公司对渡过难关充满信心。

他还提到,之前芯片产能的瓶颈问题导致 GPU 出货缓慢,进而让英伟达的库存在今天达到了很高的水平,这进一步加剧了困境。

但问题在于,即便矿卡和库存的压力随着时间逐渐消退,英伟达的未来依旧有着巨大的不确定性因素。相比短期困难,很多长期因素对投资者信心的冲击更为明显。

光线追踪:游戏的未来,

但不是英伟达的救星

长期以来,3D 游戏依赖一系列技巧来呈现栩栩如生的画面,这些技巧主要集中在光照层面。GPU 首先会将 3D 场景中玩家看不到的部分(比如视野中房子后面的车库)剔除掉来减少计算量;然后将正确的纹理应用到各种对象(树、草、人、等等)上。最后,GPU 根据场景中预先确定的光源位置在画面上应用光照效果,并在对象上添加阴影贴图。处理好的场景会转换为一个个像素并渲染到 2D 屏幕上;这个过程称为光栅化。

近年来热门的光线追踪技术机制完全不一样:光线追踪的原理是从玩家的视角位置向场景中发射大量光线,当光线遇到对象后会按照现实世界中的物理规律进行反射、折射处理。光线最后会射向场景中的光源,GPU 再从光源开始沿着光线计算照明参数。这种机制一般会显著增强光照的效果,让场景物体看起来更加贴近真实。

51b45bb720a861035c73ed9aaa860ad4.jpeg

如上图,左边开启光追的画面中水面反射与瞄准镜外壳的阴影明显更加真实。光栅化机制很难处理场景中物体的随机反射,这是光线追踪的优势所在。

在过去,光线追踪技术由于计算成本高昂(相当于对屏幕上数百万像素发出的数以亿计光线全部计算反射路径)而只能用在电影电视工业的后期处理上。每渲染一帧光线追踪场景往往需要大型计算集群工作几分钟甚至几小时。2018 年,英伟达推出的 2000 系列 GPU 引入了弱化版本的光线追踪,通过一系列技巧大大减少了光追场景所需的计算量,然后使用专用的计算单元提升了计算效率,从而实现了实时光线追踪效果。

理论上说,光线追踪不仅可以提升游戏玩家体验,还能大大减少开发者的工作量。开发者不再需要提前研究场景光照并绘制贴图(术语称为“烘培”),只需放好物体并设置表面属性,放好光源,剩下的事情交给 GPU 即可。当然,这需要几乎所有玩家都配备支持光线追踪的硬件才行。

在未来的元宇宙应用中,光追的这一优势可以显著减小开发者创造虚拟世界的负担。除了光追外,英伟达开发的 DLSS 技术能从另一个角度获得类似的效果。DLSS 通过 AI 计算来预测下一帧画面,从而减少场景所需的算力。在 AR/VR 应用中,这一技术可以让算力不足的 GPU 也能输出高帧率的画面,降低玩家的眩晕感。

英伟达的竞争对手 AMD 也选择了类似的技术路线,只不过后者尽量避免使用专用单元来执行光追和 AI 预测计算。这意味着 AMD 实现的效果不够好,但消耗的晶体管会少很多。AMD 还选择了将多个小芯片封装在一起提供算力的方案,术语称为 MCM 封装。制造小芯片的成本比大芯片低很多:制造一颗 500mm2 大芯片的费用可能可以生产 10 颗 100mm2 的小芯片。

这就产生了一个结果,虽然英伟达的 GPU 更快、效果更好,但成本相当高昂。

另一个问题在于,游戏主机市场的三大厂商:索尼、微软和任天堂开发的游戏主机全部采用 AMD 生产的 GPU,并不支持英伟达的光线追踪与 DLSS 技术。开发者即便为英伟达产品做了优化,也只有一小部分 PC 玩家能够享受成果。考虑到越来越多的大型 3D 游戏都会同时推出游戏主机和 PC 版本,甚至只推出主机版本,开发者可能更倾向于采用那些 AMD 产品也支持的特性。

虽然刚刚发布的 4000 系列 GPU 拥有极强的光线追踪性能(据英伟达宣传,新品的光追性能提升了 1-3 倍),但如果游戏不支持光追,就并不能享受这种增益。加上英伟达选择的大芯片路线让 4000 系产品成本居高不下,在这场较量中公司似乎很难取得对 AMD 的优势。

人工智能:美好的蓝图,

但并非一人独享

英伟达的巨型芯片并不是只能玩游戏。除了为人们提供娱乐外,它们还有看起来更有前景的用途。

1999 年,英伟达通过在显卡中加入硬件光照和三角形单元,历史上第一次显著分担了 CPU 的负担,从而打败并收购了曾经如日中天的 3dfx。GPU 这个名词就是英伟达在那时发明的。从那以后,GPU 的计算单元日益进化,在 3D 渲染场景中能做的事情越来越多。终于,英伟达意识到 GPU 的核心——Shader 着色器也可以在其他领域中发挥作用。2006 年,CUDA 技术与英伟达代号的 G80 的新一代 GPU 一同发布,让开发者可以将 GPU 的庞大浮点运算能力运用在通用科学计算场景中。CUDA 开启了 GPGPU 的时代,显卡取代了 CPU 成为研究人员的主要计算能力源泉。

2016 年击败围棋世界冠军的 AlphaGo 超级计算机标志着另一股力量的崛起。有了 GPU 提供的庞大算力,曾经在论文中沉睡多年的机器学习与深度学习技术终于等来了实用化的曙光。开发者在 GPU 集群中运行越来越大的 AI 模型,完成自然语言识别、图像识别、用户偏好分析等一系列任务。短短几年间,AI 的身影遍布了几乎所有 IT 领域,并通过智能手机、智能音箱、智能辅助驾驶、智能摄像头等产品深入影响人们的生活。

英伟达是人工智能崛起的最大赢家之一。无论开发人员从事何种领域的人工智能研究,他们都需要英伟达的 GPU 和 CUDA 编程生态。英伟达在这一市场先行一步,并持续多年投入大量资源开发并改进软硬件技术,帮助开发人员开发出更多、更好的 AI 模型,也赢得了整个开发社区的忠诚。

但是,为人工智能投入的资源也为英伟达带来了负担。今天的 GPU 将大量晶体管资源用来为开发者提供灵活的通用计算能力,但这些资源在游戏中能起到的作用并不明显。虽然英伟达试图通过 DLSS 这样的技术来提升 3D 游戏对 GPU 的利用率,可是无论如何,曾经全为游戏玩家设计的显卡已经一去不复返了。

与之类似,英伟达在 CUDA 生态方面的投入也和游戏开发厂商没有太大关系。英伟达开拓了一个全新的战场,这个战场与游戏产业的联系日益淡化。英伟达正在两线作战。

英伟达开始为数据中心制造专用加速硬件。这些产品没有视频输出口,无法当作显卡使用,只能用于通用计算目的。随着时间推移,这些硬件的芯片设计也开始与 GPU 芯片出现了明显差异。专用芯片会有更多晶体管用于 AI 加速目的,而 GPU 芯片依旧主打 3D 游戏。

即便如此,技术进步依旧让英伟达不敢掉以轻心。CUDA 生态为公司积累了可观的先发优势,但人工智能领域的进化速度超越了人们的想象。一夜之间,一种全新的计算范式开始迈向主流,英伟达感受到了危机。

相比从 GPU 改进而来的加速卡,人们意识到专门为 AI 目的从头开始研发的芯片可能拥有更高的计算能力与更低的功耗,或许还有更低的成本。在这样的前景驱动下,一大批 AI 初创公司杀入了战场,推出了五花八门的 AI 芯片解决方案。

另一方面,云计算的流行让大量 AI 算力需求流向了云厂商。这些云厂商一开始要投入巨资购买英伟达的加速卡升级自己的基础设施来满足需求,直到有一天他们发现了另一条路线。

IT 产业的几大巨头,包括亚马逊、谷歌、阿里巴巴,都开始研制自己的云基础设施硬件。这些硬件包括了 CPU、AI 加速器、网络芯片等等。更重要的是,不同类型的软硬件从一开始就是为云环境中高效协作而优化设计的。随着技术迭代,厂商自主研发的方案足以成为英伟达产品的强力竞争对手。

大型云厂商有充足的资金、业界一流的软件工程师队伍,能够招聘到最优秀的硬件人才为他们服务。并且他们都希望摆脱对英伟达这样第三方厂商的依赖,这种动力是不可磨灭的。

英伟达的护城河是 CUDA 形成的软件生态。然而,随着 AI 技术不断进化和普及,新一代开发人员从一开始接触到的可能会是云厂商提供的入口。他们可能不会再绑定到 CUDA 生态中,而是使用各家云厂商的解决方案来完成工作。

事情又回到了原点。英伟达只能依靠持续的技术创新,不断研发出业界最优秀的硬件才能保持市场份额,或者至少不让市场那么早就丢掉。为此,英伟达也需要提供全栈方案:除了加速硬件,今天的英伟达还在开发 CPU、IO、加速芯片、网络芯片一体化的产品。这种产品不再需要依赖英特尔或 AMD 制造的 CPU,还能通过英伟达自有 CPU 与 GPGPU 之间更紧密的数据交换通道来提升性能与能耗比。

英伟达需要独自完成所有环节。从 CPU 到编程加速库,一站式解决问题。但这样的方案能否挽回云厂商的订单?能否继续让新一代开发人员留在英伟达创造的开发生态中?答案尚未明朗。

Omniverse:成为元宇宙世界的先行者

如果云厂商最终抛弃了英伟达,英伟达会不会自己成为云厂商呢?

在今天,这种可能性是非常小的。但随着元宇宙逐渐从概念走向现实,情况可能会发生变化。

英伟达发布的 Omniverse 平台是专为元宇宙打造的软硬件方案。其中,Ominiverse Nucleus 是平台的数据库和协作引擎。开发者可以使用 Nucleus 创建虚拟世界中的种种对象,就像创世纪传说中上帝为世界塑造花鸟鱼虫和阳光雨露一样。

这些对象能够用在各种元宇宙应用中,满足生产生活的种种用途。当然,这些对象和应用都会成为英伟达元宇宙生态的一部分。

这样的元宇宙会构建在英伟达的硬件基础之上。CPU、GPU、AI 加速器、网络……所有的产品均由英伟达提供。直到最后,整个云服务都可能来自于英伟达。这是一片全新的蓝海,所有厂商都有相同的起跑线。正因如此,英伟达有理由、有动力开启新的商业模式:为元宇宙提供一站式云服务。

如果这样的未来成为现实,这意味着英伟达将与谷歌、亚马逊、Meta、阿里巴巴等巨头正面对抗。每家厂商都很可能会在自有软硬件上构筑自己的元宇宙,不同的元宇宙之间无法互通。

为了赢得这场未来之战,英伟达正在通过 Omniverse 提前蓄积弹药。就像 2006 年的 CUDA 成就了十年后的英伟达一样,今天的英伟达也希望提前锁定未来十年的竞争优势。

英伟达也没有放弃另一条路径。如果软硬件生态最终并没有走向封闭体系,那么英伟达依旧能够为各大企业提供基础设施。至少,那些中小企业可能依旧会钟情于英伟达的加速卡,而不是那些云巨头销售的计算设备订阅服务。

如果 Omniverse 成为新时代的 CUDA,英伟达就能在今天的基础上更进一步,成为元宇宙时代的统治者之一。届时,投资者可能会看到一家市值数以万亿美元计的巨型企业,为他们带来丰厚的回报。

无论如何,今天英伟达的潜在竞争对手并不希望看到这样的未来。他们会全力以赴,避免 GPGPU 的故事重演。英伟达正在吸引同行的火力,Omniverse 的前景也因此难以预测。

游戏 GPU、人工智能与元宇宙,是今天的英伟达需要解决的三大困局。强敌环伺,英伟达需要付出前所未有的努力才有可能打通那条荣耀与财富之路。稍有不慎,皮衣黄的梦想就有可能折戟沉沙,让行业见证又一颗企业巨星的陨落。

鲜花还是坟墓,未来通向何方我们无法预测。但英伟达正在试图创造未来,试图用持续不断的技术创新与大胆的商业决策吸引命运女神的垂青。这样的努力,至少值得人们的敬意。

参考链接:https://stratechery.com/2022/nvidia-in-the-valley

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

a694355e104072144f2ae0023a97c2c3.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481562.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文学习17-Global Normalization of Convolutional Neural Networks(联合实体关系抽取CNN+CRF)2017

文章目录abstract1.Introduction2.相关工作3.Model全局归一化层(使用线性链CRF)4.实验和分析4.3实验结果总结Adel, H. and H. Schtze “Global Normalization of Convolutional Neural Networks for Joint Entity and Relation Classification.”abstract CNNCRF&g…

特斯拉AI日点不燃仿人机器人的市场热情

来源:科技智谷编辑:Light"仿人机器人的巨大市场蓝海能否兑现,核心还要看产品量产和成本控制。近期,沉寂已久的仿人机器人市场终于迎来了它的“春晚”——特斯拉AI日。根据外媒报道,在9月30日(北京时间…

LSTM(序列标注,自实现)

文章目录1.LSTM1.1 单独计算单层LSTM-cell单层LSTMBPTT2.序列标注使用pytorch实现序列标注自实现lstmimport torchimport torch.nn as nndef prepare_sequence(seq, to_ix):idxs [to_ix[w] for w in seq]return torch.tensor(idxs, dtypetorch.long)training_data [("Th…

Science最新:Jeff Gore团队揭示复杂生态系统中涌现的相变

来源:集智俱乐部作者:胡脊梁编辑:邓一雪导语生态学致力于理解自然生态系统中的多样化的物种和复杂的动力学行为,然而科学家长期缺乏描述和预测生物多样性和生态动力学的统一框架。MIT物理系的胡脊梁和Jeff Gore等科学家结合理论和…

强化学习发现矩阵乘法算法,DeepMind再登Nature封面推出AlphaTensor

来源:机器之心 微信公众号DeepMind 的 Alpha 系列 AI 智能体家族又多了一个成员——AlphaTensor,这次是用来发现算法。数千年来,算法一直在帮助数学家们进行基本运算。早在很久之前,古埃及人就发明了一种不需要乘法表就能将两个数…

论文学习18-Relation extraction and the influence of automatic named-entity recognition(联合实体关系抽取模型,2007)

文章目录abstract1.introduction3.问题形式化4.系统架构5. 命名实体识别6.关系抽取(核方法)6.1global context kernel6.2 local context kernel6.3 shallow linguistic kernel7实验Giuliano, C., et al. “Relation extraction and the influence of aut…

Nature:进化新方式?线粒体DNA会插入我们的基因组

来源:生物通科学家们惊讶地发现,每4000个新生儿中就有一个会将线粒体中的一些遗传密码插入到我们的DNA中,这为人类的进化方式提供了新见解。剑桥大学和伦敦玛丽女王大学的研究人员表明,线粒体DNA也会出现在一些癌症DNA中&#xff…

论文学习19-Structured prediction models for RNN based sequence labeling in clinical text(LSTM_CRF,2016)

文章目录abstract1. Introduction2.相关工作3.方法3.1 Bi-LSTM (baseline)3.2BiLSTMCRF3.3 BiLSTM_CRF with pairwise modeling3.4 Approximate Skip-chain CRF5.实验Jagannatha, A. and H. Yu “Structured prediction models for RNN based sequence labeling in clinical te…

「深度学习表情动作单元识别」 最新2022研究综述

来源:专知基于深度学习的表情动作单元识别是计算机视觉与情感计算领域的热点课题.每个动作单元描述了一种人脸局部表情动作,其组合可定量地表示任意表情.当前动作单元识别主要面临标签稀缺、特征难捕捉和标签不均衡3个挑战因素. 基于此,本文将…

为什么物理诺奖颁给量子信息科学?——量子信息的过去、现在和未来

导语10月4日,2022年诺贝尔物理学奖授予 Alain Aspect, John F. Clauser 和 Anton Zeilinger,表彰他们“用纠缠光子实验,验证了量子力学违反贝尔不等式,开创了量子信息科学”。他们的研究为基于量子信息的新技术奠定了基础&#xf…

论文学习20-End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF(序列标注,2016ACL

文章目录abstract1.introduction2.Architecture2.1 CNN for Character-level Representation2.2 BiLSTM2.2.1 LSTM单元2.2.2BiLSTM2.3CRF2.4BiLSTM-CNNs-CRF3.训练Ma, X. and E. Hovy “End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF.”abstract 最先进的序列…

可溶解光开关利用光控制神经元

ISTOCK来源:IEEE电气电子工程师大约20年前,出现了一种称为光遗传学的策略,用激光控制大脑活动。它利用病毒将基因插入细胞,使其对光敏感。光遗传学给研究人员提供了一种精确的方法来刺激或抑制大脑回路,并阐明它们在大…

生成式AI无敌了: 大神微调Stable Diffusion,打造神奇宝贝新世界

来源:大数据文摘授权转载自AI科技评论作者:李梅、施方圆编辑:陈彩娴作为一个强大、公开且足够简单的模型,最近大火的 Stable Diffusion 在文本生成图像之外,给了大家无限的创作可能性。最近,来自 Lambda La…

论文学习21-Globally Normalized Transition-Based Neural Networks(2016,标签偏差问题

文章目录abstract1.introduction2.Model2.1 Transition System2.2 全局和局部归一化3.训练3.2标签偏差问题abstract 介绍了一种基于全局规范化转换的神经网络模型,该模型实现了最先进的词性标注、依存分析和句子压缩结果。我们的模型是一个简单的前馈神经网络&#…

推翻单一干细胞理论:哺乳动物大脑中发现了第二种干细胞

来源:生物通在成年哺乳动物的大脑中,神经干细胞保证了新的神经细胞,即神经元的不断形成。这个过程被称为成年神经发生,帮助鼠维持它们的嗅觉。一个研究小组最近在鼠大脑中发现了第二种干细胞群,它主要参与成年鼠嗅球中…

论文阅读课1-Attention Guided Graph Convolutional Networks for Relation Extraction(关系抽取,图卷积,ACL2019,n元)

文章目录abstract1.introduction1.1 dense connectionGCN1.2 效果突出1.3 contribution2.Attention Guided GCNs2.1 GCNs2.2 Attention Guided Layer2.3 Densely Connected Layer2.4 线性层2.5 AGGCN for RE3.实验3.1 数据集3.2 设置3.3 n-ary3.4 句子级4.ablation Study4.相关…

Nat. Rev. Genet. | 通过可解释人工智能从深度学习中获得遗传学见解

编译 | 沈祥振审稿 | 夏忻焱今天为大家介绍的是来自Maxwell W. Libbrecht,Wyeth W. Wasserman和Sara Mostafavi的一篇关于人工智能对于基因组学的可解释性的研究的综述。基于深度学习的人工智能(AI)模型现在代表了基因组学研究中进行功能预测…

复杂系统的逆向工程——通过时间序列重构复杂网络和动力学

导语蛋白质相互作用网络、生态群落、全球气候系统……很多复杂系统都可以抽象为一个相互作用的网络和其上的动力学。传统的研究主要关注在如何构建网络动力学模型,从而产生和实验观测数据具有相似统计特征的结果。所谓的复杂系统逆向工程,就是反其道而行…

关系提取论文总结

文章目录1.模型总结1.1 基于序列的方法1.2 dependency-based(基于依赖的)(有图)1.2.2 句间关系抽取1.5 自动学习特征的方法1.4 联合抽取模型1.6 RNN/CNN/GCN用于关系提取1.7 远程监督1.8句子级关系提取1.9MCR(阅读理解&#xff09…

邬贺铨:“物超人”具有里程碑意义,五方面仍需发力

来源:人民邮电报作者:邬贺铨我国正式迈入“物超人”时代。据工业和信息化部最新数据显示,截至8月末,我国三家基础电信企业发展移动物联网终端用户16.98亿户,成为全球主要经济体中率先实现“物超人”的国家。“物超人”…