每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
亚马逊正准备推出其最新的人工智能芯片,以实现其在半导体领域数十亿美元的投资回报,同时减少对市场领导者英伟达的依赖。亚马逊云计算部门的高管们正大力投入定制芯片,旨在提高其众多数据中心的效率,从而降低亚马逊及其云服务客户的成本。
负责这项工作的主要是安纳普尔纳实验室(Annapurna Labs),这家位于奥斯汀的芯片初创公司于2015年初被亚马逊以3.5亿美元收购。下月,亚马逊将推出最新的“Trainium 2”芯片,这款专为训练大型人工智能模型设计的芯片预计会被广泛应用。目前,Trainium 2已在亚马逊支持的竞争公司Anthropic,以及Databricks、德国电信、日本理光和Stockmark等公司中进行测试。
亚马逊网络服务(AWS)和Annapurna的目标是挑战英伟达的地位,后者因在人工智能处理器市场上的统治地位,成为了全球最有价值的公司之一。AWS的计算和网络服务副总裁戴夫·布朗表示,他们希望成为运行英伟达技术的最佳平台,但同时认为市场上有替代选择是健康的。亚马逊还提到,其另一款AI芯片系列Inferentia在生成AI模型响应方面,运行成本已低于英伟达,节省了40%。
由于机器学习和人工智能的计算需求巨大,布朗解释道,云计算成本尤其在这些领域容易增加,节省40%的费用在小额预算中影响不大,但对数千万美元的支出则有显著意义。
亚马逊预计2024年在资本支出上将达到约750亿美元,主要用于技术基础设施,而在最近的财报电话会议上,首席执行官安迪·贾西透露,这一支出可能在2025年进一步增加。2023年,亚马逊在全年支出方面为484亿美元,与之相比,这一增长尤为显著。微软和谷歌等主要云计算供应商也在加大AI领域的投入,显现出持续不断的技术竞争态势。
亚马逊、微软和Meta都是英伟达的重要客户,但同时也在设计各自的数据中心芯片,以打造未来AI增长的基础。据The Futurum Group的丹尼尔·纽曼分析,目前几乎所有主要云服务供应商都在积极构建更加垂直整合的芯片技术栈,降低生产成本、提高利润率、增强可控性等因素成为主流需求。
Annapurna的工程总监拉米·辛诺指出,亚马逊的AI基础设施是从芯片的生产到安装服务器机架的全流程一体化设计,以自有软件和架构为支撑。“达到我们这种规模的难度很大,能够做到的公司屈指可数。”
安纳普尔纳起初为AWS打造了一款名为Nitro的安全芯片,随后开发了多代Graviton系列,这种基于Arm架构的CPU提供了比传统服务器芯片更低功耗的选择。TechInsights分析师G·丹·赫奇森指出,AWS的芯片有助于降低功耗,提高数据中心效率,从而降低运营成本。如果将英伟达的GPU比作通用型的多功能车,那么亚马逊的芯片则更像是为特定任务优化的小型轿车。
不过,目前AWS和Annapurna在AI基础设施市场上对英伟达的影响仍然有限。英伟达在2024财年第二季度的AI数据中心芯片销售收入达263亿美元,这一数字与亚马逊AWS部门的总收入持平,而AWS客户中用于AI的部分还只占较小比例。
在芯片性能上,AWS避免直接与英伟达进行对比,也未提交独立的性能测试报告。芯片咨询公司Moor Insights & Strategy的专家帕特里克·穆尔黑德认为,亚马逊在Trainium 1和Trainium 2之间实现了4倍性能提升,但相较于性能数字,客户能够有更多选择可能更加重要。