中国国产AI芯片的崛起

一、CUDA的垄断

        当讨论半导体行业面临的挑战时,你首先想到的是什么?光刻机?3纳米或者5纳米技术?我们无法生产的完美方形芯片?是的,但也不完全是。

        人们经常把半导体芯片归类为硬件产业,但实际上,半导体芯片是一个硬件和软件高度融合的产业,而且软件往往发挥更重要的作用。

        芯片的硬件是指运行指令的物理平台,包括处理器、内存、存储设备等。“晶体管数量”和“7 纳米工艺”等与芯片相关的术语就是硬件参数的示例。

        另一方面,软件包括固件、驱动程序、操作系统、应用程序、运算符、编译器、开发工具、模型优化、部署工具和应用程序生态系统等。软件指导硬件如何响应用户指令、处理数据和任务,同时通过特定算法和策略优化硬件资源的使用。“x86 指令集”、“深度学习运算符”和“CUDA 平台”等术语通常与芯片软件有关。

        没有硬件,软件就无法运行。然而,没有软件,硬件只是一堆毫无意义的硅片。

        2012年,随着深度学习与GPU的结合在ImageNet大赛上大放异彩,人工智能一夜之间风靡全球,科技界开始将目光聚焦人工智能领域,深耕CUDA人工智能计算平台的英伟达股价一路飙升,成为新时代的主导力量。

        然而,软件将成为人工智能时代的核心技术壁垒。

        为了打破 Nvidia 的垄断,前芯片老大英特尔和老对手 AMD 分别推出了 OneAPI 和 ROCm,与 CUDA 展开竞争。Linux 基金会联合英特尔、谷歌、高通、Arm、三星等公司成立了 UXL 基金会(俗称“反 CUDA 联盟”),致力于开发一套新的开源软件套件,让 AI 开发者可以在任何成员公司的芯片上进行编程,试图取代 CUDA 成为首选的 AI 开发平台。

        相反,Nvidia 一直在巩固其 CUDA 护城河。

        早在 2021 年,Nvidia 就公开表示禁止使用转换层在其他硬件平台上运行基于 CUDA 的软件,并于 2024 年 3 月将此升级为彻底禁止,直接在 CUDA 的最终用户许可协议中添加条款。

        对于中国用户来说,这项禁令的打击更大。

        2022年,英伟达被要求停止向中国市场供应高端GPU芯片,有效封锁了中国的GPU芯片采购渠道。

        如今其他芯片上运行CUDA软件也被禁止,中国AI企业该怎么办?

二、中国国产AI芯片的崛起

        其实早在禁令颁布之前,中国芯片企业就已做好了准备。2015年,中国人工智能产业蓬勃发展,出现了“人工智能四龙”引领产业发展。

        在这波因对卷积神经网络(CNN)的兴趣而引发的人工智能浪潮中,中国企业认识到了国产人工智能芯片的重要性。

        这一时期,中国涌现出近百家AI芯片企业,既有寒武纪、必任科技、厚墨等创业公司,也有华为、阿里巴巴、百度等科技巨头,以及传统芯片厂商、挖矿设备厂商。

        大家都纷纷加入这股潮流,整个行业蓬勃发展,似乎都有一个共同的目标:打造自主可控的国产AI芯片生态。

        在此推动下,中国AI芯片企业很早就意识到了软件、工具和生态对于芯片的重要性,因此在不断升级迭代硬件产品的同时,投入了大量的时间和精力去解决软件相关的问题。

        CUDA 是一个封闭的软件平台,因此从头开始构建原始软件堆栈是突破 CUDA 生态系统障碍的关键。

三、中国AI芯片软件平台概况

        中国的AI芯片创业公司在云端、边缘端领域蓬勃发展,各有千秋。例如,必韧科技开发了BIRENSUPA软件平台,包括硬件抽象层、编程模型、BRCC编译器、深度学习和通用计算加速库、工具链、支持主流深度学习框架、自研推理加速引擎以及适用于各种场景的应用SDK,是国内为数不多的综合性AI软件开发平台之一。

        此外,专注于云端及车规级AI芯片的寒武纪推出了基础软件平台;专注于集成式智能驾驶芯片的厚墨科技也推出了厚墨大道软件平台;专注于全GPU的摩尔线程推出了MUSA SDK及AI软件平台;专注于通用GPU(GPGPU)的天数芯推出了天数芯软件栈。

        与中国早期白手起家的芯片研究人员不同,当代中国AI芯片玩家大多拥有丰富的行业经验,并了解类似CUDA的软件工具对于AI开发人员的关键重要性。

        因此,在2015年至2022年期间,这些玩家努力构建自己的硬件和软件生态系统。他们设法在国际层面上赶上了一些,尽管他们仍然远远落后于像Nvidia这样的全球巨头,但Nvidia并没有闲着,而是利用其在深度学习方面的专业性巩固了自己的地位。

        然而谁也没有想到,新的变革契机这么快就到来了,2022年11月,ChatGPT横空出世,再一次打破了行业的平衡。

四、大型模型是天赐的机会吗?

        2022年11月,随着ChatGPT在全球引起轰动,大型语言模型(LLM)突然成为全球追捧的前沿技术,热度远超CNN。

        对于一些中国AI芯片制造商来说,这被视为赶上竞争潮流的天赐良机。

        更加有利的是,LLM的技术基础是Transformer网络,其最初有BERT、T5、GPT三条不同的路径。

        然而,自从ChatGPT的惊艳亮相后,GPT已经成为了绝对的主流,引领全球AI产业走向统一的认识。

        在AI技术发展史上,如此程度的团结几乎是闻所未闻的。

        CUDA的先发优势因此而突然缩小。

        正是因为这种快速的融合,中国AI芯片厂商才得以快速上手对大型模型进行调优和适配,更重​​要的是,此时他们已经可以与其他国际厂商在同一起跑线上。

        目前,在Nvidia严禁在其他AI芯片硬件平台上运行CUDA,加之美国芯片禁令进一步加重、全球算力紧缺的背景下,中国大模型软件公司难以获得最前沿的GPU芯片,因此如何将现有的大模型迁移到新的计算平台上成为首要解决的痛点。

        鉴于大模型训练对计算集群的迫切需求,国内AI芯片企业正致力于加强集群能力。以采用GPGPU架构的璧人为例,客户反馈璧人的SUPA在软件团队的支持下,短时间内完成了实际应用迁移,在主流开源大模型上的表现也呈现出良好的效果。

        如果AI芯片厂商能够提供简单易用、低成本的迁移工具,有完善的模型适配能力以及成熟的集群部署经验,那么大模型的快速落地就变得可行。

        包括必韧在内的多家中国公司已完成对国内大部分开源大模型的适配,积累了丰富的千卡集群部署经验,中国大模型合作伙伴自研模型适配时间已大幅缩短。除了帮助用户快速从CUDA迁移到SUPA生态之外,大型模型公司还可以利用Biren的架构特性和SUPA的能力来扩展CUDA生态,进一步提升性能。

        通过自下而上的开发,Biren 可以最大限度地发挥其硬件优势,确保无论硬件到终端应用程序如何变化,其软件堆栈始终能够进行优化、迭代和调整。

        当前,除了芯片层面,大机型软件、算力、云计算等层面的国产化也在积极推进。

        AI芯片公司作为整个AI生态的基础构建者,寻求与大型模型、框架、集群公司进行深度合作,以最大化整体性能。

        例如,必韧科技不仅与PaddlePaddle等框架开发商合作,不仅满足企业用户符合国际标准的开发需求,还专门定制了与国内环境兼容的解决方案,为中国AI企业提供更为顺畅的融入之路。

        同时,必韧还与Infinigence等中国算力优化公司达成合作,进一步高效推动AI计算的本土化发展。

        为破解生态瓶颈,璧人通过搭建算力平台、开源相关工具和库、开放上层模型等方式推进软件平台建设,与框架、大模型合作伙伴进行联合适配优化,建立生态合作,并通过与高校、科研机构、终端客户等开展产学研合作等多种方式推进落地。

        软件无疑是最难突破的一道坎,也是目前各大AI芯片公司的共识重点。通过产学研的共同努力,一定可以取得突破。例如浙江大学的AI教学平台Mo,就利用比人软硬件资源作为教学实践的基础,为学生提供实践机会,为国产软件生态的长远发展播下种子。

五、结论

        毫无疑问,算力已成为人工智能时代的战场,算力的严重短缺制约着各国人工智能技术的发展。

        据报道,OpenAI首席执行官Sam Altman曾表示,“计算能力将成为未来的货币”,暗示人工智能的发展将演变为公司、组织甚至国家之间的大规模权力斗争。

        目前,Nvidia的GPU硬件凭借CUDA软件方面的优势,受到市场热捧,长期处于供不应求的状态。而大模型取代深度神经网络成为新一代AI技术的兴起,恰恰给了中国AI芯片玩家一个难得的追赶机会。

        回顾过去二十年,英伟达之所以能主宰AI时代,得益于其在AI领域的先发优势,借助深度学习的浪潮,凭借CUDA平台取得对英特尔的战略优势。

        如今,一条崭新的道路即将再次出现,但这一次,中国企业已经做好准备。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/39948.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【大模型LLM面试合集】大语言模型基础_llm概念

1.llm概念 1.目前 主流的开源模型体系 有哪些? 目前主流的开源LLM(语言模型)模型体系包括以下几个: GPT(Generative Pre-trained Transformer)系列:由OpenAI发布的一系列基于Transformer架构…

Linux常用查看日志方法-如使用less查看日志文件

在Linux系统中,查看日志文件是常见的运维任务之一。less命令是一个非常强大的工具,用于查看长文本文件,例如日志文件。它允许你按页浏览文件,并提供了一些便捷的导航和搜索功能。 使用less查看日志文件 假设你有一个日志文件/va…

linux环境安装elasticsearch缓存数据库和Kibana客户端

linux环境安装elasticsearch缓存数据库,今天我们安装7.17.18版本,并分析遇到的问题。 一、elasticsearch安装运行 1、直接下载 wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.17.18-linux-x86_64.tar.gz2、解压 tar -…

惊艳眼球的视觉盛宴【二】

当晨光初破黎明的静谧,一片绚烂便悄然铺展在蔚蓝的天际。那一刻,大地苏醒,万物复苏,我们仿佛踏入了一幅活生生的画卷。雾气缭绕之中,群山似乎在低语,古树在轻摇,一切都沐浴在柔和而金黄的光芒之…

如何理解vuex中的每个概念(通俗易懂)

文章目录 1. 什么是 Vuex?2. Vuex 的四个核心概念 1. 什么是 Vuex? 想象一下,你家里有一个大冰箱,所有家庭成员都可以访问这个冰箱。每个人都可以往里面放东西,也可以从里面拿东西。这个冰箱就像是 Vuex 中的“状态”…

战略流程-麦肯锡企业数字化业务变革成熟度评估模型及案例深度解析

一、企业变革成熟度评估模型 企业变革成熟度诊断模型是一种评估工具,用于全面扫描和评估企业在变革转型过程中的能力水平。该模型通过一系列量化指标和定性分析,对企业在不同变革领域的成熟度进行评分,从而帮助企业识别在变革过程中的优势和…

第12天:上下文管理器

今日学习目标 了解上下文管理器的基本概念和作用学习如何使用 with 语句学习如何创建自定义上下文管理器理解上下文管理器的实际应用场景 1. 上下文管理器简介 上下文管理器是一种用于管理资源的机制,它可以在一段代码执行前后自动执行一些操作。最常见的上下文管…

QAM MMA

MMA是改进的CMA,有RCA和CMA的优点,还能对相位误差进行修正。 N 5e5; % 仿真符号数 M 16; % QAM16msg randi([0 M-1],N,1); % 产生随机符号 tx qammod(msg,M); % QAM调制test_snr 20:5:30; …

无畏契约/valorant匹配无反应、无法联机、联机报错的解决办法

无畏契约/valorant是一款热度超高的战术射击游戏,通过其独特的美漫英雄设计和丰富的战术性,以及武器技能设计系统,在全球吸引了不少玩家的加入和喜爱。不过近期伴随第九赛季更新,很多玩家重回服务器,却遇到了匹配无反应…

进程和内存管理 如何检查内存和CPU 内存的使用和剩余情况,当前CPU的负载情况,找进程id,结束某个进程

一、检查内存 方法一:查看/proc/meminfo文件,又被称为伪文件,记录了内存的相关信息,不可用vi/vim打开编辑,可用cat等命令查看。 方法二:free -m 命令 以MB为单位来显示内存情况。 二、检查CPU 方法一…

基于用户的协同过滤算法

目录 原理: 计算相似度: 步骤: 计算方法:Jaccard相似系数、余弦相似度。 推荐 原理: 先“找到相似用户”,再“找到他们喜欢的物品”--->人以群分。即,给用户推荐“和他兴趣相似的其他用…

C语言 输出*的图案(1,3,5,7,5,3,1顺序)

输出以下图案&#xff08;不是直接输出&#xff0c;且要求输出时符号居中对齐&#xff09;。 * *** ***** ******* ***** *** * 这个程序输出一个特定的图案&#xff0c;符号居中对齐。 #include <stdio.h>int main() {int n 4; // 图案的中间行数// 输出上半部分for …

绝地求生PUBG服务器延迟太高 购买领取响应时间长怎么解决

绝地求生PUBG是一款特别热门的射击类吃鸡游戏&#xff0c;游戏还有多张地图可供玩家选择&#xff0c;玩家们需要乘坐飞机空投跳伞至不同的各个角落&#xff0c;赤手空拳寻找武器&#xff0c;车辆以及物资&#xff0c;并在多种多样的地形中展开战斗。想要取得胜利&#xff0c;我…

分享一款可编辑本地电脑文件的在线编辑器

背景 之前见过在线版的VSCode&#xff0c;被惊讶到了。网页上竟然可以编辑电脑本地的文件&#xff0c;打破了网页无法编辑本地电脑文件的限制。一直好奇怎么做的。抽空研究了一下&#xff0c;然后发现其实也不难。 分析 先给大家介绍一下这款在线编辑器的效果。 左侧栏为文件…

彻底解决网络哈希冲突,百度百舸的高性能网络 HPN 落地实践

GPU 的通信性能对于大模型的训练有着至关重要的影响。在 HPN 网络工程实践中&#xff0c;我们的核心关注点是如何充分利用网络硬件资源的能力&#xff0c;将通信性能最大化&#xff0c;从而提升大模型端到端的训练性能。 1 HPN 网络 — AIPod 下图是百度百舸的高性能网络 …

Vue如何使用封装接口

在Vue项目中封装接口&#xff08;API&#xff09;是一个常见的需求&#xff0c;特别是在与后端服务进行交互时。封装接口的目的是为了将请求逻辑与组件逻辑分离&#xff0c;提高代码的可维护性和复用性。以下是一个简单的步骤和示例&#xff0c;说明如何在Vue项目中封装接口。 …

洛谷 P1020 [NOIP1999 提高组] 导弹拦截

题目描述 某国为了防御敌国的导弹袭击&#xff0c;发展出一种导弹拦截系统。但是这种导弹拦截系统有一个缺陷&#xff1a;虽然它的第一发炮弹能够到达任意的高度&#xff0c;但是以后每一发炮弹都不能高于前一发的高度。某天&#xff0c;雷达捕捉到敌国的导弹来袭。由于该系统…

下拉菜单显示年份选项(月份也适用)

项目场景&#xff1a; 下拉菜单显示年份选项&#xff08;月份也适用&#xff09; 前段语言Vue 问题描述 在列表的搜索栏常常需要提供年份、月份选择&#xff0c;此文记录一种简单的年份下拉菜单的展示方式&#xff1a; <el-form-item label"年份" prop"yea…

战略资讯 | TapData 牵手思想科技,开启数据管理新篇章!

在这个数字化飞速发展的时代&#xff0c;数据已成为企业最宝贵的资产之一。为了更好地迎接新时代的诉求与挑战&#xff0c;TapData 现已与思想科技达成了一项具有里程碑意义的战略合作协议。这不仅是两个企业之间的合作&#xff0c;更是对整个数据管理行业的一次重大推动。 思…

兴业严选|北京市户籍 多子女家庭买二套房个贷算首套

6月26日&#xff0c;北京市住房和城乡建设委员会、中国人民银行北京市分行、国家金融监督管理总局北京监管局、北京住房公积金管理中心联合印发《关于优化本市房地产市场平稳健康发展政策措施的通知》。 明确支持多子女家庭改善性住房需求&#xff0c;对北京市户籍二孩及以上的…