来源:芯师爷
人工智能的崛起主要得益于算法、数据和计算能力三方面的突破,这三方面的能力展现离不开AI芯片。由此,AI芯片的研发制造成了人工智能技术发展过程中的关键环节。
不同于其它传统芯片,AI芯片是近年新兴产品,拥有强大市场需求的中国一直对AI芯片的发展寄予厚望,希望在这个新的技术领域中能占领优先发展位置,缩短与半导体发达国家的距离。
截止中商产业研究院在今年上半年发布的《2019年中国IC设计行业投资前景研究报告》显示,彼时中国的AI芯片创企已经超过20家。
2019年,芯师爷发起了“硬核中国芯”评选活动,旨在推动国产芯片应用。本次评选中,AI类别共有11家企业入选参评“硬核中国芯——2019年度最佳国产AI芯片产品奖”,本文盘点了入选企业的十一款AI芯片产品,希望能为“国产替代”选型提供AI芯片选择。
(注:以下排序仅为介绍产品,不代表评选名次)
1
虎贲T710
紫光展锐
虎贲T710采用8核CPU架构,由4颗2.0GHz的Arm Cortex-A75及4颗1.8GHz的Arm Cortex-A55组成,搭载工作频率为 800MHz 的IMG PowerVR GM 9446 图形处理器。虎贲T710包含了 CPU、GPU、NPU、ISP、VDSP等处理单元,为各类丰富的AI应用提供了高效能、低功耗的技术基础。
2019年7月,苏黎世联邦理工学院AI Benchmark公布了AI芯片算力排行榜,排名第一是紫光展锐虎贲T710,28097分;
除了架构和算力,虎贲T710在能效和商用成熟度上也领先业界,其中:能效 ≥ 2.5TOPS/W,超过业界平均水平30%;支持多种AI训练框架, 如TensorFlow、TensorFlow Lite、Caffe……;支持多种AI模型量化方式,包括INT4、INT8、INT16和FP16……;支持Android NN,并且提供紫光展锐自研SDK,使第三方应用程序更高效部署AI功能。
此外,虎贲T710还整合了如4K@30fps编解码,802.11AC,BT 5.0等强大的多媒体能力和先进的无线通信能力。
2
DeepEye1000
云天励飞
云天励飞芯片平台-Moss于2018年推出了第二代自主知识产权的人工智能芯片DeepEye1000。DeepEye1000是一款异构多核视觉分析SoC芯片,内嵌一颗自定义指令集神经网络处理器。
与通用GPU相比,DeepEye1000单位性能提升20倍,单位能效提升100倍,系统时延降低200倍,具有低功耗、高能效、智升级、可编程等特点,可广泛用于摄像机、机器人、无人机,以及数字城市、新零售等场景,实现视觉AI城市大脑终端摄像机的安全、独立、自主、可控。
3
思元270
寒武纪
思元270芯片集成了寒武纪在处理器架构领域的一系列创新性技术,理论峰值性能达到每秒128万亿次人工智能基本运算(INT8);同时兼容INT4和INT16运算,理论峰值分别达到每秒256万亿次和64万亿次;思元270采用寒武纪公司自主研发的MLUv02指令集,可支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用。
理论峰值性能提升4倍,思元270集成了120亿个晶体管,处理稠密机器学习模型的理论峰值性能提升至上一代思元100的4倍,达到128万亿次(INT8)。定点训练领域取得关键性突破 在定点训练领域取得关键性突破。
4
XS2001
芯声智能
XS2001是一款专用的离线语音识别前端芯片,它兼顾了超低功耗和近/远场识别高强度计算的两方面需求。
一方面,低功耗芯片技术和人工智能算法支持Always-on唤醒模式,唤醒功耗小于0.8mW;另一方面,内部有可编程低功耗的神经网络计算引擎和支持SIMD功能的CPU(基于RISC-V架构),以及丰富的内存资源,最高频率可达150MHZ。最高同时支持4个模拟(或数字)MIC输入。
芯片自带AGC,AEC,波速成型,去混响,复杂降噪算法,语音识别等超过10种自有知识产权的音频算法。当前产品已经与数个主流平台厂商、ODM以及众多终端厂商完成了design-in。广泛应用于TWS耳机,手机,智能家居,智慧照明等领域。
5
雨燕(Swift)
云知声
云知声耗时近3年,打造了全球首款面向物联网的AI芯片UniOne,并于2018年5月16日发布了第一代UniOne芯片及其解决方案——雨燕(Swift)。
该芯片由云知声自主设计研发,采用云知声自主AI指令集,拥有具备完整自主知识产权的DeepNet、uDSP(数字信号处理器),支持DNN/LSTM/CNN等多种深度神经网络模型,性能较通用方案提升超50倍。
发布芯片四个月后,云知声便选择将基于UniOne雨燕的解决方案进行开源,于9月12日以“芯玩家”为主题发布了智能家居、智能音箱的两套标杆解决方案。通过云端芯结合,提供给客户与合作伙伴面向具体场景的软硬件Turn-key解决方案。
6
求索(QuestCore)
依图科技
求索(QuestCore)是全球首款云端视觉AI芯片,也是目前性价比最高的云端AI推理芯片。设计和制造全部在国内完成,加速高端处理器芯片自主可控进程。
单芯片支持50路高清视频实时全解析,单路摄像头功耗仅为NVIDIA Tesla P4的30%,AI计算能效比是先进GPU方案的5-10倍。
基于拥有自主知识产权的神经网络加速核ManyCore,SoC设计,可不依赖Intel x86 CPU在云端独立运行,本身即是一颗具有完整端到端业务处理能力的异构运算处理器,平衡了传统的CPU计算、AI计算、存储和片上数据传输,灵活可扩展的架构使其能兼顾云端和边缘的视觉推理需求。
7
征程二代
地平线
地平线推出了中国首款车规级AI芯片——征程二代,征程二代芯片基于地平线自主研发的高性能计算架构BPU2.0,于2019年初流片成功,并已实现量产。目前,征程二代的开发套件已完全准备就绪,可支持客户直接进行产品设计。
搭载地平线自主创新研发的高性能计算架构BPU2.0(Brain Processing Unit),可提供超过4 TOPS的等效算力,典型功耗仅2瓦。征程二代能够高效灵活地实现多类AI任务处理,对多类目标进行实时检测和精准识别,可全面满足自动驾驶视觉感知、视觉建图定位、视觉ADAS等智能驾驶场景的需求,以及语音识别,眼球跟踪,手势识别等智能人机交互的功能需求,充分体现BPU架构强大的灵活性,全方位赋能汽车智能化。
8
太行语音芯片:TH1520
深聪智能
TH1520是深聪智能根据语音交互市场及算法的需求和发展方向,定义开发的“芯片+算法”人工智能人机语音交互解决方案,具有高性能、低功耗等特点。
技术亮点
A)体验好:最高支持六麦克风拾音,抗干扰能力强,反应迅速,唤醒率高;
B)低功耗:毫瓦级待机功耗,百毫瓦级全速工作功耗,适用于可移动设备。
C)离线识别:支持全离线识别,可离线识别多达100条指令;
D)快速部署:芯片内置算法,可定制关键词并快速部署于各类设备;
E)灵活适用:支持多种布置方案,可满足各种IOT产品的需求。
9
人工智能语音芯片CI110X系列
启英泰伦
2019年9月,由启英泰伦自主研发的人工智能语音芯片CI110X系列正式发布。该系列芯片基于NPU+MCU架构设计,是行业首款降噪识别一体的多核人工智能语音专用芯片。
在架构、技术方面,CI110X系列芯片实现了多项创新。
① 自主研发脑神经网络处理器核( BNPU),可支持64个神经元节点的并行计算,计算能力大大提高;
② 自主研发降噪等硬件算法模块,可实现噪声抑制、混响消除、回声消除、声纹识别、波束成形,声源定位等丰富功能,另还加持了公司自主研发的新一代本地命令词自学习技术;
③ 高度集成:集成 Audio Codec 模块,硬件音频处理模块,多路 UART、I2C、SPI、PWM、GPIO、SDIO 等外围接口,极大降低了方案模组的硬件成本;
④ 采用特色低功耗技术,其功耗相对于采用CPU计算的软件方案下降20倍左右。
10
GP8300
华夏芯
GP8300实现了在华夏芯自主Unity ISA指令集下,CPU、DSP、GSNN在异构计算架构下的缓存共享实现,达到了真正意义上的异构计算。由于GP8300 SoC上的CPU、DSP、GSNN都采用了华夏芯统一的Unity ISA指令集,使得整个系统的运行功耗非常低,运行效率非常高。如在Tiny YOLO环境下,GP8300的识别速度可达60FPS。同档位的英伟达TX2识别速度只有17~18FPS。
GP8300采用华夏芯全自主知识产权、4核64位超标量CPU:采用三发射、乱序猜测、动态多级流水线架构,包含 MMU,运行频率2GHz@28nm,标量(IU & FU) 计算:支持64位整数指令,支持半精度(16位)、单精度(32位)和双精度(64位)浮点指令;具有可变长向量(VLV)计算单元:向量寄存器长度1KB,向量计算宽度256位,支持8/16/32位整数、半精度 (16位)浮点数据类型,运行频率2GHz@28nm;采用AI专用处理器内核:华夏芯全自主知识产权、双核 AI计算处理器,采用可编程RISC架构异步多核架构。
11
星空加速卡
鲲云科技
星空加速卡是一款面向服务器端进行深度学习推断的计算加速卡,基于鲲云自主研发的定制数据流架构CAISA 2.0,可实现76%~98%的芯片利用率。在同等峰值芯片性能情况下,鲲云的产品为人工智能应用提供更高的算力支撑。
鲲云的星空加速卡基于其自主研发的定制数据流CAISA架构和端到端自动编译工具链RainBuilder。该架构不同于传统的指令集的架构方式,采用数据流的方式,摆脱对于数据的依赖性,避免过多与运算无关的资源浪费,最大化利用硬件资源,性能实现线性增长;同时专为CAISA架构设计的RainBuilder编译工具链支持TensorFlow、Caffe及ONNX等主流框架下深度学习算法无缝链接,提供从算法模型到芯片级算法部署的一整套开发套件,保证了其通用性和易用性。
CAISA硬件架构与RainBuilder编译器结合,使鲲云产品在达到高效能的同时具有高拓展性,为人工智能算法的快速应用落地提供高性能算力支撑。
以上十一款参评AI芯片产品,现已经过18天20万电子工程师线上评选+30位资深业内人士线下评分。综合所有评分,本次评选最终结果将于12月19日在会展中心1号展馆1B会议厅举办的“2019硬核中国芯领袖峰会暨颁奖盛典”中揭晓,欢迎半导体行业人士报名,现场共同见证中国芯片的崛起。
若您也有国产AI芯片推荐,也可以在评论区以“公司+产品名称+产品简介”格式展示产品,如:紫光展锐,虎贲T710:该芯片......
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”