国产AI全面崛起！盘点11款2019年热门国产AI芯片

来源：芯师爷

人工智能的崛起主要得益于算法、数据和计算能力三方面的突破，这三方面的能力展现离不开AI芯片。由此，AI芯片的研发制造成了人工智能技术发展过程中的关键环节。

不同于其它传统芯片，AI芯片是近年新兴产品，拥有强大市场需求的中国一直对AI芯片的发展寄予厚望，希望在这个新的技术领域中能占领优先发展位置，缩短与半导体发达国家的距离。

截止中商产业研究院在今年上半年发布的《2019年中国IC设计行业投资前景研究报告》显示，彼时中国的AI芯片创企已经超过20家。

2019年，芯师爷发起了“硬核中国芯”评选活动，旨在推动国产芯片应用。本次评选中，AI类别共有11家企业入选参评“硬核中国芯——2019年度最佳国产AI芯片产品奖”，本文盘点了入选企业的十一款AI芯片产品，希望能为“国产替代”选型提供AI芯片选择。

（注：以下排序仅为介绍产品，不代表评选名次）

虎贲T710

紫光展锐

虎贲T710采用8核CPU架构，由4颗2.0GHz的Arm Cortex-A75及4颗1.8GHz的Arm Cortex-A55组成，搭载工作频率为 800MHz 的IMG PowerVR GM 9446 图形处理器。虎贲T710包含了 CPU、GPU、NPU、ISP、VDSP等处理单元，为各类丰富的AI应用提供了高效能、低功耗的技术基础。

2019年7月，苏黎世联邦理工学院AI Benchmark公布了AI芯片算力排行榜，排名第一是紫光展锐虎贲T710，28097分；

除了架构和算力，虎贲T710在能效和商用成熟度上也领先业界，其中：能效 ≥ 2.5TOPS/W，超过业界平均水平30%；支持多种AI训练框架，如TensorFlow、TensorFlow Lite、Caffe……；支持多种AI模型量化方式，包括INT4、INT8、INT16和FP16……；支持Android NN，并且提供紫光展锐自研SDK，使第三方应用程序更高效部署AI功能。

此外，虎贲T710还整合了如4K@30fps编解码，802.11AC，BT 5.0等强大的多媒体能力和先进的无线通信能力。

DeepEye1000

云天励飞

云天励飞芯片平台-Moss于2018年推出了第二代自主知识产权的人工智能芯片DeepEye1000。DeepEye1000是一款异构多核视觉分析SoC芯片，内嵌一颗自定义指令集神经网络处理器。

与通用GPU相比，DeepEye1000单位性能提升20倍，单位能效提升100倍，系统时延降低200倍，具有低功耗、高能效、智升级、可编程等特点，可广泛用于摄像机、机器人、无人机，以及数字城市、新零售等场景，实现视觉AI城市大脑终端摄像机的安全、独立、自主、可控。

思元270

寒武纪

寒武纪.jpg

思元270芯片集成了寒武纪在处理器架构领域的一系列创新性技术，理论峰值性能达到每秒128万亿次人工智能基本运算（INT8）；同时兼容INT4和INT16运算，理论峰值分别达到每秒256万亿次和64万亿次；思元270采用寒武纪公司自主研发的MLUv02指令集，可支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用。

理论峰值性能提升4倍，思元270集成了120亿个晶体管，处理稠密机器学习模型的理论峰值性能提升至上一代思元100的4倍，达到128万亿次（INT8）。定点训练领域取得关键性突破在定点训练领域取得关键性突破。

XS2001

芯声智能

XS2001是一款专用的离线语音识别前端芯片，它兼顾了超低功耗和近/远场识别高强度计算的两方面需求。

一方面，低功耗芯片技术和人工智能算法支持Always-on唤醒模式，唤醒功耗小于0.8mW；另一方面，内部有可编程低功耗的神经网络计算引擎和支持SIMD功能的CPU（基于RISC-V架构），以及丰富的内存资源，最高频率可达150MHZ。最高同时支持4个模拟（或数字）MIC输入。

芯片自带AGC，AEC，波速成型，去混响，复杂降噪算法，语音识别等超过10种自有知识产权的音频算法。当前产品已经与数个主流平台厂商、ODM以及众多终端厂商完成了design-in。广泛应用于TWS耳机，手机，智能家居，智慧照明等领域。

雨燕（Swift）

云知声

云知声耗时近3年，打造了全球首款面向物联网的AI芯片UniOne，并于2018年5月16日发布了第一代UniOne芯片及其解决方案——雨燕（Swift）。

该芯片由云知声自主设计研发，采用云知声自主AI指令集，拥有具备完整自主知识产权的DeepNet、uDSP（数字信号处理器），支持DNN/LSTM/CNN等多种深度神经网络模型，性能较通用方案提升超50倍。

发布芯片四个月后，云知声便选择将基于UniOne雨燕的解决方案进行开源，于9月12日以“芯玩家”为主题发布了智能家居、智能音箱的两套标杆解决方案。通过云端芯结合，提供给客户与合作伙伴面向具体场景的软硬件Turn-key解决方案。

求索（QuestCore）

依图科技

求索（QuestCore）是全球首款云端视觉AI芯片，也是目前性价比最高的云端AI推理芯片。设计和制造全部在国内完成，加速高端处理器芯片自主可控进程。

单芯片支持50路高清视频实时全解析，单路摄像头功耗仅为NVIDIA Tesla P4的30%，AI计算能效比是先进GPU方案的5-10倍。

基于拥有自主知识产权的神经网络加速核ManyCore，SoC设计，可不依赖Intel x86 CPU在云端独立运行，本身即是一颗具有完整端到端业务处理能力的异构运算处理器，平衡了传统的CPU计算、AI计算、存储和片上数据传输，灵活可扩展的架构使其能兼顾云端和边缘的视觉推理需求。

征程二代

地平线

地平线推出了中国首款车规级AI芯片——征程二代，征程二代芯片基于地平线自主研发的高性能计算架构BPU2.0，于2019年初流片成功，并已实现量产。目前，征程二代的开发套件已完全准备就绪，可支持客户直接进行产品设计。

搭载地平线自主创新研发的高性能计算架构BPU2.0（Brain Processing Unit）,可提供超过4 TOPS的等效算力，典型功耗仅2瓦。征程二代能够高效灵活地实现多类AI任务处理，对多类目标进行实时检测和精准识别，可全面满足自动驾驶视觉感知、视觉建图定位、视觉ADAS等智能驾驶场景的需求，以及语音识别，眼球跟踪，手势识别等智能人机交互的功能需求，充分体现BPU架构强大的灵活性，全方位赋能汽车智能化。

太行语音芯片：TH1520

深聪智能

TH1520是深聪智能根据语音交互市场及算法的需求和发展方向，定义开发的“芯片+算法”人工智能人机语音交互解决方案，具有高性能、低功耗等特点。

技术亮点

A）体验好：最高支持六麦克风拾音，抗干扰能力强，反应迅速，唤醒率高；

B）低功耗：毫瓦级待机功耗，百毫瓦级全速工作功耗，适用于可移动设备。

C）离线识别：支持全离线识别，可离线识别多达100条指令；

D）快速部署：芯片内置算法，可定制关键词并快速部署于各类设备；

E）灵活适用：支持多种布置方案，可满足各种IOT产品的需求。

人工智能语音芯片CI110X系列

启英泰伦

2019年9月，由启英泰伦自主研发的人工智能语音芯片CI110X系列正式发布。该系列芯片基于NPU+MCU架构设计，是行业首款降噪识别一体的多核人工智能语音专用芯片。

在架构、技术方面，CI110X系列芯片实现了多项创新。

① 自主研发脑神经网络处理器核（ BNPU），可支持64个神经元节点的并行计算，计算能力大大提高；

② 自主研发降噪等硬件算法模块，可实现噪声抑制、混响消除、回声消除、声纹识别、波束成形，声源定位等丰富功能，另还加持了公司自主研发的新一代本地命令词自学习技术；

③ 高度集成：集成 Audio Codec 模块，硬件音频处理模块，多路 UART、I2C、SPI、PWM、GPIO、SDIO 等外围接口，极大降低了方案模组的硬件成本；

④ 采用特色低功耗技术，其功耗相对于采用CPU计算的软件方案下降20倍左右。

GP8300

华夏芯

GP8300实现了在华夏芯自主Unity ISA指令集下，CPU、DSP、GSNN在异构计算架构下的缓存共享实现，达到了真正意义上的异构计算。由于GP8300 SoC上的CPU、DSP、GSNN都采用了华夏芯统一的Unity ISA指令集，使得整个系统的运行功耗非常低，运行效率非常高。如在Tiny YOLO环境下，GP8300的识别速度可达60FPS。同档位的英伟达TX2识别速度只有17~18FPS。

GP8300采用华夏芯全自主知识产权、4核64位超标量CPU：采用三发射、乱序猜测、动态多级流水线架构，包含 MMU，运行频率2GHz@28nm，标量（IU & FU）计算：支持64位整数指令，支持半精度(16位)、单精度(32位)和双精度(64位)浮点指令；具有可变长向量(VLV)计算单元：向量寄存器长度1KB，向量计算宽度256位，支持8/16/32位整数、半精度 (16位)浮点数据类型，运行频率2GHz@28nm；采用AI专用处理器内核：华夏芯全自主知识产权、双核 AI计算处理器，采用可编程RISC架构异步多核架构。

星空加速卡

鲲云科技

星空加速卡是一款面向服务器端进行深度学习推断的计算加速卡，基于鲲云自主研发的定制数据流架构CAISA 2.0，可实现76%~98%的芯片利用率。在同等峰值芯片性能情况下，鲲云的产品为人工智能应用提供更高的算力支撑。

鲲云的星空加速卡基于其自主研发的定制数据流CAISA架构和端到端自动编译工具链RainBuilder。该架构不同于传统的指令集的架构方式，采用数据流的方式，摆脱对于数据的依赖性，避免过多与运算无关的资源浪费，最大化利用硬件资源，性能实现线性增长；同时专为CAISA架构设计的RainBuilder编译工具链支持TensorFlow、Caffe及ONNX等主流框架下深度学习算法无缝链接，提供从算法模型到芯片级算法部署的一整套开发套件，保证了其通用性和易用性。

CAISA硬件架构与RainBuilder编译器结合，使鲲云产品在达到高效能的同时具有高拓展性，为人工智能算法的快速应用落地提供高性能算力支撑。

以上十一款参评AI芯片产品，现已经过18天20万电子工程师线上评选+30位资深业内人士线下评分。综合所有评分，本次评选最终结果将于12月19日在会展中心1号展馆1B会议厅举办的“2019硬核中国芯领袖峰会暨颁奖盛典”中揭晓，欢迎半导体行业人士报名，现场共同见证中国芯片的崛起。