国产AI全面崛起!盘点11款2019年热门国产AI芯片

来源:芯师爷

人工智能的崛起主要得益于算法、数据和计算能力三方面的突破,这三方面的能力展现离不开AI芯片。由此,AI芯片的研发制造成了人工智能技术发展过程中的关键环节。

不同于其它传统芯片,AI芯片是近年新兴产品,拥有强大市场需求的中国一直对AI芯片的发展寄予厚望,希望在这个新的技术领域中能占领优先发展位置,缩短与半导体发达国家的距离。

截止中商产业研究院在今年上半年发布的《2019年中国IC设计行业投资前景研究报告》显示,彼时中国的AI芯片创企已经超过20家。

2019年,芯师爷发起了“硬核中国芯”评选活动,旨在推动国产芯片应用。本次评选中,AI类别共有11家企业入选参评“硬核中国芯——2019年度最佳国产AI芯片产品奖”,本文盘点了入选企业的十一款AI芯片产品,希望能为“国产替代”选型提供AI芯片选择。

(注:以下排序仅为介绍产品,不代表评选名次)

1

虎贲T710

紫光展锐

虎贲T710采用8核CPU架构,由4颗2.0GHz的Arm Cortex-A75及4颗1.8GHz的Arm Cortex-A55组成,搭载工作频率为 800MHz 的IMG PowerVR GM 9446 图形处理器。虎贲T710包含了 CPU、GPU、NPU、ISP、VDSP等处理单元,为各类丰富的AI应用提供了高效能、低功耗的技术基础。

2019年7月,苏黎世联邦理工学院AI Benchmark公布了AI芯片算力排行榜,排名第一是紫光展锐虎贲T710,28097分;

除了架构和算力,虎贲T710在能效和商用成熟度上也领先业界,其中:能效 ≥ 2.5TOPS/W,超过业界平均水平30%;支持多种AI训练框架, 如TensorFlow、TensorFlow Lite、Caffe……;支持多种AI模型量化方式,包括INT4、INT8、INT16和FP16……;支持Android NN,并且提供紫光展锐自研SDK,使第三方应用程序更高效部署AI功能。

此外,虎贲T710还整合了如4K@30fps编解码,802.11AC,BT 5.0等强大的多媒体能力和先进的无线通信能力。

2

DeepEye1000

云天励飞

云天励飞芯片平台-Moss于2018年推出了第二代自主知识产权的人工智能芯片DeepEye1000。DeepEye1000是一款异构多核视觉分析SoC芯片,内嵌一颗自定义指令集神经网络处理器。

与通用GPU相比,DeepEye1000单位性能提升20倍,单位能效提升100倍,系统时延降低200倍,具有低功耗、高能效、智升级、可编程等特点,可广泛用于摄像机、机器人、无人机,以及数字城市、新零售等场景,实现视觉AI城市大脑终端摄像机的安全、独立、自主、可控。

3

思元270

寒武纪

思元270芯片集成了寒武纪在处理器架构领域的一系列创新性技术,理论峰值性能达到每秒128万亿次人工智能基本运算(INT8);同时兼容INT4和INT16运算,理论峰值分别达到每秒256万亿次和64万亿次;思元270采用寒武纪公司自主研发的MLUv02指令集,可支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用。

 理论峰值性能提升4倍,思元270集成了120亿个晶体管,处理稠密机器学习模型的理论峰值性能提升至上一代思元100的4倍,达到128万亿次(INT8)。定点训练领域取得关键性突破 在定点训练领域取得关键性突破。

4

XS2001

芯声智能

XS2001是一款专用的离线语音识别前端芯片,它兼顾了超低功耗和近/远场识别高强度计算的两方面需求。

一方面,低功耗芯片技术和人工智能算法支持Always-on唤醒模式,唤醒功耗小于0.8mW;另一方面,内部有可编程低功耗的神经网络计算引擎和支持SIMD功能的CPU(基于RISC-V架构),以及丰富的内存资源,最高频率可达150MHZ。最高同时支持4个模拟(或数字)MIC输入。

芯片自带AGC,AEC,波速成型,去混响,复杂降噪算法,语音识别等超过10种自有知识产权的音频算法。当前产品已经与数个主流平台厂商、ODM以及众多终端厂商完成了design-in。广泛应用于TWS耳机,手机,智能家居,智慧照明等领域。

5

雨燕(Swift)

云知声

云知声耗时近3年,打造了全球首款面向物联网的AI芯片UniOne,并于2018年5月16日发布了第一代UniOne芯片及其解决方案——雨燕(Swift)。

该芯片由云知声自主设计研发,采用云知声自主AI指令集,拥有具备完整自主知识产权的DeepNet、uDSP(数字信号处理器),支持DNN/LSTM/CNN等多种深度神经网络模型,性能较通用方案提升超50倍。 

发布芯片四个月后,云知声便选择将基于UniOne雨燕的解决方案进行开源,于9月12日以“芯玩家”为主题发布了智能家居、智能音箱的两套标杆解决方案。通过云端芯结合,提供给客户与合作伙伴面向具体场景的软硬件Turn-key解决方案。

6

求索(QuestCore)

依图科技

 

求索(QuestCore)是全球首款云端视觉AI芯片,也是目前性价比最高的云端AI推理芯片。设计和制造全部在国内完成,加速高端处理器芯片自主可控进程。

单芯片支持50路高清视频实时全解析,单路摄像头功耗仅为NVIDIA Tesla P4的30%,AI计算能效比是先进GPU方案的5-10倍。

基于拥有自主知识产权的神经网络加速核ManyCore,SoC设计,可不依赖Intel x86 CPU在云端独立运行,本身即是一颗具有完整端到端业务处理能力的异构运算处理器,平衡了传统的CPU计算、AI计算、存储和片上数据传输,灵活可扩展的架构使其能兼顾云端和边缘的视觉推理需求。

7

征程二代

地平线

 

地平线推出了中国首款车规级AI芯片——征程二代,征程二代芯片基于地平线自主研发的高性能计算架构BPU2.0,于2019年初流片成功,并已实现量产。目前,征程二代的开发套件已完全准备就绪,可支持客户直接进行产品设计。

搭载地平线自主创新研发的高性能计算架构BPU2.0(Brain Processing Unit),可提供超过4 TOPS的等效算力,典型功耗仅2瓦。征程二代能够高效灵活地实现多类AI任务处理,对多类目标进行实时检测和精准识别,可全面满足自动驾驶视觉感知、视觉建图定位、视觉ADAS等智能驾驶场景的需求,以及语音识别,眼球跟踪,手势识别等智能人机交互的功能需求,充分体现BPU架构强大的灵活性,全方位赋能汽车智能化。

8

太行语音芯片:TH1520

深聪智能

 

TH1520是深聪智能根据语音交互市场及算法的需求和发展方向,定义开发的“芯片+算法”人工智能人机语音交互解决方案,具有高性能、低功耗等特点。

技术亮点

A)体验好:最高支持六麦克风拾音,抗干扰能力强,反应迅速,唤醒率高;

B)低功耗:毫瓦级待机功耗,百毫瓦级全速工作功耗,适用于可移动设备。

C)离线识别:支持全离线识别,可离线识别多达100条指令;

D)快速部署:芯片内置算法,可定制关键词并快速部署于各类设备;

E)灵活适用:支持多种布置方案,可满足各种IOT产品的需求。

9

人工智能语音芯片CI110X系列

启英泰伦

2019年9月,由启英泰伦自主研发的人工智能语音芯片CI110X系列正式发布。该系列芯片基于NPU+MCU架构设计,是行业首款降噪识别一体的多核人工智能语音专用芯片。

在架构、技术方面,CI110X系列芯片实现了多项创新。

① 自主研发脑神经网络处理器核( BNPU),可支持64个神经元节点的并行计算,计算能力大大提高;

② 自主研发降噪等硬件算法模块,可实现噪声抑制、混响消除、回声消除、声纹识别、波束成形,声源定位等丰富功能,另还加持了公司自主研发的新一代本地命令词自学习技术;

③ 高度集成:集成 Audio Codec 模块,硬件音频处理模块,多路 UART、I2C、SPI、PWM、GPIO、SDIO 等外围接口,极大降低了方案模组的硬件成本;

④ 采用特色低功耗技术,其功耗相对于采用CPU计算的软件方案下降20倍左右。

  

10

GP8300

华夏芯

GP8300实现了在华夏芯自主Unity ISA指令集下,CPU、DSP、GSNN在异构计算架构下的缓存共享实现,达到了真正意义上的异构计算。由于GP8300 SoC上的CPU、DSP、GSNN都采用了华夏芯统一的Unity ISA指令集,使得整个系统的运行功耗非常低,运行效率非常高。如在Tiny YOLO环境下,GP8300的识别速度可达60FPS。同档位的英伟达TX2识别速度只有17~18FPS。

GP8300采用华夏芯全自主知识产权、4核64位超标量CPU:采用三发射、乱序猜测、动态多级流水线架构,包含 MMU,运行频率2GHz@28nm,标量(IU & FU) 计算:支持64位整数指令,支持半精度(16位)、单精度(32位)和双精度(64位)浮点指令;具有可变长向量(VLV)计算单元:向量寄存器长度1KB,向量计算宽度256位,支持8/16/32位整数、半精度 (16位)浮点数据类型,运行频率2GHz@28nm;采用AI专用处理器内核:华夏芯全自主知识产权、双核 AI计算处理器,采用可编程RISC架构异步多核架构。

11

星空加速卡

鲲云科技

星空加速卡是一款面向服务器端进行深度学习推断的计算加速卡,基于鲲云自主研发的定制数据流架构CAISA 2.0,可实现76%~98%的芯片利用率。在同等峰值芯片性能情况下,鲲云的产品为人工智能应用提供更高的算力支撑。   

鲲云的星空加速卡基于其自主研发的定制数据流CAISA架构和端到端自动编译工具链RainBuilder。该架构不同于传统的指令集的架构方式,采用数据流的方式,摆脱对于数据的依赖性,避免过多与运算无关的资源浪费,最大化利用硬件资源,性能实现线性增长;同时专为CAISA架构设计的RainBuilder编译工具链支持TensorFlow、Caffe及ONNX等主流框架下深度学习算法无缝链接,提供从算法模型到芯片级算法部署的一整套开发套件,保证了其通用性和易用性。

CAISA硬件架构与RainBuilder编译器结合,使鲲云产品在达到高效能的同时具有高拓展性,为人工智能算法的快速应用落地提供高性能算力支撑。

以上十一款参评AI芯片产品,现已经过18天20万电子工程师线上评选+30位资深业内人士线下评分。综合所有评分,本次评选最终结果将于12月19日在会展中心1号展馆1B会议厅举办的“2019硬核中国芯领袖峰会暨颁奖盛典”中揭晓,欢迎半导体行业人士报名,现场共同见证中国芯片的崛起。

若您也有国产AI芯片推荐,也可以在评论区以“公司+产品名称+产品简介”格式展示产品,如:紫光展锐,虎贲T710:该芯片......


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/489106.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【周末阅读】10年内,19个关键技术将改变世界

来源:人民网 中国AI协会【导读】根据世界经济论坛全球议程理事会关于《未来软件与社会》的一份报告,到2025年前,很多新兴技术将会达到其临界点。该理事会调查走访了超过800名来自技术行业的企业高管和专家,并分享了他们关于这些黑…

上传文件实时显示网速怎么实现_担心PC程序吃内存占网速?有了它终于放心了...

自乔帮主发布iPhone至今,智能手机已经走过了13个年头,其系统、UI、操作逻辑都已经逐步完善且相当傻瓜化。所以总有许多人切换到PC上时,总感觉缺了那么点东西,Windows系统的生产力自然是毋庸置疑,但其繁琐、复杂且不直观…

python字符串怎么用_零基础如何使用python处理字符串?

摘要:Python的普遍使用场景是自动化测试、爬取网页数据、科学分析之类,这其中都涉及到了对数据的处理,而数据的表现形式很多,今天我们来讲讲字符串的操作。字符串是作为任意一门编程语言的基础,在Python中的关键字叫做…

汽车芯片科普

来源:湖杉资本智能驾驶涉及人机交互、视觉处理、智能决策等,核心是 AI 算法和芯片。伴随汽车电子化提速,汽车半导体加速成长,2017 年全球市场规模 288 亿美元(26%),远高于整车销量增速&#xff…

hanoi塔java_Java实现hanoi塔

学习数据结构绕不过会遇到汉诺塔的问题,这个也比较经典,问题我也不详细描述了。简单来说三根木桩,初始状态下一根木桩上叠放着n个盘子,大盘在下小盘在上,任你操作,把这些盘子移动到第三根木桩,当…

信息太多,时间太少: 大脑如何区分重要和不重要的事?

来源:脑与心智毕生发展研究中心CLIMB我们总是会错过一些想看到、听到或感觉到的东西——尤其是当有大量信息争夺我们的注意时。是什么吸引了我们的注意?记住重要的事情需要多长时间?神经科学家(研究大脑和行为的科学家)发现,大脑的…

java 并发 set_高并发下的Java数据结构(List、Set、Map、Queue)

1.并发ListVector 或者 CopyOnWriteArrayList 是两个线程安全的List实现,ArrayList 不是线程安全的。因此,应该尽量避免在多线程环境中使用ArrayList。如果因为某些原因必须使用的,则需要使用Collections.synchronizedList(List list)进行包装…

知识图谱和图分析与可视化

来源:知链数据“知识图谱和图分析与可视化”这个题目看起来比较大,我尝试基于本人的一些图数据可视化与分析经验,对知识图谱和图分析与可视化之间的关系进行简单梳理,并分享一些以知识图谱为代表的图数据与图可视化、图分析结合进…

新一代人工智能专利分析

来源:三思派人工智能(Artificial Intelligence,AI)自诞生以来,已经过约60年的发展。2006年深度学习算法的重大突破带来了人工智能的第三次爆发。同时也引发专利申请的激增,2006年至2016年,十年的…

MYSQL性能优化详解(二)

接着上一篇学习:http://www.cnblogs.com/quanzhiguo/p/6401453.html 七、MySQL数据库Schema设计的性能优化 高效的模型设计 适度冗余-让Query尽两减少Join 大字段垂直分拆-summary表优化 大表水平分拆-基于类型的分拆优化 统计表-准实时优化 合适的数据类型 时间存储…

图解谷歌大脑丶城市大脑丶全球脑与互联网大脑的关系

人类很早就朦胧的发现社会组织具有神经系统的特征。19世纪到20世纪,一些前瞻的哲学家们开始不断将科技与脑进行了关联,提出了"器官映射","社会神经网络","全球脑"。 21世纪之后,更多科技大脑概念不断涌现,从互联网大脑到城市大脑,从谷…

滴滴自动驾驶CEO张博:十年内无人驾驶对消费者没有吸引力丨厚势汽车

来源:WAVE2019张博:在 2012 年滴滴创立的时候,我们是一个非常简单的想法。我们发现在打出租车的场景下,无论是司机还是乘客效率都非常低。在滴滴出现之前,一个乘客想要打出租车必须要下楼招一下手,这个信号…

garch预测 python_数据科学方面的Python库,实用!

作者:Python开发与大数据人工智能原文:公众号 Python开发与大数据人工智能Python是一种很棒的编程语言。事实上,它还是世界上发展最快的编程语言之一。它一次又一次证明了它在数据科学职位中的实用性。整个Python及其库的生态系统使其成为全世…

物联网中的推荐系统

来源:北京物联网智能技术应用协会作者 | Alexander Felfernig, Seda Polat Erdeniz编译 | CDA数据科学研究院Recommender systems in the Internet of Things1、背景介绍物联网是一种联网的基础架构,是物联网、互联网和语义学领域之间融合的结果&#xf…

pwm控制的基本原理_单片机PWM控制基本原理详解~

PWM是Pulse Width Modulation的缩写,它的中文名字是脉冲宽度调制,一种说法是它利用微处理器的数字输出来对模拟电路进行控制的一种有效的技术,其实就是使用数字信号达到一个模拟信号的效果。这是个什么概念呢?我们一步步来介绍。首…

关上Deepfake的潘多拉魔盒,RealAI推出深度伪造视频检测工具

诞生之初,Deepfake是一项有趣的图像处理技术,仅仅带来搞笑和娱乐视频,但殊不知,潘多拉魔盒就此被打开,催生出色情黑产、恶搞政客“操纵”民意,Deepfake正逐步进化为一种新型“病毒”,人类伦理道…

谷歌地图的全球森林监察系统,揭秘中国雾霾的惊天秘密!

来源:老牛时评谷歌公司最近推出的全新交互式地图——“全球森林监察”它可以实时显示全球森林的覆盖情况。该幅地图的数据来源有多个,其中包括了NASA的森林面积覆盖率的分析数据。于是我们选取了中国及中国周边的部分,看完后的感受只能是比悲…

qt显示rgba8888 如何改 frame_Qt开源作品17-IP地址输入控件

一、前言这个IP地址输入框控件,估计写烂了,网上随便一搜索,保证一大堆,估计也是因为这个控件太容易了,非常适合新手练手,一般的思路都是用4个qlineedit控件拼起来,然后每个输入框设置正则表达式…

web.xml文件头出错

原先将web.xml文件头设置为如下格式 <?xml version"1.0" encoding"UTF-8"?><web-app version"3.1" xmlns"http://xmlns.jcp.org/xml/ns/javaee" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance" xsi:sche…

Nature子刊超越诺贝尔经典理论:神经科学研究路漫漫...

科学家正在观察一台用于记录小鼠脑细胞活动的双光子显微镜。图片来源&#xff1a;艾伦研究所来源&#xff1a;中国生物技术网 北京时间12月17日&#xff0c;发表在《Nature Neuroscience》上一项针对小鼠视觉系统中近6万个神经元活动的新研究显示&#xff0c;要想了解大脑如何计…