面向人工智能的计算机体系结构

640?wx_fmt=jpeg

来源:计算机研究与发展


前 言


       近几年来人工智能技术的飞速发展使得其应用迅猛扩大,而传统的计算机体系结构对于面向人工智能的应用在处理速度、能耗、使用的方便性等方面有着诸多不足。随着人工智能应用的发展,面向人工智能的体系结构成为体系结构研究与发展中的一个重要方向。因此,本刊在“计算机体系结构前沿技术”主题系列中,出版“面向人工智能的计算机体系结构”主题。本主题既包含面向人工智能应用的体系结构技术、人工智能应用程序的行为分析及其对体系结构的要求、和面向人工智能应用及特定体系结构的优化技术等方面6篇文章。


类脑机的思想与体系结构综述



传统的冯·诺依曼体系结构对于面向人工智能应用的神经网络计算有诸多不适应。类脑机是一类典型的非冯·诺依曼体系结构。类脑机在处理人工智能问题的许多领域中比传统的冯·诺依曼结构具有速度、能耗等方面的优势,引起智能机器研究人员的高度兴趣和重视。黄铁军、余肇飞、刘怡俊的文章“类脑机的思想与体系结构综述”介绍类脑机的研究和发展概况。文章介绍了类脑机的基本概念、原理结构、典型的类脑机系统,也介绍了脉冲神经网络的工作原理及其信息处理能力,文章还预测了类脑机的发展前景,并给出类脑机研究中的重要问题。


640?wx_fmt=gif


黄铁军,余肇飞,刘怡俊. 类脑机的思想与体系结构综述[J]. 计算机研究与发展, 2019, 56(6): 1135-1148.
Huang Tiejun, Yu Zhaofei, Liu Yijun. Brain-like Machine: Thought and Architecture. Journal of Computer Research and Development, 2019, 56(6): 1135-1148.


基于3D 忆阻器阵列的神经网络内存计算架构



基于忆阻器的神经网络内存计算架构是一类获得计算机体系结构研究者高度关注的计算架构。此类架构在人工智能计算的大量应用中比传统的冯·诺依曼结构在性能、能耗效率等方面具有优越性。然而,基于忆阻器的内存计算硬件存在外围电路面积大、功能单元利用率低等问题。毛海宇和舒继武的文章“基于3D 忆阻器阵列的神经网络内存计算架构”提出一种基于3D忆阻器阵列的神经网络内存计算架构(FMC),把实现功能单元的外围电路聚集而形成一个功能单元池,供多个堆叠于其上的忆阻器阵列共享。文章还提出一种数据映射策略,提高功能单元的利用率并减少忆阻器立方体之间的数据传输。实验结果表明文章所提出的技术可以提升功能单元利用率、减小空间占用、提升性能并降低能耗。


640?wx_fmt=gif


毛海宇,舒继武. 基于3D忆阻器阵列的神经网络内存计算架构[J]. 计算机研究与发展, 2019, 56(6): 1149-1160.
Mao Haiyu, Shu Jiwu. 3D Memristor Array Based Neural Network Processing in Memory Architecture. Journal of Computer Research and Development, 2019, 56(6): 1149-1160.


面向深度学习加速器的安全加密方法



深度学习是人工智能一类重要技术,在云计算、边缘计算等框架下均有广泛的应用。左鹏飞等的文章“面向深度学习加速器的安全加密方法”提出,部署在边缘计算设备上的深度学习加速器有泄露所存储的深度学习模型的风险。文章针对此问题提出一种深度学习加速器架构COSA。COSA利用计数器模式加密,提高加速器的安全性,并且把解密操作从内存访问的关键路径中移出以便提高加速器性能。实验结果表明文章所提出的技术的有效性。


640?wx_fmt=gif


左鹏飞,华宇,谢新锋,胡杏,谢源,冯丹. 面向深度学习加速器的安全加密方法[J]. 计算机研究与发展, 2019, 56(6): 1161-1169.
Zuo Pengfei, Hua Yu, Xie Xinfeng, Hu Xing, Xie Yuan, Feng Dan. A Secure Encryption Scheme for Deep Learning Accelerators. Journal of Computer Research and Development, 2019, 56(6): 1161-1169.


多层神经网络算法的计算特征建模方法



利用神经网络进行学习在不同的领域中获得广泛的应用。对于神经网络学习,如何不同的计算特征、根据不同的网络规模设计高能效的加速器?如何基于有限的硬件资源提高网络性能并最大化资源利用率?这些都是体系结构研究中的重要问题。面向这些问题,方荣强等的文章“多层神经网络算法的计算特征建模方法”提出一种基于计算特征的神经网络分析和优化方法。文章提出基于“层”的粒度解析神经网络模型并提取模型通用表达式,进而根据通用表达式和基本操作属性提取模型运算量和存储空间的需求等特征,并提出基于特征的最大值更替的运行调度算法,从而可以利用特征分析和资源状况优化运行调度方案。实验结果说明了文章所提的技术的有效性。


640?wx_fmt=gif


方荣强,王晶,姚治成,刘畅,张伟功. 多层神经网络算法的计算特征建模方法[J]. 计算机研究与发展, 2019, 56(6): 1170-1181.
Fang Rongqiang, Wang Jing, Yao Zhicheng, Liu Chang, Zhang Weigong. Modeling Computational Feature of Multi-Layer Neural Network. Journal of Computer Research and Development, 2019, 56(6): 1170-1181.


面向阻变存储器的长短期记忆网络加速器的训练和软件仿真



长短期记忆网络是人工智能领域中的一种重要的网络,有着广泛的应用;而利用阻变存储器交叉开关设计内存计算结构是一种高效处理长短期记忆网络的加速器结构。由于长短期记忆网络的计算特征和阻变存储器本身的物理性质,该种网络加速器的训练和软件仿真是加速器设计中的重要环节。刘鹤等的文章“面向阻变存储器的长短期记忆网络加速器的训练和软件仿真”提出一种针对阻变存储器特征的神经网络训练方法,可以获得符合阻变存储器约束的神经网络模型。同时,文章提出一种模拟器结构,可以用时钟驱动的形式模拟设计者提出的以阻变存储器交叉开关结构为核心的加速部件的长短期记忆加速器微体系结构,从而为设计者提供模拟工具。文章介绍了其模块结构和实现方法,并给对所提出的技术给出了试验评估结果。


640?wx_fmt=gif


刘鹤,季宇,韩建辉,张悠慧,郑纬民. 面向阻变存储器的长短期记忆网络加速器的训练和软件仿真[J]. 计算机研究与发展, 2019, 56(6): 1182-1191.
Liu He, Ji Yu, Han Jianhui, Zhang Youhui, Zheng Weimin. Training and Software Simulation for ReRAM-Based LSTM Neural Network Acceleration. Journal of Computer Research and Development, 2019, 56(6): 1182-1191.


基于细粒度数据流架构的稀疏神经网络全连接层加速



深度神经网络是当前人工智能计算最重要的技术之一,被广泛地应用于人工智能计算的各个领域。对于深度神经网络计算的硬件加速是体系结构研究中的一个重要领域。向陶然等的文章“基于细粒度数据流架构的稀疏神经网络全连接层加速”提出了一种在基于细粒度数据流体系结构的硬件加速器上加速稀疏的深度神经网络全连接层的方法,可以优化深度神经网络计算在细粒度数据流架构的加速器的实现。文章针对深度神经网络计算应用和加速器体系结构的特点提出相应的数据压缩格式及加速计算方案。实验结果显示,文章所提出的方法相较于原有稠密的全连接层运算可以大幅度减少峰值带宽需求,与一些CPU、GPU、mGPU等结构相比,可以大幅度提高其计算部件的利用率。


640?wx_fmt=gif


向陶然,叶笑春,李文明,冯煜晶,谭旭,张浩,范东睿. 基于细粒度数据流架构的稀疏神经网络全连接层加速[J]. 计算机研究与发展, 2019, 56(6): 1192-1204.
Xiang Taoran, Ye Xiaochun, Li Wenming, Feng Yujing, Tan Xu,Zhang Hao, Fan Dongrui. Accelerating Fully Connected Layers of Sparse Neural Networks with Fine-Grained Dataflow Architectures. Journal of Computer Research and Development, 2019, 56(6): 1192-1204.


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/491618.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenCV与图像处理学习九——连通区域分析算法(含代码)

OpenCV与图像处理学习九——连通区域分析算法(含代码)一、连通区域概要二、Two-Pass算法三、代码实现一、连通区域概要 连通区域(Connected Component)一般是指图像中具有相同像素值且位置相邻的前景像素点组成的图像区域&#x…

(180页PPT)|清华大学孙富春教授深度讲解: 人工智能技术与产业发展

来源:精智工厂[导读】本文是清华大学孙富春教授在机械工业出版社讲座交流PPT,孙教授从背景与历史、深度学习、脑认知、产业(装备)发展、发展趋势等五个方面详细解读了人工智能技术与产业发展。未来智能实验室是人工智能学家与科学…

OpenCV与图像处理学习十——区域生长算法(含代码)

OpenCV与图像处理学习十——区域生长算法(含代码)一、区域生长算法概要二、区域生长算法原理三、代码应用一、区域生长算法概要 区域生长是一种串行区域分割的图像分割方法。区域生长是指从某个像素出发,按照一定的准则,逐步加入…

FutureWarning: Using a non-tuple sequence for multidimensional indexing is deprecated

使用scipy模块时出现警告:FutureWarning: Using a non-tuple sequence for multidimensional indexing is deprecated; use arr[tuple(seq)] instead of arr[seq]. In the future this will be interpreted as an array index, arr[np.array(seq)], which will resu…

一文看懂中国MEMS传感器产业链

来源:通信产业网物联网对促进我国经济发展、优化产业结构具有重大的战略意义。而在整个物联网生态中,MEMS传感器扮演着越来越重要的角色,在即将到来的智能物联网时代中将起到核心作用,为新科技产品提供更智能、更敏锐的感知能力。…

OpenCV与图像处理学习十一——分水岭算法(含代码)

OpenCV与图像处理学习十一——分水岭算法(含代码)一、分水岭算法概要二、分水岭算法步骤三、代码应用一、分水岭算法概要 任意的灰度图像可以被看做是地质学表面,高亮度的地方是山峰,低亮度的地方是山谷。 给每个孤立的山谷&…

10件5G能实现但4G不能做的事情

来源:雷锋网 5G的一些最佳用途可能还没有被发现,但下面是我们已经知道的十个令人兴奋的用途。雷锋网按;2019年6月6日,工信部正式向中国电信、中国移动、中国联通、中国广电发放5G商用牌照,这表明中国正式进入了5G商用的…

OpenCV与图像处理学习十二——图像形状特征之HOG特征

OpenCV与图像处理学习十二——图像形状特征之HOG特征一、图像特征理解1.1 颜色特征1.2 纹理特征1.3 形状特征1.4 空间关系特征二、形状特征描述2.1 HOG特征2.1.1 基本概念2.1.2 HOG实现过程2.1.3 代码实现前面介绍了图像的基础知识、基本处理方法以及传统图像分割的应用&#x…

深度解读:5G正式发牌,国内通信市场冷暖预判

来源:ICT解读者2019年6月6日,工业和信息化部向中国电信、中国移动、中国联通和中国广电正式颁发5G牌照,批准四家企业经营“第五代数字蜂窝移动通信业务”。这标志着我国正式进入5G商用元年。一石激起千层浪,相较于此前各运营商官方…

OpenCV与图像处理学习十三——Harris角点检测(含代码)

OpenCV与图像处理学习十三——Harris角点检测(含代码)一、角点的概念二、Harris角点检测的实现过程三、Harris代码应用一、角点的概念 角点: 在现实世界中, 角点对应于物体的拐角, 道路的十字路口、 丁字路口等。 从…

德勤发布《中国智能制造分析报告》

来源:CIO俱乐部亚洲正受到自动化、智能化大潮冲击。国际劳工组织调研发现,越南、柬埔寨、菲律宾和印度尼西亚的工人的失业风险最高,据估计这几个区域约50%的工人工作可能在未来20年被自动化取代。亚洲尤其是中国作为制造业的重要区域&#xf…

OpenCV与图像处理学习十四——SIFT特征(含代码)

OpenCV与图像处理学习十四——SIFT特征(含代码)一、SIFT算法二、SIFT实现过程三、代码实现一、SIFT算法 SIFT, 即尺度不变特征变换算法(Scale-invariant feature transform,SIFT) , 是用于图像…

液态大脑与固态大脑——圣塔菲最新群体智能文集

来源:The Royal society撰文 | Ricard Sol, Melanie Moses, and Stephanie Forrest大脑,神经元构成的器官根植于许多生物体内。这是一种固态的大脑,且组成它们的元素在空间中相对固定。但是相对的,大脑是否可以拥有流动不定的存在…

OpenCV与图像处理学习十五——LBP纹理特征(含代码)

OpenCV与图像处理学习十五——LBP纹理特征(含代码)一、LBP介绍二、LBP原理三、代码应用一、LBP介绍 LBP(Local Binary Pattern, 局部二值模式) , 是一种用来描述图像局部纹理特征的算子; 它具有…

pycharm运行程序时看不到任何结果显示

原因是用程序选择了console来运行,取消console方法如下: Run->Edit Configurations 取消run with python console的勾

iOS 的 XMPPFramework 简介

XMPPFramework是一个OS X/iOS平台的开源项目,使用Objective-C实现了XMPP协议(RFC-3920),同时还提供了用于读写XML的工具,大大简化了基于XMPP的通信应用的开发。 1. 登录和好友上下线 1.1XMPP中常用对象们 XMPPStream&a…

OpenCV与图像处理学习十六——模板匹配

OpenCV与图像处理学习十六——模板匹配一、模板匹配介绍二、代码应用一、模板匹配介绍 模板匹配是一种最原始、最基本的模式识别方法,研究某一特定目标的图像位于图像的什么地方,进而对图像进行定位。 在待检测的图像上,从左到右&#xff0…

李剑锋:意识科学就在身边

来源: 科技日报-中国科技网近些年,生命科学家开始关注神奇的大脑,因此各国纷纷提出各自的脑计划;当前有一个更基础的、但极富争议性的领域却被大家忽视了,就是意识科学。事实脑计划的终点应该就是意识科学,但由于目前大…

OpenCV与图像处理学习十七——OpenCV人脸检测(含代码)

OpenCV与图像处理学习十七——OpenCV人脸检测(含代码)一、人脸识别概要1.1 人脸检测1.2 人脸对齐(Face Alignment)1.3 人脸特征提取(Face Feature Extraction)1.4 人脸识别(Face Recognition&am…

清华大学:人工智能之知识图谱(附PPT)

来源:笑看国际风云【导读】知识图谱(Knowledge Graph)是人工智能重要分支知识工程在大数据环境中的成功应用,知识图谱与大数据和深度学习一起,成为推动互联网和人工智能发展的核心驱动力之一。基于此背景,《人工智能之…