MIT 的新型开源系统 Taco 将数据分析速度提升 100 倍 !(附论文)

来源:全球人工智能

概要:麻省理工学院(MIT)开发的一种新型计算机系统为涉及“稀疏张量”(sparse     tensor)的计算加快了速度,稀疏张量是主要由0组成的多维数据数组。


麻省理工学院(MIT)开发的一种新型计算机系统为涉及“稀疏张量”(sparse     tensor)的计算加快了速度,稀疏张量是主要由0组成的多维数据数组。


我们生活在大数据时代,但是这些数据大多数是“稀疏数据”。比如设想一下,一个庞大表格列出了亚马逊的所有顾客与其所有商品对应的信息,“1”对应于某个顾客购买的每件商品,“0”对应于未购买的每件商品。此表格基本上以0为主。


如果是稀疏数据,分析算法最后执行涉及0的大量加法和乘法操作,这浪费了计算资源。为了规避这个问题,程序员们编写自定义代码来避免0数据项,不过这种代码很复杂,而且通常只适用于一小批问题。


在美国计算机协会(ACM)召开的系统、编程、语言和应用程序:为人类所用的软件(SPLASH)大会上,来自 MIT、法国替代能源和原子能委员会以及 Adobe Research 的研究人员最近介绍了一种新的系统,可自动生成针对稀疏数据优化的代码。


这种代码比未经过优化的现有软件包快100倍。其性能与针对特定的稀疏数据操作而精心手动优化的代码不相上下,但只需要程序员做极少的工作。


这个系统名为Taco,意指稀疏代数编译器(Tensor Algebra COmpiler)。用计算机科学术语来说,像上面亚马逊表格这样的数据结构名为“矩阵”(matrix),张量只是相当于更高维度的矩阵。如果亚马逊表格还将顾客和产品与该顾客在亚马逊网站上的产品评价和产品评价中所用的词语对应起来,结果就是四维张量。


萨曼•阿马拉辛格(Saman Amarasinghe)是MIT电气工程和计算机科学(EECS)教授,也是这篇新论文的主要作者。他说:“稀疏表示问世至今已有60多年,但没有人知道如何自动为它们生成代码。人们搞清楚了几种非常特定的操作――稀疏矩阵与向量相乘、稀疏矩阵与向量相乘后与向量相加、稀疏矩阵与矩阵相乘以及稀疏矩阵与矩阵、矩阵相乘。我们所做的最大贡献就是,在矩阵是稀疏的情况下能够为任何张量代数表达式生成代码。”


与阿马拉辛格一同撰写论文的还有第一作者MIT EECS研究生弗雷德里克•肖尔斯塔德(Fredrik Kjolstad)、同样是EECS研究生的斯蒂芬•周(Stephen Chou)、法国替代能源和原子能委员会的大卫•卢加托(David Lugato)以及Adobe Research的肖艾布•卡米尔(Shoaib Kamil)。


定制核心


近些年来,张量的数学运算(张量代数)不仅对大数据分析来说至关重要,对机器学习来说也至关重要。从爱因斯坦时代以来,张量代数就是科学研究的一个重要组成部分。


过去,要处理张量代数,数学软件将张量操作分解成多个组成部分。所以比如说,如果某个计算需要两个张量相乘,然后与第三个张量相加,软件就会对前两个张量执行标准张量相乘操作,将结果存储起来,然后执行标准张量相加操作。


然而在大数据时代,这种方法太费时间了。肖尔斯塔德解释道,为了在庞大数据集上执行高效操作,张量操作的每个序列需要各自的“核心”,也就是计算模板。


肖尔斯塔德说:“如果你在一个核心中处理,可以一次性完成处理,你还可以让它处理得更快,而不是非得将结果存放到内存中,然后读回结果,以便你可以与别的东西相加。你在同一个循环中即可完成。”


计算机科学研究人员已为机器学习和大数据分析中最常见的一些张量操作开发了核心,比如说阿马拉辛格上面列举的那些张量操作。但潜在核心的数量却是无限的:比如说,将三个张量相加的核心不同于将四个张量相加的核心,而将三个三维张量相加的核心又不同于将三个四维张量相加的核心。


许多张量操作涉及将来自一个张量的项与来自另一个张量的项相乘。如果其中一个项是0,结果也是 0,处理庞大稀疏矩阵的程序会浪费大量的时间对0执行相加和相乘操作。


针对稀疏张量手动优化的代码可识别出是0的项,并简化含有这些项的操作――加法时对非0项进位相加,或者完全忽略与0相乘。这大大加快了张量操作,但大大增加了程序员的工作量。


比如说,如果矩阵很稠密(意味着没有一项被省略),两个矩阵相乘(一种简单的张量,只有两个维度,像表格那样)的代码只有12行。但如果矩阵很稀松,同样的操作可能需要至少100行代码来跟踪分析省略和删节。


Taco应运而生


Taco自动添加所有这些额外的代码。程序员只要指定张量的大小、张量很稠密还是很稀疏以及导入值的那个文件的位置。就针对两个张量的任何特定操作而言,Taco 建立一张层次图,该图先表明来自两个张量的哪些配对项非0,然后表明来自每个张量的哪些项与0配对。所有0与0配对的一律被丢弃。


Taco还使用一种高效的索引方案,只存储稀疏张量的非0值。如果包含0项,来自亚马逊的一个公开发布的张量(将顾客的ID号与购买物品和从评论提取的描述词语对应起来)要占用 107 艾字节(EB)数据,相当于谷歌所有服务器的估计存储容量的10倍。但使用Taco压缩方案,它仅仅占用13吉字节(GB),小得足以在智能手机上装得下。


未参与这项研究的俄亥俄州立大学计算机科学和工程系教授萨代•萨达亚潘(Saday Sadayappan)说:“在过去的二十年,许多研究小组试图解决稀疏矩阵计算的编译器优化和代码生成问题,但进展甚微。弗雷德和萨曼最近取得的进展却表明这个长期悬而未决的问题有了根本性的突破。”


他继续说:“他们的编译器现在让应用程序开发人员能够用一种非常容易、方便的高级标记方法来指定非常复杂的稀疏矩阵或张量计算,编译器因此可自动生成非常高效的代码。对于几种稀疏计算而言,结果表明编译器生成的代码与精心手动开发的代码一样好,或甚至更好。这有望真正地改变游戏规则。它是编译器优化领域近期取得的最激动人心的进步之一。”


附论文


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498272.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android动态设置文本居中显示图片,Android DrawableTextView图片文字居中显示实例

在我们开发中,TextView设置Android:drawableLeft一定使用的非常多,但Drawable和Text同时居中显示可能不好控制,有没有好的办法解决呢?小编的方案是通过自定义TextView实现。实现的效果图:注:第一行为原生Te…

洪小文:以科学的方式赤裸裸地剖析AI(二)|从寒冬到复兴

来源:微软研究院AI头条 概要:1956年,在达特茅斯会议之后,包括很多国家政府,美国国家科学基金会、军方,大家满怀希望投了很多钱。但是到1975年以后发生了几件事情,让AI进入了寒冬。 谈AI的历史&a…

ios android分享代码,快速插入代码块——iOS Android

昨天看到一篇分享插入代码块的文章 Xcode 快速开发 代码块,想到把我知道的其它方案也分享一下iOS篇这种方案可行,但效率不够高方案二:DashDash 目前只有 macOS 版本,免费,但有限制(会有时间延时,可以付费取…

重磅!腾讯发布AI生态计划将赋能1000合作伙伴!

来源: 腾讯科技 概要:11月8日,腾讯2017全球合作伙伴大会,在“创想人工智能”论坛上,腾讯披露了人工智能的整体布局,以及在众多研究领域的最新技术进展与应用探索。 11月8日,腾讯2017全球合作伙伴…

重磅:ATT的《5G移动边缘计算白皮书》!

来源:5G 概要:今天(11月8日),AT&T宣布,其正在硅谷建设MEC(移动边缘计算)测试外场。 精彩报告

android 6.0 adb,安卓6.0,adb停用系统更新

集各路大神的方法,汇总一下。1、下载adb工具包2、进入开发者选项,打开“手机打开USB调试”,手机上确认允许电脑usb调试。3、手机上断开wifi和移动网络,应用管理里找到系统更新-存储-删除数据,再退出进入系统更新。4、电…

GoogleNet是怎么理解图像的?谷歌大神教你读懂「神经特征可视化」

来源:雷克世界 编译:嗯~阿童木呀 概要:特征可视化使我们能够看到在ImageNet数据集上训练的GoogLeNet是如何构建对多层图像的理解的。 边缘(层 conv2d0) 纹理(层 mixed3a) 模式(层 mi…

android studio云测,Android studio 下的robotium自动化测试和持续集成

【背景介绍】Android Studio 是一个Android开发环境,基于IntelliJ IDEA. 类似 Eclipse ADT,Android Studio 提供了集成的 Android 开发工具用于开发和调试。作为官方主推的开发环境和停止对其他开发IDE的支持,Android Studio将成为今后唯一的…

博通收购高通12张PPT深度解析!

来源:国际电子商情 概要:11月6日,博通官方发出公告,宣布将以每股60美元现金,另加10美元公司股票收购高通全部流通股,交易总价值达到1300亿美元。 高通昨日证实已收到了博通公司发出的主动收购提议&#xf…

华为鸿蒙显示安卓,被谷歌除名,华为6月2日发布鸿蒙反击,开机界面已流出!...

前几天谷歌发布了Android 12的公测版更新名单,小米、OV、一加、索尼、三星等赫然在列,唯独没有华为!这是一件很明显的事情,谷歌已经把华为从安卓系统中“除名”,华为现在要做产品也不得不自力更生了。作为对谷歌除名的…

腾讯AI战略详解:技术社会与创新图景 | 2017互联网科技创新白皮书重磅首发

来源:腾讯研究院 概要:11月8日上午,以“开放创想”为主题的2017腾讯全球合作伙伴大会在成都开幕。 11月8日上午,以“开放创想”为主题的2017腾讯全球合作伙伴大会在成都开幕,来自全球的350位国内外顶级大咖、500家主流…

腾讯「AI In All」的背后,是开放AI技术能力,探索腾讯应用场景

来源:灯塔大数据 概要:过去一年中,我们听到不少公司在谈到未来的时候都会谈到一个词,叫做「All In AI」,腾讯在 AI 方面的战略也用一个词概括,那就是「AI In All」。 「过去一年中,我们听到不少…

AI时代,企业如何利用机器学习技术驱动业务发展?

来源:全球人工智能 概要:在过去的这些年,为了构建基础设施,数据社区专注于聚集和收集数据,并使用数据来改进决策。 为了成为一个机器学习公司,你需要工具和流程去克服数据、工程和模型方面的挑战。 在过去…

自动移动文字html,css怎么移动文字?

css怎么移动文字?下面本篇文章给大家介绍一下方法。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。css怎么移动文字?首先可以用个容器来包住文字,给宽和高。然后,可以使用多种方法来移动…

医学知识图谱构建技术与研究进展

来源: 人机与认知实验室 概要:医学知识图谱是实现智慧医疗的基石,有望带来更高效精准的医疗服务。 摘要:医学知识图谱是实现智慧医疗的基石,有望带来更高效精准的医疗服务。然而,现有知识图 谱构建技术在医…

android animatorset 监听,Android源码分析--动画框架AnimatorSet

这一节,我要介绍的是AnimatorSet。一提到android的动画,一定会涉及到AnimatorSet,因为他太好用了。它所封装的接口让很多复杂的动画叠加变得容易。AnimatorSet是继承于Animator这个是非常重要的,因为AnimatorSet可以不停的叠加自身…

2017年全球最具影响力50家机器人公司排行榜!我国企业基本都有研发类似产品!

来源:机器视觉 概要:ABB Robotics是一家成立于1988年的瑞士工业机器人公司,主要涉及(新)能源和矿业、基础设施、生产/农业、供应链四个领域,关键技术包括数字化连接、工业设备和系统安装。 以下就是 2017 年…

android go 最小内存,谷歌更新Android Go新规则,由原本的支持低于1G内存设备上升到2G...

原标题:谷歌更新Android Go新规则,由原本的支持低于1G内存设备上升到2G说起安卓系统想必很多人都知道,但是你知不知道还有一个叫做安卓Go的系统呢?这个安卓Go的系统最初是谷歌在I/O 2017全球开发者大会上所发布的,它的…

神经学家探寻:机器如何拥有意识!如何避免机器人伤害我们!

来源:全球人工智能 概要:好莱坞导演们并非是对此问题困惑不解的唯一群体。随着机器智能的飞速发展,它不仅能在魔兽争霸(DOTA)和围棋这样的游戏中战胜人类玩家,而且对战过程中还不需要人类的专业知识&#x…

斯坦福大学「黑盒学习」研究:使用神经变分推理的无向图模型,可替代「采样」 | 附NIPS 2017论文

来源:雷克世界 编译:嗯~阿童木呀、多啦A亮 概要:机器学习中的许多问题可以自然地用无向图模型的语言表达。在这里,我们提出了无向模型的黑箱学习和推理算法,优化了模型的对数似然的变分近似。我们的方法的核心是我们表…