微软为什么要公开AI系统测试数据集和度量指标?


来源: 微软研究院AI头条

概要:微软研究院Maluuba团队的研究员Samira Ebrahimi Kahou等人在研究如何利用人工智能理解柱线图和饼图中所包含的信息这一问题时遇到了一个难题:没有现成的数据集可以用来测试他们的假设。


微软研究院Maluuba团队的研究员Samira Ebrahimi Kahou等人在研究如何利用人工智能理解柱线图和饼图中所包含的信息这一问题时遇到了一个难题:没有现成的数据集可以用来测试他们的假设。为了解决这一问题,他们自己创建了FigureQA数据集,并在今年秋天对外公布。


这个数据集只是近年来微软研究人员和工程师用来测试AI系统的众多数据集、度量指标和工具之一。目前,这些工具向全世界的研究人员开放,可以被用于测试各自的AI系统在例如实时语音翻译、输入词汇预测等任务中的表现。微软开发这些工具的团队认为,这些开放工具可以帮助学术研究人员和行业专家测试各自系统、比较研究成果以及相互学习。


微软必应搜索部门合作伙伴项目经理Rangan Majumder说:“这些公开数据集使我们的目标变得更加清晰。这样其他研究人员就很容易看清楚我们的技术发展方向。”Majumder带领的团队负责MS MARCO机器读阅读理解数据集的开发工作,他们即将在年底再次更新这个诞生刚刚一年的数据集。


MS MARCO 官网地址:

http://www.msmarco.org/


微软必应搜索部门合作伙伴项目经理Rangan Majumder


对于习惯传统科技行业行事风格的人来说,这种信息共享似乎无法理解。但是,在人工智能领域,这种开放性正在变得越来越普遍。位于蒙特利尔的微软研究院Maluuba团队项目经理Rahul Mehrotra 表示:“传统上,企业的研究工作是秘不示人的。但是现在,共享的风潮正席卷整个行业——几乎所有企业都在发表论文,试图引领科技前沿的发展。”去年,微软研究院Maluuba团队还发布了另外两个数据集:NewsQA和Frames。


NewsQA官网地址:

http://datasets.maluuba.com/NewsQA

Frames官网地址:

https://datasets.maluuba.com/Frames


 不少人工智能专家认为,协作精神对人工智能领域的长足发展至关重要,许多人工智能领域的早期突破都源于此。甚至身处有竞争关系的不同机构内的研究人员都可以共享彼此的研究成果。

 

微软翻译团队高级项目经理Christian Federmann表示:“我们不可能想到世界上所有的好点子,所以如果别人有个好点子并想尝试一下,我们可以给他们提供一个数据集来试一试。”


Federmann的团队开发了微软语音翻译语料库(Microsoft Speech Language Translation Corpus),并在最近在语料库中加入了更多语言。目前,所有人都可以利用这个语料库测试他们自己的类似于Microsoft Translator的实时翻译以及Skype Translator的语音翻译系统。Federmann表示,微软公司是少数几个拥有雄厚预算和资源的大公司之一,可以创建高质量的工具和数据集,让业界同行得以比较各自的研究成果。


Microsoft Speech Language Translation Corpus 下载地址:

https://www.microsoft.com/en-us/download/details.aspx?id=54689


研究人员需要创造一些标杆(benchmark)来展示自己的研究成果,而这些公开的数据集恰恰是上述标杆的关键。例如,语音识别研究领域新近的几项里程碑式的成就正是基于Switchboard语料库的训练结果。


预付费模式


许多正在开发数据集和度量指标的团队表示,从某种意义上说,他们是在“预先付费”,因为他们将来也会用到其他人所创建的数据集。


Mehrotra说,当Maluuba还是一个小型创业公司时,他们的研究非常依赖名为MCTest的微软数据集。现在,Maluuba已成为微软的一部分,他们很高兴看到自己所创建的数据集正在被业内其他人所使用。


获知MCTest 更多信息,请访问:

https://www.microsoft.com/en-us/research/publication/mctest-challenge-dataset-open-domain-machine-comprehension-text/


乔治亚理工学院助理教授、Facebook人工智能研究院的研究员Devi Parikh表示,Maluuba最近发布的FigureQA数据集很有帮助,在这个数据集的帮助下,像她这样的研究人员就可以研究需要多种人工智能技术才能解决的问题。例如,计算机要能准确阅读图形并回答有关问题,就需要同时运用计算机视觉和自然语言处理。她说:“从研究的角度来看,研究人工智能各分领域之间的交叉问题变得越来越有趣。”

 

尽管大家都看到了信息共享的价值,但AI领域的研究人员和工程师有时候也希望既能够比较他们的系统,也不必公开所有所用数据。

 

在微软去年收购的SwiftKey公司,高级软件工程主管Doug Orr表示,他所在的团队希望创建一种标准方法,用于衡量某个输入法在词汇预测(预测用户即将输入的词汇)方面的表现。词汇预测是SwiftKey输入法的一个关键组件,它能够根据个人的表达风格提供个性化的词汇预测。SwiftKey团队并没有共享某个具体的数据集,而是创建了一套可供研究人员应用于任何数据集的衡量标准——Language Model Challenge 。用户可通过GitHub下载到这套标准,它让研究人员有了一个标准化的尺度,用于衡量自身的改进并将结果与其他同行进行比较,而又无须共享专有数据。


Orr表示,这些衡量标准让公司的内部团队受益匪浅,因为他们能更了解自己的输入法,能够看到输入法改进的幅度,同时,该领域的每一个参与者也能更清晰地了解彼此的表现。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498177.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SHA384-算法解密

今天无意发现一款网页你懂得游戏 于是出于好奇就去玩了一会,看着小姐姐发卡。 于是打开抓包软件。 这里推荐大家准备好 1.抓包软件 2纸和笔 用来在10秒内完成计算 先来了解一下 sha384算法,很难破解 但是巧了,我就这么巧! 看了20多…

JS写纸牌发牌和动画(详细解剖)

先看演示 游戏构建准备 1.准备52张纸牌 2.一张桌布 3.编辑工具为 Visual Code 技术概要 1.对象操作 2.数据操作 3.JS animation动画 4.全局变量 function desen_x(){let that this;var desen["h_1","h_2","h_3","h_4","h_5&…

科技产品下一个重大突破将来自芯片堆叠技术

来源:网易科技 概要:作为几乎所有日常电子产品最基础的一个组件,微芯片正出现一种很有意思的现象。 作为几乎所有日常电子产品最基础的一个组件,微芯片正出现一种很有意思的现象。通常又薄又平的微芯片,如今却堆叠得像…

Inside Class Loaders

原文:http://onjava.com/pub/a/onjava/2003/11/12/classloader.htmlIn this part, I want to lay the groundwork on which we can start a discussion about dynamic and modular software systems. Class loaders may seem to be a dry topic, but I think it is …

Cocos creator -引擎解构

Cocos creator -引擎结构 在长期的开发中,发现cc对大型的手游加载项目的速度很慢,于是我产生了一种想法,想把 cocos creator移植在Linux上做开发,编译时在Windows。但是这样太麻烦了。索性,研究一下它的构造&#xff…

计算机视觉简介:历史、现状和发展趋势

来源:专知 概要:正像其它学科一样,一个大量人员研究了多年的学科,却很难给出一个严格的定义,模式识别如此,目前火热的人工智能如此,计算机视觉亦如此。 【导读】本文由中国科学院自动化研究所模…

IIS-HTTPS(TSL)强制开启的方法和解决过时的安全问题

IIS-HTTPS(TSL)强制开启的方法和解决过时的安全问题 系统为:Windows server 2008R2 工具为:IIS6 数据库为: Windows Sql server 2014 证书为:腾讯云颁发的AC证书 首先你需要这几个工具 IISCrypto | 检测和为你配置最安全的 策略环境 手写reg注册表 | 来关闭本地的事件 Windo…

AI在医疗行业的最新进展

来源: Future智能 概要:随着人工智能、大数据等相关应用与理念的不断传播,越来越多曾经深入人心的观念被彻底撼动,当然,医疗行业也不例外。 随着人工智能、大数据等相关应用与理念的不断传播,越来越多曾经深…

SHA384-算法解密(2)还原元数据

SHA384-算法解密(2)还原元数据 上一次的讲解比较潦草,这次写的更全面详细一些。 首先各位,如果想要解开使用这个算法加密后的数据,必须先学会加密,才能解密。 声明:这里仅供学习研究,不要学了三脚猫功夫就…

美国《时代》周刊公布年度25大最佳发明名单

来源: 中国智慧城市导刊 概要:除了大名鼎鼎的iPhone X和特斯拉model 3,还有好多你可能还未听过的新奇玩意。 当地时间16日,美国《时代》周刊发布了2017年25大最佳发明名单。除了大名鼎鼎的iPhone X和特斯拉model 3,还有…

顶级隐写术,破坏一切解释器

什么是隐写术? 就编程来说,隐写的信息通过加密或混淆,其内容例如一张购物清单,一篇文章,一篇图画或者其他“伪装”(cover)的消息。 隐写的信息通常用一些传统的方法进行加密,然后用…

“头移植模型”论文称换头术可行 业内疑两大问题未解

来源:澎湃新闻 概要:11月21日,“换头术”的倡导者、哈尔滨医科大学教授任晓平在一场见面会上称,团队在科学领域取得重大突破, “完成了人类第一例头移植外科实验模型”。 11月21日,“换头术”的倡导者、哈尔…

图片有损解构术

图片有损解构 解释:将任意图片解构其PS或修图或雪碧图拼接之前,将通道与法线分离并在原图展现出来 在群里经常看到某些人转发一些图片,有意或者无意的,勾起了我的好奇心,他们这么做有什么好处? 左边图片是…

让机器听懂世界,触及人类梦想还有多远?

来源:陈孝良科学网博客 概要:语言对于人类文明的重要性不言而喻,但是语言的起源却是个高度争议的话题,我们对此几乎一无所知。 语言对于人类文明的重要性不言而喻,但是语言的起源却是个高度争议的话题,我们…

[实战]前端wireshark抓包协议解密

前端wireshark抓包协议解密废话不多说,先看看结果该JSON文件是通过解密后的 HTTP 返回response结果再解密打开的新页面 有兴趣的小伙伴了解下之前的文章 Sha384解密[2] 打开Wireshark 将TCP 转码为RTP ,因为该目标地址有视频文件,方便转换 登…

前端React结构工程-改写render

前端React结构工程-改写render 工程准备事项 npm installcnpm初始化工程实例 以上是实例化,安装过npm后的列表 接下来使用 npm run start 来启动项目 当你启动项目后会看到react给我们准备好的 默认界面 React中的 diff原理 和 调度原理是 这次探索的目标 只有搞…

未来智能实验室成立,建设世界第一个智能系统智商评测和趋势研究机构

来源:未来智能实验室 互联网云脑逐渐清晰,AI与互联网结合引发AI威胁论 从科学史可以看到这样一个规律:每一次人类社会的重大技术变革都会导致新领域的科学革命。互联网革命对于人类的影响已经远远超过了大工业革命。与工业革命增强人类的力量…

自己动手制作一门语言(1)波罗语

自己动手制作一门语言(1)波罗语 波罗语:基于波斯(阿拉伯语)的繁衍,主要目的是二向加密语言。防止被保护的数据泄露和解密。使用在计算机与书本中使用语言的发音 主要以 ah 、v 、hv 颤音、哈音、卷舌 创造一门语言很容易,要实现起来确很难&a…

高盛:人工智能报告中文版(45页)

来源:数据局 概要:人工智能是信息时代的尖端科技。计算的飞跃建立在人类告知计算机如何表现的基础上,计算建立在计算机学习如何表现能够对每个行业有意义的基础上。 人工智能是信息时代的尖端科技。计算的飞跃建立在人类告知计算机如何表现的…

人工智能硅脑竞赛:传统芯片巨头VS AI芯片创企

来源:亿欧 概要:但现在,一些芯片企业家得到了不同程度的欢迎。投资者没有对此嗤之以鼻,而是“慷慨地”拿出其支票簿。 英国半导体创业公司Graphcore的联合创始人兼首席执行官Nigel Toon表示:“几年前,许多…