谷歌开源 TFGAN,让训练和评估 GAN 变得更加简单

者:思颖

概要:训练神经网络的时候,通常需要定义一个损失函数来告诉网络它离目标还有多远。


三年前,蒙特利尔大学 Ian Goodfellow 等学者提出「生成式对抗网络」(Generative Adversarial Networks,GANs)的概念,并逐渐引起 AI 业内人士的注意。自 2016 年以来,学界、业界对 GAN 的兴趣出现「井喷」。近日,谷歌开源 TFGAN 轻量级的工具库,据悉,其设计初衷是让训练和评估 GAN 变得更加简单。


训练神经网络的时候,通常需要定义一个损失函数来告诉网络它离目标还有多远。例如,图像分类网络中通常会有一个损失函数,一旦给出错误的分类就会进行惩罚。如果一个网络把狗的照片错当成猫了,那将会出现很高的损失值。


然而,有些问题并不能轻松用损失函数来定义,特别是当它们涉及到人的感知时,比如图像压缩或文本转语音系统。


生成式对抗网络 (GAN) 这种机器学习技术已经在广泛的应用领域引导我们取得了进步,包括基于文本生成图像、超分辨率,以及机器人抓取的解决方案。然而,GAN 在理论和软件工程上都引入了新的挑战,想要跟上它这种快速的研究步伐也很难。


为了让基于 GAN 的实验更加容易,谷歌选择开源 TFGAN,这是一个轻量级的库,设计初衷是让训练和评估 GAN 变得简单。


它提供训练 GAN 的基础设施,也提供经过良好测试的损失和评估指标,并包括易于使用的示例,可以看到这个库极具表达性和灵活性。与此同时,谷歌还发布了一个教程,其中包括能快速基于自己的数据进行模型训练的高级 API。


上图展示了对抗损失对图像压缩的影响。最上面那行是来自 ImageNet 数据集的图像 patch。中间展示了用传统损失训练的图像压缩神经网络对图像进行压缩和解压缩的结果。底部是用传统损失和对抗性损失训练的网络对图像进行压缩和解压缩的结果。


虽然基于 GAN 损失训练的图像比起原图来,信息还是有所丢失,但比起其他的方法,图片更加清晰,包含更多细节。


TFGAN 可以从以下几个方面来支持实验。


  • 它提供简单的函数调用功能,能覆盖大部分的 GAN 用例,因此仅需几行代码你就能用自己的数据训练模型,而且因为是采用模块化的方式构建,它能覆盖更特殊的 GAN 设计。


  • 你可以任意使用自己想要的模块——损失、评估、特征、训练等模块,这些都是独立的。TFGAN 的轻量级设计意味着你可以将它与其他框架或原生 TensorFlow 代码一起使用。


  • 用 TFGAN 编写的 GAN 模型很容易从未来基础设施的改进中受益,你可以从大量已经实现的损失和特征值中进行选择,而不需要再重写。

  • 最后,代码经过了良好的测试,因此你不必担心使用 GAN 库时容易出现的数值或统计错误。



如上图,大多数文本转语音 (TTS) 神经系统产生的频谱图都过于平滑。当应用到 Tacotron TTS 系统时,GAN 可以重新创建一些更真实的纹理,这将减少输出音频中的人工痕迹。


TFGAN 的开源意味着你将与许多 Google 的研究人员使用的相同的工具,任何人都可以受益于谷歌在库中最先进的改进。




未来智能实验室致力于研究互联网与人工智能未来发展趋势,观察评估人工智能发展水平,由互联网进化论作者,计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎支持和加入我们。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/497913.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Struts2源码阅读(六)_ActionProxyActionInvocation

下面开始讲一下主菜ActionProxy了.在这之前最好先去了解一下动态Proxy的基本知识.ActionProxy是Action的一个代理类,也就是说Action的调用是通过ActionProxy实现的,其实就是调用了ActionProxy.execute()方法,而该方法又调用了ActionInvocatio…

py语言和php,php和python什么区别

python语言的风格Python在设计上坚持了清晰划一的风格,这使得Python成为一门易读、易维护,并且被大量用户所欢迎的、用途广泛的语言。设计者开发时总的指导思想是,对于一个特定的问题,只要有一种最好的方法来解决就好了。这在由Ti…

计算机产业深度报告:云计算与人工智能开启新一轮技术变革周期

来源:乐晴智库概要:每一次的技术迭代都将行业推向新的高度,同时也对产业生态和企业兴衰产生重大影响。纵观整个IT产业的发展史,从1960年代到现在的2010年代,科技行业历经了大型机时代、小型机时代、PC时代、互联网时代…

自动分页,返回时跳回指定页

实现原理: displaytag 自动分页时,只需要提供一个“集合”(name 属性) 和翻页对应的 requestURI 属性(也是返回整体的集合) 执行翻页时 displaytag 会自动计算出页数,形如: http://localhost:8080/bpp/ma…

java 界面艺术字,Java 在Word文档中添加艺术字

与普通文字相比,艺术字更加美观有趣也更具有辨识度,常见于一些设计精美的杂志或宣传海报中。我们在日常工作中编辑Word文档时,也可以通过添加艺术字体来凸显文章的重点,美化页面排版。这篇文章将介绍如何使用FreeSpire.Doc for Java在word文档…

AI校招程序员最高薪酬曝光!腾讯80万年薪领跑,还送北京户口

来源:100offer概要:如果说 2016 年是互联网 AI 领域井喷的元年,2017 年整个 AI 领域全面爆发,来潮汹涌的趋势相较 2016 年可以说是有过之而无不及。如果说 2016 年是互联网 AI 领域井喷的元年,2017 年整个 AI 领域全面…

vscode php断点,VSCode中设置断点调试PHP(示例代码)

所需文件xampp 集成服务器(本文使用Apache2.4MySQLPHP7.4.3)vscodeXdebugphp-debug 插件配置Xdebug1. 下载Xdebug插件 (直接去 https://xdebug.org/download.php下载php对应版本的插件)如果不知道如何选取版本,则如下Step 1:获取本地php版本信息 (利用ph…

2017英国AI形势报告:认知鸿沟、新商业模式和当下的挑战

原作 David Kelnar MMC投资研究中心老大Root 编译自 MMC Venture量子位 出品 | 公众号 QbitAI来源:36氪概要:AI技术今年所获得媒体、资本极度的关注,短时间内已经给民众带来认知上剧烈的冲击:或是由未知产生恐惧,或是对…

前百度首席科学家吴恩达携手富士康,要用人工智能升级制造业

来源:澎湃新闻概要:当地时间12月14日,吴恩达再一次通过英文自媒体平台Medium公布了自己的下一个创业项目——Landing.ai。作为人工智能领域里的明星科学家、斯坦福大学计算机系教授吴恩达(Andrew Ng),离开百…

腾讯AI Lab解析2017 NIPS三大研究方向,启动教授及学生合作项目

来源: 腾讯AI实验室概要:腾讯AI Lab去年4月成立,今年第二次参加NIPS,共有8篇文章被录取,含一篇口头报告(Oral)。在所有国内研究机构和高校中,录取论文数仅次于清华大学。NIPS被誉为机…

「自然语言处理」如何快速理解?有这篇文章就够了!

原文来源:codeburst.io作者:Pramod Chandrayan「雷克世界」编译:嗯~阿童木呀、我是卡布达现如今,在更多情况下,我们是以比特和字节为生,而不是依靠交换情感。我们使用一种称之为计算机的超级智能机器在互联…

another mysql daemon,[守护进程详解及创建,daemon()使用

一,守护进程概述Linux Daemon(守护进程)是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。它不需要用户输入就能运行而且提供某种服务,不是对整个系统就是对某个用户程序提供服务。Linux系统的大多数服务…

李开复:明年会有一批AI公司倒闭

来源:公众号黑智概要:在北美的四大AI巨头公司中,李开复的总结是:Google有大牛优势;Facebook做得更深,但没有平台化意识;微软在试着聚拢自己的实力;“四大AI公司中,有3家不…

德勤预测2018年9大科技趋势:AR走进普通用户,直播仍然是王道

来源:腾讯科技编辑:Jennie“我们眼下正处在一个临界点,即机器学习将在企业市场加速普及,从而推动改进企业运营,让企业作出更好的决策,并提供增强或全新的产品和服务。”——德勤副总裁保罗萨罗米据外媒报道…

谷歌人工智能检索开普勒望远镜数据后,找到了“迷你太阳系”

“开普勒-90”和太阳系一样拥有八大行星 本文图片均来自 NASA来源:澎湃新闻概要:当地时间12月15日,美国国家航空航天局NASA宣布在“行星猎手”开普勒望远镜的数据库中找到了恒星“开普勒-90”周围的第八颗行星&#xf…

php去除所有标点符号的方法,php如何去除标点符号

php去除标点符号的方法:首先创建一个PHP示例文件;然后通过正则表达式“preg_replace($pattern, , $str);”删除字符串中的中英文标点符号即可。推荐:《PHP视频教程》php正则,删除字符串中的中英文标点符号原理很简单,…

美国的人工智能企业在研发哪些有趣的AI产品?

来源:亿欧概要:本文盘点了美国AI企业的有趣产品,或许能给国内AI创业者和投资人有所启发。同样是AI创业,国内外的打法显然不同。在国内,大部分AI创业公司都在拼主赛道,比如无人驾驶、AI安防、AI医疗、AI教育…

Java技术回顾之JNDI--实例

一、JNDI在Java EE中的应用JNDI 技术是Java EE规范中的一个重要“幕后”角色,它为Java EE容器、组件提供者和应用程序之间提供了桥梁作用:Java EE容器同时扮演JNDI提供者角色,组件提供者将某个服务的具体实现部署到容器上,应用程序…

【观点】智能制造:新时代智能产业革命的基石|王飞跃

来源: 中国科学院自动化研究所概要:以新的理念和新的技术发展新时期的智能制造科技,创新智能产业革命,将是中国从制造大国到制造强国,进而从世界大国到世界强国的必由之道和开路先锋。实体经济,特别是以制造…

matlab连续型随机变量,matlab连续型随机变量的分布.doc

matlab连续型随机变量的分布.doc 连续型随机变量的分布及其数字特征一、基本概念设随机变量X的分布函数为F(x),若存在非负函数f(x),使对任意实数x,有≤X{Pxd}则称X为连续型随机变量,并称f(x)为X的概率密度,它满…