CycleGAN 各种变变变

转载自

简单介绍了一下GAN和DCGAN的原理。以及如何使用Tensorflow做一个简单的生成图片的demo。

  • Ian Goodfellow对GAN一系列工作总结的ppt,确实精彩,推荐:独家 | GAN之父NIPS 2016演讲现场直击:全方位解读生成对抗网络的原理及未来(附PPT)
  • GAN论文汇总,包含code:zhangqianhui/AdversarialNetsPapers

CycleGAN是在今年三月底放在arxiv(地址:https://arxiv.org/abs/1703.10593)的一篇文章,文章名为Learning to Discover Cross-Domain Relations with Generative Adversarial Networks,同一时期还有两篇非常类似的DualGAN(地址:https://arxiv.org/abs/1704.02510)和DiscoGAN(地址:https://arxiv.org/abs/1703.05192),简单来说,它们的功能就是:自动将某一类图片转换成另外一类图片。

作者在论文中也举了一些例子,比如将普通的马和斑马进行互相转换,将苹果和橘子进行互相转换:

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

把照片转换成油画风格:

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解将油画中的场景还原成现实中的照片:

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

由于CycleGAN这个框架具有较强的通用性,因此一经发表就吸引了大量注意,很快,脑洞大开的网友想出了各种各样神奇的应用。

比如将猫变成狗:

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

让图片中的人露出笑容:

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

国外网友Jack Clark还搜集了巴比伦、耶路撒冷以及伦敦的古代地图,利用CycleGAN将它们还原成了真实卫星图像:

 

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

 

还有人使用CycleGAN将人脸转换成娃娃:

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

 

将男人变成女人:

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

 

把你自己变成一个“肌肉文身猛男”也是可以的:

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

 

如果说这些应用多少可以理解,那么下面的应用就有点“匪夷所思”了:你可以想象将人和拉面做转换吗?日本网友加藤卓哉(Takuya Kato)就训练了这样一个模型,它可以从拉面中生成人像,此外将人脸变成拉面的图片。鉴于生成的结果比较鬼畜,如果有兴趣的可以点击这个链接(地址:https://junyanz.github.io/CycleGAN/images/faces_and_ramens.jpg)观看生成结果。

此外,知乎上的 @達聞西 还用CycleGAN训练了可以脱掉女优衣服的模型(可以参考提高驾驶技术:用GAN去除(爱情)动作片中的马赛克和衣服),其脑洞之大,实在是让人惊叹了一番。但是技术水平还很厉害,下一篇博客把其中的技术扒过来。

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

 

今天这篇文章主要分成三个部分:

  • CycleGAN的原理解析

  • CycleGAN与原始的GAN、DCGAN、pix2pix模型的对比

  • 如何在TensorFlow中用CycleGAN训练模型

CycleGAN的原理

我们之前已经说过,CycleGAN的原理可以概述为:将一类图片转换成另一类图片。也就是说,现在有两个样本空间,X和Y,我们希望把X空间中的样本转换成Y空间中的样本。

因此,实际的目标就是学习从X到Y的映射。我们设这个映射为F。它就对应着GAN中的生成器,F可以将X中的图片x转换为Y中的图片F(x)。对于生成的图片,我们还需要GAN中的判别器来判别它是否为真实图片,由此构成对抗生成网络。设这个判别器为 可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解 。这样的话,根据这里的生成器和判别器,我们就可以构造一个GAN损失,表达式为:

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

这个损失实际上和原始的GAN损失是一模一样的,如果这一步不是很理解的可以参考一篇专栏:GAN学习指南:从原理入门到制作生成Demo

但单纯的使用这一个损失是无法进行训练的。原因在于,映射F完全可以将所有x都映射为Y空间中的同一张图片,使损失无效化。对此,作者又提出了所谓的“循环一致性损失”(cycle consistency loss)。

我们再假设一个映射G,它可以将Y空间中的图片y转换为X中的图片G(y)。CycleGAN同时学习F和G两个映射,并要求 可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解 ,以及 可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解  。也就是说,将X的图片转换到Y空间后,应该还可以转换回来。这样就杜绝模型把所有X的图片都转换为Y空间中的同一张图片了。根据 可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解 和 可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解 ,循环一致性损失就定义为:

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

同时,我们为G也引入一个判别器 可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解 ,由此可以同样定义一个GAN的损失 可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解 ,最终的损失就由三部分组成:

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

CycleGAN与DCGAN的对比

为了进一步搞清楚CycleGAN的原理,我们可以拿它和其他几个GAN模型,如DCGAN、pix2pix模型进行对比。

先来看下DCGAN,它的整体框架和最原始的那篇GAN是一模一样的,在这个框架下,输入是一个噪声z,输出是一张图片(如下图),因此,我们实际只能随机生成图片,没有办法控制输出图片的样子,更不用说像CycleGAN一样做图片变换了。

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

CycleGAN与pix2pix模型的对比

pix2pix也可以做图像变换,它和CycleGAN的区别在于,pix2pix模型必须要求成对数据(paired data),而CycleGAN利用非成对数据也能进行训练(unpaired data)。

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

 

比如,我们希望训练一个将白天的照片转换为夜晚的模型。如果使用pix2pix模型,那么我们必须在搜集大量地点在白天和夜晚的两张对应图片,而使用CycleGAN只需同时搜集白天的图片和夜晚的图片,不必满足对应关系。因此CycleGAN的用途要比pix2pix更广泛,利用CycleGAN就可以做出更多有趣的应用。

在TensorFlow中实验CycleGAN

最后来讲一讲如何在TensorFlow中实验CycleGAN,打开全球最大的同性交友网站Github,我们可以发现CycleGAN在TensorFlow中已经有很多轮子了,我使用的代码是:vanhuyz/CycleGAN-TensorFlow(地址:https://github.com/vanhuyz/CycleGAN-TensorFlow)。

利用这个代码,我训练了一个从男性和女性图片互换的模型,比如将男人转换成女人(左侧为原图,右侧为模型自动生成的图片):

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

 

还可以将女性转换成男性:

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

 

为了训练这么一个模型,我们需要分别准备好男性的图片和女性的图片。在实践中,我使用了CelebA数据集,分别取出其中男性和女性的图片并统一缩放到256x256的大小,然后存入两个文件夹中:

 

可能是近期最好玩的深度学习模型:CycleGAN的原理与实验详解

如果你对这个实验有兴趣,可以直接在地址https://pan.baidu.com/s/1i5qY3yt下载到我使用的数据集。当然,也可以使用自己的数据,只需要将它们存为jpg格式并统一缩放到256x256的大小就可以了。接下来的步骤为:

1. 下载项目代码

git clone https://github.com/vanhuyz/CycleGAN-TensorFlow.git

2. 将图片转换成tfrecords格式

这个项目中提供了一个build_data脚本,用于将图片转换成tfrecords形式。假设我们的图片存放在~/datasets/man2woman/a_resized/和 ~/datasets/man2woman/b_resized目录下,对应的命令就是:

python build_data.py \
   --X_input_dir ~/datasets/man2woman/a_resized/ \
   --Y_input_dir ~/datasets/man2woman/b_resized/ \
   --X_output_file ~/datasets/man2woman/man.tfrecords \
   --Y_output_file ~/datasets/man2woman/woman.tfrecords

3. 训练

训练的命令为:

python train.py \
   --X ~/datasets/man2woman/man.tfrecords \
   --Y ~/datasets/man2woman/woman.tfrecords \
   --image_size 256

训练的过程比较漫长,此时可以打开TensorBoard来观察训练情况(运行这个命令时需要将“20170715-1622”改成机器中对应的文件夹,下同):

tensorboard --logdir checkpoints/20170715-1622

4. 导出模型并执行单张图片

导出模型的方法为:

python export_graph.py \
   --checkpoint_dir checkpoints/20170715-1622 \
   --XtoY_model man2woman.pb \
   --YtoX_model woman2man.pb  \
   --image_size 256

对单张图片进行转换(将data/test.jpg替换为对应的输入图片地址):

python inference.py \
--model pretrained/man2woman.pb  \
--input data/test.jpg  \
--output data/output.jpg \
--image_size 256

总结

有已经训练好哒model,调用后发现效果很不好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/538561.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Webstorm常用快捷键

webstrom 使用 eclipse快键键 File--settings keymap 选择 eclipse 原文链接:http://www.cnblogs.com/yeminglong/p/5995421.html ------------------以下是webstrom默认的----------------------------------- Ctrl/ 或 CtrlShift/ 注释(// 或者/…

疯狂的程序员_程序员的乐趣是什么?

作者:Java3y我是一个程序员,外行人都以为我是修电脑的,我笑了笑,随意ctrl cctrl v了一把,想象着你们因为我的文章而开心不止,我感到充实而欣慰。想象着你们给我拼命点赞的样子,是多么的滑稽&…

template多行编写的方式

模板是包在 ECMAScript 2015 反引号 () 中的一个多行字符串。 反引号 () — 注意,不是单引号 () — 允许把一个字符串写在多行上, 使 HTML 模板更容易阅读。 反引号:键盘数字键1 旁边的,ESC键下面的键 如果单引号 Component({sel…

sqllite事务和MySQL事务_Android学习---SQLite数据库的增删改查和事务(transaction)调用...

上一篇文章中介绍了手工拼写sql语句进行数据库的CRUD操作,本文将介绍调用sqlite内置的方法实现CRUD操作,其实质也是通过拼写sql语句.首先,创建一个新的android项目:其次,查看代码实现增删查改:1.创建DB工具类MyDBHelper.java(创建数据库的操作)packagecom.amos.android_db;impo…

sqlserver2000给账户授予所有的权限_你的位置信息权限设置对了么?

位置信息权限是众多应用权限中的一种,是应用获取手机地理位置信息的必要凭证。在你首次安装应用并打开时,通常会出现一连串的权限弹框,如果该应用在其运行过程中会用到你的地理位置信息,那么这些弹框中就会包含一个与位置信息有关…

Python之路,Day1 - Python基础1

本节内容 Python介绍发展史Python 2 or 3?安装Hello World程序变量用户输入模块初识.pyc是个什么鬼?数据类型初识数据运算表达式if ...else语句表达式for 循环break and continue 表达式while 循环作业需求 一、 Python介绍 python的创始人为吉多范罗苏姆&#xf…

mysql 范式化_MySQL-范式和反范式

1.第一范式(1NF)(列不能再拆分)原子性,字段不可分(列的信息),只要是关系型数据库,就自动满足1NF;2.第二范式(2NF)(主键唯一,且被依赖)在第一范式基础上建立的,即满足第二范式的必须先满足第一范式。要求DB表…

java 判断是否是list_JAVA从头开始一基础梳理(4-3)

大家好,今天我们介绍一下java中常用的集合类型。首先,我们先看一下java中集合类型的结构。以上是集合的继承关系图,通常我们使用的比较多的是 Set , List , Map以及其衍生的子类和接口实现类。首先给大家介绍一下List,List本身是一…

前端网页广告无线翻滚_从小白到web前端工程师进阶之路 从0到1到更深

互联网的发展,让web前端技术发生了翻天覆地的变化,前端开发工程师可以让网页内容变得更加生动,为用户带来更好的体验。那么,武汉web前端培训哪个好?web前端好学吗?作为一个合格的Web前端工程师,…

判读一个对象不为空_ArrayList实现分析(一)——对象创建

ArrayList是java中最常用的集合类之一,它的内部实现是基于数组,因此ArryList可以根据索引实现随机访问。ArryList继承了AbstractList类,并且实现了List, RandomAccess, Cloneable接口。下面详细分析一下ArrayList的实现,下面的分析…

AngularJS与Angular的区别

指同一事物,版本的区别,叫法不同 Angular2.0之前的版本(1.x)叫做AngularJS 1.x的使用是引入AngularJS的js文件到网页。 2.0之后,就是完全不同了。 Angular2.x与Angular1.x 的区别类似 Java 和 JavaScript 或者说是…

网页控制台调用click()失败_C# 调用百度AI 人脸识别

一、设置登录百度云控制台,添加应用-添加人脸识别,查找,对比等。设置人脸识别应用记住API Key和Secret Key二、创建Demo程序1、使用Nuget安装 Baidu.AI 和 Newtonsoft.JsonNuget2、直接下载SDK https://ai.baidu.com/file/7D961BC013AB4AA790…

mysql查看服务器CPU和内存_怎么查看服务器的cpu和内存的硬件信息

可以按照如下方式进行操作:一、查看cpu总个数方法:1、首先执行top命令,如下图中内容所表示。2、在top命令的显示界面,按数字键1,即可查看到当前系统中的总cpu数,如下图中内容所表示。二、查看总内存的方法&…

极光推送指定用户推送_干货|SpringBoot集成极光推送完整实现代码(建议收藏)...

工作中经常会遇到服务器向App推送消息的需求,一般企业中选择用极光推送的比较多,在集成极光时发现极光的文档并不完整,网上的文章也很多不能直接使用,这里列出我在工作中集成极光的全部代码,只需要按照如下代码保证一次…

Babylon-AST初探-代码更新删除(Update Remove)

通过前两篇文章的介绍,大家已经了解了Create和Retrieve,我们接着介绍Update和 Remove操作。Update操作通常配合Create来完成。我们这篇文章主要介绍几个常用的NodePathAPI:replace、insert、remove。具体也可以看babel-handbook中的Manipulat…

编解码异常分析

前言 最近在做的项目,有H264解码的需求。部分H264文件解码播放后,显示为绿屏或者花屏。 分析 如何确认是否是高通硬解码的问题 adb 指令 adb root adb remount adb shell setenforce 0 adb shell setprop vendor.gralloc.disable_ubwc 1 adb shell c…

js根据name获取value_js 函数的重载

js 函数的重载我们知道,很多编程语言都有函数的重载。所谓的重载,看定义:重载,简单说,就是函数或者方法有相同的名称,但是参数列表不相同的情形,这样的同名不同参数的函数或者方法之间&#xff…

存储过程循环遍历一个月的每一天的函数_JavaScript 循环:如何处理 async/await

同步循环很久以前我写的循环是这样的:后来 JavaScript 提供了很多新的特性,现在我们会更倾向于用下面这种写法:在开发过程可能会有这么一种需求,我们需要在循环中异步处理 item,那么可以怎么做呢?异步循环如…

Angular程序架构

component,组件是Angular应用的基本构建块,你可以把一个组件理解为一段带有业务逻辑和数据的html。组件下面可以有子组件,子组件下有孙子组件,像树一样。指令:允许你向html元素添加自定义行为。模块Ngmodule&#xff1…

易语言python1.1模块_易语言之编写模块与引入模块

本人并不精通易语言,只是对其进行一定了解后做一个简单的总结。直接新建一个易语言模块,然后添加子程序即可。子程序当然可以随意命名,实际上,易语言的子程序就和c语言的函数,java中的方法一样(实际上,java…