GAN

文章目录

    • 生成对抗网络(GAN)基础
    • 生成对抗网络 优点:
    • 缺点:
    • 生成对抗网络
    • 深度GAN
    • DCGAN结构细节
    • 特征研究
    • DCGAN总结
    • 条件GAN
    • 模型结构
    • INFOGAN
    • InfoGAN: 自动学习z中部分变量意义
    • Wasserstein GAN
    • GAN存在问题
    • 原因
    • WGAN特点
    • 改进方法:

生成对抗网络(GAN)基础

组成:
D: 判别网络
G: 生成网络
Loss:判别是真实模型的概率:是/否真值
原理
z: 均匀分布变量 x:某空间的数据 zx 生成某空间数据
黑线:目标标准分布 绿线:生成数据分布
蓝线:判断函数 (根据x大小判断是否真实的概率)在这里插入图片描述

  1. 初始状态:生成数据同真实数据差距明显,容易判别
  2. 训练过程:对是否真实判断得到的loss引导生成模型更新,
    差距减少
  3. 最终状态:生成数据同真实数据相似,无法识别
  4. 假设前提:判别模型D,生成模型G具有学习能力,能够收

    目标:在这里插入图片描述
    G:relu+sigmoid nn;D:maxout

生成对抗网络 优点:

  1. 不需要大量label数据,
    loss来源于D判定
  2. 产生大量生成数据用
    于训练,接近无监督学
  3. 可以和深度神经网络
    结合

缺点:

  1. 数据直接生成,没有
    推导过程
  2. 生成器,判别器需要
    配合共同训练难度较大
  3. 容易出现训练失败

生成对抗网络

可能性:

  1. 连接神经网络扩展
  2. 输入不仅是噪声信号
  3. 时域信号生成

深度GAN

卷积神经网络+GAN
变化:生成器 G;判别器 D(conv feat ->1)
在这里插入图片描述

DCGAN结构细节

  1. 没有pooling, stride conv或deconv
  2. 运用batchnorm
  3. 不要FC
  4. 非线性激励ReLU(G), LeakyReLU (D).

特征研究

向量运算
噪声输入运算,生成不同图片
向量运算
方向插值,生成中间朝向数据

DCGAN总结

  1. GAN同深度CNN网络结合
  2. 噪声输入有着重要作用,可以实现有意义运
  3. 对输入信号实际意义可以有更深研究,定性
    输出有可能

条件GAN

 cGAN(conditional)
用一些信息对GAN的生成图片进行范围约束
信息的类型:文字;图片
训练过程输入:
随机信息+ 约束信息特征在这里插入图片描述
约束条件是图片-生成相关的图片
映射关系无限可能
图片分割
轮廓生成
热图生成
图片补全
高精度生成

模型结构

随机输入同图片结合,
G学习图片到转化图片的映射
关系,D判断生成图片和真实
图片是否一致
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
cGAN(conditional)
模型结构:D:PatchGAN
图片整体优化会造成生成的图片边界模糊,高
频信息难以估计。
解决方案:判别器关注在local区域在这里插入图片描述

INFOGAN

DCGAN中,随机参数z的值有一定实际意义,如果有
text label可以学习这种约束关系,如果没有label数据,
能否自动学会确定映射关系?

InfoGAN: 自动学习z中部分变量意义

  1. Z分为两部分,c和z
  2. c代表数据分布某种物理意义,z随机信号
  3. DCGAN,InfoGAN 没有额外数据标注
    DCGAN z对生成数据控制作用不确定,需要尝试观察
    InfoGAN 没有额外标注,能够学到c与生成图片关系。 引
    入Mutual Info概念。参与目标函数的确定,关系越紧密I越
    高,训练过程使Mutual Info高,实现生成图片同c的联系。在这里插入图片描述 InfoGAN结果
    确定c向量长度
    观察各个c物理意义
    特点:无监督学习
    自动学到模式
    可用于生成特点图片
    要求:训练图片模式
    比较明显

Wasserstein GAN

GAN存在问题

训练困难,G k次,D一次。。
Loss无法知道优化
生成样本单一
改进方案靠暴力尝试

原因

Loss函数选择不合适,使模型容易面临梯度消失,
梯度不稳定,优化目标不定导致模型失败

WGAN特点

  1. 无需平衡D,G的训练组合
  2. 解决collapse model问题,保证样本多样性
  3. 结构更改简单有效

改进方法:

  1. 判别器最后一层去掉sigmoid
  2. 生成器和判别器的loss不取log
  3. 判别器的参数更新截断
  4. 不要用基于动量的优化算法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/467703.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

1200可以读取modbus tcp_S7-1200 作 MODBUS TCP服务器

S7-1200 Modbus TCP 通信指令块STEP 7 V13 SP1 软件版本中的Modbus TCP库指令目前最新的版本已升至V4.0,该版本的使用需要具备以下两个条件:1. 软件版本: STEP 7 V13 SP1及其以上2. 固件版本: S7-1200 CPU 的固件版本V4.1图1. Mod…

Linux一定需要文件系统吗?

开篇题外话:对于Linux初学者来说,这是一个很纠结的问题,但这也是一个很关键的问题! 一语破天机:“尽管内核是 Linux 的核心,但文件却是用户与操作系统交互所采用的主要工具。这对 Linux 来说尤其如…

迁移学习

文章目录为什么需要迁移学习模型Fine-‐tune![在这里插入图片描述](https://img-blog.csdnimg.cn/20200612000845217.png)保守训练层迁移Multitask Learning渐进式神经网络/Progressive Neural Networks域对抗零样本学习Self-‐taught learning为什么需要迁移学习 使用深度学习…

怎么撤回操作_微信又更新,拍一拍能撤回了

微信拍一拍功能在 6 月份刚上线时,「微信之父」张小龙就发朋友圈表示,微信史上仅需一行代码的有趣功能终于来了,拍一拍,像蚂蚁一样打招呼。拍一拍功能将大家在现实世界的肢体交流带到了虚拟世界,相信大家都有儿时和三俩…

吹牛

起了一个不太雅观的标题,我很想给我们的会晤起一个响亮的名字,比如「三方会谈」或者「新一代5.4事件」,再或者牛逼点的,我们可以叫「西乡起义」。好吧,我摊牌了,这次吃饭就是三个屌丝和一个大佬的闲暇吹牛&…

Spring MVC-视图解析器(View Resolverr)-内部资源视图解析器(Internal Resource View Resolver)示例(转载实践)...

以下内容翻译自:https://www.tutorialspoint.com/springmvc/springmvc_internalresourceviewresolver.htm 说明:示例基于Spring MVC 4.1.6。 InternalResourceViewResolver用于将提供的URI解析为实际的URI。以下示例显示如何使用Spring Web MVC框架使用I…

手机是怎么确定位置信息的?

#手机是怎么定位的?定位是一个老生常谈的话题,最近几年还在讨论一个热点技术话题「室内定位」,从我知道这个技术到现在已经过了好几年了,也出现了一些室内定位的方案,而我们的手机是如何进行定位的,又有哪些…

tablestore列式存储原理_10分钟搞透:技术人必会的MySQL体系结构与存储引擎!

MySQL是目前使用最广的开源数据库,不管从装机量、使用人群、专职人员、社区发展,还是基于MySQL的其他分支,都是当之无愧的No.1。 本文将从以下4个方面,带你搞透MySQL体系结构与存储引擎。主要包括:1、MySQL数据库的体系…

使用Adobe Audition生成基本音频

#首先打开软件 #新建一个音频 #在效果菜单栏插入基本音频

更多网络类型

文章目录丰富网络类型CPPN孪生网络Triplet Network应用Variational Auto-encoder强化学习Markov decision processesBellman公式丰富网络类型 深度学习除了经典卷积神经网络,循环神经网络还有广泛的网络类型 CPPN 网络输入是像素坐标值(x,…

更多框架

文章目录关于框架Caffe基于层的设计思路Protocol Buffer 技术prototxt .caffemodel文件caffe的训练主要特点TorchLUA语言主要特点Tensorflowcomputation graphsMXNET关于框架 Caffe 依赖大量第三方库 为了读取图像,以及简单的图像处理,连接很重的Openc…

.net的label的背景如何设置成为透明_css如何设置背景图片?background属性添加背景图片...

在前端开发过程中,为了页面的美观,往往都会给html页面添加背景图片。那么如何利用css设置html中用图片做背景?本章就给大家介绍css怎样设置背景图片。有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。程…

苹果uwb定位技术

昨天的文章简单说明了手机定位的技术,文章写的比较简单,但是阅读量却还可以,这篇文章转一个uwb定位技术的文章,让更多的人了解这项技术。相关阅读:手机是怎么确定位置信息的?载波和LoRa#前言关于昨天的文章…

springboot导包显示不存在_(一)SpringBoot搭建基本后端应用

boot在计算机术语中是启动的意思,SpringBoot也就是Spring的启动器。稍有经验的JavaWeb程序员对于传统SSM结构的MVC应用,大多数最不好的体验就是搭建一个项目需要进行大量的配置。稍有不慎就可能采坑。更关键的是有些配置基本就不会去进行定制化修改。为了…

f12获取网页文本_8招教你快速搞定网页内容禁止复制粘贴,想怎么复制就怎么复制...

大家平时在搜索资料、浏览网页时,经常会复制一些内容。尤其是文字比较多时,比起一个个字手打,复制能省下不少功夫。可有时候好不容易找到资料了,却发现有些网站上的内容文本复制不了?甚至右键菜单都打不开!…

为什么需要超过48k的采样音频?

最近在看音频的事情,随便拿点东西出来聊一下,如果说的不对,请用棒槌来打我,这样我晚上睡觉就不用数绵羊了。我播放一个20HZ~20KHZ的音频,如下图我使用16K的采样率来采集它是声音信号,获取音频如下图我使用4…

Linux io内存存在的意义~

今天是母亲节,首先祝各位读者的母亲节日快乐,祝你们的母亲年轻健康。母亲节是一个亘古的话题,我本来想写个文章,但是想起来这周就一个周末,要花点时间陪下家人,昨天我们老大开会,特别说了&#…

imx6 配置串口波特率_RS232串口多机通信

一、基本原理1、主从多机通信拓扑图2、主从多机通信的具体过程 1)使所有的从机的SM2位置1,以便接收主机发来的地址;2)主机发出一帧地址信息,其中包括8位需要与之通信的从机地址,第9位为1;3)所有从机接收到地址帧后&…

一个故事讲完CPU的工作原理

上二年级的小明正坐在教室里。现在是数学课,下午第一节,窗外的蝉鸣、缓缓旋转的吊扇让同学们昏昏欲睡。此时,刘老师在黑板上写下一个问题:6324 244675 ?小明抬头看了一眼,觉得这两个数字挺眼熟。他昨天翘…

axure弹窗关闭_干货来袭,Axure插入图标的几种办法

前言在日常绘制原型的时候,经常会需要插入相应的图标(icon)到Axure中,但是看似好像很简单的事情也给蛮多小伙伴造成了困扰。现在很多开发团队都会用一些比较常见的前端框架来搭建后台管理系统,例如常见的Element-UI&am…