GAN

文章目录

    • 生成对抗网络(GAN)基础
    • 生成对抗网络 优点:
    • 缺点:
    • 生成对抗网络
    • 深度GAN
    • DCGAN结构细节
    • 特征研究
    • DCGAN总结
    • 条件GAN
    • 模型结构
    • INFOGAN
    • InfoGAN: 自动学习z中部分变量意义
    • Wasserstein GAN
    • GAN存在问题
    • 原因
    • WGAN特点
    • 改进方法:

生成对抗网络(GAN)基础

组成:
D: 判别网络
G: 生成网络
Loss:判别是真实模型的概率:是/否真值
原理
z: 均匀分布变量 x:某空间的数据 zx 生成某空间数据
黑线:目标标准分布 绿线:生成数据分布
蓝线:判断函数 (根据x大小判断是否真实的概率)在这里插入图片描述

  1. 初始状态:生成数据同真实数据差距明显,容易判别
  2. 训练过程:对是否真实判断得到的loss引导生成模型更新,
    差距减少
  3. 最终状态:生成数据同真实数据相似,无法识别
  4. 假设前提:判别模型D,生成模型G具有学习能力,能够收

    目标:在这里插入图片描述
    G:relu+sigmoid nn;D:maxout

生成对抗网络 优点:

  1. 不需要大量label数据,
    loss来源于D判定
  2. 产生大量生成数据用
    于训练,接近无监督学
  3. 可以和深度神经网络
    结合

缺点:

  1. 数据直接生成,没有
    推导过程
  2. 生成器,判别器需要
    配合共同训练难度较大
  3. 容易出现训练失败

生成对抗网络

可能性:

  1. 连接神经网络扩展
  2. 输入不仅是噪声信号
  3. 时域信号生成

深度GAN

卷积神经网络+GAN
变化:生成器 G;判别器 D(conv feat ->1)
在这里插入图片描述

DCGAN结构细节

  1. 没有pooling, stride conv或deconv
  2. 运用batchnorm
  3. 不要FC
  4. 非线性激励ReLU(G), LeakyReLU (D).

特征研究

向量运算
噪声输入运算,生成不同图片
向量运算
方向插值,生成中间朝向数据

DCGAN总结

  1. GAN同深度CNN网络结合
  2. 噪声输入有着重要作用,可以实现有意义运
  3. 对输入信号实际意义可以有更深研究,定性
    输出有可能

条件GAN

 cGAN(conditional)
用一些信息对GAN的生成图片进行范围约束
信息的类型:文字;图片
训练过程输入:
随机信息+ 约束信息特征在这里插入图片描述
约束条件是图片-生成相关的图片
映射关系无限可能
图片分割
轮廓生成
热图生成
图片补全
高精度生成

模型结构

随机输入同图片结合,
G学习图片到转化图片的映射
关系,D判断生成图片和真实
图片是否一致
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
cGAN(conditional)
模型结构:D:PatchGAN
图片整体优化会造成生成的图片边界模糊,高
频信息难以估计。
解决方案:判别器关注在local区域在这里插入图片描述

INFOGAN

DCGAN中,随机参数z的值有一定实际意义,如果有
text label可以学习这种约束关系,如果没有label数据,
能否自动学会确定映射关系?

InfoGAN: 自动学习z中部分变量意义

  1. Z分为两部分,c和z
  2. c代表数据分布某种物理意义,z随机信号
  3. DCGAN,InfoGAN 没有额外数据标注
    DCGAN z对生成数据控制作用不确定,需要尝试观察
    InfoGAN 没有额外标注,能够学到c与生成图片关系。 引
    入Mutual Info概念。参与目标函数的确定,关系越紧密I越
    高,训练过程使Mutual Info高,实现生成图片同c的联系。在这里插入图片描述 InfoGAN结果
    确定c向量长度
    观察各个c物理意义
    特点:无监督学习
    自动学到模式
    可用于生成特点图片
    要求:训练图片模式
    比较明显

Wasserstein GAN

GAN存在问题

训练困难,G k次,D一次。。
Loss无法知道优化
生成样本单一
改进方案靠暴力尝试

原因

Loss函数选择不合适,使模型容易面临梯度消失,
梯度不稳定,优化目标不定导致模型失败

WGAN特点

  1. 无需平衡D,G的训练组合
  2. 解决collapse model问题,保证样本多样性
  3. 结构更改简单有效

改进方法:

  1. 判别器最后一层去掉sigmoid
  2. 生成器和判别器的loss不取log
  3. 判别器的参数更新截断
  4. 不要用基于动量的优化算法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/467703.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

sql 查询统计最近7天,30天,1年的数据

统计最近7天每天的数据 第一个查询统计了最近7天内,每天创建的’WAIT_SEND’状态的订单数量。这是通过将当前日期向前推移6天(DATE_SUB(CURDATE(), INTERVAL 6 DAY))实现的。然后,它会按照创建日期对结果进行分组(GROU…

1200可以读取modbus tcp_S7-1200 作 MODBUS TCP服务器

S7-1200 Modbus TCP 通信指令块STEP 7 V13 SP1 软件版本中的Modbus TCP库指令目前最新的版本已升至V4.0,该版本的使用需要具备以下两个条件:1. 软件版本: STEP 7 V13 SP1及其以上2. 固件版本: S7-1200 CPU 的固件版本V4.1图1. Mod…

判断对象oStringObject是否为String

1.操作符 (1)typeof操作符 格式:resulttypeof variable 返回值: undefined 值未定义 boolean 布尔值 string 字符串 number 数值 object 对象、null function 函数 (2)instanceof操作符 格式:re…

Linux一定需要文件系统吗?

开篇题外话:对于Linux初学者来说,这是一个很纠结的问题,但这也是一个很关键的问题! 一语破天机:“尽管内核是 Linux 的核心,但文件却是用户与操作系统交互所采用的主要工具。这对 Linux 来说尤其如…

迁移学习

文章目录为什么需要迁移学习模型Fine-‐tune![在这里插入图片描述](https://img-blog.csdnimg.cn/20200612000845217.png)保守训练层迁移Multitask Learning渐进式神经网络/Progressive Neural Networks域对抗零样本学习Self-‐taught learning为什么需要迁移学习 使用深度学习…

RNA-Seq分析软件HTSeq的安装

1.本人刚开始安装的时候,先下载相关的软件包,然后安装installtion中的方法安装, 运行的时候老是报错。根据错误提示安装解决方法。也参考了其他的笔友的一些建议, 发现特别麻烦,后来无意中发现有小伙伴用bioconda来安装…

怎么撤回操作_微信又更新,拍一拍能撤回了

微信拍一拍功能在 6 月份刚上线时,「微信之父」张小龙就发朋友圈表示,微信史上仅需一行代码的有趣功能终于来了,拍一拍,像蚂蚁一样打招呼。拍一拍功能将大家在现实世界的肢体交流带到了虚拟世界,相信大家都有儿时和三俩…

吹牛

起了一个不太雅观的标题,我很想给我们的会晤起一个响亮的名字,比如「三方会谈」或者「新一代5.4事件」,再或者牛逼点的,我们可以叫「西乡起义」。好吧,我摊牌了,这次吃饭就是三个屌丝和一个大佬的闲暇吹牛&…

迁移学习实战

文章目录预处理网络模型的构建网络的训练网络模型的验证预处理 from __future__ import absolute_import from __future__ import division from __future__ import print_functionimport tensorflow as tffrom tensorflow.python.ops import control_flow_opsdef apply_with_…

Spring MVC-视图解析器(View Resolverr)-内部资源视图解析器(Internal Resource View Resolver)示例(转载实践)...

以下内容翻译自:https://www.tutorialspoint.com/springmvc/springmvc_internalresourceviewresolver.htm 说明:示例基于Spring MVC 4.1.6。 InternalResourceViewResolver用于将提供的URI解析为实际的URI。以下示例显示如何使用Spring Web MVC框架使用I…

手机是怎么确定位置信息的?

#手机是怎么定位的?定位是一个老生常谈的话题,最近几年还在讨论一个热点技术话题「室内定位」,从我知道这个技术到现在已经过了好几年了,也出现了一些室内定位的方案,而我们的手机是如何进行定位的,又有哪些…

tablestore列式存储原理_10分钟搞透:技术人必会的MySQL体系结构与存储引擎!

MySQL是目前使用最广的开源数据库,不管从装机量、使用人群、专职人员、社区发展,还是基于MySQL的其他分支,都是当之无愧的No.1。 本文将从以下4个方面,带你搞透MySQL体系结构与存储引擎。主要包括:1、MySQL数据库的体系…

使用Adobe Audition生成基本音频

#首先打开软件 #新建一个音频 #在效果菜单栏插入基本音频

viewpager 跳转到指定页面

viewPager.setCurrentItem(getUserIndex(userId)); seCurrentItem是定位到指定页面参数是position转载于:https://www.cnblogs.com/wmxl/p/7500647.html

vue里实现同步执行方法_vue中的watch方法 实时同步存储数据

RFID基础知识 BS:BinarySearch. TSA:TimeSlottedAloha. BSA:基本二进制搜索算法. DBSA:动态二进制搜索算法. RBSA:后退式二进制搜索算法. FSA:Frame Slo ... WampServer修改MySQL密码 WampServer安装后密码是空的,需要设置一下 一般有两种方式: 一是通过phpMyAdmin直接修改: 二…

更多网络类型

文章目录丰富网络类型CPPN孪生网络Triplet Network应用Variational Auto-encoder强化学习Markov decision processesBellman公式丰富网络类型 深度学习除了经典卷积神经网络,循环神经网络还有广泛的网络类型 CPPN 网络输入是像素坐标值(x,…

Tyvj1091

题目链接 分析: 最近做的区间dp挺多 最简单的:n^3枚举,显然TLE 其实有一个很显然的dp状态: f[i][j]表示结尾是i,j的等差数列的数量: f[i][j]Σ(f[k][j]1) (a[i]-a[j]a[j]-a[k]) 但是这样的复杂度也是…

更多框架

文章目录关于框架Caffe基于层的设计思路Protocol Buffer 技术prototxt .caffemodel文件caffe的训练主要特点TorchLUA语言主要特点Tensorflowcomputation graphsMXNET关于框架 Caffe 依赖大量第三方库 为了读取图像,以及简单的图像处理,连接很重的Openc…

.net的label的背景如何设置成为透明_css如何设置背景图片?background属性添加背景图片...

在前端开发过程中,为了页面的美观,往往都会给html页面添加背景图片。那么如何利用css设置html中用图片做背景?本章就给大家介绍css怎样设置背景图片。有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。程…

苹果uwb定位技术

昨天的文章简单说明了手机定位的技术,文章写的比较简单,但是阅读量却还可以,这篇文章转一个uwb定位技术的文章,让更多的人了解这项技术。相关阅读:手机是怎么确定位置信息的?载波和LoRa#前言关于昨天的文章…