GAN

GAN

news/2025/4/9 8:38:25/文章来源:https://blog.csdn.net/weixin_43663780/article/details/106695868

文章目录

- 生成对抗网络(GAN)基础
- 生成对抗网络优点：
- 缺点：
- 生成对抗网络
- 深度GAN
- DCGAN结构细节
- 特征研究
- DCGAN总结
- 条件GAN
- 模型结构
- INFOGAN
- InfoGAN: 自动学习z中部分变量意义
- Wasserstein GAN
- GAN存在问题
- 原因
- WGAN特点
- 改进方法：

生成对抗网络(GAN)基础

组成：
D：判别网络
G：生成网络
Loss：判别是真实模型的概率：是／否真值
原理
z: 均匀分布变量 x：某空间的数据 zx 生成某空间数据
黑线：目标标准分布绿线：生成数据分布
蓝线：判断函数（根据x大小判断是否真实的概率）在这里插入图片描述

初始状态：生成数据同真实数据差距明显，容易判别
训练过程：对是否真实判断得到的loss引导生成模型更新，
差距减少
最终状态：生成数据同真实数据相似，无法识别
假设前提：判别模型D，生成模型G具有学习能力，能够收
敛
目标：
G：relu＋sigmoid nn；D：maxout

生成对抗网络优点：

不需要大量label数据，
loss来源于D判定
产生大量生成数据用
于训练，接近无监督学
习
可以和深度神经网络
结合

缺点：

数据直接生成，没有
推导过程
生成器，判别器需要
配合共同训练难度较大
容易出现训练失败

生成对抗网络

可能性：

连接神经网络扩展
输入不仅是噪声信号
时域信号生成

深度GAN

卷积神经网络＋GAN
变化：生成器 G；判别器 D(conv feat ->1)
在这里插入图片描述

DCGAN结构细节

没有pooling， stride conv或deconv
运用batchnorm
不要FC
非线性激励ReLU(G), LeakyReLU (D).

特征研究

向量运算
噪声输入运算，生成不同图片
向量运算
方向插值，生成中间朝向数据

DCGAN总结

GAN同深度CNN网络结合
噪声输入有着重要作用，可以实现有意义运
算
对输入信号实际意义可以有更深研究，定性
输出有可能

条件GAN

 cGAN（conditional）
用一些信息对GAN的生成图片进行范围约束
信息的类型：文字；图片
训练过程输入：
随机信息＋约束信息特征在这里插入图片描述
约束条件是图片－生成相关的图片
映射关系无限可能
图片分割
轮廓生成
热图生成
图片补全
高精度生成

模型结构

随机输入同图片结合，
G学习图片到转化图片的映射
关系，D判断生成图片和真实
图片是否一致
在这里插入图片描述

cGAN（conditional）
模型结构：D：PatchGAN
图片整体优化会造成生成的图片边界模糊，高
频信息难以估计。
解决方案：判别器关注在local区域

INFOGAN

DCGAN中，随机参数z的值有一定实际意义，如果有
text label可以学习这种约束关系，如果没有label数据，
能否自动学会确定映射关系？

InfoGAN: 自动学习z中部分变量意义

Z分为两部分，c和z
c代表数据分布某种物理意义，z随机信号
DCGAN，InfoGAN 没有额外数据标注
DCGAN z对生成数据控制作用不确定，需要尝试观察
InfoGAN 没有额外标注，能够学到c与生成图片关系。引
入Mutual Info概念。参与目标函数的确定，关系越紧密I越
高，训练过程使Mutual Info高，实现生成图片同c的联系。 InfoGAN结果
确定c向量长度
观察各个c物理意义
特点：无监督学习
自动学到模式
可用于生成特点图片
要求：训练图片模式
比较明显

Wasserstein GAN

GAN存在问题

训练困难，G k次，D一次。。
Loss无法知道优化
生成样本单一
改进方案靠暴力尝试

原因

Loss函数选择不合适，使模型容易面临梯度消失，
梯度不稳定，优化目标不定导致模型失败

WGAN特点

无需平衡D，G的训练组合
解决collapse model问题，保证样本多样性
结构更改简单有效

改进方法：

判别器最后一层去掉sigmoid
生成器和判别器的loss不取log
判别器的参数更新截断
不要用基于动量的优化算法

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/467703.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

sql 查询统计最近7天，30天，1年的数据

sql 查询统计最近7天，30天，1年的数据

统计最近7天每天的数据第一个查询统计了最近7天内，每天创建的’WAIT_SEND’状态的订单数量。这是通过将当前日期向前推移6天（DATE_SUB(CURDATE(), INTERVAL 6 DAY)）实现的。然后，它会按照创建日期对结果进行分组（GROU…

阅读更多...

1200可以读取modbus tcp_S7-1200 作 MODBUS TCP服务器

1200可以读取modbus tcp_S7-1200 作 MODBUS TCP服务器

S7-1200 Modbus TCP 通信指令块STEP 7 V13 SP1 软件版本中的Modbus TCP库指令目前最新的版本已升至V4.0，该版本的使用需要具备以下两个条件：1. 软件版本： STEP 7 V13 SP1及其以上2. 固件版本： S7-1200 CPU 的固件版本V4.1图1. Mod…

阅读更多...

判断对象oStringObject是否为String

判断对象oStringObject是否为String

1.操作符 （1）typeof操作符格式：resulttypeof variable 返回值： undefined 值未定义 boolean 布尔值 string 字符串 number 数值 object 对象、null function 函数 （2）instanceof操作符格式：re…

阅读更多...

Linux一定需要文件系统吗？

Linux一定需要文件系统吗？

开篇题外话：对于Linux初学者来说，这是一个很纠结的问题，但这也是一个很关键的问题！ 一语破天机：“尽管内核是 Linux 的核心，但文件却是用户与操作系统交互所采用的主要工具。这对 Linux 来说尤其如…

阅读更多...

迁移学习

迁移学习

文章目录为什么需要迁移学习模型Fine-‐tune![在这里插入图片描述](https://img-blog.csdnimg.cn/20200612000845217.png)保守训练层迁移Multitask Learning渐进式神经网络/Progressive Neural Networks域对抗零样本学习Self-‐taught learning为什么需要迁移学习使用深度学习…

阅读更多...

RNA-Seq分析软件HTSeq的安装

RNA-Seq分析软件HTSeq的安装

1.本人刚开始安装的时候，先下载相关的软件包，然后安装installtion中的方法安装， 运行的时候老是报错。根据错误提示安装解决方法。也参考了其他的笔友的一些建议， 发现特别麻烦，后来无意中发现有小伙伴用bioconda来安装…

阅读更多...

怎么撤回操作_微信又更新，拍一拍能撤回了

怎么撤回操作_微信又更新，拍一拍能撤回了

微信拍一拍功能在 6 月份刚上线时，「微信之父」张小龙就发朋友圈表示，微信史上仅需一行代码的有趣功能终于来了，拍一拍，像蚂蚁一样打招呼。拍一拍功能将大家在现实世界的肢体交流带到了虚拟世界，相信大家都有儿时和三俩…

阅读更多...

吹牛

起了一个不太雅观的标题，我很想给我们的会晤起一个响亮的名字，比如「三方会谈」或者「新一代5.4事件」，再或者牛逼点的，我们可以叫「西乡起义」。好吧，我摊牌了，这次吃饭就是三个屌丝和一个大佬的闲暇吹牛&…

阅读更多...

迁移学习实战

迁移学习实战

文章目录预处理网络模型的构建网络的训练网络模型的验证预处理 from __future__ import absolute_import from __future__ import division from __future__ import print_functionimport tensorflow as tffrom tensorflow.python.ops import control_flow_opsdef apply_with_…

阅读更多...

Spring MVC-视图解析器（View Resolverr）-内部资源视图解析器（Internal Resource View Resolver）示例（转载实践）...

Spring MVC-视图解析器（View Resolverr）-内部资源视图解析器（Internal Resource View Resolver）示例（转载实践）...

以下内容翻译自：https://www.tutorialspoint.com/springmvc/springmvc_internalresourceviewresolver.htm 说明：示例基于Spring MVC 4.1.6。 InternalResourceViewResolver用于将提供的URI解析为实际的URI。以下示例显示如何使用Spring Web MVC框架使用I…

阅读更多...

手机是怎么确定位置信息的？

手机是怎么确定位置信息的？

#手机是怎么定位的？定位是一个老生常谈的话题，最近几年还在讨论一个热点技术话题「室内定位」，从我知道这个技术到现在已经过了好几年了，也出现了一些室内定位的方案，而我们的手机是如何进行定位的，又有哪些…

阅读更多...

tablestore列式存储原理_10分钟搞透：技术人必会的MySQL体系结构与存储引擎！

tablestore列式存储原理_10分钟搞透：技术人必会的MySQL体系结构与存储引擎！

MySQL是目前使用最广的开源数据库，不管从装机量、使用人群、专职人员、社区发展，还是基于MySQL的其他分支，都是当之无愧的No.1。本文将从以下4个方面，带你搞透MySQL体系结构与存储引擎。主要包括：1、MySQL数据库的体系…

阅读更多...

使用Adobe Audition生成基本音频

使用Adobe Audition生成基本音频

#首先打开软件 #新建一个音频 #在效果菜单栏插入基本音频

阅读更多...

viewpager 跳转到指定页面

viewpager 跳转到指定页面

viewPager.setCurrentItem(getUserIndex(userId)); seCurrentItem是定位到指定页面参数是position转载于:https://www.cnblogs.com/wmxl/p/7500647.html

阅读更多...

vue里实现同步执行方法_vue中的watch方法实时同步存储数据

vue里实现同步执行方法_vue中的watch方法实时同步存储数据

RFID基础知识 BS:BinarySearch. TSA:TimeSlottedAloha. BSA:基本二进制搜索算法. DBSA:动态二进制搜索算法. RBSA:后退式二进制搜索算法. FSA:Frame Slo ... WampServer修改MySQL密码 WampServer安装后密码是空的,需要设置一下一般有两种方式: 一是通过phpMyAdmin直接修改: 二…

阅读更多...

更多网络类型

更多网络类型

文章目录丰富网络类型CPPN孪生网络Triplet Network应用Variational Auto-encoder强化学习Markov decision processesBellman公式丰富网络类型深度学习除了经典卷积神经网络，循环神经网络还有广泛的网络类型 CPPN 网络输入是像素坐标值（x，…

阅读更多...

Tyvj1091

Tyvj1091

题目链接分析： 最近做的区间dp挺多最简单的：n^3枚举，显然TLE 其实有一个很显然的dp状态： f[i][j]表示结尾是i，j的等差数列的数量： f[i][j]Σ(f[k][j]1) (a[i]-a[j]a[j]-a[k]) 但是这样的复杂度也是…

阅读更多...

更多框架

更多框架

文章目录关于框架Caffe基于层的设计思路Protocol Buffer 技术prototxt .caffemodel文件caffe的训练主要特点TorchLUA语言主要特点Tensorflowcomputation graphsMXNET关于框架 Caffe 依赖大量第三方库为了读取图像，以及简单的图像处理，连接很重的Openc…

阅读更多...

.net的label的背景如何设置成为透明_css如何设置背景图片？background属性添加背景图片...

.net的label的背景如何设置成为透明_css如何设置背景图片？background属性添加背景图片...

在前端开发过程中，为了页面的美观，往往都会给html页面添加背景图片。那么如何利用css设置html中用图片做背景？本章就给大家介绍css怎样设置背景图片。有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。程…

阅读更多...

苹果uwb定位技术

苹果uwb定位技术

昨天的文章简单说明了手机定位的技术，文章写的比较简单，但是阅读量却还可以，这篇文章转一个uwb定位技术的文章，让更多的人了解这项技术。相关阅读：手机是怎么确定位置信息的？载波和LoRa#前言关于昨天的文章…

阅读更多...

最新文章