深度学习（34）—— StarGAN（1）

news/2025/4/26 18:12:25/文章来源:https://blog.csdn.net/qq_43368987/article/details/132083474

深度学习（34）—— StarGAN（1）

文章目录

深度学习（34）—— StarGAN（1）
- 1. 背景
- 2. 基本思路
- 3. 整体流程
- 4. StarGAN v2
- - (1) 网络结构
  - (2) mapping network
  - (3) style encoder
  - (4)Loss

和之前一样还是先理论后代码，所以这一讲还是StarGAN的理论。

1. 背景

先回忆一下，之前写的cyclegan，可以实现两个域之间的相互转换。即下面这几种情况：

将输入人像转化为我想要的图像发色
将输入人像转化为我想要的性别
将输入人像转化为我想要的年龄
将输入人像转化为我想要的肤色

上面这种两个域之间的转化使用cyclegan就可以实现，但是如果想要实现在K个域的相互转化，使用cyclegan就需要训练k（k-1）个generator网络，时间成本和计算成本都太大。
在这里插入图片描述
可不可以只训练一个模型，根据我的reference图片的特征将source转化为我想要的图片？
为了满足这一需求，就出现了StarGAN

2. 基本思路

使用StarGAN，只需要训练一个generator。相比cyclegan，StarGAN在输入时增加了类型编码（可以理解为【转化肤色，转化年龄，转化性别，转化发色】的编码）
无论是generator还是discriminator都增加这样的编码向量

3. 整体流程

在这里插入图片描述
generator

输入一张image和目标域 target domain的编码（向量）经过generator生成targaet domain的fake image
将得到的fake image 和原图的domain输入generator生成restructed image（与input image 做loss）
此时将fake image输入discriminator中让他辨别fake image的真假，还要输出domain 的编码，试图骗过discriminator

discriminator

在训练过程中，输入real image 和 fake image，经过discriminator不但要辨别每张image的真假，还要辨别每张照片属于的domain编码

4. StarGAN v2

上面说的都是StarGANv1，他针对domain做了one-hot 编码，一个编码一个风格。
v2相对于v1的进步是用实际的特征向量作为风格的编码，在特征基础上进行提取和分析。v1中只使用one-hot编码学不到每种风格的具体知识

(1) 网络结构

在这里插入图片描述
相较于v1,v2主要对每种风格进行编码，使用到 mapping network 和 style encoder

(2) mapping network

随机生成的一个向量编码latent code 和一张图片经过网络后将当前的latent coder 编码成属于该图片风格的特征，用于代表该风格domain的编码

(3) style encoder

输入一张图片经过该encoder可以得到属于这张照片的风格domain编码。

(4)Loss

在正常的GAN网络基础上增加了三个额外的loss

style_loss：mapping 得到的style 编码要尽可能与style得到的style 编码相似。
diversity_loss：同一张图变换为不同风格，变换后的两者要尽可能的存在较大差异（差异多样性）
cycle_loss :转化的是风格，不能主体变得太离谱，真实的和rec之间的loss【和cyclegan中的一个loss 一样】

okk，今天就先这么多，代码讲解，明天吧，整个项目，老地方github上！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/24599.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

4个顶级的支持消费级硬件的NeRF软件平台

4个顶级的支持消费级硬件的NeRF软件平台

似乎每天都有大量的创新发布，人们很容易感到不知所措。因此，让我们放慢脚步，看看4个主流的支持消费级硬件的NeRF 平台。推荐：用 NSDT设计器快速搭建可编程3D场景。 1、Instant-NGP（Instant-NeRF） 2022 年…

阅读更多...

【CTF】Python原型链污染

【CTF】Python原型链污染

Python原型链污染原型链在Python中每个对象都有一个原型，原型上定义了对象可以访问的属性和方法。当对象访问属性或方法时，会先在自身查找，如果找不到就会去原型链上的上级对象中查找，原型链污染攻击的思路是通过修改对象原型…

阅读更多...

计算机网络-三种交换方式

计算机网络-三种交换方式

计算机网络-三种交换方式电路交换(Circuit Switching) 电话交换机接通电话线的方式称为电路交换从通信资源分配的角度来看，交换(Switching)就是按照某种方式动态的分配传输线路的资源电话交换机为了解决电话之间通信两两之间连线过多，所以产生了电话…

阅读更多...

认识 spring AOP (面向切面编程) - springboot

认识 spring AOP (面向切面编程) - springboot

前言本篇介绍什么是spring AOP, AOP的优点，使用场景，spring AOP的组成，简单实现AOP 并了解它的通知；如有错误，请在评论区指正，让我们一起交流，共同进步！ 文章目录前言1. 什么是s…

阅读更多...

快速制作美容行业预约小程序

快速制作美容行业预约小程序

随着科技的不断进步，移动互联网的快速发展，小程序成为了很多行业迅速发展的利器。对于美容行业来说，一款美容预约小程序不仅可以方便用户进行预约，还可以提升美容店铺的服务质量和管理效率。下面，我们来介绍一下如何快…

阅读更多...

K8S deployment 重启的三种方法

K8S deployment 重启的三种方法

一般重启deployment，常规操作是删掉对应的pod, 但如果有多个副本集的话，一个个删很麻烦。除了删除pod，还可以： 方案一： 加上环境变量 kubectl patch deploy <deployment-name> -p {"spec":{"…

阅读更多...

【云原生K8s】初识Kubernetes的理论基础

【云原生K8s】初识Kubernetes的理论基础

K8S由google的Borg系统(博格系统，google内部使用的大规模容器编排工具)作为原型，后经GO语言延用Borg的思路重写并捐献给CNCF基金会开源。云原生基金会（CNCF）于2015年12月成立，隶属于Linux基金会。CNCF孵化的第一个项目…

阅读更多...

iOS——Block循环引用

iOS——Block循环引用

Capturing ‘self’ strongly in this block is likely to lead to a retain cycle 典型的循环引用 self持有了blockblock持有了self(self.name) 这样就形成了self -> block -> self的循环引用解决办法强弱共舞使用中介者模式 __weak typeof(self) weakSelf sel…

阅读更多...

认识MyBatis 之 MyBatis的动态SQL

认识MyBatis 之 MyBatis的动态SQL

前言本篇介绍MyBatis里如何使用动态SQL，了解如何去简单使用动态标签；如有错误，请在评论区指正，让我们一起交流，共同进步！ 文章目录前言MyBatis - 动态 SQLif标签trim标签where标签update set 标签delet…

阅读更多...

F5 LTM 知识点和实验 10-基础配置

F5 LTM 知识点和实验 10-基础配置

第十章基础配置 VLAN VLAN是对物理网络进行逻辑分区的一种方式，可以创建不同的广播域。将具有共同要求的主机分组在一个VLAN中——不管它们的物理位置如何——提供了明显的优势，包括: 减小广播域的大小，从而提高网络的整体性能显著减少系统和网络维护任务(功能相关的主机…

阅读更多...

【Spring Boot】（二）Spring Boot 配置文件的探索之旅

【Spring Boot】（二）Spring Boot 配置文件的探索之旅

文章目录前言一、配置文件的作用二、配置文件的格式2.1 Spring Boot 配置文件格式2.2 properties 和 yml 的区别三、properties 配置文件3.1 properties 基本语法3.2 配置文件的读取3.3 properties 优缺点分析四、yml 配置文件说明4.1 yml 基本语法4.2 yml 使用案例4.3 yml …

阅读更多...

两数相加 LeetCode热题100

两数相加 LeetCode热题100

题目给你两个非空的链表，表示两个非负的整数。它们每位数字都是按照逆序的方式存储的，并且每个节点只能存储一位数字。请你将两个数相加，并以相同形式返回一个表示和的链表。你可以假设除了数字 0 之外，这两个数都不会…

阅读更多...

el-table某一列嵌套使用el-popover,使用click触发，导致页面下拉框组件无法触发弹框关闭（解决办法）

el-table某一列嵌套使用el-popover,使用click触发，导致页面下拉框组件无法触发弹框关闭（解决办法）

在弹框触发的方法里加上document.body.click() 即可尝试了很多其他的方法都没用，只有这个解决了完整代码： <el-select change"sourceChange" clearable ><el-optionv-for"option in list1":key"option.code":…

阅读更多...

【 SpringSecurity】第三方认证方法级别安全

【 SpringSecurity】第三方认证方法级别安全

文章目录 SpringSecurity 第三方认证实现方法级别的安全 SpringSecurity 第三方认证在登录网页时，时常有用其他账号登录的方式，它们能够让用户避免在Web站点特定的登录页上自己输入凭证信息。这样的Web站点提供了一种通过其他网站（如Facebo…

阅读更多...

matlab使用教程(9)—matlab基本语句

matlab使用教程(9)—matlab基本语句

1.条件控制 - if、else、switch 条件语句可用于在运行时选择要执行的代码块。最简单的条件语句为 if 语句。例如： % Generate a random number a randi(100, 1); % If it is even, divide by 2 if rem(a, 2) 0 disp(a is even) b a/2; end 通过使用可选关键字 …

阅读更多...

fishing之第四篇使用案例一模拟登陆口

fishing之第四篇使用案例一模拟登陆口

文章目录一、访问钓鱼平台二、Sending Profiles（发件人邮箱配置）三、User&Groups（接收人邮件列表）四、Landing Pags（钓鱼页面配置）五、Email Templates（邮件内容配置）六、Campaigns七、攻击结果查看免责声明一、访问钓鱼平台详细查看第二篇的gophish的搭建二…

阅读更多...

WebRTC 之音视频同步

WebRTC 之音视频同步

在网络视频会议中， 我们常会遇到音视频不同步的问题， 我们有一个专有名词 lip-sync 唇同步来描述这类问题，当我们看到人的嘴唇动作与听到的声音对不上的时候，不同步的问题就出现了而在线会议中， 听见清晰的声音是优先…

阅读更多...

Java窗体应用程序人事管理系统web人资招聘员工劳资jsp源代码mysql

Java窗体应用程序人事管理系统web人资招聘员工劳资jsp源代码mysql

本项目为前几天收费帮学妹做的一个项目，Java EE JSP项目，在工作环境中基本使用不到，但是很多学校把这个当作编程入门的项目来做，故分享出本项目供初学者参考。一、项目描述 Java窗体应用程序人事管理系统注意：此项…

阅读更多...

Python 开发工具 Pycharm —— 使用技巧Lv.1

Python 开发工具 Pycharm —— 使用技巧Lv.1

Basic code completion Ctrl空格 is available in the search field when you search for text in the current file CtrlF, so there is no need to type the entire string 基本代码完成Ctrl 空格可在搜索领域当你搜索文本在当前文件Ctrl F,所以没有必要整个字符串类型 To m…

阅读更多...

迅为全国产龙芯3A5000电脑运行统信UOS、银河麒麟、loongnix系统

迅为全国产龙芯3A5000电脑运行统信UOS、银河麒麟、loongnix系统

iTOP-3A5000开发板采用全国产龙芯3A5000处理器，基于龙芯自主指令系统 (LoongArch) 的LA464微结构，并进一步提升频率，降低功耗，优化性能。在与龙芯3A4000处理器保持引脚兼容的基础上，频率提升至2.5GHZ，功耗降…

阅读更多...

最新文章