LAPGAN浅析

LAPGAN

引言

在原始 GAN和CGAN中,还只能生成 16*16, 28*28, 32*32 这种低像素小尺寸的图片。而LAPGAN首次实现 64*64 的图像生成。与其一下子生成这么大的图像 (包含信息量这么多),不如一步步由小到大,这样每一步生成的时候,可以基于上一步的结果,而且还只需要“填充”和“补全”新图片所需要的那些信息。

LAPGAN的思想

LAPGAN通过级联方式改进GAN以实现从粗略到精细图片的生成。网络的级联思想对后续的研究产生了极大的影响。LAPGAN使用高斯金字塔进行下采样,使用拉普拉斯金字塔进行上采样

假设图像 I I I的长度和宽度均为 j j j,对于图像 I 0 = ( j , j ) I_0=(j,j) I0=(j,j),下采样得到的图像尺寸为( j / 2 , j / 2 ) j/2,j/2) j/2,j/2),上采样得到的图像尺寸为(2 j j j,2 j j j)。对于图像进行连续 k k k 次的下采样,可以获得一系列图像 I 1 = ( j / 2 , j / 2 ) , I 2 = ( j / 4 , j / 4 ) , . . . , I k = I_1=(j/2,j/2),I_2=(j/4,j/4),...,I_k= I1=(j/2,j/2),I2=(j/4,j/4),...,Ik= ( j / 2 k , j / 2 k ) : (j/2^k,j/2^k): (j/2k,j/2k):

其中, g ( I ) g(I) g(I)表示图像的高斯金字塔。在得到高斯金字塔之后,拉普拉斯金字塔可表示如下:

h k = L k ( I ) = G k ( I ) − u ( G k + 1 ( I ) ) = I k − u ( I k + 1 ) \boldsymbol{h}_k=\mathcal{L}_k(\boldsymbol{I})=\mathcal{G}_k(\boldsymbol{I})-u\big(\mathcal{G}_{k+1}(\boldsymbol{I})\big)=\boldsymbol{I}_k-u(\boldsymbol{I}_{k+1}) hk=Lk(I)=Gk(I)u(Gk+1(I))=Iku(Ik+1)
其中,拉普拉斯金字塔的第 k k k层等于高斯金字塔的第 k k k g k ( I ) g_k(I) gk(I)减去高斯金字塔第(k+1)层的上采样 u ( g k + 1 ( I ) ) u(g_{k+1}(I)) u(gk+1(I))

image-20240426162654321

输入噪声z 3 ′ _{3^{\prime}} 3 G 3 G_{3} G3生成 I ~ 3 \tilde{I}_{3} I~3,上采样得到 I 2 I_{2} I2,使用 I 2 I_{2} I2作为条件输入 G 2 , G_{2,} G2, 同时输入噪声z 2 _{2} 2生成差分图像 h ~ 2 \tilde{h}_{2} h~2, 添加到 I 2 I_{2} I2中生成 I ~ 2 \tilde{I}_{2} I~2

LAPGAN将条件对抗生成网络CGAN集成到拉普拉斯金字塔结构中:
I ~ k = u ( I ~ k + 1 ) + h ~ k = u ( I ~ k + 1 ) + G k ( z k , u ( I ~ k + 1 ) ) \tilde{\boldsymbol{I}}_k=u(\tilde{\boldsymbol{I}}_{k+1})+\tilde{\boldsymbol{h}}_k=u(\tilde{\boldsymbol{I}}_{k+1})+G_k(\mathbf{z}_k,u(\tilde{\boldsymbol{I}}_{k+1})) I~k=u(I~k+1)+h~k=u(I~k+1)+Gk(zk,u(I~k+1))
其中, G k G_k Gk表示第 k k k个卷积神经网络,也就是生成器,高斯金字塔第 k k k层的重建等于它的第 ( k + 1 ) (k+1) (k+1)层上采样 u ( I ~ k + 1 ) u(\tilde{I}_{k+1}) u(I~k+1)加上拉普拉斯金字塔的第 k k k h ~ k \widetilde{h}_k h k。除了最高层的生成器之外,其余生成器 G 0 G_0 G0 G 1 … G k − 1 G_1\ldots G_{k-1} G1Gk1都是采用上一级的上采样和噪声作为联合输入。上采样的结果就是LAPGAN中的条件变量。

Coarse-to-fine的视觉效果

image-20240426182823979

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/3760.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

书籍推推荐之二--《生命的色彩》

史钧《生命的色彩》 在生活中,我们会注意到一个有趣的现象:每个人的头发颜色各不相同,有黑色、灰色、黄色、棕红色、银白色等,但就是没有绿色。对于生活在丛林中的早期人类来说,绿色的头发简直就是天然的迷彩服&#x…

RabbitMq总结

1.架构 rabbitmq由消费者,生产者,交换机,队列,bindingkey组成,交换机存在四种,主流使用三种 2.事务消息机制 将消息发送到一个单独的事务队列,再从事务队列发送到消费者可消费的队列&#xf…

区块链在物流中的应用

区块链如何在物流行业中应用? - 知乎 (zhihu.com) 区块链物流:打造智能物流可信生态网络 - 知乎 (zhihu.com) 菜鸟供应链发布一款基于大模型的数字化供应链产品“天机π”,通过菜鸟算法基于大模型的生成式AI辅助决策,在销量预测、补货计划和…

随手记:树结构翻页和定位指定数据逻辑

业务背景: 树形组件展示数据,数据包含过去数据,现在数据,未来数据,用户在首次进入页面时,展示的是当天的数据,如果当天没有数据,则显示最近一条的过去数据。数据按照时间越长数据会…

《托斯卡纳艳阳》

有爱情不断流淌的地方,当然充满了诱惑。这里最迷人而优雅的桥段,是非常绅士而浪漫内心丰盈又恪守道德的男人马蒂尼(好评)赶来为女主捉蛇。蛇的设定自然源于亚当夏娃,而蛇的就此消失,当然告诉我们浪漫不代表…

可替代IBM DOORS的现代化需求管理解决方案Jama Connect,支持数据迁移及重构、实时可追溯性、简化合规流程

作为一家快速发展的全球性公司,dSPACE一直致力于寻找保持领先和优化开发流程的方法。为推进其全球现代化计划,dSPACE开始寻找可以取代传统需求管理平台(IBM DOORS)的需求管理解决方案。 通过本次案例,您将了解dSPACE为…

大数据第五天(操作hive的方式)

文章目录 操作hive的方式hive 存储位置hive 操作语法创建数据表的方式 操作hive的方式 hive 存储位置 hive 操作语法 创建数据表的方式 – 创建数据库 create database if not exists test我们创建数据库表的时候,hive是将我们的数据自动添加到数据表中&#xf…

江苏开放大学2024年春《机电设备安装与调试 050095》第三次形成性考核作业参考答案

电大搜题 多的用不完的题库,支持文字、图片搜题,包含国家开放大学、广东开放大学、超星等等多个平台题库,考试作业必备神器。 公众号 答案:更多答案,请关注【电大搜题】微信公众号 答案:更多答案&#…

一文解析golang中的协程与GMP模型

文章目录 前言1、线程实现模型1.1、用户级线程与内核级线程1.2、内核级线程模型1.3、用户级线程模型1.3、两级线程模型 2、GMP模型2.1、GMP模型概述2.1、GMP v1版本 - GM模型2.2、GMP v2版本 - GMP模型2.3、GMP相关源码2.4 调度流程2.5 设计思想 3.总结 前言 并发(并行&#x…

vue实现录音并转文字功能,包括PC端web,手机端web

vue实现录音并转文字功能,包括PC端,手机端和企业微信自建应用端 不止vue,不限技术栈,vue2、vue3、react、.net以及原生js均可实现。 原理 浏览器实现录音并转文字最快捷的方法是通过Web Speech API来实现,这是浏览器…

look-behind requires fixed-width pattern_正则表达式

问题&#xff1a;例如我想要匹配一段文本中&#xff0c;字符“a”在“小猫”的前面&#xff0c;中间有可能间隔好几个字符&#xff0c;也有可能直接相邻。结果只返回“小猫”。 import re text "这是一只非常可爱的a的的小猫." pattern r"(?<a*)小猫"…

JTAG访问xilinx FPGA的IDCODE

之前调试过xilinx的XVC&#xff08;Xilinx virtual cable&#xff09;&#xff0c;突然看到有人搞wifi-JTAG&#xff08;感兴趣可以参考https://github.com/kholia/xvc-esp8266&#xff09;&#xff0c;也挺有趣的。就突然想了解一下JTAG是如何运作的&#xff0c;例如器件识别&…

淘宝/天猫按图搜索淘宝商品(拍立淘) API,按图搜索商品详情

淘宝/天猫的“按图搜索商品”功能&#xff0c;通常被称为“拍立淘”&#xff0c;允许用户通过上传图片来搜索相似的商品。这项服务背后是由淘宝提供的API支持&#xff0c;使得用户能够快速找到与上传图片相匹配或类似的商品。以下是关于“按图搜索淘宝商品”API的一些关键信息&…

C++/python之设计模式(1)之什么是单例模式

C/python之设计模式&#xff08;1&#xff09;之什么是单例模式 注&#xff1a;整理一些突然学到的C、python知识&#xff0c;随时mark一下 例如&#xff1a;忘记的关键字用法&#xff0c;新关键字&#xff0c;新数据结构 设计模式整理 C/python之设计模式&#xff08;1&#x…

Java(IO异常解释(为什么要捕获异常,为什么要给NULL)

实现copy的代码&#xff1a; package a0420.iotest1.Test2;import java.io.IOException;public class Test {public static void main(String[] args) {CopyMethod.FileCopy("D:\\idealTestio\\copy.txt","D:\\idealTestio\\finalPase");} }主要想解释一下…

Unity类银河恶魔城学习记录15-1,2 p153 Audio Manager p154 Audio distance limiter

Alex教程每一P的教程原代码加上我自己的理解初步理解写的注释&#xff0c;可供学习Alex教程的人参考 此代码仅为较上一P有所改变的代码 【Unity教程】从0编程制作类银河恶魔城游戏_哔哩哔哩_bilibili AudioManager.cs using System.Collections; using System.Collections.Gen…

三大语音机器人:如何提升销售效率

如今&#xff0c;在互联网技术的支持下&#xff0c;越来越多的企业开始采用电销方式来推销他们的产品或服务。当然&#xff0c;电销的效率往往取决于销售过程中是否采用了高效的工具和方式。不过&#xff0c;对于一些销售人员而言&#xff0c;保持高效率从来不是一件容易的事情…

Ubuntu下载的nginx的位置

位置在/etc/nginx 启动nginx systemctl status nginx上面的命令不合适&#xff0c;就重启nginx sudo service nginx restart 关闭nginx nginx -s stop Ubuntu默认的html地址在该文件夹中的default中&#xff1a; /etc/nginx/sites-available if ($http_host ~* "^(w…

【计算机系统基础读书笔记】1.1.2 冯诺依曼机基本结构

1.1.2 冯诺依曼机基本结构 冯诺依曼机基本结构如图所示&#xff1a; 模型机中主要包括&#xff1a; 主存储器&#xff1a;用来存放指令和数据&#xff0c;简称主存或内存&#xff1b; 算数逻辑部件&#xff08;Arithmetic Logic Unit&#xff0c;简称ALU&#xff09;&#x…

实现SpringMVC底层机制(二)

文章目录 1. 动态获取spring配置文件1.修改SunWebApplicationContext.java2.修改SunDispatcherServlet.java 2.自定义Service注解1.需求分析2.编写Monster.java3.自定义Service注解4.编写Service接口MonsterService.java5.编写Service实现类MonsterServiceImpl.java6.修改SunWe…