深入解析AI绘画算法:从GANs到VAEs


在这里插入图片描述
💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。
在这里插入图片描述

  • 推荐:「stormsha的主页」👈,持续学习,不断总结,共同进步,为了踏实,做好当下事儿~
  • 专栏导航
    • Python面试合集系列:Python面试题合集,剑指大厂
    • GO基础学习笔记系列:记录博主学习GO语言的笔记,该笔记专栏尽量写的试用所有入门GO语言的初学者
    • 数据库系列:详细总结了常用数据库 mysql 技术点,以及工作中遇到的 mysql 问题等
    • 运维系列:总结好用的命令,高效开发
    • 算法与数据结构系列:总结数据结构和算法,不同类型针对性训练,提升编程思维

非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。💝💝💝 ✨✨ 欢迎订阅本专栏 ✨✨

💖The Start💖点点关注,收藏不迷路💖

📒文章目录

      • 1. 生成对抗网络(GANs)
        • 1.1 生成器(Generator)
        • 1.2 判别器(Discriminator)
        • 1.3 对抗训练
        • 1.4 代码讲解
      • 2. 变分自编码器(VAEs)
        • 2.1 编码器(Encoder)
        • 2.2 解码器(Decoder)
        • 2.3 损失函数
        • 2.4 代码讲解


当涉及到AI作画算法时,主要的方法包括生成对抗网络(GANs)、变分自编码器(VAEs)、神经风格迁移(Neural Style Transfer)等。下面我将详细介绍每个组成部分的原理,并给出数学公式和代码讲解。
在这里插入图片描述

1. 生成对抗网络(GANs)

生成对抗网络由两个主要组件组成:生成器(Generator)和判别器(Discriminator)

在这里插入图片描述

1.1 生成器(Generator)

生成器旨在从随机噪声中生成逼真的图像。它通常是一个深度卷积神经网络,其目标是最小化生成的图像与真实图像之间的差距。

在数学上,生成器可以表示为:
G : z → x G:z\to x G:zx
其中,( z ) 是输入的随机噪声向量,( x ) 是生成的图像。

1.2 判别器(Discriminator)

判别器旨在区分生成器生成的假图像和真实图像。它也是一个深度卷积神经网络,其目标是最大化正确分类真实图像和生成的图像的概率。

在数学上,判别器可以表示为:
D : x → [ 0 , 1 ] D:x\to[0,1] D:x[0,1]
其中, D ( x ) D(x) D(x) 表示输入图像 x x x 是真实图像的概率。

1.3 对抗训练

生成器和判别器通过对抗训练相互竞争。生成器试图最小化判别器的损失,而判别器试图最大化将真实图像与生成的图像正确分类的概率。他们的损失函数可以定义如下:

生成器的损失函数:
L G A N = − log ⁡ ( D ( G ( z ) ) ) \mathcal{L}_\mathrm{GAN}=-\log(D(G(z))) LGAN=log(D(G(z)))

判别器的损失函数:
L G A N = − log ⁡ ( D ( x ) ) − log ⁡ ( 1 − D ( G ( z ) ) ) \mathcal{L}_{\mathrm{GAN}}=-\log(D(x))-\log(1-D(G(z))) LGAN=log(D(x))log(1D(G(z)))

这样的对抗训练会持续进行,直到生成器生成的图像与真实图像难以区分为止。

1.4 代码讲解

以下是一个简化的生成器和判别器的PyTorch代码示例:

import torch
import torch.nn as nn# Generator
class Generator(nn.Module):def __init__(self):super(Generator, self).__init__()self.model = nn.Sequential(nn.Linear(noise_dim, hidden_dim),nn.ReLU(),nn.Linear(hidden_dim, output_dim),nn.Tanh())def forward(self, z):return self.model(z)# Discriminator
class Discriminator(nn.Module):def __init__(self):super(Discriminator, self).__init__()self.model = nn.Sequential(nn.Linear(input_dim, hidden_dim),nn.ReLU(),nn.Linear(hidden_dim, 1),nn.Sigmoid())def forward(self, x):return self.model(x)

2. 变分自编码器(VAEs)

变分自编码器是一种生成模型,通过学习数据的潜在分布来生成新的数据样本。
在这里插入图片描述

2.1 编码器(Encoder)

编码器将输入图像编码为潜在空间中的潜在表示。它学习将图像映射到潜在空间中的均值和方差。

在数学上,编码器可以表示为:
q ( z ∣ x ) = N ( μ ( x ) , σ 2 ( x ) ) q(z|x)=\mathcal{N}(\mu(x),\sigma^2(x)) q(zx)=N(μ(x),σ2(x))
其中, μ ( x ) \mu(x) μ(x) σ 2 ( x ) \sigma^2(x) σ2(x) 是图像 x x x 的均值和方差。

2.2 解码器(Decoder)

解码器将潜在表示解码为图像。它学习将潜在空间中的点映射回图像空间。

在数学上,解码器可以表示为:
p ( x ∣ z ) = N ( f ( z ) , σ 2 I ) p(x|z)=\mathcal{N}(f(z),\sigma^2I) p(xz)=N(f(z),σ2I)
其中, f ( z ) f(z) f(z) 是潜在表示 z z z 的解码结果, σ 2 I \sigma^2 I σ2I 是噪声。

2.3 损失函数

VAEs使用重构损失和KL散度来训练模型。

重构损失:
L recon = − E q ( z ∣ x ) [ log ⁡ p ( x ∣ z ) ] \mathcal{L}_{\text{recon}} = -\mathbb{E}_{q(z|x)}[\log p(x|z)] Lrecon=Eq(zx)[logp(xz)]

KL散度:
L KL = KL ( q ( z ∣ x ) ∣ ∣ p ( z ) ) \mathcal{L}_{\text{KL}} = \text{KL}(q(z|x)||p(z)) LKL=KL(q(zx)∣∣p(z))

总损失:
L VAE = L recon + L KL \mathcal{L}_{\text{VAE}} = \mathcal{L}_{\text{recon}} + \mathcal{L}_{\text{KL}} LVAE=Lrecon+LKL

2.4 代码讲解

以下是一个简化的VAE的PyTorch代码示例:

import torch
import torch.nn as nn# Encoder
class Encoder(nn.Module):def __init__(self, input_dim, hidden_dim, latent_dim):super(Encoder, self).__init__()self.fc1 = nn.Linear(input_dim, hidden_dim)self.fc2_mean = nn.Linear(hidden_dim, latent_dim)self.fc2_logvar = nn.Linear(hidden_dim, latent_dim)def forward(self, x):h = torch.relu(self.fc1(x))return self.fc2_mean(h), self.fc2_logvar(h)# Decoder
class Decoder(nn.Module):def __init__(self, latent_dim, hidden_dim, output_dim):super(Decoder, self).__init__()self.fc1 = nn.Linear(latent_dim, hidden_dim)self.fc2 = nn.Linear(hidden_dim, output_dim)def forward(self, z):h = torch.relu(self.fc1(z))return torch.sigmoid(self.fc2(h))# VAE
class VAE(nn.Module):def __init__(self, encoder, decoder):super(VAE, self).__init__()self.encoder = encoderself.decoder = decoderdef reparameterize(self, mu, logvar):std = torch.exp(0.5*logvar)eps = torch.randn_like(std)return mu + eps * stddef forward(self, x):mu, logvar = self.encoder(x)z = self.reparameterize(mu, logvar)recon_x = self.decoder(z)return recon_x, mu, logvardef reconstruct(self, x):recon_x, _, _ = self.forward(x)return recon_x

❤️❤️❤️本人水平有限,如有纰漏,欢迎各位大佬评论批评指正!😄😄😄

💘💘💘如果觉得这篇文对你有帮助的话,也请给个点赞、收藏、分享下吧,非常感谢!👍 👍 👍

🔥🔥🔥道阻且长,行则将至,让我们一起加油吧!🌙🌙🌙

💖The End💖点点关注,收藏不迷路💖

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/4380.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人工智能底层自行实现篇3——逻辑回归(下)

3. 代码实现 接上一篇文章 3.1 问题背景 应用案例背景 假设我们有一个数据集,包含患者的多种生理指标(如年龄、性别、体重指数(BMI)、血糖水平等)以及他们是否被诊断为糖尿病(是或否)。我们的…

Vue3 el-table 动态高度(element-plus)

先回顾一下vue2element-ui的策略 export default (config) > {const {subtractHeight 250,} config;return {data() {return {subtractHeight,// 列表高度tableHeight: ${document.body.clientHeight - this.subtractHeight}px,};},created() {window.addEventListener(r…

RUST学习过程

一、基础知识&#xff1a; todo!&#xff1a;这个宏用来标记未实现功能。可以不写retuen的写法(if/else不能写分号&#xff0c;break带分号&#xff0c;loop写不写看情况)&#xff1a; fn fib(n: u32) -> u32 {if n < 2 {// The base case.1} else {// The recursive c…

vue-router学习9:过渡动效transition

<transition> 组件 <transition> 是 Vue 提供的一个内置组件&#xff0c;它可以为被包裹的元素或组件添加进入、离开和列表的过渡效果。当包裹的元素或组件的状态改变时&#xff08;例如&#xff0c;v-if 的条件变化或路由切换&#xff09;&#xff0c;<transi…

(python)动态规划

前言 曾经有一位叫做小明的年轻人,他生活在一个被困在连绵不断的山脉中的村庄里。这座村庄每年都会受到洪水的威胁,而村民们只能通过一条崎岖而危险的小路逃离洪水的侵袭。小明决定解决这个问题。他花了很长时间研究了地形图和洪水的模式,最终他发现了一种方法:他可以在山脚…

『大模型OS笔记』Meta 宣布推出 Llama 3 的介绍视频

Meta 宣布推出 Llama 3 的介绍视频 文章目录 一. Meta 宣布推出 Llama 3 的介绍视频一、引言二、Llama 模型历史回顾三、Llama 3 模型介绍四、Llama 3 背后的开发思路五、许可证和生态系统六、安全和信任七、其他亮点八、未来计划九、现场演示四. 参考文献一. Meta 宣布推出 Ll…

[iOS]APP优化

一、性能优化 性能优化是一个至关重要的过程&#xff0c;它对提高应用的用户体验、增强应用的市场竞争力以及维持用户的长期参与度具有深远的影响。 1.CPU 使用优化 工具&#xff1a;Instruments (Time Profiler)使用方法&#xff1a;利用 Xcode 的 Instruments 工具中的 Ti…

Unity 异步与工作线程(多线程)

文章目录 前言一、异步加载二、工作线程总结 前言 工作线程&#xff08;多线程&#xff09;是指在一个程序中同时执行多个任务的能力。多线程编程可以提高程序的性能和响应性&#xff0c;特别是在需要同时执行多个任务的情况下。工作线程通常用于执行耗时的任务&#xff0c;以…

linux驱动-CCF-2 of_clk_provider

CCF: common clock frameword of_clk_provider 总结 1. provider 注册时钟 hws[i] desc->clk_register(cprman, desc->data); 参考https://mp.csdn.net/mp_blog/creation/editor/138153040 2. provider 注册 of_clk_provider 1. provider 创建了of_clk_provider 结构体…

R语言 统计篇之相关性分析与线性回归

《Cookbook for R》数据统计篇 相关性分析与线性回归 示例数据 # 生成一些数据 # X 呈增加趋势 # Z 呈增加趋势 (缓慢) # Y 与 xvar 成反比&#xff0c;xvar*zvar 成正比set.seed(955) xvar <- 1:20 rnorm(20,sd3) zvar <- 1:20/4 rnorm(20,sd2) yvar <- -2*xvar…

FebHost:摩洛哥.ma域名注册介绍,规则有哪些?

摩洛哥国家域名介绍 摩洛哥是位于非洲西北部的一个国家&#xff0c;北部和西部面向地中海和大西洋&#xff0c;东部和南部则与阿尔及利亚、西撒哈拉和毛里塔尼亚接壤。摩洛哥的首都是拉巴特&#xff0c;但最大城市是卡萨布兰卡。摩洛哥的官方语言是阿拉伯语和柏柏尔语&#xf…

token接口设计

token接口设计 登录/注册&#xff1a;Token生成&#xff1a;Token验证&#xff1a;Token刷新&#xff1a;总结 登录/注册&#xff1a; 首先&#xff0c;用户通过提交用户名和密码或其他认证方式登录系统&#xff0c;服务器验证通过后&#xff0c;生成Token。 Token生成&#x…

使用 Python 和 DirectShow 从相机捕获图像

在 Python 中使用 OpenCV 是视觉应用程序原型的一个非常好的解决方案,它允许您快速起草和测试算法。处理从文件中读取的图像非常容易,如果要处理从相机捕获的图像,则不那么容易。OpenCV 提供了一些基本方法来访问链接到 PC 的相机(通过对象),但大多数时候,即使对于简单的…

Github创建远程仓库(项目)

天行健&#xff0c;君子以自强不息&#xff1b;地势坤&#xff0c;君子以厚德载物。 每个人都有惰性&#xff0c;但不断学习是好好生活的根本&#xff0c;共勉&#xff01; 文章均为学习整理笔记&#xff0c;分享记录为主&#xff0c;如有错误请指正&#xff0c;共同学习进步。…

制作Android分区镜像

1 python生成一个sector数据 def get_oem_bootmode(): # Header size SECTOR_SIZE_IN_BYTES 512 header [0 for i in \ range(SECTOR_SIZE_IN_BYTES)] # magic # The ord() built-in function in # Python converts a character # into …

MongoDB的安装(Linux环境)

登录到Linux服务器执行 lsb_release -a &#xff0c;即可得知服务器的版本信息为&#xff1a;CentOS 7。 # CentOS安装lsb_release包 [rootlinux100 ~]# sudo yum install redhat-lsb# 查看Linux版本 [rootlinux100 ~]# lsb_release -a LSB Version: :core-4.1-amd64:core-…

git tag管理

1. Git 创建tag并推送到云端 首先&#xff0c;在本地创建一个新的tag&#xff0c;可以使用 -a 选项添加带有注释信息的annotated tag&#xff0c;或直接创建lightweight tag。例如&#xff0c;若要标记最近一次提交为 v1.0 并附带注释信息&#xff1a; # 创建带有注释信息的a…

Blender笔记之基本操作

code review! —— 2024-04-27 杭州 Blender笔记…

c++理论篇(一) ——浅谈tcp缓存与tcp的分包与粘包

介绍 在网络通讯中,Linux系统为每一个socket创建了接收缓冲区与发送缓冲区,对于TCP协议来说,这两个缓冲区是必须的.应用程序在调用send/recv函数时,Linux内核会把数据从应用进程拷贝到socket的发送缓冲区中,应用程序在调用recv/read函数时,内核把接收缓冲区中的数据拷贝到应用…

黑马程序员2024最新SpringCloud微服务开发与实战 个人学习心得、踩坑、与bug记录Day1

你好,我是Qiuner. 为记录自己编程学习过程和帮助别人少走弯路而写博客 这是我的 github gitee 如果本篇文章帮到了你 不妨点个赞吧~ 我会很高兴的 &#x1f604; (^ ~ ^) 想看更多 那就点个关注吧 我会尽力带来有趣的内容 2024黑马程序员 SpringCloud微服务开发与实战&#xff…