VQ-VAE中如何解决梯度截断（不可导）问题？直通估计、(stop gradient，停止梯度)

VQ-VAE中如何解决梯度截断（不可导）问题？直通估计、(stop gradient，停止梯度)

bicheng/2025/10/22 19:47:30/文章来源:https://blog.csdn.net/weixin_43135178/article/details/140160466

（stop gradient，停止梯度）运算

它简称为sg

也就是说，前向传播时，𝑠𝑔里的值不变(sg=1)；反向传播时，𝑠𝑔按值为0求导(sg=0)，即此次计算无梯度。

为什么需要解决梯度截断（不可导）？

按理说我们需要求的损失函数为：

但是因为在encoder后的z（z_q），是通过在codebook中arg min得到的，所以会导致梯度消失，梯度无法在反向传播中从decoder传递到encoder。

怎么解决？

所以使用Straight-Through（直通估计）来解决这个问题：

直通估计器（Straight-Through Estimator, STE）的核心思想是：

前向传播：正常计算模型的输出。
反向传播：用一种自定义的方式计算梯度，以绕过某些不可微的操作

根据这个思想，我们可以设计一个把梯度从𝑧𝑒(𝑥)复制到𝑧𝑞(𝑥)的loss：

用在VQ-VAE的设计上，那就是：

前向传播：计算 decoder(zq(x))并基于此计算重建loss值。
反向传播：通过 stop gradient 操作，梯度将直接传递回 ze(x)，从而更新encoder，而不会受到 zq(x) 和 ze(x) 之间量化过程的影响。

前向传播时，𝑠𝑔里的值不变(sg=1)：

就是拿解码器来进行𝑧𝑞(𝑥)的解码并计算损失：

反向传播时，𝑠𝑔按值为0求导(sg=0)：

按下面这个公式进行梯度回传（参数更新），等价于把解码器的梯度全部传给𝑧𝑒(𝑥)：

代码实现方法：

在PyTorch里，(x).detach()就是𝑠𝑔(𝑥)，它的值在前向传播时取x，反向传播时取0。

L = x - decoder(z_e + (z_q - z_e).detach())

通过这一技巧，我们完成了梯度的传递，可以正常地训练编码器和解码器了。

VQ-VAE的简明介绍：量子化自编码器 - 科学空间|Scientific Spaces

轻松理解 VQ-VAE：首个提出 codebook 机制的生成模型 | 周弈帆的博客

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/bicheng/39891.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

canvas画箭头线

canvas画箭头线

箭头线 vueuni-appcanvas 画带箭头可拖动的线段 <template><div><canvas ref"canvas" class"canvas" width"600px" height"400px" mousedown"startDrawing" mousemove"draw" mouseup"stopD…

阅读更多...

Centos手动安装PHP和配置mydqli模块

Centos手动安装PHP和配置mydqli模块

第一步：手动安装php和php-fpm sudo yum install php php-fpm 安装 sudo systemctl start php-fpm 启动 sudo systemctl enable php-fpm 开机启动 php -v php-fpm -v PHP 5.4.16 (cli) (built: Apr 1 2020 04:07:17) Copyright (c) 1997-2013 The PHP G…

阅读更多...

【加密与解密】【09】GPG Client签名流程

【加密与解密】【09】GPG Client签名流程

什么是GPG客户端 GPG客户端是实现PGP加密协议的一套客户端程序，可用于加密或签名下载GPG客户端建议安装命令行工具，图形工具一般不具备完整功能 https://gnupg.org/download/index.html生成私钥此时会要求你输入名称，邮箱&#xff0c…

阅读更多...

Qt Q_ASSERT详解

Qt Q_ASSERT详解

Q_ASSERT详解引言一、基本用法二、深入了解三、参考链接引言 Q_ASSERT是 Qt 框架中的一个宏，用于在调试时检查某个条件是否为真。它是程序调试中的一个重要工具，有助于开发者在开发过程中及时发现并修复潜在的错误。一、基本用法只在使用 Qt 的 D…

阅读更多...

干货：科技论文写作保姆级攻略

干货：科技论文写作保姆级攻略

前言：Hello大家好，我是小哥谈。科技论文是报道自然科学研究或技术开发工作成果的论说文章。通常基于概念、判断、推理、证明或反驳等逻辑思维体系，使用实验调研或理论计算等研究手段，按照特定格式撰写完成。科技论文可以粗略分为…

阅读更多...

UiPath+Appium实现app自动化测试

UiPath+Appium实现app自动化测试

一、环境准备工作 1.1 完成appium环境的搭建参考：pythonappiumpytestallure模拟器(MuMu)自动化测试环境搭建_appium mumu模拟器-CSDN博客 1.2 完成uipath的安装登录官网，完成注册与软件下载安装。 UiPath业务自动化平台：先进的RPA及自动…

阅读更多...

vue组件深入介绍之插槽

vue组件深入介绍之插槽

了解插槽之前请先了解vue组件基础及注册 Vue2官网介绍 Vue3官网介绍 1、vue2插槽介绍在2.6.0中，具名插槽和作用域插槽引入了一个新的统一语法（v-slot指令）。它将取代slot和slot-scope； Vue 实现了一套内容分发的 API&#xf…

阅读更多...

AI 会淘汰程序员吗？

AI 会淘汰程序员吗？

前言前些日子看过一篇文章，说国外一位拥有 19 年编码经验、会 100% 手写代码的程序员被企业解雇了，因为他的竞争对手，一位仅有 4 年经验、却善于使用 Copilot、GPT-4 的后辈，生产力比他更高，成本比他更低&#xff0c…

阅读更多...

【数据分享】《中国金融年鉴》1986-2020年PDF版

【数据分享】《中国金融年鉴》1986-2020年PDF版

而今天要免费分享的数据就是1986-2020年间出版的《中国金融年鉴》并以多格式提供免费下载。（无需分享朋友圈即可获取） 数据介绍《中国金融年鉴》自1986年起，逐年记录着中国金融领域的发展历程、政策变化和市场动态。这部年鉴不仅是金融专业…

阅读更多...

利用人工智能技术提升返利App的智能推荐功能

利用人工智能技术提升返利App的智能推荐功能

利用人工智能技术提升返利App的智能推荐功能大家好，我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！ 随着人工智能技术的迅猛发展，它已经渗透到了各行各业…

阅读更多...

Halcon 基于分水岭的目标分割

Halcon 基于分水岭的目标分割

一分水岭 1 分水岭介绍传统的分水岭分割方法，是一种基于拓扑理论的数学形态学的分割方法，其基本思想是把图像看作是地质学上的拓扑地貌，图像中每一像素的灰度值表示该点的海拔高度，每一个局部极小值及其周边区域称为集水盆地&…

阅读更多...

企业私有模型和提示词工程初探

企业私有模型和提示词工程初探

企业私有模型和提示词工程：提升AI应用的策略和方法摘要在当今竞争激烈的商业环境中，企业越来越依赖于人工智能（AI）技术来提高运营效率和创新能力。本文探讨了企业如何通过构建私有模型和应用提示词工程来优化AI系统。首先&…

阅读更多...

ROS学习笔记(18):建图与定位（2）

ROS学习笔记(18):建图与定位（2）

0.前言上文提到现在的我们已经进入到了SLAM领域的学习，会涉及到大量专业知识，作为一个自学的大三（好吧也快大四了）萌新并不能保证每次文章的专业性和准确性，所以，本人推荐大家能自己去查阅一些相关书籍和…

阅读更多...

牛！手机、TV双端聚合，免费可同步！

牛！手机、TV双端聚合，免费可同步！

哈喽，各位小伙伴们好，我是给大家带来各类黑科技与前沿资讯的小武。有不少小伙伴闲时会选择观看游戏、户外、娱乐等各类的直播，而关注的主播可能驻留在不同直播平台，需要下载多个APP，且切换非常不方便。所以今天给大…

阅读更多...

缓存生命周期管理：探索Memcached的过期策略

缓存生命周期管理：探索Memcached的过期策略

缓存生命周期管理：探索Memcached的过期策略在高效的缓存系统中，过期策略是确保数据时效性的关键。Memcached作为一个简单而强大的分布式内存缓存系统，提供了几种不同的缓存过期策略来满足不同的业务需求。本文将详细介绍Memcached的缓存过期…

阅读更多...

OpenHarmony移植小型系统exynos4412（一）

OpenHarmony移植小型系统exynos4412（一）

新建芯片解决方案 1、新建目录芯片解决方案的目录规则为：device/board/{芯片解决方案厂商}/{开发板}。以exynos的fs4412开发板为例，在代码根目录执行如下命令建立目录： mkdir -p device/exynos/fs4412 芯片解决方案目录树的规则如下： device/board └── company # 芯…

阅读更多...

自定义动态数据源+事务控制

自定义动态数据源+事务控制

1：首先yml配置两个数据库的链接 spring:application:name: xxxxmain:banner-mode: OFFdatasource: # 默认数据源 datamarkdruid: # 关闭数据库的 web 访问stat-view-servlet:enabled: falseweb-stat-filter:enabled: falsefilt…

阅读更多...

Linux系统之玩转SafeLine防火墙应用

Linux系统之玩转SafeLine防火墙应用

Linux系统之玩转SafeLine防火墙应用一、SafeLine介绍1.1SafeLine简介1.2 SafeLine功能1.3 SafeLine 的工作原理二、本地环境介绍2.1 本地环境规划2.2 本次实践介绍三、本地环境检查3.1 检查Docker服务状态3.2 检查Docker版本3.3 检查docker compose 版本四、部署SafeLine4.1 安…

阅读更多...

算法训练营day67

算法训练营day67

题目1： #include <iostream> #include <vector> #include <string> #include <unordered_set> #include <unordered_map> #include <queue>using namespace std;int main() {string beginStr, endStr;int n;cin >> n;ci…

阅读更多...

一篇文章搞懂弹性云服务器和轻量云服务器的区别

一篇文章搞懂弹性云服务器和轻量云服务器的区别

前言在众多的云服务器类型中，弹性云服务器和轻量云服务器因其各自的特点和优势，受到了广大用户的青睐。那么，这两者之间到底有哪些区别呢？本文将为您详细解析。弹性云服务器：灵活多变的计算资源池弹性云服务器&…

阅读更多...

最新文章