SUPER-ADAM: Faster and Universal Framework of Adaptive Gradients

SUPER-ADAM: Faster and Universal Framework of Adaptive Gradients

news/2025/7/13 15:03:49/文章来源:https://blog.csdn.net/nahnah_/article/details/134973194

这周看了啥：

本周主要来看看别人是如何证明收敛的，围绕算法SUPER-ADAM 的更新过程和论文后面的证明，（这篇证明比上周的亲切多了，我哭死）仔细看了证明每一步的推导（至于作者如何想出的，还没有去考虑）

论文基本信息：

摘要：为自适应梯度算法设计一个通用的框架。我们通过引入一个包括大多数现有自适应梯度形式的通用自适应矩阵，提出了一个更快、更通用的自适应梯度框架(即Super-Adam)。此框架可以结合动量和方差减少技术。特别是，新框架为自适应梯度方法在非凸环境下的收敛分析提供了支持。

本文的三个贡献：

1：摘要提到的，设计了一个自适应梯度框架，框架可以灵活地结合动量和方差减少技术。

2：在较温和的条件下，我们为非凸环境下的自适应梯度法提供了一种新的收敛分析框架

3：SUPER-ADAM (τ = 1)) 运用momentum-based variance reduced gradient estimator

论文一些信息:

自适应矩阵Ht 以一般形式给出其中，矩阵At包括从具有噪声的随机梯度生成的自适应信息，并且调谐参数λ平衡这些自适应信息与噪声。(Id是单位矩阵）

step9：可以灵活地使用不同的自适应学习速率和不同的随机梯度估计器gt

不懂的：

p5: 这个形式怎么就是梯度下降更新了

记录：

回顾一下adam更新过程

Adam的变量包括mt（一阶矩量，即梯度的指数加权移动平均）和 vt（二阶矩量，即梯度平方的指数加权移动平均）。

Young不等式 感觉论文里提到的和这个不太一样诶。

逐维学习率 coordinate-wise learning rates

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/221220.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

verilog基础语法之比较器

verilog基础语法之比较器

逻辑运算符以及逻辑电路概述逻辑运算符常用于条件判断语句，输出为布尔值True/False。逻辑运算符是基于比较器构造的。比较器电路是产生逻辑比较的本质；比较器电路的复杂度与位宽和比较类型相关；一般情况下可以先构造基本比较器，…

阅读更多...

原生Html 引入element UI + vue3 表单校验设置

原生Html 引入element UI + vue3 表单校验设置

效果： 提交时，检验结果展示 html源码 <!DOCTYPE html> <html>  <head><meta charset"UTF-8"><script src"../js/vue3.3.8/vu…

阅读更多...

iOS IDFV特点

iOS IDFV特点

从AppStore下载的APP的表现在 AppStore 下载的APP具有以下特征： 同一厂商（即同一个开发者帐号）在一个iOS设备上的APP的IDFV相同；同一厂商在不同iOS设备上的APP的IDFV不同；不同厂商在同一iOS设备上的APP的IDFV不同&a…

阅读更多...

短视频电商模式，是否会成为未来电商的主流？

短视频电商模式，是否会成为未来电商的主流？

我是电商珠珠随着电商的发展，短视频也逐渐开拓电商市场。其中最热门的短视频APP-抖音在19年的时候，发展起了自己的电商平台-抖音小店。它的兴趣电商模式，区别于传统电商，实现了既可以让用户搜索下单，又可以在刷视频…

阅读更多...

jmeter，通过Ant插件生成html报告，展示接口详细信息

jmeter，通过Ant插件生成html报告，展示接口详细信息

一、下载Ant 下载地址：Apache Ant - 二进制发行版二、安装 1、Ant环境变量解压Ant目录；配置系统环境变量，添加ANT_PATH，值为D:\Software\Ant_plugIn\apache-ant-1.10.14配置系统环境变量Path，添加Ant路径 %ANT_H…

阅读更多...

Unity之OpenXR+XR Interaction Toolkit接入Meta Quest3

Unity之OpenXR+XR Interaction Toolkit接入Meta Quest3

前言随着备受期待的Meta Quest 3与今年10月10日发布，这款来自Meta的下一代VR游戏头戴设备承诺将彻底改变您的游戏方式。 Meta Quest 3，玩家只需轻松一触即可在虚拟现实和真实世界之间无缝切换，无需摘下头戴设备进行快速现实检查。 Meta Quest 3最引人注目的特点之一是其能…

阅读更多...

webpack学习-5.代码分离

webpack学习-5.代码分离

webpack学习-5.代码分离 1.入口起点2.防止重复2.1 入口依赖2.2 SplitChunksPlugin 3.动态导入3.1 使用符合 ECMAScript 提案的 import() 语法3.2 使用 webpack 特定的 require.ensure 4.预获取/预加载模块5.分析bundle6.总结 1.入口起点代码分离是 webpack 中最引人注目的特…

阅读更多...

sql39（Leetcode1341电影评分）

sql39（Leetcode1341电影评分）

代码： # Write your MySQL query statement below select t3.name as results from( select t1.user_id,count(t1.movie_id) as counts,t2.name from MovieRating t1 left join Users t2 on t1.user_idt2.user_id group by t1.user_id order by counts desc,t2.nam…

阅读更多...

AIGC - 环境搭建

AIGC - 环境搭建

一. 硬件环境 1. 超微7048主板，最多可搭载4块GPU 2. 2个Intel的 Xen至强 14核 CPU 3. 目前安装了一块Nvidia 的P40 GPU，后续根据需要还最多可以扩展3块GPU 4. 4T机械 2T Nvme固态， 5. 4条64G DDR4内存条，共 196G内存…

阅读更多...

QT多项目管理

QT多项目管理

.pro文件配置解释： Qt 中的多项目管理_qt子目录项目-CSDN博客Qt 模块化开发之 pro 子项目开发_qt 子项目-CSDN博客关于Qt编译库（1）：在子项目中编译动态库并且使用_qt编译动态库后配置qt-CSDN博客QT release下的编译…

阅读更多...

涵盖多种功能，龙讯旷腾Module第六期：输运性质

涵盖多种功能，龙讯旷腾Module第六期：输运性质

Module是什么在PWmat的基础功能上，我们针对用户的使用需求开发了一些顶层模块（Module）。这些Module中的一部分是与已有的优秀工具的接口，一部分是以PWmat的计算结果为基础得到实际需要的物理量，一部分则是为特定的计…

阅读更多...

排序算法(二)-冒泡排序、选择排序、插入排序、希尔排序、快速排序、归并排序、基数排序

排序算法(二)-冒泡排序、选择排序、插入排序、希尔排序、快速排序、归并排序、基数排序

排序算法(二) 前面介绍了排序算法的时间复杂度和空间复杂数据结构与算法—排序算法（一）时间复杂度和空间复杂度介绍-CSDN博客，这次介绍各种排序算法——冒泡排序、选择排序、插入排序、希尔排序、快速排序、归并排序、基数排序。文章目录排…

阅读更多...

vue watch props无效

vue watch props无效

背景如标题所示，是因为vue watch props无效才看到这篇文章的。网上有一堆讲这个问题的解决办法。比如：watch(() > props.val1, (newValue) > {...})。但是我用Vue3.3.4尝试后，也是没有成功。可能是因为props.val1是一个Ref的问题吧&am…

阅读更多...

排序-归并排序与计数排序

排序-归并排序与计数排序

文章目录一、归并排序1、概念2、过程3、代码实现4、复杂度5、稳定性二、计数排序1、思路2、代码实现3、复杂度：4、稳定性一、归并排序 1、概念是建立在归并操作上的一种有效,稳定的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已…

阅读更多...

关键点检测☞png格式换bmp,且labelme标注的json中imagePath同步修改格式

关键点检测☞png格式换bmp,且labelme标注的json中imagePath同步修改格式

import os import cv2 import jsondef bmp2jpg(in_img_path, out_dir_name): # .png -> .bmp# img = cv2.imread(in_img_path) # 彩色图片，位深24img =</

阅读更多...

GDPU 数据结构天码行空13

GDPU 数据结构天码行空13

文章目录一、【实验目的】二、【实验内容】三、实验源代码四、实验结果五、实验总结一、【实验目的】 (1) 理解插入排序算法的实现过程； （2）理解不同排序算法的时间复杂度及适用环境； （3）了解算法性能…

阅读更多...

Win11 跑通tensorRT

Win11 跑通tensorRT

准备 1.安装cuda，成功之后文件夹如下图所示 2.下载cudnn，把cudnn对应的文件放在cuda里面 3.安装vs 4.安装对应cuda版本的tensorRT https://developer.nvidia.com/tensorrt-download 5.opencv安装编译好打开vs，配置环境用vs打开tens…

阅读更多...

PLC-Recorder V3版本软件升级方法

PLC-Recorder V3版本软件升级方法

PLC-Recorder V3软件进行了架构优化，包括采集服务器、客户端、授权管理等组件。升级方法与V2版本相似，但是也有一些变化，说明如下： 一、从V2向V3版本升级 1、退出原PLCRecorder：关闭右下角的图标。 2、退出打开的离线…

阅读更多...

模型部署系列：10x速度提升，Yolov8检测模型稀疏化——CPU上超500FPS

模型部署系列：10x速度提升，Yolov8检测模型稀疏化——CPU上超500FPS

YOLOv8由广受欢迎的YOLOv3和YOLOv5模型的作者 Ultralytics 开发，凭借其无锚设计将目标检测提升到了一个新的水平。YOLOv8 专为实际部署而设计，重点关注速度、延迟和经济性。 [1] 详细内容请参阅 MarkAI Blog [2] 更多资料及工程项目请关注 MarkAI Githu…

阅读更多...

2023年【A特种设备相关管理（锅炉压力容器压力管道）】考试题及A特种设备相关管理（锅炉压力容器压力管道）考试内容

2023年【A特种设备相关管理（锅炉压力容器压力管道）】考试题及A特种设备相关管理（锅炉压力容器压力管道）考试内容

题库来源：安全生产模拟考试一点通公众号小程序 A特种设备相关管理（锅炉压力容器压力管道）考试题是安全生产模拟考试一点通总题库中生成的一套A特种设备相关管理（锅炉压力容器压力管道）考试内容，安全生产模…

阅读更多...

最新文章