CV每日论文--2024.5.10

CV每日论文--2024.5.10

news/2025/7/14 15:21:02/文章来源:https://blog.csdn.net/u012854516/article/details/138836718

1、Attention-Driven Training-Free Efficiency Enhancement of Diffusion Models

中文标题：扩散模型的注意力驱动的训练免费效率增强

简介：扩散模型在生成高质量和多样化图像方面取得了出色的表现,但其卓越性能是以昂贵的架构设计为代价的,特别是广泛使用注意力模块。现有的工作主要通过重新训练的方式来提高扩散模型的效率,但这种方法计算开销大,可扩展性也较差。

为此,我们提出了一种基于注意力驱动的无训练高效扩散模型(AT-EDM)框架。该框架利用注意力图在运行时修剪冗余标记,无需任何重新训练。具体而言,我们开发了一种新的排名算法"广义加权页面排名(G-WPR)"来识别冗余标记,并提出了一种基于相似性的恢复方法来恢复卷积操作的标记。此外,我们还提出了一种"去噪步骤感知修剪(DSAP)"方法,以调整不同去噪步骤之间的修剪预算,以获得更好的生成质量。

广泛的评估结果表明,AT-EDM在提高效率方面表现出色,例如,与Stable Diffusion XL相比,可节省38.8%的FLOPs,并提高了1.53倍的速度,同时保持了与完整模型几乎相同的FID和CLIP分数。项目网页：https://atedm.github.io。

2、Imagine Flash: Accelerating Emu Diffusion Models with Backward Distillation

中文标题：Imagine Flash:利用反向蒸馏加速emu扩散模型

简介：扩散模型是一种强大的生成框架,但在推理时需要大量计算资源,这是一个主要挑战。现有的加速方法往往会损害生成图像的质量,或在极低步长的情况下无法良好工作。

在这项研究中,作者提出了一种新的蒸馏框架,目标是通过仅使用1-3个步骤就能实现高保真度和多样性的样本生成。这个方法包括三个关键组成部分:

反向蒸馏:通过在模型自身的反向轨迹上校准学生模型,来缓解训练-推理的差异。

移位重构损失:根据当前时间步动态调整知识转移,以提高生成的准确性。

噪声校正:在推理时采用的一种技术,通过解决噪声预测中的奇异性,来增强生成样本的质量。

作者通过大量实验证明,该方法在定量指标和人类评估方面都优于现有的竞争方法。值得一提的是,仅使用3个去噪步骤就能达到与教师模型相当的性能,实现了高效的高质量样本生成。

3、Picking watermarks from noise (PWFN): an improved robust watermarking model against intensive distortions

中文标题：从噪音中提取水印(PWFN):一种改进的抗强干扰水印模型

简介：数字水印技术能够将秘密信息嵌入图像中,而人眼是无法察觉这种改变的。为了提高模型的抗干扰能力,许多基于深度学习的数字水印方法使用了编码器-解码器架构,并向噪声层添加不同类型的噪声。解码器则从受损的图像中提取水印信息。但这种方法只能抵御较弱的噪声攻击。

为了提高算法对强噪声的鲁棒性,本文提出在噪声层和解码器之间引入去噪模块,以减少噪声干扰并恢复部分丢失的信息。此外,本文还引入了SE模块,在像素和通道维度融合数字水印信息,从而提高编码器的性能。

实验结果表明,本文提出的方法不仅与现有模型相当,在不同强度噪声下也优于最先进的方法。消融实验也验证了所提出模块的有效性。

总的来说,这项研究提出了一种新颖的数字水印方法,在抗噪声干扰方面显示出良好的性能。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/837220.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

数据库——SQL SERVER（先学删库跑路）

数据库——SQL SERVER（先学删库跑路）

目录一：什么是数据库二：为什么需要数据库三：数据库的安装四：学前必备知识 1. 数据库原理 2. 数据库与编程语言 3. 数据库与数据结构的区别 4. 连接 5. 有了编程语言为啥还要数据库 6. 初学者学习数据库的三个方面 …

阅读更多...

mplab ide中使用c语言编程,PIC单片机的C语言使用——在MPLAB-IDE中使用HitechC编译器.doc...

mplab ide中使用c语言编程,PIC单片机的C语言使用——在MPLAB-IDE中使用HitechC编译器.doc...

mplab ide中使用c语言编程,PIC单片机的C语言使用——在MPLAB-IDE中使用HitechC编译器.doc...-CSDN博客

阅读更多...

高校推免报名|基于SSM＋vue的高校推免报名系统的设计与实现(源码+数据库+文档)

高校推免报名|基于SSM＋vue的高校推免报名系统的设计与实现(源码+数据库+文档)

高校推免报名目录基于SSM＋vue的高校推免报名的设计与实现一、前言二、系统设计三、系统功能设计 1系统功能模块 2后台登录模块 5.2.1管理员功能模块 5.2.2考生功能模版四、数据库设计五、核心代码六、论文参考七、最新计算机毕设选题推荐八…

阅读更多...

放大招：NLP-探索深度学习在自然语言处理中的应用：构建标题生成器

放大招：NLP-探索深度学习在自然语言处理中的应用：构建标题生成器

引言在深度学习的领域中，自然语言处理（NLP）是一个令人兴奋且快速发展的分支。它使得机器能够理解、解释和生成人类语言。在本博客中，我们将通过构建一个简单的标题生成器来探索NLP的基础知识，了解如何使用深度学习模…

阅读更多...

【学习笔记】人群归因分数 PAF 以及combined PAF（更新）

【学习笔记】人群归因分数 PAF 以及combined PAF（更新）

在此推荐2篇发表在lancet以及jama子刊上的paf文章，这两篇文章套路是一样的，只是在不同国家进行。在计算combined PAF或者说weighted PAF的时候，先建立了相关矩阵，再做主成分分析，得到communality。详细信息大家可翻阅…

阅读更多...

【Pytest官方文档翻译及学习】1.1 安装和入门

【Pytest官方文档翻译及学习】1.1 安装和入门

目录 1.1 安装和入门 1.1.1 安装pytest 1.1.2 创建第一个测试 1.1.3 运行多个测试 1.1.4 断言引发了某个异常 1.1.5 将多个测试分组在一个类中 1.1.6 请求功能测试的唯一临时目录 1.1.7 继续阅读 Pytest是一个成熟的全功能的Python测试框架，它可以满足大多数…

阅读更多...

huffman编码【python】【算法】

huffman编码【python】【算法】

哈夫曼编码(Huffman Coding)，又称霍夫曼编码，是一种编码方式，哈夫曼编码是可变字长编码(VLC)的一种。该方法完全依据字符出现概率来构造整体平均长度最短的码字，有时称之为最佳编码，一般就叫做Huffman编码（…

阅读更多...

MFC/QT利用COM组件接口从字体名称、粗体、斜体获取到字体文件路径的方法

MFC/QT利用COM组件接口从字体名称、粗体、斜体获取到字体文件路径的方法

MFC/QT利用COM组件接口从字体名称、粗体、斜体获取到字体文件路径的方法这个是目前唯一能准确从字体名称加粗斜体三个属性定位到ttf/ttc字体路径的方法，其他的方式是没有办法区分后两个属性而且会出现不准确的问题之前无意间在MSDN找到的资料： IDWr…

阅读更多...

el-calendar自定义日程，显示文字内容，el-date-picker和el-calendar互动互联

el-calendar自定义日程，显示文字内容，el-date-picker和el-calendar互动互联

Vue实现 el-calendar自定义日程，显示文字内容，el-date-picker和el-calendar互动互联效果展示首先el-calendar需要自定义日程内容的话，其格式一般必须满足如下结构 dataList = [{date: 2024-05-08, content: "数学模拟试卷(3)"},{date: 2024-05-08, content: …

阅读更多...

【STM32 |程序实例】按键控制、光敏传感器控制蜂鸣器

【STM32 |程序实例】按键控制、光敏传感器控制蜂鸣器

目录前言按键控制LED 光敏传感器控制蜂鸣器前言上拉输入：若GPIO引脚配置为上拉输入模式，在默认情况下（GPIO引脚无输入），读取的GPIO引脚数据为1，即高电平。下拉输入：若GPIO引脚配置为下…

阅读更多...

C语言（指针）6

C语言（指针）6

Hi~！这里是奋斗的小羊，很荣幸各位能阅读我的文章，诚请评论指点，关注收藏，欢迎欢迎~~ 💥个人主页：小羊在奋斗 💥所属专栏：C语言本系列文章为个人学习笔记&#x…

阅读更多...

深度学习之神经网络理论基础

深度学习之神经网络理论基础

深度学习之神经网络理论基础人工神经元人工神经元：人类神经元中抽象出来的数学模型 MP模型 mp模型：1943年心理学家W.S.McCulloch和数理逻辑学家W.Pitts研究出人工神经元，称为M-P模型。 M-P神经元（一个用来模拟生物行为的数学模…

阅读更多...

.NET开源、功能强大、跨平台的图表库LiveChart2

.NET开源、功能强大、跨平台的图表库LiveChart2

LiveCharts2 是从LiveCharts演变而来，它修复了其前身的主要设计问题，它专注于在任何地方运行，提高了灵活性，并继承LiveCharts原有功能。极其灵活的数据展示图库（效果图）开始使用 Live charts 是 .Net 的跨平台图表库，请访问 https://livecharts.dev 并查看目标平…

阅读更多...

React 基础案例

React 基础案例

React的特点： 1、声明式编程 2、组件化开发 3、多平台适配yuan 原生实现： <h2 class"title"></h2><button class"btn">改变文本</button><script>let msg "Hello World";const titleEl d…

阅读更多...

P6397 [COI2008] GLASNICI

P6397 [COI2008] GLASNICI

题目描述一条直线上有 𝑛 个信使，将他们按照从左至右的顺序以 1 至 𝑛 编号。换句话说，设 𝑖 号信使的的坐标为 𝑑𝑖，则对于 1≤𝑖<𝑛， &am…

阅读更多...

TCP协议建立连接的过程及其意义

TCP协议建立连接的过程及其意义

目录三次握手四次挥手三次握手的意义在客户端与服务器传输数据之前，要在两台主机之间先建立连接，然后再传输业务数据。三次握手，就是建立连接的过程，是在传输业务之前，就要先进行。握手好了，才能进行…

阅读更多...

【新手入门】Github与Git使用教程

【新手入门】Github与Git使用教程

Github与Git 一、Github基础教程 1.1 基本操作点击代码文件可以直接查看文件的内容，支持在线修改文件，只需要点击(文件内容)右上角的编辑按钮即可进行编辑。 README.md一般介绍项目的功能，用法，注意事项；有时还有…

阅读更多...

LeetCode //C - 93. Restore IP Addresses

LeetCode //C - 93. Restore IP Addresses

93. Restore IP Addresses A valid IP address consists of exactly four integers separated by single dots. Each integer is between 0 and 255 (inclusive) and cannot have leading zeros. For example, “0.1.2.201” and “192.168.1.1” are valid IP addresses, bu…

阅读更多...

虚拟机有线已连接但无法上网—·可能性之一

虚拟机有线已连接但无法上网—·可能性之一

背景 VMware虚拟机，搭建了三台Linux服务器，组成Hadoop集群，由于在Hadoop102上有一些经常与Mysql数据库交互的任务，需要经常打开运行，而Hadoop103和104则经常处于关闭状态，一段时间后再次启动集群时候&…

阅读更多...

ES6 笔记03

ES6 笔记03

01 回调地狱回调地狱: 回调函数嵌套回调函数嵌套过深导致维护不方便 02 promise语法的基本使用 promise语法的基本使用: 1.new Promise 对象并接收新对象 2.在构造函数里面传入回调函数 3.回调函数里面有两个形参: resolve reject resolve 表示积极状态 reject 表示消极状…

阅读更多...

最新文章