【计算机视觉】Image Data Augmentation算法介绍合集(二)

文章目录

    • 一、Random Grayscale
    • 二、GridMask
    • 三、Adversarial Color Enhancement
    • 四、Population Based Augmentation
    • 五、MaxUp
    • 六、SuperpixelGridCut, SuperpixelGridMean, SuperpixelGridMix
    • 七、InstaBoost
    • 八、Random Mix-up
    • 九、Sample Redistribution
    • 十、Batchboost
    • 十一、CutBlur
    • 十二、DiffAugment

一、Random Grayscale

随机灰度是一种图像数据增强,以概率将图像转换为灰度。

在这里插入图片描述

二、GridMask

GridMask 是一种数据增强方法,可随机删除输入图像的某些像素。 与其他方法不同,该算法去除的区域既不是连续区域,也不是 dropout 中的随机像素。 相反,该算法会删除具有不连续像素集的区域,如图所示。

我们将设置表示为

在这里插入图片描述

三、Adversarial Color Enhancement

对抗性颜色增强是一种通过梯度下降优化滤色器来生成不受限制的对抗性图像的方法。

在这里插入图片描述

四、Population Based Augmentation

基于群体的增强(PBA)是一种数据增强策略(PBA),它生成非平稳增强策略计划而不是固定增强策略。 在 PBA 中,我们将增强策略搜索问题视为超参数调度学习的一个特例。 它利用基于群体的训练 (PBT),这是一种超参数搜索算法,可联合优化网络参数及其超参数,以最大限度地提高性能。 PBT 的输出不是最优的超参数配置,而是经过训练的模型和超参数时间表。

在 PBA 中,我们只对学习的时间表感兴趣并丢弃子模型结果(类似于 AutoAugment)。 然后,可以使用这种学习到的增强计划来改进同一数据集上不同(即更大且训练成本更高)模型的训练。

PBT执行如下。 首先,随机初始化并并行训练固定的模型群体。 在一定的时间间隔,“利用和探索”过程应用于表现较差的群体成员,其中模型克隆表现更好的模型的权重(即,利用),然后扰乱克隆模型的超参数以进行搜索 超参数空间(即探索)。 由于模型的权重被克隆并且从未重新初始化,因此所需的总计算量是训练单个模型的计算量乘以群体大小。

在这里插入图片描述

五、MaxUp

MaxUp 是一种对抗性数据增强技术,用于提高机器学习模型的泛化性能。 这个想法是通过一些随机扰动或变换生成一组增强数据,并最小化增强数据的最大或最坏情况损失。 通过这样做,我们隐式地引入了针对随机扰动的平滑性或鲁棒性正则化,从而提高了生成性能。 例如,在高斯扰动的情况下,MaxUp 渐近等价于使用损失的梯度范数作为惩罚来鼓励平滑。

在这里插入图片描述

六、SuperpixelGridCut, SuperpixelGridMean, SuperpixelGridMix

Karim Hammoudi、Adnane Cabani、Bouthaina Slika、Halim Benhabiles、Fadi Dornaika 和 Mahmoud Melkemi。 SuperpixelGridCut、SuperpixelGridMean 和 SuperpixelGridMix 数据增强,arXiv:2204.08458,2022。https://doi.org/10.48550/arxiv.2204.08458

在这里插入图片描述

七、InstaBoost

InstaBoost 是一种利用现有实例掩码注释进行实例分割的数据增强技术。

在这里插入图片描述
在这里插入图片描述

八、Random Mix-up

R-Mix(随机混合)是混合系列数据增强方法。 它将随机混合与显着性引导混合相结合,产生快速且高性能的过程,同时保留显着性引导混合的良好特性,例如低预期校准误差和高弱监督对象定位精度。

在这里插入图片描述

九、Sample Redistribution

样本重新分配是一种用于人脸检测的数据增强技术,它根据基准数据集的统计数据通过大规模裁剪来增强训练样本。 在训练数据增强期间,从原始图像中裁剪出方形补丁,并具有随机大小原始图像的短边。 为了为步长 8 生成更多正样本,随机大小范围。 当裁剪框超出原始图像时,平均 RGB 值会填充缺失的像素。

其动机是为了在固定 VGA 分辨率(即 640×480)下进行有效的人脸检测,WIDER FACE 中的大多数人脸(78.93%)小于 32×32 像素,因此它们是通过浅层阶段进行预测的。 为了为这些浅层阶段获得更多的训练样本,使用了样本重新分配(SR)。

在这里插入图片描述

十、Batchboost

Batchboost 是 MixUp 的一种变体,它不是只混合两个图像,而是将许多图像混合在一起。

在这里插入图片描述

十一、CutBlur

CutBlur 是一种专门为低级视觉任务设计的数据增强方法。 它剪切低分辨率补丁并将其粘贴到相应的高分辨率图像区域,反之亦然。 Cutblur 的关键直觉是使模型不仅能够学习“如何”,而且能够学习“在哪里”超分辨率图像。 通过这样做,模型可以理解“多少”,而不是盲目地学习将超分辨率应用于每个给定的像素。

在这里插入图片描述

十二、DiffAugment

可微增强 (DiffAugment) 是一组可微图像变换,用于在 GAN 训练期间增强数据。 这些变换应用于真实图像和生成图像。 它使梯度能够通过增强传播回生成器,在不操纵目标分布的情况下正则化判别器,并保持训练动态的平衡。 作者在实验中首选三种变换选择:翻译、剪切和颜色。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/80791.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringMVC之JSON返回及异常处理

目录 JSON处理 导入依赖 配置Spring-mvc.xml ResponseBody注解使用 测试 目录 JSON处理 导入依赖 配置Spring-mvc.xml ResponseBody注解使用 测试 Jackson 定义 用法 常用注解 统一异常处理 为什么要全局异常处理? 异常处理思路 SpringMVC异常分类 综…

【C++】类和对象核心总结

类和对象目录: 一、面向过程和面向对象初步认识 二、类的引入定义(struct > class) 2.1自定义类型 struct 和 class 的区别 2.2类放在内存中的什么存储区? 2.3类中函数定义的方式 2.3.1声明和定义分离(增强代…

【Stable Diffusion】安装 Comfyui 之 window版

序言 由于stable diffusion web ui无法做到对流程进行控制,只是点击个生成按钮后,一切都交给AI来处理。但是用于生产生活是需要精细化对各个流程都要进行控制的。 故也就有个今天的猪脚:Comfyui 步骤 下载comfyui项目配置大模型和vae下载…

图像数据通道格式:NCHW和NHWC的区别

在深度学习中,图像数据通道格式有两种: NCHW,又称:“channels_first”,是nvidia cudnn库原生支持的数据模式;在GPU中,使用NCHW格式计算卷积,比NHWC要快2.5倍左右(0:54 v…

leetcode:69. x 的平方根

一、题目 函数原型:int mySqrt(int x) 二、思路 利用二分查找思想,在0与x区间进行查找。 设置左边界 left (初始值为0),右边界 right(初始值为x)和中值 mid (值为区间的中间值&#…

基于matlab实现的弹簧振动系统模型程序(动态模型)

完整代码: clear all; %System data m1.0; zeta0.01; omega01.0; Dt1.0; f01.0; x00.0; dotx00.0; xmaxsqrt(x0^2(dotx0/omega0)^2)min([0.5*abs(f0)*Dt/(m*omega0) f0/omega0^2]); omegadomega0*sqrt(1-zeta^2); dt00.1*pi/omega0; nstep500; a0.70; b0.…

[转]MySQL索引底层实现原理(此文个人觉得非常好收藏一下)

索引的本质 MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。提取句子主干,就可以得到索引的本质:索引是数据结构。 我们知道,数据库查询是数据库的最主要功能之一。我们都希望查…

OPC HDA扫盲

目录 1 基本概念 1.1 历史数据服务器类型 1.2 数据源 1.3 对象和接口概述 1.4 所需接口定义 1.5 可选接口定义 1.6 定义 1.7 边界值和时域 2 HDA聚合 2.1 生成间隔 2.2 数据类型 2.3 数据质量 3 聚合示例 3.1 示例数据 3.2 内插(INTERPOLATIVE&#x…

《C++API设计》读书笔记(3):模式

本章内容 本章涵盖了一些与CAPI设计相关的设计模式和惯用法。 “设计模式(Design Pattern)”表示软件设计问题的一些通用解决方案。该术语来源于《设计模式:可复用面向对象软件的基础》(Design Patterns: Elements of Reusable Object-Oriented Softwar…

【C++】map,set简单操作的封装实现(利用红黑树)

文章目录 一、STL中set与map的源码二、 红黑树结点的意义三、仿函数的妙用四、set,map定义迭代器的区别五、map,set迭代器的基本操作:1.begin() end()2.operator3.operator-- 六、迭代器拷贝构造…

傅里叶变换应用 (02/2):频域和相位

一、说明 到目前为止,在我们的讨论中,我已经交替使用了“傅里叶变换”和“快速傅里叶变换(FFT)”。在这一点上,值得注意的是区别!FFT 是“离散”傅里叶变换 (DFT) 的有效算法实现。“…

JavaScript-Ajax-axios-Xhr

JS的异步请求 主要有xhr xmlHttpRequest 以及axios 下面给出代码以及详细用法&#xff0c;都写在了注释里 直接拿去用即可 测试中默认的密码为123456 账号admin 其他一律返回登录失败 代码实例 <!DOCTYPE html> <html lang"en"> <head><…

科技抗老新突破,香港美容仪品牌内地重磅上市

近年来&#xff0c;新消费时代“颜值经济”的火热促使美容行业市场规模增长迅速&#xff0c;越来越多的人愿意为“美”买单&#xff0c;对美的需求也随之增长&#xff0c;美容行业已经成为成长最快的新锐产业。随着经济和科技的发展&#xff0c;“快捷”也成为了当今社会的时代…

想要精通算法和SQL的成长之路 - 最长回文子串

想要精通算法和SQL的成长之路 - 最长回文子串 前言一. 最长回文子串1.1 中心扩散法的运用 前言 想要精通算法和SQL的成长之路 - 系列导航 一. 最长回文子串 原题链接 1.1 中心扩散法的运用 这类具有回文性质的题目&#xff0c;我们如果用常规的从左往右或者从右往左的遍历方…

中尺度混凝土二维有限元求解——运行弯曲、运行光盘、运行比较、运行半圆形(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

swift 约束布局

添加约束布局 背景图瀑全屏 如何三等分 外面view容器没有约束

【Spring Boot】Spring—加载监听器

这里写目录标题 前言加载监听器执行run方法加载配置文件封装Node调用构造器思考 前言 前几天的时候&#xff0c;项目里有一个需求&#xff0c;需要一个开关控制代码中是否执行一段逻辑&#xff0c;于是理所当然的在yml文件中配置了一个属性作为开关&#xff0c;再配合nacos就可…

笔记1.4 计算机网络性能

1. 速率 速率即数据率&#xff08;data rate&#xff09;或称数据传输速率或比特率 单位时间&#xff08;秒&#xff09;传输信息&#xff08;比特&#xff09;量 计算机网络中最重要的一个性能指标 单位&#xff1a;bps、kbps、Mbps k 10^3、M 10^6、G 10^9 速率往往…

网络安全深入学习第一课——热门框架漏洞(RCE-命令执行)

文章目录 一、RCE二、命令执行/注入-概述三、命令执行-常见函数四、PHP命令执行-常见函数1、exec&#xff1a;2、system3、passthru4、shell_exec5、反引号 backquote 五、PHP命令执行-常见函数总结六、命令执行漏洞成因七、命令执行漏洞利用条件八、命令执行漏洞分类1、代码层…

excel中的引用与查找函数篇2

如下所有案例中表头均不参与范围查找内&#xff1a; 1、LOOKUP(lookup_value,lookup_vector,[result_vector])&#xff1a;在一行或者一列中查找某个值并从另一行或者列中找到同位置的值 记住&#xff1a;中括号内的参数可以不赋值&#xff0c;若在中间用逗号隔开这个参数&…