Azure - 机器学习:自动化机器学习中计算机视觉任务的超参数

Azure Machine Learning借助对计算机视觉任务的支持,可以控制模型算法和扫描超参数。 这些模型算法和超参数将作为参数空间传入以进行扫描。

关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人。

file

前置信息

本文适用于Azure - 机器学习:使用自动化机器学习训练计算机视觉模型 的任务中:
https://techlead.blog.csdn.net/article/details/134286386

一、Azure中特定于模型的超参数

下表汇总了特定于 yolov5 算法的超参数。

参数名称说明默认
validation_metric_type用于验证指标的指标计算方法。
必须为 nonecocovoccoco_vocvoc
validation_iou_threshold计算验证指标时框匹配的 IOU 阈值。
必须是 [0.1, 1] 范围内的浮点数。0.5
img_size用于训练和验证的图像大小。
必须是正整数。
注意:如果大小太大,训练运行可能会遇到 CUDA OOM 错误。

| 640 |
| model_size | 模型大小。
必须为 smallmediumlargexlarge

注意:如果模型大小太大,训练运行可能会遇到 CUDA OOM 错误。

| medium |
| multi_scale | 通过在 +/- 50% 范围内改变图像大小来启用多比例图像
必须为 0 或 1。

注意:如果 GPU 内存不足,训练运行可能会遇到 CUDA OOM 错误。

| 0 |
| box_score_thresh | 在推理期间,仅返回分数大于 box_score_thresh 的建议。 该分数是对象性分数和分类概率的乘积。
必须是 [0, 1] 范围内的浮点数。 | 0.1 |
| nms_iou_thresh | 在非最大抑制后处理中进行推理期间使用的 IOU 阈值。
必须是 [0, 1] 范围内的浮点数。 | 0.5 |
| tile_grid_size | 用于平铺每个图像的网格大小。
注意:若要启用小物体检测逻辑,tile_grid_size 不得为 None
作为字符串传递的、由两个整数构成的元组。 示例:–tile_grid_size “(3, 2)” | 无默认值 |
| tile_overlap_ratio | 每个维度中相邻图块之间的重叠率。
必须是 [0, 1) 范围内的浮点数 | 0.25 |
| tile_predictions_nms_thresh | 合并图块和图像的预测结果时用于执行 NMS 的 IOU 阈值。 在验证/推理中使用。
必须是 [0, 1] 范围内的浮点数 | 0.25 |

下表汇总了特定于 maskrcnn_* 的超参数,用于推理期间的实例分段。

参数名称说明默认
mask_pixel_score_threshold记录将像素作为部分对象掩码的临界分数。0.5
max_number_of_polygon_points从掩码转换后,多边形中 (x, y) 坐标对的最大数量。100
export_as_image将掩码导出为图像。错误
image_type掩码导出为的图像类型(选项有 jpg、png、bmp)。JPG

二、与模型无关的超参数

下表描述了与模型无关的超参数。

参数名称说明默认
number_of_epochs训练循环数。
必须是正整数。15
yolov5 除外:30)
training_batch_size训练批大小。
必须是正整数。多类/多标签:78
(vit-variants 除外:
vits16r224:128
vitb16r224:48
vitl16r224:10)
物体检测:2
yolov5 除外:16)

实例分段:2

注意:默认值是可以在 12 GiB GPU 内存上使用的最大批大小。

|
| validation_batch_size | 验证批大小。
必须是正整数。 | 多类/多标签:78
(vit-variants 除外:
vits16r224:128
vitb16r224:48
vitl16r224:10)

物体检测:1
yolov5 除外:16)

实例分段:1

注意:默认值是可以在 12 GiB GPU 内存上使用的最大批大小。

|
| grad_accumulation_step | 梯度累积是指在累积这些步骤的梯度的同时运行所配置数量的 grad_accumulation_step(不更新模型权重),然后使用累积的梯度来计算权重更新。
必须是正整数。 | 1 |
| early_stopping | 在训练期间启用提前停止逻辑。
必须为 0 或 1。 | 1 |
| early_stopping_patience | 在运行停止之前未经过主要指标
改进的最小循环数或验证评估数。
必须是正整数。 | 5 |
| early_stopping_delay | 在跟踪主要指标改进以便提前停止之前
要等待完成的最小循环数或验证评估数。
必须是正整数。 | 5 |
| learning_rate | 初始学习速率。
必须是 [0, 1] 范围内的浮点数。 | 多类:0.01
(vit-variants 除外:
vits16r224:0.0125
vitb16r224:0.0125
vitl16r224:0.001)

多标签:0.035
(vit-variants 除外:
vits16r224:0.025
vitb16r224:0.025
vitl16r224:0.002)

物体检测:0.005
yolov5 除外:0.01)

实例分段:0.005

|
| lr_scheduler | 学习速率计划程序的类型。
必须为 warmup_cosinestep。 | warmup_cosine |
| step_lr_gamma | 学习速率计划程序为 step 时的 gamma 值。
必须是 [0, 1] 范围内的浮点数。 | 0.5 |
| step_lr_step_size | 学习速率计划程序为 step 时的步长大小值。
必须是正整数。 | 5 |
| warmup_cosine_lr_cycles | 学习速率计划程序为 warmup_cosine 时的余弦周期值。
必须是 [0, 1] 范围内的浮点数。 | 0.45 |
| warmup_cosine_lr_warmup_epochs | 学习速率计划程序为 warmup_cosine 时的预热循环值。
必须是正整数。 | 2 |
| optimizer | 优化器的类型。
必须为 sgdadamadamw。 | sgd |
| momentum | 优化器为 sgd 时的动量值。
必须是 [0, 1] 范围内的浮点数。 | 0.9 |
| weight_decay | 优化器为 sgdadamadamw 时的权重衰减值。
必须是 [0, 1] 范围内的浮点数。 | 1e-4 |
| nesterov | 当优化器为 sgd 时启用 nesterov
必须为 0 或 1。 | 1 |
| beta1 | 当优化器为 adamadamw 时的 beta1 值。
必须是 [0, 1] 范围内的浮点数。 | 0.9 |
| beta2 | 当优化器为 adamadamw 时的 beta2 值。
必须是 [0, 1] 范围内的浮点数。 | 0.999 |
| amsgrad | 当优化器为 adamadamw 时启用 amsgrad
必须为 0 或 1。 | 0 |
| evaluation_frequency | 评估验证数据集以获得指标分数所遵循的频率。
必须是正整数。 | 1 |
| checkpoint_frequency | 存储模型检查点所遵循的频率。
必须是正整数。 | 验证时具有最佳主要指标的循环中的检查点。 |
| checkpoint_run_id | 具有用于增量训练的预训练检查点的试验的运行 ID。 | 无默认值 |
| checkpoint_dataset_id | FileDataset ID,其中包含用于增量训练的预训练检查点。 确保将 checkpoint_filenamecheckpoint_dataset_id 一起传递。 | 无默认值 |
| checkpoint_filename | FileDataset 中用于增量训练的预训练检查点文件名。 确保将 checkpoint_dataset_idcheckpoint_filename 一起传递。 | 无默认值 |
| layers_to_freeze | 要为模型冻结的层数。 例如,传递 2 作为 seresnext 值意味着冻结引用下面的受支持模型层信息的 layer0 和 layer1。
必须是正整数。

'resnet': [('conv1.', 'bn1.'), 'layer1.', 'layer2.', 'layer3.', 'layer4.'],
'mobilenetv2': ['features.0.', 'features.1.', 'features.2.', 'features.3.', 'features.4.', 'features.5.', 'features.6.', 'features.7.', 'features.8.', 'features.9.', 'features.10.', 'features.11.', 'features.12.', 'features.13.', 'features.14.', 'features.15.', 'features.16.', 'features.17.', 'features.18.'],
'seresnext': ['layer0.', 'layer1.', 'layer2.', 'layer3.', 'layer4.'],
'vit': ['patch_embed', 'blocks.0.', 'blocks.1.', 'blocks.2.', 'blocks.3.', 'blocks.4.', 'blocks.5.', 'blocks.6.','blocks.7.', 'blocks.8.', 'blocks.9.', 'blocks.10.', 'blocks.11.'],
'yolov5_backbone': ['model.0.', 'model.1.', 'model.2.', 'model.3.', 'model.4.','model.5.', 'model.6.', 'model.7.', 'model.8.', 'model.9.'],
'resnet_backbone': ['backbone.body.conv1.', 'backbone.body.layer1.', 'backbone.body.layer2.','backbone.body.layer3.', 'backbone.body.layer4.']

| 无默认值 |


三、图像分类(多类和多标签)特定的超参数

下表汇总了图像分类(多类和多标签)任务的超参数。

参数名称说明默认
weighted_loss0 表示无加权损失。
1 表示使用 sqrt.(class_weights) 计算的加权损失
2 表示使用 class_weights 计算的加权损失。
必须为 0、1 或 2。0
valid_resize_size- 在为验证数据集裁剪之前要将图像调整到的大小。
  • 必须是正整数。

    说明:

  • seresnext不取任意大小。

  • 注意:如果大小太大,训练运行可能会遇到 CUDA OOM 错误。 | 256 |
    | valid_crop_size | - 输入到神经网络的用于验证数据集的图像裁剪大小。

  • 必须是正整数。

    说明:

  • seresnext不取任意大小。

  • ViT-variants 应该拥有相同的 valid_crop_sizetrain_crop_size

  • 注意:如果大小太大,训练运行可能会遇到 CUDA OOM 错误。 | 224 |
    | train_crop_size | - 输入到神经网络的用于训练数据集的图像裁剪大小。

  • 必须是正整数。

    说明:

  • seresnext不取任意大小。

  • ViT-variants 应该拥有相同的 valid_crop_sizetrain_crop_size

  • 注意:如果大小太大,训练运行可能会遇到 CUDA OOM 错误。 | 224 |


四、对象检测和实例分段任务特定的超参数

以下超参数用于物体检测和实例分段任务。

警告

yolov5 算法不支持这些参数。 有关 yolov5 支持的超参数,请参阅模型特定的超参数部分。

参数名称说明默认
validation_metric_type用于验证指标的指标计算方法。
必须为 nonecocovoccoco_vocvoc
validation_iou_threshold计算验证指标时框匹配的 IOU 阈值。
必须是 [0.1, 1] 范围内的浮点数。0.5
min_size在将图像馈送到主干之前要将其重新缩放到的最小大小。
必须是正整数。
注意:如果大小太大,训练运行可能会遇到 CUDA OOM 错误。

| 600 |
| max_size | 在将图像馈送到主干之前要将其重新缩放到的最大大小。
必须是正整数。

注意:如果大小太大,训练运行可能会遇到 CUDA OOM 错误。

| 1333 |
| box_score_thresh | 在推理期间,仅返回分类分数大于 box_score_thresh 的建议。
必须是 [0, 1] 范围内的浮点数。 | 0.3 |
| nms_iou_thresh | 预测头的非最大抑制 (NMS) 中使用的 IOU(交并比)阈值。 在推理期间使用。
必须是 [0, 1] 范围内的浮点数。 | 0.5 |
| box_detections_per_img | 所有类的每个图像的最大检测次数。
必须是正整数。 | 100 |
| tile_grid_size | 用于平铺每个图像的网格大小。
注意:若要启用小物体检测逻辑,tile_grid_size 不得为 None
作为字符串传递的、由两个整数构成的元组。 示例:–tile_grid_size “(3, 2)” | 无默认值 |
| tile_overlap_ratio | 每个维度中相邻图块之间的重叠率。
必须是 [0, 1) 范围内的浮点数 | 0.25 |
| tile_predictions_nms_thresh | 合并图块和图像的预测结果时用于执行 NMS 的 IOU 阈值。 在验证/推理中使用。
必须是 [0, 1] 范围内的浮点数 | 0.25 |

关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/138745.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++入门】构造函数析构函数

目录 前言 1. 类的默认成员函数 2. 构造函数 2.1 什么是构造函数 2.2 构造函数的特性 3. 析构函数 3.1 什么是析构函数 3.2 析构函数的特性 前言 前边我们已经了解了类和对像的基本概念,今天我们将继续深入了解类。类有6个默认成员函数,即使类中什么都…

C#开发的OpenRA游戏之世界存在的属性CombatDebugOverlay(3)

C#开发的OpenRA游戏之世界存在的属性CombatDebugOverlay(3) 这次来分析CombatDebugOverlay属性,这个属性只有在调试游戏的时候才会使用。当你设置这个属性的时候,就可以看到如下图的结果: 可以看到物品的周边都有一个圆圈,以及有一些十字的点位标志。 那些十字表示的点…

Python实现局部二进制算法(LBP)

1.介绍 局部二进制算法是一种用于获取图像纹理的算法。这算法可以应用于人脸识别、纹理分类、工业检测、遥感图像分析、动态纹理识别等领域。 2.示例 """ 局部二进制算法,计算图像纹理特征 """ import cv2 import numpy as np imp…

小程序游戏对接广告收益微信小游戏抖音游戏软件

小程序游戏对接广告是一种常见的游戏开发模式,开发者可以通过在游戏中嵌入广告来获取收益。以下是一些与小程序游戏对接广告收益相关的关键信息: 小程序游戏广告平台选择: 选择适合你的小程序游戏的广告平台非常重要。不同的平台提供不同类型…

iview实现table里面每行数据的跳转

我的需求是跳转到第三方网站&#xff0c;看官方是写了如何跳转站内路由&#xff0c;不符合我的要求&#xff0c;在csdn发现了一篇文章&#xff0c;我贴一下代码 <template><Table border :columns"ReportColumns" :data"ReportData"><templ…

odoo16 库存初始化 excel导入问题

最近在为一家公司实施odoo时&#xff0c;发现库存模块实施过程中按用户实际&#xff0c;产品初始化就是个问题。下面一一记录下 一个新公司&#xff0c;产品都有上百种&#xff0c;甚致几千种&#xff0c;如何把现有产品数据录入系统就是个不小的活。odoo16是有导入导出功能不…

悟空crm二次开发 增加客户保护功能 (很久没有消息,但是有觉得有机会的客户)就进入了保护转态

需求&#xff1a;客户信息录入不限数量&#xff0c;但是录入的信息1个月内只有自己和部门领导能看到&#xff0c;如果1个月内未成交或者未转移至自己的客保 则掉入公海所有人可见&#xff0c;这里所说的客保就是现在系统自带的客保 1、需求思维导图 2、新增保护按钮 3、点击该…

C++初阶--类与对象(3)(图解)

文章目录 再谈构造函数初始化列表隐式类型转换explicit关键字 static成员友元类内部类匿名对象拷贝函数时的一些优化 再谈构造函数 在我们之前的构造函数中&#xff0c;编译器会通过构造函数&#xff0c;对对象中各个成员给出一个适合的初始值&#xff0c;但这并不能称之为初始…

QT 布局管理综合实例

通过一个实例基本布局管理&#xff0c;演示QHBoxLayout类、QVBoxLayout类及QGridLayout类效果 本实例共用到四个布局管理器&#xff0c;分别是 LeftLayout、RightLayout、BottomLayout和MainLayout。 在源文件“dialog.cpp”具体代码如下&#xff1a; 运行效果&#xff1a; Se…

Redis的内存淘汰策略分析

概念 LRU 是按访问时间排序&#xff0c;发生淘汰的时候&#xff0c;把访问时间最久的淘汰掉。LFU 是按频次排序&#xff0c;一个数据被访问过&#xff0c;把它的频次 1&#xff0c;发生淘汰的时候&#xff0c;把频次低的淘汰掉。 几种LRU策略 以下集中LRU测率网上有很多&am…

浙江大学漏洞报送证书

获取来源&#xff1a;edusrc&#xff08;教育漏洞报告平台&#xff09; url&#xff1a;主页 | 教育漏洞报告平台 兑换价格&#xff1a;20金币 获取条件&#xff1a;提交浙江大学任意中危或以上级别漏洞

selenium xpath定位

selenium-xpath定位 <span style"background-color:#2d2d2d"><span style"color:#cccccc"><code class"language-javascript">element_xpath <span style"color:#67cdcc"></span> driver<span styl…

在gitlab中指定自定义 CI/CD 配置文件

文章目录 1. 介绍2. 配置操作3. 配置场景3.1 CI/CD 配置文件在当前项目step1&#xff1a;在当前项目中创建目录&#xff0c;编写流水线文件存放在该目录中step2&#xff1a;在当前项目中配置step3&#xff1a;运行流水线测试 3.2 CI/CD 配置文件位于外部站点上step1&#xff1a…

掌动智能性能压力测试优势有哪些

企业通过自动化的测试工具模拟多种正常、峰值以及异常负载条件来对系统的各项性能指标进行测试。本文将介绍性能压力测试的价值及主要优势! 一、性能压力测试的价值 1、评估系统能力&#xff1a;有助于参数的基准测试&#xff0c;可以度量系统的响应时间;还有助于检查系统是否可…

OpenCV-Python小应用(九):通过灰度直方图检测图像异常点

OpenCV-Python小应用&#xff08;九&#xff09;&#xff1a;通过灰度直方图检测图像异常点 前言前提条件相关介绍实验环境通过灰度直方图检测图像异常点代码实现输出结果 参考 前言 由于本人水平有限&#xff0c;难免出现错漏&#xff0c;敬请批评改正。更多精彩内容&#xff…

基于springboot实现高校党务平台管理系统【项目源码】

基于springboot实现高校党务平台管理系统演示 Java技术 Java是由Sun公司推出的一门跨平台的面向对象的程序设计语言。因为Java 技术具有卓越的通用性、高效性、健壮的安全性和平台移植性的特点&#xff0c;而且Java是开源的&#xff0c;拥有全世界最大的开发者专业社群&#x…

ubuntu16.04 交叉编译 mbedtls

在为客户交叉编译项目时需要依赖 mbedtls&#xff0c; 客户的机器是 arm64 的 ubuntu 16.04&#xff0c; 交叉编译过程中遇到几个问题。 首先&#xff0c; mbedtls 需要依赖 python, 在 cmake 的过程中&#xff0c; 如果不是使用系统默认的 cmake 可能会导致&#xff0c;mbedt…

蓝桥杯算法双周赛心得——被替换的身份证(分类讨论)

大家好&#xff0c;我是晴天学长&#xff0c;分类讨论一定要细节啊&#xff0c;需要的小伙伴可以关注支持一下哦&#xff01;后续会继续更新的。&#x1f4aa;&#x1f4aa;&#x1f4aa; 1) .被替换的身份证 2) .算法思路 假设一方获胜 1.接受数据 2.假设潜梦醒 无非就是&am…

计算机组成原理之处理器(单周期)

引言 处理器的实现方式决定了时钟周期长度和CPI。实现方式有单周期与流水线&#xff0c;本篇谈谈单周期处理器。 目前CPU的频率一般是3GHZ/4GHZ&#xff0c;但是频率是有极限值的&#xff0c;受cycletime影响 基本的RISC-V实现 存储指令&#xff1a;ld,sd算术逻辑指令 &…

AI 绘画 | Stable Diffusion 进阶 Embeddings(词嵌入)、LoRa(低秩适应模型)、Hypernetwork(超网络)

前言 Stable Diffusion web ui&#xff0c;除了依靠文生图&#xff08;即靠提示词生成图片&#xff09;&#xff0c;图生图&#xff08;即靠图片提示词生成图片&#xff09;外&#xff0c;这两种方式还不能满足我们所有的绘图需求&#xff0c;于是就有了 Embeddings&#xff0…