YOLOv8训练参数总结及翻译

参数名称默认值描述
modelNone指定用于训练的模型文件。接受 .pt 预训练模型或 .yaml 配置文件的路径。对于定义模型结构或初始化权重至关重要。
dataNone数据集配置文件的路径(例如, coco8.yaml )。该文件包含特定于数据集的参数,包括到训练和验证数据的路径、类名和类数。
epochs100训练周期总数。每个epoch代表整个数据集的完整传递。调整这个值会影响训练时间和模型性能。
timeNone最大培训时间(以小时为单位)。如果设置了,这将覆盖 epochs 参数,允许训练在指定的持续时间后自动停止。对于时间限制的训练场景非常有用。
patience100在早期停止训练之前,在验证度量没有改进的情况下等待的epoch数。当表现停滞时,停止训练有助于防止过度拟合。
batch16批量大小,有三种模式:设置为整数(例如 batch=16 ),自动模式为60%的GPU内存利用率( batch=-1 ),或自动模式为指定的利用率分数( batch=0.70 )。
imgsz640用于训练的目标图像大小。所有图像在输入到模型之前都会被调整到这个尺寸。影响模型精度和计算复杂度。
saveTrue允许保存训练检查点和最终模型权重。用于恢复训练或模型部署。
save_period-1保存模型检查点的频率,以epoch指定。值为-1时禁用此特性。用于在长时间的训练期间保存临时模型。
cacheFalse启用在内存( True / ram )、磁盘( disk )或禁用( False )中缓存数据集图像。以增加内存使用为代价,通过减少磁盘I/O来提高训练速度。
deviceNone指定用于训练的计算设备:单个GPU ( device=0 ),多个GPU ( device=0,1 ), CPU ( device=cpu ),或用于Apple芯片的MPS ( device=mps )。
workers8用于数据加载的工作线程数(per  RANK 如果是多gpu训练)。影响数据预处理和输入模型的速度,在多gpu设置中特别有用。
projectNone保存培训输出的项目目录名称。允许有组织地存储不同的实验。
nameNone训练运行的名称。用于在项目文件夹中创建子目录,用于存储培训日志和输出。
exist_okFalse如果为True,则允许覆盖现有的项目/名称目录。可用于迭代实验,无需手动清除先前的输出。
pretrainedTrue确定是否从预训练的模型开始训练。可以是布尔值或到要从中加载权重的特定模型的字符串路径。提高培训效率和模型性能。
optimizer'auto'

训练优化器的选择。选项包括 SGD、 Adam 、 AdamW 、 NAdam 、 RAdam 、

 RMSProp 等,或者根据型号配置自动选择 auto 。影响收敛速度和稳定性。

verboseFalse支持训练期间的详细输出,提供详细的日志和进度更新。用于调试和密切监视培训过程。
seed0为训练设置随机种子,确保在相同配置的运行中结果的可重复性。
deterministicTrue强制使用确定性算法,确保再现性,但由于对非确定性算法的限制,可能会影响性能和速度。
single_clsFalse在训练期间将多类数据集中的所有类视为单个类。用于二元分类任务或关注对象存在而不是分类时。
rectFalse使矩形训练,优化批量组成最小填充。可以提高效率和速度,但可能会影响模型的准确性。
cos_lrFalse利用余弦学习率调度程序,调整学习率后,余弦曲线的epoch。有助于管理学习率以实现更好的收敛。
close_mosaic10在最后N次迭代中禁用马赛克数据增强,以在完成之前稳定训练。设置为0禁用此功能。
resumeFalse从上次保存的检查点恢复训练。自动加载模型权重、优化器状态和历元计数,无缝地继续训练。
ampTrue支持自动混合精度(AMP)训练,减少内存使用,并可能在对准确性影响最小的情况下加速训练。
fraction1.0指定要用于训练的数据集的部分。允许在完整数据集的子集上进行训练,对于实验或资源有限时非常有用。
profileFalse允许在训练期间对ONNX和TensorRT速度进行分析,有助于优化模型部署。
freezeNone通过索引冻结模型的前N层或指定层,减少可训练参数的数量。用于微调或迁移学习。
lr00.01最初的学习速率(即 SGD=1E-2 ,  Adam=1E-3 )。调整此值对于优化过程至关重要,它会影响模型权重更新的速度。
lrf0.01最终学习率作为初始学习率的一部分= ( lr0 * lrf ),与调度器一起使用以随时间调整学习率。
momentum0.937SGD的动量因子或Adam优化器的beta1,影响当前更新中过去梯度的整合。
weight_decay0.0005L2正则化项,惩罚大权重以防止过拟合。
warmup_epochs3.0学习率预热的epoch数,从一个较低的学习率逐渐增加到初始学习率,以稳定早期的训练。
warmup_momentum0.8热身阶段的初始动量,在热身期间逐渐调整到设定的动量。
warmup_bias_lr0.1预热阶段偏差参数的学习率,有助于稳定初始阶段的模型训练。
box7.5损失函数中盒损失分量的权重,影响对准确预测边界盒坐标的重视程度。
cls0.5总损失函数中分类损失的权重,影响正确分类预测相对于其他成分的重要性。
dfl1.5分布焦点损失的权重,在某些YOLO版本中用于细粒度分类。
pose12.0姿态估计模型中姿态损失的权重,影响了对准确预测姿态关键点的重视。
kobj2.0姿态估计模型中关键点目标损失的权重,平衡检测置信度和姿态精度。
label_smoothing0.0应用标签平滑,软化硬标签的混合目标标签和均匀分布的标签,可以提高泛化。
nbs64归一化损失的标称批量大小。
overlap_maskTrue确定在训练期间分割掩码是否应该重叠,适用于实例分割任务。
mask_ratio4分割蒙版的下采样率,影响训练时使用的蒙版的分辨率。
dropout0.0分类任务中正则化的失败率,通过在训练过程中随机省略单元来防止过拟合。
valTrue在训练期间启用验证,允许在单独的数据集上定期评估模型性能。
plotsFalse生成并保存训练和验证度量的图,以及预测示例,提供对模型性能和学习进展的可视化洞察。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/37840.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微信小程序毕业设计-线上教育商城系统项目开发实战(附源码+论文)

大家好!我是程序猿老A,感谢您阅读本文,欢迎一键三连哦。 💞当前专栏:微信小程序毕业设计 精彩专栏推荐👇🏻👇🏻👇🏻 🎀 Python毕业设计…

线性表与顺序存储结构(上)

前言 线性表:零个或多个数据元素的有限序列。 线性表是数据结构中最常用和最简单的一种结构。 本文介绍的是线性表和线性表的顺序存储结构的部分内容。 正文 什么是线性表? 顾名思义,是具有像线一样的性质的表。 首先,它是一个…

刷代码随想录有感(120):贪心算法——买卖股票的最佳时机

题干&#xff1a; 代码&#xff1a; class Solution { public:int maxProfit(vector<int>& prices) {int low INT_MAX;int res INT_MIN;for(int i 0; i < prices.size(); i){low min(low, prices[i]);res max(res, prices[i] - low);}return res;} }; 贪心…

周末总结(2024/06/29)

工作 人际关系核心实践&#xff1a; 要学会随时回应别人的善意&#xff0c;执行时间控制在5分钟以内 坚持每天早会打招呼 遇到接不住的话题时拉低自己&#xff0c;抬高别人(无阴阳气息) 朋友圈点赞控制在5min以内 工作上的要点 现状&#xff08;接受破烂现状&#xff0c;改变…

ARCGIS添加在线地图

地图服务地址&#xff1a;http://map.geoq.cn/ArcGIS/rest/services 具体方法&#xff1a; 结果展示&#xff1a;

T4打卡 学习笔记

所用环境 ● 语言环境&#xff1a;Python3.11 ● 编译器&#xff1a;jupyter notebook ● 深度学习框架&#xff1a;TensorFlow2.16.1 ● 显卡&#xff08;GPU&#xff09;&#xff1a;NVIDIA GeForce RTX 2070 设置GPU from tensorflow import keras from tensorflow.keras…

【2024最新华为OD-C/D卷试题汇总】[支持在线评测] LYA的字符串拼接游戏(200分) - 三语言AC题解(Python/Java/Cpp)

&#x1f36d; 大家好这里是清隆学长 &#xff0c;一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-C/D卷的三语言AC题解 &#x1f4bb; ACM银牌&#x1f948;| 多次AK大厂笔试 &#xff5c; 编程一对一辅导 &#x1f44f; 感谢大家的订阅➕ 和 喜欢&#x1f497; &#x1f…

Spring Boot中的分布式文件系统

Spring Boot中的分布式文件系统 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01;今天&#xff0c;我们将探讨如何在Spring Boot中实现分布式文件系统的搭建和应用…

GO sync包——读写锁

&#x1f49d;&#x1f49d;&#x1f49d;欢迎莅临我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:「stormsha的主页」…

单例模式在 Android中的应用

单例模式在Android开发中的应用非常广泛&#xff0c;它确保了一个类在应用中只有一个实例&#xff0c;并提供了一个全局访问点。以下是对单例模式在Android中应用的深入讲解&#xff1a; 一、应用场景 全局资源管理&#xff1a; 在Android应用中&#xff0c;经常需要管理全局…

多表查询实训

前提 本篇博客&#xff0c;我将通过讲解例题的方式&#xff0c;带大家进一步掌握多表查询的使用规则和使用技巧 正文 前提 先建好表 表1 salgrade (薪资等级表&#xff09; 表2 emp(员工信息表&#xff09; 表3 dept&#xff08;部门信息表&#xff09;&#xff0c;插入相…

拉普拉斯变换(Laplace Transform)

拉普拉斯变换概述 拉普拉斯变换&#xff08;Laplace Transform&#xff09;是一种积分变换&#xff0c;用于将时间域&#xff08;通常是连续时间&#xff09;的信号转换到复频域&#xff0c;以便简化对系统的分析和设计。它在控制系统、信号处理、电路分析等领域广泛应用。 拉…

docker-mysql主从复制

MySQL主从复制 安装docker和拉取镜像不再赘述 一.主服务器 1.新建主服务器容器-3307 &#xff08;这里设置的密码可能不生效&#xff0c;若未生效请看问题中的2&#xff09; docker run -p 3307:3306 --name mysql-master \ -v /mydata/mysql-master/log:/var/log/mysql \…

老年生活照护实训室:探索现代养老服务的奥秘

在老龄化社会加速发展的今天&#xff0c;如何为老年人提供优质、贴心的生活照护服务&#xff0c;成为了社会关注的焦点。老年生活照护实训室作为培养专业养老服务人才的重要场所&#xff0c;正逐渐揭开现代养老服务的神秘面纱&#xff0c;为我们展现出一幅充满关爱与智慧的画卷…

第三十七篇——麦克斯韦的妖:为什么要保持系统的开放性?

目录 一、背景介绍二、思路&方案三、过程1.思维导图2.文章中经典的句子理解3.学习之后对于投资市场的理解4.通过这篇文章结合我知道的东西我能想到什么&#xff1f; 四、总结五、升华 一、背景介绍 如果没有详细的学习这篇文章&#xff0c;我觉得我就是被麦克斯韦妖摆弄的…

[机缘参悟-200] - 对自然、人性、人生、人心、人际、企业、社会、宇宙全面系统的感悟 - 全图解

对自然、人性、人生、人心、人际、企业、社会、宇宙进行全面系统的感悟&#xff0c;是一个极其深邃且复杂的主题。以下是对这些领域的简要感悟&#xff1a; 自然&#xff1a; 自然是人类生存的根基&#xff0c;它充满了无尽的奥秘和美丽。自然界的平衡和循环规律&#xff0c;教…

JDBC的使用(一)

一、JDBC 概述 1.1 持久化概述 持久化(persistence): 把内存中的数据保存到可掉电式存储设备 (硬盘、U盘等) 中以供之后使用。 大多数企业级应用&#xff0c;数据持久化是将数据保存到各种关系数据库&#xff0c; 而在 Java中&#xff0c;数据库存取技术只能通过 JDBC 来访问数…

41.HOOK引擎设计原理

上一个内容&#xff1a;41.HOOK引擎设计原理 在一个游戏里通过hook来完成各种各样的功能&#xff0c;比如hook点是a、b、c&#xff0c;然后a点会有它自己所需要的hook逻辑&#xff0c;b、c也是有它们自己的hook逻辑&#xff08;hook逻辑指的是hook之后要做的事&#xff09;&am…

算法设计与分析--近似算法内容整理

文章目录 P、NP、NP-hard 和 NPC多项式时间概念区分NP-hard 的证明例题 1 证明 T S P TSP TSP 问题是 N P − h a r d NP-hard NP−hard 问题 。例题 2 证明最大加权独立集问题是 N P − h a r d NP-hard NP−hard 问题。 扩展 NP-hard 问题3-SAT 问题TSP 旅行商问题 Load B…

c#网络Tcp和udp

TCP 通信 TCP 服务端 Socket tcpServer new Socket(AddressFamily.InterNetwork, SocketType.Stream, ProtocolType.Tcp); IPAddress ipAddress new IPAddress(new byte[] { 192, 168, 1, 5 }); IPEndPoint ipEndPoint new IPEndPoint(ipAddress, 7788); tcpServer.Bind(ip…