1、参数的具体含义及其重要性
-
epoch: 训练迭代次数,表示模型已经进行了多少轮的训练。这是模型训练的基本计数单位,对于跟踪训练进度至关重要。
-
train/box_loss: 训练过程中边界框(bounding box)预测的损失值。这反映了模型在定位对象方面的能力。
-
train/obj_loss: 训练过程中对象存在性(objectness)预测的损失值。这涉及模型判断图像中是否存在特定对象的能力。
-
train/cls_loss: 训练过程中类别(classification)预测的损失值。这关注于模型识别对象类别的准确性。
-
metrics/precision: 精确度,表示预测为正的样本中真正为正的比例。高精度表示模型具有较少的假阳性预测。
-
metrics/recall: 召回率,表示实际为正的样本中被正确预测为正的比例。高召回率意味着模型能够找到大部分真实对象。
-
metrics/mAP_0.5: 平均精度(mean Average Precision)@ IoU=0.5,这是一个综合性能指标,反映模型在所有类别上的平均检测精度。
-
metrics/mAP_0.5:0.95: 平均精度@多个IoU阈值(从0.5到0.95),提供更全面的模型定位能力评估。
-
val/box_loss: 验证集上的边界框损失值,用于评估模型在未见过的数据上的定位性能。
-
val/obj_loss: 验证集上的对象损失值,评估模型在未见过的数据上检测对象存在的能力。
-
val/cls_loss: 验证集上的分类损失值,评估模型在未见过的数据上分类对象的能力。
-
x/lr0, x/lr1, x/lr2: 学习率(learning rate)的调度状态,通常用于展示如何根据训练进程调整学习率,比如在不同的训练阶段使用不同的学习率。
重点监控参数:
- epoch: 了解模型训练的整体进度。
- train/box_loss, train/obj_loss, train/cls_loss: 观察模型在各项任务上的表现和损失下降趋势。
- metrics/mAP_0.5: 这是评估模型质量的关键指标,反映了模型的泛化能力。
- val/box_loss, val/obj_loss, val/cls_loss: 验证集上的损失值是评估模型过拟合和泛化能力的重要参考。
- metrics/precision, metrics/recall: 精确度和召回率可以提供模型性能的不同视角,有助于理解模型在不同情况下的表现。
2、计算方法
1. Epoch
- 定义: Epoch 表示训练过程中所有数据被完整地遍历一次。
- 计算方法: 无需计算,每完成一轮训练更新一次。
- 应用场景: 用于监控训练进度和确定模型的训练时间。
2. train/box_loss, val/box_loss
- 定义: 边界框(Bounding Box)损失,通常使用如IoU(Intersection over Union)损失或平滑L1损失等。
- 计算方法:
- IoU损失 = 1 - (预测框与真实框的交集 / 预测框与真实框的并集)
- 平滑L1损失 = 平滑函数(|真实值 - 预测值|)
- 应用场景: 评估模型在定位任务上的性能,即预测对象的位置准确性。
3. train/obj_loss, val/obj_loss
- 定义: 对象存在性损失,通常使用二元交叉熵(Binary Cross-Entropy, BCE)损失。
- 计算方法:
- BCE损失 = -(真实标签 * log(预测值) + (1 - 真实标签) * log(1 - 预测值))
- 应用场景: 评估模型在检测对象是否存在的任务上的性能。
4. train/cls_loss, val/cls_loss
- 定义: 分类损失,通常使用多类交叉熵(Categorical Cross-Entropy, CCE)损失。
- 计算方法:
- CCE损失 = -Σ(真实类别 * log(预测类别概率))
- 应用场景: 评估模型在对象分类任务上的性能。
5. metrics/precision, metrics/recall
- 定义: 精确度(Precision)和召回率(Recall)。
- 计算方法:
- Precision = TP / (TP + FP)
- Recall = TP / (TP + FN)
- TP: True Positives, FP: False Positives, FN: False Negatives
- 应用场景: 评估模型的预测准确度和覆盖范围,常用于不平衡数据集。
6. metrics/mAP_0.5, metrics/mAP_0.5:0.95
- 定义: 平均精度(Mean Average Precision),是多个IoU阈值的平均精度的平均值。
- 计算方法:
- 对于每个类别,计算不同召回率下的精度,并按召回率进行插值。
- 对所有类别的AP求平均值得到mAP。
- 应用场景: 广泛用于评估目标检测模型的整体性能。
7. x/lr0, x/lr1, x/lr2
- 定义: 学习率调度器的状态。
- 计算方法: 根据预先设定的调度策略(如step decay, cosine annealing等)调整学习率。
- 应用场景: 控制训练过程中的学习速率,以期在训练早期加速学习并防止后期过拟合。