背景
近日使用YOLO算法进行目标检测任务的时候,对于输出的几张图片产生了疑惑,故在此复习与巩固。
图片说明
confusion_matrix(混淆矩阵):
- 混淆矩阵是一种用来衡量分类模型性能的表格。横坐标为实际真值,纵坐标为预测值。它展示了模型对真实类别和预测类别的分类结果。
- 通过混淆矩阵,我们可以看到模型对于各个类别的正确分类(真阳性/真阴性)和错误分类(假阳性/假阴性)的数量。数量越大,对应的点颜色越深
confusion_matrix_normalized(归一化混淆矩阵):
- 归一化混淆矩阵是将混淆矩阵中的每个元素除以对应类别的真实样本数,从而得到每个类别的分类准确率。
- 归一化混淆矩阵有助于比较不同类别之间的性能,因为不同类别的样本数量可能不同。
F1_curve(F1曲线):
- F1分数是精确率和召回率的调和平均值,用于评估分类模型的性能。
- F1曲线可能指的是在不同阈值下F1分数的变化曲线,这有助于确定最佳的分类阈值。
- 如果F1曲线在某个类别上较低,那么模型在该类别上的性能可能较差。
- 如图,较好的conf区间处为:[0.2, 0.8]
F1分数计算方式如下:
labels(标签):
- 标签是指数据集中每个样本的类别。和对应的样例数量
labels_correlogram(标签相关图):
- 对labels的补充说明
P_curve(P曲线):
- P曲线可能指的是精确度(Precision)随置信度(Confidence)变化的曲线。
- P曲线可以帮助我们了解模型在不同置信度下的精确度表现。
- 由图所示,有少数的标签训练效果很差。此外,置信度区间应当在0.2以上
PR_curve(PR曲线):
- PR曲线是精确度(Precision)和召回率(Recall)之间的曲线。
- PR曲线常用于评估分类模型的性能,特别是当类别不平衡时。
- 如果PR曲线在召回率增加时保持较高的精确度,那么模型的性能通常较好。
R_curve(R曲线):
- R曲线可能指的是召回率(Recall)随置信度(confidence)变化的曲线。
- 通过R曲线,我们可以了解模型在不同条件下对正样本的识别能力。
- 右图所示,置信度小于0.8时,召回率效果较好
总结
知识如同心台,时时勤拂拭。