在工业应用中,一些复杂场景下AI识别用的越来越多了,下面是应用的概念的简单汇总梳理,做记录备份使用。
1.场景分类
AI的场景分类简单来说包含但不限于图像分类、图像分割和目标检测以及字符识别等等。
-
图像分类
是对整幅图像来说的,给定一个图像,判断出图像属于哪个类别。 -
目标检测
给定一个图像,识别出图像中物体的类别及位置,这个位置往往是方框描述。 -
图像分割
给定一个图像,识别出物体的轮廓,可以进行面积判定等等。 -
字符识别
识别出一幅图像中的字符。
2.功能梳理
2.0 数据标注
可以对图像整体打标签,也可以通过画框的方式对图像部分打标签,甚至可以通过自动标注,识别缺陷边缘进行标注。
2.1 增强学习
在缺陷样本比较少的情况下,可以通过对图像进行旋转、翻转、缩放、平移、亮度变化等操作,扩充数据集。
2.2 增量学习
当已经训练好一个模型,如果又有新的缺陷数据,可以选择增量学习来减少训练时间,直接利用已有的模型+新缺陷数据进行训练即可,但是最终的精度比从头整体训练会低。
2.3 缺陷生成
在缺陷样本比较少的情况下,可以通过学习缺陷特征,然后再OK品上的随机位置生成相似的缺陷,比如划痕等来扩充数据集。
如果两个项目缺陷相似,但物品不同,其中一个是新项目,初期缺陷较少,也可以通过缺陷生成来通过老项目创建一些缺陷转移到新项目的图片中,比如焊点的一些项目。
经过测试,缺陷生成的图不要超过原始缺陷数据集的30%。 比如原始100张缺陷图,生成的缺陷不能超过30张。多了以后推理会出问题。
2.4 迁移学习
待补充。
2.5 训练数据量
针对缺陷比较明显的数据集,可能几十张就够用了。
要到达99%以上的识别率,可能需要几百张缺陷图。