基于深度学习的瓷砖色差分类方法研究——学习笔记(评价:色差的定义太模糊。。。问题描述不清楚,太水了)

文章目录

  • 摘要
  • 0 引言
  • 1 瓷砖图像处理
    • 1.1 图像采集
    • 1.2 图像处理
  • 2 基于深度学习的瓷砖色差分类算法设计
    • 2.1 数据预处理
    • 2.2 卷积神经网络的设计
    • 2.3 实验设计
  • 3 瓷砖色差分类平台的设计与实现

在这里插入图片描述

摘要

瓷砖是人类建筑不可或缺的一种材料,而瓷砖品质最重要的指标之一就是色差,一批瓷砖中色差越小,品级越高。目前企业主要是由熟练工人在特定的光照及距离条件下进行筛查,劳动强度大并且效率低,没有固定的判断标准。因此提出利用基于深度学习算法的视觉检测系统代替人工进行瓷砖色差分类,**首先,经过数字图像处理算法对采集的瓷砖图像进行预处理,将瓷砖本体从背景中分割出来 ;然后,利用卷积神经网络分别提取具有色差的两类瓷砖特征,通过监督学习实现瓷砖的色差分类 ;最后,设计了图形用户界面将上述所有图像处理算法及分类算法进行实现,开发可视化人机交互式操作和分类结果显示系统。**实验结果表明 :基于深度学习的视觉检测系统能够在瓷砖色差分类任务上实现准确分类,且分类效率高、分类结果可视化,具有重要的应用价值

0 引言

在这里插入图片描述
瓷砖的色差指瓷砖间的色泽差异,包含颜色与光泽间的总体差别。传统瓷砖色差分类工作主要通过熟练工人用肉眼对同一批烧制的同类瓷砖来进行差异化区分 [1],且工人们需在特定光线环境下和一定距离内进行观察与对比,从而确定瓷砖的等级与色号 [2]。这种检测工作对检测人员的经验要求高,且工作强度大。与此同时传统瓷砖行业通过人工对瓷砖进行分色,其精度与效率已不能满足愈发增长的生产规模和对瓷砖品级区分精度的要求。因此可以采取基于机器视觉的方法,以机器代替人眼来进行瓷砖色差分类工作。

基于深度学习 [3] 的机器视觉系统首先在生产线采集数字瓷砖图像,然后用数字图像处理算法对原始数据进行预处理 [4] 与图像分割,进而采用基于深度学习的卷积神经网络算法 [5] 实现对具有色差的瓷砖图像间的分类分色,最后通过图形用户界面将瓷砖图像预处理及图像分割结果以及分类结果可视化。最后,将该系统应用于实际的瓷砖生产线下的色差分类任务,证明算法的有效性。

1 瓷砖图像处理

1.1 图像采集

在这里插入图片描述

1.2 图像处理

在这里插入图片描述
在这里插入图片描述
降噪处理 :对于实地采集的瓷砖图像来说,一般图像尺寸巨大,噪声鲜有肉眼能直接看到的,但这些噪声都是实实在在存在的。常见的图像噪声包括高斯噪声 [7]、瑞利噪声、伽马噪声以及椒盐(脉冲)噪声,其中椒盐噪声其与图像信号强度对比明显,对图像
污染较大,因而在原始图像中较为明显 [8]。本文采用中值滤波算法去除数字瓷砖图像中的椒盐噪声,如图3(a) 所示。
在这里插入图片描述
灰度化处理 [9] :为了方便计算机程序对数字图像的操作,并且简化图像分割时的计算量,本文在图像分割前对降噪后的数字图像做灰度化处理,灰度化处理后如图 3(b) 所示。二值化处理 :为了更好地让瓷砖与原始图像的背景相区分,对瓷砖的灰度图做进一步的二值化处理。本文采用基于阈值的二值化方法,即设置一个阈值 n,将输入的灰度图像中灰度值 f(x,y) ≥ n的点的灰度值设置为 255,并将这些点称为对象点 [10] ;其他的点之灰度值则设置为 0,这些点称为背景点。该算法的计算公式如(1)所示 :
在这里插入图片描述
式中 f(x,y) 为灰度图像素值,g(x,y) 为二值化后的新图像像素值 [11]。由于原始图像的前景与背景对比较为强烈,本文选用双峰法确定阈值。首先计算出灰度化后的图像的灰度直方图,如图 3© 所示。将两个主要的波峰之间的最低谷作为前景与后景之间的分界线,由于摄像头位于同一位置,所有瓷砖的背景相同,且此处阈值的选取精度要求不高,还需要后续处理,因此选取 100 作为二值化处理时的阈值。二值化处理后的瓷砖图像如图3(d),可以看出图中的噪声明显减少,并且瓷砖整体更加清晰突出。

形态学操作 :利用形态学的开操作去除流水线背景中的支架结构对二值图中瓷砖图像的污染以及其他一些微小的噪声 [12]。实验效果如图 4 所示,此时的二值图中基本上只存在形状接近矩形的残缺瓷砖。

基于透视变换的图像分割 :将形态学运算后的图像用轮廓检测算法得到轮廓集,并求出其中面积最大一个轮廓作为瓷砖轮廓,之后求出瓷砖轮廓最小外接矩形作为最终需要从原始图像中分割出来的瓷砖图像本身。这里使用的最小外接矩形算法为用主成分分析法(PCA)求出轮廓的主方向向量,进而得到轮廓的长宽,最小外接矩形的轮廓(绿色)如图 5。
在这里插入图片描述

已求出瓷砖最小外接矩形,由这个矩形的四个角点坐标进行透视变换,使瓷砖图像投影为规整的矩形并平行于转换后完整图像的长宽,最后将此新矩形按角点坐标从转换后完整图像中裁剪出来,如图 6 所示。
在这里插入图片描述

2 基于深度学习的瓷砖色差分类算法设计

2.1 数据预处理

在这里插入图片描述
为了减小输入卷积神经网络的数据量,将分割好的图像的尺寸缩小为 227×227 的标准尺寸,并且由于数据集本身样本数量不多,需对数据集进行扩充,从而使训练出的模型具有更好的泛化能力,防止神经网络算法可能产生的过拟合现象,本文使用旋转和水平翻转作为数据增广的方法 [13]。为了训练神经网络模型并测试其分类精度,本文将数据集划分为训练集和测试集。并为了保证数据集中不同种类分布的均一性,从两个色号中分别选取 80% 作为训练集,用于网络的特征学习,将两种色号分别剩下的 20% 作为测试集用于测试每次训练完成之后的模型分类效果。

2.2 卷积神经网络的设计

在这里插入图片描述
ResNet[14] 的提出就是为了解决深度学习网络随着层数的加深而导致的梯度消失使得网络学习停滞的问题,其巧妙地运用恒等映射并通过快捷连接将其赋予上一模块的输入,从而使得每一层梯度不可能为零,使得每一层的参数可以不断地更新学习下去而不会停滞,使得超深层网络可以实现更加深入的学习 [15]

文 献 中 介 绍 了 18/34/50/101/152 等 多 种 层 数的 ResNet 模 型, 实 验 使 用 的 是 具 有 18 层 结 构 的ResNet18 模型 [16]。对网络进行训练的损失函数选择交叉熵函数,优化算法选择 Adam 算法,并在网络中间引入 Batch Normalization 层防止网络的过拟合 [16]。

2.3 实验设计

在这里插入图片描述
超参数是指与数据集无关,只与模型结构相关需在训练之前设定好的参数,主要包括数据集训练周期(epoch)、批量大小(batch size)、优化器的学习率(learning rate)[17]。在上述瓷砖数据集上设定训练周期为 50,批量大小恒定为 64,再分别设定大小为 0.01、0.001、0.0001 的初始学习率进行训练。

如图 7 至图 9 所示,在训练前期,前两者验证模型时准确率波动更大,分析认为这是由于样本数据集不够庞大,两种色差数据较为相似,较高的学习率导致网络的权值与偏置在优化过程中变化过大,导致输出的预测分布无法稳定,但随着损失值逐渐减小,训练集与测试集最终准确率都达到 100% 而实现收敛。

在这里插入图片描述

3 瓷砖色差分类平台的设计与实现

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
之后我会持续更新,如果喜欢我的文章,请记得一键三连哦,点赞关注收藏,你的每一个赞每一份关注每一次收藏都将是我前进路上的无限动力 !!!↖(▔▽▔)↗感谢支持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/546464.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

面试官 | 讲一下如何给高并发系统做限流?

作者 | nick hao来源 | uee.me/cDuRD在开发高并发系统时有三把利器用来保护系统:缓存、降级和限流。本文结合作者的一些经验介绍限流的相关概念、算法和常规的实现方式。缓存缓存比较好理解,在大型高并发系统中,如果没有缓存数据库将分分钟被…

Python利用multiprocessing实现多进程,Pyinstaller打包python多进程程序出现多个窗口

一、为什么需要采用multiprocessing多线程技术 自己在做文件Hash校验工具V1.0小工具软件时,需要读取文件,计算文件的MD5、SHA1、SHA256和CRC32这些Hash值,对于小文件能够很快计算出hash值,但是对于大文件需要花费一些时间,不知道进度如何?使用进度条指示也无法正确显示进…

面试官 | 说一下数据库如何分库分表?

作者 | butterfly100来源 | cnblogs.com/butterfly100/p/9034281.html一. 数据切分关系型数据库本身比较容易成为系统瓶颈,单机存储容量、连接数、处理能力都有限。当单表的数据量达到1000W或100G以后,由于查询维度较多,即使添加从库、优化索…

面试官 | JVM 为什么使用元空间替换了永久代?

7:40到11:40历时4个小时完成了该文,看到电脑中左边的便签了么,我也是拼了。在Java8和以后版本中JVM的内存结构慢慢发生了变化。作为面试官如果你还不知道,那么面试过程中是不是有些露怯?作为面试者,如果知晓这些变化&a…

Typora颠覆写作体验的极简好用 Markdown 编辑器基本设置教程

Typora是一款Markdown编辑器。 无论你是建网站写博客、每天写日记、自媒体写稿、办公、程序员写代码文档等等,Typora 都能满足你的要求。 Typora基本设置教程 1.“通用”项设置 打开“文件”下的“偏好设置”选项,在“通用”这项下,设置自…

面试官问:一个Java字符串中到底能有多少个字符?

作者 | 鸟窝来源 | urlify.cn/qYNR3q依照Java的文档, Java中的字符内部是以UTF-16编码方式表示的,最小值是 \u0000 (0),最大值是\uffff(65535), 也就是一个字符以2个字节来表示,难道Java最多只能表示 65535个字符?char…

PHP多进程处理并行处理任务实例

2019独角兽企业重金招聘Python工程师标准>>> 本文目的 本文通过例子讲解linux环境下,使用php进行并发任务处理,以及如何通过pipe用于进程间的数据同步。写得比较简单,作为备忘录。 PHP多进程 通过pcntl_XXX系列函数使用多进程功能…

Python PyCharm利用PyQt5使QPlainTextEdit支持拖放文件,类提升,重写QPlainTextEdit类

一、利用PyCharm新建基于PyQt5对话框工程MyMainTest,添加QPlainTextEdit控件,保存主窗口MyQTMainForm.ui文件运行如下: 二、新建myqplaintextedit.py文件,创建MyQPlainTextEdit类继承于QPlainTextEdit,只允许excel(.xls或.xlsx)文件拖放,及信号发射处理。代码如下: #…

经典面试题|ConcurrentHashMap 读操作为什么不需要加锁?

作者 | 上帝爱吃苹果来源 | cnblogs.com/keeya/p/9632958.html我们知道,ConcurrentHashmap(1.8)这个并发集合框架是线程安全的,当你看到源码的get操作时,会发现get操作全程是没有加任何锁的,这也是这篇博文讨论的问题——为什么它…

正能量

2019独角兽企业重金招聘Python工程师标准>>> 对别人,永远把最好的方面表现出来,这样别人都会为你传递正能量,你就能够得到能量累加。 对自己,要自信,永远给自己传递正能量,这样自己周边的能量场…

Python datetime time计算时间差

一、计算时间差 """ python主文件 """ # -*- coding: utf-8 -*-import time"""主函数 """ if __name__ __main__:# 获取当前开始的日期和时间,例:2022-02-05 14:20:36strStartDateTime …

面试官 | AJAX请求为什么不安全?

作者 | 撒网要见鱼链接 | cnblogs.com/dailc/p/8191150.html# AJAX三问AJAX请求真的不安全么?AJAX请求哪里不安全?怎么样让AJAX请求更安全?# 前言本文包含的内容较多,包括AJAX,CORS,XSS,CSRF等内…

IE6,IE7 Firefox 兼容问题

2019独角兽企业重金招聘Python工程师标准>>> 关于ie6、ie7和ff浏览器兼容网友评论 0 条 转载到博客 2009-1-8 16:11:23 来源: 本站整理顶一下这些方法都是我平时用到时在网上找到收藏下来的呵呵,我提前声明一下免得误会!一、CSS HACK以下两种方法几乎能…

面试官 | 说一下什么是代理模式?

看了这篇文章,你会对静态代理模式,JDK 动态代理模式和 CGLIB 动态代理模式有个很清晰的认识。01、简介什么是代理模式代理模式也称为委托模式,属于结构型模式之一。在某些情况下,一个对象不适合或者不能直接引用另一个对象&#x…

面试官 | 说一下 JVM 常用参数有哪些?

作者 | SimpleSmile_5177来源 | i7q.cn/50SRVt前言说一下 JVM 常用的参数有哪些?是比较常用的面试问题,同时如果项目特别大了,需要增加一下堆内存的大小、或者是系统老是莫明的挂掉,想查看下gc日志来排查一下错误的原因&#xff…

CSS 实现按钮及线呼吸灯效果

1. [代码]style view sourceprint?01<style>02 body{03 font-family:Segoe UI Light,Segoe UI,Arial,微软雅黑,sans-serif;04 font-size: 20px;05 color:#333333;0607 }08 .breath {…

美团面试题 | JVM 堆内存溢出后,其他线程是否可继续工作?

作者&#xff1a;gosaintmrc来源&#xff1a;http://sina.lt/gqaM最近网上出现一个美团面试题&#xff1a;“一个线程OOM后&#xff0c;其他线程还能运行吗&#xff1f;”我看网上出现了很多不靠谱的答案。这道题其实很有难度&#xff0c;涉及的知识点有jvm内存分配、作用域、g…

Python格式化字符串f-string常用用法

简介&#xff1a; f-string&#xff0c;亦称为格式化字符串常量&#xff08;formatted string literals&#xff09;&#xff0c;是Python3.6新引入的一种字符串格式化方法&#xff0c;该方法源于PEP 498 – Literal String Interpolation&#xff0c;主要目的是使格式化字符串…

面试官 | Java 对象不使用时为什么要赋值为 null?

作者 | zhantong来源 | www.polarxiong.com前言许多Java开发者都曾听说过“不使用的对象应手动赋值为null“这句话&#xff0c;而且好多开发者一直信奉着这句话&#xff1b;问其原因&#xff0c;大都是回答“有利于GC更早回收内存&#xff0c;减少内存占用”&#xff0c;但再往…

CentOS 6.5下利用Rsyslog+LogAnalyzer+MySQL部署日志服务器

一、简介 LogAnalyzer 是一款syslog日志和其他网络事件数据的Web前端。它提供了对日志的简单浏览、搜索、基本分析和一些图表报告的功能。数据可以从数据库或一般的syslog文本文件中获取&#xff0c;所以LogAnalyzer不需要改变现有的记录架构。基于当前的日志数据&#xff0c;它…