1、引言
机器视觉又称计算机视觉,是用计算机来实现人的视觉功能,也就是用机器代替人眼来做测量和判断。机器视觉技术包含光源照明技术、光成像技术、传感器技术、数字图像处理技术、机械工程技术、检测控制技术、模拟与数字视频技术、计算机技术、人机接口技术等相关技术,是实现计算机集成系统的基础技术。
对于交通灯的识别,将使世界上7~8%的色盲、色弱患者驾驶汽车成为可能,也为无人驾驶汽车在技术上前进一步。因而将为汽车工业以及汽车电子工业带来更大的经济效益,和更大的社会效益,并可在国际上填补该领域的空白。
2、基于机器视觉的交通灯识别方法
2.1、交通灯识别方法的流程图如下所示
2.2、交通灯定位
当获取一张原始的图像时,考虑到背景的变化及其他物体对交通灯识别的干扰,我们需要将图像中交通灯的部分提取出来。在此本文用交通灯的形状及灰度值来定位交通灯在图像中的位置。
2.2.1、交通灯形状的矩形度与圆形度
可以通过交通灯的矩形度来找出交通灯一定的范围,在此采用一种简单的矩形度计算方法rectangularity算子,即将上述低灰度值的分散区域作为输入区域,当得到某一矩形和输入区域有相同的一、二阶矩时,计算出输入区域的面积和该矩形面积的比,即为矩形度rectangularity的值。显然当输入区域为矩形时,得到矩形度的最大值1;输入的区域越接近矩形,则矩形度越接近与1(无输入区域时矩形度为0)。
通过上述矩形度的算法,可以在低灰度值的区域中筛选出一定范围(包含交通灯轮廓)的类矩形,最后通过交通灯在图像中占据的面积定位出交通灯的轮廓。
图2-1通过形状定位出交通灯的位置
然后在上图的基础上,采用一种简单的Circularity算子,确定出包含有交通灯的轮廓。
具体的算法如下:
假设F是一个闭合区域的面积,max这个区域内中心点到边界或轮廓的最大距离,那么:
circularity=F/(max^2*π)(2-1)
根据式2-1可得圆的circularity为1。由此可知对于一个轮廓或多边形包围的区域如果其circularity接近与1,那么这个轮廓近似于一个圆。可以通过一个阈值选取出与圆的相似的轮廓,例如可以选取circularity在[0.8,1]范围内的轮廓。如果有多个轮廓符合,则将这些轮廓所对应的区域存放入一个数组之内。
2.3、颜色空间变化
当确认交通灯的位置后,我们需要通过颜色识别来确定交通灯的状态。
由于RGB颜色空间的相似不能代表颜色的相似,HSI颜色空间则没有这个方面的问题,它们很适合人们肉眼的分辨,较好地反映人对颜色的感知和鉴别能力。因此可以先将RGB颜色空间转化为HSI颜色空间。
RGB空间转化为HSI空间的一般公式如下:
图2-2通过饱和度提取的交通灯信息
2.4、颜色识别
本文通过图像分割来识别交通灯的颜色。将图像通过选定的阈值分割后,找出所需要的图形。
2.4.1、基于阈值的分割
这是一种最常用的区域分割技术,阈值是用于区分不同目
标的灰度值。如果图象只有目标和背景两大类,那么只需选取一个阈值称为单阈值分割。这种方法是将图象中每个象素的灰度值和阈值比较,灰度值大于阈值的象素为一类,灰度值小于阈值的象素为另一类。如果图象中有多个目标,就需要选取多个阈值将各个目标分开,这种方法称为多阈值分割。阈值分割的结果依赖于阈值的选取,确定阈值是阈值分割的关键,阈值分割实质上就是按照某个标准求出最佳阈值的过程。
在背景和目标图像的先验概率相等这一特定条件下,最佳阈值是背景灰度均值与目标图像灰度均值之均值。即:
通常阈值化分割方法根据某种测度准则确定分割阈值。如果仅使用象素的灰度级确定分割阈值,则阈值化是点相关的;如果由每个象素邻域的局部特性决定门限,则阈值化是区域相关的。基于点相关的阈值化方法有P-TIle方法,直方图凹形分析法,最大类间方差法,最大熵法以及矩不变门限法等。基于区域相关的分割方法有直方图转换法,基于二阶灰度统计的方法,松弛法以及基于过度区提取的分割方法等。
图2-3颜色识别的结果
2.5、数字识别
在本例中,OCR被用来识别出交通数字灯上的数字显示变化,使用OCR之前应先将图像的灰度值取反。
2.5.1、灰度值转换
灰度值转换是将图像的灰度值颠倒过来,其中图像的bite和cyclic类型的计算公式为g‘=255-g
图像的direcTIon类型转化公式为:
g’=(g+90)modulo180 ( 2-6)
图2-4灰度值取反结果
2.5.2、OCR
OCR是英文OpTIcalCharacterRecogniTIon的缩写,意思为光学字符识别,通称为文字识别,它的工作原理为通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中,由此可以看出,OCR实际上是让计算机认字,实现文字自动输入。它是一种快捷、省力、高效的文字输入方法。
图2-5 OCR识别数字结果
因OCR是通过检测暗的模式确定其形状,所以在上一步的灰度值转化过程中先将原图像的灰度值取反,把原本灰度值高的部分转换成灰度值低的部分,然后用字符识别方法将形状翻译成计算机文字,即对文本资料进行扫描,然后对图像文件进行分析处理,最后获取文字及版面信息。
3、结论
交通数字信号灯是指挥交通必不可少的、无人职守的公共交通设施,其重要性是人所共知的。本文建立的交通数字信号识别系统采用机器视觉技术,对交通信号灯的颜色及其数字进行自动识别。众所周知,色弱、色盲是一种遗传疾病。根据统计,全世界约有7%~8%的人患有不同程度的色盲、色弱疾病,这给患者的工作和生活带来了一定的障碍和困难,许多工作和专业都对色盲、色弱患者关闭了大门。在我国,色盲者从出生开始直至寿终正寝,驾驶机动车的权利就被硬性法规标准所剥夺!若能够运用机器视觉技术让色盲患者正确区分红绿等多种颜色,辨别彩色图像中的种种事物,赋予他们正常人的生活权利,意义深远。