论文作者:Dat Tran-Anh,Khanh Linh Tran,Hoai-Nam Vu
作者单位:Thuyloi University;Posts and Telecommunications Institute of Technology
论文链接:http://arxiv.org/abs/2309.12972v1
内容简介:
1)方向:车牌文本检测与识别
2)应用:车牌文本检测
3)背景:在研究领域中,通过摄像机捕捉的图像/视频中的文本检测/识别对研究人员来说是一个极具挑战性的问题。尽管某些方法已经取得了较高的准确性,但目前的方法仍需要大幅改进才能在实际场景中应用。
4)方法:本文不同于图像/视频中的文本检测,而是通过合并多个不同角度的帧来解决车牌文本检测的问题。对于每个视角,提出的方法提取描述车牌文本组成部分的特征,特别是角点和面积。具体而言,我们提出了三个视角:视角1、视角2和视角3,以识别最近的邻近组件,从同一车牌行中恢复文本组件,基于相似性水平和距离度量的估计。
随后,我们采用CnOCR方法对车牌中的文本进行识别。
5)结果:对自行收集的数据集(PTITPlates)和公开可用的斯坦福汽车数据集进行的实验结果表明,所提出的方法优于现有方法。